Análisis de las características de registros vocales para la clasificación de la enfermedad de Parkinson

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Areal Antolín, Ignacio

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]:El Parkinson es una enfermedad neurodegenerativa crónica que se estima que padecen más de 10 millones de personas a nivel mundial. La enfermedad de Parkinson (EP) afecta al sistema nervioso central y se caracteriza por la degeneración progresiva de las células nerviosas en una región específica del cerebro. El diagnóstico temprano de la EP resulta clave ya que de esta forma se posibilita la reducción en el deterioro que esta genera en la calidad de vida de los pacientes. El diagnóstico de la EP se basa en la evaluación clínica de los síntomas motores característicos, como temblores, rigidez muscular y bradicinesia. Sin embargo, en las etapas iniciales, estos síntomas son leves dificultando un diagnóstico adecuado. Diversos estudios muestran que es posible la detección en etapas tempranas a través de registros de voz del paciente. La generación de estos registros es poco costosa y no invasiva, por ello, parece relevante el estudio de técnicas que permitan el diagnóstico de la EP por esta vía. Aunque se han realizado varios estudios sobre el diagnóstico de la EP a través de registros vocales, aún no se han identificado con exactitud las características o métricas específicas que permiten determinar con claridad la presencia de la afección. Por ello, los conjuntos de datos disponibles suelen incluir una gran variedad de características, como en el conjunto de datos que se empleará en este trabajo que cuenta con 753 características y un número de muestras similar. El análisis y procesamiento de datos en este tipo de problemas es cada vez más abarcable y eficaz gracias a las técnicas de aprendizaje automático. Además, existen distintos métodos de selección de características que han obtenido buenos resultados a la hora de reducir la dimensionalidad del espacio de características en conjuntos de datos como este, mejorando la capacidad de generalización de los modelos de aprendizaje. De este modo, la principal tarea que se plantea en este TFG consiste en determinar la mejor combinación de características que, junto con un modelo de aprendizaje, proporcione la mayor cantidad de información posible para discernir si un paciente está sano o padece la EP.
[Abstract]: Parkinson’s disease is a chronic neurodegenerative disorder estimated to affect more than 10 million people worldwide. Parkinson’s disease (PD) affects the central nervous system and is characterized by the progressive degeneration of nerve cells in a specific region of the brain. Early diagnosis of PD is crucial, as it helps reduce the deterioration in the patients’ quality of life. The diagnosis of PD is based on the clinical evaluation of characteristic motor symptoms such as tremors, muscle rigidity, and bradykinesia. However, in the early stages, these symptoms are mild, making an accurate diagnosis difficult. Various studies have shown that early-stage detection is possible through patient voice recordings. The generation of these recordings is low-cost and non-invasive, making it relevant to study techniques that enable PD diagnosis through this approach. Although several studies have been conducted on diagnosing PD using voice recordings, the specific features or metrics that clearly determine the presence of the condition have not yet been precisely identified. Therefore, the available datasets typically include a large number of features, as is the case with the dataset used in this work, which contains 753 features and a similar number of samples. The analysis and processing of data in this type of problem is increasingly feasible and effective thanks to machine learning techniques. Moreover, various feature selection methods have shown good results in reducing the dimensionality of the feature space in such datasets, improving the generalization capability of learning models. Thus, the main task proposed in this Final Degree Project is to determine the best combination of features that, together with a learning model, provides the greatest amount of information possible to discern whether a patient is healthy or suffers from PD.

Description

Editor version

Rights

Attribution-NonCommercial-NoDerivatives 4.0 International
Attribution-NonCommercial-NoDerivatives 4.0 International

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International