Mostrar o rexistro simple do ítem

dc.contributor.advisorBarreiro García, Álvaro
dc.contributor.advisorLosada Carril, David Enrique
dc.contributor.authorLojo Vicente, José David
dc.contributor.otherUniversidade da Coruña. Departamento de Computaciónes_ES
dc.date.accessioned2013-05-28T12:00:44Z
dc.date.available2013-05-28T12:00:44Z
dc.date.issued2012
dc.identifier.urihttp://hdl.handle.net/2183/10051
dc.description.abstract[Abstract] In hospitals, huge amounts of complex data are daily produced. Manually labeling every produced document is not an option because of the limited resources. One of the clinical classification tasks is the coding of diagnoses from discharge reports. Coding is a process that consists of analysing the discharge documentation and assigning the diagnostic codes associated to the clinical episode. This doctoral dissertation aims at investigating Automatic Text Classification (ATC) in a complex area: clinical documentation. This is a supervised learning scenario, where the classes are ICD-9-CM codes and the documents are clinical discharge summaries. We use different classification strategies, such as nearest algorithm (knn) and Support Vector Machines (SVMs). A key contribution of this study is the construction of a new test collection from the discharge reports of a clinical service (documents written in Spanish). It is a difficult testbed because of the large number of classes, the average number of classes per document, and the lack of balance among classes. We study different representations of the documents, different retrieval models and the effect of weighting on the classification. The final objective is to build a system to assist the coders with the assignment of ICD-9-CM codes. In addition, we also analyse Active Learning (AA) as a tool to select which documents should be coded. This helps to make good training sets and, therefore, it is a promising avenue to improve clinical classification systems.es_ES
dc.description.abstract[Resumen] En los hospitales, se producen diariamente grandes cantidades de datos complejos. Puesto que los recursos humanos son limitados, la clasificación manual de los documentos producidos no es una alternativa óptima. Una de las tareas de la clasificación de la documentación clínica es la codificación de los informes de alta. La codificación es un proceso que consiste en analizar la documentación del alta, y asignar códigos de los diagnósticos de ese episodio clínico. Esta tesis doctoral tiene como objetivo investigar la Clasificación Automática de Textos (CAT) en un área compleja: la documentación clínica. Este es un escenario de aprendizaje supervisado, donde las clases son los códigos CIE-9-MC y los documentos son los informes de alta hospitalaria. Se utilizan diferentes estrategias de clasificación, tales como los algoritmos de vecindad (Knn) y las Máquinas de Soporte Vectorial (SVM). Una contribución fundamental de este estudio es la construcción de una nueva colección de informes de alta de un servicio clínico (documentos escritos en español). Es un banco de pruebas difícil por la gran cantidad de clases, el número medio de clases por documento, y la falta de equilibrio entre las clases. Se estudian diferentes representaciones de los documentos, distintos modelos de recuperación y el efecto de la ponderación en la clasificación. El objetivo final es construir un sistema de ayuda a los codificadores en la asignación de códigos CIE-9-MC. También investigamos en Aprendizaje Activo (AA) como una herramienta para seleccionar qué documentos deben ser codificados. Esto ayuda a formar buenas colecciones de entrenamiento y, por lo tanto, es una vía prometedora para mejorar los sistemas de clasificación clínicos.es_ES
dc.description.abstract[Resumo] Nos hospitais, prodúcense diariamente gran cantidade de datos complexos. Como os recursos humanos son limitados, a selección manual dos documentos producidos non é unha alternativa ideal. Unha tarefa de clasificación da documentación clínica é a codificación dos informes de alta. A codificación é un proceso que consiste en analizar a documentación de alta, e asignar códigos dos diagnósticos de ese episodio clínico. Esta tese de doutoramento ten como obxectivo investigar a Clasificación Automática de Textos (CAT), nunha área complexa: a documentación clínica. Este é un escenario de aprendizaxe supervisada, onde as clases son CIE-9-MC e os documentos son os informes de alta hospitalaria. Emprégase diferentes estratexias de clasificación, tales como os algoritmos de veciñanza (Knn) e as Máquinas de Soporte Vectorial (SVM). A contribución fundamental deste estudo é a construción dunha nova colección de informes de alta dun servizo clínico (documentos escritos en español). É un banco de probas difícil pola gran cantidade de clases, o número medio de clases por documento, e a falta de equilibrio entre as clases. Estudamos diferentes representacións de documentos, distintos modelos de recuperación e os efectos da ponderación na clasificación. O obxectivo final é a construción dun sistema de apoio para os codificadores na asignación de códigos CIE-9-MC. Tamén investigamos en Aprendizaxe Activa (AA) como unha ferramenta para seleccionar que documentos deben ser codificados. Isto axuda a formar boas coleccións de adestramento e, polo tanto, é un camiño esperanzador para mellorar os sistemas de clasificación clínicaes_ES
dc.language.isospaes_ES
dc.rightsOs titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenidoes_ES
dc.titleClasificación automática de documentación clínicaes_ES
dc.typeinfo:eu-repo/semantics/doctoralThesises_ES
dc.rights.accessinfo:eu-repo/semantics/openAccesses_ES


Ficheiros no ítem

Thumbnail

Este ítem aparece na(s) seguinte(s) colección(s)

Mostrar o rexistro simple do ítem