Mostrar o rexistro simple do ítem
Técnicas de tratamiento de datos faltantes y aplicación en problema de detección de fraude bancario
dc.contributor.advisor | García Romarís, José Jorge | |
dc.contributor.advisor | Oviedo de la Fuente, Manuel | |
dc.contributor.advisor | Fernádez-Casal, Rubén | |
dc.contributor.author | Zas Pérez, Alexandre | |
dc.contributor.other | Universidade da Coruña. Facultade de Informática | es_ES |
dc.date.accessioned | 2023-06-30T14:03:31Z | |
dc.date.available | 2023-06-30T14:03:31Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/2183/33270 | |
dc.description.abstract | [Resumen] En este documento se realiza una revisión de las principales técnicas de tratamiento de valores faltantes para aplicarlas en un problema de detección de transacciones fraudulentas. Se realiza un análisis inicial de algunas de las 134 variables iniciales y se realiza un preprocesado de los datos incluyendo una selección de variables, creación de variables e imputación de datos faltantes con distintas técnicas. Los datos son divididos en transacciones de banca electrónica y de banca móvil. Para el primer conjunto de datos los mejores resultados se obtienen con el algoritmo XGBoost aplicando missForest como técnica de imputación; mientras que para el segundo conjunto el mejor modelo es un CatBoost con missForest como técnica de imputación. | es_ES |
dc.description.abstract | [Abstract] In this document, a review of the main techniques for handling missing values is conducted in order to apply them to a fraudulent transaction detection problem. An initial analysis is performed on some of the 134 initial variables, and data preprocessing is carried out, including variable selection, variable creation, and imputation of missing data using different techniques. The data is divided into electronic banking transactions and mobile banking transactions. For the first dataset, the best results are obtained with the XGBoost algorithm using missForest as the imputation technique, while for the second dataset, the best model is a CatBoost with missForest as the imputation technique. | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | Atribución-NoComercial-SinDerivadas 3.0 España | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.subject | Datos faltantes | es_ES |
dc.subject | Imputación de datos | es_ES |
dc.subject | Transacciones fraudulentas | es_ES |
dc.subject | XGBoost | es_ES |
dc.subject | CatBoost | es_ES |
dc.subject | MissForest | es_ES |
dc.subject | Missing data | es_ES |
dc.subject | Data imputation | es_ES |
dc.subject | Fraudulent transactions | es_ES |
dc.title | Técnicas de tratamiento de datos faltantes y aplicación en problema de detección de fraude bancario | es_ES |
dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
dc.rights.access | info:eu-repo/semantics/openAccess | es_ES |
dc.description.traballos | Traballo fin de grao (UDC.FIC). Ciencia e enxeñaría de datos. Curso 2022/2023 | es_ES |