Técnicas de tratamiento de datos faltantes y aplicación en problema de detección de fraude bancario

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Zas Pérez, Alexandre

Advisors

García Romarís, José Jorge
Fernádez-Casal, Rubén

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen] En este documento se realiza una revisión de las principales técnicas de tratamiento de valores faltantes para aplicarlas en un problema de detección de transacciones fraudulentas. Se realiza un análisis inicial de algunas de las 134 variables iniciales y se realiza un preprocesado de los datos incluyendo una selección de variables, creación de variables e imputación de datos faltantes con distintas técnicas. Los datos son divididos en transacciones de banca electrónica y de banca móvil. Para el primer conjunto de datos los mejores resultados se obtienen con el algoritmo XGBoost aplicando missForest como técnica de imputación; mientras que para el segundo conjunto el mejor modelo es un CatBoost con missForest como técnica de imputación.
[Abstract] In this document, a review of the main techniques for handling missing values is conducted in order to apply them to a fraudulent transaction detection problem. An initial analysis is performed on some of the 134 initial variables, and data preprocessing is carried out, including variable selection, variable creation, and imputation of missing data using different techniques. The data is divided into electronic banking transactions and mobile banking transactions. For the first dataset, the best results are obtained with the XGBoost algorithm using missForest as the imputation technique, while for the second dataset, the best model is a CatBoost with missForest as the imputation technique.

Description

Editor version

Rights

Atribución-NoComercial-SinDerivadas 3.0 España
Atribución-NoComercial-SinDerivadas 3.0 España

Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España