Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

How Important Is Data Quality? Best Classifiers vs Best Features

Thumbnail
Ver/abrir
Moran_Fernandez_Laura_2021_How_Important_Is_Data_Quality.pdf (674.4Kb)
Use este enlace para citar
http://hdl.handle.net/2183/30051
Atribución-NoComercial-SinDerivadas 4.0 Internacional
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-NoComercial-SinDerivadas 4.0 Internacional
Coleccións
  • Investigación (FIC) [1685]
Metadatos
Mostrar o rexistro completo do ítem
Título
How Important Is Data Quality? Best Classifiers vs Best Features
Autor(es)
Morán-Fernández, Laura
Bolón-Canedo, Verónica
Alonso-Betanzos, Amparo
Data
2021
Cita bibliográfica
MORÁN-FERNÁNDEZ, Laura, BÓLON-CANEDO, Verónica and ALONSO-BETANZOS, Amparo, 2022. How important is data quality? Best classifiers vs best features. Neurocomputing. 22 January 2022. Vol. 470, p. 365–375. DOI 10.1016/j.neucom.2021.05.107
Resumo
[Abstract] The task of choosing the appropriate classifier for a given scenario is not an easy-to-solve question. First, there is an increasingly high number of algorithms available belonging to different families. And also there is a lack of methodologies that can help on recommending in advance a given family of algorithms for a certain type of datasets. Besides, most of these classification algorithms exhibit a degradation in the performance when faced with datasets containing irrelevant and/or redundant features. In this work we analyze the impact of feature selection in classification over several synthetic and real datasets. The experimental results obtained show that the significance of selecting a classifier decreases after applying an appropriate preprocessing step and, not only this alleviates the choice, but it also improves the results in almost all the datasets tested.
Palabras chave
Feature selection
Filters
Preprocessing
High dimensionality
Classification
Data análisis
 
Descrición
Financiado para publicación en acceso aberto: Universidade da Coruña/CISUG
Versión do editor
http://dx.doi.org/10.1016/j.neucom.2021.05.107
Dereitos
Atribución-NoComercial-SinDerivadas 4.0 Internacional

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións