Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Traballos académicos (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Traballos académicos (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Evaluación de las técnicas de aprendizaje estadístico en el software R

Thumbnail
Ver/abrir
PeteiroGandara_Alberto_TFG_2023.pdf (2.303Mb)
Use este enlace para citar
http://hdl.handle.net/2183/33350
Atribución 3.0 España
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución 3.0 España
Coleccións
  • Traballos académicos (FIC) [716]
Metadatos
Mostrar o rexistro completo do ítem
Título
Evaluación de las técnicas de aprendizaje estadístico en el software R
Autor(es)
Peteiro Gándara, Alberto
Director(es)
Oviedo de la Fuente, Manuel
Data
2023
Centro/Dpto/Entidade
Universidade da Coruña. Facultade de Informática
Descrición
Traballo fin de grao (UDC.FIC). Enxeñaría informática. Curso 2022/2023
Resumo
[Resumen]: El objetivo de este TFG es evaluar diferentes técnicas de aprendizaje estadístico implementadas en el software R y comparar su rendimiento en la clasificación de conjuntos de datos. Para ello, se han utilizado diferentes algoritmos de aprendizaje supervisado, como regresión logística, naive bayes y gradient boosting, entre otros. Se ha llevado a cabo un proceso de preprocesamiento de los datos, que incluye la limpieza de valores atípicos, la eliminación de variables irrelevantes y la normalización de los datos. Posteriormente, se han aplicado los algoritmos de aprendizaje a los datos procesados y se han evaluado mediante la métrica de precisión, la cual mide la proporción de instancias clasificadas de forma correcta. Los resultados obtenidos indican que los diferentes algoritmos de aprendizaje estadístico presentan resultados similares en cuanto a precisión en la clasificación de los datos, aunque algunos algoritmos, como naive bayes y gradient boosting, pueden ser más adecuados para conjuntos de datos específicos. En conclusión, este estudio demuestra la utilidad del software R para la implementación y evaluación de técnicas de aprendizaje estadístico, así como la importancia de seleccionar el algoritmo adecuado para cada conjunto de datos en particular.
 
[Abstract]: The goal of this TFG is to evaluate different statistical learning techniques implemented in the R software and compare their performance in classifying datasets. For this purpose, various supervised learning algorithms such as logistic regression, Naive Bayes, and gradient boosting have been used. A data pre-processing process has been carried out, including outlier removal, elimination of irrelevant variables, and data normalization. Subsequently, the learning algorithms were applied to the pre-processed data and evaluated using the precision metric, which measures the proportion of instances classified correctly. The results indicate that the different statistical learning algorithms show similar results in terms of precision in classifying the data, although some algorithms, such as Naive Bayes and gradient boosting, may be more suitable for specific datasets. In conclusion, this study demonstrates the usefulness of the R software for implementing and evaluating statistical learning techniques, as well as the importance of selecting the appropriate algorithm for each specific dataset.
 
Palabras chave
Aprendizaje estadístico
Algoritmos de aprendizaje supervisado
Preprocesamiento de datos
Clasificación de conjuntos de datos
Utilidad del software R
Limpieza de valores atípicos
Eliminación de variables irrelevantes
Statistical learning
Supervised learning algorithms
Data preprocessing
Classification of datasets
Utility of R software
Outlier removal
Elimination of irrelevant variables
 
Dereitos
Atribución 3.0 España

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións