Aplicación de algoritmos de aprendizaje automático para la detección de anomalías de tráfico en entornos IoT

Vigoya Morales, Laura Victoria

Ver/abrir

VigoyaMorales_LauraVictoria_TD_2023.pdf (1.384Mb)

Use este enlace para citar

http://hdl.handle.net/2183/33306

Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido

A non ser que se indique outra cousa, a licenza do ítem descríbese como Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido

Coleccións

Teses de doutoramento [2122]

Metadatos

Mostrar o rexistro completo do ítem

Título

Aplicación de algoritmos de aprendizaje automático para la detección de anomalías de tráfico en entornos IoT

Autor(es)

Vigoya Morales, Laura Victoria

Director(es)

Carneiro, Carneiro Díaz
Fernández Iglesias, Diego

Data

2023

Resumo

[Abstract] The huge number of lightweight devices interconnected in IoT infrastructures generates a large amount of vulnerable information. In this field, techniques based on supervised machine learning have gained credibility as a successful approach for anomaly detection in IoT networks. This thesis proposes the detection of traffic anomalies in IoT through the application of supervised machine learning algorithms. Given the absence of datasets in the required conditions, two new ones were generated using the MQTT protocol and the CoAP protocol, respectively. Both present three types of anomalies in the payload of the messages and are based on data from a real CPD network of temperature sensors. For the mathematical modeling of the temperature values, the STL method of time series decomposition was used. For the classification, Linear Regressions, Naive Bayes, Random Forest, Support Vector Machines, and AdaBoost were applied. After using various preprocessing techniques and algorithms, as well as hyperparameterization for model optimization, the results show, using different traditional metrics, that classifiers can achieve a high detection rate in all experiments. Tree-based models present the best results.

[Resumen] El ingente número de dispositivos ligeros interconectados en las infraestructuras IoT genera una gran cantidad de información vulnerable. En este ámbito, las técnicas basadas en aprendizaje automático supervisado han ganado credibilidad como una aproximación exitosa para la detección de anomalías en redes IoT. Esta tesis propone la detección de anomalías de tráfico en IoT mediante la aplicación de algoritmos de aprendizaje automático supervisado. Ante la ausencia de datasets en las condiciones requeridas, se generaron dos nuevos empleando el protocolo MQTT y el protocolo CoAP, respectivamente. Ambos presentan tres tipos de anomalías en el payload de los mensajes, y están basados en los datos de una red de sensores de temperatura de un CPD real. Para el modelado matemático de los valores de temperatura, se empleó el método STL de descomposición de series temporales. Para la clasificación, se aplicaron Regresiones Lineales, Naive Bayes, Random Forest, Máquinas de Vectores de Soporte y AdaBoost. Tras utilizar diversas técnicas y algoritmos de pre-procesado, así como hiperparametrización para la optimización de los modelos, los resultados muestran, utilizando diferentes métricas tradicionales, que los clasificadores pueden lograr una alta tasa de detección en todos los experimentos. Los modelos basados en árboles presentan los mejores resultados.

[Resumo] O inxente número de dispositivos lixeiros interconectados nas infraestruturas IoT xera unha grande cantidade de información vulnerable. Neste ámbito, as técnicas baseadas en aprendizaxe automática supervisada gañaron credibilidade como unha aproximación exitosa para a detección de anomalías en redes IoT. Esta tese propón a detección de anomalías de tráfico en IoT mediante a aplicación de algoritmos de aprendizaxe automática supervisada. Ante a ausencia de datasets nas condicións requiridas, xeráronse dous novos empregando o protocolo MQTT e o protocolo CoAP, respectivamente. Ambos presentan tres tipos de anomalías no payload das mensaxes, e están baseados nos datos dunha rede de sensores de temperatura dun CPD real. Para o modelado matemático dos valores de temperatura, empregouse o método STL de descomposición de series temporais. Para a clasificación, aplicáronse Regresi´ons Lineais, Naive Bayes, Random Forest, Máquinas de Vectores de Soporte e Adaboost. Tras utilizar diversas técnicas e algoritmos de preprocesado, así como hiperparametrización para a optimización dos modelos, os resultados mostran, utilizando diferentes métricas tradicionais, que os clasificadores poden lograr unha alta taxa de detección en todos os experimentos. Os modelos baseados en árbores presentan os mellores resultados.

Palabras chave

Sensores-Informática
Internet de las cosas
Aprendizaje automático

Descrición

Programa Oficial de Doutoramento en Tecnoloxías da Información e as Comunicacións. 5032V01

Dereitos

Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido

Atribución 4.0 Internacional (CC BY 4.0)