Aplicación de algoritmos de aprendizaje automático para la detección de anomalías de tráfico en entornos IoT
![Thumbnail](/dspace/bitstream/handle/2183/33306/VigoyaMorales_LauraVictoria_TD_2023.pdf.jpg?sequence=5&isAllowed=y)
Use este enlace para citar
http://hdl.handle.net/2183/33306
A non ser que se indique outra cousa, a licenza do ítem descríbese como Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido
Coleccións
- Teses de doutoramento [2122]
Metadatos
Mostrar o rexistro completo do ítemTítulo
Aplicación de algoritmos de aprendizaje automático para la detección de anomalías de tráfico en entornos IoTAutor(es)
Director(es)
Carneiro, Carneiro DíazFernández Iglesias, Diego
Data
2023Resumo
[Abstract] The huge number of lightweight devices interconnected in IoT infrastructures generates a large amount of vulnerable information. In this field, techniques based on supervised machine learning have gained credibility as a successful approach for anomaly detection in IoT networks. This thesis proposes the detection of traffic anomalies in IoT through
the application of supervised machine learning algorithms. Given the absence of datasets in the required conditions, two new ones were generated using the MQTT protocol and the CoAP protocol, respectively. Both present three types of anomalies in the payload of the messages and are based on data from a real CPD network of temperature sensors.
For the mathematical modeling of the temperature values, the STL method of time series decomposition was used. For the classification, Linear Regressions, Naive Bayes, Random Forest, Support Vector Machines, and AdaBoost were applied. After using various preprocessing techniques and algorithms, as well as hyperparameterization for model optimization,
the results show, using different traditional metrics, that classifiers can achieve a high detection rate in all experiments. Tree-based models present the best results. [Resumen] El ingente número de dispositivos ligeros interconectados en las infraestructuras IoT genera una gran cantidad de información vulnerable. En este ámbito, las técnicas basadas en aprendizaje automático supervisado han ganado credibilidad como una aproximación exitosa para la detección de anomalías en redes IoT. Esta tesis propone la detección de anomalías de tráfico en IoT mediante la aplicación de algoritmos de aprendizaje automático supervisado. Ante la ausencia de datasets en las condiciones requeridas, se generaron dos nuevos empleando el protocolo MQTT y el protocolo CoAP, respectivamente. Ambos presentan tres tipos de anomalías en el payload de los mensajes, y están basados en los datos de una red de sensores de temperatura de un CPD real. Para el modelado matemático de los valores de temperatura, se empleó el método STL de descomposición de series temporales. Para la clasificación, se aplicaron Regresiones Lineales, Naive Bayes, Random Forest, Máquinas de Vectores de Soporte y AdaBoost. Tras utilizar diversas técnicas y algoritmos de pre-procesado, así como hiperparametrización para la optimización de los modelos, los resultados muestran, utilizando diferentes métricas tradicionales, que los clasificadores pueden lograr una alta tasa de detección en todos los experimentos. Los modelos basados en árboles presentan los mejores resultados. [Resumo] O inxente número de dispositivos lixeiros interconectados nas infraestruturas IoT xera unha grande cantidade de información vulnerable. Neste ámbito, as técnicas baseadas en aprendizaxe automática supervisada gañaron credibilidade como unha aproximación exitosa para a detección de anomalías en redes IoT. Esta tese propón a detección de anomalías de tráfico en IoT mediante a aplicación de algoritmos de aprendizaxe automática
supervisada. Ante a ausencia de datasets nas condicións requiridas, xeráronse dous novos empregando o protocolo MQTT e o protocolo CoAP, respectivamente. Ambos presentan tres tipos de anomalías no payload das mensaxes, e están baseados nos datos dunha rede de sensores de temperatura dun CPD real. Para o modelado matemático dos valores
de temperatura, empregouse o método STL de descomposición de series temporais. Para a clasificación, aplicáronse Regresi´ons Lineais, Naive Bayes, Random Forest, Máquinas
de Vectores de Soporte e Adaboost. Tras utilizar diversas técnicas e algoritmos de preprocesado, así como hiperparametrización para a optimización dos modelos, os resultados mostran, utilizando diferentes métricas tradicionais, que os clasificadores poden lograr unha alta taxa de detección en todos os experimentos. Os modelos baseados en árbores
presentan os mellores resultados.
Palabras chave
Sensores-Informática
Internet de las cosas
Aprendizaje automático
Internet de las cosas
Aprendizaje automático
Descrición
Programa Oficial de Doutoramento en Tecnoloxías da Información e as Comunicacións. 5032V01
Dereitos
Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido Atribución 4.0 Internacional (CC BY 4.0)