Uso de técnicas de recomendación en sistemas dispersos

Fernández, Diego

Ver/abrir

FernandezIglesias_Diego_TD_2014.pdf (3.001Mb)

Use este enlace para citar

http://hdl.handle.net/2183/11819

A non ser que se indique outra cousa, a licenza do ítem descríbese como Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional

Coleccións

Teses de doutoramento [2089]

Metadatos

Mostrar o rexistro completo do ítem

Título

Uso de técnicas de recomendación en sistemas dispersos

Autor(es)

Fernández, Diego

Director(es)

Cacheda, Fidel
Carneiro Díaz, Víctor Manuel

Data

2014

Centro/Dpto/Entidade

Universidade da Coruña. Departamento de Tecnoloxías da Información e as Comunicacións

Resumo

[Resumen] En esta tesis nos centramos en el problema que padecen los sistemas de recomendación basados en filtrado colaborativo para recomendar cuando pocos usuarios han valorado los mismos productos: el problema de la dispersión de datos. El análisis de datasets realizado en el dominio de recomendación de películas evidencia las limitaciones de las medidas de similitud tradicionales de los algoritmos basados en vecinos y el elevado número de usuarios con pocas puntuaciones. Para paliar estas limitaciones, proponemos una medida de similitud menos estricta, que mejora los resultados en predicción en situaciones dispersas, y ahondamos en técnicas de expansión de per l, que aumentan el número de puntuaciones para dichos usuarios, aliviando la dispersión, lo que se refleja en los resultados de las recomendaciones. Para profundizar en nuestro estudio, recurrimos al dominio de la recomendación de consultas, por ser especialmente disperso, como demostramos en el análisis efectuado de un query log público. Las técnicas colaborativas se ajustan bien a este nuevo ámbito, a pesar de la gran dispersión de datos. Ésta disminuye al aplicar técnicas de preprocesamiento y al eliminar las sesiones con pocas consultas, mejorando con ello signi cativamente los resultados de los algoritmos empleados.

[Resumo] Nesta tese centrámonos no problema que padecen os sistemas de recomendación baseados en fil trado colaborativo para recomendar cando poucos usuarios valoraron os mesmos produtos: o problema da dipersión de datos. A análise de datasets realizada no dominio de recomendación de películas evidencia as limitacións das medidas de similitude tradicionais dos algoritmos baseados en veciños e o elevado número de usuarios con poucas puntuacións. Para paliar estas limitacións, propoñemos unha medida de similitude menos estrita, que mellora os resultados en predición en situacións dispersas, e afondamos en técnicas de expansión de per l, que aumentan o número de puntuacións para ditos usuarios, aliviando a dispersión, o que se reflicte nos resultados das recomendacións. Para profundar no noso estudo, recorremos ao dominio da recomendación de consultas, por ser especialmente disperso, como demostramos na análise efectuada dun query log público. As técnicas colaborativas axústanse ben a este novo ámbito, a pesar da grande dispersión de datos. Esta diminúe ao aplicar técnicas de preprocesamento e ao eliminar as sesións con poucas consultas, mellorando con eso signi cativamente os resultados dos algoritmos empregados.

[Abstract] In this thesis we focus on the difficulties that recommender systems based on collaborative fi ltering present in order to recommend when few users have rated the same products: the sparsity problem. We accomplish the analysis of diff erent datasets in the movie recommendation domain, which make clear the limitations of the traditional similarity measures that neighbor-based algorithms usually employ and the big amount of users with few ratings. In order to alleviate these limitations, we propose a less strict similarity measure, which increases the accuracy in the prediction task in sparse situations, and we go through the pro file expansion techniques in depth, which increase the number of ratings for those users, alleviating the sparsity problem, what is reflected signifi cantly in the recommendation results. To deepen our subject, we turn to the query recommendation domain, since it is especially sparse, as we demonstrate with the analysis of a public query log. The collaborative techniques fit well in this new scope, despite the important sparsity of the data. This sparsity diminishes by applying preprocessing techniques and ignoring sessions with few queries and, then, the results improve signifi cantly.

Palabras chave

Sistemas de recomendación
Filtrado de información

Dereitos

Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional