Compact and efficient representations of graphs
Use este enlace para citar
http://hdl.handle.net/2183/13775Coleccións
- Teses de doutoramento [2150]
Metadatos
Mostrar o rexistro completo do ítemTítulo
Compact and efficient representations of graphsAutor(es)
Director(es)
Brisaboa, Nieves R.Marín Caihuan, Mauricio
Data
2014Centro/Dpto/Entidade
Universidade da Coruña. Departamento de ComputaciónResumo
[Resumen] En esta tesis estudiamos el problema de la creación de representaciones compactas y
eficientes de grafos. Proponemos nuevas estructuras para persistir y consultar grafos
de diferentes dominios, prestando especial atención al diseño de soluciones eficientes
para grafos generales y grafos RDF.
Hemos diseñado una nueva herramienta para generar grafos a partir de fuentes de
datos heterogéneas mediante un sistema de definición de reglas. Es una herramienta
de propósito general y, hasta nuestro conocimiento, no existe otra herramienta de
estas características en el Estado del Arte. Otra contribución de este trabajo es
una representación compacta de grafos generales, que soporta el acceso eficiente
a los atributos y aristas del grafo. Así mismo, hemos estudiado el problema de
la distribución de grafos en un entorno paralelo, almacenados sobre estructuras
compactas, y hemos propuesto nueve alternativas diferentes que han sido evaluadas
experimentalmente. También hemos propuesto un nuevo índice para RDF que
soporta la resolución básica de SPARQL de forma comprimida. Por último,
presentamos una nueva estructura compacta para almacenar relaciones ternarias
cuyo diseño se enfoca a la representación eficiente de datos RDF.
Todas estas propuestas han sido experimentalmente validadas con conjuntos de
datos ampliamente aceptados, obteniéndose resultados competitivos comparadas con
otras alternativas del Estado del Arte. [Resumo] Na presente tese estudiamos o problema da creación de representacións compactas e
eficientes de grafos. Para isto propoñemos novas estruturas para persistir e consultar
grafos de diferentes dominios, facendo especial fincapé no deseño de solucións
eficientes nos casos de grafos xerais e grafos RDF.
Deseñamos unha nova ferramenta para a xeración de grafos a partires de fontes
de datos heteroxéneas mediante un sistema de definición de regras. Trátase dunha
ferramenta de propósito xeral e, até onde chega o noso coñecemento, non existe outra
ferramenta semellante no Estado do Arte. Outra das contribucións do traballo é unha
representación compacta de grafos xerais, con soporte para o acceso eficiente aos
atributos e aristas do grafo. Así mesmo, estudiamos o problema da distribución de
grafos nun contorno paralelo, almacenados sobre estruturas compactas, e propoñemos
nove alternativas diferentes que foron avaliadas de xeito experimental. Propoñemos
tamén un novo índice para RDF que soporta a resolución básica de SPARQL de
xeito comprimido. Para rematar, presentamos unha nova estrutura compacta para
almacenar relacións ternarias, cun diseño especialmente enfocado á representación
eficiente de datos RDF.
Todas estas propostas foron validadas experimentalmente con conxuntos de datos
amplamente aceptados, obténdose resultados competitivos comparadas con outras
alternativas do Estado do Arte. [Abstract] In this thesis we study the problem of creating compact and efficient representations
of graphs. We propose new data structures to store and query graph data from
diverse domains, paying special attention to the design of efficient solutions for
attributed and RDF graphs.
We have designed a new tool to generate graphs from arbitrary data through
a rule definition system. It is a general-purpose solution that, to the best of our
knowledge, is the first with these characteristics. Another contribution of this work
is a very compact representation for attributed graphs, providing efficient access
to the properties and links of the graph. We also study the problem of graph
distribution on a parallel environment using compact structures, proposing nine
different alternatives that are experimentally compared. We also propose a novel
RDF indexing technique that supports efficient SPARQL solution in compressed
space. Finally, we present a new compact structure to store ternary relationships
whose design is focused on the efficient representation of RDF data.
All of these proposals were experimentally evaluated with widely accepted
datasets, obtaining competitive results when they are compared against other
alternatives of the State of the Art.
Palabras chave
Representaciones de grafos
Dereitos
Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido