PyToxo: una herramienta Python para calcular tablas de penetrancia de modelos de epistasia de alto orden

Use this link to cite
http://hdl.handle.net/2183/28636
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España
Collections
Metadata
Show full item recordTitle
PyToxo: una herramienta Python para calcular tablas de penetrancia de modelos de epistasia de alto ordenAuthor(s)
Directors
Martín Santamaría, María JoséPonte-Fernández, Christian
Date
2021Center/Dept./Entity
Enxeñaría informática, Grao enDescription
Traballo fin de grao. Enxeñaría Informática. Curso 2020/2021Abstract
[Resumen] Los estudios de asociación del genoma completo analizan marcadores genéticos con el fin de poder asociar una determinada variación genética a una enfermedad. Los estudios de asociación contemporáneos se centran en interacciones epistáticas, pues es sabido que el análisis individual de los locus no resulta suficiente para explicar muchas de las enfermedades del mundo real. La epistasia es el fenómeno por el que la expresión de un determinado gen se ve afectada por la de otros genes independientes, es decir, hace referencia a situaciones más complejas en las que varios genes diferentes se influyen recíprocamente.
La forma más común de representar interacciones epistáticas es a través de lo que se conoce como tablas de penetrancia. No obstante, aunque la mayoría de simuladores que permiten crear conjuntos de datos de casos-controles para estudios de asociación admiten el uso de estas tablas, en general no pueden crearlas o tienen bastantes limitaciones a la hora de hacerlo.
Este Trabajo de Fin de Grado ha conllevado la creación de PyToxo, una herramienta Python para calcular tablas de penetrancia de modelos de epistasia de alto orden. PyToxo es una reimplementación de Toxo, una librería anterior que introdujo una aproximación matemática innovadora en el estado del arte, pero que también presentaba una serie de carencias y puntos débiles que fueron subsanados con esta nueva herramienta.
Con la conclusión de este Trabajo de Fin de Grado se ha alcanzado un software que mejora a Toxo —y con él al resto de herramientas del estado del arte— en materia de alcance, precisión, tiempo de ejecución y usabilidad. Estos resultados tan satisfactorios permiten presentar a la comunidad científica una utilidad interesante para el ámbito de investigación de los estudios de asociación del genoma completo, con la que pueden conseguirse datos sintéticos más realistas con los que continuar indagando en la dimensión genética de las enfermedades. [Abstract] Genome-wide association studies analyze genetic markers in order to be able to associate a certain genetic variation to a disease. Contemporary genome-wide association studies focus on epistatic interactions, as it is known that the analysis of individual locus is not sufficient to explain many real-world diseases. Epistasis is the phenomenon by which the expression of a certain gene is affected by that of other independent genes, that is, it refers to more complex situations in which several different genes interact. The most common way to represent epistatic interactions is through what are known as penetrance tables. However, although most simulators that allow creating case-control data sets for association studies allow the use of these tables, in general they cannot create them or can do so with many limitations.
This Final Degree Dissertation has led to the creation of PyToxo, a Python tool to calculate penetrance tables for high-order epistasis models. PyToxo is a reimplementation of Toxo, an earlier library that presented an innovative mathematical approach to the state of the art, but that also brings its own shortcomings, corrected in this new application.
With the conclusion of this Final Degree Dissertation we have obtained a software that improves Toxo —and with it the rest of the state of the art tools— in terms of scope, accuracy, runtime and usability. These very satisfactory results make it possible to present to the scientific community an interesting utility in the research field of genome-wide association studies, with which more realistic synthetic data can be obtained to continue investigating the genetic dimension of diseases.
Keywords
Tablas de penetrancia
Epistasia
Genoma completo
Genoma humano
Python
Genética
Bioinformática
Epistasia
Genoma completo
Genoma humano
Python
Genética
Bioinformática
Rights
Atribución-NoComercial-SinDerivadas 3.0 España