Research on Cancer Risk and Drug Treatment Efficacy Based on Database Construction and IFPTML Prediction Model

Ren, Shumin

dc.contributor.advisor	Dorado, Julián
dc.contributor.advisor	Duardo-Sanchez, Aliuska
dc.contributor.author	Ren, Shumin
dc.date.accessioned	2024-06-17T14:50:29Z
dc.date.issued	2024
dc.identifier.uri	http://hdl.handle.net/2183/37034
dc.description	Programa Oficial de Doutoramento en Tecnoloxías da Información e as Comunicacións. 5032V01	es_ES
dc.description.abstract	[Abstract] In the field of cancer research, the construction of databases and predictive models have become essential work tools. The hallmark of cancer is the uncontrolled proliferation of abnormal cells. It necessitates research into its intricate initiation and progression mechanisms, guiding therapeutic interventions. Addressing these challenges involves leveraging the abundant data from various levels, encompassing genomics, proteomics, clinical documentation, and imaging. These data can be collected and organized in specific databases, revealing biological relationships, patterns, and potential biomarkers. Meanwhile，with the advancement of machine learning models, combining different levels of biological and genetic information enhances the capacity to predict and evaluate cancer risk and prognosis more precisely. However, while there are currently some databases on cancer risk and pharmacogenomics, knowledgebases for comparing and evaluating cancer risk models, as well as databases for drug treatment effects based on multi-omic molecules, is still missing. Addressing this research gap, we established the Cancer Risk Prediction Model Knowledge Base (CRPMKB) and the Prostate Cancer Treatment Efficacy Knowledge Base (PCaTEKB). The creation of these two databases, accessible through public websites, has facilitated research on cancer risk prevention, personalized treatment, and cancer mechanisms. They also provide resources for the subsequent development of interpretable models. We also introduced the Information Fusion, Perturbation Theory, and Machine Learning (IFPTML) algorithm which can establish predictive models that integrates various types of inputs. Therefore, we developed the IFPTML model based on data from the ChEMBL database and PCaTEKB database. This model is designed to predict therapeutic outcomes of drugs related to prostate cancer. Subsequently, we deployed this model on the PCaTEKB website. Finally, we discussed the FAIR principles', which have been gaining ground as a paradigm for the ethical management of data in scientific research. We also discussed its evolution, incorporation into legislation, extension to research software, and practical application to our knowledge database.	es_ES
dc.description.abstract	[Resumo] No ámbito da investigación sobre o cancro, a construción de bases de datos e modelos predictivos emerxeron como ferramentas importantes nas investigacións sobre o cancro. A marca distintiva do cancro é a proliferación descontrolada de células anormais. Isso exixe investigación sobre os seus intrincados mecanismos de inicio e progresión, guiando intervencións terapéuticas. Abordar estes desafíos implica aproveitar os abundantes datos de varios niveis, incluíndo xenómica, proteómica, documentación clínica e imaxes. Estes datos poden ser recollidos e organizados en bases de datos específicas, revelando relacións biolóxicas, patróns e biomarcadores potenciais. Ao mesmo tempo, co avance dos modelos de aprendizaxe automática, a combinación de diferentes niveis de información biolóxica e xenómica aumenta a capacidade de prever e avaliar con maior precisión o risco e o pronóstico do cancro. Non obstante, mentres existen actualmente algunhas bases de datos sobre o risco de cancro e farmacoxenómica, aínda falta bases de coñecemento para comparar e avaliar modelos de risco de cancro, así como bases de datos para os efectos do tratamento con medicamentos baseados en moléculas multiómicas. Para abordar esta fenda na investigación, o noso grupo estableceu a Base de Coñecemento do Modelo de Predición de Risco de Cancro (CRPMKB) e a Base de Coñecemento sobre a Eficacia do Tratamento do Cancro de Próstata (PCaTEKB). A creación destas dúas bases de datos, accesibles a través de sitios web públicos, facilitou a investigación sobre a prevención do risco de cancro, o tratamento personalizado e os mecanismos do cancro. Tamén fornecen recursos para o desenvolvemento posterior de modelos interpretables. O noso grupo tamén introduciu o algoritmo de Fusión de Información, Teoría de Perturbación e Aprendizaxe Automática (IFPTML), que pode establecer modelos predictivos que integran diferentes tipos de entradas. Polo tanto, o noso grupo desenvolveu o modelo IFPTML baseado en datos da base de datos ChEMBL e PCaTEKB. Este modelo está deseñado para prever os resultados terapéuticos de medicamentos relacionados co cancro de próstata. Posteriormente, despregamos este modelo no sitio web de PCaTEKB. Finalmente, discutimos a evolución dos principios FAIR, a súa incorporación na lexislación, a extensión ao software de investigación e a aplicación práctica nunha base de coñecemento.	es_ES
dc.description.abstract	[Resumen] En el campo de la investigación del cáncer, la construcción de bases de datos y modelos predictivos ha surgido como una herramienta de trabajo esencial. La característica distintiva del cáncer es la proliferación descontrolada de células anormales. Esto requiere investigar sus intrincados mecanismos de inicio y progresión, guiando las intervenciones terapéuticas. Abordar estos desafíos implica aprovechar los abundantes datos de diversos niveles, que abarcan genómica, proteómica, documentación clínica e imágenes. Estos datos pueden recopilarse y organizarse en bases de datos específicas, revelando relaciones biológicas, patrones y biomarcadores potenciales. Mientras tanto, con el avance de los modelos de aprendizaje automático, la combinación de diferentes niveles de información biológica y genética mejora la capacidad de predecir y evaluar el riesgo y pronóstico del cáncer de manera más precisa. Sin embargo, aunque actualmente existen algunas bases de datos sobre riesgo de cáncer y farmacogenómica, aún faltan bases de conocimientos para comparar y evaluar modelos de riesgo de cáncer, así como bases de datos para los efectos del tratamiento farmacológico basado en moléculas multiómicas. Para abordar esta brecha de investigación, nuestro grupo estableció la Base de Conocimientos del Modelo de Predicción de Riesgo de Cáncer (CRPMKB) y creamos la Base de Conocimientos de Eficacia del Tratamiento del Cáncer de Próstata (PCaTEKB). La creación de estas dos bases de datos, accesible a través de sitios web públicos, ha facilitado la investigación sobre la prevención del riesgo de cáncer, el tratamiento personalizado y los mecanismos del cáncer. También proporcionan recursos para el posterior desarrollo de modelos interpretables. En este trabajo también introducimos el algoritmo de Fusión de Información, Teoría de Perturbación y Aprendizaje Automático (IFPTML), para establecer modelos predictivos que integran varios tipos de entradas. Así en este trabajo se ha desarrollado un modelo IFPTML basado en datos de las bases ChEMBL y PCaTEKB. Este modelo está diseñado para predecir los resultados terapéuticos de medicamentos relacionados con el cáncer de próstata. Posteriormente, implementamos este modelo en el sitio web de PCaTEKB. Finalmente, discutimos la evolución de los principios FAIR, que han ido ganando terreno como paradigma de la gestión ética de datos en la investigación científica. Discutimos su incorporación a la legislación española, la extensión al software de investigación y la aplicación de los mismo a nuestra base de datos de conocimiento.	es_ES
dc.language.iso	eng	es_ES
dc.rights	Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido desta tese a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo da tese como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de esta tesis a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen de la tesis como a su contenido	es_ES
dc.subject	Aprendizaje automático-Aplicaciones científicas	es_ES
dc.subject	Inteligencia artificial-Aplicaciones biológicas	es_ES
dc.subject	Medicina-Informática	es_ES
dc.subject	Bioinformática	es_ES
dc.subject	Próstata-Cáncer	es_ES
dc.title	Research on Cancer Risk and Drug Treatment Efficacy Based on Database Construction and IFPTML Prediction Model	es_ES
dc.type	info:eu-repo/semantics/doctoralThesis	es_ES
dc.rights.access	info:eu-repo/semantics/embargoedAccess	es_ES
dc.date.embargoEndDate	2024-11-15	es_ES
dc.date.embargoLift	2024-11-15

Ficheiros no ítem

Nome:: RenShumin_TD_2024.pdf
Tamaño:: 6.270Mb
Formato:: PDF

Ver/abrir

Este ítem aparece na(s) seguinte(s) colección(s)

Teses de doutoramento [2118]

Mostrar o rexistro simple do ítem