Use this link to cite:
http://hdl.handle.net/2183/39470 Single cell RNA-seq analysis to improve breast cancer subtype classification
Loading...
Identifiers
Publication date
Authors
García Pombo, Jorge
Advisors
Other responsabilities
Universidade da Coruña. Facultade de Informática
Journal Title
Bibliographic citation
Type of academic work
Academic degree
Abstract
[Abstract]: Cancer represents one of the main causes of death worldwide, and its impact continues to grow year after year. Out of every kind of cancer, breast cancer is the most common one in women, affecting one in four females having no other risk factors beyond age and gender. At the molecular level, breast cancer is a heterogeneous disease, with five different subtypes distinguished. Each one of them has different levels of aggressiveness and tolerance to the multiple available treatments. Therefore, being able to classify a clinical case as early as possible can have a significant influence on the disease’s development. The most widely used classification methods use bulk RNA-sequencing (RNA-seq) to perform the classification. This type of data shows the average gene expression of every cell in the biological sample in question. The aim of this project is to analyze the behavior of these methods when applied to single-cell RNA-sequencing (scRNA-seq) data. This more modern higher resolution type of data, individually collects the gene expression of each cell present in the biological tissue. Furthermore, a benchmark will be conducted with different state-of-the-art Machine Learning (ML) models to compare their performance in this classification task.
[Resumo]: O cancro representa unha das principais causas de morte globalmente e a súa afectación continúa crecendo ano tras ano. Dentro de todos os seus tipos, o cancro de mama é o tipo de cancro máis habitual en mulleres, afectando a unha de cada catro, e sen que haxa factores de risco máis aló de idade e xénero. A nivel molecular, o cancro de mama é unha enfermidade heteroxénea, diferenciándose cinco subtipos distintos. Cada un deles ten distintos niveles de agresividade e tolerancia aos múltiples tratamentos dispoñibles. Polo tanto, seren capaces de clasificar un caso clínico o antes posible pode ter gran repercusión no desenvolvemento da enfermidade. Os metodos clasificatorios máis utilizados empregan datos bulk RNA-sequencing (RNA-seq) para poder realizar a clasificación. Este tipo de datos mostran a expresión xénica promedio de todas as células da mostra biolóxica que se está a analizar. O obxectivo deste proxecto é comprobar o comportamento destes métodos ao aplicárense a datos single-cell RNA-sequencing (scRNA-seq). Este tipo de datos máis moderno recolle a expresión xénica de cada célula presente no texido biolóxico. Ademais, levarase a cabo un benchmark con distintos modelos de Machine Learning (ML) de estado do arte para comparar o seu rendemento nesta tarefa de clasificación.
[Resumo]: O cancro representa unha das principais causas de morte globalmente e a súa afectación continúa crecendo ano tras ano. Dentro de todos os seus tipos, o cancro de mama é o tipo de cancro máis habitual en mulleres, afectando a unha de cada catro, e sen que haxa factores de risco máis aló de idade e xénero. A nivel molecular, o cancro de mama é unha enfermidade heteroxénea, diferenciándose cinco subtipos distintos. Cada un deles ten distintos niveles de agresividade e tolerancia aos múltiples tratamentos dispoñibles. Polo tanto, seren capaces de clasificar un caso clínico o antes posible pode ter gran repercusión no desenvolvemento da enfermidade. Os metodos clasificatorios máis utilizados empregan datos bulk RNA-sequencing (RNA-seq) para poder realizar a clasificación. Este tipo de datos mostran a expresión xénica promedio de todas as células da mostra biolóxica que se está a analizar. O obxectivo deste proxecto é comprobar o comportamento destes métodos ao aplicárense a datos single-cell RNA-sequencing (scRNA-seq). Este tipo de datos máis moderno recolle a expresión xénica de cada célula presente no texido biolóxico. Ademais, levarase a cabo un benchmark con distintos modelos de Machine Learning (ML) de estado do arte para comparar o seu rendemento nesta tarefa de clasificación.
Description
Editor version
Rights
Atribución-NoComercial 3.0 España








