En el ámbito de la bioinformática, la búsqueda de subsecuencias similares, a lo que llamaremos patrones en esta investigación, entre secuencias de proteínas se plantea como un reto computacional debido a la multiplicación de subsecuencias candidatas de manera logarítmica. El reto principal es encontrar métodos para reducir la carga computacional y proporcionar resultado de patrones buscados.
Este estudio consiste en proponer un algoritmo que cumpla con los objetivos del descubrimiento de patrones en proteínas.
En la investigación de enfermedades neoplásicas, se han aislado las proteínas que actúan en los procesos de reproducción de células cancerosas.
El descubrimiento de patrones en las proteínas mencionadas anteriormente servirá para conocer las diferencias y similitudes en los procesos y proteínas de cada enfermedad y poder compararlas a nivel genético. La comparación a nivel genético de las enfermedades permitirá proponer la reposición de medicamentos entre las enfermedades.
Este TFM explora los conocimientos de Biología molecular, Bioinformática, tratamiento y similitudes de cadenas de texto, métodos de descubrimiento de patrones, técnicas de clasificación como base teórica y algunos métodos existentes. Finalmente propone un método de búsqueda de patrones y proporciona resultados experimentales.
ABSTRACT
In the field of bioinformatics, the search for similar protein subsequences, which we will call patterns in this research, among protein sequences is posed as a computational challenge due to the multiplication of subsequence candidates in a logarithmic manner. The main challenge is to find methods to reduce the computational load and provide results of searched patterns.
This study consists of proposing an algorithm that meets the objectives of protein pattern discovery.
In the research of neoplastic diseases, proteins that act in the reproduction processes of cancer cells have been isolated.
The discovery of patterns in the proteins mentioned above will help to understand the differences and similarities in the processes and proteins of each disease and to be able to compare them at the genetic level. The comparison at the genetic level of the diseases may propose drug repurposing between the diseases.
This TFM explores the knowledge of molecular biology, bioinformatics, treatment and similarities of text chains, pattern discovery methods, classification techniques as a theoretical basis and some existing methods. Finally, it proposes a method for searching for patterns and experimental results.
En el ámbito de la bioinformática, la búsqueda de subsecuencias similares, a lo que llamaremos patrones en esta investigación, entre secuencias de proteínas se plantea como un reto computacional debido a la multiplicación de subsecuencias candidatas de manera logarítmica. El reto principal es encontrar métodos para reducir la carga computacional y proporcionar resultado de patrones buscados.
Este estudio consiste en proponer un algoritmo que cumpla con los objetivos del descubrimiento de patrones en proteínas.
En la investigación de enfermedades neoplásicas, se han aislado las proteínas que actúan en los procesos de reproducción de células cancerosas.
El descubrimiento de patrones en las proteínas mencionadas anteriormente servirá para conocer las diferencias y similitudes en los procesos y proteínas de cada enfermedad y poder compararlas a nivel genético. La comparación a nivel genético de las enfermedades permitirá proponer la reposición de medicamentos entre las enfermedades.
Este TFM explora los conocimientos de Biología molecular, Bioinformática, tratamiento y similitudes de cadenas de texto, métodos de descubrimiento de patrones, técnicas de clasificación como base teórica y algunos métodos existentes. Finalmente propone un método de búsqueda de patrones y proporciona resultados experimentales.
ABSTRACT
In the field of bioinformatics, the search for similar protein subsequences, which we will call patterns in this research, among protein sequences is posed as a computational challenge due to the multiplication of subsequence candidates in a logarithmic manner. The main challenge is to find methods to reduce the computational load and provide results of searched patterns.
This study consists of proposing an algorithm that meets the objectives of protein pattern discovery.
In the research of neoplastic diseases, proteins that act in the reproduction processes of cancer cells have been isolated.
The discovery of patterns in the proteins mentioned above will help to understand the differences and similarities in the processes and proteins of each disease and to be able to compare them at the genetic level. The comparison at the genetic level of the diseases may propose drug repurposing between the diseases.
This TFM explores the knowledge of molecular biology, bioinformatics, treatment and similarities of text chains, pattern discovery methods, classification techniques as a theoretical basis and some existing methods. Finally, it proposes a method for searching for patterns and experimental results. Read More