Este Trabajo de Fin de Grado se enfoca en la aplicación de técnicas de Deep Learning a imágenes médicas con el objetivo de mejorar la asistencia al diagnóstico. Se abordan diversas arquitecturas, como redes neuronales convolucionales (CNN), redes generativas adversarias (GAN) y Transformers, para abordar esta tarea.
El objetivo principal consiste en comparar diferentes arquitecturas de redes neuronales para la segmentación de imágenes de laparoscopias, buscando lograr robustez en la predicción de todas las clases. Se realizan modificaciones a las arquitecturas con el propósito de mejorar su rendimiento. Una de estas modificaciones implica reemplazar el módulo de atención de una arquitectura por otro más sencillo, con el fin de comprobar si la atención es esencial para el rendimiento de los Transformers, y también se evalúa la profundidad de la arquitectura.
Para el desarrollo de esta investigación, se emplean conjuntos de datos adecuados al problema específico de imágenes médicas, en nuestro caso se utilizarán las imágenes endoscópicas de Cholec80, proporcionadas por el Grupo de investigación CAMMA (Análisis computacional y modelado de actividades médicas), como base. Estas imágenes representan casos clínicos reales de videos de cirugías de colecistectomía laparoscópica y se utilizan para entrenar y evaluar los modelos propuestos.
Durante el proceso de desarrollo, se utilizan herramientas y bibliotecas especializadas en Deep Learning, como TensorFlow o PyTorch, y entornos de desarrollo como Google Colab o Jupyter Notebook, que facilitan la implementación y experimentación.
La evaluación de los modelos se realiza mediante métricas apropiadas para el diagnóstico médico. Estas métricas permiten medir la precisión y el rendimiento de los modelos en la detección de enfermedades o anomalías en las imágenes médicas.
Los resultados obtenidos muestran la efectividad del enfoque de Deep Learning aplicado a la imagen médica para el diagnóstico. Los modelos propuestos logran una alta precisión en la detección y clasificación de enfermedades, lo que podría ser de gran ayuda para los profesionales médicos en la toma de decisiones clínicas.
Abstract:
This Bachelor’s Thesis focuses on the application of Deep Learning techniques to medical images with the aim of improving diagnostic assistance. Various architectures are addressed, such as Convolutional Neural Networks (CNNs), Generative Adversarial Networks (GANs), and Transformers, to tackle this task.
The main objective is to compare different neural network architectures for image segmentation in laparoscopy images, seeking to achieve robustness in predicting all classes. Modifications are made to the architectures to improve their performance. One of these modifications involves replacing the attention module of an architecture with a simpler one to verify if attention is essential for the performance of Transformers. The depth of the architecture is also evaluated.
For the development of this research, appropriate datasets for the specific problem of medical images are used. In this case, endoscopic images from Cholec80, provided by the CAMMA research group (Computational Analysis and Modeling of Medical Activities), will be used as the basis. These images represent real clinical cases of laparoscopic cholecystectomy surgery videos and are used to train and evaluate the proposed models.
During the development process, specialized Deep Learning tools and libraries such as TensorFlow or PyTorch are used, as well as development environments like Google Colab or Jupyter Notebook, which facilitate implementation and experimentation.
The evaluation of the models is carried out using appropriate metrics for medical diagnosis. These metrics allow measuring the accuracy and performance of the models in detecting diseases or anomalies in medical images.
The obtained results show the effectiveness of the Deep Learning approach applied to medical images for diagnosis. The proposed models achieve high accuracy in disease detection and classification, which could be of great help to medical professionals in making clinical decisions.
Este Trabajo de Fin de Grado se enfoca en la aplicación de técnicas de Deep Learning a imágenes médicas con el objetivo de mejorar la asistencia al diagnóstico. Se abordan diversas arquitecturas, como redes neuronales convolucionales (CNN), redes generativas adversarias (GAN) y Transformers, para abordar esta tarea.
El objetivo principal consiste en comparar diferentes arquitecturas de redes neuronales para la segmentación de imágenes de laparoscopias, buscando lograr robustez en la predicción de todas las clases. Se realizan modificaciones a las arquitecturas con el propósito de mejorar su rendimiento. Una de estas modificaciones implica reemplazar el módulo de atención de una arquitectura por otro más sencillo, con el fin de comprobar si la atención es esencial para el rendimiento de los Transformers, y también se evalúa la profundidad de la arquitectura.
Para el desarrollo de esta investigación, se emplean conjuntos de datos adecuados al problema específico de imágenes médicas, en nuestro caso se utilizarán las imágenes endoscópicas de Cholec80, proporcionadas por el Grupo de investigación CAMMA (Análisis computacional y modelado de actividades médicas), como base. Estas imágenes representan casos clínicos reales de videos de cirugías de colecistectomía laparoscópica y se utilizan para entrenar y evaluar los modelos propuestos.
Durante el proceso de desarrollo, se utilizan herramientas y bibliotecas especializadas en Deep Learning, como TensorFlow o PyTorch, y entornos de desarrollo como Google Colab o Jupyter Notebook, que facilitan la implementación y experimentación.
La evaluación de los modelos se realiza mediante métricas apropiadas para el diagnóstico médico. Estas métricas permiten medir la precisión y el rendimiento de los modelos en la detección de enfermedades o anomalías en las imágenes médicas.
Los resultados obtenidos muestran la efectividad del enfoque de Deep Learning aplicado a la imagen médica para el diagnóstico. Los modelos propuestos logran una alta precisión en la detección y clasificación de enfermedades, lo que podría ser de gran ayuda para los profesionales médicos en la toma de decisiones clínicas.
Abstract:
This Bachelor’s Thesis focuses on the application of Deep Learning techniques to medical images with the aim of improving diagnostic assistance. Various architectures are addressed, such as Convolutional Neural Networks (CNNs), Generative Adversarial Networks (GANs), and Transformers, to tackle this task.
The main objective is to compare different neural network architectures for image segmentation in laparoscopy images, seeking to achieve robustness in predicting all classes. Modifications are made to the architectures to improve their performance. One of these modifications involves replacing the attention module of an architecture with a simpler one to verify if attention is essential for the performance of Transformers. The depth of the architecture is also evaluated.
For the development of this research, appropriate datasets for the specific problem of medical images are used. In this case, endoscopic images from Cholec80, provided by the CAMMA research group (Computational Analysis and Modeling of Medical Activities), will be used as the basis. These images represent real clinical cases of laparoscopic cholecystectomy surgery videos and are used to train and evaluate the proposed models.
During the development process, specialized Deep Learning tools and libraries such as TensorFlow or PyTorch are used, as well as development environments like Google Colab or Jupyter Notebook, which facilitate implementation and experimentation.
The evaluation of the models is carried out using appropriate metrics for medical diagnosis. These metrics allow measuring the accuracy and performance of the models in detecting diseases or anomalies in medical images.
The obtained results show the effectiveness of the Deep Learning approach applied to medical images for diagnosis. The proposed models achieve high accuracy in disease detection and classification, which could be of great help to medical professionals in making clinical decisions. Read More