Peak Attention U-Net: attention-enhanced ECG delineation model for Peak Detection

Segun estadísticas recientes de la Organización Mundial de la Salud, las enfermedades cardiovasculares son la principal causa de muerte a nivel mundial, lo que destaca la necesidad de herramientas de diagnóstico avanzadas. El electrocardiograma (ECG) es una prueba no invasiva que registra la actividad eléctrica del corazón, proporcionando información esencial para el diagnóstico de afecciones cardiacas. La delineación del ECG se refiere al proceso de identificación de puntos de interés específicos (puntos fiduciales) en la señal del ECG, como los comienzos, picos y finales de las ondas P, QRS y T, que son cruciales para una interpretación y diagnóstico precisos.
Mientras que los métodos tradicionales de delineación del ECG, como las transformadas wavelet y los algoritmos basados en reglas, han sido ampliamente utilizados, a menudo tienen dificultades con el ruido y las variaciones morfológicas. Los enfoques recientes de aprendizaje profundo, incluyendo las redes neuronales convolucionales (CNN) y las redes neuronales recurrentes (RNN), han mostrado promesa, pero carecen de precisión en la detección de regiones más pequeñas.
Este Trabajo de Fin de Máster propone un modelo novedoso de aprendizaje profundo que aborda varias limitaciones de los modelos existentes y facilita su uso clínico futuro con dispositivos wearables. El modelo U-Net mejorado con atención propuesto (Peak Attention U-Net) incorpora un mecanismo de atención en la arquitectura UNet, permitiéndole enfocarse en regiones pequeñas pero clínicamente relevantes dela señal ECG, como los picos. El modelo Peak Attention U-Net logra un rendimiento del estado del arte en la delineación de puntos fiduciales, destacando particularmente en la detección de picos P, R y T. En comparación con enfoques recientes y relevantes de aprendizaje profundo, demuestra una mejora notable de más del 12,5% en la puntuación F1 para la detección de picos. El rendimiento del modelo fue evaluado utilizando la ampliamente reconocida base de datos LUDB de PhysioNet, asegurando una comparación robusta con los métodos existentes.
Las ventajas clave del modelo propuesto incluyen su capacidad para detectar picos, procesar señales completas de ECG, su diseño agnóstico de la derivación y su eficiencia computacional. Estas características lo convierten en una herramienta versátil y práctica para varios escenarios clínicos, incluyendo tanto el análisis offline como potenciales aplicaciones de monitoreo en tiempo real.
Los resultados experimentales demuestran el potencial del marco desarrollado para su uso clínico real. Al abordar las limitaciones de los métodos existentes y ofrecer un mejor rendimiento, esta investigación contribuye al avance de la delineación de ECGy abre posibilidades para el diagnóstico precoz más allá de los entornos médicos tradicionales con el uso de tecnología wearable. El trabajo futuro se centrará en evaluar la capacidad de generalización del modelo en diferentes conjuntos de datos y en entornos clínicos reales para confirmar su utilidad clínica.
ABSTRACT
According to recent statistics from the World Health Organization, cardiovascular diseases are the leading cause of death globally, highlighting the need for advanced diagnostic tools. An electrocardiogram (ECG) is a non-invasive test that records the electrical activity of the heart, providing essential information for diagnosing cardiac conditions. ECG delineation refers to the process of identifying specific points of interest (fiducial points) in the ECG signal, such as the onsets, peaks and offsets of the P, QRS, and T waves, which are crucial for accurate interpretation and diagnosis.
While traditional ECG delineation methods such as wavelet transforms and rulebased algorithms have been widely used, they often struggle with noise and morphological variations. Recent deep learning approaches, including convolutional neural networks (CNNs) and recurrent neural networks (RNNs), have shown promise, but lack accuracy in detecting smaller regions.
This Master’s Thesis proposes a novel deep learning model that addresses several limitations of existing models and facilitates their future clinical use with wearable devices. The proposed attention-enhanced U-Net model (Peak Attention U-Net) incorporates an attention mechanism into the U-Net architecture, allowing it to focus on small yet clinically relevant regions of the ECG signal, such as peaks. The Peak Attention U-Net achieves state-of-the-art performance in fiducial point delineation, particularly excelling in the detection of P, R, and T peaks. Compared to recent and relevant deep learning approaches, it demonstrates a remarkable improvement of over 12.5% in F1 score for peak detection. The model’s performance was evaluated using the widely recognized PhysioNet LUDB database, ensuring a robust comparison with existing methods.
Key advantages of the proposed model include its ability to detect peaks, process entire ECG signals, its lead-agnostic design, and its computational efficiency. These features make it a versatile and practical tool for various clinical scenarios, including both offline analysis and potential real-time monitoring applications.
Experimental results demonstrate the potential of the developed framework for real clinical use. By addressing the limitations of existing methods and offering improved performance, this research contributes to the advancement of ECG delineation and opens possibilities for early diagnosis beyond traditional medical settings with the use of wearable devices. Future work will focus on evaluating the model’s generalizability across diverse datasets and in real-world clinical settings to confirm its clinical utility.

​Segun estadísticas recientes de la Organización Mundial de la Salud, las enfermedades cardiovasculares son la principal causa de muerte a nivel mundial, lo que destaca la necesidad de herramientas de diagnóstico avanzadas. El electrocardiograma (ECG) es una prueba no invasiva que registra la actividad eléctrica del corazón, proporcionando información esencial para el diagnóstico de afecciones cardiacas. La delineación del ECG se refiere al proceso de identificación de puntos de interés específicos (puntos fiduciales) en la señal del ECG, como los comienzos, picos y finales de las ondas P, QRS y T, que son cruciales para una interpretación y diagnóstico precisos.
Mientras que los métodos tradicionales de delineación del ECG, como las transformadas wavelet y los algoritmos basados en reglas, han sido ampliamente utilizados, a menudo tienen dificultades con el ruido y las variaciones morfológicas. Los enfoques recientes de aprendizaje profundo, incluyendo las redes neuronales convolucionales (CNN) y las redes neuronales recurrentes (RNN), han mostrado promesa, pero carecen de precisión en la detección de regiones más pequeñas.
Este Trabajo de Fin de Máster propone un modelo novedoso de aprendizaje profundo que aborda varias limitaciones de los modelos existentes y facilita su uso clínico futuro con dispositivos wearables. El modelo U-Net mejorado con atención propuesto (Peak Attention U-Net) incorpora un mecanismo de atención en la arquitectura UNet, permitiéndole enfocarse en regiones pequeñas pero clínicamente relevantes dela señal ECG, como los picos. El modelo Peak Attention U-Net logra un rendimiento del estado del arte en la delineación de puntos fiduciales, destacando particularmente en la detección de picos P, R y T. En comparación con enfoques recientes y relevantes de aprendizaje profundo, demuestra una mejora notable de más del 12,5% en la puntuación F1 para la detección de picos. El rendimiento del modelo fue evaluado utilizando la ampliamente reconocida base de datos LUDB de PhysioNet, asegurando una comparación robusta con los métodos existentes.
Las ventajas clave del modelo propuesto incluyen su capacidad para detectar picos, procesar señales completas de ECG, su diseño agnóstico de la derivación y su eficiencia computacional. Estas características lo convierten en una herramienta versátil y práctica para varios escenarios clínicos, incluyendo tanto el análisis offline como potenciales aplicaciones de monitoreo en tiempo real.
Los resultados experimentales demuestran el potencial del marco desarrollado para su uso clínico real. Al abordar las limitaciones de los métodos existentes y ofrecer un mejor rendimiento, esta investigación contribuye al avance de la delineación de ECGy abre posibilidades para el diagnóstico precoz más allá de los entornos médicos tradicionales con el uso de tecnología wearable. El trabajo futuro se centrará en evaluar la capacidad de generalización del modelo en diferentes conjuntos de datos y en entornos clínicos reales para confirmar su utilidad clínica.
ABSTRACT
According to recent statistics from the World Health Organization, cardiovascular diseases are the leading cause of death globally, highlighting the need for advanced diagnostic tools. An electrocardiogram (ECG) is a non-invasive test that records the electrical activity of the heart, providing essential information for diagnosing cardiac conditions. ECG delineation refers to the process of identifying specific points of interest (fiducial points) in the ECG signal, such as the onsets, peaks and offsets of the P, QRS, and T waves, which are crucial for accurate interpretation and diagnosis.
While traditional ECG delineation methods such as wavelet transforms and rulebased algorithms have been widely used, they often struggle with noise and morphological variations. Recent deep learning approaches, including convolutional neural networks (CNNs) and recurrent neural networks (RNNs), have shown promise, but lack accuracy in detecting smaller regions.
This Master’s Thesis proposes a novel deep learning model that addresses several limitations of existing models and facilitates their future clinical use with wearable devices. The proposed attention-enhanced U-Net model (Peak Attention U-Net) incorporates an attention mechanism into the U-Net architecture, allowing it to focus on small yet clinically relevant regions of the ECG signal, such as peaks. The Peak Attention U-Net achieves state-of-the-art performance in fiducial point delineation, particularly excelling in the detection of P, R, and T peaks. Compared to recent and relevant deep learning approaches, it demonstrates a remarkable improvement of over 12.5% in F1 score for peak detection. The model’s performance was evaluated using the widely recognized PhysioNet LUDB database, ensuring a robust comparison with existing methods.
Key advantages of the proposed model include its ability to detect peaks, process entire ECG signals, its lead-agnostic design, and its computational efficiency. These features make it a versatile and practical tool for various clinical scenarios, including both offline analysis and potential real-time monitoring applications.
Experimental results demonstrate the potential of the developed framework for real clinical use. By addressing the limitations of existing methods and offering improved performance, this research contributes to the advancement of ECG delineation and opens possibilities for early diagnosis beyond traditional medical settings with the use of wearable devices. Future work will focus on evaluating the model’s generalizability across diverse datasets and in real-world clinical settings to confirm its clinical utility. Read More