Are 12-lead ECGs necessary for detecting heart anomalies? a comparison between 12-lead and 3-lead ECG classification using deep learning

Las enfermedades cardiovasculares causaron 17,9 millones de muertes en todo el mundo, según la Organización Mundial de la Salud. La detección temprana y precisa de las enfermedades cardiovasculares es vital para una intervención oportuna, un tratamiento eficaz y mejor desenlace para los pacientes. Una de las herramientas de diagnóstico primarias utilizadas en la evaluación de la salud cardiovascular es el electrocardiograma (ECG). Las muestras de ECG capturan la actividad eléctrica del corazón. Al analizar la morfología de las ondas dentro de una señal de ECG, los profesionales de la salud pueden identificar diversas anomalías cardíacas y tomar decisiones informadas sobre la condición del paciente. Sin embargo, obtener un ECG de 12 derivaciones con equipo profesional no es viable en muchas situaciones en tiempo real, por lo que debemos recurrir a ECGs de derivaciones reducidas.
Siguiendo el trabajo de un grupo de médicos españoles que estudiaron la eficacia clínica del diagnóstico del síndrome coronario agudo con smartwatches, utilizando solo tres derivaciones para el diagnóstico, la pregunta a abordar en esta investigación es: “¿Pueden los modelos de deep learning de clasificación de ECG de 3 derivaciones alcanzar un rendimiento similar al de los modelos de clasificación de ECG de 12 derivaciones?”. La hipótesis inicial es que la clasificación de ECG de 3 derivaciones puede, de hecho, tener un rendimiento similar al de sus homólogos de 12 derivaciones.
Para este trabajo, se utilizó un modelo de clasificación de ECG de 12 derivaciones publicado en Nature Communications y entrenado originalmente con más de 2 millones de ECG como modelo de 12 derivaciones y LightX3ECG como modelo básico de 3 derivaciones. Ambos se entrenaron en el conjunto de datos PTB-XL para disponer de una base común de comparación. Una vez establecidas las líneas de base, el modelo de 12 derivaciones se modificó para trabajar con sólo 3 derivaciones y se entrenó con el conjunto de datos PTB-XL. Además, se utilizaron técnicas de aprendizaje por transferencia y de uno contra todos para reducir la diferencia de rendimiento entre los modelos de 12 y 3 derivaciones.
Los resultados de esta investigación muestran que el modelo de 12 derivaciones estudiado puede adaptarse a 3 derivaciones cambiando únicamente la capa de entrada y perdiendo sólo un 4% de rendimiento con un 75% menos de entrada. Además, el aprendizaje por transferencia y el enfoque “uno contra todos” pueden utilizarse para minimizar la variación de rendimiento entre los modelos de 12 y 3 derivaciones, lo que se traduce en una caída del rendimiento de tan solo un 1%.
Este trabajo tiene algunas limitaciones, como la disponibilidad de datos y el hecho de que esta comparación se haya realizado en un diseño de arquitectura única. No obstante, a pesar de estas limitaciones, la conclusión de este estudio es que, en ausencia de un ECG de 12 derivaciones, podría utilizarse un ECG de 3 derivaciones para obtener un diagnóstico con una precisión casi equivalente. Este hallazgo prepara el terreno para futuras investigaciones que estudien la generalizabilidad de esta conclusión para diferentes conjuntos de datos y arquitecturas de modelos. Además, abre la oportunidad de realizar diagnósticos automáticos y sistemas de monitorización continua con dispositivos de ECG de derivación reducida y otros dispositivos sanitarios portátiles.
ABSTRACT
Cardiovascular diseases were responsible for 17.9 million deaths worldwide according to the World Health Organization in 2019. Early and accurate detection of cardiovascular diseases is crucial for timely intervention, effective treatment, and improved patient outcomes. One of the primary diagnostic tools used in the assessment of cardiovascular health is the electrocardiogram (ECG). ECG recordings capture the electrical activity of the heart. By analyzing the waveforms within an ECG signal, healthcare professionals can identify various cardiac abnormalities and make informed decisions about the patient’s condition. However, obtaining a 12-lead ECG with professional equipment is not viable in many real-time situations so we must resort to reduced-lead ECGs.
Following the work of a group of Spanish doctors that studied the clinical effectiveness of diagnosing acute coronary syndrome with smartwatches, using only three leads for the diagnosis, the question to be addressed in this research is: “Can 3-lead ECG classification deep learning models achieve a similar performance to 12-lead ECG classification models?”. The initial hypothesis is that 3-lead ECG classification can in fact perform similarly to their 12-lead counterparts.
For this work, a 12-lead ECG classification model published in Nature Communications and originally trained on over 2 million ECGs, was used as the 12-lead model and LightX3ECG was used as a base 3-lead model. Both were trained on the PTB-XL dataset to have a common ground for comparison. Once baselines were established the 12-lead model was modified to work with only 3 leads and trained on the PTB-XL dataset. Additionally, transfer learning and a one vs. all techniques were used to reduce the performance difference between the 12-lead and 3-lead models.
The results of this research show that the 12-lead model studied can be adapted to 3 leads by only changing the input layer and only losing 4% in performance with 75% less input. Furthermore, transfer learning and a one vs. all approach can be used to minimise the performance variation between the 12-lead and 3-lead models resulting in a mere 1% drop in performance.
There are some limitations to this work such as the data availability and the fact that this comparison was done on a single architecture design. Nevertheless, in spite of these limitations, the conclusion of this study is that in the absence of a 12-lead ECG a 3-lead ECG could potentially be used to obtain a diagnosis with almost equivalent accuracy. This finding sets the stage for future research to study the generalizability of this conclusion for different datasets and model architectures. Additionally, it opens up the opportunity of automatic diagnosis and continuous monitoring systems with reduced-lead ECG devices and other health wearables.

​Las enfermedades cardiovasculares causaron 17,9 millones de muertes en todo el mundo, según la Organización Mundial de la Salud. La detección temprana y precisa de las enfermedades cardiovasculares es vital para una intervención oportuna, un tratamiento eficaz y mejor desenlace para los pacientes. Una de las herramientas de diagnóstico primarias utilizadas en la evaluación de la salud cardiovascular es el electrocardiograma (ECG). Las muestras de ECG capturan la actividad eléctrica del corazón. Al analizar la morfología de las ondas dentro de una señal de ECG, los profesionales de la salud pueden identificar diversas anomalías cardíacas y tomar decisiones informadas sobre la condición del paciente. Sin embargo, obtener un ECG de 12 derivaciones con equipo profesional no es viable en muchas situaciones en tiempo real, por lo que debemos recurrir a ECGs de derivaciones reducidas.
Siguiendo el trabajo de un grupo de médicos españoles que estudiaron la eficacia clínica del diagnóstico del síndrome coronario agudo con smartwatches, utilizando solo tres derivaciones para el diagnóstico, la pregunta a abordar en esta investigación es: “¿Pueden los modelos de deep learning de clasificación de ECG de 3 derivaciones alcanzar un rendimiento similar al de los modelos de clasificación de ECG de 12 derivaciones?”. La hipótesis inicial es que la clasificación de ECG de 3 derivaciones puede, de hecho, tener un rendimiento similar al de sus homólogos de 12 derivaciones.
Para este trabajo, se utilizó un modelo de clasificación de ECG de 12 derivaciones publicado en Nature Communications y entrenado originalmente con más de 2 millones de ECG como modelo de 12 derivaciones y LightX3ECG como modelo básico de 3 derivaciones. Ambos se entrenaron en el conjunto de datos PTB-XL para disponer de una base común de comparación. Una vez establecidas las líneas de base, el modelo de 12 derivaciones se modificó para trabajar con sólo 3 derivaciones y se entrenó con el conjunto de datos PTB-XL. Además, se utilizaron técnicas de aprendizaje por transferencia y de uno contra todos para reducir la diferencia de rendimiento entre los modelos de 12 y 3 derivaciones.
Los resultados de esta investigación muestran que el modelo de 12 derivaciones estudiado puede adaptarse a 3 derivaciones cambiando únicamente la capa de entrada y perdiendo sólo un 4% de rendimiento con un 75% menos de entrada. Además, el aprendizaje por transferencia y el enfoque “uno contra todos” pueden utilizarse para minimizar la variación de rendimiento entre los modelos de 12 y 3 derivaciones, lo que se traduce en una caída del rendimiento de tan solo un 1%.
Este trabajo tiene algunas limitaciones, como la disponibilidad de datos y el hecho de que esta comparación se haya realizado en un diseño de arquitectura única. No obstante, a pesar de estas limitaciones, la conclusión de este estudio es que, en ausencia de un ECG de 12 derivaciones, podría utilizarse un ECG de 3 derivaciones para obtener un diagnóstico con una precisión casi equivalente. Este hallazgo prepara el terreno para futuras investigaciones que estudien la generalizabilidad de esta conclusión para diferentes conjuntos de datos y arquitecturas de modelos. Además, abre la oportunidad de realizar diagnósticos automáticos y sistemas de monitorización continua con dispositivos de ECG de derivación reducida y otros dispositivos sanitarios portátiles.
ABSTRACT
Cardiovascular diseases were responsible for 17.9 million deaths worldwide according to the World Health Organization in 2019. Early and accurate detection of cardiovascular diseases is crucial for timely intervention, effective treatment, and improved patient outcomes. One of the primary diagnostic tools used in the assessment of cardiovascular health is the electrocardiogram (ECG). ECG recordings capture the electrical activity of the heart. By analyzing the waveforms within an ECG signal, healthcare professionals can identify various cardiac abnormalities and make informed decisions about the patient’s condition. However, obtaining a 12-lead ECG with professional equipment is not viable in many real-time situations so we must resort to reduced-lead ECGs.
Following the work of a group of Spanish doctors that studied the clinical effectiveness of diagnosing acute coronary syndrome with smartwatches, using only three leads for the diagnosis, the question to be addressed in this research is: “Can 3-lead ECG classification deep learning models achieve a similar performance to 12-lead ECG classification models?”. The initial hypothesis is that 3-lead ECG classification can in fact perform similarly to their 12-lead counterparts.
For this work, a 12-lead ECG classification model published in Nature Communications and originally trained on over 2 million ECGs, was used as the 12-lead model and LightX3ECG was used as a base 3-lead model. Both were trained on the PTB-XL dataset to have a common ground for comparison. Once baselines were established the 12-lead model was modified to work with only 3 leads and trained on the PTB-XL dataset. Additionally, transfer learning and a one vs. all techniques were used to reduce the performance difference between the 12-lead and 3-lead models.
The results of this research show that the 12-lead model studied can be adapted to 3 leads by only changing the input layer and only losing 4% in performance with 75% less input. Furthermore, transfer learning and a one vs. all approach can be used to minimise the performance variation between the 12-lead and 3-lead models resulting in a mere 1% drop in performance.
There are some limitations to this work such as the data availability and the fact that this comparison was done on a single architecture design. Nevertheless, in spite of these limitations, the conclusion of this study is that in the absence of a 12-lead ECG a 3-lead ECG could potentially be used to obtain a diagnosis with almost equivalent accuracy. This finding sets the stage for future research to study the generalizability of this conclusion for different datasets and model architectures. Additionally, it opens up the opportunity of automatic diagnosis and continuous monitoring systems with reduced-lead ECG devices and other health wearables. Read More