Detección y estimación de métricas sobre una pelota de pádel usando cámaras de alta velocidad

La detección y extracción de métricas de objetos que se mueven a gran velocidad, representa un desafío en el ámbito deportivo. La motivación detrás de este trabajo se basa en la creciente demanda de soluciones para la extracción automática de métricas en el pádel. Por ello, este proyecto se enfoca en el diseño y desarrollo de un algoritmo capaz de detectar la pelota y extraer métricas como la velocidad a la que está moviéndose utilizando técnicas tradicionales de aprendizaje automático.
El principal desafío abordado en este proyecto es la detección precisa y rápida de la pelota en diversos entornos y condiciones de iluminación. La detección precisa es difícil porque la pelota puede estar sujeta a posibles oclusiones o variaciones de tamaño en función de su distancia a la cámara. En cuanto al requisito de diseñar un algoritmo que funcione en tiempo real, cabe destacar la necesidad de usar cámaras que graban gran cantidad de frames para capturar de manera nítida la pelota. Aunque en deportes similares como el ping pong o el tenis se han abordado estos problemas, cabe analizar e investigar su aplicabilidad a otros deportes similares como pueda ser el pádel. Mediante el uso de algoritmos de visión por computador, como el análisis del color y la forma de la pelota o la captura del movimiento producido en la escena, es posible la detección precisa y rápida de la pelota de pádel así como su posterior seguimiento. Asimismo, se implementa la estimación de la velocidad de la pelota conociendo el tamaño de la pelota y el número de imágenes que captura la cámara por segundo.
Para evaluar los resultados de los algoritmos implementados, se ha anotado manualmente la posición de la pelota en 4 vídeos capturados en exteriores. Aunque el sistema está diseñado para ser utilizado en un entorno controlado, se obtienen buenos resultados incluso en escenarios donde hay otros elementos de color similar al de la pelota, siempre y cuando la cámara esté fija en un trípode. La conclusión principal de este trabajo es que las técnicas tradicionales de aprendizaje automático siguen siendo una herramienta efectiva para detectar objetos de manera precisa en tiempo real.
ABSTRACT
The detection and extraction of metrics from fast moving objects represents a challenge in sports. The motivation behind this work is based on the growing demand for automatic metric extraction solutions in paddle tennis. Therefore, this project focuses on the design and development of an algorithm capable of detecting the ball and extracting metrics such as the speed at which it is moving using traditional machine learning techniques.
The main challenge addressed in this project is the accurate and fast detection of the ball in various environments and lighting conditions. Accurate detection is difficult because the ball may be subject to possible occlusions or size variations depending on its distance from the camera. In terms of the requirement to design an algorithm that works in real time, it is worth noting the need to use cameras that record large numbers of frames to capture the ball sharply. Although these problems have been addressed in similar sports such as ping pong or tennis, it is worth analyzing and investigating their applicability to other similar sports such as paddle tennis. By using computer vision algorithms such as the analysis of the color and shape of the ball or the capture of the movement produced in the scene, it is possible the accurate and fast detection of the paddle ball as well as its subsequent tracking. Also, the estimation of the speed of the ball is implemented by knowing the size of the ball and the number of images captured by the camera per second.
To evaluate the results of the implemented algorithms, the position of the ball has been manually annotated in 4 videos captured outdoors. Although the system is designed to be used in a controlled environment, good results are obtained even in scenarios where there are other elements of similar color to the ball, as long as the camera is fixed on a tripod. The main conclusion of this work is that traditional machine learning techniques are still an effective tool for accurately detecting objects in real time.

​La detección y extracción de métricas de objetos que se mueven a gran velocidad, representa un desafío en el ámbito deportivo. La motivación detrás de este trabajo se basa en la creciente demanda de soluciones para la extracción automática de métricas en el pádel. Por ello, este proyecto se enfoca en el diseño y desarrollo de un algoritmo capaz de detectar la pelota y extraer métricas como la velocidad a la que está moviéndose utilizando técnicas tradicionales de aprendizaje automático.
El principal desafío abordado en este proyecto es la detección precisa y rápida de la pelota en diversos entornos y condiciones de iluminación. La detección precisa es difícil porque la pelota puede estar sujeta a posibles oclusiones o variaciones de tamaño en función de su distancia a la cámara. En cuanto al requisito de diseñar un algoritmo que funcione en tiempo real, cabe destacar la necesidad de usar cámaras que graban gran cantidad de frames para capturar de manera nítida la pelota. Aunque en deportes similares como el ping pong o el tenis se han abordado estos problemas, cabe analizar e investigar su aplicabilidad a otros deportes similares como pueda ser el pádel. Mediante el uso de algoritmos de visión por computador, como el análisis del color y la forma de la pelota o la captura del movimiento producido en la escena, es posible la detección precisa y rápida de la pelota de pádel así como su posterior seguimiento. Asimismo, se implementa la estimación de la velocidad de la pelota conociendo el tamaño de la pelota y el número de imágenes que captura la cámara por segundo.
Para evaluar los resultados de los algoritmos implementados, se ha anotado manualmente la posición de la pelota en 4 vídeos capturados en exteriores. Aunque el sistema está diseñado para ser utilizado en un entorno controlado, se obtienen buenos resultados incluso en escenarios donde hay otros elementos de color similar al de la pelota, siempre y cuando la cámara esté fija en un trípode. La conclusión principal de este trabajo es que las técnicas tradicionales de aprendizaje automático siguen siendo una herramienta efectiva para detectar objetos de manera precisa en tiempo real.
ABSTRACT
The detection and extraction of metrics from fast moving objects represents a challenge in sports. The motivation behind this work is based on the growing demand for automatic metric extraction solutions in paddle tennis. Therefore, this project focuses on the design and development of an algorithm capable of detecting the ball and extracting metrics such as the speed at which it is moving using traditional machine learning techniques.
The main challenge addressed in this project is the accurate and fast detection of the ball in various environments and lighting conditions. Accurate detection is difficult because the ball may be subject to possible occlusions or size variations depending on its distance from the camera. In terms of the requirement to design an algorithm that works in real time, it is worth noting the need to use cameras that record large numbers of frames to capture the ball sharply. Although these problems have been addressed in similar sports such as ping pong or tennis, it is worth analyzing and investigating their applicability to other similar sports such as paddle tennis. By using computer vision algorithms such as the analysis of the color and shape of the ball or the capture of the movement produced in the scene, it is possible the accurate and fast detection of the paddle ball as well as its subsequent tracking. Also, the estimation of the speed of the ball is implemented by knowing the size of the ball and the number of images captured by the camera per second.
To evaluate the results of the implemented algorithms, the position of the ball has been manually annotated in 4 videos captured outdoors. Although the system is designed to be used in a controlled environment, good results are obtained even in scenarios where there are other elements of similar color to the ball, as long as the camera is fixed on a tripod. The main conclusion of this work is that traditional machine learning techniques are still an effective tool for accurately detecting objects in real time. Read More