Evaluación de redes neuronales artificiales aplicadas a ortofotos

En este Trabajo de Fin de Grado, el objetivo es obtener modelos de Inteligencia Artificial que puedan detectar correctamente objetos geoespaciales orientados. Los objetos detectados son flechas de señalización vial y puentes. Para ello, se han considerado diferentes variantes (“n” – nano, “s” – small, “m” – medium, “l” – large y “x” – extralarge) de la octava versión del modelo YOLO (en concreto, su versión para objetos orientados, o OBB). Estos modelos han sido entrenados, validados y probados para obtener e identificar la arquitectura del modelo de DL más adecuada para la tarea.
Para obtener estos modelos de DL, primero se han entrenado diferentes configuraciones en dos conjuntos de datos iniciales, uno para las flechas y otro para los puentes. Después de evaluar datos nuevos con el mejor modelo, se han ido aumentando los respectivos datasets con datos procedentes de zonas difíciles para mejorar las predicciones.
El modelo con mejor rendimiento alcanzó una precisión de 0.79, una sensibilidad de 0.82, un mAP50-95 de 0.62 y un F1 score de 0.80 con una confianza del 0.67 en el caso de la detección del objeto puente, y una precisión de 0.89, una sensibilidad de 0.85, un mAP50- 95 de 0.73 y un F1 score de 0.86 con una confianza del 0.66 para la detección de los objetos flechas de señalización vial.
Estos valores indican un rendimiento alto, pero se considera que se pueden lograr más mejoras, ya que incluso los mejores modelos parecen obtener métricas de evaluación más bajas con la introducción de imágenes de fondo. También se espera que las métricas mejoren con la introducción de estrategias de normalización.
Abstract:
In this End-of-Studies project, the objective is to obtain Artificial Intelligence models that can correctly detect oriented geospatial objects. The objected detected are road marking arrows and bridges. To do so, different variants (“n” – nano, “s” – small, “m” – medium, “l” – large and “x” – extralarge) of the eighth version of the YOLO model (specifically its oriented object version, or OBB), have been considered. These models have been trained, validated and tested to obtain and identify the most suitable DL model architecture for the task.
To obtain these DL models, different configurations have first been trained on two initial datasets, one for the arrows and one for the bridges. After evaluating new data with the best model, the respective datasets have been increased with data from difficult area to improve the predictions.
The best performing model achieved a precision of 0.79, a recall of 0.82, a mAP50-95 of 0.62 and a F1 score of 0.80 with a confidence of 0.67 in the case of the bridge object detection, and a precision of 0.89, a recall of 0.85, a mAP50-95 of 0.73 and a F1 score of 0.86 with a confidence of 0.66 for the detection road marking arrow objects.
These values indicate a high performance, but it is considered that further improvements can be achieved, as even the best models seem obtained lower evaluation metrics with the addition of background images. It is also expected that the metrics might improve with the addition of normalization strategies.

​En este Trabajo de Fin de Grado, el objetivo es obtener modelos de Inteligencia Artificial que puedan detectar correctamente objetos geoespaciales orientados. Los objetos detectados son flechas de señalización vial y puentes. Para ello, se han considerado diferentes variantes (“n” – nano, “s” – small, “m” – medium, “l” – large y “x” – extralarge) de la octava versión del modelo YOLO (en concreto, su versión para objetos orientados, o OBB). Estos modelos han sido entrenados, validados y probados para obtener e identificar la arquitectura del modelo de DL más adecuada para la tarea.
Para obtener estos modelos de DL, primero se han entrenado diferentes configuraciones en dos conjuntos de datos iniciales, uno para las flechas y otro para los puentes. Después de evaluar datos nuevos con el mejor modelo, se han ido aumentando los respectivos datasets con datos procedentes de zonas difíciles para mejorar las predicciones.
El modelo con mejor rendimiento alcanzó una precisión de 0.79, una sensibilidad de 0.82, un mAP50-95 de 0.62 y un F1 score de 0.80 con una confianza del 0.67 en el caso de la detección del objeto puente, y una precisión de 0.89, una sensibilidad de 0.85, un mAP50- 95 de 0.73 y un F1 score de 0.86 con una confianza del 0.66 para la detección de los objetos flechas de señalización vial.
Estos valores indican un rendimiento alto, pero se considera que se pueden lograr más mejoras, ya que incluso los mejores modelos parecen obtener métricas de evaluación más bajas con la introducción de imágenes de fondo. También se espera que las métricas mejoren con la introducción de estrategias de normalización.
Abstract:
In this End-of-Studies project, the objective is to obtain Artificial Intelligence models that can correctly detect oriented geospatial objects. The objected detected are road marking arrows and bridges. To do so, different variants (“n” – nano, “s” – small, “m” – medium, “l” – large and “x” – extralarge) of the eighth version of the YOLO model (specifically its oriented object version, or OBB), have been considered. These models have been trained, validated and tested to obtain and identify the most suitable DL model architecture for the task.
To obtain these DL models, different configurations have first been trained on two initial datasets, one for the arrows and one for the bridges. After evaluating new data with the best model, the respective datasets have been increased with data from difficult area to improve the predictions.
The best performing model achieved a precision of 0.79, a recall of 0.82, a mAP50-95 of 0.62 and a F1 score of 0.80 with a confidence of 0.67 in the case of the bridge object detection, and a precision of 0.89, a recall of 0.85, a mAP50-95 of 0.73 and a F1 score of 0.86 with a confidence of 0.66 for the detection road marking arrow objects.
These values indicate a high performance, but it is considered that further improvements can be achieved, as even the best models seem obtained lower evaluation metrics with the addition of background images. It is also expected that the metrics might improve with the addition of normalization strategies. Read More