Este trabajo fin de grado se centra en la detección de las rotondas y enlaces que se pueden encontrar en ortoimágenes aéreas del Plan Nacional de Ortofotografía Aérea (PNOA). Se presentan los conceptos más importantes relacionados con la inteligencia artificial, aprendizaje automático y el aprendizaje profundo y se aplican redes neuronales especializadas en la detección de objetos (basadas en redes convolucionales) para la detección y clasificación de objetos geoespaciales (rotondas y enlaces) en ortoimágenes aéreas.
Se parte de un conjunto de datos etiquetado con información sobre rotondas y enlaces utilizando LabelMe, además de varios scripts iniciales para la descarga de imágenes o la orientación de las etiquetas. Después, se entrenan variantes de YOLOv8 para detectar los objetos geoespaciales estudiados en las ortoimágenes.
El trabajo se centra en el entrenamiento, testeo y validación de las diversa simágenes con los modelos de YOLOv8. Se prueban modelos que utilizan las etiquetas orientadas y modelos que no las usan. Por otro lado, se analizan las métricas más importantes y se elige el modelo más adecuado para el problema, el cual posteriormente se utilizará para predecir las diferentes clases en imágenes del Plan Nacional de Ortofotografía Aérea en la Comunidad de Madrid. Posteriormente se valora el rendimiento y funcionamiento del modelo para observar sus limitaciones.
Por último, este trabajo también se enfoca en analizar que estructura debe seguir un fichero JSON para que siga con el estándar TrainingDML-AI. Con ello, se consigue un fichero JSON con las etiquetas utilizadas en este proyecto.
Abstract:
This final degree project focuses on the detection of roundabouts and junctions found in aerial orthoimages from the National Plan for Aerial Orthophotography (PNOA).
The most important concepts related to artificial intelligence, machine learning, and deep learning are presented, and neural networks specialized in object detection (based on convolutional networks) are applied for the detection and classification of geospatial objects (roundabouts and junctions) in aerial orthoimages.
The project starts with a labelled dataset containing information about roundabouts and junctions using LabelMe, along with several initial scripts for downloading images or orienting the labels. Then, variants of YOLOv8 are trained to detect the geospatial objects studied in the orthoimages.
The work focuses on training, testing, and validating the various images with YOLOv8 models. Models using oriented labels and models that do not use them are tested. On the other hand, the most important metrics are analysed, and the most suitable model for the problem is selected, which will later be used to predict the different classes in images from the National Plan for Aerial Orthophotography in the Community of Madrid. Subsequently, the performance and functionality of the model are evaluated to observe its limitations.
Finally, this project also focuses on analysing the structure a JSON file should follow to comply with the TrainingDML-AI standard. As a result, a JSON file with the labels used in this project is created.
Este trabajo fin de grado se centra en la detección de las rotondas y enlaces que se pueden encontrar en ortoimágenes aéreas del Plan Nacional de Ortofotografía Aérea (PNOA). Se presentan los conceptos más importantes relacionados con la inteligencia artificial, aprendizaje automático y el aprendizaje profundo y se aplican redes neuronales especializadas en la detección de objetos (basadas en redes convolucionales) para la detección y clasificación de objetos geoespaciales (rotondas y enlaces) en ortoimágenes aéreas.
Se parte de un conjunto de datos etiquetado con información sobre rotondas y enlaces utilizando LabelMe, además de varios scripts iniciales para la descarga de imágenes o la orientación de las etiquetas. Después, se entrenan variantes de YOLOv8 para detectar los objetos geoespaciales estudiados en las ortoimágenes.
El trabajo se centra en el entrenamiento, testeo y validación de las diversa simágenes con los modelos de YOLOv8. Se prueban modelos que utilizan las etiquetas orientadas y modelos que no las usan. Por otro lado, se analizan las métricas más importantes y se elige el modelo más adecuado para el problema, el cual posteriormente se utilizará para predecir las diferentes clases en imágenes del Plan Nacional de Ortofotografía Aérea en la Comunidad de Madrid. Posteriormente se valora el rendimiento y funcionamiento del modelo para observar sus limitaciones.
Por último, este trabajo también se enfoca en analizar que estructura debe seguir un fichero JSON para que siga con el estándar TrainingDML-AI. Con ello, se consigue un fichero JSON con las etiquetas utilizadas en este proyecto.
Abstract:
This final degree project focuses on the detection of roundabouts and junctions found in aerial orthoimages from the National Plan for Aerial Orthophotography (PNOA).
The most important concepts related to artificial intelligence, machine learning, and deep learning are presented, and neural networks specialized in object detection (based on convolutional networks) are applied for the detection and classification of geospatial objects (roundabouts and junctions) in aerial orthoimages.
The project starts with a labelled dataset containing information about roundabouts and junctions using LabelMe, along with several initial scripts for downloading images or orienting the labels. Then, variants of YOLOv8 are trained to detect the geospatial objects studied in the orthoimages.
The work focuses on training, testing, and validating the various images with YOLOv8 models. Models using oriented labels and models that do not use them are tested. On the other hand, the most important metrics are analysed, and the most suitable model for the problem is selected, which will later be used to predict the different classes in images from the National Plan for Aerial Orthophotography in the Community of Madrid. Subsequently, the performance and functionality of the model are evaluated to observe its limitations.
Finally, this project also focuses on analysing the structure a JSON file should follow to comply with the TrainingDML-AI standard. As a result, a JSON file with the labels used in this project is created. Read More