Este Trabajo Fin de Grado tiene como objetivo principal analizar y comparar cualitativamente el rendimiento obtenido por modelo pix2pix en la tarea de esqueletización de los viales con metodologías tradicionales. El enfoque del proyecto se centra en la aplicación de técnicas de aprendizaje profundo para la generación y la validación de los modelos. Este estudio se fundamenta en una exhaustiva revisión de la bibliografía, que establece el marco teórico y contextualiza el uso de modelos generativos como pix2pix.
El proyecto implicó la creación de un conjunto de datos robusto y representativo, obtenidos mediante la digitalización de las carreteras, rotondas, enlaces y cruces. Los datos de entrada para el modelo simulan los resultados de la segmentación semántica. El modelo pix2pix compuesto por un discriminador y un generador, se entrenó y validó exhaustivamente, realizando ajustes iterativos para optimizar su rendimiento.
Los resultados obtenidos demuestran que el modelo pix2pix ofrece una alta precisión medida en los resultados del cálculo de IoU obteniendo un valor de 80%, siendo capaz de generar el esqueleto de las imágenes de entrada de manera exitosa, superando los problemas comunes y desventajas que ofrecen las distintas metodologías tradicionales.
Adicionalmente, el uso del modelo pix2pix representa una mejorar significativa en el análisis cualitativo en comparación con las metodologías tradicionales. La capacidad del modelo para aprender y generalizar a partir de datos complejos lo convierte en una herramienta valiosa para futuras investigaciones y aplicaciones en el campo del deep learning.
Abstract:
This End-of-Studies Project (TFG) aims to analyze and qualitative compare the performance obtained by the pix2pix model for the task of skeletonizing roadways with traditional methodologies. The focus of the project is related to the application of deep learning techniques for the generation and validation of models. This study is based on an exhaustive review of the literature to establish the theoretical framework and contextualize the use of generative models like pix2pix.
The project involved creating a robust and representative dataset, obtained by manually digitalizing the roads, roundabouts, links and highway intersections. The input data for the model simulate the results of semantic segmentation. The pix2pix model, consisting of a discriminator and a generator, was trained and quantitatively and qualitatively validated in an exhaustive manner, with iterative adjustments applied to optimize its performance.
The results indicate that the pix2pix model offers a high IoU score performance (achieving a value of 80%) and is capable of successfully generating the skeleton of the input images, surpassing common problems and disadvantages presented by various traditional methodologies. Additionally, the use of the pix2pix model represents a significant improvement in qualitative analysis compared to traditional methodologies.
The model’s ability to learn and generalize from complex data demonstrates that it is a valuable tool for future research and applications in the field of deep learning.
Este Trabajo Fin de Grado tiene como objetivo principal analizar y comparar cualitativamente el rendimiento obtenido por modelo pix2pix en la tarea de esqueletización de los viales con metodologías tradicionales. El enfoque del proyecto se centra en la aplicación de técnicas de aprendizaje profundo para la generación y la validación de los modelos. Este estudio se fundamenta en una exhaustiva revisión de la bibliografía, que establece el marco teórico y contextualiza el uso de modelos generativos como pix2pix.
El proyecto implicó la creación de un conjunto de datos robusto y representativo, obtenidos mediante la digitalización de las carreteras, rotondas, enlaces y cruces. Los datos de entrada para el modelo simulan los resultados de la segmentación semántica. El modelo pix2pix compuesto por un discriminador y un generador, se entrenó y validó exhaustivamente, realizando ajustes iterativos para optimizar su rendimiento.
Los resultados obtenidos demuestran que el modelo pix2pix ofrece una alta precisión medida en los resultados del cálculo de IoU obteniendo un valor de 80%, siendo capaz de generar el esqueleto de las imágenes de entrada de manera exitosa, superando los problemas comunes y desventajas que ofrecen las distintas metodologías tradicionales.
Adicionalmente, el uso del modelo pix2pix representa una mejorar significativa en el análisis cualitativo en comparación con las metodologías tradicionales. La capacidad del modelo para aprender y generalizar a partir de datos complejos lo convierte en una herramienta valiosa para futuras investigaciones y aplicaciones en el campo del deep learning.
Abstract:
This End-of-Studies Project (TFG) aims to analyze and qualitative compare the performance obtained by the pix2pix model for the task of skeletonizing roadways with traditional methodologies. The focus of the project is related to the application of deep learning techniques for the generation and validation of models. This study is based on an exhaustive review of the literature to establish the theoretical framework and contextualize the use of generative models like pix2pix.
The project involved creating a robust and representative dataset, obtained by manually digitalizing the roads, roundabouts, links and highway intersections. The input data for the model simulate the results of semantic segmentation. The pix2pix model, consisting of a discriminator and a generator, was trained and quantitatively and qualitatively validated in an exhaustive manner, with iterative adjustments applied to optimize its performance.
The results indicate that the pix2pix model offers a high IoU score performance (achieving a value of 80%) and is capable of successfully generating the skeleton of the input images, surpassing common problems and disadvantages presented by various traditional methodologies. Additionally, the use of the pix2pix model represents a significant improvement in qualitative analysis compared to traditional methodologies.
The model’s ability to learn and generalize from complex data demonstrates that it is a valuable tool for future research and applications in the field of deep learning. Read More