Generación de imágenes sintéticas para estimar la orientación del rostro

Desde la aparición del Deep Learning, cada vez se necesitan más datos para el entrenamiento de modelos de inteligencia artificial. Este problema se está solucionando gracias a la obtención automática de grandes datos de internet. Sin embargo, algunos de estos conjuntos de datos suponen una amenaza para los derechos de los ciudadanos, ya que se están recopilando sus datos personales sin su explícito consentimiento y pueden tener sesgos o utilizarse de forma poco ética. Por estos motivos, uno de los mayores desafíos a los que se enfrenta la inteligencia artificial es la creación de conjuntos de datos confiables. Especialmente para aquellas aplicaciones que tienen un impacto directo en las personas, como es el procesamiento de rostros.
En este trabajo se busca ofrecer una alternativa a los conjuntos de datos obtenidos de internet en forma de conjunto de datos sintéticos. Por ello se utilizará un modelo generativo de imágenes capaz de generar rostros para crear un conjunto de datos sintético para la tarea de estimación de la orientación del rostro. El conjunto de datos sintético, llamado OP3D12P, será evaluado con distintas métricas de generación de imágenes y se utilizará para entrenar un modelo de estimación de la orientación del rostro. Este modelo se evaluará con varios conjuntos de datos y se comparará con otros modelos de estimación de la orientación del rostro, con lo que se podrá comprobar si los modelos generativos actuales pueden generar conjuntos de datos que compitan con conjuntos de datos reales.
ABSTRACT
Since the emergence of Deep Learning, more data is needed for training artificial intelligence models. This problem is being solved by automatically obtaining big data from the Internet. However, some of these datasets pose a threat to citizens’ rights, as their personal data is being collected without their explicit consent and may be biased or used unethically. For these reasons, one of the biggest challenges that artificial intelligence is facing is the creation of trustworthy datasets. Especially for those applications that have a direct impact on people, like face processing.
This work seeks to offer an alternative to datasets obtained from the Internet in the form of synthetic datasets. To do this, an image generative model capable of generating faces will be used to create a synthetic dataset for the face orientation estimation task. This dataset, named OP3D12P, will be evaluated in different metrics of image generation and will be used for training a face orientation estimation model. This model will be evaluated with several datasets and compared to other face orientation estimation models, to test if current generative models can generate datasets capable of competing with real datasets.

​Desde la aparición del Deep Learning, cada vez se necesitan más datos para el entrenamiento de modelos de inteligencia artificial. Este problema se está solucionando gracias a la obtención automática de grandes datos de internet. Sin embargo, algunos de estos conjuntos de datos suponen una amenaza para los derechos de los ciudadanos, ya que se están recopilando sus datos personales sin su explícito consentimiento y pueden tener sesgos o utilizarse de forma poco ética. Por estos motivos, uno de los mayores desafíos a los que se enfrenta la inteligencia artificial es la creación de conjuntos de datos confiables. Especialmente para aquellas aplicaciones que tienen un impacto directo en las personas, como es el procesamiento de rostros.
En este trabajo se busca ofrecer una alternativa a los conjuntos de datos obtenidos de internet en forma de conjunto de datos sintéticos. Por ello se utilizará un modelo generativo de imágenes capaz de generar rostros para crear un conjunto de datos sintético para la tarea de estimación de la orientación del rostro. El conjunto de datos sintético, llamado OP3D12P, será evaluado con distintas métricas de generación de imágenes y se utilizará para entrenar un modelo de estimación de la orientación del rostro. Este modelo se evaluará con varios conjuntos de datos y se comparará con otros modelos de estimación de la orientación del rostro, con lo que se podrá comprobar si los modelos generativos actuales pueden generar conjuntos de datos que compitan con conjuntos de datos reales.
ABSTRACT
Since the emergence of Deep Learning, more data is needed for training artificial intelligence models. This problem is being solved by automatically obtaining big data from the Internet. However, some of these datasets pose a threat to citizens’ rights, as their personal data is being collected without their explicit consent and may be biased or used unethically. For these reasons, one of the biggest challenges that artificial intelligence is facing is the creation of trustworthy datasets. Especially for those applications that have a direct impact on people, like face processing.
This work seeks to offer an alternative to datasets obtained from the Internet in the form of synthetic datasets. To do this, an image generative model capable of generating faces will be used to create a synthetic dataset for the face orientation estimation task. This dataset, named OP3D12P, will be evaluated in different metrics of image generation and will be used for training a face orientation estimation model. This model will be evaluated with several datasets and compared to other face orientation estimation models, to test if current generative models can generate datasets capable of competing with real datasets. Read More