Large Language Models to query your data: retrieving ads industry users data using natural language

La publicidad, especialmente la digital, ha evolucionado con el auge de Internet y las redes sociales. Las empresas ahora utilizan varios medios, como motores de búsqueda y banners web. Sin embargo, gestionar presupuestos publicitarios en múltiples plataformas puede ser un desafío e ineficiente. Para ayudar a resolver este problema, MINT introdujo la Gestión de Recursos Publicitarios (ARM), una plataforma de software diseñada para consolidar las operaciones publicitarias. La plataforma ARM utiliza análisis de datos en tiempo real y conocimientos predictivos para ayudar a las empresas a gestionar mejor sus esfuerzos de publicidad digital. A pesar de sus beneficios, la complejidad de la aplicación web actual puede dificultar la participación de los usuarios.
Esta tesis tiene como objetivo mejorar la interacción del usuario con la plataforma ARM mediante la introducción de un asistente de IA impulsado por LLMs. El asistente permite a los usuarios hacer preguntas en lenguaje natural, que luego se convierten en consultas SQL para recuperar datos relevantes. El estudio evalúa varios LLMs, incluidos los de OpenAI, Google y Amazon, por su rendimiento en esta tarea. También se propone un nuevo modelo de seguridad para detectar solicitudes potencialmente dañinas, añadiendo una capa adicional de seguridad.
La implementación comienza refinando la funcionalidad de TextToSQL y luego construyendo toda la arquitectura del sistema. Esto incluye la integración de un método dinámico de recuperación de ejemplos utilizando el algoritmo de Relevancia Marginal Máxima para mejorar la precisión de las consultas SQL generadas. La arquitectura del asistente de IA está diseñada para ser escalable y adaptable, permitiendo actualizaciones y mejoras fáciles.
Los resultados muestran mejoras significativas en la precisión de las consultas y la participación del usuario, haciendo que la recuperación de datos sea más sencilla y eficiente. Esta tesis demuestra los beneficios prácticos de los LLMs en la publicidad digital, sugiriendo un potencial para futuras mejoras en las tecnologías de asistencia al usuario impulsadas por IA.
ABSTRACT
Generative AI has seen a notable increase in use over the past few years, changing various fields from natural language processing to creative arts. This change is mainly due to the introduction of the Transformer model in 2017, which improved the handling of sequential data. Recently, Large Language Models (LLMs) like OpenAI’s GPT-4 have gained popularity, showcasing their potential to automate and improve many applications.
Advertising, particularly digital advertising, has evolved with the rise of the Internet and social networks. Companies now use various media like search engines and web banners. However, managing advertising budgets across multiple platforms can be challenging and inefficient. To help solve this problem, MINT introduced Advertising Resource Management (ARM), a software platform designed to consolidate advertising operations. ARM’s platform uses real-time data analysis and predictive insights to help businesses better manage their digital advertising efforts. Despite its benefits, the complexity of the current web application can make it difficult for users to engage with the platform.
This thesis aims to improve user interaction with the ARM platform by introducing an AI assistant powered by LLMs. The assistant allows users to ask questions in natural language, which are then converted into SQL queries to retrieve relevant data. The study evaluates various LLMs, including those from OpenAI, Google, and Amazon, for their performance in this task. A new safety model is also proposed to detect potentially harmful requests, adding an extra layer of security.
The implementation starts with refining the TextToSql functionality and then building the complete system architecture. This includes integrating a dynamic example retrieval method using the Max Marginal Relevance algorithm to enhance the accuracy of generated SQL queries. The AI assistant architecture is designed to be scalable and adaptable, allowing for easy updates and improvements.
Results show significant improvements in query accuracy and user engagement, making data retrieval more straightforward and efficient. This thesis demonstrates the practical benefits of LLMs in digital advertising, suggesting potential for future improvements in AI-driven user assistance technologies.

​La publicidad, especialmente la digital, ha evolucionado con el auge de Internet y las redes sociales. Las empresas ahora utilizan varios medios, como motores de búsqueda y banners web. Sin embargo, gestionar presupuestos publicitarios en múltiples plataformas puede ser un desafío e ineficiente. Para ayudar a resolver este problema, MINT introdujo la Gestión de Recursos Publicitarios (ARM), una plataforma de software diseñada para consolidar las operaciones publicitarias. La plataforma ARM utiliza análisis de datos en tiempo real y conocimientos predictivos para ayudar a las empresas a gestionar mejor sus esfuerzos de publicidad digital. A pesar de sus beneficios, la complejidad de la aplicación web actual puede dificultar la participación de los usuarios.
Esta tesis tiene como objetivo mejorar la interacción del usuario con la plataforma ARM mediante la introducción de un asistente de IA impulsado por LLMs. El asistente permite a los usuarios hacer preguntas en lenguaje natural, que luego se convierten en consultas SQL para recuperar datos relevantes. El estudio evalúa varios LLMs, incluidos los de OpenAI, Google y Amazon, por su rendimiento en esta tarea. También se propone un nuevo modelo de seguridad para detectar solicitudes potencialmente dañinas, añadiendo una capa adicional de seguridad.
La implementación comienza refinando la funcionalidad de TextToSQL y luego construyendo toda la arquitectura del sistema. Esto incluye la integración de un método dinámico de recuperación de ejemplos utilizando el algoritmo de Relevancia Marginal Máxima para mejorar la precisión de las consultas SQL generadas. La arquitectura del asistente de IA está diseñada para ser escalable y adaptable, permitiendo actualizaciones y mejoras fáciles.
Los resultados muestran mejoras significativas en la precisión de las consultas y la participación del usuario, haciendo que la recuperación de datos sea más sencilla y eficiente. Esta tesis demuestra los beneficios prácticos de los LLMs en la publicidad digital, sugiriendo un potencial para futuras mejoras en las tecnologías de asistencia al usuario impulsadas por IA.
ABSTRACT
Generative AI has seen a notable increase in use over the past few years, changing various fields from natural language processing to creative arts. This change is mainly due to the introduction of the Transformer model in 2017, which improved the handling of sequential data. Recently, Large Language Models (LLMs) like OpenAI’s GPT-4 have gained popularity, showcasing their potential to automate and improve many applications.
Advertising, particularly digital advertising, has evolved with the rise of the Internet and social networks. Companies now use various media like search engines and web banners. However, managing advertising budgets across multiple platforms can be challenging and inefficient. To help solve this problem, MINT introduced Advertising Resource Management (ARM), a software platform designed to consolidate advertising operations. ARM’s platform uses real-time data analysis and predictive insights to help businesses better manage their digital advertising efforts. Despite its benefits, the complexity of the current web application can make it difficult for users to engage with the platform.
This thesis aims to improve user interaction with the ARM platform by introducing an AI assistant powered by LLMs. The assistant allows users to ask questions in natural language, which are then converted into SQL queries to retrieve relevant data. The study evaluates various LLMs, including those from OpenAI, Google, and Amazon, for their performance in this task. A new safety model is also proposed to detect potentially harmful requests, adding an extra layer of security.
The implementation starts with refining the TextToSql functionality and then building the complete system architecture. This includes integrating a dynamic example retrieval method using the Max Marginal Relevance algorithm to enhance the accuracy of generated SQL queries. The AI assistant architecture is designed to be scalable and adaptable, allowing for easy updates and improvements.
Results show significant improvements in query accuracy and user engagement, making data retrieval more straightforward and efficient. This thesis demonstrates the practical benefits of LLMs in digital advertising, suggesting potential for future improvements in AI-driven user assistance technologies. Read More