acaddemia

Agentes de IA

Herramientas para la construcción de Agente de IA

La inteligencia artificial ha evolucionado más allá de simples chatbots para dar paso a los agentes de IA, sistemas inteligentes capaces de comunicarse en lenguaje natural, tomar decisiones autónomas y ejecutar tareas complejas en diversos entornos. Estos asistentes digitales están transformando la manera en que las empresas automatizan procesos, desde la gestión de reservas de viajes hasta la coordinación de múltiples departamentos organizacionales.

A diferencia de los sistemas convencionales, los agentes de IA combinan una base de conocimiento sólida con modelos de lenguaje avanzados (LLM) para interpretar contextos, resolver problemas específicos e interactuar con herramientas externas mediante APIs y actuadores. En esta guía completa, exploraremos los diferentes tipos de agentes inteligentes, las principales plataformas para su desarrollo como Azure AI Foundry, Amazon Web Services y N8N, así como las técnicas de optimización que potencian su rendimiento en aplicaciones del mundo real.

¿Qué son los agentes de IA?

Un agente de Inteligencia Artificial es una herramienta que posibilita la comunicación bilateral por medio de lenguaje natural, es decir, es un programa al cual le podemos realizar preguntas y recibir respuestas como si estuviésemos hablando con otra persona, con nuestro propio idioma. Sin embargo, lo que destaca principalmente de los agentes es su capacidad de procesar este lenguaje y tomar decisiones a partir de su entendimiento, además de solucionar problemas, automatizar tareas o interactuar con un entorno determinado.

Por lo general, el agente está programado para atender a ciertas cuestiones en particular, por lo que un usuario le asigna determinadas tareas para que este genere una respuesta acorde.

La estructura general de un agente parte de una Base de Conocimiento de la cual se puede extraer información, y que es interpretada por un LLM (modelo largo de lenguaje, usualmente GPT, Ollama, Deepseek, entre otros) para atender a los objetivos que se le impongan, ya sea por medio de respuestas simples o a través de APIs o actuadores externos que le permitan generar acciones en elementos distintos o ajenos a él.

TIPOS DE AGENTES:

Para que quede más claro el concepto de agente, sus capacidades y limitaciones, veamos cierta clasificación de acuerdo con sus funciones.

Agente de reflejo simple:

Estos agentes se caracterizan por generar una respuesta de reacción frente a cambios en su entorno; por ejemplo, si quisiéramos mantener la temperatura de una habitación en cierto punto, el agente se encargaría de detectar cambios y condiciones en el ambiente, y a partir de ello generaría una acción que se puede interpretar como el accionar o el control de un aire acondicionado.

Agente basado en modelos:

Un poco más avanzado que el anterior, este tipo se caracteriza por tener un modelo matemático detrás que lo soporta para tomar decisiones coherentes y estructuradas. Se diferencia del anterior puesto que es capaz de almacenar información y adecuarse a las condiciones específicas del contexto en el que se encuentra; por ejemplo, una aspiradora automática que mediante va limpiando un piso, también va detectando caminos y espacios por donde puede movilizarse.

Agente basado en objetivos:

Esta clasificación se basa en la consecución de objetivos predefinidos, y lo que se busca es optimizar esa meta a partir de las condiciones que se presenten. Un claro escenario de este tipo es un GPS que encuentra la ruta más corta de un lugar a otro.

Agente basado en recursos:

Bastante similar a la anterior, estos agentes buscan cumplir con objetivos, pero tratan de darle solución buscando una optimización de recursos. Continuando con el GPS, un agente basado en recursos no solo le daría prioridad al tiempo estimado del recorrido, sino también a elementos como el consumo de gasolina o el estado de la carretera.

Agente de aprendizaje:

Estos están diseñados para aprender mediante interactúan con su entorno, o con el usuario, por lo que nunca terminan de entrenarse; usualmente están soportados de una retroalimentación continua para poder interpretar que están haciendo bien y en qué puntos

están cometiendo errores. Un ejemplo sería un sistema de recomendación de películas, cómo el desarrollado por Netflix.

Agente jerárquico:

Este actúa como un supervisor o coordinador, y se usa principalmente para comunicarse con varios agentes especializados. Si hay un agente para el sector financiero de una empresa, otro para temas de producción, y un tercero asociado a documentación legal, este supervisor se encarga de recibir las tareas por parte del usuario y crear la comunicación con el agente especializado en el área requerida.

Herramientas para construir agentes:

Aunque los agentes de IA parecieran ser un tema complejo y de poco acceso, la realidad es completamente distinta. Actualmente existen múltiples plataformas que permiten la construcción de agentes de acuerdo a las necesidades de cada usuario, y aunque todas tienen un punto diferenciador, el esquema de desarrollo general es bastante similar.

Como punto de partida común, se deben de cargar los diferentes archivos y fuentes de información que se considere que requiera el agente, además de describir al agente su función; en este paso, literalmente se le dice al agente para qué razones va a ser creado, qué fuentes de información se le serán suministradas, cómo se espera que responda, y demás elementos que se quieran personalizar. Es importante recordar que el agente está diseñado para procesar lenguaje natural, por lo que esta información realmente se le entrega por medio de un párrafo descriptivo.

Posterior a esto, es necesario definir un modelo LLM para que procese toda la información, que de cierta manera es el cerebro del agente. Finalmente, el agente se configura para que pueda hacer uso de herramientas ajenas, como puede ser la interacción con plataformas de correos, agencias de viajes, y otros.

Por cierto, ¿ya realizaste el curso de Conceptos Esenciales de Automatización de Procesos con Microsoft Power Automate ofrecido en la página de Acaddemia? Aprovecha la oportunidad de elevar tus conocimientos al próximo nivel. Para más información, visita: Conceptos Esenciales de Automatización de Procesos con Microsoft Power Automate

Ahora sí, veamos algunas diferencias entre ciertas plataformas para la construcción de agentes.

Azure AI Foundry:

Esta alternativa proveniente de Microsoft Azure es un ecosistema que integra diferentes elementos que facilitan la creación de un agente que pretende usar herramientas desarrolladas por el mismo Microsoft. En este orden de ideas, Azure AI Foundry tiene una conexión nativa con OpenAI que es el desarrollador de los modelos GPT para la selección del LLM, además de permitir accesos directos y sencillos a Microsoft Fabric para la extracción y manipulación de datos, permisos para poder desarrollar automatizaciones en Microsoft Office, Teams, entre otros. Adicionalmente, contiene una acción de interpretador de código que aumenta de manera considerable el rendimiento del agente para realizar scripts de Python, pues tiene la capacidad de ejecutar los códigos internamente para cerciorarse de que proponga respuestas funcionales.

Amazon Web Services:

A diferencia de Azure AI Foundry, la apuesta de Amazon se centra principalmente en sus opciones de almacenamiento masivo de datos, y de la disponibilidad de modelos propios como Titan o NOVA. De esta manera, AWS tiene una herramienta llamada Amazon Bedrock, bastante similar a la de Microsoft Azure visualmente, donde el factor diferenciador está en la buena interpretación por parte de los modelos LLM que aportan una excelente solución a temas de chatbots y asistentes virtuales.

N8N:

Por último, N8N aparece como una tercera herramienta bastante menos popular a las dos anteriores, pero que destaca por tener una plataforma que permite el desarrollo de agentes de manera gráfica, creando relaciones a partir de flujos. Con esta propuesta, N8N se posiciona como una gran alternativa a personas que prefieran diseñar los agentes de manera visual y evitar entrar en mucha personalización que posiblemente conlleve conocimiento de lenguajes de programación.+

Opciones para “dotar” al agente:

Aparte de la construcción general de los agentes, hay distintas estrategias que permiten mejorar el desempeño de estos continuamente, y entre las cuales destacan las siguientes:

RAG:

El Retrieval-Augmented Generation se refiere la característica nativa del agente en donde es posible leer documentos para poder generar una respuesta acertada e informada.

Fine-Tuning:

El Fine-Tuning consiste en reentrenar el cerebro (LLM) a partir de datos propios para que el agente tome mejores decisiones. A diferencia de la configuración usual del agente en donde este busca en las Bases de Conocimiento la respuesta a las preguntas del usuario, el Fine-Tuning permite que el agente ya aprenda a priori esta información, por lo que no tiene que ir a buscar en las fuentes de información sino que ya conoce las respuestas de manera anticipada.

Uso de memoria:

El último elemento consiste en configurar el uso de memoria por parte del programa. Este parámetro nos permite definir cuántos mensajes recuerda el agente a la hora de comunicarse con un usuario, es decir, si queremos que el agente recuerde el tema que se trató hace 5 mensajes o si queremos que en cada interacción se reinicie la memoria del mismo.

Casos de uso e integraciones:

Reforzando la idea que ya ha sido planteada constantemente, los agentes de IA permiten la integración con herramientas terceras para ampliar sus capacidades y aptitudes. Un ejemplo natural que saca provecho de los servicios de Azure AI Foundry es la construcción de un agente que maneje reservas por medio de TripAdvisor; sus funciones podrían abarcar la lectura y almacenamiento de información acerca de periodos vacacionales de los empleados de una compañía, y asistirlos en el proceso de reservar hoteles y/o tiquetes de viaje, ya sea brindando información relevante o, incluso, realizando las respectivas reservas por sí mismo. En cuanto a N8N, se podrían desarrollar automatizaciones ofimáticas que permitieran la integración con Microsoft Teams para agilizar procesos o mensajes rutinarios; por ejemplo, búsqueda de información agilizada por medio de un chatbot o la lectura y modificación automática de un archivo en específico cada determinado periodo de tiempo.

Los agentes han llegado como una herramienta de Inteligencia Artificial para apoyarnos en nuestras tareas cotidianas, y asistirnos para agilizar nuestro trabajo y poder centralizar nuestros esfuerzos en temas prioritarios; y que no se nos olvide lo más importante: que crear un agente es un proceso sencillo, solo hace falta disposición y una mente creativa.

Preguntas Frecuentes

Autor: Mateo Ramírez Montoya

Ingeniero Mecánico y Matemático con énfasis en la construcción de soluciones numéricas de fenómenos mecánicos descritos a partir de modelos complejos. Gran interés en el desarrollo de nuevas herramientas computacionales y numéricas para la solución de problemas del día a día, así como la implementación de estrategias de Aprendizaje Automático.