Este documento de IA presenta a los agentes: un marco Python de código abierto para agentes de lenguaje autónomo



Captura de pantalla del 17 de septiembre de 2023 a las 3.32.26 a.m.Captura de pantalla del 17 de septiembre de 2023 a las 3.32.26 a.m.

En tareas como atención al cliente, consultoría, programación, redacción, enseñanza, etc., los agentes lingüísticos pueden reducir el esfuerzo humano y son un primer paso potencial hacia la inteligencia artificial general (AGI). Demostraciones recientes del potencial de los agentes lingüísticos, incluidos AutoGPT y BabyAGI, han despertado mucha atención por parte de investigadores, desarrolladores y público en general. 

Incluso para desarrolladores o investigadores experimentados, la mayoría de estas demostraciones o repositorios no son propicios para personalizar, configurar e implementar nuevos agentes. Esta restricción se debe al hecho de que estas demostraciones son frecuentemente pruebas de conceptos que resaltan el potencial de los agentes lingüísticos en lugar de ser marcos más sustanciales que puedan usarse para desarrollar y personalizar gradualmente los agentes lingüísticos. 

Además, los estudios muestran que la mayoría de estas fuentes de código abierto cubren sólo un pequeño porcentaje de las capacidades básicas de los agentes lingüísticos, como la descomposición del trabajo, la memoria a largo plazo, la navegación web, el uso de herramientas y la comunicación entre agentes múltiples. Además, la mayoría (si no todos) de los marcos de agentes lingüísticos actualmente en uso se basan exclusivamente en una breve descripción de la tarea y enteramente en la capacidad de los LLM para planificar y actuar. Debido a la alta aleatoriedad y coherencia entre las diferentes ejecuciones, los agentes de lenguaje son difíciles de modificar y ajustar, y la experiencia del usuario es deficiente.

Investigadores de AIWaves Inc., la Universidad de Zhejiang y ETH Zürich presentan AGENTS, una biblioteca y un marco de agentes lingüísticos de código abierto para respaldar los agentes lingüísticos basados en LLM. El objetivo de AGENTS es hacer que la personalización, el ajuste y la implementación de los agentes de lenguaje sean lo más sencillos posible (incluso para los no especialistas) y, al mismo tiempo, que sean fácilmente ampliables para programadores e investigadores. La biblioteca también ofrece las capacidades principales que se enumeran a continuación, que se combinan para convertirla en una plataforma flexible para agentes lingüísticos: 

Memoria a largo plazo: Los AGENTES incorporan los componentes de la memoria, lo que permite a los agentes del lenguaje actualizar rutinariamente una memoria de trabajo a corto plazo con un bloc de notas y almacenar y recuperar la memoria a largo plazo utilizando VectorDB y búsqueda semántica. Los usuarios pueden decidir si otorgarle a un agente memoria a largo plazo, memoria a corto plazo o ambas simplemente completando un campo en el archivo de configuración. 

Navegación web y uso de herramientas: La capacidad de los agentes autónomos para utilizar herramientas externas y navegar por Internet es otra característica crucial. AGENTS admite algunas API externas ampliamente utilizadas y ofrece una clase abstracta que simplifica a los programadores la incorporación de otras herramientas. Al clasificar la búsqueda y navegación web como API especializadas, también hacemos posible que los agentes naveguen por Internet y recopilen información. 

Interacción entre múltiples agentes: AGENTES permiten sistemas personalizables de múltiples agentes y capacidades de un solo agente, que pueden ser útiles para aplicaciones específicas como juegos, experimentos sociales, desarrollo de software, etc. La función de "programación dinámica" en AGENTES es una nueva incorporación para la comunicación entre múltiples agentes. La programación dinámica permite establecer un agente controlador que actúa como "moderador" y elige qué agente llevará a cabo la siguiente acción en función de sus funciones y su historial reciente, en lugar de programar el orden para que los agentes actúen con reglas codificadas. Existe la posibilidad de una comunicación más flexible y natural entre varios agentes cuando se utiliza la programación dinámica. Al definir la regla del controlador en el archivo de configuración utilizando un lenguaje sencillo, los desarrolladores pueden alterar rápidamente el comportamiento del controlador. 

Interacción humano-agente es compatible con AGENTES en escenarios de un solo agente y de múltiples agentes, lo que permite la interacción y comunicación entre uno o más humanos y agentes del lenguaje.

Controlabilidad: Utilizando un plan simbólico, a menudo conocido como procedimientos operativos estándar (SOP), los AGENTES ofrecen un paradigma revolucionario para desarrollar agentes controlables. Un SOP es un gráfico con varios estados que describe las diversas circunstancias que un agente podría enfrentar mientras realiza una tarea y las reglas para la transición entre los estados. Un SOP en AGENTES es una colección minuciosamente registrada de instrucciones detalladas que especifican cómo un agente o grupo de agentes debe llevar a cabo una actividad o procedimiento específico. Esto es similar a los SOP del mundo real. Un LLM puede producir SOP que el usuario puede modificar mientras personaliza y ajusta al agente. Después del despliegue, un agente funcionará según las instrucciones y estándares establecidos para cada estado y cambiará dinámicamente su estado actual en respuesta a interacciones con el mundo exterior, personas u otros agentes. Con la llegada del plan simbólico, ahora es posible proporcionar un control detallado sobre el comportamiento de un agente, mejorando su estabilidad y previsibilidad y al mismo tiempo facilitando el ajuste y la optimización del agente.

El equipo espera que AGENTES faciliten a los investigadores el estudio de agentes lingüísticos, a los desarrolladores la creación de aplicaciones utilizando agentes lingüísticos y a las audiencias no técnicas la creación y modificación de agentes lingüísticos únicos. 


Revisar la Papel y GitHubTodo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de más de 30.000 ml, Comunidad de Facebook de más de 40.000 personas, Canal de discordia, y Boletín electrónico, donde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.

La publicación Este documento de IA presenta a los agentes: un marco Python de código abierto para agentes de lenguaje autónomo apareció por primera vez en MarkTechPost.



Enlace fuente

Deja una respuesta

Su dirección de correo electrónico no será publicada. Los campos obligatorios están marcados *

Puede utilizar estas etiquetas y atributos HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

es_ESSpanish