Cet article sur l'IA présente les agents : un framework Python open source pour les agents de langage autonomes



Capture d'écran 2023 09 17 à 3.32.26Capture d'écran 2023 09 17 à 3.32.26

Dans des tâches telles que le service client, le conseil, la programmation, la rédaction, l'enseignement, etc., les agents linguistiques peuvent réduire l'effort humain et constituent un premier pas potentiel vers l'intelligence artificielle générale (AGI). De récentes démonstrations du potentiel des agents linguistiques, notamment AutoGPT et BabyAGI, ont suscité beaucoup d'attention de la part des chercheurs, des développeurs et du grand public. 

Même pour les développeurs ou chercheurs chevronnés, la plupart de ces démos ou référentiels ne sont pas propices à la personnalisation, à la configuration et au déploiement de nouveaux agents. Cette restriction résulte du fait que ces démonstrations sont souvent des preuves de concept mettant en évidence le potentiel des agents linguistiques plutôt que des cadres plus substantiels pouvant être utilisés pour développer et personnaliser progressivement des agents linguistiques. 

De plus, des études montrent que la majorité de ces sources open source ne couvrent qu'un infime pourcentage des capacités de base des agents linguistiques, telles que la décomposition des tâches, la mémoire à long terme, la navigation Web, l'utilisation des outils et la communication multi-agents. De plus, la plupart (sinon la totalité) des cadres d'agents linguistiques actuellement utilisés reposent exclusivement sur une brève description de tâche et entièrement sur la capacité des LLM à planifier et à agir. En raison du caractère aléatoire et de la cohérence élevés entre les différentes exécutions, les agents linguistiques sont difficiles à modifier et à ajuster, et l'expérience utilisateur est médiocre.

Des chercheurs d'AIWaves Inc., de l'Université du Zhejiang et de l'ETH Zürich présentent AGENTS, une bibliothèque d'agents de langage open source et un cadre pour prendre en charge les agents de langage basés sur LLM. L'objectif d'AGENTS est de rendre la personnalisation, le réglage et le déploiement des agents linguistiques aussi simples que possible, même pour les non-spécialistes, tout en étant facilement extensible pour les programmeurs et les chercheurs. La bibliothèque offre également les fonctionnalités de base répertoriées ci-dessous, qui se combinent pour en faire une plate-forme flexible pour les agents linguistiques : 

Mémoire à long terme : Les AGENTS intègrent les composants de mémoire, permettant aux agents linguistiques de mettre régulièrement à jour une mémoire de travail à court terme avec un bloc-notes et de stocker et récupérer la mémoire à long terme à l'aide de VectorDB et de la recherche sémantique. Les utilisateurs peuvent décider d'accorder à un agent une mémoire à long terme, une mémoire à court terme ou les deux en remplissant simplement un champ dans le fichier de configuration. 

Navigation web et utilisation des outils : La capacité des agents autonomes à utiliser des outils externes et à naviguer sur Internet est une autre caractéristique cruciale. AGENTS prend en charge quelques API externes largement utilisées et propose une classe abstraite qui permet aux programmeurs d'incorporer facilement d'autres outils. En classant la recherche et la navigation sur le Web comme API spécialisées, nous permettons également aux agents de naviguer sur Internet et de recueillir des informations. 

Interaction multi-agents : AGENTS permet des systèmes multi-agents personnalisables et des capacités mono-agent, qui peuvent être utiles pour des applications spécifiques telles que les jeux, les expériences sociales, le développement de logiciels, etc. La fonction de « planification dynamique » dans AGENTS est un nouvel ajout pour la communication multi-agent. La planification dynamique permet d'établir un agent contrôleur qui sert de « modérateur » et choisit quel agent effectuera la prochaine action en fonction de ses rôles et de son historique récent, au lieu de planifier l'ordre d'action des agents avec des règles codées en dur. Il existe la possibilité d'une communication plus flexible et plus naturelle entre plusieurs agents lors de l'utilisation de la planification dynamique. En définissant la règle du contrôleur dans le fichier de configuration en langage simple, les développeurs peuvent rapidement modifier le comportement du contrôleur. 

Interaction homme-agent est pris en charge par AGENTS dans les scénarios mono-agent et multi-agents, permettant l'interaction et la communication entre un ou plusieurs humains et agents linguistiques.

Contrôlabilité: Utilisant un plan symbolique, souvent connu sous le nom de procédures opérationnelles standard (SOP), les AGENTS offrent un paradigme révolutionnaire pour développer des agents contrôlables. Une SOP est un graphique comportant plusieurs états qui décrit les différentes circonstances auxquelles un agent peut être confronté lors de l'exécution d'une tâche et les règles de transition entre les états. Une SOP dans AGENTS est un ensemble d'instructions détaillées soigneusement enregistrées qui précisent comment un agent ou un groupe d'agents doit effectuer une activité ou une procédure spécifique. Ceci est similaire aux SOP dans le monde réel. Un LLM peut produire des SOP que l'utilisateur peut modifier tout en personnalisant et en affinant l'agent. Après le déploiement, un agent fonctionnera selon les instructions et les normes définies pour chaque état et modifiera dynamiquement son état actuel en réponse aux interactions avec le monde extérieur, les personnes ou d'autres agents. Avec l'avènement du plan symbolique, il est désormais possible de fournir un contrôle précis sur le comportement d'un agent, améliorant ainsi sa stabilité et sa prévisibilité tout en facilitant le réglage et l'optimisation de l'agent.

L'équipe espère qu'AGENTS permettra aux chercheurs d'étudier plus facilement les agents linguistiques, aux développeurs de créer des applications utilisant des agents linguistiques et aux publics non techniques de créer et de modifier des agents linguistiques uniques. 


Vérifiez Papier et GitHubTout le mérite de cette recherche revient aux chercheurs de ce projet. N'oubliez pas non plus de vous inscrire notre SubReddit de plus de 30 000 ML, Plus de 40 000 communautés Facebook, Chaîne Discorde, et Courriel, où nous partageons les dernières nouvelles en matière de recherche sur l'IA, des projets intéressants en matière d'IA et bien plus encore.

Si vous aimez notre travail, vous allez adorer notre newsletter.

L'article Cet article sur l'IA présente les agents : un cadre Python open source pour les agents de langage autonomes apparaît en premier sur MarkTechPost.



Lien source

Laisser une réponse

Votre adresse email ne sera pas publiée. Les champs requis sont indiqués *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

fr_FRFrench