Tento dokument o umělé inteligenci představuje agenty: Open-Source Python Framework pro autonomní jazykové agenty



Snímek obrazovky 2023 09 17 v 3:32:26Snímek obrazovky 2023 09 17 v 3:32:26

V úkolech, jako je zákaznický servis, poradenství, programování, psaní, výuka atd., mohou jazykoví agenti snížit lidské úsilí a jsou potenciálním prvním krokem k umělé obecné inteligenci (AGI). Nedávné ukázky potenciálu jazykových agentů, včetně AutoGPT a BabyAGI, vyvolaly velkou pozornost výzkumníků, vývojářů a široké veřejnosti. 

I pro zkušené vývojáře nebo výzkumníky většina těchto ukázek nebo repozitářů nevede k přizpůsobení, konfiguraci a nasazení nových agentů. Toto omezení vyplývá ze skutečnosti, že tyto ukázky jsou často důkazy konceptů, které zdůrazňují potenciál jazykových agentů, spíše než aby šlo o podstatnější rámce, které lze použít k postupnému vývoji a přizpůsobení jazykových agentů. 

Studie navíc ukazují, že většina těchto zdrojů s otevřeným zdrojovým kódem pokrývá pouze malé procento základních schopností jazykových agentů, jako je rozklad práce, dlouhodobá paměť, navigace na webu, používání nástrojů a komunikace mezi více agenty. Navíc většina (pokud ne všechny) rámců jazykových agentů, které se v současnosti používají, spoléhá výhradně na stručný popis úkolu a zcela na schopnost LLM plánovat a jednat. Vzhledem k vysoké náhodnosti a konzistenci napříč různými běhy je obtížné upravit a vyladit jazykové agenty a uživatelská zkušenost je špatná.

Výzkumníci z AIWaves Inc., Zhejiang University a ETH Zürich představují AGENTS, open-source knihovnu jazykových agentů a rámec pro podporu jazykových agentů využívajících LLM. Cílem AGENTS je maximálně zjednodušit přizpůsobení, ladění a nasazení jazykových agentů – dokonce i pro laiky – a přitom být snadno rozšiřitelné pro programátory a výzkumníky. Knihovna také nabízí základní funkce uvedené níže, které z ní činí flexibilní platformu pro jazykové agenty: 

Krátkodobá paměť: AGENTS obsahují paměťové komponenty, které umožňují jazykovým agentům rutinně aktualizovat krátkodobou pracovní paměť pomocí zápisníku a ukládat a získávat dlouhodobou paměť pomocí VectorDB a sémantického vyhledávání. Uživatelé se mohou rozhodnout, zda poskytnou agentovi dlouhodobou paměť, krátkodobou paměť nebo obojí, jednoduše vyplněním pole v konfiguračním souboru. 

Navigace na webu a použití nástrojů: Schopnost autonomních agentů používat externí nástroje a procházet internet je další zásadní charakteristikou. AGENTS podporuje několik široce používaných externích rozhraní API a nabízí abstraktní třídu, která programátorům usnadňuje začlenění dalších nástrojů. Klasifikací webového vyhledávání a navigace jako specializovaných API také umožňujeme agentům procházet internet a shromažďovat informace. 

Interakce s více agenty: AGENTS umožňují přizpůsobitelné multiagentní systémy a funkce jednoho agenta, které mohou být užitečné pro specifické aplikace, jako jsou hry, sociální experimenty, vývoj softwaru atd. Funkce „dynamického plánování“ v AGENTS je jedním z nových přírůstků pro multiagentní komunikaci. Dynamické plánování umožňuje zřídit agenta kontroléru, který slouží jako „moderátor“ a volí, který agent provede další akci, na základě svých rolí a nedávné historie namísto plánování příkazu, aby agenti jednali podle pevně zakódovaných pravidel. Při použití dynamického plánování existuje možnost flexibilnější a přirozenější komunikace mezi několika agenty. Definováním pravidla ovladače v konfiguračním souboru pomocí jednoduchého jazyka mohou vývojáři rychle změnit chování ovladače. 

Interakce člověk-agent je podporován AGENTS ve scénářích s jedním i více agenty, což umožňuje interakci a komunikaci mezi jedním nebo více lidmi a jazykovými agenty.

ovladatelnost: Pomocí symbolického plánu, často známého jako standardní operační postupy (SOP), AGENTI nabízejí revoluční paradigma pro vývoj ovladatelných agentů. SOP je graf s několika stavy, který popisuje různé okolnosti, kterým může agent čelit při plnění úkolu, a pravidla pro přechod mezi stavy. SOP v AGENTS je pečlivě zaznamenaný soubor podrobných instrukcí, které specifikují, jak by měl agent nebo skupina agentů provádět konkrétní činnost nebo postup. To je podobné SOP v reálném světě. LLM může vytvářet SOP, které může uživatel měnit a zároveň personalizovat a dolaďovat agenta. Po nasazení bude agent fungovat podle pokynů a standardů stanovených pro každý stav a dynamicky měnit svůj současný stav v reakci na interakce s vnějším světem, lidmi nebo jinými agenty. S příchodem symbolického plánu je nyní možné poskytnout jemnou kontrolu nad chováním agenta, zlepšit jeho stabilitu a předvídatelnost a zároveň usnadnit ladění a optimalizaci agenta.

Tým doufá, že AGENTS usnadní výzkumníkům studium jazykových agentů, vývojářům vytváření aplikací využívajících jazykové agenty a netechnickému publiku vytváření a modifikaci jedinečných jazykových agentů. 


Podívejte se na Papír a GithubVeškerá zásluha za tento výzkum patří výzkumníkům na tomto projektu. Také se nezapomeňte připojit náš 30k+ ML SubReddit, 40 000+ Facebook komunita, Discord Channel, a E-mailový newsletter, kde sdílíme nejnovější zprávy o výzkumu AI, skvělé projekty AI a další.

Pokud se vám naše práce líbí, náš newsletter se vám bude líbit..

The post This AI Paper Introduces Agents: An Open-Source Python Framework for Autonomous Language Agents appeared first on MarkTechPost.



Odkaz na zdroj

zanechte odpověď

Vaše e-mailová adresa nebude zveřejněna. Povinná pole jsou označena *

Můžete použít tyto HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

cs_CZCzech