V úkolech, jako je zákaznický servis, poradenství, programování, psaní, výuka atd., mohou jazykoví agenti snížit lidské úsilí a jsou potenciálním prvním krokem k umělé obecné inteligenci (AGI). Nedávné ukázky potenciálu jazykových agentů, včetně AutoGPT a BabyAGI, vyvolaly velkou pozornost výzkumníků, vývojářů a široké veřejnosti.
I pro zkušené vývojáře nebo výzkumníky většina těchto ukázek nebo repozitářů nevede k přizpůsobení, konfiguraci a nasazení nových agentů. Toto omezení vyplývá ze skutečnosti, že tyto ukázky jsou často důkazy konceptů, které zdůrazňují potenciál jazykových agentů, spíše než aby šlo o podstatnější rámce, které lze použít k postupnému vývoji a přizpůsobení jazykových agentů.
Studie navíc ukazují, že většina těchto zdrojů s otevřeným zdrojovým kódem pokrývá pouze malé procento základních schopností jazykových agentů, jako je rozklad práce, dlouhodobá paměť, navigace na webu, používání nástrojů a komunikace mezi více agenty. Navíc většina (pokud ne všechny) rámců jazykových agentů, které se v současnosti používají, spoléhá výhradně na stručný popis úkolu a zcela na schopnost LLM plánovat a jednat. Vzhledem k vysoké náhodnosti a konzistenci napříč různými běhy je obtížné upravit a vyladit jazykové agenty a uživatelská zkušenost je špatná.
Výzkumníci z AIWaves Inc., Zhejiang University a ETH Zürich představují AGENTS, open-source knihovnu jazykových agentů a rámec pro podporu jazykových agentů využívajících LLM. Cílem AGENTS je maximálně zjednodušit přizpůsobení, ladění a nasazení jazykových agentů – dokonce i pro laiky – a přitom být snadno rozšiřitelné pro programátory a výzkumníky. Knihovna také nabízí základní funkce uvedené níže, které z ní činí flexibilní platformu pro jazykové agenty:
Krátkodobá paměť: AGENTS obsahují paměťové komponenty, které umožňují jazykovým agentům rutinně aktualizovat krátkodobou pracovní paměť pomocí zápisníku a ukládat a získávat dlouhodobou paměť pomocí VectorDB a sémantického vyhledávání. Uživatelé se mohou rozhodnout, zda poskytnou agentovi dlouhodobou paměť, krátkodobou paměť nebo obojí, jednoduše vyplněním pole v konfiguračním souboru.
Navigace na webu a použití nástrojů: Schopnost autonomních agentů používat externí nástroje a procházet internet je další zásadní charakteristikou. AGENTS podporuje několik široce používaných externích rozhraní API a nabízí abstraktní třídu, která programátorům usnadňuje začlenění dalších nástrojů. Klasifikací webového vyhledávání a navigace jako specializovaných API také umožňujeme agentům procházet internet a shromažďovat informace.
Interakce s více agenty: AGENTS umožňují přizpůsobitelné multiagentní systémy a funkce jednoho agenta, které mohou být užitečné pro specifické aplikace, jako jsou hry, sociální experimenty, vývoj softwaru atd. Funkce „dynamického plánování“ v AGENTS je jedním z nových přírůstků pro multiagentní komunikaci. Dynamické plánování umožňuje zřídit agenta kontroléru, který slouží jako „moderátor“ a volí, který agent provede další akci, na základě svých rolí a nedávné historie namísto plánování příkazu, aby agenti jednali podle pevně zakódovaných pravidel. Při použití dynamického plánování existuje možnost flexibilnější a přirozenější komunikace mezi několika agenty. Definováním pravidla ovladače v konfiguračním souboru pomocí jednoduchého jazyka mohou vývojáři rychle změnit chování ovladače.
Interakce člověk-agent je podporován AGENTS ve scénářích s jedním i více agenty, což umožňuje interakci a komunikaci mezi jedním nebo více lidmi a jazykovými agenty.
ovladatelnost: Pomocí symbolického plánu, často známého jako standardní operační postupy (SOP), AGENTI nabízejí revoluční paradigma pro vývoj ovladatelných agentů. SOP je graf s několika stavy, který popisuje různé okolnosti, kterým může agent čelit při plnění úkolu, a pravidla pro přechod mezi stavy. SOP v AGENTS je pečlivě zaznamenaný soubor podrobných instrukcí, které specifikují, jak by měl agent nebo skupina agentů provádět konkrétní činnost nebo postup. To je podobné SOP v reálném světě. LLM může vytvářet SOP, které může uživatel měnit a zároveň personalizovat a dolaďovat agenta. Po nasazení bude agent fungovat podle pokynů a standardů stanovených pro každý stav a dynamicky měnit svůj současný stav v reakci na interakce s vnějším světem, lidmi nebo jinými agenty. S příchodem symbolického plánu je nyní možné poskytnout jemnou kontrolu nad chováním agenta, zlepšit jeho stabilitu a předvídatelnost a zároveň usnadnit ladění a optimalizaci agenta.
Tým doufá, že AGENTS usnadní výzkumníkům studium jazykových agentů, vývojářům vytváření aplikací využívajících jazykové agenty a netechnickému publiku vytváření a modifikaci jedinečných jazykových agentů.
Podívejte se na Papír a Github. Veškerá zásluha za tento výzkum patří výzkumníkům na tomto projektu. Také se nezapomeňte připojit náš 30k+ ML SubReddit, 40 000+ Facebook komunita, Discord Channel, a E-mailový newsletter, kde sdílíme nejnovější zprávy o výzkumu AI, skvělé projekty AI a další.
Pokud se vám naše práce líbí, náš newsletter se vám bude líbit..
The post This AI Paper Introduces Agents: An Open-Source Python Framework for Autonomous Language Agents appeared first on MarkTechPost.
zanechte odpověď