LaTM, CREATOR a další rámce s uzavřenou smyčkou pro použití nástrojů LLM…
V nedávných přehledech jsme prozkoumali užitečnost rozšíření velkých jazykových modelů (LLM) o externí nástroje. Tyto modely lze naučit využívat nástroje různými způsoby. Měli bychom si však uvědomit, že stávající LLM sledující nástroje využívají pouze omezenou sadu potenciálních nástrojů [3], vzhledem k tomu, že rozsah problémů, které chceme řešit pomocí LLM, je téměř nekonečný! S ohledem na to je jasné, že takové paradigma je omezující – vždy budeme schopni najít scénáře, které vyžadují nástroje, které ještě neexistují. V tomto přehledu prozkoumáme nedávný výzkum, jehož cílem je vyřešit tento problém poskytnutím LLM dovedností k vytváření vlastních nástrojů. Takový přístup vytváří zajímavou analogii s lidským životem, protože schopnost vyrábět nástroje vedla k velkému technologickému pokroku. Nyní prozkoumáme dopad podobných technik na vývoj LLM.
„Podle lekcí získaných z evolučních milníků lidí bylo zásadním bodem obratu to, že lidé získali schopnost vyrobit si vlastní nástroje k řešení nových výzev. Pustíme se do počátečního průzkumu, abychom mohli tento evoluční koncept aplikovat na oblast LLM.“ — od [1]
Než se dozvíme více o LLM na výrobu nástrojů, musíme si osvěžit několik základních konceptů. Mnohé z těchto myšlenek jsme probrali v nedávných přehledech, ale nyní si je znovu krátce projdeme, aby naše diskuse o nedávných publikacích byla obsáhlejší a srozumitelnější.
Proč bychom měli používat nástroje?
V předchozích přehledech jsme se dozvěděli o několika různých druzích nástrojů, které lze integrovat s LLM pro zlepšení jejich výkonu, jako například:
- Základní nástroje (kalkulačky, vyhledávače atd.) https://towardsdatascience.com/can-language-models-make-their-own-tools-cbc7c3777d22?source=rss—-7f60cf5620c9—4
- Rozhraní API modelu hlubokého učení https://towardsdatascience.com/can-language-models-make-their-own-tools-cbc7c3777d22?source=rss—-7f60cf5620c9—4
zanechte odpověď