Mohou si jazykové modely vytvořit vlastní nástroje? | Cameron R. Wolfe, Ph.D. | září 2023


LaTM, CREATOR a další rámce s uzavřenou smyčkou pro použití nástrojů LLM…

(Fotka od Todd Quackenbush na Unsplash)

V nedávných přehledech jsme prozkoumali užitečnost rozšíření velkých jazykových modelů (LLM) o externí nástroje. Tyto modely lze naučit využívat nástroje různými způsoby. Měli bychom si však uvědomit, že stávající LLM sledující nástroje využívají pouze omezenou sadu potenciálních nástrojů [3], vzhledem k tomu, že rozsah problémů, které chceme řešit pomocí LLM, je téměř nekonečný! S ohledem na to je jasné, že takové paradigma je omezující – vždy budeme schopni najít scénáře, které vyžadují nástroje, které ještě neexistují. V tomto přehledu prozkoumáme nedávný výzkum, jehož cílem je vyřešit tento problém poskytnutím LLM dovedností k vytváření vlastních nástrojů. Takový přístup vytváří zajímavou analogii s lidským životem, protože schopnost vyrábět nástroje vedla k velkému technologickému pokroku. Nyní prozkoumáme dopad podobných technik na vývoj LLM.

„Podle lekcí získaných z evolučních milníků lidí bylo zásadním bodem obratu to, že lidé získali schopnost vyrobit si vlastní nástroje k řešení nových výzev. Pustíme se do počátečního průzkumu, abychom mohli tento evoluční koncept aplikovat na oblast LLM.“ — od [1]

(z [1, 2])

Než se dozvíme více o LLM na výrobu nástrojů, musíme si osvěžit několik základních konceptů. Mnohé z těchto myšlenek jsme probrali v nedávných přehledech, ale nyní si je znovu krátce projdeme, aby naše diskuse o nedávných publikacích byla obsáhlejší a srozumitelnější.

Proč bychom měli používat nástroje?

(z [3, 8, 9])

V předchozích přehledech jsme se dozvěděli o několika různých druzích nástrojů, které lze integrovat s LLM pro zlepšení jejich výkonu, jako například:

  • Základní nástroje (kalkulačky, vyhledávače atd.) https://towardsdatascience.com/can-language-models-make-their-own-tools-cbc7c3777d22?source=rss—-7f60cf5620c9—4
  • Rozhraní API modelu hlubokého učení https://towardsdatascience.com/can-language-models-make-their-own-tools-cbc7c3777d22?source=rss—-7f60cf5620c9—4



Odkaz na zdroj

zanechte odpověď

Vaše e-mailová adresa nebude zveřejněna. Povinná pole jsou označena *

Můžete použít tyto HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

cs_CZCzech