Vítejte zpět v sérii Illustrated Machine Learning. Pokud si přečtete druhé články v seriálu, Víte, jak to chodí. Vezmeme (nudně znějící) koncept strojového učení a udělejte z něj zábavu tím, že jej ilustrujete! Tento článek se bude zabývat konceptem tzv Přírůstkové učení, kde se modely strojového učení učí nové informace v průběhu času, udržují a staví na předchozích znalostech. Než se do toho ale pustíme, promluvme si nejprve o tom, jak vypadá proces stavby modelu dnes.
Obvykle se řídíme procesem tzv statické učení při stavbě modelů. V tomto procesu trénujeme model pomocí nejnovějších dostupných dat. Model ladíme a ladíme v tréninkovém procesu. A jakmile jsme s jeho výkonem spokojeni, nasadíme ho. Tento model se nějakou dobu vyrábí. Pak si všimneme, že výkon modelu se postupem času zhoršuje. Tehdy zahodíme stávající model a postavíme nový s využitím nejnovějších dostupných dat. A opláchneme a opakujeme stejný postup.
Ukažme si to na konkrétním příkladu. Zvažte tento hypotetický scénář. Model podvodu jsme začali budovat na konci ledna 2023. Tento model zjišťuje, zda je transakce kreditní kartou podvodná či nikoli. Náš model trénujeme pomocí všech údajů o transakcích kreditních karet, které jsme měli k dispozici za poslední roční období (leden 2022 až prosinec 2022), a údaje o transakcích z tohoto měsíce (leden 2023) používáme k testování modelu.
Na konci příštího měsíce si všimneme, že model si proti novým datům příliš nevede. Postavili jsme tedy další model, ale tentokrát s použitím dat z uplynulého ročního období (únor 2022 až leden 2023), abychom jej trénovali a následně použili data z aktuálního měsíce (únor 2023) k jeho testování. A všechna data mimo tato školení a testovací období jsou vyhozena.
zanechte odpověď