odhad

Odhad

Při odhadu směsi (i) odhadujeme, která komponenta je v danou chvíli aktivní, (ii) nastavujeme parametry komponent tak, aby pokrývaly shluky v měřených datech.
Důležitá je inicializace odhadu, tj. apriorní rozmístění komponent a nastavení jejich šířky. Pro inicializaci lze využít expertní znalost, případně apriorní data. Jako nejúčinnější se osvědčilo použití expertně před-klasifikovaná data - tj. množinu změřených nebo uměle zkonstruovaných regresních vektorů s přiřazenými třídami klasifikace od experta (expertů).

Odhad parametrů probíhá "klasicky" - určení vah komponent vzhledem k aktuálním datům, přepočet statistik komponent a ukazovátka s určenými vahami, výpočet bodových odhadů (viz teorie).

Zpět na hlavní stránku

1. Odhad směsi statických komponent a statického/dynamického ukazovátka

Statické ukazovátko
Statická komponenta s dvourozměrným výstupem je "kopeček" se svým středem (střední hodnota) a šířkou (kovarianční matice). Vzdálenost datového bodu od komponenty je dána především hodnotou hustoty pravděpodobnosti komponenty (tedy výškou kopečku) v daném bodě. Dále pak pravděpodobností aktivity dané komponenty, určené z minulých dat. Součin těchto faktorů tvoří váhu příslušnou dané komponentě a aktuálním datům (padne-li aktuální hodnota výstupu blízko středu nějaké komponenty, bude hodnota její hp velká a tedy i velká váha komponenty). S těmito vahami (normovanými na pravděpodobnosti) jsou dále v tomto kroku přidělována data pro přepočet statistik.
Při odhadu se tedy:

upřesňují jednotlivé komponenty tak, aby dobře modelovaly příslušné datové shluky,
průběžně odhadují aktivity jednotlivých komponent, což kromě odhadu komponent provádí také klasifikaci přicházejících dat.

Odhad směsi tedy může sloužit pro modelování (vícemodálních nebo i mírně nelineárních systémů) ale také pro klasifikaci dat.

Teorie Program

Dynamické ukazovátko
Dynamický model ukazovátka vyjadřuje okamžitou hodnotu ukazovátka v závislosti na předchozí hodnotě. Tento model tedy popisuje časový vývoj ukazovátka a tak umožňuje jeho předpověď do budoucích hodnot.
Odhad modelu ukazovátka je jiný, než ve statickém případě. Tam se pravděpodobnosti aktivní komponenty počítají prostě, jako historická četnost jednotlivých komponent v roli aktivní komponenty.
Při odhadu dynamického ukazovátka se postupně vyvíjí matice W která reprezentuje sdruženou pravděpodobnost okamžité a minulé hodnoty ukazovátka. Vektor vah w se získá marginalizaci této sdružené pravděpodobnosti.
Program pro odhad směsi s dynamickým a statickým ukazovátkem se liší prakticky jen v této záležitosti: (i) statický popis ukazovátka je vektor, dynamický je matice, (ii) při při přepočtu vah se v dynamickém případě uplatní i minulý popis ukazovátka (staré w).

Teorie Program

2. Predikce s modelem směsi komponent

Predikce s modelem směsi komponent má smysl jen pro model s dynamickým ukazovátkem.
V modelu směsi komponent figurují dvě veličiny: (i) výstup soustavy a (ii) ukazovátko. Přitom jako měřená veličina nesoucí informaci o chování soustavy vystupuje jen výstup. Odhad modelu v čase probíhá takto: 1. spočteme vektor "vzdáleností" změřené hodnoty výstupu (výstup se dosadí do jednotlivých komponent), 2. určíme predikci aktivní komponenty (starý váhový vektor se vynásobí modelem ukazovátka). Vektor "vzdáleností" bere v úvahu aktuální měřený výstup, predikce ukazovátka je "naslepo", jen s pomocí modelu ukazovátka.
Jestliže chceme mluvit o predikci, můžeme mít na mysli obojí - jak ukazovátko tak i výstup. Přitom situace, kterou uvažujeme je následující: jsme v čase t, známe data do času t-1 a pravě jsme změřili výstup y (s indexem t). Počet kroků predikce označíme np. Předpověď modelu se statickými komponentami a dynamickým ukazovátkem spočívá v předpovědí aktivit jednotlivých komponent (tedy předpovědi vektoru w) a "namíchání" výstupů jednotlivých komponent s vahami danými prvky vektoru w. Přitom první krok predikce w (tedy určení pravděpodobností aktivní komponenty v čase t) je počítána s využitím změřené hodnoty výstupu, další kroky (pro t+1, t+2 atd.) se počítá "naslepo", jen s modelem ukazovátka.

Teorie Program