Při odhadu směsi (i) odhadujeme, která komponenta je v danou
chvíli aktivní, (ii) nastavujeme parametry komponent tak, aby
pokrývaly shluky v měřených datech. Důležitá je inicializace odhadu, tj. apriorní rozmístění komponent a nastavení jejich šířky. Pro inicializaci lze využít expertní znalost, případně apriorní data. Jako nejúčinnější se osvědčilo použití expertně před-klasifikovaná data - tj. množinu změřených nebo uměle zkonstruovaných regresních vektorů s přiřazenými třídami klasifikace od experta (expertů). Odhad parametrů probíhá "klasicky" - určení vah komponent vzhledem k aktuálním datům, přepočet statistik komponent a ukazovátka s určenými vahami, výpočet bodových odhadů (viz teorie). |
Statické ukazovátko Statická komponenta s dvourozměrným výstupem je "kopeček" se svým středem (střední hodnota) a šířkou (kovarianční matice). Vzdálenost datového bodu od komponenty je dána především hodnotou hustoty pravděpodobnosti komponenty (tedy výškou kopečku) v daném bodě. Dále pak pravděpodobností aktivity dané komponenty, určené z minulých dat. Součin těchto faktorů tvoří váhu příslušnou dané komponentě a aktuálním datům (padne-li aktuální hodnota výstupu blízko středu nějaké komponenty, bude hodnota její hp velká a tedy i velká váha komponenty). S těmito vahami (normovanými na pravděpodobnosti) jsou dále v tomto kroku přidělována data pro přepočet statistik. Při odhadu se tedy:
Odhad směsi tedy může sloužit pro modelování
(vícemodálních nebo i mírně nelineárních systémů) ale také pro klasifikaci
dat. Teorie
Program
Dynamické ukazovátko
Dynamický model ukazovátka vyjadřuje okamžitou hodnotu ukazovátka v závislosti na předchozí hodnotě. Tento model tedy popisuje časový vývoj ukazovátka a tak umožňuje jeho předpověď do budoucích hodnot. Odhad modelu ukazovátka je jiný, než ve statickém případě. Tam se pravděpodobnosti aktivní komponenty počítají prostě, jako historická četnost jednotlivých komponent v roli aktivní komponenty. Při odhadu dynamického ukazovátka se postupně vyvíjí matice W která reprezentuje sdruženou pravděpodobnost okamžité a minulé hodnoty ukazovátka. Vektor vah w se získá marginalizaci této sdružené pravděpodobnosti. Program pro odhad směsi s dynamickým a statickým ukazovátkem se liší prakticky jen v této záležitosti: (i) statický popis ukazovátka je vektor, dynamický je matice, (ii) při při přepočtu vah se v dynamickém případě uplatní i minulý popis ukazovátka (staré w). |
Predikce s modelem směsi komponent má smysl jen pro
model s dynamickým ukazovátkem. V modelu směsi komponent figurují dvě veličiny: (i) výstup soustavy a (ii) ukazovátko. Přitom jako měřená veličina nesoucí informaci o chování soustavy vystupuje jen výstup. Odhad modelu v čase probíhá takto: 1. spočteme vektor "vzdáleností" změřené hodnoty výstupu (výstup se dosadí do jednotlivých komponent), 2. určíme predikci aktivní komponenty (starý váhový vektor se vynásobí modelem ukazovátka). Vektor "vzdáleností" bere v úvahu aktuální měřený výstup, predikce ukazovátka je "naslepo", jen s pomocí modelu ukazovátka. Jestliže chceme mluvit o predikci, můžeme mít na mysli obojí - jak ukazovátko tak i výstup. Přitom situace, kterou uvažujeme je následující: jsme v čase t, známe data do času t-1 a pravě jsme změřili výstup y (s indexem t). Počet kroků predikce označíme np. Předpověď modelu se statickými komponentami a dynamickým ukazovátkem spočívá v předpovědí aktivit jednotlivých komponent (tedy předpovědi vektoru w) a "namíchání" výstupů jednotlivých komponent s vahami danými prvky vektoru w. Přitom první krok predikce w (tedy určení pravděpodobností aktivní komponenty v čase t) je počítána s využitím změřené hodnoty výstupu, další kroky (pro t+1, t+2 atd.) se počítá "naslepo", jen s modelem ukazovátka. |