Při odhadu směsi (i) odhadujeme, která komponenta je v danou
chvíli aktivní, (ii) nastavujeme parametry komponent tak, aby
pokrývaly významné body nebo oblasti v měřených datech. Důležitá je inicializace odhadu. Pro ni lze využít expertní znalost, případně apriorní data. Jako nejúčinnější se osvědčilo použití expertně před-klasifikovaná data - tj. množinu změřených nebo uměle zkonstruovaných regresních vektorů s přiřazenými třídami klasifikace od experta (expertů). Odhad parametrů probíhá "klasicky" - určení vah komponent vzhledem k aktuálním datům, přepočet statistik komponent a ukazovátka s určenými vahami, výpočet bodových odhadů (viz teorie). |
Kategorická komponenta je diskrétní model zadaný
tabulkou podmíněných pravděpodobností - řádky jsou normalizovány na
jednotkový součet. Všechny veličiny, které s modelem souvisí, jsou
diskrétní. Klastry, které jsou modelem směsi detekovány, jsou trochu problematické. Představa kopečku, obecně přijatá pro spojitou komponentu, zde selhává (mezi jednotlivými datovými body může, ale nemusí být řeč o vzdálenosti a dokonce mezi nimi nemusí být ani žádná souvislost). V případě ordinálních dat mohou být komponenty tvořeny skupinou sousedních datových bodů, v případě, data jsou ordinální, se zdá, že komponentou může být jeden bod s vysokou četností. Odhad směsi tedy může sloužit pro predikci ale
spíše pro klasifikaci dat. |