Odhad

Při odhadu směsi (i) odhadujeme, která komponenta je v danou chvíli aktivní, (ii) nastavujeme parametry komponent tak, aby pokrývaly významné body nebo oblasti v měřených datech.
Důležitá je inicializace odhadu. Pro ni lze využít expertní znalost, případně apriorní data. Jako nejúčinnější se osvědčilo použití expertně před-klasifikovaná data - tj. množinu změřených nebo uměle zkonstruovaných regresních vektorů s přiřazenými třídami klasifikace od experta (expertů).

Odhad parametrů probíhá "klasicky" - určení vah komponent vzhledem k aktuálním datům, přepočet statistik komponent a ukazovátka s určenými vahami, výpočet bodových odhadů (viz teorie).

Back to main page

1. Odhad směsi kategorických komponent

Kategorická komponenta je diskrétní model zadaný tabulkou podmíněných pravděpodobností - řádky jsou normalizovány na jednotkový součet. Všechny veličiny, které s modelem souvisí, jsou diskrétní.
Klastry, které jsou modelem směsi detekovány, jsou trochu problematické. Představa kopečku, obecně přijatá pro spojitou komponentu, zde selhává (mezi jednotlivými datovými body může, ale nemusí být řeč o vzdálenosti a dokonce mezi nimi nemusí být ani žádná souvislost). V případě ordinálních dat mohou být komponenty tvořeny skupinou sousedních datových bodů, v případě, data jsou ordinální, se zdá, že komponentou může být jeden bod s vysokou četností.

Odhad směsi tedy může sloužit pro predikci ale spíše pro klasifikaci dat.

Teorie Program