O co jde?

V případě, že pracujeme s nezápornými daty, budeme mít potíže s použitím předpokladu normality modelu. Normální rozdělení je definováno na celé reálné ose, i když od svého vrcholu ve střední hodnotě dost rychle padá k nule. Nikdy ale nemáme jistotu, že model nebude generovat záporné hodnoty, které jsou nesmyslné a které nohou zcela znehodnotit výsledky algoritmu, který model používá. Abychom vyhověli požadavku nezápornosti, je třeba pro model třeba použít některé nezáporné rozdělení, tj. definované pouze pro nezáporné realizace náhodné veličiny.
Zde se z těch nejzákladnějších rozdělení nabízí rozdělení exponenciální, gamma, Rayleigho nebo log-normální (všechny postupně uvedeme).
!!! kde začínají a jak rychle padají !!!

Back to main page

1. Odhad směsi s exponenciálními komponentami

Základní exponenciální model
Exponenciální rozdělení je patrně nejjednodušším rozdělením, které zachovává nezápornost hodnot náhodné veličiny. Rozdělení začíná svým maximem v nule a postupně klesá rychlostí, danou svým parametrem. Tedy jako nepravděpodobnější jsou jeho hodnoty blízké nule, postupně jejich pravděpodobnost klesá. Pokles pravděpodobnosti je exponenciální.


Teorie    Program


Posunutý exponenciální model
Další variantou je posunuté exponenciální rozdělení. To je definováno exponenciálou, podobně jako v předchozím případě, ale je posunuté tak, že začíná v dané nenulové hodnotě A. S odhadem hodnoty A jsou ale podobné problémy jako u rozdělení rovnoměrného (již nepatří do exponenciální třídy).

Teorie    Program


2. Odhad směsi s gama  komponentami

Gama rozdělení představuje v podstatě určité rozšíření exponenciálního rozdělení. Může, ale nemusí mít maximum v nule. Klesá přibližně stejně jako exponenciální rozdělení.

Teorie    Program


3. Odhad směsi s Rayleigho komponentami


Rayleigho rozdělení se od exponenciálního a gama liší. Ani ne tak tvarem, ale rychlostí poklesu - klesá totiž s exponenciálou kvadratického argumentu (podobně jako normální). Je nezáporné, ale nemá maximum v nule. Může tedy modelovat malé kladné odchylky od nuly.

Teorie    Program


4. Odhad směsi s log-normálními komponentami


Jako nejvýhodnější rozdělení pro práci s nezápornými veličinami se jeví log-normální rozdělení. Pro malé hodnoty náhodné veličiny zachovává nezápornost, pro velké se podobá normálnímu (stále ale zachovává nezápornost). Klesá přibližně jako exponenciála.
Jistá nevýhoda je, že log-normální rozdělení nepatří do exponenciální třídy rozdělení. Tedy práce s ním samotným, není jednoduchá. Nicméně stačí triviální trik a problém s log-normálním rozdělením převedeme na problém normální. Trik spočívá v tom, že měřená data logaritmujeme a pracujeme s jejich logaritmy.
Tedy, pro modelování nezáporných veličin uvažujeme log-normální rozdělení a využijeme skutečnosti, že logaritmus veličiny s log-normálním rozdělením má rozdělení normální. Odhad je tedy konstruován takto:
1. Nezáporné veličiny se logaritmují a tak se převedou na normální.
2. Celý odhad se provede pro normální veličiny (včetně inicializace).
3. Výsledky s opět převedou do původních veličin tak, že se na ně aplikuje exponenciála.
Pro bližší popis odhadu normální směsi se podívejte na Normální směs

Teorie    Program




5. Odhad směsi s polovičními normálními komponentami


Poloviční normální rozdělení je dáno dvojnásobkem normálního rozdělení s nulovou střední hodnotou pro jeho pravou část - tedy pro nezáporné argumenty. Má maximum v nule a klesá stejně jako normální rozdělení, tedy s exponenciálou s kvadratickým argumentem.

Teorie    Program