#8 Podmínky regresní analýzy
Publikováno 29.08.2023 v 13:10 v kategorii Regrese, přečteno: 57x
Ještě než se pustíme do větších akcí a do programování, je třeba vyjasnit si teoretické podmínky, za kterých regrese sestavovat. Řekl jsem ti, že jsou stupně polynomů a také jsme už zběžně probrali i jiné regresní křivky než vytváří polynomy (kupř. sinusoida, hyperbolická, logaritmická, logistická atp.).
Ovšem ne vždy se dají použít všechny typy pro každý případ. Počet vstupních dat musí být vždy alespoň o 1 vyšší než stupeň polynomu, který zvolíš. To znamená, že zvolíš-li lineární regresi, tzn. polynom stupně 1, musíš mít alespoň 2 vstupní data. Je to logické, neboť máš-li nakreslit pevně ukotvenou přímku, potřebuješ k tomu znát minimálně 2 body, kterými tu přímku protneš. Zvolíš-li kvadratickou regresi, musíš mít k dispozici alespoň 3 vstupní data (protože máš-li nakreslit parabolu, musíš mít alespoň 3 body). Pro kubickou 4 vstupní data atd.
Další omezení platí i pro jiné regrese. Např. pro logaritmickou regresi se nesmí ve vstupních datech vyskytovat nulová hodnota, neboť logaritmus 0 neexistuje. Nula se v datech nesmí objevit ani při exponenciální či mocninné regresi, ze stejných důvodů. V hyperbolické regresi se nesmí 0 objevit v sadě X vstupních dat, jinak by docházelo k dělení nulou.
Jako programátor máš možnost tato data ošetřit elegantně na vstupu, např. pokud je na vstupní straně hodnota 0, pak se přepíše na 0.000001. Vyhneš se sice matematické chybě, ale ta regrese nemusí udávat dobrý výsledek a je lepší se této regresi vyhnout úplně, pokud tam nulová hodnota je a nemusíš ji aplikovat za každou cenu.
Pokud si tyhle podmínky nebudeš pamatovat nebo je nějakým způsobem pro tuto chvíli vypustíš, nic se neděje. Narazíš na ně sám až budeš sestavovat vlastní strojové učení na nějaký konkrétní příklad. Pak se k nim třeba vrať nebo si na ně jen vzpomeneš a program doladíš.
Komentáře
Celkem 0 komentářů