|
Data Mining - vytváření modelu |
|
|
Následuje iterativní proces tvorby miningového modelu a jeho kontroly (viz následující kapitola), kdy se hledá co nejlepší možná metoda a její parametry. Data se zde rozdělují na „učící“ a „testovací“. Na základě učících dat se data miningová metoda „naučí“ předpovídat to, co chceme, a na testovacích datech se potom zkouší, jak dobře je tento model schopný predikce a vhodný k nasazení. Data lze rozdělit náhodně, nebo třeba podle času, kdy se model nechá naučit na prodejích za půl roku a poté je otestován na datech za poslední měsíc.
Znalosti dat z předchozího kroku velmi pomůžou při vytváření modelu.
4. Fáze: vytváření modelu (zdroj obrázku: Microsoft)
Příklad:
Rozhodneme se pro model Rozhodovací strom, nastavíme vstupní a výstupní atributy, nastavíme parametry modelu a předhodíme mu „učící“ data.
<< Předchozí Následující>>
|