|
Data Mining - datová deskripce |
|
|
Profilování a popis dat
Než se lze pustit do vytváření a testování modelů, je potřeba plně rozumět připraveným datům a zkontrolovat je. Zjistí se charakteristiky hodnot jednotlivých atributů, statistické parametry jako: minima, maxima, průměry, odchylky atributů, rozložení dat. Poté lze zodpovědně říci, zda připravená jsou bez vady, a případně navrhnout opravu dat.
3. Fáze: profilování a popis dat (zdroj obrázku: Microsoft)
Příklady zjištění v této fázi:
- Průměrně zákazník koupil 6,12 výrobků
- 20% zákazníků si koupilo starší model zkoumaného výrobku
- Profil věku zákazníků vypadá takto: ...
<< Předchozí Následující>>
|