Porovnávacia tabuľka
Základ pre porovnanie | klasifikácia | regresia |
---|---|---|
základné | Zistenie modelu alebo funkcií, kde sa mapovanie objektov vykonáva v preddefinovaných triedach. | Vytvorený model, v ktorom sa mapovanie objektov vykonáva do hodnôt. |
Zahŕňa predpoveď | Diskrétne hodnoty | Spojité hodnoty |
algoritmy | Rozhodovací strom, logistická regresia atď. | Regresný strom (Náhodný les), Lineárna regresia atď. |
Povaha predpokladaných údajov | neusporiadaný | objednaný |
Spôsob výpočtu | Presnosť merania | Meranie strednej štvorcovej chyby |
Definícia klasifikácie
Klasifikácia je proces hľadania alebo objavenia modelu (funkcie), ktorý pomáha pri oddeľovaní údajov do viacerých kategorických tried. Pri klasifikácii sa identifikuje členstvo v skupine v probléme, čo znamená, že údaje sú podľa niektorých parametrov kategorizované pod rôznymi menovkami a potom sa predpovedajú pre údaje.
Odvodené modely by mohli byť demonštrované vo forme pravidiel IF-THEN, rozhodovacích stromov alebo neurónových sietí atď. Rozhodovací strom je v podstate diagram, ktorý sa podobá stromovej štruktúre, kde každý vnútorný uzol zobrazuje test na atribút, a jeho vetvy ukazujú výsledok testu. Postup klasifikácie sa zaoberá problémami, v ktorých môžu byť údaje rozdelené do dvoch alebo viacerých diskrétnych značiek, inými slovami dvoch alebo viacerých nesúrodých súborov.
Urobme príklad, predpokladáme, že chceme predpovedať možnosť dažďa v niektorých regiónoch na základe niektorých parametrov. Potom by existovali dva štítky dažďa a žiadny dážď, pod ktorými môžu byť rôzne regióny klasifikované.
Definícia regresie
Regresia je proces hľadania modelu alebo funkcie na rozlíšenie údajov na kontinuálne reálne hodnoty namiesto použitia tried. Matematicky, s regresným problémom, sa snažíme nájsť funkčnú aproximáciu s minimálnou chybovou odchýlkou. Pri regresii sa predpokladá, že číselná závislosť údajov bude rozlíšená.
Regresná analýza je štatistický model, ktorý sa používa na predpovedanie číselných údajov namiesto štítkov. Môže tiež určiť distribučný pohyb v závislosti od dostupných údajov alebo historických údajov.
Vezmime podobný príklad aj v regresii, kde nájdeme možnosť dažďa v niektorých konkrétnych regiónoch pomocou niektorých parametrov. V tomto prípade existuje pravdepodobnosť spojená s dažďom. Tu nie je klasifikácia regiónov v daždi a žiadne označenie dažďa namiesto toho ich klasifikujeme s ich súvisiacou pravdepodobnosťou.
Kľúčové rozdiely medzi klasifikáciou a regresiou
- Proces klasifikácie modeluje funkciu, pomocou ktorej sa údaje predpovedajú v diskrétnych označeniach triedy. Na druhej strane, regresia je proces vytvárania modelu, ktorý predpovedá kontinuálne množstvo.
- Klasifikačné algoritmy zahŕňajú rozhodovací strom, logistickú regresiu atď. Naproti tomu regresný strom (napr. Náhodný les) a lineárna regresia sú príklady regresných algoritmov.
- Klasifikácia predpovedá neusporiadané údaje, zatiaľ čo regresia predpovedá objednané údaje.
- Regresie možno vyhodnotiť pomocou strednej štvorcovej chyby. Naopak, klasifikácia sa hodnotí presnosťou merania.
záver
Klasifikačná technika poskytuje prediktívny model alebo funkciu, ktorá predpovedá nové dáta v diskrétnych kategóriách alebo štítkoch pomocou historických údajov. Naopak regresná metóda modeluje funkcie s nepretržitou hodnotou, čo znamená, že predpovedá dáta v súvislých číselných údajoch.