Odporúčaná, 2024

Redakcia Choice

Rozdiel medzi klasifikáciou a regresiou

Klasifikácia a regresia sú dva hlavné predikčné problémy, ktoré sa zvyčajne riešia v oblasti dolovania dát. Prediktívne modelovanie je technika vývoja modelu alebo funkcie pomocou historických údajov na predpovedanie nových údajov. Významný rozdiel medzi klasifikáciou a regresiou spočíva v tom, že klasifikácia mapuje vstupný dátový objekt na niektoré diskrétne štítky. Na druhej strane regresia mapuje vstupný dátový objekt na kontinuálne reálne hodnoty.

Porovnávacia tabuľka

Základ pre porovnanieklasifikáciaregresia
základné
Zistenie modelu alebo funkcií, kde sa mapovanie objektov vykonáva v preddefinovaných triedach.Vytvorený model, v ktorom sa mapovanie objektov vykonáva do hodnôt.
Zahŕňa predpoveďDiskrétne hodnotySpojité hodnoty
algoritmyRozhodovací strom, logistická regresia atď.Regresný strom (Náhodný les), Lineárna regresia atď.
Povaha predpokladaných údajovneusporiadanýobjednaný
Spôsob výpočtuPresnosť meraniaMeranie strednej štvorcovej chyby

Definícia klasifikácie

Klasifikácia je proces hľadania alebo objavenia modelu (funkcie), ktorý pomáha pri oddeľovaní údajov do viacerých kategorických tried. Pri klasifikácii sa identifikuje členstvo v skupine v probléme, čo znamená, že údaje sú podľa niektorých parametrov kategorizované pod rôznymi menovkami a potom sa predpovedajú pre údaje.

Odvodené modely by mohli byť demonštrované vo forme pravidiel IF-THEN, rozhodovacích stromov alebo neurónových sietí atď. Rozhodovací strom je v podstate diagram, ktorý sa podobá stromovej štruktúre, kde každý vnútorný uzol zobrazuje test na atribút, a jeho vetvy ukazujú výsledok testu. Postup klasifikácie sa zaoberá problémami, v ktorých môžu byť údaje rozdelené do dvoch alebo viacerých diskrétnych značiek, inými slovami dvoch alebo viacerých nesúrodých súborov.

Urobme príklad, predpokladáme, že chceme predpovedať možnosť dažďa v niektorých regiónoch na základe niektorých parametrov. Potom by existovali dva štítky dažďa a žiadny dážď, pod ktorými môžu byť rôzne regióny klasifikované.

Definícia regresie

Regresia je proces hľadania modelu alebo funkcie na rozlíšenie údajov na kontinuálne reálne hodnoty namiesto použitia tried. Matematicky, s regresným problémom, sa snažíme nájsť funkčnú aproximáciu s minimálnou chybovou odchýlkou. Pri regresii sa predpokladá, že číselná závislosť údajov bude rozlíšená.

Regresná analýza je štatistický model, ktorý sa používa na predpovedanie číselných údajov namiesto štítkov. Môže tiež určiť distribučný pohyb v závislosti od dostupných údajov alebo historických údajov.

Vezmime podobný príklad aj v regresii, kde nájdeme možnosť dažďa v niektorých konkrétnych regiónoch pomocou niektorých parametrov. V tomto prípade existuje pravdepodobnosť spojená s dažďom. Tu nie je klasifikácia regiónov v daždi a žiadne označenie dažďa namiesto toho ich klasifikujeme s ich súvisiacou pravdepodobnosťou.

Kľúčové rozdiely medzi klasifikáciou a regresiou

  1. Proces klasifikácie modeluje funkciu, pomocou ktorej sa údaje predpovedajú v diskrétnych označeniach triedy. Na druhej strane, regresia je proces vytvárania modelu, ktorý predpovedá kontinuálne množstvo.
  2. Klasifikačné algoritmy zahŕňajú rozhodovací strom, logistickú regresiu atď. Naproti tomu regresný strom (napr. Náhodný les) a lineárna regresia sú príklady regresných algoritmov.
  3. Klasifikácia predpovedá neusporiadané údaje, zatiaľ čo regresia predpovedá objednané údaje.
  4. Regresie možno vyhodnotiť pomocou strednej štvorcovej chyby. Naopak, klasifikácia sa hodnotí presnosťou merania.

záver

Klasifikačná technika poskytuje prediktívny model alebo funkciu, ktorá predpovedá nové dáta v diskrétnych kategóriách alebo štítkoch pomocou historických údajov. Naopak regresná metóda modeluje funkcie s nepretržitou hodnotou, čo znamená, že predpovedá dáta v súvislých číselných údajoch.

Top