avainero luokituksen ja regressiopuun välillä on se luokituksessa riippuvat muuttujat ovat kategorioita ja järjestämättömiä, kun taas regressiossa riippuvat muuttujat ovat jatkuvia tai järjestettyjä kokonaisia arvoja.
Luokittelu ja regressio ovat oppimistekniikoita ennustemallien luomiseksi kerätystä tiedosta. Molemmat tekniikat esitetään graafisesti luokittelu- ja regressiopuina tai pikemminkin vuokaavioina jakamalla tiedot jokaisen askeleen jälkeen, tai pikemminkin ”haarana” puussa. Tätä prosessia kutsutaan rekursiiviseksi osioksi. Kaivostoiminnan kaltaiset kentät käyttävät näitä luokittelu- ja regressio-oppimistekniikoita. Tämä artikkeli keskittyy luokittelu- ja regressiopuuhun.
1. Yleiskatsaus ja keskeiset erot
2. Mikä on luokittelu
3. Mikä on regressio
4. Vertailu rinnakkain - luokittelu vs. regressio taulukkomuodossa
5. Yhteenveto
Luokittelu on tekniikka, jota käytetään saamaan kaavio, joka osoittaa datan järjestämisen alusta edeltäjämuuttujalta. Riippuvat muuttujat luokittelevat tiedot.
Kuva 01: Tietojen louhinta
Luokittelupuu alkaa itsenäisellä muuttujalla, joka jakautuu kahteen ryhmään olemassa olevien riippuvien muuttujien määrittelemällä tavalla. Sen on tarkoitus selvittää vastaukset riippuvaisten muuttujien aikaansaaman kategorisoinnin muodossa.
Regressio on ennustusmenetelmä, joka perustuu oletettuun tai tunnettuun numeeriseen lähtöarvoon. Tämä lähtöarvo on seuraus rekursiivisestä osioinnista, jokaisella vaiheella on yksi numeerinen arvo ja toisessa ryhmässä riippuvaisia muuttujia, jotka haarautuvat toiseen pariin, kuten tämä.
Regressiopuu alkaa yhdellä tai useammalla edeltäjämuuttujalla ja päättyy yhdellä lopullisella lähtömuuttujalla. Riippuvat muuttujat ovat joko jatkuvia tai erillisiä numeerisia muuttujia.
Luokittelu vs regressio | |
Puumalli, jossa kohdemuuttuja voi ottaa diskreetin arvojoukon. | Puumalli, jossa kohdemuuttuja voi ottaa jatkuvia arvoja, tyypillisesti todellisia lukuja. |
Riippuva muuttuja | |
Luokittelupuussa riippuvat muuttujat ovat kategorisia. | Regressiopuussa riippuvat muuttujat ovat numeerisia. |
arvot | |
Sillä on asetettu määrä järjestämättömiä arvoja. | Onko joko erillisiä, vielä tilattuja arvoja tai erottamattomia arvoja. |
Rakentamisen tarkoitus | |
Regressiopuun rakentamisen tarkoituksena on sovittaa regressiojärjestelmä jokaiseen determinanttihaaraan siten, että odotettu lähtöarvo nousee. | Luokittelupuu oksittuu edellisestä solmusta johdetun riippuvan muuttujan määrittämällä tavalla. |
Regressio- ja luokittelupuut ovat hyödyllisiä tekniikoita kartoitettaessa prosessia, joka osoittaa tutkitun tuloksen joko luokituksessa tai yksittäisessä numeerisessa arvossa. Ero luokittelupuu ja regressiopuu on niiden riippuvainen muuttuja. Luokittelupuilla on riippuvaisia muuttujia, jotka ovat kategorisia ja järjestämättömiä. Regressiopuilla on riippuvaisia muuttujia, jotka ovat jatkuvia arvoja tai tilattuja kokonaisia arvoja.
1. ”Päätöksen oppiminen.” wikipedia, Wikimedia Foundation, 13. toukokuuta 2018. Saatavilla täältä
1.Data Mining'By Arbeck - Oma työ, (CC BY 3.0) Commons Wikimedian kautta