Ohjattu oppiminen ja ohjaamaton oppiminen ovat koneoppimisen kaksi keskeistä käsitettä. Ohjattu oppiminen on koneoppimistehtävä, jonka avulla voidaan oppia toiminto, joka kuvaa tulon tulosteen esimerkki-tulo-lähtöparien perusteella. Valvomaton oppiminen on koneoppimistehtävä, jonka avulla voidaan päätellä funktio kuvaamaan piilotettu rakenne leimaamattomasta tiedosta. avainero ohjatun ja valvomattoman koneoppimisen välillä on se ohjattu oppiminen käyttää leimattua dataa, kun taas ohjaamaton oppiminen käyttää leimatonta tietoa.
Koneoppiminen on tietotekniikan ala, joka antaa tietokonejärjestelmälle mahdollisuuden oppia tiedoista ilman, että sitä on nimenomaisesti ohjelmoitu. Sen avulla voidaan analysoida tietoja ja ennustaa niiden kuvioita. Koneoppimisessa on monia sovelluksia. Jotkut niistä ovat kasvojentunnistus, eleiden tunnistus ja puheentunnistus. Koneoppimiseen liittyy useita algoritmeja. Jotkut niistä ovat regressio, luokittelu ja klusterointi. Yleisimmät ohjelmointikielet koneoppimispohjaisten sovellusten kehittämiseen ovat R ja Python. Muita kieliä, kuten Java, C ++ ja Matlab, voidaan myös käyttää.
1. Yleiskatsaus ja keskeiset erot
2. Mikä on ohjattu oppiminen
3. Mikä on valvomaton oppiminen
4. Ohjattavan ja ohjaamattoman koneoppimisen väliset yhtäläisyydet
5. Vertailu rinnakkain - ohjattu vs. ohjaamaton koneoppiminen taulukkomuodossa
6. Yhteenveto
Koneoppimisissa järjestelmissä malli toimii algoritmin mukaan. Ohjatussa oppimisessa mallia ohjataan. Ensinnäkin malli on koulutettava. Saatujen tietojen avulla se voi ennustaa vastauksia tuleville esiintymille. Malli koulutetaan merkityn tietoaineiston avulla. Kun järjestelmälle annetaan näytteistötietoja, se voi ennustaa tuloksen. Seuraava on pieni ote suositusta IRIS-aineistosta.
Yllä olevan taulukon mukaan Sepaalin pituutta, Sepaalin leveyttä, Patelin pituutta, Patelin leveyttä ja lajia kutsutaan määritteiksi. Sarakkeet tunnetaan ominaisuuksina. Yhdessä rivissä on tietoja kaikista määritteistä. Siksi yhtä riviä kutsutaan havainnoksi. Tiedot voivat olla joko numeerisia tai kategorisia. Mallille annetaan havainnot, joissa syötteenä on vastaava lajinimi. Kun uusi havainto annetaan, mallin tulisi ennustaa, minkä tyyppinen laji siihen kuuluu.
Ohjatussa oppimisessa on algoritmeja luokitukselle ja regressiolle. Luokittelu on merkittyjen tietojen luokitteluprosessi. Malli loi rajat, jotka erottivat tietoryhmät. Kun mallille annetaan uutta tietoa, se voi luokitella pisteen perusteella. K-lähimmät naapurit (KNN) on luokittelumalli. K-arvosta riippuen luokka päätetään. Esimerkiksi, kun k on 5, jos tietty datapiste on lähellä kahdeksan A-luokan datapistettä ja kuusi B-luokan datapistettä, datapiste luokitellaan A: ksi..
Regressio on prosessi, jolla ennustetaan aiempien tietojen suuntausta ennustaa uusien tietojen lopputulos. Regressiossa lähtö voi koostua yhdestä tai useammasta jatkuvasta muuttujasta. Ennustaminen tehdään käyttämällä riviä, joka kattaa suurimman osan datapisteistä. Yksinkertaisin regressiomalli on lineaarinen regressio. Se on nopea eikä vaadi viritysparametreja, kuten KNN: ssä. Jos tiedot osoittavat parabolista trendiä, lineaarinen regressiomalli ei sovellu.
Nämä ovat joitain esimerkkejä valvotuista oppimisalgoritmeista. Yleensä ohjattujen oppimismenetelmien tuottama tulos on tarkempi ja luotettavampi, koska syöttötiedot ovat hyvin tunnettuja ja merkittyjä. Siksi koneen on analysoitava vain piilotetut kuviot.
Valvomattomassa oppimisessa mallia ei valvota. Malli toimii yksinään tulosten ennustamiseksi. Se käyttää koneoppimisalgoritmeja päätelmien tekemiseen leimaamattomasta tiedosta. Yleensä ohjaamat oppimisalgoritmit ovat vaikeampia kuin ohjatut oppimisalgoritmit, koska tietoa on vähän. Klusterointi on eräänlainen ohjaamaton oppiminen. Sitä voidaan käyttää tuntemattoman datan ryhmittelemiseen algoritmeja käyttämällä. K-keskiarvo ja tiheyspohjainen klusterointi ovat kaksi klusterointialgoritmia.
k-keskimääräinen algoritmi, sijoittaa k-keskikohdan satunnaisesti jokaiselle klusterille. Sitten kukin datapiste osoitetaan lähimmälle keskukselle. Euklidista etäisyyttä käytetään laskemaan etäisyys datapisteestä keskikohtaan. Tietopisteet luokitellaan ryhmiin. K-keskuksen sijainnit lasketaan uudelleen. Uusi keskikohdan sijainti määritetään ryhmän kaikkien pisteiden keskiarvon perusteella. Jokainen datapiste on jälleen osoitettu lähimmälle keskukselle. Tämä prosessi toistuu, kunnes keskikohdat eivät enää muutu. k-keskiarvo on nopea klusterointialgoritmi, mutta klusterointipisteiden alustamista ei ole määritelty. Lisäksi klusterimallien vaihtelu perustuu klusteripisteiden alustamiseen.
Toinen klusterointialgoritmi on Tiheyspohjainen klusterointi. Se tunnetaan myös nimellä tiheyspohjaiset alueelliset klusterointisovellukset, joissa on melua. Se toimii määrittelemällä klusterin suurimpana tiheyteen kytkettyjen pisteiden joukona. Ne ovat kaksi parametria, joita käytetään tiheyspohjaiseen klusterointiin. Ne ovat Ɛ (epsilon) ja minimipisteet. Ɛ on naapuruston suurin säde. Vähimmäispisteet ovat minimimäärä pisteitä Ɛ-naapurustossa klusterin määrittelemiseksi. Nämä ovat joitain esimerkkejä klusteroinnista, joka kuuluu ohjaamattomaan oppimiseen.
Yleensä valvomattomista oppimisalgoritmeista tuotetut tulokset eivät ole kovin tarkkoja ja luotettavia, koska koneen on määritettävä ja nimettävä syöttötiedot ennen piilotettujen kuvioiden ja toimintojen määrittämistä.
Ohjattu vs valvomaton koneoppiminen | |
Ohjattu oppiminen on koneoppimistehtävä, jonka avulla voidaan oppia toiminto, joka kuvaa tulon tulosteen esimerkkitulo- ja lähtöparien perusteella. | Valvomaton oppiminen on koneoppimistehtävä, jonka avulla voidaan päätellä funktio kuvaamaan piilotettu rakenne leimaamattomasta tiedosta. |
Päätoiminnot | |
Ohjatussa oppimisessa malli ennustaa lopputuloksen merkittyjen syöttötietojen perusteella. | Valvomattomassa oppimisessa malli ennustaa tuloksen ilman leimattua tietoa tunnistamalla kuviot yksinään. |
Tulosten tarkkuus | |
Ohjattujen oppimismenetelmien tulokset ovat tarkempia ja luotettavia. | Valvomattomien oppimismenetelmien tulokset eivät ole kovin tarkkoja ja luotettavia. |
Pääalgoritmit | |
Ohjatussa oppimisessa on olemassa algoritmeja regression ja luokittelun suhteen. | Klusterointia varten on olemassa algoritmeja ohjaamattomassa oppimisessa. |
Ohjattu oppiminen ja ohjaamaton oppiminen ovat kahta tyyppistä koneoppimista. Ohjattu oppiminen on koneoppimistehtävä, jonka avulla voidaan oppia toiminto, joka kuvaa tulon tulosteen esimerkkitulo- ja lähtöparien perusteella. Valvomaton oppiminen on koneoppimistehtävä, jonka avulla voidaan päätellä funktio kuvaamaan piilotettu rakenne leimaamattomasta tiedosta. Ero ohjatun ja valvomattoman koneoppimisen välillä on se, että ohjattu oppiminen käyttää merkittyä tietoa, kun taas valvomaton kaltevuus käyttää merkitsemätöntä tietoa.
1.TheBigDataUniversity. Koneoppiminen - Ohjattu VS Valvomaton oppiminen, kognitiivinen luokka, 13. maaliskuuta 2017. Saatavana täältä
2. ”Ohjaamaton oppiminen.” Wikipedia, Wikimedia Foundation, 20. maaliskuuta 2018. Saatavilla täältä
3. ”Ohjattu oppiminen”. Wikipedia, Wikimedia Foundation, 15. maaliskuuta 2018. Saatavilla täältä
1.'2729781 ', kirjoittanut GDJ (Public Domain) pixabayn kautta