Regressio vs. ANOVA
Regressio ja ANOVA (varianssianalyysi) ovat kaksi tilastoteorian menetelmää yhden muuttujan käyttäytymisen analysoimiseksi toiseen. Regressiossa se on usein riippuvaisen muuttujan variaatio riippumattoman muuttujan perusteella, kun taas ANOVA: ssa se on kahden populaation kahden näytteen ominaisuuksien variaatio.
Lisätietoja regressiosta
Regressio on tilastollinen menetelmä, jota käytetään piirtämään suhde kahden muuttujan välillä. Usein tietoja kerättäessä voi olla muuttujia, jotka ovat riippuvaisia toisista. Tarkka suhde näiden muuttujien välillä voidaan määrittää vain regressiomenetelmillä. Tämän suhteen määrittäminen auttaa ymmärtämään ja ennakoimaan yhden muuttujan käyttäytymistä toiselle.
Regressioanalyysin yleisin sovellus on estää riippuvaisen muuttujan arvo annetulle arvolle tai arvoalueelle. Esimerkiksi regressiota käyttämällä voidaan määrittää hyödykehinnan ja kulutuksen välinen suhde satunnaisesta näytteestä kerättyjen tietojen perusteella. Regressioanalyysi tuottaa tietojoukon regressiofunktion, joka on käytettävissä olevaan tietoon parhaiten sopiva matemaattinen malli. Tätä voidaan helposti edustaa sirontakuvaajana. Graafisesti regressio vastaa parhaiten sopivan käyrän löytämistä annosdatajoukolle. Käyrän funktio on regressiofunktio. Matemaattisella mallilla hyödykkeen käyttö voidaan ennustaa tietylle hinnalle.
Siksi regressioanalyysiä käytetään laajasti ennustamisessa ja ennustamisessa. Sitä käytetään myös luomaan suhteita kokeelliseen dataan, fysiikan, kemian ja monien luonnontieteiden ja tekniikan alojen aloille. Jos suhde tai regressiofunktio on lineaarifunktio, niin prosessi tunnetaan lineaarisena regressiona. Hajotuskaaviossa se voidaan esittää suorana viivanä. Jos funktio ei ole lineaarinen parametrien yhdistelmä, regressio on epälineaarinen.
Lisätietoja ANOVA: sta (varianssianalyysi)
ANOVA ei sisällä kahden tai useamman muuttujan välisen suhteen analysointia nimenomaisesti. Pikemminkin se tarkistaa, onko kahdella tai useammalla näytteellä eri populaatioista sama keskiarvo. Harkitse esimerkiksi kouluun suoritetun tentin testituloksia. Vaikka testit ovat erilaisia, suorituskyky voi olla luokkien välillä samanlainen. Yksi menetelmä tämän todentamiseksi on vertaamalla jokaisen luokan keinoja. ANOVA tai varianssianalyysi mahdollistaa tämän hypoteesin testaamisen. Perusasennossa ANOVA: ta voidaan pitää t-testin jatkeena, jossa verrataan kahdesta populaatiosta otettujen kahden näytteen keskiarvoja.
ANOVA: n perusideana on otoksen sisäisen variaation ja näytteiden välisen variaation huomioon ottaminen. Otoksen sisäinen variaatio voidaan johtaa satunnaisuuteen, kun taas näytteiden keskinäinen vaihtelu voidaan johtua sekä satunnaisuudesta että muista ulkoisista tekijöistä. Varianssianalyysi perustuu kolmeen malliin; kiinteät efektimallit, satunnaistehostemallit ja sekaefektit.
Mikä on ero regression ja ANOVA: n välillä??
• ANOVA on kahden tai useamman näytteen välisen variaation analyysi, kun taas regressio on kahden tai useamman muuttujan välisen suhteen analysointi.
• ANOVA-teoriaa käytetään kolmen perusmallin (kiinteät efektimallit, satunnaistehostemallit ja sekoitetut efektimallit) avulla, kun taas regressiota käytetään kahden mallin (lineaarinen regressiomalli ja moninkertainen regressiomalli) kanssa.
• ANOVA ja regressio ovat molemmat yleisen lineaarimallin (GLM) versiot. ANOVA perustuu kategorisiin ennustemuuttujiin, kun taas regressio perustuu kvantitatiivisiin ennustajamuuttujiin.
• Regressio on joustavampi tekniikka, ja sitä käytetään ennustamiseen ja ennustamiseen, kun taas ANOVA: ta käytetään kahden tai useamman populaation tasa-arvon vertaamiseen..