Sekä korrelaatio että regressio ovat tilastollisia välineitä, jotka käsittelevät kahta tai useampaa muuttujaa. Vaikka molemmat liittyvät samaan aiheeseen, näiden kahden välillä on eroja. Näiden kahden erot selitetään alla.
Termi korrelaatio viittaamalla kahteen tai useampaan muuttujaan tarkoittaa, että muuttujat liittyvät jollain tavalla. Korrelaatioanalyysi määrittää, onko kahden muuttujan välillä yhteys, ja suhteen vahvuus. Jos kaksi muuttujaa x (riippumaton) ja y (riippuvainen) liittyvät toisiinsa niin, että riippumattoman muuttujan suuruuden vaihteluun liittyy riippuvaisen muuttujan suuruuden vaihtelu, silloin kahden muuttujan sanotaan korreloivan.
Korrelaatio voi olla lineaarinen tai epälineaarinen. Lineaarinen korrelaatio on sellainen, jossa muuttujat ovat niin toisiinsa liittyviä, että yhden muuttujan arvon muutos aiheuttaisi muuttujan muuttujan johdonmukaisesti. Lineaarisessa korrelaatiossa riippuvaisten ja riippumattomien muuttujien vastaaviin arvoihin liittyvät hajallaan olevat pisteet ryhtyisivät ei-vaakasuoran suoran ympärille, vaikka vaakasuora suora osoittaisi myös muuttujien välisen lineaarisen suhteen, jos suora voisi yhdistää pisteitä, jotka edustavat muuttujat.
Regressioanalyysi puolestaan käyttää olemassa olevia tietoja määrittämään muuttujien välinen matemaattinen suhde, jota voidaan käyttää määrittämään riippuvaisen muuttujan arvo suhteessa riippumattoman muuttujan mihin tahansa arvoon..
Korrelaatio liittyy assosiaation voimakkuuden tai suhteen voimakkuuden mittaamiseen, kun regressiolla tarkoitetaan riippuvaisen muuttujan arvon ennustamista suhteessa riippumattoman muuttujan tunnettuun arvoon. Tämä selitetään seuraavilla kaavoilla.
Korrelaatiokerroin tai kerroinkorrelaatio (r) x & y: n välillä selvitetään seuraavalla kaavalla;
r = kovarianssi (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σy ovat vastaavasti x: n ja y: n vakiopoikkeamia, ja - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Korrelaatiokerroin r on puhdas luku ja riippumaton mittayksiköstä. Joten jos x on korkeus (tuumaa) ja y on tietyn alueen ihmisten paino (lbs.), Niin r ei ole tuumaa tai kiloa, vaan yksinkertaisesti numero.
Regressioyhtälö saadaan selville seuraavalla kaavalla:
Y: n regressioyhtälö x: llä (y arvion selvittämiseksi) on y - y '= byx (x-x‾), byx: tä kutsutaan y: n regressiokertoimeksi x: llä. X: n regressioyhtälö y: llä (arvion x selvittämiseksi) on x - x '= bxy (y-y‾), bxy: tä kutsutaan x: n regressiokertoimeksi y: llä.
Korrelaatioanalyysi ei oleta minkään muuttujan riippuvuutta toisesta muuttujasta, eikä myöskään yritetä selvittää näiden kahden suhdetta. Se vain arvioi muuttujien välisen assosiaation asteen. Toisin sanoen korrelaatioanalyysi testaa muuttujien keskinäistä riippuvuutta. Regressioanalyysi puolestaan kuvaa riippuvaisen muuttujan tai vastemuuttujan riippuvuutta riippumattomasta tai selittävistä muuttujista. Regressioanalyysissä oletetaan, että selittävien ja vastemuuttujien välillä on yksisuuntainen syy-yhteys, eikä siinä oteta huomioon, onko syy-yhteys positiivinen vai negatiivinen. Korrelaatiota varten sekä riippuvien että riippumattomien muuttujien arvot ovat satunnaisia, mutta riippumattomien muuttujien regressioarvojen ei tarvitse olla satunnaisia.
1. Korrelaatioanalyysi on testi kahden muuttujan välisestä riippuvuudesta. Regressioanalyysi antaa matemaattisen kaavan riippuvan muuttujan arvon määrittämiseksi suhteessa riippumattoman muuttujan / arvoihin.
2. Korrelaatiokerroin on riippumaton alkuperävalinnasta ja mittakaavasta, mutta regressiokerroin ei ole niin.
Korrelaatioon molempien muuttujien arvojen on oltava satunnaisia, mutta näin ei ole regressiokertoimen suhteen.
1. Das, N. G., (1998), Statistics Methods, Calcutta
2. Korrelaatio ja regressio, saatavana osoitteessa www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regressio ja korrelaatio, saatavana osoitteessa www.abyss.uoregon.edu