Korrelaatio vs. kovarianssi
Korrelaatio ja kovarianssi ovat läheisesti toisiinsa liittyviä käsitteitä teoreettisissa tilastoissa. Ne ovat tärkeitä määritettäessä kahden satunnaismuuttujan välistä suhdetta.
Mikä on korrelaatio?
Korrelaatio on mittari kahden muuttujan välisen suhteen vahvuudesta. Korrelaatiokerroin määrittelee yhden muuttujan muutosasteen toisen muuttujan muutoksen perusteella. Tilastoissa korrelaatio on kytketty riippuvuuden käsitteeseen, joka on kahden muuttujan välinen tilastollinen suhde
Pearsonin korrelaatiokerroin tai vain korrelaatiokerroin r on arvo välillä -1 ja 1 (-1≤r≤ + 1). Se on yleisimmin käytetty korrelaatiokerroin ja pätevä vain muuttujien väliseen lineaariseen suhteeseen. Jos r = 0, ei ole yhteyttä ja jos r≥0, suhde on suoraan verrannollinen; yhden muuttujan arvo kasvaa toisen kasvaessa. Jos r≤0, suhde on käänteisesti verrannollinen; yksi muuttuva lasku toisen kasvaessa.
Lineaarisuusedellytysten takia korrelaatiokerrointa r voidaan käyttää myös määrittämään lineaarinen suhde muuttujien välillä.
Mikä on Covariance?
Tilastollisessa teoriassa kovarianssi on mitta siitä, kuinka paljon kaksi satunnaismuuttujaa muuttuu yhdessä. Toisin sanoen kovarianssi on mittaus kahden satunnaismuuttujan välisen korrelaation vahvuudelle.
Toisesta näkökulmasta voidaan nähdä, että korrelaatio on vain kovarianssin normalisoitu versio, jossa kovarianssi jaetaan kahden satunnaismuuttujan keskihajonnan kertoimella. Kovarianssialue voi olla suuri; Siksi sitä ei ole helppo verrata. Tämä vaikeus ratkaistaan saattamalla kovarianssiarvot alueelle, jota voidaan verrata normalisoimalla se (sellainen kuin z-pistemäärä tekee). Vaikka kovarianssi ja varianssi kytketään toisiinsa yllä olevalla tavalla, niiden todennäköisyysjakaumia ei kiinnitetä toisiinsa yksinkertaisella tavalla ja niitä on käsiteltävä erikseen.
Mitä eroa korrelaatiolla ja kovarianssilla on??
• Sekä korrelaatio että kovarianssi ovat suhteita kahden satunnaismuuttujan välillä. Korrelaatio on kahden muuttujan lineaarisuuden lujuuden mitta ja kovarianssi on korrelaation vahvuuden mitta.
• Korrelaatiokertoimen arvot ovat arvo välillä -1 ja +1, kun taas kovarianssialue ei ole vakio, mutta voi olla joko positiivinen tai negatiivinen. Mutta jos satunnaismuuttujat standardisoidaan ennen kovarianssin laskemista, niin kovarianssi on yhtä suuri kuin korrelaatio ja sen arvo on välillä -1 ja +1.