Varianssi vs. kovarianssi
Varianssi ja kovarianssi ovat kaksi tilastossa käytettyä mittaa. Varianssi on datan sironnan mittari, ja kovarianssi osoittaa kahden satunnaismuuttujan muutosasteen yhdessä. Varianssi on pikemminkin intuitiivinen käsite, mutta kovarianssi määritellään matemaattisesti siten, että se ei ole aluksi intuitiivista.
Lisätietoja Variancesta
Varianssi on mitta datan jakautumisesta jakauman keskiarvosta. Se kertoo kuinka kaukana datapisteet sijaitsevat jakauman keskiarvosta. Se on yksi todennäköisyysjakauman ensisijaisista kuvauksista ja yksi jakauman hetkistä. Lisäksi varianssi on populaation parametri, ja populaation otoksen varianssi toimii arvioijana populaation varianssille. Yhden näkökulman mukaan se määritellään keskihajonnan neliöksi.
Yksinkertaisella kielellä sitä voidaan kuvata kunkin datapisteen ja jakauman keskiarvon välisen etäisyyden neliöiden keskiarvona. Seuraavaa kaavaa käytetään varianssin laskemiseen.
Var (X) = E [(X-μ)2 ] väestölle ja
Var (X) = E [(X-~x)2 ] näytteelle
Sitä voidaan edelleen yksinkertaistaa, jolloin saadaan Var (X) = E [X2 ] - (E [X])2.
Varianssilla on joitain allekirjoitusominaisuuksia, ja sitä käytetään usein tilastoissa käytön yksinkertaistamiseksi. Varianssi ei ole negatiivinen, koska se on etäisyyksien neliö. Varianssialue ei kuitenkaan ole rajoitettu ja riippuu tietystä jakaumasta. Vakion satunnaismuuttujan varianssi on nolla, ja varianssi ei muutu sijaintiparametrin suhteen.
Lisätietoja Covariancesta
Tilastollisessa teoriassa kovarianssi on mitta siitä, kuinka paljon kaksi satunnaismuuttujaa muuttuu yhdessä. Toisin sanoen kovarianssi on mittaus kahden satunnaismuuttujan välisen korrelaation vahvuudelle. Sitä voidaan pitää myös kahden satunnaismuuttujan varianssikäsityksen yleistyksenä.
Kahden satunnaismuuttujan X ja Y, jotka jakautuvat yhdessä äärellisen toisen momentin kanssa, kovarianssi tunnetaan nimellä σXY= E [(X-E [X]) (Y-E [Y])]. Tästä lähtien varianssi voidaan nähdä kovarianssin erityistapauksena, jossa kaksi muuttujaa ovat samat. Cov (X, X) = Var (x)
Normalisoimalla kovarianssi voidaan saada lineaarinen korrelaatiokerroin tai Pearsonin korrelaatiokerroin, joka määritellään ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graafisesti datapisteparin välinen kovarianssi voidaan nähdä suorakulmion alueena, jossa datapisteet ovat vastakkaisissa kärkipisteissä. Sitä voidaan tulkita kahden datapisteen välisen eron suuruusmittana. Kun otetaan huomioon koko väestön suorakulmiot, kaikkia datapisteitä vastaavien suorakulmioiden päällekkäisyyksiä voidaan pitää erotuksen vahvuutena; kahden muuttujan varianssi. Kovarianssi on kahdessa ulottuvuudessa, johtuen kahdesta muuttujasta, mutta yksinkertaistamalla se yhdeksi muuttujaksi saadaan yhden variaatio erotuksena yhdessä ulottuvuudessa.
Mikä on ero varianssin ja kovarianssin välillä??
• Varianssi on populaation leviämisen / hajonnan mitta, kun taas kovarianssia pidetään kahden satunnaismuuttujan variaation tai korrelaation voimakkuuden mitana..
• Varianssia voidaan pitää kovarianssin erityistapauksena.
• varianssi ja kovarianssi ovat riippuvaisia data-arvojen suuruudesta, eikä niitä voida verrata; siksi ne normalisoidaan. Kovarianssi normalisoidaan korrelaatiokertoimeen (jakamalla kahden satunnaismuuttujan keskihajonnan kertoimella) ja varianssi normalisoidaan standardipoikkeamalle (ottamalla neliöjuuri)