Väestö vs. näytteen keskihajonta
Tilastoinnissa käytetään useita indeksejä kuvaamaan tietojoukko, joka vastaa sen keskeistä taipumusta, leviämistä ja vinoutta. Vakiopoikkeama on yksi yleisimmistä mittareista datan leviämiselle tietojoukon keskustasta.
Käytännön vaikeuksien vuoksi koko väestön tietoja ei ole mahdollista käyttää, kun hypoteesia testataan. Siksi käytämme näytteiden tietoarvoja päätelmien tekemiseksi väestöstä. Tällaisessa tilanteessa näitä kutsutaan estimaattoreiksi, koska ne arvioivat populaatioparametrien arvot.
On erittäin tärkeää käyttää puolueettomia estimoijia päätelmissä. Estimaattorin sanotaan olevan puolueeton, jos estimoijan odotettu arvo on yhtä suuri kuin populaatioparametri. Esimerkiksi, käytämme otsakkeen keskiarvoa puolueettomassa arvioijassa populaatiokeskiarvosta. (Matemaattisesti voidaan osoittaa, että näytteen keskiarvon odotettu arvo on yhtä suuri kuin populaation keskiarvo). Jos arvioidaan populaation keskihajontaa, myös otoksen keskihajonta on puolueeton estimoija.
Mikä on populaation keskihajonta??
Kun koko väestön tiedot voidaan ottaa huomioon (esimerkiksi väestönlaskennan tapauksessa), on mahdollista laskea väestön keskihajonta. Väestön keskihajonnan laskemiseksi lasketaan ensin tietoarvojen poikkeamat populaation keskiarvosta. Poikkeamien neliökeskiarvoa (neliökeskistä) kutsutaan populaation keskihajonnaksi.
Kymmenen oppilaan luokassa tiedot opiskelijoista voidaan helposti kerätä. Jos hypoteesi testataan tälle opiskelijaryhmälle, silloin ei tarvitse käyttää näytteen arvoja. Esimerkiksi 10 oppilaan painot (kilogrammoina) ovat 70, 62, 65, 72, 80, 70, 63, 72, 77 ja 79. Silloin kymmenen ihmisen keskipaino (kilogrammoina) on (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, joka on 71 (kilogrammoina). Tämä on väestön keskiarvo.
Nyt lasketaan väestön keskihajonta laskemalla poikkeamat keskiarvosta. Vastaavat poikkeamat keskiarvosta ovat (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 ja (79 - 71) = 8. Poikkeama neliöiden summa on ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Väestön keskihajonta on √ (366/10) = 6,05 (kilogrammoina). 71 on luokan oppilaiden tarkka keskimääräinen paino ja 6.05 on painon tarkka keskihajonta 71: stä.
Mikä on näytteen keskihajonta??
Kun populaation parametreihin arvioidaan näytteen (koon n) tietoja, otoksen keskihajonta lasketaan. Ensin lasketaan data-arvojen poikkeamat näytteen keskiarvosta. Koska otoskeskiarvoa käytetään populaatiokeskiarvon (jota ei tunneta) sijasta, kvadraattisen keskiarvon ottaminen ei ole tarkoituksenmukaista. Näytekeskiarvon käytön kompensoimiseksi jaetaan poikkeamien neliöiden summa (n-1): n sijaan. Näytteen keskihajonta on tämän neliöjuuri. Matemaattisissa symboleissa S = √ ∑ (xminä-x)2 / (n-1), missä S on näytteen keskihajonta, ẍ on näytteen keskiarvo ja xminäovat datapisteitä.
Oletetaan nyt, että edellisessä esimerkissä väestö on koko koulun oppilaita. Sitten luokka on vain näyte. Jos tätä näytettä käytetään arvioinnissa, näytteen keskihajonta on √ (366/9) = 6,38 (kilogrammoina), koska 366 jaettiin 9: llä 10: n (näytteen koko) sijasta. Huomaa, että tämän ei voida taata olevan tarkka populaation keskihajonta-arvo. Se on vain arvio siitä.
Mikä on ero populaation keskihajonnan ja näytteen keskihajonnan välillä? • Väestön keskihajonta on tarkka parametriarvo, jota käytetään mittaamaan dispersiota keskustasta, kun taas näytteen keskihajonta on puolueeton arvio. • Väestön keskihajonta lasketaan, kun kaikki väestön kunkin yksilön tiedot ovat tiedossa. Muu, näytteen keskihajonta lasketaan. • Väestön keskihajonta saadaan σ = √ ∑ (xi-µ)2/ n, missä µ on populaation keskiarvo ja n on populaation koko, mutta näytteen keskihajonta saadaan kaavalla S = √ ∑ (xi-ẍ)2 / (n-1), missä ẍ on näytteen keskiarvo ja n on näytteen koko.
|