Keskeinen taipumus vs. leviäminen
Kuvailevissa ja päättelytilastoissa käytetään useita indeksejä kuvaamaan tietojoukko, joka vastaa sen keskeistä taipumusta, leviämistä ja vinoutumista: kolme tärkeintä ominaisuutta, jotka määrittävät tietojoukon jakauman suhteellisen muodon.
Mikä on keskeinen taipumus?
Keskeinen taipumus viittaa ja etsii arvojen jakauman keskuksen. Keskiarvo, tila ja mediaani ovat yleisimmin käytettyjä indeksejä kuvaamalla tietojoukon keskimääräistä taipumusta. Jos tietojoukko on symmetrinen, niin mediaanin ja tietojoukon keskiarvo ovat samat.
Kun tietojoukko, keskiarvo lasketaan laskemalla kaikkien data-arvojen summa ja jakamalla se sitten tietomäärällä. Esimerkiksi 10 ihmisen paino (kilogrammoina) on mitattu 70, 62, 65, 72, 80, 70, 63, 72, 77 ja 79. Sitten kymmenen ihmisen keskipaino (kilogrammoina) voi olla lasketaan seuraavasti. Painojen summa on 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Keskiarvo = (summa) / (tietojen lukumäärä) = 710/10 = 71 (kilogrammoina). Ymmärretään, että poikkeamilla (normaalista kehityksestä poikkeavat tietopisteet) on taipumus vaikuttaa keskiarvoon. Siten poikkeavien läsnä ollessa keskiarvo ei yksinään anna oikeaa kuvaa tietojoukon keskustasta.
Mediaani on tietopiste, joka löytyy tietojoukon täsmällisestä keskeltä. Yksi tapa laskea mediaani on järjestää datapisteet nousevassa järjestyksessä ja paikantaa sitten datapiste keskeltä. Esimerkiksi, jos tilauksen jälkeen edellinen tietojoukko näyttää, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Siksi (70 + 72) / 2 = 71 on keskellä. Tästä seuraa, että mediaanin ei tarvitse olla tietojoukossa. Poikkeamien läsnäolo ei vaikuta mediaaniin. Siksi mediaani toimii parempana mitattuna keskitetylle taipumukselle poikkeavien läsnä ollessa.
Tila on datajoukon yleisimmin esiintyvä arvo. Edellisessä esimerkissä arvot 70 ja 72 esiintyvät molemmat kahdesti ja siten molemmat ovat tiloja. Tämä osoittaa, että joissain jakaumissa on enemmän kuin yksi modaaliarvo. Jos on vain yksi moodi, tietojoukon sanotaan olevan yksimodaalinen, tässä tapauksessa tietojoukko on kaksimodaalinen.
Mikä on dispersio?
Dispersio on jakauman keskipistettä koskevan tiedon leviämisen määrä. Alue ja keskihajonta ovat yleisimmin levinneisyyden mitat.
Alue on yksinkertaisesti suurin arvo miinus alin arvo. Edellisessä esimerkissä suurin arvo on 80 ja pienin arvo 62, joten alue on 80-62 = 18. Mutta alue ei tarjoa riittävää kuvaa dispersiosta.
Vakiopoikkeaman laskemiseksi lasketaan ensin data-arvojen poikkeamat keskiarvosta. Poikkeamien juur neliökeskiarvoa kutsutaan vakiopoikkeamiseksi. Edellisessä esimerkissä vastaavat poikkeamat keskiarvosta ovat (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 ja (79 - 71) = 8. poikkeamaruudut ovat (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Vakiopoikkeama on √ (366/10) = 6.05 (kilogrammoina). Ellei tietojoukko ole suuresti vinoutunut, tästä voidaan päätellä, että suurin osa tiedoista on välillä 71 ± 6.05, ja näin on todella tässä erityisessä esimerkissä.
Mikä on ero keskittymissuunnan ja hajonnan välillä?? • Keskitetyllä taipumuksella tarkoitetaan ja paikannetaan arvojen jakauman keskipiste • Dispersio on tiedon leviämisen määrä tietojoukon keskustasta.
|