Ero näytteen varianssin ja populaation varianssin välillä

Selitys

Tilastoinnissa käsitteellä näytteenotto tarkoitetaan osan tilastotietojen valintaa osan kannalta tarpeellisten tietojen saamiseksi. Kaikkien tutkimuksen kohteena olevien jäsenten tietystä luonteesta koostuvaa tilastotietoa tai kokonaisuutta kutsutaan populaatioksi tai universumiksi. (Das, N.G., 2010). Valittua väestön osaa, jota käytetään populaation tai maailmankaikkeuden ominaisuuksien saamiseksi, kutsutaan ”näytteeksi”. Väestö otetaan yksittäisistä yksiköistä tai jäsenistä, ja osa yksiköistä sisältyy otokseen. Väestön yksikköjen kokonaismäärää kutsutaan populaation kokoksi ja otoksen määrää kutsutaan otoksen kokoksi. Väestö ja otos voivat olla äärettömiä tai äärettömiä ja samoin kuin ne voivat olla olemassa tai hypoteettisia.

varianssi: Varianssi on numeerinen arvo, joka osoittaa, kuinka laajasti tietyn tietoryhmän yksittäiset luvut jakautuvat keskiarvonsa suhteen. Näin kauan kukin luku on keskiarvosta ja siten toisistaan. Nollaarvon varianssi tarkoittaa, että kaikki tiedot ovat identtisiä. Mitä enemmän varianssi, sitä enemmän arvot jakautuvat keskiarvoon, siis toisistaan. Vähemmän varianssia, vähemmän arvot jakautuvat keskiarvoon, siis toisistaan, ja varianssi ei voi olla negatiivinen.

Ero populaation varianssin ja otoksen varianssin välillä

Suurin ero populaatiovarianssin ja otoksen varianssin välillä liittyy varianssin laskentaan. Varianssi lasketaan viidessä vaiheessa. Ensimmäinen keskiarvo lasketaan, sitten lasketaan poikkeamat keskiarvosta, ja kolmanneksi poikkeamat neliöidaan, neljäsosa summataan neliöpoikkeamat yhteen ja lopuksi tämä summa jaetaan kohteiden lukumäärällä, joille varianssi lasketaan. Siten varianssi = Σ (xi-x -) / n. Missä xi = i. Lukumäärä, x- = keskiarvo ja n = esineiden lukumäärä…

Kun varianssi on laskettava väestötiedoista, n on yhtä suuri kuin kappaleiden lukumäärä. Siten, jos kaikkien 1000 ihmisen verenpaineen variaatio on laskettava kaikkien 1000 ihmisen verenpainetta koskevista tiedoista, niin n = 1000. Kun varianssi lasketaan näytteistä, 1 on kuitenkin vähennettävä n: stä ennen jakamista neliöpoikkeamien summa. Siten yllä olevassa esimerkissä, jos näytetiedoissa on 100 nimikettä, nimittäjä olisi 100 - 1 = 99.

Tästä johtuen näytteen perusteella laskettu varianssiarvo on korkeampi kuin arvo, joka olisi voitu saada selville käyttämällä populaatiotietoja. Tämän tekemisen logiikka on kompensoida puutetta väestötiedoista. Ihmisten korkeuden variaatioita on mahdotonta selvittää, sillä emme ehdottomasti puutu tietoista kaikkien elävien ihmisten korkeuksista, puhumattakaan tulevaisuudesta. Vaikka otamme yhden maltillisen esimerkin, kuten kaikkien Yhdysvaltain elävien miesten väestötiedot, kuten se on, fyysisesti mahdollista, mutta tähän liittyvät kustannukset ja aika saattaisivat estää sen laskennan tarkoituksen. Tästä syystä otantatiedot otetaan suurimpaan osaan tilastollisia tarkoituksia, ja tähän liittyy tiedon puute suurimmasta osasta tietoja. Tämän kompensoimiseksi varianssin arvo ja keskihajonta, joka on varianssin neliö, ovat suurempia näytteistietojen tapauksessa kuin varianssi väestötiedoista.

Tämä toimii automaattisena suojana analyytikoille ja päätöksentekijöille. Logiikka pätee pääoman budjetointiin, henkilökohtaiseen ja yritysrahoitukseen, rakentamiseen, liikenteen hallintaan ja moniin sovellettaviin aloihin. Tämä auttaa sidosryhmää olemaan turvallisella puolella päätöksenteossa tai muissa päätelmissä.

Yhteenveto: Väestövarianssilla tarkoitetaan varianssiarvoa, joka lasketaan väestötiedoista, ja otoksen varianssi on näytteen perusteella laskettua varianssia. Tämän nimittäjän arvon vuoksi varianssikaavassa otantadatan tapauksessa on 'n-1', ja populaatiotietoihin se on 'n'. Seurauksena on se, että näytteistä saadut variaatio ja keskihajonta ovat enemmän kuin väestötiedoista saadut.