Pylväskaavio vs. histogrammi
Tilastoinnissa tietojen yhteenveto ja esittäminen on tärkeää. Se voidaan tehdä joko numeerisesti käyttämällä kuvaavia mittauksia tai graafisesti käyttämällä ympyrädiagrammeja, pylväskaavioita ja monia muita graafisen esityksen menetelmiä.
Mikä on pylväskaavio?
Pylväskaavio on yksi tärkeimmistä graafisen esityksen menetelmistä tilastoissa. Sitä käytetään laadullisten tietojen erillisten arvojen näyttämiseen vaaka-akselilla ja näiden arvojen suhteelliset taajuudet (tai taajuudet tai prosenttimäärät) pystyakselilla. Palkki, jonka korkeus / pituus on verrannollinen suhteelliseen taajuuteen, edustaa kutakin erillistä arvoa, ja palkit on sijoitettu siten, etteivät ne kosketa toisiinsa. Pylväskaavio, jolla on yllä oleva kokoonpano, on yleisin, ja sitä kutsutaan pystysuoraksi pylväskaavioksi tai sarakkeista. Mutta on myös mahdollista vaihtaa akseleita; tällöin tangot ovat vaakatasossa.
Pylväskaaviota käytettiin ensimmäistä kertaa William Playfairin vuonna 1786 julkaisemassa teoksessa ”Kaupallinen ja poliittinen atlas”. Siitä lähtien pylväskaaviosta on tullut yksi tärkeimmistä työkaluista kategorisen datan esittämisessä. Pylväskaavioiden käyttöä voidaan laajentaa edustamaan monimutkaisempia kategorisia tietoja, kuten aikakehitysmuuttujia (vaalivasteet), ryhmitettyä tietoa ja muuta.
Mikä on histogrammi?
Histogrammi on toinen tärkeä tietojen graafinen esitys, ja sitä voidaan pitää kehityksenä pylväskaaviossa. Histogrammissa kvantitatiivisen datan luokat näytetään vaaka-akselilla, ja luokkien taajuus (tai suhteellinen taajuus tai prosenttimäärät) näkyy y-akselilla. Pystypalkki edustaa yleensä sen luokan taajuutta (tai suhteellista taajuutta tai prosenttimäärää), jonka korkeus on yhtä suuri kuin sen suuruus. Toisin kuin tavalliset pylväskaaviot, pylväät on sijoitettu koskettamaan toisiaan.
X-akselin muuttuja voi olla joko yksittäinen arvo ryhmitelty tai raja ryhmitelty. Yhden arvon ryhmittelyssä palkkeja merkitään havaintojen erillisillä arvoilla, jolloin jokainen arvo on keskitetty palkin alapuolelle. Rajaryhmittelyyn tai leikkauspisteiden ryhmittelyyn käytetään alarajojen rajoituksia (tai vastaavasti alaluokan leikkauspisteitä) palkkien merkitsemiseen. Tangon alla keskitettyjä luokkamerkkejä tai luokan keskipisteitä voidaan myös käyttää.
Yksi suurimmista eroista löytyy muuttujasta, jota käytetään X-akselilla. Histogrammissa muuttuja on kvantitatiivinen muuttuja ja voi olla joko jatkuva tai erillinen. Ja sitä voidaan käyttää edustamaan tietojoukkojen tiheysinformaatiota. Tässä tapauksessa x-akselilla käytetyt aikavälit voivat vaihdella toisistaan, ja y-akselilla taajuuden tiheys on merkitty. Jos X-akselin väli on 1, niin histogrammi on yhtä suuri kuin suhteellinen taajuuskaavio.
Mitä eroa on pylväskaavion ja histogrammin välillä??
• Ensinnäkin, histogrammi on kehitys pylväskaaviosta, mutta se ei ole identtinen pylväsdiagrammin kanssa. Histogrammit ovat eräänlainen pylväskaavio, mutta pylväsdiagrammit eivät ehdottomasti ole histogrammeja.
• Pylväsdiagrammeja käytetään kategorisen tai kvalitatiivisen datan piirtämiseen, kun taas histogrammeja käytetään kvantitatiivisen datan piirtämiseen, jolloin data-alueet on ryhmitelty lokeroihin tai väleihin.
• Pylväsdiagrammeja käytetään muuttujien vertailuun, kun taas histogrammeja käytetään muuttujien jakaumien näyttämiseen
• Pylväskaavioissa on välilyöntejä kahden palkin välillä, kun taas histogrammeissa ei ole välilyöntejä palkkien välillä. (Syynä on, että x-akseli pylväskaavioissa on diskreetti kategoriallinen arvo, kun taas histogrammeissa se on joko erillinen tai jatkuva kvantitatiivinen).
• Histogrammeja käytetään kuvaamaan muuttujan tiheyttä välein; tässä tapauksessa palkin pinta-ala edustaa muuttujan taajuutta.