Luokatiedot vs. numeeriset tiedot
Tiedot ovat tosiseikkoja tai tietoja, jotka on kerätty viittausta tai analysointia varten. Usein nämä tiedot kerätään asianomaisen aiheen ominaisuutena. Tämä ominaisuus voi vaihdella toisistaan, joten tätä vaihtelevaa ominaisuutta voidaan pitää muuttujana. Muuttujat voivat olettaa eri muotoja arvoja ja nämä ovat luontaisia kerätyssä tiedossa.
Muuttujat voivat olla joko laadullisia tai määrällisiä; ts. jos muuttuja on kvantitatiivinen, vastaukset ovat numeroita ja mitatun ominaisuuden suuruus voidaan ilmaista tietyllä tarkkuudella. Toinen tyyppi, laadulliset muuttujat mittaavat laadullisia ominaisuuksia, eikä muuttujien olettamia arvoja voida antaa koon tai suuruuden perusteella. Itse muuttujat tunnetaan kategorisina muuttujina ja kategorisen muuttujan avulla kerätyt tiedot ovat kategorisia tietoja.
Lisätietoja numeerisista tiedoista
Numeerinen data on pohjimmiltaan muuttujasta saatua kvantitatiivista tietoa, ja arvolla on koko- / suuruusmitta. Saadut numeeriset tiedot jaotellaan edelleen vielä kolmeen luokkaan Stanley Smith Stevensin kehittämän teorian perusteella. Numeerinen data voi olla joko ordinaarinen, intervalli tai suhde. Tietotyyppi määritetään arvojen mittausmenetelmällä, ja tyypit tunnetaan mittaustasoina.
Henkilön paino, kahden pisteen välinen etäisyys, lämpötila ja kaluston hinta ovat esimerkkejä numeerisista tiedoista.
Tilastoissa suurin osa menetelmistä on johdettu numeerisen datan analysoimiseksi. Kuvailevia perustilastoja ja regressiota sekä muita päätelmämenetelmiä käytetään pääasiassa numeerisen datan analysointiin.
Lisätietoja kategoriallisista tiedoista
Kategorinen tieto on laadullisen muuttujan, usein luvun, sanan tai symbolin, arvoja. Ne tuovat esiin tosiasian, että tarkasteltavana olevassa tapauksessa muuttuja kuuluu johonkin käytettävissä olevista vaihtoehdoista. Siksi ne kuuluvat yhteen luokkaan; siis nimi kategorinen.
Henkilön poliittinen kuuluvuus, henkilön kansallisuus, ihmisen suosikkiväri ja potilaan veriryhmä ovat laadullisia ominaisuuksia. Joskus numero voidaan saada kategorisena arvona, mutta luku itsessään ei edusta mitatun ominaisuuden suuruutta. Postinumero on yksi esimerkki.
Kaikki kategoriset arvot kuuluvat myös nimelliseen tietotyyppiin, joka on toinen mittaustasoihin perustuva tyyppi. Kategorisen datan analysointimenetelmät eroavat numeerisen datan menetelmistä, mutta periaate voi olla sama.
Mitä eroa on kategorisilla ja numeerisilla tiedoilla??
• Numeerinen tieto on kvantitatiiviselle muuttujalle saatuja arvoja, ja sillä on muuttujan kontekstiin liittyvä suuruusaste (siksi ne ovat aina numeroita tai symboleita, joilla on numeerinen arvo). Luokatiedot ovat arvoja, jotka on saatu laadulliselle muuttujalle; kategorisilla datanumeroilla ei ole merkitystä.
• Numeerinen data kuuluu aina joko ordinaariseen, suhde- tai välityyppityyppiin, kun taas kategorinen data kuuluu nimityyppiin.
• Kvantitatiivisen datan analysointimenetelmät eroavat kategorialliselle tiedolle käytetyistä menetelmistä, vaikka periaatteet ovat samat, ainakin sovelluksella on merkittäviä eroja.
• Numeerista tietoa analysoidaan tilastollisilla menetelmillä kuvaavissa tilastoissa, regressiossa, aikasarjoissa ja monissa muissa.
• Luokatiedoissa käytetään yleensä kuvaavia menetelmiä ja graafisia menetelmiä. Joitakin ei-parametrisia testejä käytetään myös.