Tietovarastointi on järjestelmä, joka on suunniteltu tallentamaan ja järjestämään tietoja keskusvarastoissa, mukaan lukien tiedot muista lähteistä. Se on relaatiotietokantamallien liiketiedon ydinkonsepti, joka käyttää analyyttisiä tekniikoita integroidaksesi yritystiedot keskitetyyn tietokantaan.
Tietovarastoinnissa käytetään kahta yleistä arkkitehtomallia:
Molemmat ovat yleisiä moniulotteisia tietokantamalleja, joita käytetään suurten tietokantojen tarpeiden analysointia varten todellisissa tietovarastoissa.
Esitämme puolueettoman vertailun näiden kahden välillä ymmärtääksesi paremmin, mikä on parempi kuin toinen.
Se on yleisin ja laajimmin hyväksytty arkkitehtuurimalli, jota käytetään kehitettäessä tietovarastoja ja tietokarttoja, joissa tiedot on järjestetty tosiasioihin ja ulottuvuuksiin. Se on yksinkertaisin arkkitehtuurimalli, jossa yhtä tositaulukkoa käytetään viitaamaan moniulotteisiin taulukoihin, jäljittelemällä tähtikuviota.
Kuten nimestä voi päätellä, kaavio muistuttaa tähtiä, jonka keskellä on tositaulukko ja siitä säteilevät useita ulottuvuustaulukoita, jolloin saadaan tähtimainen malli.
Se tunnetaan myös nimellä Star Join Schema, ja se tallentaa kaikki ulottuvuuden määritteet yhdeksi denormalisoituun tietotaulukkoon, jotta voidaan nopeasti selata suuria moniulotteisia tietojoukkoja, jotka vastaavat nopeita kyselyn vastausaikoja.
Se on tähtikaavion laajennus, johon on lisätty toiminnallisuuksia. Toisin kuin tähtikaavio, lumihiutalekaavion mittataulukot normalisoidaan useisiin liittyviin taulukoihin.
Arkkitehtoninen malli edustaa loogista taulukkojärjestelyä monien välisissä suhdehierarkioissa, joissa useita ulottuvuustaulukoita normalisoidaan alaulotteisiin taulukoihin, jotka muistuttavat lumihiutalemaista mallia, tästä myös nimi.
Se on monimutkaisempi versio tähtijärjestelmästä, jossa on enemmän liittymiä mittataulukoiden välillä, mikä vastaa hitaasta käsittelyajasta datan noutamiseen, mikä tarkoittaa hitaita kyselyn vastausaikoja. Se minimoi datan redundanssin, mikä puolestaan parantaa kyselyn suorituskykyä.
Suhteellisissa tietokannoissa tähtikaavio on yksinkertaisin arkkitehtuurimalli, jota käytetään tietovarastojen ja moniulotteisten tietokarttojen kehittämiseen. Kuten nimestä voi päätellä, malli muistuttaa tähtiä, jonka pisteet säteilevät keskustasta, mikä tarkoittaa, että tositaulukko on keskipiste ja pisteet ovat mittataulukoita. Kuten muutkin ulottuvuusmallit, se koostuu tiedoista tosiasioiden ja ulottuvuuksien muodossa. Lumihiutalekaavio on sitä vastoin monimutkaisempi arkkitehtomalli, joka viittaa moniulotteiseen tietokantaan, jossa on looginen taulukkojen asettelu lumihiutaleen muodossa..
Lumihiutalekaavio on melko samanlainen kuin tähtikaavio paitsi, että siinä voi olla useampia kuin yksi mittataulukko, jotka normalisoidaan edelleen useiksi toisiinsa liittyviksi taulukoiksi, joihin viitataan alidimensiotaulukoiksi. Se edustaa useita suhteitasoja, jotka haarautuvat lumihiutalekuvioksi. Tähtikaavio tallentaa kuitenkin kaikki siihen liittyvät ulottuvuuden määritteet yhdeksi denormalisoituun mittataulukkoksi, mikä helpottaa yksinkertaisempien kyselyiden ymmärtämistä ja käsittelemistä.
Mittataulukko ei voi sisältää päällekkäisiä rivejä relaatiotietokantamalleissa yksinkertaisesti siitä, että se voi luoda epäselvyyksiä haussa. Jokaisessa taulukossa tulisi olla sarake tai sarakeyhdistelmä, jota kutsutaan ensisijaiseksi avaimeksi ja joka yksilöi kaikki taulukkotiedot. Vieras avain on sarake tai sarakeryhmä, joka tarjoaa linkin kahden taulukon välillä. Tähtikaaviossa jokaisessa ulottuvuustaulussa on pääavain, joka liittyy tositaulukon vieraaseen avaimeen. Lumihiutalekaavion yrityshierarkiaa edustaa ensisijaisen avaimen / vieraan avaimen suhde mittataulukoiden välillä.
Keskeinen ero kahden relaatiotietokantamallin välillä on normalisointi. Tähtikaavion mittataulukoita ei normalisoida, mikä tarkoittaa, että liiketoimintamalli käyttää suhteellisen enemmän tilaa mittataulukoiden tallentamiseen ja enemmän tilaa tarkoittaa redundanttisempia tietueita, jotka lopulta aiheuttaisi epäjohdonmukaisuutta. Lumihiutalekaavio puolestaan minimoi datan redundanssin, koska mittataulukot normalisoidaan, mikä vastaa paljon vähemmän tarpeettomia tietueita. Liiketoimintahierarkia ja sen ulottuvuudet säilyvät vertailuherkkyyden avulla, eli suhteet voidaan päivittää itsenäisesti tietovarastoissa.
Tähtikaaviolla on vähemmän liittymiä ulottuvuustaulukon ja tietotaulukon välillä verrattuna lumihiutalekaavioon, jossa on useita liitoksia, mikä vastaa vähemmän kyselyn monimutkaisuudesta. Koska tähtikaavion mitat on linkitetty keskeisen tosiasiataulukon kautta, sillä on selkeät liittymispolut, jotka tarkoittavat nopeita kyselyvastausaikoja ja nopea vasteaika tarkoittaa parempaa suorituskykyä. Lumihiutalemallissa on suurempi liittymisten lukumäärä, joten pidemmät kyselyvastausajat, mikä johtaa monimutkaisempiin kyselyihin, jotka lopulta vaarantavat suorituskyvyn.
Molemmat ovat yleisimpiä ja laajemmin hyväksyttyjä arkkitehtomalleja, joita käytetään tietokantavarastojen ja tietokarttojen kehittämiseen. Jokaisella liiketoimintamallilla on kuitenkin kohtuullinen osuus eduistaan ja haitoistaan. Tähtikaavio on yksinkertaisin moniulotteinen malli, jota käytetään tietojen järjestämiseen tosiasioiksi ja ulottuvuuksiksi, mutta se on ihanteellinen kehitettäessä tietokarttoja, joihin liittyy vähemmän monimutkaisia suhteita. Lumihiutalekaavio on looginen esitys taulukoista moniulotteisessa tietokannassa, jossa mitat tallennetaan aladimension taulukoihin. Suurin ero näiden kahden välillä on normalisointi. Lumihiutalekaavion mittataulukot normalisoidaan kokonaan useiksi hakutaulukoiksi, kun taas tähtikaaviossa mittataulukot denormalisoidaan yhdeksi keskeiseksi tositaulukkoksi.