Ero HBase ja Hive välillä

HBase ja Hive ovat molemmat Hadoop-pohjaisia ​​tietovarastorakenteita, jotka eroavat toisistaan ​​merkittävästi sen suhteen, kuinka ne tallentavat ja kyselytietoja. Valtavien web-pohjaisten tietojen hallinta ja käsittely on entistä vaikeampaa tavanomaisten tietokannan hallintatyökalujen avulla. Täältä HBase tulee kuvaan. HBase on edullinen valinta käsitellä suuria määriä dataa. Esimerkiksi, jos joudut suodattamaan valtavan joukon sähköpostiviestejä vedäksesi sen tarkastettavaksi tai muuhun tarkoitukseen, tämä on täydellinen käyttötapa HBase: lle. Hive puolestaan ​​on enemmän kuin perinteinen tietovarastoraportointijärjestelmä, joka toimii Hadoopin päällä. Hive tarjoaa SQL-tyyppisen kyselykielen, jonka avulla voit hakea Hadoopiin tallennettuja osittain jäsenneltyjä tietoja. Tämä vie tarpeettomia ponnistuksia joutua kirjoittamaan MapReduce-koodi. Vaikka sekä HBasea että Hiveä käytetään tietovarastoina jäsentämättömän tiedon tallentamiseksi, ne ovat erilaisia.

Mikä on Hbase?

HBase on avoimen lähdekoodin, ei-relaatiotietokannan hallintajärjestelmä, joka on inspiroitu Googlen Big Table -arkkitehtuuriin ja kirjoitettu Java-ohjelmaan. HBase on pohjimmiltaan sarakekeskeinen, hajautettu NoSQL-tietokanta, joka toimii Hadoopin hajautetun tiedostojärjestelmän (HDFS) päällä. Sen ovat suunnitelleet ja kehittäneet monet insinöörit Apache Software Foundation -säätiön puitteissa. Se istuu Apache Hadoopilla ja sitä saa virhesietoinen hajautettu tiedostorakenne, joka tunnetaan nimellä HDFS. Se tarjoaa tavan tallentaa harvat tietojoukot, jotka ovat yleisiä suurten tietojen käyttötapauksissa. Se mahdollistaa hajasaantitietojen nopean lukemisen suurista tietomääristä avainarvojen perusteella. Sitä ei kuitenkaan ole suunniteltu suorittamaan tietojen yhdistämistä.

Mikä on Hive?

Hive ei ole tarkalleen tietokanta, mutta Hadoopin huipulle rakennettu tietovarastopaketti. Pesää on erilainen tekniikka kuin HBase; se rakentaa datan joukkotaulukoita, jotka voidaan yhdistää, yhdistää ja kysyä käytettäessä HQL-nimistä kyselykieltä, jonka nimi on Hive Query Language (HQL) ja joka on hyvin samanlainen kuin SQL, jota käytetään suurten tietojen eräkäsittelyyn. Sen avulla voit kysyä Hadoop-tietokantaan tallennettua puolijärjestelmällistä tietoa, joka lopulta muuttuu MapReduce-työksi, suoritetaan joko paikallisesti tai hajautetussa MapReduce-klusterissa. Hive on pohjimmiltaan Hadoopin tietovarastojärjestelmä, joka helpottaa tietojen yhteenvetoa, tapauskohtaisia ​​kyselyjä ja Hadoopin kanssa yhteensopiviin tiedostojärjestelmiin tallennettujen suurten tietojoukkojen analysointia. Tietoja voidaan lukea ja kirjoittaa Hivestä ja HBase: sta ja päinvastoin. Sitä ei kuitenkaan voida käyttää tietojen reaaliaikaiseen käsittelyyn.

Ero HBase: n ja Hive: n välillä

tekniikka

- Vaikka HBase ja Hive ovat molemmat Hadoop-pohjaisia ​​tietovarastorakenteita, joita käytetään suurten tietomäärien tallentamiseen ja käsittelemiseen, ne eroavat toisistaan ​​merkittävästi sen suhteen, kuinka ne tallentavat ja kyselytietoja. HBase on pohjimmiltaan sarakkeeseen suuntautunut, hajautettu NoSQL-tietokanta, joka toimii Hadoopin hajautetun tiedostojärjestelmän (HDFS) päällä ja tarjoaa vikasietoisen tavan tallentaa harvat tietojoukot, jotka ovat yleisiä suurissa tiedonkäyttötapauksissa. Toisaalta Hive ei ole tarkalleen tietokanta, mutta Hadoopin huipulle rakennettu tietovarastopaketti. Pesä on enemmän kuin perinteinen tietovarastoraportointijärjestelmä.

Arkkitehtuuri

- HBase on NoSQL-tietokanta ja Googlen Big Table -arkkitehtuurin avoimen lähdekoodin toteutus, joka istuu Apache Hadoopilla ja jota saa vikasietoinen hajautettu tiedostorakenne, joka tunnetaan nimellä HDFS. Se on skaalautuva tallennusratkaisu, joka mahtuu käytännöllisesti loputtomaan määrään dataa. Se on tietojen tallennusarkkitehtuuri, jota käytetään jäsentämättömän tiedon tallentamiseen. Toisaalta Hive on SQL-moottori, joka on rakennettu HDFS: n päälle ja hyödyntää MapReducea sisäisesti, mikä mahdollistaa HDFS: ään tallennettujen tietojen kyselyn SQL: n kaltaisen kyselykielen, nimeltään HQL (Hive Query Language), kautta..

Käyttää

- HBase-tietokantaa käytetään halpahintaisten, joustavien ja helppohoitoisten laattakerrospalveluiden - Hadoop-pohjaisen maantieteellisen tietojärjestelmän (HBGIS) - rakentamiseen massiivisen tiedon tallennuksen mahdollistamiseksi. Se on levyllä oleva sarakkeiden tallennusmuoto, joka tarjoaa tavan tallentaa harvat tietojoukot, jotka ovat yleisiä suurten tietojen käyttötapauksissa. Se mahdollistaa hajasaantitietojen nopean lukemisen suurista tietomääristä avainarvojen perusteella. Toisaalta Hive on SQL-kyselyjen standardi Hadoopin tietojen petabateille ja tarjoaa SQL-tyyppisen kyselykielen, nimeltään HQL, Hadoop-klusteriin tallennettujen tietojen kyselyyn..

HBase vs. pesää: vertailukaavio

Yhteenveto

Vaikka HBase ja Hive ovat molemmat Hadoop-pohjaisia ​​tietovarastorakenteita, joita käytetään suurten tietomäärien tallentamiseen ja käsittelemiseen, ne eroavat toisistaan ​​merkittävästi sen suhteen, kuinka ne tallentavat ja kyselytietoja. HBase on sarakekeskeinen tietokannanhallintajärjestelmä, jota käytetään massiiviseen tietojen varastointiin. Se tarjoaa tavan säilyttää harvat tietojoukot, jotka ovat yleisiä useissa suurissa tiedonkäyttötapauksissa. Toisaalta Hive on enemmän kuin perinteinen tietovarastoraportointijärjestelmä, joka on rakennettu Hadoopin huipulle ja jota käytetään prosessointiin aikataulutöiden kautta ja sitten tulokset ladataan yhteenvetotyyppitaulukkoon, josta asiakassovellukset voivat edelleen kysyä..