DBMS vs. Data Mining
DBMS (Database Management System) on digitaalisten tietokantojen hallintaan tarkoitettu täydellinen järjestelmä, joka mahdollistaa tietokannan sisällön tallentamisen, datan luomisen / ylläpidon, haun ja muut toiminnot. Toisaalta Data Mining on tietotekniikan ala, joka käsittelee aiemmin tuntemattoman ja mielenkiintoisen tiedon poimimista raa'asta tiedosta. Yleensä Data Mining -prosessin tulona käytetty tieto tallennetaan tietokantoihin. Tilastotieteeseen taipuvaiset käyttäjät käyttävät Data Mining -sovellusta. He hyödyntävät tilastollisia malleja etsien tietojen piilotettuja malleja. Tiedon louhijat ovat kiinnostuneita löytämään hyödyllisiä suhteita eri tietoelementtien välillä, mikä on viime kädessä kannattavaa yrityksille.
DBMS
DBMS, jota kutsutaan joskus vain tietokannan hallintaohjelmaksi, on kokoelma tietokoneohjelmia, joka on tarkoitettu kaikkien järjestelmään (ts. Kiintolevyyn tai verkkoon) asennettujen tietokantojen hallintaan (ts. Organisointiin, varastointiin ja hakuun). Maailmassa on olemassa erityyppisiä tietokannanhallintajärjestelmiä, ja jotkut niistä on suunniteltu tiettyihin tarkoituksiin määritettyjen tietokantojen asianmukaiseen hallintaan. Suosituimmat kaupalliset tietokannanhallintajärjestelmät ovat Oracle, DB2 ja Microsoft Access. Kaikki nämä tuotteet tarjoavat keinoja jakaa erityyppisiä oikeuksia eri käyttäjille, minkä ansiosta DBMS-järjestelmää voi hallita keskitetysti yksi järjestelmänvalvoja tai jakaa useille eri henkilöille. Jokaisessa tietokannan hallintajärjestelmässä on neljä tärkeää elementtiä. Ne ovat mallinnuskieli, tietorakenteet, kyselykieli ja tapahtumien mekanismi. Mallinnuskieli määrittelee kunkin DBMS-järjestelmän ylläpitämän tietokannan kielen. Nykyään useita suosittuja lähestymistapoja, kuten hierarkia, verkko, relaatio ja objekti, ovat käytännössä. Tietorakenteet auttavat järjestämään tietoja, kuten yksittäisiä tietueita, tiedostoja, kenttiä ja niiden määritelmiä ja esineitä, kuten visuaalisia välineitä. Tietokyselykieli ylläpitää tietokannan turvallisuutta seuraamalla kirjautumistietoja, käyttöoikeuksia eri käyttäjille ja protokollia tietojen lisäämiseksi järjestelmään. SQL on suosittu kyselykieli, jota käytetään relaatiotietokannan hallintajärjestelmissä. Viimeinkin mekanismi, joka mahdollistaa transaktiot, auttaa samanaikaisuutta ja moninaisuutta. Tämä mekanismi varmistaa, että useat käyttäjät eivät muuta samaa tietuetta samanaikaisesti, pitäen siten tiedon eheyden taktisena. Lisäksi DBMS-järjestelmä tarjoaa myös varmuuskopioita ja muita palveluita.
Tietojen louhinta
Tiedon louhinta tunnetaan myös nimellä Tietojen löytäminen tiedoissa (KDD). Kuten edellä mainittiin, se on tietotekniikan felid, joka käsittelee aiemmin tuntemattoman ja mielenkiintoisen tiedon poimimista raa'asta tiedosta. Tietojen eksponentiaalisen kasvun takia, etenkin liiketoiminnan kaltaisilla aloilla, tiedonlouhinnasta on tullut erittäin tärkeä työkalu muuntaa tämä suuri tietojoukko yritystietoksi, koska kuvioiden manuaalinen poimiminen on näyttänyt mahdottomalta viime vuosikymmeninä. Sitä käytetään esimerkiksi nykyisin erilaisiin sovelluksiin, kuten sosiaalisen verkoston analyysiin, petosten havaitsemiseen ja markkinointiin. Tietojen louhinta käsittelee yleensä seuraavia neljää tehtävää: klusterointi, luokittelu, regressio ja yhdistäminen. Klusterointi on samanlaisten ryhmien tunnistaminen jäsentämättömästä tiedosta. Luokittelu on oppimissääntöjä, joita voidaan soveltaa uuteen tietoon, ja niihin sisältyy tyypillisesti seuraavat vaiheet: datan esikäsittely, mallinnuksen suunnittelu, oppimisen / ominaisuuden valinta ja arviointi / validointi. Regressio on sellaisten funktioiden löytäminen, joilla on mahdollisimman vähän virheitä datan mallintamiseen. Ja assosiaatio etsii suhteita muuttujien välillä. Tietojen louhintaa käytetään yleensä vastaamaan kysymyksiin, kuten mitkä ovat päätuotteita, jotka saattavat auttaa saamaan korkeaa voittoa ensi vuonna Wal-Martissa?
Mitä eroa on DBMS: n ja tiedon louhinnan välillä??
DBMS on täysimittainen järjestelmä digitaalisten tietokantojen pitämiseen ja hallitsemiseen. Tietojen louhinta on kuitenkin tietotekniikan tekniikka tai konsepti, joka käsittelee hyödyllisen ja aiemmin tuntemattoman tiedon erottamista raa'asta tiedosta. Useimmiten nämä raakatiedot tallennetaan erittäin suuriin tietokantoihin. Siksi tiedon kaivostoimijat käyttävät DBMS: n olemassa olevia toimintoja käsittelemään, hallitsemaan ja jopa käsittelemään raakadataa ennen tiedon louhintaprosessia ja sen aikana. Pelkkää DBMS-järjestelmää ei kuitenkaan voida käyttää datan analysointiin. Joissakin DBMS-järjestelmissä on kuitenkin tällä hetkellä sisäänrakennettu tietojen analysointityökaluja tai ominaisuuksia.