Data Mining vs OLAP
Sekä tiedon louhinta että OLAP ovat kaksi yleistä Business Intelligence (BI) -teknologiaa. Liiketoimintatiedolla tarkoitetaan tietokonepohjaisia menetelmiä hyödyllisen tiedon tunnistamiseksi ja poimimiseksi yritystiedoista. Tietojen louhinta on tietotekniikan ala, joka käsittelee kiinnostavien kuvioiden poimimista suurista tietosarjoista. Se yhdistää monia menetelmiä tekoälyn, tilastojen ja tietokantojen hallinnan kautta. OLAP (online analytical processing), kuten nimestä voi päätellä, on kokoelma tapoja kysyä moniulotteisia tietokantoja.
Tiedon louhinta tunnetaan myös nimellä Tietojen löytäminen tiedoissa (KDD). Kuten edellä mainittiin, se on tietotekniikan ala, joka käsittelee aiemmin tuntemattoman ja mielenkiintoisen tiedon poimimista raa'asta tiedosta. Tietojen eksponentiaalisen kasvun takia, etenkin liiketoiminnan kaltaisilla aloilla, tiedonlouhinnasta on tullut erittäin tärkeä työkalu muuntaa tämä suuri tietojoukko yritystietoksi, koska kuvioiden manuaalinen poimiminen on näyttänyt mahdottomalta viime vuosikymmeninä. Sitä käytetään esimerkiksi nykyisin erilaisiin sovelluksiin, kuten sosiaalisen verkoston analyysiin, petosten havaitsemiseen ja markkinointiin. Tietojen louhinta käsittelee yleensä seuraavia neljää tehtävää: klusterointi, luokittelu, regressio ja yhdistäminen. Klusterointi on samanlaisten ryhmien tunnistaminen jäsentämättömästä tiedosta. Luokittelu on oppimissääntöjä, joita voidaan soveltaa uuteen dataan ja joihin sisältyy tyypillisesti seuraavat vaiheet: datan esikäsittely, mallinnuksen suunnittelu, oppiminen / ominaisuuden valinta ja arviointi / validointi. Regressio on sellaisten funktioiden löytäminen, joilla on mahdollisimman vähän virheitä datan mallintamiseen. Ja assosiaatio etsii suhteita muuttujien välillä. Tietojen louhintaa käytetään yleensä vastaamaan kysymyksiin, kuten mitkä ovat päätuotteita, jotka saattavat auttaa saamaan korkeaa voittoa ensi vuonna Wal-Martissa.
OLAP on luokka järjestelmiä, jotka tarjoavat vastauksia moniulotteisiin kyselyihin. Tyypillisesti OLAP: ää käytetään markkinointiin, budjetointiin, ennustamiseen ja vastaaviin sovelluksiin. Sanomattakin on selvää, että OLAP-tietokannat on määritetty monimutkaisille ja tapauskohtaisille kyselyille nopeaa suorituskykyä ajatellen. Tyypillisesti matriisia käytetään osoittamaan OLAP: n lähtö. Rivit ja sarakkeet muodostuvat kyselyn mittojen perusteella. He käyttävät usein yhdistelmämenetelmiä useisiin taulukoihin saadakseen yhteenvedot. Sitä voidaan käyttää esimerkiksi selvittämään tämän vuoden myynti Wal-Martissa viime vuoteen verrattuna? Mikä on ennakoitu seuraavan vuosineljänneksen myynnistä? Mitä suuntauksesta voidaan sanoa tarkastelemalla prosentuaalista muutosta?
Vaikka on selvää, että tiedon louhinta ja OLAP ovat samankaltaisia, koska ne toimivat tiedolla älykkyyden hankkimiseksi, tärkein ero johtuu siitä, kuinka ne toimivat tiedossa. OLAP-työkalut tarjoavat moniulotteisen data-analyysin ja ne tarjoavat yhteenvedot tiedoista, mutta toisaalta tietojen louhinta keskittyy tietojoukon suhteisiin, malleihin ja vaikutuksiin. Se on OLAP-sopimus aggregoinnista, joka laskee datan toiminnan "lisäyksen" kautta, mutta tiedon louhinta vastaa "jakoa". Toinen huomattava ero on, että vaikka tiedon louhintatyökalut mallintavat tietoja ja palauttavat toimitettavat säännöt, OLAP suorittaa vertailu- ja kontrastitekniikoita liiketoiminnan ulottuvuuksissa reaaliajassa.