Mis on Data Mining?

Suured ettevõtted teavad sinust rohkem kui kunagi varem ette kujutada - siin ongi kuidas

Andmete kaevandamine on suure hulga andmete analüüs, et leida mustreid ja teadmisi. Tegelikult on andmete kaevandamine tuntud ka andmete avastamiseks või teadmiste avastamiseks.

Andmete kaevandamine kasutab statistikat, masinõppe (ML), tehisintellekti (AI) ja arvukate andmete kogust (sageli andmebaasidest või andmekogudest), et tuvastada mustreid viisil, mis on võimalikult automatiseeritud ja kasulik.

Mida Data Mining kasutab?

Andmekaevandusel on kaks põhieesmärki: kirjeldus ja ennustus. Esiteks kirjeldab andmete kaevandamine andmeid ja teadmisi, mis on saadud andmete mustrite analüüsimisel. Teiseks kasutab andmehankimine tulevaste mudelite ennustamiseks tunnustatud andmemudelide kirjeldusi.

Näiteks kui teil on kulunud aega veebibrausil , et leida raamatuid erinevate taimede tüübi tuvastamiseks, logi selle veebisaidi stseenide taga töötavad andmekaevandusteenused teie profiiliga seotud otsingute kirjeldust. Kui te kaks nädalat hiljem uuesti sisse logite, kasutavad veebisaidi andmete kaevandamise teenust oma varasemate otsingute kirjeldusi oma praeguste huvide ennustamiseks ja pakuvad isikupärastatud ostunõuandeid, mis hõlmavad raamatuid taimede tuvastamise kohta.

Kuidas andmetöötlus töötab

Andmete kaevandamisel kasutatakse algoritme, juhtnööride komplekti, mis ütlevad arvutile või töötlevad ülesannet, et tuvastada erinevate andmete mustreid. Andmete kaevandamisel kasutatavad erinevad mustri äratundmise meetodid hõlmavad klastrite analüüsi, anomaalia tuvastamist, assotsiatsiooni õppimist, andmete sõltuvust, otsustuspuhke, regressioonimudeleid, klassifikatsioone, väljatõrjumise tuvastamist ja närvivõrke.

Kuigi andmete kaevandamist saab kasutada kõikide eri andmetüüpide mustrite kirjeldamiseks ja ennustamiseks, on paljudel inimestel kõige sagedamini kasutatav kasutamine, isegi kui nad seda ei mõista, kirjeldada ostuvalikute ja -käitumiste mustreid, et ennustada tõenäolist tulevase ostu otsused.

Näiteks, kas olete kunagi mõelnud, kuidas Facebook alati tundub teada, mida olete veebis otsinud ja näitab oma uudistevoogudes olevaid reklaame, mis on seotud teiste teie külastatud veebisaitide või teie veebiotsingutega? Facebooki andmete kaevandamine kasutab teie brauseris salvestatud teavet, mis jälgib teie tegevust, näiteks küpsiseid , koos oma teadmistega oma mustritest, mis põhinevad teie eelmisel Facebooki teenuse kasutamisel, et avastada ja ennustada tooteid ja pakkumisi, mis võivad teile huvi pakkuda.

Milliseid andmeid saab minna?

Sõltuvalt teenusest või poodist (füüsilised kauplused kasutavad ka andmekaevandust), võib teie ja teie mustrite kohta minna üllatavalt palju andmeid. Teie kohta kogutud andmed võivad sisaldada seda, millist tüüpi sõidukit sõidate, kus te elate, teie poolt reisitud kohti, tellitud ajakirju ja ajalehti ning kas olete abielus või mitte. Samuti saab see kindlaks teha, kas teil on lapsi, millised on teie hobid, milline bänd sulle meeldib, oma poliitilist tahet, seda, mida ostate veebis, mida ostate füüsilistes kauplustes (sageli kliendilohutusega seotud tasu kaartide kaudu) ja kõik andmed, mida jagate oma elust sotsiaalmeedias.

Näiteks jaemüüjad ja moespetsiifilised väljaanded, mis on suunatud teismelistele, kasutavad statistilisi andmeid sotsiaalmeediateenuste, nagu Instagram ja Facebook, andmete kohta, et ennustada moesuundeid, mis meelitatakse teismeliste ostjatele või lugejatele. Andmekaevandamise käigus avastatud teadmised võivad olla nii täpne, et mõned jaemüüjad võivad isegi prognoosida, kas naine võib olla rase, lähtudes ostuvalikute väga spetsiifilistest muutustest. Jaemüüja Target on teatanud, et on nii täpne, et prognoosida rasedust, mis põhineb ajaloo ostmise mudelitel, et ta saatis lapsele mõeldud kupongid nooremale leedile, andes talle oma raseduse saladuse enne, kui ta rääkis oma perekonnale.

Andmekaevandamine on kõikjal, kuid kauplused ja teenused kasutavad suurel hulgal teavet, mida avastatakse ja analüüsitakse meie ostuharjumuste, isiklike eelistuste, valikute, finantseerimise ja veebitegevuste kohta, eesmärgiga parandada klientide kogemusi.