Pozrite sa na rozdiel medzi získavaním údajov a skladovaním údajov pomocou porovnávacej tabuľky uvedenej nižšie.
Porovnávacia tabuľka
Základ pre porovnanie | Dolovanie údajov | Skladovanie údajov |
---|---|---|
základné | Dolovanie dát je proces získavania alebo extrakcie zmysluplných údajov z databázy / dátového skladu. | Dátový sklad je úložisko, kde sú informácie z viacerých zdrojov uložené pod jedinou schémou. |
Definícia dolovania údajov
Dolovanie údajov je proces objavovania vedomostí, ktoré ste nikdy neočakávali vo vašej databáze . Pomocou tradičného nástroja na vyhľadávanie môžete iba získať známe informácie z údajov. Ale Data mining vám poskytuje spôsob, ako získať skryté informácie z dát . Data mining extrahuje zmysluplné informácie z databázy, ktoré môžu byť použité pre rozhodovanie .
Zisťovanie vedomostí v databázach, označované ako KDD, vykazuje vzťah a štruktúru . Vzťah môže byť medzi dvoma alebo viacerými rôznymi objektmi, medzi atribútmi toho istého objektu. Vzor je ďalším výsledkom dolovania dát, ktoré zobrazuje pravidelnú a zrozumiteľnú postupnosť informácií, ktoré pomáhajú pri rozhodovaní.
Kroky, ktoré sa týkajú KDD, tj Zisťovanie vedomostí v databázach, možno najskôr zhrnúť do výberu dátových súborov, na ktorých je potrebné vykonať dolovanie dát. Nasleduje predspracovanie, ktoré zahŕňa odstránenie nekonzistentných údajov. Potom prichádza transformácia dát, kde sa dáta transformujú do formy vhodnej na dolovanie dát. Ďalej ide o dolovanie dát, tu sa algoritmy dolovania dát použijú na dáta. A nakoniec, interpretácia a hodnotenie, ktoré zahŕňajú extrakciu vzťahu alebo vzoru medzi dátami.
Spracovanie dát sa dobre hodí do prostredia dátového skladu, ktoré ukladá dáta agregovaným a zhrnutým spôsobom. Keďže sa dá ľahko zbierať dáta v dátovom sklade
Definovanie dátového skladovania
Data Warehouse je ústredné miesto, kde sa informácie zhromaždené z viacerých zdrojov ukladajú do jednej jednotnej schémy . Údaje sa spočiatku zhromažďujú, rôzne zdroje podniku sa potom vyčistia a transformujú a ukladajú do dátového skladu. Po zadaní údajov do dátového skladu zostane tam dlhý čas a dá sa k nim pristupovať.
Data Warehouse je perfektná kombinácia technológií, ako je dátové modelovanie, získavanie dát, správa dát, riadenie metadát, riadenie obchodov s vývojovými nástrojmi . Všetky tieto technológie podporujú funkcie ako extrakcia dát, transformácia dát, ukladanie dát, poskytovanie užívateľských rozhraní pre prístup k dátam .
Datový sklad nie je produkt alebo softvér, je to informačné prostredie, ktoré poskytuje informácie ako integrovaný pohľad na podnik. Môžete pristupovať k aktuálnym a historickým údajom podniku, ktoré pomáhajú pri rozhodovaní. Podporuje transakcie pre rozhodovanie bez ovplyvnenia operačných systémov. Je to flexibilný zdroj na získanie strategických informácií.
Kľúčové rozdiely medzi získavaním údajov a skladovaním údajov
- Existuje základný rozdiel, ktorý oddeľuje dolovanie dát a skladovanie dát, čo je dolovanie dát, je proces získavania zmysluplných údajov z veľkej databázy alebo dátového skladu. Datový sklad však poskytuje prostredie, v ktorom sa dáta ukladajú v integrovanej forme, ktorá zjednodušuje dolovanie dát a efektívnejšie získava dáta.
záver:
Dáta údajov možno vykonať iba vtedy, keď je dobre integrovaná veľká databáza, tj dátový sklad. Takže dátový sklad musí byť dokončený pred tým, ako sa dolovanie dát. Dátový sklad musí mať informácie v dobre integrovanej podobe, aby bolo možné získať poznatky efektívnym spôsobom.