Jednoducho povedané, dátový mart je dátový sklad s obmedzeným rozsahom a ktorého dáta sa dajú získať sumarizáciou a výberom dát z dátového skladu alebo pomocou odlišných extraktov, procesov transformácie a načítania zo zdrojového dátového systému.
Porovnávacia tabuľka
Základ pre porovnanie | Dátový sklad | Data Mart |
---|---|---|
základné | Dátový sklad je nezávislý od aplikácie. | Data mart sú špecifické pre aplikáciu systému podpory rozhodovania. |
Typ systému | centralizovaná | decentralizované |
Forma údajov | detailné | zhrnúť |
Použitie denormalizácie | Údaje sú mierne denormalizované. | Údaje sú veľmi denormalizované. |
Dátový model | Top-down | Bottom-up |
príroda | Flexibilná, dátovo orientovaná a dlhá životnosť. | Reštriktívny, projektovo orientovaný a krátky život. |
Typ použitého schémy | Fakt konštelácia | Hviezda a snehová vločka |
Jednoduchá výstavba | Je ťažké stavať | Jednoduché budovanie |
Definícia dátového skladu
Termínom " dátový sklad" sa rozumie časový variant, objektovo orientovaný, netlačiteľný a integrovaný súbor údajov, ktoré napomáhajú rozhodovaciemu procesu riadenia. Alternatívne je to úložisko informácií zhromaždených z viacerých zdrojov, uložených v zjednotenej schéme, na jedinom mieste, ktoré umožňuje integráciu rôznych aplikačných systémov. Po zhromaždení týchto údajov sa dlhodobo ukladá, preto má dlhú životnosť a umožňuje prístup k historickým informáciám.
V dôsledku toho dátový sklad poskytuje používateľovi jediné integrované rozhranie s údajmi, prostredníctvom ktorých môže používateľ ľahko zapisovať otázky na podporu rozhodovania. Datový sklad pomáha pri premenách údajov na informácie. Navrhovanie dátového skladu zahŕňa prístup zhora nadol.
Zhromažďuje informácie o subjektoch, ktoré pokrývajú celú organizáciu, ako sú zákazníci, predaj, aktíva, predmety, a preto je rozsah celého podniku. Vo všeobecnosti sa v ňom používa schéma konštelácie, ktorá pokrýva širokú škálu predmetov. Datový sklad nie je statickou štruktúrou a stále sa vyvíja .
Definícia údajov Mart
Dátový mart môže byť nazvaný ako podmnožina dátového skladu alebo podskupiny firemných údajov, ktoré zodpovedajú určitému súboru používateľov. Dátový sklad zahŕňa niekoľko oddelení a logické dátové marts, ktoré musia byť pretrvávajúce v ich dátovej ilustrácii, aby sa zabezpečila robustnosť dátového skladu. Dátový mart je súbor tabuliek, ktoré sa sústreďujú na jednu úlohu, ktorá je navrhnutá pomocou prístupu zdola nahor.
Keďže schéma hviezda a snehová vločka sú smerované k modelovaniu jediného subjektu, to je dôvod, prečo sú tieto bežne používané v dátovom obchode. Aj keď schéma hviezdy je viac populárna ako schéma snehovej vločky. V závislosti od zdroja údajov môžu byť databázové marts rozdelené do dvoch typov: závislých a nezávislých dátových mart.
Kľúčové rozdiely medzi dátovým skladom a dátami Mart
- Datový sklad je nezávislý od aplikácie, zatiaľ čo dátový mart je špecifický pre aplikáciu systému podpory rozhodovania.
- Údaje sú uložené v jednom centrálnom úložisku v dátovom sklade. Na rozdiel od toho dátové dáta ukladajú údaje v užívateľskej oblasti decentralizovane .
- Datový sklad obsahuje podrobnú formu údajov. Na rozdiel od toho údaje o dátume obsahujú zhrnuté a vybrané údaje.
- Údaje v dátovom sklade sa mierne denormalizujú, zatiaľ čo v prípade Data mart sa výrazne denormalizuje.
- Konštrukcia dátového skladu zahŕňa prístup zhora nadol . Naopak, pri konštruovaní údajov sa používa prístup zdola nahor .
- Datový sklad je flexibilný, orientovaný na informácie a dlhodobo existujúci charakter. Naopak, dátový mart je obmedzujúci, projektovo orientovaný a má kratšiu existenciu.
- Skutočná konštelačná schéma sa zvyčajne používa na modelovanie dátového skladu, zatiaľ čo v dátovej mart hviezdnej schéme je populárnejšia.
záver
Data warehouse poskytuje podnikové zobrazenie, jednotný a centralizovaný úložný systém, vlastnú architektúru a nezávislosť aplikácií, zatiaľ čo Data mart je podmnožinou dátového skladu, ktorý poskytuje decentralizované úložisko. Keďže je dátový sklad veľmi veľký a integrovaný, má vysoké riziko zlyhania a ťažkosti s jeho budovaním. Na druhej strane je dátový mart ľahko stavať a súvisiace riziko poruchy je tiež menej, ale dáta mart by mohli byť fragmentované.