Odporúčaná, 2024

Redakcia Choice

Rozdiel medzi skutočnou tabuľkou a tabuľkou dimenzií

Tabuľka faktov a Tabuľka dimenzií sú základnými faktormi na vytvorenie schémy . Záznam tabuľky faktov je kombináciou atribútov z rôznych tabuliek dimenzií. Informačná tabuľka pomáha používateľovi analyzovať obchodné rozmery, ktoré mu pomáhajú pri rozhodovaní o zlepšení svojho podnikania. Na druhej strane rozmerové tabuľky pomáhajú tabuľke faktov zhromažďovať rozmery, pod ktorými sa musia opatrenia prijať.

Bod, ktorý rozlišuje tabuľku skutočností a tabuľky dimenzií, spočíva v tom, že tabuľka dimenzií obsahuje atribúty, pri ktorých sa merania prijímajú v skutočnej tabuľke . Existujú aj niektoré ďalšie faktory, ktoré vytvárajú rozdiely medzi tabuľkou faktov a tabuľkou dimenzií a zobrazujú ich. Pozrime sa na porovnávacom grafe nižšie.

Porovnávacia tabuľka

Základ pre porovnanieFaktografická tabuľkaTabuľka dimenzií
základnéSkutočná tabuľka obsahuje meranie pozdĺž atribútov dimenzovanej tabuľky.Tabuľka dimenzií obsahuje atribúty, v ktorých tabuľka faktov vypočíta metriku.
Atribút a záznamyFaktová tabuľka obsahuje menej atribútov a viac záznamov.Tabuľka dimenzií obsahuje viac atribútov a menej záznamov.
Veľkosť tabuľkyTabuľka faktov rastie vertikálne.Tabuľka dimenzií rastie horizontálne.
kľúčSkutočná tabuľka obsahuje primárny kľúč, ktorý je zlučovaním primárnych kľúčov všetkých rozmerových tabuliek.Každá tabuľka dimenzií obsahuje primárny kľúč.
stvoreniaTabuľka faktov je možné vytvoriť len vtedy, keď sú dokončené tabuľky dimenzií.Najskôr je potrebné vytvoriť tabuľky dimenzií.
schémaSchéma obsahuje menej faktografických tabuliek.Schéma obsahuje viac číselných tabuliek.
atribútyInformačný stôl môže obsahovať údaje v číselnom aj textovom formáte.Tabuľka dimenzií obsahuje vždy atribúty v textovom formáte.

Definícia skutočnej tabuľky

Tabuľka skutočností je tabuľka, ktorá obsahuje merania pozdĺž atribútov tabuľky dimenzií. Môže obsahovať informácie na najnižšej možnej úrovni. Niektoré faktické tabuľky obsahujú iba súhrnné údaje nazývané agregovaná tabuľka faktov . Faktová tabuľka takmer obsahuje údaje s dátumom . Prediskutujeme vlastnosti tabuľky faktov.

Zlučiteľný kľúč
Tabuľka skutočností obsahuje zlučiteľný kľúč, ktorým je zlučovanie primárnych kľúčov všetkých rozmerových tabuliek. Zreťazená kľúčová tabuľka faktov musí jednoznačne identifikovať riadok v tabuľke faktov.

Dátové zrno
Zrnitosť údajov ukazuje, ako hlboko boli uložené merania v skutočnej tabuľke. Zrno dát musí byť na najvyššej možnej úrovni.

Doplnkové opatrenia
Atribúty tabuľky skutočností môžu byť plne aditívne alebo semia- aditívne . Plne aditívne opatrenia sú tie, ktoré možno ľahko zhrnúť do všetkých rozmerov v tabuľke. Napríklad quantity_ordered, je atribút, ktorý možno zhrnúť pre všetky dimenzie. Rovnako môžeme vyňať celkový quantity_order pre konkrétneho zákazníka, región, dátum, značku atď. Semi-aditívne opatrenia sú tie, ktoré možno zhrnúť podľa niektorých rozmerov tabuľky faktov, ale nie všetkých rozmerov. Rovnako ako nie je možné zhrnúť sumu v čase, pretože sa časom mení.

Rizikové údaje
Niekedy môžeme vidieť záznamy v skutočnosti tabuľky, ktorá má atribúty s nulovými opatreniami . Napríklad na dovolenku nemusí byť objednávka. Takže atribúty pre tento dátum budú mať nulové opatrenia. Na takéto záznamy nemusíme ukladať opatrenia, pretože neposkytujú žiadne informácie.

Degenerované rozmery
Niekedy sa môžete stretnúť s niektorými rozmermi v tabuľke faktov, ktoré vôbec nie sú aditívne. Napríklad číslo_objednávky, customer_id, nemôžete pridať tieto typy dimenzií. V prípade, že musíte v tomto mesiaci nájsť objednávku konkrétneho zákazníka; potom budete potrebovať identifikátor zákazníka, ktorý bude zodpovedať vášmu vyhľadávaniu. Tieto typy, ak atribúty alebo rozmery skutočnej tabuľky sa nazývajú Degenerovaný rozmer .

Definícia tabuľky dimenzií

Tabuľka dimenzií je kľúčovou súčasťou štartovacej schémy. Tabuľka dimenzií obsahuje atribúty, ktoré predstavujú rozmery, pozdĺž ktorých sa meranie vykoná v skutočnej tabuľke. Ďalej sa budeme zaoberať niektorými vlastnosťami tabuľky rozmerov.

Atribúty a kľúče
Každá tabuľka dimenzií musí mať primárny kľúč, ktorý jednoznačne identifikuje každý záznam tabuľky. Bežne sa zistí, že tabuľka dimenzií obsahuje mnoho atribútov. Preto sa zdá, že je široký, tj keď vytvoríte tabuľku dimenzií, zistíte, že sa šíri horizontálne .

Hodnoty atribútov
Hodnoty atribútov v tabuľke dimenzií sú zriedkavo číselné, väčšinou nájdete hodnoty v atribútoch v textovom formáte . Napríklad názov produktu, značka, kategória, podkategória atď.

Vzťah medzi atribútmi
Často si môžete všimnúť, že atribúty, ktoré narazíte do tabuľky dimenzií, nie sú priamo spojené. Podobne, Product_brand nesmie robiť nič s balíkom_databázu, ale oba by mohli byť atribúty tabuľky Dimenzia produktu.

normalizácie
Tabuľka dimenzií sa nemá normalizovať . Je to preto, že normalizácia tabuľky by vytvorila mnoho medzibankových tabuliek. Keď dotaz zoberie atribút z tabuľky dimenzií a obnoví merania pozdĺž tej tabuľky s faktami, musí prechádzať cez tie medzipolohy, ktoré sa stávajú neúčinnými. Rozmerové tabuľky preto nie sú normalizované.

Vŕtanie dole, prevrátenie
Atribúty tabuľky dimenzií umožňujú získať podrobnosti buď prechodom z vyššej úrovne agregovaných atribútov na atribúty nižšej úrovne. Napríklad, ak chcete nájsť celkový predaj v regióne, potom môžete rozvinúť, aby ste našli predaj podľa štátu, mesta, zipu. Môžete dokonca zrolovať, aby ste našli celkový predaj najprv zipsom, potom mestom a potom štátom.

Viacnásobná hierarchia
Rozmerová tabuľka často ponúka viaceré hierarchie. Napríklad máme tabuľku dimenzií produktu pre obchodný oddelenie. Teraz máme dve oddelenia marketingové a účtovné oddelenie.

Marketingové oddelenie rozoberá atribúty tabuľky dimenzií produktu v určitej hierarchii, aby získala merania pre tabuľku skutočností.

Na ostatných rukách oddelenie účtovníctva rozkúpi medzi atribútmi tabuľky rozmerov produktov v rôznych hierarchii, aby získalo merania pre skutočnú tabuľku.

Takže tabuľka dimenzií musí mať viaceré hierarchie alebo úroveň agregácie atribútov, aby používateľ mohol rozvinúť pozdĺž niektorej z viacerých hierarchií.

záznamy
Hoci tabuľka dimenzií má príliš veľa atribútov, má menej záznamov.

Kľúčové rozdiely medzi skutočnou tabuľkou a tabuľkou dimenzií

  1. Informačná tabuľka obsahuje meranie pozdĺž dimenzie / atribútov tabuľky dimenzií.
  2. Faktová tabuľka obsahuje viac záznamov a menej atribútov v porovnaní s tabuľkou kótov, pričom tabuľka dimenzií obsahuje viac atribútov a menej záznamov.
  3. Tabuľka veľkosti tabuľky skutočností stúpa vertikálne, zatiaľ čo veľkosť tabuľky tabuľky rozmerov rastie horizontálne.
  4. Každá tabuľka dimenzií obsahuje primárny kľúč na identifikáciu každého záznamu v tabuľke, zatiaľ čo faktová tabuľka obsahuje zlučiteľný kľúč, ktorý je kombináciou všetkých primárnych kľúčov všetkých tabuliek dimenzií.
  5. Tabuľka dimenzií musí byť zaznamenaná pred vytvorením faktovej tabuľky.
  6. Schéma obsahuje menej faktografických tabuliek, ale viac tabuliek dimenzií.
  7. Tabuľky atribútov v skutočnosti sú číselné aj textové, ale atribúty tabuľky dimenzií majú iba textové atribúty.

záver:

Obidva sú rovnako dôležité pre vytvorenie schémy, ale tabuľka dimenzií musí byť zaznamenaná pred skutočnou tabuľkou. Nakoľko nie je možné vytvoriť tabuľku skutočností s rozmermi von.

Top