Ten wpis należy do serii wpisów poświęconych architekturze hurtowni danych.
Tytuł dzisiejszego wpisu ukradłem Komandorowi McPig (temu z Muppet Show). Dziś opowiemy sobie pokrótce o jednej z najważniejszych kwestii, którą należy wziąć na warsztat we wczesnej fazie projektowania jakiejkolwiek hurtowni danych: ujednoliceniu wymiarów.
Zagadnienie to było już poruszane na tym blogu wcześniej, ale nie szkodzi. Ważne tematy trzeba utrwalać.
Wymiar jest elementem newralgicznym DW. Źle zaprojektowany wymiar będzie prowadził do niespójności danych, sprzyjał tworzeniu nowych silosów (a więc czegoś, czemu DW ma zapobiegać) a docelowo wygeneruje nam mnóstwo sfrustrowanych użytkowników.
Kluczowym aspektem dobrze zaplanowanego wymiaru jest jego ujednolicone rozumienie przez wszystkich użytkowników DW (taki ujednolicony wymiar nazywa się po angielsku conformed dimension)
Przydarzyło mi się kiedyś pracować w firmie zajmującej się obsługą inwestycji, w której pojęcie "fundusz" miało cztery różne znaczenia, w zależności od tego, do którego działu człowiek zwrócił się z prośbą o definicję. Końcem końców okazało się, że wszyscy mieli rację - do hurtowni trafiły dwa różne wymiary związane z funduszami, a oryginalna czworakość definicji wynikała z tego, że różne działy operowały na różnych poziomach logicznej hierarchii funduszy.
Powtórzę jeszcze raz, ponieważ jest to najważniejsza, najbardziej kluczowa sprawa w każdej hurtowni danych: zanim zabierzemy się za implementację kolejnego wymiaru w DW, upewnijmy się, że (1) dokładnie rozumiemy, co ów wymiar reprezentuje (w sensie operacji biznesowych) oraz (2) że wszyscy docelowi użytkownicy DW mają zgodny pogląd na to, co ów wymiar oznacza.
Bolesnym aspektem ujednolicania wymiarów jest to, że na początku sami możemy mieć błędne mniemanie na temat tego, co próbujemy zbudować. Musimy więc upewnić się, że podchodzimy do zagadnienia z elastycznym umysłem i pokorą. Będziemy musieli rozmawiać z mnóstwem ludzi, wykonać mnóstwo notatek, a następnie (być może przy wsparciu kolegów z działów biznesowych) utworzyć jednolitą definicję tego wymiaru, aby wreszcie potwierdzić ją na różnych poziomach hierarchii firmowej oraz - wisienka na torcie - przekonać wszystkich, że ta definicja jest jedyną słuszną, i że od tej pory mają używać naszej definicji zamiast tej, do której byli przyzwyczajeni od lat.
Ludzie nie cierpią zmieniać przyzwyczajeń, będą więc stawiać opór. Będzie dochodziło do konfliktów, które trzeba będzie rozwiązać (na ogół przekonując przełożonego - lub przełożonych skłóconych stron). Czasem trzeba iść w górę całkiem wysoko, zanim trafi się na kogoś odpowiednio władnego (a zarazem kompetentnego). Zagadnienie jest - niestety - mało techniczne, wymaga za to umiejętności rozumienia tego, co ludzie nam mówią, a także tego, czego nam nie mówią. Wymaga odrobiny dyplomacji. Nie da się uniknąć babrania w firmowej polityce. Tak naprawdę to żadna frajda - ale trzeba.
Niestety, nie ma jakiegoś uniwersalnego przepisu na ujednolicanie wymiarów w DW. Proces ów jest tak samo bolesny za pierwszym razem, jak też za setnym. No ale nikt nie mówił, że będzie łatwo...
Ten wpis zamyka część wstępną, ogólną, "przegadaną" serii. Począwszy od następnego wpisu będzie już "samo gęste", a więc zerkniemy sobie wreszcie - na razie tylko z lotu ptaka - na architekturę DW od strony technicznej.
Jeżeli chcesz do komentarza wstawić kod, użyj składni:
[code]
tutaj wstaw swój kod
[/code]
Jeżeli zrobisz literówkę lub zmienisz zdanie, możesz edytować komentarz po jego zatwierdzeniu.