lad_danych_ankieta

Ład Danych – Pierwsze Kroki

Znaczenie Ładu Danych w Organizacji

O co chodzi z tym Ładem Danych? Wiele osób nie do końca zdaje sobie sprawę, czym jest Ład Danych, a pytanie o jego wdrożenie często spotyka się z niewielkim odzewem. Jeśli na sali znajdzie się sto osób, zapewne tylko kilka z nich podniosłoby rękę, deklarując, że w ich organizacji wdrożono Ład Danych.

W rzeczywistości każda organizacja, mniej lub bardziej świadomie, wdrożyła już pewne elementy Ładu Danych. Dane są gromadzone, przechowywane, przetwarzane oraz udostępniane – to wszystko to elementy Ładu Danych. Różnice pojawiają się jednak w sposobie realizacji tych działań i świadomości ich podejmowania.

Ważnym pytaniem staje się więc nie tyle „Kto wdrożył Ład Danych?”, lecz „kto wdrożył Ład Danych świadomie?”.

W dużym uproszczeniu Ład Danych (ang. Data Governance) wskazuje kierunki i zadania, które należy wykonać, a dopiero później zająć się ich realizacją , czyli Zarządzaniem Danymi (ang. Data Management). Biorąc pod uwagę szeroki zakres zagadnień objętych Ładem Danych, pojawia się pytanie: od czego zacząć porządkowanie i udoskonalanie tego, co już w organizacji istnieje?

Katalog, Słownik i Glosariusz Danych: Rola w Zarządzaniu Informacją

Katalog Danych – Standaryzacja

Pierwszym krokiem w sytuacji rozproszenia wielu źródeł danych powinno być ich skatalogowanie oraz nadanie im odpowiedniego kontekstu. Katalog Danych (ang. Data Catalog) to scentralizowana i uporządkowana baza wiedzy o wykorzystywanych w organizacji danych. Zawiera ona tzw. „dane o danych” (metadane), a nie same dane – obejmuje logiczną strukturę danych (schematy, tabele, kolumny), a także informacje o lokalizacji, właścicielu, zasadach dostępu, osobie odpowiedzialej za aktualność, źródło pochodzenia, format czy typ danych.

Katalog Danych stanowi kluczowy element w procesie porządkowania informacji w organizacji. Jego zadaniem jest nie tylko rejestracja zbiorów danych, ale także wskazanie źródeł ich pochodzenia. Dzięki temu możliwe jest ustalenie, czy dane pochodzą ze źródeł zewnętrznych, czy też są efektem przesyłania i transformacji pomiędzy wewnętrznymi bazami danych. Istotne jest również określenie celu wykorzystania danych — czy służą one jako podstawa do tworzenia raportów czy stanowią źródło dla innych zbiorów lub baz danych. Umożliwia to śledzenie drogi danych od pierwotnego źródła aż po miejsce ich faktycznego użycia.

Budowa Katalogu Danych zwykle rozpoczyna się od najczęściej używanych lub najważniejszych zbiorów, co ułatwia efektywne zarządzanie całym procesem.

Słownik Danych – Techniczne Opisanie Zasobów

Słownik Danych (ang. Data Dictionary) to uporządkowany zbiór informacji technicznych o wszystkich elementach danych w danej bazie. Każdy składnik posiada własną definicję oraz zestaw atrybutów, takich jak typ, dopuszczalne wartości czy szczegółowy opis. Słownik pełni rolę technicznego przewodnika, wprowadzając jednolity standard opisu danych i wspierając ich efektywne wykorzystanie.

Glosariusz – Ujednolicenie Terminologii

Kolejnym etapem jest stworzenie Glosariusza, który pozwala na ujednolicenie rozumienia pojęć stosowanych w organizacji oraz powiązanie ich z konkretnymi danymi. Umożliwia przypisanie pojęć biznesowych do wybranych tabel, kolumn czy raportów. Słownik pojęć, wraz z synonimami i akronimami, zapobiega nieporozumieniom komunikacyjnym między pracownikami. Przykładowo, pojęcie „klient” może mieć różne znaczenie dla pracownika urzędu obsługującego społeczność lokalną oraz dla specjalisty IT, dla którego „klient” oznacza urządzenie lub program wysyłający żądania do serwera.

Wspólna Rola Katalogu, Słownika i Glosariusza

Katalog Danych, Słownik Danych oraz Glosariusz wspólnie przyczyniają się do prawidłowego opisu i nadania kontekstu posiadanym danym. Dzięki nim zestawy danych przestają być jedynie zbiorami tabel i kolumn, a stają się zasobem, który jest bardziej zrozumiały i użyteczny dla użytkowników organizacji.

https://amanranjanverma.medium.com/business-glossary-data-dictionary-and-data-catalog-5eaf0e3ab9b3

Rola zespołu Ładu Danych

Nad całością podejmowanych działań powinien czuwać zespół Ładu Danych. Na początek, szczególnie w mniejszych organizacjach lub na początkowych etapach wdrożenia, zespół ten może być reprezentowany nawet przez jedną, konkretną osobę. Jej zadaniem jest zapewnienie spójności podejmowanych działań, kontrola nad procesami katalogowania i standaryzacji opisu danych, a także czuwanie nad prawidłowym wykorzystywaniem zasobów informacyjnych w organizacji.

Katalog Danych i Co Dalej?

Skatalogowanie danych oraz stworzenie Glosariusza, podobnie jak ich późniejsze utrzymanie, należy traktować jako proces, a nie jednorazowy projekt. Działania te powinny mieć charakter ciągły oraz podlegać regularnej weryfikacji i aktualizacji, co pozwala zapewnić ich bieżącą przydatność i dostosowanie do zmieniających się potrzeb organizacji.

Po zakończeniu procesu katalogowania i opisywania danych, kolejnymi krokami mogą być działania mające na celu dalsze uporządkowanie i optymalizację zarządzania danymi w organizacji. Poniżej przedstawiono obszary, które warto uwzględnić:

  • Zarządzanie Danymi Podstawowymi (ang. Master Data) – obejmuje identyfikację i uporządkowanie najważniejszych danych kluczowych dla działalności jednostki, takich jak informacje o mieszkańcach czy infrastrukturze.
  • Zarządzanie Danymi Referencyjnymi (ang. Reference Data) – polega na organizacji i kontroli zbiorów danych, które mają charakter referencyjny, np. kody pocztowe czy klasyfikacje działalności.
  • Poprawa Jakości Danych – obejmuje działania zmierzające do zapewnienia spójności i poprawności danych wykorzystywanych w organizacji.
  • Automatyzacja procesów – poprawia efektywność oraz ogranicza ryzyko błędów podczas gromadzenia, łączenia oraz aktualizowania danych.
  • Bezpieczeństwo Danych – wdrożenie mechanizmów i procedur mających na celu ochronę danych przed nieuprawnionym dostępem, utratą czy niepożądanymi modyfikacjami.
  • Budowa Produktów Danych (ang. Data Products) – tworzenie zorganizowanych zestawów danych, które mogą być wykorzystywane do realizacji konkretnych celów biznesowych lub operacyjnych.
  • Zarządzanie zbiorami danych dla potrzeb rozwoju rozwiązań w oparciu o sztuczną inteligencję (ang. AI Governance) – przygotowanie i kontrola zbiorów danych wykorzystywanych do projektowania, trenowania i wdrażania rozwiązań opartych na sztucznej inteligencji.

Warto mieć świadomość, że nie wszystkie etapy będą przebiegały zgodnie z założeniami, dlatego kluczowe jest uzbrojenie się w cierpliwość i wytrwałość. Celem nadrzędnym pozostaje stopniowe odzyskiwanie i wzmacnianie kontroli nad Ładem Danych, który – jak wcześniej wspomniano – w pewnej formie jest już wdrożony w organizacji.

Narzędzia wspierające Ład Danych

Dobór odpowiednich narzędzi technologicznych do zarządzania Ładem Danych zależy przede wszystkim od rozmiaru jednostki organizacyjnej oraz jej rzeczywistych potrzeb. Na rynku dostępny jest szeroki wachlarz rozwiązań, począwszy od prostych narzędzi służących do katalogowania danych, aż po zaawansowane systemy umożliwiające kompleksową realizację niemal wszystkich aspektów związanych z Ładem Danych.

Analiza potrzeb i wybór rozwiązania

Kluczowym elementem wdrażania narzędzi jest precyzyjne określenie faktycznych potrzeb organizacji. Ważne jest, aby wybrać takie rozwiązanie, które najlepiej wpisuje się w te potrzeby. Często zdarza się, że zakupione narzędzie przewyższa aktualne wymagania, ponieważ zakłada się, że „będziemy rozwijać Ład Danych”. Jednak w szczególności mniejsze jednostki powinny rozważyć wdrożenie prostszego i tańszego rozwiązania, pozwalającego na zbudowanie podstawowej kultury zarządzania danymi. Poznanie rzeczywistych potrzeb umożliwi w przyszłości bardziej świadomy wybór kolejnych narzędzi lub rozbudowę już wdrożonego systemu o dodatkowe moduły.

Elastyczność i interoperacyjność rozwiązań

Nawet w przypadku konieczności zmiany lub rozbudowy narzędzia, większość dotychczas wykonanych prac można przenieść do nowego systemu lub zintegrować z nowymi funkcjonalnościami. Standardy wymiany danych pomiędzy różnymi rozwiązaniami dostępnymi na rynku są często ujednolicone, co umożliwia współpracę np. Katalogu Danych jednej firmy z narzędziem do Jakości Danych innego producenta.

Strategia rozwoju narzędzi

Zamiast stosować zbyt rozbudowane i kosztowne rozwiązania na początkowym etapie, warto rozważyć stopniową rozbudowę narzędzi, odpowiadającą rzeczywistemu rozwojowi organizacji. Analogicznie do strategii kraba pustelnika, który zmienia skorupę dopiero wtedy, gdy przestaje się w niej mieścić, tak i organizacja powinna dostosowywać swoje narzędzia technologiczne do aktualnych potrzeb i możliwości, zamiast „strzelać do komara z armaty”.

https://pl.wikipedia.org/wiki/Pustelniki_(skorupiaki)
_MG_0711

Warszawa stolicą zarządzania danymi: triumf wiedzy i innowacji podczas DAMA Day Warsaw

18 września 2025 roku Warszawa zamieniła się w prawdziwe centrum polskiej społeczności data management. W przestrzeniach Cambridge Innovation Center odbyła się konferencja DAMA Day Warsaw, organizowana przez DAMA Poland Chapter, całodniowe wydarzenie poświęcone wszystkim najważniejszym aspektom zarządzania danymi, ich jakości, ochrony prywatności i roli w rozwoju sztucznej inteligencji.

Od samego rana uczestnicy tłumnie przybywali na miejsce, by odebrać materiały konferencyjne, spotkać znajomych z branży i porozmawiać z organizatorami. Oficjalne otwarcie wydarzenia poprowadzili Peter Aiken, prezes DAMA International, oraz Piotr Pietrzyk, prezes DAMA Poland Chapter. Podczas wystąpienia inauguracyjnego podkreślili, że dane stały się jednym z najważniejszych zasobów współczesnych organizacji, a umiejętność ich właściwego zarządzania jest kluczowa dla skuteczności biznesu. W tym kontekście ogłoszono również zapowiedź nowej edycji DAMA DMBOK® 3.0, która wprowadzi świeże spojrzenie na Data Governance, integrując m.in. rosnące znaczenie sztucznej inteligencji i automatyzacji w procesach zarządzania informacją.

Jednym z największych atutów konferencji był jej program, zaprojektowany w formule dwóch równoległych ścieżek: eksperckiej i partnerskiej. Dzięki temu uczestnicy mogli wybierać między wykładami o charakterze strategicznym i teoretycznym, a prezentacjami praktycznych wdrożeń przygotowanych przez partnerów. W ścieżce eksperckiej szczególnym zainteresowaniem cieszyły się prelekcje dotyczące łączenia Data Governance i Data Quality z wartością biznesową, prezentacje poświęcone wyzwaniom stojącym przed firmami w dobie rozwoju AI, a także inspirujący wykład Tiankai Feng „Humanizing Data Strategy”, który przypomniał, że technologia to tylko narzędzie, a prawdziwym sercem strategii danych są ludzie, ich kompetencje, komunikacja, współpraca i odpowiedzialność.

Ścieżka partnerska natomiast zdominowana była przez studia przypadków i przykłady wdrożeń, które wniosły do programu dużą dawkę praktycznej wiedzy. Eksperci z Deloitte i mBanku pokazali, jak w praktyce budować model zarządzania danymi w sektorze bankowym, PwC Polska skupiło się na kwestiach ochrony prywatności i bezpieczeństwa danych w kontekście rosnących cyberzagrożeń, a Ataccama zaprezentowała narzędzia pozwalające na automatyzację procesów zapewniania jakości danych. Ab Initio przedstawiło rozwiązania wspierające zarządzanie danymi w środowiskach multi-cloud, a Dawiso & ILUM podzieliły się wizją tworzenia fundamentów danych gotowych na rozwój agentów AI. Uczestnicy mieli także okazję wysłuchać prelekcji o projektowaniu i wdrażaniu Data Marketplace, znaczeniu Data Catalog w organizacjach oraz o tym, jak granularne podejście do Data Lineage przekłada się na lepszą kontrolę i transparentność procesów. To właśnie dzięki tym partnerom – Ataccamie, Deloitte, PwC Polska, Ab Initio, BitPeak oraz Dawiso & ILUM – program konferencji nabrał praktycznego wymiaru i pozwolił zobaczyć, jak najnowsze koncepcje i technologie są wdrażane w realnych projektach. W imieniu DAMA Poland Chapter serdecznie dziękujemy wszystkim partnerom, prelegentom i uczestnikom za ich wkład i zaangażowanie, to dzięki nim DAMA Day Warsaw stał się wydarzeniem, które nie tylko edukuje, ale także integruje społeczność i inspiruje do dalszego rozwoju.

Kulminacyjnym momentem konferencji był wieczorny egzamin CDMP® (Certified Data Management Professional), który odbył się w godzinach 18:00–19:30. Dla wielu uczestników była to długo wyczekiwana okazja, by oficjalnie potwierdzić swoje kompetencje w obszarze zarządzania danymi i zdobyć międzynarodowy certyfikat uznawany na całym świecie. Egzamin poprzedzony był przerwą techniczną oraz sesją Q&A, w trakcie której można było rozwiać ostatnie wątpliwości dotyczące przygotowania i formy testu.

Po części egzaminacyjnej uczestnicy spotkali się na koktajlu networkingowym, który stworzył idealną przestrzeń do nawiązania nowych kontaktów biznesowych, wymiany doświadczeń i podsumowania intensywnego dnia. Atmosfera była wyjątkowa, widać było, że środowisko data management w Polsce jest nie tylko coraz liczniejsze, ale i coraz bardziej świadome wyzwań oraz szans, jakie niesie przyszłość.

DAMA Day Warsaw 2025 udowodnił, że zarządzanie danymi w Polsce wychodzi poza wąskie grono ekspertów i staje się kluczowym tematem dla całych organizacji. Wystąpienia dotyczące nowych technologii, regulacji prawnych, sztucznej inteligencji i kultury organizacyjnej dowodzą, że dane to nie tylko technologia, ale fundament świadomego, odpowiedzialnego i innowacyjnego biznesu. Ta edycja konferencji umocniła pozycję DAMA Poland Chapter jako organizacji, która nie tylko uczy, ale i integruje środowisko specjalistów data management, inspirując do rozwoju kompetencji i wdrażania najlepszych praktyk.

autor: Dominika Pogudz DAMA Poland

JST_DAMA

Ład danych w administracji samorządowej – wyzwania, możliwość, konieczność

Wnioski i materiały z webinarium przygotowanego przez: Jarosław Banaś, Karol Berłowski, Andrzej Burzyński, Arkadiusz Dąbkowski, Filip Dzięcioł, Wojciech Łachowski w ramach współpracy DAMA Chapter Poland oraz sieci Analityków danych miejskich prowadzonej przez Instytut Rozwoju Miast i Regionów.

Niewidzialna ręka urzędów JST

Ogromne wolumeny danych wpływające na organizację życia każdego mieszkańca w Polsce są przetwarzane w urzędach Jednostek Samorządu Terytorialnego (JST) czyli w urzędach miast, województw, powiatów, gmin. JST gromadzą i przetwarzają dane nie tylko w zakresie bezpośrednio dotyczącym osób fizycznych np. danych meldunkowych, ale prawie w każdym zakresie dotyczącym naszego otoczenia np. architektury, transportu, edukacji, ochrony środowiska, bezpieczeństwa, wodociągów i wielu innych. Dane te służą podejmowaniu decyzji wpływających na organizację życia lokalnej społeczności np. dotyczące lokalizacji szkoły lub tras autobusów. Wybrane dane są przekazywana do rejestrów rządowych stanowiąc podstawę do decyzji na poziomie całego kraju lub Unii Europejskiej. Wybrane dane są udostępniane publicznie stanowiąc źródło referencyjnych danych dla wielu firm. Przetwarzanie danych w JST jest uregulowane licznymi branżowymi przepisami.

Ile Ładu danych jest w JST?

Według badań Unii Europejskiej w 2024 r. Polska zajęła 2 miejsce w badaniu dojrzałości otwierania danych państw UE, co może świadczyć znakomitym zarządzaniu danymi w polskiej administracji publicznej.

Źródło: Open data in Europe 2024 | data.europa.eu

Nieliczne dostępne krajowe badania zarządzania danymi w JST (naukowe oraz kontrole Najwyższej Izby Kontroli) koncentrują się najczęściej na zarządzaniu bezpieczeństwem informacji. Zgodnie z rozporządzeniami w sprawie Krajowych Ram Interoperacyjności od  2012 r. wszystkie JST powinny posiadać wdrożone Systemy Zarządzania Bezpieczeństwem Informacji (SZBI). Mimo tego obowiązku tylko ok 44-75% JST (w zależności od badanej grupy w okresie 2012-2024 r.) wdrożyło SZBI, a przy tym w większości niekompletnie. Wymagania ww. Rozporządzenia dla SZBI są oparte o normę ISO 27001 i są spójne z elementami bezpieczeństwa Ładu Danych opisanymi w Data Management Body of Knowledge (DMBoK). Obszar bezpieczeństwa jest jednym z fundamentów Ładu Danych. Części wspólne wymagań ww. Rozporządzenia oraz Ładu Danych obejmują kluczowe konieczności: określenia ról, przypisania odpowiedzialności, prowadzenia ewidencji (metadanych), określenia zasad dostępu i wielu innych regulacji organizacji pracy z danymi. Powyższe oznacza że badania zarządzanie bezpieczeństwem informacji mogą być wskaźnikiem wdrażania Ładu Danych w urzędach, a ich dostępne wyniki świadczą o znacznych problemach.

O Ładzie danych interaktywnie

Podczas webinarium „Czy Ład Danych w samorządzie jest możliwy?” przedstawiciele DAMA Poland Chapter podjęli dyskusję nad problematyką wdrożenia Ładu Danych w JST. Webinarium zostało zorganizowane 25.04.2025 jako spotkanie w ramach sieci Analityków danych miejskich prowadzonej przez Instytut Rozwoju Miast i Regionów. O potrzebie organizacji spotkania świadczy frekwencja – webinarium zainteresowało 156 przedstawicieli z 70 jednostek samorządowych.

Podczas spotkania Wojciech Łachowski przedstawił korzyści jakie może przynieść Ład Danych w JST, w tym: lepsze decyzje, transparentność, większa efektywność, rozwój usług cyfrowych. Zidentyfikował także główne bariery wprowadzania Ładu Danych w JST analogiczne do generalnych problemów transformacji cyfrowej JST, m.in. brak środków finansowych, opór przed zmianami, problem z zapewnieniem odpowiednich kompetencji, niejasne przepisy, dług technologiczny, zła organizacja pracy. Karol Berłowski rozwinął wybrane problemy. Działalność JST jest wręcz przeregulowana przez liczne, niespójne lub nawet sprzeczne przepisy branżowe. Powyższe jest m.in. przyczyną rozległego problemu ustalenia jednolitej definicji dla jakości danych i operacyjnego właścicielstwa danych. Znaczące nieustrukturyzowanie danych powoduje komplikacje technologiczne zarządzania. JST mają trudność aby pozyskać specjalistów i zaoferować warunki pracy konkurencyjne lub zbliżone wobec sektora prywatnego.

Źródło: opracowanie W. Łachowski, K. Berłowski

Mimo wielu problemów w niektórych urzędach podejmuje sią zaawansowane działania w celu usprawnienia zarządzania danymi czego przykładem jest Urząd Miasta Krakowa

Fundamenty

Podczas spotkania Filip Dzięcioł uwzględnił podstawy teoretyczne wskazując na kluczowe aspekty Ładu Danych wg. DMBoK, takie jak strategia, polityka, standardy, nadzór. Omówił podstawowe obszary Ładu Danych: architektura, modelowanie, składowanie i operacje, bezpieczeństwo, integracja i interoperacyjność, zarządzanie zawartością, dane główne i referencyjne, hurtowanie i analityka, metadane, zarządzanie jakością. Zaznaczył problematykę wdrożeniową w organizacji która już przetwarza dane, przedstawił koncepcję wdrożenia piramidy Aikena oraz wskazał rekomendacje implementacyjne.

Źródło: opracowanie F. Dzięcioł

Sprawdzone rozwiązania

Problemy są podobne w każdym urzędzie. Bazując na swoich doświadczeniach jako eksperta Urzędu Komisji Nadzoru Finansowego, potwierdzonych przykładami z realizacji podobnych projektów w administracji publicznej oraz instytucji finansowych, Andrzej Burzyński przedstawił praktyczne możliwości wdrożenia Ładu Danych. Rozpoczęcie wdrożenia można zacząć od pryncypiów uzgodnionych z kierownikami poszczególnych obszarów merytorycznych. To zapewnia identyfikację rzeczywistych potrzeb i umożliwia określenie ogólnej polityki zarządzania danymi, z której będą wynikały zasady zarządzania danymi. Potrzebne jest uwzględnienie ludzi – ról i odpowiedzialności, potrzeb procesów oraz modelu informacyjnego który usprawni dostęp do potrzebnych danych. Ogólne dokumenty strategiczne są niezbędne do realizacji działań w postaci projektów i usług. Konieczne jest zaangażowanie kadry kierowniczej, w tym najwyższego szczebla, z uwagi na potrzebę wprowadzenia struktury organizacyjnej zarządzania danymi – przypisania odpowiedzialności dla poszczególnych osób za zarządzania danymi, np. w poszczególnych komórkach merytorycznych właścicieli danych. Potrzebne jest powołanie zespołu prowadzącego zagadnienia wdrażania Ładu Danych, skupiającego kompetencje w tym obszarze, stanowiący wsparcie dla pozostałej części jednostki. Zespół wspiera rozwiązywanie szczegółowych problemów np. zarządzania jakością danych. Inne niezbędne działania to m.in. wdrożenie katalogu danych, zidentyfikowanie obszarów tematycznych danych, opracowanie definicji, określenie danych referencyjnych, opracowanie zasad przepływu danych. Wprowadzenie Ładu Danych nie wymaga znaczącego zwiększenia zatrudnienia lub radykalnej zmiany sposobu działania lecz skoordynowania i uspójnienia bieżącej działalności. Wprowadzenie może nastąpić małymi krokami w drodze ewolucji oraz pracy zespołowej całej organizacji. Podmioty przetwarzające dane dla swojej bieżącej działalności mają już pewne elementy organizacyjne które można wykorzystać, zmodyfikować lub rozwinąć w celu osiągnięcia Ładu Danych. Istnieje dużo gotowych metodyk i narzędzi informatycznych wspierających działania. 

Źródło: opracowanie A. Burzyński

Wsparcie jest dostępne

Podczas spotkania omówiono potrzeby zarządzania danymi w JST, problemy oraz ich teoretyczne i praktyczne rozwiązania na prawdziwych przykładach. Przykłady rzeczywistego wdrożenia Ładu Danych w polskiej administracji publicznej stanowią dowód że jest to dostępna i już sprawdzona metoda zarządzania także dla podobnych podmiotów – Jednostek Samorządu Terytorialnego. Arkadiusz Dąbkowski wskazał że gotowe wzorce zarządzania danymi można znaleźć w DMBoK, a kompetencje można rozwijać w społeczności DAMA Poland https://damapoland.org/.

Ład danych odpowiedzią bieżące potrzeby JST

Wobec planowanych zmian w przepisach dotyczących bezpieczeństwa informacji w JST (nowelizacji Ustawy o z dnia 5 lipca 2018 r. o krajowym systemie cyberbezpieczeństwa) wprowadzanie zmian zarządzania danymi w obszarze bezpieczeństwa danych staje się dla JST koniecznością. Zmieniając sposób zarządzania danymi w obszarze bezpieczeństwa, JST muszą wprowadzić wewnętrzne regulacje i podjąć działania skutkujące jednoczesnym wprowadzeniem elementów Ładu Danych. Te elementy stanowią znakomity przyczółek do objęcia Ładem Danych także innych obszarów, jak np. dokumenty strategiczne, jakość, zarządzanie danymi podstawowymi i referencyjnymi. 

źródło: pixabay.com

Nagranie z webinarium jest dostępne na youtube:

Źródła przywoływanych badań:

  • D. Lisiak-Felicka, M. Szmit, Systemy Zarządzania bezpieczeństwem informacji w administracji samorządowej w Polsce – badanie empiryczne, „Przegląd Organizacji”, TNOiK 2023
  • D. Lisiak-Felicka, M. Szmit, Zarządzanie Bezpieczeństwem Informacji w Urzędach administracji samorządowej. Główne problemy, „Współczesny człowiek wobec wyzwań: szans i zagrożeń w cyberprzestrzeni aspekty społeczne-techniczne-prawne”, praca zbiorowa pod redakcją A. Kamińska-Nawrot, J. Grubicka, Uniwersytet Pomorski w Słupsku, Słupsk 2021
  • A. Sobczak, Ład danych jako element wdrażania koncepcji otwartego rządu, Roczniki Kolegium Analiz Ekonomicznych nr 46/2017, Kolegium Analiz Ekonomicznych Szkoły Głównej Handlowej w Warszawie,
  • https://data.europa.eu/en/publications/open-data-maturity/2024
  • https://www.nik.gov.pl/kontrole/P/18/006
  • https://www.nik.gov.pl/kontrole/P/24/004

_123d5c94-2a3a-4a7a-b680-1aa8e841bb60

Monetyzacja danych, a jakość danych – przykład na bazie zarządzania ryzykiem kredytowym w banku

Co to jest monetyzacja danych ?

Monetyzacja danych oznacza wykorzystywanie zgromadzonych informacji i danych klientów w celu generowania przychodów lub zysków. Jest to praktyka, która staje się coraz bardziej popularna w erze cyfrowej, gdzie przedsiębiorstwa gromadzą ogromne ilości danych o swoich klientach i ich transakcjach. Oto kilka produktów, dla których można ‘monetyzować’ dane na przykładzie branży bankowej:

  1. Personalizacja ofert i usług: Banki mogą wykorzystywać dane o zachowaniach finansowych klientów, aby dostosować oferty i usługi do ich indywidualnych potrzeb
  2. Analiza ryzyka i ocena kredytowa: Dane klientów pozwalają bankom na dokładniejszą analizę ryzyka i ocenę kredytową. Dzięki temu mogą one podejmować bardziej trafne decyzje dotyczące udzielania kredytów i innych produktów finansowych
  3. Sprzedaż danych: Banki mogą zdecydować się na sprzedaż anonimizowanych lub agregowanych danych klientów innym firmom, takim jak firmy badawcze, agencje marketingowe lub instytucje rządowe
  4. Programy partnerskie i marketing: Banki mogą nawiązywać współpracę z firmami zewnętrznymi i oferować im dostęp do swojej bazy klientów w zamian za udział w przychodach lub opłaty za reklamę.
  5. Rozwój nowych produktów i usług: Dostęp do danych klientów może pomóc bankom w identyfikowaniu nowych trendów i potrzeb rynkowych
  6. Zwiększona retencja klientów: Banki mogą wykorzystywać dane do analizy zachowań klientów i identyfikowania tych, którzy są zagrożeni odejściem do konkurencyjnych instytucji finansowych

Warto zaznaczyć, że monetyzacja danych musi być przeprowadzana z uwzględnieniem przepisów dotyczących ochrony danych osobowych, takich jak RODO / GDPR w Europie, aby zapewnić prywatność i bezpieczeństwo klientów.

Zanim przejedziemy dalej wyjaśnienia wymaga jeszcze pojęcie ‘Data Product’ (ang.) użytego na potrzeby tego artykułu. ‘Produkt Danych’ to rodzaj produktu lub usługi zbudowanej wokół wykorzystania danych i analiz w celu zapewnienia wartości użytkownikom lub klientom. Na ‘Data Product’ mogą się składać się takie elementy jak: dane, procesy biznesowe, właścicielstwo danych, metryki jakościowe, raporty, modele danych, systemy, interfejsy, powiązane metadata, definicje i słowniki danych itp., a więc wszystko co łączy się bezpośrednio, lub bezpośrednio z ‘DAMA Wheel’

Przykład analizy Ryzyka i Ocena Kredytowa

1. Wprowadzenie

W niniejszym artykule skupimy się na przykładzie ‘Produktu Danych’ dot. Ryzyka Kredytowego i Oceny Zdolności Kredytowej Dla Klienta Biznesowego, ale w analogiczny sposób można przeprowadzić analizę dla każdego innego produktu, klienta lub segmentu zarówno z obszaru danych branży finansowej jak i nie finansowej, jednak należy zaznaczyć, iż kluczem do sukcesu jest zrozumienia wszystkich elementów związanych z danym produktem.

2. Business Case

W ramach omawianego przykładu bierzemy pod uwagę proces kalkulacji ratingu klienta biznesowego w oparciu o dane pochodzące z systemów źródłowych Banku i wpływu tej kalkulacji na inne modele takie jak Risk Weight Asset (RWA) oraz Economic Capital (EC) przy uwzględnieniu procesów agregacji i transformacji danych wykorzystujących tzw. ‘Critical Data Elements’ (CDE) – w naszym przypadku ‘Typ Księgowości’ (Accouting Type), gdzie błąd w danych prowadzi do zniekształcenia danych, a co za tym idzie dalszych błędnych wyników końcowych. Warto nadmienić, iż CDEs powinny zostać skatalogowane w dedykowanym Katalogu Danych

Poniżej znajduje się uproszczony diagram (diagram nr 1) pokazujący wpływ ww. błędu w polu ‘Accouting Type’ (3) (Typ Księgowości) na poszczególne modele, a w następstwie na wyliczanie parametrów RWA i Economic Capital Demand (EC) – oczywiście jest to wersja ‘bardzo’ uproszczona 🙂

W praktyce każda zmienna tzw. ‘Input Variable’, która wpływa na jakikolwiek model danych (LGD, PD, EL etc.) włączając w to modele ML/AI niesie za sobą ryzyko błędnej kalkulacji modelu i wzrostu ponoszonych kosztów np. rezerwy, wymogi kapitałowe itp. lub błędnych decyzji podjętych przez człowieka lub… komputer w oparciu o te dane :warning:.

Aby uniknąć takich ‘błędów’ oraz pomyłek, które mogą generować straty finansowe, Regulator w ramach m.in regulacji BCBS239 ustalił 3 główne obszary , które winny być monitorowane wraz z określonymi wymogami (BCBS239 Priniciples from 1 to 11).

Obszary te możemy podzielić na:

BCBS239 Principles

Warto nadmienić, iż przy wprowadzeniu powyższych wymogów pomoże nam DAMA jako, że zawiera wszystkie elementy potrzebne do wypełnienia postanowień BCBS 239 po stworzeniu odpowiedniego ‘Planu i Konceptu Wdrożenia BCBS 239’

W dalszej kolejności DAMA może nam pomóc zaadresować inne wymogi regulacyjne np. BCBC239, GDPR , Target Review Internal Model (TRIM) , IFRS9 requirements, Capital Requirements Regulation (CRR) lub wiele innych, które można znaleźć na poniższej stronie: Interactive Single Rulebook

3. Analiza i działania

3.1 Analiza Przyczyny Błędu (Root Cause Analysis):

Brak wprowadzonego we właściwy sposób ‘Typu Księgowości’ przez pracownika banku (1 minute task) dla jednego klienta w systemie operacyjnym, którego ekspozycja wynosi 1 mln EUR skutkuje brakiem możliwości użycia ‘technik redukcji ryzyka’ i zgodnie z wymogami BASEL dotworzeniem rezerw, a przez to dodatkowych Wymogów Kapitałowych również na poziomie 1 mln EUR :warning:.

3.2 Wniosek pokontrolny:

Jeżeli w Banku byłoby takich 100 klientów, dla których brak jest wprowadzonej poprawnej wartości tylko w jednym polu :warning: to Bank musi dotworzyć z dnia na dzień o ca 95% więcej rezerw i wymogów kapitałowych niż to jest wymagane przez regulatora dla danej ekspozycji, jeżeli błąd nie istnieje :warning:.

3.3 Rekomendowane Działania:

  1. Zbudowanie ‘Przepływu Procesu Danych’ dla każdego modelu (Data Lineage)
  2. Identyfikacja zmiennych wpływających na model i zaszeregowanie ich jako tzw. ‘Critical Data Elements’ (CDE) (patrz również drugi diagram – część Model Owner)
  3. Identyfikacja i dokumentacja sposobów agragacji, transofrmacji i właścicielstwa danych przy pomocy ‘Procesu Przypływu Danych’ (Data Lineage) i Katalogu Danych (Data Katalog)
  4. Określenie wymogów na potrzeby ‘Monitorowania Jakości Danych’ (Data Observability) np. Business DQ Rules, Technical DQ Rules, Integgration DQ Rules i wdrożenie w narzędziu do ‘Monitorowania Jakości Danych’ na poszczególnych etapach ‘Lineage’ (patrz również drugi diagram – część DQ Ownership & Issue)
  5. Porównując dane (przed błędem vs po błędzie) możemy określić wpływ, a więc dokonać ‘monetyzacji’ oraz wyliczyć ROI dla Data Governance*

*Należy pamiętać, żę aby wyliczyć ROI dla Data Governance, warto wdrożyć wszystkie wymagane elementy #DAMA (Data Governance, Data Quality & Data Operation), gdyż trudno jest wyliczyć ROI i tylko dla jednego z nich :warning:

Załączniki

Wykres 1 – Mapa Danych / Model Koncepcyjny:

Wykres 2 – Przykład Przepływu Danych (Data Lineage Topic):

DAMA DMBOK

DMBok o Data Governace

W dzisiejszej erze cyfrowej, dane stały się jednym z najcenniejszych zasobów dla organizacji. Właściwe zarządzanie danymi staje się nieodzowne, aby wykorzystać ich pełen potencjał i osiągnąć strategiczne cele biznesowe. W ramach tego procesu, dwie kluczowe praktyki wyłaniają się na pierwszy plan: #DataGovernance #DataStewardship. Te dwie koncepcje są nieodłącznie powiązane i razem tworzą fundament skutecznego zarządzania danymi.

Ważne jest zrozumienie, że zarządzanie danymi nie jest izolowanym procesem, lecz ściśle związane z kontekstem organizacji. Nie wystarczy jedynie posiadać technologiczne rozwiązania do przechowywania i analizy danych. Efektywne zarządzanie danymi wymaga uwzględnienia szerokiego spektrum czynników, takich jak strategia biznesowa, strategia IT, polityki i standardy organizacji oraz kultura biznesowa i otoczenie.

 

#DMBOK przedstawia następującą definicję data governance i data stewardship: “Wykonywanie władzy, kontroli oraz podejmowania wspólnych decyzji (planowanie, monitorowanie i egzekwowanie) w zakresie zarządzania aktywami danych.”

Według #DMBOK, istnieją trzy podstawowe cele strategiczne #DataGovernance #DataStewardship:

      • Umożliwienie organizacji zarządzania danymi jako aktywem.

      • Określanie, zatwierdzanie, komunikowanie i wdrażanie zasad, polityk, mierników, narzędzi i odpowiedzialności dotyczących zarządzania danymi.

      • Monitorowanie i kierowanie zgodnością z politykami, wykorzystaniem danych oraz działaniami zarządzania.

    Określanie, zatwierdzanie, komunikowanie i wdrażanie zasad, polityk, narzędzi i mierników dotyczących zarządzania danymi jest niezwykle istotne dla utrzymania spójności i skuteczności w obszarze danych. Również monitorowanie i kierowanie zgodnością z politykami, wykorzystaniem danych oraz działaniami zarządzania pomaga w utrzymaniu wysokiej jakości danych i zgodności z przepisami. Te cele są kluczowe dla organizacji dążących do efektywnego wykorzystania swoich zasobów danych. 

    #DataGovernance #DataStewardship

    Implementacja data governance i data stewardship generuje różnorodne produkty, które pomagają organizacjom w skutecznym zarządzaniu danymi. Niektóre z tych produktów to:

      • Strategię zarządzania danymi;
      • Strategię danych;
      • Mapę strategiczną strategii biznesowej i zarządzania danymi;
      • Zasady danych, polityki zarządzania danymi, procesy;
      • Ramy operacyjne dla danych;
      • Mapę strategiczną i strategię wdrożenia, itp.

      Wszystkie te produkty pozwalają na wcielenie w życie data governance w całej organizacji oraz na monitorowanie i ocenę jej efektywności.

      #DMBOK definiuje również szereg aktywności, które wynikają bezpośrednio z data governance i data stewardship. Niektóre z tych aktywności to:

        • Określenie zarządzania danymi dla organizacji.
        • Opracowanie strategii zarządzania danymi.
        • Przeprowadzenie oceny gotowości/dojrzałości data governance
        • Przeprowadzenie analizy i dopasowania do biznesu.
        • Opracowanie punktów styku w organizacji.
        • Określenie ram operacyjnych zarządzania danymi.
        • Opracowanie celów, zasad i polityk.
        • Zapewnienie wsparcia projektom zarządzania danymi.

        Podzielcie się w komentarzach swoimi praktykami dotyczącymi data governance – jak to wygląda w Waszych organizacjach? Czekamy na Wasze cenne doświadczenia i opinie!

        Nie przegapcie kolejnego artykułu: będzie poświęcony katalogom danych w #DMBOK