Is een datawarehouse nog wel van deze tijd, of zijn juist meerdere datawarehouses aan te raden?
Anno 2023 lijkt een datawarehouse niet meer nodig. Er zijn immers verschillende tools beschikbaar waarmee gebruikers zelf gegevens kunnen ophalen, combineren en exporteren. Een datawarehouse is duur, gedateerd, moeilijk te begrijpen en te beheren. En ook nog tijdrovend. Dat is wat vaak in de gedachten van managers leeft. Maar kloppen deze aannames eigenlijk wel? En welke opties heb je als zorginstelling om van ruwe data tot bruikbare informatie te komen? In deze blog kijken we naar een aantal aspecten hiervan.
Datahonger
Eerst maar even naar de gebruikers. De mensen in de organisatie die data nodig hebben voor het verkrijgen van inzicht om daar beslissingen op te nemen óf te valideren of eerder genomen beslissingen daadwerkelijk het beoogde effect hebben. De vaardigheden van deze medewerkers kunnen enorm variëren. Toch hebben deze gebruikers een ding gemeen: ze willen allemaal meer data, meer inzicht en meer rapportages dan ze nu hebben. En dat zoekt een uitweg. Als de centraal ondersteunde informatievoorziening niet toereikend is, zijn gebruikers vindingrijk genoeg om alternatieve tools te gebruiken. Dit is een risico. Er ontstaat hiermee een alternatieve datastroom buiten het zicht van de verantwoordelijken binnen de organisatie. De honger naar data is niet het probleem, de oplossing die men hier zelf voor gaat zoeken kan wel tot problemen leiden. Veel handwerk, geen documentatie, meerdere versies van de waarheid, geen data governance, geen validatie en minimaal hergebruik. En met de Excelsheets die rondgestuurd worden via mail is ook het risico op een datalek aanwezig.
Self Service Tools
De afgelopen jaren zijn de laagdrempelige rapportagetools doorontwikkeld tot producten die ook door niet-BI’ers gebruikt kunnen worden. Hierdoor kunnen medewerkers in staat gesteld worden om zelf data te importeren, te bewerken en om te zetten in rapportages. Gegevens kunnen rechtstreeks uit de bronsystemen gehaald worden, er dient enkel toegang verleend te worden. In plaats van een centrale afdeling die verantwoordelijk is om rapportages te maken, kunnen nu veel meer medewerkers rapportages maken. Zonder hiervoor te hoeven wachten op ruimte binnen de ontwikkelagenda.
Datawarehouse: een terugblik
Maar, waarom hadden we eigenlijk ook al weer een datawarehouse? Om meerdere redenen:
- Bronsystemen hebben vaak allemaal andere manieren om data op te halen.
- Bronsystemen kunnen vanwege performance-redenen overdag niet gebruikt worden om zware datavragen op uit te voeren.
- Data uit de verschillende systemen kan niet eenvoudig worden samengevoegd
- Er is schoning, verrijking en berekeningen nodig.
Een traditioneel datawarehouse leest periodiek de bronsystemen uit, schoont de data op volgens afgesproken regels, geeft duiding aan de ruwe data door middel van het uitvoeren van gevalideerde berekeningen en zet deze data klaar in datamarts. Deze datamarts dienen vervolgens als basis voor de verschillende informatieproducten.
Kijken we naar een tool als Power BI, dan zien we dat Power BI prima in staat is om data uit bronsystemen op te halen, berekeningen te maken, schoning en verrijking van data op door te voeren en zelfs binnen dezelfde tool ook nog visuele rapportages en dashboards te maken. Hiermee lijkt de noodzaak voor een datawarehouse in eerste instantie niet meer aanwezig. Kijken we nog wat verder, dan zien we echter dat een datawarehouse ook andere aspecten in zich heeft:
- Het bijhouden van data die niet meer in de bronsystemen aanwezig zijn. Of gemuteerd is, waarbij in het bronsysteem de oude waarde niet meer aanwezig is.
- Een datawarehouse bevat tegenwoordig steeds meer ongestructureerde data.
- Berekeningen kunnen zo complex zijn, dat deze niet eenvoudig opnieuw te maken zijn in een self-service tool.
- De definities van de berekeningen liggen vast in het datawarehouse, dit is hiermee een bron van de waarheid.
We zien hiermee dat het technische aspect van een datawarehouse prima overgenomen kan worden door een self service tool, maar dat niet alle functionele eigenschappen voldoende overgenomen kunnen worden zodat hiermee het datawarehouse kan worden uitgefaseerd.
Datawarehouse of rapportageomgeving bij softwarepakket
Steeds vaker wordt bij een softwarepakket een separate rapportageomgeving of datawarehouse geleverd, waarmee rapportages op de onderliggende data gemaakt kan worden. Het voordeel hiervan is dat de leverancier de rapportages en definities onderhoudt. Maar dit voordeel kan ook een nadeel zijn. Een rapportage kan voor de eigen organisatie onbruikbaar zijn, tenzij deze op een of meerdere punten wordt aangepast. En ook dan ontstaat er weer een nieuwe omgeving waarop rapportages draaien, wat het vaak voor gebruikers ingewikkeld maakt om te bedenken waar de rapportage staat die men nodig heeft.
Een oplossing
Uiteraard kan per organisatie de ideale situatie verschillend zijn. Toch zijn er een aantal zaken die in vrijwel iedere organisatie ingericht kunnen worden voor een betere informatievoorziening.
- Breng alle gebruikers in kaart en groepeer deze. Achterhaal de informatiebehoefte van deze groepen gebruikers. Er zijn gebruikers die heel goed geholpen zijn met goede standaardrapportages en geen behoefte hebben om veel zelf met data te kunnen doen.
- Zorg voor een solide Enterprise Datawarehouse met functioneel rijke datamarts. In deze datamarts is schoning en verrijking toegepast, en zijn berekeningen op eenduidige wijze doorgevoerd. De datamarts zijn beschreven, het onderhoud wordt centraal door de BI afdeling uitgevoerd.Bekijk tevens per datamart wat de meest waardevolle bron is om de benodigde data uit op te halen. Als een leverancier al een datawarehouse bij het softwarepakket levert, dan kan het handig zijn om dat als bron te nemen. Weeg hierbij de voor- en nadelen tegen elkaar af.
- Ontwikkel goede standaardrapportages, in samenspraak met de interne gebruikersgroepen. Het is aan te raden hiervoor een of meerdere product owners te benoemen. Zij bewaken de ontwikkelagenda, samen met het ontwikkelteam. De product owner(s) vertegenwoordigen de informatiebehoefte vanuit de gehele organisatie en zijn tevens verantwoordelijk voor de prioritering.
- Richt Self Service in en neem hierin ook data governance voor BI producten in mee. Doe dit per gebruikersgroep, en train deze gebruikersgroepen in het gebruik van de centraal ondersteunde Self Service BI tool. Dit geeft vrijheid voor deze gebruikers, maar ook verantwoordelijkheid.
- Zorg ervoor dat gebruikers van datamarts en rapportages op de hoogte zijn van alle informatieproducten. Dit vraagt niet alleen om documentatie, maar ook om een productcatalogus en/of duidelijk informatieportaal. Hoe meer men moet zoeken naar informatie, hoe groter de kans op het ontstaan van parallelle informatiestromen.
Het inrichten van een enterprise datawarehouse, data governance en self service is een complex proces. De consultants van ilionx hebben hier veel ervaring mee binnen zorginstellingen van verschillende grootte. Neem contact met ons op voor een vrijblijvend gesprek om te kijken wat in uw situatie het beste past.
Erik Schmitz – ilionx