Van klassiek datawarehouse naar moderne data architectuur, hier houdt u best rekening mee

Van klassiek datawarehouse naar moderne data architectuur, hier houdt u best rekening mee

19 april 2021

Data

Elke (soon to be) datagedreven organisatie heeft een modern dataplatform nodig. Zo’n bedrijf wil immers meer met z’n data doen dan enkel efficiënte rapportering bouwen. De data wordt mee in het hart van de organisatie geplaatst om van daaruit waarde te creëren, te zorgen voor een efficiëntere organisatie en zelfs nieuwe services te bieden aan klanten. Naast een geoptimaliseerde cultuur en processen, is daarvoor ook een slim uitgedacht technologisch platform nodig om alles te faciliteren.

Waarom een klassiek datawarehouse niet meer voldoende is

Een klassiek datawarehouse is vandaag niet meer voldoende om data te organiseren volgens de huidige normen. Door de evolutie van o.a. Internet of Things is er een overvloed aan (potentiële) data beschikbaar. Deze enorme gegevensverzamelingen worden gekenmerkt door vier dimensies, ook wel bekend als de 4 V’s van big data.

  • Volume
    De omvang van de datasets die moeten worden geanalyseerd en verwerkt, zijn veel groter geworden. Alleen al het volume van de gegevens vereist andere verwerkingstechnologieën dan de traditionele opslag- en verwerkingscapaciteiten.

     
  • Velocity
    De snelheid waarmee informatie binnenkomt, is ook enorm gestegen. Met de komst van 5G zullen we nog verder evolueren richting real-time verwerking omdat gegevens zo snel uitgewisseld kunnen worden.
     
  • Variety
    Er zijn veel bronnen die verschillende soorten data opleveren. Vroeger had je gestructureerde data die binnenkwam in het datawarehouse. Vandaag is er ook (semi) ongestructureerde data, een aanpassing in de architectuur dringt zich op. Je zou zelfs beroep kunnen doen op gegevens van derde partijen. Door de juiste linken te leggen tussen al die beschikbare data wordt een context gecreëerd en worden complexere vormen van waardecreatie mogelijk.

     
  • Veracity
    Dit gaat over de kwaliteit van data. Er is meer nood aan aandacht voor de kwaliteit en juistheid. Data moet de werkelijkheid vertegenwoordigen. Als er enige perceptie of vooroordeel ingebakken zit in de brongegevens, trek je deze perceptie door en maak je daar de waarheid van.

 

Een dataplatform dat past bij uw noden

Een dataplatform met aandacht voor al deze dimensies krijgt een centrale plaats in een datagedreven organisatie. Veel bedrijven werken nu met een zeer eenvoudige versie of hebben data in verschillende silo’s zitten. Om het volledige potentieel van data te benutten, dient dit gecentraliseerd te worden. Andere specificaties van het platform zijn te bepalen op basis van de noden.

De makkelijkste oplossing is kiezen voor een platform via een cloudprovider. De meest gehoorde ‘ja-maar’ argumenten draaien rond veiligheid, met topics als privacy en GDPR. Indien zo’n zaken spelen, kan je gaan voor de ‘ja-en’ strategie in de vorm van een hybride oplossing. Je kan bijvoorbeeld de meest gevoelige data lokaal houden.

Zo’n opsplitsing kan ook financieel interessant zijn. Rekenkracht kost in de cloud immers enkel geld als je het gebruikt. Zo’n hybride model kan een eerste stap zijn richting een eigen modern dataplatform.

Daarnaast is er nog de splitsing tussen opslag en rekenkracht. Deze maakt de toepassing van verregaande veiligheidsmaatregelen eenvoudig. Aan deze splitsing gaat best wel een denkoefening vooraf om dit zo efficiënt en geoptimaliseerd mogelijk te doen. Hou daarbij in het achterhoofd dat een platform geen doel op zich is, alles moet in het teken staan van waardecreatie door middel van data.

data-blog-3

Hier moet u over nadenken bij het opzetten van een moderne data architectuur

Er zijn vier fasen waar gegevens doorheen bewegen in een datagedreven organisatie. Data wordt opgenomen in de architectuur, verwerkt, geconsumeerd en gebruikt. Elke fase bevat verschillende elementen om alles in goede banen te leiden. Over alles moet goed nagedacht worden. Wat heb je precies nodig, voor wat moet het dienen, wat moet het faciliteren, …

Ten eerste is het belangrijk dat data in een bruikbare vorm wordt opgeslagen. Het algemene werk moet al gebeurd zijn zodat een data engineer z’n tijd optimaal kan benutten. Pas wel op met te veel bewerkingen of correlaties, de data moet overkoepelend inzetbaar zijn. Ook wat betreft de beveiliging van data moet er een strategie uitgetekend worden. Bij de classificatie van datasets bepaal je welke securitymaatregelen nodig zijn, bij elke fase van het platform. Geef data een gevoeligheidscategorie mee en beslis welke zaken deelbaar zijn. Vertrouwen op vlak van dataveiligheid is immers heel snel weg en moeilijk terug op te bouwen. Ook een zicht op de herkomst van gegevens is belangrijk om in orde te zijn qua GDPR. Een datacatalogus zal je hierin ook ondersteunen. Daar hou je namelijk bij welke data bestaat in het bedrijf. Wanneer iemand vraagt om z’n gegevens te verwijderen, is er meteen een overzicht van wat er allemaal aanwezig is. Er zijn ook nog heel wat andere componenten die belangrijk zijn voor een goede datakwaliteit en governance. Bouw ook mogelijkheden in om data te analyseren. Zorg ervoor dat er een manier is om te grasduinen in de data, om mogelijkheden op te zoeken.

Denk ook zeker na over wat je uiteindelijk wil doen met de data. Wil je een dashboard bouwen om in het oog te houden wat er aan het gebeuren is in een specifiek domein van je organisatie en/of wil je voorspellende of intelligente modellen opzetten? Naast het bouwen van zo’n visualisaties of modellen kan de data ook geïntegreerd worden in bestaande business applicaties of zelfs beschikbaar gemaakt worden voor derde partijen.

Uiteindelijk kan de data worden ingezet in allerlei applicaties, nadat het een hele weg heeft afgelegd. Toch blijft dit voor veel bedrijven het startpunt (‘we willen iets met onze data doen’), ze vergeten de rest van de puzzel en bekomen daardoor niet het resultaat of de waarde die ze voor ogen hadden. Een rapport of AI model bouwen is op zichzelf niet genoeg. De inzichten moeten gebruikt en ingezet worden om er meerwaarde mee te creëren in de organisatie. Zonder data te laten doorsijpelen naar het hart van uw organisatie blijven het interessante maar losstaande modellen zonder impact.

Weet u al hoe u aan de slag kan om datagedreven te worden?

Dit is de derde blog in een reeks over het verankeren van data in het hart van de organisatie. Lees zeker ook de andere blogs.

Ontdek alle blogs
Lees meer

Schrijf je in en ontvang onze blogs in je mailbox

Inschrijven op de nieuwsbrief

Blijft u graag op de hoogte van nieuws, aanbiedingen en events over onderwerpen die u zelf kiest?

Schrijf u hier in