Wat is datakwaliteit: de handleiding om datakwaliteit te meten, weten en te verbeteren

Foto Dick Pouw MBA
Auteur: Dick Pouw MBA
Associate Partner datakwaliteit & datawarehousing
Inhoudsopgave

Is je datakwaliteit goed? Dan haal je veel meer uit je organisatie en je investeringen. Zoals die in CRM, Analytics, KPI’s of een datawarehouse. Alles staat of valt met de kwaliteit van je data (bekijk de 6 criteria). Maar, hoe verhoog je de kwaliteit van reguliere data en big data? En welke tools, methodes en maatregelen zijn het meest effectief? Welke doelen kun je formuleren om je datakwaliteit te verbeteren. Het is zo bekend: ‘garbage in, garbage uit’. Toch blijkt het moeilijk om de kwaliteit van de data op een hoger plan te brengen. Dat komt niet alleen maar door gebrekkige IT. Het gedrag van mensen speelt een evenzo belangrijke rol. Passionned Group, expert in datakwaliteit en data science, begrijpt dat en helpt je graag verder.

Zes criteria om datakwaliteit te meten

Datakwaliteit kun je meten. Dat is complex, maar zeker niet onmogelijk. De volgende aspecten worden gebruikt als criteria om datakwaliteit te kunnen meten:

  1. Accuraat: gegevens moeten 100% kloppen. Denk bijvoorbeeld aan verouderde adressen, spelfouten in namen of aan een verhuurde woning zonder puntentelling (woningcorporaties).
  2. Compleet: zijn alle gegevens compleet en goed ingevuld. Denk bijvoorbeeld aan een postcode waar de vier cijfers wel zijn gevuld maar de letters niet. Je primaire proces vaart hier ook wel bij.
  3. Formaat: voldoet de data aan de regels die van toepassing zijn in jouw land of regio? Denk aan het formaat van een datum, telefoonnummer of bankrekening.
  4. Consistent: klopt de data onderling? Is een adres bijvoorbeeld in het boekhoudpakket gelijk aan die in het CRM-systeem? En welk record is dan het meest betrouwbaar?
  5. Dubbel: klant- en productgegevens komen vaak meerdere keren voor in bestanden. Meestal is de informatie in de diverse records anders.
  6. Integer: dit gaat om data die niet goed te koppelen valt. Denk bijvoorbeeld aan orders die “zweven” in het systeem en geen klant kennen.

Datakwaliteit meten & verbeteren
Figuur 1: Start met je datakwaliteit meten, zodat je kan weten waar je die kunt verbeteren.

Investeer in goede klantdata. Toets je data daarom regelmatig op deze aspecten. Daarvoor zijn al veel externe bronnen en tools beschikbaar. Denk bijvoorbeeld aan tabellen met postcodes of systemen om namen van klanten te controleren. Of denk aan ETL data profiling tools: hier vind je een uitgebreid overzicht.

Ga van meten naar verbeteren

Meten is de eerste stap. Maar dan ben je er natuurlijk nog niet. In stap twee moet je je data gaan verbeteren. En daar heb je dan een goede aanpak voor nodig. Onze aanpak helpt jou en je team met het ontwikkelen van nieuwe vaardigheden. Daarmee kun je de kwaliteit van gegevens continu verbeteren. En we helpen je met de juiste KPI’s en tools. Zodat je als individu en als team betere resultaten bereikt.

Elk moment kun je zien wat je datakwaliteit is, en vooral hoe en waar je die kan verbeteren. Of het nu gaat om klantgegevens of allerlei product- en procesgegevens. Wij bieden je alvast een gratis tool aan: de bekende cirkel van Deming: plan do check act. Hiermee kun je periodiek je datakwaliteit verbeteren vanuit een plan.

Formuleer doelen voor je datakwaliteit

In dat plan formuleer je de doelen voor de gewenste datakwaliteit. Dit gebeurt SMART zodat je het kunt meten. Dan stel je key performance indicators (KPI’s) vast en plaats je die op een dashboard. Vervolgens ga je de KPI’s normeren, je stelt je een doel. Je wilt bijvoorbeeld dat 98% van de contactgegevens van je klanten juist is.

In de stap ‘do’ ga je analyses maken. Je kijkt welke data fout is en hoe je die kan corrigeren. Ter plekke of door het systeem aan te passen. In de stap ‘check’ van de PDCA-cirkel vergelijk je de norm met de resultaten. En die bespreek je met elkaar. In de laatste stap stel je je doelen en KPI’s bij, of je maakt meer middelen vrij voor de uitvoering.

Wat je verder moet weten over datakwaliteit

Formuleer doelen voor je datakwaliteitDatakwaliteit kent een aantal belangrijke aspecten. Die moet je altijd meenemen in je aanpak. Zie je deze aspecten over het hoofd, dan kan het je reputatie schaden. En dan lopen je klanten weg. Data heeft een zeer goede bescherming nodig. Neem daarom altijd de volgende drie aspecten mee in je data-strategie.

  • Privacy is een belangrijk aspect. Je klanten vertrouwen hun gegevens aan jouw organisatie toe. Ze gaan ervan uit dat je hier verstandig mee omgaat. Dit ging bijvoorbeeld fout toen enkele grote banken klantdata aan derden wilden verkopen. Ze zagen het voornamelijk als extra inkomstenbron. Hier was heel veel ophef over.
  • Security is een ander zeer belangrijk aspect. Elke dag is het wel in het nieuws: een datalek of een hack waarbij klantdata is gestolen uit een (online) database. De reputatieschade voor het bedrijf is enorm. Het kan zelfs het voortbestaan van je bedrijf in gevaar brengen.
  • Transparantie wordt steeds belangrijker. Welke klantdata sla je op en welke data deel je met derden? Facebook is wel het bekendste voorbeeld. Dat bedrijf verzamelt zeer veel data over klanten. En is het onduidelijk welke gegevens zij precies opslaan, wat ze daar dan mee doen en met wie ze die delen.

Deze bovengenoemde aspecten worden steeds belangrijker. Ze staan dan ook voortdurend op de agenda van alle directies en raden van bestuur van organisaties.

De ETL & Data Integratie Guide™ Afbeelding van De ETL & Data Integratie Guide™De ETL & Data Integratie Guide™ geeft je ongelimiteerde toegang tot grote hoeveelheden markt-, product- en leveranciersinformatie. Beoordeel de belangrijkste leveranciers op verschillende aspecten waaronder datakwaliteit. Selecteer hiermee de meest geschikte data integratie-oplossing en til je kennis naar een hoger niveau. Drilldown tot wel vier niveaus diep, zo raak je de kern van het vakgebied. Verdiep je in de belangrijkste ETL-processen, zoals datakwaliteit, data-integratie, datamigratie, datareplicatie en data governance. Ontdek het verschil tussen ETL en ELT aan de hand van een geanimeerde video, of volg een minicollege over het belang van datakwaliteit.de ETL & Data Integratie Guide™ 2024

Data is net een regenboog

Datakwaliteit verbeterenData kent veel verschijningsvormen. Het is net een regenboog. Het enige verschil is dat een regenboog weer snel verdwijnt. Data daarentegen blijft persisteren in je organisatie. De meest bekende vorm is big data. Dit zijn heel veel gegevens of data die erg complex zijn. Ze passen niet meer in een normale database met kolommen en rijen. Daarnaast moet je zeker ook letten op open data en zero data.

  • Big data: is een zeer belangrijke trend. In onze datagedreven economie geeft big data snel nieuwe inzichten in het gedrag van klanten en apparaten. Big data zoekt figuurlijk naar de speld in de hooiberg. Werk je met big data, dan heb je waarschijnlijk grote problemen met datakwaliteit. Zeker als het gaat om data die mensen plaatsen op sociale media.
  • Open data: is vrij beschikbare data. Je kunt het tegenwoordig overal vandaan trekken. Overheden en kennisinstituten produceren die aan de lopende band. Denk aan de data van het CBS of die van het RDW. Het doel van open data is hergebruik. Door die te koppelen met bedrijfsdata, kun je je klantdata enorm verrijken. En krijg je veel meer inzichten in je klant of probleem. Bekijk ook alle open data van de overheid.
  • Zero data: veel organisaties richten zich alleen maar op big data, want dat is de trend. Ze vergeten dat heel veel informatie ook intern beschikbaar is. Bijvoorbeeld door specifiek te kijken naar data die niet in de database zit. Dit noemen we zero data. Deze data geeft bijvoorbeeld aan wat jouw klanten niet kochten.
De opleiding Datawarehouse & Data Governance Afbeelding van De opleiding Datawarehouse & Data GovernanceTijdens de krachtige 3-daagse opleiding Datawarehouse & Data Governance maak je in 3 intensieve dagen kennis met het begrip datawarehouse, de beginselen van ETL, het bouwen van een datawarehouse, data lakes en welke Data Governance jouw situatie vereist. Ook reikt de docent je allerlei inzichten aan om de datakwaliteit inzichtelijk te maken (data profiling) en te verbeteren.Volg onze opleiding Datawarehouse & Data Governance

3 wijdverbreide misverstanden over datakwaliteit

Er zijn verschillende valkuilen die je moet zien te vermijden. Leer van de fouten die anderen eerder al maakten. Hieronder presenteren we de drie meest voorkomende misverstanden die leven over datakwaliteit.

  1. Datakwaliteit is een eenmalige exercitie en geen continu verbeterproces. Wanneer de acute noodzaak van goede data verwatert, verdwijnt het van de agenda. En dan blijft het alsnog dweilen met de kraan open.
  2. Data is geen strategische asset. Dan is er misschien ad hoc aandacht voor, maar nooit structureel. Door je datakwaliteit continu te monitoren en hierover te rapporteren, ga je dat veranderen.
  3. Datakwaliteit is iets wat IT moet regelen. De verantwoordelijkheid is dan niet goed belegd. Het verbeteren van je datakwaliteit komt dan nooit echt goed van de grond.

Verhoog de datakwaliteit in jouw bedrijf

Je ziet dat datakwaliteit een onderwerp is dat leeft. En het onderwerp wint steeds meer aan belang. Wil je ook meters maken in het verbeteren van je datakwaliteit? Dan kunnen onze praktijkgerichte experts jou zeker helpen. Neem hier contact met ons op voor een vrijblijvend gesprek of offerte.

Over Passionned Group

logo van Passionned Group, de datakwaliteit specialistenWij zijn Passionned Group: specialist in datakwaliteit, data science en big data. Onze ervaren experts helpen jou bij de kanteling naar een intelligente, datagedreven organisatie. Met passie en plezier. Om het jaar organiseert Passionned Group de Dutch BI & Data Science Award™, de verkiezing van de Slimste organisatie van Nederland.

neem contact met ons op

Onze datakwaliteit-consultants

» Bekijk alle experts

Bestel nu de bestseller 'De intelligente, datagedreven organisatie' (8e druk)

Productafbeelding van het boek 'De intelligente, datagedreven organisatie'

Dit vind je misschien ook interessant

Uitgelichte afbeelding Oracle BI & Analytics
Oracle BI & Analytics
Uitgelichte afbeelding SAP BI & Analytics
SAP BI & Analytics
Uitgelichte afbeelding Informatica ETL & Data Integratie
Informatica ETL & Data Integratie

Deze organisaties gingen je voor

Word nu ook klant

Wil je ook klant bij ons worden? Wij helpen je maar wat graag verder met het inzichtelijk maken en verbeteren van de datakwaliteit of andere zaken waar je slimmer van wordt.

Foto Dick Pouw - Associate Partner datakwaliteit & datawarehousingDICK POUW MBAAssociate Partner datakwaliteit & datawarehousing

Neem contact met mij op

Fact sheet

___
klanten
___
trainingen & workshops
___
mensen opgeleid
4,4
sterren klanttevredenheid
___
consultants & docenten
3
kantoren
19
jaar ervaring