Het ‘garbage in-garbage out’ principe is algemeen bekend. Het gebruik van onjuiste klantgegevens in klantinteracties leidt tot postretouren, e-mail bounces en klagende klanten. Wat is goede datakwaliteit en hoe kunnen we zorgen voor een goede kwaliteit van de data?

Over vervuilde data
De belangrijkste oorzaak voor het ontstaan van vervuilde data is het gebruik van dubbele records (74%), gevolgd door het gebruik van twee of meer databases (38%). In vrijwel alle sectoren worstelt men met het managen van relevante data. Dit doet zich vooral voor in b2c markten (74%) en ook in aanzienlijke mate in b2b markten (59%). De dataproblemen worden in meerderheid door directies erkend (52%) en vooral door het lagere management (80%).

Data kwaliteit
Voor de omschrijving van de kwaliteit worden in het algemeen de volgende criteria gehanteerd:
-compleet: adressen, telefoonnummers e.d. zijn allemaal aanwezig. Data van één persoon is samengebracht in één database
-uniek: een klant komt slechts éénmaal voor in een databestand, en is niet in meerdere bestanden opgenomen. Alle gegevens van een klant zijn aan de klant gekoppeld
-consistent (uniform): de (aan)schrijfwijze van een klant is consistent door de hele organisatie heen, dat geldt ook voor gegevens van de klant, zoals M/V of man/vrouw, en niet de ene keer M/V en de andere keer man/vrouw
-nauwkeurig: de gegevens zijn juist
-actueel: recente aankopen, verhuizingen e.d. zijn bekend en in de bestanden gemuteerd

Oorzaken van slechte datakwaliteit
De volgende oorzaken worden veelvuldig gesignaleerd:
-gemakzucht of onnauwkeurigheid van medewerkers
-systemen die niet goed functioneren, systemen signaleren onvoldoende dat gegevens onvolledig zijn of niet consistent
-meerdere systemen worden gebruikt, dit leidt direct tot allerlei problemen, onduidelijk is welke gegevens uit welke systemen moeten komen, onduidelijk is hoe de gegevens gecombineerd moeten worden e.d. Ook is vaak niet duidelijk of de heer Jansen in systeem A dezelfde is als de heer Jansen in systeem B etc.

Oplossingen voor een betere kwaliteit
Er zijn allerlei oplossingsrichtingen aan te wijzen. Hier worden de volgende genoemd:
-zorgdragen voor goede datainvoer
-het inrichten van den datawasstraat: grote hoeveelheden data worden in een uitvoerig proces geüniformeerd, ontdubbeld en aangevuld
-dataverrijking: met externe bestanden ontbrekende gegevens aanvullen
-organisatorische maatregelen: datamanagers aanwijzen die verantwoordelijk worden gesteld voor de datakwaliteit

Voordelen van goede datakwaliteit
De voordelen vallen uiteen in drie categorieën:
-kostenbesparing: minder data opslag, minder zoektijd naar de juiste data, minder doublures en lagere mailkosten, minder handmatige verwerking, minder controle kosten, minder postretouren, minder kosten van klachten afhandeling/klantenservice
-hogere responsepercentages
-minder irritatie bij klanten en medewerkers

Bron:
‘Datakwaliteit en klantgerichte marketing’, White Paper, T-Systems, 2009