Ben jij een dataverzamelaar? 2019-04-18T09:39:16+02:00

Project Description

Het strategisch belang van data

 

Zodra er binnen organisaties plannen worden gemaakt en beslissingen worden genomen, komt het strategisch belang van data aan het licht. Data is het belangrijkste ingrediënt voor een gedegen onderbouwing van beide. Het data proces begint met het vastleggen van de data om deze later te kunnen analyseren. Bedenk vooraf wat je wilt analyseren om te weten welke data elementen je gaat verzamelen en vastleggen. Met te veel data waar je uiteindelijk niets mee doet, wordt je overzicht onnodig troebel.

 

Correcte en uniforme schrijfwijze

 

 

Wanneer we een data analyse uitvoeren, onderzoeken we gegevens. Deze gegevens staan in principe altijd in een Excel document. Elke kolom heeft een naam en bevat gegevens die onder die benaming vallen. Om met deze gegevens aan de slag te kunnen, dient de schrijfwijze van de gegevens in de kolommen correct en uniform te zijn. Wanneer de kolom genaamd ‘plaatsnaam’ bijvoorbeeld op een regel de plaats Den Haag bevat maar op een andere regel wordt deze plaats ’s-Gravenhage genoemd, hoe weet het systeem waarmee we werken dan, dat beide regels doelen op dezelfde vestigingsplaats? Zelfs het niet consequent plaatsen van spaties zoals in een postcode tussen de cijfers en letters, kan een analyse al behoorlijk in de war brengen.

Automatische matching

 

Om een goede en dus betrouwbare data analyse te kunnen uitvoeren, moeten we eerst de data die we gaan onderzoeken, controleren en uniformeren. Dat zou in veel gevallen handmatig een flinke klus zijn. Gelukkig zijn er geavanceerde programma’s geschreven die middels het vergelijken met een complete en actuele externe database, een goede automatische match kunnen maken.  Op basis van deze match, ofwel vergelijking, kunnen de gegevens worden aangepast en geüniformeerd.

De programma’s zijn ook in staat de gegevens in de kolommen op te splitsen. Wanneer er bijvoorbeeld een kolom genaamd ‘adres’ is waarin alle onderdelen van het adres worden genoemd: straatnaam, huisnummer, huisnummertoevoeging en plaatsnaam, wordt het doen van een betrouwbare analyse beperkt. Een straatnaam en nummer, los van de plaatsnaam, kan namelijk al behoorlijk wat extra locatie informatie geven. Deze gegevens dienen dus in gescheiden kolommen in het bestand te staan. Ook hier kunnen de geavanceerde programma’s voor zorgen.

Datakwaliteit

 

 

Om een nuttige analyse te kunnen doen op je data, speelt datakwaliteit een grote rol. Het uniformeren en updaten van je database is daarom een noodzakelijke klus. En al stel je nog zoveel regels op betreft het invoeren van data in het bestand, fouten zijn onvermijdelijk. Daarom is het fijn dat een automatische matching altijd mogelijk is. Ben je benieuwd naar de kwaliteit van jouw databestanden? Laat dan een gratis kwaliteitscheck uitvoeren. Je krijgt na de check een duidelijk overzicht van de aantallen gegevens die niet correct zijn.

Wil je meer weten over het controleren of analyseren van je bestanden?

Neem contact op