Schrijf geschiedenis met Big Data
Big data kenmerkt zich door enorm grote en complexe datasets die mensen en machines elke dag genereren. Denk bijvoorbeeld aan alle berichten en foto’s die op social media worden gepost of alle geluidsopnames van klantgesprekken in een call center van een maand. Maar ook realtime data afkomstig van bijvoorbeeld sensors in koffiemachines van alle hotels en restaurants of alle dagelijkse verkooptransacties van Amazon noemen we big data. Daarin ligt bijna altijd een schat aan informatie en nuttige inzichten verborgen en door big data analyse kun je heel interessante patronen ontdekken. In dit artikel gaan we in op het vakgebied big data analytics en kijken naar de 5 belangrijkste kenmerken van big data, de voordelen, de oplossingen & tools en geven voorbeelden. De grote vraag is natuurlijk hoe je als organisatie veel waarde uit big data kunt halen en welke stappen je dan moet zetten. Zodat je processen kunt optimaliseren, je business model kunt innoveren en je net als Netflix geschiedenis gaat schrijven met big data. Tot slot geven we je nog 7 praktische tips mee.
Wat is Big Data?
Big data zijn gegevens die ongestructureerd, complex of heel groot in omvang zijn. Die gegevens zijn veel lastiger te analyseren dan de eenvoudige data die netjes in een gewone database past. Je hebt specifieke tools, technieken, expertise en technologie (AI, machine learning, data lakes) nodig om big data te kunnen analyseren. Vandaar dat we big data als volgt definiëren:
Big data zijn grote hoeveelheden (ongestructureerde) gegevens die door grondig analyse vaak heel interessante informatie en kennis aan de oppervlakte brengen. Daarmee kun je je bedrijfsprocessen optimaliseren en de innovatie aanwakkeren.
Deze big data definitie maakt duidelijk dat big data niet zomaar gegevens in een systeem zijn en je die daar kunt laten ‘rusten’. Je moet ze verzamelen, continu analyseren, er waarde uit halen en dat vertalen naar procesoptimalisatie of innovatieve toepassingen. Zie ook de belangrijkste voordelen of bestel het complete Big Data boek.
De 5 kenmerken van Big Data
Big data laat zich karakteriseren door een aantal kenmerken die overeenkomen met 5 letters die allemaal beginnen met de letter V. Zo kun je de kenmerken gemakkelijk onthouden. Bij één of meer van de onderstaande situaties mag je spreken van big data:
- Volume: de omvang van de data is zo groot of dermate ongestructureerd dat die niet past in traditionele databasetabellen met rijen en kolommen. De opslag van die big data vindt plaats in filesystemen of moderne objectgeoriënteerde databases.
- Velocity: big data komt snel op en kan ook heel rap weer verdwijnen. Op social media wordt jouw laatste tweet al snel van de timeline van je volgers gehaald omdat andere berichten vechten om voorrang te krijgen omdat die bijvoorbeeld recenter of relevanter zijn. Big data kan dus snel verdampen, in het bijzonder data die door machines en apparaten wordt gegenereerd en via het mobiele netwerk direct de lucht in wordt geslingerd. Als je die niet opvangt, ben je ze kwijt.
- Variëteit: de data kent veel variatie, zowel in structuur, volume als betekenis. Mensen gebruiken soms woorden die heel anders bedoeld zijn of geïnterpreteerd kunnen worden. Gaat het woord ‘Utrecht’ nu om de provincie, de stad, de regio of om de gemeente? Denk ook aan verschillende schrijfwijzen zoals ‘s-Hertogenbosch of Den Bosch en synoniemen. Ook sarcasme kan big data analyse lastig maken. Denk bijvoorbeeld aan: ‘Mijn nieuwe laptop loopt na één dag alweer vast. Topkwaliteit!’ Is dat nu positief of negatief?
- Veracity: de big data geeft niet altijd een waarheidsgetrouw beeld. Zo kan een sentimentsanalyse op recensies volledig onbetrouwbaar worden door bots die automatisch gegenereerde reacties plaatsen of door spamaccounts die als enige doel hebben om reclame te maken voor een product of dienst. Soms zitten limieten bij API’s je in de weg waardoor je als je even niet oplet een incomplete dataset krijgt. De wisselende (data)kwaliteit en twijfels over de betrouwbaarheid maken het toepassen van de big data een grote uitdaging.
- Value: dit is waar het werkelijk om gaat en het meest belangrijke kenmerk. Welke waarde gaat big data analytics voor je organisatie en je klanten opleveren? Zorg dat je de voordelen van big data voor jouw organisatie (de businesscase) haarscherp in beeld krijgt anders investeer je misschien heel veel geld in een technologie die niks oplevert.
Figuur 1: Om de echte waarde van big data te begrijpen, moet je eerst de vijf bekende V’s begrijpen die big data kenmerken
De vijf kenmerken geven je misschien het gevoel dat big data analyse heel moeilijk en complex is. En dat gevoel is juist. In de praktijk mislukt helaas het overgrote deel van de big data projecten, onderzoek laat zien dat 80 tot 90% van de big data systemen niet in productie wordt genomen. Je hebt ervaren specialisten nodig die niet alleen kennis hebben van de technologie maar ook van taal, fotografie, bedrijfsprocessen, analyse, API’s, machine learning en innovatie. Maar ga niet op zoek naar dat schaap met vijf poten maar neem hier contact op met ons ervaren big data team.
Wat is Big Data analytics?
Het verzamelen, opslaan, analyseren en waarde uit big data halen is een serieus vakgebied. We noemen dit Big Data analytics. Omdat de gegevens zo groot zijn qua omvang of ongestructureerd moet je gaan vertrouwen op data lakes voor de opslag en artificial intelligence en machine learning modellen voor geautomatiseerde analyse. Maak dan bij voorkeur gebruik van krachtige computers in de cloud. Ouderwetse, handmatige data-analyse werkt in principe ook maar dan ben je als data analist misschien jaren bezig om alles op een rij te zetten. Wanneer je veel ongestructureerde data wilt analyseren zonder een machine learning model, is de kans op fouten groot of je ziet zaken over het hoofd. En daarnaast krijgt het AI-model veel meer waarde omdat je algoritme getraind kan worden op grote hoeveelheden data. De kans op een betrouwbaar en accuraat model neemt daardoor toe. De combinatie big data & AI levert een perfect samenspel op waarmee je de kans vergroot om succes met big data analytics te bereiken.
Soorten big data
Misschien maak je nu nog geen foto’s of geluidsopnames, of heb je geen weet van de logfiles die alle computers of routers in je bedrijf al genereren. Of het nu gaat om big data of behapbare gestructureerde data, de opslag vindt plaats op computers die werken met bits (nullen en enen). Op dit niveau zie je geen verschil. Maar op een hoger niveau kun je de volgende soorten big data ontdekken:
- Documenten: denk hierbij aan e-mails, offertes, beleidsnota’s en tekstbestanden
- Foto’s: maak je met je telefoon, een camera of speciale (ziekenhuis)apparatuur
- Video’s: maak je met je telefoon, een videocamera of geavanceerdere apparatuur
- Geluidsfragmenten: deze neem je op met een geluidsrecorder en speel je af met een player
- Sensorische of machine data: deze wordt gegenereerd door machines of apparaten
- RFID tags: denk hierbij aan polsbandjes of stickers met een chip die je kunt detecteren
- Social media berichten: deze stelt de gebruiker zelf samen op het social media platform
- Logfiles: deze big data wordt gegenereerd door computers, websites en systemen (event logs)
Wil je iets met big data beginnen en bereiken? Loop dan alle soorten eens langs en ga na of je deze gegevens in jouw organisatie makkelijk kunt identificeren en wie of wat de bron is. Vervolgens denk je met elkaar – vertegenwoordigers uit de organisatie, data analisten en IT’ers – na over eventuele analyses die je op die gegevens kunt loslaten om interessante, voorspellende inzichten boven water te krijgen. Er zit meer in big data dan je denkt. De kunst is om het eruit te halen.
De grootste voordelen
Big data analytics is weliswaar complex maar als je succes bereikt dan heeft het een geweldige positieve impact op je organisatie, klanten en processen. De voordelen zijn als volgt:
- Gestroomlijnde processen: je KPI’s kleuren bijna allemaal groen (zie ook KPI’s & Big Data)
- Verhoogde productiviteit: medewerkers verzetten veel meer werk in minder tijd
- Hogere klanttevredenheid: je klanten kun je veel beter gaan segmenteren en bedienen
- Vernieuw je organisatie: van reactief naar proactief met voorspellende modellen
- Innovatiekracht: ontwerp sneller nieuwe producten en diensten (big data innovatie)
- Datagedreven beslissingen: stimuleer beslissen met harde data, roei de intuïtie niet uit
De kracht van big data is dat je veel fijnmaziger te werk kunt gaan en veel vaker datagedreven kunt beslissen tegen gelijkblijvende of zelfs lagere kosten (na een initiële investering).
Figuur 2: Enkele voordelen van Big Data analyse
Ook verdwijnt de willekeur (bias) uit je processen omdat je big data analyses automatiseert. Willekeurige steekproeven behoren tot het verleden omdat je door automatisering alle gevallen kunt bekijken en analyseren. Ook je marktkennis kan toenemen en je kunt risico’s sneller opsporen. Dit alles maakt je organisatie financieel veel gezonder en robuuster.
Big data analyse: het proces in 8 stappen
Om de voordelen van big data te kunnen verzilveren, zet je een aantal stappen en richt je een verbetercyclus in. Deze stappen helpen je om structuur aan te brengen in je project en zorgen dat je start met een businessvraagstuk. Dat is cruciaal, want veel projecten laten in de praktijk geen rendement zien omdat ze bijvoorbeeld vanuit IT worden aangevlogen. Meestal wordt er dan wel heel veel data verzameld, maar nauwelijks geanalyseerd en toegepast. In onderstaande figuur komen de 8 big data analyse-stappen aan bod inclusief uitleg waarmee je wél succes met big data kunt gaan realiseren:
Figuur 3: de 8 stappen van een big data analyse.
- Identificeer en definieer het businessvraagstuk: hier ga je samen met je collega’s verkennen welke businessvraagstukken in aanmerking komen voor big data analyse. Richt je hierbij als eerste op de belangrijkste Key Performance Indicators (KPI’s) in jouw organisatie of bedrijfsproces.
- Verzamel en prepareer de relevante data: op basis van het businessvraagstuk ga je een eerste dataverzameling selecteren en die ga je waar relevant opschonen. Lees nu meer over het verbeteren van je datakwaliteit.
- Verken en analyseer de big data: je gaat nu de data verkennen met een BI tool zodat je begrip krijgt van de data en of deze het businessvraagstuk zou kunnen gaan oplossen. Ook ga je de data op allerlei manieren visualiseren. Lees direct meer over datavisualisaties.
- Stel een definitieve dataset samen: de stappen 1, 2 en 3 voer je net zolang uit totdat je een dataverzameling hebt die compleet, schoon en snel is.
- Bouw het big data model: je gaat nu een machine learning model opbouwen waar algoritmes gaan leren voorspellen, groeperen of classificeren op basis van datasets die geselecteerd zijn voor het trainen.
- Valideer het model: het model moet nu gevalideerd gaan worden door domeinexperts. Zij bepalen of de voorspellingen die het algoritme als resultaat geeft, kloppen.
- Breng het model naar productie: als het model valide is, gegeven de uitgangssituatie en het businessvraagstuk én je hebt de datakwaliteit onder controle, dan breng je het big data model in productie.
- Evalueer de resultaten van het model: toets met regelmaat of het model nog steeds goede uitkomsten en resultaten geeft. Op basis van deze evaluatie ga je een verfijndere versie maken van het model die nog nauwkeuriger kunt gaan werken.
Deze stappen van big data-analyse helpen je om altijd een businessvraagstuk centraal te stellen en laten je daarnaast de governance organiseren met verantwoordelijke rollen. Daarnaast maakt het stappenplan duidelijk dat het niet een eenmalige exercitie is, maar een doorlopend proces van verfijnen en verbeteren.
Tot slot: patronen vinden in big data kun je niet met traditionele analyse tools doen want de datasets zijn te groot of te complex qua structuur. Pas een algoritme zoals een neuraal netwerk of regressiemodel toe die de analyse voor jou op een efficiënte en effectieve manier gaat automatiseren.
Big data oplossingen & tools
Gelukkig zijn er tegenwoordig heel veel big data tools beschikbaar op de markt. Ze helpen je bij het onderzoeken en analyseren van big data, het toepassen van AI en het opbouwen van machine learning modellen. Uit ons jaarlijkse onderzoek (2025) naar BI & Analytics oplossingen blijkt dat de volgende softwarebedrijven het allerbeste scoren op big data: Microsoft, SAS, Oracle, TIBCO, Qlik en SAP.
Big data voorbeelden
Om te leren van andere organisaties en om inspiratie op te doen, geven we hier een aantal aansprekende voorbeelden van big data toepassingen in een aantal sectoren. Wat opvalt is dat het aantal voorbeelden van big data toepassingen in de publieke sector groot is. Daar is een logische verklaring voor: de publieke ruimte zelf is enorm groot. Grofweg alles wat zich tussen je huis, kantoor en andere bestemmingen bevindt komt in aanmerking voor het verzamelen van big data en bijbehorende analyse. We geven hier een aantal voorbeelden van big data toepassingen:
Foto’s en videobeelden zijn tegenwoordig eenvoudig automatisch te maken door bijvoorbeeld drones te laten rondvliegen met een (infrarood)camera. Denk bijvoorbeeld aan foto’s die kunnen aangeven of bomen ziek zijn, tuinen opgeruimd zijn en hoe hoog het onkruid staat. Maar ook tonen de foto’s aan of parkeerplaatsen bezet zijn door auto’s zonder geldige vergunning of geven ze de staat van onderhoud van objecten die in de buitenruimte staan door. Tevens zijn er legio voorbeelden van big data in de gezondheidszorg. Het is steeds gebruikelijker om big data analyses in te zetten waarmee specialisten ziektes in een vroegtijdig stadium kunnen ontdekken.
7 tips om succes met big data analytics te behalen
Een succesvol traject met big data kenmerkt zich door een open en lerende analytische bedrijfscultuur. En natuurlijk voldoende betrokkenheid en budgetmogelijkheden vanuit het management. Daarnaast is heel veel bedrijfskennis en gedegen proceskennis en creativiteit vereist van zowel de businessmensen als de data scientist. Om succes met big data te realiseren zorgt een projectleider verder voor:
- Afstemming met de organisatiedoelstellingen en KPI’s: de big data doelen komen overeen met de strategische doelstellingen en KPI’s, zodat big data een substantiële bijdrage kan leveren aan het realiseren van de organisatiedoelen. Zomaar in het wilde weg een data lake aanleggen is vrij nutteloos. Zorg dat niet de technologie leidend wordt, maar je bedrijfsstrategie, KPI’s en bedrijfsprocessen.
- Betrokken gebruikers: gebruikersparticipatie en vooral bewustzijn bij de gebruikers wat big data kan betekenen voor hun eigen werkproces, is van groot belang voor het slagen van een traject. Een agile & scrum aanpak kan helpen om die participatie te realiseren. Maar ook een opleiding big data of een inspiratiesessie mogen niet ontbreken.
- Bron- en datakwaliteit: de kwaliteit van de data is bij big data van nog groter belang dan bij normale data-analyse die je doorgaans toepast met Business Intelligence. Je gaat immers met big data bepaalde beslissingen automatisch nemen. De data vertelt je dat je nu linksaf moet gaan in plaats van rechtsaf. Een machine learning model dat in productie is genomen, functioneert vaak als een blackbox. Verder zijn in een data lake nog nauwelijks voorzieningen beschikbaar om de datakwaliteit over de hele linie te meten en te verbeteren.
- Ethiek & privacy: wanneer het gaat om de verwerking en analyse van persoonsgegevens kan wet- en regelgeving zoals de Algemene Verordening Gegevensbescherming (AVG), de GDPR of de meer recente AI-act al snel een behoorlijke blokkade opwerpen om big data analyses met succes toe te passen.
- Een solide datafundament: de kwaliteit en flexibiliteit van de data-infrastructuur moeten ook hoog zijn. Je hebt een robuust en schaalbaar systeem nodig want foto’s, teksten, machinedata en videobeelden kunnen al snel petabytes aan opslag vragen. Hoewel opslagruimte tegenwoordig niet zoveel meer kost, blijft omvang een aandachtspunt. Ook omdat de big data analyse door de complexiteit van de data al snel kan gaan vastlopen. Je hebt dus heel veel “brute” en ook slimme rekenkracht nodig om een goed systeem op te zetten waarmee je een toepassing snel en agile kunt ontwikkelen.
- Een afgewogen teamopbouw: er zijn voldoende ervaren data science experts en een team waarin je business en IT vaardigheden en competenties goed op elkaar kunt afstemmen. Zo kun je beter en sneller inspelen op diverse informatiebehoeften en elkaar aanvullen.
- Bruikbaarheid en gebruiksgemak: tot slot, de bruikbaarheid, toegankelijkheid en het gebruiksgemak van een big data toepassing moeten hoog zijn.
Bovenstaande zaken goed managen en succes behalen met big data analyses is bepaald geen eenvoudige opgave. Ze werken op elkaar in en vragen om een vaste hand, gedegen kennis van zaken en een flinke dosis ervaring met big data analytics. Vraag hier vrijblijvend consultancy aan.
Verdiep je hier verder in Big Data analytics
Om je nog beter te faciliteren met kennis en best practices over het vakgebied Big Data analytics geven we hier een overzicht voor meer verdieping:
Als jijzelf big data niet goed (genoeg) begrijpt dan loop je het risico om te falen. Zie ook onze 7 tips voor succes.
Meteen aan de slag met Big Data?
Wil jij ook starten met big data analyses? Neem dan gerust contact met ons op voor een oriënterend gesprek met een van onze big data-specialisten. We helpen je graag verder om jouw organisatie datagedreven te laten werken en wij worden heel blij wanneer we je kunnen helpen met succesvolle big data-toepassingen.
Over Passionned Group
Passionned Group is dé specialist in het ontwerpen en implementeren van innovatieve big data oplossingen. Onze gedreven big data consultants helpen bedrijven en overheden bij de kanteling naar een intelligente, datagedreven organisatie. Om het jaar organiseren wij de Dutch BI & Data Science Award™, de verkiezing van de Slimste organisatie van Nederland.
Veelgestelde vragen
Waarom zou je aan big data analytics beginnen?
In de eerste plaats omdat je waarschijnlijk al veel big data bezit zonder dat je het zelf misschien weet. Maar nog belangrijker is dat je met big data analyses patronen kunt ontdekken die jouw processen enorm kunnen versnellen en verbeteren. Laat je inspireren door de voorbeelden of bekijk ons Big Data boek.
Hoe zorg ik voor veilige verwerking van mijn big data?
Je moet voldoen aan de privacywetgeving en andere wetten. Een belangrijke Europese wetgeving die bescherming biedt tegen misbruik van data is de Algemene Verordening Gegevensbescherming (AVG), ook wel General Data Protection Regulation (GDPR) genoemd. De AVG geldt sinds 25 mei 2018 en heeft tot doel de privacy en gegevensbescherming van burgers binnen de Europese Unie te waarborgen. En de AI-act uit 2024 zou gebruikers van Big Data en AI nog beter moeten beschermen.
Waar betekenen de 5 V’s die big data kenmerken?
Volume, Velocity, Variëteit, Veracity en Value. Dit zijn de vijf kenmerken waaraan je big data kunt herkennen.
Wat zijn de belangrijkste bigdataplatforms?
Het bekendste bigdataplatform is Hadoop. Daarnaast zijn Apache Spark, Apache Cassandra, MongoDB, Apache Kafka, Microsoft Azure HDInsight, Google Cloud BigQuery, Elastic MapReduce van Amazon, Cloudera en IBM InfoSphere BigInsights populair. Raadpleeg voor een vergelijking van de verschillende bigdataplatforms de BI & Analytics Guide 2025.
Welke rollen heb ik nodig in mijn project?
In de eerste plaats een business consultant die al eerder big data projecten succesvol heeft uitgevoerd. Daarnaast heb je een data analist, een data scientist of machine learning engineer en een data engineer nodig. Neem contact met ons op voor inhuur.
Wat is geen big data?
Om te beoordelen of bepaalde gegevens geclassificeerd kunnen worden als normale data stel je de vraag of die passen in een tabel met rijen en kolommen. Is het antwoord ‘ja’ dan is het geen big data. Zodra de gegevens uit de tabel lopen (te veel rijen) of de structuur verminken dan spreken we wel over big data.
Wat betekent zero data?
Zero data is data die niet als zodanig wordt opgeslagen maar die je met behulp van technieken zoals inferentie toch kunt achterhalen.
Hoe kun je de datakwaliteit meten?
De kwaliteit van je data kun je beoordelen aan de hand van een aantal criteria zoals volledigheid, accuratesse, uniciteit, validiteit, tijdigheid en consistentie.
Is er verschil tussen big data en open data?
Ja, open data is informatie die vrij beschikbaar is voor het publiek, zonder beperkingen op toegang of gebruik, waardoor iedere burger of organisatie deze data kan raadplegen, hergebruiken en delen. Big data (definitie) kan ook als open data beschikbaar worden gesteld.