Wat is een Data Scientist: de 5 kerncompetenties, functieprofiel & relevante trends

Foto Herman van Dellen MSc
Auteur: Herman van Dellen MSc
Data Science Consultant
Inhoudsopgave

Hoe de data scientist werd uitgeroepen tot ‘meest sexy beroep van deze eeuw’

In het huidige datatijdperk zijn Data Science, Big Data en Machine Learning de buzzwords die de wereld aandrijven. Het beroep van data scientist, vaak bestempeld door de Harvard Business Review als ‘het meest sexy beroep van deze eeuw,’ heeft dan ook zijn aantrekkingskracht bewezen bij zowel studenten als opdrachtgevers. Data scientists spelen een cruciale rol in het omzetten van gegevens naar waardevolle inzichten en innovatie. In dit artikel bespreken we de essentiële vaardigheden van de data scientist, de trends binnen het vakgebied en de vijf kerncompetenties die elke data scientist zou moeten bezitten. Passionned biedt interim services om u te helpen bij het vinden van zowel beginnende als ervaren data scientists die perfect passen bij uw organisatiebehoeften.

Data scientists zijn moderne schapen met 5 poten

De data scientist is het moderne schaap met vijf poten. Hij combineert de functie van hacker, analist, communicator en ’trusted advisor’. Daarnaast moet dit schaap ook de business kunnen begrijpen en complexe problemen kunnen beantwoorden met eenvoudige oplossingen.

Wat zijn belangrijke zaken om op te letten bij een data scientist?

De belangrijkste aandachtspunten rondom een data scientist zijn:

  • Welke vaardigheden moet een big data scientist bezitten? Zie ook onze cursus data mining & R.
  • Welke stappen moet je zetten om een data scientist te vinden?
  • Hoe houd je ze geboeid en ‘verbonden’ met jouw organisatie?
  • Welke ontwikkelingen spelen er in het datascience vakgebied? Zie ook de AI trends 2024.
  • Welke werkzaamheden en verantwoordelijkheden behoren precies tot dit profiel? En hoe implementeer je die in je bestaande organisatie?

Antwoorden zijn niet eenvoudig te geven op deze vragen, maar hieronder geven we wel een eerste aanzet.

Functieprofiel: welke vaardigheden bezit een goede Big Data scientist?

De vaardigheden (skills) van een Big Data scientist zijn zeer uiteenlopend. Het is het moderne schaap met vijf poten. De belangrijkste vaardigheden zijn:

  • Een gedegen universitaire opleiding met als studierichting wiskunde, econometrie of statistiek. Met deze skills kan je op de juiste manier performance management inzetten.
  • Technische analysevaardigheden, zoals goed om kunnen gaan met statistiek en econometrie. Daarnaast is de data scientist expert in pakketten als SAS Visual Analytics, Tableau, Power BI en Watson analytics. Tot slot: kennis en ervaring met R of Python is belangrijk.
  • Technische computer skills. Hij moet goed om kunnen gaan met verschillende talen en tools. Hij moet ook in staat zijn hiermee snel resultaten te bereiken.
  • Een ‘onderzoekende geest’ hebben en buiten de bestaande kaders kunnen en durven te denken.
  • Een gedegen kennis hebben van de business en weten welke problemen belangrijk zijn om op te lossen.
  • Een goede communicator zijn en technische zaken aan niet-technische mensen, zoals marketingmensen, kunnen overbrengen.

Dit zijn skills die moeilijk in één persoon te verenigen zijn. En als je dit schaap met 5 poten al vindt, dan is het nog maar de vraag hoe je die lang genoeg verbonden kunt houden aan je organisatie.

Trends voor data scientistsOntwikkelingen gaan razendsnel, zowel op technisch gebied (BI software) als op business niveau. Steeds meer organisaties bepalen met Big Data Science het verschil. Dit zijn de belangrijkste trends die je bij een data scientist nauwlettend in gaten moet houden:

  • Vrije vogels: data scientists moet je vrijlaten om te zoeken in Big Data naar oplossingen voor business problemen die spelen in een bepaalde markt.
  • Eigen tools first: laat de data scientist gebruikmaken van eigen tools waar ze handig mee om kunnen gaan. Er zijn namelijk zoveel verschillende software tools voor de verschillende uitdagingen die er zijn dat het onmogelijk is om standaarden te definiëren. Laat staan dat je deze kunt afdwingen. En de groei is er ook nog lang niet uit, dus laat de keuze vrij.
  • Storage is key: zorg voor voldoende snelle opslag die grote hoeveelheden data kan verwerken. De cloud is hiervoor de aangewezen oplossing en ‘in memory dataverwerking’ komt steeds meer in zwang. Nadeel hiervan is dat steeds meer data ‘buiten de deur’ komt te staan.
  • Druk neemt toe: vooral startups moeten steeds sneller, met data, kunnen aantonen of ze levensvatbaar zijn. Dit legt grote druk op de data scientist om zeer snel de benodigde data te leveren die ook nog eens beschikbaar en correct moet zijn.
  • Oververhitting arbeidsmarkt: de vraag naar data scientists overstijgt het aantal nieuwe professionals dat de arbeidsmarkt betreedt. Organisaties lopen daardoor het gevaar niet mee te kunnen komen. Het lukt ze niet om een data scientist aan zich te binden.
  • Van individu naar team: het is erg moeilijk om het moderne schaap met de vijf poten, die ene doorgewinterde data scientist, te vinden. Om die reden zie je steeds vaker dat er teams ontstaan, die gezamenlijk die functie invullen.

Dit zijn bij lange na niet alle trends. Er zijn veel ontwikkelingen gaande op het gebied van softwareontwikkeling. Steeds meer Business Intelligence leveranciers integreren Big Data onderdelen in hun software. Ze proberen hiermee het proces van de data scientist te automatiseren en te vereenvoudigen. Bekijk ook onze BI & Analytics Guide™ 2024.

Wil je (freelance) data scientists inhuren?

Data scientists zijn schaars en moeilijk te vinden. De Passionned Group is al meer dan 15 jaar werkzaam in het werkveld van machine learning en data science. Hierdoor hebben we een groot netwerk kunnen opbouwen. Het is voor ons dus wel mogelijk om het moderne schaap met de vijf poten te vinden of anders een team met de vereiste competenties samen te stellen. Ben je op zoek naar een interim data scientist, neem dan gerust contact met ons op. Wij gaan dan snel aan de slag om de juiste kandidaat met jouw organisatie te matchen.

De 5 competenties van een goede data scientist

Wat maakt (of breekt) een goede Data Scientist?Allereerst verwacht je van een data scientist uiteraard de zogenoemde “harde vaardigheden”. Denk dan aan kwantitatieve vaardigheden als statistiek, machine learning en datamining. Maar ook de soft skills moeten wel degelijk aanwezig zijn.

1. Harde vaardigheden bij Data Science

Een data scientist heeft begrip van de wet van de grote getallen. Hoe groter de dataset, hoe kleiner de invloed zal zijn van vreemde uitschieters. Hij of zij heeft ook technisch inzicht en beschikt over een uitstekend begrip van het ontwerp en gebruik van databases, algoritmes en data lakes. Hij of zij heeft de attitude van een goede programmeur en hacker, vasthoudend, met oog voor detail. Hij of zij is in staat om te programmeren.

2. Zachte vaardigheden bij Data Science

Ook heeft de data scientist een goed begrip van de business. Hij of zij ziet de uitdagingen van zijn organisatie en welke rol data science daarbij kan spelen. Bij het selecteren van de optimale kwantitatieve techniek, moet je als data scientist rekening houden met de specifieke kenmerken van het business-probleem.

3. Analytische modellen selecteren

Typische eisen voor analytische modellen zijn:

  • actievermogen: in hoeverre kan het analytisch model het business-probleem oplossen?
  • prestaties: wat zijn de statistische prestaties van het analytisch model?
  • interpretatievermogen: kan je de werking van het analysemodel makkelijk verklaren aan beslissers?
  • operationele efficiëntie: hoeveel inspanning is nodig voor het opzetten, bouwen, evalueren en monitoren van het analytische model?
  • naleving van de regelgeving: is het model in lijn met de regelgeving en de ethiek?
  • economische kosten: wat zijn de kosten van het opzetten, bouwen, en het onderhouden van het model?

Met deze combinatie van eisen moet de data scientist in staat zijn de beste analytische techniek te selecteren om het business-probleem op te lossen.

4. Communicatieve vaardigheden

Daarnaast beschikt een goede data scientist over veelzijdige communicatievaardigheden. Hij of zij is een absolute teamspeler en heeft een aangeboren nieuwsgierigheid voor het verkennen van en experimenteren met data science.

5. Complexe zaken vertalen voor gewone mensen

Hij of zij is in staat moeilijke complexe zaken te vertalen voor ‘gewone mensen’. Hij of zij slaat de brug tussen analytische modellen en de eindgebruiker. Data scientists maken adequaat gebruik van heldere datavisualisaties. Deze mensen zijn van nature sceptisch en vasthoudend. Ze stellen een heleboel vragen over de levensvatbaarheid van een bepaalde oplossing en of het wel echt zal werken. Nieuwsgierigheid en creativiteit zorgen ervoor dat de data scientist niet voor één gat te vangen is. Hij of zij bouwt uiteraard mee aan het snel ontwikkelende kennisgebied.

De voordelen van een data scientist via Passionned Group

Data scientists opereren veelal in een omgeving die meer traditioneel is ingericht voor het oplossen van Business Intelligence vraagstukken. We zien dan ook vaak een groot gat ontstaan tussen beide werelden. Daardoor blijken goed bedoelde initiatieven uiteindelijk niet succesvol te zijn. Een goede roadmap gaat je helpen om deze afstand te verkleinen.

Met al onze ervaring en de tools die de data scientist automatisch meeneemt kun je een groot aantal valkuilen voorkomen. De kans op succes kun je hierdoor aanzienlijk vergroten. Passionned Group is volledig onafhankelijk en dus niet gebonden aan enige leverancier. Dit maakt onze positie in de markt uniek. Zie ook onze BI & Analytics Guide™ 2024.

stuur hier je aanvraag in

Hoe kun je jezelf ontwikkelen tot een (nog betere) data scientist?

Even een cursus volgen en dan aan de slag als ervaren data scientist is natuurlijk geen optie. Een goede data scientist onderzoekt veel, bouwt ervaring op en leert elke dag in de praktijk. Dit leer je niet even in een cursus, maar een gedegen Data Science opleiding of een 3-daagse praktische cursus machine learning helpt wel om een goede start te maken. Ons Data Science boek kan je ook helpen om extra kennis op te doen.

De data analist van 15 jaar terug is niet de data scientist van nu. Er is een andere set aan vaardigheden nodig. Het gaat al lang niet meer om het maken van de juiste analyse. Het gaat erom dat je data inzet om business problemen in ‘het hier en nu’ op te lossen.

Trainingen in Data Science Analytics

Ontwikkelingen staan niet stil en hoe ‘verkoop’ en implementeer je inzichten die je verkrijgt in je eigen organisatie? Met de BI & Data Science opleidingen van de Passionned Academy leer je hoe je weerstanden kunt overwinnen en succesvol kunt zijn als data scientist.

Passionned Academy voor de Data scientist

De Passionned Academy biedt onder meer een 10-daagse opleiding ‘Master of Data Science’. Hierin krijg je een overview van het volledige vakgebied en ga je op essentiële onderdelen de diepte in. Ook bieden we opleidingen aan op het gebied van ‘soft-skills’. Wil je hier meer over weten? Vraag dan nu onze brochure aan.

Vacatures Big Data scientists

Vacatures Big Data scientistsPassionned Group is voor haar klanten en projecten vaak op zoek naar data scientists. Wil je jouw horizon verbreden, nieuwe ervaringen opdoen of ‘gewoon eens ergens ander kijken’, neem dan eens contact met ons op. We nodigen je graag uit voor een oriënterend gesprek. Of bekijk de data scientist vacature.

Data science: de wereld van veel data

Data science is al lang niet meer weg te denken uit ons dagelijks bestaan. Veel organisaties zijn er mee bezig en zetten data science in om het verschil te maken. Heel snel verovert Big Data en de analyse hierop de wereld. Denk bijvoorbeeld aan smartphones die objecten in foto’s herkennen of data analyses waarmee je veel beter ziektes op kan sporen. Maar denk ook aan organisaties als Netflix. Ze maken alleen nog maar films en series op basis van Big Data van hun gebruikers.

Degene die dit allemaal voor elkaar (moet) krijgen zijn de data scientists. Dit zijn niet de personen van 15 jaar terug die statistisch juiste rapportages afleverden. Het is de data scientist van nu die zelfstandig met een ‘vrije geest’ oplossingen zoekt voor echte business problemen. Ze maken daarbij gebruik van allerlei gestructureerde gegevens en zeer complexe databronnen. Dit is echter alleen mogelijk als je een goede architectuur hebt staan.

Tekort aan gekwalificeerde data scientists

De technologie en het kunnen ontsluiten van databronnen gaat zo snel, dat er een schrijnend tekort is aan goed gekwalificeerde data scientists. Het beroep is zeer aantrekkelijk. Veel (jonge) mensen gaan nu dit vakgebied bestuderen. Maar het zal nog enige tijd duren voor de enorme schaarste weg is. Tot die tijd is er veel werk te verzetten. Dat verzetten van het werk begint niet met de vraag: “waar halen we de juiste mensen vandaan?” Het begint juist met de vraag: “wat gaan de data scientists in jouw organisatie doen en vooral wat kunnen ze toevoegen?”

Chronisch tekort aan Data Scientists breekt op

Het aantal vacatures voor de functie van Data Scientist groeit snel. Deze functionaris verovert in rap tempo een belangrijke plek binnen organisaties en de salarissen voor deze functie stijgen fors. Een onderzoek van het McKinsey Global Institute toont aan dat het gebrek aan analytisch ingestelde functionarissen, en managementtalent om Big Data succesvol in te zetten, momenteel één van de grootste uitdagingen is voor organisaties.

Vraag met 50% gegroeid

De vraag naar Data Scientists is in de afgelopen jaren dan ook met 50% gegroeid en uit onderzoek blijkt dat dit enorme tekort alleen nog maar verder zal oplopen. De jacht op Data Scientists is daarmee geopend. Alle inspanningen zijn gericht op het binnenhalen van het zogenaamde schaap met de vijf poten. De Data Scientist zal vroeg of laat ook binnen jouw organisatie zijn intrede doen. Deze functionaris moet veel in zijn of haar mars hebben om de explosie van nieuwe mogelijkheden die big data biedt te ondersteunen en richting te geven. Maar is dit verwachtingspatroon wel realistisch?

Dé Data Scientist bestaat niet

Regelmatig zie ik in vacatureteksten een complete waslijst aan harde functie-eisen, competenties en vaardigheden voorbijkomen waaraan een Data Scientist allemaal moet voldoen. Denk hierbij aan een gedegen universitaire opleiding met als studierichting wiskunde, econometrie of statistiek. Maar ook aan technische analysevaardigheden, zoals goed om kunnen gaan met data mining en bijbehorende software. Daarnaast moet deze functionaris om kunnen gaan met verschillende programmeertalen en tools en in staat zijn hiermee snel resultaten te bereiken.

De Data Scientist moet bovendien een onderzoeker zijn die buiten de kaders durft te denken en buiten de lijntjes durft te kleuren. Daarnaast moet hij of zij beschikken over een gedegen kennis van businessprocessen en problemen. En tot slot moet deze figuur een excellente communicator zijn. Hij of zij moet de mogelijkheden en beperkingen van ingewikkelde technologie helder over kunnen brengen en uitleggen.

Kort samengevat is de Data Scientist eigenlijk een aanjager van datagedreven werken en innoveren. Maar deze gevraagde superman of supervrouw, oftewel het spreekwoordelijke schaap met de vijf poten, bestaat natuurlijk helemaal niet!

Een schaap met vijf poten loopt moeilijk

Bovendien loopt het hypothetische schaap met vijf poten waarschijnlijk moeilijk. Denk je ook niet? Er zijn twee, inmiddels achterhaalde, denkpatronen verantwoordelijk voor het feit dat organisaties momenteel volstrekt irrealistische functie-eisen stellen aan een Data Scientist.

  1. De ver doorgevoerde arbeidsdeling in organisaties voldoet tegenwoordig niet meer
  2. Organisaties willen voor een dubbeltje op de eerste rang zitten

Moderne organisaties denken in rollen in plaats van functies

Bij de oude wijze van organiseren zette men standaard alle kaarten op de specialist, die als een soort “reddende engel” de organisatie uit de brand zou moeten helpen. Een wijze van denken die nog dateert uit de tweede industriële revolutie, waarbij ver doorgevoerde arbeidsdeling tot gigantische productiviteitsverbeteringen leidde.

Tegenwoordig staat dit haaks op de moderne visie waarbij een wendbare organisatie en goed geoliede teams hét verschil maken. Bovendien keren steeds meer organisaties op hun schreden terug. Ze kiezen voor het werken in rollen in plaats van functies. Generalistische taken en rollen zijn cruciaal om een dialoog uit te lokken en gaande te houden. En zelforganisatie is tegenwoordig noodzakelijk om agility in je organisatie te realiseren. Zo kunnen organisaties overleven, zeker in een tijd waarin de time-to-market steeds vaker doorslaggevend is.
De opleiding Data Science Afbeelding van De opleiding Data ScienceTijdens deze Data Science training maak je in 10 intensieve dagen kennis met (generatieve) Artificial Intelligence, machine learning, BI, Big Data, business cases, valkuilen, privacy, ethiek maar vooral de governance en succesfactoren.bekijk de opleiding Data Science

Slimme organisaties wedden nooit op één paard

Het tweede denkpatroon is eigenlijk meer een brevet van onvermogen. Voor de functie van Data Scientist stelt HR samen met de business manager een vacaturetekst op waarin heel veel verschillende competenties, vaardigheden en eigenschappen allemaal in één functie worden geperst. Lees de vacatures er maar eens op na. Intuïtief weet iedereen wel dat één persoon nooit al die taken en rollen in zijn eentje naar behoren kan uitvoeren. Maar het wervingsbudget laat het niet toe om twee of drie mensen aan te nemen.

Tegen beter weten in besluit de organisatie vervolgens om op zoek te gaan naar de ideale kandidaat. Die ideale kandidaat wordt nooit gevonden. De kandidaat die uiteindelijk wél wordt aangenomen, brandt in no time op, omdat hij niet kan voldoen aan de overspannen verwachtingen.

Het is overigens nog maar de vraag of die superspecialist überhaupt wel gewenst is. Met een superspecialist loop je een reëel risico dat de echte dialoog nooit tot stand komt. Vaak opereert hij of zij namelijk vanuit een ivoren toren. Hierdoor blijven de échte inhoudelijke discussies uit. Op de werkvloer klinkt het bekende riedeltje “U vraagt en wij draaien”, in plaats dat er een stevige discussie ontstaat over de ratio van de voorgestelde oplossingen en verbeteringen. Zo wordt 1+1 nooit 3, de synergie blijft uit.

Denk je nog steeds als een Fayolist?

Henri Fayol was een Franse mijndirecteur die een grote bijdrage leverde aan de organisatiekunde aan het begin van de 20ste eeuw. Hij formuleerde een aantal belangrijke principes van organiseren die je nu in gedrag of visie regelmatig nog terug ziet komen. Het waren indertijd geweldige ideeën om schaalbaarheid te creëren, maar nu is dit gedachtegoed minder productief en relevant, zeker voor wendbare, zelfsturende teams.

Fayol kwam tot veertien principes van het organiseren, waarvan de volgende vijf de belangrijkste waren: specialisatie, eenheid van commando, formele chain of command, eenheid van richting en tot slot autoriteit en verantwoordelijkheid. Principes die haaks kunnen staan op die van agile teams die wendbaarheid en soms zelfs disruptie voor ogen moeten hebben. Het Fayolistische gedachtegoed heeft vaak geleid tot patronen bij managers en het management die hun keuzes hierop blijven baseren, soms bewust en soms onbewust.

Investeer in een betaalbaar Data Science-team

Veranderingen vinden tegenwoordig plaats in de haarvaten van de organisatie, dus alleen teams kunnen de problemen snel aan zien komen, analyseren en met elkaar oplossen. Dit vereist wendbare medewerkers, methoden die kortcyclisch werken ondersteunen en een combinatie en overlap van actuele kennis en schaarse competenties, waaronder die van een Data Scientist. Een team of projectteam maakt graag gebruik van zijn of haar specialistische kennis.

Hierbij is het cruciaal om te bepalen voor welke situaties die vijfpotige superspecialisten echt nodig zijn en wanner je met minder toe kan. Dit voorkomt dat je peperdure teams samenstelt die zichzelf nooit zullen terugverdienen. Zo kunnen teamleden met verschillende gradaties van bijvoorbeeld analytische vaardigheden met elkaar prima een vruchtbare dialoog voeren over de betekenis van data en mogelijke oplossingsrichtingen.

Extra ingrediënten

In de kern kennen we maar een beperkt aantal competentiegroepen. Dit zijn taak- of rolgerichte, intellectuele, emotionele, organisatorische, sociaal/communicatieve en tot slot ontwikkelingsgerichte competenties. Teamcompetenties vormen in onze huidige, agile wereld nog een extra onmisbaar ingrediënt. Hoewel deze competenties eigenlijk grotendeels overeenkomen met de sociaal/communicatieve vaardigheden. Zodra het doel van een project of team duidelijk is, kun je vrij snel in kaart brengen welk van deze competenties je moet inbrengen om de doelen te behalen. Daarbij moet je zorgvuldig nagaan wat het belang is van dialoog, samenwerken, onderscheid en autonomie in het kader van sturen en beslissen. Op basis van deze uitgangspunten wordt dan duidelijk op welke kerncompetenties je de nadruk moet leggen en waar je eventueel een overlap tolereert om snel meters met elkaar te kunnen maken.

Professioneel Data Scientist koestert zijn relationele netwerk

De belangrijkste Data Science-vaardigheden zijn relationeel van aard. De bevestiging hiervan valt te lezen in de beschrijving die Hal Varian van Google geeft over Data Science-vaardigheden: ‘The ability to take data – to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it – that’s going to be a hugely important skill in the next decades.’ De meeste van de genoemde vaardigheden hebben alleen zin in relatie tot collega’s. Alleen binnen de context van een groep mensen of tussen twee individuen krijgt data betekenis! Data bevordert en voedt relationele processen.

Wat is het belang van je eigen datakwaliteit?

Kun je deze vraag nog niet goed beantwoorden dan is het advies: ga eerst met andere zaken aan de slag. Business intelligence en datagedreven werken moeten op een zeer goed niveau zijn willen data scientists vaste grond onder hun voeten hebben. We zien maar al te vaak dat organisaties zich vol op Big Data, AI & machine learning storten, zonder dat ze zich voldoende bekommeren om hun eigen data(kwaliteit) en besturing. Aan beide moet je werken als je jouw organisatie succesvol de datagedreven toekomst in wil loodsen.

Heb je interesse of wil je meer weten?

Wil je meer weten over het uitdagende werk van data scientists, wil je een ervaren data scientist inhuren of wil je ervaringen met ons delen? Wij komen graag met je in contact. Maak hier een afspraak met ons.

Over Passionned Group

Logo Passionned Group, de specialist in interim Data scientistsPassionned Group zit al jaren bovenop de trends die spelen rondom Business Intelligence & Data Science. Onze consultants en data scientists vertalen deze trends naar concreet implementeerbare oplossingen voor onze klanten. Enkele voorbeelden vind je in ons portfolio met lopende of afgeronde opdrachten. Om het jaar organiseren we de Dutch BI & Data Science Award™.

Neem contact met ons op

Onze (business) data scientists

» Bekijk alle experts