Inspiratie

DataNatives – twee dagen bijpraten over Big Data

27 en 28 oktober was ik in Berlijn voor de tweede editie van DataNatives – A conference for the data-driven generation. DataNatives is geen klein klasje nerds maar een tweedaags congres met meer dan 800 deelnemers (dubbel zoveel als vorig jaar!), een spreker of 30, drie paneldiscussies, fantastische catering, een startup-battle en een afterparty. Het is begint bijna op werken te lijken om alles bij te benen, steeds weer te kiezen uit het programma in twee zalen, exposanten en mede-congresgangers te spreken. En dat van negen tot zes. Maar het was weer zeer de moeite waard.

logo-datanatives

Het is duidelijk te merken dat de organisatoren van DataNatives de sprekers niet zomaar de vrije hand geven maar samen met hen een concept neerzetten van heldere bondige presentaties van 20 minuten dat staat als een huis. Zo word je als bezoeker in sneltreinvaart bijgepraat over de stand van zaken in de fascinerende wereld van Big Data. 

De techniek is er klaar voor

Een congres als DataNatives is een heerlijke bron van voorbeelden. Elke spreker heeft wel een verhaal over hoe nuttige toepassingen van het werk van gegevensgravers het dagelijks leven veraangenamen. De onderliggende techniek wordt minutieus uit de doeken gedaan, daar niet van. Maar het leukste om te vertellen blijven toch de verhalen.

DataNatives netwerken

Data science, de kunst van het graven in bergen gegevens op zoek naar antwoorden op grote en kleine vragen, is here to stay. Er zijn nog maar weinig banen (en levensgebieden) waar geen computers aan te pas komen. En it’s only the beginning. Wonen, transport en gezondheidszorg ondergaan momenteel een complete en onomkeerbare transformatie. Je bent allang geen wereldvreemde nerd meer als je het rendement van je zonnepanelen volgt via internet, je reisgedrag downloadt via OV-chipkaart.nl en in contact staat met de zorgrobot van je bejaarde moeder. En de drempels vallen weg: interactie met een computer via een toetsenbord is eigenlijk achterhaald; computers leren in een razend tempo stemmen en gebaren herkennen en zo op een natuurlijke manier met mensen communiceren.

Hier zijn dan de voorbeelden die ik op DataNatives hoorde, van datagebruik iets verder van je bed:

  • De stad Rennes gaf alle data over de locaties van stadsbussen vrij, en werd beloond met 9 bruikbare apps die lokale bedrijven ermee bouwden;
  • Parijs wilde de Place de la Nation, de megarotonde bij de Arc de Triomphe, ‘ontstoppen’, vroeg grote bedrijven als IBM om sensors te plaatsen en de data die die verzamelden vrij te geven voor wie wilde meedenken; dat leverde zeer bruikbare suggesties op waar de ambtenaren anders nooit op gekomen waren;
  • Machine learning wordt veelvuldig toegepast door ontwerpers: de computer mixt alle randvoorwaarden en beperkingen tot een werkbaar geheel in de gewenste stijl; is de menselijke ontwerper niet tevreden, dan onthoudt de computer wat het probleem was, en zorgt dat het niet meer voorkomt;
  • Zou je niet een data-steen in je huis willen hebben die allerlei handige informatie verzamelt over temperatuur, vochtigheid, onderhoud etc. etc., en die je als nieuwe bewoner kunt uitlezen?
  • IBM Watson integreert vele terabytes aan gezondheidsinformatie en is enorm bedreven in het vinden van de juiste behandeling voor een patiënt; in Azië is de techniek razend populair, artsen in Europa en de VS vertrouwen vooralsnog liever op hun eigen kennis;
  • De luchtvaart: je knikt de piloot bemoedigend toe bij het instappen, maar in feite doet hij minder dan je denkt: opstijgen gaat op ’t handje, bij het dalen coacht de piloot de computer, de rest van de vlucht vliegt de computer geheel zelfstandig;
  • Een van de sprekers liet een hoofdband zien voor mensen met epilepsie; bij patiënten die deze dragen zie je een aanval veel eerder aankomen en registreer je ook de kleinste absences (momentjes van ‘wegvallen’), ook als de patiënt ze niet in de gaten heeft;
  • Semantic fingerprinting is een techniek om een tekst te analyseren in trefwoorden en daarvan een visuele weergave te maken; analyseer alle krantenartikelen over Apple en die over Facebook en je krijgt een vergelijkbare fingerprint – het zijn technologiebedrijven met veel gemeenschappelijke kenmerken; zo kun je razendsnel teksten analyseren, ook in talen die je niet spreekt; speel er maar eens mee; hier kun je een fingerprint van een concept maken: cortical.io/topic-explorer.html en hier nieuwsberichten analyseren: http://37.139.2.231:3838/fp-dashboard/
  • De diplomatenwereld probeert data-analisten binnen te halen, om uit nieuwsberichten en social media gegevens een crisis te kunnen voorspellen en de burgers beter te informeren;
  • Een van de sprekers liet zien hoe hij razendsnel vuistdikke contracten over onroerend goed analyseert en een tabelletje oplevert met de cruciale gegevens.

De werkelijkheid is nog wel eens weerbarstig

Ok, mooie voorbeelden in overvloed. Maar waarom zijn dan nog niet alle huizen, stoplichten en ziekenhuisbedden op internet aangesloten? Waarom heeft nog niet elke directeur een scherm in de kamer hangen waarop in real time de prestaties van het bedrijf te volgen zijn? Waarom lezen advocaten nog zoveel stukken woord voor woord door, om van Kamerleden nog maar te zwijgen?

DataNatives bezoekers

De werkelijkheid is soms niet zo snel als de DataNatives graag zouden willen:

  • Overheidsinstanties vinden zichzelf vaak best transparant, maar als je op zoek gaat naar bruikbare data vind je alleen pdf bestanden of mooi vormgegeven Excels – daar kan een computer niets mee;
  • Het publiceren van data bij een bedrijf gaat vaak via één persoon of afdeling; medewerkers kunnen niet zelf data publiceren voor analisten; daardoor zijn lang niet alle gegevens die een analist graag wil hebben (tijdig) beschikbaar;
  • Eigenaars van data zijn bang dat de gegevens worden gehackt of gestolen; daar moet je praten als Brugman om gegevens mee te krijgen;
  • Data-analyse is duur; vele uren noeste arbeid door dure werknemers gaan eraan op voordat er zichtbaar resultaat is; dat kan heel frustrerend zijn;
  • Voordat een analist aan de slag kan moeten er een heleboel moeilijke vragen worden beantwoord: “Wat bedoel je precies met een klant, een transactie, succes?” en dat tot 6 decimalen achter de komma;
  • Niet iedereen is overtuigd van het nut van gestructureerde analyses. “Maar we hebben toch Google Analytics? Dat is gratis!” – ja, maar dat is heel grofmazig en heeft een foutenmarge van maar liefst 20%;
  • Leuk, zo’n continue datastroom, maar als de verbinding wegvalt kun je niets meer; hier moeten echt goede oplossingen voor bedacht worden; sowieso hoeven niet alle gegevens continu te worden ververst en dat scheelt heel wat dataverkeer, en we moeten beseffen dat het Internet of Things niet genoeg heeft aan huis-tuin-en-keuken-wifi;
  • Niet is de uitkomst van de analyses datgene wat het management hoopt, wenst of verwacht – ligt het dan aan de vraagstelling of gaat het echt zo beroerd? De stekker uit het project trekken is een verleidelijke oplossing;
  • Je moet wel willen veranderen: smart city projecten gaan altijd over de doorstroming van het verkeer, maar als je al weet dat er gewoon teveel auto’s in de stad zijn en te weinig goed openbaar vervoer, en je bent niet bereid dat probleem aan te pakken, laat dat smart city project dan maar zitten;
  • Nieuwe technologie trekt altijd criminelen aan: hackers en ander gespuis voeren een continu kat-en-muis-spel met de cyber security deskundigen van deze wereld; maar ook voor hen geldt: hoe meer aanvallen er gedaan worden, des te beter zien ze de volgende aankomen.

Hoe maak je een dataproject tot een succes?

De sprekers op DataNatives putten zich uit in tips en aanbevelingen. Wat ging er bij hen mis, en hoe kunnen wij het beter doen?

DataNatives spreker

De basisvoorwaarden voor een geslaagd data-analyseproject zijn heel klassiek:

  • goede data,
  • een organisatie die het ziet zitten,
  • een team dat de schouders eronder zet
  • en een management dat met de resultaten aan de slag gaat.

Maar natuurlijk. Verder nog iets om mee naar huis te nemen?

Jawel:

  • Beloof niet teveel; iedereen aan wie je een grafiek laat zien vuurt direct 10 vervolgvragen af; zeg nee;
  • Neem de tijd om gegevens op te schonen en doe dat extreem precies; GIGO (garbage in garbage out) is zonde van het geld;
  • Test, test en test; mooie grafiekjes maken is niet zo moeilijk, maar klopt het wel wat hier staat? Ga zo snel mogelijk de fout in, zodat je tijd hebt om het voor de deadline op te lossen;
  • Koester je metadata, oftewel documenteer je werk: wat betekent welke term, waar is de data, hoe verloopt het analyseproces, hoe moet het resultaat eruitzien op welk apparaat;
  • Zorg dat je als analist meegenomen wordt in het proces: hoe meer input je krijgt, des te beter de output;
  • Communiceer: zorg voor regelmatige berichtgeving over dataprojecten;
  • Visualiseer: vertaal je droge cijfers in aansprekende grafieken of infographics;
  • Gebruik je uitkomsten direct in de praktijk: test stellingen, reageer op trends, lanceer een nieuw product als de tijd rijp is, zorg voor goedkopere diensten.

Een mooie mix van gevorderde ervaringskennis, boerenverstand en het leerboek Organisatieverandering uit mijn psychologiestudie.

Wat levert het op?

Dat hoef je een zaal met datalovers natuurlijk niet te vertellen. Gegevensonderzoek levert bruikbare stuurinformatie op voor bedrijven, een voorsprong op de concurrent, een oplossing uit onverwachte hoek, bevestiging van je onderbuikgevoel en staving voor je beweringen.

Maar, er is meer:

  • Werk – de landen met de meeste robots hebben de laagste werkloosheid, heb ik me laten vertellen;
  • Reputatie – met transparantie maak je als bedrijf of overheidsorganisatie goede sier.

Nou, waar wacht je op?

Neem contact op voor een goed gesprek over je volgende dataproject.