Van prep naar predictive: onze visie op data

Geschreven door op Feb 29, 2020

Specialisten in dit werkgebied

Afgelopen week vond de Big Data Expo 2019 plaats in de jaarbeurs in Utrecht. Een plek waar mensen samenkomen met een gedeelde interesse voor data. Ook wij waren hier aanwezig om nieuwe ideeën op te doen en te leren van andere specialisten binnen dit werkgebied. Hieronder zullen we een aantal inzichten met jullie delen.

ETL proces

Een van de focuspunten tijdens het programma was het inrichten van een goed datalandschap. Het grootste gedeelte van de tijd is een data specialist namelijk bezig met het prepareren van de data. Ook tijdens de Big Data Expo werd er uitgebreid stilgestaan bij dit onderwerp en uitgelicht hoe belangrijk het is om het datalandschap in orde te hebben, voordat er fancy visualisaties gemaakt kunnen worden of voorspelmodellen worden toegepast. Maar hoe werkt dit?

ETL staat voor Extract, Transform en Load. Extract is het proces waarbij data zonder bewerking ontsloten wordt vanuit verschillende bronsystemen. Vervolgens moet de data getransformeerd worden (Transform). Dit wordt ook wel ‘data cleaning’ genoemd - de data wordt gestructureerd op basis van feiten en dimensies. De uitkomst hiervan is een datamodel van de verschillende datasets op basis van gelijke sleutels. De laatste stap in dit proces is Load, waarin de getransformeerde data wordt gebruikt voor onder andere de volgende doeleinden: dashboarding, predictive analytics en data management.

Cloud migratie

Op het gebied van cloud migratie waren er ook enkele sprekers, waaronder Rutger de Graaf (Data Architect bij Randstad Groep Nederland). In de afgelopen jaren hebben zij een volledige transitie vanuit lokale serverparken naar serverless oplossingen in de cloud van Amazon Web Services. Services als Redshift, Mattilion, S3, EC2 en Lambda functies zijn besproken. Het serverless transformeren van data in de cloud, zoals Little Rocket dit nu ook voor diverse klanten doet, bevestigd dat we een goede weg inslaan met hypermoderne oplossingen.

Daarnaast hebben we een bijeenkomst van VGZ bijgewoond. VGZ gaf een lezing over hoe zij met behulp van een consultancy bureau een datagedreven organisatie zijn geworden. Het oude datalandschap had hoge data-opslagkosten en kende een lange time-to-market. Vanwege die redenen is er gekozen voor een Azure cloud omgeving. Hiermee kan de hele organisatie snel en efficiënt toegang krijgen tot de beschikbare data. Voor VGZ was het belangrijk dat het platform geschikt is voor zowel BI en data science, met daarnaast nog een focus op data governance.

Dashboarding

Een van de manieren om de getransformeerde data te gebruiken en daarmee waarde te creëren voor een bedrijf is het gebruik van een business intelligence tool. Het is belangrijk om een tool te kiezen die bij je wensen past. Bijvoorbeeld: Klipfolio, Simplicate, Tableau, Looker, etc. Een van de toolings waar wij enthousiast over zijn is Power BI. Power BI is een zelfservice tool waarbij mensen met verschillende achtergronden, zoals het management team en data analisten, gemakkelijk gebruik kunnen maken van hetzelfde dashboard. Microsoft (Power BI) is door Gartner uitgeroepen tot de beste visualisatie tool van dit moment. Power BI is een Microsoft tool met dezelfde interface als excel, waardoor deze tool goed toegankelijk is voor eindgebruikers.

Predictive analytics

Gartner geeft aan dat er 4 levels zijn van analytics. Bij visualisaties van data wordt er vaak gebruik gemaakt van descriptive analytics, waarbij er terug wordt gekeken naar gebeurtenissen uit het verleden. Een andere waardevolle analytics vorm is predictive analytics, waarbij er gekeken wordt naar de toekomst. Een ander belangrijk aandachtspunt tijdens de Big Data Expo was uiteraard machine learning, wat steeds toegankelijker wordt en veel waarde kan toevoegen voor je organisatie.

Machine learning en predictive analytics gaan hand in hand, waarbij voorspelmodellen worden toegepast. Veelvoorkomende voorspelmodellen zijn logistische regressies, beslisbomen en neurale netwerken. Vragen die je met behulp van predictive analytics kunt beantwoorden zijn bijvoorbeeld:

- Welke consument gaat welk product aanschaffen?
- Op welk moment gaat iemand zijn/haar abonnement stopzetten (churn)?

Op basis van historische data gaat men kijken wanneer gebeurtenissen in de toekomst plaats zullen vinden. Hiervoor is het opnieuw heel belangrijk dat het datalandschap gestructureerd is ingericht. Binnenkort meer over dit onderwerp met een use-case!

Doe de datascan
Wil je weten welk level van datavolwassenheid jouw organisatie heeft, en wat je moet doen om verder te groeien? Doe dan eerst onze datascan.

  • ✔ Invullen kost enkele minuten
  • ✔ Je krijgt per e-mail een gratis rapport met toelichting
  • ✔ Binnen twee dagen weet je waar je staat

Benieuwd wat wij allemaal doen?

Bekijk al onze diensten en ontdek de mogelijkheden met data & AI.

Verwante
blogartikelen

De sleutel tot succes: een effectieve datastrategie

Een datastrategie, of tegenwoordig zelfs een data & AI strategie, vormt de route voor het verzamelen, analyseren en gebruiken van data & AI.
Leen Timmers
February 1, 2024
15 min

De combinatie van Artificial Intelligence en zinvol werken

Dat de aandacht voor data & AI toeneemt en dat de waarde steeds vaker aangetoond wordt is duidelijk. Zo blijkt uit het thema van de 16e...
Leen Timmers
January 18, 2024
10 min

Wat is Infrastructure as Code?

Veel bedrijven specialiseren zich in software ontwikkeling of data. Bij Little Rocket doen we beide. We zoeken continue naar de beste...
July 30, 2020
15 min

Wat is GraphQL?

Wanneer je start met het bouwen van een webapplicatie zijn er talloze vragen die je moet beantwoorden. Welke technieken gebruik ik voor...
Michel Boezerooij
October 15, 2020
15 min

De 7 dimensies van digitale volwassenheid die je moet weten voor je gaat transformeren

Digitale transformatie. We willen het allemaal, net zoals ‘iets met’ Big Data, Marketing Automation & AI. En we strugglen er ook...
Marc van Belkum
February 25, 2020
5 min

Groeien met data… daar komt geen einde aan

Zelfs als uit onze datascan blijkt dat je het hoogste level van datavolwassenheid hebt bereikt, kun je blijven groeien met data...
Marc van Belkum
June 20, 2023
10 min

Op weg naar een toekomst zonder geheimen 

Wat gaat er morgen gebeuren? Op die vraag kun je een behoorlijk betrouwbaar antwoord geven als je organisatie level 4 van...
Marc van Belkum
May 31, 2023
10 min

Waarom? Waarom? Waarom?

‘We halen veel nieuwe klanten binnen, halen onze salestargets, maar waarom stijgt onze omzet niet?’ Met dit soort waarom-vragen ga je aan...
Marc van Belkum
May 4, 2023
10 min

Wie is de beste data-ontdekker?

Komt uit onze datascan dat je op level 2 zit van datavolwassenheid? Dan is het tijd om te experimenteren! In deze fase heb je al wat data...
Marc van Belkum
April 26, 2023
10 min

Waarom kwalitatieve data broodnodig is

Elk bedrijf, groot of klein, heeft data. Maar niet elk bedrijf dóet iets met die data. In dit tweede blog (uit een serie van zes) lees je...
Marc van Belkum
April 5, 2023
10 min

Claim nú marketingbudget voor Google Analytics 4 in 2023

Kijk je soms, regelmatig of vaak naar de bezoekersaantallen van je website? Maar zegt de datum 1 juli 2023 je weinig? Dan ben je niet...
Leen Timmers
November 24, 2022
5 min

Waarom hardlopers straks weglopen met datasynthese

Marc van Belkum
April 7, 2022
5 min

Third party data stopt, zet je eigen data in voor sales & marketing!

Met het steeds verder beperken van third party (cookie) data verandert het digital marketing landschap sterk. En daarmee ook de...
May 28, 2020
10 min

De waarde van data analyse voor jouw bedrijf

Ieder bedrijf genereert data, bewust of onbewust. Als je die data links laat liggen gebeurt er niets. Gebruik je data om beter te worden.
Jelle Scholten
May 20, 2020
5 min

In drie stappen van data naar business inzicht

In de afgelopen jaren hebben veel bedrijven steeds meer data verzameld. Waarom? Omdat data het nieuwe goud is....
Jelle Scholten
February 27, 2020
5 min

De vijf levels van data-volwassenheid

Hoe hard is het nodig voor jouw bedrijf om te investeren in data? Dat hangt af van twee dingen: hoe datavolwassen je concurrenten...
Marc van Belkum
September 7, 2022
4 min

“Dankzij data maken we nu slimmere keuzes”

We horen de term steeds vaker: datavolwassenheid. Terecht, wat ons betreft, want bedrijven die mede dankzij data...
Leen Timmers
October 5, 2022
3 min