Het was ergens halverwege de jaren 90. Ik had een hele berg gegevens tot mijn beschikking.
En het rekenprogramma op mijn pc bood de mogelijkheid om daar iets mee te doen. Een regressieanalyse maken bijvoorbeeld. Daarmee kun je kijken of er een bepaalde samenhang is. Mijn eerste kennismaking met Big Data.
Nu is het hot. Dat heb je wel vaker. Heeft wel iets weg van een veenbrand. Het is er wel, maar je ziet het nog niet. Ik wist het allang, dat het er was. Maar ik dacht, doei, ik zeg niks. Ik houd het lekker voor mezelf. Ik ga apen niet leren klimmen. Maar goed, nu is iedereen er mee bezig, dus tijd om uit de kast te komen.
Ik weet nog goed dat er een voorbeeld werd genoemd van een ijsverkoper. Stel je voor dat hij ’s morgens moet beslissen hoeveel bakken met ijs hij inlaadt. Daar zijn bepaalde factoren op van invloed. Ten eerste hoe het weer is. Schijnt de zon of valt er regen? En welke dag van de week is het? Zaterdag is voor ijsverkopers beter dan maandag. En op welke plek ga je staan? Bij een bos? Op de boulevard? Is het vakantietijd? Toeristen? Man, dat valt nog niet mee hoor, ijsjesverkoper zijn. Daar komt heel wat bij kijken.
En als je al die gegevens in mooie tabellen zet en er een regressieanalyse op los laat, dan geeft dat soms zomaar verrassende uitkomsten. Op maandag in de regen naar het strand van Katwijk? Doe maar niet. Kost je geld. Maar een zonnige, warme zaterdag in juli op dezelfde plek? Wow, dan ben je om half vier los! Maar omdat je dat van tevoren al wist, komt je vrouw om drie uur een nieuwe lading brengen. Kijk, dat is anticiperen!
Nou, dat leek me wel wat. Want ik wilde ook graag weten wanneer we nu het beste veel bloemen konden veilen. Dat doe je toch het liefst als ze duur zijn. En dus ging ik aan het werk. Kolommen met aantallen van onszelf en van de veiling. Opbrengstprijzen ernaast. De buitentemperatuur op basis van weekgemiddelden. Bloemendagen. Man man, wat een cijfers.
Toen de analyse. En wat bleek? Bij weinig aanvoer ging de prijs omhoog. Tropisch weer? Grote aantallen bloemen voor lage prijzen. Moederdagen, Vrouwendag, Valentijn? Dure handel. Ja, daar sta je van te kijken hè? Ik zou er maar snel werk van maken, van die Big Data.