Buiten het werk heb je misschien de beroemde uitspraak 'Correlatie is geen oorzakelijk verband' gehoord. Het klinkt misschien als een stuk theoretische onzin die, hoewel betrokken bij een recente Nobelprijs voor economie, niet relevant is voor uw werk als vraagplanner. Is dat zo, dan heb je misschien maar gedeeltelijk gelijk.

Extrapolatieve versus causale modellen

De meeste vraagvoorspellingen maken gebruik van extrapolatieve modellen. Deze modellen, ook wel tijdreeksmodellen genoemd, voorspellen de vraag op basis van alleen de waarden uit het verleden van de vraag naar een artikel. Plots van waarden uit het verleden onthullen trend en seizoensgebondenheid en volatiliteit, dus er is veel waar ze goed voor zijn. Maar er is nog een ander type model – causale modellen – dat de nauwkeurigheid van prognoses mogelijk kan verbeteren, verder dan wat u kunt krijgen van extrapolatieve modellen.

Causale modellen voegen meer invoergegevens toe aan de prognosetaak: informatie over veronderstelde prognose "stuurprogramma's" buiten de vraaggeschiedenis van een artikel. Voorbeelden van potentieel bruikbare oorzakelijke factoren zijn onder meer macro-economische variabelen zoals het inflatiepercentage, het groeipercentage van het bbp en grondstofprijzen. Voorbeelden die niet gebonden zijn aan de nationale economie zijn onder meer branchespecifieke groeipercentages en uw eigen advertentie-uitgaven en die van uw concurrenten. Deze variabelen worden meestal gebruikt als invoer voor regressiemodellen, dit zijn vergelijkingen met vraag als uitvoer en causale variabelen als invoer.

Voorspellingen met behulp van causale modellen

Veel bedrijven hebben een S&OP-proces waarbij maandelijks statistische (extrapolatieve) prognoses worden beoordeeld, waarbij het management de prognoses aanpast op basis van hun oordeel. Vaak is dit een indirecte en subjectieve manier om causale modellen in het proces te verwerken zonder de regressiemodellering uit te voeren.

Om daadwerkelijk een causaal regressiemodel te maken, moet u eerst een lijst van potentieel bruikbare causale voorspellende variabelen nomineren. Deze kunnen voortkomen uit uw inhoudelijke expertise. Stel, u vervaardigt vensterglas. Veel van uw glas kan terechtkomen in nieuwe woningen en nieuwe kantoorgebouwen. Het aantal nieuw gebouwde woningen en kantoren zijn dus plausibele voorspellende variabelen in een regressievergelijking.

Er is hier een complicatie: als je de vergelijking gebruikt om iets te voorspellen, moet je eerst de voorspellers voorspellen. Zo kan de verkoop van glas komend kwartaal sterk gerelateerd zijn aan aantallen nieuwe woningen en nieuwe kantoorpanden komend kwartaal. Maar hoeveel nieuwe woningen komen er komend kwartaal? Dat is zijn eigen prognoseprobleem. Je hebt dus een potentieel krachtig prognosemodel, maar je hebt extra werk te doen om het bruikbaar te maken.

Er is één manier om dingen te vereenvoudigen: als de voorspellende variabelen "vertraagde" versies van zichzelf zijn. Zo kan het aantal nieuw afgegeven bouwvergunningen een half jaar geleden een goede voorspeller zijn van de glasverkoop volgende maand. U hoeft de bouwvergunninggegevens niet te voorspellen, u hoeft ze alleen maar op te zoeken.

Is het een causaal verband of slechts een onechte correlatie?

Causale modellen zijn de real deal: er is een feitelijk mechanisme dat de voorspellende variabele relateert aan de voorspelde variabele. Het voorbeeld van het voorspellen van de verkoop van glas uit bouwvergunningen is een voorbeeld.

Een correlatierelatie is twijfelachtiger. Er is een statistische associatie die al dan niet een solide basis vormt voor prognoses. Stel, u verkoopt een product dat Nederlanders het meest aanspreekt, maar u heeft dit niet door. Nederlanders zijn gemiddeld de langste mensen van Europa. Als uw verkopen stijgen en de gemiddelde lengte van Europeanen toeneemt, kunt u die relatie goed gebruiken. Maar als het aandeel Nederlanders in de eurozone afneemt terwijl de gemiddelde lengte toeneemt omdat de mix van mannen versus vrouwen naar mannen verschuift, wat kan er dan misgaan? U verwacht dat de verkoop zal toenemen omdat de gemiddelde lengte toeneemt. Maar uw verkopen zijn eigenlijk vooral aan Nederlanders, en hun relatieve aandeel in de bevolking wordt kleiner, dus uw verkopen zullen in plaats daarvan echt afnemen. In dit geval is de associatie tussen verkoop en klantlengte een onechte correlatie.

Hoe kun je het verschil zien tussen echte en valse relaties? De gouden standaard is om een rigoureus wetenschappelijk experiment te doen. Maar u bent waarschijnlijk niet in de positie om dat te doen. In plaats daarvan moet u vertrouwen op uw persoonlijke 'mentale model' van hoe uw markt werkt. Als uw vermoedens juist zijn, zullen uw potentiële causale modellen correleren met de vraag en zal causale modellering voor u lonend zijn, hetzij als aanvulling op extrapolatieve modellen, hetzij ter vervanging ervan.