Wat maakt een probabilistische voorspelling?

Wat is al die heisa rond de term 'probabilistische prognoses'? Is het gewoon een recentere marketingterm die sommige softwareleveranciers en consultants hebben bedacht om innovatie te veinzen? Is er een echt tastbaar verschil in vergelijking met voorgaande "best passende" technieken? Zijn toch niet alle voorspellingen probabilistisch?

Om deze vraag te beantwoorden, is het nuttig om na te denken over wat de voorspelling u werkelijk vertelt in termen van kansen. Een "goede" voorspelling moet onbevooroordeeld zijn en daarom een 50/50 waarschijnlijkheid opleveren die hoger of lager is dan de werkelijke. Een "slechte" voorspelling zal subjectieve buffers inbouwen (of de voorspelling kunstmatig verlagen) en resulteren in een hoge of lage vraag. Overweeg een verkoper die opzettelijk zijn prognose verlaagt door geen verkopen te rapporteren die hij verwacht te sluiten als 'conservatief'. Hun voorspellingen zullen een negatieve voorspellingsbias hebben, aangezien de werkelijke waarden bijna altijd hoger zullen zijn dan wat ze voorspelden. Overweeg aan de andere kant een klant die een opgeblazen prognose aan zijn fabrikant geeft. Bezorgd over stockouts, overschatten ze de vraag om hun aanbod zeker te stellen. Hun voorspelling zal een positieve bias hebben, aangezien de werkelijke waarden bijna altijd lager zullen zijn dan wat ze voorspelden. 

Dit soort ééncijferige voorspellingen die hierboven zijn beschreven, zijn problematisch. We verwijzen naar deze voorspellingen als "puntvoorspellingen", omdat ze één punt (of een reeks punten in de tijd) vertegenwoordigen op een plot van wat er in de toekomst zou kunnen gebeuren. Ze geven geen volledig beeld, want om effectieve zakelijke beslissingen te nemen, zoals het bepalen hoeveel voorraad er moet worden opgeslagen of het aantal werknemers dat beschikbaar moet zijn om aan de vraag te voldoen, is gedetailleerde informatie vereist over hoeveel lager of hoger de werkelijke waarde zal zijn! Met andere woorden, u hebt de kansen nodig voor elke mogelijke uitkomst die zich kan voordoen. Dus op zichzelf is de puntvoorspelling niet probabilistisch.   

Om een probabilistische voorspelling te krijgen, moet u de verdeling van mogelijke eisen rond die voorspelling kennen. Zodra u dit hebt berekend, wordt de voorspelling 'probabilistisch'. Hoe prognosesystemen en beoefenaars zoals vraagplanners, voorraadanalisten, materiaalmanagers en CFO's deze waarschijnlijkheden bepalen, is de kern van de vraag: "wat maakt een prognose probabilistisch?"     

Normale verdelingen
De meeste prognoses en de systemen/software die ze produceren, beginnen met een voorspelling van de vraag. Vervolgens berekenen ze het bereik van mogelijke eisen rond die voorspelling door onjuiste theoretische aannames te doen over de verdeling. Als u ooit een "betrouwbaarheidsinterval" in uw voorspellingssoftware hebt gebruikt, is dit gebaseerd op een kansverdeling rond de voorspelling. De manier waarop dit vraagbereik wordt bepaald, is door uit te gaan van een bepaald type distributie. Meestal betekent dit dat we uitgaan van een klokvormige verdeling, ook wel bekend als een normale verdeling. Wanneer de vraag intermitterend is, kunnen sommige systemen voor voorraadoptimalisatie en vraagvoorspelling aannemen dat de vraag Poisson-vormig is. 

Nadat de prognose is gemaakt, wordt de veronderstelde verdeling rond de vraagprognose gegooid en hebt u uw schatting van kansen voor elke mogelijke vraag - dat wil zeggen, een "probabilistische prognose". Deze schattingen van de vraag en de bijbehorende waarschijnlijkheden kunnen vervolgens worden gebruikt om desgewenst extreme waarden of iets daartussenin te bepalen. De extreme waarden in de bovenste percentielen van de distributie (dwz 92%, 95%, 99%, enz.) worden meestal gebruikt als invoer voor voorraadbeheermodellen. Bestelpunten voor kritieke reserveonderdelen in een elektriciteitsbedrijf kunnen bijvoorbeeld worden gepland op basis van een 99.5%-serviceniveau of zelfs hoger. Terwijl een niet-kritiek serviceonderdeel kan worden gepland op een 85%- of 90%-serviceniveau.

Het probleem met het maken van aannames over de verdeling is dat je deze kansen verkeerd zult interpreteren. Als de vraag bijvoorbeeld niet normaal verdeeld is, maar u een klokvormige/normale curve op de voorspelling afdwingt, hoe kan het dan dat de kansen onjuist zijn. In het bijzonder wilt u misschien het voorraadniveau weten dat nodig is om een 99%-kans te bereiken dat de voorraad niet opraakt en de normale distributie zal u vertellen om 200 eenheden in voorraad te hebben. Maar als je het vergelijkt met de daadwerkelijke vraag, kom je erachter dat 200 eenheden slechts in 40/50 waarnemingen volledig aan de vraag voldeden. Dus in plaats van een 99%-serviceniveau te krijgen, behaalde u alleen een 80%-serviceniveau! Dit is een gigantische misser die het gevolg is van het proberen een vierkante pin in een rond gat te passen. De misser zou ertoe hebben geleid dat u een onjuiste voorraadvermindering had genomen.

Empirisch geschatte verdelingen zijn slim
Om een slimme (lees nauwkeurige) probabilistische voorspelling te maken, moet u eerst de verdeling van de vraag empirisch schatten zonder enige naïeve aannames over de vorm van de verdeling. Smart Software doet dit door tienduizenden gesimuleerde vraag- en doorlooptijdscenario's uit te voeren. Onze oplossing maakt gebruik van gepatenteerde technieken die Monte Carlo-simulatie, statistische bootstrapping en andere methoden bevatten. De scenario's zijn ontworpen om reële onzekerheid en willekeur van zowel vraag als doorlooptijden te simuleren. Actuele historische waarnemingen worden gebruikt als de primaire invoer, maar de oplossing geeft u de mogelijkheid om ook te simuleren van niet-waargenomen waarden. Alleen al omdat 100 eenheden de historische piekvraag was, wil dat nog niet zeggen dat u in de toekomst gegarandeerd op 100 piekt. Nadat de scenario's zijn voltooid, weet u de exacte waarschijnlijkheid voor elke uitkomst. De "punt"-voorspelling wordt dan het middelpunt van die verdeling. Elke toekomstige periode in de tijd wordt uitgedrukt in termen van de kansverdeling die bij die periode hoort.

Leiders in probabilistische prognoses
Smart Software, Inc. was twintig jaar geleden het eerste bedrijf dat ooit statistische bootstrapping introduceerde als onderdeel van een commercieel verkrijgbaar softwaresysteem voor vraagvoorspelling. We kregen er destijds een Amerikaans patent voor en werden finalist genoemd in de APICS Corporate Awards of Excellence for Technological Innovation. Ons NSF gesponsord onderzoek die tot deze en andere ontdekkingen leidden, speelden een belangrijke rol bij het bevorderen van prognoses en voorraadoptimalisatie. Wij zetten ons in voor voortdurende innovatie, en dat kunt u ook vind hier meer informatie over ons meest recente patent.

 

 

Correlatie versus oorzakelijk verband: is dit relevant voor uw baan?

Buiten het werk heb je misschien de beroemde uitspraak 'Correlatie is geen oorzakelijk verband' gehoord. Het klinkt misschien als een stuk theoretische onzin die, hoewel betrokken bij een recente Nobelprijs voor economie, niet relevant is voor uw werk als vraagplanner. Is dat zo, dan heb je misschien maar gedeeltelijk gelijk.

Extrapolatieve versus causale modellen

De meeste vraagvoorspellingen maken gebruik van extrapolatieve modellen. Deze modellen, ook wel tijdreeksmodellen genoemd, voorspellen de vraag op basis van alleen de waarden uit het verleden van de vraag naar een artikel. Plots van waarden uit het verleden onthullen trend en seizoensgebondenheid en volatiliteit, dus er is veel waar ze goed voor zijn. Maar er is nog een ander type model – causale modellen – dat de nauwkeurigheid van prognoses mogelijk kan verbeteren, verder dan wat u kunt krijgen van extrapolatieve modellen.

Causale modellen voegen meer invoergegevens toe aan de prognosetaak: informatie over veronderstelde prognose "stuurprogramma's" buiten de vraaggeschiedenis van een artikel. Voorbeelden van potentieel bruikbare oorzakelijke factoren zijn onder meer macro-economische variabelen zoals het inflatiepercentage, het groeipercentage van het bbp en grondstofprijzen. Voorbeelden die niet gebonden zijn aan de nationale economie zijn onder meer branchespecifieke groeipercentages en uw eigen advertentie-uitgaven en die van uw concurrenten. Deze variabelen worden meestal gebruikt als invoer voor regressiemodellen, dit zijn vergelijkingen met vraag als uitvoer en causale variabelen als invoer.

Voorspellingen met behulp van causale modellen

Veel bedrijven hebben een S&OP-proces waarbij maandelijks statistische (extrapolatieve) prognoses worden beoordeeld, waarbij het management de prognoses aanpast op basis van hun oordeel. Vaak is dit een indirecte en subjectieve manier om causale modellen in het proces te verwerken zonder de regressiemodellering uit te voeren.

Om daadwerkelijk een causaal regressiemodel te maken, moet u eerst een lijst van potentieel bruikbare causale voorspellende variabelen nomineren. Deze kunnen voortkomen uit uw inhoudelijke expertise. Stel, u vervaardigt vensterglas. Veel van uw glas kan terechtkomen in nieuwe woningen en nieuwe kantoorgebouwen. Het aantal nieuw gebouwde woningen en kantoren zijn dus plausibele voorspellende variabelen in een regressievergelijking.

Er is hier een complicatie: als je de vergelijking gebruikt om iets te voorspellen, moet je eerst de voorspellers voorspellen. Zo kan de verkoop van glas komend kwartaal sterk gerelateerd zijn aan aantallen nieuwe woningen en nieuwe kantoorpanden komend kwartaal. Maar hoeveel nieuwe woningen komen er komend kwartaal? Dat is zijn eigen prognoseprobleem. Je hebt dus een potentieel krachtig prognosemodel, maar je hebt extra werk te doen om het bruikbaar te maken.

Er is één manier om dingen te vereenvoudigen: als de voorspellende variabelen "vertraagde" versies van zichzelf zijn. Zo kan het aantal nieuw afgegeven bouwvergunningen een half jaar geleden een goede voorspeller zijn van de glasverkoop volgende maand. U hoeft de bouwvergunninggegevens niet te voorspellen, u hoeft ze alleen maar op te zoeken.

Is het een causaal verband of slechts een onechte correlatie?

Causale modellen zijn de real deal: er is een feitelijk mechanisme dat de voorspellende variabele relateert aan de voorspelde variabele. Het voorbeeld van het voorspellen van de verkoop van glas uit bouwvergunningen is een voorbeeld.

Een correlatierelatie is twijfelachtiger. Er is een statistische associatie die al dan niet een solide basis vormt voor prognoses. Stel, u verkoopt een product dat Nederlanders het meest aanspreekt, maar u heeft dit niet door. Nederlanders zijn gemiddeld de langste mensen van Europa. Als uw verkopen stijgen en de gemiddelde lengte van Europeanen toeneemt, kunt u die relatie goed gebruiken. Maar als het aandeel Nederlanders in de eurozone afneemt terwijl de gemiddelde lengte toeneemt omdat de mix van mannen versus vrouwen naar mannen verschuift, wat kan er dan misgaan? U verwacht dat de verkoop zal toenemen omdat de gemiddelde lengte toeneemt. Maar uw verkopen zijn eigenlijk vooral aan Nederlanders, en hun relatieve aandeel in de bevolking wordt kleiner, dus uw verkopen zullen in plaats daarvan echt afnemen. In dit geval is de associatie tussen verkoop en klantlengte een onechte correlatie.

Hoe kun je het verschil zien tussen echte en valse relaties? De gouden standaard is om een rigoureus wetenschappelijk experiment te doen. Maar u bent waarschijnlijk niet in de positie om dat te doen. In plaats daarvan moet u vertrouwen op uw persoonlijke 'mentale model' van hoe uw markt werkt. Als uw vermoedens juist zijn, zullen uw potentiële causale modellen correleren met de vraag en zal causale modellering voor u lonend zijn, hetzij als aanvulling op extrapolatieve modellen, hetzij ter vervanging ervan.

 

 

 

 

Drie manieren om de nauwkeurigheid van prognoses te schatten

Nauwkeurigheid van prognoses is een belangrijke maatstaf om de kwaliteit van uw vraagplanningsproces te beoordelen. (Het is niet de enige. Anderen omvatten tijdigheid en kosten; zie 5 Tips voor vraagplanning voor het berekenen van prognoseonzekerheid.) Zodra u prognoses heeft, zijn er een aantal manieren om hun nauwkeurigheid samen te vatten, meestal aangeduid met obscure drie- of vierletterige acroniemen zoals MAPE, RMSE en MAE. Zien Vier handige manieren om prognosefouten te meten voor meer informatie.

Een minder besproken maar meer fundamentele kwestie is hoe computationele experimenten worden georganiseerd voor het berekenen van voorspellingsfouten. Deze post vergelijkt de drie belangrijkste experimentele ontwerpen. Een van hen is ouderwets en komt in wezen neer op valsspelen. Een andere is de gouden standaard. Een derde is een handig hulpmiddel dat de gouden standaard nabootst en kan het beste worden gezien als een voorspelling van hoe de gouden standaard zal uitpakken. Figuur 1 is een schematische weergave van de drie methoden.

 

Three Ways to Estimate Forecast Accuracy Software Smart

Afbeelding 1: Drie manieren om prognosefouten te beoordelen

 

Het bovenste paneel van figuur 1 geeft de manier weer waarop voorspellingsfouten werden beoordeeld in het begin van de jaren '80 voordat we de stand van de techniek verplaatsten naar het schema in het middelste paneel. Vroeger werden prognoses beoordeeld op dezelfde gegevens die werden gebruikt om de prognoses te berekenen. Nadat een model aan de gegevens was aangepast, waren de berekende fouten niet voor modelvoorspellingen maar voor model past bij. Het verschil is dat prognoses voor toekomstige waarden zijn, terwijl aanpassingen voor gelijktijdige waarden zijn. Stel dat het voorspellingsmodel een eenvoudig voortschrijdend gemiddelde is van de drie meest recente waarnemingen. Op tijdstip 3 berekent het model het gemiddelde van waarnemingen 1, 2 en 3. Dit gemiddelde wordt dan vergeleken met de waargenomen waarde op tijdstip 3. We noemen dit vals spelen omdat de waargenomen waarde op tijdstip 3 een stem kreeg over wat de voorspelling zou moeten zijn op tijdstip 3. Een echte prognosebeoordeling zou het gemiddelde van de eerste drie waarnemingen vergelijken met de waarde van de volgende, vierde, observatie. Anders blijft de voorspeller achter met een te optimistische beoordeling van de nauwkeurigheid van de voorspelling.

Het onderste paneel van figuur 1 toont de beste manier om de nauwkeurigheid van prognoses te beoordelen. In dit schema worden alle historische vraaggegevens gebruikt om in een model te passen, dat vervolgens wordt gebruikt om toekomstige, onbekende vraagwaarden te voorspellen. Uiteindelijk ontvouwt de toekomst zich, onthullen de werkelijke toekomstige waarden zich en kunnen werkelijke voorspellingsfouten worden berekend. Dit is de gouden standaard. Deze informatie wordt ingevuld in het rapport 'Prognoses versus actuals' in onze software.

Het middelste paneel toont een handige tussenmaat. Het probleem met de gouden standaard is dat u moet wachten om erachter te komen hoe goed de door u gekozen prognosemethoden presteren. Deze vertraging helpt niet wanneer u op dit moment moet kiezen welke prognosemethode u voor elk item wilt gebruiken. Het geeft ook geen tijdige inschatting van de prognoseonzekerheid die u zult ervaren, wat belangrijk is voor risicobeheer zoals het afdekken van prognoses. De middenweg is gebaseerd op hold-out-analyse, die de meest recente waarnemingen uitsluit (“holds out”) en de voorspellingsmethode vraagt zijn werk te doen zonder die grondwaarheden te kennen. Vervolgens kunnen de prognoses op basis van de verkorte vraaggeschiedenis worden vergeleken met de uitgestelde werkelijke waarden om een eerlijke beoordeling van de prognosefout te krijgen.

 

 

Olifanten en kangoeroes ERP vs. Best of Breed Vraagplanning

'Ondanks wat je in je tekenfilms op zaterdagochtend hebt gezien, kunnen olifanten niet springen, en daar is een simpele reden voor: dat hoeft niet. De meeste springerige dieren – je kangoeroes, apen en kikkers – doen het voornamelijk om weg te komen van roofdieren.” — Patrick Monahan, Science.org, 27 januari 2016.

Nu weet u waarom de grootste ERP-bedrijven geen best-of-breed-achtige oplossingen van hoge kwaliteit kunnen ontwikkelen. Dat hebben ze nooit hoeven doen, dus ze zijn nooit geëvolueerd om te innoveren buiten hun kernfocus. 

Naarmate ERP-systemen echter gemeengoed zijn geworden, werden hiaten in hun functionaliteit onmogelijk te negeren. De grotere spelers probeerden hun deel van de portemonnee van de klant te beschermen door te beloven innovatieve add-on-applicaties te ontwikkelen om alle witte ruimtes te vullen. Maar zonder die 'innovatiekracht' mislukten veel projecten en stapelden zich bergen technische schulden op.

Best-of-breed bedrijven zijn geëvolueerd om te innoveren en hebben een diepgaande functionele expertise in specifieke branches. Het resultaat is dat de beste ERP-add-ons eenvoudiger te gebruiken zijn, meer functies hebben en meer waarde bieden dan de native ERP-modules die ze vervangen. 

Als uw ERP-leverancier al een samenwerking heeft aangegaan met een innovatieve, toonaangevende add-onprovider*, bent u helemaal klaar! Maar als u alleen de basis uit uw ERP kunt halen, kies dan voor een best-of-breed add-on die op maat is geïntegreerd met het ERP. 

Een goede plek om te beginnen met zoeken is om te zoeken naar add-ons voor ERP-vraagplanning die hersens toevoegen aan de kracht van het ERP, dat wil zeggen add-ons die voorraadoptimalisatie en vraagvoorspelling ondersteunen. Maak gebruik van aanvullende tools zoals Smart's apps voor statistische prognoses, vraagplanning en voorraadoptimalisatie om prognoses en voorraadbeleid te ontwikkelen die worden teruggekoppeld naar het ERP-systeem om dagelijkse bestellingen te stimuleren. 

*App-stores zijn een licentie voor de beste in hun soort om te verkopen aan de ERP-bedrijvenbasis - zijnde beursgenoteerde partnerschappen.

 

 

 

 

Is uw demand planning en forecasting proces een black box?

Er is één ding waar ik bijna elke dag aan herinnerd wordt bij Smart Software dat me een raadsel stelt: de meeste bedrijven begrijpen niet hoe prognoses worden gemaakt en hoe voorraadbeleid wordt bepaald. Het is een organisatorische zwarte doos. Hier is een voorbeeld van een recent verkoopgesprek:

Hoe voorspel je?
Wij gebruiken geschiedenis.

Hoe gebruik je geschiedenis?
Wat bedoel je?

Welnu, u kunt een gemiddelde nemen van het afgelopen jaar, de afgelopen twee jaar, het gemiddelde nemen van de meest recente perioden, of een ander type formule gebruiken om de prognose te genereren.
Ik ben er vrij zeker van dat we een gemiddelde van de laatste 12 maanden gebruiken.

Waarom 12 maanden in plaats van een andere hoeveelheid geschiedenis?
12 maanden is een goede hoeveelheid tijd om te gebruiken omdat het niet vertekend wordt door oudere gegevens, maar het is recent genoeg

Hoe weet je dat het nauwkeuriger is dan 18 maanden of een andere lengte van de geschiedenis te gebruiken?
We weten het niet. Wel passen we de prognoses aan op basis van feedback van sales.  

Weet u of de aanpassingen de zaken nauwkeuriger of minder nauwkeurig maken dan wanneer u alleen het gemiddelde zou gebruiken?
We weten het niet, maar zijn ervan overtuigd dat de prognoses te hoog zijn

Wat doen de voorraadkopers dan als ze denken dat de cijfers te hoog zijn?
Ze hebben veel zakelijke kennis en passen hun aankopen hierop aan

Dus, is het eerlijk om te zeggen dat ze de voorspellingen in ieder geval een deel van de tijd zouden negeren?
Ja, soms.

Hoe beslissen de kopers wanneer ze meer bestellen? Heeft u een bestelpunt of veiligheidsvoorraad gespecificeerd in uw ERP-systeem die u helpt bij het nemen van deze beslissingen?
Ja, we gebruiken een veiligheidsvoorraadveld.

Hoe wordt de veiligheidsvoorraad berekend?
Kopers bepalen dit op basis van het belang van het artikel, doorlooptijden en andere overwegingen, zoals hoeveel klanten het artikel kopen, de snelheid van het artikel en de kosten. Afhankelijk hiervan zullen ze verschillende hoeveelheden veiligheidsvoorraad bij zich hebben.

De discussie ging door. De belangrijkste afhaalmogelijkheid hier is dat wanneer je net onder het oppervlak krabt, er veel meer vragen worden onthuld dan antwoorden. Dit betekent vaak dat het voorraadplanning- en vraagprognoseproces zeer subjectief is, van planner tot planner varieert, niet goed wordt begrepen door de rest van de organisatie en waarschijnlijk reactief is. Zoals Tom Willemain heeft beschreven, is het "chaos gemaskeerd door improvisatie". Het "as-is"-proces moet volledig worden geïdentificeerd en gedocumenteerd. Alleen dan kunnen hiaten worden blootgelegd en kunnen verbeteringen worden aangebracht.   Hier is een lijst met 10 vragen die u kunt stellen dat zal het werkelijke proces van prognoses, vraagplanning en voorraadplanning van uw organisatie onthullen.