Top 4 bewegingen wanneer u vermoedt dat software de voorraad opdrijft

Er wordt ons vaak gevraagd: "Waarom drijft de software de voorraad op?" Het antwoord is dat Smart het in geen van beide richtingen stuurt - de inputs sturen het aan en die inputs worden beheerd door de gebruikers (of beheerders). Hier zijn vier dingen die u kunt doen om de resultaten te krijgen die u verwacht.

1. Bevestig dat uw serviceniveaudoelen in overeenstemming zijn met wat u wilt voor dat artikel of die groep artikelen. Het instellen van zeer hoge doelen (95% of meer) zal waarschijnlijk de inventaris verhogen als je op een lager niveau hebt rondgereden en het goed vindt om daar te zijn. Het is mogelijk dat u het nieuwe, hogere serviceniveau nog nooit heeft bereikt, maar klanten hebben niet geklaagd. Zoek uit welk serviceniveau heeft gewerkt door historische prestatierapporten te evalueren en stel uw doelen dienovereenkomstig vast. Houd er echter rekening mee dat concurrenten u kunnen verslaan op het gebied van artikelbeschikbaarheid als u de serviceniveaudoelstellingen van uw vader blijft gebruiken.

2. Zorg ervoor dat uw begrip van "serviceniveau" overeenkomt met de definitie van het softwaresysteem. Mogelijk meet u de prestaties op basis van hoe vaak u verzendt binnen een week na ontvangst van de bestelling van de klant, terwijl de software zich richt op bestelpunten op basis van uw vermogen om meteen te verzenden, niet binnen een week. Het is duidelijk dat de laatste meer inventaris nodig heeft om hetzelfde "serviceniveau" te bereiken. Een 75%-serviceniveau voor dezelfde dag kan bijvoorbeeld overeenkomen met een 90%-serviceniveau voor dezelfde week. In dit geval ben je echt appels met peren aan het vergelijken. Als dit de reden is voor de overtollige voorraad, bepaal dan welk serviceniveau "dezelfde dag" nodig is om u op het door u gewenste serviceniveau "dezelfde week" te krijgen en voer dat in de software in. Het gebruik van het minder strikte doel voor dezelfde dag zal de inventaris doen dalen, soms zeer aanzienlijk.

3. Evalueer de invoer van de doorlooptijd. We hebben gevallen gezien waarin doorlooptijden waren opgeblazen om oude software te misleiden om de gewenste resultaten te produceren. Moderne software houdt de prestaties van leveranciers bij door hun werkelijke doorlooptijden over meerdere bestellingen vast te leggen, en houdt vervolgens rekening met de doorlooptijdvariabiliteit in simulaties van dagelijkse activiteiten. Pas op als uw doorlooptijden zijn vastgesteld op een waarde die in het verre verleden is bepaald en niet actueel is.

4. Controleer uw vraagsignaal. U heeft veel historische transacties in uw ERP-systeem die op veel manieren kunnen worden gebruikt om de vraaghistorie te bepalen. Als u signalen gebruikt zoals overboekingen, of als u retouren niet uitsluit, overdrijft u mogelijk de vraag. Besteed wat tijd aan het definiëren van "vraag" op de manier die het meest logisch is voor uw situatie.

Wat maakt een probabilistische voorspelling?

Wat is al die heisa rond de term 'probabilistische prognoses'? Is het gewoon een recentere marketingterm die sommige softwareleveranciers en consultants hebben bedacht om innovatie te veinzen? Is er een echt tastbaar verschil in vergelijking met voorgaande "best passende" technieken? Zijn toch niet alle voorspellingen probabilistisch?

Om deze vraag te beantwoorden, is het nuttig om na te denken over wat de voorspelling u werkelijk vertelt in termen van kansen. Een "goede" voorspelling moet onbevooroordeeld zijn en daarom een 50/50 waarschijnlijkheid opleveren die hoger of lager is dan de werkelijke. Een "slechte" voorspelling zal subjectieve buffers inbouwen (of de voorspelling kunstmatig verlagen) en resulteren in een hoge of lage vraag. Overweeg een verkoper die opzettelijk zijn prognose verlaagt door geen verkopen te rapporteren die hij verwacht te sluiten als 'conservatief'. Hun voorspellingen zullen een negatieve voorspellingsbias hebben, aangezien de werkelijke waarden bijna altijd hoger zullen zijn dan wat ze voorspelden. Overweeg aan de andere kant een klant die een opgeblazen prognose aan zijn fabrikant geeft. Bezorgd over stockouts, overschatten ze de vraag om hun aanbod zeker te stellen. Hun voorspelling zal een positieve bias hebben, aangezien de werkelijke waarden bijna altijd lager zullen zijn dan wat ze voorspelden. 

Dit soort ééncijferige voorspellingen die hierboven zijn beschreven, zijn problematisch. We verwijzen naar deze voorspellingen als "puntvoorspellingen", omdat ze één punt (of een reeks punten in de tijd) vertegenwoordigen op een plot van wat er in de toekomst zou kunnen gebeuren. Ze geven geen volledig beeld, want om effectieve zakelijke beslissingen te nemen, zoals het bepalen hoeveel voorraad er moet worden opgeslagen of het aantal werknemers dat beschikbaar moet zijn om aan de vraag te voldoen, is gedetailleerde informatie vereist over hoeveel lager of hoger de werkelijke waarde zal zijn! Met andere woorden, u hebt de kansen nodig voor elke mogelijke uitkomst die zich kan voordoen. Dus op zichzelf is de puntvoorspelling niet probabilistisch.   

Om een probabilistische voorspelling te krijgen, moet u de verdeling van mogelijke eisen rond die voorspelling kennen. Zodra u dit hebt berekend, wordt de voorspelling 'probabilistisch'. Hoe prognosesystemen en beoefenaars zoals vraagplanners, voorraadanalisten, materiaalmanagers en CFO's deze waarschijnlijkheden bepalen, is de kern van de vraag: "wat maakt een prognose probabilistisch?"     

Normale verdelingen
De meeste prognoses en de systemen/software die ze produceren, beginnen met een voorspelling van de vraag. Vervolgens berekenen ze het bereik van mogelijke eisen rond die voorspelling door onjuiste theoretische aannames te doen over de verdeling. Als u ooit een "betrouwbaarheidsinterval" in uw voorspellingssoftware hebt gebruikt, is dit gebaseerd op een kansverdeling rond de voorspelling. De manier waarop dit vraagbereik wordt bepaald, is door uit te gaan van een bepaald type distributie. Meestal betekent dit dat we uitgaan van een klokvormige verdeling, ook wel bekend als een normale verdeling. Wanneer de vraag intermitterend is, kunnen sommige systemen voor voorraadoptimalisatie en vraagvoorspelling aannemen dat de vraag Poisson-vormig is. 

Nadat de prognose is gemaakt, wordt de veronderstelde verdeling rond de vraagprognose gegooid en hebt u uw schatting van kansen voor elke mogelijke vraag - dat wil zeggen, een "probabilistische prognose". Deze schattingen van de vraag en de bijbehorende waarschijnlijkheden kunnen vervolgens worden gebruikt om desgewenst extreme waarden of iets daartussenin te bepalen. De extreme waarden in de bovenste percentielen van de distributie (dwz 92%, 95%, 99%, enz.) worden meestal gebruikt als invoer voor voorraadbeheermodellen. Bestelpunten voor kritieke reserveonderdelen in een elektriciteitsbedrijf kunnen bijvoorbeeld worden gepland op basis van een 99.5%-serviceniveau of zelfs hoger. Terwijl een niet-kritiek serviceonderdeel kan worden gepland op een 85%- of 90%-serviceniveau.

Het probleem met het maken van aannames over de verdeling is dat je deze kansen verkeerd zult interpreteren. Als de vraag bijvoorbeeld niet normaal verdeeld is, maar u een klokvormige/normale curve op de voorspelling afdwingt, hoe kan het dan dat de kansen onjuist zijn. In het bijzonder wilt u misschien het voorraadniveau weten dat nodig is om een 99%-kans te bereiken dat de voorraad niet opraakt en de normale distributie zal u vertellen om 200 eenheden in voorraad te hebben. Maar als je het vergelijkt met de daadwerkelijke vraag, kom je erachter dat 200 eenheden slechts in 40/50 waarnemingen volledig aan de vraag voldeden. Dus in plaats van een 99%-serviceniveau te krijgen, behaalde u alleen een 80%-serviceniveau! Dit is een gigantische misser die het gevolg is van het proberen een vierkante pin in een rond gat te passen. De misser zou ertoe hebben geleid dat u een onjuiste voorraadvermindering had genomen.

Empirisch geschatte verdelingen zijn slim
Om een slimme (lees nauwkeurige) probabilistische voorspelling te maken, moet u eerst de verdeling van de vraag empirisch schatten zonder enige naïeve aannames over de vorm van de verdeling. Smart Software doet dit door tienduizenden gesimuleerde vraag- en doorlooptijdscenario's uit te voeren. Onze oplossing maakt gebruik van gepatenteerde technieken die Monte Carlo-simulatie, statistische bootstrapping en andere methoden bevatten. De scenario's zijn ontworpen om reële onzekerheid en willekeur van zowel vraag als doorlooptijden te simuleren. Actuele historische waarnemingen worden gebruikt als de primaire invoer, maar de oplossing geeft u de mogelijkheid om ook te simuleren van niet-waargenomen waarden. Alleen al omdat 100 eenheden de historische piekvraag was, wil dat nog niet zeggen dat u in de toekomst gegarandeerd op 100 piekt. Nadat de scenario's zijn voltooid, weet u de exacte waarschijnlijkheid voor elke uitkomst. De "punt"-voorspelling wordt dan het middelpunt van die verdeling. Elke toekomstige periode in de tijd wordt uitgedrukt in termen van de kansverdeling die bij die periode hoort.

Leiders in probabilistische prognoses
Smart Software, Inc. was twintig jaar geleden het eerste bedrijf dat ooit statistische bootstrapping introduceerde als onderdeel van een commercieel verkrijgbaar softwaresysteem voor vraagvoorspelling. We kregen er destijds een Amerikaans patent voor en werden finalist genoemd in de APICS Corporate Awards of Excellence for Technological Innovation. Ons NSF gesponsord onderzoek die tot deze en andere ontdekkingen leidden, speelden een belangrijke rol bij het bevorderen van prognoses en voorraadoptimalisatie. Wij zetten ons in voor voortdurende innovatie, en dat kunt u ook vind hier meer informatie over ons meest recente patent.

 

 

Correlatie versus oorzakelijk verband: is dit relevant voor uw baan?

Buiten het werk heb je misschien de beroemde uitspraak 'Correlatie is geen oorzakelijk verband' gehoord. Het klinkt misschien als een stuk theoretische onzin die, hoewel betrokken bij een recente Nobelprijs voor economie, niet relevant is voor uw werk als vraagplanner. Is dat zo, dan heb je misschien maar gedeeltelijk gelijk.

Extrapolatieve versus causale modellen

De meeste vraagvoorspellingen maken gebruik van extrapolatieve modellen. Deze modellen, ook wel tijdreeksmodellen genoemd, voorspellen de vraag op basis van alleen de waarden uit het verleden van de vraag naar een artikel. Plots van waarden uit het verleden onthullen trend en seizoensgebondenheid en volatiliteit, dus er is veel waar ze goed voor zijn. Maar er is nog een ander type model – causale modellen – dat de nauwkeurigheid van prognoses mogelijk kan verbeteren, verder dan wat u kunt krijgen van extrapolatieve modellen.

Causale modellen voegen meer invoergegevens toe aan de prognosetaak: informatie over veronderstelde prognose "stuurprogramma's" buiten de vraaggeschiedenis van een artikel. Voorbeelden van potentieel bruikbare oorzakelijke factoren zijn onder meer macro-economische variabelen zoals het inflatiepercentage, het groeipercentage van het bbp en grondstofprijzen. Voorbeelden die niet gebonden zijn aan de nationale economie zijn onder meer branchespecifieke groeipercentages en uw eigen advertentie-uitgaven en die van uw concurrenten. Deze variabelen worden meestal gebruikt als invoer voor regressiemodellen, dit zijn vergelijkingen met vraag als uitvoer en causale variabelen als invoer.

Voorspellingen met behulp van causale modellen

Veel bedrijven hebben een S&OP-proces waarbij maandelijks statistische (extrapolatieve) prognoses worden beoordeeld, waarbij het management de prognoses aanpast op basis van hun oordeel. Vaak is dit een indirecte en subjectieve manier om causale modellen in het proces te verwerken zonder de regressiemodellering uit te voeren.

Om daadwerkelijk een causaal regressiemodel te maken, moet u eerst een lijst van potentieel bruikbare causale voorspellende variabelen nomineren. Deze kunnen voortkomen uit uw inhoudelijke expertise. Stel, u vervaardigt vensterglas. Veel van uw glas kan terechtkomen in nieuwe woningen en nieuwe kantoorgebouwen. Het aantal nieuw gebouwde woningen en kantoren zijn dus plausibele voorspellende variabelen in een regressievergelijking.

Er is hier een complicatie: als je de vergelijking gebruikt om iets te voorspellen, moet je eerst de voorspellers voorspellen. Zo kan de verkoop van glas komend kwartaal sterk gerelateerd zijn aan aantallen nieuwe woningen en nieuwe kantoorpanden komend kwartaal. Maar hoeveel nieuwe woningen komen er komend kwartaal? Dat is zijn eigen prognoseprobleem. Je hebt dus een potentieel krachtig prognosemodel, maar je hebt extra werk te doen om het bruikbaar te maken.

Er is één manier om dingen te vereenvoudigen: als de voorspellende variabelen "vertraagde" versies van zichzelf zijn. Zo kan het aantal nieuw afgegeven bouwvergunningen een half jaar geleden een goede voorspeller zijn van de glasverkoop volgende maand. U hoeft de bouwvergunninggegevens niet te voorspellen, u hoeft ze alleen maar op te zoeken.

Is het een causaal verband of slechts een onechte correlatie?

Causale modellen zijn de real deal: er is een feitelijk mechanisme dat de voorspellende variabele relateert aan de voorspelde variabele. Het voorbeeld van het voorspellen van de verkoop van glas uit bouwvergunningen is een voorbeeld.

Een correlatierelatie is twijfelachtiger. Er is een statistische associatie die al dan niet een solide basis vormt voor prognoses. Stel, u verkoopt een product dat Nederlanders het meest aanspreekt, maar u heeft dit niet door. Nederlanders zijn gemiddeld de langste mensen van Europa. Als uw verkopen stijgen en de gemiddelde lengte van Europeanen toeneemt, kunt u die relatie goed gebruiken. Maar als het aandeel Nederlanders in de eurozone afneemt terwijl de gemiddelde lengte toeneemt omdat de mix van mannen versus vrouwen naar mannen verschuift, wat kan er dan misgaan? U verwacht dat de verkoop zal toenemen omdat de gemiddelde lengte toeneemt. Maar uw verkopen zijn eigenlijk vooral aan Nederlanders, en hun relatieve aandeel in de bevolking wordt kleiner, dus uw verkopen zullen in plaats daarvan echt afnemen. In dit geval is de associatie tussen verkoop en klantlengte een onechte correlatie.

Hoe kun je het verschil zien tussen echte en valse relaties? De gouden standaard is om een rigoureus wetenschappelijk experiment te doen. Maar u bent waarschijnlijk niet in de positie om dat te doen. In plaats daarvan moet u vertrouwen op uw persoonlijke 'mentale model' van hoe uw markt werkt. Als uw vermoedens juist zijn, zullen uw potentiële causale modellen correleren met de vraag en zal causale modellering voor u lonend zijn, hetzij als aanvulling op extrapolatieve modellen, hetzij ter vervanging ervan.

 

 

 

 

Welke gegevens zijn nodig om software-implementaties voor vraagplanning te ondersteunen

We hebben onlangs een ontmoeting gehad met het IT-team bij een van onze klanten om de gegevensvereisten en de installatie van onze API-gebaseerde integratie te bespreken die gegevens zou halen uit hun lokale installatie van hun ERP-systeem. De IT-manager en de analist uitten allebei hun grote bezorgdheid over het verstrekken van deze gegevens en vroegen zich serieus af waarom ze überhaupt moesten worden verstrekt. Ze uitten zelfs hun bezorgdheid dat hun gegevens zouden kunnen worden doorverkocht aan hun concurrentie. Hun reactie was een grote verrassing voor ons. We hebben deze blog geschreven met hen in gedachten en om het voor anderen gemakkelijker te maken om te communiceren waarom bepaalde gegevens nodig zijn om een effectief vraagplanningsproces te ondersteunen. 

Houd er rekening mee dat als u een prognoseanalist, vraagplanner of supply chain-professional bent, het meeste van wat u hieronder zult lezen voor de hand ligt. Maar wat deze bijeenkomst me heeft geleerd, is dat wat voor de ene groep specialisten vanzelfsprekend is, dat niet zal zijn voor een andere groep specialisten op een heel ander gebied. 

De vier belangrijkste soorten gegevens die nodig zijn, zijn:  

  1. Historische transacties, zoals verkooporders en verzendingen.
  2. Taakgebruik transacties, zoals welke componenten nodig zijn om eindproducten te produceren
  3. Voorraadoverdrachttransacties, zoals welke inventaris van de ene locatie naar de andere is verzonden.
  4. Prijzen, kosten en attributen, zoals de eenheidskosten betaald aan de leverancier, de eenheidsprijs betaald door de klant en verschillende metagegevens zoals productfamilie, klasse, enz.  

Hieronder volgt een korte uitleg waarom deze gegevens nodig zijn om de implementatie van software voor vraagplanning door een bedrijf te ondersteunen.

Transactiegegevens van historische verkopen en verzendingen per klant
Denk aan wat uit de inventaris werd gehaald als de "grondstof" die nodig is voor software voor vraagplanning. Dit kan zijn wat aan wie en wanneer is verkocht of wat u aan wie en wanneer hebt verzonden. Of welke grondstoffen of halffabrikaten zijn verbruikt in werkorders en wanneer. Of wat er wanneer vanuit een distributiecentrum aan een satellietmagazijn wordt geleverd.

De geschiedenis van deze transacties wordt door de software geanalyseerd en gebruikt om statistische prognoses te produceren die waargenomen patronen extrapoleren. De gegevens worden geëvalueerd om patronen zoals trend, seizoensinvloeden, cyclische patronen bloot te leggen en om potentiële uitschieters te identificeren die zakelijke aandacht vereisen. Als deze gegevens niet algemeen toegankelijk zijn of onregelmatig worden bijgewerkt, is het bijna onmogelijk om een goede voorspelling van de toekomstige vraag te maken. Ja, je zou zakelijke kennis of onderbuikgevoel kunnen gebruiken, maar dat schaalt niet en introduceert bijna altijd vertekening in de prognose (dwz consequent te hoog of te laag voorspellen). 

Er zijn gegevens nodig op transactieniveau om nauwkeurigere prognoses op wekelijks of zelfs dagelijks niveau te ondersteunen. Als een bedrijf bijvoorbeeld het drukke seizoen ingaat, wil het misschien beginnen met wekelijkse prognoses om de productie beter af te stemmen op de vraag. Dat lukt niet zonder de transactiegegevens in een goed gestructureerd datawarehouse te hebben. 

Het kan ook zo zijn dat bepaalde soorten transacties niet in de vraaggegevens moeten worden opgenomen. Dit kan gebeuren wanneer de vraag het gevolg is van een forse korting of een andere omstandigheid waarvan het supply chain-team weet dat deze de resultaten zal vertekenen. Als de gegevens geaggregeerd worden verstrekt, is het veel moeilijker om deze uitzonderingen te scheiden. Bij Smart Software noemen we het proces om uit te zoeken welke transacties (en bijbehorende transactiekenmerken) in het vraagsignaal moeten worden meegeteld "vraagsignaalsamenstelling". Door toegang te hebben tot alle transacties kan een bedrijf zijn vraagsignaal in de loop van de tijd naar behoefte aanpassen binnen de software. Slechts het verstrekken van een deel van de gegevens resulteert in een veel rigidere vraagsamenstelling die alleen kan worden verholpen met extra implementatiewerk.

Prijzen en kosten
De prijs waarvoor u uw producten heeft verkocht en de kosten die u hebt betaald om ze (of grondstoffen) te kopen, zijn van cruciaal belang om inkomsten of kosten te kunnen voorspellen. Een belangrijk onderdeel van het vraagplanningsproces is het verkrijgen van zakelijke kennis van klanten en verkoopteams. Verkoopteams denken vaak aan de vraag per klant of productcategorie en spreken in de taal van dollars. Het is dus belangrijk om een prognose in dollars uit te drukken. Het vraagplanningssysteem kan dat niet als de prognose alleen in eenheden wordt weergegeven. 

Vaak wordt de vraagprognose gebruikt om een groter planning- en budgetteringsproces aan te sturen of op zijn minst te beïnvloeden, en de belangrijkste input voor een budget is een omzetprognose. Wanneer vraagprognoses worden gebruikt om het S&OP-proces te ondersteunen, moet de software voor vraagplanning de gemiddelde prijs over alle transacties berekenen of "tijdgefaseerde" conversies toepassen die rekening houden met de op dat moment verkochte prijs. Zonder de onbewerkte gegevens over prijsstelling en kosten kan het vraagplanningsproces nog steeds functioneren, maar zal het ernstig worden belemmerd. 

Productkenmerken, klantgegevens en locaties
Productattributen zijn nodig zodat voorspellers prognoses kunnen verzamelen voor verschillende productfamilies, groepen, goederencodes, enz. Het is handig om te weten hoeveel eenheden en de totale geprojecteerde gedollariseerde vraag voor verschillende categorieën. Zakelijke kennis over wat de vraag in de toekomst zou kunnen zijn, is vaak niet bekend op productniveau, maar wel op productfamilieniveau, klantniveau of regionaal niveau. Met de toevoeging van productkenmerken aan uw datafeed voor vraagplanning, kunt u eenvoudig prognoses "oprollen" van artikelniveau naar familieniveau. U kunt prognoses op deze niveaus omzetten in dollars en beter samenwerken aan hoe de prognose moet worden aangepast.  

Zodra de kennis is toegepast in de vorm van een prognose-override, zal de software de wijziging automatisch afstemmen op alle individuele items waaruit de groep bestaat. Zo hoeft een forecast analist niet elk onderdeel apart aan te passen. Ze kunnen op geaggregeerd niveau een wijziging aanbrengen en de software voor vraagplanning de afstemming voor hen laten doen. 

Groepering voor gemakkelijke analyse is ook van toepassing op klantkenmerken, zoals een toegewezen verkoper of de voorkeurslocatie van een klant voor verzending. En locatieattributen kunnen handig zijn, zoals toegewezen regio. Soms hebben attributen betrekking op een product- en locatiecombinatie, zoals voorkeursleverancier of toegewezen planner, die voor hetzelfde product kan verschillen, afhankelijk van het magazijn.

 

Een laatste opmerking over vertrouwelijkheid

Bedenk dat onze klant bezorgd was dat we hun gegevens aan een concurrent zouden verkopen. Dat zouden we nooit doen. Al tientallen jaren gebruiken we klantgegevens voor trainingsdoeleinden en om onze producten te verbeteren. We zijn nauwgezet in het beschermen van klantgegevens en het anonimiseren van alles wat bijvoorbeeld kan worden gebruikt om een punt in een blogpost te illustreren.

 

 

 

Drie manieren om de nauwkeurigheid van prognoses te schatten

Nauwkeurigheid van prognoses is een belangrijke maatstaf om de kwaliteit van uw vraagplanningsproces te beoordelen. (Het is niet de enige. Anderen omvatten tijdigheid en kosten; zie 5 Tips voor vraagplanning voor het berekenen van prognoseonzekerheid.) Zodra u prognoses heeft, zijn er een aantal manieren om hun nauwkeurigheid samen te vatten, meestal aangeduid met obscure drie- of vierletterige acroniemen zoals MAPE, RMSE en MAE. Zien Vier handige manieren om prognosefouten te meten voor meer informatie.

Een minder besproken maar meer fundamentele kwestie is hoe computationele experimenten worden georganiseerd voor het berekenen van voorspellingsfouten. Deze post vergelijkt de drie belangrijkste experimentele ontwerpen. Een van hen is ouderwets en komt in wezen neer op valsspelen. Een andere is de gouden standaard. Een derde is een handig hulpmiddel dat de gouden standaard nabootst en kan het beste worden gezien als een voorspelling van hoe de gouden standaard zal uitpakken. Figuur 1 is een schematische weergave van de drie methoden.

 

Drie manieren om prognosenauwkeurigheid te schatten Software Smart

Afbeelding 1: Drie manieren om prognosefouten te beoordelen

 

Het bovenste paneel van figuur 1 geeft de manier weer waarop voorspellingsfouten werden beoordeeld in het begin van de jaren '80 voordat we de stand van de techniek verplaatsten naar het schema in het middelste paneel. Vroeger werden prognoses beoordeeld op dezelfde gegevens die werden gebruikt om de prognoses te berekenen. Nadat een model aan de gegevens was aangepast, waren de berekende fouten niet voor modelvoorspellingen maar voor model past bij. Het verschil is dat prognoses voor toekomstige waarden zijn, terwijl aanpassingen voor gelijktijdige waarden zijn. Stel dat het voorspellingsmodel een eenvoudig voortschrijdend gemiddelde is van de drie meest recente waarnemingen. Op tijdstip 3 berekent het model het gemiddelde van waarnemingen 1, 2 en 3. Dit gemiddelde wordt dan vergeleken met de waargenomen waarde op tijdstip 3. We noemen dit vals spelen omdat de waargenomen waarde op tijdstip 3 een stem kreeg over wat de voorspelling zou moeten zijn op tijdstip 3. Een echte prognosebeoordeling zou het gemiddelde van de eerste drie waarnemingen vergelijken met de waarde van de volgende, vierde, observatie. Anders blijft de voorspeller achter met een te optimistische beoordeling van de nauwkeurigheid van de voorspelling.

Het onderste paneel van figuur 1 toont de beste manier om de nauwkeurigheid van prognoses te beoordelen. In dit schema worden alle historische vraaggegevens gebruikt om in een model te passen, dat vervolgens wordt gebruikt om toekomstige, onbekende vraagwaarden te voorspellen. Uiteindelijk ontvouwt de toekomst zich, onthullen de werkelijke toekomstige waarden zich en kunnen werkelijke voorspellingsfouten worden berekend. Dit is de gouden standaard. Deze informatie wordt ingevuld in het rapport 'Prognoses versus actuals' in onze software.

Het middelste paneel toont een handige tussenmaat. Het probleem met de gouden standaard is dat u moet wachten om erachter te komen hoe goed de door u gekozen prognosemethoden presteren. Deze vertraging helpt niet wanneer u op dit moment moet kiezen welke prognosemethode u voor elk item wilt gebruiken. Het geeft ook geen tijdige inschatting van de prognoseonzekerheid die u zult ervaren, wat belangrijk is voor risicobeheer zoals het afdekken van prognoses. De middenweg is gebaseerd op hold-out-analyse, die de meest recente waarnemingen uitsluit (“holds out”) en de voorspellingsmethode vraagt zijn werk te doen zonder die grondwaarheden te kennen. Vervolgens kunnen de prognoses op basis van de verkorte vraaggeschiedenis worden vergeleken met de uitgestelde werkelijke waarden om een eerlijke beoordeling van de prognosefout te krijgen.