Wat te doen als een statistische prognose geen steek houdt

Soms slaat een statistische prognose gewoon nergens op. Elke voorspeller is er geweest. Ze kunnen dubbel controleren of de gegevens correct zijn ingevoerd of de modelinstellingen bekijken, maar ze blijven zich afvragen waarom de voorspelling er zo anders uitziet dan de vraaggeschiedenis. Wanneer de incidentele voorspelling nergens op slaat, kan dit het vertrouwen in het hele statistische prognoseproces aantasten.

Deze blog zal een leek helpen begrijpen wat de slimme statistische modellen zijn en hoe ze automatisch worden gekozen. Er wordt ingegaan op hoe die keuze soms mislukt, hoe u kunt weten of dat zo is en wat u kunt doen om ervoor te zorgen dat de prognoses altijd gerechtvaardigd kunnen worden. Het is belangrijk om te weten wat u kunt verwachten en hoe u de uitzonderingen kunt opvangen, zodat u kunt vertrouwen op uw prognosesysteem.

 

Hoe methoden automatisch worden gekozen

De criteria om automatisch één statistische methode uit een set te kiezen, zijn gebaseerd op welke methode het dichtst bij het correct voorspellen van de achtergehouden geschiedenis kwam. De eerdere geschiedenis wordt aan elke methode doorgegeven en het resultaat wordt vergeleken met de werkelijke waarden om de methode te vinden die er het dichtst bij in de buurt kwam. Die automatisch gekozen methode krijgt dan alle geschiedenis om de voorspelling te produceren. Bekijk deze blog voor meer informatie over de modelselectie https://smartcorp.com/uncategorized/statistical-forecasting-how-automatic-method-selection-works/

Voor de meeste tijdreeksen kan dit proces trends, seizoensgebondenheid en gemiddeld volume nauwkeurig vastleggen. Maar soms komt een gekozen methode wiskundig het dichtst in de buurt van het voorspellen van de achtergehouden geschiedenis, maar projecteert deze niet op een logische manier. Dat betekent dat de door het systeem geselecteerde methode niet de beste is en voor sommigen "moeilijk te voorspellen"

 

Moeilijk te voorspellen items

Moeilijk te voorspellen items kunnen grote, onvoorspelbare pieken in de vraag hebben, of meestal geen vraag maar willekeurige onregelmatige pieken, of ongebruikelijke recente activiteit. Ruis in de gegevens dwaalt soms willekeurig omhoog of omlaag, en de geautomatiseerde best-pick-methode kan een op hol geslagen trend of een nulpunt voorspellen. Het zal het slechter doen dan gezond verstand en in een klein percentage van een redelijk gevarieerde groep items. U moet deze gevallen dus identificeren en reageren door de prognose te negeren of de invoer van de prognose te wijzigen.

 

Hoe de uitzonderingen te vinden

De beste werkwijze is om de voorspelde items te filteren of te sorteren om de items te identificeren waarvan de som van de prognose voor het volgende jaar aanzienlijk afwijkt van de overeenkomstige geschiedenis van vorig jaar. De prognosesom kan veel lager zijn dan de historie of andersom. Gebruik de meegeleverde statistieken om deze items te identificeren; vervolgens kunt u ervoor kiezen om overschrijvingen toe te passen op de prognose of de prognose-instellingen te wijzigen.

 

Hoe de uitzonderingen op te lossen

Wanneer de voorspelling vreemd lijkt, zal een middelingsmethode, zoals Single Exponential Smoothing of zelfs een eenvoudig gemiddelde met behulp van Freestyle, vaak een redelijkere voorspelling opleveren. Als de trend mogelijk geldig is, kunt u alleen seizoensmethoden verwijderen om een onjuist seizoensresultaat te voorkomen. Of doe het tegenovergestelde en gebruik alleen seizoensmethoden als seizoensgebondenheid wordt verwacht maar niet was geprojecteerd in de standaardprognose. U kunt de wat-als-functies gebruiken om een onbeperkt aantal prognoses te maken, te evalueren en te vergelijken en de instellingen verder te verfijnen totdat u vertrouwd bent met de prognose.

Het opschonen van de geschiedenis, met of zonder wijziging van de automatische methodeselectie, is ook effectief bij het produceren van redelijke voorspellingen. U kunt prognoseparameters insluiten om de hoeveelheid geschiedenis die wordt gebruikt om die items te voorspellen of het aantal perioden dat aan het algoritme is doorgegeven, te verminderen, zodat eerdere, verouderde geschiedenis niet langer in aanmerking wordt genomen. U kunt pieken of dalen in de vraaggeschiedenis bewerken die bekende afwijkingen zijn, zodat ze de uitkomst niet beïnvloeden. U kunt ook samenwerken met het Smart-team om automatische detectie en verwijdering van uitschieters te implementeren, zodat gegevens voordat ze worden voorspeld al zijn opgeschoond van deze afwijkingen.

Als de vraag echt intermitterend is, wordt het bijna onmogelijk om "nauwkeurig" per periode te voorspellen. Als een level-loading-gemiddelde niet acceptabel is, kan het effectief zijn om het artikel af te handelen door een voorraadbeleid in te stellen met een doorlooptijdprognose. U kunt er ook voor kiezen om 'hetzelfde als vorig jaar'-modellen te gebruiken die, hoewel ze niet gevoelig zijn voor nauwkeurigheid, algemeen worden geaccepteerd door het bedrijf gezien de alternatieve prognoses.

Ten slotte, als het item zo recent is geïntroduceerd dat de algoritmen niet genoeg input hebben om nauwkeurig te voorspellen, is een eenvoudige gemiddelde of handmatige voorspelling wellicht het beste. U kunt nieuwe items identificeren door te filteren op het aantal historische perioden.

 

Handmatige selectie van methoden

Zodra u rijen hebt geïdentificeerd waar de prognose niet logisch is voor het menselijk oog, kunt u een kleinere subset van alle methoden kiezen om de prognoserun toe te laten en te vergelijken met de geschiedenis. Met Smart kunt u een beperkte set methoden gebruiken voor slechts één prognoserun of de beperkte set insluiten om te gebruiken voor alle prognoseruns in de toekomst. Verschillende methoden zullen de geschiedenis op verschillende manieren in de toekomst projecteren. Als u een idee heeft van hoe elk werkt, kunt u kiezen welke u wilt toestaan.

 

Vertrouw op uw prognosetool

Hoe meer u Slimme periode-over-periode gebruikt om uw beslissingen over hoe te voorspellen en welke historische gegevens u in overweging moet nemen, vast te leggen, hoe minder vaak u uitzonderingen zult tegenkomen, zoals beschreven in deze blog. Het invoeren van prognoseparameters is een beheersbare taak wanneer u begint met kritieke items of items met een hoge impact. Zelfs als u geen handmatige beslissingen over prognosemethoden insluit, wordt de prognose elke periode opnieuw uitgevoerd met nieuwe gegevens. Dus een item met een oneven resultaat vandaag kan in de loop van de tijd gemakkelijk voorspelbaar worden.

 

 

Statistische prognoses: hoe automatische methodeselectie werkt in Smart IP&O

Smart IP&O biedt geautomatiseerde statistische prognoses die de juiste prognosemethode selecteren die de gegevens het beste voorspelt. Het doet dit voor elke tijdreeks in de dataset. Deze blog zal leken helpen begrijpen hoe de voorspellingsmethoden automatisch worden gekozen.

Smart stelt vele methoden beschikbaar, waaronder enkele en dubbele exponentiële afvlakking, lineair en eenvoudig voortschrijdend gemiddelde, en Winters-modellen. Elk model is ontworpen om een ander soort patroon vast te leggen. De criteria om automatisch één statistische methode uit een reeks keuzes te kiezen, zijn gebaseerd op welke methode het dichtst bij het correct voorspellen van de achtergehouden geschiedenis kwam.

Eerdere vraaggeschiedenis wordt aan elke methode doorgegeven en het resultaat wordt vergeleken met de werkelijke waarden om de methode te vinden die er in het algemeen het dichtst bij kwam. Die "winnende" automatisch gekozen methode krijgt dan alle geschiedenis voor dat item om de prognose te produceren.

De algehele aard van het vraagpatroon voor het item wordt vastgelegd door verschillende delen van de geschiedenis vast te houden, zodat een incidentele uitbijter de keuze van de methode niet onnodig beïnvloedt. U kunt het visualiseren met behulp van het onderstaande diagram, waarin elke rij een 3-periodevoorspelling in de uitgehouden geschiedenis vertegenwoordigt, gebaseerd op verschillende hoeveelheden van de rode eerdere geschiedenis. De varianties van elke pass worden samen gemiddeld om de algemene rangschikking van de methode ten opzichte van alle andere methoden te bepalen.

App voor automatische prognoses en statistische prognoses

Voor de meeste tijdreeksen kan dit proces nauwkeurig trends, seizoensinvloeden en gemiddeld volume vastleggen. Maar soms komt een gekozen methode wiskundig het dichtst in de buurt van het voorspellen van de achtergehouden geschiedenis, maar projecteert deze niet op een logische manier.

Gebruikers kunnen dit corrigeren door de uitzonderingsrapporten en filterfuncties van het systeem te gebruiken om items te identificeren die een beoordeling verdienen. Vervolgens kunnen ze de automatische prognosemethoden configureren waarmee ze voor dat item in aanmerking willen komen.

 

 

Hoeveel tijd zou het kosten om statistische prognoses te berekenen?
De belangrijkste factoren die van invloed zijn op de snelheid van uw prognose-engine 

Hoe lang moet het duren voordat een vraagprognose wordt berekend met behulp van statistische methoden? Deze vraag wordt vaak gesteld door klanten en prospects. Het antwoord hangt er echt van af. Voorspellingsresultaten voor een enkel item kunnen in een oogwenk worden berekend, in slechts enkele honderdsten van een seconde, maar soms kan het zelfs vijf seconden duren. Om de verschillen te begrijpen, is het belangrijk om te begrijpen dat er meer bij komt kijken dan alleen de rekenkundige berekeningen zelf door te spitten. Hier zijn zes factoren die de snelheid van uw prognose-engine beïnvloeden.

1) Prognosemethode.  Traditionele tijdreeks-extrapolatieve technieken (zoals exponentiële afvlakking en voortschrijdend-gemiddeldemethoden) zijn, mits slim gecodeerd, razendsnel. De automatische prognose-engine Smart Forecast, die gebruikmaakt van deze technieken en onze software voor vraagplanning en voorraadoptimalisatie aandrijft, kan bijvoorbeeld in 1 seconde statistische prognoses voor 1000 artikelen genereren! Extrapolatieve methoden produceren een verwachte voorspelling en een samenvattende maatstaf voor de voorspellingsonzekerheid. Complexere modellen in ons platform die probabilistische vraagscenario's genereren, duren echter veel langer bij dezelfde computerbronnen. Dit komt deels omdat ze een veel groter outputvolume creëren, meestal duizenden plausibele toekomstige vraagreeksen. Meer tijd, ja, maar geen tijdverspilling, aangezien deze resultaten veel vollediger zijn en de basis vormen voor downstream-optimalisatie van voorraadbeheerparameters.

2) Computerbronnen.  Hoe meer bronnen u naar de berekening gooit, hoe sneller het zal zijn. Middelen kosten echter geld en het is misschien niet economisch om in deze middelen te investeren. Om bijvoorbeeld bepaalde soorten op machine learning gebaseerde prognoses te laten werken, moet het systeem multithread-berekeningen over meerdere servers uitvoeren om snel resultaten te leveren. Zorg er dus voor dat u de veronderstelde rekenresources en bijbehorende kosten begrijpt. Onze berekeningen vinden plaats in de Amazon Web Services-cloud, dus het is mogelijk om desgewenst voor een groot deel van de parallelle berekeningen te betalen.

3) Aantal tijdreeksen.  Moet u slechts een paar honderd artikelen op één locatie of vele duizenden artikelen op tientallen locaties voorspellen? Hoe groter het aantal combinaties van SKU x Locatie, hoe langer de benodigde tijd. Het is echter mogelijk om de tijd om vraagprognoses te krijgen te verkorten door een betere vraagclassificatie. Het is bijvoorbeeld niet belangrijk om elke combinatie van SKU x Locatie te voorspellen. Moderne software voor vraagplanning kan de gegevens eerst subsetten op basis van volume-/frequentieclassificaties voordat de prognose-engine wordt uitgevoerd. We hebben situaties waargenomen waarin meer dan een miljoen combinaties van SKU x Locatie bestonden, maar waar slechts tien procent vraag naar had in de voorgaande twaalf maanden.

4) Historisch emmeren. Maakt u prognoses met behulp van dagelijkse, wekelijkse of maandelijkse tijdsintervallen? Hoe gedetailleerder de bucketing, hoe meer tijd het kost om statistische prognoses te berekenen. Veel bedrijven zullen zich afvragen: "Waarom zou iemand dagelijks prognoses willen maken?" State-of-the-art software voor vraagvoorspelling kan echter gebruikmaken van dagelijkse gegevens om gelijktijdige dag-van-week- en week-van-maandpatronen te detecteren die anders zouden worden verdoezeld met traditionele maandelijkse vraagbuckets. En de snelheid van zaken blijft toenemen, wat de concurrentiekracht van het traditionele maandelijkse planningstempo bedreigt.

5) Hoeveelheid geschiedenis. Beperkt u het model door alleen de meest recente vraaghistorie in te voeren, of voert u alle beschikbare historie in de vraagvoorspellingssoftware? Hoe meer historie u het model voedt, hoe meer gegevens er moeten worden geanalyseerd en hoe langer het gaat duren.

6) Aanvullende analytische verwerking.  Tot nu toe hebben we ons voorgesteld om de vraaggeschiedenis van items in te voeren en prognoses te krijgen. Maar het proces kan ook aanvullende analytische stappen omvatten die de resultaten kunnen verbeteren. Voorbeelden zijn onder meer:

a) Uitbijterdetectie en -verwijdering om de vervorming te minimaliseren die wordt veroorzaakt door eenmalige gebeurtenissen zoals stormschade.

b) Machine learning dat beslist hoeveel geschiedenis moet worden gebruikt voor elk item door verandering van regime te detecteren.

c) Causale modellering die identificeert hoe veranderingen in vraagbepalende factoren (zoals prijs, rentevoet, klantensentiment, enz.) de toekomstige vraag beïnvloeden.

d) Melding van uitzonderingen die data-analyse gebruikt om ongebruikelijke situaties te identificeren die nadere beoordeling door het management verdienen.

 

De rest van het verhaal. Het is ook van cruciaal belang om te begrijpen dat de tijd om een antwoord te krijgen meer inhoudt dan de snelheid van het voorspellen van berekeningen per se. Gegevens moeten in het geheugen worden geladen voordat de berekening kan beginnen. Zodra de prognoses zijn berekend, moet uw browser de resultaten laden zodat ze op het scherm kunnen worden weergegeven zodat u ermee kunt werken. Als u een product opnieuw voorspelt, kunt u ervoor kiezen om de resultaten op te slaan. Als u werkt met producthiërarchieën (het samenvoegen van artikelprognoses tot productfamilies, families tot productlijnen, enz.), zal de nieuwe prognose de hiërarchie beïnvloeden en moet alles op elkaar worden afgestemd. Dit kost allemaal tijd.

Snel genoeg voor jou? Wanneer u software evalueert om te zien of aan uw behoefte aan snelheid zal worden voldaan, kan dit allemaal worden getest als onderdeel van een proof of concept of proef aangeboden door leveranciers van software voor vraagplanning. Test het uit, en zorg ervoor dat de berekenen, laden en opslaan tijden zijn acceptabel gezien de hoeveelheid gegevens en prognosemethoden die u wilt gebruiken om uw proces te ondersteunen.

 

 

 

Hebben uw statistische prognoses last van het wiggle-effect?

 Wat is het wiggle-effect? 

Het is wanneer uw statistische prognose de ups en downs die in uw vraaggeschiedenis zijn waargenomen, onjuist voorspelt terwijl er echt geen patroon is. Het is belangrijk om ervoor te zorgen dat uw prognoses niet schommelen, tenzij er een echt patroon is.

Hier is een transcriptie van een recente klant waar dit probleem werd besproken:

Klant: “De prognose volgt niet de patronen die ik in de historie zie. Waarom niet?" 

Smart: “Als je goed kijkt, zijn de ups en downs die je ziet geen patronen. Het is echt lawaai.”  

Klant: "Maar als we de hoogtepunten niet voorspellen, slaan we de voorraad op."

Smart: “Als de voorspelling zou 'wiebelen', zou die veel minder nauwkeurig zijn. Het systeem voorspelt welk patroon dan ook, in dit geval een zeer lichte opwaartse trend. We bufferen het lawaai met veiligheidsvoorraden. De wiggles worden gebruikt om de veiligheidsvoorraden in te stellen.”

Klant: “Oké. Logisch nu.” 

Hebben uw statistische prognoses last van de grafiek met het wiggle-effect

De wiggle ziet er geruststellend uit, maar in dit geval resulteert het in een onjuiste vraagprognose. De ups en downs vinden niet echt elke maand op hetzelfde tijdstip plaats. Een betere statistische voorspelling wordt weergegeven in lichtgroen.

 

 

Hoe om te gaan met statistische prognoses van nul

Een statistische voorspelling van nul kan voor veel verwarring zorgen bij voorspellers, vooral wanneer de historische vraag niet nul is. Natuurlijk, het is duidelijk dat de vraag naar beneden neigt, maar moet deze naar nul evolueren? Wanneer de oudere vraag veel groter is dan de meer recente vraag en de meer recente vraag een zeer laag volume is (dwz 1,2,3 gevraagde eenheden), is het antwoord, statistisch gezien, ja. Dit komt echter mogelijk niet overeen met de zakelijke kennis van de planner en het verwachte minimale vraagniveau. Dus, wat moet een voorspeller doen om dit te corrigeren? Hier zijn drie suggesties:

 

  1. Beperk de historische gegevens die aan het model worden ingevoerd. In een neerwaartse trendsituatie zijn de oudere gegevens dat vaak veel groter dan de recente gegevens. Wanneer de oudere, veel hogere volumevraag wordt genegeerd, zal de neerwaartse trend lang niet zo significant zijn. U voorspelt nog steeds een neerwaartse trend, maar de resultaten zullen eerder in lijn zijn met de zakelijke verwachtingen.
  1. Probeer trenddemping. Smart Demand Planner heeft een functie genaamd "trendhedging" waarmee gebruikers kunnen definiëren hoe een trend in de loop van de tijd moet verdwijnen. Hoe hoger het percentage trendhedge (0-100%), hoe sterker de trenddemping. Dit betekent dat een voorspelde trend zich niet gedurende de hele prognosehorizon zal voortzetten. Dit betekent dat de vraagprognose begint af te vlakken voordat deze nul bereikt bij een neerwaartse trend.
  1. Wijzig het prognosemodel. Schakel over van een trendingmethode zoals Double Exponential Smoothing of Linear Moving Average naar een niet-trendingmethode zoals Single Exponential Smoothing of Simple Moving Average. U voorspelt geen neerwaartse trend, maar uw voorspelling zal in ieder geval niet nul zijn en dus waarschijnlijker door het bedrijf worden geaccepteerd.