Elk voorspellingsmodel is goed waarvoor het is ontworpen

Wanneer u traditionele extrapolatieve voorspellingstechnieken moet gebruiken.

Met zoveel hype rond nieuwe Machine Learning (ML) en probabilistische voorspellingsmethoden lijken de traditionele “extrapolatieve” of “tijdreeksen” statistische voorspellingsmethoden de koude schouder te krijgen. Het is echter de moeite waard om te onthouden dat deze traditionele technieken (zoals enkele en dubbele exponentiële afvlakking, lineaire en eenvoudige voortschrijdende middeling, en Winters-modellen voor seizoensitems) vaak behoorlijk goed werken voor gegevens met een groter volume. Elke methode is goed voor waarvoor deze is ontworpen. Pas ze allemaal op de juiste manier toe, bijvoorbeeld: neem geen mes mee naar een vuurgevecht en gebruik geen drilboor als een eenvoudige handhamer voldoende is. 

Extrapolatieve methoden presteren goed wanneer de vraag een hoog volume heeft en niet te gedetailleerd is (dat wil zeggen, de vraag wordt maandelijks of driemaandelijks gespreid). Ze zijn ook erg snel en gebruiken niet zoveel computerbronnen als probabilistische en ML-methoden. Dit maakt ze zeer toegankelijk.

Zijn de traditionele methoden even nauwkeurig als nieuwere voorspellingsmethoden? Smart heeft ontdekt dat extrapolatieve methoden het zeer slecht doen als de vraag intermitterend is. Wanneer de vraag echter groter is, doen ze het slechts iets slechter dan onze nieuwe probabilistische methoden wanneer de vraag maandelijks wordt gesegmenteerd. Gezien hun toegankelijkheid, snelheid en het feit dat u prognoseoverschrijvingen gaat toepassen op basis van bedrijfskennis, zal het verschil in basislijnnauwkeurigheid hier niet materieel zijn.

Het voordeel van geavanceerdere modellen zoals de GEN2-probabilistische methoden van Smart is wanneer u patronen moet voorspellen met behulp van gedetailleerdere buckets zoals dagelijkse (of zelfs wekelijkse) gegevens. Dit komt omdat probabilistische modellen patronen van de dag van de week, de week van de maand en de maand van het jaar kunnen simuleren die met eenvoudigere technieken verloren zullen gaan. Heeft u ooit geprobeerd de dagelijkse seizoensinvloeden te voorspellen met een Wintermodel? Hier is een hint: het gaat niet werken en vereist veel techniek.

Probabilistische methoden bieden ook waarde die verder gaat dan de basisvoorspelling, omdat ze scenario's genereren die kunnen worden gebruikt bij stresstests voor voorraadbeheermodellen. Dit maakt ze geschikter om bijvoorbeeld te beoordelen hoe een verandering in het bestelpunt de voorraadkansen, opvullingspercentages en andere KPI's zal beïnvloeden. Door duizenden mogelijke aanvragen gedurende vele doorlooptijden te simuleren (die zelf in scenariovorm worden gepresenteerd), krijgt u een veel beter idee van hoe uw huidige en voorgestelde voorraadbeleid zal presteren. U kunt betere beslissingen nemen over waar u gerichte voorraadverhogingen en -verlagingen kunt doorvoeren.

Gooi dus nog niet het oude weg voor het nieuwe. Weet gewoon wanneer je een hamer nodig hebt en wanneer je een drilboor nodig hebt.

 

 

 

 

Probabilistische voorspellingsscenario's creëren en exploiteren

Probabilistische scenario's zijn reeksen gegevenspunten die worden gegenereerd om potentiële situaties uit de echte wereld weer te geven. In tegenstelling tot scenario's in oorlogsspellen of andere simulaties zijn dit synthetische tijdreeksen die worden gebruikt als input voor systeemmodellen of als intuïtiebouwers voor besluitvormers.

Scenario's van de toekomstige vraag naar artikelen kunnen bijvoorbeeld worden ingevoerd in Monte Carlo-simulatiemodellen van voorraadbeheersystemen, waardoor een virtueel laboratorium ontstaat waarin de gevolgen van managementbeslissingen kunnen worden onderzocht, zoals het wijzigen van bestelpunten en/of bestelhoeveelheden. Bovendien kunnen grafieken van meetgegevens, zoals voorhanden voorraad of stockouts, voorraadplanners helpen hun ‘gevoel’ voor de willekeur die inherent is aan hun activiteiten te verdiepen.

Figuur 1 toont dagelijkse vraagscenario's die zijn gegenereerd op basis van een enkele waargenomen vraagreeks die gedurende één jaar is geregistreerd. Merk op dat hetzelfde proces voor het genereren van gegevens er in detail “heel anders uit kan zien” van monster tot monster. Dit bootst het echte leven na.

Creating and Exploiting Probabilistic Forecasting Scenarios Sequence 1

Figuur 1: Een waargenomen vraagvolgorde en daarvan afgeleide vraagscenario’s.

 

Figuur 2 toont twee vraagscenario's en hun gevolgen voor de voorraad in een bepaald voorraadbeheersysteem. Het verschil tussen de twee voorraadgrafieken illustreert de mate waarin de willekeur in de vraag het probleem domineert. Het bovenste plot toont twee afleveringen van stockout, terwijl het onderste plot negen toont. Door het gemiddelde te nemen over vele scenario's zullen de typische waarden van Key Performance Metrics (KPI's) worden verduidelijkt, zoals het gemiddelde aantal stockouts dat is gekoppeld aan elke keuze van het bestelpunt en de bestelhoeveelheid (die respectievelijk 10 en 25 zijn in figuur 2).

Creating and Exploiting Probabilistic Forecasting Scenarios Sequence 2

Figuur 2: Twee vraagscenario's en hun gevolgen voor de voorhanden voorraad

 

In deze notitie beschrijven we technieken voor het maken van scenario's en geven we criteria op voor het evalueren van scenariogeneratoren.

Criteria voor scenario's

Zoals we hieronder zullen zien, zijn er verschillende manieren om scenario's te maken. Ongeacht de bron, welke criteria definiëren een ‘goed’ scenario? Er zijn vier hoofdcriteria: trouw, variëteit, hoeveelheid en kosten. Trouw vat samen hoe nauwkeurig een scenario situaties uit de echte wereld imiteert. High-fidelity betekent dat de scenario's de werkelijke gebeurtenissen nauwkeurig weerspiegelen en een solide basis vormen voor analyse en besluitvorming. Verscheidenheid beschrijft de diversiteit aan scenario's die een generator kan creëren. Een veelzijdige generator kan een breed scala aan potentiële situaties simuleren, waardoor mogelijkheden en risico's grondig kunnen worden verkend. Hoeveelheid verwijst naar het aantal scenario's dat een generator kan produceren. Een generator die een groot aantal scenario's kan creëren, levert voldoende gegevens voor analyse. Kosten houdt rekening met zowel de computer- als de menselijke hulpbronnen die nodig zijn om de scenario's te produceren. Een efficiënte scenariogenerator brengt kwaliteit in evenwicht met het gebruik van hulpbronnen, zodat de inspanning wordt gerechtvaardigd door de waarde en nauwkeurigheid van de resultaten.

Scenariogeneratie

Denk opnieuw aan een scenario als een tijdreeks. Hoe komen scenario's tot stand?

  1. Gepetto's werkplaats: Deze aanpak omvat het handmatig vervaardigen van scenario's door experts. Hoewel het high-fidelity (realisme) kan opleveren, vergt het zeer veel middelen en kan het niet gemakkelijk variatie genereren, wat een groot aantal scenario's vereist.
  2. Groundhog-dag: Bij deze methode wordt herhaaldelijk één enkele praktijksituatie als input gebruikt. Hoewel het per definitie realistisch en kosteneffectief is (er worden geen andere middelen gebruikt dan het vastleggen van de gegevens), mist deze aanpak variatie en kan daarom de diversiteit van scenario's uit de echte wereld niet accuraat weerspiegelen.
  3. Parametrische modellen: Voorbeelden van parametrische modellen zijn de klassiekers die in de klassen van de Statistiek worden bestudeerd: Normaal, exponentieel, Poisson, enz. De vraagdiagrammen in Figuur 2 worden parametrisch gegenereerd, zijnde de kwadraten van willekeurige Poisson-variabelen. Deze modellen genereren een onbeperkt aantal goedkope scenario's met een goede variëteit, maar ze geven niet altijd de complexiteit van gegevens uit de echte wereld weer, waardoor de betrouwbaarheid mogelijk in gevaar komt. Wanneer de werkelijkheid ingewikkelder is, genereren deze modellen te vereenvoudigde scenario's.
  4. Niet-parametrische tijdreeksbootstraps: Deze aanpak kan goed scoren op alle criteria: trouw, variëteit, kwantiteit en kosten. Het is een veelzijdige methode die uitblinkt in het creëren van enorme aantallen realistische scenario's. De synthetische vraaggeschiedenissen in Figuur 1 zijn eenvoudige bootstrap-voorbeelden, gebaseerd op de waargenomen waarden in de bovenste grafiek. (Zie de onderstaande links voor enkele details over het genereren van scenario's.)

Scenario's exploiteren

Scenario's bewijzen hun waarde op twee manieren: als input voor besluitvorming en als intuïtiebouwers. Wanneer vraagscenario's bijvoorbeeld worden gebruikt als input voor simulatiemodellen, maken ze stresstests en prestatieschattingen voor systeemontwerp mogelijk. Scenario's kunnen ook dienen als intuïtiebouwers voor besluitvormers of systeembeheerders. Hun visuele weergave helpt bij het ontwikkelen van inzicht in en waardering voor de risico's die gepaard gaan met het nemen van operationele beslissingen, of het nu gaat om vraagvoorspelling of voorraadbeheer.

Scenario-gebaseerde analyse is zeer computerintensief, vooral wanneer de scenario's worden gegenereerd door middel van bootstrapping. Bij Smart Software gebeurt het rekenen in de cloud. Stel je de rekenlast voor die gepaard gaat met het bepalen van bestelpunten en bestelhoeveelheden voor elk van de tienduizenden voorraadartikelen met behulp van honderden of duizenden vraagsimulaties voor elk artikel. Stel je verder voor dat de software niet alleen een specifiek voorgesteld paar van bestelpunten en bestelhoeveelheid evalueert, maar door de hele “ontwerpruimte” van paren dwaalt om het beste paar controleparameters voor elk item te vinden. Om dit praktisch te maken, profiteren we van de parallelle verwerkingskracht van de cloud. In wezen krijgt elk inventarisitem een eigen computer toegewezen die bij de berekeningen kan worden gebruikt, zodat al dat computerwerk tegelijkertijd kan plaatsvinden in plaats van opeenvolgend. Nu kunnen we losgaan en u echt de resultaten bezorgen die u nodig heeft.

Meer leren

Wie geïnteresseerd is in verdere technische details en referenties, kan hier meer informatie vinden.

Wat maakt een probabilistische voorspelling?

Probabilistische prognoses voor intermitterende vraag

 

 

 

 

Een ruwe kaart van termen die verband houden met prognoses

Mensen die nieuw zijn in de functie van “vraagplanner” of “aanbodplanner” zullen waarschijnlijk vragen hebben over de verschillende prognosetermen en -methoden die in hun baan worden gebruikt. Deze notitie kan helpen door deze termen uit te leggen en te laten zien hoe ze verband houden.

 

Demand Planning

Vraagplanning gaat over hoeveel van wat u te verkopen heeft in de toekomst de deur uit zal gaan, bijvoorbeeld hoeveel wat niet u het volgende kwartaal zult verkopen. Hier volgen zes methodologieën die vaak worden gebruikt bij vraagplanning.

  • Statistical Forecasting
    • Deze methoden gebruiken de vraaggeschiedenis om toekomstige waarden te voorspellen. De twee meest gebruikelijke methoden zijn curve-fitting en data-afvlakking.
    • Curve-aanpassing komt overeen met een eenvoudige wiskundige functie, zoals de vergelijking voor een rechte lijn (y= a +b∙t) of een rentecurve (y=a∙bT), naar de vraaggeschiedenis. Vervolgens breidt het die lijn of curve voorwaarts in de tijd uit als de voorspelling.
    • Het gladmaken van gegevens resulteert daarentegen niet in een vergelijking. In plaats daarvan doorloopt het de geschiedenis van de vraag, waarbij gaandeweg de waarden worden gemiddeld, om een vloeiendere versie van de geschiedenis te creëren. Deze methoden worden exponentiële afvlakking en voortschrijdend gemiddelde genoemd. In het eenvoudigste geval (dat wil zeggen, bij afwezigheid van trends of seizoensinvloeden, waarvoor varianten bestaan), is het doel om het huidige gemiddelde vraagniveau te schatten en dat als voorspelling te gebruiken.
    • Deze methoden produceren “puntvoorspellingen”, dit zijn schattingen op één getal voor elke toekomstige tijdsperiode (bijvoorbeeld: “De verkoop in maart zal 218 eenheden bedragen”). Soms komen ze met schattingen van potentiële voorspellingsfouten, die zijn gebaseerd op afzonderlijke modellen voor de variabiliteit van de vraag (“De verkoop in maart zal 218 ± 120 eenheden bedragen”).
  • Probabilistic Forecasting
    • Deze benadering maakt gebruik van de willekeur van de vraag en werkt hard om de prognoseonzekerheid in te schatten. Het beschouwt prognoses minder als een oefening in het verzamelen van specifieke cijfers en meer als een oefening in risicobeheer.
    • Het modelleert expliciet de variabiliteit in de vraag en gebruikt die om resultaten te presenteren in de vorm van grote aantallen scenario's die zijn geconstrueerd om het volledige scala aan mogelijke vraagsequenties weer te geven. Deze zijn vooral handig bij taken op het gebied van tactische leveringsplanning, zoals het instellen van bestelpunten en bestelhoeveelheden.
  • Causale voorspellingen
    • Statistische voorspellingsmodellen gebruiken als input alleen de vraaggeschiedenis van het betreffende artikel in het verleden. Ze beschouwen de op en neer gaande bewegingen in het vraagdiagram als het eindresultaat van talloze niet nader genoemde factoren (rentetarieven, de prijs van thee in China, fasen van de maan, wat dan ook). Causale voorspellingen identificeren expliciet één of meer invloeden (rentetarieven, advertentie-uitgaven, prijzen van concurrenten, …) die op plausibele wijze de verkoop kunnen beïnvloeden. Vervolgens wordt een vergelijking opgesteld die de numerieke waarden van deze ‘drivers’ of ‘causale factoren’ relateert aan de verkoop van artikelen. De coëfficiënten van de vergelijking worden geschat door middel van “regressieanalyse”.
  • Oordelende voorspellingen
    • Gouden Darm. Ondanks de algemene beschikbaarheid van klodders data, besteden sommige bedrijven weinig aandacht aan de cijfers en hechten ze meer gewicht aan de subjectieve oordelen van een leidinggevende die wordt geacht een ‘Gouden Buik’ te hebben, waardoor hij of zij ‘onderbuikgevoel’ kan gebruiken om te voorspellen wat de toekomstige vraag zal zijn. Als die persoon veel ervaring heeft, een carrière lang naar de cijfers heeft gekeken en niet vatbaar is voor wensdenken of andere vormen van cognitieve vooringenomenheid, kan de Gouden Darm een goedkope, snelle manier van plannen zijn. Maar er zijn goede aanwijzingen uit studies van bedrijven die op deze manier worden uitgevoerd, dat vertrouwen op de Gouden Gut riskant is.
    • Groepsconsensus. Vaker is een proces waarbij gebruik wordt gemaakt van een periodieke bijeenkomst om tot een groepsconsensusvoorspelling te komen. De groep zal toegang hebben tot gedeelde objectieve gegevens en voorspellingen, maar de leden zullen ook kennis hebben van factoren die mogelijk niet goed of helemaal niet worden gemeten, zoals het consumentenvertrouwen of de verhalen van verkopers. Het is nuttig om voor deze discussies een gedeeld, objectief uitgangspunt te hebben dat bestaat uit een soort objectieve statistische analyse. Vervolgens kan de groep overwegen om de statistische voorspelling aan te passen. Dit proces verankert de voorspelling in de objectieve realiteit, maar maakt gebruik van alle andere informatie die beschikbaar is buiten de voorspellingsdatabase.
    • Scenariogeneratie. Soms ontmoeten meerdere mensen elkaar en bespreken ze ‘strategische wat-als’-vragen. “Wat als we onze Australische klanten verliezen?” “Wat als de uitrol van onze nieuwe producten met zes maanden wordt uitgesteld?” "Wat als onze verkoopmanager voor het Midden-Westen naar een concurrent springt?" Deze vragen over het grotere geheel kunnen implicaties hebben voor itemspecifieke prognoses en kunnen worden toegevoegd aan elke bijeenkomst over prognoses voor groepsconsensus.
  • Prognose van nieuwe producten
    • Nieuwe producten hebben per definitie geen verkoopgeschiedenis die statistische, waarschijnlijkheids- of causale voorspellingen ondersteunt. Hier kunnen altijd subjectieve voorspellingsmethoden worden gebruikt, maar deze berusten vaak op een gevaarlijke verhouding tussen hoop en feiten. Gelukkig bestaat er op zijn minst gedeeltelijke steun voor objectieve voorspellingen in de vorm van curve-fitting.
    • Een grafiek van de cumulatieve verkoop van een artikel beschrijft vaak een soort “S-curve”, dat wil zeggen een grafiek die begint bij nul, zich opbouwt en vervolgens afvlakt tot de totale totale verkoop gedurende de uiteindelijke levensduur. De curve dankt zijn naam aan het feit dat hij lijkt op een letter S die op de een of andere manier naar rechts is uitgesmeerd en uitgerekt. Nu zijn er een oneindig aantal S-curves, dus voorspellers kiezen doorgaans een vergelijking en specificeren subjectief enkele belangrijke parameterwaarden, zoals wanneer de omzet 25%, 50% en 75% van de totale levenslange omzet zal bereiken en wat dat uiteindelijke niveau zal zijn. Dit is ook openlijk subjectief, maar het levert gedetailleerde voorspellingen per periode op die kunnen worden bijgewerkt naarmate de ervaring toeneemt. Ten slotte worden S-curven soms gevormd om overeen te komen met de bekende geschiedenis van een soortgelijk voorgangerproduct ("De verkoop voor onze laatste gizmo zag er zo uit, dus laten we dat als sjabloon gebruiken.").

 

Supply Planning

Vraagplanning wordt meegenomen in de aanbodplanning door toekomstige verkopen (bijvoorbeeld voor eindproducten) of gebruik (bijvoorbeeld voor reserveonderdelen) te voorspellen. Vervolgens is het aan de leveringsplanning om ervoor te zorgen dat de betreffende artikelen beschikbaar zijn voor verkoop of gebruik.

  • Afhankelijke vraag
    • Afhankelijke vraag is de vraag die kan worden bepaald door de relatie ervan met de vraag naar een ander artikel. Uit een stuklijst kan bijvoorbeeld blijken dat een rood wagentje bestaat uit een carrosserie, een trekstang, vier wielen, twee assen en diverse bevestigingsmiddelen om de wielen op de assen te houden en de trekstang met de carrosserie te verbinden. Dus als je 10 kleine rode wagons hoopt te verkopen, kun je er beter 10 maken, wat betekent dat je 10×2 = 20 assen, 10×4 = 40 wielen, enz. nodig hebt. De afhankelijke vraag regelt de aankoop van grondstoffen, de aankoop van componenten en subsystemen, zelfs personeel inhuren (voor 10 wagons is één middelbare scholier nodig om ze in een dienst van een uur in elkaar te zetten).
    • Als u meerdere producten heeft met gedeeltelijk overlappende stuklijsten, heeft u de keuze uit twee prognosebenaderingen. Stel dat u niet alleen kleine rode wagentjes verkoopt, maar ook kleine blauwe kinderwagens, die allebei dezelfde assen gebruiken. Om het aantal assen te voorspellen dat u nodig heeft, kunt u (1) de afhankelijke vraag naar assen van elk product voorspellen en de prognoses toevoegen, of (2) de totale vraaggeschiedenis naar assen als zijn eigen tijdreeks bekijken en die afzonderlijk voorspellen. Wat beter werkt, is een empirische vraag die kan worden getest.
  • Voorraadbeheer
    • Voorraadbeheer omvat veel verschillende taken. Deze omvatten het instellen van parameters voor voorraadbeheer, zoals bestelpunten en bestelhoeveelheden, het reageren op onvoorziene omstandigheden zoals voorraadtekorten en het versnellen van bestellingen, het instellen van personeelsbezetting en het selecteren van leveranciers.
  • Bij de eerste drie speelt forecasting een rol. Het aantal aanvulbestellingen dat in een jaar voor elk product wordt gedaan, bepaalt hoeveel mensen er nodig zijn om inkooporders te verlagen. Het aantal en de ernst van stockouts in een jaar bepalen het aantal onvoorziene gebeurtenissen dat moet worden afgehandeld. Het aantal inkooporders en stockouts in een jaar zal willekeurig zijn, maar wordt bepaald door de keuze van de parameters voor voorraadbeheer. De implicaties van dergelijke keuzes kunnen worden gemodelleerd door inventarissimulaties. Deze simulaties zullen worden aangestuurd door gedetailleerde vraagscenario's die worden gegenereerd door probabilistische voorspellingen.

 

 

 

Zes best practices voor vraagplanning waar u twee keer over moet nadenken

Op elk gebied, inclusief voorspellingen, wordt volkswijsheid verzameld die zich uiteindelijk voordoet als ‘best practices’. Deze best practices zijn vaak verstandig, althans gedeeltelijk, maar missen vaak context en zijn mogelijk niet geschikt voor bepaalde klanten, sectoren of bedrijfssituaties. Er zit vaak een addertje onder het gras: een ‘ja, maar’. Deze opmerking gaat over zes doorgaans juiste voorspellingen, die niettemin hun kanttekeningen plaatsen.

 

  1. Organiseer uw bedrijf rond een prognose van één getal. Dat klinkt verstandig: het is goed om een gedeelde visie te hebben. Maar elk onderdeel van het bedrijf zal zijn eigen idee hebben over welk getal het getal is. De financiële sector wil misschien kwartaalomzet, de marketing wil misschien websitebezoeken, de verkoop wil misschien een verloop, het onderhoud wil misschien een langere tijd tot het misgaat. Overigens heeft elke eenheid waarschijnlijk een handvol belangrijke statistieken. U heeft geen slogan nodig, u moet uw werk gedaan krijgen.

 

  1. Integreer bedrijfskennis in een gezamenlijk prognoseproces. Dit is een goede algemene regel, maar als uw samenwerkingsproces gebrekkig is, kan het knoeien met een statistische prognose via managementoverschrijvingen de nauwkeurigheid verminderen. Je hebt geen slogan nodig; je moet de nauwkeurigheid van alle methoden meten en vergelijken en de winnaars volgen.

 

  1. Voorspelling met behulp van causale modellering. Extrapolatieve prognosemethoden houden geen rekening met de onderliggende krachten die uw verkopen aandrijven, ze werken alleen met de resultaten. Causale modellering brengt u dieper in de fundamentele drijfveren en kan zowel de nauwkeurigheid als het inzicht verbeteren. Causale modellen (geïmplementeerd door middel van regressieanalyse) kunnen echter minder nauwkeurig zijn, vooral als ze voorspellingen van de drijvende krachten vereisen (“voorspellingen van de voorspellers”) in plaats van simpelweg de geregistreerde waarden van vertraagde voorspellende variabelen in te pluggen. Je hebt geen slogan nodig: je hebt een onderlinge vergelijking nodig.

 

  1. Voorspel de vraag in plaats van verzendingen. Vraag is wat je echt wilt, maar het ‘opstellen van een vraagsignaal’ kan lastig zijn: wat doe je met interne overboekingen? Eenmalige? Verloren omzet? Bovendien kunnen vraaggegevens worden gemanipuleerd. Als klanten bijvoorbeeld opzettelijk geen bestellingen plaatsen of proberen hun bestellingen te misleiden door te lang van tevoren te bestellen, zal de bestelgeschiedenis niet beter zijn dan de verzendgeschiedenis. Althans met verzendgeschiedenis, het klopt: u weet wat u heeft verzonden. Prognoses van verzendingen zijn geen voorspellingen van de ‘vraag’, maar vormen een solide uitgangspunt.

 

  1. Gebruik Machine Learning-methoden. Ten eerste is ‘Machine learning’ een elastisch concept dat een steeds groter aantal alternatieven omvat. Onder de motorkap van veel door ML geadverteerde modellen bevindt zich slechts een automatisch kiezen een extrapolatieve voorspellingsmethode (dat wil zeggen: de beste pasvorm) die, hoewel uitstekend in het voorspellen van de normale vraag, al bestaat sinds de jaren tachtig (Smart Software was het eerste bedrijf dat een automatische selectiemethode voor de pc uitbracht). ML-modellen zijn data-hogs die grotere datasets nodig hebben dan u mogelijk ter beschikking heeft. Het op de juiste manier kiezen en trainen van een ML-model vereist een niveau van statistische expertise dat ongebruikelijk is in veel productie- en distributiebedrijven. Misschien wil je iemand vinden die je hand vasthoudt voordat je dit spel gaat spelen.

 

  1. Door uitschieters te verwijderen, ontstaan betere voorspellingen. Hoewel het waar is dat zeer ongebruikelijke pieken of dalen in de vraag onderliggende vraagpatronen, zoals trends of seizoensinvloeden, zullen maskeren, is het niet altijd waar dat u de pieken moet wegnemen. Vaak weerspiegelen deze pieken in de vraag de onzekerheid die willekeurig uw bedrijfsvoering kan verstoren en waarmee dus rekening moet worden gehouden. Het verwijderen van dit soort gegevens uit uw vraagvoorspellingsmodel kan de gegevens op papier voorspelbaarder maken, maar u zult verrast zijn als dit opnieuw gebeurt. Wees dus voorzichtig met het verwijderen van uitschieters massaal.

 

 

 

 

De automatische prognosefunctie

Automatische prognoses zijn de populairste en meest gebruikte functie van SmartForecasts en Smart Demand Planner. Automatische prognoses maken is eenvoudig. Maar de eenvoud van Automatic Forecasting maskeert een krachtige interactie van een aantal zeer effectieve prognosemethoden. In deze blog bespreken we een deel van de theorie achter deze kernfunctie. We richten ons op automatische prognoses, deels vanwege de populariteit ervan en deels omdat veel andere prognosemethoden vergelijkbare resultaten opleveren. Kennis van automatische prognoses wordt onmiddellijk overgedragen naar eenvoudig voortschrijdend gemiddelde, lineair voortschrijdend gemiddelde, enkele exponentiële afvlakking, dubbele exponentiële afvlakking, Winters' exponentiële afvlakking en promoprognoses.

 

Prognose toernooi

Automatische prognoses werken door een toernooi uit te voeren met een reeks concurrerende methoden. Omdat personal computers en cloud computing snel zijn, en omdat we zeer efficiënte algoritmen hebben gecodeerd in de automatische voorspellingsengine van SmartForecasts, is het praktisch om een puur empirische benadering te volgen om te beslissen welke extrapolatieve voorspellingsmethode moet worden gebruikt. Dit betekent dat u het zich kunt veroorloven om een aantal benaderingen uit te proberen en vervolgens degene te behouden die het beste presteert bij het voorspellen van de betreffende gegevensreeks. SmartForecasts automatiseert dit proces volledig voor u door de verschillende voorspellingsmethoden uit te proberen in een gesimuleerd voorspellingstoernooi. De winnaar van het toernooi is de methode die het dichtst bij het voorspellen van nieuwe gegevenswaarden van oude komt. Nauwkeurigheid wordt gemeten aan de hand van de gemiddelde absolute fout (dat wil zeggen de gemiddelde fout, waarbij eventuele mintekens worden genegeerd). Het gemiddelde wordt berekend over een reeks voorspellingen, die elk een deel van de gegevens gebruiken, in een proces dat bekend staat als glijdende simulatie.

 

Glijdende simulatie

De glijdende simulatie veegt herhaaldelijk door steeds langere delen van de historische gegevens, waarbij in elk geval het gewenste aantal perioden in uw prognosehorizon wordt voorspeld. Stel dat er 36 historische gegevenswaarden zijn en dat u zes perioden vooruit moet voorspellen. Stel je voor dat je de voorspellingsnauwkeurigheid van een bepaalde methode, bijvoorbeeld een voortschrijdend gemiddelde van vier waarnemingen, wilt beoordelen op de gegevensreeks die voorhanden is.

Op een gegeven moment in de glijdende simulatie worden de eerste 24 punten (alleen) gebruikt om de 25e tot en met 30e historische gegevenswaarden te voorspellen, die we tijdelijk als onbekend beschouwen. We zeggen dat de punten 25-30 buiten de analyse worden gehouden. Het berekenen van de absolute waarden van de verschillen tussen de zes prognoses en de overeenkomstige werkelijke historische waarden levert één exemplaar op van elk een 1-staps, 2-staps, 3-staps, 4-staps, 5-staps en 6-staps vooruit absolute voorspelling fout. Als u dit proces herhaalt met de eerste 25 punten, krijgt u meer voorbeelden van 1-staps, 2-staps, 3-staps vooruit-fouten, enzovoort. Het gemiddelde van alle absolute foutschattingen die op deze manier zijn verkregen, geeft een samenvatting van de nauwkeurigheid in één getal.

 

Methoden die worden gebruikt bij automatische prognoses

Normaal gesproken zijn er zes extrapolatieve voorspellingsmethoden die meedoen aan het automatische voorspellingstoernooi:

  • Eenvoudig voortschrijdend gemiddelde
  • Lineair voortschrijdend gemiddelde
  • Enkele exponentiële afvlakking
  • Dubbele exponentiële afvlakking
  • Additieve versie van Winters' exponentiële afvlakking
  • Multiplicatieve versie van Winters' exponentiële afvlakking

 

De laatste twee methoden zijn geschikt voor seizoenreeksen; ze worden echter automatisch uitgesloten van het toernooi als er minder dan twee volledige seizoensgegevenscycli zijn (bijvoorbeeld minder dan 24 periodes met maandelijkse gegevens of acht periodes met driemaandelijkse gegevens).

Deze zes klassieke, op afvlakking gebaseerde methoden hebben bewezen gemakkelijk te begrijpen, gemakkelijk te berekenen en nauwkeurig te zijn. Je kunt elk van deze methoden uitsluiten van het toernooi als je een voorkeur hebt voor sommige deelnemers en niet voor andere.