Beheersing van automatische prognoses voor tijdreeksgegevens

In deze blog analyseren we de automatische prognoses voor vraagprojecties in tijdreeksen, waarbij we ons concentreren op de belangrijkste technieken, uitdagingen en best practices. Er zijn meerdere methoden om de toekomstige vraag naar een artikel te voorspellen, en dit wordt complex als het om duizenden artikelen gaat, die elk een andere voorspellingstechniek vereisen vanwege hun unieke vraagpatronen. Sommige artikelen hebben een stabiele vraag, andere vertonen een stijgende of dalende trend en sommige vertonen seizoensinvloeden. Het selecteren van de juiste methode voor elk item kan overweldigend zijn. Hier onderzoeken we hoe automatische prognoses dit proces vereenvoudigen.

Automatische prognoses worden van fundamenteel belang bij het beheren van grootschalige vraagprojecties. Met duizenden items is het handmatig selecteren van een prognosemethode voor elk item onpraktisch. Automatische prognoses maken gebruik van software om deze beslissingen te nemen, waardoor nauwkeurigheid en efficiëntie in het prognoseproces worden gegarandeerd. Het belang ervan ligt in het vermogen om complexe, grootschalige prognosebehoeften efficiënt af te handelen. Het elimineert de noodzaak van handmatige selectie, waardoor tijd wordt bespaard en fouten worden verminderd. Deze aanpak is vooral nuttig in omgevingen met uiteenlopende vraagpatronen, waarbij voor elk artikel mogelijk een andere prognosemethode nodig is.

 

Belangrijke overwegingen voor effectieve prognoses

  1. Uitdagingen van handmatige prognoses:
    • Onhaalbaarheid: het handmatig kiezen van prognosemethoden voor duizenden items is onbeheersbaar.
    • Inconsistentie: Menselijke fouten kunnen leiden tot inconsistente en onnauwkeurige voorspellingen.
  2. Criteria voor methodeselectie:
    • Foutmeting: Het primaire criterium voor het selecteren van een voorspellingsmethode is de typische voorspellingsfout, gedefinieerd als het verschil tussen voorspelde en werkelijke waarden. Deze fout wordt gemiddeld over de prognosehorizon (bijvoorbeeld maandelijkse prognoses over een jaar).
    • Holdout-analyse: deze techniek simuleert het proces van wachten tot een jaar is verstreken door enkele historische gegevens te verbergen, voorspellingen te doen en vervolgens de verborgen gegevens te onthullen om fouten te berekenen. Dit helpt bij het kiezen van de beste methode in realtime.
  3. Prognose toernooi:
    • Methodevergelijking: Verschillende methoden concurreren om elk item te voorspellen, waarbij de methode de laagste gemiddelde fout oplevert.
    • Parameterafstemming: Elke methode wordt getest met verschillende parameters om de optimale instellingen te vinden. Eenvoudige exponentiële afvlakking kan bijvoorbeeld worden geprobeerd met verschillende wegingsfactoren.

 

De algoritmen achter effectieve automatische prognoses

Automatische prognoses zijn zeer rekenkundig, maar haalbaar met moderne technologie. Het proces omvat:

  • Gegevenssegmentatie: Door historische gegevens in segmenten te verdelen, kunt u verschillende aspecten van historische gegevens beheren en benutten voor nauwkeurigere prognoses. Voor een product met een seizoensgebonden vraag kunnen de gegevens bijvoorbeeld worden gesegmenteerd op basis van seizoenen om seizoensspecifieke trends en patronen vast te leggen. Door deze segmentatie kunnen voorspellers effectiever voorspellingen maken en testen.
  • Herhaalde simulaties: Het gebruik van glijdende simulaties houdt in dat voorspellingen over verschillende perioden herhaaldelijk worden getest en verfijnd. Deze methode valideert de nauwkeurigheid van voorspellingsmethoden door ze toe te passen op verschillende gegevenssegmenten. Een voorbeeld is de glijdende-venstermethode, waarbij een venster met een vaste grootte door de tijdreeksgegevens beweegt en voor elke positie voorspellingen wordt gegenereerd om de prestaties te evalueren.
  • Parameteroptimalisatie: Parameteroptimalisatie omvat het uitproberen van meerdere varianten van elke prognosemethode om de best presterende te vinden. Door parameters aan te passen, zoals de afvlakkingsfactor bij exponentiële afvlakkingsmethoden of het aantal eerdere waarnemingen in ARIMA-modellen, kunnen voorspellers modellen verfijnen om de prestaties te verbeteren.

In onze software laten we bijvoorbeeld verschillende prognosemethoden met elkaar concurreren om de beste prestaties op een bepaald item. Kennis van automatische prognoses wordt onmiddellijk overgedragen op Simple Moving Average, lineair voortschrijdend gemiddelde, Single Exponential Smoothing, Double Exponential Smoothing, Winters' Exponential Smoothing en Promo-voorspellingen. Deze competitie zorgt ervoor dat de meest geschikte methode wordt geselecteerd op basis van empirisch bewijs, en niet op basis van subjectief oordeel. De winnaar van het toernooi komt het dichtst in de buurt van het voorspellen van nieuwe gegevenswaarden uit oude gegevens. De nauwkeurigheid wordt gemeten aan de hand van de gemiddelde absolute fout (dat wil zeggen de gemiddelde fout, waarbij eventuele mintekens worden genegeerd). Het gemiddelde wordt berekend over een reeks voorspellingen, waarbij elk een deel van de gegevens gebruikt, in een proces dat bekend staat als glijdende simulatie. eerder uitgelegd in een eerdere blog.

 

Methoden die worden gebruikt bij automatische prognoses

Normaal gesproken zijn er zes extrapolatieve voorspellingsmethoden die meedoen aan het automatische voorspellingstoernooi:

  • Eenvoudig voortschrijdend gemiddelde
  • Lineair voortschrijdend gemiddelde
  • Enkele exponentiële afvlakking
  • Dubbele exponentiële afvlakking
  • Additieve versie van Winters' exponentiële afvlakking
  • Multiplicatieve versie van Winters' exponentiële afvlakking

De laatste twee methoden zijn geschikt voor seizoensreeksen; ze worden echter automatisch uitgesloten van het toernooi als er minder dan twee volledige seizoenscycli met gegevens zijn (bijvoorbeeld minder dan 24 perioden met maandelijkse gegevens of acht perioden met driemaandelijkse gegevens). Deze zes klassieke, op afvlakking gebaseerde methoden hebben bewezen gemakkelijk te begrijpen, eenvoudig te berekenen en nauwkeurig te zijn. Je kunt elk van deze methoden uitsluiten van het toernooi als je een voorkeur hebt voor sommige deelnemers en niet voor andere.

Automatische prognoses voor tijdreeksgegevens zijn essentieel voor het efficiënt en nauwkeurig beheren van grootschalige vraagprojecties. Bedrijven kunnen een betere voorspellingsnauwkeurigheid bereiken en hun planningsprocessen stroomlijnen door de selectie van voorspellingsmethoden te automatiseren en technieken zoals holdout-analyse en voorspellingstoernooien te gebruiken. Het omarmen van deze geavanceerde voorspellingstechnieken zorgt ervoor dat bedrijven voorop blijven lopen in dynamische marktomgevingen en weloverwogen beslissingen nemen op basis van betrouwbare gegevensprojecties.

 

 

 

Elk voorspellingsmodel is goed waarvoor het is ontworpen

Wanneer u traditionele extrapolatieve voorspellingstechnieken moet gebruiken.

Met zoveel hype rond nieuwe Machine Learning (ML) en probabilistische voorspellingsmethoden lijken de traditionele “extrapolatieve” of “tijdreeksen” statistische voorspellingsmethoden de koude schouder te krijgen. Het is echter de moeite waard om te onthouden dat deze traditionele technieken (zoals enkele en dubbele exponentiële afvlakking, lineaire en eenvoudige voortschrijdende middeling, en Winters-modellen voor seizoensitems) vaak behoorlijk goed werken voor gegevens met een groter volume. Elke methode is goed voor waarvoor deze is ontworpen. Pas ze allemaal op de juiste manier toe, bijvoorbeeld: neem geen mes mee naar een vuurgevecht en gebruik geen drilboor als een eenvoudige handhamer voldoende is. 

Extrapolatieve methoden presteren goed wanneer de vraag een hoog volume heeft en niet te gedetailleerd is (dat wil zeggen, de vraag wordt maandelijks of driemaandelijks gespreid). Ze zijn ook erg snel en gebruiken niet zoveel computerbronnen als probabilistische en ML-methoden. Dit maakt ze zeer toegankelijk.

Zijn de traditionele methoden even nauwkeurig als nieuwere voorspellingsmethoden? Smart heeft ontdekt dat extrapolatieve methoden het zeer slecht doen als de vraag intermitterend is. Wanneer de vraag echter groter is, doen ze het slechts iets slechter dan onze nieuwe probabilistische methoden wanneer de vraag maandelijks wordt gesegmenteerd. Gezien hun toegankelijkheid, snelheid en het feit dat u prognoseoverschrijvingen gaat toepassen op basis van bedrijfskennis, zal het verschil in basislijnnauwkeurigheid hier niet materieel zijn.

Het voordeel van geavanceerdere modellen zoals de GEN2-probabilistische methoden van Smart is wanneer u patronen moet voorspellen met behulp van gedetailleerdere buckets zoals dagelijkse (of zelfs wekelijkse) gegevens. Dit komt omdat probabilistische modellen patronen van de dag van de week, de week van de maand en de maand van het jaar kunnen simuleren die met eenvoudigere technieken verloren zullen gaan. Heeft u ooit geprobeerd de dagelijkse seizoensinvloeden te voorspellen met een Wintermodel? Hier is een hint: het gaat niet werken en vereist veel techniek.

Probabilistische methoden bieden ook waarde die verder gaat dan de basisvoorspelling, omdat ze scenario's genereren die kunnen worden gebruikt bij stresstests voor voorraadbeheermodellen. Dit maakt ze geschikter om bijvoorbeeld te beoordelen hoe een verandering in het bestelpunt de voorraadkansen, opvullingspercentages en andere KPI's zal beïnvloeden. Door duizenden mogelijke aanvragen gedurende vele doorlooptijden te simuleren (die zelf in scenariovorm worden gepresenteerd), krijgt u een veel beter idee van hoe uw huidige en voorgestelde voorraadbeleid zal presteren. U kunt betere beslissingen nemen over waar u gerichte voorraadverhogingen en -verlagingen kunt doorvoeren.

Gooi dus nog niet het oude weg voor het nieuwe. Weet gewoon wanneer je een hamer nodig hebt en wanneer je een drilboor nodig hebt.