"Biljoenen records van miljoenen mensen... Het vinden van de nuttige en juiste informatie, het begrijpen van de kwaliteit ervan en het tijdig en kosteneffectief produceren van betrouwbare geanalyseerde gegevens zijn allemaal kritieke kwesties."
Smart Software Senior Vice President for Research Tom Willemain had onlangs de gelegenheid om te praten met Dr. Mohsen Hamoudia, President van de Internationaal Instituut van Voorspellers (IIF), om actuele problemen met en kansen voor big data-analyse te bespreken. Het IIF informeert praktijkmensen over trends en onderzoeksontwikkelingen op het gebied van prognoses via gedrukte en online publicaties en het organiseren van professionele conferenties.
Dr. Hamoudia begint, bij wijze van inleiding:
In alle sectoren neemt de beschikbaarheid van gegevens explosief toe in volume, variëteit en snelheid. Big data-analyse speelt een belangrijke rol bij het identificeren van de gegevens die het belangrijkst zijn voor het bedrijf.
Ik neem het voorbeeld van de informatie- en communicatietechnologie (ICT)-sector. We zien een letterlijk exponentiële groei in de hoeveelheid data die beschikbaar is voor telecombedrijven, Over-the-top (OTT) onafhankelijke contentdistributeurs, overheid, toezichthouders en andere organisaties.
Over de hele wereld zijn we getuige van petabytes aan gegevens: biljoenen records van miljoenen mensen - allemaal afkomstig uit meerdere bronnen. Onder deze bronnen: internetverbindingen, verkoop, klantcontactcentra, sociale media, mobiele en vaste telefoongegevens. Het vinden van de nuttige en juiste informatie, het begrijpen van de kwaliteit ervan en het tijdig en kosteneffectief produceren van betrouwbare, geanalyseerde gegevens zijn allemaal kritieke kwesties. ICT-bedrijven zoeken steeds vaker naar bruikbare inzichten in hun data. Hoe ze hun klantenbestand en loyaliteitsprogramma's kunnen vergroten? Hoe kunnen ze de Quality of Service (QoS) verbeteren en het klantverloop verminderen? Met de juiste big data-analyseplatforms kunnen ze concurrerender en efficiënter zijn, waardoor de bedrijfsvoering, klantenservice en risicobeheer worden verbeterd. Het voorspellen en voorspellen van klanttrends en richtingen zijn essentieel voor telecom.
Voorspellingsvaardigheden, waaronder wiskunde, statistiek en econometrie, vormen een van de belangrijkste "blokken" van vereiste vaardigheden bij het beheren van Big Data. Sommige voorspellingsactiviteiten maken natuurlijk deel uit van het big data-debat.
In de detailhandel komen prognoses dagelijks aan de orde vraag naar over duizenden producten. Financiële prognoses, of het nu gaat om klantgedrag of financiële datareeksen, genereren enorme online datasets. Zoals opgemerkt door Robert Fildes, Distinguished Professor aan de Universiteit van Lancaster, is de academische prognosegemeenschap tot nu toe nog niet grondig betrokken - op enkele uitzonderingen na. Hal Varian van Google heeft gekeken naar een deel van het werk dat David Hendry en Jennifer Castle, aan de Universiteit van Oxford, hebben ondernomen om grote datasets te doorzoeken op datacongruente, betekenisvolle modellen. Stock en Watson hebben ook hun eigen benaderingen ontwikkeld voor grote macrogegevenssets. Maar ondanks de poging, tijdens het symposium over prognoses vorig jaar in Seoel, om het thema big data en zijn prognosetoepassingen te verkennen, zijn er nog maar weinig overtuigende toepassingen van het gebruik van online data voor echte prognoseproblemen.
V. Men hoort tegenwoordig veel over 'voorspellende analyses', maar de uitdrukking wordt zelden in verband gebracht met prognoses. Bent u het ermee eens dat prognoses de kern vormen van voorspellende analyses? Heb je een verklaring waarom de link verbroken is? Heeft u ideeën over hoe u prognoses opnieuw in het gesprek kunt inbrengen?
De resultaten van prognoses (het 'wat') worden nu misschien als minder belangrijk ervaren dan het 'hoe'. Bijgevolg is het vertrouwen dat gebruikers stellen in traditionele prognoses afgenomen. Wie stelt inderdaad de juistheid of relevantie van prognoses ter discussie door a posteriori de realiteit versus de prognose te vergelijken - om te pleiten voor de effectiviteit van methododiges en daarmee voor het opbouwen van geloofwaardigheid?
Met de huidige perceptie van "voorspellende analyses" is er waarschijnlijk meer ruimte in de publieke verbeelding voor de "hoe"-kant van de dingen, en daarom een geloofwaardiger verhaal om te vertellen aan partners, investeerders of klanten.
V. Het lijkt erop dat er bijna geen verband bestaat tussen traditionele prognoses en mobiele technologie (smartphones, tabletcomputers). Klopt dit, of migreren sommige bedrijven prognoses naar mobiele apparaten? Ziet u een pad voorwaarts waarin traditionele prognosealgoritmen routinematig op mobiele apparaten zouden staan?
Allereerst wil ik uw lezers graag uitnodigen om ons nieuwste nummer van Foresight te lezen. In een uitstekend artikel over dit onderwerp, "Forecasting In the Pocket: Mobile Devices Can Improve Collaboration", wordt uitgelegd dat "de toenemende populariteit van PDA's, smartphones, tabletcomputers en andere mobiele apparaten nieuwe mogelijkheden opent voor communicatie en samenwerking bij zakelijke prognoses." De auteurs vertellen ons: "Mobiele prognosetoepassingen (m-forecasting) kunnen benaderingen van samenwerking tussen detailhandelaren en leveranciers stroomlijnen, en zo bijdragen aan de verstrekking en uitwisseling van productinformatie, vooral omdat prognoses sterk verbonden zijn met kennis van de lokale context."
Aan de kant van ICT & OTT vinden bijvoorbeeld een groot aantal voorspellende projecten plaats, zoals die van Google+ en Facebook, dankzij de opname van de "gebruikerslocatie" -gegevens in de IT-systemen van OTT. Naar mijn mening, en wat ik zie in sommige sectoren zoals retail en logistiek, is dat traditionele forecasting en mobiele forecasting (m-forecasting) complementair zijn. Dit laatste zou kunnen worden gezien als een bottom-up prognosebenadering die de top-down prognoseresultaten al dan niet zal bevestigen.
V. Sommige mensen beweren dat big data de vervanging van prognoses door "sense and react"-systemen zal vergemakkelijken. Hoe zou u 'voelen en reageren' in de praktijk uitleggen en zijn er toepassingsgebieden waarvan u denkt dat het wel of niet zal aanslaan?
Het lijkt mij dat "sense and react" volledig gericht is op het kortetermijnperspectief. Prognoses breiden dit uit door tegemoet te komen aan behoeften voor een variabele horizon: korte en middellange termijn.
Als neveneffect van ATAWAD (Anytime, Anywhere, Any Device) zijn de besluitvormingscriteria meer dan ooit “korte termijn”. Big data is een detectiesysteem voor "zwakke signalen", dat de bijna realtime detectie van zakelijke kansen mogelijk maakt die met traditionele IT-systemen onopgemerkt zouden blijven. Er zijn niet echt voorkeurs- of niet-prioritaire toepassingen hiervoor, de vraag is meer aan de "wanneer" -kant.
Big data is relevant als je onder de oppervlakte kijkt in moeilijke economische tijden, maar ik ben er minder zeker van of het de moeite waard is in een “normale” economische periode. Om af te sluiten op dit punt: ik zal graag een voorbeeld zien van hoe nauwkeurig prognoses zijn die zijn gebaseerd op "voelen en reageren" versus prognoses op basis van traditionele modellen.
V. Ik stel een aantal grote vragen. In hoeverre ziet u de IIF-gemeenschap deze discussies en resultaten vormgeven? Hoe kunnen lezers deelnemen aan de dialoog?
We verwachten een toenemende beschikbaarheid en een toenemend gebruik van enorme hoeveelheden gegevens in veel sectoren, zoals energie, transport, gezondheidszorg, financiën, telecommunicatie en toerisme.
Veel van de IIF-leden houden zich bezig met verschillende aspecten van de big data-beweging. Het IIF doet wat werk in de voorspellingsactiviteiten die natuurlijk deel uitmaken van het big data-debat. Meer in het algemeen neemt het IIF actief deel aan en biedt het een forum voor de discussie over prognoses in de rest van de wereld.
Het thema van ons laatste International Symposium on Forecasting (ISF) in Seoul was “Forecasting with Big Data” en enkele presentaties hadden betrekking op gezondheidszorg en telecommunicatie. Er is zojuist een relevante workshop georganiseerd door de Europese Centrale Bank (ECB). Als er op deze modellen wordt geprofiteerd, hebben ze het potentieel om het economisch beleid van Europa vrij snel te beïnvloeden.
Lezers kunnen deelnemen aan de dialoog door artikelen bij te dragen aan de publicaties van het IIF (The International Journal of Forecasting, Foresight and Het orakel). Foresight is bijvoorbeeld een stem van onschatbare waarde om academici en praktijkmensen samen te brengen in een voortdurende discussie.
Lezers kunnen ook papers presenteren op de jaarlijkse conferentie (de eerder genoemde ISF). Ze kunnen ook specifieke workshops voorstellen en organiseren voor specifieke toepassingen van big data, zoals de workshop die zojuist door de ECB in Frankfurt is georganiseerd. Een andere mogelijkheid is om de leden van IIF uit te nodigen voor het bijwonen van bijeenkomsten die te maken hebben met prognoses met big data. Al deze kansen vormen goede platforms om te netwerken en samen te werken.
Mohsen Hamoudia, PhD, is de voorzitter van het International Institute of Forecasters. Hij is ook Head of Strategy for Large Projects (Parijs) voor Orange Business Services (het voormalige France Telecom).
Thomas Willemain, PhD, was medeoprichter van Smart Software en is momenteel Senior Vice President for Research. Dr. Willemain is ook emeritus hoogleraar Industrial and Systems Engineering aan het Rensselear Polytechnic Institute en als lid van de onderzoeksstaf van het Centre for Computing Sciences, Institute for Defence Analyses.