Glidande Medelvärde Metod Exponentiella Smoothing Metod Trendprojektions Metoder


Prognoser genom utjämningstekniker Den här webbplatsen är en del av JavaScript E-labs lärande objekt för beslutsfattande. Annan JavaScript i denna serie kategoriseras under olika tillämpningsområden i avsnittet MENU på den här sidan. En tidsserie är en följd av observationer som beställs i tid. Inherent i insamlingen av data som tagits över tiden är någon form av slumpmässig variation. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. Bredt använda tekniker är utjämning. Dessa tekniker, när de tillämpas korrekt, avslöjar tydligare de underliggande trenderna. Ange tidsserierna Row-wise i följd, från början till vänster och parametrarna, och klicka sedan på knappen Beräkna för att få fram en prognos för en period framåt. Blanka rutor ingår inte i beräkningarna men nollor är. När du matar in data för att flytta från cell till cell i datmatrisen använder du inte knappen Tab eller pilar in. Funktioner av tidsserier, som kan avslöjas genom att granska dess graf. Med de prognostiserade värdena och restbeteendet, förutsatt prognosmodellering. Flyttande medelvärden: Flyttande medelvärde rankas bland de mest populära teknikerna för förbehandling av tidsserier. De används för att filtrera slumpmässigt vitt brus från data, för att göra tidsserierna mjukare eller till och med för att betona vissa informationskomponenter som ingår i tidsserierna. Exponentiell utjämning: Detta är ett mycket populärt schema för att producera en slät Time Series. Medan i rörliga medelvärden viktas de senaste observationerna, exponentiell utjämning tilldelar exponentiellt minskande vikter som observationen blir äldre. Med andra ord ges de senaste observationerna relativt större vikt vid prognoser än de äldre observationerna. Dubbel exponentiell utjämning är bättre vid hantering av trender. Trippel exponentiell utjämning är bättre vid hantering av paraboltrender. Ett exponentiellt vägat glidande medelvärde med en utjämningskonstant a. motsvarar ungefär ett enkelt rörligt medelvärde av längd (dvs period) n, där a och n är relaterade till: a 2 (n1) ORn (2-a) a. Således skulle exempelvis ett exponentiellt vägt glidmedel med en utjämningskonstant lika med 0,1 motsvara ungefär ett 19 dagars glidande medelvärde. Och ett 40-dagars enkelt rörligt medelvärde skulle motsvara ungefär ett exponentiellt vägt rörligt medelvärde med en utjämningskonstant lika med 0,04878. Håller linjär exponentiell utjämning: Antag att tidsserierna är säsongsbetonade men visar trend. Holts metod beräknar både nuvarande nivå och nuvarande trend. Observera att det enkla glidande medlet är ett speciellt fall av exponentiell utjämning genom att ställa in perioden för glidande medelvärde till heltalet av (2-alfa) alfa. För de flesta företagsdata är en Alpha-parameter som är mindre än 0,40 ofta effektiv. Man kan emellertid utföra en nätverkssökning av parameterutrymmet, med 0,1 till 0,9, med steg om 0,1. Då har den bästa alfas det minsta genomsnittliga absoluta felet (MA-fel). Hur man jämför flera utjämningsmetoder: Även om det finns numeriska indikatorer för bedömning av prognosteknikens noggrannhet, är det mest använda sättet att använda en visuell jämförelse av flera prognoser för att bedöma deras noggrannhet och välja mellan olika prognosmetoder. I detta tillvägagångssätt måste man plotta (med användning av exempelvis Excel) på samma graf de ursprungliga värdena för en tidsserievariabel och de förutspådda värdena från flera olika prognosmetoder, vilket underlättar en visuell jämförelse. Du kanske gillar att använda tidigare prognoser med utjämningstekniker JavaScript för att få de senaste prognosvärdena baserade på utjämningstekniker som endast använder en parameter. Holt - och Winters-metoderna använder sig av två respektive tre parametrar, därför är det inte en lätt uppgift att välja de optimala eller till och med nära optimala värden genom försök och fel för parametrarna. Den enda exponentiella utjämningen betonar det korta perspektivet som ställer nivån till den sista observationen och baseras på förutsättningen att det inte finns någon trend. Den linjära regressionen, som passar en minsta kvadrera linje till historiska data (eller transformerade historiska data), representerar det långa intervallet, vilket är konditionerat för den grundläggande trenden. Hålen linjär exponentiell utjämning fångar information om den senaste trenden. Parametrarna i Holts-modellen är nivåparametrar som bör minskas när datamängden är stor, och trenderparametern bör ökas om den senaste trendriktningen stöds av orsakssambandsfaktorerna. Kortsiktiga prognoser: Observera att varje JavaScript på denna sida ger en enstegs prognos. För att få en tvåstegs prognos. Lägg helt enkelt det prognostiserade värdet till slutet av din tidsseriedata och klicka sedan på samma Calculate-knapp. Du kan upprepa denna process några gånger för att få de nödvändiga kortsiktiga prognoserna. Förflyttning av medel och exponentiella utjämningsmodeller Som ett första steg för att flytta bortom genomsnittliga modeller kan slumpmässiga gångmodeller och linjära trendmodeller, nonseasonal mönster och trender kunna Extrapoleras med hjälp av en rörlig genomsnitts - eller utjämningsmodell. Det grundläggande antagandet bakom medelvärdes - och utjämningsmodeller är att tidsserierna är lokalt stationära med ett långsamt varierande medelvärde. Därför tar vi ett rörligt (lokalt) medelvärde för att uppskatta det nuvarande värdet av medelvärdet och sedan använda det som prognosen för den närmaste framtiden. Detta kan betraktas som en kompromiss mellan medelmodellen och slumpmässig-walk-utan-drift-modellen. Samma strategi kan användas för att uppskatta och extrapolera en lokal trend. Ett rörligt medelvärde kallas ofta en quotsmoothedquot-version av den ursprungliga serien, eftersom kortsiktig medelvärde medför att utjämning av stötarna i originalserien. Genom att justera graden av utjämning (bredden på glidande medelvärdet) kan vi hoppas att hitta någon form av optimal balans mellan prestandan hos medel - och slumpmässiga gångmodeller. Den enklaste typen av medelvärdesmodell är. Enkelt (lika viktat) Flyttande medelvärde: Prognosen för värdet av Y vid tiden t1 som är gjord vid tiden t motsvarar det enkla medelvärdet av de senaste m-observationerna: (Här och på annat håll använder jag symbolen 8220Y-hat8221 för att stå För en prognos av tidsserie Y som gjordes snarast möjligt före datum med en given modell.) Detta medel är centrerat vid period-t (m1) 2, vilket innebär att uppskattningen av det lokala medelvärdet tenderar att ligga bakom det sanna Värdet av det lokala medelvärdet med ca (m1) 2 perioder. Således säger vi att medelåldern för data i det enkla glidande medlet är (m1) 2 i förhållande till den period för vilken prognosen beräknas: det här är hur lång tid prognoserna tenderar att ligga bakom vändpunkter i data . Om du till exempel medger de senaste 5 värdena, kommer prognoserna att vara ca 3 perioder sent för att svara på vändpunkter. Observera att om m1 är den enkla glidande genomsnittsmodellen (SMA) motsvarar den slumpmässiga gångmodellen (utan tillväxt). Om m är väldigt stor (jämförbar med längden på uppskattningsperioden) motsvarar SMA-modellen den genomsnittliga modellen. Precis som med vilken parameter som helst av en prognosmodell, är det vanligt att justera värdet på k för att få den bästa kvotkvoten till data, dvs de minsta prognosfelen i genomsnitt. Här är ett exempel på en serie som verkar utgöra slumpmässiga fluktuationer runt ett långsamt varierande medelvärde. Först kan vi försöka passa på den med en slumpmässig promenadmodell, vilket motsvarar ett enkelt glidande medelvärde på 1 term: Slumpmässig gångmodell svarar väldigt snabbt på förändringar i serien, men därigenom väljer man mycket av kvotenhetskvoten i data (de slumpmässiga fluktuationerna) samt quotsignalquot (den lokala medelvärdet). Om vi ​​istället försöker ett enkelt glidande medelvärde på 5 termer får vi en snyggare uppsättning prognoser: Det 5-åriga enkla glidande medlet ger betydligt mindre fel än den slumpmässiga gångmodellen i det här fallet. Medelåldern för data i denna prognos är 3 ((51) 2), så att den tenderar att ligga bakom vändpunkter med cirka tre perioder. (Till exempel verkar en nedgång ha skett i period 21, men prognoserna vänder inte om till flera perioder senare.) Notera att de långsiktiga prognoserna från SMA-modellen är en horisontell rak linje, precis som i slumpmässig promenad modell. Således antar SMA-modellen att det inte finns någon trend i data. Men medan prognoserna från den slumpmässiga promenadmodellen helt enkelt motsvarar det senast observerade värdet är prognoserna från SMA-modellen lika med ett vägt genomsnitt av de senaste värdena. De konfidensbegränsningar som beräknas av Statgraphics för de långsiktiga prognoserna för det enkla glidande genomsnittet blir inte större eftersom prognostiseringshorisonten ökar. Det här är uppenbarligen inte korrekt Tyvärr finns det ingen underliggande statistisk teori som berättar hur förtroendeintervallen borde utvidgas för denna modell. Det är dock inte så svårt att beräkna empiriska uppskattningar av konfidensgränserna för prognosen för längre tid. Du kan till exempel konfigurera ett kalkylblad där SMA-modellen skulle användas för att prognostisera två steg framåt, 3 steg framåt etc. i det historiska dataprov. Därefter kan du beräkna felfunktionens avvikelser vid varje prognoshorisont och sedan konstruera konfidensintervaller för längre siktprognoser genom att lägga till och subtrahera multiplar med lämplig standardavvikelse. Om vi ​​försöker ett 9-sikt enkelt glidande medelvärde får vi ännu jämnare prognoser och mer av en eftersläpande effekt: Medelåldern är nu 5 perioder ((91) 2). Om vi ​​tar ett 19-årigt glidande medel ökar medeltiden till 10: Observera att prognoserna nu försvinner nu bakom vändpunkter med cirka 10 perioder. Vilken mängd utjämning är bäst för denna serie Här är en tabell som jämför deras felstatistik, inklusive ett 3-siktigt genomsnitt: Modell C, det 5-åriga glidande medlet, ger det lägsta värdet av RMSE med en liten marginal över 3 - term och 9-medeltal, och deras andra statistik är nästan identiska. Så, bland modeller med mycket liknande felstatistik kan vi välja om vi föredrar lite mer respons eller lite mer jämnhet i prognoserna. (Tillbaka till början av sidan.) Browns Simple Exponential Smoothing (exponentiellt vägd glidande medelvärde) Den enkla glidande medelmodellen beskriven ovan har den oönskade egenskapen som den behandlar de senaste k-observationerna lika och fullständigt ignorerar alla föregående observationer. Intuitivt bör tidigare data diskonteras på ett mer gradvis sätt - till exempel bör den senaste observationen få lite mer vikt än 2: a senast, och den 2: a senaste bör få lite mer vikt än den 3: e senaste, och så vidare. Den enkla exponentiella utjämningens (SES) - modellen åstadkommer detta. Låt 945 beteckna en quotsmoothing constantquot (ett tal mellan 0 och 1). Ett sätt att skriva modellen är att definiera en serie L som representerar den nuvarande nivån (dvs lokal medelvärde) för serien som uppskattad från data fram till idag. Värdet på L vid tid t beräknas rekursivt från sitt eget tidigare värde som detta: Således är det nuvarande utjämnade värdet en interpolation mellan det tidigare jämnda värdet och den aktuella observationen, där 945 styr närheten av det interpolerade värdet till den senaste observation. Prognosen för nästa period är helt enkelt det nuvarande utjämnade värdet: Likvärdigt kan vi uttrycka nästa prognos direkt i form av tidigare prognoser och tidigare observationer, i någon av följande ekvivalenta versioner. I den första versionen är prognosen en interpolation mellan föregående prognos och tidigare observation: I den andra versionen erhålls nästa prognos genom att justera föregående prognos i riktning mot det föregående felet med en bråkdel av 945. Är felet gjort vid Tid t. I den tredje versionen är prognosen ett exponentiellt vägt (dvs. rabatterat) glidande medelvärde med rabattfaktor 1-945: Interpolationsversionen av prognosformuläret är det enklaste att använda om du genomför modellen på ett kalkylblad: det passar in i en Encell och innehåller cellreferenser som pekar på föregående prognos, föregående observation och cellen där värdet 945 lagras. Observera att om 945 1 motsvarar SES-modellen en slumpmässig gångmodell (utan tillväxt). Om 945 0 motsvarar SES-modellen den genomsnittliga modellen, förutsatt att det första släta värdet sätts lika med medelvärdet. (Återgå till början av sidan.) Medelåldern för data i prognosen för enkel exponentiell utjämning är 1 945 i förhållande till den period som prognosen beräknas för. (Det här är inte tänkt att vara uppenbart, men det kan enkelt visas genom att utvärdera en oändlig serie.) Den enkla, snabba genomsnittliga prognosen tenderar därför att ligga bakom vändpunkter med cirka 1 945 perioder. Till exempel, när 945 0,5 är fördröjningen 2 perioder när 945 0,2 är fördröjningen 5 perioder när 945 0,1 är fördröjningen 10 perioder, och så vidare. För en given medelålder (dvs mängden fördröjning) är prognosen för enkel exponentiell utjämning (SES) något överlägsen SMA-prognosen (Simple Moving Average) eftersom den lägger relativt större vikt vid den senaste observationen, dvs. det är något mer quotresponsivequot för förändringar som inträffade under det senaste förflutna. Till exempel har en SMA-modell med 9 villkor och en SES-modell med 945 0,2 båda en genomsnittlig ålder på 5 för data i sina prognoser, men SES-modellen lägger mer vikt på de sista 3 värdena än SMA-modellen och vid samtidigt som det inte helt 8220forget8221 om värden som är mer än 9 perioder gamla, vilket visas i det här diagrammet. En annan viktig fördel med SES-modellen över SMA-modellen är att SES-modellen använder en utjämningsparameter som kontinuerligt varierar, så att den lätt kan optimeras genom att använda en kvotsolverquot-algoritm för att minimera det genomsnittliga kvadratfelet. Det optimala värdet på 945 i SES-modellen för denna serie visar sig vara 0,2961, som visas här: Medelåldern för data i denna prognos är 10,2961 3,4 perioder, vilket liknar det för ett 6-sikt enkelt glidande medelvärde. De långsiktiga prognoserna från SES-modellen är en horisontell rak linje. Som i SMA-modellen och den slumpmässiga promenadmodellen utan tillväxt. Observera dock att de konfidensintervall som beräknas av Statgraphics avviker nu på ett rimligt sätt, och att de är väsentligt smalare än konfidensintervallen för slumpmässig promenadmodell. SES-modellen förutsätter att serien är något mer förutsägbar än den slumpmässiga promenadmodellen. En SES-modell är egentligen ett speciellt fall av en ARIMA-modell. så ger den statistiska teorin om ARIMA-modeller en bra grund för beräkning av konfidensintervaller för SES-modellen. I synnerhet är en SES-modell en ARIMA-modell med en icke-säsongsskillnad, en MA (1) term och ingen konstant term. annars känd som en quotARIMA (0,1,1) modell utan constantquot. MA (1) - koefficienten i ARIMA-modellen motsvarar kvantiteten 1-945 i SES-modellen. Om du till exempel passar en ARIMA-modell (0,1,1) utan konstant till serien som analyseras här, uppskattas den uppskattade MA (1) - koefficienten vara 0,7029, vilket är nästan exakt en minus 0,2961. Det är möjligt att lägga till antagandet om en icke-noll konstant linjär trend till en SES-modell. För att göra detta, ange bara en ARIMA-modell med en icke-säsongsskillnad och en MA (1) term med en konstant, dvs en ARIMA (0,1,1) modell med konstant. De långsiktiga prognoserna kommer då att ha en trend som är lika med den genomsnittliga trenden som observerats under hela estimeringsperioden. Du kan inte göra detta i samband med säsongjustering, eftersom säsongsjusteringsalternativen är inaktiverade när modelltypen är inställd på ARIMA. Du kan dock lägga till en konstant långsiktig exponentiell trend till en enkel exponentiell utjämningsmodell (med eller utan säsongsjustering) genom att använda inflationsjusteringsalternativet i prognosproceduren. Den lämpliga quotinflationen (procentuell tillväxt) per period kan uppskattas som lutningskoefficienten i en linjär trendmodell som är anpassad till data i samband med en naturlig logaritmtransformation, eller det kan baseras på annan oberoende information om långsiktiga tillväxtutsikter . (Return to top of page.) Browns Linjär (dvs dubbel) Exponentiell utjämning SMA-modellerna och SES-modellerna antar att det inte finns någon trend av något slag i data (vilket vanligtvis är OK eller åtminstone inte för dåligt för 1- Stegvisa prognoser när data är relativt bullriga), och de kan modifieras för att införliva en konstant linjär trend som visas ovan. Vad sägs om kortsiktiga trender Om en serie visar en växande växthastighet eller ett cykliskt mönster som står klart ut mot bruset, och om det finns behov av att prognostisera mer än en period framåt, kan uppskattningen av en lokal trend också vara en fråga. Den enkla exponentiella utjämningsmodellen kan generaliseras för att erhålla en linjär exponentiell utjämning (LES) - modell som beräknar lokala uppskattningar av både nivå och trend. Den enklaste tidsvarierande trendmodellen är Browns linjära exponentiella utjämningsmodell, som använder två olika slätmade serier som centreras vid olika tidpunkter. Prognosformeln baseras på en extrapolering av en linje genom de två centra. (En mer sofistikerad version av denna modell, Holt8217s, diskuteras nedan.) Den algebraiska formen av Brown8217s linjär exponentiell utjämningsmodell, som den enkla exponentiella utjämningsmodellen, kan uttryckas i ett antal olika men likvärdiga former. Den här kvotens kvotstandardkvot uttrycks vanligen enligt följande: Låt S beteckna den singeljämnade serien som erhållits genom att använda enkel exponentiell utjämning till serie Y. Dvs, värdet av S vid period t ges av: (Minns att, under enkel exponentiell utjämning, detta skulle vara prognosen för Y vid period t1.) Låt sedan Squot beteckna den dubbelsidiga serien erhållen genom att använda enkel exponentiell utjämning (med samma 945) till serie S: Slutligen prognosen för Y tk. För vilken kgt1 som helst, ges av: Detta ger e 1 0 (det vill säga lura lite och låt den första prognosen motsvara den faktiska första observationen) och e 2 Y 2 8211 Y 1. varefter prognoser genereras med hjälp av ekvationen ovan. Detta ger samma monterade värden som formeln baserad på S och S om de senare startades med användning av S1S1Y1. Denna version av modellen används på nästa sida som illustrerar en kombination av exponentiell utjämning med säsongsjustering. Holt8217s linjär exponentiell utjämning Brown8217s LES-modell beräknar lokala uppskattningar av nivå och trend genom att utjämna de senaste uppgifterna, men det faktum att det gör det med en enda utjämningsparameter ställer en begränsning på de datamönster som den kan passa: nivån och trenden får inte variera till oberoende priser. Holt8217s LES-modell tar upp problemet genom att inkludera två utjämningskonstanter, en för nivån och en för trenden. När som helst, t som i Brown8217s modell, finns det en uppskattning L t på lokal nivå och en uppskattning T t av den lokala trenden. Här beräknas de rekursivt från värdet av Y observerat vid tiden t och de tidigare uppskattningarna av nivån och trenden med två ekvationer som applicerar exponentiell utjämning till dem separat. Om den beräknade nivån och trenden vid tiden t-1 är L t82091 och T t-1. Respektive prognosen för Y tshy som skulle ha gjorts vid tid t-1 är lika med L t-1 T t-1. När det verkliga värdet observeras beräknas den uppdaterade uppskattningen av nivån rekursivt genom interpolering mellan Y tshy och dess prognos L t-1 T t 1 med vikter av 945 och 1- 945. Förändringen i beräknad nivå, Nämligen L t 8209 L t82091. Kan tolkas som en bullrig mätning av trenden vid tiden t. Den uppdaterade uppskattningen av trenden beräknas därefter rekursivt genom interpolering mellan L t 8209 L t82091 och den tidigare uppskattningen av trenden T t-1. Användning av vikter av 946 och 1-946: Tolkningen av trendutjämningskonstanten 946 är analog med den för nivåutjämningskonstanten 945. Modeller med små värden av 946 antar att trenden ändras endast mycket långsamt över tiden, medan modeller med Större 946 antar att det förändras snabbare. En modell med en stor 946 tror att den avlägsna framtiden är väldigt osäker, eftersom fel i trendberäkning blir ganska viktiga vid prognoser mer än en period framåt. (Återgå till början av sidan.) Utjämningskonstanterna 945 och 946 kan beräknas på vanligt sätt genom att minimera medelkvadratfelet i de 1-stegs-prognoserna. När detta görs i Statgraphics visar uppskattningarna att vara 945 0.3048 och 946 0.008. Det mycket lilla värdet på 946 innebär att modellen antar mycket liten förändring i trenden från en period till nästa, så i grunden försöker denna modell uppskatta en långsiktig trend. I analogi med begreppet medelålder för de data som används för att uppskatta den lokala nivån i serien, är medelåldern för de data som används för att uppskatta den lokala trenden proportionell mot 1 946, men inte exakt lika med den . I det här fallet visar sig att vara 10.006 125. Detta är ett mycket exakt nummer eftersom precisionen av uppskattningen av 946 är verkligen 3 decimaler, men den har samma generella storleksordning som provstorleken på 100, så att denna modell är medeltal över ganska mycket historia för att uppskatta trenden. Prognosplotten nedan visar att LES-modellen beräknar en något större lokal trend i slutet av serien än den ständiga trenden som beräknas i SEStrend-modellen. Det uppskattade värdet på 945 är också nästan identiskt med det som erhållits genom att montera SES-modellen med eller utan trend, så det här är nästan samma modell. Nu ser dessa ut som rimliga prognoser för en modell som beräknas beräkna en lokal trend. Om du 8220eyeball8221 ser det här, ser det ut som om den lokala trenden har vänt sig nedåt i slutet av serien. Vad har hänt Parametrarna i denna modell Har uppskattats genom att minimera det kvadrerade felet i 1-stegs-prognoser, inte längre prognoser, i vilket fall trenden gör inte en stor skillnad. Om allt du tittar på är 1 steg framåt, ser du inte den större bilden av trender över (säg) 10 eller 20 perioder. För att få denna modell mer i linje med vår ögonbolls extrapolering av data kan vi manuellt justera trendutjämningskonstanten så att den använder en kortare baslinje för trendberäkning. Om vi ​​till exempel väljer att ställa in 946 0,1, är medelåldern för de data som används vid uppskattning av den lokala trenden 10 perioder, vilket betyder att vi medeltar trenden över de senaste 20 perioderna eller så. Here8217s hur prognosplotet ser ut om vi sätter 946 0,1 medan ni håller 945 0.3. Detta ser intuitivt rimligt ut för denna serie, men det är troligen farligt att extrapolera denna trend mer än 10 perioder i framtiden. Vad sägs om felstatistik Här är en modelljämförelse för de två modellerna ovan och tre SES-modeller. Det optimala värdet på 945. För SES-modellen är ungefär 0,3, men liknande resultat (med något mer eller mindre responsivitet) erhålls med 0,5 och 0,2. (A) Hål linjär exp. utjämning med alfa 0,3048 och beta 0,008 (B) Hål linjär exp. Utjämning med alfa 0,3 och beta 0,1 (C) Enkel exponentiell utjämning med alfa 0,5 (D) Enkel exponentiell utjämning med alfa 0,3 (E) Enkel exponentiell utjämning med alfa 0,2 Deras statistik är nästan identisk, så vi kan verkligen göra valet på grundval Av prognosfel i 1 steg före proverna. Vi måste falla tillbaka på andra överväganden. Om vi ​​starkt tror att det är vettigt att basera den nuvarande trendberäkningen på vad som hänt under de senaste 20 perioderna eller så kan vi göra ett ärende för LES-modellen med 945 0,3 och 946 0,1. Om vi ​​vill vara agnostiska om det finns en lokal trend, kan en av SES-modellerna vara enklare att förklara och skulle också ge fler mitten av vägtrafikprognoserna för de kommande 5 eller 10 perioderna. (Tillbaka till början av sidan.) Vilken typ av trend-extrapolation är bäst: Horisontell eller linjär. Empiriska bevis tyder på att om uppgifterna redan har justerats (om det behövs) för inflationen, kan det vara oskäligt att extrapolera kortsiktiga linjära Trender mycket långt in i framtiden. Tendenser som uppenbaras idag kan sänkas i framtiden på grund av olika orsaker som produktförstörning, ökad konkurrens och konjunkturnedgångar eller uppgångar i en bransch. Av denna anledning utför enkel exponentiell utjämning ofta bättre ur prov än vad som annars skulle kunna förväntas, trots sin kvotiv kvot horisontell trend extrapolering. Dämpade trendmodifieringar av den linjära exponentiella utjämningsmodellen används också i praktiken för att införa en konservatismedel i dess trendprognoser. Den demoniserade trenden LES-modellen kan implementeras som ett speciellt fall av en ARIMA-modell, i synnerhet en ARIMA-modell (1,1,2). Det är möjligt att beräkna konfidensintervaller kring långsiktiga prognoser som produceras av exponentiella utjämningsmodeller, genom att betrakta dem som speciella fall av ARIMA-modeller. (Var försiktig: inte all mjukvara beräknar konfidensintervall för dessa modeller korrekt.) Bredden på konfidensintervallet beror på (i) modellens RMS-fel, (ii) utjämningstypen (enkel eller linjär) (iii) värdet (Er) av utjämningskonstanten (erna) och (iv) antalet perioder framåt du prognoserar. I allmänhet sprids intervallet snabbare, eftersom 945 blir större i SES-modellen och de sprider sig mycket snabbare när linjär snarare än enkel utjämning används. Detta ämne diskuteras vidare i avsnittet ARIMA-modeller i anteckningarna. (Återgå till början av sidan.) Utjämning av data tar bort slumpmässig variation och visar trender och cykliska komponenter. Inhämtande i insamlingen av data som tagits över tiden är någon form av slumpmässig variation. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. En ofta använd teknik inom industrin är utjämning. Denna teknik, när den tillämpas korrekt, avslöjar tydligare den underliggande trenden, säsongs - och cykliska komponenter. Det finns två olika grupper av utjämningsmetoder. Medelvärden Metoder Exponentiella utjämningsmetoder Medeltal är det enklaste sättet att smidiga data Vi ska först undersöka några medelvärdesmetoder, till exempel det enkla genomsnittet av alla tidigare data. En lagerförare vill veta hur mycket en typisk leverantör levererar i 1000 dollar-enheter. Heshe tar ett urval av 12 leverantörer, slumpmässigt, erhåller följande resultat: Den beräknade medelvärdet eller medeltalet av data 10. Chefen bestämmer sig för att använda detta som uppskattning av utgifter för en typisk leverantör. Är detta en bra eller dålig uppskattning Medelkvadratfel är ett sätt att bedöma hur bra en modell är Vi ska beräkna det genomsnittliga kvadratfelet. Felaktigt belopp som använts minus den beräknade mängden. Felet kvadrerat är felet ovan, kvadrerat. SSE är summan av kvadrerade fel. MSE är medelvärdet av de kvadratiska felen. MSE-resultat till exempel Resultaten är: Fel och kvadrater Fel Uppskattningen 10 Frågan uppstår: kan vi använda medelvärdet för att prognostisera inkomst om vi misstänker en trend En titt på grafen nedan visar tydligt att vi inte borde göra det här. Genomsnittet väger alla tidigare observationer lika Sammanfattningsvis anger vi att Det enkla genomsnittet eller medelvärdet av alla tidigare observationer är enbart en användbar uppskattning för prognoser när det inte finns några trender. Om det finns trender, använd olika uppskattningar som tar hänsyn till trenden. Medeltalet väger alla tidigare observationer lika. Medelvärdet av värdena 3, 4, 5 är till exempel 4. Vi vet självklart att ett medel beräknas genom att lägga till alla värden och dela summan med antalet värden. Ett annat sätt att beräkna medelvärdet är att lägga till varje värde dividerat med antalet värden eller 33 43 53 1 1.3333 1.6667 4. Multiplikatorn 13 kallas vikten. Generellt: bar frac summa vänster (frac right) x1 left (frac right) x2,. ,, vänster (frac höger) xn. De (vänster (frac höger)) är vikterna och de räknas naturligtvis till 1.2.4: Trend och Seasonal Components Fore 133. en gammal varningstid, som i värsta fall skadar hotet och osäkerhet i bästa fall till de Inom potentiellt område. Cast 133 betjänar en projektil till det osynliga och vanligtvis okänt under den bedrägliga ytan Prognos. . en varning till de som använder den. en bekännelse av osäkerhet (eller bedrägeri) av dem som skapar den. ett hot om att skada dem i sin väg Från Tom Brown i att få ut det mesta av prognoser 2.1: Introduktion till prognoser Även om de kvantitativa affärsmetoderna kan studeras som fristående moduler anser jag att det är lämpligt att texten placerar prognosmaterialet strax efter beslutsanalys. Minns i våra beslutsanalysproblem hänvisade naturens tillstånd i allmänhet till varierande efterfrågan eller någon annan okänd variabel i framtiden. Att förutse, med viss mått av noggrannhet eller tillförlitlighet, vad de efterfrågade kraven är, är vårt nästa ämne. Prognoser är mer än enkla extrapoleringar av tidigare data i framtiden med hjälp av matematiska formler eller samling av trender från experter133. Prognoser är mekanismer för att komma fram till åtgärder för planering av framtiden. När de görs korrekt tillhandahåller de ett revisionsspår och ett mått på deras noggrannhet. När de inte görs på rätt sätt, påminner de oss om Tom Browns smarta sammanfattning av termen upprepad vid öppningen av dessa anteckningar. Inte bara gör prognoser hjälp oss att planera, de hjälper oss spara pengar Jag är medveten om ett företag som minskade sin investering i lager från 28 miljoner till 22 miljoner genom att anta en formell prognosmetod som minskade prognosfelet med 10. Detta är ett exempel på prognoser Att hjälpa produktföretag att ersätta inventarier med information, vilket inte bara sparar pengar utan förbättrar kundrespons och service. När vi använder termen prognoser i en kvantitativ metod kurs, hänvisar vi i allmänhet till kvantitativa prognoser för tidsserier. Dessa modeller är lämpliga när: 1) Tidigare information om variabeln som prognostiseras är tillgänglig, 2) Informationen kan kvantifieras och 3) Det antas att mönster i historiska data kommer att fortsätta in i framtiden. Om den historiska data är begränsad till tidigare värden av den räntevariabel av intresse, kallas prognosproceduren en tidsserie metod. Till exempel bygger många försäljningsprognoser på de klassiska tidsserier som vi kommer att täcka i den här modulen. När prognosen baseras på tidigare försäljning har vi en prognos för tidsserier. En sidoanteckning: Även om jag sa försäljningen ovan, försöker vi, när det är möjligt, prognostisera försäljningen utifrån tidigare efterfrågan i stället för försäljning133 varför antar du att du äger en T-shirtaffär på stranden. Du lager 100 Spring Break 2000 T-shirts redo för Spring Break. Vidare antar att 110 Spring Breakers går in i din butik för att köpa Spring Break 2000 T-shirts. Vad är din försäljning, det är rätt, 100. Men vad är din efterfrågan Höger igen, 110. Du skulle vilja använda efterfrågesiffran, i stället för försäljningsfigur, när du förbereder nästa år, eftersom försäljnings siffrorna inte tar upp dina lagerutdelningar. Så varför gör många företag försäljningsprognoser baserade på tidigare försäljning och inte efterfrågan. Den främsta anledningen är att kostnadsförsäljning enkelt kan fångas vid utcheckningsstationen, men du behöver ytterligare en funktion i ditt förvaltningsinformationssystem för att fånga efterfrågan. Tillbaka till introduktionen. Den andra stora kategorin av prognosmetoder som bygger på tidigare data är regressionsmodeller. Kallas ofta orsaksmodeller som i vår text. Dessa modeller baserar sin förutsägelse av de framtida värdena på svarsvariabeln, t. ex. försäljning på relaterade variabler, såsom engångsinkomst, kön och kanske konsumenternas ålder. Du studerade regressionsmodeller i statistikkursen, så vi täcker inte dem i kursen. Men jag vill säga att vi bör använda termen kausal med försiktighet, eftersom ålder, kön eller engångsinkomst kan vara mycket relaterad till försäljningen, men ålder, kön eller engångsinkomst kan inte orsaka försäljning. Vi kan bara bevisa orsakssamband i ett experiment. Den sista stora kategorin av prognostiseringsmodeller innehåller kvalitativa metoder som i allmänhet innebär användning av expertbedömning för att utveckla prognosen. Dessa metoder är användbara när vi inte har historiska data, till exempel fallet när vi lanserar en ny produktlinje utan tidigare erfarenhet. Dessa metoder är också användbara när vi gör prognoser i den avlägsna framtiden. Vi kommer att täcka en av de kvalitativa modellerna i denna introduktion. Först undersöker vi ett enkelt klassificeringsschema för allmänna riktlinjer vid val av en prognosmetod och täcker sedan några grundläggande principer för prognoser. Välja en prognosmetod Nedanstående tabell illustrerar allmänna riktlinjer för val av en prognosmetod baserad på tids - och målkriterier. Trendprojektion Flyttande medelvärde Exponentiell utjämning Vänligen förstå att dessa är allmänna riktlinjer. Du kan hitta ett företag som använder trendprojektion för att göra tillförlitliga prognoser för produktförsäljning 3 år framöver. Det bör också noteras att eftersom företag använder tidsserier för prognospaket för datorprogram i stället för handberäkningar, kan de prova flera olika tekniker och välja den teknik som har den bästa mätningen av noggrannhet (lägsta fel). När vi diskuterar de olika teknikerna, och deras egenskaper, antaganden och begränsningar, hoppas jag att du kommer att få en uppskattning av ovanstående klassificeringsschema. Prognosprinciper Klassificeringssystem som det ovanstående är användbara för att hjälpa väljprognosmetoder som är lämpliga för tidsperioden och syftet för hand. Det finns också några allmänna principer som bör beaktas när vi förbereder och använder prognoser, särskilt de som bygger på tidsserier. Oliver W. Wight i produktions - och lagerstyrning i datoråldern. och Thomas H. Fuller i Mikrodatorer i produktions - och lagerhantering utvecklade en uppsättning principer för produktions - och lagerstyrningsgemenskapen ett tag tillbaka som jag tror har universell tillämpning. 1. Om inte metoden är 100 korrekt måste den vara enkel nog så att personer som använder den vet hur man använder det intelligent (förstår det, förklara det och replikera det). 2. Varje prognos bör åtföljas av en uppskattning av felet (mätningen av dess noggrannhet). 3. Långsiktiga prognoser bör täcka den största möjliga gruppen av poster begränsa enskilda prognoser på kort sikt. 4. Det viktigaste inslaget i ett prognosschema är den där saken mellan tangentbordet och stolen. Den första principen tyder på att du kan klara dig med att behandla en prognosmetod som en svart låda, så länge det är 100 korrekt. Det vill säga om en analytiker helt enkelt matar in historiska data i datorn och accepterar och genomför prognosutmatningen utan någon aning om hur beräkningarna gjordes, behandlar analytikern prognosmetoden som en svart låda. Detta är ok så länge prognosfelet (faktisk observation - prognosobservation) är noll. Om prognosen inte är tillförlitlig (högt fel), ska analytikern åtminstone vara mycket generad genom att inte kunna förklara vad som gick fel. Det kan finnas mycket sämre förgreningar än förlägenhet om budgetar och andra planeringshändelser låg mycket på den felaktiga prognosen. Den andra principen är verkligen viktig. I avsnitt 2.2 presenterar vi ett enkelt sätt att mäta prognosfel, skillnaden mellan vad som faktiskt inträffar och vad som beräknades inträffa för varje prognosperiod. Här är tanken. Antag att ett autoföretag förutspår försäljning av 30 bilar nästa månad med Metod A. Metod B kommer också fram med en prognos på 30 bilar. Utan att känna till måttet på noggrannheten hos de två metoderna skulle vi vara likgiltiga vad gäller deras val. Om vi ​​visste att kompositfelet för metod A är - 2 bilar över en relevant tidshorisont och kompositfelet för metod B är - 10 bilar, skulle vi definitivt välja metod A över metod B. Varför skulle en metod ha så mycket Fel jämfört med ett annat Det kommer att vara ett av våra lärandemål i denna modul. Det kan bero på att vi använde en utjämningsmetod i stället för en metod som innehåller trendprojicering när vi inte borde ha - till exempel när uppgifterna visar en tillväxt trend. Utjämningsmetoder som exponentiell utjämning, tappa alltid trender som resulterar i prognosfel. Den tredje principen kan bäst illustreras med ett exempel. Antag att du är Operationsdirektör på ett sjukhus, och du är ansvarig för att förutse efterfrågan på patientbäddar. Om din prognos skulle vara för kapacitetsplanering tre år från nu kan du beräkna totala patientbäddar för år 2003. Å andra sidan, om du skulle förutse efterfrågan på patientbäddar för april 2000, för schemaläggning , Då skulle du behöva göra separata prognoser för akutrums patientbäddar, kirurgisk återhämtning av patientbäddar, OB-patientbäddar och så vidare. När mycket detaljer krävs, håll dig till en kortsiktig prognoshorisont aggregat din produkt linestype av patientsetc. när man gör långsiktiga prognoser. Detta reducerar generellt prognosfelet i båda situationerna. Vi borde tillämpa den sista principen på någon kvantitativ metod. Det finns alltid utrymme för döma justeringar av våra kvantitativa prognoser. Jag gillar det här citatet från Alfred North Whitehead i en introduktion till matematik. 1911: 91T93 Det finns inget mer vanligt fel än att anta att eftersom långvariga och exakta matematiska beräkningar har gjorts, är tillämpningen av resultatet på ett visst faktum i naturen helt säkert. Naturligtvis kan dom också vara av. Vad sägs om denna prognos gjord 1943 av IBM: s ordförande Thomas Watson: Jag tror att det är en världsmarknad för cirka fem datorer. Hur kan vi förbättra tillämpningen av dom Det är vårt nästa ämne. Delphi Metoden för prognos Delphi Metoden för prognoser är en kvalitativ teknik som är populär av Rand Corporation. Det tillhör familjen tekniker som inkluderar metoder som gräsrotsar, marknadsundersökningspanel, historisk analys, expertdom och försäljningskraftkomposit. Det som är gemensamt med dessa tillvägagångssätt är användningen av experters åsikter, snarare än historiska data, för att göra förutsägelser och prognoser. Ämnena av dessa prognoser är typiskt förutsägelsen av politisk, social, ekonomisk eller teknisk utveckling som kan föreslå nya program, produkter eller svar från organisationen som sponsrar Delphi-studien. Min första erfarenhet av expertbedömningstekniker var vid min senaste uppgift under min tidigare karriär i USA: s flygvapen. I den uppgiften var jag direktör för transportprogram på Pentagon. En gång om året skulle min chef, transportdirektören, samla ledande ledarskap (och deras handläggare) vid en konferens för att formulera transportplaner och program för de kommande fem åren. Dessa program blev sedan grunden för budgetering, upphandling och så vidare. En av de övningar vi gjorde var en Delphi-metod för att förutsäga utvecklingen som skulle ha stor inverkan på Air Force Transportation-program. Jag minns en av de utveckling som vi förutspådde vid en konferens i början av 1980-talet var den påskyndade rörelsen från decentraliserad till centraliserade strategiska transportsystem i militären. Som ett resultat började vi ställa upp flygvapnet för det gemensamma transportkommandot flera år innan det blev en verklighet. Steg 1. Delphi Metoden för prognoser, liksom de andra domensteknikerna, börjar med att välja experterna. Naturligtvis är det här där dessa tekniker kan misslyckas - när experterna verkligen inte är experter alls. Kanske är chefen som en expert för Delphi-studien, men medan chefen är bra på att hantera resurser kan han eller hon vara hemsk när han läser miljön och förutsäger utvecklingen. Steg 2. Det första formella steget är att få en anonym prognos om ämnet av intresse. Detta kallas Round 1. Här kommer experterna att bli uppmanade att ge en politisk, ekonomisk, social eller teknisk utveckling av intresse för organisationen som sponsrar Delphi-metoden. De anonyma prognoserna kan samlas via en webbplats, via e-post eller med frågeformulär. De kan också samlas i en levande gruppinställning men haloeffekten kan störa fritt flöde av förutsägelserna. Det skulle till exempel vara gemensamt att den expertgrupp som samlades i Pentagon skulle inkludera allmänna tjänstemän. Flera av generalerna var stora ledare på fältet, men inte stora visionärer när det gällde logistikutvecklingen. Å andra sidan var deras löjtnant kolonel handling officerare mycket bra tänkare och visste mycket om vad som var i horisonten för logistik och transportsystem. Men på grund av den klassiska respekten för rang, kanske de yngre officerarna inte hade kommit fram om vi inte använde en anonym metod för att få den första omgången av prognoser. Steg 3. Det tredje steget i Delphi-metoden innebär att gruppmomentet sammanfattar och omfördelar resultaten från Round One-prognoserna. Detta är typiskt en tvättlista av utvecklingen. Experterna blir sedan uppmanade att svara på listan One-tvätt genom att ange det år då de trodde att utvecklingen skulle inträffa eller att säga att denna utveckling aldrig kommer att inträffa. Detta kallas Round 2. Steg 4. Det fjärde steget, Round 3. involverar grupptillfredsställaren sammanfatta och omfördela resultaten från rundan två. Detta inkluderar en enkel statistisk visning, typiskt median och interkvartilintervallet, för data (år en utveckling kommer att inträffa) från runda 2. Sammanfattningen skulle också inkludera procenten av experter som rapporterar aldrig förekomma för en viss utveckling. I denna runda uppmanas experterna att ändra, om de önskar, sina förutsägelser. Experterna ges också möjlighet att ge argument som utmanar eller stöder de aldrig förekommande förutsägelserna för en viss utveckling, och att utmana eller stödja åren utanför interkvartilområdet. Steg 5. Det femte steget, Runda 4. repeterar Runda 3 - experterna får en ny statistisk display med argument - och uppmanas att ge nya prognoser och eller motargument. Steg 6. Runda 4 upprepas tills konsensus bildas, eller åtminstone en relativt smal spridning av åsikter. Min erfarenhet är att vid Runda 4 hade vi en bra uppfattning om den utveckling vi borde fokusera på. Om det ursprungliga målet med Delphi Metoden är att producera ett tal snarare än en utvecklingstrend, frågar Round 1 helt enkelt experterna för deras första förutsägelse. Det kan vara att förutse produktbehovet för en ny produktlinje för ett konsumentproduktföretag eller att förutse DJIA ett år ut för ett fondföretag som hanterar en blue chip indexfond. Lets göra en för rolig (inte graderad och rent volontär) Delphi övning. Antag att du är en marknadsexpert och vill bli med de andra experterna i vår klass för att förutse vad DJIA kommer att vara den 16 april 2001 (så nära skattedagen som möjligt). Jag kommer att lägga upp en konferensämne som heter DJIA-förutsägelser på kursens webbtråd, inom modul 2-konferensen. Var vänlig och svara på det här konferensämnet genom att helt enkelt ange vad du tycker att DJIA kommer att stänga på den 16 april 2001. Vänligen svara den 27 januari 2001, så jag kan skicka sammanfattningsstatistiken innan vi lämnar prognosmaterialet den 3 februari. Vi kommer nu att börja diskutera kvantitativa prognoser för tidsserier. 2.2: Utjämningsmetoder I det här avsnittet vill vi täcka komponenterna i en tidsserie, naiva, glidande medel och exponentiella utjämningsmetoder för prognos och mätning av prognosnoggrannhet för varje införd metod. Pausa och reflektera Minns att det finns tre generella klasser av prognos - eller prognosmodeller. Kvalitativa metoder, inklusive Delphi, bygger på expertbedömning och yttrande, inte historiska data. Regressionsmodeller bygger på historisk information om både prediktorvariablerna och den svarsvariabel som är av intresse. Kvantitativa prognosmetoder för tidsserier bygger på historisk numerisk information om variabeln av intresse och antar att mönster i det förflutna kommer att fortsätta in i framtiden. Detta avsnitt börjar vår studie av tidsseriemodellerna, som börjar med mönster eller komponenter i tidsserier. Komponenter i en tids-serie De mönster som vi kan hitta i en tidsserie av historiska data inkluderar de genomsnittliga, trend-, säsongs-, cykliska och oregelbundna komponenterna. Medelvärdet är helt enkelt medelvärdet av de historiska data. Trend beskriver verklig tillväxt eller minskning av genomsnittlig efterfrågan eller annan variabel av intresse, och representerar en förändring i medeltalet. Säsongskomponenten återspeglar ett mönster som upprepas inom den totala tidsramen av intresse. Till exempel, för 15 år sedan i sydvästra Florida, var flygtrafiktrafik mycket högre i januari-april och toppade i mars. Oktober var den låga månaden. Detta säsongsmönster upprepades 1988. Mellan 1988 och 1992 fortsatte januari-april att repetera varje år som höga månader, men topparna var inte så höga som tidigare eller lågsäsongens dalar så låga som tidigare, mycket till glädje av hotell - och turismindustrin. Poängen är att säsongstoppar upprepas inom tidsintervallet - vanligtvis månads - eller kvartalssäsonger inom ett år, även om det kan finnas daglig säsongshandel på aktiemarknaden (måndagar och fredagar som visar högre slutmedel än tisdagar-torsdagar) som ett exempel. Den cykliska komponenten visar återkommande värden på den variabla som är intressen över eller under den genomsnittliga eller långfristiga trendlinjen över en flerårig planeringshorisont. Cyklängden är inte konstant, liksom längden på säsongstoppar och dalar, vilket gör konjunkturcyklerna mycket hårdare att förutsäga. Eftersom mönstren inte är konstanta är flera variabla modeller som ekonometriska och multipelregressionsmodeller bättre lämpade för att förutsäga cykliska vändpunkter än tidsseriemodeller. Den sista komponenten är vad som är kvar Den oregelbundna komponenten är den slumpmässiga variationen i efterfrågan som är oförklarlig av de genomsnittliga, trend-, säsongsmässiga och / eller cykliska komponenterna i en tidsserie. Precis som i regressionsmodeller försöker vi göra slumpvariationen så låg som möjligt. Kvantitativa modeller är utformade för att ta itu med de olika komponenterna ovan. Självklart kommer trendprojektionstekniken att fungera bäst med tidsserier som uppvisar ett historiskt trendmönster. Tidsseriens sönderdelning, som sönderdelar trenden och säsongsbeståndsdelarna i en tidsserie, fungerar bäst med tider som har trend och säsongsmönster. Var lämnar vi vår första uppsättning tekniker, utjämningsmetoder I själva verket fungerar utjämningsmetoder bra i närvaro av genomsnittliga och oregelbundna komponenter. Vi börjar med dem nästa. Innan vi börjar kan vi få lite data. Denna tidsserie består av kvartalsvis efterfrågan på en produkt. Historiska data finns tillgängliga för 12 kvartaler, eller tre år. Tabell 2.2.1 ger historien. Figur 2.2.1 ger en graf över tidsserierna. Denna graf framställdes i Excel med hjälp av Chart Wizards Line Plot-diagramassistent. Det är inte viktigt vilken programvara som används för att gradera historiska tidsserier - men det är viktigt att titta på data. Att göra en penna och papperskiss är även användbar för att få en känsla för data, och se om det kan finnas trend andor säsongskomponenter i tidsserierna. Flyttande medelmetod En enkel teknik som fungerar bra med data som inte har någon trend, säsongsmässighet eller cykliska komponenter är den glidande genomsnittliga metoden. Visserligen har denna exempeluppsättning trend (notera den totala tillväxten från period 1 till 12) och säsongsmässighet (notera att tredje kvartalet speglar en minskning av den historiska efterfrågan). Men vi kan tillämpa den glidande medeltekniken på dessa data så vi kommer att lägga grund för jämförelse med andra metoder senare. En treårs glidande medelprognos är en metod som tar tre dataperioder och skapar ett medelvärde. Det genomsnittet är prognosen för nästa period. För denna dataset är den första prognosen vi kan beräkna för period 4, med aktuella historiska data från period 1, 2 och 3 (eftersom det är ett treårs glidande medelvärde). Sedan, efter period 4, kan vi göra en prognos för period 5 med historiska data från period 2, 3 och 4. Observera att period 1 släpptes, följaktligen begreppet glidande medelvärde. Denna teknik antar sedan att faktiska historiska data i det avlägsna förflutet inte är lika användbara som mer aktuella historiska data vid prognoser. Innan du visar formlerna och illustrerar det här exemplet, låt mig presentera några symboler. I den här modulen använder jag symbolen F t för att representera en prognos för period t. Således kommer prognosen för period 4 att visas som F 4. Jag ska använda symbolen Y t för att representera det aktuella historiska värdet av variabeln av intresse, såsom efterfrågan, i period t. Sålunda skulle den faktiska efterfrågan på period 1 visas som Y 1. Nu för att vidarebefordra beräkningarna för ett treårs glidande medelvärde. Prognosen för period fyra är: Att generera prognosen för period fem: Vi fortsätter genom de historiska uppgifterna tills vi kommer fram till slutet av period 12 och gör vår prognos för period 13 baserat på den faktiska efterfrågan från period 10, 11 och 12. Sedan Period 12 är den sista perioden för vilken vi har data, vilket gör att våra beräkningar slutar. Om någon var intresserad av att göra en prognos för perioden 14, 15 och 16, samt period 13, skulle det bästa som kunde göras med den glidande genomsnittliga metoden vara att göra prognoserna för samma period som den senaste prognosen. Detta är sant eftersom rörliga genomsnittsmetoder inte kan växa eller reagera på trenden. Det här är den främsta orsaken till att dessa typer av metoder är begränsade till korta ansökningar, till exempel vad är efterfrågan på nästa period. Prognosberäkningarna sammanfattas i tabell 2.2.2. Eftersom vi är intresserade av att mäta felets storlek för att bestämma prognosnoggrannheten, notera att jag kvadrerar felet för att ta bort plus - och minustecknen. Därefter enklar vi de kvadratiska felen. För att beräkna ett medelvärde eller en medelvärde, först s av de quared e rrors (SSE). Därefter divideras med antalet fel för att få m ean s quared e rror (MSE). Ta sedan kvadratroten av felet för att få R oot M ean S quare E rror (RMSE). SSE (235,1 608,4 625,0 455,1) 9061,78 MSE 9061.78 9 1006.86 RMSE Square Root (1006.86) 31.73 Från din statistik kurs (er) kommer du att känna igen RMSE som helt enkelt standardavvikelsen för prognosfel och MSE är helt enkelt variansen hos prognosfel. Liksom standardavvikelsen, desto lägre RMSE desto mer exakt är prognosen. Således kan RMSE vara till stor hjälp vid val mellan prognosmodeller. Vi kan också använda RMSE för att göra någon sannolikhetsanalys. Eftersom RMSE är standardavvikelsen för prognosfelet kan vi behandla prognosen som medelvärdet av en distribution och tillämpa den viktiga empiriska regeln. Förutsatt att prognosfel normalt fördelas. Jag kommer att satsa på att någon av er kommer ihåg denna regel: 68 av observationerna i en klockformad symmetrisk fördelning ligger inom området: medelvärde - 1 standardavvikelse 95 av observationerna ligger inom: medelvärde - 2 standardavvikelser 99,7 (nästan alla observationer) ligger inom: medelvärde - 3 standardavvikelser Eftersom medelvärdet är prognosen och standardavvikelsen är RMSE, kan vi uttrycka empirisk regel enligt följande: 68 av verkliga värden förväntas falla inom: Prognos - 1 RMSE 454,3 - 31,73 423 till 486 95 av de faktiska värdena förväntas falla inom: Prognos - 2 RMSE 454,3 - (231,73) 391 till 518 99,7 av de faktiska värdena förväntas falla inom: Prognos - 3 RMSE 454,3 - (331,73) 359 till 549 Som att studera medel - och standardavvikelsen i beskrivande statistik är detta mycket viktigt och har liknande tillämpningar. En sak vi kan göra är att använda 3 RMSE-värdena för att avgöra om vi har några utestängningar i våra data som behöver bytas ut. Alla prognoser som är mer än 3 RMSEs från den faktiska siffran (eller har ett fel som är större än absolutvärdet 3 31.73 eller 95 är en outlier. Det värdet bör avlägsnas eftersom det blåser upp RMSE. Det enklaste sättet att ta bort en outlier i en tidsserie är att ersätta den med det genomsnittliga värdet strax före utlöparen och strax efter outlier. En annan mycket handanvändning till RMSE ligger i inställningen av säkerhetslager i lagerförhållanden. Låter ut RMSE-regionens 2 empirisk regel för denna prognos: 2,5 95 2,5 359. 391. 454. 518. 549 Eftersom observationens mitten 95 faller mellan 391 och 518, faller 5 av observationerna under 391 och över 518. Om man antar att fördelningen är klockformad, är 2,5 av observationerna faller under 391 och 2,5 faller över 518. Ett annat sätt att ange detta är att 97,5 av observationerna faller under 518 (när man mäter ner till negativ oändlighet, även om de faktiska uppgifterna ska stanna vid 359. Bottom line. Faktisk efterfrågan att vara 518 (2 RMSEs över prognosen), då genom att lagra en inventering av 518 kommer de att täcka 97,5 av de faktiska kraven som teoretiskt kan uppstå. Det vill säga, de arbetar på en 97,5 kundservicenivå. I endast 2,5 av efterfrågorna bör de förvänta sig ett lager. Det är verkligen slick, det är inte det. Efter samma metod, om företaget lagrar 549 poster eller 3 RMSE över prognosen, är de nästan försäkrade att de inte kommer att ha ett lager om inte något ovanligt förekommer (vi kallar att en outlier är statistik). Slutligen, om företaget lagrar 486 objekt (2 RMSE över prognosen), kommer de att ha ett lager i 16 fall eller täcka 84 av de krav som ska uppstå (100-16). I det här fallet arbetar de på en 84 kundservicenivå. 16 68 16 359. 423. 454. 486. 549 Vi kunde beräkna andra sannolikheter förknippade med andra områden under kurvan genom att hitta den kumulativa sannolikheten för z-poäng, z (observationsprognos) RMSE (kommer du ihåg det från statskursen ( s)). För våra ändamål här är det bara viktigt att illustrera ansökan från statistikkursen. Använda Management Scientist Software Package Vi kommer att använda Management Scientist Forecasting Module för att göra de faktiska prognoserna och RMSE-beräkningarna. För att illustrera paketet för det första exemplet klickar du på Windows StartProgramsThe Management ScientistThe Management Scientist IconContinueSelect Module 11 ForecastingOKFileNew och du är redo att ladda exempelproblemet. Nästa dialogruta frågar dig att ange antalet tidsperioder - det är hur många observationer du har - 12 i det här fallet. Klicka på OK. Och börja ange dina data (endast siffror och decimalpunkter - dialogrutan tillåter inte alfabetiska tecken eller kommatecken). Därefter klickar du på SolutionSolveMoving Average och anger 3 där den frågar efter antal rörliga perioder. Du bör få följande lösning: PROBLEM MED RÖRELSE AVERAGES DEN BEVÄGANDE GEMENSAMMA ANVÄNDNINGEN 3 TIDS PERIODER TIDS PERIOD TID SERIEN VÄRDE FÖRVÄRD FÖRSÄLJNING FEL MÄTT SQUARE ERROR 1,006.86 PROJEKTET FÖR PERIOD 13 454.33 Observera att programvaran returnerar Mean Square Error. och för att få det mer användbara roten medelstora fältet. du måste ta kvadratroten av Mean Square-felet, 1006.83 i det här fallet. Observera också att mjukvaran ger bara ett prognosvärde och erkänner begränsningen av glidande medelmetoder som begränsar projiceringen till en tidsperiod. Slutligen notera att jag sätter dataen i en HTML-tabell bara så att du kan läsa den bättre - det här är bara nödvändigt med att gå från OUT-filen till html, inte till en e-postinsättning av OUT-filen eller kopiering av en OUT-fil till en WORD-dokument. Liksom med lösningarna för beslutsanalysmoduler kan du välja SolutionPrint Solution och antingen välja Skrivare som ska skrivas ut eller Textfil för att spara för att infoga i ett e-mail till mig eller till ett Word-dokument. Innan vi gör ett mer glidande medelvärde, ta en titt på prognosfelkolumnen. Observera att de flesta fel är positiva. Eftersom felet är lika med det faktiska tidsserievärdet minus de prognostiserade värdena betyder positiva fel att den faktiska efterfrågan i allmänhet är större än den prognostiserade efterfrågan - vi är under prognoser. I det här fallet saknas en tillväxtutveckling i data. Som påpekat tidigare fungerar glidande medeltekniker inte bra med tidsseriedata som uppvisar trender. Figur 2.2.2 illustrerar den fördröjning som är närvarande när man använder den glidande medeltekniken med en tidsserie som uppvisar en trend. Fem perioders rörande medelprognos Här är Management Scientist-lösningen för att använda 5 perioder för att konstruera den glidande genomsnittliga prognosen. PROBLEM MED RÖRLÄGGNINGSFÖRVÄRDEN RÄDDNINGSOMRÅDET GENOMGÅNG 5 TIDS PERIODER TID PERIOD TID SERIEN VÄRDE FÖRSÄTTNINGSPROFIL ERROR SÄKERHETSSEKVARFEL 1.349.37 FRAMSATSEN FÖR PERIOD 13 453,60 RMSE för femårsrörelserna Genomsnittlig prognos är 36,7, vilket är cirka 16 sämre än Fel i treårsmodellen. Anledningen till detta är att det finns en tillväxtutveckling i dessa data. När vi ökar antalet perioder i beräkningen av det rörliga genomsnittet börjar medeltaget att minska tillväxten med större mängder. Samma skulle vara sant om de historiska uppgifterna uppvisade en nedåtgående trend. Det rörliga genomsnittet skulle fördröja trenden och ge prognoser som skulle vara över de faktiska. Pausa och reflektera Den snabba genomsnittsprognosen är enkel att använda och förstå, och det fungerar bra med tidsserier som inte har trend, säsong eller cykliska komponenter. Tekniken kräver liten data, bara tillräckligt med tidigare observationer för att matcha antalet tidsperioder i det glidande medlet. Prognoser är vanligtvis begränsade till en period framåt. Tekniken fungerar inte bra med data som inte är stationär - data som uppvisar trend, säsongsmässighet, andor cykliska mönster. Enperiodsprognosprognos eller Naivprognosen En naivprognos skulle vara en där antalet perioder i glidande medelvärdet är lika med ett. Det vill säga nästa prognos är lika med den sista faktiska efterfrågan. Låt inte skratta Denna teknik kan vara användbar i händelse av snabb tillväxt trend prognosen skulle bara sänka den faktiska med en fjärdedel eller en månad, oavsett tidsperiod av intresse. Det är självklart mycket bättre att använda en modell som kan göra en trendprojicering om trenden representerar ett verkligt drag från ett tidigare stationärt mönster - vi kommer till det lite senare. Här är ledningsforskarens resultat för det genomsnittliga prognoset för en period. FORECASTING WITH MOVING AVERAGES THE MOVING AVERAGE USES 1 TIME PERIODS TIME PERIOD TIME SERIES VALUE FORECAST FORECAST ERROR THE MEAN SQUARE ERROR 969.91 THE FORECAST FOR PERIOD 13 473.00 This printout reflects a slightly lower RMSE than the three period moving average. That concludes our introduction to smoothing techniques by examining the class of smoothing methods called moving averages. The last smoothing method we will examine is called exponential smoothing , which is a form of a weighted moving average method. Exponential Smoothing This smoothing model became very popular with the production and inventory control community in the early days of computer applications because it did not need much memory, and allowed the manager some judgment input capability. That is, exponential smoothing includes a smoothing parameter that is used to weight either past forecasts (places emphasis on the average component) or the last observation (places emphasis on a rapid growth or decline trend component). The exponential smoothing model is: F t1 forecast of the time series for period t 1 Y t actual value of the time series in period t F t forecast of the time series for period t a smoothing constant or parameter (0 lt a lt 1) The smoothing constant or parameter, a . is shown as the Greek symbol alpha in the text - I am limited to alpha characters. In any case, if the smoothing constant is set at 1, the formula becomes the naive model we already studied: If the smoothing constant is set at 0, the formula becomes a weighted average model which gives most weight to the most recent forecast, with diminishing weight the farther back in the time series. Setting a can be done by trial and error, perhaps trying 0.1, 0.5 and 0.9, recording the RMSE for each run, then choosing the value of a that gives forecasts with the lowest RMSE. Some guidelines are, set a relatively high when there is a trend and you want the model to be responsive set a relatively low when there is just the irregular component so the model will not be responding to random movements. Lets do some exponential smoothing forecasts with a set at 0.6, relatively high. To get the model started, we begin by making a forecast for Period 2 simply based on the actual demand for Period 1 (first shown in Table 2.2.1, but often repeated with each demonstration). Then the first exponential smoothing forecast is actually made for Period 3, using information from Period 2. Thus t 2, t1 3, and F t1 F 21 F 3 . For this forecast, we need the actual demand for Period 2 (Y t Y 2 395), the forecast for Period 2 (F 2 398. The result is: The next forecast is for Period 4: This continues through the data until we get to the end of Period 12 and are ready to make our last forecast for Period 13. Note that all we have to maintain in historical data is the last forecast, the last actual demand and the value of the smoothing parameter - that is why the technique was so popular since it did not take much data. However, I do not subscribe to throwing away data files today - they should be archived for audit trail purposes. Anyway, the forecast for Period 13: Thankfully today, we have software like The Management Scientist to do the computations. To use The Management Scientist . select the Forecasting Module and load the data as previously described in the Three Period Moving Average demonstration. Next, click SolutionSolveExponential Smoothing and enter 0.6 where it asks for the value of the smoothin g constant. Printout 2.2.4 illustrates the computer output with a smoothing constant of 0.6. FORECASTING WITH EXPONENTIAL SMOOTHING THE SMOOTHING CONSTANT IS 0.6 TIME PERIOD TIME SERIES VALUE FORECAST FORECAST ERROR THE MEAN SQUARE ERROR 871.52 THE FORECAST FOR PERIOD 13 459.74 This model provides a single forecast since, like the moving average techniques, it does not have the capability to address the trend component. The Root Mean Square Error is 29.52, (square root of the mean square error), or slightly better than the best results of the moving average and naive techniques. However, since the time series shows trend, we should be able to do much better with the trend projection model that is demonstrated next. Pause and Reflect The exponential smoothing technique is a simple technique that requires only five to ten historical observations to set the value of the smoothing parameter, then only the most recent actual observation and forecasting values. Forecasts are usually limited to one period ahead. The technique works best for time series that are stationary, that is, do not exhibit trend, seasonality andor cyclic components. While historical data is generally used to fit the model - that is set the value of a . analysts may adjust that value in light of information reflecting changes to time series patterns. 2.3: Trend Projections When a time series reflects a shift from a stationary pattern to real growth or decline in the time series variable of interest (e. g. product demand or student enrollment at the university), that time series is demonstrating the trend component. The trend projection method of time series forecasting is based on the simple linear regression model. However, we generally do not require the rigid assumptions of linear regression (normal distribution of the error component, constant variance of the error component, and so forth), only that the past linear trend pattern will continue into the future. Note that is the trend pattern reflects a curve, we would have to rely on the more sophisticated features of multiple regression. The trend projection model is: T t Trend value for variable of interest in Period t b 0 Intercept of the trend projection line b 1 Slope, or rate of change, for the trend projection line While the text illustrates the computational formulas for the trend projection model, we will use The Management Scientist . To use The Management Scientist . select the Forecasting Module and load the data as previously described in the Three Period Moving Average demonstration. Next, click SolutionSolveTrend Projection and enter 4 where it asks for Number of Periods to Forecast. Note, this is the first method that we have covered that the software asks this question, as it is assumed that all of the smoothing methods covered in this course are limited to forecasting just one period ahead. Printout 2.3.1 illustrates the trend projection printout from The Management Scientist . FORECASTING WITH LINEAR TREND THE LINEAR TREND EQUATION: T 367.121 7.776 t where T trend value of the time series in period t TIME PERIOD TIME SERIES VALUE FORECAST FORECAST ERROR THE MEAN SQUARE ERROR 449.96 THE FORECAST FOR PERIOD 13 468.21 THE FORECAST FOR PERIOD 14 475.99 THE FORECAST FOR PERIOD 15 483.76 THE FORECAST FOR PERIOD 16 491.54 Now we are getting somewhere with a forecast Note the mean square error is down to 449.96, giving a root mean square error of 21.2. Compared to the three period moving average RMSE of 31.7, we have a 33 improvement in the accuracy of the forecast over the relevant period. Now, if this were products such as automobiles, to achieve a customer service level of 97.5, we would create a safety stock of 2 times the RMSE above the forecast. So, for Period 13, the forecast plus 2 times the RMSE is 468.21 (2 21.2) or 511 cars. With the three period moving average method, the same customer service level inventory position would be: 454.3 (2 31.7) or 518. The safety stocks are 2 times 21 (42 for the trend projection) compared to 2 times 31.7 (63 for the three period moving average). This is a difference of 21 cars which could represent significant inventory carrying cost that could be avoided with the better forecasting method. Note that the software provides the trend equation, showing the intercept of 367.121 and the slope of 7.776. The slope is interpreted as in simple linear regression, demand goes up 7.776 per unit increase in time. This means that over the course of the time series, demand is increasing about 8 units a quarter. The intercept is only of interest in placing the trend projection line on a time series graph. I used the Chart Wizard in Excel to produce such a graph for the trend projection model: Note in this figure that demand falls below the trend projection line in Periods 3, 7 and 11. This is confirmed by looking at The Management Scientist computer Printout 2.3.1, where the errors are negative in the same periods. That is a pattern Since our data is quarterly, we would suspect that there is a seasonal pattern that results in a valley in the time series in every third quarter. To capture that pattern, we need the time series decomposition model that breaks down, analyzes and forecasts the seasonal as well as the trend components. We do that in the last section of this notes modules. Pause and Reflect The trend projection model is appropriate when the time series exhibits a linear trend component that is assumed to continue into the future. While rules of thumb suggest 20 observations to compute and test parameters of linear regression models, the simple trend projection model can be created with a minimum of 10 observations. The trend projection model is generally used to make multiple period forecasts for the short range, although some firms use it for the intermediate range as well. 2.4: Trend and Seasonal Components The last time series forecasting method that we examine is very powerful in that it can be used to make forecasts with time series that exhibit trend and seasonal components. The method is most often referred to as Time Series Decomposition, since the technique involves breaking down and analyzing a time series to identify the seasonal component in what are called seasonal indexes . The seasonal indexes are used to deseasonalize the time series. The deseasonalized time series is then used to identify the trend projection line used to make a deseasonalized projection. Lastly, seasonal indexes are used to seasonalize the trend projection. Lets illustrate how this works. As usual, we will use The Management Scientist to do our work after the illustration. The Seasonal Component The seasonal component may be found by using the centered moving average approach as presented in the text, or by using the season average to grand average approach described here. The latter is a simpler technique to understand, and comes very close to the centered moving average approach for most time series. The first step is to gather observations from the same quarter and find their average. I will repeat Table 2.2.1 as Table 2.4.1, so we can easily find the data: To compute the average demand for Quarter 1, we gather all observations for Quarter 1 and find their average, then repeat for Quarters 2, 3 and 4: Quarter 1 Average (398 410 465) 3 424.3 Quarter 2 Average (395 402 460) 3 419 Quarter 3 Average (361 378 430) 3 389.7 Quarter 4 Average (400 440 473) 3 437.7 The next step is to find the seasonal indexes for each quarter. This is done by dividing the quarterly average from above, by the grand average of all observations. Grand Average (398395361400410402378 440465460430473) 12 417.7 Seasonal Index, Quarter 1 424.3 417.7 1.016 Seasonal Index, Quarter 2 419 417.7 1.003 Seasonal Index, Quarter 3 389.7 417.7 0.933 Seasonal Index, Quarter 4 437.7 417.7 1.048 These indexes are interpreted as follows. The overall demand for Quarter 4 is 4.5 percent above the average demand, thus making Quarter 4 a peak quarter. The overall demand for Quarter 3 is 6.7 percent below the average demand, thus making Quarter 3 an off peak quarter. This confirms our suspicion that demand is seasonal, and we have quantified the nature of the seasonality for planning purposes. Please note The Management Scientist software Printout 2.4.1 provides indexes of 1.046, 1.009, 0.920, and 1.025. The peaks and off peaks are similar to the above computations, although the specific values are a bit different. The centered moving average approach used by the software requires more data for computations - at least 4 or 5 repeats of the seasons, we only have 3 repeats (12 quarters gives 3 years of data). We will let the computer program do the next steps, but I will illustrate with a couple of examples. The next task is to deseasonalize the data. We do this by dividing each actual observation by the appropriate seasonal index. So for the first observation, where actual demand was 398, we note that it is a first quarter observation. The deseasonalized value for 398 is: Deseasonalized Y 1 398 1.016 391.7 Actual demand would have been 391.7 if there was no seasonal effects. Lets do four more: Deseasonalized Y 2 395 1.003 393.8 Deseasonalized Y 3 361 0.933 386.9 Deseasonalized Y 4 400 1.048 381.7 Deseasonalized Y 5 410 1.016 403.6 I am sure you have seen deseasonalized numbers in articles in the Wall Street Journal or other popular business press and journals. This is how those are computed. The next step is to find the trend line projection based on the deseasonalized observations. This trend line is a bit more accurate than the trend line projection based on the actual observations since than line contains seasonal variation. The Management Scientist gives the following trend line for this data: This trend line a close to the line we computed in Section 2.3, when the line was fit to the actual, rather than the seasonal data: T t 367 7.8 t. Once we have the trend line, making a forecast is easy. Lets say we want to make a forecast for time period 2. Of course, The Management Scientist does all this for us. To use The Management Scientist . select the Forecasting Module and load the data as previously described in the Three Period Moving Average demonstration. Next, click SolutionSolveTrend and Seasonal . then enter 4 where it asks for number of seasons, and 4 where it asks for number of periods to forecast. - click OK to get the solution. Note that number of seasons is 4 for quarterly data, 12 for monthly data, and so forth. Here is the printout. Printout 2.4.1 FORECASTING WITH TREND AND SEASONAL COMPONENTS SEASON SEASONAL INDEX THE MEAN SQUARE ERROR 87.25 THE FORECAST FOR PERIOD 13 494.43 THE FORECAST FOR PERIOD 14 485.44 THE FORECAST FOR PERIOD 15 450.64 THE FORECAST FOR PERIOD 16 510.40 The Mean Square Error of 87.25, gives a root mean square error of 9.3, a spectacular improvement over the other techniques. A sketch of the actual and forecast data shows how well the trend and seasonal model can do at responding to the trend and the seasonal turn points. Note how the four period out forecast continues the response to both components. Pause and Reflect The trend and seasonal components method is appropriate when the time series exhibits a linear trend and seasonality. This model, compared to the others, does require significantly more historical data. It is suggested that you should have enough data to see at least four or five repetitions of the seasonal peaks and off peaks (with quarterly data, there should be 16 to 20 observations with monthly data, there should be 48 to 60 observations). Well, thats it to the introduction to times series forecasting material. Texts devoted entirely to this subject go into much more detail, of course. For example, there are exponential smoothing models that incorporate trend and time series decomposition models that incorporate the cyclic component. A good reference for these is Wilson and Keating, Business Forecasting . Andra ed. Irwin (1994). Two parting thoughts. In each of the Pause and Reflect paragraphs, I gave suggestions for number of observations in the historical data base. There is always some judgment required here. While we need a lot of data to fit the trend and trend and seasonal models, a lot of data may mean going far into the past. When we go far into the past, the patterns in the data may be different, and the time series forecasting models assume that any patterns in the past will continue into the future (not the values of the past observations, but the patterns such as slope and seasonal indexes). When worded on forecasts for airport traffic, we would love to go back 10 years, but tourist and permanent resident business travel is different today than 10 years ago so we must balance the need for a lot of data with the assumption of forecasting. The second thought is to always remember to measure the accuracy of your models. We ended with a model that had a root mean square error that was a 75 improvement over the 5-period moving average. I know one company that always used a 5-period moving average for their sales forecasts - scary, isnt it You should be ready to tackle the assignment for Module 2, Forecasting Lost Sales, in the text, pp. 210-212. The case answers via e-mail and The Management Scientist computer output files are due February 10, 2001. If you want free review of your draft responsesoutput, please forward as a draft by Tuesday, February 6, 2001. Module Schedule

Comments

Popular Posts