Wednesday 1 November 2017

Glidande medelvärde metod i tidsserieanalys


Utför en tidsserieanalys med hjälp av den linjära glidande medelvärdesmetoden Du kan använda den här metoden med en tidsserie som visar trend och glidande medelvärden som involverar mer än två glidande medelvärden. Först beräkna och lagra det rörliga genomsnittet av originalserien. Beräkna och lagra sedan det glidande medelvärdet för den tidigare lagrade kolumnen för att få ett andra glidande medelvärde. För att beräkna och lagra det rörliga genomsnittet väljer du Stat gt Time Series gt Moving Average. slutför dialogrutan, välj Lagring. och välj Flytta medelvärden. Copyright 2016 Minitab Inc. Alla rättigheter reserverade. Genom att använda denna webbplats godkänner du användningen av cookies för analys och personligt innehåll. Läs vår policySmoothing data tar bort slumpmässig variation och visar trender och cykliska komponenter. Inhämtande i insamlingen av data som tagits över tiden är någon form av slumpmässig variation. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. En ofta använd teknik inom industrin är utjämning. Denna teknik, när den tillämpas korrekt, avslöjar tydligare den underliggande trenden, säsongs - och cykliska komponenter. Det finns två olika grupper av utjämningsmetoder. Medelvärden Metoder Exponentiella utjämningsmetoder Med medelvärden är det enklaste sättet att släta data. Vi ska först undersöka några medelvärden, till exempel det enkla genomsnittet av alla tidigare data. En lagerförare vill veta hur mycket en typisk leverantör levererar i 1000 dollar-enheter. Heshe tar slumpmässigt ett urval av 12 leverantörer med följande resultat: Beräknat medelvärde eller medelvärde av data 10. Chefen bestämmer sig för att använda detta som uppskattning av utgifter för en typisk leverantör. Är detta en bra eller dålig uppskattning Medelkvadratfel är ett sätt att bedöma hur bra en modell är Vi ska beräkna det genomsnittliga kvadratfelet. Det felaktiga beloppet använts minus den beräknade mängden. Felet kvadrerade är felet ovan, kvadrerat. SSE är summan av kvadrerade fel. MSE är medelvärdet av de kvadratiska felen. MSE-resultat till exempel Resultaten är: Fel och kvadrater Fel Uppskattningen 10 Frågan uppstår: kan vi använda medelvärdet för att prognostisera inkomst om vi misstänker en trend En titt på diagrammet nedan visar tydligt att vi inte borde göra det här. Genomsnittet väger alla tidigare observationer lika Sammanfattningsvis säger vi att Det enkla genomsnittet eller medelvärdet av alla tidigare observationer är enbart en användbar uppskattning för prognoser när det inte finns några trender. Om det finns trender, använd olika uppskattningar som tar hänsyn till trenden. Medeltalet väger alla tidigare observationer lika. Medelvärdet av värdena 3, 4, 5 är till exempel 4. Vi vet självklart att ett medel beräknas genom att lägga till alla värden och dela summan med antalet värden. Ett annat sätt att beräkna medelvärdet är att lägga till varje värde dividerat med antalet värden eller 33 43 53 1 1.3333 1.6667 4. Multiplikatorn 13 kallas vikten. Generellt: bar frac summa vänster (frac right) x1 left (frac right) x2,. ,, vänster (frac höger) xn. (Vänster (frac höger)) är vikterna och de räknas naturligtvis till 1.2.1 Flytta genomsnittsmodeller (MA modeller) Tidsseriemodeller som kallas ARIMA-modeller kan innefatta autoregressiva termer och eller rörliga genomsnittsvillkor. I vecka 1 lärde vi oss en autoregressiv term i en tidsseriemodell för variabeln x t är ett fördröjt värde av x t. Till exempel är en lag 1-autoregressiv term x t-1 (multiplicerad med en koefficient). Denna lektion definierar glidande medelvärden. En glidande medelfrist i en tidsseriemodell är ett tidigare fel (multiplicerat med en koefficient). Låt (wt overset N (0, sigma2w)), vilket betyder att wt är identiskt oberoende fördelat, var och en med en normal fördelning med medelvärde 0 och samma varians. Den första ordningens rörliga genomsnittsmodell, betecknad med MA (1) är (xt mu wt theta1w) Den andra ordens rörliga genomsnittsmodellen, betecknad med MA (2) är (xt mu wt theta1w theta2w) , betecknad med MA (q) är (xt mu wt theta1w theta2w punkter thetaqw) Not. Många läroböcker och programvara definierar modellen med negativa tecken före villkoren. Detta ändrar inte de allmänna teoretiska egenskaperna hos modellen, även om den vrider de algebraiska tecknen på uppskattade koefficientvärden och (unsquared) termer i formler för ACF och variationer. Du måste kontrollera din programvara för att kontrollera om negativa eller positiva tecken har använts för att korrekt beräkna den beräknade modellen. R använder positiva tecken i sin underliggande modell, som vi gör här. Teoretiska egenskaper hos en tidsserie med en MA (1) modell Observera att det enda nonzero-värdet i teoretisk ACF är för lag 1. Alla andra autokorrelationer är 0. Således är ett prov ACF med en signifikant autokorrelation endast vid lag 1 en indikator på en möjlig MA (1) modell. För intresserade studenter är bevis på dessa egenskaper en bilaga till denna handout. Exempel 1 Antag att en MA (1) modell är x t10 w t .7 w t-1. var (överskridande N (0,1)). Således är koefficienten 1 0,7. Den teoretiska ACF ges av En plot av denna ACF följer. Den visade ploten är den teoretiska ACF för en MA (1) med 1 0,7. I praktiken ger ett prov vanligen vanligtvis ett så tydligt mönster. Med hjälp av R simulerade vi n 100 provvärden med hjälp av modellen x t 10 w t .7 w t-1 där vikt N (0,1). För denna simulering följer en tidsserieplot av provdata. Vi kan inte berätta mycket från denna plot. Provet ACF för den simulerade data följer. Vi ser en spik vid lag 1 följt av allmänt icke-signifikanta värden för lags över 1. Observera att provet ACF inte matchar det teoretiska mönstret för den underliggande MA (1), vilket är att alla autokorrelationer för lags över 1 kommer att vara 0 . Ett annat prov skulle ha ett något annorlunda prov ACF som visas nedan, men skulle troligen ha samma breda funktioner. Terapeutiska egenskaper för en tidsreaktion med en MA (2) modell För MA (2) modellen är teoretiska egenskaper följande: Observera att de enda nonzero-värdena i teoretisk ACF är för lags 1 och 2. Autokorrelationer för högre lags är 0 . En ACF med signifikanta autokorrelationer vid lags 1 och 2, men icke-signifikanta autokorrelationer för högre lags indikerar en möjlig MA (2) modell. iid N (0,1). Koefficienterna är 1 0,5 och 2 0,3. Eftersom det här är en MA (2), kommer den teoretiska ACF endast att ha nonzero-värden endast på lags 1 och 2. Värdena för de två icke-oberoende autokorrelationerna är A-plot av den teoretiska ACF följer. Såsom nästan alltid är fallet kommer provdata inte att verka så perfekt som teori. Vi simulerade n 150 provvärden för modellen x t 10 w t .5 w t-1 .3 w t-2. var vet N (0,1). Tidsserierna av data följer. Som med tidsserien för MA (1) provdata kan du inte berätta mycket för det. Provet ACF för den simulerade data följer. Mönstret är typiskt för situationer där en MA (2) modell kan vara användbar. Det finns två statistiskt signifikanta spikar vid lags 1 och 2 följt av icke-signifikanta värden för andra lags. Observera att provet ACF på grund av provtagningsfel inte exakt matchade det teoretiska mönstret. ACF för General MA (q) Modeller En egenskap hos MA (q) modeller är generellt att det finns icke-oberoende autokorrelationer för de första q-lagsna och autokorrelationerna 0 för alla lags gt q. Icke-unikhet av koppling mellan värden på 1 och (rho1) i MA (1) Modell. I MA (1) - modellen, för något värde av 1. den ömsesidiga 1 1 ger samma värde. Använd exempelvis 0,5 för 1. och använd sedan 1 (0,5) 2 för 1. Du får (rho1) 0,4 i båda fallen. För att tillfredsställa en teoretisk restriktion kallad invertibility. vi begränsar MA (1) - modellerna till att ha värden med absolutvärdet mindre än 1. I exemplet just givet är 1 0,5 ett tillåtet parametervärde, medan 1 10,5 2 inte kommer att. Omvändbarhet av MA-modeller En MA-modell sägs vara omvändbar om den är algebraiskt ekvivalent med en konvergerande oändlig ordning AR-modell. Genom att konvergera menar vi att AR-koefficienterna minskar till 0 när vi flyttar tillbaka i tiden. Omvändbarhet är en begränsning programmerad i tidsserieprogramvara som används för att uppskatta koefficienterna för modeller med MA-termer. Det är inte något vi söker efter i dataanalysen. Ytterligare information om invertibilitetsbegränsningen för MA (1) - modeller ges i bilagan. Avancerad teorinotation. För en MA (q) modell med en specificerad ACF finns det bara en inverterbar modell. Det nödvändiga villkoret för invertibilitet är att koefficienterna har värden så att ekvationen 1- 1 y-. - q y q 0 har lösningar för y som faller utanför enhetens cirkel. R-kod för exemplen I exempel 1 ritade vi den teoretiska ACF av modellen x t10 wt. 7w t-1. och sedan simulerade n 150 värden från denna modell och plottade provets tidsserie och provet ACF för de simulerade data. R-kommandon som användes för att plotta den teoretiska ACF var: acfma1ARMAacf (mac (0.7), lag. max10) 10 lags av ACF för MA (1) med theta1 0,7 lags0: 10 skapar en variabel som heter lags som sträcker sig från 0 till 10. plot (lags, acfma1, xlimc (1,10), ylabr, typh, huvud ACF för MA (1) med theta1 0,7) abline (h0) adderar en horisontell axel till plottet Det första kommandot bestämmer ACF och lagrar det i ett objekt namnet acfma1 (vårt val av namn). Plot-kommandot (det tredje kommandot) plottar jämfört med ACF-värdena för lags 1 till 10. ylab-parametern markerar y-axeln och huvudparametern lägger en titel på plotten. För att se de numeriska värdena för ACF använder du bara kommandot acfma1. Simuleringen och diagrammen gjordes med följande kommandon. xcarima. sim (n150, lista (mac (0.7))) Simulerar n 150 värden från MA (1) xxc10 lägger till 10 för att göra medelvärdet 10. Simulering standardvärden betyder 0. plot (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF för simulerad provdata) I exempel 2 ritade vi den teoretiska ACF av modellen xt 10 wt5 w t-1, 3 w t-2. och sedan simulerade n 150 värden från denna modell och plottade provets tidsserie och provet ACF för de simulerade data. De R-kommandon som användes var acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typh, huvud ACF för MA (2) med theta1 0,5, theta20.3) abline (h0) xcarima. sim (n150, lista (mac (0,5, 0,3)) xxc10 plot (x, typeb, huvudsimulerad MA (2) serie) acf (x, xlimc (1,10) mainACF för simulerade MA (2) data) Bilaga: Bevis på egenskaper hos MA (1) För intresserade studenter, här är bevis för teoretiska egenskaper hos MA (1) modellen. Varians: (text (xt) text (mu wt theta1 w) 0 text (wt) text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) När h 1, föregående uttryck 1 w 2. För varje h 2, föregående uttryck 0 . Orsaken är att, per definition av vägtons oberoende. E (w k w j) 0 för någon k j. Vidare, eftersom w t har medelvärdet 0, E (w jw j) E (wj 2) w 2. För en tidsserie, Applicera detta resultat för att få ACF ges ovan. En inverterbar MA-modell är en som kan skrivas som en oändlig ordning AR-modell som konvergerar så att AR-koefficienterna konvergerar till 0 när vi rör sig oändligt tillbaka i tiden. Visa väl omvändbarhet för MA (1) modellen. Vi ersätter sedan förhållandet (2) för w t-1 i ekvation (1) (3) (zt wt theta1 (z-tetww) wt theta1z-tetanw) Vid tid t-2. ekvationen (2) blir Vi ersätter sedan förhållandet (4) för w t-2 i ekvation (3) (zt wt theta1z-teteta21wt theta1z-teteta21 (z-tetww) wt theta1z-teteta12z theta31w) Om vi ​​skulle fortsätta oändligt) skulle vi få oändlig ordning AR-modellen (zt wt theta1z-theta21z theta31z-tetta41z punkter) Observera dock att om koefficienterna som multiplicerar lagren av z ökar (oändligt) i storlek när vi flyttar tillbaka i tid. För att förhindra detta behöver vi 1 lt1. Detta är förutsättningen för en inverterbar MA (1) modell. Oändlig ordning MA-modell I vecka 3 ser du att en AR (1) - modell kan konverteras till en oändlig ordning MA-modell: (xt - mu wt phi1w phi21w prickar phik1 w dots sum phij1w) Denna summering av tidigare vita ljudvillkor är känd som orsakssammanställning av en AR (1). Med andra ord är x t en special typ av MA med ett oändligt antal termer som går tillbaka i tiden. Detta kallas en oändlig ordning MA eller MA (). En ändlig ordning MA är en oändlig ordning AR och någon ändlös ordning AR är en oändlig ordning MA. Minns i vecka 1 noterade vi att ett krav på en stationär AR (1) är att 1 lt1. Låt beräkna Var (x t) med hjälp av kausalrepresentationen. Det här sista steget använder ett grundläggande faktum om geometriska serier som kräver (phi1lt1) annars skiljer serien. NavigationMethods för analys av tidsserier Minitab erbjuder flera analyser som låter dig analysera tidsserier. Dessa analyser inkluderar enkla prognos - och utjämningsmetoder, korrelationsanalysmetoder och ARIMA-modellering. Även om korrelationsanalys kan göras separat från ARIMA-modellering presenterar Minitab korrelationsmetoderna som en del av ARIMA-modellering. Enkla prognoser och utjämningsmetoder De enkla prognoserna och utjämningsmetoderna är komponenter i en serie som vanligtvis är enkla att observera i en tidsserier av data. Detta tillvägagångssätt sönderdelar data i dess beståndsdelar, och förlänger sedan beräkningarna av komponenterna i framtiden för att ge prognoser. Du kan välja mellan de statiska metoderna för trendanalys och sönderdelning, eller de dynamiska metoderna för att flytta genomsnittet, enkel och dubbel exponentiell utjämning och Winters metod. Statiska metoder har mönster som inte förändras över tiden Dynamiska metoder har mönster som ändras över tiden och uppskattningar uppdateras med angränsande värden. Du kan använda två metoder i kombination. Det innebär att du kan välja en statisk metod för att modellera en komponent och en dynamisk metod för att modellera en annan komponent. Till exempel kan du passa en statisk trend med trendanalys och dynamiskt modellera säsongsbeståndsdelen i resterna med Winters metod. Eller du kan passa en statisk säsongsmodell med sönderdelning och dynamiskt modellera trendkomponenten i resterna med dubbla exponentiella utjämningar. Du kan också tillämpa en trendanalys och sönderdelning tillsammans så att du kan använda det bredare urvalet av trendmodeller som erbjuds genom trendanalys. En nackdel med att kombinera metoder är att konfidensintervallet för prognoser inte är giltigt. För varje metod tillhandahåller följande tabell en sammanfattning och ett diagram över passar och prognoser för vanliga data. Trendanalys Passar en generell trendmodell till tidsseriedata. Välj mellan den linjära, kvadratiska, exponentiella tillväxten eller sönderfallet och S-kurva trendmodeller. Använd den här proceduren för att passa trenden när det inte finns någon säsongskomponent i din serie. Prognoser: Längd: lång Profil: förlängning av trendlinjen Nedbrytning Skiljer tidsserierna i linjära trendkomponenter, säsongskomponenter och felet. Välj om säsongskomponenten är additiv eller multiplikativ med trenden. Använd den här proceduren för att prognostisera när det finns en säsongskomponent i din serie eller när du vill undersöka komponenternas karaktär. Prognoser: Längd: lång Profil: trend med säsongsmönster Flytta genomsnittet Förlorar dina data genom att medellånga iakttagelser i följd i en serie. Du kan använda denna procedur när dina data inte har en trendkomponent. Om du har en säsongskomponent anger du längden på det glidande medlet som är lika med längden på säsongscykeln. Prognoser: Längd: kort Profil: platt linje Enkel exponentiell utjämning Släpper ut dina data med hjälp av den optimala enstegs framåtriktad ARIMA (0,1,1) prognosformeln. Denna procedur fungerar bäst utan en trend eller säsongskomponent. Den enda dynamiska komponenten i en rörlig genomsnittsmodell är nivån. Prognoser: Längd: kort Profil: platt linje Dubbel exponentiell utjämning Släpper ut dina data med den optimala enstegsformuläret ARIMA (0,2,2). Denna procedur kan fungera bra när det finns en trend men det kan också fungera som en allmän utjämningsmetod. Dubbel exponentiell utjämning beräknar dynamiska uppskattningar för två komponenter: nivå och trend. Prognoser: Längd: kort Profil: rak linje med lutning lika med senaste trendberäkning Winters Method Släpper ut dina data genom Holt-Winters exponentiella utjämning. Använd denna procedur när det finns trend och säsonglighet, med dessa två komponenter som antingen additiv eller multiplicativ. Winters Method beräknar dynamiska uppskattningar för tre komponenter: nivå, trend och säsong. Prognoser: Längd: kort till medium Profil: trend med säsongsmönster Korrelationsanalys och ARIMA-modellering ARIMA (autoregressiv integrerad rörlig genomsnitts) modellering använder sig också av mönster i data, men dessa mönster är inte lätt synliga i en del av data. Istället använder ARIMA-modellering differentiering och autokorrelation och partiella autokorrelationsfunktioner för att identifiera en acceptabel modell. ARIMA-modellering kan användas för att modellera många olika tidsserier, med eller utan trend - eller säsongskomponenter, och att ge prognoser. Prognosprofilen beror på vilken modell som passar. Fördelen med ARIMA-modellering jämfört med de enkla prognos - och utjämningsmetoderna är att det är mer flexibelt att anpassa data. Identifiering och montering av en modell kan dock vara tidskrävande, och ARIMA-modellering är inte lätt att automatisera. Skillnader Beräknar och lagrar skillnaderna mellan datavärdena i en tidsserie. Om du vill passa en ARIMA-modell, men dina data har en trend - eller säsongskomponent, är olika data ett vanligt steg vid bedömningen av sannolika ARIMA-modeller. Differentiering används för att förenkla korrelationsstrukturen och avslöja vilket underliggande mönster som helst. Lag Beräknar och lagrar lagren i en tidsserie. När du lagrar en tidsserie, flyttar Minitab de ursprungliga värdena nerför kolumnen och infogar saknade värden längst upp i kolumnen. Antalet saknade värden som är införda beror på längden på lagret. Autokorrelation Beräknar och skapar ett diagram över autokorrelationerna i en tidsserie. Autokorrelation är korrelationen mellan observationer av en tidsserie separerad av k tidsenheter. Autokorrelationsdiagrammet kallas autokorrelationsfunktionen (ACF). Visa ACF för att styra ditt val av villkor för att inkludera i en ARIMA-modell. Delvis autokorrelation Beräknar och skapar ett diagram över de partiella autokorrelationerna i en tidsserie. Delvis autokorrelationer, som autokorrelationer, är korrelationer mellan uppsättningar av beställda datapar i en tidsserie. Precis som med partiella korrelationer i regressionsfallet mäter partiella autokorrelationer styrkan i förhållandet till andra termer som förklaras. Den partiella autokorrelationen vid en lagring av k är korrelationen mellan rester vid tid t från en autoregressiv modell och observationer vid lag k med termer för alla mellanliggande lag i den autoregressiva modellen. Plot av partiella autokorrelationer kallas den partiella autokorrelationsfunktionen (PACF). Visa PACF för att styra ditt val av villkor för att inkludera i en ARIMA-modell. Korskorrelation Beräknar och skapar ett diagram över korrelationerna mellan två tidsserier. ARIMA Passar en Box-Jenkins ARIMA-modell till en tidsserie. I ARIMA, autoregressivt, integrerat och rörligt medelvärde, refererar till filtreringssteg som tas vid beräkningen av ARIMA-modellen tills endast slumpmässigt brus kvarstår. Använd ARIMA för att modellera tidsserier beteende och att generera prognoser. Copyright 2016 Minitab Inc. Alla rättigheter reserverade.

No comments:

Post a Comment