Wednesday 20 December 2017

1 4 enkel rörliga medelvärden


Flytta medelvärden Flytta medelvärden Med vanliga dataset är medelvärdet ofta det första och en av de mest användbara, sammanfattande statistiken för att beräkna. När data är i form av en tidsserie är seriemärket en användbar åtgärd, men återspeglar inte dataens dynamiska natur. Medelvärden beräknade över korta perioder, antingen före den aktuella perioden eller centrerad under den aktuella perioden, är ofta mer användbara. Eftersom sådana medelvärden varierar eller flyttas, då den aktuella perioden går från tid t 2, t 3. etc. är de kända som glidande medelvärden (Mas). Ett enkelt glidande medelvärde är (vanligtvis) det obegripade medlet av k tidigare värden. Ett exponentiellt vägt rörligt medelvärde är väsentligen detsamma som ett enkelt rörligt medelvärde, men med bidrag till medelvärdet viktat av deras närhet till den aktuella tiden. Eftersom det inte finns en, men en hel serie av rörliga medelvärden för en given serie, kan maset själva vara ritat på diagram, analyserade som en serie och används vid modellering och prognoser. En rad modeller kan konstrueras med hjälp av glidande medelvärden, och dessa är kända som MA-modeller. Om sådana modeller kombineras med autoregressiva (AR) modeller är de resulterande kompositmodellerna kända som ARMA - eller ARIMA-modeller (jag är för integrerad). Enkla glidande medelvärden Eftersom en tidsserie kan betraktas som en uppsättning värden, kan t 1,2,3,4, n genomsnittet av dessa värden beräknas. Om vi ​​antar att n är ganska stor, och vi väljer ett heltal k som är mycket mindre än n. vi kan beräkna en uppsättning blockmedelvärden eller enkla glidande medelvärden (i ordning k): Varje åtgärd representerar genomsnittet av datavärdena över ett intervall av k-observationer. Observera att den första möjliga MA i ordningen k gt0 är den för t k. Mer generellt kan vi släppa det extra prenumerationen i ovanstående uttryck och skriva: Detta säger att det uppskattade medelvärdet vid tiden t är det enkla genomsnittet av det observerade värdet vid tiden t och de föregående k -1-stegen. Om vikter appliceras som minskar bidraget från observationer som är längre bort i tid, sägs det glidande medlet vara exponentiellt jämna. Flytta medelvärden används ofta som en form av prognoser, varvid det uppskattade värdet för en serie vid tiden t 1, S t1. tas som MA för perioden fram till och med tiden t. t. ex. Dagens uppskattning baseras på ett genomsnitt av tidigare inspelade värden fram till och med gårdagarna (för dagliga data). Enkla glidande medelvärden kan ses som en form av utjämning. I det exempel som illustreras nedan har luftföroreningens dataset som visas i introduktionen till detta ämne ökat med en 7-dagars glidande medelvärde (MA) - linje, som visas här i rött. Såsom kan ses, släpper MA-linjen ut topparna och trågen i data och kan vara till stor hjälp när det gäller att identifiera trender. Standarden framåtberäkningsformeln innebär att de första k -1 datapunkterna inte har något MA-värde, men därefter sträcker sig beräkningarna till den slutliga datapunkten i serien. PM10 dagliga medelvärden, Greenwich källa: London Air Quality Network, londonair. org. uk En anledning till att beräkna enkla glidande medelvärden på det sätt som beskrivs är att det gör det möjligt att beräkna värden för alla tidsluckor från tid tk fram till idag, och När en ny mätning erhålls för tid t 1 kan MA för tid t 1 läggas till den redan beräknade uppsättningen. Detta ger ett enkelt förfarande för dynamiska dataset. Det finns emellertid vissa problem med detta tillvägagångssätt. Det är rimligt att hävda att medelvärdet under de senaste 3 perioderna ska vara placerat vid tiden t -1, inte tiden t. och för en MA över ett jämnt antal perioder kanske det borde ligga mitt i punkten mellan två tidsintervaller. En lösning på denna fråga är att använda centrerade MA-beräkningar, där MA vid tiden t är medelvärdet av en symmetrisk uppsättning värden runt t. Trots dess uppenbara meriter används inte detta tillvägagångssätt allmänt eftersom det krävs att data är tillgängliga för framtida händelser, vilket kanske inte är fallet. I fall där analysen helt och hållet består av en befintlig serie, kan användningen av centrerad Mas vara att föredra. Enkla glidande medelvärden kan betraktas som en form av utjämning, avlägsna några högfrekventa komponenter i en tidsserie och markera (men inte ta bort) trender på ett sätt som liknar den allmänna uppfattningen av digital filtrering. Faktum är att glidmedel är en form av linjärt filter. Det är möjligt att tillämpa en glidande medelberäkning till en serie som redan har slätts, dvs utjämning eller filtrering av en redan slätad serie. Till exempel med ett glidande medelvärde av ordning 2 kan vi betrakta det som beräknat med vikter, så MA vid x 2 0,5 x 1 0,5 x 2. På samma sätt kan MA vid x 3 0,5 x 2 0,5 x 3. Om vi Applicera en andra nivå av utjämning eller filtrering, vi har 0,5 x 2 0,5 x 3 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dvs 2-stegs filtrering process (eller convolution) har producerat ett variabelt viktat symmetriskt rörligt medelvärde, med vikter. Flera omvälvningar kan producera ganska komplexa viktade glidmedel, av vilka vissa har visat sig vara särskilt användningsområden inom specialiserade områden, t. ex. i livförsäkringsberäkningar. Flyttande medelvärden kan användas för att avlägsna periodiska effekter om de beräknas med periodens längd som känd. Exempelvis kan säsongsvariationer ofta avlägsnas (om detta är målet) med hjälp av ett symmetriskt 12 månaders glidande medelvärde med alla månader viktade lika mycket, med undantag för det första och det sista som vägs med 12. Detta beror på att det kommer att var 13 månader i den symmetriska modellen (aktuell tid, t. - 6 månader). Totalen är dividerad med 12. Liknande procedurer kan antas för vilken väldefinierad periodicitet som helst. Exponentiellt vägda glidmedel (EWMA) Med den enkla glidande medelformeln: alla observationer är lika viktiga. Om vi ​​kallade dessa lika vikter, alfa t. var och en av k-vikterna skulle motsvara 1 k. så summan av vikterna skulle vara 1 och formeln skulle vara: Vi har redan sett att flera tillämpningar av denna process resulterar i vikten varierande. Med exponentiellt vägda glidmedel är bidraget till medelvärdet från observationer som är mer borttagna i tiden minskat, vilket därmed understryker senare (lokala) händelser. I grunden introduceras en utjämningsparameter, 0lt al1, och formeln revideras till: En symmetrisk version av denna formel skulle vara av formen: Om vikterna i den symmetriska modellen väljas som villkoren för villkoren för binomial expansion, (1212) 2q. de kommer att summeras till 1, och när q blir stor kommer den att approximera normalfördelningen. Detta är en form av kärnviktning, med binomial som fungerar som kärnfunktionen. Den tvåstegsvalsning som beskrivs i föregående stycke är just detta arrangemang, med q 1, vilket ger vikterna. Vid exponentiell utjämning är det nödvändigt att använda en uppsättning vikter som summerar till 1 och som reducerar geometriskt i storlek. De använda vikterna är typiskt av formen: För att visa att dessa vikter uppgår till 1, överväga utvidgningen av 1 som en serie. Vi kan skriva och expandera uttrycket i parentes med binomialformeln (1- x) p. där x (1-) och p -1, vilket ger: Detta ger då en form av viktat glidande medelvärde av formuläret: Denna summering kan skrivas som en återkommande relation: vilket förenklar beräkningen kraftigt och undviker problemet att viktningsregimen bör strängt vara oändlig för vikterna sammanlagt till 1 (för små värden av alfa. detta är vanligtvis inte fallet). Notationen som används av olika författare varierar. Vissa använder bokstaven S för att indikera att formeln i huvudsak är en jämn variabel och skriv: medan kontrollteori litteraturen ofta använder Z snarare än S för exponentiellt viktade eller jämnda värden (se exempelvis Lucas och Saccucci, 1990, LUC1 , och NIST-webbplatsen för mer detaljer och fungerade exempel). De ovan angivna formlerna härstammar från Roberts arbete (1959, ROB1), men Hunter (1986, HUN1) använder ett uttryck av formen: vilket kan vara mer lämpligt för användning vid vissa kontrollförfaranden. Med alfa 1 är medelvärdet bara det uppmätta värdet (eller värdet av föregående dataobjekt). Med 0,5 är uppskattningen det enkla glidande medlet för nuvarande och tidigare mätningar. Vid prognosmodeller är värdet S t. används ofta som uppskattning eller prognosvärde för nästa tidsperiod, dvs som uppskattning för x vid tidpunkt t 1. Således har vi: Detta visar att prognosvärdet vid tid t 1 är en kombination av det tidigare exponentiellt vägda glidande medlet plus en komponent som representerar det vägda prediktionsfelet, epsilon. vid tiden t. Antag att en tidsserie ges och en prognos krävs, ett värde för alfa krävs. Detta kan beräknas från befintliga data genom att utvärdera summan av kvadrerade prediktionsfel erhållna med varierande värden av alfa för varje t 2,3. inställning av den första uppskattningen som det första observerade datavärdet, x 1. I kontrollapplikationer är värdet av alfa viktigt eftersom det används vid bestämning av de övre och nedre kontrollgränserna och påverkar den genomsnittliga körlängden (ARL) som förväntas innan dessa kontrollgränser bryts (under antagandet att tidsserierna representerar en uppsättning slumpmässiga, identiskt distribuerade oberoende variabler med gemensam varians). Under dessa omständigheter är variansen av kontrollstatistiken: (Lucas och Saccucci, 1990): Kontrollgränser fastställs vanligtvis som fasta multiplar av denna asymptotiska varians, t. ex. - 3 gånger standardavvikelsen. Om exempelvis alfa 0,25 och de data som övervakas antas ha en Normalfördelning, N (0,1), när den är i kontroll, kommer kontrollgränserna att vara - 1,134 och processen kommer att nå en eller annan gräns i 500 steg i genomsnitt. Lucas och Saccucci (1990 LUC1) härleda ARL för ett brett spektrum av alfa värden och under olika antaganden med användning av Markov Chain-förfaranden. De tabulerar resultaten, inklusive att tillhandahålla ARL, när medelvärdet av kontrollprocessen har skiftats med en del multipel av standardavvikelsen. Till exempel, med ett 0,5 skift med alfa 0,25 är ARL mindre än 50 tidssteg. Tillvägagångssätten som beskrivs ovan är kända som enda exponentiell utjämning. eftersom förfarandena appliceras en gång till tidsserierna och sedan utförs analyser eller kontrollprocesser på den resulterande utjämnade datasatsen. Om datasetet innehåller en trend och eller säsongsbetonade komponenter kan två - eller trestegs exponentiell utjämning användas för att avlägsna (explicit modellering) dessa effekter (se vidare avsnittet Prognoser nedan och NIST-exemplet). CHA1 Chatfield C (1975) Analysen av Times Series: Theory and Practice. Chapman och Hall, London HUN1 Hunter J S (1986) Det exponentiellt vägda glidande medlet. J av Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiellt viktade rörliga medelkontrollsystem: Egenskaper och förbättringar. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolldiagramtester baserat på geometriska rörliga medelvärden. Technometrics, 1, 239-2506.2 Flytta genomsnittsvärden ma 40 elecsales, order 5 41 I den andra kolumnen i denna tabell visas ett glidande medelvärde av order 5, vilket ger en uppskattning av trendcykeln. Det första värdet i denna kolumn är medeltalet av de första fem observationerna (1989-1993) det andra värdet i 5-MA kolumnen är medelvärdet av värdena 1990-1994 och så vidare. Varje värde i 5-MA kolumnen är genomsnittet av observationerna under femårsperioden centrerad på motsvarande år. Det finns inga värden för de två första åren eller de senaste två åren eftersom vi inte har två observationer på vardera sidan. I ovanstående formel innehåller kolumn 5-MA värden på hatt med k2. För att se hur trendcykeln uppskattar ser vi ut det tillsammans med de ursprungliga uppgifterna i Figur 6.7. plot 40 elecsales, huvudsakliga quotResidential electricity salesquot, ylab quotGWhquot. xlab quotYearquot 41 linjer 40 ma 40 elecsales, 5 41. col quotredquot 41 Lägg märke till hur trenden (i röd) är mjukare än originaldata och fångar huvudrörelsen för tidsserierna utan alla mindre svängningar. Den rörliga genomsnittsmetoden tillåter inte uppskattningar av T där t ligger nära seriens ändar, därför sträcker sig den röda linjen inte till kanterna på grafen på båda sidor. Senare kommer vi att använda mer sofistikerade metoder för trendcykeluppskattning som tillåter uppskattningar nära slutpunkterna. Ordningen för glidande medel bestämmer jämnheten i trendcykeluppskattningen. I allmänhet betyder en större ordning en mjukare kurva. Nedanstående diagram visar effekten av att ändra ordningen för glidande medelvärdet för elförsäljningsdata för bostäder. Enkla glidande medelvärden som dessa är vanligtvis oddliga ordningar (t ex 3, 5, 7 osv.) Det här är så att de är symmetriska: I ett glidande medelvärde av ordningen m2k1 finns k tidigare observationer, k senare observationer och mittenobservationen som är genomsnittliga. Men om m var jämn, skulle det inte längre vara symmetrisk. Flytta medelvärden för glidande medelvärden Det är möjligt att använda ett glidande medelvärde till ett glidande medelvärde. En anledning till att göra detta är att skapa en jämn ordning med glidande medelvärde. Till exempel kan vi ta ett glidande medelvärde av order 4 och sedan tillämpa ett annat glidande medelvärde av order 2 till resultaten. I tabell 6.2 har detta gjorts under de första åren av australiensiska kvartalsvisa ölproduktionsdata. beer2 lt - window 40 ausbeer, start 1992 41 ma4 lt 40 beer2, order 4. center FALSE 41 ma2x4 lt 40 beer2, order 4. center TRUE 41 Notationen 2times4-MA i den sista kolumnen betyder en 4-MA följt av en 2-MA. Värdena i den sista kolumnen erhålls genom att ta ett glidande medelvärde av ordning 2 av värdena i föregående kolumn. De första två värdena i 4-MA-kolumnen är exempelvis 451,2 (443410420532) 4 och 448,8 (410420532433) 4. Det första värdet i kolumnen 2times4-MA är medelvärdet av dessa två: 450,0 (451.2448.8) 2. När en 2-MA följer ett glidande medelvärde av jämn ordning (till exempel 4) kallas det ett centrerat glidande medelvärde av order 4. Detta beror på att resultaten nu är symmetriska. För att se att så är fallet kan vi skriva 2times4-MA enligt följande: starta huvuden från Bigfrac (y y y y) frac (y y y y) Stor amp frac y frac14y frac14y frac14y frac18y. slutet Det är nu ett vägt genomsnitt av observationer, men det är symmetriskt. Andra kombinationer av rörliga medelvärden är också möjliga. Till exempel används en 3times3-MA ofta och består av ett glidande medelvärde av order 3 följt av ett annat glidande medelvärde av order 3. Generellt bör en jämn order MA följas av en jämn order MA för att göra den symmetrisk. På liknande sätt bör en udda order MA följas av en udda order MA. Beräkning av trendcykeln med säsongsdata Den vanligaste användningen av centrerade glidmedel är att uppskatta trendcykeln från säsongsdata. Tänk på 2times4-MA: hat frac y frac14y frac14y frac14y frac18y. När de tillämpas på kvartalsdata får varje kvartal av året lika stor vikt som de första och sista villkoren gäller för samma kvartal i efterföljande år. Följaktligen kommer säsongsvariationen att medelvärdes ut och de resulterande värdena på hatt t kommer att ha liten eller ingen säsongsvariation kvar. En liknande effekt skulle erhållas med användning av en 2 x 8-MA eller 2 x 12-MA. I allmänhet motsvarar en 2-timmars m-MA ett vägat glidande medelvärde av ordning m1 med alla observationer som tar vikt 1m förutom de första och sista termerna som tar vikter 1 (2m). Så om säsongsperioden är jämn och i ordning m, använd en 2-timmars m-MA för att uppskatta trendcykeln. Om säsongsperioden är udda och av ordning m, använd en m-MA för att uppskatta trendcykeln. I synnerhet kan en 2-timmars 12-MA användas för att uppskatta trendcykeln för månadsdata och en 7-MA kan användas för att uppskatta trendcykeln för dagliga data. Andra val för MA-ordningen kommer vanligen att resultera i att trendcykeluppskattningar är förorenade av säsongsmässigheten i data. Exempel 6.2 Tillverkning av elektrisk utrustning Figur 6.9 visar en 2times12-MA applicerad på elutrustningens orderindex. Observera att den släta linjen inte visar någon säsongsmässighet är nästan lika med trendcykeln som visas i Figur 6.2, som uppskattades med en mycket mer sofistikerad metod än glidande medelvärden. Något annat val för ordningen för glidande medelvärde (förutom 24, 36 etc.) skulle ha resulterat i en jämn linje som visar vissa säsongsvariationer. plot 40 elecequip, ylab quotNew orders indexquot. col quotgrayquot, huvudkvotproduktionstillverkning (Euro area) cv 41 linjer 40 ma 40 elecequip, order 12 41. col quotredquot 41 Vägt glidmedelvärde Kombinationer av glidande medelvärden resulterar i viktade glidmedelvärden. Exempelvis motsvarar 2x4-MA diskuterade ovan en vägd 5-MA med vikter som ges av frac, frac, frac, frac, frac. I allmänhet kan en vägd m-MA skrivas som hat t sum k aj y, där k (m-1) 2 och vikterna ges med a, prickar, ak. Det är viktigt att vikterna alla summerar till en och att de är symmetriska så att aj a. Den enkla m-MA är ett speciellt fall där alla vikter är lika med 1m. En stor fördel med viktade glidande medelvärden är att de ger en jämnare uppskattning av trendcykeln. Istället för observationer som går in i och lämnar beräkningen vid full vikt, ökar deras vikter långsamt och sakta sakta minskar vilket resulterar i en jämnare kurva. Vissa specifika uppsättningar vikter används i stor utsträckning. Några av dessa ges i tabell 6.3.1-4 Enkelt rörligt medelvärde När ett lagerdiagram visar rörliga medelvärden för olika intervaller är grafen med det kortare tidsintervallet känt som snabbrörande medelvärde som förändringar i slutkurserna uppträder på en dag - I dagsläget kommer det snabbrörande medelvärdet att reflektera dessa förändringar snabbare än den långsamma glidande medelvärdet. När ett lagerdiagram visar rörliga medelvärden i två olika intervaller är grafen med det längre tidsintervallet känt som det långsamma glidgruppen som ändringar i stängning Priserna uppträder dagligen, det snabbrörande genomsnittet kommer att återspegla dessa förändringar snabbare än den långsiktiga glidande genomsnittet

No comments:

Post a Comment