'N Rima staan vir outoregressiewe geïntegreerde bewegende gemiddelde modelle. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n science. Forecasting - outoregressiewe geïntegreerde bewegende gemiddelde (ARIMA) Hierdie diens implemente outoregressiewe geïntegreerde bewegende gemiddelde (ARIMA) om voorspellings te produseer gebaseer op die historiese data wat verskaf is deur die gebruiker. Sal die vraag na 'n spesifieke produk te verhoog vanjaar Kan ek voorspel my produk verkope vir die Kersseisoen, sodat ek effektief kan beplan my inventaris voorspellingsmodelle is geneig om sulke vrae aan te spreek. Gegewe die afgelope data, hierdie modelle te ondersoek verborge tendense en seisoenaliteit om toekomstige tendense te voorspel. Probeer blou masjien Leer gratis Geen kredietkaart of blou inskrywing nodig. Begin nou GT Hierdie web diens deur gebruikers moontlik deur 'n foon kan verteer word, deur middel van 'n webwerf, of selfs op 'n plaaslike rekenaar, byvoorbeeld. Maar die doel van die web diens is ook om te dien as 'n voorbeeld van hoe blou masjien Leer gebruik kan word om die web dienste te skep bo-op R-kode. Met net 'n paar lyne van R-kode en klik van 'n knoppie binne blou masjien Leer Studio, kan 'n eksperiment word geskep met R-kode en gepubliseer as 'n web diens. Die web diens kan dan na die blou Marketplace gepubliseer en verteer deur gebruikers en toestelle regoor die wêreld met geen opstel infrastruktuur deur die skrywer van die web diens. Verbruik van web dienste Hierdie diens aanvaar 4 argumente en bereken die ARIMA voorspellings. Die insette argumente is: Frekwensie - Dui die frekwensie van die rou data (daagliks / weekliks / maandeliks / kwartaalliks / jaarlikse). Horizon - Toekomstige voorspelling tydraamwerk. Datum - Voeg in die nuwe tydreeksdata vir tyd. Waarde - Voeg in die nuwe tydreeksdata waardes. Die uitset van die diens is die berekende voorspelling waardes. Monster insette kan wees: Frequency - 12 Horizon - 12 Datum - 1/15/20122/15/20123/15/20124/15/20125/15/20126/15/20127/15/20128/15/20129/15/201210 / 15/201211/15/201212/15/2012 1/15/20132/15/20133/15/20134/15/20135/15/20136/15/20137/15/20138/15/20139/15/201310 / 15/201311/15/201312/15/2013 1/15/20142/15/20143/15/20144/15/20145/15/20146/15/20147/15/20148/15/20149/15/2014 Waarde - 3.4793.683.8323.9413.7973.5863.5083.7313.9153.8443.6343.5493.5573.7853.7823.6013.5443.5563.653.7093.6823.511 3.4293.513.5233.5253.6263.6953.7113.7113.6933.5713.509 Hierdie diens, as gasheer op die blou Marketplace, is 'n OData diens hierdie mag genoem word deur die pos of kry metodes. Daar is verskeie maniere om die verbruik van die diens in 'n outomatiese mode ( 'n voorbeeld app is hier). Begin C-kode vir web diens verbruik: Skep van web diens Dit web diens is geskep met behulp van blou masjien Leer. Vir 'n gratis toets, sowel as inleidende video's op die skep van eksperimente en publiseer web dienste. sien blou / ml. Hier is 'n kiekie van die eksperiment wat die web diens en voorbeeld kode vir elk van die modules in die eksperiment. Van binne blou masjienleer, is 'n nuwe leeg eksperiment geskep. Monster insette data is gelaai met 'n vooraf gedefinieerde data skedule. Gekoppel aan die data-skedule is 'n uitvoer R script module, wat die ARIMA voorspelling model met behulp van auto. arima en voorspelling funksies van R. Medley vloei genereer: Module 1: Module 2: Beperkings Dit is 'n baie eenvoudige voorbeeld vir ARIMA vooruitskatting. Soos gesien kan word uit die voorbeeld kode hierbo, vang geen fout is geïmplementeer, en die diens aanvaar dat al die veranderlikes is deurlopende / positiewe waardes en die frekwensie moet 'n heelgetal groter as 1. wees Die lengte van die datum en waarde vektore moet wees dieselfde. Die datum veranderlike moet voldoen aan die formaat mm / dd / jjjj. Vrae Vir vrae oor die verbruik van die web diens of publikasie te mark, kyk hier. Documentation is die onvoorwaardelike gemiddelde van die proses, en x03C8 (L) is 'n rasionele, oneindige-graad lag operateur polinoom, (1 x03C8 1 L x03C8 2 L 2 x2026). Let wel: Die konstante eienskap van 'n ARIMA model voorwerp ooreenstem met c. en nie die onvoorwaardelike gemiddelde 956. Deur Wolds ontbinding 1. Vergelyking 5-12 ooreenstem met 'n stilstaande stogastiese proses op voorwaarde dat die koëffisiënte x03C8 Ek is absoluut summable. Dit is die geval wanneer die AR polinoom, x03D5 (L). is stabiel. wat beteken dat al sy wortels lê buite die eenheidsirkel. Daarbenewens het die proses is kousale op voorwaarde dat die MA polinoom is omkeerbaar. wat beteken dat al sy wortels lê buite die eenheidsirkel. Ekonometrie Gereedskap dwing stabiliteit en inverteerbaarheid van ARMA prosesse. Wanneer jy 'n ARMA model spesifiseer met behulp van ARIMA. jy 'n fout as jy koëffisiënte wat nie ooreenstem met 'n stabiele AR polinoom of omkeerbare MA polinoom betree. Net so, skat lê stasionariteit en inverteerbaarheid beperkings tydens beraming. Verwysings 1 Wold, H. 'n studie in die ontleding van tydreekse. Uppsala, Swede: Almqvist amp Wiksell, 1938. Kies jou CountryAutoregressive bewegende gemiddeldes Simulasie (Eerste Orde) besonderhede die demonstrasie is sodanig dat dieselfde ewekansige reeks punte maak nie saak hoe die konstantes en is uiteenlopend gebruik gestel. Maar wanneer die quotrandomizequot knoppie gedruk word, 'n nuwe ewekansige reeks sal gegenereer word en gebruik word. Hou die ewekansige reeks identiese die gebruiker toelaat om presies die uitwerking daarvan op die ARMA reeks van veranderinge in die twee konstantes sien. Die konstante is beperk tot (-1,1) omdat divergensie van die ARMA reeks resultate wanneer. Die demonstrasie is net vir 'n eerste-orde-proses. Bykomende AR terme in staat sal stel meer komplekse reeks word gegenereer, terwyl bykomende MA terme die smoothing sal verhoog. Vir 'n gedetailleerde beskrywing van ARMA prosesse, sien, byvoorbeeld, G. Box, G. M. Jenkins, en G. Reinsel, Tydreeksanalise: Vooruitskatting en beheer. 3rd ed. Englewood Cliffs, NJ: Prentice-Hall, 1994. VERWANTE LINKSMicrosoft Tyd Reeks Algoritme Tegniese Verwysing van toepassing op: SQL Server 2016 Die Microsoft Tyd Reeks algoritme sluit twee afsonderlike algoritmes vir die ontleding van tydreekse: Die ARTXP algoritme, wat in SQL Server 2005, is geskik vir die voorspelling van die volgende waarskynlik waarde in 'n reeks. Die ARIMA algoritme is in SQL Server 2008 bygevoeg akkuraatheid vir 'n lang termyn voorspelling te verbeter. By verstek, Analysis Services gebruik elke algoritme afsonderlik aan die model op te lei en dan meng die resultate van die beste voorspelling gee vir 'n veranderlike aantal voorspellings. Jy kan ook kies om net een van die algoritmes, op grond van jou data en voorspelling vereistes te gebruik. In SQL Server 2008 Enterprise, kan jy ook pas die afsnypunt dat die kombinasie van algoritmes tydens voorspelling beheer. Hierdie onderwerp bied meer inligting oor elke algoritme geïmplementeer, en hoe jy die algoritme kan aanpas deur die oprigting van parameters te verfyn die ontleding en voorspelling resultate. Microsoft Research ontwikkel die oorspronklike ARTXP algoritme wat gebruik word in SQL Server 2005, die implementering van die Microsoft besluit Bome algoritme baseer. Daarom kan die ARTXP algoritme beskryf word as 'n outoregressiewe boom model vir wat periodieke tydreeksdata. Hierdie algoritme verband 'n veranderlike aantal afgelope items aan elke huidige item wat voorspel. Die naam ARTXP spruit uit die feit dat die outoregressiewe boom metode ( 'n kuns algoritme) is van toepassing op verskeie onbekende voor State. Vir 'n volledige uiteensetting van die ARTXP algoritme, sien outoregressiewe Tree Models vir tydreekse Ontleding. Die ARIMA algoritme is in SQL Server 2008 na die Microsoft Tyd Reeks algoritme bygevoeg langtermyn voorspelling te verbeter. Dit is 'n implementering van die proses vir die berekening van outoregressiewe geïntegreerde bewegende gemiddeldes wat beskryf word deur Box en Jenkins. Die ARIMA metode maak dit moontlik om afhanklikhede aan waarnemings agtermekaar geneem in die tyd te bepaal, en kan ewekansige skokke inkorporeer as deel van die model. Die ARIMA metode ondersteun ook multiplikatiewe seisoenaliteit. Lesers wat meer wil weet oor die ARIMA algoritme leer word aangemoedig om die seminale werk deur Box en Jenkins hierdie artikel is bedoel om spesifieke besonderhede oor hoe die ARIMA metode het in die Microsoft Tyd Reeks algoritme geïmplementeer verskaf lees. By verstek, die Microsoft Tyd Reeks algoritme gebruik beide metodes, ARTXP en ARIMA, en versnitte die resultate van akkuraatheid voorspel verbeter. As jy wil net 'n spesifieke metode te gebruik, kan jy die algoritme parameters om net ARTXP of net ARIMA gebruik, of om te bepaal hoe die resultate van die algoritmes gekombineer word. Let daarop dat die ARTXP algoritme ondersteun kruis-voorspelling, maar die ARIMA algoritme nie. Daarom, kruis-voorspelling is net beskikbaar as jy 'n versnit van algoritmes gebruik, of wanneer jy die model op te stel om slegs ARTXP gebruik. Hierdie afdeling stel 'n paar terme wat nodig is om die ARIMA model verstaan en bespreek die spesifieke implementering van breukmetodes in die Microsoft Tyd Reeks algoritme. Vir 'n volledige uiteensetting van hierdie terme en konsepte, beveel ons aan 'n hersiening van Box en Jenkins. 'N Term is 'n komponent van 'n wiskundige vergelyking. Byvoorbeeld, kan 'n term in 'n polinoomvergelyking sluit 'n kombinasie van veranderlikes en konstantes. Die ARIMA formule wat ingesluit is in die Microsoft Tyd Reeks algoritme gebruik beide outoregressiewe en bewegende gemiddelde terme. Tydreeksmodelle kan stilstaande of nie-stationaire wees. Stilstaande modelle is dié wat terugkeer na 'n gemiddelde, hoewel hulle siklusse kan hê, terwyl nie-stationaire modelle nie 'n fokus van ewewig het en is onderhewig aan 'n groter variasie of verandering wat deur skokke. of eksterne veranderlikes. Die doel van breukmetodes is om 'n tydreeks te stabiliseer maak en 'n stilstaande. Die orde van verskil verteenwoordig die aantal kere wat die verskil tussen waardes geneem vir 'n tydreeks. Die Microsoft Tyd Reeks algoritme werk deur die neem van waardes in 'n data-reeks en 'n poging om die data te pas om 'n patroon. As die data-reeks is nie reeds skryfbehoeftes, die algoritme van toepassing 'n bevel van verskil. Elke toename in die orde van verskil is geneig om die tydreeks meer stilstaande maak. Byvoorbeeld, as jy die tyd reeks (Z1, Z2,, Zn) en berekeninge te kan uitvoer met behulp van 'n bevel van verskil, jy 'n nuwe reeks (y1, y2 ,. yn-1), waar yi zi1-zi verkry. Wanneer die verskil orde is 2, die algoritme genereer 'n ander reeks (x1, x2,, xn-2), wat gebaseer is op die y-reeks wat afgelei van die eerste orde vergelyking. Die korrekte bedrag van breukmetodes hang af van die data. 'N Enkele orde van breukmetodes is mees algemeen in modelle wat 'n konstante tendens 'n tweede orde van breukmetodes kan 'n tendens wat wissel met die tyd aan te dui wys. By verstek, die einde van verskil in die Microsoft Tyd Reeks algoritme is -1, wat beteken dat die algoritme outomaties die beste waarde vir die verskil orde sal opspoor. Tipies, wat die beste waarde is 1 (wanneer breukmetodes vereis), maar onder sekere omstandighede sal die algoritme wat waarde te verhoog tot 'n maksimum van 2. Die Microsoft Tyd Reeks algoritme bepaal die optimale ARIMA verskil orde deur die gebruik van die motor regressie waardes. Die algoritme ondersoek die AR waardes en stel 'n verborge parameter, ARIMAARORDER, wat die einde van die AR terme. Hierdie verborge parameter, ARIMAARORDER, het 'n reeks waardes van -1 tot 8. Aan die verstek waarde van -1, sal die algoritme outomaties die toepaslike verskil orde te kies. Wanneer die waarde van ARIMAARORDER is groter as 1, die algoritme vermenigvuldig die tydreeks deur 'n polinoom termyn. As een termyn van die polinoom formule besluit om 'n wortel van 1 of naby 1, die algoritme poog om die stabiliteit van die model te bewaar deur die verwydering van die term en die verhoging van die verskil bevel deur 1. Indien die verskil orde is reeds op die maksimum, die term verwyder en die verskil orde verander nie. Byvoorbeeld, indien die waarde van AR 2, die gevolglike AR polinoom termyn kan lyk soos volg: 1 1.4B .45B2 (1- .9B) (1- 0.5B). Let op die term (1- .9B) wat 'n wortel van ongeveer 0,9 het. Die algoritme elimineer hierdie term uit die polinoom formule maar kan die verskil einde nie baie verdien deur een, want dit is reeds op die maksimum waarde van 2. Dit is belangrik om daarop te let dat die enigste manier waarop jy 'n verandering in verskil bestelling kan dwing om die gebruik ongesteunde parameter, ARIMADIFFERENCEORDER. Hierdie verborge parameter beheer hoeveel keer die algoritme voer breukmetodes op die tydreeks, en kan deur te tik 'n persoonlike algoritme parameter gestel. Maar ons het nie beveel aan dat jy hierdie waarde te verander nie, tensy jy bereid is om te eksperimenteer is en vertroud is met die betrokke berekeninge. Let ook daarop dat daar tans geen meganisme, insluitend verborge parameters, om jou te laat die drumpel waarteen die toename in verskil orde is veroorsaak te beheer. Ten slotte, daarop te let dat die hierbo beskryf formule is die vereenvoudig geval, met geen wenke seisoenaliteit. As wenke seisoenaliteit word, dan 'n aparte AR polinoom termyn bygevoeg aan die linkerkant van die vergelyking vir elke seisoen wenk, en dieselfde strategie toegepas word om terme wat die differenced reeks kan destabiliseer skakel.
No comments:
Post a Comment