Thursday 21 September 2017

Autoregressive moving average tutorial


Os modelos ARIMA são, em teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser estacionária por diferenciação se necessário, talvez em conjunto com transformações não-lineares Tais como registrar ou desinflar, se necessário Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele se move de forma consistente Ou seja, seus padrões de tempo aleatórios de curto prazo sempre se parecem em um sentido estatístico. A última condição significa que suas correlações de autocorrelações com seus próprios desvios anteriores da média permanecem constantes ao longo do tempo ou, de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo. Variável desta forma pode ser vista como usual como uma combinação de sinal e ruído, eo sinal se um é aparente poderia ser um patt De reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no sinal, e também poderia ter uma componente sazonal Um modelo ARIMA pode ser visto como um filtro que tenta separar o sinal do ruído, eo sinal é então Extrapolada para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação de tipo linear de regressão linear, na qual os preditores consistem em atrasos da variável dependente e ou atrasos dos erros de previsão. Isto é. Valor estimado de Y Uma soma constante e ou ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores defasados ​​de Y é um modelo autoregressivo auto-regredido puro, Que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com software de regressão padrão. Por exemplo, um modelo AR 1 auto-regressivo de primeira ordem para Y é um modelo de regressão simples no qual a variável independente i Se apenas alguns dos preditores são defasagens dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não há como especificar o erro do último período s Como uma variável independente, os erros devem ser calculados periodicamente quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros retardados como preditores é que as previsões do modelo não são funções lineares do Assim, os coeficientes em modelos ARIMA que incluem erros retardados devem ser estimados por métodos de otimização não-linear escalada em vez de simplesmente resolver um sistema de equações. A sigla ARIMA significa Auto-Regressive Integrated Média Móvel As baixas das séries estacionalizadas na equação de previsão são chamadas de termos autorregressivos, os atrasos dos erros de previsão são chamados de termos de média móvel e uma série de tempo que precisa ser Ser diferenciado para ser feito estacionário é dito ser uma versão integrada de uma série estacionária Random-pé e modelos de tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA nonseasonal é classificado como um ARIMA P, d, q modelo, where. p é o número de termos autorregressivos. d é o número de diferenças não sazonais necessárias para a estacionariedade, e. q é o número de erros de previsão defasados ​​na equação de previsão. A equação de previsão é construída da seguinte forma Notemos que a segunda diferença de Y o caso d 2 não é a diferença de dois períodos atrás. Em vez disso, é a diferença de primeira diferença da primeira diferença que é O análogo discreto de uma segunda derivada, ou seja, a aceleração local da série em vez de sua tendência local. Em termos de y, a equação de previsão geral é. Aqui os parâmetros de média móvel s são definidos de modo que seus sinais sejam negativos na equação Seguindo a convenção introduzida por Box e Jenkins Alguns autores e softwares, incluindo a linguagem de programação R, definem-nos de modo que eles tenham mais sinais ao invés. Quando os números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção O software usa quando você está lendo a saída Muitas vezes os parâmetros são indicados por AR 1, AR 2,, e MA 1, MA 2, etc Para identificar o modelo ARIMA apropriado para Y você começa por determinar a ordem de diferenciação d que necessitam Para estacionarizar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação de estabilização de variância, como logging ou deflação Se você parar neste ponto e prever que a série diferenciada é constante, você apenas montou uma caminhada aleatória ou aleatória No entanto, a série estacionária pode ainda ter erros autocorrelacionados, sugerindo que algum número de termos AR p 1 e ou algum número de termos MA q 1 também são necessários Na equação de previsão. O processo de determinar os valores de p, d e q que são melhores para uma dada série de tempo será discutido em seções posteriores das notas cujos links estão no topo desta página, mas uma prévia de alguns Dos tipos de modelos não-temporais ARIMA que são comumente encontrados é dado abaixo. ARIMA 1,0,0 modelo auto-regressivo de primeira ordem se a série é estacionária e autocorrelacionada, talvez ele pode ser previsto como um múltiplo de seu próprio valor anterior, mais um Constante A equação de previsão neste caso é a que é Y regressa sobre si mesma retardada por um período. Este é um modelo de constante ARIMA 1,0,0 Se a média de Y for zero, então o termo constante não seria incluído. Se a inclinação O coeficiente 1 é positivo e menor que 1 em magnitude deve ser menor que 1 em magnitude se Y estiver parado, o modelo descreve o comportamento de reversão de média no qual o valor do próximo período deve ser predito como sendo 1 vezes mais distante da média como Valor do período s Se 1 for negativo, Prediz comportamento de reversão de média com alternância de sinais, ou seja, também prevê que Y estará abaixo do próximo período médio se estiver acima da média desse período. Em um modelo autorregressivo de segunda ordem ARIMA 2,0,0, haveria um Y t-2 termo à direita também, e assim por diante Dependendo dos sinais e magnitudes dos coeficientes, um modelo ARIMA 2,0,0 poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento De uma massa em uma mola que é sujeita a choques aleatórios. ARIMA 0,1,0 passeio aleatório Se a série Y não é estacionário, o modelo mais simples possível para ele é um modelo de caminhada aleatória, que pode ser considerado como um caso limitativo de Um modelo AR 1 no qual o coeficiente autorregressivo é igual a 1, ie uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como. quando o termo constante é a variação média período-período, isto é, a longo prazo Este modelo pode ser montado como uma interceptação sem Em que a primeira diferença de Y é a variável dependente Uma vez que inclui apenas uma diferença não sazonal e um termo constante, é classificada como modelo ARIMA 0,1,0 com constante O modelo randômico-sem-desvio seria Um modelo ARIMA 0,1,0 sem constante. ARIMA 1,1,0 modelo auto-regressivo de primeira ordem diferenciado Se os erros de um modelo randômico randômico são autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente ao Isto é, regressando a primeira diferença de Y sobre si mesma retardada por um período Isto resultaria na seguinte equação de previsão que pode ser rearranjada para. Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciamento não sazonal e um termo constante --em um modelo ARIMA 1,1,0.ARIMA 0,1,1 sem alisamento exponencial simples constante Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Por exemplo, aqueles que exibem flutuações barulhentas em torno de uma média de variação lenta, o modelo de caminhada aleatória não funciona tão bem quanto uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação , É melhor usar uma média das últimas observações para filtrar o ruído e estimar com mais precisão a média local O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados ​​para alcançar este efeito A equação de previsão para a O modelo de suavização exponencial simples pode ser escrito em um número de formas matematicamente equivalentes, uma das quais é a chamada forma de correção de erro, na qual a previsão anterior é ajustada na direção do erro que ela cometeu. Porque e t-1 Y t - 1 - t-1 por definição, isso pode ser reescrito como. que é uma equação de previsão ARIMA 0,1,1-sem-constante com 1 1 - Isso significa que você pode ajustar um smoo exponencial simples , Especificando-o como um modelo ARIMA 0,1,1 sem constante, eo coeficiente MA 1 estimado corresponde a 1-menos-alfa na fórmula SES. Lembre-se que no modelo SES, a idade média dos dados no intervalo 1- As previsões de período antecipado é de 1, o que significa que tenderão a ficar para trás em relação a tendências ou pontos de viragem em cerca de 1 períodos. Consequentemente, a idade média dos dados nas previsões de um período de 1 período de um ARIMA 0,1,1 - 1 1 - 1 Assim, por exemplo, se 1 0 8, a idade média é 5 Como 1 se aproxima de 1, o modelo ARIMA 0,1,1-sem constante se torna uma média móvel de muito longo prazo e Quando 1 se aproxima de 0, torna-se um modelo randômico-sem-deriva. Qual é a melhor maneira de corrigir a autocorrelação adicionando termos AR ou adicionando termos MA Nos dois modelos anteriores discutidos acima, o problema de erros autocorrelacionados em um modelo de caminhada aleatória Foi fixado de duas maneiras diferentes adicionando um valor defasado da série diferenciada à equação ou adicionando um valor defasado do foreca St erro Qual abordagem é a melhor Uma regra para esta situação, que será discutida em mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada pela adição de um termo AR para o modelo e autocorrelação negativa é geralmente melhor tratada por Adicionando um termo MA Na série econômica e de negócios, a autocorrelação negativa surge frequentemente como um artefato de diferenciação. Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa. Assim, o modelo ARIMA 0,1,1, em Cuja diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um modelo ARIMA 1,1,0. ARIMA 0,1,1 com suavização exponencial simples constante com crescimento Ao implementar o modelo SES como um modelo ARIMA, você realmente ganha alguns Flexibilidade Em primeiro lugar, permite-se que o coeficiente de MA 1 estimado seja negativo, isto corresponde a um factor de alisamento maior do que 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES Sec Você tem a opção de incluir um termo constante no modelo ARIMA se desejar, para estimar uma tendência média não-zero. O modelo ARIMA 0,1,1 com constante tem a equação de previsão. As previsões deste modelo são qualitativamente semelhantes às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma linha inclinada cuja inclinação é igual a mu ao invés de uma linha horizontal. ARIMA 0,2,1 ou 0, 2,2 sem suavização exponencial linear constante Modelos lineares de suavização exponencial são modelos ARIMA que usam duas diferenças não sazonais em conjunção com os termos MA A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim A primeira diferença da primeira diferença - ou seja, a mudança na mudança de Y no período t Assim, a segunda diferença de Y no período t é igual a Y t - Y t-1 - Y t-1 - Y T-2 Y t-2Y t-1 Y t-2 Uma segunda diferença de uma função discreta é analogou S para uma segunda derivada de uma função contínua mede a aceleração ou curvatura na função em um determinado ponto no tempo. O modelo ARIMA 0,2,2 sem constante prevê que a segunda diferença da série é igual a uma função linear da última Dois erros de previsão. que podem ser rearranjados como. quando 1 e 2 são os coeficientes MA 1 e MA 2 Este é um modelo de alisamento exponencial linear geral essencialmente o mesmo que o modelo de Holt s eo modelo de Brown s um caso especial Ele usa ponderação exponencial Médias móveis para estimar um nível local e uma tendência local na série As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA 1,1,2 sem Este modelo é ilustrado nos slides acompanhantes em modelos ARIMA extrapola a tendência local no final da série, mas aplaina-lo em horizontes de previsão mais longos para introduzir um Ote do conservadorismo, uma prática que tem suporte empírico Veja o artigo sobre Por que a Tendência de Damped trabalha por Gardner e McKenzie eo artigo da regra de ouro por Armstrong et al para detalhes. É geralmente aconselhável ficar com modelos em que pelo menos um de p E q não é maior do que 1, ou seja, não tente encaixar um modelo como o ARIMA 2,1,2, uma vez que isso é susceptível de levar a problemas de overfitting e de fatores comuns que são discutidos com mais detalhes nas notas sobre a matemática Estrutura de modelos ARIMA. Implementação de folha de cálculo Modelos ARIMA como os descritos acima são fáceis de implementar em uma planilha A equação de predição é simplesmente uma equação linear que se refere a valores passados ​​de séries de tempo originais e valores passados ​​dos erros Assim, você pode configurar Uma planilha de previsões ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os dados de erros menos as previsões na coluna C A fórmula de previsão em uma célula típica na coluna B seria simplesmente um expressio linear N referindo-se a valores nas linhas precedentes das colunas A e C, multiplicados pelos coeficientes AR ou MA apropriados armazenados em células em outra parte da planilha. ARMA Unplugged. This é a primeira entrada da nossa série de tutoriais Unplugged, na qual nós nos aprofundamos Os detalhes de cada um dos modelos de séries temporais com os quais você já está familiarizado, destacando as suposições subjacentes e dirigindo para casa as intuições por trás deles. Em esta edição, vamos abordar o modelo ARMA uma pedra angular na modelagem de séries temporais Ao contrário de problemas de análise anteriores, vamos começar Aqui com a definição do processo ARMA, o estado das entradas, saídas, parâmetros, restrições de estabilidade, pressupostos e, finalmente, desenhar algumas orientações para o processo de modelagem. Por definição, a média automática auto-regressiva ARMA é um processo estacionário estacionário composto de somas De Excel auto-regressivo e média móvel components. Alternatively, em uma formula. is simples é a saída observada no tempo t. is a inovação, choque ou erro termo a tempo T. time série observações. Are independente e identicamente distribuído. Follow uma distribuição gaussiana. Nota A variância da distribuição de choques, ou seja, é invariante no tempo. Usando notação back-shift ou seja, podemos expressar o processo ARMA como follows. Let s olhar mais de perto A formulação O processo de ARMA é simplesmente uma soma ponderada das observações de saída passadas e choques, com poucas suposições chaves. O processo de ARMA gera uma série de tempo estacionária. Os resíduos seguem uma distribuição Gaussian estável. Os valores de parâmetro de componentes são constantes. Produzem um processo ARMA estacionário. O que significam essas suposições? Um processo estocástico é uma contrapartida de um processo determinístico que descreve a evolução de uma variável aleatória ao longo do tempo. Em nosso caso, a variável aleatória é. Em seguida, os valores são independentes Eles são idênticos Distribuído Se sim, não deve ser descrito por um processo estocástico, mas sim por um modelo de distribuição probabilística. Para casos em que os valores não são independentes Por exemplo, o valor é dependente do caminho, um modelo estocástico semelhante ao ARMA é para capturar a evolução do processo. ARMA só captura a correlação serial ou seja, auto-correlação entre as observações Em palavras simples, o processo ARMA resume os valores do passado Observações, não seus valores quadrados ou seus logaritmos, etc dependência de ordem superior exige um processo diferente, por exemplo, ARCH GARCH, modelos não-lineares, etc Existem numerosos exemplos de um processo estocástico onde os valores passados ​​afetam os atuais Por exemplo, em um escritório de vendas Que recebe RFQs em uma base contínua, alguns são percebidos como vendas-ganhou, alguns como vendas perdidas, e alguns derramado sobre para o próximo mês Como resultado, em qualquer mês, alguns dos casos ganhos de vendas originam como RFQs Ou são as vendas de repetição dos meses anteriores. Quais são os choques, inovações ou termos de erro. Isto é difícil questão, ea resposta não é menos confuso ainda, vamos experimentá-lo Em palavras simples, o termo de erro em um determinado modelo É uma captura Se para todas as variações que o modelo não explica. Confundido Vamos colocá-lo de uma maneira diferente Em qualquer dado sistema, existem possivelmente dezenas de variáveis ​​que afetam a evolução do, mas o modelo captura poucos deles e irá agrupar o resto como Um termo de erro em sua fórmula i e. Still perdido Vamos usar um exemplo Para um processo de preço das ações, existem possivelmente centenas de fatores que levam o nível de preços para baixo, incluindo. Dividendos e anúncios Split. Quarterly relatórios de ganhos. Merger e aquisição MA atividades. Eventos legais, por exemplo, a ameaça de ações coletivas. Um modelo, por design, é uma simplificação de uma realidade complexa, então tudo o que deixamos fora do modelo é automaticamente empacotado no termo de erro. O processo ARMA assume que o coletivo Efeito de todos esses fatores age mais ou menos como ruído Gaussiano. Por que nos preocupamos com choques passados. Unlike um modelo de regressão, a ocorrência de um estímulo eg choque pode ter um efeito sobre o nível atual, e possivelmente futuro le Por exemplo, um evento corporativo, por exemplo, a atividade de MA afeta o preço das ações da empresa subjacente, mas a mudança pode levar algum tempo para ter seu impacto total, pois os participantes do mercado analisam as informações disponíveis e reagem em conformidade. Os valores passados ​​da saída já têm os shocks passado information. YES, o histórico de choques já é contabilizado nos níveis de saída passados ​​Um modelo ARMA pode ser representado apenas como um modelo AR puro auto-regressivo, mas o requisito de armazenamento de um tal sistema Em infinito Esta é a única razão para incluir o componente MA para economizar no armazenamento e simplificar a formulação. Além disso, o processo ARMA deve ser estacionário para que exista a variância incondicional marginal. Note Na minha discussão acima, não estou fazendo uma distinção entre Meramente a ausência de uma raiz unitária na equação característica e a estacionaridade do processo estão relacionados, mas a ausência de uma raiz unitária não é uma garantia de estacionaridade Stil L, a raiz unitária deve estar dentro do círculo da unidade para ser preciso. Vamos recapitular o que fizemos até agora Primeiro examinamos um processo ARMA estacionário, juntamente com sua formulação, entradas, suposições e requisitos de armazenamento Em seguida, Um processo ARMA incorpora seus valores de saída de auto-correlação e choques que experimentou anteriormente na saída atual Finalmente, nós mostramos que o processo estacionário ARMA produz uma série de tempo com uma média de longo prazo estável e variância. Em nossa análise de dados, antes de propor Um modelo ARMA, devemos verificar a suposição de estacionaridade e os requisitos de memória finita. No caso de a série de dados exibir uma tendência determinística, precisamos remover de-tendência primeiro e, em seguida, usar os resíduos para ARMA. O conjunto de dados exibe uma tendência estocástica, por exemplo, caminhada aleatória ou sazonalidade, precisamos de entreter ARIMA SARIMA. Finalmente, o correlograma, ou seja, ACF PACF pode ser usado para medir a exigência de memória do modelo que deve esperar ACF ou PAC F para decair rapidamente depois de alguns retornos Se não, isso pode ser um sinal de não-estacionaridade ou um padrão de longo prazo, por exemplo, ARFIMA. Autoregressive Média Movente Integrada - ARIMA. DEFINITION de média móvel auto-regressiva integrada - ARIMA. A modelo de análise estatística que Usa dados de séries temporais para prever tendências futuras É uma forma de análise de regressão que procura predizer movimentos futuros ao longo da caminhada aparentemente aleatória tomada por estoques eo mercado financeiro examinando as diferenças entre os valores na série em vez de usar os valores de dados reais Lags Das séries diferenciadas são referidas como autorregressivas e os atrasos dentro dos dados previstos são referidos como média móvel. BREAKING DOWN Média Móvel Integrada Autorestrada - ARIMA. Este tipo de modelo é geralmente referido como ARIMA p, d, q, com os inteiros referindo-se a As partes autorregressivas integradas e móveis do conjunto de dados, respectivamente a modelagem ARIMA pode levar em conta tendências, ciclos de sazonalidade, erros e Aspectos não estacionários de um conjunto de dados ao fazer previsões.

No comments:

Post a Comment