4.5 - Identificação de Modelos ARIMA

Você está aqui

A identificação particular de um modelo ARIMA a ser ajustado aos dados pode ser considerado uma das fases mais críticas ao se utilizar uma modelagem ARIMA. A escolha do modelo a ser utilizado é feita principalmente com base nas autocorrelações e autocorrelações parciais estimadas, que utilizaremos para comparar com as quantidades teóricas e identificar um possível modelo para os dados.

Lembramos que a f.a.c. $ \rho_j $ é estimada por


$$r_j = \dfrac{g_j}{g_0}, \quad j = 0, 1, \dots , N-1$$

onde $ g_j $ é a estimativa da f.a.c.v. $ \gamma_j $, dado por


$$g_j = \dfrac{1}{N}\sum_{t=1}^{N-j} [(X_t - \bar{X})(X_{t+j} - \bar{X})], \quad j = 0,1,\dots , N-1$$

sendo $ \bar{X} = \dfrac{1}{N}\sum_{j=1}^{N}X_t $ a média amostral. Como as funções de auto correlação são funções pares, temos que $ g_{-j} = g_j $ e $ r_{-j} = r_{j} $.

Os modelos AR(p), MA(q) e ARMA(p,q) apresentam f.a.c. com características especiais:

i) um processo AR(p) tem f.a.c. infinita em extensão que decai de acordo com exponenciais e/ou senoides amortecidas;

ii) um processo MA(q) tem f.a.c. finita, no sentido que ela apresenta um corte após a defasagem q;

iii) um processo ARMA(p,q) tem f.a.c. infinita que decai de acordo com exponencias e/ou senoides amortecidas após a defasagem (q-p).

Assim, a partir das f.a.c. estimadas, tentamos identificar um padrão que se comporte teoricamente com algum modelo. Em particular, a f.a.c. estimada é útil para identificar modelos MA por causa da característica (ii) e não são muito úteis na identificação de modelos ARMA, que possuem f.a.c. complicadas.

Função de Autocorrelação Parcial (f.a.c.p.)

Uma outra ferramenta utilizada no processo de identificação do modelo é a função de autocorrelação parcial(f.a.c.p.).  Esta medida corresponde a correlação de $ X_t $ e $ X_{t-k} $ removendo o efeito das observações $ X_{t-1}, X_{t-2}, \dots , X_{t-k+1} $  e é denotada por $ \phi_{kk} $, ou seja


$$\phi_{kk} = Corr(X_t, X_{t-l}/X_{t-1}, X_{t-2},\hdots,X_{t-k+1})$$

Um método geral para encontrar a f.a.c.p. para um processo estacionário com f.a.c. $ \rho_k $ é utilizando as equações de Yule-Walker, isto é, para um certo k temos


$$\rho_j = \phi_{k1}\rho_{j-1} + \phi{k2}\rho_1 + \cdots + \phi_{kk}\rho{j-1}, \quad j = 1, 2, \hdots , k$$

Desenvolvendo a equação temos


$$\rho_1 = \phi_{k1} + \phi_{k2}\rho_1 + \cdots + \phi_{kk}\rho_{j-1}$$


$$\rho_2 = \phi_{k1}\rho_1 + \phi_{k2} + \cdots + \phi_{kk}\rho_{j-2}$$


$$\quad \vdots \quad = \quad \vdots$$


$$\rho_j = \phi_{k1}\rho_{j-1} + \phi_{k2}\rho_{j-2} + \cdots + \phi_{kk}$$

Resolvendo as equações acima sucessivamente para k = 1, 2, ..., obtemos $ \phi_{kk} $ da seguinte maneira

             $ \phi_{11} = \rho_1 $

             $ \phi_{22} = \dfrac{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \\ \ \rho_1 \ \rho_2 \ \end{array} \right \Bigg{|}}{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \\ \ \rho_1 \ 1 \ \end{array} \Bigg{|}} $      $ \Longrightarrow \quad \phi_{22} = \dfrac{\rho_2 - \rho_1^2}{1 - \rho_1^2} $ 

             $ \phi_{33} = \dfrac{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \rho_1 \ \\ \ \rho_1 \ 1 \ \rho_2 \ \\ \ \rho_2 \ \rho_1 \ \rho_3 \ \end{array} \right \Bigg{|}}{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \rho_2 \ \\ \ \rho_1 \ 1 \ \rho_1 \ \\ \ \rho_2 \ \rho_1 \ 1 \ \end{array} \Bigg{|}} $      $ \Longrightarrow \quad \phi_{33} = \dfrac{\rho_3 + \rho_2^2\rho_1 + \rho_1^3 - 2\rho_1\rho_2 - \rho_1^2\rho_3}{1 - 2\rho_1^2 - \rho_2^2} $

em geral temos


$$\phi_{kk} = \dfrac{|P^*_k|}{|P_k|}$$

onde $ P_k $ é a matriz de autocorrelação, e $ P^*_k $ é a matriz $ P_k $ com a ultima coluna substituída pelo vetor de autocorrelação.

Nos processos AR, MA e ARMA temos as seguintes f.a.c.p. teóricas:

i) em um processo AR(P) a f.a.c.p é da forma: $ \left \{ \begin{array} \ \phi_{kk} \not= 0, \quad se \ k \le p \\ \phi_{kk} = 0, \quad se \ k \ \textgreater \ p \end{array} \right $;

ii)em um processo MA(q) a f.a.c.p. se comporta de maneira similar à f.a.c. de um processo AR(p), isto é, composta por exponenciais e\ou senoides amortecidas;

iii)um processo ARMA(p,q) tem f.a.c.p. que se comporta como a f.a.c.p. de um processo MA puro.

Devido aos fatores acima, segue que a f.a.c.p. é útil para identificar modelos AR puros, não sendo tão útil para identificar modelos MA e ARMA.

Uma maneira simples de estimar as f.a.c.p. de um processo consistem em substituir nas equações de Yullie-Walker as f.a.c. por sua estimativas


$$r_j = \hat{\phi}_{k1}r_{j-1} + \cdots + \hat{\phi}_{kk}r_{j-k}, \quad j=1,\hdots,k,$$

e resolver estas equações para k=1, 2, 3,....

Exemplo 4.5.1:

Observe na tabela abaixo uma estimativa das f.a.c.p. dos processos AR(1), MA(1) e ARMA(1,1), de séries temporais simuladas computacionalmente com 100  observações cada.

j AR(1) MA(1) ARMA(1,1)
1 -0,4514 0,3828 -0,0187
2 -0,0640 -0,2738 -0,0833
3 -0,0460 -0,0710 -0,1950
4 -0,0305 -0,1540 0,1094
5 0,0144 -0,0599 -0,0949
6 -0,0425 -0,0412 0,0537
7 0,0939 -0,0412 0,0708
8 -0,0470 -0,1616 -0,1851
9 -0,0256 0,0528 0,1552
10 0,0080 -0,0296 0,0474
11 -0,0754 -0,0305 -0,1351
12 0,0846 -0,1096 -0,0056
13 0,0457 -0,0883 0,0532
14 0,0330 0,0115 -0,0495
15 -0,0132 0,0761 0,0547

Representadas graficamente por:

Critérios de informação AIC e BIC

Após selecionarmos possíveis modelos ARIMA para os dados observados, identificamos o melhor modelo possível utilizando os critérios AIC e BIC. Queremos encontrar as ordens k e l que minimizam os critérios AIC e BIC para a determinação das ordens p e q do modelo, isto é, queremos minimizar


$$AIC(k,l) = -2ln(\hat{\sigma}^2_{k,l}) + 2(k+l+2)$$


$$BIC(k,l) = -2ln(\hat{\sigma}^2_{k,l}) + (k+l)\dfrac{lnN}{N}$$

onde, N é o número de observações e $ \hat{\sigma}_{k,l}^2 $ é o estimador de máxima verossimilhança da variância residual do modelo ARMA(k,l).

Exemplo 4.5.2:

Considere os retornos das ações da Petrobras durante o período de 10/01/2008 a 10/02/2008. Construímos uma série temporal utilizando a média dos retornos em cada hora por dia, com um total de 110 observações. Vamos identificar um modelo ARIMA para esta série. Os dados para este exemplo podem ser baixados clicando aqui.

j $ X_j $ j $ X_j $ j $ X_j $ j $ X_j $ j $ X_j $
1 -0,0012 23 0,0004 45 -0,0011 67 0,0106 89 -0,0036
2 0,0006 24 -0,0035 46 -0,0149 68 -0,0025 90 0,0001
3 -0,0059 25 0,0019 47 0,0003 69 0,0058 91 -0,0030
4 -0,0054 26 -0,0107 48 0,0012 70 -0,0088 92 -0,0020
5 -0,0039 27 0,0042 49 -0,0148 71 -0,0053 93 -0,0154
6 -0,0222 28 0,0030 50 0,0006 72 -0,0242 94 0,0090
7 -0,0017 29 -0,0150 51 0,0136 73 -0,0089 95 0,0083
8 0,0096 30 -0,0215 52 -0,0152 74 -0,0133 96 0,0035
9 0,0102 31 -0,0029 53 -0,0113 75 -0,0075 97 -0,0038
10 -0,0068 32 -0,0575 54 0,0037 76 -0,0037 98 -0,0025
11 0,0105 33 0,0045 55 0,0282 77 0,0065 99 0,0342
12 0,0100 34 -0,0043 56 -0,0008 78 -0,0107 100 -0,0043
13 0,0079 35 -0,0077 57 -0,0192 79 -0,0017 101 0,0567
14 0,0069 36 0,0186 58 0,0060 80 -0,0064 102 0,0033
15 0,0097 37 0,0039 59 0,0077 81 0,0120 103 0,0012
16 -0,0009 38 0,0269 60 -0,0092 82 0,0021 104 0,0053
17 -0,0056 39 -0,0101 61 -0,0010 83 -0,0031 105 0,0066
18 -0,0011 40 -0,0010 62 -0,0003 84 -0,0047 106 -0,0082
19 -0,0035 41 0,0043 63 0,0048 85 0,0014 107 0,0192
20 -0,0313 42 0,0099 64 -0,0017 86 -0,0022 108 0,0020
21 0,0094 43 0,0003 65 0,0008 87 -0,0008 109 0,0122
22 -0,0045 44 0,0022 66 -0,0023 88 0,0090 110 0,0032

Visualizando o gráfico da série, podemos identificar alguns pequenos ciclos repetitivos o que torna a série não estacionária e analisando a f.a.c. estimada da série não conseguimos identificar um modelo apropriado para o ajuste, então tomamos uma diferença na série e analisamos novamente as f.a.c. e f.a.c.p estimadas.

A análise das f.a.c. e f.a.c.p. estimadas sugerem um modelo de médias móveis MA(p) na série diferenciada. Calculamos então os critérios de informação AIC e BIC para confirmar um modelo do tipo ARIMA(0,1,p).

p AIC BIC
1 -637,4155 -632,0145
2 -635,4466 -627,3451
3 -633,7607 -622,9587
4 -632,4030 -618,9006
5 -630,6355 -614,4326
6 -628,6938 -609,7904
7 -627,4892 -605,8854
8 -627,2289 -602,9245
9 -627,2354 -600,2306
10 -626,7906 -597,0853

Note que entre as 10 primeiras ordens o menor valor entre os critérios é para ordem p = 1, portanto, concluímos que um modelos ideal para o conjunto de dados é um ARIMA(0,1,1).

Séries Temporais

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]