- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
A identificação particular de um modelo ARIMA a ser ajustado aos dados pode ser considerado uma das fases mais críticas ao se utilizar uma modelagem ARIMA. A escolha do modelo a ser utilizado é feita principalmente com base nas autocorrelações e autocorrelações parciais estimadas, que utilizaremos para comparar com as quantidades teóricas e identificar um possível modelo para os dados.
Lembramos que a f.a.c. $\rho_j$ é estimada por
$$r_j = \dfrac{g_j}{g_0}, \quad j = 0, 1, \dots , N-1$$
onde $g_j$ é a estimativa da f.a.c.v. $\gamma_j$, dado por
$$g_j = \dfrac{1}{N}\sum_{t=1}^{N-j} [(X_t - \bar{X})(X_{t+j} - \bar{X})], \quad j = 0,1,\dots , N-1$$
sendo $\bar{X} = \dfrac{1}{N}\sum_{j=1}^{N}X_t$ a média amostral. Como as funções de auto correlação são funções pares, temos que $g_{-j} = g_j$ e $r_{-j} = r_{j}$.
Os modelos AR(p), MA(q) e ARMA(p,q) apresentam f.a.c. com características especiais:
i) um processo AR(p) tem f.a.c. infinita em extensão que decai de acordo com exponenciais e/ou senoides amortecidas;
ii) um processo MA(q) tem f.a.c. finita, no sentido que ela apresenta um corte após a defasagem q;
iii) um processo ARMA(p,q) tem f.a.c. infinita que decai de acordo com exponencias e/ou senoides amortecidas após a defasagem (q-p).
Assim, a partir das f.a.c. estimadas, tentamos identificar um padrão que se comporte teoricamente com algum modelo. Em particular, a f.a.c. estimada é útil para identificar modelos MA por causa da característica (ii) e não são muito úteis na identificação de modelos ARMA, que possuem f.a.c. complicadas.
Uma outra ferramenta utilizada no processo de identificação do modelo é a função de autocorrelação parcial(f.a.c.p.). Esta medida corresponde a correlação de $X_t$ e $X_{t-k}$ removendo o efeito das observações $X_{t-1}, X_{t-2}, \dots , X_{t-k+1}$ e é denotada por $\phi_{kk}$, ou seja
$$\phi_{kk} = Corr(X_t, X_{t-l}/X_{t-1}, X_{t-2},\hdots,X_{t-k+1})$$
Um método geral para encontrar a f.a.c.p. para um processo estacionário com f.a.c. $\rho_k$ é utilizando as equações de Yule-Walker, isto é, para um certo k temos
$$\rho_j = \phi_{k1}\rho_{j-1} + \phi{k2}\rho_1 + \cdots + \phi_{kk}\rho{j-1}, \quad j = 1, 2, \hdots , k$$
Desenvolvendo a equação temos
$$\rho_1 = \phi_{k1} + \phi_{k2}\rho_1 + \cdots + \phi_{kk}\rho_{j-1}$$
$$\rho_2 = \phi_{k1}\rho_1 + \phi_{k2} + \cdots + \phi_{kk}\rho_{j-2}$$
$$\quad \vdots \quad = \quad \vdots$$
$$\rho_j = \phi_{k1}\rho_{j-1} + \phi_{k2}\rho_{j-2} + \cdots + \phi_{kk}$$
Resolvendo as equações acima sucessivamente para k = 1, 2, ..., obtemos $\phi_{kk}$ da seguinte maneira
$\phi_{11} = \rho_1$
$\phi_{22} = \dfrac{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \\ \ \rho_1 \ \rho_2 \ \end{array} \right \Bigg{|}}{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \\ \ \rho_1 \ 1 \ \end{array} \Bigg{|}}$ $\Longrightarrow \quad \phi_{22} = \dfrac{\rho_2 - \rho_1^2}{1 - \rho_1^2}$
$\phi_{33} = \dfrac{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \rho_1 \ \\ \ \rho_1 \ 1 \ \rho_2 \ \\ \ \rho_2 \ \rho_1 \ \rho_3 \ \end{array} \right \Bigg{|}}{\Bigg{|} \left \begin{array}{} \ 1 \ \rho_1 \ \rho_2 \ \\ \ \rho_1 \ 1 \ \rho_1 \ \\ \ \rho_2 \ \rho_1 \ 1 \ \end{array} \Bigg{|}}$ $\Longrightarrow \quad \phi_{33} = \dfrac{\rho_3 + \rho_2^2\rho_1 + \rho_1^3 - 2\rho_1\rho_2 - \rho_1^2\rho_3}{1 - 2\rho_1^2 - \rho_2^2}$
em geral temos
$$\phi_{kk} = \dfrac{|P^*_k|}{|P_k|}$$
onde $P_k$ é a matriz de autocorrelação, e $P^*_k$ é a matriz $P_k$ com a ultima coluna substituída pelo vetor de autocorrelação.
Nos processos AR, MA e ARMA temos as seguintes f.a.c.p. teóricas:
i) em um processo AR(P) a f.a.c.p é da forma: $\left \{ \begin{array} \ \phi_{kk} \not= 0, \quad se \ k \le p \\ \phi_{kk} = 0, \quad se \ k \ \textgreater \ p \end{array} \right$;
ii)em um processo MA(q) a f.a.c.p. se comporta de maneira similar à f.a.c. de um processo AR(p), isto é, composta por exponenciais e\ou senoides amortecidas;
iii)um processo ARMA(p,q) tem f.a.c.p. que se comporta como a f.a.c.p. de um processo MA puro.
Devido aos fatores acima, segue que a f.a.c.p. é útil para identificar modelos AR puros, não sendo tão útil para identificar modelos MA e ARMA.
Uma maneira simples de estimar as f.a.c.p. de um processo consistem em substituir nas equações de Yullie-Walker as f.a.c. por sua estimativas
$$r_j = \hat{\phi}_{k1}r_{j-1} + \cdots + \hat{\phi}_{kk}r_{j-k}, \quad j=1,\hdots,k,$$
e resolver estas equações para k=1, 2, 3,....
Observe na tabela abaixo uma estimativa das f.a.c.p. dos processos AR(1), MA(1) e ARMA(1,1), de séries temporais simuladas computacionalmente com 100 observações cada.
j | AR(1) | MA(1) | ARMA(1,1) |
1 | -0,4514 | 0,3828 | -0,0187 |
2 | -0,0640 | -0,2738 | -0,0833 |
3 | -0,0460 | -0,0710 | -0,1950 |
4 | -0,0305 | -0,1540 | 0,1094 |
5 | 0,0144 | -0,0599 | -0,0949 |
6 | -0,0425 | -0,0412 | 0,0537 |
7 | 0,0939 | -0,0412 | 0,0708 |
8 | -0,0470 | -0,1616 | -0,1851 |
9 | -0,0256 | 0,0528 | 0,1552 |
10 | 0,0080 | -0,0296 | 0,0474 |
11 | -0,0754 | -0,0305 | -0,1351 |
12 | 0,0846 | -0,1096 | -0,0056 |
13 | 0,0457 | -0,0883 | 0,0532 |
14 | 0,0330 | 0,0115 | -0,0495 |
15 | -0,0132 | 0,0761 | 0,0547 |
Representadas graficamente por:
Após selecionarmos possíveis modelos ARIMA para os dados observados, identificamos o melhor modelo possível utilizando os critérios AIC e BIC. Queremos encontrar as ordens k e l que minimizam os critérios AIC e BIC para a determinação das ordens p e q do modelo, isto é, queremos minimizar
$$AIC(k,l) = -2ln(\hat{\sigma}^2_{k,l}) + 2(k+l+2)$$
$$BIC(k,l) = -2ln(\hat{\sigma}^2_{k,l}) + (k+l)\dfrac{lnN}{N}$$
onde, N é o número de observações e $\hat{\sigma}_{k,l}^2$ é o estimador de máxima verossimilhança da variância residual do modelo ARMA(k,l).
Considere os retornos das ações da Petrobras durante o período de 10/01/2008 a 10/02/2008. Construímos uma série temporal utilizando a média dos retornos em cada hora por dia, com um total de 110 observações. Vamos identificar um modelo ARIMA para esta série. Os dados para este exemplo podem ser baixados clicando aqui.
j | $X_j$ | j | $X_j$ | j | $X_j$ | j | $X_j$ | j | $X_j$ |
1 | -0,0012 | 23 | 0,0004 | 45 | -0,0011 | 67 | 0,0106 | 89 | -0,0036 |
2 | 0,0006 | 24 | -0,0035 | 46 | -0,0149 | 68 | -0,0025 | 90 | 0,0001 |
3 | -0,0059 | 25 | 0,0019 | 47 | 0,0003 | 69 | 0,0058 | 91 | -0,0030 |
4 | -0,0054 | 26 | -0,0107 | 48 | 0,0012 | 70 | -0,0088 | 92 | -0,0020 |
5 | -0,0039 | 27 | 0,0042 | 49 | -0,0148 | 71 | -0,0053 | 93 | -0,0154 |
6 | -0,0222 | 28 | 0,0030 | 50 | 0,0006 | 72 | -0,0242 | 94 | 0,0090 |
7 | -0,0017 | 29 | -0,0150 | 51 | 0,0136 | 73 | -0,0089 | 95 | 0,0083 |
8 | 0,0096 | 30 | -0,0215 | 52 | -0,0152 | 74 | -0,0133 | 96 | 0,0035 |
9 | 0,0102 | 31 | -0,0029 | 53 | -0,0113 | 75 | -0,0075 | 97 | -0,0038 |
10 | -0,0068 | 32 | -0,0575 | 54 | 0,0037 | 76 | -0,0037 | 98 | -0,0025 |
11 | 0,0105 | 33 | 0,0045 | 55 | 0,0282 | 77 | 0,0065 | 99 | 0,0342 |
12 | 0,0100 | 34 | -0,0043 | 56 | -0,0008 | 78 | -0,0107 | 100 | -0,0043 |
13 | 0,0079 | 35 | -0,0077 | 57 | -0,0192 | 79 | -0,0017 | 101 | 0,0567 |
14 | 0,0069 | 36 | 0,0186 | 58 | 0,0060 | 80 | -0,0064 | 102 | 0,0033 |
15 | 0,0097 | 37 | 0,0039 | 59 | 0,0077 | 81 | 0,0120 | 103 | 0,0012 |
16 | -0,0009 | 38 | 0,0269 | 60 | -0,0092 | 82 | 0,0021 | 104 | 0,0053 |
17 | -0,0056 | 39 | -0,0101 | 61 | -0,0010 | 83 | -0,0031 | 105 | 0,0066 |
18 | -0,0011 | 40 | -0,0010 | 62 | -0,0003 | 84 | -0,0047 | 106 | -0,0082 |
19 | -0,0035 | 41 | 0,0043 | 63 | 0,0048 | 85 | 0,0014 | 107 | 0,0192 |
20 | -0,0313 | 42 | 0,0099 | 64 | -0,0017 | 86 | -0,0022 | 108 | 0,0020 |
21 | 0,0094 | 43 | 0,0003 | 65 | 0,0008 | 87 | -0,0008 | 109 | 0,0122 |
22 | -0,0045 | 44 | 0,0022 | 66 | -0,0023 | 88 | 0,0090 | 110 | 0,0032 |
Visualizando o gráfico da série, podemos identificar alguns pequenos ciclos repetitivos o que torna a série não estacionária e analisando a f.a.c. estimada da série não conseguimos identificar um modelo apropriado para o ajuste, então tomamos uma diferença na série e analisamos novamente as f.a.c. e f.a.c.p estimadas.
A análise das f.a.c. e f.a.c.p. estimadas sugerem um modelo de médias móveis MA(p) na série diferenciada. Calculamos então os critérios de informação AIC e BIC para confirmar um modelo do tipo ARIMA(0,1,p).
p | AIC | BIC |
1 | -637,4155 | -632,0145 |
2 | -635,4466 | -627,3451 |
3 | -633,7607 | -622,9587 |
4 | -632,4030 | -618,9006 |
5 | -630,6355 | -614,4326 |
6 | -628,6938 | -609,7904 |
7 | -627,4892 | -605,8854 |
8 | -627,2289 | -602,9245 |
9 | -627,2354 | -600,2306 |
10 | -626,7906 | -597,0853 |
Note que entre as 10 primeiras ordens o menor valor entre os critérios é para ordem p = 1, portanto, concluímos que um modelos ideal para o conjunto de dados é um ARIMA(0,1,1).
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.