4.6 - Estimação de Modelos ARIMA

Identificada a ordem de um modelo ARIMA para uma série temporal precisamos agora estimar os parâmetros deste modelo. Para isso, podemos utilizar método dos momentos, estimadores de mínimos quadrados e estimadores máxima verossimelhança.

Considere um modelo ARIMA(p,d,q) e coloquemos seus p+q+1 parâmetros no vetor $\xi = (\phi, \theta, \sigma^2_a)$, onde $\phi = (\phi_1, \phi_2, \hdots, \phi_p)$, $\theta = (\theta_1, \theta_2, \hdots, \theta_q)$. Quando d $\textgreater$ 0 supomos $\mu = 0$, caso contrário precisamos considerar $\mu$ como um parâmetro e estima-lo, então teríamos p+q+2 parâmetros a serem estimados.

Dado as N observações, $X_1, \hdots, X_n$, consideramos a função de verossimilhança $L(\xi | X_1, \hdots, X_n)$ como uma função de $\xi$, então queremos encontrar os valores de $\xi$ que minimizam $L$ ou $l = log(L)$.

Para determinar o EMV trabalharemos com a suposição que o processo $a_t$ é normal, ou seja, para cada t, temos $a_t \sim N(0, \sigma_a^2)$, nestas considerações os EMV serão aproximadamente estimadores de mínimos quadrados (EMQ).

Inicialmente, tomamos d diferenças na série para alcançarmos estacionariedade, ficamos com n = N - d observações denotadas por $W_1, \hdots, W_n$, onde $W_t = \Delta^dZ_t$, resultando em um modelo ARMA(p,q) estacionário e invertível, então escrevemos

$$ a_t = \~{W} - \phi_t \~{W}_{t-1} - \cdots - \phi_p\~{W}_{t-p} + \theta_1a_{t-1} + \cdots + \theta_qa_{t-q}$$

onde $\~{W}_t = W_t - \mu$.

Para calcular os $a_t$ é necessário obter valores iniciais para os $\~{W}$'s e os a's. Podemos resolver esta questão através de dois métodos: Condicional, que os valores iniciais desconhecidos são substituídos por valores que supomos serem razoáveis; incondicional, em que o valores iniciais são estimados utilizando um precedimento denominado "backforecasting".

  • Procedimento Condicional

Supondo a normalidade de $a_t$, a função densidade conjunta de $a_1, \hdots, a_n$ é dada por

$$f(a_1, \hdots, a_n) = (2\pi)^{-n/2}(\sigma_a)^n exp\Bigg\{-\sum_{t=1}^n \dfrac{a_t^2}{2\sigma_a^2}\Bigg\}.$$

Suponha que são dados p valores $W_t$ e q valores $a_t$, denotados por $W_t^*$ e $a_t^*$. A função de verossimilhança é dada por

$$L(\xi|W,W^*,a^*) = (2\pi)^{-n/2}(\sigma_a)^{-n}exp\Bigg\{\dfrac{1}{2\sigma_a^2}\sum^n_{t=1}(\~{W}_t - \phi_1\~{W}_{t-1} - \cdots - \phi_p\~{W}_{t-p} + \theta_1a_{t-1} + \cdtos + \theta_qa_{t-p})^2\Bigg\}.$$

Tomando o logaritmo de L, considere $\eta = (\phi, \theta)$, temos

$$l(\xi|W,W^*,a^*) \propto -nlog(\sigma_a) - \dfrac{S(\eta|(W,W^*,a^*)}{2\sigma_a^2}$$

onde

$$S(\eta|W,W^*,a^*) = \sum_{t=1}^n a_t^2(\eta,W,W^*,a^*),$$

que é chamada de soma de quadrados (SQ) condicional.

Segue que maximizar $l(\xi|W,W^*,a^*)$ é equivalente a minimizar $S(\eta|W,W^*,a^*)$ e os estimadores de MV serão os estimadores de MQ.

  • Procedimento não Condicional

Pode ser demonstrado que o logaritmo da função de verossimilhança não condicional é dado por

$$l(\xi) \simeq -nlog(\sigma_a) - \dfrac{S(\eta)}{2\sigma_a^2}$$

em que

$$S(\eta) = S(\phi,\theta) = \sum_{t=-\infty}^n [a_t(\eta,W)]^2$$

é a soma de quadrados não condicional, com $[a_t(\eta,W)] = E(a_t|\eta,W).$

Portanto, estimadores de mínimos quadrados obtidos minimizando $S(\eta)$ serão boas aproximações para os estimadores de máxima verossimilhança.

Para calcular a soma de quadrados para um dado $\eta$, precisamos usar o procedimento chamado "backforecasting" ("previsão para o passado") para calcular $[W_{-j}]$ e $[a_{-j}]$, ou seja, gerando (prevendo) valores antes do inicio da série. Pode-se demonstrar que a chamada forma "backward" do processo fornece uma representação estacionária e invertível na qual $W_t$ é expressa somente em termos de valores futuros de $W_t$ e $e_t$, onde $e_t$ tem distribuição normal com média zero e mesma variância de $a_t$.

Desta forma, o valor $W_{-j}$ tem a mesma relação probabilística com $W_1, \hdots, W_n$ que $W_{n+j+1}$ tem com $W_n, W_{n-1}, \hdots, W_1$, ou seja, fazer previsão de antes que a série comece é equivalente a prever a série inversa.

Exemplo 4.6.1:

Considere uma série temporal $Z_1, \hdots, Z_n$, na qual identificamos um modelo ARIMA(0,1,1). Seja $W_t = \Delta Z_t$, então podemos escrever

$$a_t = W_t + \theta a_{t-1}.$$

No caso condicional, suponha $\theta = 0,7$ e iniciamos $a_t$ especificando $a_0 = 0$ e $Z_0 = 200$,  portanto podemos calcular recursivamente os valores de $a_t$. Utilizando dados hipotéticos para $Z_t$ temos

t $\bold{Z_t}$ $\bold{W_t = \Delta Z_t}$ $\bold{a_t}$
0 200   0
1 197 -3 -3,0
2 190 -7 -9,1
3 194 4 -2,4
4 189 -5 -6,7
5 187 -2 -6,7
6 192 5 0,3
7 197 5 5,2
8 201 4 7,7
9 204 3 8,4
10 202 -2 3,9

Desta forma, segue que a soma de quadrados condicional fica

$$S^*(0,7) = \sum_{t=1}^{10} a_t^2(0,7|a_0 = 0) = 357,3.$$

Séries Temporais

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]