4.6 - Estimação de Modelos ARIMA

Identificada a ordem de um modelo ARIMA para uma série temporal precisamos agora estimar os parâmetros deste modelo. Para isso, podemos utilizar método dos momentos, estimadores de mínimos quadrados e estimadores máxima verossimelhança.

Considere um modelo ARIMA(p,d,q) e coloquemos seus p+q+1 parâmetros no vetor $ \xi = (\phi, \theta, \sigma^2_a) $, onde $ \phi = (\phi_1, \phi_2, \hdots, \phi_p) $, $ \theta = (\theta_1, \theta_2, \hdots, \theta_q) $. Quando d $ \textgreater $ 0 supomos $ \mu = 0 $, caso contrário precisamos considerar $ \mu $ como um parâmetro e estima-lo, então teríamos p+q+2 parâmetros a serem estimados.

Dado as N observações, $ X_1, \hdots, X_n $, consideramos a função de verossimilhança $ L(\xi | X_1, \hdots, X_n) $ como uma função de $ \xi $, então queremos encontrar os valores de $ \xi $ que minimizam $ L $ ou $ l = log(L) $.

Para determinar o EMV trabalharemos com a suposição que o processo $ a_t $ é normal, ou seja, para cada t, temos $ a_t \sim N(0, \sigma_a^2) $, nestas considerações os EMV serão aproximadamente estimadores de mínimos quadrados (EMQ).

Inicialmente, tomamos d diferenças na série para alcançarmos estacionariedade, ficamos com n = N - d observações denotadas por $ W_1, \hdots, W_n $, onde $ W_t = \Delta^dZ_t $, resultando em um modelo ARMA(p,q) estacionário e invertível, então escrevemos

$$ a_t = \~{W} - \phi_t \~{W}_{t-1} - \cdots - \phi_p\~{W}_{t-p} + \theta_1a_{t-1} + \cdots + \theta_qa_{t-q}$$

onde $ \~{W}_t = W_t - \mu $.

Para calcular os $ a_t $ é necessário obter valores iniciais para os $ \~{W} $'s e os a's. Podemos resolver esta questão através de dois métodos: Condicional, que os valores iniciais desconhecidos são substituídos por valores que supomos serem razoáveis; incondicional, em que o valores iniciais são estimados utilizando um precedimento denominado "backforecasting".

  • Procedimento Condicional

Supondo a normalidade de $ a_t $, a função densidade conjunta de $ a_1, \hdots, a_n $ é dada por

$$f(a_1, \hdots, a_n) = (2\pi)^{-n/2}(\sigma_a)^n exp\Bigg\{-\sum_{t=1}^n \dfrac{a_t^2}{2\sigma_a^2}\Bigg\}.$$

Suponha que são dados p valores $ W_t $ e q valores $ a_t $, denotados por $ W_t^* $ e $ a_t^* $. A função de verossimilhança é dada por

$$L(\xi|W,W^*,a^*) = (2\pi)^{-n/2}(\sigma_a)^{-n}exp\Bigg\{\dfrac{1}{2\sigma_a^2}\sum^n_{t=1}(\~{W}_t - \phi_1\~{W}_{t-1} - \cdots - \phi_p\~{W}_{t-p} + \theta_1a_{t-1} + \cdtos + \theta_qa_{t-p})^2\Bigg\}.$$

Tomando o logaritmo de L, considere $ \eta = (\phi, \theta) $, temos

$$l(\xi|W,W^*,a^*) \propto -nlog(\sigma_a) - \dfrac{S(\eta|(W,W^*,a^*)}{2\sigma_a^2}$$

onde

$$S(\eta|W,W^*,a^*) = \sum_{t=1}^n a_t^2(\eta,W,W^*,a^*),$$

que é chamada de soma de quadrados (SQ) condicional.

Segue que maximizar $ l(\xi|W,W^*,a^*) $ é equivalente a minimizar $ S(\eta|W,W^*,a^*) $ e os estimadores de MV serão os estimadores de MQ.

  • Procedimento não Condicional

Pode ser demonstrado que o logaritmo da função de verossimilhança não condicional é dado por

$$l(\xi) \simeq -nlog(\sigma_a) - \dfrac{S(\eta)}{2\sigma_a^2}$$

em que

$$S(\eta) = S(\phi,\theta) = \sum_{t=-\infty}^n [a_t(\eta,W)]^2$$

é a soma de quadrados não condicional, com $ [a_t(\eta,W)] = E(a_t|\eta,W). $

Portanto, estimadores de mínimos quadrados obtidos minimizando $ S(\eta) $ serão boas aproximações para os estimadores de máxima verossimilhança.

Para calcular a soma de quadrados para um dado $ \eta $, precisamos usar o procedimento chamado "backforecasting" ("previsão para o passado") para calcular $ [W_{-j}] $ e $ [a_{-j}] $, ou seja, gerando (prevendo) valores antes do inicio da série. Pode-se demonstrar que a chamada forma "backward" do processo fornece uma representação estacionária e invertível na qual $ W_t $ é expressa somente em termos de valores futuros de $ W_t $ e $ e_t $, onde $ e_t $ tem distribuição normal com média zero e mesma variância de $ a_t $.

Desta forma, o valor $ W_{-j} $ tem a mesma relação probabilística com $ W_1, \hdots, W_n $ que $ W_{n+j+1} $ tem com $ W_n, W_{n-1}, \hdots, W_1 $, ou seja, fazer previsão de antes que a série comece é equivalente a prever a série inversa.

Exemplo 4.6.1:

Considere uma série temporal $ Z_1, \hdots, Z_n $, na qual identificamos um modelo ARIMA(0,1,1). Seja $ W_t = \Delta Z_t $, então podemos escrever

$$a_t = W_t + \theta a_{t-1}.$$

No caso condicional, suponha $ \theta = 0,7 $ e iniciamos $ a_t $ especificando $ a_0 = 0 $ e $ Z_0 = 200 $,  portanto podemos calcular recursivamente os valores de $ a_t $. Utilizando dados hipotéticos para $ Z_t $ temos

t $ \bold{Z_t} $ $ \bold{W_t = \Delta Z_t} $ $ \bold{a_t} $
0 200   0
1 197 -3 -3,0
2 190 -7 -9,1
3 194 4 -2,4
4 189 -5 -6,7
5 187 -2 -6,7
6 192 5 0,3
7 197 5 5,2
8 201 4 7,7
9 204 3 8,4
10 202 -2 3,9

Desta forma, segue que a soma de quadrados condicional fica

$$S^*(0,7) = \sum_{t=1}^{10} a_t^2(0,7|a_0 = 0) = 357,3.$$

Séries Temporais

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]