4.2.1 - Método de Máxima Verossimilhança

Você está aqui

O método de máxima verossimilhança trata o problema de estimação da seguinte forma: baseado nos resultados obtidos pela amostra, devemos determinar qual a distribuição, dentre todas aquelas definidas pelos possíveis valores de seus parâmetros, com maior possibilidade de ter gerado tal amostra. Em outras palavras, se por exemplo a distribuição do tempo de falha é a de Weibull, para cada combinação diferente de $ \alpha $ e $ \delta $ tem-se diferentes distribuições de Weibull. O estimador de máxima verossimilhança escolhe aquele par de $ \alpha $ e $ \delta $ que melhor explica a amostra observada. A seguir discutiremos as idéias do método de máxima verossimilhança para conceitos matemáticos a partir dos quais será possível obter estimadores para os parâmetros. Suponha uma amostra de observações t1, ..., tn de uma certa população de interesse. Considere inicialmente que todas as observações são não-censuradas. A população é caracterizada pela sua função de densidade f(t). Por exemplo, se $ f(t) = \alpha \exp(-\alpha t) $, significa que as observações vem de uma distribuição Exponencial com um parâmetro a ser estimado. A função de verossimilhança para um parâmetro genérico é dada por


$$L(\theta)= \displaystyle\prod_{i=1}^{n}f(t_i;\theta)~~~~~~~~~~~~~~~(4.2.1.1)$$

Note na expressão (4.2.1.1) que θ pode representar um único parâmetro ou um conjunto de parâmetros. Por exemplo, no modelo Log-normal temos θ = (μ, σ). A tradução em termos matemáticos para a frase "a distribuição que melhor explica a amostra observada" é achar o valor θ que maximiza a função L(θ). Isto é, achar o valor de θ que maximiza a probabilidade da amostra observada ocorrer. A função de verossimilhança L(θ) mostra que a contribuição de cada observação não-censurada é a sua função de densidade. Por outro lado, a contribuição de cada observação censurada não é a sua função de densidade. Essas observações somente nos informam que o tempo de falha é maior do que o tempo de censura observado e portanto, sua contribuição para L(θ) é a sua função de confiabilidade R(t). As observações podem então ser divididas em dois conjuntos, as r primeiras são as não-censuradas (1, 2, ..., r), e as n - r seguintes são as censuradas (r + 1, r + 2, ..., n). Com isso, a função de verossimilhança assume a seguinte forma


$$L(\theta)=\prod_{i=1}^{r}f(t_i;\theta)\prod_{i=r+1}^{n}R(t_i;\theta)~~~~~~~~~~~~~~~(4.2.1.2)$$

A expressão (4.2.1.2) para a verossimilhança é válida para os mecanismos de censura do tipo I e II sob a suposição de que o mecanismo de censura é não-informativo, ou seja, não carrega informações sobre os parâmetros, a mesma vale também para o mecanismo do tipo aleatório. Essa suposição é razoável em estudos de durabilidade e é sempre conveniente trabalhar com o logaritmo da função de verossimilhança. Os estimadores de máxima verossimilhança são os valores θ que maximizam L(θ) ou equivalente log(L(θ)). Eles são encontrados resolvendo o sistema de equações


$$U(\theta)= \dfrac{\partial \log(L(\theta))}{\partial\theta}=0$$

 

Aplicações

Os cálculos realizados para obter os estimadores de máxima verossimilhança são ilustrados abaixo para as distribuições Exponencial e de Weibull. No caso da distribuição de Weibull, como não existem expressões fechadas para os estimadores de $ \alpha $ e $ \delta $ optamos por apresentar os passos seguidos pelo método numérico. Nesse caso, as estimativas para um conjunto de dados de durabilidade devem ser obtidas por meio de um pacote estatístico.

Daqui em diante, vamos supor que t1, ..., tn é uma amostra de observações independentes, em que t1, ..., tr são os tempos observados de falha e tr+1, ..., tn são observações censuradas.

 

Distribuição Exponencial

A função de verossimilhança para a distribuição Exponencial é obtida a partir da expressão (4.2.1.2) como


$$L(\alpha)=\left\{\prod_{i=1}^{r}f(t_i;\theta)\right\}\times\left\{\prod_{i=r+1}^{n}R(t_i;\theta)\right\}$$


$$=\left\{\prod_{i=1}^{r}\alpha \exp(-\alpha t_{i})\right\} \times\left\{\prod_{i=r+1}^{n} \exp(-\alpha t_{i})\right\}$$


$$=\alpha^{r} \exp\left(-\alpha \sum_{i=1}^{n} t_{i}\right).$$

Com isso, o logaritmo da função de verossimilhança é dado por


$$\log L(\alpha)=r \log (\alpha) - \alpha \displaystyle\sum_{i=1}^{n}t_{i}$$

Derivando essa expressão em relação a $ \alpha $, obtemos


$$\dfrac{\partial \log L(\alpha)}{\partial \alpha}=\dfrac{r}{\alpha}-\sum_{i=1}^{n}t_{i},$$

e igualando a zero, temos que a expressão do estimador de máxima verossimilhança $ \widehat{\alpha} $ é dada por


$$\widehat{\alpha}=\dfrac{r}{\sum_{i=1}^{n}t_i}.$$

O termo $ \displaystyle \sum_{i=1}^{n} t_i $ é denominado "tempo total sob teste". Observe que se todas as observações são não-censuradas, temos que a média amostral é dada por $ \widehat{\alpha}=1/\overline{t}. $

 

Distribuição de Weibull

A função de verossimilhança de $ \alpha $ e $ \delta $ para a distribuição de Weibull é dada por


$$L(\alpha,\delta)=\left\{\prod_{i=1}^{r}f(t_i;\theta)\right\}\times\left\{\prod_{i=r+1}^{n}R(t_i;\theta)\right\}$$


$$=\left\{\prod_{i=1}^{r} \dfrac{\delta}{\alpha^{\delta}} t_i^{\delta - 1} \exp \left[-\left(\dfrac{t_i}{\alpha}\right)^{\delta}\right]\right\}\times\left\{\prod_{i=r+1}^{n}\exp\left[-\left(\dfrac{t_i}{\alpha}\right)^{\delta}\right]\right\}$$


$$=\dfrac{\delta^r}{\alpha^{r\delta}}\left(\prod_{i=1}^{r}t_i\right)^{\delta-1}\exp\left\{-\dfrac{1}{\alpha^{\delta}} \sum_{i=1}^{n} t_i^{\delta}\right\}.$$

Com isso, a função de log-verossimilhança é dada por


$$\log L(\alpha,\delta)= r \log(\delta) - r \delta \log (\alpha) + (\delta-1)\sum_{i=1}^{r} \log(t_i) - \dfrac{1}{\alpha^{\delta}}\sum_{i=1}^{n} t_i^{\delta}$$

Derivando essa expressão em relação a $ \alpha $ e $ \delta $ e igualando a zero, obtemos as seguintes expressões para os estimadores de máxima verossimilhança $ \widehat{\alpha} $ e $ \widehat{\delta} $


$$\dfrac{\sum_{i=1}^{n}t_i^{\widehat{\delta}}\log(t_i)}{\sum_{i=1}^{n}t_i^{\widehat{\delta}}}- \dfrac{1}{\widehat{\delta}}-\dfrac{1}{r}\sum_{i=1}^{r}\log(t_i)=0,~~~~~~~~~~~~~~~(4.2.1.3)$$


$$\widehat{\alpha}=\left(\dfrac{1}{r}\sum_{i=1}^{n}t_i^{\widehat{\delta}}\right)^{1/\widehat{\delta}}.~~~~~~~~~~~~~~~(4.2.1.4)$$

Os estimadores de máxima verossimilhança são os valores $ \widehat{\alpha} $ e $ \widehat{\delta} $ que satisfazem as equações (4.2.1.3) e (4.2.1.4). A solução desse sistema de equações para um conjunto de dados particular deve ser obtida por meio de um método numérico. Aqui utilizaremos o método de Newton-Raphson que usa a matriz de derivadas segundas (F) da função de log-verossimilhança, sua expressão é dada por


$$\widehat{\theta}^{(k+1)}=\widehat{\theta}^{(k)}-F^{-1} (\widehat{\theta}^{(k)})U(\widehat{\theta}^{(k)}),~~~~~~~~~~~~~~~(4.2.1.5)$$

em que


$$U(\theta)=\dfrac{\partial \log L(\theta)}{\partial \theta}.$$

A expressão (4.2.1.5) é baseada na expansão de $ U(\widehat{\theta}^{(k)}) $ em série de Taylor em torno de $ \widehat{\theta}^{(k)} $. Partindo de um valor inicial $ \widehat{\theta}^{(0)}=0 $ o método atualiza esse valor a cada passo, convergindo para a solução desejada. Em geral, obtemos convergência em poucos passos com um erro relativo, em média, menor que 0,001 entre dois passos consecutivos. Observe que a matriz de derivadas F para o modelo Exponencial se reduz a um único número, dado por


$$F(\alpha)=\dfrac{\partial^2 \log L(\alpha)}{\partial \alpha^2}=\dfrac{r}{\alpha^2}-2\dfrac{\sum_{i=1}^{n}t_i}{\alpha^3}.$$

Já para o modelo de Weibull $ F(\alpha, \delta) $ é uma matriz simétrica 2x2 com os seguintes elementos


$$F_{11}(\alpha,\delta)=\dfrac{\partial^2 \log L(\alpha,\delta)}{\partial \alpha^2}$$


$$F_{22}(\alpha,\delta)=\dfrac{\partial^2 \log L(\alpha,\delta)}{\partial \delta^2}$$


$$F_{11}(\alpha,\delta)=F_{21}(\alpha,\delta)=\dfrac{\partial^2 \log L(\alpha,\delta)}{\partial \alpha \partial \delta}$$

 

Intervalos de Confiança para os parâmetros

O método de máxima verossimilhança foi usado para obter estimadores para os parâmetros do modelo. Esses valores são chamados de estimadores pontuais. Esse método também permite a construção de intervalos de confiança para os parâmetros. Isso é feito a partir das propriedades para grandes amostras desses estimadores. As justificativas matemáticas dessas propriedades são bastante complexas e nesse texto apresentaremos apenas as propriedades que são suficientes para os objetivos propostos. A propriedade ou resultado mais importante diz respeito à precisão do estimador de máxima verossimilhança e estabelece que


$$Var(\widehat{\theta}) \approx -[E(F(\theta))]^{-1}$$

Ou seja, isso significa que a matriz de variâncias-covariâncias do estimador de máxima verossimilhança é aproximadamente o negativo da inversa da matriz de segundas derivadas de log(L(θ)) esperada. Nas situações em que a esperança é impossível ou difícil de ser calculada, usa-se simplesmente -(F-1(θ)), em que F(θ) é a matriz de segundas derivadas de log(L(θ)). Os elementos da diagonal principal são as variâncias dos estimadores e os outros suas respectivas covariâncias. Geralmente Var(θ) depende de θ. Uma estimativa para Var(θ) é então obtida substituindo θ por $ \widehat{\theta} $. Na construção de intervalos de confiança é necessário ter uma estimativa para o erro-padrão de $ \widehat{\theta}=\sqrt{Var(\widehat{\theta})}. $ No caso particular em que θ é um escalar, um intervalo de $ (1-\alpha)100\% $ de confiança para θ é


$$\widehat{\theta} \pm Z_{\alpha/2}\sqrt{Var(\widehat{\theta})}.$$

Por exemplo, um intervalo de 95% de confiança para o parâmetro do modelo exponencial é dado por


$$\alpha \pm 1.96 \times \sqrt{\dfrac{\widehat{\alpha}^2}{r}}$$

pois,


$$E \left[\dfrac{r}{\alpha^2}-\dfrac{-2 \sum_{i=1}^{n}t_i}{\alpha^3} \right]=\dfrac{-r}{\alpha^2}$$

No caso em que θ é um vetor de parâmetros, um intervalo de confiança pode ser construído para cada parâmetro separadamente. Basta obter uma estimativa para o erro-padrão a partir da matriz de variância-covariância $ Var(\widehat{\theta}). $ Consideremos agora $ \theta=(\delta, \alpha) $ como no modelo de Weibull. Algumas vezes o interesse pode ser estimar uma função dos parâmetros $ \phi = g(\alpha ,\delta), $ por exemplo a mediana da distribuição de Weibull, $ t_{0,5} = \alpha[-\log(1 - 0,5 )]^{1/\delta}. $ O estimador de máxima verossimilhança $ \phi $ é $ \widehat{\phi}=g(\widehat{\alpha},\widehat{\delta}), $ ou seja, para estimar $ \phi=g(\alpha, \delta) $ basta substituir $ \alpha $ e $ \delta $ por seus respectivos estimadores de máxima verossimilhança. Essa é outra propriedade importante do estimador de máxima verossimilhança. Se além de estimar $ \phi $ existe interesse em construir um intervalo de confiança, então é necessário obter uma estimativa para o erro padrão de $ \phi. $ Isso é feito usando o Método Delta que é descrito a seguir.

Considere inicialmente que θ é um escalar e desejamos avaliar $ Var[g(\widehat{\theta})]. $ Expandindo $ g(\widehat{\theta}) $ em torno de


$$E[\widehat{\theta}] =\theta$$

e ignorando os termos superiores ao de primeira ordem temos


$$g(\widehat{\theta})=g(\theta)+(\widehat{\theta}-\theta)\dfrac{\partial g(\theta)}{\partial\theta}$$

assim, obtemos que


$$Var(g(\widehat{\theta}))=Var(\widehat{\theta})\left(\dfrac{\partial g(\theta)}{\partial(\theta)}\right)^2$$

A versão multivariada do método delta será necessária para o caso das distribuições que envolvem mais de um parâmetro. Suponha, como anteriormente, que $ \theta=(\delta, \alpha) $ e que estamos interessados em $ \phi=g(\alpha, \delta). $ Procedendo de forma similar temos que


$$Var(\widehat{\phi})=Var(\widehat{\alpha})\left(\dfrac{\partial \phi}{\partial \alpha}\right)^2+Cov(\widehat{\alpha},\widehat{\delta})\dfrac{\partial\phi\partial\phi}{\partial\alpha \partial\delta}+Var(\widehat{\delta})\left(\dfrac{\partial \phi}{\partial\delta}\right)^2.$$

 

Confiabilidade

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]