1.1 Modelo Estatístico

Você está aqui

Como visto na Figura 1.1 referente à "Motivação 1", é razoável supor que a relação existente entre as variáveis dureza de pistões, denotada por Y e níveis de temperatura, denotada por X, é linear. Desta forma, definimos o seguinte modelo de regressão linear simples entre Y (variável resposta) e X (variável regressora).

Definição 1.1.1

Consideremos duas variáveis X e Y. Dados n pares $ (X_1,Y_1),(X_2,Y_2),...,(X_n,Y_n) $, se Y é função linear de X, pode-se estabelecer uma regressão linear simples cujo modelo estatístico é 


\[Y_i=\beta_0+\beta_1 x_i+\varepsilon_i,~~~\mbox{para }~i=1,\ldots,n,~~~~~(1.1.1)\]

em que substituímos $ X_i $ por $ x_i $ uma vez que $ X_i $ é uma variável determinística (constante conhecida).

Neste modelo,

$ Y_i $ é uma variável aleatória e representa o valor da variável resposta (variável dependente) na i-ésima observação;
$ x_i $ representa o valor da variável explicativa (variável independente, variável regressora) na i-ésima observação;
$ \epsilon_i $ é uma variável aleatória que representa o erro experimental;
$ \beta_0 $ e $ \beta_1 $ são os parâmetros do modelo, que serão estimados, e que definem a reta de regressão e
n é o tamanho da amostra.

1.1.1 Interpretação dos parâmetros do modelo

O parâmetro $ \beta_0 $ é chamado intercepto ou coeficiente linear e representa o ponto em que a reta regressora corta o eixo dos y's, quando x=0. Já o parâmetro $ \beta_1 $ representa a inclinação da reta regressora e é dito coeficiente de regressão ou coeficiente angular. Além disso, temos que para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta $ \beta_1 $ unidades. A interpretação geométrica dos parâmetros $ \beta_0 $ e $ \beta_1 $ pode ser vista na Figura 1.1.1.

Figura 1.1.1: Reta Regressora.

Um ponto negativo na Definição 1.1.1 é que o modelo de regressão linear simples não acomoda impactos de erros experimentais (variação de matéria prima), de erros de medida, entre outras inúmeras fontes de variabilidade, tornando-se inadequado nestes casos.

1.1.2 Suposições para o modelo

Ao estabelecer o modelo 1.1.1 para os dados, pressupomos que:

i) A relação matemática entre Y e X é linear;

ii) Os valores de x são fixos (ou controlados), isto é, x não é uma variável aleatória; 

iii) A média do erro é nula, ou seja, $ E(\epsilon_i)=0 $. Desta forma, segue que


$$E(Y_{i})=E(\beta_{0}+\beta_{1}x_{i}+\epsilon_{i})=\beta_{0}+\beta_{1}x_{i}+E(\epsilon_{i})=\beta_{0}+\beta_{1}x_i}$$

e portanto, a função de regressão para o modelo 1.1.1 é dada por:


$$E[Y\mid x]=\beta_{0}+\beta_{1}x$$

Note que o valor observado de $ Y_i $ está em torno do valor da função de regressão com erro experimental $ \epsilon_i $.

iv) Para um dado valor de x, a variância de $ \epsilon_i $ é sempre $ \sigma^2 $, isto é,


$$Var(\varepsilon_i)= E(\varepsilon_i^2) - [E(\varepsilon_i)]^2 = E(\varepsilon_i^2) = \sigma^2, $$

isto implica em:


$$Var(Y_i)= E[Y_i - E(Y_i|x_i)]^2 = E(\varepsilon_i^2) = \sigma^2.$$

Neste caso, dizemos que o erro é homocedástico (tem variância constante);

v) O erro de uma observação é não correlacionado com o erro de outra observação, isto é,


$$Cov(\varepsilon_i,\varepsilon_j)= E(\varepsilon_i,\varepsilon_j) - E(\varepsilon_i)E(\varepsilon_j) = E(\varepsilon_i,\varepsilon_j) = 0, \quad \text{para} \quad i \neq j;$$

Esta hipótese não implica que os erros sejam independentes. Se a distribuição dos erros for normal,  esta hipótese é equivalente a independência dos erros.

vi) Frequentemente, supomos que os erros tem distribuição Normal.

Desta forma, combinando (iii), (iv) e (vi) temos que $ \varepsilon_i \sim N(0;\,\sigma^2) $. Como $ Y_i $ é a soma de um termo constante, $ \beta_{0}+\beta_{1}x_{i} $, com um termo aleatório, $ \epsilon_{i} $, segue que $ Y_i \sim N(\beta_0 + \beta_1 x_i;\,\sigma^2). $ Além disso, por (v) e (vi) temos que $ Y_i $ e $ Y_j $ são independentes. A suposição de normalidade é necessária para a elaboração dos testes de hipóteses e obtenção de intervalos de confiança.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]