1.1 Modelo Estatístico

Você está aqui

Como visto na Figura 1.1 referente à "Motivação 1", é razoável supor que a relação existente entre as variáveis dureza de pistões, denotada por Y e níveis de temperatura, denotada por X, é linear. Desta forma, definimos o seguinte modelo de regressão linear simples entre Y (variável resposta) e X (variável regressora).

Definição 1.1.1

Consideremos duas variáveis X e Y. Dados n pares $(X_1,Y_1),(X_2,Y_2),...,(X_n,Y_n)$, se Y é função linear de X, pode-se estabelecer uma regressão linear simples cujo modelo estatístico é 

\[Y_i=\beta_0+\beta_1 x_i+\varepsilon_i,~~~\mbox{para }~i=1,\ldots,n,~~~~~(1.1.1)\]

em que substituímos $X_i$ por $x_i$ uma vez que $X_i$ é uma variável determinística (constante conhecida).

Neste modelo,

$Y_i$ é uma variável aleatória e representa o valor da variável resposta (variável dependente) na i-ésima observação;
$x_i$ representa o valor da variável explicativa (variável independente, variável regressora) na i-ésima observação;
$\epsilon_i$ é uma variável aleatória que representa o erro experimental;
$\beta_0$ e $\beta_1$ são os parâmetros do modelo, que serão estimados, e que definem a reta de regressão e
n é o tamanho da amostra.

1.1.1 Interpretação dos parâmetros do modelo

O parâmetro $\beta_0$ é chamado intercepto ou coeficiente linear e representa o ponto em que a reta regressora corta o eixo dos y's, quando x=0. Já o parâmetro $\beta_1$ representa a inclinação da reta regressora e é dito coeficiente de regressão ou coeficiente angular. Além disso, temos que para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta $\beta_1$ unidades. A interpretação geométrica dos parâmetros $\beta_0$ e $\beta_1$ pode ser vista na Figura 1.1.1.

Figura 1.1.1: Reta Regressora.

Um ponto negativo na Definição 1.1.1 é que o modelo de regressão linear simples não acomoda impactos de erros experimentais (variação de matéria prima), de erros de medida, entre outras inúmeras fontes de variabilidade, tornando-se inadequado nestes casos.

1.1.2 Suposições para o modelo

Ao estabelecer o modelo 1.1.1 para os dados, pressupomos que:

i) A relação matemática entre Y e X é linear;

ii) Os valores de x são fixos (ou controlados), isto é, x não é uma variável aleatória; 

iii) A média do erro é nula, ou seja, $E(\epsilon_i)=0$. Desta forma, segue que

$$E(Y_{i})=E(\beta_{0}+\beta_{1}x_{i}+\epsilon_{i})=\beta_{0}+\beta_{1}x_{i}+E(\epsilon_{i})=\beta_{0}+\beta_{1}x_i}$$

e portanto, a função de regressão para o modelo 1.1.1 é dada por:

$$E[Y\mid x]=\beta_{0}+\beta_{1}x$$

Note que o valor observado de $Y_i$ está em torno do valor da função de regressão com erro experimental $\epsilon_i$.

iv) Para um dado valor de x, a variância de $\epsilon_i$ é sempre $\sigma^2$, isto é,

$$Var(\varepsilon_i)= E(\varepsilon_i^2) - [E(\varepsilon_i)]^2 = E(\varepsilon_i^2) = \sigma^2, $$

isto implica em:

$$Var(Y_i)= E[Y_i - E(Y_i|x_i)]^2 = E(\varepsilon_i^2) = \sigma^2.$$

Neste caso, dizemos que o erro é homocedástico (tem variância constante);

v) O erro de uma observação é não correlacionado com o erro de outra observação, isto é,

$$Cov(\varepsilon_i,\varepsilon_j)= E(\varepsilon_i,\varepsilon_j) - E(\varepsilon_i)E(\varepsilon_j) = E(\varepsilon_i,\varepsilon_j) = 0, \quad \text{para} \quad i \neq j;$$ Esta hipótese não implica que os erros sejam independentes. Se a distribuição dos erros for normal,  esta hipótese é equivalente a independência dos erros.

vi) Frequentemente, supomos que os erros tem distribuição Normal.

Desta forma, combinando (iii), (iv) e (vi) temos que $\varepsilon_i \sim N(0;\,\sigma^2)$. Como $Y_i$ é a soma de um termo constante, $\beta_{0}+\beta_{1}x_{i}$, com um termo aleatório, $\epsilon_{i}$, segue que $Y_i \sim N(\beta_0 + \beta_1 x_i;\,\sigma^2).$ Além disso, por (v) e (vi) temos que $Y_i$ e $Y_j$ são independentes. A suposição de normalidade é necessária para a elaboração dos testes de hipóteses e obtenção de intervalos de confiança.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]