- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Como visto na Figura 1.1 referente à "Motivação 1", é razoável supor que a relação existente entre as variáveis dureza de pistões, denotada por Y e níveis de temperatura, denotada por X, é linear. Desta forma, definimos o seguinte modelo de regressão linear simples entre Y (variável resposta) e X (variável regressora).
Consideremos duas variáveis X e Y. Dados n pares $(X_1,Y_1),(X_2,Y_2),...,(X_n,Y_n)$, se Y é função linear de X, pode-se estabelecer uma regressão linear simples cujo modelo estatístico é
\[Y_i=\beta_0+\beta_1 x_i+\varepsilon_i,~~~\mbox{para }~i=1,\ldots,n,~~~~~(1.1.1)\]
em que substituímos $X_i$ por $x_i$ uma vez que $X_i$ é uma variável determinística (constante conhecida).
Neste modelo,
$Y_i$ é uma variável aleatória e representa o valor da variável resposta (variável dependente) na i-ésima observação;
$x_i$ representa o valor da variável explicativa (variável independente, variável regressora) na i-ésima observação;
$\epsilon_i$ é uma variável aleatória que representa o erro experimental;
$\beta_0$ e $\beta_1$ são os parâmetros do modelo, que serão estimados, e que definem a reta de regressão e
n é o tamanho da amostra.
O parâmetro $\beta_0$ é chamado intercepto ou coeficiente linear e representa o ponto em que a reta regressora corta o eixo dos y's, quando x=0. Já o parâmetro $\beta_1$ representa a inclinação da reta regressora e é dito coeficiente de regressão ou coeficiente angular. Além disso, temos que para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta $\beta_1$ unidades. A interpretação geométrica dos parâmetros $\beta_0$ e $\beta_1$ pode ser vista na Figura 1.1.1.
Figura 1.1.1: Reta Regressora.
Um ponto negativo na Definição 1.1.1 é que o modelo de regressão linear simples não acomoda impactos de erros experimentais (variação de matéria prima), de erros de medida, entre outras inúmeras fontes de variabilidade, tornando-se inadequado nestes casos.
1.1.2 Suposições para o modelo
Ao estabelecer o modelo 1.1.1 para os dados, pressupomos que:
i) A relação matemática entre Y e X é linear;
ii) Os valores de x são fixos (ou controlados), isto é, x não é uma variável aleatória;
iii) A média do erro é nula, ou seja, $E(\epsilon_i)=0$. Desta forma, segue que
$$E(Y_{i})=E(\beta_{0}+\beta_{1}x_{i}+\epsilon_{i})=\beta_{0}+\beta_{1}x_{i}+E(\epsilon_{i})=\beta_{0}+\beta_{1}x_i}$$
e portanto, a função de regressão para o modelo 1.1.1 é dada por:
$$E[Y\mid x]=\beta_{0}+\beta_{1}x$$
Note que o valor observado de $Y_i$ está em torno do valor da função de regressão com erro experimental $\epsilon_i$.
iv) Para um dado valor de x, a variância de $\epsilon_i$ é sempre $\sigma^2$, isto é,
$$Var(\varepsilon_i)= E(\varepsilon_i^2) - [E(\varepsilon_i)]^2 = E(\varepsilon_i^2) = \sigma^2, $$
isto implica em:
$$Var(Y_i)= E[Y_i - E(Y_i|x_i)]^2 = E(\varepsilon_i^2) = \sigma^2.$$
Neste caso, dizemos que o erro é homocedástico (tem variância constante);
v) O erro de uma observação é não correlacionado com o erro de outra observação, isto é,
$$Cov(\varepsilon_i,\varepsilon_j)= E(\varepsilon_i,\varepsilon_j) - E(\varepsilon_i)E(\varepsilon_j) = E(\varepsilon_i,\varepsilon_j) = 0, \quad \text{para} \quad i \neq j;$$ Esta hipótese não implica que os erros sejam independentes. Se a distribuição dos erros for normal, esta hipótese é equivalente a independência dos erros.
vi) Frequentemente, supomos que os erros tem distribuição Normal.
Desta forma, combinando (iii), (iv) e (vi) temos que $\varepsilon_i \sim N(0;\,\sigma^2)$. Como $Y_i$ é a soma de um termo constante, $\beta_{0}+\beta_{1}x_{i}$, com um termo aleatório, $\epsilon_{i}$, segue que $Y_i \sim N(\beta_0 + \beta_1 x_i;\,\sigma^2).$ Além disso, por (v) e (vi) temos que $Y_i$ e $Y_j$ são independentes. A suposição de normalidade é necessária para a elaboração dos testes de hipóteses e obtenção de intervalos de confiança.
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.