- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Nesta seção vamos descrever o modelo estatístico para a motivação, para isto é razoável supor que a relação existente entre a variável Área (Y) e níveis de Concentração (X) é linear. Desta forma, definimos o seguinte modelo de regressão linear simples entre Y (variável resposta) e X (variável regressora).
Consideramos duas variáveis Concentração e Área, neste caso, podemos estabelecer uma regressão linear simples cujo modelo estatístico é
$$Y_{ij}=\beta_0+\beta_1~x_{i}+\varepsilon_{ij}\quad i=1,\cdots, n;$$
em que,
Pelo método dos mínimos quadrados, obtemos
$$\hat{\beta}_1=\frac{S_{xy}}{S_{xx}}\quad e\quad\hat{\beta}_0=\overline{y}-\hat{\beta}_1\overline{x}$$
em que,
para mais detalhes consulte estimação dos parâmetros do modelo.
Voltando à Motivação, vamos calcular as estimativas dos parâmetros $\beta_{0}$ e $\beta_{1}$ pelo Método dos Mínimos Quadrados.
n | Concentracao | Area | Conc2 | Area2 | Conc x Area |
1 | 0,05 | 0,00000405 | 0,0025 | 1,64E-11 | 2,02E-07 |
2 | 0,05 | 0,00000312 | 0,0025 | 9,74E-12 | 1,56E-07 |
3 | 0,05 | 0,00000211 | 0,0025 | 4,43E-12 | 1,05E-07 |
4 | 0,1 | 0,0000286 | 0,01 | 8,21E-10 | 2,86E-06 |
5 | 0,1 | 0,0000238 | 0,01 | 5,67E-10 | 2,38E-06 |
6 | 0,1 | 0,0000308 | 0,01 | 9,48E-10 | 3,08E-06 |
7 | 0,5 | 0,0001913 | 0,25 | 3,66E-08 | 9,56E-05 |
8 | 0,5 | 0,0001936 | 0,25 | 3,75E-08 | 9,68E-05 |
9 | 0,5 | 0,0002006 | 0,25 | 4,03E-08 | 1,00E-04 |
10 | 1 | 0,0004883 | 1 | 2,38E-07 | 4,88E-04 |
11 | 1 | 0,0004761 | 1 | 2,27E-07 | 4,76E-04 |
12 | 1 | 0,0004851 | 1 | 2,35E-07 | 4,85E-04 |
13 | 2 | 0,0009072 | 4 | 8,23E-07 | 1,81E-03 |
14 | 2 | 0,0009246 | 4 | 8,55E-07 | 1,85E-03 |
15 | 2 | 0,0009008 | 4 | 8,12E-07 | 1,80E-03 |
Soma | 10,95 | 0,005 | 15,788 | 0,00000331 | 0,007 |
Média | 0,73 | 0,0003 |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
As médias amostrais das variáveis Concentração (X) e Área (Y) são, respectivamente,
$$\overline{x}=\dfrac{1}{15}\sum_{i=1}^{15}x_i=0,73\quad\text{e}\quad\overline{y}=\dfrac{1}{15}\sum_{i=1}^{15} y_i=0,039.$$
Além disso, na Tabela, apresentamos os valores de $x^2$, $y^2$ e $xy$ para cada observação $i=1,\ldots,15$.
Da tabela calculamos as somas de quadrados da seguinte forma:
$$S_{xx}=\sum^n_{i=1}x_i^2-n\overline{x}^2=15,788-15\times 0,73^2=7,794$$
$$S_{yy}=\sum^n_{i=1}y_i^2-n\overline{y}^2= 0,00000331 - 15 \times 0,73^2=1,73\times 10^{-6}$$
$$S_{xy}=\sum^n_{i=1}x_i y_i-n\overline{x}\overline{y}=0,007 - 15 \times 0,73 \times 0,0003=0,0036.$$
Logo, as estimativas dos parâmetros $\beta_{1}$ e $\beta_{0}$ são, respectivamente
$$\widehat\beta_1=\dfrac{0,0036}{7,794}=0,00047\quad\text{e }\quad\widehat\beta_0=0,0003-(0,00047)\times 0,73=-1,95\times 10^{-5}.$$
Portanto, o modelo ajustado é dado por
$$\mbox{Área}~=~-1,95\times 10^{-5}~+~0,00047~\times\mbox{Concentração}.$$
Veja a seguir os resultados obtidos pelo software Action.
Da seção análise de variância obtemos que
$$QME=\dfrac{\displaystyle\sum\limits_{i=1}^n(Y_i-\overline{Y})^2-\widehat{\beta}_1\displaystyle\sum\limits_{i=1}^n(x_i-\overline{x})Y_i}{n-2}.$$
Substituindo os valores obtemos que
$$QME=3,98\times 10^{-10}$$
Com isso, podemos calcular as variâncias dos parâmetros
$$\widehat{\text{Var}}(\hat{\beta}_0)=QME\left(\frac{1}{n}+\frac{\overline{x}^2}{S_{xx}}\right)=5,38\times 10^{-11}$$
$$\widehat{\text{Var}}(\hat{\beta}_1)=\frac{QME}{S_{xx}}=5,11\times 10^{-11}$$
O $R^2$ é uma medida descritiva da qualidade do ajuste obtido. Como obtemos um $R^2$ de 0,99, logo a quantidade de variabilidade dos dados bem é explicada pelo modelo de regressão ajustado. Como dito anteriormente, na prática temos interesse em predizer o valor de concentração (X) dado uma observação em área (Y). Então, dado $y_0$ observado, tomamos como estimativa (invertendo a função linear)
$$\hat{x_0} = \frac{y_0 -\hat{\beta_0} }{\hat{\beta_1}}~\quad \text{que é equivalente a}\quad \widehat{\text{Concentração}}_0=\dfrac{\text{Área}_0-\hat{\beta}_0}{\hat{\beta}_1}.$$
Logo, a variância da estimativa $\hat{x_0}$ é dada por (Veja Brown [13], 1993, pg. 26)
$$\widehat{Var(\hat{x_0})}=\frac{QME}{\hat{\beta_1}^2}=\frac{3,98\times 10^{-10}}{0,00047^2}=0,00179.$$
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.