1.10.1 - Modelo Estatístico para Curva de Calibração

Você está aqui

Nesta seção vamos descrever o modelo estatístico para a motivação, para isto é razoável supor que a relação existente entre a variável Área (Y) e níveis de Concentração (X) é linear. Desta forma, definimos o seguinte modelo de regressão linear simples entre Y (variável resposta) e X (variável regressora).

Consideramos duas variáveis Concentração e Área, neste caso, podemos estabelecer uma regressão linear simples cujo modelo estatístico é


$$Y_{ij}=\beta_0+\beta_1~x_{i}+\varepsilon_{ij}\quad i=1,\cdots, n;$$

em que,

  • $ Y_{ij} $: representa a j-ésima medição de área referente a i-ésima concentração;
  • $ X_{i} $: representa a i-ésima concentração;
  • $ \beta_0 $: representa o coeficiente linear ou intercepto;
  • $ \beta_1 $: representa o coeficiente angular;
  • $ \varepsilon_{ij} $: representa o j-ésimo erro cometido na medição da i-ésima área. Consideramos que os $ \varepsilon_{ij} $ são independentes e identicamente distribuídos com distribuição $ N(0,\sigma^2) $ .

Pelo método dos mínimos quadrados, obtemos


$$\hat{\beta}_1=\frac{S_{xy}}{S_{xx}}\quad e\quad\hat{\beta}_0=\overline{y}-\hat{\beta}_1\overline{x}$$

em que,

  • $ S_{xx}=\displaystyle\sum^n_{i=1}(x_i-\overline{x})^2=\sum^n_{i=1}x_i^2-2\overline{x}\sum^n_{i=1}x_i+n\overline{x}^2 = \sum^n_{i=1} x_i^2-n\overline{x}^2; $
  • $ S_{xy}=\displaystyle\sum^n_{i=1}(x_i-\overline{x})(y_i-\overline{y})=\sum^n_{i=1}(x_i-\overline{x})y_i; $
  • $ \overline{y}=\frac{1}{n}\displaystyle\sum^n_{i=1}(y_i) $ representa a média das leituras de área;
  • $ \overline{x}=\frac{1}{n}\displaystyle\sum^n_{i=1}(x_i) $ representa a média das leituras de concentração.

para mais detalhes consulte estimação dos parâmetros do modelo.

 

Exemplo

 

Voltando à Motivação, vamos calcular as estimativas dos parâmetros $ \beta_{0} $ e $ \beta_{1} $ pelo Método dos Mínimos Quadrados.

 

n Concentracao Area Conc2 Area2 Conc x Area
1 0,05 0,00000405 0,0025 1,64E-11 2,02E-07
2 0,05 0,00000312 0,0025 9,74E-12 1,56E-07
3 0,05 0,00000211 0,0025 4,43E-12 1,05E-07
4 0,1 0,0000286 0,01 8,21E-10 2,86E-06
5 0,1 0,0000238 0,01 5,67E-10 2,38E-06
6 0,1 0,0000308 0,01 9,48E-10 3,08E-06
7 0,5 0,0001913 0,25 3,66E-08 9,56E-05
8 0,5 0,0001936 0,25 3,75E-08 9,68E-05
9 0,5 0,0002006 0,25 4,03E-08 1,00E-04
10 1 0,0004883 1 2,38E-07 4,88E-04
11 1 0,0004761 1 2,27E-07 4,76E-04
12 1 0,0004851 1 2,35E-07 4,85E-04
13 2 0,0009072 4 8,23E-07 1,81E-03
14 2 0,0009246 4 8,55E-07 1,85E-03
15 2 0,0009008 4 8,12E-07 1,80E-03
Soma 10,95 0,005 15,788 0,00000331 0,007
Média 0,73 0,0003      

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

As médias amostrais das variáveis Concentração (X) e Área (Y) são, respectivamente, 


$$\overline{x}=\dfrac{1}{15}\sum_{i=1}^{15}x_i=0,73\quad\text{e}\quad\overline{y}=\dfrac{1}{15}\sum_{i=1}^{15} y_i=0,039.$$

Além disso, na Tabela, apresentamos os valores de $ x^2 $, $ y^2 $ e $ xy $ para cada observação $ i=1,\ldots,15 $

 

Da tabela calculamos as somas de quadrados da seguinte forma:


$$S_{xx}=\sum^n_{i=1}x_i^2-n\overline{x}^2=15,788-15\times 0,73^2=7,794$$


$$S_{yy}=\sum^n_{i=1}y_i^2-n\overline{y}^2= 0,00000331 - 15 \times 0,73^2=1,73\times 10^{-6}$$


$$S_{xy}=\sum^n_{i=1}x_i y_i-n\overline{x}\overline{y}=0,007 - 15 \times 0,73 \times 0,0003=0,0036.$$

Logo, as estimativas dos parâmetros $ \beta_{1} $ e $ \beta_{0} $ são, respectivamente


$$\widehat\beta_1=\dfrac{0,0036}{7,794}=0,00047\quad\text{e }\quad\widehat\beta_0=0,0003-(0,00047)\times 0,73=-1,95\times 10^{-5}.$$

Portanto, o modelo ajustado é dado por


$$\mbox{Área}~=~-1,95\times 10^{-5}~+~0,00047~\times\mbox{Concentração}.$$

Veja a seguir os resultados obtidos pelo software Action.

 

Da seção análise de variância obtemos que


$$QME=\dfrac{\displaystyle\sum\limits_{i=1}^n(Y_i-\overline{Y})^2-\widehat{\beta}_1\displaystyle\sum\limits_{i=1}^n(x_i-\overline{x})Y_i}{n-2}.$$

Substituindo os valores obtemos que


$$QME=3,98\times 10^{-10}$$

Com isso, podemos calcular as variâncias dos parâmetros


$$\widehat{\text{Var}}(\hat{\beta}_0)=QME\left(\frac{1}{n}+\frac{\overline{x}^2}{S_{xx}}\right)=5,38\times 10^{-11}$$


$$\widehat{\text{Var}}(\hat{\beta}_1)=\frac{QME}{S_{xx}}=5,11\times 10^{-11}$$

O $ R^2 $ é uma medida descritiva da qualidade do ajuste obtido. Como obtemos um $ R^2 $ de 0,99, logo a quantidade de variabilidade dos dados bem é explicada pelo modelo de regressão ajustado. Como dito anteriormente, na prática temos interesse em predizer o valor de concentração (X) dado uma observação em área (Y). Então, dado $ y_0 $ observado, tomamos como estimativa (invertendo a função linear)


$$\hat{x_0} = \frac{y_0 -\hat{\beta_0} }{\hat{\beta_1}}~\quad \text{que é equivalente a}\quad \widehat{\text{Concentração}}_0=\dfrac{\text{Área}_0-\hat{\beta}_0}{\hat{\beta}_1}.$$

Logo, a variância da estimativa $ \hat{x_0} $ é dada por (Veja Brown [13], 1993, pg. 26)


$$\widehat{Var(\hat{x_0})}=\frac{QME}{\hat{\beta_1}^2}=\frac{3,98\times 10^{-10}}{0,00047^2}=0,00179.$$

 

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]