Exemplo Linearidade Cromatógrafo: Heteroscedástico

A seguir, apresentamos os dados coletados.

Concentração Área
1,998 91287,2967
1,998 92634,5279
1,998 87717,324
3,9959 181620,124
3,9959 183739,1996
3,9959 175633,4481
5,9939 288422,6727
5,9939 276836,9997
5,9939 271491,458
7,9918 371431,3043
7,9918 378810,2832
7,9918 361987,7019
8,9908 445930,366
8,9908 425366,3293
8,9908 440825,634
9,9898 470969,3284
9,9898 453986,2756
9,9898 592596,0537
10,9887 543081,3348
10,9887 480101,757
10,9887 529028,7698
11,9877 602909,3744
11,9877 523645,5587
11,9877 586988,7449

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Antes de iniciar o estudo do parâmetro Linearidade, é interessante ressaltar que os dados são provenientes de soluções diluídas de uma mesma solução mãe, logo temos  "quase-réplicas", ou seja, para cada ponto de concentração ocorreu uma pesagem, assim os experimentos foram realizados de modo independente. Dito isto, iniciamos o estudo de linearidade. Neste exemplo utilizamos a seguinte notação:

  • X: Concentração
  • Y: Área

Por meio do método de mínimos quadrados ordinários, estimamos os parâmetros do modelo, mas para estimar os parâmetros precisamos das seguintes quantidades:

  • $  \bar{X}  $ = 7,742075
  • $  \bar{Y}  $ = 331960,1
  • $  S_{xx}  $ = 2559726
  • $  S_{yy}  $ = 785903657767
  • $  S_{xy}  $ = 11190952

Na tabela abaixo apresentamos as estimativas, desvio padrão e o teste de hipótese para o intercepto e para o coeficiente angular.

  Estimativa Desvio Padrão Estat.t P-Valor Limite inferior Limite superior
Intercepto -9442,9682 10136,1715 -0,9316 0,3616 -30464,1012 11578,1649
Concentração 48402,5767 1206,3004 40,1248 0 45900,8629 50904,2906

Portanto, o modelo ajustado é:

Área = -9442,9682 + 48402,5767 * Concentração

Por meio da tabela acima, além das estimativas calculadas, podemos avaliar a significância dos parâmetros por meio do teste T, como visto no exemplo 1.1.2.1.

Em relação ao parâmetro intercepto, temos que as hipóteses são:

$ H_{0} $ : Intercepto é igual a zero.

$ H_{1} $ : Intercepto é diferente de zero.

O quantil da distribuição T para a obtenção da região crítica é dado por $  t_{(0,95, 22)} = \ 1,717144  $. Como o p-valor associado ao teste,  $  \text{P-valor} = 2 P( t_{(0,95, 22)} \textgreater | \text{t} | ) = \ 0,3616 \  $, é maior que 0,05, não rejeitamos $ H_0 $ e concluímos que o intercepto é igual a zero ao nível de significância de 5%.

Em relação ao coeficiente angular, temos que as hipóteses são:

$ H_{0} $ : Coeficiente angular é igual a zero.

$ H_{1} $ : Coeficiente angular é diferente de zero.

O quantil da distribuição T para a obtenção da região crítica é dado por $  t_{(0,95, 22)} = \ 1,717144  $. Como o p-valor associado ao teste, $  \text{P-valor} = 2 P( t_{(0,95, 22)} \textgreater | \text{t} | ) = \ 0 \  $, é menor que 0,05, rejeitamos $ H_0 $ e concluímos que o coeficiente angular é diferente de zero ao nível de significância de 5%.

Avaliamos também a significância dos parâmetros por meio do teste F da ANOVA. Note que temos um modelo de regressão simples, logo, como dito anteriormente, o teste F da ANOVA é equivalente ao teste T.

A seguir, testamos a significância dos parâmetros do modelo. 

Tabela ANOVA

Fatores Graus de liberdade Soma dos quadrados Quadrado médio Estat. F P-Valor
Concentração 1 599694955424,175 599694955424,175 1610,0007 0
Resíduos 22 8194586069,4757 372481184,9762    
Total 23 607889541494      

Para testarmos o coeficiente angular do modelo utilizamos o teste F da ANOVA, neste caso testamos as hipóteses:

$ H_{0} $ : Coeficiente angular é igual a zero.

$ H_{1} $ : Coeficiente angular é diferente de zero.

A região crítica para o teste F é dada por $  F_{(0,95, 1, 22)} = 4,30095  $. Como a estatística observada $  \ | \text{F} | \textgreater \ \text{4,30095}  $ é maior que o quantil da distribuição para a determinação da região crítica, isto é, a estatística observada pertence a região crítica, e o p-valor associado ao teste $  \text{P-valor} = 2 P( F_{(0,95, 1, 22)} \textgreater | \text{F} | ) = 0  $, rejeitamos a hipótese nula ao nível de significância de 5%.   

A tabela a seguir, apresenta a análise exploratória dos resíduos.

Mínimo 1Q Mediana  Média 3Q Máximo
-47150 -7739 111,1 0 13250 32120

Observando a tabela acima, notamos que os valores de mínimo e máximo, em módulo, apresentam uma diferença notável, assim como os valores da mediana e da média, o que dá indícios de que a distribuição dos resíduos é assimétrica.

Além do teste de hipótese para o coeficiente linear, avaliamos também o impacto deste na resposta analítica. O impacto é dado na tabela a seguir.

Concentração Área Impacto do coeficiente linear (%)
1,998 91287,2967 10,3442
1,998 92634,5279 10,1938
1,998 87717,324 10,7652
3,9959 181620,124 5,1993
3,9959 183739,1996 5,1393
3,9959 175633,4481 5,3765
5,9939 288422,6727 3,274
5,9939 276836,9997 3,411
5,9939 271491,458 3,4782
7,9918 371431,3043 2,5423
7,9918 378810,2832 2,4928
7,9918 361987,7019 2,6086
8,9908 445930,366 2,1176
8,9908 425366,3293 2,22
8,9908 440825,634 2,1421
9,9898 470969,3284 2,005
9,9898 453986,2756 2,08
9,9898 592596,0537 1,8788
10,9887 543081,3348 1,7388
10,9887 480101,757 1,9669
10,9887 529028,7698 1,785
11,9877 602909,3744 1,5662
11,9877 523645,5587 1,8033
11,9877 586988,7449 1,6087

Observe que temos impactos superiores a 2% nos níveis de concentração de 1,998 à 9,9898. Desta forma o ideal seria quantificar os resultados da rotina com uma curva de calibração, mas caso seja utilizado ponto único será necessário investigar o impacto. Alem disso, o resultado do impacto não está em conformidade com o resultado do teste do intercepto.

A seguir, analisamos o coeficiente de correlação de Pearson.

Desvio padrão dos resíduos  Graus de liberdade $ R^2 $ Coeficiente de correlação
19299,7716 22 0,9865 0,9932

Como o coeficiente de correlação, $ r = 0,9932 $, está acima do valor especificado 0,9900 pela agência reguladora, concluímos que existe uma relação linear adequada. Como dito no exemplo anterior, temos que o coeficiente de determinação representa a relação sinal/ruído.

Observando o gráfico acima, notamos que os pontos seguem a reta ajustada. Porém observamos uma baixa diferença entre a variável resposta e a reta ajustada. Temos que a magnitude da escala da área (eixo y) é extremamente baixa em comparação a escala da concentração (eixo x).

A seguir, analisamos as suposições feitas sobre os erros experimentais, por meio do gráfico 4 em 1, dado a seguir.

Observando o gráfico de resíduos padronizado vs valores ajustados, notamos que não há pontos com um valor alto de resíduo, logo não temos possíveis outliers. Contudo observamos a disposição destes se apresenta em forma de funil.

Observando o QQPlot notamos que alguns pontos estão distantes da reta pontilhada - em azul -, e que os pontos 28 e 20 estão fora da banda de confiança. Logo temos indícios de que a suposição de normalidade dos erros experimentais não é satisfeita.

Observando o gráfico de resíduos X valores ajustados, notamos que os pontos parecem se distribuir em forma de funil, o que dá indícios que a variância dos erros experimentais é heterocedástica.

Observando o gráfico de resíduos X ordem de coleta, notamos que os pontos apresentam uma tendência, conforme a ordem de coleta cresce, os resíduos também crescem. Logo temos indícios de que os erros experimentais são dependentes.

Para validar nossas suspeitas a partir da análise gráfica, verificaremos as hipóteses levantadas por meio de testes estatísticos.

A seguir, analisamos a normalidade dos erros experimentais, no qual as hipóteses são:

$ H_{0} $ : A distribuição dos erros experimentais é normal.

$ H_{1} $ : A distribuição dos erros experimentais não é normal.

Teste  Estatística P-Valor
Anderson-darling 0,5552 0,1357
Kolmogorov-Smirnov 0,1466 0,2010
Ryan-Joiner 0,9652 0,0976
Shapiro-Wilk 0,9363 0,1246

Aqui adotamos o teste de Shapiro-Wilk para avaliar a normalidade. Como o p-valor do teste de Shapiro-Wilk, p-valor 0,1246, é maior que 0,05, não rejeitamos a hipótese de normalidade dos erros experimentais ao nível de significância de 5%.

A seguir, analisamos a homoscedasticidade por meio do teste de Breusch-Pagan. Como dito anteriomente o teste de Breusch-Pagan é o que melhor se adequa ao objetivo do teste. As hipóteses são:

$ H_{0} $ : As variâncias são iguais.

$ H_{1} $ : Pelo menos uma variância difere.

Estatística P-Valor
7.5689 0,0059

Como o p-valor do teste é menor que 0,05, rejeitamos a hipótese de igualdade das variâncias ao nível de significância de 5%. Logo, temos um modelo heterocedástico. Observe que o resultado do teste de Breusch-Pagan está em conformidade com a análise gráfica.

A RDC 166 define como critério que o modelo seja homocedástico. O exemplo não passa por este critério, visto que temos um modelo heterocedástico, assim devemos buscar maneiras de lidar com este critério. Logo iremos aplicar o método de mínimos quadrados ponderados

O método de mínimos quadrados ponderados tem como ideia, transformar as observações, para que possamos aplicar o modelo de regressão. Devemos buscar uma transformação que melhor se adeque aos dados, isto é, a melhor ponderação é aquela que resulta em menores valores de resíduos, em módulo. 

A seguir apresentamos os fatores de ponderação que serão aplicados:

  • $  w_{1} = \frac{1}{x}  $
  • $  w_{2} = \frac{1}{x^2}  $ 
  • $  w_{3} = \frac{1}{y}  $
  • $  w_{4} = \frac{1}{y^2}  $
  • $  w_{5} = \frac{1}{s_{i}^{2}}  $
  • $  w_{6} =\frac{\frac{1}{s_{i}^{2}}}{\sum_{i = 1}^{k} \frac{1}{s_{i}^{2}}} \times k $

Em que $ x_i $ representa a concentração no i-ésimo ponto, $ y_i $ representa a área no i-ésimo ponto e $ s_i $ representa a variância no i-ésimo ponto.

A seguir, apresentamos os resíduos, considerando o método de mínimos quadrados ordinários, MMQO, e o método de mínimos quadrados ponderados para cada fator de ponderação, $ w_i, i $ = 1 à 6.

MMQO $ w_1 $ $ w_2 $ $ w_3 $ $ w_4 $ $ w_5 $ $ w_6 $
021,916568 1978,418146 896,8962031 8,861215302 0,019320913 0,784587699 4431,821069
5369,147768 2931,531139 1571,186093 13,22299396 0,033583429 1,3147949 7426,748781
451,9438684 -547,1968823 -889,87692 -3,014014208 -0,020591358 -0,620386615 -3504,315037
-2348,764198 -1574,783806 -899,7617689 -6,988747808 -0,017289498 -0,728224927 -4113,450386
-229,688598 -514,7025747 -369,4492986 -2,004704865 -0,005557035 -0,22414483 -1266,104197
-8335,440098 -4569,657022 -2397,966404 -21,39192179 -0,051965026 -2,152319551 -12157,58945
7745,436178 3011,337557 1248,30505 14,58119628 0,029196592 0,964589247 5448,577581
-3840,236822 -1720,899804 -684,6055754 -7,136406717 -0,011431687 -0,373999535 -2112,573292
-9185,778522 -3904,318252 -1576,435886 -17,46552385 -0,03134631 -0,991614252 -5601,23099
-5949,440289 -2085,678417 -654,3377868 -8,448680105 -0,010249839 -0,477977394 -2699,90249
1429,538611 524,5226631 268,9809774 3,623079017 0,009429173 0,397099261 2243,054372
-15393,04269 -5426,208526 -1835,99929 -24,25424084 -0,036605425 -1,597898741 -9025,88877
20195,44725 6824,103277 2381,015869 31,97659334 0,051737262 2,126723572 12013,00803
-368,5894507 -34,0818136 93,78484366 1,210207154 0,005894165 0,206231567 1164,919365
15090,71525 5121,655582 1813,243034 24,47274091 0,040756441 1,649988526 9320,123061
-3119,764513 -835,345526 -141,7733719 -2,337800231 0,001039227 0,004661142 26,3289223
-20102,81731 -6208,599432 -1841,812692 -27,5865725 -0,036330633 -0,683754478 -3862,254662
28506,96079 9171,007704 3024,128378 42,34823039 0,06390056 1,286664558 7267,851767
20642,90798 6436,209706 2078,318846 30,55304825 0,04600689 0,74215206 4192,119173
-42336,66982 -12562,60847 -3652,984929 -58,39827259 -0,079137587 -1,162860295 -6568,531168
6590,342983 2197,023979 799,4992407 11,63578521 0,020666018 0,317088716 1791,106914
32116,77342 9537,667475 2903,273722 44,23486888 0,061688854 0,874494623 4939,6692
-47147,04228 -13355,56098 -3708,82165 -62,07100182 -0,080342565 -1,015905069 -5738,440063
16196,14392 4939,420406 1575,193315 24,050746 0,036239466 0,494796108 2794,904659

A seguir, apresentamos o gráfico dos resíduos do método de mínimos quadrados ordinários e os gráficos para cada fator de ponderação do método de mínimos quadrados ordinários.

Observando a tabela e os gráficos dados acima, temos que o peso $ w_4 $ apresenta os menores valores de resíduos. Logo aplicaremos o método de mínimos quadrados ponderados considerando este fator de ponderação.

A seguir, apresentamos as estimativas para os parâmetros do modelo:

  Estimativa Desvio Padrão Estat.t P-Valor Limite inferior Limite superior
Intercepto -5717,9259 2964,786 -1,9286 0,0668 -11866,5157 430,6638
Concentração 47668,4028 673,6381 70,7626 0 46271,3629 49065,4427

Portanto, o modelo ajustado é:

Área = -5717,9259 + 47668,4028 * Concentração

A seguir, avaliamos a significância dos parâmetros por meio do teste T. Em relação ao parâmetro intercepto, temos que as hipóteses são:

$ H_{0} $ : Intercepto é igual a zero.

$ H_{1} $ : Intercepto é diferente de zero.

O quantil da distribuição T para a obtenção da região crítica é dado por $  t_{(0,95, 22)} = \ 1,717144  $. Como o p-valor associado ao teste,  $  \text{P-valor} = 2 P( t_{(0,95, 22)} \textgreater | \text{t} | ) = 0,0668  $, é maior que 0,05, não rejeitamos $ H_0 $ e concluímos que o intercepto é igual a zero ao nível de significância de 5%.

Em relação ao coeficiente angular, temos que as hipóteses são:

$ H_{0} $ : Coeficiente angular é igual a zero.

$ H_{1} $ : Coeficiente angular é diferente de zero.

O quantil da distribuição T para a obtenção da região crítica é dado por $  t_{(0,95, 22)} = \ 1,717144  $. Como o p-valor associado ao teste, $  \text{P-valor} = 2 P( t_{(0,95, 22)} \textgreater | \text{t} | ) = \ 0 \  $, é menor que 0,05, rejeitamos $ H_0 $ e concluímos que o coeficiente angular é diferente de zero ao nível de significância de 5%.

Avaliamos também a significância dos parâmetros por meio do teste F da ANOVA. 

Tabela ANOVA

Fatores Graus de liberdade Soma dos quadrados Quadrado médio Estat. F P-Valor
Concentração 1 8,7884 8,7884 5007,3499 0
Resíduos 22 0,0386 0,0018    
Total 23 8,8270      

Para testarmos o coeficiente angular do modelo utilizamos o teste F da ANOVA, neste caso testamos as hipóteses:

$ H_{0} $ : Coeficiente angular é igual a zero.

$ H_{1} $ : Coeficiente angular é diferente de zero.

A região crítica para o teste F é dada por $  F_{(0,95, 1, 22)} = 4,30095  $. Como a estatística observada $  \ | \text{F} | \textgreater \ \text{4,30095}  $ é maior que o quantil da distribuição para a determinação da região crítica, isto é, a estatística observada pertence a região crítica, e o p-valor associado ao teste $  \text{P-valor} = 2 P( F_{(0,95, 1, 22)} \textgreater | \text{F} | ) = 0  $, rejeitamos a hipótese nula ao nível de significância de 5%.   

A tabela a seguir, apresenta a análise exploratória dos resíduos.

Mínimo 1Q Mediana  Média 3Q Máximo
-0,0803 -0,0287 0,0035 0,0016 0,0356 0,0639

Observando a tabela acima, notamos que os valores de mínimo e máximo, em módulo, apresentam uma proximidade, assim como os valores da mediana e da média, o que dá indícios de que a distribuição dos resíduos é simétrica.

Além do teste de hipótese para o coeficiente linear, avaliamos também o impacto deste na resposta analítica. O impacto é dado na tabela a seguir.

Concentração Área Impacto do coeficiente linear (%)
1,998 91287,2967 6,2637
1,998 92634,5279 6,1726
1,998 87717,324 6,5186
3,9959 181620,124 3,1483
3,9959 183739,1996 3,112
3,9959 175633,4481 3,2556
5,9939 288422,6727 1,9825
5,9939 276836,9997 2,0654
5,9939 271491,458 2,1061
7,9918 371431,3043 1,5394
7,9918 378810,2832 1,5094
7,9918 361987,7019 1,5796
8,9908 445930,366 1,2822
8,9908 425366,3293 1,3442
8,9908 440825,634 1,2971
9,9898 470969,3284 1,2141
9,9898 453986,2756 1,2595
9,9898 592596,0537 1,1377
10,9887 543081,3348 1,0529
10,9887 480101,757 1,191
10,9887 529028,7698 1,0808
11,9877 602909,3744 0,9484
11,9877 523645,5587 1,0919
11,9877 586988,7449 0,9741

Em comparação ao impacto do modelo do método de mínimos quadrados ordinários, temos que os níveis 1,998, 3,9959 e 5,9939 mantiveram um impacto supeiror ao máximo aceitável, 2%. Contudo, como dito anteriomente, o ideal seria quantificar os resultados da rotina em uma curva de calibração, mas caso seja utilizado ponto único será necessário investigar o impacto. Note que temos três níveis que não estão em conformidade com o resultado do teste do intercepto. 

A seguir, analisamos o coeficiente de correlação de Pearson.

Desvio padrão dos resíduos  Graus de liberdade $ R^2 $ Coeficiente de correlação
0,419 22 0,9956 0,9978

Como o coeficiente de correlação, $ r = 0,9978 $, está acima do valor especificado pela agência reguladora, concluímos que existe uma relação linear adequada.

 

Observando o gráfico acima, notamos que os pontos seguem a reta ajustada. Porém observamos uma diferença entre a variável resposta e a reta ajustada. Vale ressaltar que a magnitude da escala da área (eixo y) é extremamente baixa em comparação a escala da concentração (eixo x).

A seguir, analisamos as suposições feitas sobre os erros experimentais, por meio do gráfico 4 em 1, dado a seguir.

Observando o gráfico de resíduos padronizado vs valores ajustados, notamos que não há pontos com um valor alto de resíduo, logo não temos possíveis outliers. Contudo observamos a disposição destes se apresenta em forma de funil.

Observando o QQPlot notamos que os pontos se aproximam da reta pontilhada - em azul -, e que estes estão contidos na banda de confiança. Logo temos indícios de que a suposição de normalidade dos erros experimentais é satisfeita.

Observando o gráfico de resíduos X valores ajustados, notamos que os pontos parecem se distribuir aleatoriamente, o que dá indícios que a variância dos erros experimentais é homocedástica.

Observando o gráfico de resíduos X ordem de coleta, notamos que os pontos não apresentam uma tendência, isto é, eles parecem se distribuir aleatoriamente. Logo temos indícios de que os erros experimentais são independentes.

Para validar nossas suspeitas a partir da análise gráfica, verificaremos as hipóteses levantadas por meio de testes estatísticos.

A seguir, analisamos a normalidade dos erros experimentais, no qual as hipóteses são:

$ H_{0} $ : A distribuição dos erros experimentais é normal.

$ H_{1} $ : A distribuição dos erros experimentais não é normal.

Teste  Estatística P-Valor
Anderson-darling 0,2098 0,8429
Kolmogorov-Smirnov 0,0840 0,9321
Ryan-Joiner 0,9876 0,7059
Shapiro-Wilk 0,9650 0,5476

Aqui adotamos o teste de Shapiro-Wilk para avaliar a normalidade. Como o p-valor do teste de Shapiro-Wilk, p-valor 0,5476, é maior que 0,05, não rejeitamos a hipótese de normalidade dos erros experimentais ao nível de significância de 5%.

A seguir, analisamos a homoscedasticidade por meio do teste de Breusch-Pagan. As hipóteses são:

$ H_{0} $ : As variâncias são iguais.

$ H_{1} $ : Pelo menos uma variância difere.

Estatística P-Valor
3,6845 0,0549

Como o p-valor do teste é maior que 0,05, não rejeitamos a hipótese de igualdade das variâncias ao nível de significância de 5%. Logo temos um modelo homocedástico.

A seguir, analismos os valores extremos. Para isto, avaliamos os resíduos padronizados e os resíduos studentizados.

Número obs. Concentração Pesos Resíduos Resíduos Studentizados Resíduos Padronizados
1 1,998 1,1999E-10 0,0193 0,5366 0,5455
2 1,998 1,16534E-10 0,9403 0,9403 0,9428
3 1,998 1,29966E-10 -0,0206 -0,5823 -0,5913
4 3,9959 3,0316E-11 -0,0173 -0,4165 -0,4245
5 3,9959 2,96208E-11 -0,0056 -0,1333 -0,1364
6 3,9959 3,24179E-11 -0,052 -1,2982 -1,2785
7 5,9939 1,2021E-11 0,0292 0,703 0,7112
8 5,9939 1,30482E-11 -0,0114 -0,273 -0,279
9 5,9939 1,35671E-11 -0,0313 -0,7582 -0,7656
10 7,9918 7,24841E-12 -0,0102 -0,2456 -0,251
11 7,9918 6,96878E-12 0,0094 0,2256 0,2307
12 7,9918 7,63154E-12 -0,0366 -0,8935 -0,8976
13 8,9908 5,02882E-12 0,0517 1,2838 1,2653
14 8,9908 5,5268E-12 0,0059 0,1413 0,1445
15 8,9908 5,14596E-12 0,0408 0,9972 0,9973
16 9,9898 4,50832E-12 0,001 0,0249 0,0255
17 9,9898 4,85193E-12 -0,0363 -0,8905 -0,8948
18 9,9898 3,95878E-12 0,0639 1,6214 1,5645
19 10,9887 3,39055E-12 0,046 1,1369 1,1294
20 10,9887 4,33844E-12 -0,0791 -2,1059 -1,9586
21 10,9887 3,57307E-12 0,0207 0,4994 0,5081
22 11,9877 2,75103E-12 0,0617 1,5642 1,5152
23 11,9877 3,64691E-12 -0,0803 -2,1504 -1,9925
24 11,9877 2,90229E-12 0,0362 0,8872 0,8915

Como critério para a análise serão considerados valores extremos na resposta as observações com resíduos studentizados e/ou padronizados mariores que 3, em módulo.

Observando a tabela acima e os gráficos de resíduos padronizado vs valores ajustados e resíduos studentizado vs valores ajustados, notamos que não existem resíduos studentizados e padronizados com valores maiores que três, em módulo, logo não temos outliers.

A seguir, analisamos os pontos influentes por meio das medidas DFFITS, DFBETA e a distância de Cook. Os critérios para análise dos pontos influentes são dados por:

Diagnóstico Fórmula Valor
DFFITS $ 2 \sqrt{(p+1)/n} $ 0,58
DCOOK $ 4/n $ 0,1667
DFBETA $ 2/\sqrt{n} $ 0,4082

Observações DFFITS Critério
2 0,58 $  \pm  $ 0,58
23 -0,61 $  \pm  $ 0,58

Pelo critério da medida DFFITS temos que as observações 2 e 23 são pontos influentes.

Observações DCOOK Critério
2 0,1703 0,1667

Pelo critério da medida DCOOK temos que a observação 2 é um ponto influente.

Observações DFBETA Critério
20

-0,5443

0,4082
23 1,033 0,4082

Pelo critério da medida DFBETA temos que as observações 20 e 23 são pontos influetes. Logo a partir dos critérios estabelecidos pelas medidas e pela observação dos gráficos das medidas, temos que as observações 2, 20 e 23 são pontos influentes.

A seguir, analisamos a independência das observações.

Obervando o gráfico acima, notamos que não existe nenhuma tendência aparente dos pontos, isto é, não temos sequências de pontos decrescentes ou crescentes. Logo temos indícios de que não há dependência das observações. Para validar esta suspeita iremos aplicar o teste de  Durbin-Watson. as hipóteses do teste são:

$ H_{0} $ : As observações são independentes.

$ H_{1} $ : As observações não são independentes.

Estatística  P-Valor
11,7043 0,0006

Aplicando o teste, obtemos um p-valor de 0,0006. Como o p-valor é menor que 0,05 rejeitamos a hipótese de indenpendência das observações a um nível de significância de 5%. A rejeição da hipótese de independência ocorre, pois, as soluções foram diluídas de uma mesma solução mãe.

Por fim, avaliamos o ajuste do modelo, para isto testamos a falta de ajuste. No qual as hipóteses são:

$ H_{0} $ : O modelo está bem ajustado.

$ H_{1} $ : O modelo não está bem ajustado.

  Graus de liberdade Soma dos Quadrados Quadrado Médio Estat. F P-Valor
Concentração 1 8,7884 8,7884 4351,9734 0
Resíduos 22 0,0386 0,0018    
Falta de ajuste 6 0,0063 0,0011 0,5201 0,7848
Erro puro 16 0,0323 0,002    

A partir da tabela acima, temos que o p-valor para a falta de ajuste foi de 0,7848, valor maior que 0,05. Logo não rejeitamos $ H_0 $ e portanto o modelo é adequado e a linearidade do modelo está validada ao nível de 5% de significância.

Logo, os critérios da RDC que foram satisfeitos são:

  • Coeficiente angular significativo ao nível de significância de 5%;
  • Coeficiente linear não significativo ao nível de significância de 5%;
  • Coeficiente de correlação superior a 0,9900;
  • Homoscedasticiade do modelo;
  • Normalidade dos erros experimentais.

Contudo temos observações dependentes, desta forma devemos analisar a causa da dependência das observações. Note que as concentrações são provenientes de uma mesma solução mãe, isto é, as soluções são diluídas de uma única solução mãe, assim devemos analisar se isto influenciou a dependência das observações.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]