O método do Kernel é um método não paramétrico para estimação de curvas de densidades onde cada observação é ponderada pela distância em relação a um valor central, o núcleo. A idéia é centrar cada observação x onde se queira estimar a densidade, uma janela b que define a vizinhança de x e os pontos que pertencem à estimação.
Estimação de densidade
A probabilidade de que um vetor x, retirado de uma função de densidade desconhecida p(x), cair dentro de uma região R é dada por
![]() |
Considerando que R seja contínua e pequena de forma que p(x) não varia, teremos
![]() |
onde V é o volume de R.
Se retiramos n pontos de maneira independente de p(x) então a probabilidade de que k deles caiam na região R é dada pela lei binomial
![]() |
Temos também que o número médio de pontos caindo em R é dado pela esperança matemática de k, ou seja, E[k] = nP. Considerando n grande, temos
![]() |
Então,
![]() |
Logo, a estimação da densidade p(x) é dada por
![]() |
Se as regiões Ri não tem intersecção, temos um histograma como abaixo.
Em problemas reais existem duas alternativas para estimação da densidade:
- Escolher um valor fixo de k e determinar o volume V a partir dos dados,
- Fixar o volume V e determinar k a partir dos dados (Janela de Parzen).
Janela de Parzen
Nesta abordagem fixamos o tamanho da região R para estimar a densidade, fixamos o volume V e determinamos o correspondente k a partir dos dados de aprendizagem e assumimos que a região R é um hipercubo de tamanho h cujo volume é hd.
Para estimar a densidade no ponto x simplesmente centramos R em x, contamos o número de observações em R e substituímos na equação
![]() |
Por exemplo,
Podemos definir uma expressão para encontrar a quantidade de pontos que caem em R, a qual é definida como função de Kernel ou Parzen window.
Considerando que temos os exemplos x1, x2, ..., xn, então
Exemplo 4.3.1.1: Janela de Parzen em 1D.
Suponha que temos 7 observações D = {2, 3, 4, 8, 10, 11, 12} e o tamanho da janela é h = 3. Vamos estimar a densidade em x = 1.
Para ver o formato da função podemos estimar todas as densidades.
A janela é usada na realidade para interpolação, cada observação xi contribui para o resultado da densidade em x, se x está perto bastante de xi.
Janela de Parzen: kernel Gaussiano
Uma alternativa a janela quadrada usada até então é a janela Gaussiana. Nesse caso, os pontos que estão próximos a xi recebem um peso maior. A estimação da densidade é então suavizada
Exemplo 4.3.1.2: Voltando ao Exemplo 4.3.1.1, em que D = {2, 3, 4, 8, 10, 11, 12}. Se considerarmos agora h = 1, teremos
Janelas de Parzen N(0, 1)

Figura 4.3.1.1: Poucas observações e h pequeno.

Figura 4.3.1.2: Muitas observações e h pequeno.
Outros kernels utilizados
Apesar do kernel Gaussiano ser mais frequentemente utilizado há várias escolhas entre kernels como mostrado na tabela abaixo.
Tabela 4.3.1.1: Diferentes tipos de funções de densidade φ(u).
| Kernel | ![]() |
| Uniforme | ![]() |
| Triangular | ![]() |
| Epanechnikov | ![]() |
| Quadrático | ![]() |
| Triweight | ![]() |
| Cosseno | ![]() |
Exemplo 4.3.1.3: Medições do diâmetro de um pino feitas com súbito, pegando 3 peças a cada 20 produzidas. Vamos analisar a estabilidade e a capacidade do processo considerando as seguintes especificações: LSE = 40 e LIE = 30.
Tabela 4.3.1.2: Medições do diâmetro do pino.
| Amostra | Medições | Média | ||
| 1 | 33,633 | 34,276 | 35,265 | 34,39 |
| 2 | 39,815 | 34,24 | 34,5 | 36,18 |
| 3 | 34,333 | 33,682 | 35,5 | 34,5 |
| 4 | 35,13 | 33,667 | 34,946 | 34,58 |
| 5 | 33,827 | 33,893 | 35,407 | 34,37 |
| 6 | 33,543 | 33,8 | 34,8 | 34,05 |
| 7 | 34,615 | 34,607 | 34,667 | 34,63 |
| 8 | 34,208 | 34,265 | 35,087 | 34,52 |
| 9 | 33,839 | 35,761 | 35,5 | 35,03 |
| 10 | 33,047 | 35 | 34,889 | 34,31 |
| 11 | 35,4 | 34,519 | 34,633 | 34,85 |
| 12 | 34,81 | 34,471 | 35,31 | 34,86 |
| 13 | 33,742 | 35,032 | 35,174 | 34,65 |
| 14 | 33,686 | 35,083 | 35,071 | 34,61 |
| 15 | 33,357 | 35,345 | 35,2 | 34,63 |
| 16 | 36,278 | 35,556 | 35,25 | 35,69 |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Para esse exemplo temos
- m = Número de Amostras = 16
- n = Tamanho das Amostras = 3
Observando o papel de probabilidade a seguir vemos que os dados não seguem nenhuma distribuição conhecida testada.
Figura 4.3.1.3: Papel de probabilidade.
Portanto, vamos utilizar o método do núcleo (Kernel) para fazer uma análise de performance do processo.
A seguir temos os resultados obtidos pelo Software Action para esse exemplo.
Figura 4.3.1.4: Gráfico da análise de performance do processo - Método do núcleo.
| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||














