1.7 - Histograma

Você está aqui

 

Distribuição de frequência em intervalos de classes: Dados quantitativos contínuos

Para dados quantitativos contínuos, geralmente resultantes de medições de características da qualidade de peças ou produtos, dividimos a faixa de variação dos dados em intervalos de classes. O menor valor da classe é denominado limite inferior (li) e o maior valor da classe é denominado limite superior (Li).

O intervalo ou classe pode ser representado das seguintes maneiras:

1. (li)$ \vdash $(Li), onde o limite inferior da classe é incluído na contagem da frequência absoluta, mas o superior não;
2. (li)$ \dashv $(Li)
, onde o limite superior da classe é incluído na contagem, mas o inferior não.

Podemos escolher qualquer uma destas opções, mas é importante que deixemos claro no texto ou na tabela qual delas está sendo usada. Embora não seja necessário, os intervalos são frequentemente construídos de modo que todos tenham larguras iguais, o que facilita as comparações entre as classes.

Na tabela de distribuição de frequência, acrescentamos uma coluna com os pontos médios de cada intervalo de classe, denotada por xi. Esta é definida como a média dos limites da classe $ \displaystyle x_i=\frac{l_i+L_i}{2} $. Estes valores são utilizados na construção de gráficos.

Algumas indicações na construção de distribuição de frequências são:

  • Na medida do possível, as classes deverão ter amplitudes iguais.
  • Escolher os limites dos intervalos entre duas possíveis observações.
  • O número de intervalos não deve ultrapassar 20.
  • Escolher limites que facilitem o agrupamento.
  • Marcar os pontos médios dos intervalos.
  • Ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à frequência absoluta, o que dá no mesmo) correspondente.

Um ponto importante na construção da distribuição de frequência é o numero de intervalos de classes. No Action Stat utilizamos a regra de Sturges para obter o número de intervalos de classes

$$k = 1 + 3,3 ~ log_{10} (n),$$

no qual $ n $ é o tamanho do conjuntos de dados.  

Histograma

Histograma é uma representação gráfica (um gráfico de barras verticais ou barras horizontais) da distribuição de frequências de um conjunto de dados quantitativos contínuos. O histograma pode ser um gráfico por valores absolutos ou frequência relativa ou densidade. No caso de densidade, a frequência relativa do intervalo i, (fri), é representada pela área de um retângulo que é colocado acima do ponto médio da classe  i. Consequentemente, a área total do histograma (igual a soma das áreas de todos os retângulos) será igual a 1. Assim, ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à frequência absoluta, o que é indiferente) correspondente. No caso em que os intervalos são de tamanhos (amplitudes) iguais, as alturas dos retângulos serão iguais às frequências relativas (ou iguais às frequências absolutas) dos intervalos correspondentes.

Exemplo 1.6.2:

Considerando os dados do Exemplo 1.3.4, monte a distribuição de frequências e construa o histograma correspondente.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Como temos dados quantitativos contínuos, para construir a distribuição de frequências, vamos separar os dados em classes. Ao aplicarmos a regra de Sturges obtemos


$$k=1+ 3,3 ~ log_{10} (100) = 7,6.$$

Assim, dividimos os dados em 8 classes de tamanhos iguais. A distribuição de frequências então é a seguinte

Tabela de Frequências
Classe Frequência Freq. Rel. Freq. Perc. Freq. Acum. Densidades Ponto Médio
[4,2 ; 4,4) 6 0,06 6 6 0,3 4,3
[4,4 ; 4,6) 8 0,08 8 14 0,4 4,5
[4,6 ; 4,8) 15 0,15 15 29 0,75 4,7
[4,8 ; 5) 33 0,33 33 62 1,65 4,9
[5 ; 5,2) 18 0,18 18 80 0,9 5,1
[5,2 ; 5,4) 13 0,13 13 93 0,65 5,3
[5,4 ; 5,6) 5 0,05 5 98 0,25 5,5
[5,6 ; 5,8) 2 0,02 2 100 0,1 5,7

 

A seguir, apresentamos o histograma obtido com o software Action Stat.

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Muitas vezes, queremos representar a curva de uma distribuição de probabilidade (por exemplo, normal) junto com o histograma. Esta é uma forma visual de avaliar o ajuste dos dados pela referida distribuição de probabilidade. Entretanto, como a área total da distribuição de probabilidade é igual a $ 1 $, não faz sentido utilizarmos a altura do retângulo como a frequência absoluta ou a frequência relativa. Neste caso, comparamos elementos em escalas distintas. Para contornar este problema, sugerimos utilizar a área de cada retângulo como a frequência relativa cuja a soma é igual a 1. Neste caso, a altura de cada retângulo é dada pela densidade (D) que corresponde frequência relativa dividida pelo tamanho do intervalo de classe. 

Exemplo 1.6.3:

Considerando os dados do Exemplo 1.3.4, construa o histograma de densidades correspondente

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Para construir o histograma de densidades, basta que os retângulos tenham altura do tamanho da densidade de cada classe e largura do tamanho da classe. Neste caso, o histograma ficaria da seguinte forma:

 

Acima pudemos observar exemplos de histogramas com distribuição aproximadamente normal cuja característica principal é um formato de sino que tende a ser simétrico. Entretanto os histogramas podem assumir formas variadas de acordo com a distribuição de probabilidade dos dados. A seguir veremos alguns exemplos de formatos variados de histogramas. 

 Exemplo 1.6.4:

Os dados do histograma a seguir seguem uma dstribuição de probabilidade exponencial, que é usada, por exemplo, como um modelo para o tempo de vida de certos produtos e materiais.

A distribuição exponencial caracteriza-se por seu formato assimétrico, com muitos valores próximos de 0 e uma tendência decrescente.

 Exemplo 1.6.5:

Neste exemplo, trazemos dados da distribuição F de Snedecor, também conhecida como distribuição de Fisher é frequentemente utilizada na inferência estatística para análise de variância.

Esta distribuição também é assimétrica, o formato do histograma desta distribuição quase sempre reflete a alta densidade dos dados em torno do 1.

 Exemplo 1.6.6:

Aqui trazemos um exemplo de uma distribuição bimodal, isto é, que apresenta duas modas.Imagine uma avenida principal de uma cidade em que mede-se o número de automóveis que passam por essa avenida: é lícito imaginar um fluxo máximo de automóveis em determinado horário quando muitos estão indo para o trabalho e de noite ( ou ao entardecer ), um novo fluxo máximo quando as pessoas estão voltando do trabalho para casa. 

Como pode-se notar, o histograma mostra dois picos de desnsidade, um no começo e outro quase ao final da distribuição.

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]