1.6 - Histograma

Você está aqui

Distribuição de frequências

A distribuição de frequências é um agrupamento de dados em classes, de tal forma que contabilizamos o número de ocorrências em cada classe. O número de ocorrências de uma determinada classe recebe o nome de frequência absoluta. O objetivo é apresentar os dados de uma maneira mais concisa e que nos permita extrair informação sobre seu comportamento. A seguir, apresentamos algumas definições necessárias à construção da distribuição de frequências.

Frequência absoluta (ƒi): É o número de observações correspondente a cada classe. A frequência absoluta é, geralmente, chamada apenas de frequência.

Frequência relativa (ƒri): É o quociente entre a frequência absoluta da classe correspondente e a soma das frequências (total observado), isto é, $ \displaystyle f_{ri}=\frac{f_i}{\sum_{j}f_j} $ onde n representa o número total de observações.

Frequência percentual (pi): É obtida multiplicando a frequência relativa por 100%.

Frequência acumulada: É o total acumulado (soma) de todas as classes anteriores até a classe atual. Pode ser: frequência acumulada absoluta (Fi), frequência acumulada relativa (Fri), ou frequência acumulada percentual (Pi).

 

Distribuição de frequência pontual: dados quantitativos discretos

A construção de uma tabela de distribuição de frequência pontual é equivalente à construção de uma tabela simples, onde se listam os diferentes valores observados da variável com suas frequências absolutas, denotadas por (ƒi) (o índice i corresponde ao número de linhas da Tabela) como é mostrado na Tabela abaixo. Utilizamos a distribuição de frequência pontual quando se trabalha com dados discretos. Um gráfico utilizado para representar este tipo de distribuição de frequência é o Gráfico de Barras.

Exemplo 1.6.1:

Considere os dados do Exemplo 1.3.3. Construa a distribuição de frequências para este conjunto de dados e o gráfico de barras.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Número de pessoas com diabetes Frequência (ƒi) Frequência relativa (ƒri) Frequência percentual Frequência acumulada
7 1 0,05 5 5
8 2 0,1 10 15
9 5 0,25 25 40
10 8 0,4 40 80
11 3 0,15 15 95
12 1 0,05 5 100

 

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário

 

Distribuição de frequência em intervalos de classes: Dados quantitativos contínuos

Para dados quantitativos contínuos, geralmente resultantes de medições de características da qualidade de peças ou produtos, dividimos a faixa de variação dos dados em intervalos de classes. O menor valor da classe é denominado limite inferior (li) e o maior valor da classe é denominado limite superior (Li).

O intervalo ou classe pode ser representado das seguintes maneiras:

1. (li)$ \vdash $(Li), onde o limite inferior da classe é incluído na contagem da frequência absoluta, mas o superior não;
2. (li)$ \dashv $(Li)
, onde o limite superior da classe é incluído na contagem, mas o inferior não.

Podemos escolher qualquer uma destas opções, mas é importante que deixemos claro no texto ou na tabela qual delas está sendo usada. Embora não seja necessário, os intervalos são frequentemente construídos de modo que todos tenham larguras iguais, o que facilita as comparações entre as classes.

Na tabela de distribuição de frequência, acrescentamos uma coluna com os pontos médios de cada intervalo de classe, denotada por xi. Esta é definida como a média dos limites da classe $ \displaystyle x_i=\frac{l_i+L_i}{2} $. Estes valores são utilizados na construção de gráficos.

Algumas indicações na construção de distribuição de frequências são:

  • Na medida do possível, as classes deverão ter amplitudes iguais.
  • Escolher os limites dos intervalos entre duas possíveis observações.
  • O número de intervalos não deve ultrapassar 20.
  • Escolher limites que facilitem o agrupamento.
  • Marcar os pontos médios dos intervalos.
  • Ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à frequência absoluta, o que dá no mesmo) correspondente.

Um ponto importante na construção da distribuição de frequência é o numero de intervalos de classes. No Action Stat utilizamos a regra de Sturges para obter o número de intervalos de classes

$$k = 1 + 3,3 ~ log_{10} (n),$$

no qual $ n $ é o tamanho do conjuntos de dados.  

Histograma

Histograma é uma representação gráfica (um gráfico de barras verticais ou barras horizontais) da distribuição de frequências de um conjunto de dados quantitativos contínuos. O histograma pode ser um gráfico por valores absolutos ou frequência relativa ou densidade. No caso de densidade, a frequência relativa do intervalo i, (fri), é representada pela área de um retângulo que é colocado acima do ponto médio da classe  i. Consequentemente, a área total do histograma (igual a soma das áreas de todos os retângulos) será igual a 1. Assim, ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à frequência absoluta, o que é indiferente) correspondente. No caso em que os intervalos são de tamanhos (amplitudes) iguais, as alturas dos retângulos serão iguais às frequências relativas (ou iguais às frequências absolutas) dos intervalos correspondentes.

Exemplo 1.6.2:

Considerando os dados do Exemplo 1.3.4, monte a distribuição de frequências e construa o histograma correspondente.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Como temos dados quantitativos contínuos, para construir a distribuição de frequências, vamos separar os dados em classes. Ao aplicarmos a regra de Sturges obtemos


$$k=1+ 3,3 ~ log_{10} (100) = 7,6.$$

Assim, dividimos os dados em 8 classes de tamanhos iguais. A distribuição de frequências então é a seguinte

Tabela de Frequências
Classe Frequência Freq. Rel. Freq. Perc. Freq. Acum. Densidades Ponto Médio
[4,2 ; 4,4) 6 0,06 6 6 0,3 4,3
[4,4 ; 4,6) 8 0,08 8 14 0,4 4,5
[4,6 ; 4,8) 15 0,15 15 29 0,75 4,7
[4,8 ; 5) 33 0,33 33 62 1,65 4,9
[5 ; 5,2) 18 0,18 18 80 0,9 5,1
[5,2 ; 5,4) 13 0,13 13 93 0,65 5,3
[5,4 ; 5,6) 5 0,05 5 98 0,25 5,5
[5,6 ; 5,8) 2 0,02 2 100 0,1 5,7

 

A seguir, apresentamos o histograma obtido com o software Action Stat.

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Muitas vezes, queremos representar a curva de uma distribuição de probabilidade (por exemplo, normal) junto com o histograma. Esta é uma forma visual de avaliar o ajuste dos dados pela referida distribuição de probabilidade. Entretanto, como a área total da distribuição de probabilidade é igual a $ 1 $, não faz sentido utilizarmos a altura do retângulo como a frequência absoluta ou a frequência relativa. Neste caso, comparamos elementos em escalas distintas. Para contornar este problema, sugerimos utilizar a área de cada retângulo como a frequência relativa cuja a soma é igual a 1. Neste caso, a altura de cada retângulo é dada pela densidade (D) que corresponde frequência relativa dividida pelo tamanho do intervalo de classe. 

Exemplo 1.6.3:

Considerando os dados do Exemplo 1.3.4, construa o histograma de densidades correspondente

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Para construir o histograma de densidades, basta que os retângulos tenham altura do tamanho da densidade de cada classe e largura do tamanho da classe. Neste caso, o histograma ficaria da seguinte forma:

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Dúvidas sobre esse conteúdo? Comente:

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook