As variáveis estatísticas podem ser qualitativas ou quantitativas (contínuas ou discretas). As varáveis qualitativas definem qualidades dos indivíduos (por exemplo, género, estado civil, cor do cabelo) e as variáveis quantitativas são caraterísticas mensuráveis dos indivíduos (por exemplo, idade, peso, número de irmãos).
![]() |
| Variável qualitativa |
![]() |
| Variável quantitativa |
Censos (ou recenseamento) e sondagem:
No recenseamento o estudo efetua-se com todos os elementos da população e na sondagem o estudo efetua-se com uma parte da população (a amostra).
Medidas de localização (média, moda, mediana e quartis):
Média: somam-se os valores e dividem-se pelo total de dados;
Moda: dado que ocorre com maior frequência, há conjuntos de dados com mais do que uma moda (bimodal, trimodal,...) e outros que não têm moda (amodal).
Mediana (ou 2º quartil): é um valor que divide a amostra ordenada ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os restantes 50% são maiores ou iguais à mediana. Para calcular a mediana colocam-se os valores por ordem crescente ou decrescente, e se o número de dados for ímpar, a mediana é o valor central. Se o número de dados for par, a mediana é igual à média dos dois valores centrais.
Quartis:uma vez a amostra dividida em duas partes com igual número de elementos, cada uma destas partes ainda pode ser dividida ao meio. Às medianas da parte inferior e superior dos dados, chamamos respetivamente 1.º quartil e 3.º quartil e representamos por Q1 e Q3. Assim, o 1.º quartil, a mediana e o 3.º quartil dividem a amostra (ordenada) em 4 partes iguais, cada uma contendo 25% dos dados.
Gráfico ou diagrama de caule-e-folhas:
É uma representação que se situa entre a tabela e o gráfico, uma vez que, de um modo geral, apresenta os verdadeiros valores da amostra, mas de uma forma sugestiva, faz lembrar o histograma. O gráfico caule-e-folhas é muito útil para comparar observações que digam respeito à mesma variável, mas que tenham sido recolhidas de grupos (populações) distintos. Para representar os caule-e-folhas paralelos, determinamos os caules (comuns) a partir da amostra de maior amplitude.
Medidas de dispersão (amplitude e amplitude interquartis)
Amplitude de um conjunto de dados: diferença entre o máximo e o mínimo dos valores da amostra;
Amplitude interquartis de um conjunto de dados: é a diferença entre o 3º e o 1º quartis (Q3 – Q1). A variabilidade (dispersão) dos dados que ficam entre o 1º e o 3º quartis é tanto maior quanto maior for a amplitude interquartis.
Conhecendo os extremos (mínimo e máximo), a mediana e os quartis é possível construir o diagrama de extremos e quartis.
Quartis:uma vez a amostra dividida em duas partes com igual número de elementos, cada uma destas partes ainda pode ser dividida ao meio. Às medianas da parte inferior e superior dos dados, chamamos respetivamente 1.º quartil e 3.º quartil e representamos por Q1 e Q3. Assim, o 1.º quartil, a mediana e o 3.º quartil dividem a amostra (ordenada) em 4 partes iguais, cada uma contendo 25% dos dados.
Gráfico ou diagrama de caule-e-folhas:É uma representação que se situa entre a tabela e o gráfico, uma vez que, de um modo geral, apresenta os verdadeiros valores da amostra, mas de uma forma sugestiva, faz lembrar o histograma. O gráfico caule-e-folhas é muito útil para comparar observações que digam respeito à mesma variável, mas que tenham sido recolhidas de grupos (populações) distintos. Para representar os caule-e-folhas paralelos, determinamos os caules (comuns) a partir da amostra de maior amplitude.
Medidas de dispersão (amplitude e amplitude interquartis)
Amplitude de um conjunto de dados: diferença entre o máximo e o mínimo dos valores da amostra;
Amplitude interquartis de um conjunto de dados: é a diferença entre o 3º e o 1º quartis (Q3 – Q1). A variabilidade (dispersão) dos dados que ficam entre o 1º e o 3º quartis é tanto maior quanto maior for a amplitude interquartis.
Conhecendo os extremos (mínimo e máximo), a mediana e os quartis é possível construir o diagrama de extremos e quartis.
Simetria
Distribuições simétricas:
Uma distribuição diz-se simétrica se a média divide o histograma em duas metades iguais. Se a distribuição dos dados se apresentar aproximadamente simétrica, então a média e a mediana coincidem (ou são valores próximos) (Mediana= Média)
Distribuições enviesadas:
(1) Enviesamento à direita:
Se a distribuição tem uma maior concentração de dados junto do valor mínimo, diz-se enviesada à direita (a cauda direita é mais longa) e a mediana está à esquerda da média (Mediana < Média)
(2) Enviesamento à esquerda:
Se a distribuição tem uma maior concentração de dados junto do valor máximo, diz-se enviesada à esquerda (a cauda esquerda é mais longa) e a mediana está à direita da média (Mediana > Média)






Sem comentários:
Enviar um comentário