A presente apostila (DICAS) foi elaborada para alunos do curso de mestrado e doutorado em Educação Matemática, da UNICAMP, a partir dos capítulos 10 (Selecting the appropriate statistics) e 11 (Collecting, managing, and analyzing the data) do livro de Cone e Foster (1993). Por esta razão, os exemplos utilizados estão relacionados com a área educacional, mas que podem ser estendidos a outras áreas de conhecimento.

 

Selecionando a estatística apropriada

 Segundo os autores, a maioria dos pesquisadores iniciantes enfrentam sérias dificuldades quando tem de usar a análise estatística. Eles apontam como prováveis causas o ensino de Estatística que, frequentemente, tem um enfoque matemático ou de livro de culinária que não conduzem  ao aproveitamento desta ferramenta e, a ansiedade matemática, que pode levar os estudantes a evitar o uso de números e a não confiança na área. Essa situação conduz muitos  estudantes a dependência de outros para selecionar a estatística adequada a seu projeto. O objetivo deste capítulo é ajudar a ter uma idéia da potencialidade da estatística apropriada a sua pesquisa.

 Primeiro examine seu estudo

 Como primeiro passo na escolha da estatística apropriada, identifique o propósito que você quer com sua análise estatística. Inicialmente você deve especificar claramente as várias questões que você quer que sua análise estatística responda. Comece com suas questões de pesquisa e hipóteses. Porém, você precisa ir além disso, pois usará a Estatística para mais do que testar sua hipótese.

 Suponha que desejamos saber como as atitudes em relação à Matemática interferem na formação das atitudes em relação à Estatística e o impacto dessas atitudes no desempenho na disciplina de Estatística, além da interferência de outras variáveis. A Figura 1 esquematiza as variáveis, a relação entre elas e as hipóteses.

 

Variáveis dependentes (VD)

Variáveis independentes (VI)

A seguir, faça uma lista de cada variável que você pretende analisar. Se você está olhando as características demográficas de sua amostra, liste cada peça de dados demográficos e determine como você pegará os dados para cada sujeito em cada variável. Faça a mesma coisa para suas variáveis dependentes e independentes. No nosso exemplo:

  Tabela 1. Lista das variáveis a serem pesquisadas e suas características

Construtos / variáveis

Instrumento

Variáveis

Natureza (1)

Valores / níveis ou categorias

Desempenho em

Estatística (2)

Registros

 acadêmicos

Nota final

Dependente

Quantitativa – contínua

De 0 a 10

Atitudes em relação à Estatística

Escala do tipo

Likert de 20 itens

Pontuação na escala

Dependente

Quantitativa – contínua

De 20 a 80 pontos

Atitudes em relação à Matemática

Escala do tipo

Likert de 20 itens

Pontuação na escala

Independente

Quantitativa – contínua

De 20 a 80 pontos

Área de conhecimento

do curso

Questionário

Área

Independente

Qualitativa nominal

Exatas, Humanas, Biológicas

Turno do curso

Questionário

Turno

Independente

Qualitativa nominal

Diurno, Matutino, Vespertino, Noturno

Gênero

Questionário

Gênero

Independente

Qualitativa nominal

Masculino

Feminino

Idade (3)

Questionário

Faixa etária

Independente

Qualitativa ordinal

Até 18; de 19 a 21; de 22 a 24, + 25

Renda Familiar (4)

Questionário

Faixa de renda

Independente

Qualitativa ordinal

Até 5, de 5 a 10, de 10 a 20, mais de 20

Nº de disciplinas de Matemática cursadas (5)

Histórico escolar

do aluno

Número_mat

Independente

Qualitativa ordinal

Nenhuma, uma,

duas ou mais

Curso no 2º grau

Questionário

Curso_2ºgrau

Independente

Qualitativa nominal

Científico, Técnico, Magistério

Pontuação no vestibular geral (6)

Registro acadêmico

Vestibular_total

Independente

Quantitativa – contínua

0 a 100

Pontuação no vestibular

em Matemática (6)

Registro acadêmico

Vestibular_mat

Independente

Quantitativa – contínua

0 a 100

Auto-percepção de desempenho em Matemática

Questionário

Auto-percepção

Matemática

Independente

Qualitativa ordinal

Péssimo, ruim,

bom, muito bom

Nº de disciplinas de Estatística cursadas (5)

Histórico escolar

do aluno

Número_est

Independente

Qualitativa ordinal

Nenhuma, uma,

duas ou mais

Reprovação em

Estatística (7)

Histórico escolar

do aluno

Reprovação

Independente

Qualitativa nominal

Reprovou, não, cursando 1ª vez

Auto-percepção de desempenho em Estatística

Questionário

Auto-percepção

Estatística

Independente

Qualitativa ordinal

Péssimo, ruim,

bom, muito bom

(1)     As variáveis, de acordo a sua natureza se classificam em quantitativas (discretas e contínuas) e qualitativas ou categóricas (nominal e ordinal); de acordo a sua função em variáveis dependentes (VD) e independentes (VI).

(2)     Você pode elaborar um instrumento para avaliar o desempenho.

(3)     A idade pode ser definida como contínua se perguntarmos a data de nascimento e calcularmos a idade exata, com frações de anos; como discreta, se perguntarmos a idade em anos completos, e qualitativa ordinal, se fixarmos faixas, como, por exemplo, menos de 18 anos; de 19 a 21; de 22 a 24, e 25 anos ou mais.

(4)     A renda familiar, idem a variável idade: contínua (valor exato); discreta (número de salários mínimos completos); ordinal (faixas de renda).

(5)     Via de regra, este tipo de variável toma poucos valores, logo pode ser definida como ordinal: nenhuma, uma, duas ou mais.

(6)     Depende da Universidade, via de regra a pontuação é padronizada. Outra forma de mensurar esta variável é o posto que o aluno ocupou no vestibular.

(7)     Você pode definir como qualitativa nominal: reprovou, não reprovou, cursando pela primeira vez.

Sugestão: se possível, pegue o dado bruto, depois via SPSS agrupe, isto lhe dará flexibilidade para diversos agrupamentos. Se você não conhece a definição dos termos estatísticos procure o GLOSSÁRIO em anexo.

Não se preocupe se você fica confuso. Confusão pode ser sinal que você precisa clarear exatamente como cada medida gerará um dado. Tire uma cópia de cada instrumento, simule dados para poucos sujeitos, registre os dados e examine os resultados. No final desse processo, você terá uma lista de questões que você tenta responder com Estatística e uma segunda lista de variáveis que aquelas estatísticas usaram de uma ou de outra maneira.

Observe que algumas variáveis serão coletadas por instrumentos, alguns já elaborados e validados, tais como a escala de atitudes, outros você elaborará. Se você opta por construir o instrumento (por exemplo, uma prova para avaliar o desempenho), lembre-se de validar o instrumento.

A seguir, escolha uma das questões que você tenta responder com Estatística. Indique as variáveis independentes e dependente (categorias ou valores) específicas envolvidas na resposta desta questão. Por exemplo, se a questão fosse: “a área de conhecimento do curso e gênero interferem na formação de atitudes em relação à Estatística”. Você deve listar a variável gênero (Masculino, Feminino) e variável área de conhecimento (Exatas, Humanas, Biológicas) como variáveis independentes e a pontuação na escala como variável dependente. Então, pergunte a sim mesmo:

(a)    esta questão será respondida comparando grupos de sujeitos? ou,
(b)   esta questão será respondida relacionando a pontuação das diferentes variáveis a uma outra em um único grupo de sujeitos?

 Neste caso, a primeira alternativa é a correta. Você precisa comparar pontuações entre vários grupos. As estatísticas que comparam grupos são os delineamentos experimentais e quase-experimentais, que comparam entre grupos, dentro de grupos, e mistos. Note que uma comparação estatística de grupos pode ser apropriada se você está comparando  ou (a) as pontuações de diferentes grupos de indivíduos (Masculino, Feminino) ou (b) as pontuações do mesmo grupo de indivíduos que tem sido registrados em diferentes pontos no tempo (pré-teste e pós-teste) ou sobre diferentes condições.

No nosso exemplo:


Hipótese: existe diferença significativa

 Os delineamentos que requerem estatísticas de comparação de grupos usa variáveis independentes que o pesquisador define de forma que os sujeitos se encaixem em grupos, onde cada grupo é chamado de nível e tem seu rótulo, chamadas de variáveis qualitativas ou categóricas. No nosso exemplo: Gênero (Masculino e Feminino), área de conhecimento (Exatas, Humanas e Biológicas). Se o pesquisador não está interessado nas diferenças por gênero, esta não deve ser considerada como variável independente e o pesquisador não tem porque examiná-la.

Se você deseja tratar seus sujeitos como um único grupo e examinar associações entre pontuações, um delineamento correlacional pode ser mais apropriado. Este será o caso se a questão de pesquisa for “qual a relação entre as atitudes em relação à Estatística (medido pela somatória de pontos obtidos nos 20 itens da escala de atitudes), as atitudes em relação à Matemática (similar a anterior) e o desempenho em Estatística (mensurado como a nota final na disciplina)?” Esta pesquisa trata todos os sujeitos como um simples grupo. Eles não estão sorteados em grupos separados. Nos estudos correlacionais  as variáveis podem ser contínuas ou discretas, embora é mais freqüente serem contínuas. Nos procuramos por estatísticas correlacionais para responder questões de tipos de associação ou de relação. Neste caso usaremos as técnicas de correlação e de regressão

Variável independente
Quantitativa 
(covariável)

 

Variável dependente
Quantitativa

 

Variável dependente
Quantitativa

Atitudes em relação à matemática

  ----->

Atitudes em relação

à Estatística

  <---->

Desempenho

em Estatística

 

Um outro exemplo: suponha que você está interessado  em saber se crianças com alto coeficiente de inteligência (QI) experimentam mais problemas com seus pais do que crianças sem alto QI. Você pode delinear seu estudo de duas formas: (a) coletar a pontuação do QI e da interação com os pais e examinar a relação entre eles, ou (b) sortear crianças em grupos de QI, com dois ou mais níveis (pe. alto e médio QI) e olhar a diferença entre os grupos na interação com seus pais, usando uma comparação de grupos.


QI medido com testes apropriados
Interação com os pais (quantitativa), medido com um instrumento similar a escala de atitudes.

Via de regra, delineamentos correlacionais são mais apropriados quando você conceitua sua variável independente como contínua (pe. inteligência, pontuação na escala de atitudes, nota numa prova) ou se você deseja  examinar as melhores combinações de variáveis independentes para prever uma única variável dependente. Também, é adequado quando você não consegue manipular as variáveis independentes (você não pode manipular, inteligência, atitudes, etc.). De outro lado, se você transformar uma variável contínua em grupos e usar estatísticas de comparação, seus resultados perdem poder estatístico.

Delineamento de comparação de grupos são mais apropriados que os delineamentos correlacionais quando a variável independente é naturalmente categorizada (por exemplo, gênero, tipo de escola, área de conhecimento), ou baseada em variáveis combinadas, em um forma não linear (por exemplo, diagnóstico psiquiátrico,  os quais estão baseados na presença, ausência ou degraus de vários comportamentos). Comparação de grupos, também, são mais apropriados quando você manipula as variáveis independentes (por exemplo tratamento versus controle).

Como segundo passo na escolha da estatística apropriada, cheque se sua variável dependente é adequada para a estatística paramétrica. A estatística paramétrica envolve dois pressupostos, subjacentes a distribuição dos escores na população, onde você está amostrando. O primeiro é que esses escores seguem uma distribuição normal e, o segundo, é que os dados entre diferentes sujeitos são independentes. Outros testes paramétricos tem requerimentos adicionais. Portanto, uma variável qualitativa ou categórica não se enquadra neste tipo de estatística, devendo usar o enfoque da estatística não paramétrica.

Assim recorremos a estatística paramétrica quando analisamos variáveis dependentes contínuas. Se essas variáveis violam os pressupostos e não tem como corrigir essa violação, então você deve utilizar a estatística não paramétrica.

Examine cada variável dependente uma por uma nesse processo. Nem todas terão as mesmas características. Um erro comum, por exemplo, é assumir que você pode usar o mesmo teste estatístico  se os grupos experimentais são equivalente em idade, gênero, anos de estudos e outras variáveis demográficas. Idade e anos de estudo são duas variáveis geralmente analisadas com estatística paramétrica. Gênero e etnia são variáveis categóricas e por isto devem ser analisadas com Estatística não paramétrica.

Você poderá usar diferentes estatísticas.

Neste ponto, você tem uma lista de questões que você usará estatística para responder.  Você tem uma lista de variáveis dependentes e variáveis independentes. Para cada variável dependente você indicará se um teste paramétrico é adequado ou não. Finalmente, você indicará se a questão envolve análise comparando grupos (estatísticas de comparação de grupos) ou relacionando escores de uma ou mais medidas em um único grupo (estatística  correlacional).

No nosso exemplo, a variável dependente pode ser tanto as atitudes em relação à Estatística, quanto as notas na disciplina. Via de regra, a pontuação na escala de atitudes segue uma distribuição normal, já as notas, nem sempre. Você tem duas opções: uma aprender a lidar com a Estatística não paramétrica, a outra, aumentar o tamanho da amostra.

Supondo que suas variáveis dependentes tivessem uma distribuição normal ou que sua amostra fosse suficientemente grande, você deve verificar todas as possibilidades de análise: univariada , bivariada, múltipla e multivariada, se for o caso. A Tabela 2 mostra o planeamento para análise univariada e bivariada. Numa primeira triagem você deve rodar todas as análises, colocar os resultados de forma sintética e depois explorar aquelas que apresentaram resultados interessantes. Lembre-se que não encontrar os resultados esperados, também pode ser interessante. Faça uma análise cuidadosa dos resultados.

     A análise univariada é quando a variável é analisada per se, análise bivariada quando uma variável dependente é relacionada com uma única variável independente, análise múltipla quando se analisa uma variável dependente em função de várias variáveis independentes, e análise multivariada, quando se analisa várias variáveis dependentes contínuas em função de variáveis independentes categóricas ou quando se analisa a estrutura das variáveis, visando a redução do número de variáveis.

Se a variável dependente for categórica e você deseja saber, por exemplo, se esta se relaciona com uma variável independente categórica, você deverá utilizar o teste Qui-quadrado. Por exemplo, se você quer saber se a escolha do curso (área de conhecimento) está relacionada ao Gênero, ou se as mulheres tendem a ter uma auto-percepção de desempenho em Estatística  menos positiva do que os homens. A Tabela 3 e as Figuras 2 e 3 complementam o esquema de análise.

 

Tabela 2. Planejamento das análises estatísticas univariadas e bivariadas das variáveis

 

 

 

Variáveis

Análise univariada

 

Análise bivariada

Variável dependente: Nota final (*)

Estatísticas

Gráficos

Apropriados

 

Estatísticas

Gráficos

apropriados

Nota final

n, média, dp

Histograma, ramo e folhas ou box-plot

 

 

 

Pont. na escala estatística

n, média, dp

Histograma, ramo e folhas ou box-plot

 

Correlação bivariada

 regressão simples

Scatter plot

Pont. na escala matemática

n, média, dp

Histograma, ramo e folhas ou box-plot

 

Correlação bivariada

Regressão simples

Scatter plot

Área

TDF

Barras

 

ANOVA – Teste F

box-plot

Turno

TDF

Barras

 

ANOVA – Teste F

box-plot

Gênero

TDF

Barras

 

Teste t-student

box-plot

Faixa etária

TDF

Barras

 

ANOVA – Teste F

box-plot

Faixa de renda

TDF

Barras

 

ANOVA – Teste F

box-plot

Número_mat

TDF

Barras

 

ANOVA – Teste F

box-plot

Curso_2ºgrau

TDF

Barras

 

ANOVA – Teste F

box-plot

Vestibular_total

n, média, dp

Histograma, ramo e folhas ou box-plot

 

Correlação bivariada regressão simples

Scatter plot

Vestibular_mat

n, média, dp

Histograma, ramo e folhas ou box-plot

 

Correlação bivariada regressão simples

Scatter plot

Auto-percepção Matemática

TDF

Barras

 

ANOVA – Teste F

box-plot

Número_est

TDF

Barras

 

ANOVA – Teste F

box-plot

Reprovação

TDF

Barras

 

ANOVA – Teste F

box-plot

Auto-percepção Estatística

TDF

Barras

 

ANOVA – Teste F

box-plot

TDF= Tabela de distribuição de frequências (use a opção frequencies do SPSS);
 
n = tamanho da amostra
dp = desvio padrão;
(*) o mesmo esquema pode ser utilizado para a variável atitudes em relação à Estatística

 

Tabela 3. Exemplo dos principais testes estatísticos