GLOSSÁRIO DE NOÇÕES ELEITORAIS E DE PESQUISA

 

Neste espaço estão expostos alguns termos ou expressões técnicas mais utilizadas nas pesquisas eleitorais (Anexo 1) e no processo de pesquisa propriamente dito (Anexo 2). Agenor Gasparetto.

 
ANEXO 1 – ALGUNS TERMOS TÉCNICOS UTILIZADOS NAS ELEIÇÕES E ALGUMAS QUESTÕES SUSCITADAS PELAS PESQUISAS ELEITORAIS

Eleições:  processo de escolha, mediante votação secreta, dos dirigentes e de representantes para cargos eletivos.  

Pesquisas eleitorais: método utilizado pelos institutos de pesquisa para sondarem, por amostragem, a predisposição de votar dos eleitores.

Função principal das pesquisas eleitorais: refletir a realidade num dado momento do processo sucessório. Trata-se de um corte, um flash com margem de erro, sendo esse conhecido. Como a realidade é dinâmica, nela atuando sujeitos e estando em confronto estratégias e ações visando capturar a intenção de voto dos eleitores, os resultados de uma pesquisa eleitoral tende a ficar progressivamente defasados. Uma pesquisa, aqui, eqüivale a função de um termômetro. Mede a temperatura. Todavia, não cabe ao termômetro uma função de cura, mas apenas de diagnóstico. Obviamente, um bom diagnóstico melhora e muito as condições de intervenção.

Função instrumental das pesquisas eleitorais:  uma segunda função possível dos resultados de uma pesquisa eleitoral deriva de sua utilização com finalidade de propaganda. Aqui, mais importante do que a função de informação de um quadro diagnosticado importa sua presumível atuação junto a decisão do eleitor, induzindo-o a alguma forma de voto útil, ao voto ganhador. As principais formas dessa instrumentalização são: divulgação de pesquisa defasadas, que captaram uma realidade pretérita e que não permanece. Todavia, essa divulgação pretende reduzir a velocidade de mudança do quadro, retardando-a com a projeção como se fosse hoje um quadro de semanas anteriores. Uma outra modalidade é divulgar os resultados concernentes à expectativa de vitória como se fossem resultados de intenções de voto. Todavia, essa variável reflete principalmente volume de propaganda e não necessariamente intenções de voto. Pode ser até um bom indicador de poder (ou de abuso de poder) econômico num processo eleitoral. Como há uma predisposição de parte do eleitorado em não votar em quem não tem viabilidade (voto útil) ou para não perder o voto, a presença massiva da propaganda contribui para criar um clima de vitória.  Um outra modalidade é sonegar algumas informações, divulgando-as seletivamente. Por exemplo, não divulgar os resultados da estimulada e de rejeição se na espontânea é observado o melhor desempenho da candidatura interessada nessa divulgação. Uma outra modalidade, essa no âmbito da delinqüência,  é divulgar pesquisas falsas utilizando nome de algum instituto com credibilidade.

Prazo de validade de uma pesquisa: para uma pesquisa não ser qualificada como de validade vencida precisa ser atual.   Ou, se não for atual, ter a garantia que está refletindo um quadro estabilizado. É aqui que é relevante a presença de um Sociólogo. Cabe a esse profissional fazer a leitura e interpretação da realidade e informar da natureza da situação. Via de regra, quanto mais próximo estivermos de uma eleição, menor é o prazo de validade de um resultado eleitoral. Na véspera de uma eleição, os institutos não sustentam por mais de alguns dias os seus resultados. E isto porque a realidade é dinâmica e, por vezes, numa disputa acirrada, em um dia o quadro muda. Aqui, sentar na cadeira de prefeito na véspera poderá implicar e não fazê-lo no dia seguinte à eleição. Há quadros que seis meses antes a situação está definida. Em outros, é preciso esperar a contagem dos votos. Mais uma vez, aqui a palavra de um Sociólogo pode fazer a diferença.

Pesquisa e urnas: nenhuma pesquisa pode ter a pretensão de substituir a eleição propriamente dita. A pesquisa por excelência é a própria eleição. Nesse sentido, ainda que os institutos tenhamos a pretensão de passar à sociedade uma pretensão de infalibilidade, no propósito de criarem, consolidarem ou recuperarem sua credibilidade ou por razões de sobrevivência,  o fato é que toda pesquisa é uma aproximação da verdade que a realidade contém. O eleitor não deve se impressionar com sinais de arrogância desse tipo, frutos da pretensão acima referida.  

Pesquisa espontânea:  consiste na resposta do eleitor entrevistado à pergunta que sonda sobre sua intenção de voto. É sempre a primeira questão de cunho eleitoral formulada. Capta o que se passa na cabeça do eleitor quando o assunto é prefeito a ser  votado. O resultado a essa questão informa sobretudo a intensidade da campanha ou nível de internalização pelo eleitor de uma campanha. No fundo, tende a refletir o volume ou massificação do nome do candidato, embora seja um bom indicador de desempenho dos candidatos. Quando mais próximo estivermos da eleição, mais altos tendem a ser os percentuais de eleitores que apontam um ou outro candidato. No dia da eleição tende a coincidir com a pesquisa estimulada, já que serão poucos os que permanecem alheios ao processo de escolha do novo prefeito, por exemplo.

Pesquisa estimulada ou induzida ou ainda motivada: aqui, o eleitor é informado sobre os candidatos que estão em disputa. Dentre os nomes que  lhe são expostos, é convidado a apontar um. Essa resposta é a pesquisa eleitoral propriamente dita. Avalia o desempenho dos diferentes candidatos.

Pesquisa de rejeição: essa  é a pesquisa estimulada na sua forma negativa. O eleitor é convidado a apontar os nomes dos candidatos em quem não votaria de jeito nenhum. É possível que nenhum seja rejeitado. É possível que um ou mais sejam rejeitados. E também é possível que todos sejam rejeitados. Quando isso ocorre, na estimulada, o eleitor terá apontado que votará nulo, ou branco ou que não comparecerá a seção eleitoral para votar no dia da eleição. Esse eleitor é avesso aos políticos e talvez à prática política. Trata-se de uma forma de protesto.

Indecisos: as pesquisas chamam indeciso o eleitor que na pesquisa estimulada não apontou nenhum nome e não votará nem nulo e nem branco. A rigor, indeciso significa quase sempre indiferente. Trata-se do indivíduo desinteressado pelas eleições e que até a véspera não sabe em quem irá votar e sendo o voto obrigatório vai a sua seção eleitoral e faz alguma escolha. Pelo seu nível de desinformação e desinteresse, é bastante suscetível de influência pelas pesquisas ou pela boca de urna. Há, evidentemente, também eleitores realmente indecisos.

Quem vai ganhar ou expectativa de vitória: a pergunta sobre quem irá ganhar a eleição é um bom indicador de volume ou massificação da propaganda. Não é necessariamente um bom indicador de intenções de voto. Quando alguma candidatura apresenta esse dado o faz com intuito de propaganda e é revelador de que o quadro no tocante a intenções de voto não vai tão bem quanto desejado. A divulgação dessa informação isolada consiste numa apelação e numa tentativa de iludir o eleitor, fazendo supor que haveria igualdade entre intenções de voto e expectativa de vitória. O correto é divulgar a pesquisa estimulada como indicadora do quadro de intenções de voto e não outras como essa.

Questão da influência das pesquisas eleitorais sobre o eleitor: consiste na capacidade das pesquisas em mudar a opinião e o comportamento do eleitor.

Cerne do problema da influência: situa-se no fato de que os eleitores, em conseqüência de discursos e de práticas, tendem a internalizar uma pretensão de infalibilidade dos institutos, reforçada pelos meios de comunicação. Na prática, esse  problema consiste no fato de que eleitores assumem, em graus variados, os resultados das pesquisas como verdade imune ao erro. (Ver artigo Pesquisas eleitorais: informação e propaganda, nesta página).

Questões concernentes às pesquisas eleitorais: no plano ético, há o problema da influência, da indução; o problema da manipulação e da distorção dos resultados; o problema de converter a pesquisa num instrumento privilegiado de propaganda. No plano técnico, a margem de erro e o erro propriamente dito, o erro por incompetência sobretudo no processo de amostragem.

Significado dos resultados de pesquisas eleitorais:  Não há um significado único. As pesquisas assumem diferentes significações e desempenham funções diversas em função do contexto no qual são inseridas.

Significado dos resultados de pesquisas eleitorais na perspectiva dos candidatos:

a)        As pesquisas são feitas para captar momentos de um processo, são retratos. Uma sucessão de retratos pode apontar uma direção, tendências. 

b)        As pesquisas também cumprem a função de formação de opinião, influenciam, não são neutras. 

c)        assumem funções de ferramenta útil ao planejamento e para a tomada de decisões, estratégias e ações de campanha e, também,

d)        podem se constituir em peças de propaganda eleitoral. Em resumo, são informações, e como toda informação dotada de relevância, são tomadas em consideração e podem influir. 

Significado dos resultados de pesquisas eleitorais na perspectiva dos eleitores:

Na perspectiva dos eleitores, os resultados das pesquisas são informações úteis, em graus variados:

São informações que sintetizam situações complexas. Sintetizam, em percentuais de fácil entendimento, a resultante em intenções de voto. Em série, revelam tendências, a evolução do processo. Em resumo, são sínteses numéricas que têm a pretensão de conter a verdade das urnas, antecipando-a pela expressão “se a eleição fosse hoje...”, que poderia ser assim interpretada “mantendo-se tudo como está, esse será o resultado das eleições”.  Essa é a verdade de que são portadoras e nisso reside o potencial enquanto peças de propaganda, ainda que sejam apresentadas como informação disputando espaço com um mundo de outras.

Principais significações assumidas pelas pesquisas eleitorais:

Significações das pesquisas boca de urna:

As pesquisas boca de urna são pós-voto. Da perspectiva da influência na decisão do eleitor, nada significam, são natimortas. Cumprem, todavia,  três funções principais:

a)         antecipam em algumas horas os prováveis resultados das eleições. (=função manifesta);

b)        são  utilizadas como fontes de legitimação e de credibilidade (=função principal); 

c)         com a massificação dos seus resultados e seu confronto com o resultado das urnas, o eleitor perde de vista o desempenho dos institutos no período pré-voto. O foco passa da influência para ser apenas o erro das pesquisas.

Significações das pesquisas pré-voto: 

a) Das pesquisas divulgadas até o término da campanha: dizem respeito ao direito do eleitor  de ser informado sobre as perspectivas das diferentes candidaturas, podendo, se assim o desejar, pautar sua decisão, combinando  afinidade com algum pragmatismo. A sua divulgação é eticamente aceitável.

b) Das pesquisas após o término da campanha até o dia da eleição, incluindo-o:  essas funcionam, na prática, como uma continuação da campanha eleitoral por outros meios, independentemente da intencionalidade dos realizadores e veiculadores das mesmas.  O seu efeito, aqui, pelo contexto marcado pela ausência de quem as conteste, tende a ser mais forte.  Em vez de luz para uma decisão, ofuscam o livre discernimento do eleitor após período de intensa campanha.

Da influência das pesquisas eleitorais: 

Os eleitores podem ser afetados em graus variados:

a)         apenas induzindo a apatia eleitores que sentem que seu candidato não tem chances.

b)         induzindo a alguma forma de voto útil,  combinando afinidade com algum pragmatismo;

c)         até tomando das pesquisas sua decisão, pela razão de não perder o voto (pobreza cultural).

Do direito de informar: no fundo, utilizar o argumento da neutralidade absoluta, não diferenciando contextos,  é querer assegurar o uso monopolizado do direito. Assim como há o direito de informar, também há o direito de igualdade de condições, de não interferência de fatores externos nas  campanhas e nos destinos de uma eleição.  Pergunta relevante aqui: qual é o princípio-mor que comanda o espaço que deve ocupar cada notícia num veículo de comunicação? Se as pesquisas fossem neutras, seriam inúteis da perspectiva do impacto e da sua influência. Jornais, revistas e programas noticiosos, na perspectiva de sua linha editorial e de seus interesses, não costumam colocar manchetes insossas, desinteressantes.  É a capacidade de impactar que conta. 

(Ver artigo Pesquisas eleitorais: informação e propaganda, nesta página).

Do conceito regular. Toda divulgação eivada por intentos de propaganda é tentada pela transformação do conceito regular atribuído a uma administração pública como conceito positivo, agregando-o aos conceitos ótimo e bom. Quem agrega o conceito regular aos conceitos positivos poderia pelas mesmas razões agregá-lo aos conceitos negativos, ruim e péssimo. Nos 11 anos da Sócio Estatística sempre classificamos o conceito regular como um conceito ambíguo, uma vez que diz respeito ao eleitor e cidadão que percebe elementos positivos e negativos e no balanço permanece na ambigüidade ou, simplificando, em cima do muro. A experiência mostra que quando esse sujeito desce do muro ou dele cai, via de regra, soma mais para o negativo. A razão parece ser muito simples: ninguém se satisfaz com uma comida, um carro, um calçado ou uma roupa regular,  tendo uma boa ou ótima ao seu alcance. Portanto, a junção do regular para qualquer uma das direções, positiva ou negativa, responde a um intuito sutil de propaganda cavalgando uma informação. A propósito, recomenda-se nesta mesma página: Nota de Esclarecimento, A integridade dos resultados de uma pesquisa..., Administração Pública e Reeleição, Administração Pública, Pesquisas eleitorais: informação e propaganda.

 

 

ANEXO 2 –  ALGUNS TERMOS ESTATÍSTICOS UTILIZADOS NAS PESQUISAS

População. Toda questão de pesquisa define um universo de objetos aos quais os resultados do estudo deverão ser aplicados.  A população alvo, também, chamada população estudada, é composta de elementos distintos possuindo um certo número de características comuns (pelo menos uma). Essa característica comum deve delimitar inequivocamente quais os elementos que pertencem à população e quais os que não pertencem. Estes elementos, chamados de unidades populacionais, são as unidades de análise sobre as quais serão recolhidas informações. Por exemplo, todos os eleitores de um município constituem a população alvo ou população referência.

Amostra. Uma amostra é um subconjunto de indivíduos da população alvo. Existem dois tipos de amostras, as probabilísticas, baseadas nas leis de probabilidades, e as amostras não probabilísticas, que tentam reproduzir o mais fielmente possível a população alvo. Entretanto, somente as amostras probabilísticas podem, por definição, originar uma generalização estatística, apoiada no cálculo de probabilidades e permitir a utilização da potente ferramenta que é a inferência estatística. Por exemplo, os eleitores selecionados por uma pesquisa de intenções de voto.

Variável é uma característica da população. Toda questão de pesquisa define um número de construções teóricas que o pesquisador quer associar. O grau de operacionalização destas construções não faz parte de um consenso. Por essa razão, a seção que trata das definições das variáveis deve permitir ao leitor avaliar a adequação entre os instrumentos utilizados, as variáveis escolhidas e as construções teóricas descritas no quadro conceitual.

Variáveis dependentes. Mede o fenômeno que se estuda e que se quer explicar. São aquelas cujos efeitos são esperados de acordo com as causas. Elas se situam, habitualmente, no fim do processo causal e são sempre definidas na hipótese ou na questão de pesquisa. No caso, o desempenho dos diferentes candidatos em termos de intenções de voto.

Variáveis independentes. São aquelas variáveis candidatas a explicar a(s) variável(is) dependente(s), cujos efeitos queremos medir. Aqui devemos ter cuidado, pois mesmo encontrando relação entre as variáveis isto, não necessariamente, significa relação causal. Nas pesquisas eleitorais da Sócio Estatística, as comumente mais utilizadas são faixas de idade, níveis de instrução, classes sócio-econômicas, sexo, regiões e religião.

Variável qualitativa (ou categórica) nominal. São aquelas cujas respostas podem ser encaixadas em categorias, sendo que cada categoria é independente, sem nenhuma relação com as outras: sexo (masculino, feminino), raça (branco, preto, outro), etc.

Variável qualitativa (ou categórica) ordinal. São aquelas cujas  categorias mantém uma relação de ordem com as outras, que podem ser regulares ou não (existe uma ordem natural nas categorias): classe social (alta, média, baixa), auto-percepção de desempenho em Matemática (péssimo, ruim, regular, bom , ótimo), etc.

A rigor, no tratamento estatístico das variáveis categóricas, não existe diferença se ela for nominal ou ordinal, a única observação é que quando se está lidando com uma variável ordinal, é aconselhável manter a ordem natural das categorias, de menor para maior, na hora da apresentação, seja em tabela, ou em gráficos.

Variável quantitativa discreta. São aquelas resultantes de contagens, constituem um conjunto finito de valores: número de filhos, número de reprovações em matemática, idade em anos completos, etc.

Variável quantitativa contínua Resultados de mensurações, podem tomar infinitos valores: pontuação na escala de atitude, nota dada a administração de um prefeito, por exemplo, podendo variar de zero a dez e todos os valores intermediários contidos.

Descrição das variáveis. A variável  constitui um primeiro nível de operacionalização de uma construção teórica e, para cada uma, se deve dar, em seguida, uma descrição operacional. Para algumas variáveis a descrição é simples, porém, em outros casos, essa definição é mais complexa. Uma variável contínua, pode ser transformada em discreta e depois em categórica ordinal, por exemplo idade (como diferença entre a dada e data de nascimento, anos completos, faixas de idade). É recomendável tomar o valor bruto e depois categorizá-lo, isso da mais flexibilidade ao pesquisador.

Parâmetro é uma medida usada para descrever, de forma resumida, uma característica da população, Por exemplo a média populacional (m), a proporção populacional (p), a variância populacional (s), etc. Os parâmetros, via de regra, são desconhecidos e desejamos estimar a partir de uma amostra.

Média populacional (m), é o valor que representa um conjunto de valores da população. Definida como a soma de todos os valores da população dividido pelo número de observações. Por exemplo: renda per capita de um país, esperança de vida, renda familiar média, pontuação média na escala de atitudes em relação à Estatística

Proporção populacional (p), é um valor, resultante do cociente entre o número de casos favoráveis e o número de casos possíveis na população. Por exemplo: proporção de eleitores que votarão no candidato A nas próximas eleições.

Variância populacional (s2), mede o grau de dispersão dos valores da variável, na população, em relação à média populacional. Definida como a soma dos quadrados dos desvios dos valores da variável em relação a sua média, divido pelo número de observações: Soma[(Xi – média)2]/n

Covariância é a medida de dispersão simultânea de duas variáveis quantitativas em relação as suas médias. É a soma dos produtos dos desvios das variáveis em relação a sua média, divido pelo número de observações: Soma[(Xi – médiaX)*(Yi – médiaY)]/n. É o numerador do coeficiente de correlação.

Correlação populacional (r2), mede o grau de relação linear entre duas variáveis quantitativas. É igual a covariância dividida pelo desvio padrão de cada uma das variáveis.

Estatística ou estimador é uma característica da amostra, ou seja, é uma função dos valores da amostra, por exemplo, a média amostral, a proporção amostral, a variância amostral, etc.

Média amostral (X, se lê X barra), é uma variável aleatória, função dos valores da amostra, é definida como a soma de todos os valores da amostra dividido pelo número de observações. Ela é aleatória, por que nunca podemos saber antecipadamente, que elementos populacionais serão selecionados naquela amostra; por essa razão, ela tem uma função de probabilidade que nos permite estimar as chances de nossas estimativas estarem certas. Serve para estimar a média populacional.

Proporção amostral ( p se lê p barra), é uma variável aleatória, função dos valores da amostra, é definida como o cociente resultante entre o número de casos favoráveis e o número de casos possíveis na amostra. Serve para estimar a proporção populacional.

Estimativa (ou Estimativa pontual) é o valor que a estatística toma em uma amostra determinada.

Erro de estimação  é a diferença entre o verdadeiro valor do parâmetro e o valor calculado a partir do dados de uma amostra. Este depende diretamente do grau de dispersão (variabilidade) da variável em estudo e inversamente ao tamanho da amostra. Usualmente, trabalha-se em pesquisas eleitorais com erro amostral da ordem de 5%. Esse erro concilia custos e precisão.

Intervalo de confiança é um intervalo centrado na estimava pontual, cuja probabilidade de conter o verdadeiro valor do parâmetro é igual ao nível de confiança. Em pesquisas eleitorais, trabalha-se, via de regra, com um intervalo da ordem de 95%.

a  é a probabilidade de erro na estimação por intervalo.

(1 - a) Nível de confiança é a probabilidade de que o Intervalo de Confiança contenha o verdadeiro valor do parâmetro.

Hipóteses. Uma hipótese é um enunciado formal das relações esperadas entre pelo menos uma variável independente e uma variável dependente. Nas pesquisas exploratórias, as hipóteses podem se tornar questões de pesquisa. Estas questões pela sua especificidade, devem dar testemunho do trabalho conceitual efetuado pelo pesquisador e, pela sua clareza, permitir uma resposta interpretável. Numa pesquisa eleitoral, espera-se que pertencer a uma classe ou outra influi no comportamento eleitoral.

Hipótese alternativa (H1). As hipóteses de uma pesquisa devem enunciar-se por propostas claras e específicas quanto possível, via de regra, é o que você quer mostrar. O trabalho dos assessores assenta-se em hipóteses, por exemplo, se o candidato fizer isso ou disser aquilo terá as essas ou aquelas conseqüências em intenções  de voto.  Ou ainda, o quadro de intenções de voto mudará com o programa gratuito de propaganda nas rádios e televisão.

Hipótese nula (Ho). A hipótese nula é a negação  da hipótese alternativa, por isso, via de regra, você sempre torce para que ela seja rejeitada, como no caso seguinte: “a propaganda na televisão não exercerá influência sobre os eleitores”. Está é a hipótese que esta sendo testada por qualquer teste estatístico.

A se tomar uma decisão estatística, existem duas possibilidades de erro: o Erro  de tipo I: rejeitar a hipótese nula (Ho), quando ela é verdadeira e, o Erro  de tipo II: aceitar a hipótese nula (Ho), quando ela é falsa. Infelizmente, quando a probabilidade de um diminui, a probabilidade de cometer o outro aumenta, assim os testes estatísticos foram delineados para controlar o erro de tipo I, chamado de nível de significância.

Nível de significância (a) é definida como a probabilidade de cometer o erro de tipo I, ou seja, rejeitar a hipótese nula (Ho), quando ela é verdadeira. Por exemplo:

Ho: a propaganda na rádio e na televisão  não interferem na opinião dos eleitores  (rxy = 0)

H1: a propaganda na rádio e na televisão  interferem na opinião dos eleitores. (rxy ¹ 0)

a = é a probabilidade de Rejeitar Ho, quando ela é verdadeira, neste caso, seria a probabilidade de afirmar que a propaganda na televisão e nas rádios interferem na opinião dos eleitores, quando na realidade não existe nenhuma relação. Ou seja, o eleitor já tinha tomado a decisão antes da propaganda e a ela ficou indiferente.

Este erro é controlado pelo pesquisador, e é ele que define a margem de erro que está disposto a correr. Existem vários fatores que influenciam a escolha do nível de significância. Em pesquisas onde os instrumentos de medida das variáveis, o controle de fatores intervenientes, etc. possibilitam um maior rigor, e portanto um nível de significância menor. Contudo, em pesquisas, nas ciências humanas, que lida com pessoas, com construtos polêmicos, instrumentos ainda não testados, etc., pode-se ser mais flexível. Via de regra, usa-se o nível de 5%.

p-valor, é a probabilidade de cometer o erro de tipo I (rejeitar Ho quando ela é verdadeira), com os dados de uma amostra específica. Este valor é dado pelo pacote estatístico, assim o comparamos com o nível de significância escolhido e tomamos a decisão. Se o p-valor for menor que o nível de significância escolhido rejeitamos Ho, caso contrário, aceitamos Ho.

Normal. Uma variável quantitativa segue uma distribuição normal, se sua distribuição de freqüências tem o formato similar ao de um sino, ou seja a maioria dos valores se concentram em torno da média, e a medida que se afasta do centro as observações são cada vez mais raras. Essa distribuição e simétrica. Muitas variáveis tem essa distribuição, tais como altura das pessoas adultas do sexo masculino, coeficiente de inteligência, etc. Para examinar visualmente, você pode fazer o histograma como a curva ajustada, o SPSS faz isso. O teste que checa a normalidade de uma variável é o teste de Lilliefors, que se encontra no comando EXPLORE do SPSS. A hipótese nula é que a variável segue uma distribuição normal, por isso você espera aceitar Ho, e espera que o p-valor seja maior do que o nível de significância especificado por você.

O pressuposto de normalidade é chave para toda a estatística paramétrica, por essa razão devemos sempre deve checar a validade do mesmo. Contudo, quando sua amostra for suficientemente grande (n > 30), dependendo do formato da distribuição, o Teorema Central do Limite garante a convergência da média amostral para a normalidade, veja a página 197 do livro de Estatística Básica de Moretin e Bussab.

O pressuposto de independência é chave para a maioria das estatísticas. Isto significa que o resultado de uma observação não interfere no resultado de outra observação. Por exemplo, a nota de um aluno, não interfere na nota de um outro aluno. Já esse pressuposto é quebrado para amostras relacionadas, como por exemplo, passar uma prova antes de uma intervenção e a mesma prova (ou outra) depois da intervenção, essas duas medidas, são correlacionadas, logo deve-se utilizar o teste para dados emparelhadas, ou ANOVA com medidas repetidas. Logo, cuidado com os estudos longitudinais, onde se acompanha os mesmos sujeitos em vários momentos.

Homocedasticidade ou igualdade de variâncias, este pressuposto exige que o nível de dispersão da variável dentro dos grupos seja similar. O SPSS automaticamente testa esta hipótese: Ho: s1 = s2 = s3 = s4, através do teste de Levene.

Matriz de covariância, é uma matriz quadrada, simétrica, cuja diagonal contém a variância da variável e em cada interseção linha (i) coluna (j) a covariância das variáveis Xi e Xj.

Matriz de correlação, é uma matriz quadrada, simétrica, cuja diagonal é formada pela unidade, pois trata-se da correlação da variável com ela mesma, e em cada interseção linha (i) coluna (j) a correlação das variáveis Xi e Xj.

Esfericidade. O teste de esfericidade checa se a matriz  de correlação é igual a matriz identidade, ou seja, na diagonal formados por uns e zeros nas outras medidas.

Multicolinearidade. Este é um pressuposto importante na análise de regressão múltipla, pois se uma variável independente for uma combinação linear de outras variáveis independentes, coloca em risco toda a análise.

Graus de liberdade é um conceito ligado ao número de dados disponíveis (livres) para o cálculo da estatística. Por exemplo, ao estimarmos a média populacional, com a média amostral perdemos um grau de liberdade, assim a estatística t-student terá n-1 graus de liberdade. No caso da Tabela de ANOVA, os graus de liberdade do grupo será igual ao número de grupos menos 1, os graus de liberdade total será igual a n-1 e os graus de liberdade do resíduo, a diferença entre esses dois.

Células, quando utilizamos modelos mais complexos com duas ou mais variáveis independentes, como no caso de ANOVA com dois fatores:

Outliers, são valores que superam em uma vez e meia a amplitude interquartílica (quartil 3 menos quartil 1). Valores extremos quando superam três vezes essa amplitude.