top of page
cerebro.png

Sigma Test Light

A inteligência é a característica mais importante dos seres vivos, e é graças a ela que os humanos dominaram nosso planeta. Existem muitos animais maiores, mais fortes, mais rápidos do que os humanos, mas todos eles foram subjugados graças à nossa inteligência, foi ela que nos tirou das cavernas e nos levou ao espaço.

 

Todas as pessoas instruídas compreendem a importância do autoconhecimento, e entre todas as características que precisam ser bem conhecidas e bem compreendidas, a inteligência é a mais importante.

 

Conhecer a própria a inteligência é muito mais importante do que conhecer a própria altura, o próprio peso ou o próprio signo, entretanto tem sido disseminada uma lenda de que testes de QI não são apropriados para avaliar a inteligência. Isso não é verdade.

 

Há milhares de estudos sobre isso, em mais de 190 países, ao longo de quase 120 anos, e os resultados desses estudos mostram nitidamente que os testes de QI medem muito bem a inteligência dentro de um certo intervalo. Além disso, o QI é o constructo mais bem compreendido, mais profundamente estudado e mais corretamente avaliado entre todos os constructos da Psicologia.

 

A Psicometria – que estuda testes cognitivos – é disparadamente o ramo mais desenvolvido da psicologia.

 

O estudo da Psicometria é tão desenvolvido e tão importante que tem produzido inclusive ferramentas estatísticas e matemáticas amplamente utilizadas em outros campos do conhecimento, tais como o coeficiente de correlação, a regressão linear, a análise fatorial e a teoria de resposta ao item.

 

O coeficiente de correlação é possivelmente a ferramenta estatística mais utilizada no mundo em todas as áreas científicas, foi graças ao uso do coeficiente de correlação que se descobriu que o universo está em expansão, é graças ao coeficiente de correlação que se consegue realizar exames rápidos e baratos como hemogramas, é graças ao coeficiente de correlação que se compreende uma imensa variedade e fenômenos sociais, políticos, econômicos, físicos, químicos, astronômicos, arqueológicos e muitos outros. Nenhuma invenção na psicologia, que não tenha sido criada na Psicometria, tem aplicação relevante em outros campos do conhecimento.

 

Por isso os testes de QI constituem os instrumentos psicológicos mais solidamente amparados pelo método científico e mais rigorosamente testados e validados. Apesar disso, há um forte preconceito de pessoas que, por não conhecerem nem compreenderem matemática, ciência e lógica, fazem críticas levianas e completamente infundadas aos testes de QI. Inclusive entre a maioria dos psicólogos, que geralmente não conhecem nem compreendem matemática, é muito comum esse tipo de preconceito.

 

Quando analisamos objetivamente os fatos, o que podemos verificar é muito diferente das opiniões desses psicólogos. Desde os estudos pioneiros de Terman, de 1928, e nos milhares de estudos posteriores, ficou muito claro que a inteligência se correlaciona com sucesso financeiro, sucesso acadêmico, sucesso social, habilidades específicas e habilidades gerais, menor incidência de distúrbios mentais, menos desvios de comportamento e menor criminalidade.

 

Os estudos de Terman incluíram milhares de crianças que foram separadas em dois grupos: 1.526 crianças com QI acima de 135 e quase 100.000 crianças com QI abaixo de 135. Terman e seus assistentes – que deram continuidade ao seu trabalho depois de sua morte, em 1956 –, acompanharam as vidas dessas crianças por décadas e constataram uma nítida vantagem em produção acadêmica, literária, artística e esportiva, se comparadas à medida a população. Também verificou que apresentavam menos problemas com vícios, criminalidade, distúrbios mentais, maior renda, casamentos mais estáveis e duradouros e vida mais longa.

 

A grande maioria dos psicólogos nem sequer sabe o que é o QI, frequentemente confundem o QI com o escore num teste de QI. Essa diferença é explicada detalhadamente num de meus vídeos, além de uma explicação mais formal no “Livro de ouro da inteligência” e uma versão resumida no “Guia dos apodícticos”.

 

A má compreensão sobre o que é o QI e sua importância resulta em numerosos prejuízos. Há décadas, as maiores empresas de tecnologia já perceberam isso e usam testes de QI para selecionar seus funcionários, pois compreendem a enorme vantagem de contratar pessoas que produzem 1000 vezes mais do que uma pessoa mediana, e pagam apenas 30 vezes mais. Assim a pessoa contratada fica feliz, ganhando 30x o salário de uma pessoa média, e a empresa fica mais feliz ainda por pagar por 30 e receber pela produção de 1000 pessoas médias.

 

Enquanto isso, as empresas mais tacanhas preferem contratar com base em graduação acadêmica, indicação, nepotismo e outros critérios ineficazes, tendo como resultado um quadro de funcionários subqualificados, achando que estão “economizando” com salários menores, quando na verdade estão desperdiçando com produção muitíssimo menor, contratando pessoas que produzem por 1 e ganham por 1.

 

Por isso conhecer a própria inteligência é de capital importância para ter uma melhor ideia sobre seu potencial, suas limitações, seu valor, seus pontos fracos e fortes. Nesse contexto, os testes de QI tradicionais como WAIS, Stanford-Binet, Cattell, Raven, DAT e outros são bons instrumentos de avaliação para a faixa de 70 a 130 de QI, especialmente para a faixa de 90 a 110 (na qual esses testes tem maior precisão).

 

Entretanto, para pessoas com QI acima de 110, e principalmente acima de 120 e 130, os testes de QI tradicionais não avaliam corretamente, e os erros se tornam cada vez maiores, à medida que o QI real se encontra mais distante da média. Isso conduz a muitos diagnósticos grosseiramente incorretos, além de erros graves de seleção e recrutamento.

 

Há casos de pessoas com mais de 170, 180 e até mais de 200 de QI que foram avaliadas incorretamente como se tivessem 120 a 130, devido às limitações dos testes usados em clínica. Alguns exemplos marcantes são os casos de Feynman, Fischer e Kasparov, que tiveram escores 123 em testes tradicionais, embora o QI correto deles fosse acima de 170 e no caso de Feynman acima de 200.

 

Também é comum o erro oposto, isto é, a pessoa ter escore muito mais alto do que o correto, como Adragon de Mello, Ainan Cawley, Michael Kearney e outros, cujos QIs verdadeiros ficavam entre 150 e 170, mas os QIs medidos nos testes foi acima de 300.

 

Quando o QI da pessoa é acima de 130, os erros produzidos nos testes de clínica são imensos, tanto para mais do que o correto quanto para menos do que o correto.

 

A interpretação simplória e incorreta dessa situação é de que se os testes de QI produzem erros tão grandes, eles não servem para nada. Isso é um erro grave e primário. Na verdade, os testes de QI funcionam muito bem se usados dentro de seus limites de aplicabilidade e se interpretados por pessoas capacitadas. Os limites de aplicabilidade cobrem o intervalo de 70 a 130, que inclui 95% da população.

 


 

Isso não significa que todos os escores entre 70 e 130 serão corretos e todos os escores acima de 130 serão incorretos. Eventualmente os testes também falham dentro desse intervalo, mas geralmente funcionam bem. E mesmo nos casos em que os resultados apresentem inconsistência, um bom psicólogo deveria (teoricamente) estar preparado para detectar o problema e sugerir a aplicação de testes com nível de dificuldade apropriado. Porém a esmagadora maioria dos psicólogos não está capacitada para detectar essas inconsistências e assinam laudos completamente absurdos. O erro, portanto, não está nos testes, mas sim na subqualificação dos pretensos profissionais que usam esses testes em condições inadequadas.

 

É como usar uma balança analítica de laboratório de química de alta precisão para tentar pesar um automóvel. A balança é boa, mas não é apropriada para essa faixa de peso. Se alguém usasse uma balança analítica para tentar pesar um carro, o problema estaria na falta de conhecimento e discernimento da pessoa que fez mau uso da balança. O mesmo vale para qualquer outro instrumento que seja utilizado fora do contexto para o qual ele foi criado ou fora dos limites de aplicabilidade.

 

Portanto os testes de QI como WAIS são muito bons, muito eficazes, muito acurados e fidedignos para avaliar corretamente o nível intelectual de pessoas com QI entre 90 e 110, e continuam funcionando razoavelmente até 130. Acima disso, os erros crescem e torna-se necessário utilizar outros instrumentos mais apropriados para os respectivos níveis intelectuais nos quais se deseja medir.

 

Nesse cenário, o Sigma Test Light (STL) e o Sigma Test Extended (STE) emergem como os melhores instrumentos de avaliação cognitiva nos níveis mais altos. O STL possibilita medir corretamente QIs de 80 a 200, com melhor precisão no intervalo de 110 a 180. O STE possibilita medir corretamente QIs de 100 a 225, com melhor precisão no intervalo de 120 a 210.

 

Por isso se você foi um aluno destacado, se tem curiosidade sobre temas científicos e filosóficos, se analisa criticamente tudo à sua volta, se é uma pessoa com opiniões originais, isso significa que você tem algumas características comuns a pessoas com inteligência acima da média, talvez você seja uma pessoa superdotada, e o Sigma Test Light pode ser indicado no seu caso, para que você tenha uma avaliação correta sobre nível intelectual.

 

Se você já foi examinado com outro teste e obteve escore acima de 110, e principalmente acima de 120, com certeza você precisa de uma avaliação mais correta, porque há grandes chances de que sua avaliação atual esteja errada.

 

O STL não trará uma “verdade absoluta”, isso não existe, mas proporcionará uma avaliação muito mais bem fundamentada e mais realista, com melhor validade de constructo e com questões cuja dificuldade é apropriada para avaliar corretamente o QI nos níveis mais elevados.

 

É importante compreender que não é que os testes de QI usados em clínica deixam de funcionar a partir de 110, ou 120 ou 130. O que ocorre é uma degradação progressiva na validade de constructo e na adequação dos itens. Isso faz com que a incerteza nos escores dos testes de QI tradicionais comece a crescer a partir de 110, e vai piorando paulatinamente, até atingir níveis intoleráveis em torno de 130. Nesses casos, o Sigma Test Light proporciona meios adequados para continuar avaliando corretamente em níveis nos quais os outros testes deixam de funcionar.

 

Alguns testes tradicionais, como Raven Standard Progressive Matrices (RSPM), utilizam tetos nominais bastante realistas, compatíveis com o verdadeiro nível de dificuldade das questões e com boa validade de constructo, com teto em torno de 135. Mas outros testes, até mais tradicionais do que o RSPM, falham gravemente nesse ponto, com tetos nominais muito altos, completamente incompatíveis com o real nível de dificuldade das questões, estabelecendo tetos nominais falsamente elevados, que não representam corretamente a inteligência nos níveis mais altos.

 

Dois exemplos disso são o Stanford—Binet (SB), o mais tradicional do mundo, e o Wechsler Adult Intelligence Scale (WAIS), o segundo mais tradicional.

 

O SB gera escores nominais de até 225, mas esses escores são gravemente destoantes da realidade a partir de 130. O WAIS gera escores nominais até 155, mas também não tem validade acima de 130.

 

O STL gera escores realistas e acurados até cerca de 180, e continua gerando escores realistas até cerca de 190, embora a acurácia comece a diminuir, tornando os escores acima de 195 menos confiáveis.

 

O Sigma Test Light não oferece vantagem em comparação aos testes tradicionais para pessoas com QI abaixo de 110, mas é superior aos testes tradicionais em pessoas com QI acima de 120 e é muito mais acurado e fidedigno para QIs acima de 130, ou seja, na faixa de 110 a 130, o STL apresenta acurácia semelhante à dos testes tradicionais, sendo o STL um pouco mais confiável acima de 120 e muito mais confiável acima de 130.

 

Algumas das principais vantagens do Sigma Test Light são:

1.      Não há limite de tempo. Desse modo, o STL mede sua capacidade real, em vez de medir sua performance num momento específico, que poderia estar sujeito a fatores como estresse, ansiedade, sono, nervosismo etc.

2.      Os níveis de dificuldade das questões são apropriados para os diversos níveis de QI que o teste propõe medir, diferentemente dos testes tradicionais, cujas questões não ultrapassam o nível de 130 e tentam dificultar artificialmente por escassez de tempo. Sabe-se que a rapidez para resolver questões elementares não mede o mesmo tipo de habilidade que a criatividade e profundidade de raciocínio para resolver questões mais difíceis e mais complexas, por isso os testes tradicionais falham a partir de 130, enquanto o Sigma Test Light continua funcionando até pouco acima de 190.

3.      A validade de constructo é um dos quesitos mais importantes para um bom teste cognitivo, pois indica que a variável medida é de fato aquela que se deseja medir. A maioria dos testes de QI tradicionais cumpre bem esse quesito até cerca de 120, mas começam a falhar a partir de 125, enquanto o Sigma Test Light tem boa validade de constructo até mais de 180.

 

Por essas e outras razões, o Sigma Test Light (STL) é um instrumento psicométrico de avaliação intelectual com muitos diferenciais importantes em comparação a outros testes cognitivos. Segue a mesma linha do Sigma Test (ST), Sigma Test VI (STVI) e Sigma Test Extended (STE).

A nova versão do Sigma Test Extended (2022) já foi publicada em revistas das principais sociedades de alto QI, inclusive In-Sight Journal, Phenomenon e Deus Vult.

 

In-Sight Journal é a principal publicação das sociedades de alto QI, que reúne entrevistas com os maiores expoentes mundiais das sociedades de alto QI e artigos sobre diferentes temas relacionados a QI, inteligência, psicometria e ciência cognitiva:

https://in-sightpublishing.com/2022/07/22/ste/  Phenomenon é a revista de OlympIQ Society (para pessoas com QI>180): https://winone.iqsociety.org/issues/Phenomenon_25.pdf  DEUS VULT é a revista de CatholIQ High IQ Society (QI>150):

https://drive.google.com/file/d/1bO6CBwgINp7HukCW6wWUo_PboBOWkopw/view  

A versão original do Sigma Test (1999) foi publicada em Mensalainen (Mensa Finland), ComMensal (Mensa Belgium), Gift Of Fire (Prometheus Society), Papyrus (Glia Society), IQ Magazine (International High IQ Society), Malba Tahan (Física Interessante).

 

O Sigma Test já foi aceito como critério para admissão em algumas das principais sociedades de alto QI, inclusive Sigma VII, Sigma VI, United Giga Society, Pars Society, OlympIQ Society e outras. Cientistas e matemáticos de alto calibre já forame examinados com os testes Sigma, que é considerado o mais apropriado para avaliar corretamente nos níveis mais altos. Esse tema é abordado na segunda entrevista de Hindemburg Melão Jr. para o In-Sight Journal: https://www.sigmasociety.net/artigo/entrevista-scott.

 

O STE foi projetado para ser o teste de inteligência mais difícil que existe e com melhor validade de constructo nos níveis mais altos, possibilitando avaliar corretamente pessoas com QIs até um pouco acima de 220, por meio de questões com nível de dificuldade adequado e que exigem habilidades cognitivas compatíveis. É muito diferente de testes como Stanford—Binet (SB), que alegadamente medem até 225, quando na verdade as questões mais difíceis do SB estão num nível de 130, isto é, algumas pessoas com 130 de QI teriam cerca de 50% de probabilidade de acertar as questões mais difíceis do SB, além de os processos cognitivos envolvidos na resolução serem excessivamente primários para avaliar em níveis acima de 125. Para mais informações sobre o Sigma Test Extended, visite o link no final desse texto.

O Sigma Test Light é uma versão mais acessível do Sigma Test, destinado ao público com QI entre 90 e 190, podendo se estender um pouco além dessa faixa, chegando a cobrir o intervalo de 75 a 200.

A faixa ótima de precisão e acurácia fica no intervalo de 100 a 175, destinando-se a pessoas classificadas como possuindo inteligência acima da média, que obtiveram escores a partir de 110 em testes de QI convencionais e desejam uma avaliação mais representativa de sua real capacidade intelectual.

Embora o significado de “acima da média” seja arbitrário e vago, é um padrão amplamente aceito. Em livros acadêmicos sobre Psicometria pode-se encontrar classificações por faixa de QI segundo as opiniões de diversos autores, inclusive as mais tradicionais como as de Terman, Wechsler, Levine e Woodcock, até outras menos conhecidas. Essas classificações são subjetivas e sem valor científico, em que os níveis de corte são “chutados” pelos autores. No caso de Lewis Terman, por exemplo, decidiu “chutar” que as classificações deveriam ser assim: 

 

Pinter decidiu que deveriam ser assim:

 

Levine decidiu que deveriam ser assim:

 

Outros autores deram outros palpites sobre como achavam que deveriam ser as classificações.

 

Essa maneira de promover estratificações e classificações, com base em palpites pessoais, é pseudocientífica, mas é amplamente usada e aceita na psicologia, o que representa um erro grave, do ponto de vista conceitual.

 

A maneira adequada seria que procurassem identificar características comuns presentes nas pessoas situadas em cada faixa de QI e discriminatórias em pessoas situadas em faixas diferentes e, a partir daí, estabelecer pontos de corte adequados para delimitar esses perfis. Isso deveria ser prioritariamente feito com o uso de ferramentas estatísticas como Wavelets, Análise de Clusters, Análise Fatorial ou algo equivalente.

Quando as classificações são realizadas de maneira apropriada, as divisões não ficam posicionadas de 10 em 10 pontos ou de 20 em 20 pontos, mas sim em intervalos variáveis e com números que raramente são redondos. O Sigma Test, por exemplo, adota classificações seguindo essa linha, utilizando Análise Fatorial com ligações Ward e métrica de Bhattacharyya, resultando em estratificações muito mais bem fundamentadas e com valor científico. Para mais detalhes sobre a classificação usada no Sigma Test, veja nosso artigo sobre o laudo do Sigma Test Light em https://www.sigmasociety.net/artigoss/significados-stl.

Embora as classificações listadas nas tabelas acima não sejam acuradas nem conceitualmente válidas, são amplamente aceitas e utilizadas, por isso quando nos referimos à faixa de QI “acima da média” estamos mantendo esse padrão, por enquanto. Mas no laudo apresentamos a classificação correta, e adicionamos também, a título de curiosidade, as outras classificações incorretas adotadas desde 1916.

Além de adotar um sistema incorreto de classificação, os testes de QI tradicionais apresentam muitas outras falhas. Não caberia aqui enumerar e comentar todas elas (isso é feito no “Livro de ouro da inteligência”), aqui citaremos apenas alguns dos problemas mais graves, entre os quais se destacam as avalições com erros astronômicos, que podem chegar a mais de 100 pontos.

Existem muitos casos de pessoas que receberam avaliações gritantemente incorretas em testes tradicionais, tanto para cima quanto para baixo, e isso pode ter vários efeitos negativos. A maioria desses erros nunca chega a ser descoberta, porque a pessoa simplesmente “engole” e acredita na avaliação, confiando na autoridade do psicólogo. Mas há alguns poucos casos que acabam sendo identificados e denunciados, porque o erro é tão escandaloso que não há como fazer vistas grossas. Citarei alguns exemplos:

Existe um concurso nos EUA que consiste em resolver problemas difíceis de Matemática e Lógica, semelhante às Olimpíadas da Matemática. As questões desse concurso não podem ser resolvidas simplesmente aplicando fórmulas nas quais os alunos são treinados para repetir mecanicamente. Em vez disso, é necessário compreender aspectos sutis e complexos e inventar métodos originais para resolvê-los. O nome desse concurso é “Putnam”.

O campeão do prêmio Putnam e ganhador do Nobel de Física Richard Feynman teve escore 123 num teste de QI. Isso é um erro óbvio e completamente absurdo, mas o psicólogo que aplicou o teste em Feynman não percebeu que estava diante de um erro crasso e assinou o laudo como se Feynman tivesse de fato 123 de QI.

 

Esse resultado bizarro de Feynman tem sido amplamente citado para desacreditar testes de QI, quando na verdade reflete apenas a imperícia do psicólogo que aplicou o teste, sem compreender bem as limitações inerentes aos testes tradicionais e sem ter a experiência e a sensibilidade necessárias para perceber que estava diante de um dos maiores gênios do século XX, cujo QI verdadeiro era cerca de 220.

 

Para se ter uma ideia do que isso representa, basta dizer que a população dos EUA na época de Feynman era cerca de 200.000.000, e ser campeão no Putnam o situava pelo menos no nível de 1 em 1.000.000 e provavelmente acima disso. Entretanto um QI de 123 corresponde ao nível de raridade de 1 em 13, ou seja, numa sala de aula com 100 alunos, cerca de 7 ou 8 possuem QI acima de 123. Isso já deixa muito óbvio que o escore de 123 é grosseiramente incorreto. Como se o prêmio Putnam não bastasse, Feynman ganhou também o Nobel de Física, foi um dos participantes mais jovens no projeto Manhattan e fez várias contribuições importantes à Física e à Ciência em geral, inclusive merecia mais do que um prêmio Nobel.

 

O nível intelectual de Feynman estava seguramente na faixa entre 1 em 30.000.000 e 1 em 300.000.000.

 

Mas o escore dele no teste de QI dizia que estava no nível de 1 em 13.

 

O QI correto de Feynman fica na faixa de 210 a 230, mas o teste indicou 123.

 

Outro caso de avaliação bizarra em teste de QI envolve o campeão mundial de Xadrez Bobby Fischer, que também teve escore 123. Algumas fontes citam “incorretamente” o valor de 187, outras citam 184 ou 181, mas os documentos oficiais da escola onde Fischer estudou no Brooklin, mostram o escore 123. Ironicamente, embora esse valor 187 tenha sido “inventado” por algum jornalista, está mais próximo do valor verdadeiro do que o QI “oficial” medido por um psicólogo.

O campeão mundial de Xadrez Garry Kasparov também teve 123 no Raven e 135 no Eysenck, embora o QI verdadeiro de Kasparov fique entre 160 e 180. Algumas fontes também atribuem 192 a Kasparov, mas esse é o resultado da conversão do rating FIDE máximo que ele alcançou (2851) em QI, usando a fórmula de Bill McGaugh, que apresenta vários problemas conceituais e quantitativos, mas ainda gera um escore mais próximo do correto do que os resultados que ele obteve em testes de QI tradicionais.

O caso mais absurdo é provavelmente o de Henry Poincaré, um dos maiores matemáticos de todos os tempos, um dos maiores cientistas e um dos maiores intelectuais da História, que obteve 35 de QI, entretanto seu QI correto fica entre 220 e 240.

No extremo oposto, há pessoas que alcançam escores 200, 300 e até 400, mas cujo QI verdadeiro fica entre 150 e 170. Adragon de Mello é um exemplo, que obteve escore 400 na infância, mas ao chegar em idade adulta, não cumpriu nenhuma das profecias sobre sua esperada genialidade, revelando-se uma pessoa muito inteligente, mas num nível de 160, bem longe dos astronômicos 400.

Houve várias outras crianças em situação similar, como Ainan Cawley, Michael Kearney, Edith Stern, Marnen Laibow-Koser, Sho Yano, Michael Grost, Nadia Camukova e muitos outros, que se mostraram rápidos e precoces na execução de tarefas simples e fáceis, apropriadas para medir corretamente até 130 de QI, mas devido a erros na normatização dos testes ou de extrapolação feita pelos examinadores, foram avaliados em mais de 200, alguns chegando a mais de 300, quando na verdade os QIs corretos dessas pessoas ficam perto de 150, que é de fato alto, mas 150 corresponde a um nível de raridade 1 em 1.000, enquanto um QI 200 está num nível teórico de 1 em 5.000.000.000. Quando se ajusta corretamente os QIs para uma escala de proporção e se considera a distribuição verdadeira, que não é gaussiana, então o escore 200 corresponde a 1 em 5.000.000.

Tanto esses escores distorcidos para cima quanto os distorcidos para baixo podem causar vários problemas. Einstein, quando criança, foi avaliado como retardado, embora ele fosse um dos maiores gênios da história. Thomas Edison também foi subavaliado na infância, assim como o já citado Poincaré e muitos outros.

Em casos como os de Feynman, Einstein e Poincaré, a história se encarregou de revisar os erros grotescos de diagnósticos, mas quantos são os casos de pessoas brilhantes que poderiam ter mudado a história, que nunca chegaram sequer a se tornar conhecidas porque alguma avaliação incorreta as empurrou para baixo?

Também ocorrem muitos problemas causados por distorções para cima. Justin Chapman foi uma criança prodígio que ganhou grande destaque nas mídias no final dos anos 1990, por ter quase 300 de QI aos 4 anos de idade. Mais precisamente, o escore atribuído a ele pelos psicólogos e pela mídia foi 298, mas o correto era cerca de 140 a 150. Isso levou à criação de uma série de problemas de cobrança excessiva, exposição, bullying, ofensas etc., a tal ponto que com 6 anos de idade ele chegou a tentar suicídio. Imagine uma criança de 6 anos querendo se matar porque não suporta o inferno que se tornou sua vida devido aos desdobramentos de uma avaliação psicológica incorreta.

Outro caso bem mais famoso é o de William James Sidis, que teve seu QI avaliado entre 250 a 300, e quase todos os tabloides sobre o assunto costumam citar Sidis como a pessoa mais inteligente que já viveu, quando na verdade seu QI verdadeiro foi cerca de 170 a 190. Sidis também enfrentou cobranças excessivas e diversos outros problemas, até que não suportou mais a pressão, quando concluiu seu doutorado aos 17 anos com distinção Cum Laude, mas seus pais esperavam que obtivesse uma Summa Cum Laude, e em vez de parabenizá-lo, seus pais o repreenderam duramente. Foi a gota d’água e, a partir de então, Sidis decidiu abandonar a carreira acadêmica para viver perambulando pelo mundo em atividades sub-profissionais e colecionando placas de automóveis.

É importante destacar que o problema não está no QI elevado, mas na distorção do resultado. Gauss, por exemplo, foi avaliado corretamente e cumpriu as expectativas de se consagrar como um dos maiores gênios da História. O mesmo sucedeu com Pascal, John von Neumann, Évariste Galois e outros. Não havia testes de QI na época em que a maioria deles viveu, mas foram diagnosticados como gênios desde a infância, e confirmaram essa genialidade em idade adulta, com importantes descobertas que ampliaram os horizontes do conhecimento. Isso porque não foram diagnosticados com base em testes de QI que utilizam questões primárias, mas sim com base em suas notáveis realizações, que já se revelaram impressionantes desde os primeiros anos de vida, realizações que também envolvem a resolução de problemas de lógica, matemática e ciência, mas com um nível de dificuldade e complexidade muito maior do que o teto dos testes de QI, problemas semelhantes aos que são utilizados nos testes Sigma.

Esses erros de avaliação acontecem porque os testes de QI tradicionais são planejados para avaliar o nível intelectual de pessoas entre -2 e +2 desvios padrão em relação à média, isso inclui cerca de 95,5% da população com QI entre 68 e 132. Quando a pessoa está nos 2,3% acima de 132 ou nos 2,3% abaixo de 68, os resultados no teste não refletem tão bem sua real capacidade, e quanto mais distante o QI real da pessoa estiver dessa faixa, maior é o erro potencial entre o escore medido e o QI verdadeiro.

Os testes tradicionais, usados em clínicas, não incluem questões com nível apropriado de dificuldade nem atendem aos quesitos necessários para que tenham validade de construto fora desse intervalo. Esse tema é analisado de forma didática em minha primeira entrevista para o In-Sight Journal, em 2022, bem como em alguns de meus vídeos e artigos. https://www.sigmasociety.net/entrevista-jacobsen

Essa crítica se aplica aos testes mais respeitados, como WAIS, Stanford-Binet, Raven, DAT, Cattell etc. Quando se trata de outros testes, cuja padronização não é tão cuidadosa e a validação de constructo não é tão rigorosa, as falhas são muito mais graves e mais numerosas, inclusive contendo questões ambíguas, gabarito incorreto, distorções nas normas, inexistência de resposta aceitável em algumas questões etc. Na verdade, inclusive testes consagrados como o WAIS também apresentam vários desses problemas, mas os outros apresentam problemas ainda mais graves e mais frequentes. Veja minha análise sobre os erros do WAIS no “Livro de ouro da inteligência”.

Apesar dessas falhas, o WAIS ainda é um instrumento bastante razoável para medir níveis intelectuais entre 70 e 130, sendo considerado “padrão ouro” na avaliação dos psicólogos, um ouro bastante questionável, mas em relação aos demais testes usados em clínica, o WAIS é de fato comparativamente um dos melhores.

 

Embora o WAIS produza escores nominais até 160 (WAIS-R) ou 155 (WAIS-III ou IV), dependendo do ano da norma, as pontuações acima de 130 carecem de validade. Muitos psicólogos, no entanto, não possuem uma clara compreensão dessa limitação e acabam emitindo laudos com escores irreais. Muitas das crianças citadas acima foram vítimas desse tipo de diagnóstico incorreto. Esses psicólogos não fazem isso por maldade, mas por desconhecimento.

Lewis Terman, em seu estudo com 1528 crianças superdotadas, enfrentou vários problemas de previsão e interpretação, devido às falhas nos testes de QI.

Terman e sua equipe examinaram dezenas de milhares de crianças e selecionaram as 1.528 que obtiveram escore acima de 135, com algumas chegando a mais de 200, e acompanharam a evolução dessas crianças ao longo da vida por muitas décadas, para conferir se elas se tornariam gênios em idade adulta.

O resultado confirmou algumas expectativas, e realmente as crianças com QI acima de 135 tiveram uma produção intelectual bem acima da medida da população em geral, porém nenhuma delas, nem aquelas com QI acima de 180 e acima de 200, se revelaram gênios, nem conquistaram qualquer prêmio intelectual importante. Além disso, para a vergonha de Terman, entre as crianças que ele não selecionou por não terem QI suficiente, isto é, com QI abaixo de 135 nos seus testes, houve 2 ganhadores do Nobel: William Shockley, que teve escore 125 e ganhou o Nobel de Física em 1956, e Luis Alvarez, que teve escore 124 e ganhou o Nobel de Física em 1968.

As pessoas que não conhecem Psicometria atribuem esse resultado a falhas nos testes de QI, quando na verdade é uma limitação dos testes usados por Terman e uma limitação na capacidade de julgamento de Terman e de outros psicólogos, que não percebem quando o escore é absurdo, incompatível com os fatos observados, e agem mecanicamente, colocando na pessoa o rótulo que é indicado pelo resultado no teste, sem avaliar criticamente se aquele escore é plausível. A perda de validade de constructo para escores acima de 130 é outro problema grave, pois aquilo que os testes usados por Terman mediam só era um bom reflexo da inteligência até cerca de 130, mas aquilo que mediam acima de 130 não representava bem a inteligência.

Se uma pessoa coloca um frango inteiro de tamanho normal numa balança, e o peso indicado é 144 g, a pessoa precisa ter bom-senso para saber que um frango inteiro não pode pesar 144 g e alguma coisa está errada. Se ela não conseguir identificar e corrigir o erro de pesagem, é melhor estimar o peso com bom senso do que colocar uma etiqueta no frango dizendo que ele pesa 144 g. Ou se houver uma balança mais apropriada, é melhor usá-la para medir corretamente.

Também é importante destacar que no caso do estudo realizado por Terman, não havia um “problema” nos testes de QI utilizados, mas apenas uma limitação. Não havia um problema porque os testes de fato mediam corretamente dentro de um certo intervalo, entre 70 e 130. “Prova” disso é que os testes selecionaram pessoas muito mais inteligentes do que a média, pessoas que tiveram muito mais sucesso acadêmico, profissional, financeiro e social. Portanto, em geral, os testes acertaram ao separar o grupo acima de 135 do grupo abaixo de 135, confirmando que os testes funcionam bem até esse ponto. Mas falharam justamente nos 2 casos mais notáveis, de pessoas com QI muito acima de 135, que foram imensamente subavaliadas, e o examinador não foi capaz de perceber isso. Os testes de QI funcionam bem para 95% da população, mas o problema é que justamente nos 2% com QI mais elevado, que o teste falha, é onde estão os gênios que podem mudar o mundo e que precisariam ser corretamente diagnosticados.

 

Isso deixa muito claro que sim, os testes de QI funcionam muito bem, porém só funcionam até certo ponto, para QIs abaixo de 130 e algumas vezes abaixo de 120. Entretanto, existem outros testes, mais difíceis e com validade de constructo mais adequada, para avaliar corretamente nos níveis mais altos.

 

Em empresas como IBM, Microsoft, Google, Facebook, eles precisam de pessoas com QI muito acima de 130 e até mesmo acima de 150, por isso eles criaram seus próprios testes para medir corretamente nesses níveis. Os testes usados por essas empresas chegam a medir corretamente de 130 até cerca de 160, mas também começam a falhar nos níveis acima de 165.

O Sigma Test Extended cumpre com folga a função de medir corretamente o QI no nível acima de 150, chegando a mais de 220. Também se aplica a QIs abaixo de 150, cobrindo o intervalo de 100 a 225, tendo a faixa ótima de precisão entre 120 e 210.

 

O Sigma Test foi usado para selecionar a equipe que trabalhou no desenvolvimento da plataforma Cantor (em homenagem a Georg Cantor), constituída por 6 medalhistas olímpicos internacionais de Matemática, Física e Ciência da Computação, e tem sido aceito como critério para admissão em algumas das sociedades de alto QI mais exclusivas do mundo.

Essa “faixa ótima de precisão” é determinada pelo número de questões cuja dificuldade se enquadra no respectivo nível. Quanto mais questões apropriadas para determinado nível, maior é a precisão dos escores naquele nível. No caso do SAT, por exemplo, tem um teto de dificuldade em torno de 135 a 140, mas produz escores conversíveis em QI até 164 pela norma antiga (pré-1974) e cerca de 160 pela norma mais recente (pós-1995). Entretanto, mesmo que o teto de dificuldade fosse compatível com o nível de 160 e mesmo que a validade de constructo também alcançasse esse nível, ainda assim precisaria cumprir outro quesito importante que é conter um número suficiente de questões no respectivo nível. Se houvesse apenas 1 ou 2 questões que cumprissem esse quesito, a incerteza nas proximidades do teto seria baixa, ou seja, o teste mediria de fato até 160, mas o erro nessa medida poderia ser grande.

Nos testes de QI tradicionais, geralmente há menos de 10% de questões para discriminar nos níveis acima de 125 e 0 questões com nível de dificuldade apropriado para medir corretamente acima de 130, entretanto esses testes geram escores que podem chegar a 150, 160 e até mesmo acima de 190, porém esses escores não refletem a real capacidade intelectual, mas sim a velocidade para resolver questões primárias. São números sem qualquer valor conceitual, embora tenham algum significado estatístico, que indica a raridade de pessoas capazes de resolver questões elementares com certo nível de rapidez, e isso não é o mesmo que ter a inteligência no nível equivalente de raridade.

O Raven Standard Progressive Matrices tem 60 questões. Se a pessoa acerta as 60, seu QI é 133. Se acerta 59, seu QI é 129. Se acerta 58, seu QI é 125. Ou seja, há apenas 2 questões num teste com 60 para discriminar nos níveis acima de 125. Isso torna a incerteza nos escores acima de 125 muito grande, porque é como se fosse um teste baseado em apenas 2 questões úteis para discriminar perto do teto (na verdade não é tão simples essa análise. Para mais detalhes, veja nossos livros e artigos). Como se não bastassem essas falhas, ainda por cima são questões de múltipla escolha, introduzindo mais uma incerteza na medida, devido ao fator sorte.

Apesar de todas essas imperfeições, o Raven ainda é um bom instrumento para avalição de níveis intelectuais entre 70 e 110, podendo chegar a 115 ou pouco acima, mas não deveria ser utilizado para medir QIs acima de 120. Entretanto, na prática, ele continua sendo usado para QIs de até o teto, 133 na norma atual, ou 137 em algumas normas antigas. Lembrando que o principal problema no Raven não é o teto, mas sim o pequeno número de questões destinadas a discriminar nos níveis próximos ao teto.

No caso do Sigma Test Light, cerca de metade das questões são adequadas para medir acima de 120, o que torna os escores fidedignos e acurados nesse nível, chegando até cerca de 170 com boa validade de constructo e boa adequação no nível de dificuldade.

Nos níveis acima de 170, o Sigma Test Light continua gerando escores válidos, mas as incertezas são um pouco maiores, porque o número de questões com dificuldade adequada para esses níveis vai diminuindo, e quanto menos questões, maior é a incerteza na medida (é recomendável ler meus livros e artigos nos quais trato de Teoria da Medida, para compreender melhor esse efeito).

O Sigma Test Light possui também uma característica singular que é a propriedade de uma mesma questão cobrir diferentes níveis de dificuldade. Por exemplo: a questão sobre escoamento de água pode ser respondida em diferentes níveis. Se a pessoa fizer um cálculo simplificado, recebe uma pontuação proporcional, que depende de quão perto ela chegou da resposta “correta”. Se a pessoa planejar um método mais sofisticado e mais eficaz para fazer o cálculo, e chegar mais perto do valor correto, ela recebe mais pontos. Desse modo, a mesma questão é capaz de discriminar em diferentes níveis de habilidade, de acordo com a qualidade da resposta. Isso permite que uma mesma questão seja ótima para uma larga faixa de escores, que implica uma personalização do nível de dificuldade para cada pessoa. Isso aumenta substancialmente a acurácia e a precisão nos escores, com mais de 10 questões apropriadas para medir acima de 180 e mais de 20 apropriadas para medir acima de 170, além disso também inclui mais de 30 questões entre 90 e 110, mantendo boa precisão tanto nos níveis mais altos quanto perto da média e em todos os níveis intermediários.

Essa propriedade das questões confere ao Sigma Test Light duas vantagens muito importantes: a primeira é que o intervalo de aplicabilidade é mais largo e a segunda é que cada questão se adapta ao nível de habilidade da pessoa. Se uma pessoa com 110 de QI resolve o teste, ela encontrará cerca de 80% das questões adequadas para medir corretamente em sua faixa de QI. Se outra pessoa com 170 de QI faz o teste, ela também encontrará 80% das questões com dificuldade adequada para medir em sua faixa de QI, porque as pessoas com 110 darão um tipo de resposta que receberá pontuação compatível com 110, enquanto as pessoas com 170 darão respostas para as mesmas questões, mas que serão compatíveis com cerca de 170. Desse modo, é como se o teste possuísse maior número de questões em todas as faixas de QI, sendo mais preciso e mais acurado num largo espectro de níveis de habilidade.

De forma resumida, essas são algumas das propriedades do Sigma Test Light. Para mais informações sobre esse tema, leia nossos livros e artigos, assista aos nossos vídeos, estude Teoria da Medida, Estatística e Psicometria.

Conheça também o Sigma Test Extended (link), com um texto introdutório detalhado no qual você poderá encontrar mais informações importantes sobre Psicometria, uma análise crítica sobre limitações e potencialidades dos testes de QI, informações conceituais, estatísticas e muito mais. Leia também nossos artigos, nossos livros e nossas entrevistas em texto e vídeo, onde encontrará as informações mais bem fundamentadas sobre Psicometria e sobre uma ampla gama de outros temas ligados à Ciência, Filosofia, Investimentos, Astronomia, Filosofia da Ciência e outros campos do conhecimento.

Clique no botão abaixo para adquirir o questionário e dar prosseguimento ao Sigma Test Light.

bottom of page