top of page

28 de jun. de 2024

Significados dos termos usados no laudo do STL

Por Hindemburg Melão Jr.


O laudo do Sigma Test Light (STL) é o mais completo e acurado, trazendo diversas informações psicométricas relevantes que não são apresentadas em laudos de outros testes. Algumas dessas informações requerem esclarecimentos, por não serem de uso comum, inclusive muitas são inéditas, como os conceitos de pIQ e rIQ.

 

Todas essas informações estão disponíveis em nossos livros e artigos, especialmente no “Livro de ouro da inteligência”, “Xadrez, 2022 melhores jogadores da história e 2 novos sistemas de rating”, “Guia dos apodícticos”, artigo sobre “Novo método para normatização de testes em escala de proporção”, artigo sobre “Suspeita de fraude no jogo Niemann—Carlsen”, alguns de nossos vídeos, inclusive sobre “QI, inteligência, Xadrez e Ciência”, na entrevista sobre inteligência e QI no canal Clube de Xadrez On-Line, entre outros.

 

Entretanto, alguns dos livros ainda não foram finalizados e publicados, como são os casos do “Livro de ouro da inteligência” e os volumes 4 e 5 do “Guia dos apodícticos”. Por isso estamos colocando fragmentos de capítulos do “Livro de ouro da inteligência” disponíveis a membros e assinantes de Sigma Society, sobre temas relacionados aos significados de alguns termos utilizados no laudo do STL.

 

Alguns dos termos são autoexplicativos e não requerem muito detalhamento, mas para tornar a descrição completa, vamos descrever todos os termos. Para exemplificar, fizemos um laudo hipotético para Einstein em 15 de setembro de 1905:

 

DADOS DO LAUDO:

  • Examinee: Albert Einstein

  • Age at test delivery date: 26.51 years

  • Absolute pIQ at your age: 247 (μ=100, σ=16, Distribution=adjusted to true data)

  • Adjusted pIQ for your age: 241.3 (μ=100, σ=16, Distribution=adjusted to true data)

  • Age of your maximum IQ: 28.19 years

  • Your maximum pIQ at 28.19 yo: 247.1 (μ=100, σ=16, Distribution=adjusted to true data)

  • Age at which you reached the absolute pIQ of an average adult (IQ=100): 4.52 years

  • rIQ: 202.9 (μ=100, σ=16, Distribution=Normal)

  • SAT equivalent: Would break the SAT ceiling, above 1600. Equivalent to 2608

  • GRE equivalent: Would break the GRE ceiling, above 1600. Equivalent to 2685

  • Theoretical percentille: 100.0%

  • True percentille: 99.9999999936%

  • Theoretical rarity: 1 in 1,894,416,550,414,111,744 (supposed normal distribution)

  • True rarity: 1 in 15,534,557,186 (based on true distribution)

  • Equivalent intellectual potential: 128,793,818% above average

  • Your IQ is higher than the average IQ in 100.0% of the countries in the world. See the complete list in the link at the end of this report.


DESCRIÇÃO:

 

·         Examinee: Albert Einstein

 

Nome da pessoa examinada.

 

·         Age at test delivery date: 26.51 years

 

Idade da pessoa examinada, de acordo com informações que ela incluiu em sua planilha de respostas e a data de registro do recebimento de todas as respostas.

 

Os cálculos de ajuste do QI por idade usam a idade desde a fecundação, considerando tempo médio de fecundação = 280,098 dias (0,76687 ano juliano) ou o valor informado pela pessoa, quando esse valor é informado.

 

A escolha de utilizar o ano juliano, em vez do gregoriano, é porque para pessoas que não viveram antes de 1900 nem depois de 2100, o comportamento do calendário civil entre esses anos fica mais bem ajustado ao ano juliano, já que 2000 foi bissexto. No exemplo de Einstein, como 1900 não foi bissexto, haveria uma anomalia, mas o impacto disso no resultado seria menor que 0,1 ponto de QI.

 

·         Absolute pIQ at your age: 247 (μ=100, σ=16, Distribution=adjusted to true data)

 

Embora milhares ou até mesmo milhões de sites, revistas, livros, canais e outras mídias compartilhem a informação bizarra de que o QI de Einstein teria sido 160, é óbvio que essa informação é muito distante da realidade. Para mais detalhes, leia nossos livros e artigos.

 

Os significados de “QI absoluto”, “QI máximo” e “QI ajustado à idade” serão explicados mais detalhadamente no final desse artigo. De forma resumida, o significado de QI absoluto é o seguinte:

 

Para calcular as curvas de variação do QI em função da idade (abaixo), precisamos de um valor de “QI de entrada” para a fórmula. Esse valor foi originalmente determinado como sendo aquele no qual o QI máximo que uma pessoa de QI 100 alcança na vida seja igual ao QI de entrada. Para outros níveis de QI, o QI máximo não é o mesmo valor do QI de entrada.

Essas curvas mostram como o nível intelectual varia ao longo da vida, e são ajustadas para cada nível de QI.

 

Antes de compreender o que é o QI absoluto, precisamos compreender claramente o que é esse “QI de entrada”, que não é citado no laudo, mas tem capital importância sob o ponto de vista técnico, sendo esse valor utilizado para todos os cálculos.

 

O escore gerado pelo STL é o QI de entrada, ou seja, é o seu nível intelectual no momento que você realizou o teste, independentemente de sua idade, de seu estado emocional, de seu estado de saúde, de fome, frio, ansiedade etc.

 

Embora haja vários fatores que podem interferir no resultado, o STL não tem limite de tempo, por isso a pessoa pode administrar a resolução de modo a se dedicar ao teste quando estiver se sentindo disposta – exceto por impulsividade e ansiedade, que podem afetar o resultado, mas ainda assim conseguimos filtrar melhor a maioria dos ruídos em comparação aos testes com limite de tempo, nos quais a pessoa não pode escolher quando se sente melhor para resolver as questões. Essa flexibilidade permite que o STL obtenha uma avaliação mais representativa da verdadeira capacidade intelectual da pessoa quando está em boas condições de atuar em atividades intelectuais.

 

Desse modo, filtrando a maioria dos fatores que poderiam prejudicar o resultado, a idade se torna o fator preponderante que precisa ser ajustado.

 

Se você teve um “QI de entrada” 150 aos 10 anos de idade, o seu “QI vitalício” é muito maior do que se você teve os mesmos 150 de QI aos 25 anos de idade. Se você teve um QI 150 aos 70 anos de idade, o seu “QI vitalício” também é muito maior do que se você teve os mesmos 150 de QI aos 25 anos de idade. O seu “QI vitalício” depende de qual era sua idade no momento que você fez o teste. Esse “QI vitalício” é bastante estável ao longo da vida, porque é o que chamamos “QI ajustado à idade”.

 

Não temos como saber exatamente como foi e como será o seu ritmo individual de evolução do nível intelectual ao longo da vida, mas sabemos como é essa evolução para a média das pessoas. Além disso, sabemos também como são as diferenças nessa evolução para diferentes faixas de QI. Desse modo, podemos estimar como foi seu ritmo individual de evolução com base em sua faixa de QI.

 

Geralmente, as pessoas atingem melhores performances intelectuais entre 20 a 35 anos, com máximo perto de 26 a 29 anos. A média geral das idades de pessoas examinadas em vários países costuma ser equivalente à cerca de 16 anos, na qual alcançam aproximadamente o mesmo QI de quando chegam aos 45 anos. Por isso os valores padronizados de entrada para gerar essas curvas foram escolhidos aproximadamente nesse intervalo, com pequenas variações em função da faixa de QI.

 

Quando a pessoa faz o STL, ou qualquer outro teste, o resultado gerado não é a melhor representação do QI “vitalício” da pessoa, mas sim o QI naquele momento, ou seja, é o valor absoluto que ela obteve naquele teste naquele momento.

 

Um valor que melhor representa o QI “vitalício” da pessoa é o valor calculado a partir desse QI obtido no teste, levando em conta também a idade na qual a pessoa foi examinada, ou seja, é o “QI ajustado à idade”, esse é o que pode ser interpretado como melhor representação do “QI vitalício”.

 

O termo “absoluto” pode causar confusões, porque pode sugerir que é “mais correto” ou “mais estável”, mas significa apenas que é absoluto no sentido de ser independente da idade, do estado de saúde, do estado emocional etc. Enquanto o QI ajustado à idade é um valor que corrige o resultado obtido no teste de acordo com a curva para evolução de QI para seu escore e de acordo com a idade da pessoa no momento que foi examinada. Se a pessoa teve escore QI=100 aos 5 anos de idade, seu QI é muito alto, mas se teve escore QI=100 aos 25 anos, esse escore é quase igual ao seu QI ajustado à idade, ficando na média da população.

 

A criança com 5 anos e QI absoluto 100 significa que aos 5 anos ela tem a idade mental de um adulto médio, enquanto a pessoa de 25 com escore 100 tem também a idade mental de um adulto médio. A diferença é que essa pessoa de 25 anos é de fato um adulto próximo de seu ápice intelectual, por isso 100 representa aproximadamente o QI ajustado à idade para essa pessoa, é uma boa estimativa para o “QI vitalício” dessa pessoa, mas no caso da criança, o QI ajustado à idade precisa verificar como a curva evolui para o caso dela de modo que aos 5 anos o valor de entrada do QI resulte em QI=100 aos 5 anos de idade, ou seja, precisa ser calculada a função inversa de curva usando QI=100 aos 5 anos e encontrar qual deve ser o QI de entrada na fórmula que produz esse valor 100 aos 5 anos. Como não é uma função simples, podemos usar Newton-Raphson, entre outras técnicas de ajuste simultâneo dos parâmetros, para alcançar o resultado-objetivado.

 

Para compreender com mais clareza o significado de QI absoluto, precisamos antes compreender os significados de QI, escore em teste de QI e inteligência.

 

A inteligência é o nível intelectual absoluto. Ela evolui ao longo da vida. Uma pessoa com saúde normal será mais inteligente aos 7 anos de idade do que era aos 5, e aos 10 será mais inteligente do que era aos 7. Depois dos 50 ou 60, será menos inteligente do que era aos 25 ou 30.

 

O QI praticamente não varia ao longo da vida, porque ele é a divisão da idade mental pela idade cronológica. No capítulo adequado do livro de ouro da inteligência, esse significado é analisado com mais profundidade, bem como a versão incorreta proposta por Wechsler, que acabou se popularizando.

 

Na abordagem antiga de 1916, uma criança que aos 5,00 anos de idade tem mesma performance intelectual que o da média de um grupo de crianças com 6,00 anos, tem QI 120, porque 100×6/5=120. Espera-se que quando essa criança tenha 7 anos, ela continue com 120 de QI, porém aos 7 anos seu nível intelectual será equivalente ao da média de um grupo de crianças com 8,4 anos. Quando ela chegar aos 10, espera-se que continue com 120 de QI, mas terá performance equivalente à média das crianças de 12 anos.

 

A ideia central estava correta, de ajustar pela idade, mas a simplificação estava errada em supor que o nível intelectual crescia linearmente com a idade. Na verdade, crescem em ritmos diferentes, como mostrado nas curvas do gráfico acima.

 

A inteligência pode ser comparada à altura. A altura varia ao longo da vida. O QI seria equivalente ao nível de altura dentro da faixa etária. Uma criança de 5 anos com 1,50 m é muito alta para sua idade, embora seja baixa se comparada aos adultos. Não existe no caso da altura uma palavra com significado homólogo ao do QI para a inteligência, por isso se diz “alta para a idade”. O QI seria basicamente o equivalente a dizer “inteligente para a idade”.

 

O escore em teste de QI é uma tentativa de medir o QI. Se o teste for adequado, o escore será uma representação razoável, assim como a fita métrica ou a régua ou a trena são usadas para tentativas de medir a altura. Se esses instrumentos não estiverem distorcidos e forem aplicados adequadamente, o resultado obtido para a altura será uma representação razoável para a altura verdadeira. Há diferenças importantes, porque o significado de “altura” é bem definido, tornando fácil saber que aquilo que se está medindo com a trena é de fato aquilo que se gostaria de medir, mas quando se trata da inteligência, não é tão simples assegurar que aquilo que o teste está medindo é de fato um constructo capaz de representar adequadamente a inteligência (ou o QI, quando o valor é ajustado à idade).

 

A medida da altura é absoluta em qualquer idade, não há um ajuste da altura em função da idade. Se a pessoa mede 1,40 m aos 5 anos, a altura dela é 1,40 m, a escala de altura é a mesma para qualquer idade. O mesmo ocorre para o nível intelectual, mas não existe uma escala de valores de níveis intelectuais desse tipo. O que existe é o QI, mas o QI não informa o nível intelectual absoluto, informa o nível para cada idade, ou seja, a escala é ajustada para cada idade.

 

O QI absoluto é o equivalente à altura absoluta, que fornece um valor com base no nível de dificuldade dos problemas que a pessoa conseguiu resolver na ocasião em que ela foi examinada. Em conjunto com as explicações anteriores, isso proporciona uma boa ideia sobre o que significa “QI absoluto” nesse contexto. É basicamente o mesmo que “nível intelectual absoluto”, é a variável em si, sem considerar ajustes para a faixa etária. Como o significado original de QI é ajustado à faixa etária, passamos a usar o termo “QI absoluto” para aquele que reflete o nível intelectual absoluto, e “QI ajustado à idade” para aquele que reflete o nível intelectual “vitalício” que melhor representaria um QI estável da pessoa ao longo da vida.

 

·         Adjusted pIQ for your age: 241.3 (μ=100, σ=16, Distribution=adjusted to true data)

 

Como o nome diz, é o QI ajustado à idade na qual a pessoa fez o teste. Se uma criança de 10 anos obteve escore 90 num teste normatizado para adultos, obviamente o QI correto dela não é 90. É muito maior. O mesmo ocorre para uma pessoa com 85 anos, ou 7 anos, ou qualquer idade, mas em cada um desses casos o ajuste é diferente. Esse item também é analisado com mais detalhes ao final desse artigo.

 

Geralmente, o QI ajustado à idade é maior do que o QI absoluto, porém se a pessoa fez o teste em uma idade próxima da qual ela atinge seu QI máximo, então o QI ajustado à idade pode ser menor do que o QI absoluto. Nesse exemplo, Einstein tinha quase seu QI máximo quando publicou o 4o artigo de 1905.

 

·         Age of your maximum IQ: 28.19 years

 

Indica a idade na qual geralmente as pessoas com QI nesse nível atingem seus níveis intelectuais máximos. Essa idade é indicada em anos julianos. Pessoas com QI mais alto geralmente atingem seu pico de performance intelectual numa idade mais avançada, ou seja, o QI dessas pessoas continua aumentando por mais tempo ao longo da vida. Além disso, depois de atingir o máximo, o decrescimento é mais lento.

 

Embora o número acima seja indicado com 4 algarismos, há incerteza no segundo algarismo. São indicados com 2 decimais porque não haveria utilidade se indicasse com apenas 1 ou 2 dígitos, em cujo caso praticamente todas as pessoas teriam o pico entre 25 e 30 anos, entretanto o que se observa é que geralmente pessoas com QI mais alto continuam aumentando a inteligência – inclusive a inteligência inata – por um pouco mais de tempo do que as pessoas com QI mais baixo, fazendo com que as idades nas quais as pessoas de QI mais alto atingem seus QIs máximos sejam um pouco maiores do que as idades nas quais as pessoas com QIs não tão altos atingem seus QIs máximos.

 

É como acontece na altura, e em outras características. A maioria das meninas continua a crescer até 18 anos, enquanto os meninos continuam a crescer até 21 anos. Mas algumas meninas param de crescer aos 17 ou mesmo 16 anos, outras continuam até os 19 ou 20 ou mais. O mesmo ocorre nos casos dos meninos, alguns param de crescer aos 16 ou 17 anos, outros crescem até os 22 anos ou mais. Roberto Wadlow continuou crescendo por toda a vida, até atingir 2,72 m aos 22 anos e 4 meses.

 

Embora as pessoas com maior QI tendam a atingir seu QI máximo numa idade mais avançada, esse ponto máximo varia de uma pessoa para outra mesmo entre pessoas de mesmo QI. Mas há uma correlação positiva entre QI e idade na qual atingem o QI máximo.

 

Geralmente pessoas com QI próximo a 100 atingem seu máximo por volta de 26 anos, enquanto as pessoas com 150 atingem seu máximo por volta de 27 anos, pessoas com QI acima de 200 atingem seu máximo por volta dos 29 anos.

 

Alguns estudos sugerem variações mais largas, indicando que as pessoas com QI 100 já atingem seu nível intelectual máximo entre 18 a 21 anos e começam a decair aos 30, enquanto pessoas com QI 150 chegam a seu máximo aos 27 anos e preservam seu nível máximo até cerca de 40 a 45 anos. Entretanto, esses resultados provavelmente estão incorretos e se devem ao parâmetro de inclinação da reta tangente à essa curva, que vai ficando quase paralela ao eixo das abcissas (antes de inverter) conforme a idade avança, de modo que quase não se percebe diferença na inclinação dessa reta dos 18 para os 25 anos, especialmente quando os parâmetros do modelo são calculados a partir de amostras com poucas pessoas, porque amostras pequenas geram resultados com sensibilidade insuficiente para distinguir a inclinação da reta tangente entre 18 e 25 anos, pois nesses casos a inclinação é quase a mesma, de modo que a presença de 1 ou 2 outliers numa amostra de 3000 já pode deslocar a posição do ponto máximo.

 

Além disso, há vários outros problemas associados à validade de constructo duvidosa dos testes de QI tradicionais nos níveis acima de 120, além de inadequação no nível de dificuldade das questões, que não medem corretamente acima de 120 e principalmente acima de 130 de QI.

 

Por isso preferimos tomar como base os ratings de Xadrez em função da idade, porque embora os ratings não sejam individualmente uma representação acurada para a inteligência, podem se tornar muito mais eficazes quando se considera grandes grupos, e nesses casos o rating mede muito bem o comportamento da variável de interesse.

 

Em amostras com centenas de milhares de pessoas, como no caso do Mega Database (mais de 300.000 pessoas, sendo mais de 100.000 com mais de 24 jogos disputados), podemos analisar como varia o rating em função da idade, e a curva é, de fato, bastante semelhante à curva da inteligência fluida no WAIS dos 10 aos 20 anos e bastante semelhante à inteligência cristalizada no WAIS dos 20 aos 40 anos.

 

No artigo sobre Niemann, há vários estudos de caso de jogadores com evolução do rating em função da idade, que seguem um padrão bastante semelhante e razoavelmente bem definido. O gráfico abaixo mostra algumas curvas de variação do rating em função da idade para alguns dos melhores jogadores. Podemos observar que não há declínio perceptível antes dos 30 anos para nenhum deles. Também podemos observar que nenhum deles atingiu seu apogeu antes dos 20 anos ou mesmo antes dos 25 anos.

 

Nessa pequena amostra, precisamos fazer as ressalvas devido às diferenças de comportamento do rating em função da idade em comparação ao comportamento do QI em função da idade, mas quando consideramos a amostra muito mais numerosa do Mega Database, os erros para mais e para menos se compensam e podemos tratar os resultados observados para rating como altamente representativos do que ocorre com o QI.

 

Isso porque num grupo com 10 pessoas, como no exemplo acima, pode acontecer de que alguém com crescimento mais acelerado seja porque teve melhores oportunidades, melhores professores ou mesmo um ritmo anormalmente precoce nos primeiros anos. Mas quando se considera 100.000 pessoas, mesmo que algumas delas apresentem esses tipos de anomalias de precocidade ou melhores oportunidades, o peso dessas exceções é pequeno numa massa total de dados com 100.000 pessoas, além de haver exemplos contrários que contrabalançam essas anomalias, gerando resultados que refletem muito bem não só a evolução no Xadrez, mas também a evolução dos atributos cognitivos relevantes para o desempenho no Xadrez, entre os quais a inteligência, que correlaciona com a habilidade para o Xadrez entre 0,4 e 0,7.

 

Por isso é muito apropriado tomar como base esses dados sobre rating, em vez de usar os escores em testes de QI, principalmente quando se trata dos níveis mais altos de habilidade, já que os testes de QI falham tragicamente acima de 2 ou 3 desvios padrão acima da média, enquanto a habilidade para Xadrez continua sendo avaliada corretamente até 6 ou mais desvios padrão acima da média.

 

Embora essa habilidade avaliada no Xadrez não seja a própria inteligência, ela está mais fortemente correlacionada com a inteligência nos casos de escores acima de 130 de QI do que os resultados nos próprios testes de QI. Os high range IQ tests funcionam melhor do que o rating nesses casos, porém não há resultados publicados com grandes amostras que permitam esse tipo de análise usando high range IQ tests. De qualquer modo, os dados do Xadrez são bastante satisfatórios para essa finalidade.

 

É preciso ter em mente que no Xadrez o conhecimento (“inteligência cristalizada”) tem um peso maior do que em bons testes de QI. Depois que se ultrapassa um certo “nível basal” de conhecimento, os resultados no Xadrez passam a depender mais de aptidão inata do que de conhecimento, mas antes de alcançar esse nível, o conhecimento tem um peso grande, e como a maioria dos jogadores nunca chega a alcançar esse “nível basal”, então o conhecimento no Xadrez desempenha um papel muito relevante, fazendo com que em certa região da curva, o rating seja mais semelhante ao que se costuma chamar “inteligência cristalizada”.

 

O nível de conhecimento basal é aquele a partir do qual depois que a pessoa chega àquele patamar, não adianta muito continuar estudando, porque os incrementos em sua habilidade serão muito pequenos, quase imperceptíveis, mas antes de chegar nesse patamar, os incrementos com o estudo são substanciais. É a famosa “curva de aprendizado”. Nos primeiros dias e meses de estudo, a qualidade de jogo melhora muito rápido, subindo centenas de pontos de rating em poucos meses. Depois que a pessoa já dedicou 5 anos de estudo sistemático, o crescimento no rating fica muito mais lento ou até mesmo já se estabilizou. Nos primeiros 5 anos, a pessoa pode subir de 500 para 2000 de rating, mas entre os 5 e 10 anos, ou seja, nos 5 anos seguintes, pode subir de 2000 para 2050 ou 2100, ou até mesmo cair, dependendo da idade da pessoa.

 

Alguém com 70 anos que aprenda Xadrez, vai subir de rating nos primeiros meses e até primeiros anos, porque embora sua inteligência e sua aptidão para Xadrez estejam em declínio, o ritmo desse declínio é muito mais lento do que o ritmo em que as informações sobre estratégia, teoria de aberturas, teoria de finais, temas táticos vão sendo recebidos e assimilados. Por isso o rating sobe, embora a inteligência e a aptidão para Xadrez já estejam em fase de declínio. Mas essa mesma pessoa logo chegará a um ponto a partir do qual mesmo que ela continue estudando no mesmo ritmo, seu rating passará a diminuir, porque depois de adquirir certo volume de conhecimento, a soma de novos conhecimentos representará um incremento prático pequeno e o ritmo do declínio intelectual, embora continue lento, se tornará comparativamente menos lento do que o ritmo de aquisição de conhecimentos relevantes.

 

Aqui é preciso considerar também o conceito de análise fatorial. Quando se extrai o primeiro fator, ele é o mais importante, o que explica maior parte da variabilidade do fenômeno que se deseja investigar, geralmente explicando cerca de 70% da variabilidade. O segundo fator geralmente explica cerca de 20%. Portanto os 2 primeiros fatores já explicam 90% da variabilidade, de modo que todos os outros milhares de fatores restantes somados, só explicam 10% da variabilidade. Algo semelhante ocorre no aprendizado de qualquer coisa.

 

Quando a pessoa começa a aprender alguma coisa, seja Xadrez, Música, Matemática, um idioma ou uma linguagem de programação, no início ela vai aprender o que é mais importante para a compreensão daquela atividade. A pessoa que começa a aprender japonês vai começar por palavras e frases mais usuais, que são aplicadas em 70% do tempo. Depois vai complementando com outras numa segunda camada de mais usais, que combinadas aos primeiras, cobrem 90% das aplicações, e assim sucessivamente.

 

Depois de certo ponto, os novos conhecimentos começam a se tornar redundantes com os já adquiridos, ou servem apenas para nuances sutis em áreas muito especializadas. Com 3000 palavras e noções gramaticais, uma pessoa consegue se comunicar razoavelmente. Com 15.000 palavras, consegue se comunicar de forma praticamente completa. Com 100.000 palavras, quase não há aumento na capacidade de comunicação, embora haja um aumento na sofisticação do vocabulário, vastidão do vocabulário, mas não produz um ganho útil que ajude a expressar muito melhor suas ideias do que ela já conseguia fazer com 15.000 palavras. Na verdade, as linguagens poderiam ser sintetizadas com muito menos palavras.

 

Isso acontece com praticamente todo tipo de aprendizado, mas obviamente as curvas são diferentes em cada caso. Matemática e Ciência são campos ilimitados, com muito mais conhecimento existente do que uma pessoa pode adquirir ainda que vivesse 10.000 anos. É bem diferente de um idioma, no qual há um conjunto relativamente pequeno de regras gramaticais e de palavras mais usuais. Isso pode ser aprendido em alguns meses com imersão num ambiente de falantes nativos.

 

Nesse aspecto, o Xadrez está num nível intermediário entre um idioma e uma ciência. Se a pessoa compreende bem os conceitos de “domínio do centro” e “desenvolvimento de peças”, ela já deu um salto importante em seu aprendizado e já domina 90% da essência do Xadrez. O problema é que a maioria acha que compreendeu esses conceitos, sem ter de fato compreendido. A pessoa apenas decorou a frase “desenvolver peças e dominar o centro”, sem compreender o que isso de fato significa.

 

Para compreender de fato o significado, ela precisa dedicar milhares de horas de estudo de várias centenas de partidas, nas quais esses conceitos são aplicados, com diferentes níveis de erros e acertos, precisa compreender os comentários, inclusive filtrar os comentários errados, precisa tentar compreender os comentários certos, deduzir o que não consta nos comentários, e assim acaba chegando a uma compreensão razoável do que significa “desenvolver as peças” e “dominar o centro”. Para o meio-jogo, o conceito de desenvolvimento muda para “melhorar as posições das peças” e lutar pelo centro e por espaço em regiões específicas. No final, precisa centralizar o Rei, avançar peões passados, ou criá-los, caso não existam. Ao mesmo tempo, precisam evitar que o oponente faça essas coisas em cada fase.

 

O iniciante não considera nada disso, o iniciante quer dar xeque-mate, sem compreender que só conseguirá dar o xeque-mate se o oponente degradar a posição dele num nível suficiente, e para que isso ocorra, precisa criar problemas para que seu adversário desenvolva as peças dele e domine o centro, na abertura, e atinja os outros objetivos nas outras fases.

 

Esse efeito do aprendizado pode ser observado nos sistemas de AI que utilizam aprendizado profundo por reforço, como no caso de Lc0:

 

 

Por isso a curva de evolução de habilidade para o Xadrez em função da idade se parece mais com a curva de testes de QI que avaliam a inteligência cristalizada (conhecimento) do que a curva de testes de avaliam a inteligência fluida (pensamento). O ritmo de crescimento é muito maior no início e depois acaba quase estabilizando. Nos casos de humanos, estabiliza e decai porque embora o conhecimento (inteligência cristalizada) possa continuar aumentando, a capacidade de processar esse conhecimento (inteligência fluida) vai diminuindo.

 

Aqui não vamos discutir os problemas com os significados de “inteligência fluida” e “inteligência cristalizada”. Apenas enfatizados que, a rigor, são conceitos inadequados, mal formulados, e que conduzem a muitas interpretações erradas, mas podem ser úteis para uma primeira aproximação simplista, que ajuda a distinguir questões muito saturadas de fatores ambientais e culturais de outras questões menos saturadas e que exigem mais pensamento do que mera repetição mecânica.

 

Isso mostra que nos primeiros anos de vida, o desenvolvimento é predominantemente determinado pelo aumento na inteligência inata, mas a partir dos 20 anos a curva passa a ser mais dominada pelo aumento cultural, e a inteligência inata se estabiliza ou até mesmo inicia um lento declínio depois dos 20 – um declínio bem mais lento do que foi o crescimento nos primeiros 20 anos, e muitas vezes esse declínio é parcialmente (ou até completamente) compensado pelo aumento cultural.

 

Por isso no Xadrez o rating costuma se manter estável dos 20 aos 45 anos ou dos 25 aos 40 em alguns casos, eventualmente dos 17 aos 69, como no caso de Philidor ou dos 20 aos 57, como no caso de Lasker. Entretanto, a inteligência pode começar a diminuir antes dos 30, embora lentamente e quase imperceptível em casos individuais, mas notório na média de grupos numerosos.

 

Quando se tenta medir o desenvolvimento intelectual com base nos resultados no Xadrez, uma das dificuldades é que os melhores jogadores aprendem muito jovens, por isso é difícil separar quanto do aumento no rating é explicado pelo estudo e quanto é explicado pelo aumento no nível intelectual com a idade. Mas há algumas estratégias que permitem essa distinção, analisando casos de pessoas que aprenderam a jogar em idade adulta, como Deschapelles (32 anos), Rubinstein (20), Zukertort (19), Vidmar (19), Winawer (19), Blackburne (18).

 

Além disso, uma estratégia mais sofisticada é comparando os ritmos de evolução que tiveram em diferentes idades, ajustando as curvas de modo a subtrair o efeito do estudo. Isso não funciona individualmente, porque assume-se que os ritmos de estudo são iguais e com efeitos iguais, mas funciona em grandes grupos, porque em média os grupos apresentam níveis de estudo muito semelhantes e com efeitos semelhantes. Ou seja, dois jogadores A e B podem dedicar tempos muito diferentes ao estudo, e mesmo que dedicassem tempos iguais, o efeito dos estudos poderia ser muito diferente entre eles. Mas quando se considera dois grandes grupos de jogadores, A e B, com 1000 pessoas em cada grupo, é muito razoável assumir que o tempo médio de estudo no grupo A seja semelhante ao do grupo B, bem como o efeito médio do estudo nos membros do grupo A sejam semelhantes aos do efeito no grupo B.

 

·         Your maximum pIQ at 28.19 yo: 247.1 (μ=100, σ=16, Distribution=adjusted to true data)

 

É o QI absoluto máximo atingido ao longo da vida, geralmente ocorrendo próximo ou na mesma idade estimada no item anterior.

 

Entre parêntesis está a informação complementar de que esse valor do QI é baseado numa escala com média=100 e desvio padrão=16, embora a forma da distribuição seja diferente da de uma distribuição normal fora do intervalo de -3σ a +3σ, e em muitos casos já seja diferente desde +2σ.

 

Dentro do intervalo de -2σ a +2σ, a curva real gerada pelos dados costuma ser muito aderente a uma normal, por isso os parâmetros μ e σ, calculados com base na hipótese de normalidade, são geralmente razoáveis, porque na região de -2sd a +2sd estão contidos 95,5% das pessoas, enquanto apenas 4,5% ficam na região com anomalias na forma da curva, não tendo grande peso a ponto de distorcer os valores dos parâmetros. Como resultado, testes de normalidade sinalizam que a curva pode ser aceita como “normal”, embora não possa. Inclusive testes como Anderson-Darling, mais sensíveis a caudas densas, não costumam ser suficientes para detectar o problema, dependendo do tamanho da amostra.

 

É importante destacar que os níveis de raridade são notavelmente afetados, por isso a distinção entre pIQ e rIQ é imprescindível. Também é importante enfatizar que essa mudança na raridade não se deve a uma mudança no desvio padrão, que permanece sendo 16, se calculado com base na forma global da curva, embora seja localmente maior para escores acima de 130. Esse tema é desenvolvido com mais profundidade e com uma abordagem mais técnica no capítulo correspondente do “Livro de oura da inteligência”.

 

·         Age at which you reached the absolute pIQ of an average adult (IQ=100): 4.52 years

 

Idade na qual a pessoa atinge o nível intelectual equivalente ao de um adulto médio, isto é, um adulto típico com QI=100. Essa idade pode variar muito de uma pessoa para outra, algumas pessoas se desenvolvem muito mais rapidamente nos primeiros anos, mas depois passam a se desenvolver mais lentamente nos anos seguintes, ou o contrário, e esse tipo de aceleração ou desaceleração no desenvolvimento pode ocorrer em diferentes faixas de QI.

 

Apesar dessas flutuações, existe um comportamento médio típico dessas curvas para cada faixa de QI, portanto embora não possibilitem modelagens muito acuradas, são bastante razoáveis para proporcionar uma ideia aproximada sobre como o nível intelectual evolui nas pessoas em diferentes faixas de QI.

 

Assim, pode-se fazer essa estimativa para cada faixa de QI. Nesse exemplo, onde está escrito 4,52 anos, pode-se interpretar como algo entre 4 e 5 anos, ou seja, a pessoa “examinada” (Einstein, nesse exemplo) alcançou, aos 4 anos e meio, o mesmo nível intelectual de um adulto médio. A interpretação disso não é exatamente essa, porque a criança de 4 anos genial fará algumas coisas, compreenderá algumas coisas e resolverá com facilidade alguns problemas que um adulto médio não conseguirá, e vice-versa. Além disso, Einstein não é o melhor exemplo de precocidade na infância. Gauss, Galois, Pascal e Von Neumann foram exemplos mais notáveis de gênios precoces.

 

No exemplo específico de Einstein, é muito difícil julgar a adequação dessa estimativa, porque embora Einstein costumasse ele próprio dizer que foi uma criança retardada, inclusive algumas fontes afirmam que ele só teria começado a falar aos 4 anos, que usou fraldas até muito tarde, geralmente tais informações são fortemente distorcidas para provocar impacto publicitário.

 

Desde muito jovem, Einstein demonstrou profundas reflexões sobre muitos assuntos, especialmente sobre o que é a luz e suas propriedades. Ele também se interessou em tentar compreender o funcionamento da bússola quando ainda criança, o que sugere que não tinha nenhum retardamento, mas sim um talento muito acima do normal.

 

Embora as lendas sobre retardamento de Einstein na infância sejam provavelmente distorções e exageros, não há indícios de que ele tenha realizado proezas notáveis em seus primeiros anos, como se observa em alguns prodígios infantis. Por isso talvez a estimativa de 4,5 anos não seja correta para Einstein, mas certamente ele chegou à maturidade intelectual de adulto muito antes da maioria, talvez aos 6 ou 7 anos. Além disso, aparentemente ele continuou evoluindo até bem depois dos 29 anos, talvez até os 35 ou 40, portanto a curva para ele é diferente, assim como algumas curvas individuais também podem ser diferentes, por isso esses números devem ser interpretados com reservas, servem como um indicativo aproximado.

 

Esse tipo de ressalva é importante para compreender que embora os números possam ser eventualmente apresentados com vários algarismos, a precisão e a acurácia reais não são como os números sugerem. Esse tipo de ressalva seria muito mais importante nos testes de QI tradicionais, que além de numerosos erros e grandes incertezas, não se preocupam em chamar a atenção para as incertas e erros que eles contém, enquanto o STL, muito mais acurado e com incertezas muito menores, adota uma postura mais autocrítica, mais rigorosa e cuidadosa, oferecendo o exemplo de como todos os outros testes deveriam fazer. Quando se olha para a massa de dados que mostra como o nível intelectual varia ao longo da vida, percebe-se que há uma variação larga, portanto as incertezas são grandes. Isso é visível tanto no caso do Xadrez quanto do QI (para ver o gráfico de Xadrez, leia o artigo sobre Niemann, no caso do QI, alguns gráficos no final desse artigo).

 

·         rIQ: 202.9 (μ=100, σ=16, Distribution=Normal)

 

Esse número é a conversão do QI correto, baseado numa escala de proporção (que idealmente é como as boas escalas deveriam ser) num escore forçado a se ajustar a uma distribuição normal de níveis de raridade, com várias deformações na escala, como é explicado no artigo “Novo método para normatização de testes em escalas de proporção”.

 

A única utilidade desse número é ajustar o escore aos limites estatísticos teóricos para uma população de 8 bilhões de pessoas vivas, ou 200 bilhões que nasceram ao longo da história da humanidade, ou das 100 bilhões que chegaram à idade adulta.

 

Convém lembrar que todos os testes de QI medem o pIQ, bem como os high range IQ tests, porém eles calculam incorretamente os níveis de raridade como se estivessem medindo o rIQ. Isso conduz a muitos mal-entendidos e distorções. Sociedades de alto QI que supostamente teriam cut-off no nível de 1 em 1 bilhão, na verdade tem corte verdadeiro perto de 1 em 1 milhão. A distorção pode ser ainda maior quando há também outros erros mais graves nas normas dos testes aceitos para admissão.

 

Forçar os escores a se ajustarem a uma distribuição normal é tão bizarro quanto tentar forçar as alturas a se ajustarem a uma distribuição normal. Isso implicaria destruir completamente o sistema métrico decimal. Toda a Física, a Engenharia, a Química, toda a Ciência seriam inutilizadas se tal ajuste fosse adotado, porque 1 cm numa certa região da escala seria maior do que 1 cm em outra região da mesma escala, o sistema seria trivialmente inconsistente.

 

Perto da cintura, 1 cm teria quase o dobro do comprimento de 1 cm perto do topo da cabeça das pessoas mais altas, as réguas, trenas, fitas métricas precisariam ser deformadas para isso. Não faz o menor sentido, assim como tentar distorcer os escores dos testes de QI para que a distribuição fique aderente a uma normal na região central da distribuição, mesmo porque esse forçamento não promove um ajuste real, porque não ajusta as regiões distantes da massa central de dados. Esse é o tipo de desastre que se faz quando se utiliza o método de Wechsler para padronizar os escores, em vez de tentar compreender e medir como os escores verdadeiros se distribuem.

 

Em alguns exames, como vestibulares, provas escolares, concursos públicos, pode-se padronizar os escores porque não existe um constructo psicológico subjacente sendo aferido, ou seja, não envolvem um constructo que possua características próprias que precisem ser compreendidas e medidas corretamente. Por isso é aceitável que se faça tais padronizações nesse tipo de prova, mas não nos testes de QI, porque no caso do QI existe um constructo que se deseja medir, e as propriedades desse constructo são adulteradas quando se adota os procedimentos de Wechsler para padronização dos escores, além de não conseguir padronizar de fato, porque só os escores no intervalo coberto pela população da amostra acaba sendo “ajustado” naqueles moldes, enquanto o restante fica num molde ainda pior, que não é a escala original nem a escala ajustada.

 

Quando se calcula a média e o desvio padrão de uma amostra, os valores obtidos para média e desvio padrão decorrem quase totalmente do comportamento da região central da distribuição, entre -2sd e +2sd, que reúne mais de 95% dos dados. Mesmo quando se tenta aplicar o teste a mais de 1000 pessoas, de modo a cobrir 3 desvios padrão, quando se força os escores nesse intervalo a terem distribuição normal, isso não implica que os escores fora desse intervalo também ficarão ajustados, porque os tamanhos das distorções são diferentes. Os erros entre +2sd e +3sd são moderados, mas vão crescendo progressivamente nos níveis mais altos.

 

Por isso tentar ajustar os escores com base numa amostra de 1000 a 3000 pessoas, cobrindo pouco mais de 3 desvios padrão, ainda ficam distorcidos todos escores maiores que 3,5 desvios padrão. Além disso, o “ajuste” não é uma correção, mas sim uma degradação, conforme explico no artigo “Novo método para normatização de testes”, portanto piora inclusive os escores entre +2sd e +3sd. Só não piora gravemente os escores entre -2sd e +2sd porque nesse intervalo as diferenças entre pIQ e rIQ são pequenas, porque nesse intervalo a distribuição verdadeira é de fato semelhante a uma distribuição normal.

 

A pessoa mais alta do mundo tem 2,57 m, porém a altura máxima esperada para uma população de 8 bilhões de pessoas seria 2,14 m, já que os cálculos da média e do desvio padrão indicam 1,70 m e 0,07 m respectivamente. Entretanto é óbvio que não faria sentido mudar o significado de metro – e derivados do metro – para cada faixa de altura de modo a forçar as medidas de altura a terem o nível de raridade previsto teoricamente, não faria o menor sentido distorcer as fitas métricas, preservando os intervalos uniformes até 1,85 m, mas os intervalos começassem a ficar mais largos acima de 1,85 m, e cada vez mais largos.

 

Em vez de distorcer a escala métrica para forçar as medidas de altura a se encaixarem numa distribuição gaussiana, o mais plausível é compreender como as alturas se distribuem de fato e modelar essa distribuição de modo a produzir resultados compatíveis com a observação. A incidência de pessoas mais altas do que “deveriam” indica um erro no modelo que tenta prever os níveis de raridade para cada altura, em vez de um erro na métrica utilizada para aferir a altura. O mesmo problema da distribuição das alturas ocorre com o QI.

 

·         SAT equivalent: Would break the SAT ceiling, above 1600. Equivalent to 2608

 

O Scholastic Assessment Test (SAT) passou por várias padronizações ao longo de décadas, sendo que as últimas revisões relevantes foram em 1974 e 1995. Em certos momentos, o SAT foi padronizado para ter escore médio 800 e desvio padrão 200, mas esses valores mudam ligeiramente ao longo dos anos, com eventuais reajustes para reposicioná-los perto de 800 e 200.

 

Desse modo, bastar aplicar uma regra de três para converter escore do SAT em QI e vice versa, usando a média e o desvio padrão em cada um. Porém o teto do Sigma Test Light é acima de 180, enquanto o SAT tem teto 1600, que seria equivalente a 164 de QI na versão pré-1974. Por isso não há como converter os escores mais altos no STL em escores do SAT porque não existem escores correspondentes no SAT que satisfaçam essa equivalência. Uma pessoa com 170 de QI teria mais de 1600 no SAT, mas não existem escores acima de 1600 no SAT.

 

Bill Gates, por exemplo, teve escore 1590 no SAT em 1973, sendo aplicada a norma na qual seu QI correspondente seria 163, embora algumas fontes atribuam a ele 159 ou 160, baseados no SAT pós-1995. Outras fontes atribuem 151 ou 152, com base em conversões baseadas em Teoria de Resposta ao Item (TRI).

 

O correto para Gates é cerca de 140 a 165, sendo o caso de Gates analisado com mais detalhes no “Livro de ouro da inteligência”. Em síntese, no caso de Gates, a conversação baseada em TRI não é acurada, por outro lado a variável medida pelo SAT não é adequada para medir corretamente o QI acima de 135, o que torna o SAT insuficiente para avaliar o QI de Gates, mas em conjunto com seu legado e algumas de suas realizações, entrevistas, hábitos etc., pode-se estimar seu QI como algo com mais de 70% de probabilidade de estar no intervalo de 140 a 165.

 

Como a variável medida pelo SAT não é uma representação acurada do QI acima de 135, assim como as variáveis medidas por qualquer outro teste de QI tradicional, não é possível uma previsão segura de quanto uma pessoa obteria no SAT com base no escore que ela obteve no STL, já que o STL mede razoavelmente bem a inteligência até acima de 180 de QI, podendo chegar até mais de 190. O que se pode fazer é comparar o nível de raridade de pessoas que alcançam determinado escore no STL com pessoas que alcançam determinado escore no SAT. Por exemplo: um escore 137 no STL representa um nível de raridade de 1 em 100, que equivale a 1262 no SAT.

 

Mesmo quando se limita a interpretação dessa equivalência, ainda há várias outras ressalvas a serem feitas, porque o SAT é uma prova de múltipla escolha explícita e com poucas alternativas, geralmente 4 alternativas por questão, e uma parte do exame é subjetiva. Nesse aspecto, o Graduate Record Examination (GRE) costuma ter 5 e às vezes 6 alternativas por questão, o que reduz um pouco o efeito da sorte/azar, tornando os escores no GRE um pouco mais acurados, embora outros fatores precisem ser também considerados para avaliar a acurácia, inclusive validade de constructo, e adequação dos níveis de dificuldade.

 

Mas, de modo geral, pode-se fazer a conversão dos escores do SAT em QI e vice-versa, assim como do GRE, ACT, Enem, Fuvest e outros exames com correlação acima de 0,6 com testes de QI. No caso do SAT, a correlação é 0,82. Esse limite de 0,6 é geralmente adotado pelo Conselho Federal de Psicologia (CFP), mas não é um critério muito apropriado, conforme é explicado no “Livro de ouro da inteligência”. De qualquer modo, esses exames são tão bons para avaliar o QI quanto os próprios testes de QI, assim como os testes de QI são tão bons para predizer resultados nesses exames quanto os próprios exames de anos anteriores (ou posteriores podem ser preditos).

 

Além disso, pode-se extrapolar o teto do SAT e GRE, e estimar, caso esses testes contivessem maior número de questões, com questões mais difíceis, qual seria o escore obtido para manter equivalência com o escore no Sigma Test Light. No caso de Einstein, embora o teto do SAT seja 1600, o QI de Einstein exigiria um pouco mais de 2600 para que pudesse ser medido, e obviamente os níveis de dificuldade e a validade de constructo das questões precisariam de profundas adaptações para que os resultados fizessem algum sentido, em vez de medirem apenas rapidez para questões simples.

 

Um membro típico da Mensa, por exemplo, teria expectativa de obter cerca de 1200 a 1250 no SAT ou no GRE, que é bem menos do que o necessário para ser aprovado em Harvard, Princeton e outras das melhores universidades dos EUA.

 

·         GRE equivalent: Would break the GRE ceiling, above 1600. Equivalent to 2685

 

No caso do Graduate Record Examination (GRE), aplicam-se quase os mesmos comentários do SAT, porém com valores um pouco diferentes para os parâmetros, e algumas diferenças de conteúdo, formato etc., mas, em linhas gerais, são bastante semelhantes.

 

·         Theoretical percentille: 100.0%

 

Aqui há um erro, o correto para Einstein seria 99,9999999999999999472133%, mas os cálculos foram feitos com scipy, que tem limitações para variáveis double precision com mais de 15 ou 16 algarismos significativos.

 

O teto do STL fica entre 180 e 210 (ainda a ser determinado pela normatização ao longo dos meses, conforme mais pessoas que já fizeram outros testes forem examinadas com o STL), por isso não há necessidade de medir a raridade no nível teórico de 247 de QI absoluto (241.26471732358468 de QI ajustado à idade, no caso de Einstein), que para uma distribuição teórica com média 100 e desvio padrão 16 seria cerca de 1/1.894.416.550.414.096.896, que contem 19 dígitos, excedendo as limitações do scipy.

 

Para calcular o valor correto, precisaria usar o mpmath, ou adotar alguma estratégia para isso, como calcular a raridade para o mesmo número negativo de desvios padrão, converter num número inteiro multiplicando pela potência P correspondente, e depois fazer a subtração de 10^P por esse valor, que serviria nesse caso, mas não seria generalizável. E o uso do mpmath não é muito “confortável”, exceto quando é estritamente necessário.

 

O mpmath não reconhece decimais escritas na forma números, do tipo pi=3.1415926535897932384626433832795, nesses casos ele só lê e só trabalha com os 15 ou 16 primeiros, como faria o numpy ou scipy. Para que o mpmath possa aproveitar a maior precisão e seus demais recursos, o número precisa ser escrito como texto, assim: pi=“3.1415926535897932384626433832795”, mas ao representar um número dessa maneira, todas as outras fórmulas usando scipy e numpy deixam de funcionar, ou precisam de correções adicionais, ou todo o código precisa ser reescrito de modo compatível com o mpmath. Mas a maneira como o mpmath representa as funções matemáticas é bem mais trabalhosa, menos intuitiva, e com maior risco de anotar algo errado ao traduzir. Por exemplo, algo simples como:

 

r = n-d+d*((d-1)/d)**n

 

ao ser escrito para executar usando mpmath ficaria assim:

 

r = fsub(fadd(n, fmul(d, pow((fdiv(fsub(d, 1), d)), n))), d)

 

algo tão simples quanto 1+1 fica fadd(1, 1). Em muitas situações, o mpmath é imprescindível, por ter muito mais funções do que scipy e numpy, ser mais rápido para cálculos complexos e ter quantos algarismos quisermos com decimais. Mas numpy e scipy são muito mais intuitivos, mais práticos para implementar. Além disso, a maneira como se trabalha de forma integrada com numpy e pandas usando arrays, inclusive com cálculos envolvendo datas, torna-se muito mais complexa e trabalhosa usando mpmath. Por isso enquanto o teto do STL for menor que 210, não vou “corrigir” isso e vou continuar usando scipy para essa finalidade.

 

Mas esse detalhe não é importante, é apenas um esclarecimento necessário, porque não pode haver percentis de 100%, porque a distribuição normal não possui limites assintóticos, logo não há como algum valor estar acima de todos os outros.

 

O importante aqui é esclarecer o significado conceitual. Esse “percentil teórico”, assim como a “raridade teórica” são os valores correspondentes se a distribuição dos escores fosse normal com média=100 e desvio padrão=16 ao longo de toda a distribuição. Na verdade, o “percentil verdadeiro” também é teórico, porém ele se baseia em postulados mais adequados para representar a situação real, usando uma função mais aderente à distribuição verdadeira dos escores, enquanto o percentil teórico e a raridade teórica assume, o postulado falso de que a distribuição dos escores é normal, o que só teria validade aproximada dentro do intervalo de -2sd a +2sd.

 

Qual a utilidade dessa informação sobre o percentil teórico, se ela é falsa? A resposta é simples: ela é usada em todos os testes de QI e em todos os high range IQ tests, portanto, para permitir comparação de equivalência, essa informação precisa constar, caso contrário alguém que obteve escore 190 no Mega Test, cuja raridade teórica é cerca de 1 em 100.000.000, pode pensar que isso corresponde a mais do que 190 no Sigma Test Light, já que no STL o escore 190 é associado a um nível de raridade de 1 em 260.000.

 

Porém os fatos mostram que a norma do Mega Test está gravemente distorcida para escores acima de 140 e principalmente acima de 150, e a raridade verdadeira para o escore 190 no Mega Test é algo entre 1/ em 32.000 e 1 em 260.000, portanto é o contrário, o escore 190 no STL representa mais do que 190 no Mega Test, porém como o STL informa a raridade verdadeira de 1 em 260.000 para 190, enquanto o Mega Test informa 1 em 100.000.000, que é muito destoante do correto, uma pessoa que faça uma análise superficial ou que não compreenda corretamente os problemas envolvidos, tende a interpretar incorretamente tudo isso. Para evitar tais confusões, ou pelo menos minimizar isso, o laudo do STL inclui as duas informações sobre raridade, tanto a correta quanto a “oficialmente adotada por todos”.

 

Há diferentes estudos para tentar corrigir a norma do Mega Test e estimar percentis e raridades mais realistas do que as indicadas na “norma oficial”. O estudo de Bob Seitz indica para o Mega Test um teto real de rIQ=170, em vez de 193. Em estudo de minha autoria, realizado em 2003, indica para o Mega Test um teto de rIQ=166. Outros estudos chegam a valores entre 165 e 175, usando diferentes métodos, mas nenhum chega perto de 190, que é um escore bastante inflado se se considerar rIQ, mas é bastante próximo do correto se considerar pIQ. Kevin Langdon, Grady Towers e outros também propuseram “revisões” nas normas do Mega Test.

 

Uma das mais recentes foi proposta por David Redvaldsen em 2019: https://www.researchgate.net/figure/New-norming-of-the-Mega-Test-2019_tbl5_341032783 e chega a resultados semelhantes aos das revisões anteriores, com teto perto de 175, que não é informado de forma explícita, mas apenas 170+, começando com 170 para 45 certos e depois anotando 170+ para 46, 47 e 48 certos, que é uma anotação bastante cautelosa e adequada, pois como o nível de dificuldade das questões mais difíceis é semelhante, isto é, acertar as 4 mais difíceis não representa muito mais do que errar algumas delas e acertar outras, pois os acertos podem indicar competência para resolver esse tipo de questão nesse nível de dificuldade, enquanto os erros indicariam desmotivação por ter que dedicar tempo à resolução de questões semelhantes. Isso afeta, por exemplo, as questões 25, 26 e 27 do Sigma Test Extended (STE), que são semelhantes e envolvem um tipo semelhante de raciocínio, com pequenos detalhes diferentes. Por isso, 48 acertos não implica necessariamente um escore muito maior do que 45.

 

Portanto os níveis de raridade e os percentis informados nos laudos de todos os testes são distorcidos para os escores acima de 140, e a distorção cresce quase exponencialmente à medida que o escore aumenta. O erro é menor e menos grave do que nos testes de QI usados em clínicas, mas ainda é suficientemente grande para gerar distorções grandes nas proximidades do teto. Como esse é um erro generalizado e, de certo modo, “institucionalizado”, decidimos manter o padrão para permitir comparações adequadas.

 

De certo modo, é o tipo de problema que se observa em fundos de investimento que fazem publicidade de suas performances medidas em R$, sem corrigir as performances pela inflação. Mesmo se as performances fossem em US$, precisariam ser corrigidas pela inflação, além da discussão sobre qual a maneira correta de medir a inflação.

 

Claro que no caso do QI o erro não é tão óbvio nem tão elementar quanto deixar de considerar a inflação, mas também produz uma distorção nos resultados, que requer um ajuste para reposicionar os valores num patamar realista.

 

Por esses motivos, nosso laudo inclui tanto a informação correta (que outros testes não informam, sobre raridade verdadeira e percentil verdadeiro), quanto a informação incorreta, que é a mesma apresentada em outros laudos, para permitir uma comparação justa.

 

·         True percentille: 99.9999999936%

 

O significado de “percentil” é qual a porcentagem da população com QI não tão alto quanto o da pessoa examinada. Se a pessoa tem 132 de QI, significa que ela tem QI mais alto do que 97,7% da população. Aqui caberia uma discussão sobre “qual população”, e geralmente o significado é uma população não-seleta de adultos, em escala mundial e histórica. Essa discussão precisa considerar efeito Flynn, diferenças culturais, temporais, etárias, étnicas e outras, mas esse debate não caberia aqui, sendo o tema explorado com mais detalhes em nossos livros e artigos.

 

·         Theoretical rarity: 1 in 1,894,416,550,414,111,744 (supposed normal distribution)

 

Já foi explicado antes. Cabe apenas ressaltar que foi calculado usando o scipy, cujo valor é incorreto nos últimos dígitos. O correto, tal como exposto acima, é 1/1.894.416.550.414.096.896, portanto os últimos 5 dígitos são incorretos. De qualquer modo, isso só tem alguma relevância teórica, porque o primeiro algarismo já é incerto. Nesse nível de raridade, é difícil estimar corretamente diferenças entre

1/1.000.000.000.000.000.000

e

1/10.000.000.000.000.000.000

 

·         True rarity: 1 in 15,534,557,186 (based on true distribution)

 

Esse número proporciona uma ideia aproximada do tamanho do erro que pode ocorrer nos cálculos teóricos de raridade com base na hipótese de que a distribuição dos escores é normal. Esse número também é “teórico”, como foi dito acima, mas se apoia numa teoria mais representativa da distribuição verdadeira dos escores inclusive nas extremidades das caudas. Mas também deve ser interpretado como uma aproximação, uma melhor aproximação que o anterior, tanto na acurácia quanto na precisão, mas ainda assim uma aproximação. Nesse caso, pode ser encarado como algo entre 10.000.000.000 e 25.000.000.000 ou até mesmo num intervalo mais largo pode ser alto entre 5.000.000.000 e 50.000.000.000.

 

O significado de raridade verdadeira é homólogo ao de percentil verdadeiro, conforme já explicado. Representa a raridade calculada a partir de um modelo representativo da distribuição real, em especial considerando as caudas densas observadas nas distribuições reais e utilizando uma escala de proporção na qual os escores são espaçados de forma correta.

 

·         Equivalent intellectual potential: 128,793,818% above average

 

Esse valor é calculado conforme é explicado no “Novo método para normatização de testes em escala de proporção”, com mais detalhes também no artigo sobre a norma de 2003 do Sigma Test.

 

Significa que uma pessoa com o QI da pessoa examinada tem capacidade de produção intelectual equivalente à de 1.300.000 pessoas médias trabalhando juntas, ou 130.000.000% maior do que a capacidade de produção de uma pessoa média. O significado disso não caberia resumir aqui, sendo recomendável a leitura dos artigos em nosso site.

 

·         Your IQ is higher than the average IQ in 100.0% of the countries in the world. See the complete list in the link at the end of this report.

 

Por fim, compara o QI da pessoa com a média de QI nos diferentes países. Há uma versão de Richard Lynn para os QIs nos países, que apresenta várias distorções graves, e há um artigo no qual analiso e reviso os erros cometidos por Lynn.

 

No final do laudo, há links recomendados para que se possa obter as informações necessárias para uma interpretação adequada do jargão utilizado no laudo, inclusive link para esse artigo sobre os QIs nos países e outro sobre os QIs nas universidades, ambos revisados, nos quais analiso os motivos pelos quais os textos originais estão incorretos e apresento dados mais próximos da realidade.

 

Analisaremos agora as imagens que ilustram o laudo do STL, explicando brevemente cada uma:

As duas imagens acima são basicamente representações da curva de distribuição de densidade de probabilidades baseada no modelo concebido e parametrizado para se ajustar aos dados reais, inclusive nas extremidades das caudas, representando a distribuição verdadeira dos QIs. Embora seja a mesma curva, o eixo “y” está numa escala logarítmica no segundo caso, para permitir visualizar o comportamento das caudas.

 

Pode-se notar que é uma curva assimétrica e que essa assimetria cresce nas caudas, diferentemente da curva teórica normal. No caso de Einstein, foi representado fora do limite de 212 de QI, porque o teto do STL não deve chegar a esse ponto. Se fosse uma pessoa com escores 134 ou 152, esses casos seriam representados assim:

 


A região hachurada indica o grupo de maior QI no qual essa pessoa faz parte. No caso de 134 está no grupo TOP 1,63% e no caso de 152 está no TOP 0,112%, ou seja, percentis 98,37% e 99,888% respectivamente.

 

As próximas imagens mostram tabelas de classificação em função do QI. Em vez de impor uma escolha específica de classificação, achei mais apropriado apresentar diferentes classificações sugeridas por diferentes psicometristas, deixando a interpretação a critério da pessoa, mesmo porque não há uma interpretação “certa” ou “errada”, mas sim uma questão de escolha de quais palavras ela prefere aplicar para determinado estrato.

 

A maioria dessas classificações é feita de forma arbitrária, com faixas de 10 em 10 pontos de QI, sem qualquer justificativa científica ou matemática para que os intervalos sejam esses. É diferente no caso da classificação que proponho, que utiliza análise de clusters para estabelece grupos mais homogêneos internamente e mais diferentes dos outros grupos, e estabelece as separações entre os estratos com base nessas dissimilaridades e similaridades dos elementos, de modo a agrupar elementos mais semelhantes como membros da mesma faixa de QI. Isso, porém, não assegura que os nomes atribuídos a cada estrato sejam os mais adequados. As separações e delimitações dos estratos são mais objetivas e científicas, mas os nomes ainda são escolhas subjetivas, tentando obter inspiração para os nomes com base nas características dos integrantes de cada grupo, mas ainda assim há uma carga considerável de subjetividade nessa nomenclatura.

 

Nas demais classificações, além da subjetividade nos nomes, há também arbitrariedade e ausência de critério adequado para determinar as divisões entre os estratos, muitas vezes misturando pessoas com perfis diferentes, e agrupando pessoas diferentes num mesmo agrupamento. Esse tipo de erro é evitado pelo meu método.

 Sigma—Hindemburg Classification by Cluster Analysis of ST, STE, 2003—2024

 

 

Nörlinger Classification by interval, 1998

 

 

Levine & Marks Classification by interval, 1928

 


Wechsler Classification by interval, 1939—1955 (adjusted to μ=100, σ=16)

 

Terman Classification, by interval, 1916—1937

 

 

Existem várias outras classificações além dessas. Procurei selecionar as que tiveram maior importância histórica ou alguma utilidade prática ou científica que a tornasse mais relevante. Contudo, as tentativas de impor intervalos de 10 em 10 pontos ou similar me causa forte rejeição, porque não é assim que as variáveis se agrupam no mundo real. É necessário tentar compreender como as variáveis realmente se agrupam e determinar critérios compatíveis com as propriedades dessas variáveis, em vez de fingir que se agrupam de 10 em 10 pontos, ou forçar que se agrupem de 10 em 10 pontos.

 

Em alguns casos o erro é ainda pior, porque deixam lacunas, do tipo:

 

Entre 90 e 109 é QI normal.

Entre 110 e 119 é médio superior.

 

E cortam os valores entre 109 e 110. Esse tipo de aberração leva a vários erros psicométricos. Entre as tabelas que incluí acima, a maioria está com esse erro, mas os corrigi antes.

 

A próxima imagem é apenas uma curva teórica de distribuição normal padrão, com média=0 e desvio padrão=1, para ilustrar e para proporcionar uma ideia quantitativa aproximada de como os escores se distribuem.

 

Theoretical distribution

A imagem a seguir já foi analisada anteriormente:

 

Theoretical model (by Hindemburg) of variation of Absolute pIQ by age (good health)

 

A próxima imagem é das mesmas funções, mas num intervalo mais estreito, para facilitar a visualização do que acontece com a evolução intelectual nos primeiros anos de vida e compreender melhor essa evolução até chegar ao ponto de desenvolvimento máximo para cada faixa de QI, bem como para perceber visualmente como é essa e outras variações em função do QI.


Theoretical model (by Hindemburg) of variation of Absolute pIQ by age (young)

 

Por fim, a lista das recomendações de leitura complementar.

Understand the pIQ, rIQ and more: https://www.sigmasociety.net/artigos 

Sigma Test Extended: https://www.sigmasociety.net/sigmatest-extended

Corrected average IQ in several countries: https://www.sigmasociety.net/artigo/qis-corretos-dos-paises 

Corrected average IQ in main universities and colleges: https://www.sigmasociety.net/artigo/qi-universidade-escolas

Discover the IQs of famous people from science, arts, sports: https://www.sigmasociety.net/top1000qis

Measure Theory, Psychometrics, Science, Math and more: https://www.amazon.com.br/stores/author/B09D8SDT9P

IQ by age study: https://www.sigmasociety.net/news/eng-niemannxcarlsen

 

Agora analisaremos mais detalhadamente os casos de QI máximo alcançado ao longo da vida, QI absoluto, QI ajustado à idade, e variação do QI em função da idade, que por ser uma explicação mais extensa e recorrer a muitas imagens, comprometeria a fluência do texto se fosse introduzida acima nos itens correspondentes.

 

O QI máximo é autoexplicativo, e já foi detalhado suficientemente acima.

 

O QI ajustado à idade já foi razoavelmente explicado, mas cabe adicionar alguns complementos na parte inicial, sobre uma criança de 10 anos que obtenha escore 90 num teste normatizado para adultos etc. Vamos considerar mais alguns exemplos: Uma criança de 7 anos que obteve escore 90 num teste para adultos se saiu melhor do que a criança de 10 anos. Antigamente se ajustava isso supondo linearidade na evolução da inteligência com a idade, pela famosa fórmula de QI = IM/IC, onde IM = idade mental, IC = idade cronológica. A idade mental é a média aritmética das idades das pessoas que tiveram mesmo escore bruto que essa pessoa e a idade cronológica é o tempo próprio transcorrido desde o nascimento da pessoa até a data do exame.

 

Além disso, antigamente se considerava que a maturidade mental de adulto era atingida aos 16 anos, e partir de então a inteligência estabilizava para o resto da vida. Alguns consideravam 15 anos, outros consideravam 15,65 anos, alguns consideravam 17 anos, mas o valor mais usual era 16 anos, porque Binet observou que acima de 16 anos não parecia haver aumento (nem redução) no escore médio obtido pelas pessoas nos testes, levando à interpretação inicial de que depois dos 16 o nível intelectual se mantinha constante pelo resto da vida, eventualmente decaindo por senilidade na velhice avançada.

 

Pessoas de 30 ou 40 anos tinham praticamente mesma média de escore bruto que pessoas de 16 ou 17 ou 20 anos. Entretanto, à medida que maior número de pessoas de diferentes faixas etárias foram examinadas, percebeu-se que o nível intelectual continua variando mesmo depois dos 16 anos.

 

Também se percebeu que a evolução do nível intelectual nas idades iniciais (antes dos 20 anos) não era linear em função da idade, como se “pensava”. Na verdade, nem todos pensavam isso, o próprio Binet parecia compreender que a evolução não era necessariamente linear com a idade, mas como primeira aproximação seria razoável usar uma reta, até que se reunisse mais dados e se pudesse tentar reconstruir a forma correta da curva de variação do nível intelectual em função da idade.

 

Atualmente há muitos modelos de ajuste da variação do nível intelectual em função da idade, mas todos apresentam vários problemas graves. Alguns estão inteiramente comprometidos e inutilizados, enquanto outros possuem fragmentos úteis, como o WISC e WAIS para a faixa etária de 10 a 40 anos, intervalo no qual proporcionam uma estimativa razoavelmente acurada da variação no QI absoluto em função da idade.

 

O gráfico a seguir mostra justamente as curvas baseadas no WAIS:

 


 

Os dados cobrem o intervalo de 5 anos a 89 anos, mas só apresentam forma razoavelmente correta entre 10 e 40 anos. Além disso, a maioria das curvas é quase inútil para explicar a variação da inteligência com a idade. Somente o Gf e Gc são razoáveis e a combinação de ambos, em conjunto com as variações no rating de Xadrez, permitem a composição de um modelo preliminar adequado. Os números indicados no eixo y provavelmente não são o QI, mesmo assim há um erro claro em todos os escores serem 0 aos 5 anos, isso é um sintoma de ajuste forçado e decorre de uma compreensão incorreta do que acontece.

 

Mas há ainda vários erros, um dos quais está em tratar a distribuição dos QIs como se houvesse um limite assintótico em 0 de QI e em 5 anos de idade, como se os escores de QI começassem em 0 e a vida começasse aos 5 anos.

 

A distribuição normal não tem limites assintóticos, por isso o QI pode ter qualquer valor entre -ထ e +ထ. a

Claro que existem limites orgânicos que dificultam a existência de pessoas com QI muito acima de 300 ou 400, assim como é muito difícil QIs abaixo de 0 ou de -100. Mas impor um mínimo em 0 correspondente a 5 anos não faz o menor sentido, mesmo porque uma criança de 5 anos típica tem nível intelectual semelhante ao deum adulto com cerca de 40 de QI, que é muito diferente de um adulto com 0 de QI. Portanto todos os valores iniciais de todas essas curvas estão errados, e esses erros obviamente se propagam aos demais valores, mas o erro vai se tornando mais tênue à medida que a idade se afasta de 5 anos, e a partir de 10 anos a curva já começa a assumir um formato mais realista.

 

Outros erros ocorrem devido aos conteúdos do teste, que não teria como analisar aqui porque demandaria 30 a 40 de páginas. Essa análise é apresentada no Livro de ouro da inteligência no capítulo que discuto os erros no WAIS. Um dos vários erros é que vários dos subtestes medem características que não tem nenhuma ligação conceitual com inteligência, embora apesentem correlação positiva por motivos variados. Os cubos de Kohs são um excelente exemplo de teste adequado para macacos, elefantes, e outros animais, mas não é adequado para humanos, porém devido ao pouco tempo disponível, esse subteste acaba discriminando acima do nível de raridade de 1 em 100.000.

 

Isso não faz o menor sentido, porque esse subteste não mede a inteligência nem sequer no nível de 1 em 10, quanto menos no nível de 1 em 100.000. O constructo avaliado por esse subteste só tem alguma relação conceitual com inteligência em níveis bastante elementares, de QIs abaixo de 80, podendo chegar no máximo até 110 ou 120. Mas quando se impôe limites insanos de escassez de tempo, acaba sendo tão difícil de resolver que apenas 1 em cada 100.000 pessoas ou menos possui o tipo de habilidade necessária para isso, mas tal habilidade nada tem a ver com inteligência no nível de 1 em 100.000, nem sequer em níveis acima de 1 em 100. Outros subtestes do WAIS apresentam erros ainda mais graves, e como o WAIS é um dos melhores (menos piores) testes, significa que os outros testes e subtestes são ainda mais problemáticos.

 

Apenar desses absurdos, os escores produzidos ainda são bastante adequados para representar o nível intelectual, porque geralmente pessoas inteligentes também gostam de ler, também pensam com rapidez, também têm boa memória etc., de modo que ao medir vocabulário, informações rasas, repetição mecânica baseada em memória de curto prazo, rapidez para lidar com questões elementares e assim por diante, embora nenhuma dessas habilidades seja uma boa representação conceitual do que é a inteligência, geralmente pessoas que possuem essas habilidades desenvolvidas também possuem a inteligência desenvolvida.

 

Isso é extremamente “perigoso”, porque conduz a muitas interpretações erradas de que o teste está medindo a inteligência, quando na verdade está medindo atributos que se correlacionam estatisticamente com a inteligência, mas não conceitualmente, de modo que algumas vezes esses a habilidade para resolver esse tipo de questão pode não ter nenhuma ligação nem correlação com inteligência em certos níveis, e é justamente o que se observa nos níveis mais altos. Um dos subtestes consiste em olhar para 10 símbolos, cada símbolo associado a um número de 0 a 9, depois ir preenchendo uma lista de campos com os símbolos correspondentes. É um teste bastante ridículo, que um chimpanzé bem adestrado consegue fazer, mas o limite de tempo é insano.

 

No meu caso, primeiro memorizei os símbolos e depois preenchi sem gastar tempo olhando cada um, e consegui completar dentro do prazo, mas menos de 1 em 1 milhão de pessoas deve fazer isso. Entretanto, a norma do teste considera que 1 em 740 conseguem fazer, o que denuncia que o teste não foi normatizado corretamente. E o pior é que resolver ou não esse subteste não diz nada sobre o nível intelectual acima de 70 ou 80 de QI, já que qualquer pessoa, ou mesmo algum primata, pode memorizar e depois preencher dentro do prazo. Não existe nenhuma dificuldade intelectual relevante nesse subteste, esse é o problema. E mesmo assim o teste é usado para discriminar num nível de quase 1 em 1000 entre humanos, embora não sirva nem para 1 em 10.

 

É como se incluísse entre os subtestes a habilidade de equilibrar uma bola no nariz, ou de descascar um coco com os dentes. Poucas pessoas conseguem fazer isso, portanto a raridade de pessoas que conseguirá cumprir pode ser menor do que 1 em 1000, mas a característica que estará sendo avaliada não terá relação com a inteligência. Além disso, uma foca e alguns outros animais bem treinados podem equilibrar uma bola no focinho com mais habilidade que a maioria dos humanos.

 

Essa minha analogia apresenta algumas falhas, porque embora nem essas habilidades citadas nos parágrafos nem acima nem os subestes avaliem corretamente a inteligência nos níveis acima de 80, há uma diferença importante e “perigosa”, que é o fato de que os resultados nesses subtestes correlacionam positivamente com inteligência, o que leva à conclusão errada de que estão medindo a inteligência.

 

Quando se considera grandes grupos de pessoas, realmente esses subtestes são eficazes em medir a inteligência média de grandes grupos de pessoas, porque algumas terão o escore muito distorcido para cima, outras muito distorcido para baixo, e outras terão de fato a inteligência num nível similar ao dessas habilidades medidas porque tanto a inteligência quanto essas habilidades costumam fazer parte do mesmo “combo”, então embora aquilo que o teste esteja medindo não seja a própria inteligência, geralmente a inteligência “vem junto” com essas habilidades e numa proporção semelhante. E o perigo é justamente que se funciona em grupos, deduz incorretamente que também funciona individualmente, mas aí está um erro crasso, que leva resultados aberrantes como o escore 123 de Feynman, quando na verdade o QI correto de Feynman era cerca de 220.

 

É importante destacar que não estou criticando o WAIS por eu ter me saído mal nele. Tive escore quase perfeito em 1987 e novamente em 2023 (perfeito em 13 dos 14 subtestes). Estou criticando porque realmente há montanhas de erros e alguns são erros muito graves.

 

Não há como expor tudo que gostaria aqui, senão passaria meses, por isso vou apenas analisar brevemente mais alguns exemplos de gráficos de variação do QI absoluto em função da idade, e então finalizar esse artigo:

 

 

Aparentemente esse gráfico é baseado no WAIS e apresenta curvas “desenhadas” sem se basear em dados ou funções. O autor do desenho aparentemente tentou reproduzir aproximadamente algumas curvas do WAIS, sem informar as escalas em cada eixo, mas assumindo que sejam escalas uniformes e os eixos sejam ortonormais, o gráfico indica apenas que depois de certa idade o QI cai mais lentamente do que sobe, que a inteligência cristalizada continua aumentando ao longo da vida, e que a média entre ambas se estabiliza depois de certa idade.

 

Quase todas essas informações estão erradas. Dependendo da largura dos intervalos, a velocidade que decai nos últimos anos em proporção à velocidade que aumenta nos primeiros anos está errada, a curva da inteligência cristalizada não cresce até o fim da vida, ela cresce apenas até o momento em que o ritmo de memorização de novas informações é ultrapassado pelo ritmo de esquecimento, e isso costuma ocorrer perto dos 60 a 70 anos. As “curvas” parecem ter sido construídas com segmentos de retas. A média entre inteligência fluida e cristalizada também decai depois de certa idade. Entre outros problemas.

 

 

Não entendi bem porque foram usados riscos em vez de pontos, ou círculos, ou marcadores aproximadamente simétricos e pequenos. Se fossem barrinhas verticais de incerteza, ou cruzes com barras também horizontais de incerteza, seria uma representação útil, mas não parece ser isso. Contudo, esses gráficos parecem melhores que os anteriores e posteriores, sob alguns aspectos importantes.

 

No eixo y não é o QI, parece ser um escore com média = 0 e talvez desvio padrão = 2. Seria desejável que o gráfico ou texto de onde foi extraído, esclarecesse melhor o que tem em cada eixo, especialmente qual teste e qual escala foi utilizado.

 

Há alguns erros de modelagem, a aparentemente impondo uma função a priori, sem analisar criticamente se é uma função adequada. No gráfico à direita, percebe-se que não é uma função adequada, pois não acompanha a massa de dados na queda. Se tiver sido usado um ajuste robusto, ainda assim o número de elementos muito abaixo à direita e a proximidade vertical desses elementos com a massa principal não permite que sejam tratados como outliers, inclusive porque há uma formação razoavelmente “contínua” desde a massa principal até os elementos mais distantes. Isso é diferente do comportamento tipicamente observado em outliers. O mais provável é que tenha sido um erro de modelagem, usando uma função que não é adequada para esse conjunto de dados.

 

Dependendo do que significa a escala no eixo y, o comportamento observado também não faz sentido. Se o eixo y tiver média = 0 e desvio padrão = 30 (em vez de 20), então pode fazer algum sentido para o tamanho da amostra, que parece conter algumas centenas de elementos, podendo gerar alguns resultados abaixo de -2sd.

 

Por fim, os aspectos positivos são que essas curvas e a dispersão dos dados se parecem muito com gráficos de evolução do rating com a idade, indicando que são boas representações de como o QI absoluto varia em função da idade.

 

Seguem mais alguns exemplos de outras curvas que indicam variação do QI absoluto em função da idade:

 


 

No exemplo acima, a variável representada no eixo y não é o QI. É o escore bruto no teste. Apesar disso, parece haver uma quase linearidade entre os escores brutos e os QIs, já que a curva observada é semelhante a que se observa no QI absoluto para pessoas entre 5 e 17 anos.

 


 

Nesse gráfico um intervalo diferente, de 25 a 88 anos.

 


 

Nesse gráfico, o que chamam “cognition score” parece ser a “idade mental” em anos, tratando incorretamente como se aos 16 anos fosse atingido o teto de inteligência fluida, e aos 55 o teto de inteligência cristalizada. Há vários problemas nesse gráfico, que não valeria a pena comentar.

 


Não encontrei esse gráfico com melhor resolução nem consegui melhorar a resolução. Há vários problemas também, que são comuns na maioria dos estudos desse tipo, porque parece que os psicomtristas tentam impor um limite inferior 0 nos escores, que não faz sentido. Dependendo do modelo utilizado, há um limite empírico natural que se delineia perto de 38 de QI, ou fica sem limite inferior, podendo inclusive ter valores negativos. Ambos os modelos são adequados, desde que sejam mantidos como padrão para evitar inconsistências. O que não faz sentido é impor um limite artificial em 0.

 

Um dos erros que salta à vista é que não parece haver mais que algumas centenas de dados nessa amostra, portanto o QI mais baixo esperado seria cerca de 50, mas há alguns adultos nesse gráfico assinalados como se tivessem QI abaixo de 10 e muitos abaixo de 25. Provavelmente esses dados estão errados. Não significa que todos os dados estejam, podem ser erros punctuais, mas há também sinais de vastas regiões distorcidas, como nos primeiros anos de vida.

 

Para corrigir as distorções nos primeiros anos, não há muito como escapar, é necessário contar o tempo a partir da concepção, em vez de contar a partir do parto. E não se pode impor um mínimo arbitrário, como gostam de fazer, porque isso distorce gravemente a curva. Outro ponto importante é que na padronização no WAIS são removidas pessoas com deficiências, o que é um erro grave que gera várias inconsistências. No gráfico acima, precisaria saber qual teste foi utilizado e como a amostragem foi realizada. Mas mesmo sem saber essas informações, já se pode constatar vários indícios de problemas, com número anormal de pessoas com deficiência severa, numa proporção muito acima do que seria razoável.

 


Esse gráfico incorre num erro básico que é “unir os pontos”. Não se faz isso, exceto em cotações de ações e alguns outros casos específicos. O T score é um tipo de nota padronizada com média 50 e desvio padrão 10, portanto há alguns erros, indicando que aos 5 anos de idade as pessoas teriam, em média, o equivalente ao QI absoluto de um adulto 2 desvios padrão abaixo da média, que corresponde a cerca de 70 de QI. Na verdade, aos 5 anos as pessoas têm cerca de 37 de QI.

 


Mesmos problemas anteriores.

 

Gráfico sem dados quantitativos. Apenas tenta representar a forma aproximada da curva e vender algum treinamento para saúde.

 


Idem ao anterior.

 


Vários erros bizarros e óbvios, como se recém-nascidos tivessem mais coordenação motora do que pessoas de 60 anos, além de vários outros erros.

 


Não sei quem é John Murray, mas Charles Murray é um bom psicometrista. Entretanto, assim como Richard Lynn, Charles Murray tem vieses neonazistas em suas interpretações dos resultados, além de seus estudos possivelmente serem norteados por interesses de apoiar suas crenças contaminadas por pensamentos nazistas. Quando as análises são estritamente objetivas, sem margem para interpretações e sem envolver questões raciais e similares, os estudos de Charles Murray acabam sendo de alguma utilidade. No caso de John Murray, não conheço para julgar, mas o sobrenome desperta um alerta amarelo.

 

O gráfico de “inteligência cristalizada” parece ter um erro de interpretação, em que ele aparentemente encontrou uma diminuição aos 30 anos na amostra usada no estudo, mas que certamente não reflete uma redução real. Se utilizasse uma amostra diferente, provavelmente essa anomalia não seria encontrada.

 

A maneira com utiliza T scores não é típica. Precisaria saber quanto é a média e o desvio padrão. Talvez ele tenha usado média 500 e desvio padrão 20, mas geralmente se utiliza média 50 e desvio padrão 10.

 

Não parece ser uma curva “calculada”, mas apenas um desenho ilustrativo, tentando representar algumas das características relevantes dessas curvas.

 


Os outros gráficos são muito ruins e obviamente ruins. Os do WAIS são mais “perigosos” porque à primeira vista não parecem ruins, mas ao analisar com mais detalhes, se começa a perceber vários problemas. São melhores que os outros, sem dúvida, mas ainda são gravemente comprometidos e não podem ser tomados como base.

 

O gráfico sugere aumento até a faixa de 35—44 anos, considerando o conjunto de inteligência fluida e cristalizada. Isso está errado. O uso de intervalos com descontinuidades é outro problema comum entre psicólogos. Aparentemente eles não sabem que existem números reais entre os naturais, por isso colocam um intervalo de 35 a 44, outro intervalo de 45 a 54, deixando uma lacuna entre 44 e 45, e repetem isso em cada faixa.

 

Embora essa curva esteja “errada”, ela fornecesse alguns dados úteis sobre quanto o QI absoluto no WAIS é menor aos 87 anos do que era aos 27. Isso ajuda a conferir se o modelo adotado é semelhante aos dados obtidos no WAIS. Infelizmente não se pode confiar muito no WAIS, mas na ausência de outros parâmetros melhores, os estudos do WAIS acabam servindo como uma base, ainda que seja uma tênue.

 

Quando comparamos essa região da curva de QI com a curva dos ratings de Xadrez, percebemos uma similaridade bastante razoável na morfologia, mas não muito quando se considera os valores em si ao longo de todo o intervalo. Apesar disso, os pontos específicos de 27 e 87 anos ajudam a calibrar o modelo, além de outros pontos.

 


Embora esse pareça um “gráfico de brinquedo”, os dados são razoáveis. Entre os 25 e 80 anos realmente ocorre uma redução de quase 2 desvios padrão. Entretanto esse gráfico inicia a queda aos 20 anos, porém os indícios experimentais sugerem mais fortemente que o pico ocorre em torno de 26 anos para QI=100. Apesar disso, indica uma queda de quase 30 pontos, que é uma informação útil na calibração.

 

O que podemos verificar ate esse ponto é que não existe nenhum estudo razoável sobre variação do QI absoluto em função da idade, todos apresentam muitas distorções, o que torna necessário “recortar” fragmentos desses modelos que tenham probabilidade razoável de serem corretos e depois tentar “costurar” esses fragmentos e contrastar com o modelo baseado no rating, para conferir se o modelo baseado em rating ficou plausível.

 

É importante conhecer essa lista de gráficos de variação do QI em função da idade para ter uma ideia melhor sobre a quantidade e a gravidade dos erros presentes em todos esses estudos, e para ter uma ideia realista sobre as incertezas, mesmo que os modelos são bem parametrizados e calibrados, porque de algum modo acabam se baseando em fragmentos de resultados de modelos anteriores.

 


Esse gráfico, embora muito simples, parece ser um dos melhores, indicando uma redução quase linear entre 22 e 72 anos, de pouco mais de 1,5 desvios padrão.

 

Com isso, encerramos esse artigo. O uso combinado de trechos de alguns desses modelos possibilita tentar construir um novo modelo minimamente distorcido, mas ainda assim são necessárias algumas extrapolações e estimações.

 

Para informações mais detalhadas sobre esses temas, é recomendável o “Livro de ouro da inteligência” (acompanhe nosso perfil na Amazon para saber quando o livro será lançado) e outros livros indicados no início desse artigo, especialmente o livro que trata de rating de Xadrez e os volumes do Guia dos apodícticos que tratam de temas psicométricos.


 

bottom of page