
Sigma Test Extended 2022
O Sigma Test Extended tem como objetivo ser o teste cognitivo mais difícil e mais fidedigno na aferição do constructo “inteligência”, especialmente para pessoas com QI acima de 160 (σ=16), exigindo uma vasta gama de habilidades cognitivas em diferentes níveis de profundidade e complexidade.
Ao mesmo tempo, é um teste que não requer conhecimentos especializados. Basta conhecimento até o 11º ano (Ensino Médio / School). Em alguns casos específicos pode ser necessário fazer pequenas consultas sobre o significado de algumas palavras, mas não há necessidade de treinamento especializado em nenhuma área específica.
I'm really enjoying the SIGMA test. I've already printed it out and started answering your questions. Allow me to congratulate you on your test. In fact, it's incomparably better than the IQ tests I've taken
Renato P. dos Santos, Ph.D. in Physics, Post-Doctoral in Artificial Intelligence, Universitaet Karlsruhe, Research Institute for Symbolic Computation, Researcher and Preceptor of Ph.D. students, member of British Blockchain Association, referee of International Journal of Physical Sciences, Journal of Virtual Worlds Research, Concurrency and Computation: Practice and Experience, Financial Innovation and Advanced Theory and Simulations, Honorary member of Immortal Society (IQ>164).
I would like to take the Sigma Test. (Which I believe has the best end excellent questions.)
I appreciate immensely the Sigma Teste because I believe that in many questions are needed both intelligence and imagination to solve them.
I also want to say to you that the Sigma Test is incredibly brilliant. It was by far the best test I have ever taken and enjoyed it very much.
Dylan Taylor, MBA at University of Chicago, Chairman & CEO of Voyager Space, Young Global Leader in 2011 Prize (World Economic Forum), Global Leadership and Public Policy for the 21st at Harvard Kennedy School, highest score on the English version of the Giant Test, Honorary Member of Immortal Society (IQ>164).
The SIGMA test was one of the most interesting things I have done in the realm of puzzles because the later questions were so clever and had so many different levels of solution. I finished the test as a personal challenge, and it gave me great satisfaction. Some of the SIGMA test puzzles are REALLY beautiful. They are a work of art!
Thank you for a fascinating, thrilling and a very challenging test! I will recommended it to friends and colleagues who might be interested in this kind of challenge. My next mission will be Sigma Test VI.
Thought tests and puzzles always have amused me, this is the first IQ-test I have bothered to send in for scoring. I found myself increasingly absorbed by the intellectual art behind the questions in this test. Together with achievement, I rank creativity on top of the scale, which you elegantly have combined with divergent / convergent thinking. Thank you for creating a great test. I now look forward to take the Sigma Test VI! Provided my scores are sufficient, I intend to apply for membership in the Sigma Society."

O objetivo final de um bom teste de inteligência não é medir a capacidade de resolver as questões do próprio teste. O objetivo é utilizar essas questões como meio indireto para descobrir outras competências mais importantes. Por isso não se pode perder de vista qual é o objetivo primordial a ser alcançado, caso contrário corre-se o risco de criar viciados em testes de QI, em vez de descobrir talentos para as Ciências, para a Matemática e para outros importantes campos do conhecimento.
Esse é o propósito do STE, medir a habilidade para resolver problemas diversos do mundo real, problemas que vão desde questões cotidianas até desafios intelectuais com nível olímpico de dificuldade, exigindo uma combinação de pensamento divergente e convergente em diferentes níveis de sofisticação, cujas questões são compatíveis com os níveis de habilidade que se deseja medir. Esse é um diferencial importante, porque os testes de QI apresentam tetos gravemente distorcidos. O Stanford-Binet V, por exemplo, pode ter o teto extrapolado em até 225 de QI, conforme se pode ver na tabela a seguir:
Porém as questões mais difíceis do Stanford-Binet V podem ser facilmente resolvidas por pessoas com 135 a 140 de QI. Isso produz uma disparidade muito grande entre o QI medido e o QI verdadeiro. Qualquer pessoa com QI 140, desde que seja suficientemente rápida e tenha bom nível cultural, pode alcançar mais de 200 de QI nesse teste, gerando uma quantidade gigantesca de falsos diagnósticos de genialidade. Isso não significa que as distorções sejam sempre para cima. Da maneira como a padronização é feita, isso não seria possível, porque se fosse assim a média ficaria deslocada. Portanto as distorções para cima ocorrem aproximadamente com mesma frequência e mesma magnitude que as distorções para baixo. Como resultado, pessoas realmente geniais podem obter escores muito abaixo de seu verdadeiro potencial nesse teste, e isso foi constatado repetidas vezes. No estudo realizado por Lewis Terman, a partir de 1921, com 1528 crianças com QI acima de 135, nenhuma das 1528 crianças selecionadas ganhou um prêmio Nobel, nem qualquer outro prêmio internacional de grande importância em áreas científicas ou em Matemática. Mas entre as crianças que foram reprovadas no teste, duas delas foram laureadas com o Nobel de Física. Isso deixa evidente que o Stanford-Binet, embora seja muito bom e preciso para medir QIs entre 70 e 130, não é apropriado para níveis mais altos. O grupo de Terman incluiu quase 100 crianças com mais de 175 de QI, mas nenhuma delas ganhou 1 Nobel, sendo que o QI médio dos ganhadores do Nobel em Ciência é 154. Isso é outra grave inconsistência nos escores produzidos pelo Stanford-Binet nos escores mais altos.
Como o estudo de Terman foi realizado com pessoas examinadas na infância, poder-se-ia argumentar que o problema não era inerente ao teste, mas sim ao fato de terem sido avaliadas muito cedo. Na verdade, esse também é um dos problemas, mas não é o único e não é suficiente para explicar todas as anomalias observadas. Para esclarecer melhor esse ponto, convém citar os casos das pessoas registradas no Guinness Book por terem QI mais alto do mundo com base em escores no Stanford-Binet aplicado em diferentes idades:
O primeiro registro dessa modalidade no Guinness Book ocorreu em 1966, no qual Chris Harding foi apresentado como a pessoa com QI mais alto do mundo, por ter obtido escore 196-197 no Stanford-Binet (creio que foi utilizada a padronização de 1960, form L-M do Stanford-Binet). Numa distribuição normal com média 100 e desvio padrão 16, apenas 1 em cada 1 bilhão de pessoas tem QI acima de 196. Entretanto o número de pessoas examinadas com o Stanford-Binet era de poucos milhares. No processo de padronização, as amostras também eram de poucos milhares. Com isso, o melhor que se podia fazer era situar o teto do teste perto de 155 a 160, e mesmo assim ainda haveria o problema de que as questões mais difíceis estavam no nível de dificuldade perto de 140, portanto os escores 160 indicariam apenas maior rapidez para resolver problemas do nível 140, em vez de indicarem nível intelectual de 160.
Nos anos 1970 e 1980, Kevin Langdon e várias outras pessoas começaram a aparecer com escores 196-197, reivindicando compartir o recorde de maior QI. Algumas das pessoas que solicitaram o registro de pessoa com maior QI do mundo entre 1966 e 1978 foram:
-
Chistopher Philip Harding
-
Kevin Langdon
-
Bruce Whiting
-
Robert Bryzman
-
Leta Speyer
-
Johannes Dougles Veldhuis
-
Ferris Eugene Alger
Houve também outros casos depois de 1978, reivindicando o recorde, com QIs alegados acima de 197:
-
Kim Ung-yong com QI 210
-
Marilyn vos Savant com QI 230, depois corrigido para 228, depois corrigido para 218, depois corrigido para 186, depois 190
-
Keith Raniere, com QI 242
E finalmente o Guinness removeu essa modalidade. Um dos motivos prováveis é que ficou claro que não havia uma padronização adequada que possibilitasse uma comparação justa. As métricas de ajuste de escores obtidos na infância para idade adulta estavam distorcidas, o uso de testes diferentes também produzia escores muito diferentes. Outro motivo que pode ter agravado essa situação foi a polêmica sobre a Marilyn ter sido acusada de falsificar as datas em seu laudo e Keith Raniere ter sido preso, acusado por diversos crimes, inclusive assassinato. No caso da Marilyn, acho que a versão dela é muito plausível. Ela alega que fez o teste aos 10 anos, mas foi registrado incorretamente em sua ficha como se tivesse sido examinada aos 11 anos e 4 meses. Sobre essa polêmica, até o ponto em que cheguei a tomar conhecimento dos fatos, fico do lado da Marilyn e explico o motivo: em 2004 e 2005 trabalhei como consultor na principal editora de Psicologia do Brasil, fiz a padronização e a revisão de vários testes de QI, e pude constatar que o número de erros de registro nos dados das pessoas examinadas era absurdamente grande, chegando a mais de 5%. Era muito comum pessoas registradas com ano de nascimento 2040, o mês de nascimento maior que 12, entre outros. Por isso acho muito mais provável que o psicólogo que a examinou tenha realmente anotado incorretamente a data do que a Marilyn ter mentido sobre isso. Considerando o histórico da Marilyn, não tenho nenhuma razão para colocar em dúvida a sinceridade dela, enquanto o histórico de erros de registros em laudos psicométricos é muito frequente. No caso do Keith, os fatos e as evidências contra ele são abundantes e inquestionáveis.
O ponto importante é que um teste aplicado a poucos milhares de pessoas no processo de padronização, não permite estabelecer um teto acima de 160, com a agravante de que o teto de dificuldade não passa de 140. Mas mesmo que o teste fosse realmente capaz de medir corretamente no nível até 196, e mesmo que todas as pessoas do mundo tivessem sido examinadas com o Stanford-Binet (considerando que algumas pessoas seriam crianças e outras seriam muito idosas), não seria esperado encontrar mais que 3 ou 4 no mundo com QI acima de 196. Entretanto, numa amostra com poucos milhares de pessoas havia 10 pessoas com QI acima de 196, algumas chegando a 242, cuja raridade está muitas ordens de grandeza fora do limite do número de pessoas que já nasceram, com nível de raridade 1 em 2,86 × 10^15 sendo que o número de pessoas que já nasceram é cerca de 10^11.
Claro que essa amostra de poucos milhares não é representativa da população em geral. É uma amostra na qual boa parte foi selecionada por ter obtido escores muito altos em outros testes ou por ter apresentado desenvolvimento muito precoce na infância ou por algum destaque em notas escolares. Por isso é natural que fossem encontradas nessa amostra mais pessoas com QIs elevados do que numa amostra aleatória da população. Se aplicar um teste de QI em estudantes de Harvard ou de Cambridge, é natural que o escore médio seja muito maior que o escore médio da população em geral, além disso, também é muito provável que algumas das 10 pessoas mais inteligentes dos EUA ou do UK estejam nessas instituições. O problema principal não é a anomalia estatística. O maior problema é que 100% dessas pessoas com QI acima de 196 não se notabilizaram como cientistas, matemáticos ou autores de trabalhos intelectuais brilhantes que correspondessem aos QIs medidos.
A própria Marilyn, numa entrevista no programa de David Letterman, fez o seguinte comentário (trecho da entrevista):
D: I have uh, I have miserable teeth. I mean, they're healthy... [Paul laughs aloud] They're just odd, they're odd. You know, I can eat things through fences. [laughter] Not that there's any call for that, but uh... Allright, now Marilyn, let's get back to you and your... uh... head. [laughter] Uh, what uh... now how do we know you're the smartest woman in the world?
M: Well, you probably don't know that, I don't think anyone really knows that, not that many people have taken an IQ test. And so I had the highest score on the Benet... so far... but this very...
D: [trying to interrupt] Now when did you...
M: ...small minority of people in the world have taken a test, and... [dramatically] what did Benet know, for heaven's sake? [Paul & Dave both chuckle as Marilyn rambles] I mean back in 1904, he didn't... [laughter] he didn't stumble over a Rosetta Stone, he said, "This is what I think I'm gonna do," and everybody's been imitating him ever since.
E Chris Harding, num artigo de 2013 “A pessoa mais inteligente do mundo” afirmou:
“Genius is not intelligence. Genius is creative ability of the highest possible kind. True, most geniuses are highly intelligent, but this depends on the field their genius was recognized in. And here there is a plethora of problems. Recognized by whom; which people, what society, when and where. There is an old joke that goes something like I will believe in psychologists devising tests from geniuses when monkeys devise tests for psychologists. I do have ideas of my own on this, but so far no one seems interested in this. I was listed in the Guinness Book of World Records seven editions 1982-88 under "Highest IQ" and was given a certificate for this. I was also listed in 500 Great Minds of the Early 21st Century in 2002. All such lists-comparisons are temporary. There appears less and less match between persons and outcomes these days. Humanity hangs by it’s intellectual neck on the tree of tragedy –there are no Leonardo’s in the 19th, 20th, and so far in the 21st Century. Yet he/she must still exist we should think? With mass education has come the noisy ones but no Geniuses to show for it all. Bad money has driven out good money, bad people good people. The masses have come to judge the best and are part of this process to drive out the very people they need most, all in the name of incorrectly accessed political correctness. Today the system has driven down performance; today big institutional science has been a spoiler of great insights delaying progress everywhere. Today it is business as usual. The criminal come to the top. My greatest fear is that an end is coming to the centuries of progress that mankind has grown use to. The age of genius may be at an end. I’m sorry to ramble on this in such a `scatter gun’ way.”
A declaração de Marilyn é superficial porque é compatível com o programa de TV destinado ao grande público, mas as colunas dela na revista Parade têm um nível muito alto e profundo, compatível com o QI 186-190 que ela obteve no Mega Test. A declaração de Chris Harding, embora curta e sobre um tema que não oferece margem para muita profundidade, também deixa transparecer um nível intelectual muito alto. A opinião dele sobre o significado de “gênio” é questionável, mas para um texto de um parágrafo é aceitável. E o ponto central é que ambos reconhecem que os escores medidos por testes de QI convencionais apresentam vários problemas e não podem ser levados muito a sério quando utilizados para tentar avaliar a inteligência nos níveis mais altos de QI.
Isso mostra que, embora os escores no intervalo de 70 a 130 sejam capazes de medir razoavelmente bem a inteligência, à medida que os escores vão se afastando da média, aquilo que os testes medem vai gradualmente deixando de ser a inteligência e se tornando algo mais raso, como velocidade de raciocínio para questões triviais ou repetição mecânica de tarefas. O problema é que, à medida que o QI a ser medido vai aumentando, o teste continua medindo a mesma variável, porém o significado de inteligência vai mudando. Para crianças de 8 a 12 anos com QI entre 80 e 130 pode ser apropriado medir a capacidade de soletrar palavras sem cometer erros como um critério satisfatório para determinar a aptidão para Comunicação escrita, mas se aplicar esse mesmo método para tentar estimar a aptidão para Comunicação escrita de Shakespeare ou de Dostoievsky, é evidente que o resultado será distorcido, não porque esses escritores sejam rápidos demais ao soletrar nem porque sejam infalíveis nisso. Eles até podem errar mais do que uma criança de anos bem treinada que tenha “talento” para soletrar. O ponto é que esse critério deixa de ser útil nos níveis de Shakespeare, Goethe ou Dostoievsky. Na verdade, já deixa de ser útil em níveis muito mais baixos, perto de 125 ou 130. O mesmo problema acontece quando se tenta utilizar questões elementares como aquelas do Stanford-Binet para medir níveis intelectuais acima de 140.
O fato de o QI médio dos ganhadores do Nobel estar no nível de raridade de 1 em 3 mil, enquanto a frequência de ganhadores do Nobel na população ser menor que 1 em 1 milhão, também corrobora que os escores acima de 130 no Stanford-Binet são muito distorcidos, falhando dramaticamente em “deixar escapar” as pessoas mais brilhantes e, ao mesmo tempo, selecionando incorretamente várias que não são de fato brilhantes, mas apenas rápidas na realização de tarefas triviais.
Esse não é um defeito exclusivo do Stanford-Binet. Todos os melhores testes de QI, inclusive WAIS, Raven, Cattell, DAT, D70 etc. apresentam esse mesmo problema (e obviamente há mais e piores problemas nos testes que não são os melhores). Um dos principais motivos disso é o mesmo que já foi mencionado: esses testes tentam medir QIs em níveis muito acima de 140, mas não incluem questões com nível de dificuldade acima de 135.
Para resolver esse problema, em 1973 Kevin Landgon criou o LAIT (Landgon Adult Intelligence Test), o primeiro teste de inteligência realmente difícil, capaz de medir corretamente até perto de 165. Em 1982, Ronald Hoeflin publicou seu Mega Test, depois o Titan Test, Ultra Test e Power Test. Os testes de Hoeflin podiam medir corretamente até cerca de 170 ou até mesmo 180 de QI.
Com isso foi inaugurada uma nova era de testes de inteligência. Continuaram existindo os testes tradicionais, usados em clínicas, para medir no intervalo de 70 a 130, cobrindo mais de 95% da população, e também passou a ser possível medir a inteligência nos níveis muito mais altos. Entretanto, esses testes ainda não alcançavam o “ponto crítico” que permite identificar corretamente mentes geniais. As pessoas com maiores escores nos testes de Hoeflin são sem dúvida muito inteligentes: Rick Rosner, Chris Langan, Marilyn vos Savant, etc. com escores 190 ou acima. Mas quando se compara a produção intelectual dessas pessoas com a de um ganhador do Nobel com QI 160, a diferença é gritantemente favorável ao ganhador do Nobel. Ainda faltava algo nas variáveis a serem medidas no topo do nível de dificuldade. Nos anos e décadas seguintes, foram criados outros testes, inclusive o Eureka, Logima Stricta e o Sigma Test.
O Sigma Test, desde sua primeira versão, tenta ser inovador em vários aspectos. Isso não significa que tenha alcançado esse propósito, mas pelo menos estamos tentando, e alguns dos resultados obtidos se mostraram animadores. Há controvérsias sobre até que nível de dificuldade o Sigma Test pode de fato medir corretamente. Algumas pessoas acham que o teto real não passa de 180, outros acham que chega a 200 ou um pouco mais. Isso é difícil de determinar enquanto o número de pessoas avaliadas não for suficientemente grande ou enquanto não houver algum grande gênio reconhecido internacionalmente como tal (medalha Fields, prêmio Abel, Nobel de Física), que seja avaliado pelo Sigma Test. Mas independentemente do teto de dificuldade, o Sigma Test também traz outras inovações relevantes e algumas delas já foram corroboradas experimentalmente. Entre essas inovações, a mais importante é o novo método de normatização, apresentado pela primeira vez em 2000 e aplicado pela primeira vez em 2003.
O novo método de normatização utilizado no Sigma Test se distingue de todos os outros por gerar escores cujos antilogs estão numa escala de proporção. Além disso, esse método possibilita calcular corretamente os percentis correspondentes, evitando os resultados inflados que são produzidos pelos métodos tradicionais. Esse tema é abordado com mais detalhes em outros artigos.
Outro diferencial é a variedade de processos cognitivos necessários para solucionar as questões. Isso é extremamente importante por medir a capacidade intelectual num amplo espectro de cenários. A habilidade para jogar Xadrez, por exemplo, mede um traço latente muito especializado e muito estreito, que não pode ser interpretado como representativo da inteligência geral. A habilidade para Xadrez está positivamente correlacionada com inteligência, mas à medida que o rating se afasta da média, esse escore é determinado cada vez mais pela habilidade específica para o Xadrez e cada vez menos pela inteligência geral. O mesmo acontece se um teste utiliza exclusivamente séries de figuras, ou se utiliza exclusivamente séries de números. A variável medida não pode ser interpretada como representativa da inteligência geral. Essa afirmação se opõe a algumas “mantras psicométricas” repetidas há décadas – em especial sobre homogeneidade (quanto maior melhor) e sobre saturação de g – por isso requer uma análise um pouco mais detalhada:
Séries de figuras têm a virtude de minimizar a exigência de conhecimento, evitando que fatores culturais e etários interfiram no resulto, e isso é bom. Por outro lado, limitam o teto de dificuldade e de complexidade, mas o principal problema é o excesso de homogeneidade.
Há muitas maneiras diferentes de se medir a homogeneidade. Uma das melhores e mais usuais é por meio do α de Cronbach.
Para que se possa compreender como funciona o α de Cronbach, antes convém explicar como funciona o Kuder-Richardson: a ideia é bem simples, divide-se o teste em duas metades equivalentes e verifica-se o escore que cada pessoa obteve em cada metade. Essa divisão pode ser entre questões pares e ímpares, pode ser por sorteio, ou por qualquer outro critério razoável. Se as metades forem equivalentes, espera-se que cada pessoa obtenha aproximadamente mesmo escore em cada metade. A ideia do α de Cronbach é semelhante, porém considera-se todas as covariâncias entre todos os itens, tornando essa medida independente do critério adotado para separar as duas metades, isso é quase equivalente a comparar todas as combinações possíveis de duas metades.
É positivo e desejável que um bom teste apresente elevado α de Cronbach (acima de 0,7), porque indica que os itens do teste estão contribuindo para medir a mesma variável. Isso todos sabem e repetem religiosamente. Por outro lado, é ruim se o α de Cronbach for excessivamente alto (acima de 0,9), porque indica que os itens do teste não estão cobrindo uma variedade suficientemente larga das características que deveriam ser medidas, ou seja, os itens estão excessivamente redundantes e especializados. Esse fato aparentemente não é conhecido nem é bem compreendido, por isso requer uma explicação um pouco mais minuciosa. Para tanto, usarei um exemplo didático:
Um teste constituído exclusivamente por 60 séries numéricas tende a apresentar α de Cronbach maior do que um teste que inclua 20 séries numéricas, 20 séries de figuras e 20 analogias. Se as distribuições de dificuldades forem iguais nos dois testes, então aquele com 60 séries numéricas provavelmente terá maior α de Cronbach, e nesse caso ter um α de Cronbach maior pode ser pior. Em outras palavras, um α de Cronbach 0,85 pode ser melhor do que 0,92.
Um efeito análogo também pode produzir ilusões sobre saturação de g, fazendo parecer que um teste esteja mais saturado de g do que realmente é, simplesmente por ser excessivamente homogêneo. Num teste demasiado homogêneo, o primeiro fator extraído pode ser suficiente para explicar mais de 80% ou 85% da variabilidade, não porque o teste esteja de fato mais saturado do fator g, mas sim porque dentro dos limites do que está sendo avaliado por esse teste, um fator principal comum a todos os itens responde por 80% a 85% da variância, ou até mais.
Nesse contexto, a pseudo saturação de g é um sintoma ruim, a menos que o objetivo final fosse medir a habilidade para resolver séries de números e figuras. Mas normalmente não é isso que se deseja medir. O propósito de um bom teste de inteligência é reunir uma lista apropriada de questões para avaliar a capacidade de solucionar problemas reais. O objetivo não é o escore no teste em si, mas sim assegurar que esse escore seja capaz de refletir a habilidade para resolver problemas diversos na vida real. E nisso o STE se destaca, por incluir vários problemas com estrutura muito similar à de problemas reais.
A habilidade para resolver séries de figuras também é útil, porque essa mesma habilidade também contribui para resolver outros problemas em outras situações. Entretanto, medir diretamente o tipo de habilidade que se deseja conhecer é preferível do que medir um atributo correlacionado. Para deixar claro esse problema, vamos analisar duas variáveis mais bem conhecidas: o peso e a altura.
O peso e a altura das pessoas são variáveis moderadamente correlacionadas. Isso significa que conhecendo o peso de uma pessoa, pode-se estimar a altura dessa pessoa. Entretanto, se for possível medir diretamente a própria altura, isso é melhor do que medir o peso e tentar estimar a altura com base no peso. Se não for possível medir a altura, e a única informação disponível for o peso, é possível usar essa informação para tentar estimar, grosseiramente, a altura, mas o erro pode ser muito grande, porque há pessoas baixas com muita massa de gordura e há pessoas altas muito magras.
Por isso se houver um grupo de variáveis mais estreitamente relacionadas à altura, tais como tamanho do fêmur, tamanho do pé, tamanho do braço, então a medida dessas variáveis deve fornecer uma estimativa mais acurada para a altura do que tentar estimar a altura com base no peso. O tamanho do fêmur não é exatamente proporcional à altura, mas a variação no tamanho do fêmur preserva muito melhor a proporção com a variação na altura do que a variação no peso em relação à variação na altura. O mesmo se aplica ao tamanho do pé e ao tamanho do braço. Quando se considera conjuntamente tamanho do fêmur, tamanho do pé e tamanho do braço, pode-se fazer uma estimativa muito mais confiável para a altura do que se tentasse estimar a altura com base no peso.
Por isso usar um teste com séries de figuras para estimar a inteligência é como usar o peso para estimar a altura, ou seja, funciona, mas os erros e as distorções são grandes. Além disso, conforme se vai chegando perto dos níveis mais altos de peso, o erro também vai aumentando, e o mesmo acontece quando se deseja medir corretamente nos níveis mais altos de altura, porque raramente os níveis mais elevados de altura correspondem aos níveis mais elevados de peso. As pessoas mais altas do mundo não são as mesmas que as mais pesadas do mundo. Geralmente as mais pesadas possuem altura normal ou só um pouco acima do normal.
Mas se a medição fosse baseada no tamanho do fêmur, do braço e do pé, estimando a altura com base em cada uma dessas variáveis, depois calculando a média dos resultados, a estimativa para a altura ficaria muito mais próxima do valor correto. Outro detalhe a ser considerado é que além de a correlação entre tamanho do fêmur e altura ser muito mais forte do que entre peso e altura, essa correlação é preservada nos níveis mais altos, de modo que as maiores pessoas do mundo também possuem maiores fêmures, maiores braços e maiores pés. Portanto a medida dessas partes do corpo continua sendo eficiente para estimar a altura correta das pessoas em todos os níveis, desde a média da população até as pessoas mais altas do mundo.
Do mesmo modo, o uso de itens com as propriedades das questões do Sigma Test, estreitamente relacionados aos processos cognitivos que representam a inteligência, cobrindo uma ampla variedade de características cognitivas e níveis de habilidade, fornece uma estimativa muito mais acurada e realista para a Inteligência.
Há também desvantagens no Sigma Test, que produz resultados menos justos se for aplicado em grupos rurais ou com nível de instrução muito abaixo do 11º ano. Mas não vejo tanta necessidade de criar testes destinados a esse público, porque já existem bons testes para isso, inclusive Logima Stricta e alguns dos excelentes testes de Iakovos Koukas e YoungHoon Kim. Por isso meu foco é tentar preencher uma lacuna que existe desde os primórdios dos testes de QI, que é tentar medir corretamente o nível intelectual nos estratos mais elevados. Os testes de Binet conseguiram medir corretamente até cerca de 135, depois os testes de Langdon e Hoeflin chegaram a medir corretamente até cerca de 170. O Sigma Test Extended pretende medir de forma realista e acurada acima de 190 e talvez acima de 200.
Conforme já foi comentado, os testes de Hoeflin foram pioneiros na medida correta do QI em níveis muito acima dos limites dos testes de QI tradicionais, mas como não havia um método apropriado para calcular os percentis correspondentes, as normas foram calculadas utilizando os métodos disponíveis para padronização, resultando em estimativas distorcidas, sobretudo nas proximidades do teto.
O teto “correto” do Mega Test, com base nos dados que estavam disponíveis no site do Miyaguchi e utilizando o mesmo método de normatização da norma de 2003 do Sigma Test, é cerca de 186, muito perto do teto nominal de 190+ (~193) que foi adotado por Hoeflin. O teto calculado por Grady Towers foi 202. Bob Seitz também fez uma tentativa de estabelecer uma nova norma que se ajustasse aos níveis corretos de raridade, e chegou a cerca de 170, muito próximo da norma de raridade que encontrei em 2003 para o teto do Mega Test (168,5). Essa divergência entre os resultados obtidos por Towers e por Seitz já sinalizavam uma disparidade entre as raridades verdadeiras e as raridades obtidas com base na hipótese de que os escores se distribuíam normalmente. No final dos anos 1990, o problema já estava bem configurado: a raridade real não concordava com os escores de QI medidos nos testes. Mas a solução para isso ainda não estava clara.
O escore nominal de QI não apresenta grandes problemas. O teto do Mega Test apresenta erro de 7 pontos, que é tolerável, e para escores mais baixos o erro é cada vez menor. Porém o percentil correspondente é muito diferente do correto. O nível teórico de raridade para QI=193, assumindo que a distribuição dos escores fosse perfeitamente aderente a uma gaussiana, seria de 1 em 325.000.000, mas o nível correto de raridade, considerando a forma verdadeira da distribuição dos escores, é cerca de 1 em 435.000. Se considerar que o teto correto é 186 em vez de 193, então o nível de raridade é 1 em 130.000. Portanto o nível verdadeiro de raridade difere do nível indicado na norma por um fator maior que 2000. Um erro gigantesco. Os dados no site do Miyaguchi são incompletos, por isso o valor 186 de QI indicado como "correto" para o teto pode ser um pouco diferente, talvez próximo a 190. Entretanto, as distorções nos percentis são grandes demais para que possam ser explicadas por algum viés presente nos dados disponibilizados no site do Miyaguchi. Trata-se de um erro metodológico grave e que vem sendo repetido sistematicamente há décadas.
Os testes de Hoeflin e os de Landgon diferem em alguns pontos importantes. Os de Langdon, assim como alguns tests de Cooijmans, Robert Lato e outros, seguiam uma linha similar à dos testes de Raven (séries de figuras), enquanto os testes de Hoeflin seguiam uma linha mais semelhante à de Binet e Wechsler (diversificados).
Nesse ponto convém recapitular como foram as primeiras tentativas para medir a inteligência. Não serei redundante com o artigo Resumo Histórico sobre Testes de Inteligência; quem tiver interesse, pode acessá-lo para mais detalhes. Aqui farei um resumo muito mais breve e focado nos tópicos que estamos abordando.
O teste de Binet representa um avanço importante na evolução dos testes cognitivos. Depois que as tentativas de Francis Galton (1884) e James Cattell (1890) para medir a inteligência se mostraram infrutíferas, Alfred Binet (1904) tentou abordar o problema por uma perspectiva diferente. Galton e Cattell acreditavam que seria possível medir os componentes elementares da inteligência, enquanto Binet decidiu medir o resultado combinado desses componentes em ação sinérgica, obtendo resultados muito mais promissores, possibilitando identificar deficiências leves e algumas aptidões. Isso sugere que o uso combinado de questões que exigem diferentes tipos de pensamento operando em conjunto na resolução de problemas complexos, pode funcionar melhor do que questões que tentem medir separadamente cada tipo de pensamento. O STE segue uma linha semelhante, apostando na medida de um conjunto combinado de habilidades para resolver problemas complexos, com o diferencial de incluir questões que alcançam níveis bem mais altos de dificuldade do que o teto do Stanford-Binet (140), chegando e ultrapassando 190 e até mesmo 200.
Embora o teste de Binet seja um dos melhores para medir corretamente QIs entre 70 e 130, ele falha gravemente por continuar produzindo escores até níveis muito acima do que ele realmente é capaz de medir. O mesmo problema está presente nos testes de Wechsler, Cattell Culture Fair e outros. O teto nominal do Stanford-Binet extrapolado chegou a 225, mas o teto real nunca passou de 140. Não estou dizendo que o escore 140 seja baixo; dizer isso seria um erro grosseiro. O que estou dizendo é que um teste com teto 140 seria como uma régua clínica para medir altura com limite máximo de 1,87 m. O limite 1,87 m não é baixo, mas também não é suficiente para atender a uma fração considerável da população.
Na verdade, o problema na norma do Stanford-Binet é pior do que isso. É como se fosse uma régua com teto nominal 2,15 m, mas que começasse a ficar torta e com os intervalos de 1 cm cada vez menores para alturas acima de 1,80 m. Nessa régua, o tamanho de 1 cm no intervalo de 1,50 m a 1,80 m é aproximadamente uniforme, mas acima de 1,80 m, cada intervalo de 1 cm vai se tornando cada vez mais estreito. Quando chega perto de 2,15 m, cada 1 cm está tão curto que fica menor do que metade de 1 cm na região entre 1,70 m e 1,80 m. Com uma régua enviesada nesse nível, as medidas só são razoavelmente confiáveis até 1,80 m ou, com um pouco de otimismo, até 1,85 m.
A imagem abaixo mostra um exemplo de escala distorcida (não-intervalar) em que até certo ponto (os 10 primeiros) os intervalos são uniformes, mas depois vão ficando cada vez mais estreitos:

Usar uma régua que tivesse cada unidade espaçada dessa maneira, obviamente produziria grandes erros. É basicamente isso que acontece com quase todos os testes de QI, inclusive o Sigma Test anterior a 2003, porque embora esse método para normatização já tivesse sido idealizado e publicado em 2000, a primeira norma do Sigma Test precisou ser determinada pela comparação com outros testes já normatizados pelos métodos existentes, e o número de testes no Sigma Test em 2000 ainda não era suficiente para uma padronização adequada utilizando o novo método. Por isso a primeira norma aplicando esse método foi em 2003.
Portanto, todos os testes de QI tradicionais e todos os high range IQ tests apresentavam essa distorção até 2003 e essa distorção acarreta vários problemas.
Se houvesse um erro assim numa régua ou numa fita métrica, em que uma parte da régua estivesse correta e outra estivesse distorcida, seria fácil corrigir usando a parte “saudável” para comparar lado a lado com a parte anômala, e então reparar o erro. Mas numa escala de QI isso é bem mais difícil e complexo de se corrigir. Numa régua torta e com escala distorcida, o problema é notado visualmente, mas as distorções na escala de um teste de QI são invisíveis, e só se pode detectá-las com um tratamento estatístico adequado. Além de a detecção não ser trivial, a correção é ainda mais difícil, por é preciso estabelecer uma escala de referência que seja invariante. Binet tentou fazer isso usando as idades, e foi uma ideia inicial interessante, mas rapidamente se constatou que não produzia uma escala intervalar. Para produzir uma escala de proporção é ainda mais difícil.
A solução adotada na norma de 2003 do Sigma Test consegue gerar uma escala de proporção aproveitando a ideia de Bill McGaugh de converter rating de Xadrez em QI. Entretanto, o rating FIDE, o rating USCF e principalmente os ratings online estão muito distorcidos, além do efeito inflacionário. Por isso antes era necessário estabelecer uma escala adequada de rating, a partir da qual seria estabelecida uma escala de proporção de potencial e, em seguida, essa poderia ser aplicada ao QI. Naturalmente a fórmula de Bill McGaugh também não poderia ser usada em sua forma original, já que foi calculada com base no rating FIDE, mas foi uma importante inspiração.
O método para cálculo de rating é descrito nesse livro https://www.saturnov.org/livro/rating e a distribuição dos escores utilizando esse método é essa:

A título de comparação, a distribuição dos ratings FIDE é essa:

E a distribuição dos ratings USCF é essa;

Converter os ratings FIDE com essa distribuição em escores de QI, ou converter os ratings USCF em QI, exigiria algumas acrobacias, mesmo assim haveria grandes distorções. Por isso foi necessário primeiramente recalcular os ratings, e nesse processo já aproveitei para aprimorar o método tradicional, além de introduzir um novo baseado na qualidade dos lances. Além disso, as duas distribuições, a de QI e da de rating, foram ajustadas a curvas adequadas, em vez de utilizar a hipótese forçada de uma distribuição gaussiana. Ao todo Foram testadas 91 distribuições contínuas e 17 discretas para verificar qual a mais apropriada para representar esse conjunto de dados. Na seleção preliminar, foi utilizado Kolmogorov-Smirnov para aferir a qualidade de ajuste. Em etapa posterior, foram utilizados Anderson-Darling e uma comparação por meio de Qui-quadrado com um modelo de ajuste de uma rede neural. Nos casos em que a distribuição discreta impossibilitava a comparação por conter a função n-fatorial, esta foi substituída por Gamma(n+1). O gráfico a seguir mostra uma síntese de todas as curvas testadas:

As distribuições experimentadas foram estas:

Depois de determinar as curvas mais adequadas para representar a distribuição dos QIs e a mais adequada para a distribuição do rating, foram feitos mais alguns ajustes, para corrigir a self-selection que varia com a faixa de rating e com a faixa de QI, e não varia na mesma proporção. Mais detalhes sobre os procedimentos são descritos nos volumes I e II do livro “Xadrez - 2022 melhores jogadores da História, dois novos sistemas de rating”.
Com isso, foi possível refinar um pouco os valores de alguns parâmetros usados na normatização do Sigma Test, acentuando algumas das vantagens conceituais e quantitativas que já estavam presentes na norma de 2003.
O resultado final é que QI medido pelo ST ou pelo STE gera escores praticamente na mesma escala de outros high range IQ tests, ou seja, uma pessoa com escore 180 no Mega Test deve obter cerca de 180 no STE, enquanto duas outras pessoas com 150 e 120 no Mega Test também devem obter cerca de 150 e 120 no STE, respectivamente. Para escores acima de 170 e principalmente acima de 180, o ST gera escores um pouco mais baixos (e mais corretos, menos inflados) do que outros testes. Para escores abaixo de 170, praticamente não há diferença.
Os percentis do ST e STE são realistas, portanto são muito mais baixos que os gerados pelos outros testes. Portanto se seu objetivo é um certificado com muitos noves para pendurar na parede, infelizmente o Sigma Test não poderá lhe ajudar. Mas se você tem uma curiosidade sincera em conhecer sua real capacidade intelectual, com base numa escala corretamente normatizada e com nível de dificuldade adequado, se quer conhecer o percentil verdadeiro em que você se encontra em relação à população mundial, entre outras informações (*), o STE é exatamente o que você procura.
(* uma informação complementar que não é possível calcular com base em outras normas é a “proporção de potencial”. Se tiver interesse em saber exatamente o que isso significa, por gentileza, leia esse artigo: https://www.sigmasociety.net/escalasqi. De maneira muito resumida, a proporção de potencial determina o número de pessoas com QI=100, trabalhando juntas, para alcançar o mesmo nível de “produção intelectual” que uma pessoa com QI=x. Esse cálculo requer que os escores estejam numa escala de proporção para que os valores não sejam distorcidos)
Outro detalhe que eu gostaria de comentar é sobre a diferença entre questões intrinsecamente difíceis e questões muito trabalhosas.
Questões que sejam apenas trabalhosas, mas não sejam de fato difíceis, medem mais a perseverança, a persistência, a paciência e outros atributos, em vez de medir de fato a inteligência. Quando se aplica testes sem limite de tempo, é necessário tomar alguns cuidados adicionais, para evitar que uma pessoa tenha escore mais alto apenas pode dedicar 100 vezes mais tempo. Para cada problema existe uma curva que determina a probabilidade de acerto em função do tempo dedicado a ele, e essa curva atinge um limite assintótico que faz com que depois de certo limite, dedicar mais tempo não contribui para aumentar a probabilidade de acerto numa proporção que justifique a maior quantidade de tempo investido. Quando essa curva é semelhante a uma reta, indica que o problema é inadequado, porque depende predominantemente do esforço e trabalho mecânico, mas se a curva for semelhante a uma logística, indica que o problema depende predominantemente da capacidade intelectual. Isso porque nos problemas mais trabalhosos, se a pessoa resolve 5% do problema em 5 minutos, resolverá aproximadamente 10% em 10 minutos, 50% em 50 minutos e assim por diante. São problemas caracterizados por tarefas repetitivas, em que repetir 10 vezes implica avançar o dobro de repetir 5 vezes. Mas nos casos de problemas predominantemente intelectuais é diferente. Nos primeiros 10% a 20% do tempo, a pessoa não avança quase nada, fica apenas tentando compreender e esboçar uma estratégia de solução. Depois começa a resolução propriamente, e nessa etapa ocorrem rapidamente os avanços, sendo os 50% a 70% da região central da curva logística. À medida que se avança na resolução, chegando mais perto da resposta definitiva, percebe-se que existem pequenos detalhes que ainda podem melhorar a resposta. Mas esses detalhes exigem cada vez mais tempo e são cada vez menores e contribuem cada vez menos para o resultado final. A curva abaixo representa essa situação:

Chega a um ponto que a pessoa conclui que não faz sentido dedicar mais tempo para continuar melhorando a resposta, porque precisaria dedicar muito tempo para produzir pequenos incrementos. Em alguns dos grandes problemas da Ciência isso leva séculos. A solução de Newton, por exemplo, depois foi melhorada por Einstein, e no futuro será melhorada novamente. O modelo atômico também experimentou várias etapas de evolução, e isso acontece em diversas situações nas quais se está lidando com um problema difícil e predominantemente intelectual. Se for um problema trabalhoso, em que a resolução seja mais repetitiva e mecânica, o gráfico que determina a porcentagem resolvida em função do tempo fica mais semelhante ao de baixo, no qual o tempo dedicado à resolução cresce quase linearmente com a porcentagem resolvida.

O tipo de problemas desejável para um bom teste de inteligência é o que apresenta o comportamento do gráfico 1. E todos os itens do STE são planejados com esse objetivo.
O gráfico 1 é uma simplificação, porque muitas vezes podem ocorrer várias estagnações no processo de resolução. A pessoa avança rapidamente, até deparar com alguma dificuldade que impede o avanço até que seja desenvolvida uma estratégia para resolver aquilo. Então volta a avançar na resolução, depois depara com outro obstáculo etc. Vários dos problemas mais difíceis do STE apresentam essa característica, em que a pessoa precisa ter mais de um insight durante o processo de resolução para conseguir continuar avançando.
Desde que Langdon criou o primeiro high range IQ test até meados dos anos 1990, havia menos de meia dúzia de testes desse tipo. Mas a partir dos anos 1990 foram criados vários outros e atualmente existem centenas. Eu não conheço todos os high range tests que existem atualmente, por isso não posso generalizar, mas posso afirmar que muitos desses testes são constituídos por questões trabalhosas, mas que não são verdadeiramente difíceis. Isso é comum em testes com séries de números ou de figuras, que basta a pessoa dedicar tempo suficiente, testando muitas alternativas diferentes de maneira organizada, que em algum momento ela descobrirá o padrão subjacente. Claro que o uso de algumas heurísticas pode agilizar esse processo, mas são heurísticas muito básicas, e depois de a pessoa treinar a resolução de muitos testes desse tipo, ela acaba se tornando “especializada”. Há também questões que dependem apenas de que a pessoa tenha um vasto vocabulário para resolver uma analogia, sem que haja dificuldade intrínseca na analogia em si. O mesmo se aplica a problemas de associações. Certamente o ST e o STE não estão imunes e também apresentam seus próprios defeitos e limitações, mas, na medida do possível, tentamos evitar alguns dos problemas listados aqui.
Em comparação aos melhores testes de QI tradicionais, como Stanford-Binet e Wechsler, os high range IQ tests resolvem adequadamente o problema de medir corretamente nos níveis mais altos de dificuldade, chegando a 170 ou até 180, e nesse aspecto o ST não trouxe grandes contribuições, exceto, talvez, por empurrar um pouco para cima o teto até onde se consegue medir corretamente. Mas há outros aspectos nos quais o ST trouxe contribuições relevantes:
-
Geração de escores numa escala de proporção
-
Determinação correta dos percentis e dos níveis de raridade
-
Determinação inédita de proporções de potencial de produção intelectual
-
Adequação de diferentes processos cognitivos ao nível de habilidade aferido
-
Outras possíveis vantagens: https://www.sigmasociety.net/escalasqi
As mães e os pais geralmente acham seus filhos os mais bonitos do mundo, por isso é possível que minha opinião sobre o ST e o STE esteja enviesada. Então é melhor se basear nas opiniões de outras pessoas que foram examinadas com o Sigma Test e deram seus depoimentos. Uma lista dessas opiniões pode ser acessada aqui: https://www.sigmasociety.net/depoimentos. Portanto, embora talvez minha opinião seja enviesada, o ST e o STE foram construídos pensando em solucionar alguns dos pontos fracos (sob meu ponto de vista) que estão presentes em outros testes, e acredito que o ST e o STE sejam os instrumentos psicométricos que melhor atendem aos meus critérios para medir corretamente o nível intelectual nos níveis mais altos. Algumas outras pessoas profundamente talentosas concordam com essa opinião, outras talvez não. Esse espaço está aberto a receber novas opiniões positivas e negativas sobre o ST e o STE.
Por esses motivos, em Sigma Society, como o cut-off é 132, dentro do intervalo no qual outros testes também funcionam bem, não havia problemas em aceitar outros testes como critério para admissão, porque a distorção não é grande para escores até esse nível. Em Sigma III houve algumas dúvidas sobre se deveria aceitar outros testes, e foi decidido manter inicialmente só o ST, com possibilidade de posteriormente aceitar também outros testes. A partir de Sigma IV, só o próprio ST era aceito. Por esses mesmos motivos, o STE servirá como exame padrão para admissão em Sigma VII e para o Conselho Deliberativo em Immortal Society. Também será usado como critério para admissão em Sigma VI, Sigma V, Unicorn, Platinum, Sigma IV, Immortal Society, Sigma III e Sigma Society.
Feitos esses esclarecimentos, esperamos que todos que aceitarem esse desafio desfrutem a agradável aventura intelectual oferecida pelas questões do STE e obtenham resultados justos e acurados.
INSTRUÇÕES
Procure responder todas as questões, inclusive aquelas que não tiver certeza.
Não há limite de tempo, não há restrições ao uso de ferramentas auxiliares. Consultas a dicionários e enciclopédias podem ser realizadas à vontade.
Juntamente com suas respostas, envie também os escores que você obteve em outros testes (testes de QI de clínica, testes online, high range tests, SAT, GRE, ACT etc.), a data em que foi examinado com cada teste (pode ser aproximada), o escore obtido (informando desvio padrão) e o nome do teste. Também pedimos que informe as outras sociedades de que participa ou já participou, e outras informações que você considere importantes.
Entre parêntesis consta o QI aproximado correspondente à dificuldade das questões naquele nível. Isso ajuda a evitar descuidos por subestimar a dificuldade de alguma questão, bem como evitar desperdiçar tempo procurando em questões simples e fáceis por complicações que não existem.
Em breve será publicado um livro com as 1000 pessoas com maiores QIs da história e as 100 pessoas com maiores QIs da atualidade. Nesse livro serão discutidos vários outros detalhes sobre testes de QI, sobre escores inflados etc.

Questionário Sigma Test Extended
Nível I (100) Média
1. Em 1976 Marcelo tinha 11 anos. Supondo que ele continue vivo, quantos anos terá em 1999?
2. Se 13 balas custam R$ 3,90. Quanto custarão 31 balas?
3. Uma caixa grande mede 60 cm de largura, 50 cm de comprimento e 30 cm de profundidade. Qual o número máximo de caixinhas com 10 cm de largura, 10 cm de comprimento e 10 cm de profundidade que caberão dentro da caixa grande?
4. Se 12 pessoas fazem um trabalho em 12 dias, quantas pessoas serão necessárias para fazer o mesmo trabalho em 1 dia?
5. Uma coleção é constituída por 12 volumes; cada volume tem 300 páginas; cada página tem 50 linhas e cada linha tem 100 letras. Qual é o número total de letras da coleção?
Nível II (110) Acima da média
6. Uma empresa tem estoque para abastecer uma clientela de 2.500 pessoas durante 12 meses. Quanto tempo duraria seu estoque se sua clientela passasse a ser de 6.000 pessoas?
7. Se um cavalo consegue puxar 600 kg, quantos cavalos serão necessários para puxar 6150 kg?
8. Fernanda e Andreia têm juntas 18 anos. Qual a idade de cada uma, sabendo-se que Andreia tem o dobro da idade de Fernanda?
9. Temos 7 cubos com aresta de 1 cm cada. Eles são colados uns aos outros de maneira que a superfície externa total depois da colagem seja a menor possível. Calcule a área dessa superfície. A imagem abaixo mostra um exemplo de organização dos cubos no qual o critério de minimizar as superfícies não é atendido. (EXT 2022)

Nível III (120) Inteligência Superior
10. Ricardo pesa 30% a mais que José. Se Ricardo emagrecer 10% e José engordar 20%, qual ficará mais pesado? Justifique.
11. Num sistema planetário há, além da estrela principal, 9 planetas. Cada planeta possui 7 satélites primários. Para cada 21 satélites primários, há um que possui 3 satélites co-orbitais. Quantos astros são ao todo?
12. Numa escada com 1.000 degraus havia 1 grama de ouro no primeiro degrau, 2 gramas no segundo, 3 gramas no terceiro, 4 gramas no quarto, 5 gramas no quinto e assim por diante, até que no último degrau havia 1 kg de ouro. Sabendo-se que um grama de ouro vale 11 dólares, calcule o valor total de ouro na escada (em dólares).
13. Dentro de uma sala há uma estante, um cubo de ouro e um cilindro de platina. A altura do cilindro é igual a seu diâmetro. Os 3 objetos estão sobre o chão, e que é plano dentro dos limites que podemos medir. O plano do topo da estante é paralelo ao plano do solo. Se o cubo ficar em cima da estante e o cilindro ficar no chão, a distância entre o topo do cubo e o topo do cilindro será de 204 cm. Se o cilindro ficar em cima da estante e o cubo ficar no chão, a distância entre o topo do cubo e o topo do cilindro será de 156 cm. Qual é a altura da estante? (EXT 2022)
Nível IV (132) Superdotado, Talentoso, Altas Habilidades
14. Das pessoas que estão numa sala, 99% são homens. Quantos homens devem sair da sala para que esta percentagem caia para 98%, sabendo-se que o número de mulheres na sala é 3?
15. Num tabuleiro de Xadrez com 64 escaques (8 × 8), dois Reis podem ocupar 3.612 posições diferentes. Quantas posições diferentes podem se produzir num tabuleiro com 117 escaques (13 × 9), sabendo-se que dois Reis não podem ocupar simultaneamente o mesmo escaque nem escaques adjacentes? (Obs.: escaques são as “casinhas”)
16. Marcelo tinha várias maçãs, das quais deu metade ao seu irmão. Este, por sua vez, deu 75% das maçãs que ganhou para serem igualmente divididas entre seus três primos: Anderson, João e Mané. Anderson comprou mais 7 maçãs e deu metade do total ao seu irmão, Mané. Com isso, Mané ficou com um total de 17 maçãs. Quantas maçãs ganhou João?
17. Maria foi à granja comprar ovos. Chegando em casa, deu metade deles para sua irmã que, por sua vez, deu um terço dos ovos que ganhou ao seu namorado. Este último, após comer um terço dos ovos que ganhou, deu os restantes para seu primo. Sabendo-se que cada ovo pesa 70 gramas, Maria não consegue carregar mais do que 2,5 kg e os ovos estavam crus, calcule quantos ovos recebeu o primo do namorado da irmã de Maria.
18. O prefeito João e um grande empresário solteirão, chamado José, ofereceram, em parceria, uma grande churrascada. Sem contar o empresário José, o prefeito João e sua esposa, o número de pessoas presentes foi igual à quantidade de notas de 100 dólares que o prefeito gastou multiplicado pelo número de notas de 100 dólares que o empresário gastou. Sabendo-se que, em média, cada pessoa consumiu o equivalente a US$ 6,40 e que o prefeito investiu US$ 1700,00, calcule quanto o empresário José investiu. (Nota: o empresário José, o prefeito João e sua esposa participaram no consumo).
Nível V (144)
19. Um automóvel de fórmula - 1 percorre uma pista circular, completando a primeira volta em 3 minutos, à velocidade média de 144 km/h. Em quanto tempo deve ser concluída a segunda volta, para que a velocidade média nas duas voltas seja de 300 km/h?
20. Quando Antônio olhou para seu relógio, notou que o ponteiro das horas estava exatamente sobreposto ao dos minutos. Depois de quanto tempo essa sobreposição voltará a acontecer? (o movimento de cada ponteiro é uniforme)
21. Um trem com 2 vagões viaja à 80 km/h da cidade X para a cidade Y, separadas por uma distância de 800 km. No momento em que o trem partiu, um passageiro começou a andar de um extremo ao outro do vagão B, à velocidade de 100cm/seg. Chegando à cidade Y, o passageiro já havia ido e voltado 720 vezes. O vagão A tem o tamanho do vagão B mais a quarta parte do tamanho da locomotiva e a locomotiva tem o tamanho do vagão A mais a quinta parte do vagão B. Qual o tamanho total do trem?
22. Qual é a porcentagem da superfície da Lua iluminada pelo Sol em determinado instante? Justifique. (Moon Test)
23. A imagem abaixo é uma montagem com foto da Lua sobre o Oceano Atlântico. Supondo que não fosse uma montagem, em qual país estaria a pessoa que tirou a foto? Justifique a resposta. (Moon Test)

Nível VI (156)
24. Várias torneiras foram usadas para encher seis tanques. Durante uma hora, todas as torneiras despejaram água num reservatório que a distribuía entre quatro destes tanques: A, B, C e D. Depois, durante mais uma hora, as torneiras passaram a despejar sua água num funil duplo, que direcionava metade da água para os tanques, E e F e a outra metade para o reservatório, que, por sua vez, continuava a dividir sua água entre os tanques A, B, C e D. Com isso, os tanques A, B, C e D ficaram cheios. Para completar os tanques E e F, foi preciso usar uma torneira que, durante duas horas, distribuiu sua água entre os tanques E e F, completando assim todos os seis tanques. Qual o número de torneiras utilizadas inicialmente? (Obs.: todas as torneiras despejavam igual fluxo d’água e os tanques também tinham volumes iguais).
25. Vários retângulos são desenhados numa superfície plana, de modo que os cruzamentos entre suas linhas produzem 18.769 áreas distintas não subdividas. Qual o número mínimo de desenhos de retângulos necessário para formar o padrão descrito?
26. Vários segmentos retos são traçados numa superfície plana, de modo que os cruzamentos entre suas linhas produzem 1.597 áreas distintas não subdividas. Qual o número mínimo de traços necessário para formar o padrão descrito?
27. São desenhados 1 + 10^1.234.567.890 triângulos numa superfície plana. Qual é o número máximo de áreas distintas não subdividas que podem ser formadas pela intersecção desses triângulos? (Proposto por Rodrigo de Almeida Rodrigues)
28. O Último Teorema de Fermat afirma que a^n + b^n = c^n não tem solução para n inteiro maior que 2 (a, b, c, n inteiros positivos). Em 1992, demonstrei isso de maneira bem simples, porém incorreta. A demonstração é assim: o Teorema de Fermat consiste numa generalização do Teorema de Pitágoras. O que o Teorema de Pitágoras propõe é que a soma das áreas dos quadrados construídos sobre os catetos de um triângulo-retângulo totaliza uma área igual a do quadrado construído sobre a hipotenusa desse mesmo triângulo-retângulo (a^2 + b^2 = c^2). Se tentamos generalizar esse teorema, passando de 2 para 3 dimensões (a^3 + b^3 = c^3), teremos um prisma triangular gerado pelo deslocamento de um triângulo-retângulo ao longo de um eixo perpendicular a sua face, conforme mostra a figura abaixo. Podemos construir um cubo sobre uma das três faces quadrangulares desse prisma. Duas dessas faces correspondem aos dois catetos do triângulo-retângulo (ADFB, BFEC) e a face maior corresponde à hipotenusa (ADEC). É possível construir um cubo sobre uma das faces, e isso implicará em que essa face tenha os 4 lados iguais, e tal fato repercutirá em todo o prisma, fazendo com que o cubo a ser construído sobre a outra face tenha o mesmo tamanho do construído na primeira, pois se AB= BF e BF=BC, então AB=BC. Desse modo, a terceira face nunca poderá ter um cubo construído sobre ela, pois se AC representa a hipotenusa, AC não pode ser igual a AB, portanto a^n + b^n = c^n não tem solução para n=3. Mantendo a mesma linha de raciocínio, podemos demonstrar que isso não é válido para qualquer número de dimensões maior que 2 (CQD). Onde está o erro dessa demonstração?

29. João foi sequestrado por alienígenas e levado para planeta distante. Ele recebe dois desafios. Se ele resolver um deles, ganhará sua liberdade e poderá voltar para a Terra. Se resolver ambos, ganhará também 100 toneladas do mineral que ele preferir, ouro ou platina, que serão entregues em sua casa em seu planeta. Desafio 1: nesse planeta onde ele se encontra, um alienígena subiu no topo de 3 montanhas A, B, C, situadas respectivamente nas latitudes 27º, 27.5º, 27º. A partir do ponto A, os pontos B e C parecem afastados entre si 68,174º. A partir do ponto B, os pontos A e C parecem afastados entre si 54,821º. A partir do ponto C, os pontos A e B parecem afastados entre si 57,086º. A distância entre os pontos A e B é 100 km. Qual é aproximadamente o diâmetro desse planeta? (EXT 2022)
30. Desafio 2: Esse planeta tem parte da superfície coberta por oceanos e outra parte por rochas/terra. João é levado a uma ilha na qual há um vulcão, cujo topo é a parte mais elevada da ilha. Quando retorna ao continente, João percebe que, da praia, ainda é possível enxergar o topo do vulcão, quase sumindo no horizonte. Sabendo que a altura desse vulcão é de 3500 m, qual é a distância dessa praia até o topo desse vulcão? (EXT 2022)
Nível VII (168)
31. Um determinado sistema de engrenagens consiste na superposição de 5 discos concêntricos: A, B, C, D, E, que permanecem sobre uma plataforma rígida, assumida como referencial estático. Os discos possuem tamanhos diferentes e giram a velocidades diferentes. Cada disco tem velocidade uniforme, alguns giram no sentido horário, outros no anti-horário. Cada disco possui um ponto vermelho em sua superfície, e inicialmente todos esses pontos vermelhos estão desalinhados. Num dado momento, todos os discos começam simultaneamente a girar, cada um a seu próprio ritmo, sem qualquer contato entre um disco e outro. O disco A leva 7 minutos para executar um giro completo (360 graus), o disco B leva 13 minutos, o disco C leva 17 minutos, o disco D leva 19 minutos e o disco E leva 23 minutos. Passado algum tempo, todos os pontos vermelhos encontram-se alinhados, sendo que o disco A está na mesma posição que se encontrava depois de 2 minutos após o início do movimento, o disco B encontra-se na mesma posição em que estava depois de 3 minutos após o início do movimento, o disco C encontra-se na mesma posição em que estava depois de 4 minutos após o início do movimento, o disco D encontra-se na mesma posição em que estava depois de 7 minutos após o início do movimento e o disco E encontra-se na mesma posição em que estava depois de 9 minutos após o início do movimento. Quanto tempo transcorreu desde o início do movimento para que os discos tenham chegado pela primeira vez a essa configuração?
32. Pedrinho chegou à Papelaria da Dona Maria e pediu a ela que lhe vendesse uma régua geométrica para desenhar uma espiral com um pequeno círculo concêntrico. Dona Maria, que era associada à Sigma Society, explicou ao garoto que não havia réguas para desenhar espirais. Mas depois de refletir com cuidado sobre o problema, ela descobriu um jeito de fazer o tal desenho, e descreveu o método para o garoto. Em seguida, ela lhe vendeu o material necessário, que ele pagou com uma nota de US$ 10,00 e recebeu algum troco. Ele foi para casa e fez um desenho sem dificuldades. Descreva um método para cumprir a tarefa de Pedrinho, dispondo dos mesmos US$ 10,00 para comprar o material necessário. O desenho precisa ser satisfatoriamente reconhecido conforme o padrão descrito (espiral com círculo concêntrico), sem grandes irregularidades na espiral.
33. Um homem inspira profundamente, até encher completamente seus pulmões. Então prende a respiração e uma fita métrica é usada para medir o perímetro de seu tórax, que nessas condições mede 106 cm. Em seguida, o homem expira até que seus pulmões liberem todo o ar, e novamente mede-se seu tórax, que agora apresenta um perímetro de 84cm. Dispondo-se de US$ 10,00 para comprar material, de que modo se pode saber qual o volume de ar que os pulmões são capazes de comportar?
34. A velocidade dos reflexos de uma pessoa pode ser determinada com base no tempo transcorrido entre um estímulo e uma reação provocada por esse estímulo. Por exemplo: Uma lâmpada permanece apagada, enquanto a observamos. Ao receber o estímulo de que “a lâmpada acendeu”, a reação deve ser “fechar os olhos”. Quanto menor for o tempo entre “acender a lâmpada” e “fechar os olhos”, mais rápidos são os reflexos. Descreva um método para determinar a velocidade dos reflexos das pessoas, sem utilizar um cronômetro ou qualquer outro equipamento que permita medir intervalos de tempo menores que 1 segundo. Pode-se elaborar um método rústico dispondo de US$ 1,00 para adquirir equipamentos e pode-se elaborar um método sofisticado, com boa precisão, dispondo de US$ 1000,00. Descreva um método para cada orçamento.
35. Em 1993, num ensaio sobre Ciência e Religião, eu descrevi um projeto de como seria possível construir uma “máquina da invisibilidade”. Durante a descrição dos pormenores, acabei me dando conta de que alguns problemas eram insolúveis, não apenas devido às limitações tecnológicas, mas por questões físicas, que impunham limites teóricos e, possivelmente, intransponíveis. O projeto parte da ideia central de que, para tornar um objeto invisível, é necessário fazer com que um observador externo que olhe na direção desse objeto deixe de notar visualmente sua presença. Isso pode ser feito da seguinte forma: constrói-se uma esfera, e toda a superfície externa dessa esfera é recoberta com diminutas câmeras e monitores de TV de altíssima resolução. Milhões, ou mesmo bilhões de câmeras e monitores devem recobrir toda a esfera, de modo que cada monitor transmita a imagem captada pela câmera situada no ponto diametralmente oposto. O resultado será como mostra a figura abaixo. A imagem do objeto (quadrado azul) é captada por uma câmera situada no ponto A, que transmite a imagem para o monitor situado no ponto M, e assim um observador situado no ponto O verá o quadrado azul, como se não houvesse nada à sua frente. Desse modo, tudo que estiver situado dentro da esfera será invisível ao observador externo. Mas esse esquema apresenta dois problemas, um dos quais pode ser solucionado em teoria, enquanto o outro não tem solução. Indique esses dois problemas e explique porque um deles pode ser resolvido e o outro não.

36. Muitos membros da Mensa foram aprovados pelo teste de Raven (Standard ou Advanced). Supondo que todos os membros da Mensa tivessem sido aprovados pelo Raven Standard Progressive Matrices e considerando a norma indicada abaixo estivesse correta e acurada, qual seria a porcentagem de membros da Mensa que foram aprovados sem ter de fato QI acima de 132? Desconsidere casos de fraude (pessoas que conheciam as respostas antes de fazer o teste). A incerteza no escore de cada pessoa examinada é 2,6 pontos brutos. (EXT 2022)

37. Seguindo o enunciado anterior, qual a porcentagem de pessoas não aprovadas no RSPM, mas cujo QI está acima de 132? (EXT 2022)
38. Num hiperespaço ortonormal euclidiano de 256 dimensões, temos uma hiperesfera de 6 dimensões e desejamos dividi-la no maior número possível de pedaços, mas só podemos fazer 12 cortes. Os pedaços não podem mudar de posição. Cada corte é um hiperespaço ortogonal euclidiano de 5 dimensões (hiperplano). Quantos pedaços podemos conseguir dessa maneira? (Sigma Test VI 2003)
Nível VIII (184)
39. Os palitos porosos e acinzentados do interior dos lápis são formados por uma mistura de grafite e argila, e não sabemos quais são as proporções. Ao escrever com um lápis sobre uma folha de papel, deixa-se uma fina camada de material. Descreva um procedimento para calcular a massa de grafite e argila presente no pingo da letra “i”, dispondo-se de apenas US$10,00 para comprar o material necessário à experiência.
40. Temos uma fita com 0,01cm de espessura e 1 cm de largura, e um cilindro com 50cm de raio e 1m de altura. Sabendo que uma das faces da fita é inextensível e a espessura da fita não varia, determine o menor comprimento de fita necessário para dar 9 voltas completas (completamente sobrepostas) ao redor do cilindro. É preciso indicar a solução com 14 algarismos significativos e não é permitido cortar a fita nem cortar ou deformar o cilindro.
41. Uma sofisticada nave paira como um beija-flor sobre um terreno situado na linha equatorial de um planeta, a 1.000 metros de altitude. Esse planeta é perfeitamente esférico, homogêneo e possui um pequenino satélite que descreve uma órbita circular num plano paralelo ao seu equador. Às 15:58:30h um homem salta de paraquedas dessa nave, e desce perpendicularmente ao solo. No momento em que ele salta, observa que o satélite está ‘nascendo’ no horizonte Leste. Ele chega ao solo e, sem sair do lugar, continua observando o satélite, que às 17:40:00h atinge o zênite. Permanece em seu lugar, observando... e às 19:20:00h vê o satélite desaparecendo no horizonte Oeste. Ainda sem sair do lugar, às 22:40:00h, ele observa novamente o satélite nascendo no Leste. Qual o diâmetro aproximado desse planeta? Justifique sua resposta e explique a utilidade de cada informação contida no enunciado. Explique também porque o valor obtido não pode ser exato. (Se houver dúvidas sobre os significados de zênite, horizonte, equador, órbita etc., não há restrição quanto a consultar dicionários ou enciclopédias)
42. Temos um tetraedro regular T1 rígido e maciço com aresta 1 e desejamos fazer corte por dentro do qual seja possível passar outro tetraedro T2 rígido e maciço, atravessando completamente esse buraco e saindo completamente do outro lado. Qual é a aresta máxima que pode ter o tetraedro T2? A resposta deve ser apresentada com 50 algarismos. (EXT 2022)
43. Temos um cubo rígido e maciço com aresta 1 e desejamos fazer corte por dentro do qual seja possível passar um tetraedro regular, rígido e maciço, atravessando completamente esse buraco e saindo completamente do outro lado. Qual é a aresta máxima que pode ter esse tetraedro? A resposta deve ser apresentada com 50 algarismos. (EXT 2022)
Nível IX (202)
44. Descreva um método prático e rápido que permita determinar com boa precisão o número de palavras que constituem o vocabulário de uma pessoa.
45. Se Júpiter fosse oco e o topo de suas nuvens fosse uma membrana rígida com espessura de 1 mm, quantos planetas como a Terra caberiam inteiramente dentro dele? (Moon Test)
46. Estime ou calcule percentis realistas para os escores brutos dos seguintes testes: Mega Test, Titan Test. Sinta-se à vontade para justificar com fórmulas e argumentos, caso queira, procurando ser o mais conciso e objetivo que puder. (EXT 2022)
47. Estime ou calcule percentis realistas para os escores brutos de 2 high range IQ testes à sua livre escolha. Sinta-se à vontade para justificar com fórmulas e argumentos, caso queira, procurando ser o mais conciso e objetivo que puder. (EXT 2022)
48. Estime ou calcule percentis realistas para os cut-off das seguintes sociedades de alto QI:
1. Mensa
2. Intertel
3. Colloquy
4. Cerebrals
5. ISPE
6. Prometheus
7. Epimetheus
8. HellIQ
9. Mega Society
10. Omega Society
11. Pi Society
12. Pars Society
13. OlympIQ Society
14. Sigma V
15. Giga Society
16. Sigma VI
17. Escolha outras 2 sociedades com percentil teórico 1-10^-9 ou acima. (EXT 2022)
49. Havia um brilhante antropólogo, membro de Sigma V, chamado João. Durante uma expedição à África, ele foi aprisionado por uma tribo de canibais e condenado a servir de refeição. Mas a “legislação” dessa tribo oferecia aos prisioneiros uma oportunidade de serem libertados, caso fossem capazes de superar um desafio. No caso de João, o desafio consistia no seguinte: dois ovos lhe seriam apresentados, sendo um cru e o outro cozido. Cada ovo permaneceria dentro de uma caixa. As paredes dessas caixas são rígidas e opacas. As caixas têm a forma de paralelepípedos. Uma das caixas tem uma janela em uma de suas faces, e essa janela é tapada com uma tela de arame, através da qual é possível enxergar o ovo que está dentro dela. O desafio consiste em identificar qual é o ovo cru num prazo de 2 minutos. Os ovos não podem ser quebrados, não podem ser retirados do interior das caixas, as caixas não podem ser abertas e não é permitido inserir nada dentro das caixas. João é informado de que esse desafio lhe será apresentado num prazo de 90 dias. Até que esteja expirado esse prazo, ele pode contar com o apoio dos membros da aldeia para investigar um meio de solucionar o problema. Além disso, João pode dispor de todos os “sofisticados” instrumentos e tudo o mais que houver na aldeia e nas circunvizinhanças. Chegada a data de enfrentar o desafio, ao raiar do Sol, João teve seus olhos vendados e suas mãos amarradas. Alguns minutos depois, um ancião da aldeia cozinhou um ovo, enxugou-o, colocou-o numa caixa e fechou-a. Pegou um ovo cru e o colocou noutra caixa, fechando-a em seguida. As duas caixas foram colocadas numa mesa, onde permaneceram até o anoitecer. Então João foi desamarrado e as vendas foram retiradas de seus olhos, ele foi munido com o equipamento requisitado e foi colocado diante da mesa onde estavam as caixas com os ovos. Ele as examinou cuidadosamente e conseguiu identificar onde estava o ovo cru. O desafio foi repetido durante 20 dias seguidos, sempre com ovos diferentes, e nas 20 vezes ele conseguiu fazer a identificação correta. Diante disso, os canibais, admirados, reconheceram o valor do notável antropólogo. Decidiram libertá-lo e ainda o presentearam com muitas joias. Descreva um procedimento que João pode ter usado para conseguir identificar qual era a caixa com o ovo cru.
50. As duas fotos abaixo foram tiradas em agosto de 2020, por Hindemburg Melão Jr. nas coordenadas -22.947594, -45,476772 e por Alisson Correa Chervinski nas coordenadas -29.755334, -57.076461. Qual era a distância do centro da Terra ao centro da Lua nesse momento? Justifique detalhadamente sua resposta. (visite a página do Moon Test para download das imagens em maior resolução)

Nível X – EXTRA (221) (é necessário acertar pelo menos 80% das questões anteriores para que suas respostas no nível X sejam analisadas)
51. Um homem árabe e uma mulher israelense são abduzidos por extraterrestres. Os E.Ts. prometem devolvê-los incólumes à Terra, desde que eles sejam capazes de cumprir uma tarefa, que consiste no seguinte: três salas são designadas A, B e C. Cada sala é quadrada e tem aproximadamente 25m2. Elas estão unidas de modo que cada uma delas possui duas portas, e cada uma dessas portas dá acesso a uma das outras duas salas. As três salas são acusticamente isoladas, não possuem nenhuma mobília e nenhuma janela. As paredes, as portas, o teto e o chão das salas são maciços e opacos e não apresentam fendas, orifícios, passagens ocultas ou similares. Na sala A é colocado o homem e na sala B é colocada a mulher. Tanto o homem quanto a mulher recebem as seguintes instruções:
1. Ambos terão o prazo de 1 hora para percorrer as três salas e voltar à sala de origem, sempre caminhando no sentido A-B-C-A.
2. Ambos deverão permanecer sentados, no chão, no centro de sua respectiva sala, até que seja emitido um sinal, indicando que a contagem do tempo foi iniciada. Esse sinal consiste no seguinte: em cada porta existem duas lâmpadas (uma de cada lado da porta), e o sinal é quando todas essas lâmpadas se acendem quase simultaneamente. Cada uma das lâmpadas é suficientemente luminosa para se fazer notar com facilidade, mesmo que não se esteja prestando atenção a ela.
3. No momento em que a mulher tocar na maçaneta da porta de uma sala, o homem já não pode estar presente nessa sala.
4. No momento em que o homem tocar na maçaneta da porta de uma sala, a mulher já não pode estar presente nessa sala.
5. A mulher precisa se levantar depois que o homem.
6. O homem e a mulher não podem estabelecer nenhum tipo de comunicação, nem obter de terceiros alguma informação que permita a um saber onde se encontra o outro. Não podem bater nas paredes ou nas portas, nem tentar propagar nenhum tipo de onda de choque. Ao sair de uma sala e entrar na outra, é necessário fechar a porta que lhe serviu de acesso. Inicialmente todas as portas estão fechadas. Duas ou mais portas não podem ficar abertas simultaneamente.
7. Nenhum deles dispõe de um relógio nem qualquer outro instrumento que permita determinar o fluxo do tempo.
8. Quando faltar 1 minuto para completar 1 hora, será dado novamente o sinal luminoso, indicando que o prazo está se esgotando.
9. Ao expirar o prazo de 1 hora, o homem precisa estar sentado no centro da sala A e a mulher precisa estar sentada no centro da sala B.
10. A mulher só pode se sentar depois que o homem.
11. O homem é informado de que a mulher é excepcionalmente inteligente.
12. A mulher é informada de que o homem é excepcionalmente inteligente.
O homem e a mulher não se conheciam previamente, nunca tiveram nenhum contato antes e permanecem incomunicáveis entre si durante todo o processo (para tornar o enunciado mais claro, pode-se admitir que ambos são surdos e mudos). A experiência é realizada e eles conseguem cumprir a tarefa. A experiência é repetida 10 vezes e todas as 10 vezes eles cumprem a tarefa com sucesso, o que deixa claro que não foi por sorte. Então eles são devolvidos à Terra, convertem-se ao Zoroastrismo, casam-se e vivem felizes para sempre! Descreva o procedimento que eles tiveram e o pensamento de cada um.
52. Considere que o nível de produção intelectual de uma empresa seja medido pela soma das produções de seus funcionários e executivos trabalhando em conjunto. Considere uma empresa com 10.000 funcionários, que os seleciona por meio de um teste cognitivo fidedigno, acurado, eficiente e bem normatizado com corte em 2 desvios padrão acima da média. A produção intelectual total dos funcionários dessa empresa é equivalente à de uma pessoa com QI = x trabalhando sozinha. Quanto vale x? Claro que os funcionários produzirão em maior quantidade que a pessoa com QI = x, mas se ponderar a relevância intelectual de cada trabalho, o menor número de trabalhos mais relevantes da pessoa com QI=x será equivalente ao maior número de trabalhos menos relevantes dos 10.000 funcionários somados. (EXT 2022)
53. Seguindo o enunciado anterior, agora considere que o número total de pessoas que já nasceu é cerca de 100 bilhões e considere que o QI médio da população histórica seja 100 com desvio padrão 16. Se um alienígena tivesse a capacidade de produção intelectual igual à de todas as pessoas que já viveram somadas, qual seria o QI desse alienígena? (EXT 2022)
54. A foto abaixo mostra a cratera Clavius. Christopher Clavius foi um matemático, astrônomo e sacerdote contemporâneo de Galileu que se notabilizou por seus trabalhos em Geometria e Álgebra. Quando Galileu mostrou que a Lua apresentava uma topografia acidentada, em vez de ela ser uma esfera perfeita, como se acreditava até então, Clavius argumentou que se a superfície da Lua fosse realmente irregular, como dizia Galileu, então as bordas da Lua deveriam também mostrar essa característica, porém mesmo ao telescópio (da época) as bordas da Lua se mostram muito lisas. Diante a essa evidência empírica, Clavius propôs que provavelmente a Lua tinha uma superfície transparente e perfeitamente lisa, por baixo da qual havia essas aparentes irregularidades. De acordo com o historiador R.A.M. não há registros de que Galileu tenha encontrado argumentos adequados para refutar a tese de Clavius, entretanto havia recursos suficientes na época para mostrar que Clavius estava equivocado. Aponte problemas no argumento de Clavius e mostre que a tese de Galileu tinha maior probabilidade de ser uma representação adequada para a realidade senciente. (Moon Test)

55. Qual o número total de posições diferentes que podem se produzir em todas as partidas possíveis de Xadrez. Justifique detalhadamente sua resposta. (EXT 2022)
56. Qual o logaritmo (base 10) do número total de posições diferentes que podem se produzir em todas as partidas possíveis de MegaChess, versão 16x16 de Xadrez da plataforma Zillions of Games. Justifique detalhadamente sua resposta. (EXT 2022)

Primeira estimativa de norma do Sigma Test Extended
Recordista atual no STE (e no ST): Petri Widsten, 212. Petri é Ph.D. Summa Cum Laude em Química, sua tese de doutorado foi considerada a melhor da Finlândia no biênio 2002-2003, ele também foi primeiro colocado em importantes competições internacionais de Lógica, Inteligência e Puzzles, inclusive no WORLD I.Q. CHALLENGE.



Norma baseada nos resultados combinados do Sigma Test, Sigma Test VI e Moon Test
Theoretical Percentil: percentil usado em todas as sociedades de alto QI, baseado na hipótese de que os escores se distribuem normalmente ao longo de toda a escala. Como a distribuição real tem caudas densas à direita e se torna progressivamente mais densa para QIs mais altos, os percentis são inflados e incorretos. Mas como é o padrão utilizado, a tabela inclui também essa informação para efeito de comparação.
True Percentil: percentil realista calculado com base no método descrito nesse artigo https://www.sigmasociety.net/escalasqi, colocando os escores em escala de proporção e determinando as frequências cumulativas verdadeiras.
TAXA:
Taxa: US$ 10.000,00
DESCONTOS CUMULATIVOS:
Quem fizer o Sigma Test Extended enquanto houver menos de 100 pessoas examinadas poderá solicitar um novo certificado depois que houver mais de 100 pessoas examinadas, com a norma revisada.
Pessoas que já foram examinadas com o Sigma Test antes de 2007 e não receberam certificado impresso: isentos na taxa
Pessoas que já foram examinadas com o Sigma Test antes de 2007 e receberam certificado impresso: 30% de desconto na taxa
Pessoas que já foram examinadas com o Sigma Test VI: 20% de desconto na taxa
Pessoas que já foram examinadas com o Moon Test: 10% de desconto na taxa
Os descontos acima são cumulativos. Por exemplo: a pessoa fez o Sigma Test e o Sigma Test VI, então sua taxa será 0,7 × 0,8 = 0,56 (desconto de 44%).
Ao fazer o Sigma Test Extended a pessoa recebe um certificado do Sigma Test Extended e um certificado baseado exclusivamente nas questões do Sigma Test, já que o ST é um subteste do STE.
Os certificados do Sigma Test e Sigma Test Extended são aceitos como critério para admissão nas seguintes sociedades de alto QI:
-
Sigma VII: QI>212 (sd=16)
-
United Giga Society: QI>196
-
Sigma VI: QI>196
-
Pars Society (inativa): QI>180
-
Grand Master Society: QI>180
-
OlympIQ Society: QI>180
-
Unicorn High IQ Society (inativa): QI>180
-
Sigma V: QI>180
-
Platinum Society (inativa): QI>164,3
-
Prometheus 2.0 Society: IQ>164
-
Immortal Society: QI>164
-
Sigma IV: QI>164
-
Entre outras sociedades de alto QI com critérios de corte entre 121 e 151