21 de jun. de 2026

Previsão da copa do mundo de futebol 2026

Por Kawan Duarte (membro)

Foi postado na COMUNIDADE Sigma Society um tópico sobre a copa do mundo de futebol 2026 e o membro Kawan fez uma excelente análise dentro do tópico: https://www.sigmasociety.net/post/sigma-society-aberto/discussion

Quem é Kawan? Membro de Sigma Society e Immortal Society, único a resolver o Super Desafio Sigma 2024, Medalhista na OBMEP, indicado como bolsista do PICME e devido ao seu desempenho excepcional, foi convidado a cursar mestrado simultaneamente à graduação, como aluno especial. Co-Campeão Estadual (PI) de Xadrez nos EJIF e Campeão Brasileiro por Equipes.

Copa do Mundo 2026: minha previsão

Por Kawan Duarte

Fiz minha previsão com um modelo estatístico bayesiano hierárquico que estima a força de cada seleção, seguido de uma simulação de Monte Carlo do torneio inteiro. O resultado demonstra, em números, o argumento que Hindemburg apresentou em 2018: como o futebol tem poucos gols por partida (em geral), o acaso pesa muito e o time mais forte raramente termina campeão.

A tese, demonstrada com números

Tomemos a seleção mais forte do modelo, a Argentina. Num jogo eliminatório em campo neutro, contra um adversário de força mediana, ela vence em cerca de 82% das vezes. Mas o título exige cinco vitórias seguidas no mata-mata (32-avos, oitavas, quartas, semifinal e final). Se mantivesse esses 82% em todas, sua chance de título seria:

ingênuo (82% por jogo, 5 rodadas): 0,82⁵ ≈ 37%
simulação completa do torneio: 19,5%

A diferença entre os dois números é instrutiva. Os adversários endurecem nas fases finais, então a probabilidade média por jogo cai de 82% para cerca de 72% (nas semifinais e na final fica em torno de 67%). É essa queda, ao longo das cinco rodadas, que leva aos 19,5% da simulação, e não os 37% do produto ingênuo: não é um único expoente que produz o resultado, e sim o calendário, vencer cinco mata-matas contra oponentes cada vez mais fortes. De qualquer modo, a lição do Hindemburg se confirma, e os números a tornam concreta:

Há 80,5% de probabilidade de o campeão não ser o nº 1 do ranking, e 64% de ser uma seleção de fora do top-2.
Dezoito seleções têm ao menos 1% de chance de título; o número efetivo de candidatos (pelo inverso do índice de Herfindahl) é de cerca de 10.

O modelo (o que está por baixo)

O modelo trata os gols do mandante e do visitante como variáveis de Poisson, governadas por forças latentes de ataque e defesa de cada seleção:

log λ_casa = μ + ataque[casa] − defesa[fora] + mando·(casa real) + host·(país-sede)

log λ_fora = μ + ataque[fora] − defesa[casa]

ataque[t] = confederação_a[t] + β·qualidade[t] + efeito_t (idem defesa)

+ correção de Dixon-Coles (ρ) na cauda de placares baixos (0-0, 1-0, 0-1, 1-1)

Essas forças são estimadas por MCMC, com uma verossimilhança que dá mais peso aos jogos recentes (meia-vida de cerca de 2,8 anos) e às competições mais importantes. Os parâmetros resultantes têm leitura direta:

μ ≈ 0,08, o equivalente a cerca de 1,08 gol de base por equipe; e o mando vale 0,23, ou seja, 25% a mais de gols quando se joga em casa de verdade.
ρ = −0,043 na correção de Dixon-Coles, que faz o modelo prever mais empates do que um Poisson simples, como de fato ocorre no futebol.
O efeito de confederação (ataque mais defesa), com intervalo de credibilidade de 94%:

CONMEBOL > UEFA > CAF > AFC > CONCACAF > OFC.

Esse último termo corrige um viés concreto: seleções africanas e asiáticas inflam suas estatísticas ao enfrentar adversários fracos da própria confederação. São os 658 jogos entre confederações diferentes que revelam a hierarquia. A precisão é desigual: a OFC, com poucos jogos fora da própria confederação, é a menos precisa (intervalo largo, embora claramente negativo); as demais excluem o zero com folga.

O modelo ainda inclui uma covariável de qualidade de elenco (o Elo médio dos clubes dos convocados), mas o coeficiente estimado é praticamente nulo (β ≈ 0). Na prática, portanto, a força de cada seleção vem da confederação e dos resultados, não da fama do elenco. Volto a esse ponto nos insights.

A base reúne cerca de 4.200 jogos de seleções entre 2022 e 2026: amistosos, eliminatórias das seis confederações, Nations Leagues, Copa América, Eurocopa, Gold Cup, Copa Asiática, AFCON e os Mundiais de 2022 e 2026, já com os jogos disputados nesta edição.

Validação (treino só com o passado, teste no futuro)

Para confiar no modelo, testei-o fora da amostra: treinando apenas com o passado e prevendo jogos que ele não tinha visto.

O log-loss ficou entre 0,83 e 0,93, contra 0,87 a 1,01 de um Elo com regressão logística e cerca de 1,05 de um palpite baseado só nas taxas médias, ao longo de quatro janelas temporais.
Treinado com dados anteriores à Eurocopa e à Copa América de 2024, o modelo já apontava os campeões reais daqueles torneios, Espanha e Argentina, como nº 2 e nº 1 favoritos.
A calibração é boa: quando o modelo diz 70%, o evento acontece perto de 70% das vezes (erro médio de 1 a 3%). A amostragem convergiu de forma limpa (R-hat ≤ 1,01, sem divergências).

Previsões

Com o modelo ajustado e o chaveamento já definido, simulei o restante do torneio. Estes são os favoritos ao título:

Probabilidade de título (top 16), por Monte Carlo com 50.000 torneios.

Probabilidade de cada seleção alcançar cada fase, do mata-mata ao título.

Três insights

Resultados acima de reputação. O modelo pesa o que cada seleção fez em campo, não a fama do elenco. Por isso a França, badalada pelo talento mas com um ciclo irregular, aparece com apenas 7%, uma da3s minhas apostas mais contrárias ao consenso.
Talento individual não melhora a previsão. Cheguei a incluir as estatísticas dos 1.246 convocados (gols, assistências e a força do clube de cada um). Fora da amostra, o ganho foi praticamente nulo, porque os resultados das seleções já carregam essa informação (normalmente). Acabei usando os dados de jogador apenas para ajustar ausências por lesão, etc.
O chaveamento pesa tanto quanto a força. O ranking de probabilidade de título não coincide com o de força pura: o Marrocos é forte, mas caiu num grupo difícil (o do Brasil), enquanto a Alemanha avança por um caminho mais fácil.

Como me comparo às fontes públicas

Por fim, coloquei minha previsão lado a lado com fontes respeitadas: o supercomputador da Opta, o modelo acadêmico de Groll e Zeileis, a Universidade de Liverpool, o mercado de apostas e o PELE, de Nate Silver.

Probabilidade de título: meu modelo vs. Opta, acadêmico (Groll/Zeileis) e mercado.

Ranking de favoritos por fonte de previsão (top 6)

Colunas por probabilidade de título, exceto PELE (ranking por rating de força; a prob. de título do PELE é paga). Acadêmico e Liverpool divulgaram apenas o topo (6 seleções).

Ranking de favoritos ao título, por fonte de previsão.

Tenho duas apostas contrárias ao consenso, em direções opostas. A Argentina em 1º é a mais ousada: entre as fontes que publicam probabilidade de título, sou o único a colocá-la no topo (acadêmico 8,2%, Opta cerca de 10%, mercado cerca de 11% e Liverpool 12,4% a deixam entre o 4º e o 6º lugar). Vale notar, porém, que o rating de força do PELE, de Nate Silver, já ajustado pelos jogos desta Copa, também tem a Argentina como nº 1, à frente da Espanha: na força bruta, há quem concorde comigo. A divergência está em quanto essa força se converte em título. A outra é a França, na direção oposta: sou o mais pessimista de todos (7%, contra cerca de 12% a 20% das demais fontes). Creio que ambas vêm do mesmo princípio, resultados acima de reputação, e são os maiores riscos da minha previsão.

Para detalhar, comparo também a força estimada pelo meu modelo (ataque mais defesa) com o rating do PELE, força contra força. No topo, as duas quase coincidem: mesmo top 4 (Argentina, Espanha, Inglaterra, França) e a Argentina em 1º nas duas. As diferenças surgem mais abaixo, sou mais alto em Marrocos, Portugal e Colômbia, e o PELE em Brasil e Alemanha.

Força do meu modelo (ataque + defesa) vs rating do PELE (top 10)

Força = ataque + defesa (escala do modelo); ordenado pela minha força. O top 4 coincide com o do PELE. Divergências: sou mais alto em Marrocos/Portugal/Colômbia; o PELE, em Brasil/Alemanha.

Força do meu modelo (ataque mais defesa) vs rating de força do PELE (top 10).

Fontes das previsões de terceiros (Copa do Mundo 2026)

Opta (25.000 simulações): theanalyst.com/articles/who-will-win-2026-fifa-world-cup-predictions-opta-supercomputer
Acadêmico, Groll/Hvattum/Michels/Schauberger/Zeileis et al. (random forest, 100.000 simulações): theconversation.com/we-ran-100-000-computer-simulations-of-the-world-cup-and-the-winner-will-be-284629 (espelho: r-bloggers.com).
Universidade de Liverpool, Holmes e McHale (1.000 simulações): news.liverpool.ac.uk/2026/06/12/is-it-euro-2024-all-over-again-supercomputer-predicts-world-cup-results/
PELE / Nate Silver (100.000 simulações): natesilver.net/p/world-cup-2026-odds-predictions
Mercado (agregador de odds, por volta de 20/jun/2026): covers.com/world-cup/odds