A corrida pela supremacia em inteligência artificial ganhou um capítulo perturbador em 2026 — e o dado mais chocante não é sobre quem venceu, mas sobre o que o "campeão" faz de errado.
O novo número 1 chegou — mas tem um problema grave:
O GPT-5.5, lançado pela OpenAI em 23 de abril de 2026, assumiu o topo do ranking global de IAs com 60 pontos no índice da Artificial Analysis, ficando três pontos à frente do Claude Opus 4.7 e do Gemini 3.1 Pro. Porém, há um detalhe alarmante: o modelo apresenta uma taxa de alucinação de 86% no benchmark AA-Omniscience — ou seja, ele responde com confiança mesmo quando está completamente errado.
Para efeito de comparação, o Claude Opus 4.7 apresenta taxa de alucinação de apenas 36% no mesmo teste, e o Gemini 3.1 Pro fica em 50%.
O que isso significa na prática?
Pense assim: o modelo mais poderoso do mundo sabe mais do que qualquer outro — mas também mente com mais confiança. Para áreas como direito, medicina ou finanças, isso é um risco real e concreto.
Cada IA tem seu superpoder diferente:
O GPT-5.5 lidera em raciocínio abstrato complexo. O Claude Opus 4.7 é o mais confiável para engenharia de software e admite quando não sabe algo. O Gemini 3.1 Pro oferece uma janela de contexto de 1 milhão de tokens — capaz de processar cerca de 750 mil palavras de uma vez — sendo imbatível para operações com vídeo, áudio e enormes volumes de documentos simultaneamente.
E a IA ainda não consegue pensar como um cientista:
Um novo benchmark chamado CritPt, desenvolvido por mais de 60 pesquisadores, simula desafios de pesquisa em nível de doutorado em física — e nenhum modelo conseguiu superar 10%. O melhor resultado foi o Gemini 3 Pro, com apenas 9,1%. A conclusão é cirúrgica: a IA atual consegue "conversar" como um PhD, mas ainda não consegue "pesquisar" como um.
O dado mais curioso de tudo? O ChatGPT já ultrapassa 900 milhões de usuários ativos semanais e mais de 50 milhões de assinantes pagantes — tornando-se uma infraestrutura tão fundamental da internet quanto o Google. Mas, ironicamente, o modelo mais usado do planeta é justamente o que mais "inventa" respostas com ar de certeza. A era da IA poderosa chegou — junto com a era da IA que mente bem.
0 Comentário(s)