Tecnologia

Análise aponta falhas no SWE-bench Verified para medir progresso em codificação

Por

23/02/2026

Uma análise recente revelou que o SWE-bench Verified, uma ferramenta utilizada para medir o progresso em codificação de ponta, está cada vez mais contaminada e falha em sua função. O estudo identificou testes defeituosos e vazamentos de treinamento como principais problemas. Como solução, foi recomendada a adoção do SWE-bench Pro como alternativa mais eficaz.

De acordo com informações do OpenAI Blog, a necessidade de uma ferramenta mais precisa é crucial para acompanhar o avanço tecnológico no campo da codificação.

— Publicidade —

Google AdSense • Slot in-article

Análise aponta falhas no SWE-bench Verified para medir progresso em codificação

DEIXE UM COMENTÁRIO

Sobre

Últimas

Hospital Ophir Loyola realiza campanha de doação de sangue para pacientes em Belém

Praça de Esporte e Lazer de Santa Luzia do Pará atinge 98% das obras concluídas

Sefa apreende 33 mil garrafas de cachaça em Novo Progresso por falta de impostos

Mais Lidas