Em uma semana lotada de anúncios, a OpenAI revelou nesta sexta-feira (20) seus mais novos modelos de linguagem “racional”, o o3 e o o3-mini. As tecnologias foram apenas apresentadas rapidamente pela empresa com alguns testes de resolução matemática e sobre programação, mas ainda parece longe de estar disponível ao público.
Segundo os testes da OpenAI, o o3 supera seu antecessor em quase 23% em testes sobre programação por meio do SWE-Bench Verified. O modelo também bateu 87% de precisão ao resolver o GPQA Diamond, um complexo teste de matemática avançada que nem todas as tecnologias conseguem desvendar.