OpenAI lança um par de modelos de raciocínio de IA, o3 e o4-mini

A OpenAI anunciou na quarta-feira o lançamento de o3 e o4-mini, novos modelos de raciocínio de IA projetados para pausar e trabalhar em perguntas antes de responder.

A empresa chama o3 de seu modelo de raciocínio mais avançado até agora, superando os modelos anteriores da empresa em testes que medem as capacidades de matemática, codificação, raciocínio, ciência e compreensão visual. Enquanto isso, o4-mini oferece o que a OpenAI diz ser um equilíbrio competitivo entre preço, velocidade e desempenho - três fatores que os desenvolvedores frequentemente consideram ao escolher um modelo de IA para impulsionar suas aplicações.

Ao contrário dos modelos de raciocínio anteriores, o3 e o4-mini podem gerar respostas usando ferramentas no ChatGPT, como navegação na web, execução de código Python, processamento de imagens e geração de imagens. A partir de hoje, os modelos, além de uma variante do o4-mini chamada “o4-mini-high”, que gasta mais tempo elaborando respostas para melhorar sua confiabilidade, estão disponíveis para assinantes dos planos Pro, Plus e Team da OpenAI.

Os novos modelos fazem parte do esforço da OpenAI para superar o Google, Meta, xAI, Anthropic e DeepSeek na acirrada corrida global de IA. Embora a OpenAI tenha sido a primeira a lançar um modelo de raciocínio de IA, o1, os concorrentes rapidamente seguiram com versões próprias que igualam ou excedem o desempenho da linha de produtos da OpenAI. Na verdade, os modelos de raciocínio começaram a dominar o campo à medida que os laboratórios de IA procuram extrair mais desempenho de seus sistemas.

O3 quase não foi lançado no ChatGPT. O CEO da OpenAI, Sam Altman, indicou em fevereiro que a empresa pretendia dedicar mais recursos a uma alternativa sofisticada que incorporasse a tecnologia o3. Mas a pressão competitiva aparentemente fez a OpenAI mudar de ideia no final.

A OpenAI afirma que o3 alcança um desempenho de ponta no teste SWE-bench verificado (sem andaimes personalizados), um teste que mede habilidades de codificação, com uma pontuação de 69,1%. O modelo o4-mini alcança desempenho similar, com pontuação de 68,1%. O próximo melhor modelo da OpenAI, o3-mini, obteve 49,3% no teste, enquanto o Claude 3.7 Sonnet obteve 62,3%.

A OpenAI afirma que o3 e o4-mini são seus primeiros modelos que podem “pensar com imagens”. Na prática, os usuários podem enviar imagens para o ChatGPT, como esboços de quadros brancos ou diagramas de PDFs, e os modelos analisarão as imagens durante sua fase de “encadeamento de pensamento” antes de responderem. Graças a essa nova capacidade, o3 e o4-mini podem entender imagens borradas e de baixa qualidade e podem realizar tarefas como zoom ou rotação de imagens enquanto raciocinam.

Além das capacidades de processamento de imagens, o3 e o4-mini podem executar código Python diretamente em seu navegador por meio do recurso Canvas do ChatGPT e pesquisar na web ao serem questionados sobre eventos atuais.

Além do ChatGPT, os três modelos - o3, o4-mini e o4-mini-high - estarão disponíveis por meio dos endpoints voltados para desenvolvedores da OpenAI, a API de Completudes de Chat e a API de Respostas, permitindo que engenheiros construam aplicativos com os modelos da empresa a taxas baseadas no uso.

A OpenAI está cobrando dos desenvolvedores um preço relativamente baixo para o o3, dado seu aprimoramento de desempenho, a $10 por milhão de tokens de entrada (aproximadamente 750.000 palavras, mais do que a série O Senhor dos Anéis) e $40 por milhão de tokens de saída. Para o o4-mini, a OpenAI está cobrando o mesmo que o o3-mini, $1,10 por milhão de tokens de entrada e $4,40 por milhão de tokens de saída.

Nas próximas semanas, a OpenAI diz que planeja lançar o3-pro, uma versão do o3 que utiliza mais recursos computacionais para produzir suas respostas, exclusivamente para assinantes do ChatGPT Pro.

O CEO da OpenAI, Sam Altman, indicou que o3 e o4-mini podem ser seus últimos modelos de raciocínio de IA independentes no ChatGPT antes do GPT-5, um modelo que a empresa afirmou que unificará modelos tradicionais como o GPT-4.1 com seus modelos de raciocínio.