
A Anthropic, um dos maiores fornecedores de IA do mundo, possui uma poderosa família de modelos de IA generativa chamada Claude. Esses modelos podem executar uma variedade de tarefas, desde legendas de imagens e redação de e-mails até resolver desafios matemáticos e de codificação.
Com o ecossistema de modelos da Anthropic crescendo tão rapidamente, pode ser difícil acompanhar quais modelos de Claude fazem o quê. Para ajudar, reunimos um guia sobre Claude, que manteremos atualizado à medida que novos modelos e atualizações forem lançados.
Modelos Claude
Os modelos Claude recebem nomes de obras literárias de arte: Haiku, Sonnet e Opus. Os mais recentes são:
- Claude 3.5 Haiku, um modelo leve.
- Claude 3.7 Sonnet, um modelo híbrido de raciocínio de médio alcance. Este é atualmente o modelo de IA principal da Anthropic.
- Claude 3 Opus, um modelo grande.
Contraintuitivamente, Claude 3 Opus — o modelo mais caro e maior que a Anthropic oferece — é o modelo Claude menos capaz no momento. No entanto, isso certamente mudará quando a Anthropic lançar uma versão atualizada do Opus.
Recentemente, a Anthropic lançou Claude 3.7 Sonnet, seu modelo mais avançado até o momento. Este modelo de IA é diferente do Claude 3.5 Haiku e do Claude 3 Opus, porque é um modelo de raciocínio de IA híbrido, que pode fornecer respostas em tempo real e respostas mais consideradas e 'pensadas' a perguntas.
Ao usar Claude 3.7 Sonnet, os usuários podem escolher se ativam as habilidades de raciocínio do modelo de IA, o que faz com que o modelo 'pense' por um curto ou longo período de tempo.
Quando o raciocínio é ativado, Claude 3.7 Sonnet passará de alguns segundos a alguns minutos em uma fase de 'pensamento' antes de responder. Durante esta fase, o modelo de IA está dividindo a solicitação do usuário em partes menores e verificando suas respostas.
O Claude 3.7 Sonnet é o primeiro modelo de IA da Anthropic que pode 'raciocinar', uma técnica que muitos laboratórios de IA recorreram à medida que os métodos tradicionais de melhoria de desempenho da IA diminuem.
Mesmo com seu raciocínio desativado, o Claude 3.7 Sonnet continua sendo um dos melhores modelos de IA da indústria de tecnologia.
Em novembro, a Anthropic lançou uma versão aprimorada — e mais cara — de seu modelo de IA leve, o Claude 3.5 Haiku. Este modelo supera o Claude 3 Opus da Anthropic em vários benchmarks, mas não pode analisar imagens como o Claude 3 Opus ou o Claude 3.7 Sonnet podem.
Todos os modelos Claude — que possuem uma janela de contexto padrão de 200.000 tokens — também podem seguir instruções em várias etapas, usar ferramentas (por exemplo, rastreadores de ticker de ações) e produzir saídas estruturadas em formatos como JSON.
Uma janela de contexto é a quantidade de dados que um modelo como o Claude pode analisar antes de gerar novos dados, enquanto os tokens são bits subdivididos de dados brutos (como as sílabas 'fã', 'tas' e 'tic' na palavra 'fantástico'). Duzentos mil tokens equivalem aproximadamente a 150.000 palavras, ou um romance de 600 páginas.
Diferentemente de muitos modelos principais de IA generativa, os da Anthropic não podem acessar a internet, o que significa que não são particularmente bons em responder perguntas sobre eventos atuais. Eles também não podem gerar imagens — apenas diagramas de linhas simples.
Quanto às principais diferenças entre os modelos Claude, o Claude 3.7 Sonnet é mais rápido que o Claude 3 Opus e entende melhor instruções sutis e complexas. O Haiku tem dificuldade com solicitações sofisticadas, mas é o mais rápido dos três modelos.
Preços dos modelos Claude
Os modelos Claude estão disponíveis por meio da API da Anthropic e de plataformas gerenciadas como Amazon Bedrock e Google Cloud's Vertex AI.
Veja os preços da API da Anthropic:
- O Claude 3.5 Haiku custa 80 centavos por milhão de tokens de entrada (~750.000 palavras), ou $4 por milhão de tokens de saída
- O Claude 3.7 Sonnet custa $3 por milhão de tokens de entrada, ou $15 por milhão de tokens de saída
- O Claude 3 Opus custa $15 por milhão de tokens de entrada, ou $75 por milhão de tokens de saída
A Anthropic oferece armazenamento em cache de prompt e em lotes para obter economia adicional de tempo de execução.
O armazenamento em cache de prompt permite que os desenvolvedores armazenem 'contextos de prompt' específicos que podem ser reutilizados em chamadas de API para um modelo, enquanto os lotes processam grupos assíncronos de solicitações de inferência de modelo de baixa prioridade (e, consequentemente, mais baratas).
Planos e aplicativos Claude
Para usuários individuais e empresas que desejam simplesmente interagir com os modelos Claude por meio de aplicativos para web, Android e iOS, a Anthropic oferece um plano gratuito Claude com limites de taxa e outras restrições de uso.
Atualizando para uma das assinaturas da empresa remove esses limites e desbloqueia novas funcionalidades. Os planos atuais são:
- Claude Pro.
- Claude Team, para pequenas empresas
- Claude Enterprise, para empresas maiores
O Claude Pro, que custa $20 por mês, vem com limites de taxa 5x maiores, acesso prioritário e prévias de recursos futuros.
Sendo focado em negócios, o Team — que custa $30 por usuário por mês — adiciona um painel de controle para controlar faturamento e gerenciamento de usuários e integrações com repositórios de dados como bases de código e plataformas de gerenciamento de relacionamento com o cliente (por exemplo, Salesforce). Um interruptor permite habilitar ou desabilitar citações para verificar reivindicações geradas pela IA. (Como todos os modelos, o Claude pode ter alucinações de tempos em tempos.)
Tanto os assinantes do Pro quanto do Team recebem Projetos, um recurso que fundamenta as saídas do Claude em bases de conhecimento, que podem ser guias de estilo, transcrições de entrevistas, e assim por diante. Esses clientes, juntamente com os usuários de nível gratuito, também podem acessar Artefatos, um espaço de trabalho onde os usuários podem editar e adicionar conteúdo como código, aplicativos, designs de site e outros documentos gerados pelo Claude.
Para clientes que precisam de ainda mais, há o Claude Enterprise, que permite que empresas façam upload de dados proprietários no Claude para que o Claude possa analisar as informações e responder a perguntas sobre elas. O Claude Enterprise também vem com uma janela de contexto maior (500.000 tokens), integração do GitHub para equipes de engenharia sincronizarem seus repositórios do GitHub com o Claude, e Projetos e Artefatos.
Uma palavra de cautela
Como é o caso de todos os modelos de IA generativa, há riscos associados ao uso do Claude.
Os modelos ocasionalmente cometem erros ao resumir ou responder perguntas devido à sua tendência a alucinar. Eles também são treinados em dados web públicos, parte dos quais podem estar protegidos por direitos autorais ou sob uma licença restritiva. A Anthropic e muitos outros fornecedores de IA argumentam que a doutrina de uso justo os protege de reivindicações de direitos autorais. Mas isso não impediu que os proprietários de dados entrassem com ações judiciais.
A Anthropic oferece políticas para proteger certos clientes de batalhas judiciais decorrentes de desafios de uso justo. No entanto, eles não resolvem o dilema ético de usar modelos treinados em dados sem permissão.
Este artigo foi publicado originalmente em 19 de outubro de 2024. Foi atualizado em 25 de fevereiro de 2025 para incluir novos detalhes sobre o Claude 3.7 Sonnet e o Claude 3.5 Haiku.