• Gerson News
  • Posts
  • OpenAI lança o GPT-4.5 e Anthropic lança o Claude 3.7 Sonnet #06

OpenAI lança o GPT-4.5 e Anthropic lança o Claude 3.7 Sonnet #06

OpenAI lança GPT-4.5 e Anthropic Claude 3.7 Sonnet, Amazon lança Alexa+

Bem-vindo à edição nº 6 do Gerson News! Aqui você encontra as principais novidades, insights e dicas sobre dados e inteligência artificial. Boa leitura!

OpenAI lança seu mais novo modelo GPT-4.5

Crédito: OpenAI

A OpenAI lançou no dia 27 de fevereiro o modelo de inteligência artificial GPT-4.5.

A OpenAI lançou o GPT-4.5 como uma "prévia", descrevendo-o como seu maior e melhor modelo de bate-papo. O novo modelo está inicialmente disponível para usuários e desenvolvedores do ChatGPT Pro, com os usuários Plus e Team ganhando acesso na próxima semana.

GPT-4.5 representa uma evolução do "aprendizado não supervisionado" em vez de seguir a abordagem de "raciocínio" da série o1. Enquanto modelos como o1 e o3-mini pensam antes de responder por meio do raciocínio, o GPT-4.5 responde diretamente como um modelo clássico de linguagem grande, alcançando suas melhorias de desempenho por meio do dimensionamento tradicional de pré-treinamento.

De acordo com a OpenAI, o GPT-4.5 (também conhecido como Orion) é o maior modelo da empresa até hoje e, de acordo com o pesquisador da OpenAI, Rapha Gontijo Lopes, a empresa "(provavelmente) treinou o maior modelo do mundo". Ao mesmo tempo, a empresa enfatiza que o GPT-4.5 não é um "modelo de fronteira". Isso provavelmente decorre do fato de que a empresa treinou o o3, um modelo que supera significativamente o GPT-4.5 em muitas áreas.

Em testes de benchmark, o GPT-4.5 mostra melhorias significativas em algumas áreas: No teste SimpleQA, ele atinge uma precisão de 62,5% em comparação com 38,2% para GPT-4o ou 43,6% para o Grok 3 lançado recentemente.

Crédito: OpenAI

A taxa de alucinação cai de 61,8% para 37,1%, superando o desempenho de o1 e o3-mini. Em MMMLU (multilíngue) e MMMU (multimodal), supera seus antecessores GPT-4o (81,5% e 69,1%) e o3-mini (81,1% e NN) com pontuações de 85,1% e 74,4%, respectivamente.

Em testes de avaliação humana, os testadores preferiram GPT-4.5 em vez de GPT-4o em todas as categorias: inteligência criativa (56,8%), questões profissionais (63,2%) e perguntas cotidianas (57,0%).

Anthropic lança Claude 3.7 Sonnet que inclui capacidade de raciocínio

Crédito: Anthropic

Dia 25/02 a Anthropic lançou um modelo híbrido Claude 3.7 Sonnet. É o melhor e mais inteligente modelo da empresa.

Segundo a empresa, essa é a primeira IA híbrida do setor, capaz de fornecer tanto respostas imediatas quanto análises mais detalhadas, dependendo da configuração escolhida.

“Assim como os humanos usam um único cérebro para respostas rápidas e reflexões profundas, acreditamos que o raciocínio deve ser uma capacidade integrada de modelos de vanguarda em vez de um modelo totalmente separado”, diz a companhia no comunicado de lançamento.

Os testes comparativos revelam saltos qualitativos:

Engenharia de Software: 70,3% de precisão no SWE-bench com scaffolds personalizados, superando concorrentes como OpenAI o3-mini (49,3%) e DeepSeek R1 (49,2%).

Automação de Fluxos de Trabalho: 81,2% de eficiência em tarefas de varejo no TAU-bench, contra 73,5% do principal concorrente.

Matemática e Física: Melhoria de 37% na resolução de problemas multivariáveis graças ao modo de raciocínio estruturado.

Crédito: Anthropic

Acompanhando o modelo, a Anthropic revelou o Claude Code, uma ferramenta em prévia que redefine a assistência em desenvolvimento de software:

  • Edição contextual de código via terminal

  • Geração automática de testes unitários

  • Integração direta com repositórios GitHub

"O Claude 3.7 não apenas sugere snippets, mas compreende arquiteturas completas", relata Jared Kaplan, cofundador da empresa.

Crédito: Anthropic

Amazon lança Alexa+

Crédito: Amazon

A Amazon lançou recentemente a Alexa+, uma versão aprimorada de sua assistente virtual com inteligência artificial generativa. Anunciada em 26 de fevereiro de 2025, a Alexa+ traz uma série de novos recursos e habilidades.

Principais características da Alexa+

A nova versão da assistente virtual da Amazon oferece:

  • Respostas mais detalhadas e personalizadas

  • Melhor compreensão das preferências do usuário

  • Conversas mais naturais e fluidas

  • Capacidade de agir em nome do usuário (planejamento de viagens, compras, envio de e-mails)

  • Recursos avançados de visão e análise de imagens

  • Melhor integração com dispositivos inteligentes

Funcionalidades aprimoradas

A Alexa+ agora pode realizar tarefas mais complexas, como:

  • Pesquisar disponibilidade de ingressos para shows

  • Efetuar reservas em restaurantes

  • Recomendar empresas locais

  • Criar rotinas mais elaboradas sem necessidade de aplicativo

  • Gerenciar calendários e agendar compromissos

  • Buscar informações específicas em documentos, e-mails e fotos compartilhados

Disponibilidade e preço

A Alexa+ será lançada inicialmente nos Estados Unidos nas próximas semanas, integrada aos dispositivos Echo Show 8, 10, 15 e 21. O serviço custará US$ 19,99 por mês (aproximadamente R$ 115 na cotação atual), mas será gratuito para assinantes do Amazon Prime.

Notícias Rápidas

  • Microsoft lança SLM Phi-4: A Microsoft anunciou o lançamento do Phi-4-multimodal e do Phi-4-mini, as mais recentes adições à sua família Phi de modelos de linguagem pequena (SLMs). Esses modelos são projetados para capacitar os desenvolvedores com recursos avançados de IA em várias modalidades, incluindo fala, visão e texto.

    O Phi-4-multimodal é o primeiro modelo de linguagem multimodal da Microsoft, capaz de processar fala, visão e texto simultaneamente em uma arquitetura única e unificada, permitindo interações mais naturais e sensíveis ao contexto.

    O Phi-4-mini supera modelos maiores em tarefas baseadas em texto, incluindo raciocínio, matemática, codificação, acompanhamento de instruções e chamada de função, apesar de seu tamanho compacto de 3,8 bilhões de parâmetros.

  • ElevenLabs lança Scribe STT: A ElevenLabs lançou seu primeiro modelo autônomo de fala para texto chamado Scribe, que visa competir com os principais players no espaço de reconhecimento de fala.

    O modelo possui alta precisão em muitos idiomas e recursos avançados, como diarização do alto-falante.

    O Scribe oferece suporte a 99+ idiomas, com 25 na categoria "excelente precisão" (< taxa de erro de palavras de 5%), incluindo inglês com 97% de precisão.

  • Alibaba lança novo modelo de vídeo Wan2.1: O novo modelo de vídeo de código aberto do Alibaba ocupa o primeiro lugar do VLM: O Wan2.1 da gigante chinesa de comércio eletrônico acaba de varrer a concorrência no VBench, líder do setor, que mede coisas como suavidade de movimento, renderização de texto e precisão física.

    Ele supera rivais como Sora da OpenAI, MiniMax da Hailuo e Dream Machine da Luma.

    Além disso, seu código e pesos estão disponíveis publicamente, permitindo que os programadores criem seus próprios spinoffs - algo que é raro para modelos desse calibre.

  • Google apresenta assistente de codificação de IA gratuito com altos limites de uso: Essa ferramenta gratuita de IA permite que os desenvolvedores usem uma janela de bate-papo para falar em linguagem natural com um modelo de IA do Google que pode acessar e editar sua base de código.

    Ele pode corrigir bugs, completar seções de código ou explicar partes da base de código que não fazem sentido.

    Ele é alimentado pelo modelo Gemini 2.0 AI do Google, ajustado para codificação com uma janela de contexto de 128.000 tokens, permitindo lidar com bases de código maiores e mais complexas, e oferece 180.000 conclusões de código por mês - 90 vezes mais do que o plano gratuito do GitHub Copilot - juntamente com 240 solicitações diárias de bate-papo.

Dicas de Ferramentas de IA

Crédito: Adobe

O Adobe Podcast é uma ferramenta inovadora desenvolvida pela Adobe, projetada para simplificar o processo de gravação, edição e produção de podcasts. Com uma interface intuitiva e recursos avançados impulsionados por inteligência artificial (IA), essa plataforma se destaca como uma solução ideal para criadores de conteúdo de todos os níveis.

Recursos Principais

Enhance Speech: Utiliza IA para remover ruídos de fundo e melhorar a clareza das vozes automaticamente, garantindo que as gravações sejam claras e profissionais.

Edição Baseada em Texto: Permite editar áudio usando transcrições, facilitando a modificação do conteúdo como se fosse um documento.

Gravação Remota: Oferece a possibilidade de gravar com convidados à distância, mantendo a qualidade profissional.

Integração com Adobe Creative Cloud: Permite incorporar facilmente trilhas sonoras do Adobe Audition e imagens do Photoshop e Illustrator para complementar a produção do podcast.

Vantagens

Facilidade de Uso: A interface intuitiva facilita o fluxo de trabalho, tornando o processo de edição acessível tanto para iniciantes quanto para profissionais.

Melhoria da Qualidade do Áudio: Ferramentas como equalização e compressão ajudam a melhorar significativamente a qualidade sonora dos episódios.

Integração com Outras Ferramentas Adobe: Permite um fluxo de trabalho completo ao integrar-se com outras soluções da Adobe.

Dica de Prompt

"Aja como um parceiro de brainstorming. Preciso de ideias únicas para [tipo de artigo, por exemplo, lista, artigo de opinião] sobre [tópico]. Ajude-me a delinear 3-5 ângulos envolventes para abordá-lo, considerando o que os leitores podem achar mais valioso."

Cursos e Eventos

Curso Presencial de Microsoft Fabric: O melhor treinamento de Microsoft Fabric agora está na versão presencial. Depois de sucesso de 3 turmas online, formando mais de 150 profissionais, vai desembarcar em São Paulo. Você será mentorado por 2 profissionais MVP Microsoft. Vagas Limitadas.

Imersão Presencial de Power BI na era da IA Generativa: Depois do Sucesso das duas edições anteriores, dias 26 e 27 de abril, irá acontecer a 3ª edição do evento em São Paulo.

O que achou desta edição?

Faça Login ou Inscrever-se para participar de pesquisas.

Grande Abraço

Gerson Viergutz

Reply

or to participate.