Gerson News
Posts
OpenAI lança o GPT-4.5 e Anthropic lança o Claude 3.7 Sonnet #06

OpenAI lança o GPT-4.5 e Anthropic lança o Claude 3.7 Sonnet #06

OpenAI lança GPT-4.5 e Anthropic Claude 3.7 Sonnet, Amazon lança Alexa+

Gerson Viergutz
3 de março de 2025 • Tempo de leitura: 6 minutos

Bem-vindo à edição nº 6 do Gerson News! Aqui você encontra as principais novidades, insights e dicas sobre dados e inteligência artificial. Boa leitura!

Na edição de hoje

OpenAI lança seu mais novo modelo GPT-4.5
Anthropic lança Claude 3.7 Sonnet que inclui capacidade de raciocínio
Amazon lança Alexa+
Notícias Curtas
Dicas de Ferramentas de IA
Dica de Prompt

OpenAI lança seu mais novo modelo GPT-4.5

Crédito: OpenAI

A OpenAI lançou no dia 27 de fevereiro o modelo de inteligência artificial GPT-4.5.

A OpenAI lançou o GPT-4.5 como uma "prévia", descrevendo-o como seu maior e melhor modelo de bate-papo. O novo modelo está inicialmente disponível para usuários e desenvolvedores do ChatGPT Pro, com os usuários Plus e Team ganhando acesso na próxima semana.

GPT-4.5 representa uma evolução do "aprendizado não supervisionado" em vez de seguir a abordagem de "raciocínio" da série o1. Enquanto modelos como o1 e o3-mini pensam antes de responder por meio do raciocínio, o GPT-4.5 responde diretamente como um modelo clássico de linguagem grande, alcançando suas melhorias de desempenho por meio do dimensionamento tradicional de pré-treinamento.

De acordo com a OpenAI, o GPT-4.5 (também conhecido como Orion) é o maior modelo da empresa até hoje e, de acordo com o pesquisador da OpenAI, Rapha Gontijo Lopes, a empresa "(provavelmente) treinou o maior modelo do mundo". Ao mesmo tempo, a empresa enfatiza que o GPT-4.5 não é um "modelo de fronteira". Isso provavelmente decorre do fato de que a empresa treinou o o3, um modelo que supera significativamente o GPT-4.5 em muitas áreas.

Em testes de benchmark, o GPT-4.5 mostra melhorias significativas em algumas áreas: No teste SimpleQA, ele atinge uma precisão de 62,5% em comparação com 38,2% para GPT-4o ou 43,6% para o Grok 3 lançado recentemente.

Crédito: OpenAI

A taxa de alucinação cai de 61,8% para 37,1%, superando o desempenho de o1 e o3-mini. Em MMMLU (multilíngue) e MMMU (multimodal), supera seus antecessores GPT-4o (81,5% e 69,1%) e o3-mini (81,1% e NN) com pontuações de 85,1% e 74,4%, respectivamente.

Em testes de avaliação humana, os testadores preferiram GPT-4.5 em vez de GPT-4o em todas as categorias: inteligência criativa (56,8%), questões profissionais (63,2%) e perguntas cotidianas (57,0%).

Anthropic lança Claude 3.7 Sonnet que inclui capacidade de raciocínio

Crédito: Anthropic

Dia 25/02 a Anthropic lançou um modelo híbrido Claude 3.7 Sonnet. É o melhor e mais inteligente modelo da empresa.

Segundo a empresa, essa é a primeira IA híbrida do setor, capaz de fornecer tanto respostas imediatas quanto análises mais detalhadas, dependendo da configuração escolhida.

“Assim como os humanos usam um único cérebro para respostas rápidas e reflexões profundas, acreditamos que o raciocínio deve ser uma capacidade integrada de modelos de vanguarda em vez de um modelo totalmente separado”, diz a companhia no comunicado de lançamento.

Os testes comparativos revelam saltos qualitativos:

Engenharia de Software: 70,3% de precisão no SWE-bench com scaffolds personalizados, superando concorrentes como OpenAI o3-mini (49,3%) e DeepSeek R1 (49,2%).

Automação de Fluxos de Trabalho: 81,2% de eficiência em tarefas de varejo no TAU-bench, contra 73,5% do principal concorrente.

Matemática e Física: Melhoria de 37% na resolução de problemas multivariáveis graças ao modo de raciocínio estruturado.

Crédito: Anthropic

Acompanhando o modelo, a Anthropic revelou o Claude Code, uma ferramenta em prévia que redefine a assistência em desenvolvimento de software:

Edição contextual de código via terminal
Geração automática de testes unitários
Integração direta com repositórios GitHub

"O Claude 3.7 não apenas sugere snippets, mas compreende arquiteturas completas", relata Jared Kaplan, cofundador da empresa.

Crédito: Anthropic

Amazon lança Alexa+

Crédito: Amazon

A Amazon lançou recentemente a Alexa+, uma versão aprimorada de sua assistente virtual com inteligência artificial generativa. Anunciada em 26 de fevereiro de 2025, a Alexa+ traz uma série de novos recursos e habilidades.

Principais características da Alexa+

A nova versão da assistente virtual da Amazon oferece:

Respostas mais detalhadas e personalizadas
Melhor compreensão das preferências do usuário
Conversas mais naturais e fluidas
Capacidade de agir em nome do usuário (planejamento de viagens, compras, envio de e-mails)
Recursos avançados de visão e análise de imagens
Melhor integração com dispositivos inteligentes

Funcionalidades aprimoradas

A Alexa+ agora pode realizar tarefas mais complexas, como:

Pesquisar disponibilidade de ingressos para shows
Efetuar reservas em restaurantes
Recomendar empresas locais
Criar rotinas mais elaboradas sem necessidade de aplicativo
Gerenciar calendários e agendar compromissos
Buscar informações específicas em documentos, e-mails e fotos compartilhados

Disponibilidade e preço

A Alexa+ será lançada inicialmente nos Estados Unidos nas próximas semanas, integrada aos dispositivos Echo Show 8, 10, 15 e 21. O serviço custará US$ 19,99 por mês (aproximadamente R$ 115 na cotação atual), mas será gratuito para assinantes do Amazon Prime.

Notícias Rápidas

Microsoft lança SLM Phi-4: A Microsoft anunciou o lançamento do Phi-4-multimodal e do Phi-4-mini, as mais recentes adições à sua família Phi de modelos de linguagem pequena (SLMs). Esses modelos são projetados para capacitar os desenvolvedores com recursos avançados de IA em várias modalidades, incluindo fala, visão e texto.
O Phi-4-multimodal é o primeiro modelo de linguagem multimodal da Microsoft, capaz de processar fala, visão e texto simultaneamente em uma arquitetura única e unificada, permitindo interações mais naturais e sensíveis ao contexto.
O Phi-4-mini supera modelos maiores em tarefas baseadas em texto, incluindo raciocínio, matemática, codificação, acompanhamento de instruções e chamada de função, apesar de seu tamanho compacto de 3,8 bilhões de parâmetros.
ElevenLabs lança Scribe STT: A ElevenLabs lançou seu primeiro modelo autônomo de fala para texto chamado Scribe, que visa competir com os principais players no espaço de reconhecimento de fala.
O modelo possui alta precisão em muitos idiomas e recursos avançados, como diarização do alto-falante.
O Scribe oferece suporte a 99+ idiomas, com 25 na categoria "excelente precisão" (< taxa de erro de palavras de 5%), incluindo inglês com 97% de precisão.
Alibaba lança novo modelo de vídeo Wan2.1: O novo modelo de vídeo de código aberto do Alibaba ocupa o primeiro lugar do VLM: O Wan2.1 da gigante chinesa de comércio eletrônico acaba de varrer a concorrência no VBench, líder do setor, que mede coisas como suavidade de movimento, renderização de texto e precisão física.
Ele supera rivais como Sora da OpenAI, MiniMax da Hailuo e Dream Machine da Luma.
Além disso, seu código e pesos estão disponíveis publicamente, permitindo que os programadores criem seus próprios spinoffs - algo que é raro para modelos desse calibre.
Google apresenta assistente de codificação de IA gratuito com altos limites de uso: Essa ferramenta gratuita de IA permite que os desenvolvedores usem uma janela de bate-papo para falar em linguagem natural com um modelo de IA do Google que pode acessar e editar sua base de código.
Ele pode corrigir bugs, completar seções de código ou explicar partes da base de código que não fazem sentido.
Ele é alimentado pelo modelo Gemini 2.0 AI do Google, ajustado para codificação com uma janela de contexto de 128.000 tokens, permitindo lidar com bases de código maiores e mais complexas, e oferece 180.000 conclusões de código por mês - 90 vezes mais do que o plano gratuito do GitHub Copilot - juntamente com 240 solicitações diárias de bate-papo.

Dicas de Ferramentas de IA

Crédito: Adobe

O Adobe Podcast é uma ferramenta inovadora desenvolvida pela Adobe, projetada para simplificar o processo de gravação, edição e produção de podcasts. Com uma interface intuitiva e recursos avançados impulsionados por inteligência artificial (IA), essa plataforma se destaca como uma solução ideal para criadores de conteúdo de todos os níveis.

Recursos Principais

Enhance Speech: Utiliza IA para remover ruídos de fundo e melhorar a clareza das vozes automaticamente, garantindo que as gravações sejam claras e profissionais.

Edição Baseada em Texto: Permite editar áudio usando transcrições, facilitando a modificação do conteúdo como se fosse um documento.

Gravação Remota: Oferece a possibilidade de gravar com convidados à distância, mantendo a qualidade profissional.

Integração com Adobe Creative Cloud: Permite incorporar facilmente trilhas sonoras do Adobe Audition e imagens do Photoshop e Illustrator para complementar a produção do podcast.

Vantagens

Facilidade de Uso: A interface intuitiva facilita o fluxo de trabalho, tornando o processo de edição acessível tanto para iniciantes quanto para profissionais.

Melhoria da Qualidade do Áudio: Ferramentas como equalização e compressão ajudam a melhorar significativamente a qualidade sonora dos episódios.

Integração com Outras Ferramentas Adobe: Permite um fluxo de trabalho completo ao integrar-se com outras soluções da Adobe.

Dica de Prompt

"Aja como um parceiro de brainstorming. Preciso de ideias únicas para [tipo de artigo, por exemplo, lista, artigo de opinião] sobre [tópico]. Ajude-me a delinear 3-5 ângulos envolventes para abordá-lo, considerando o que os leitores podem achar mais valioso."

Cursos e Eventos

Curso Presencial de Microsoft Fabric: O melhor treinamento de Microsoft Fabric agora está na versão presencial. Depois de sucesso de 3 turmas online, formando mais de 150 profissionais, vai desembarcar em São Paulo. Você será mentorado por 2 profissionais MVP Microsoft. Vagas Limitadas.

Imersão Presencial de Power BI na era da IA Generativa: Depois do Sucesso das duas edições anteriores, dias 26 e 27 de abril, irá acontecer a 3ª edição do evento em São Paulo.

O que achou desta edição?

Faça Login ou Inscrever-se para participar de pesquisas.

Grande Abraço

Gerson Viergutz

Reply

or to participate.