Gerson News
Posts
Gemma 3: O Novo Modelo de IA Aberto do Google #08

Gemma 3: O Novo Modelo de IA Aberto do Google #08

Google lança modelo Gemma 3, Baidu lança Ernie 4.5 e Ernie X1

Gerson Viergutz
17 de março de 2025 • Tempo de leitura: 8 minutos

Bem-vindo à edição nr 8 do Gerson News! Aqui você encontrará as principais novidades, insights e dicas sobre dados e inteligência artificial. Aproveite a leitura!

Na edição de hoje

Google lança o modelo Gemma 3 e supera rivais
OpenAI lança SDK Agentes para facilitar a criação de agentes
Nova chinesa entra na corrida da IA. Baidu lança Ernie 4.5 e Ernie X1
Notícias Curtas
Dicas de Ferramentas de IA
Dica de Prompt

Google lança o modelo Gemma 3 e supera rivais

Crédito: Blog Google

O Gemma 3 é um modelo de IA aberto lançado pelo Google, projetado para ser executado em uma única GPU ou TPU, tornando-o acessível para desenvolvedores. Ele é multimodal, processando texto, imagens e vídeos, com uma janela de contexto de até 128k tokens, ideal para lidar com grandes volumes de dados. Está disponível em tamanhos de 1B, 4B, 12B e 27B parâmetros, com versões pré-treinadas e ajustadas para instruções, permitindo personalização.

Construído a partir da mesma pesquisa e tecnologia que alimenta os modelos Gemini 2.0, o Gemma 3 foi projetado para funcionar eficientemente em diversos dispositivos, desde smartphones e laptops até estações de trabalho, oferecendo aos desenvolvedores novas possibilidades para criar aplicações de IA avançadas e acessíveis.

Características e Capacidades do Gemma 3

O Gemma 3 se destaca por seu desempenho excepcional, superando concorrentes como Llama-405B, DeepSeek-V3 e o3-mini em avaliações preliminares de preferência humana no ranking LMArena. Este modelo traz avanços significativos em diversas áreas, começando por uma janela de contexto expandida para 128 mil tokens, permitindo que as aplicações processem e compreendam grandes volumes de informação.

Este gráfico classifica os modelos de IA pelas pontuações do Chatbot Arena Elo; pontuações mais altas (números principais) indicam maior preferência do usuário. Os pontos mostram os requisitos estimados da GPU NVIDIA H100. Gemma 3 27B tem uma classificação alta, exigindo apenas uma única GPU, apesar de outras precisarem de até 32.

A tabela abaixo resume os tamanhos e capacidades principais:

Tamanho do Modelo	Tokens de Treinamento	Características Notáveis
1B	2T	Text-only, leve para dispositivos limitados
4B	4T	Suporte a visão, ideal para aplicações móveis
12B	12T	Alta performance, multimodality avançada
27B	14T	Topo de linha, pontuação Elo de 1.338 no LMArena

O Gemma 3 representa um avanço significativo no campo da inteligência artificial aberta, combinando desempenho excepcional com acessibilidade e versatilidade. Com sua capacidade multimodal, amplo suporte a idiomas, eficiência computacional e foco na segurança, este novo modelo do Google está posicionado para impulsionar a próxima geração de aplicações de IA.

Para desenvolvedores, acadêmicos e entusiastas de tecnologia, o Gemma 3 oferece uma oportunidade única de explorar e criar com uma ferramenta de IA avançada sem as limitações tradicionais de modelos proprietários. Com mais de 100 milhões de downloads dos modelos Gemma anteriores e mais de 60.000 variantes criadas pela comunidade, o ecossistema "Gemmaverse" continua a crescer e inspirar inovações em diversos campos.

À medida que o modelo se torna mais amplamente adotado, podemos esperar ver novas aplicações criativas e soluções inovadoras emergindo da comunidade global de desenvolvedores, demonstrando o potencial transformador da IA aberta e acessível.

OpenAI lança SDK Agentes para facilitar a criação de agentes

Crédito: OpenAI

A OpenAI anunciou recentemente o lançamento de um conjunto de ferramentas destinadas a simplificar o desenvolvimento de agentes de IA. Este pacote inclui o Agents SDK (Kit de Desenvolvimento de Software para Agentes) e a API Responses, tecnologias que prometem revolucionar a forma como desenvolvedores e empresas criam e implementam sistemas autônomos de IA. Lançadas em março de 2025, estas ferramentas representam um avanço significativo na democratização da tecnologia de agentes de IA, permitindo que organizações de todos os portes desenvolvam soluções personalizadas para automatizar tarefas complexas.

As Principais Ferramentas do Lançamento

API Responses: A Nova Base para Agentes de IA

A API Responses é apresentada como uma evolução das APIs anteriores da OpenAI, combinando a simplicidade da API de Completions de Chat com os recursos de uso de ferramentas da API Assistants. Esta nova interface permite que desenvolvedores criem agentes capazes de realizar tarefas complexas utilizando múltiplas ferramentas e interações com o modelo com uma única chamada à API.

Entre as características mais relevantes da API Responses estão:

Ferramentas integradas para pesquisa na web e em arquivos
Capacidade de usar o computador para automatizar tarefas no sistema operacional
Função de armazenamento de dados na OpenAI, facilitando a avaliação do desempenho do agente

A OpenAI planeja substituir a API Assistants pela Responses API até meados de 2026, oferecendo migração de dados para desenvolvedores durante a transição. Esta nova API incorpora melhorias baseadas no feedback de usuários da versão anterior, tornando-a mais robusta e versátil.

Agents SDK: Orquestrando Fluxos de Trabalho Multi-Agentes

O Agents SDK é uma ferramenta de código aberto projetada para simplificar a orquestração de cargas de trabalho que envolvem múltiplos agentes. Este SDK representa uma evolução significativa em relação ao Swarm, um kit experimental lançado anteriormente pela OpenAI.

O SDK oferece recursos importantes como:

Configuração simplificada de modelos de linguagem (LLMs) com instruções claras
"Handoffs" inteligentes que permitem a transferência otimizada de controle entre agentes
"Guardrails" configuráveis que funcionam como verificações de segurança para garantir a integridade do sistema
Ferramentas de observabilidade para rastrear e inspecionar a execução do fluxo de trabalho dos agentes

A tecnologia é compatível com a API Responses e a Chat Completions API, permitindo fácil integração em projetos existentes, e também funciona com modelos de outros provedores, desde que ofereçam um endpoint de API no estilo Chat Completions.

Aplicações Práticas e Casos de Uso

Automatização de Suporte ao Cliente

Agentes especializados podem ser configurados para responder a consultas comuns, criando um sistema de atendimento mais eficiente e disponível 24 horas.

Pesquisa Avançada e Análise de Dados

A capacidade de buscar informações na web e em arquivos internos permite a criação de agentes que compilam e analisam grandes volumes de dados, gerando insights valiosos.

Automação de Tarefas Computacionais

Os agentes podem assumir o controle do computador para realizar tarefas repetitivas, como navegação em sites e entrada de dados, liberando tempo para atividades de maior valor.

Casos de Sucesso Iniciais

Algumas empresas já começaram a utilizar estas novas ferramentas com resultados promissores:

Coinbase: Desenvolveu o AgentKit, que permite que agentes de IA interajam com carteiras de criptomoedas e realizem atividades na blockchain.
Box: Criou agentes que permitem a empresas pesquisar e extrair insights de dados não estruturados armazenados em seus sistemas, em conformidade com políticas de segurança e permissões internas.

A OpenAI reconhece que estas ferramentas ainda estão em estágios iniciais de desenvolvimento. A empresa admite que sua tecnologia "ainda não é altamente confiável para automatizar tarefas em sistemas operacionais" e pode cometer erros "inadvertidos". Este reconhecimento indica um compromisso com a transparência e a melhoria contínua.

A OpenAI acredita que os agentes de IA se tornarão parte integral da força de trabalho, aumentando significativamente a produtividade em diversos setores. Para concretizar esta visão, a empresa está investindo no desenvolvimento de integrações mais profundas em suas APIs e novas ferramentas para otimizar o desempenho dos agentes em produção.

Nas próximas semanas e meses, a OpenAI planeja lançar ferramentas e recursos adicionais para simplificar e acelerar ainda mais a criação de aplicações baseadas em agentes em sua plataforma.

Nova empresa chinesa entra na corrida da IA. Baidu lança Ernie 4.5 e Ernie X1

Crédito: Radartasik

A gigante chinesa de tecnologia Baidu anunciou em 16 de março de 2025 o lançamento de dois novos modelos de inteligência artificial: o Ernie 4.5 e o Ernie X1. O Ernie 4.5 representa um salto significativo na tecnologia de IA multimodal, combinando alta performance com custo reduzido, posicionando-se como um forte concorrente ao GPT-4.5 da OpenAI. Este modelo chega ao mercado em um momento de acirrada competição no setor de inteligência artificial, especialmente após recentes lançamentos de empresas como a DeepSeek.

Acesse o chat aqui: Wen Xin disse

Recursos e Capacidades do Ernie 4.5

O Ernie 4.5 é descrito como o melhor modelo da Baidu até o momento, com melhorias significativas em capacidades de raciocínio e multimodalidade nativa. Isso significa que ele pode processar eficientemente texto, vídeo, imagens e áudio de forma integrada. Uma característica inesperada é sua alta capacidade emocional (EQ), que permite entender contextos complexos, como memes e sátiras, conforme destacado em Tech Crunch. Além disso, oferece preços competitivos, com tarifas de entrada a partir de RMB 0,004 e saída a partir de RMB 0,016 por mil tokens, tornando-o acessível para usuários e desenvolvedores.

Impacto e Estratégia da Baidu

Com o lançamento, a Baidu tornou o Ernie Bot, seu chatbot baseado nesses modelos, gratuito para o público, uma decisão que parece destinada a aumentar a adoção e a penetração no mercado. Isso ocorre em um contexto de competição acirrada, especialmente com a ascensão de startups como a DeepSeek, cujo modelo R1 é rivalizado pelo Ernie X1, oferecido a metade do preço, segundo aibase.com. Essa estratégia reflete a pressão para manter a relevância em um setor em rápida evolução.

Olhando para frente, a Baidu planeja tornar a série Ernie 4.5 de código aberto a partir de 30 de junho de 2025, demonstrando um compromisso com o desenvolvimento colaborativo e a inovação na comunidade de IA. Essa mudança pode fomentar maior colaboração, mas também levanta questões sobre como isso afetará a competitividade no longo prazo.

Veja o resultado dos testes abaixo:

Notícias Rápidas

O Gemini agora pode se conectar ao seu histórico de pesquisa do Google: O assistente Gemini AI do Google agora pode usar os históricos de pesquisa dos usuários para fornecer respostas mais personalizadas e relevantes.
Detalhes:
- O recurso é alimentado pelo modelo Gemini 2.0 Flash Thinking Experimental e só fará referência aos resultados da pesquisa se a IA determinar que é "útil" após analisar sua consulta.
Por exemplo, se você pedir recomendações de restaurantes à Gemini, ela consultará seu histórico de pesquisa relacionado a alimentos para fornecer sugestões relevantes.
- Os usuários podem desativar o recurso a qualquer momento e receberão transparência sobre como seu histórico de pesquisa está sendo usado.
- Os assinantes do Gemini e do Gemini Advanced na web podem ativar o recurso selecionando "Personalização (experimental)" e ele está sendo implementado gradualmente no celular.
- Outra mudança significativa é que os usuários gratuitos agora podem criar seus próprios Gems e acessar o recurso Deep Research.
O Google está aproveitando seus recursos de pesquisa - sua maior vantagem competitiva - para fazer o Gemini se destacar como o assistente de IA mais personalizado. A empresa também planeja conectar o Gemini a outros aplicativos como YouTube e Google Fotos, permitindo que ele "forneça insights mais personalizados, com base em uma compreensão mais ampla de suas atividades e preferências".
Xbox anuncia novo assistente de IA para jogadores: "Copilot for Gaming": O Xbox está apresentando o "Copilot for Gaming", um assistente com inteligência artificial projetado para aprimorar a experiência de jogo como o "melhor companheiro de jogo".
- Este companheiro ativado por voz oferece dicas em tempo real, conselhos sobre jogos, lembretes e até mesmo algumas conversas divertidas para tornar sua experiência de jogo mais interativa e divertida.
- O assistente também pode notificá-lo quando seus amigos estiverem online e perguntar se você deseja entrar em um jogo com eles ou se adaptar ao seu estilo solo se ninguém estiver online.
- O Xbox fez parceria com estúdios de jogos para garantir que as respostas da IA sejam precisas, pois as informações encontradas na Internet às vezes podem ser enganosas ou desatualizadas.
Atualmente, o Copilot for Gaming está disponível apenas por meio do aplicativo móvel Xbox, aparecendo como uma segunda tela enquanto você joga. O Xbox planeja melhorar o recurso com base no feedback do usuário.

Dicas de Ferramentas de IA

Experimente acesso ilimitado à conversão de texto em fala de qualidade premium. A plataforma oferece síntese de voz de alta fidelidade para todas as suas necessidades criativas e profissionais. Com o Speechma, você pode transformar sem esforço qualquer texto – artigos, scripts, apresentações e até código – em áudio de alta qualidade e som natural. Selecionamos meticulosamente uma vasta biblioteca de mais de 400+ vozes de alta fidelidade, cada uma com personalidades e sotaques únicos, permitindo que você encontre a voz perfeita para qualquer projeto. Se você precisa de um narrador caloroso e amigável para um audiolivro, uma narração profissional para um vídeo corporativo ou um tom envolvente para uma apresentação educacional, o Speechma tem o que você precisa. Entendemos que a flexibilidade é fundamental. É por isso que projetamos nossa plataforma para ser totalmente gratuita para uso ilimitado, permitindo que você explore seus recursos sem quaisquer restrições. Além disso, concedemos a você a liberdade de usar o Speechma para qualquer finalidade, desde projetos pessoais até aplicativos comerciais, dando a você o poder de liberar sua criatividade e atingir seus objetivos. Experimente a diferença da Speechma hoje e descubra o poder transformador de suas palavras.

Acesse em: SPEECHMA - Best Free Text to Speech Online | Unlimited AI Voices | Commercial Use TTS 2024

Dica de Prompt

"Quero melhorar minhas habilidades de tomada de decisão. Forneça um plano de aprendizado de 30 dias que me ajude a tomar decisões melhores e mais informadas."

Cursos e Eventos

Curso Presencial de Microsoft Fabric: O melhor treinamento de Microsoft Fabric agora está na versão presencial. Depois de sucesso de 3 turmas online, formando mais de 150 profissionais, vai desembarcar em São Paulo. Você será mentorado por 2 profissionais MVP Microsoft. Vagas Limitadas.

Imersão Presencial de Power BI na era da IA Generativa: Depois do Sucesso das duas edições anteriores, dias 26 e 27 de abril, irá acontecer a 3ª edição do evento em São Paulo.

O que achou desta edição?

Faça Login ou Inscrever-se para participar de pesquisas.

Grande Abraço

Gerson Viergutz

Reply

or to participate.