A NVIDIA e o Google anunciaram uma colaboração estratégica com o objetivo de levar capacidades avançadas de inteligência artificial agêntica (agentic AI) a computadores pessoais e dispositivos de edge. Como parte da iniciativa, a NVIDIA revelou a otimização dos novos modelos abertos Gemma 4 para execução eficiente em toda a sua infraestrutura de IA — desde PCs equipados com GPUs RTX e sistemas DGX Spark até plataformas Jetson e GPUs Blackwell.
A nova família de modelos busca ampliar o uso de aplicações de IA local, permitindo que desenvolvedores e entusiastas explorem soluções mais avançadas diretamente em dispositivos do dia a dia, reduzindo a dependência de processamento em nuvem.
A linha Gemma 4 inclui modelos compactos, porém altamente capazes, com suporte a raciocínio, programação, compreensão multimodal e uso de ferramentas, viabilizando experiências mais autônomas e inteligentes.
Entre os destaques estão:
- Modelos E2B e E4B: versões ultracompactas e eficientes, projetadas para inferência de baixa latência e funcionamento totalmente offline em dispositivos de edge, como smartphones e Jetson Orin Nano. São indicadas para aplicações em tempo real e continuamente ativas.
- Modelos 26B e 31B: opções de maior escala e desempenho elevado, voltadas para tarefas complexas de raciocínio, programação e fluxos agênticos. Esses modelos foram otimizados para execução em GPUs NVIDIA RTX e sistemas DGX Spark, com foco em desenvolvedores e ambientes de workstation.
Além disso, os modelos oferecem suporte integrado a ferramentas como Ollama e llama.cpp, bem como a estruturas como OpenClaw e Unsloth Studio. Com isso, torna-se possível implementar agentes inteligentes capazes de acessar contexto pessoal em tempo real — de arquivos a fluxos de trabalho — para automatizar tarefas e aumentar a produtividade.