O Google está restaurando a capacidade do Gemini de gerar imagens de pessoas ao expandir seu gerador de imagens, o Imagen 3, para aplicativos e todos os idiomas.
A empresa lançará a geração de imagens de pessoas nos ao longo dos próximos dias.
O acesso antecipado será oferecido aos usuários do Gemini Advanced, Business e Enterprise em inglês. Mais usuários e idiomas serão disponibilizados em um futuro próximo.
O Google disse que resolveu os problemas fazendo “melhorias técnicas”, usando conjuntos de dados de avaliação melhores, estabelecendo “princípios de produto” claros e realizando exercícios de equipe vermelha que tentaram quebrar o modelo de IA.
A Imagen 3 da Gemini não produzirá imagens realistas e identificáveis de pessoas, informou a empresa.
Também não permitirá imagens de menores ou conteúdo “excessivamente sangrento, violento ou sexual”. O Google advertiu que as imagens não seriam perfeitas, mas que também ouviria o feedback.
O novo sistema de IA generativa é considerado de maior qualidade do que seu antecessor, o Imagen 2. Você pode criar imagens em estilos artísticos específicos, e as imagens resultantes são mais próximas do que você escreveu em seu comando.
Supostamente, ele funciona “favoravelmente” em comparação com outros geradores de imagens, de acordo com o gerente de produto Dave Citron.
O Google retirou a capacidade do Gemini de gerar pessoas em fevereiro, depois que os usuários produziram imagens historicamente imprecisas, como pessoas de cor como soldados alemães da Segunda Guerra Mundial.
O CEO Sundar Pichai teria dito à equipe que os resultados eram “inaceitáveis”, e o vice-presidente sênior Prabhakar Raghavan disse que o modelo não levava em conta situações em que a diversidade não é realista.
É muito cedo para dizer se o Google resolveu completamente os problemas com o Imagen.
Muitos dos problemas encontrados nos modelos de IA generativa só apareceram à medida que um público maior começou a experimentá-los e a encontrar pontos fracos.
No entanto, a abordagem contrasta fortemente com o Grok da xAI. O gerador apoiado por Elon Musk tem relativamente poucas proteções e permite que as pessoas criem deepfakes que podem ser usados para enganar outras pessoas.
O Google está determinado a ter uma abordagem segura para criar pessoas, em parte porque os principais recursos, como o Pixel Studio do Pixel 9, giram em torno do Gemini.
-O Gemini do Google voltará a gerar imagens de pessoas nos próximos dias. -A empresa afirma ter resolvido os problemas que levaram a imagens controversas. -O Google contrasta fortemente com a xAI em sua abordagem.