Google Whisk: O Guia Completo para Criar Arte IA Consistente

O Whisk é um projeto experimental do Google Labs focado na geração de imagens via IA.
Cachorro de terno em ambiente de jantar japonês. Cachorro de terno em ambiente de jantar japonês.

Se você já tentou criar imagens com inteligência artificial, sabe que manter a consistência de personagens ou cenários é um dos maiores desafios. É aqui que entra o Whisk, uma ferramenta de geração de imagens por IA do Google Labs que promete mudar esse jogo.

Neste post, vamos explorar como usar o Whisk para criar imagens incríveis, controlar seus personagens e até animar suas criações.

Banner Whisk Experiment amarelo com imagens artísticas.

O que é o Whisk?

O Whisk é um projeto experimental do Google Labs focado na geração de imagens via IA. O acesso é simples: basta fazer login com sua conta do Google e entrar na ferramenta. A interface é bastante intuitiva, apresentando uma caixa de prompt na parte inferior para digitar o que deseja. Se estiver sem ideias, há um botão de dado que gera sugestões aleatórias para você começar.

Infográfico sobre arte consistente com IA e pilares visuais.

O Segredo da Consistência: Sujeito, Cena e Estilo

O grande diferencial do Whisk é a capacidade de “travar” elementos específicos para garantir consistência na sua narrativa visual. A ferramenta divide o processo de criação em três categorias principais que você pode controlar marcando (ou “ticando”) as opções desejadas:

  1. Sujeito (Subject): Você pode fazer upload de uma imagem ou criar um personagem via texto e defini-lo como seu “sujeito”. Ao marcar a caixa de seleção desse sujeito, o Whisk tentará usar esse personagem específico em qualquer nova imagem que você gerar. A ferramenta permite até mesmo combinar múltiplos sujeitos na mesma imagem.
  2. Cena (Scene): Funciona da mesma forma que o sujeito. Você pode definir um local, como uma rua de Londres ou um terreno em Marte, e salvar isso como sua cena fixa.
  3. Estilo (Style): Quer que sua imagem pareça um filme do Wes Anderson, uma ilustração 3D ou um desenho animado? Você pode carregar uma referência de estilo ou usar texto para definir a estética visual que será aplicada.

A mágica acontece na combinação desses elementos. Por exemplo, você pode selecionar seu sujeito específico (uma mulher) e sua cena específica (Marte). O Whisk faz o trabalho pesado de fundir esses elementos, permitindo situações criativas, como colocar pessoas com roupas normais em Marte sem que a IA force trajes espaciais, caso você mantenha a referência do sujeito bloqueada.

Publicidade

Ajustando e Refinando suas Imagens

Estante de livros decorativa em forma de robô.

Nem sempre a IA acerta de primeira, e o Whisk oferece ferramentas poderosas para ajustes finos e edições radicais:

  • Refinar (Refine): Esta opção é ideal para pequenas alterações. Se você quiser mudar a cor do céu para roxo ou adicionar um acessório ao personagem, use o botão “Refine”. Ele abre um fluxo de trabalho semelhante a um chat, onde você pede o ajuste sem alterar drasticamente a composição da imagem.
  • Editar (Edit): Use esta opção para mudanças mais radicais. Por exemplo, se você quiser transformar a etnia de um personagem mantendo o restante da imagem, a função “Edit” é a mais indicada.
  • Referência Precisa (Precise Reference): Nas configurações, existe a opção “precise reference”. Quando ativada, o modelo segue estritamente suas imagens de referência. Ao desativá-la, você dá mais liberdade para a IA ser criativa e variar os detalhes, o que pode ser útil se o resultado estiver ficando muito rígido.

Dando Vida às Imagens: Animação

O Whisk vai além das imagens estáticas e permite criar vídeos curtos. Ao passar o mouse sobre a imagem e clicar no botão “Animate”, a ferramenta utiliza o modelo v2 para gerar um vídeo de aproximadamente 8 segundos. Você pode descrever o movimento que deseja ver ou deixar a IA decidir por conta própria.

Nota sobre custos: O uso básico da ferramenta para gerar imagens é gratuito, mas a função de animação é limitada a 10 vídeos gratuitos por mês. Para gerar mais vídeos, é necessário uma assinatura do Google AI (planos Pro ou Ultra).

Dicas Rápidas para Começar

  • Proporção da Imagem: Você pode alternar o formato da imagem entre 16:9 (paisagem), 1:1 (quadrado) ou 9:16 (retrato) antes de gerar.
  • Presets Divertidos: O menu oferece predefinições criativas, como transformar seu personagem em um bicho de pelúcia (“plushie”), transformá-lo em um adesivo (“sticker”) ou colocá-lo dentro de uma caixa de chocolates.
  • Inspiração na Comunidade: Na página principal, se você gostar de uma imagem criada por outro usuário, pode clicar em “Make your own” (faça a sua). Isso carrega o prompt e as referências usadas naquela imagem para o seu painel, o que é uma excelente maneira de aprender como certos estilos foram construídos.

O Google Whisk é uma ferramenta fantástica para quem busca controle narrativo em arte gerada por IA, eliminando a frustração de personagens que mudam de rosto a cada nova imagem.