Semana agitada de grandes lançamentos. Depois do chatGPT4, ontem foi a vez do MidJourney5, a mais nova versão do gerador de imagens por Inteligência Artificial.
Para usar este modelo, basta adicionar o parâmetro --v 5
ao final de um prompt, ou já deixe como modelo padrão pelo comando /settings
e selecione 5️⃣ MJ Version 5
A maior diferença no novo MidJourney5 em relação aos anteriores é que ele tem uma COERÊNCIA maior, ou seja, a qualidade e força da conexão entre o prompt e o resultado são melhores, tanto a capacidade de compreender e interpretar o que você está comandando, quanto as imagens geradas.
Mas o que realmente diferencia o MidJourney5 de seus predecessores é o nível de detalhe e precisão que ele traz para imagens fotográficas. A profundidade e a riqueza das imagens que o MidJourney5 produz são verdadeiramente surpreendentes. As imagens em estilo mais fotográfico ficaram visivelmente melhores. Na versão anterior já eram boas, mas dava para ver que eram mais “ilustrações tão realistas que passavam por fotografias”. Agora, parecem fotos mesmo.
Tamanho padrão do MidJourney5 é 1024×1024
O tamanho padrão das imagens no MidJourney5 aumentou e agora é de 1024×1024. O processamento ficou um pouco mais lento (não muito), mas em compensação, o upscale é imediato.
Outra novidade é a capacidade de repetir padrões com o comando --tile
para criar texturas e fundos. Também já existia na versão anterior mas agora ficou bem melhor.
Comparando Imagens
Achei que seria interessante comparar imagens geradas pelos mesmos prompts nas versões V4 e V5, fica sempre mais fácil de enxergar o incremento. Claro, são apenas exemplos, mas testei com coisas que sempre usamos como um homem, uma mulher, um objeto e… claro… mãos. Mãos, como todo usuário sabe, são o maior desafio para uma IA e o novo modelo melhorou bastante neste quesito, mas não a ponto de resolver totalmente o problema. Mas com uma certa insistência, ficou mais contornável.
Vamos aos testes com o MidJourney5. Usei os prompts mais básicos possíveis, com o menor número de palavras, para não aumentar muito os parâmetros. Dá pra deixar essas imagens bem melhores, mas mantive os parâmetros mais básicos para efeito de teste comparativo.
Uma Mulher
Versão 4
Versão 5
Melhorando o prompt
Um Homem
Versão 4
Versão 5
Melhorando o Prompt
Um Hamburguer
Versão 4
Versão 5
Melhorando o Prompt
Mãos segurando um café
Versão 4
Versão 5
Melhorando o Prompt
Me Mostre 10 dedos
Versão 4
Versão 5
Outras Imagens com prompts mais trabalhados
Lembrando que o foco deste post foram as imagens em estilo mais fotográfico. O MidJourney5 também melhorou muito nas imagens mais gráficas, mais para o universo das ilustrações, vale a pena explorar também.