Este texto não foi escrito por uma Inteligência Artificial. Mas poderia ter sido. E certamente será, de um jeito indistinguível, em um futuro próximo.
Mas aqui ainda sou eu mesmo (👋 Oi!), batucando dedinhos nas têmporas e nas teclinhas.
Autenticidade e autoria são coisas que estão ficando mais difíceis de interpretar.
Existe hoje toda uma perspectiva em direção a um conceito de ” composição total “, um processo criativo que beira a mágica, em que qualquer coisa que você possa imaginar possa de fato ser entregue com total fluidez criativa, impulsionada por avanços na tecnologia e ferramentas de criação de conteúdo acessíveis.
Estilo “faça seu pedido pro Gênio da Lâmpada da criatividade” e… plim! Feito! O que implicará em uma mudança no eixo das habilidades, de criativos que “sabem fazer,” para criativos que “sabem pedir.” A criatividade persiste, mas de uma maneira diferente. E, esperamos, complementar.
Uma breve reflexão sobre o processo criativo
Eu diria que o processo criativo, na essência, é composto por dois momentos: (1) ter a ideia e (2) produzir a ideia, formatar.
Esses momentos podem ser distintos, mas geralmente se sobrepõem. E um pode ficar maior que o outro, o que acaba resultando em alguns clássicos do ofício como a ideia boa que foi mal formatada, a ideia fraca que foi salva por uma superprodução e por aí vai. Essas desproporções acabam afetando diretamente o resultado, obviamente.
E, pensando geracionalmente (e dá pra ver isso nitidamente na publicidade, por exemplo), a parte da produção tem ficado bem maior do que a parte da ideia. Agencias e marcas tem feito uso de data e algoritmos e ideation tem ficado em segundo plano ao ponto de cogitarmos se os profissionais se quer ainda tem essa capacidade. É um mundo de peças elaboradas e palavras rebuscadas pelo hype, mas de quase nenhuma “ideia”.
Eisso pode ser um problema ainda maior do que imaginamos. Com a achegada da IA para turbinar a parte da produção, corremos o risco de baixar ainda mais o nível criativo. A tendência é que amadores ganhem um poder de produção enorme e o ofício seja banalizado ainda mais, tipo, “clique e receba uma campanha”, “clique e receba um jingle”, “clique e receba um comercial” e por aí vai.
Banalização é um efeito colateral de todo processo que dá poder e inclui não-profissionais nos processos. Até o ponto em que a própria interpretação de valor qualitativo, do que é bom e do que não é, acabe desaparecendo.
Um mundo com menos agulhas, em palheiros infinitamente maiores. E com o agravante de irmos perdendo a noção… do que seja uma agulha.
O potencial disruptivo da IA
Nos últimos 12 meses rolou uma explosão cambriana em inovação, estendendo os blocos de construção de grandes modelos de linguagem AI (LLM) como GPT-3 para todas as formas de criação de mídia. Um dos mais legais e disruptivos foi o da “imagem gerada por texto” com a capacidade de renderizar imagens elaboradas a partir de instruções de texto simples. Os prompts, palavrinha que os criativos de todas as áreas (e toda aquela turma adoram embalar cursos e palestras com o vocabulário hype vigente nos LinkedIns da vida) devem incorporar com vontade.
O que acontece é que até agora as inovações de software, lideradas por empresas como a Adobe, costumavam impulsionar a comunidade criativa em ciclos lentos e previsíveis. Mas agora a curva é vertiginosa. Nesse mundo hiper-conectado, com amplo conhecimento técnico, o movimento de código aberto e computação sob demanda, todos criam condições para uma rápida disseminação de novas ideias e capacidades tecnológicas. A IA generativa avança como um incêndio, capturando a atenção de usuários não técnicos e milhares de desenvolvedores que buscam lucrar com o que parece ter sido uma espécie de movimento de inclusão.
Ao contrário do que imaginávamos, não é só a classe operária que está sendo desafiada, mas também os criativos que todo mundo pensava que seriam os últimos a serem “ameaçados” por essa investida robótica.
Esses momentos não acontecem com muita frequência. Eles acontecem quando diferentes fluxos de inovação convergem sobre um mesmo processo, geralmente com ramificações sociais ou econômicas desproporcionais. Ou seja, quando várias novidades ficam disponíveis ao mesmo tempo e acabam mudando a realidade anterior para algo completamente diferente e não apenas “atualizado”. Aconteceu há quinze anos com a chegada do iPhone, um momento em que a inovação convergente em microprocessadores, redes 3G, GPS, tecnologia de bateria, câmeras, telas sensíveis ao toque se combinaram para desencadear uma revolução técnica e cultural que atingiu todas as partes de nossas vidas.
Desta vez, a mudança nasceu de avanços em modelos de linguagem , inovação de conceitos semânticos que são mapeados para dados de imagem, sistemas treinados com enormes bases de dados de imagens e metadados, alimentados por décadas de digitalização do conhecimento e avanços constantes na computação, em particular a adoção de GPUs poderosas (unidades de processamento gráfico). Tudo recebendo um enorme investimento por empresas como Google, Facebook e Microsoft.
Em português mais claro, sabemos que o potencial criativo aumenta na medida em que os repertórios aumentam. Quanto maior o nosso baú de referências, maiores as chances de ligações inusitadas (que é, inclusive, a filosofia-mestre do UoD desde o início). A gente associa isso a uma habilidade humana, mas pensa no tamanho desse tal baú e dessas tais ligações inusitadas de uma máquina com todas as “artes criativas” jea produzidas neste planeta, por todos os humanos vivos ou mortos que já tiverem suas obras registradas e disponibilizadas de alguma forma. Quem diria, criatividade tem sim uma essência “database” capaz de competir com toda aquela poesia e genialidade quase-mágica e celestial dos que “tem um dom único” que costumamos associar à capacidade de criação.
A própria palavra “INSPIRAÇÃO” vem de uma imagem mental de que a pessoa “inspirou” algo divino do ar, como que tomada por uma entidade divina, um momento de “iluminação”. Parece que agora, as máquinas também vão buscar uma “inspiração”, só que vão inspirar gigantescos bancos de imagens, de sons, de textos, etc.
Mais recentemente, os modelos de código aberto, especificamente aqueles oferecidos pela Stability AI e seu modelo Stable Diffusion , turbinaram a imaginação da comunidade criativa e de desenvolvedores em um ritmo acelerado. O Dall-E , da Open AI, foi o primeiro a oferecer imagens geradas por texto, não muito tempo atrás, em janeiro de 2021. Como você pode conferir nos links abaixo, o volume de inovação, updates e imagens em menos de dois anos é simplesmente impressionante.
Hoje em dia, para quem já acompanha o assunto mais de perto, é tudo “X + IA”. Qualquer que seja a área de produção criativa, tem sempre a IA envolvida, ou pelo menos, disponível. Para muitos é simplesmente o próximo capítulo da disrupção técnica pós-internet e celular.
Abaixo algumas observações e exemplos iniciais que ajudarão você a entender esse cenário, começando com um resumo da tecnologia texto > imagem do pessoal da Vox:
O “texto vira imagem” virou “texto vira qualquer coisa”
A IA evoluiu da linguagem para as imagens. Está se movendo rapidamente para vídeo em 3D e música. Texto para vídeo torna-se texto para qualquer coisa; “criar uma melodia inspirada em “Dreams”, do Fleetwood Mac, mas com uma linha de baixo tipo um dubstep.”
Dicas de links:
- Meta baseia-se em texto para imagem com texto para vídeo: Make-a-Video .
- Google segue suite com Imagen .
- Deforum Stable Diffusion mostra como podemos facilmente estender imagens para animação.
- Phenaki é um novo modelo que está tornando o texto em vídeo mais eficiente. As primeiras demonstrações mostram um caminho do texto para a narrativa em vídeo renderizada.
- Podcast de IA. Rogan entrevista Steve Jobs.
- Pesquisadores do Google na Dream Fusion imaginam texto em 3D .
- Texto para Pokémon
A arte do prompt
Os prompts são consultas de texto que informam à IA o que fazer. Bons prompts são expressões criativas que entendem como os modelos subjacentes funcionam. Você pode ficar bom nisso da mesma forma que um bibliotecário é bom em encontrar o livro perfeito.
- Os membros da comunidade Hugging Face AI têm um serviço para ajudá-lo com prompt criativo
- A PromptBase lança um mercado para vender prompts de qualidade. $ 1,99 você recebe um para mini-salas ou retratos de sofrimento. Aqui está um para avatares vintage .
Hiperpersonalização
A personalização da IA toca você de maneiras sutis hoje. Como quando o Google conclui automaticamente uma consulta de pesquisa com base nos dados de localização. A IA conduzirá um futuro muito mais íntimo, onde os agentes de software personalizam profundamente a recuperação, organização e síntese de informações.
Imagine pedir uma lista dos melhores artigos sobre IA e automação de marketing. Um bot com inteligência artificial recuperará e organizará uma lista de conteúdo digno do seu tempo com base em uma compreensão profunda de seus interesses específicos, nível de especialização, histórico de pesquisa etc. Ele criará um resumo útil.
Tudo o que vemos terá potencial para personalização profunda, mas agora em nível visual. O merchandising de férias apresentará sua família em um resort de praia ou em uma colina de esqui. Personagens de filmes ou jogos serão substituídos por quem você quiser.
Ou hoje vamos dizer que você quer re-imaginar um quarto? Carregue uma foto de qualquer ambiente. A IA ajuda você a imaginar isso de inúmeras maneiras .
A cultura do remix chega a todas as mídias
Agora estamos acostumados ao remix como parte fundamental da música moderna. E se pudéssemos fazer o mesmo com qualquer tipo de mídia? E se alguém pudesse fazer isso? A IA permitirá o versionamento de trabalhos criativos inteiros com novos personagens, novos cenários, novas histórias. Reimagine O Poderoso Chefão como clãs guerreiros de pessoas-gato? Chegando. Naturalmente, a tecnologia desencadeará novas e massivas complexidades no gerenciamento de direitos autorais e direitos.
Aqui está um pequeno projeto divertido… fazer pôsteres de filmes que não existem.
Disrupção de marketing e merchandising
A programática automatizou grande parte do processo de compra de mídia. Ou pelo menos eliminou muitas das ineficiências do processo. A IA escreverá um capítulo em que as decisões de segmentação e otimização de mídia desaparecem por trás do algoritmo. O Performance Max do Google está mostrando esse futuro hoje, eliminando grande parte da complexidade do planejamento, compra e otimização de mídia.
O criativo tem sido mais lento para automatizar. A IA mudará tudo isso. Os funis dinâmicos criarão automaticamente narrativas de marketing visual com base no seu perfil pessoal. O laborioso trabalho de merchandising digital será fundamentalmente alterado pela IA. Um par de sapatos pode ser renderizado instantaneamente de qualquer ângulo, em qualquer pé, em qualquer cenário, tudo criado treinando o modelo em um punhado de imagens.
Um “crack” no monopólio das pesquisas do Google
Mecanismos de busca são prompts. Estamos acostumados a receber do Google os resultados das coisas que solicitamos. Imagine um futuro em que a consulta faça muito mais, desde resultados hiperpersonalizados até imagens geradas por IA e conteúdo multimídia. Há muito tempo é difícil imaginar um concorrente disruptivo do Google. Esta é uma abertura.
Criadores sobre-humanos são especialistas em ferramentas
Nosso filho é um músico e produtor em ascensão. Meu conselho consistente para ele, dominar o processo e as ferramentas de fazer. A próxima geração de criadores ganha porque eles sabem como transformar inspiração em conteúdo rapidamente. No futuro, o trabalho de qualquer pessoa criativa se torna o orquestrador de ferramentas que permitem a criação de mídia inimaginavelmente sofisticada em qualquer lugar.
Também muda a codificação. Assim como a IA torna você um programador mais rápido hoje. O Github Copilot usa OpenAI para sugerir a próxima linha de código em tempo real. O futuro da programação se parece cada vez menos com a compreensão das complexidades das linguagens de programação.
Talvez a maneira mais fácil de ver a rapidez com que as coisas estão evoluindo hoje… verifique o que o Runway.ai está prestes a fazer com a edição de vídeo.
O Erase and Replace é uma nova Ferramenta AI Magic que permite transformar suas imagens simplesmente usando uma descrição em linguagem natural. Disponível agora: runwayml.com
Difusão de difusores
A IA não é monolítica. A capacidade de usar modelos de código aberto e aumentá-los com novos conjuntos de dados cria novos resultados criativos. Midjourney , por exemplo, tem uma vibe visual particular.
- Um projeto de arte divertido chamado An Improbable Future mostra design industrial e de transporte usando IA para gerar imagens contra uma estética futurista retro específica.
- Disco Diffusion (também conhecido como DD) é um modelo de difusão guiado por clipes que pode gerar imagens incríveis a partir do prompt de texto, e é bastante impressionante na geração de arte abstrata. Aqui está uma cartilha . Aqui está um fórum do Reddit mostrando vários exemplos. Aqui está uma comparação entre difusão estável e disco.
- Prompts mais longos… eis como estamos começando a estender a imagem à história .
- O Playgound AI fornece uma vitrine de todos os tipos de imagens generativas.
Tudo isso forçará uma reformulação fundamental do papel de um criativo, como criamos mídia, como precificamos e valorizamos a criatividade e certamente um exame complexo dos direitos de propriedade intelectual.
Apesar de tudo, olhando ainda mais longe, talvez passaremos a valorizar cada vez mais o que é exclusivamente humano.
Rapaz, eu tava caçando embasamento pra falar sobre com os amigos. Tô espalhando o link pra todo mundo, parabéns!
Excelente matéria, Wagner!
Valeu Maurício! Abs!
Foda! Obrigado.
Opa, obrigado Matheus, bom que gostou. Um abraço.