As Top 4 Novidades de geração de imagem com Inteligência Artificial
Saiu a versão 6 do Midjourney e existem alguns brinquedos novos disponíveis para quem quer virar desenhista ou pintor com as palavras.
Semanas atrás eu comentei que o Midjourney está ensaiando um site próprio para gerar imagens ao invés de obrigar você a usar o Discord. Pois bem, nessa última semana acabou de sair a mais nova versão do gerador de imagens mais hypado do universo: a versão 6.
Hoje vou mostrar para vocês os principais diferenciais dessa nova versão e quem sabe te convencer de uma vez por todas que existem duas formas de aprender a desenhar hoje em dia: com a mão e, agora, com palavras.
Textos Escritos
Aparentemente na v6 a capacidade de geração de imagens está muito superior. É só colocar o que você quer entre aspas no prompt que a máquina vai entender o que precisa ser feito.
Importante ressaltar que algumas instruções de —style raw podem ser necessárias para fazer acontecer da melhor forma.
Novidades no Prompt
Talvez a notícia mais amarga seja o fato de que houveram tantas mudanças no prompt que você que já tem muita prática vai precisar re-aprender a escrever.
Na própria documentação do Midjourney eles deixam bem explícito que existem diferenças entre versões.
A verdade é que agora você não precisa mais se prender a escrever com palavras chave. O prompt meio quase poético, quase que escrito da forma como se fala, é super eficiente.
Consistência de personagens
Até a v5, ao tentar criar versões diferentes de pessoas ou personagens, mesmo indicando uma foto base para isso, ainda assim os resultados variavam um pouco. A versão 6 mostrou mais consistência entre re-gerações de imagens, facilitando o processo de fazer quase que um pacote de fotos de personagens com Prompt.
Detalhes e detalhes
Ao que tudo indica a nova versão traz uma capacidade de gestão de detalhes muito boa. Um exemplo que coloquei abaixo é começando de uma versão simples e depois uma versão completamente cheia de detalhes descritos.
Depois de pedir para o modelo ir acrescentando os detalhes, aos poucos a imagem foi ganhando esse aspecto de pintura menos realista. No entanto, após algumas re-tentativas na versão final, vejam o resultado do quadro na direita abaixo: uma imagem conforme a descrição com detalhes.
O prompt que começou como:
a man with blue glasses --style raw --ar 16:9 --v 6.0
Terminou como:
a man with blue glasses and red earrings, he is wearing a green sweater, he is sitting in a yellow sportswear, he is smiling and extremely happy, he is smoking a fat cigar, there is a white Siberian tiger in the backseat of the car, the tiger is wearing purple sunglasses and an orange hat, unsplash --style raw --ar 16:9 --v 6.0
Outros menores itens
A verdade é que de versão em versão o que todo mundo quer ver é um modelo mega inteligente capaz de quase adivinhar a mesma imagem que nós imaginamos em nossas cabeças.
Por enquanto, é isso que a versão 6 do Midjourney tem para nós. Além de algumas coisas menores como um novo Upscale — a ferramenta que aumenta o tamanho da imagem para você baixar —, e uma forma de fazer um remix mas re-escrevendo o prompt como opção — o que não era possível antes.
Se você quiser ver uma lista completa de comparações entre imagens da versão 5 contra a versão 6, checa esse tweet to Nick St. Pierre.
Se você quiser ver a apresentação completa da nova versão do Midjourney, recomendo o vídeo abaixo:
E aí, já estão usando ferramentas de IA para gerar as imagens aí na sua empresa ou nos seus projetos? Deixa nos comentários.
Acontecendo no Mundo
Falando em imagem: olha só essa ferramenta que transforma qualquer imagem em sua versão animada 3D
Eu poderia tentar explicar tecnicamente o que está acontecendo, mas o resumo da ópera é que antes para fazer isso era preciso pelo menos umas 200 imagens e agora com uma única foto e o uso de aprendizado de máquina o modelo em 3D nasce.
Waymo descobre que seus carros sem motorista ‘superaram significativamente’ os humanos
Os pesquisadores da Waymo dizem que seus carros sem motorista reduziram significativamente as taxas de acidentes relatados pela polícia e que causaram ferimentos em comparação com motoristas humanos. Está a pressionar amplamente pela padronização internacional para análises válidas de dados de acidentes de veículos autónomos.
O conjunto de dados LAION-5B usado pela Stable Diffusion e outros produtos importantes de IA foi removido depois que um estudo de Stanford descobriu que continha 3.226 casos suspeitos de material de abuso sexual infantil, 1.008 dos quais foram validados externamente.
O que esperar de IA em 2024 segundo Stanford
O ano passado marcou grandes avanços na IA generativa, à medida que termos como ChatGPT e Bard se tornaram nomes familiares. As empresas investiram grandes investimentos em startups de IA (a queda de US$ 10 bilhões da Microsoft na OpenAI, a queda de US$ 4 bilhões da Amazon na Anthropic, para citar apenas duas), enquanto os principais pesquisadores e CEOs de IA debatiam a probabilidade da AGI nas manchetes.
O Brasil que deu certo? Cidade aqui está substituindo políticos por IA?
A notícia não é nova, mas não é todo dia que o Brasil sai em algum noticiário internacional e não é por um motivo de desgraça. Desta vez, o Wall Street Journal está colocando Porto Alegre em cena para falar do trabalho de Ramiro Rosário ao colocar IA a serviço do povo, e de políticos também.
Ferramenta da Semana
Quanto vale o seu tempo? E se você puder gastar menos tempo e melhorar os resultados em 10x. Essa é a promessa da PostNitro.AI, uma ferramenta que cria os carrosséis de conteúdos para diversas redes sociais - Instagram, LinkedIn, Facebook, Ticket etc - e que por usar visuais atraentes e diferenciados, tem um poder de retenção ainda maior. O melhor é que ainda está gratuito, então testar está fácil.
Charada do GPT
O que é, o que é: tem coroa, mas não é rei; tem escamas, mas não é peixe?
Prompt da Semana
Essa é mais uma dica para melhorar seu uso do ChatGPT do que um prompt em si. Para melhorar a qualidade das respostas e sair do padrão, experimente ao invés de pedir exatamente o que você quer, vá no caminho oposto e peça ao ChatGPT para falar respostas não convencionais.
Peça coisas que vão contra a norma, que desafiem o público, peça que apresente novos ângulos e veja as coisas com lentes diferentes. Veja um exemplo:
Tópico: Aumentando seus seguidores no Twitter
Para o tópico acima, dê exemplos que contradizem a narrativa dominante. Gere um esboço para conteúdo instigante que desafie suposições.
🙏 Fique a vontade para clicar no botão de ❤️ neste artigo, assim mais pessoas podem descobrir esse conteúdo 😍 Também compartilha comigo o que você achou nos comentários!
Ótimas dicas, já testando várias 😀