Stable Difussion lança novos recursos em sua segunda versão – Wwwhat's new?

Volta e meia falamos aqui em projetos de Inteligência Artificial, principalmente, aqueles que permitem a criação de imagens de forma automática, partindo do zero, utilizando apenas textos.

E entre esses projetos de Inteligência Artificial, dentro desse setor, que estão ganhando mais destaque está o Stable Diffusion, que ganhou nos últimos dias a sua versão 2.0, trazendo inovações bem interessantes.

Stability AI observa que modelos robustos de texto para imagem treinados com um codificador de texto completamente novo (OpenCLIP) foram incluídos nesta versão, estando por trás de seu desenvolvimento LAION com o suporte de Stability AI, prometendo melhorias na qualidade da imagem em comparação com a versão anterior.

Segundo a Stability AI:

Os modelos de texto para imagem nesta versão podem produzir imagens com resoluções padrão de 512×512 pixels e 768×768 pixels

Nesta versão, um dos problemas existentes neste tipo de projeto foi resolvido, que é a geração de conteúdo que pode ser qualificado para adultos. Nesse sentido, o filtro LAION NSFW foi incluído para eliminar esse tipo de conteúdo.

Esta versão também inclui um novo modelo chamado Upscaler Diffusion capaz de aumentar a escala de imagens por um fator de 4, oferecendo um exemplo de uma imagem gerada em resolução de 128×128 dimensionada para uma imagem de maior resolução (512×512).

Combinado com nossos modelos de texto para imagem, o Stable Diffusion 2.0 agora pode produzir imagens com resoluções de 2048×2048 ou até mais.

Mas, além disso, esta versão inclui o depth2img, seu novo modelo que leva em conta a profundidade de uma imagem gerada pelo modelo atual para gerar novas imagens usando tanto o texto quanto a informação de profundidade, e cujo exemplo conduz este artigo.

Depth-to-Image pode oferecer todos os tipos de novos aplicativos criativos, fornecendo transformações que parecem radicalmente diferentes do original, mas ainda retêm a coerência e a profundidade dessa imagem.

E, finalmente, apontam que atualizaram seu modelo de difusão de tinta guiada por texto, o que torna fácil e rápido alterar partes de uma imagem com mais precisão.

Quem se interessar, poderá testá-lo diretamente no Dream Studio em algumas semanas.

Mais informações: Stability AI