Lensa AI está roubando da arte humana? Um especialista explica a controvérsia

Um retrato falso no estilo ArtStation feito em Stable Diffusion. (Difusão estável)

O aplicativo de edição de fotos e vídeos Lensa ganhou destaque nas mídias sociais nas últimas semanas, depois de adicionar um recurso que permite gerar retratos digitais impressionantes de si mesmo em estilos de arte contemporânea.

Ele faz isso por apenas uma pequena taxa e pelo esforço de carregar de 10 a 20 fotos diferentes de você mesmo.

2022 foi o ano em que a tecnologia de texto para mídia AI deixou os laboratórios e começou a colonizar nossa cultura visual, e o Lensa pode ser a aplicação comercial mais inteligente dessa tecnologia até hoje.

O Lensa é basicamente uma engenharia imediata sobre o Stable Diffusion empacotado como um aplicativo que, segundo rumores, está ganhando $ 1 milhão / dia com as compras de aplicativos.

Este é apenas um exemplo de uma nova geração de aplicativos que transformará a engenharia imediata em ferramentas de produtividade e entretenimento.


Acendeu um fogo entre os influenciadores de mídia social que procuram se destacar – e um tipo diferente de fogo entre a comunidade artística. A artista australiana Kim Leutwyler disse ao The Guardian que reconheceu os estilos de artistas específicos – incluindo seu próprio estilo – nos retratos da Lensa.

Desde que o Midjourney, o Dall-E da OpenAI e o Stable Diffusion do grupo CompVis entraram em cena no início deste ano, a facilidade com que os estilos de artistas individuais podem ser emulados soou um sinal de alerta.

Os artistas sentem que sua propriedade intelectual – e talvez um pouco de sua alma – foi comprometida. Mas tem?

Bem, não tanto quanto a lei de direitos autorais existente o vê.

Se não é roubo direto, o que é?

A IA de texto para mídia é inerentemente muito complicada, mas é possível para nós, não cientistas da computação, entender conceitualmente.

Estou cortando isso por motivos de privacidade/porque não estou tentando chamar a atenção de nenhum indivíduo. Estes são todos os retratos Lensa onde os restos mutilados da assinatura de um artista ainda são visíveis. São os restos da assinatura de um dos vários artistas que roubou.

Para realmente entender os pontos positivos e negativos do Lensa, vale a pena dar alguns passos para trás para entender como os estilos individuais dos artistas podem entrar e sair das caixas pretas que alimentam sistemas como o Lensa.

O Lensa é essencialmente um front-end simplificado e personalizado para o modelo de deep learning Stable Diffusion disponível gratuitamente. É assim chamado porque usa um sistema chamado difusão latente para alimentar sua produção criativa.

A palavra “latente” é a chave aqui. Na ciência de dados, uma variável latente é uma qualidade que não pode ser medida diretamente, mas pode ser inferida a partir de coisas que podem ser medidas.

Quando o Stable Diffusion estava sendo construído, os algoritmos de machine learning foram alimentados com um grande número de pares de imagem-texto e aprenderam bilhões de maneiras diferentes pelas quais essas imagens e legendas poderiam ser conectadas.

Isso formou uma base de conhecimento complexa, nenhuma das quais é diretamente inteligível para os humanos. Podemos ver “modernismo” ou “tinta grossa” em suas saídas, mas Stable Diffusion vê um universo de números e conexões.

E tudo isso decorre de uma matemática complexa que envolve os números gerados a partir dos pares imagem-texto originais.

Como o sistema ingeriu descrições e dados de imagem, ele nos permite traçar um curso através do enorme mar de saídas possíveis, digitando prompts significativos.

Tome a imagem abaixo como exemplo. O prompt de texto incluía os termos “arte digital” e “artstation” – um site que abriga muitos artistas digitais contemporâneos.

Durante seu treinamento, Stable Diffusion aprendeu a associar essas palavras com certas qualidades que identificou nas várias obras de arte em que foi treinado. O resultado é uma imagem que caberia bem no ArtStation.

Um retrato falso no estilo ArtStation feito em Stable Diffusion poderia caber perfeitamente no site. (Difusão estável)

O que faz a Lensa se destacar?

Portanto, se a Stable Diffusion é um sistema de texto para imagem em que navegamos por diferentes possibilidades, o Lensa parece bem diferente, pois aceita imagens, não palavras. Isso porque uma das maiores inovações do Lensa é agilizar o processo de inversão textual.

O Lensa tira fotos fornecidas pelo usuário e as injeta na base de conhecimento existente do Stable Diffusion, ensinando o sistema a “capturar” os recursos do usuário para que possa estilizá-los. Embora isso possa ser feito na difusão estável regular, está longe de ser um processo simplificado.

Embora você não possa enviar as imagens no Lensa em nenhuma direção específica desejada, a compensação é uma ampla variedade de opções que quase sempre são impressionantes. Essas imagens emprestam ideias do trabalho de outros artistas, mas não contêm nenhum trecho real de seu trabalho.

O Australian Arts Law Center deixa claro que, embora as obras de arte individuais estejam sujeitas a direitos autorais, os elementos estilísticos e as ideias por trás delas não estão. Da mesma forma, o caso Dave Grossman Designs Inc. v Bortin nos EUA estabeleceu que a lei de direitos autorais não se aplica a um estilo de arte.

E os artistas?

No entanto, o fato de que os estilos e técnicas de arte são agora transferíveis dessa maneira é imensamente perturbador e extremamente perturbador para os artistas. À medida que tecnologias como o Lensa se tornam mais populares e os artistas se sentem cada vez mais roubados, pode haver pressão para que a legislação se adapte a ela.

Para artistas que trabalham em trabalhos de pequena escala, como criar ilustrações digitais para influenciadores ou outras empresas da web, o futuro parece desafiador.

No entanto, embora seja fácil fazer uma obra de arte com boa aparência usando IA, ainda é difícil criar um trabalho muito específico, com um assunto e contexto específicos. Portanto, independentemente de como aplicativos como o Lensa abalam a maneira como a arte é feita, a personalidade do artista continua sendo um contexto importante para seu trabalho.

Pode ser que os próprios artistas precisem pegar emprestada uma página do manual do influenciador e investir mais esforço em se divulgar.

Ainda é cedo e será uma década tumultuada para produtores e consumidores de arte. Mas uma coisa é certa: o gênio saiu da garrafa.


Publicado em 18/12/2022 21h29

Artigo original: