Categorias
Blog

OpenAI diz que DALL-E está gerando mais de 2 milhões de imagens por dia – e isso é apenas uma estimativa

O venerável site de imagens, Getty, possui um catálogo de 80 milhões de imagens. A Shutterstock, rival da Getty, oferece 415 milhões de imagens. Demorou algumas décadas para construir essas bibliotecas prodigiosas.

Agora, parece que teremos que redefinir prodigioso. Em uma postagem no blog na semana passada, a OpenAI disse que seu algoritmo de aprendizado de máquina, DALL-E 2, está gerando mais de dois milhões de imagens por dia. Nesse ritmo, sua produção seria igual à Getty e Shutterstock combinadas em oito meses. O algoritmo está produzindo quase tantas imagens diariamente quanto toda a coleção de imagens gratuitas do site Unsplash.

E isso foi antes do OpenAI abrir o DALL-E 2 para todos. Até a semana passada, o acesso era restrito e havia uma lista de espera de pessoas ansiosas para colocar as mãos no algoritmo. O objetivo da postagem no blog em que o número apareceu era anunciar que DALL-E 2 agora está aberto ao público em geral.

Algoritmos semelhantes, entretanto, já estão disponíveis gratuitamente. O ritmo, então, provavelmente vai acelerar a partir daqui.

Claro, vale ressaltar que esta é uma comparação imperfeita. A qualidade da sua imagem média da Shutterstock ou da Getty é principalmente mais alta, e os sites também oferecem imagens editoriais de eventos atuais. Enquanto isso, o DALL-E 2 e outros algoritmos geram várias imagens para cada prompt, a qualidade da imagem varia muito e o melhor trabalho requer polimento por uma mão experiente.

Ainda assim, está claro que DALL-E e outros são máquinas de criação de imagens sem precedentes.

Um lançamento em fases
DALL-E 2, lançado no início deste ano, tem sido o assunto do mundo da tecnologia.

Ao contrário de seu antecessor, que o OpenAI revelou pela primeira vez em 2021 e produziu criações visivelmente imperfeitas, o DALL-E 2 cria imagens fotorrealistas com um prompt de texto. Os usuários podem misturar e combinar elementos, como solicitar um astronauta andando a cavalo, e estilos, como uma lontra marinha no estilo de Garota com Brinco de Pérola de Johannes Vermeer.

Para limitar o uso indevido e filtrar melhor a saída do algoritmo, a OpenAI buscou um lançamento em fases. Treinado em milhões de imagens e legendas on-line, o DALL-E 2 e outros algoritmos semelhantes são suscetíveis a vieses em seus conjuntos de dados, bem como ao uso indevido pelos usuários. A OpenAI publicou um artigo sobre DALL-E 2 em abril e visualizou o algoritmo para 200 artistas, pesquisadores e outros usuários. Eles expandiram a visualização em 1.000 usuários por semana no mês seguinte e, em seguida, estenderam o acesso ao algoritmo em versão beta, com preços, para um milhão de pessoas.

“Escalar com responsabilidade um sistema tão poderoso e complexo quanto o DALL-E – enquanto aprende sobre todas as maneiras criativas em que ele pode ser usado e mal utilizado – exigiu uma abordagem de implantação iterativa”, escreveu a empresa no post do blog.

Durante o lançamento, a OpenAI recebeu o feedback dos usuários e o traduziu em correções técnicas para reduzir preconceitos e filtros para evitar conteúdo inadequado. Eles também estão empregando uma equipe de moderadores para acompanhar as coisas. O quão bem essa abordagem será dimensionada, à medida que milhões de imagens se tornarem dezenas de milhões ou mais, ainda não se sabe, mas a equipe estava confiante o suficiente no produto até agora para avançar com uma versão completa.

Arte de IA em ascensão
O resto do mundo da IA ​​não ficou parado nesse meio tempo. Os concorrentes rapidamente seguiram os passos de DALL-E. Primeiro foi o DALL-E Mini – agora Craiyon – um gerador de imagens de qualidade inferior, mas gratuito, aproveitado pela internet para fabricar memes. Algoritmos de maior qualidade incluem Midjourney e Stable Diffusion. O Google até entrou no jogo com seu algoritmo Imagen (embora a empresa até agora o tenha mantido em segredo).

Adicione-os à saída do DALL-E 2 e o volume de arte de IA deverá crescer rapidamente.

No início deste verão, a Stable Diffusion disse que seu algoritmo já estava produzindo dois milhões de imagens por dia durante os testes. Quando a plataforma atingiu um milhão de usuários em meados de setembro, o fundador da Stable Diffusion, Emad Mostaque, twittou: “Devemos bater um bilhão de imagens por dia mais cedo ou mais tarde, imagino, especialmente quando ativarmos a animação, etc.”

O rápido surgimento da arte da IA ​​não rolou sem controvérsia.

Uma peça de arte de IA gerada em Midjourney por Jason Allen ganhou recentemente a fita azul para arte digital na Feira Estadual do Colorado. Não é difícil perceber porquê. A peça é linda e chamativa. Mas muitos artistas foram ao Twitter para expressar seu descontentamento.

Alguns temem que os algoritmos reduzam a quantidade de trabalho aberta aos designers gráficos. A combinação de qualidade, velocidade e volume com habilidades especializadas limitadas exigidas pode significar que as empresas optam por uma criação algorítmica rápida em vez de contratar um designer.

Recentemente, a Ars Technica informou que a Shutterstock já abrigava milhares de imagens da IA. Não muito tempo depois, apareceu que o site estava derrubando alguns. Enquanto isso, a Getty baniu completamente a arte da IA ​​em sua plataforma, citando preocupações com direitos autorais. O cenário legal ainda é obscuro e passível de mudança.

“No momento, o conteúdo gerado por IA será revisado da mesma forma que qualquer outro tipo de envio de ilustração digital”, disse Shutterstock ao Quartz na semana passada. “Isso pode mudar a qualquer momento à medida que aprendemos mais sobre imagens sintéticas”.

Outros temem que a capacidade de imitar de perto o estilo de um artista em atividade possa impactar negativamente o valor e a visibilidade de seu trabalho. Também não está claro o que se deve aos artistas cujas criações ajudaram a treinar os algoritmos. Os desenvolvedores expressaram uma preocupação semelhante no ano passado, quando a OpenAI lançou algoritmos de codificação treinados em repositórios abertos de código.

Mas nem todos concordam que a arte da IA ​​substituirá tão facilmente designers e artistas habilidosos depois que a novidade acabar. E a comunidade pode resolver ainda mais questões, como decidir treinar algoritmos apenas em obras de domínio público ou permitir que artistas optem por não participar. (Já existe uma ferramenta para os artistas verem se suas criações estão incluídas nos dados de treinamento.)

Quando a poeira baixar
Algoritmos de aprendizado de máquina geraram imagens e textos estranhos, novos, mas não particularmente úteis por anos. A IA que poderia gerar um trabalho de qualidade realmente entrou em cena em 2020, quando a OpenAI lançou o algoritmo de linguagem natural GPT-3. O algoritmo podia produzir texto que às vezes era quase indistinguível de algo escrito por um humano. GPT-3 é agora, como DALL-E 2, um produto pago e também um produtor prodigioso.

Mas mesmo tão grande quanto o GPT-3, DALL-E 2 pode assumir a liderança. “Vimos muito mais interesse do que prevíamos, muito maior do que o GPT-3”, disse o vice-presidente de produtos e parcerias da OpenAI, Peter Welinder, ao MIT Technology Review em julho.

A tendência provavelmente não terminará com imagens. Os desenvolvedores de IA já estão de olho no vídeo. Na semana passada, o Meta lançou talvez o algoritmo mais avançado até agora. Embora sua produção ainda esteja longe de ser perfeita, o ritmo de melhoria sugere que não teremos esperar muito.

Quando a poeira baixar, é possível que esses algoritmos se estabeleçam como uma nova forma de arte. A fotografia enfrentou resistência semelhante em sua chegada no século XIX e, finalmente, em vez de suplantar as formas de arte existentes, juntou-se a elas.

“O que é verdade desde pelo menos o advento da fotografia ainda é verdade agora: a arte que nasce pela metade é a mais emocionante. Ninguém sabe o que pode ser uma nova forma de arte até que alguém descubra o que é”, escreveu Stephen March recentemente no Atlantic. “Descobrir o que é a arte da IA ​​será tremendamente difícil, tremendamente alegre. Vamos começar agora.”

Deixe um comentário