Nova tecnologia de Inteligência Artificial consegue criar qualquer imagem


Foto: Divulgação OpenAI

A OpenAI, empresa aconselhada por Elon Musk – um dos homens mais ricos do mundo – e apoiada pela Microsoft, conseguiu desenvolver um software capaz de gerar qualquer imagem a partir de texto. Os resultados são surpreendentes. Por exemplo, se você digitar ‘um gato feito de sushi’ ou ‘um raio-x de uma capivara sentada em uma floresta’, a ferramenta vai gerar dezenas de imagens, conforme as demonstradas. Algumas com qualidade surpreendentemente boa para uma tecnologia de Inteligência Artificial.


Ao contrário de softwares que já existiam e tentavam executar a mesma tarefa, a nova ferramenta é capaz de dar atenção a detalhes que não são mencionados na descrição, mas seriam necessários para uma imagem realista. Por exemplo, com a descrição ‘uma pintura de uma raposa sentada no campo durante o inverno’, o agente foi capaz de determinar que uma sombra era necessária para que uma das fotos ficasse melhor. Já ao pedir para que gerasse imagens de uma cobra robô, a ferramenta foi capaz de criar fotos com texturas que imitassem uma aparência metálica.


“Ao contrário de um mecanismo de renderização 3D normal, cujas entradas devem ser especificadas de forma inequívoca e em detalhes completos, o DALL-E é capaz de ‘preencher os espaços em branco’ quando a legenda implica que a imagem deve conter um determinado detalhe que não está explicitamente declarado”, disse um membro da equipe da OpenAI.


O projeto, que foi batizado de DALL-E, em homenagem ao pintor Salvador Dalí e ao personagem da Disney-Pixar Wall-E, usa um sistema que imita as redes neurais humanas. A grande novidade é que as produções são feitas a partir de textos. O DALL- -E pode criar imagens com base na descrição de seus atributos, a partir de um banco de dados com mais de 12 bilhões de fotos. Ele também consegue desenhar e combinar vários objetos e fornecer diferentes pontos de vista, incluindo os interiores.


Foto: SpaceX

Elon Musk é um dos cofundadores da OpenAI, mas se afastou para cuidar melhor da Tesla e da SpaceX. Hoje, atua como conselheiro da empresa de pesquisa e desenvolvimento em inteligência artificial.


A tecnologia ainda é limitada

O sistema tem inúmeros outros talentos, como entender de que modo os objetos mudam ao longo do tempo, aprender fatos geográficos e pontos de referência e criar imagens em estilos fotográficos, de ilustração e até de clip-art. Por enquanto, o DALL- -E é bastante limitado. Às vezes, ele entrega o que você espera da descrição, e outras vezes, apenas algumas imagens estranhas. Tal como acontece com outros sistemas de Inteligência Artificial, mesmo os próprios pesquisadores não entendem exatamente como ele produz certas imagens.


“No futuro, planejamos analisar como esta tecnologia se relaciona com questões sociais, como impacto econômico em determinados processos de trabalho e profissões, o potencial de parcialidade nos resultados do modelo e os desafios éticos em longo prazo implícitos por essa tecnologia”, afirmou a equipe.


A preocupação é com o abuso da mídia gerada por Inteligência Artificial, sendo possível criar vídeos, áudios e imagens falsas para fins antiéticos, que vão desde desinformação política até tentativas de fraude.


Repercussão no Brasil


Foto: Arquivo Pessoal Filipe Deschamps

Vários meios de comunicação divulgaram a novidade em todo o mundo, e no Brasil não seria diferente. O programador Filipe Deschamps, que tem um canal sobre tecnologia no Youtube e conta com mais de 400 mil inscritos, tratou sobre o assunto em um de seus vídeos. Segundo ele, mesmo com tecnologias assim, programadores de verdade ainda vão ser muito necessários nas próximas décadas.


“No curto prazo, os programadores vão continuar existindo. Mas como eu já falei, essas tecnologias vão acabar, sim, substituindo quem não quiser ser maximizado por essas ferramentas. Existe uma parcela da população de programadores que vai se tornar obsoleta. Essa categoria sempre existiu e vai continuar existindo, e são os que ficam estagnados num conjunto muito limitado de ferramentas ou marcas”, afirmou Filipe em um de seus vídeos.

Para o programador, quem está começando agora na profissão não deveria se sentir desmotivado pela criação dessas novas tecnologias, mas desafiado a aprender a trabalhar com elas. “Diante de um desafio, de uma coisa que vocês realmente querem... A última coisa que vocês podem fazer é desistir! Ué, precisa ser o contrário! Vocês precisam persistir, ter estratégia, tentar pôr outros ângulos... E o resultado dessa dualidade é que vai dizer o quanto realmente você queria”, defendeu.


Inteligência Artificial usada também para textos

O novo software é um desdobramento do GPT-3 (Generative Pre-training), robô capaz de produzir textos diversos, desde notícias até poesias. O jornal inglês The Guardian, inclusive, já publicou um artigo utilizando a tecnologia em 2020, quando impressionou muita gente. Também desenvolvido pela OpenAI, ele se mostrou capaz de escrever textos, muito ricos em vocabulário, sem qualquer intervenção humana.


O sistema tem base em machine learning e, graças a 175 bilhões de parâmetros, pode escrever vários tipos de textos, sob os mais variados gêneros e assuntos. A linguagem vem para substituir a GPT-2, que tinha 1,5 bilhão de parâmetros e foi lançada em 2019.


O GPT-3 cria textos usando seu enorme banco de dados para prever quais palavras podem complementar uma frase inicial, gerando uma sequência plausível. A Inteligência Artificial consegue gerar ainda textos como poemas, horóscopos, resenhas de arte, piadas, episódios de séries e roteiros de filmes. Uma preocupação com o GPT-3, assim como com o DALL-E, é a possibilidade de a tecnologia ser usada para a criação de contas falsas, com a finalidade de gerar e disseminar fake news.

0 comentário