GPT-4 e Dall-E 3: Inovação e controvérsia na Inteligência Artificial – Uma análise das novas atualizações, suas limitações e o desafio da representação equitativa

Avanços e desafios da Inteligência Artificial na geração de texto e imagens

A inteligência artificial (IA) tem experimentado um desenvolvimento vertiginoso nos últimos anos, especialmente no que diz respeito à geração de texto e imagens. Dois exemplos notáveis deste avanço são o GPT-4, que impulsiona o ChatGPT, e o Dall-E 3, ambos produtos da OpenAI. Apesar das fascinantes possibilidades que estas ferramentas oferecem, também apresentam desafios e problemas que requerem atenção.

ChatGPT e Dall-E 3: Potencialidades e limitações

O ChatGPT, alimentado pelo GPT-4, permite até 50 interações a cada três horas. No entanto, a geração de imagens com esta ferramenta pode exigir uma espera de aproximadamente 30 segundos. A OpenAI estabeleceu restrições para garantir o uso adequado de suas tecnologias: as criações que violem suas diretrizes podem ser limitadas ou mesmo proibidas.

Dall-E 3, por sua vez, oferece a possibilidade de gerar imagens a partir de descrições textuais. Ao contrário de outros geradores de imagens AI como Dall-E 2 ou Midjourney, ChatGPT atua como intermediário com Dall-E 3, criando múltiplas indicações que podem variar desde frases longas até parágrafos completos com detalhes específicos. Se os primeiros resultados não forem satisfatórios, é possível ajustar aspectos como o esquema de cores ou a vibe geral. Além disso, pode-se solicitar mais imagens semelhantes a uma que tenha sido selecionada.

Proteção artística e desafios pendentes

Em uma tentativa de proteger os direitos dos artistas, a nova atualização do chatbot não cria imagens se for solicitado que imite um artista contemporâneo. No entanto, existem formas alternativas para obter resultados semelhantes. Por exemplo, pode-se solicitar que desenhe uma caneca de café com arte no estilo Keith Haring.

Apesar das melhorias na qualidade das imagens geradas, persistem problemas como distorções estranhas e rostos inquietantes nas imagens criadas por Dall-E 3. Além disso, foram detectados erros graves, como a má etiquetagem geográfica. Um exemplo disso é Gaza, que foi erroneamente etiquetada como parte do Mar Mediterrâneo.

Um dos problemas mais sérios e preocupantes é a tendência de reverter para estereótipos raciais ao representar humanos. Por exemplo, na criação de imagens de “repórteres da WIRED”, os resultados foram predominantemente brancos e masculinos quando raça ou gênero não foram especificados.

Conclusão: Necessidade de um desenvolvimento equitativo

Em conclusão, embora ferramentas de IA como GPT-4 e Dall-E 3 ofereçam possibilidades emocionantes para a geração de texto e imagens, também apresentam desafios significativos. É crucial que os desenvolvedores abordem esses problemas para garantir que essas tecnologias sejam justas e equitativas para todos os usuários.

Sarah Vercheval

Sarah é, além de uma especialista em marketing digital, uma criadora de conteúdo com vasta experiência no campo. Graduada em Sociologia pela Universidade de Barcelona e com uma Pós-graduação em Marketing Digital pelo Inesdi, Sarah conseguiu se destacar como Diretora de Marketing Digital. Seu profundo conhecimento das tendências digitais e sua habilidade para identificar oportunidades de crescimento foram fundamentais para o sucesso de inúmeras campanhas. Além disso, ela dá aulas e palestras em prestigiosas escolas de negócios, universidades e eventos, compartilhando seus conhecimentos e experiências com outros profissionais e estudantes.

Esta entrada também está disponível em: Español Français