Avances y desafíos de la Inteligencia Artificial en la generación de texto e imágenes
La inteligencia artificial (IA) ha experimentado un desarrollo vertiginoso en los últimos años, especialmente en lo que respecta a la generación de texto e imágenes. Dos ejemplos notables de este avance son GPT-4, que impulsa ChatGPT, y Dall-E 3, ambos productos de OpenAI. A pesar de las fascinantes posibilidades que estas herramientas ofrecen, también presentan desafíos y problemas que requieren atención.
ChatGPT y Dall-E 3: Potencialidades y limitaciones
ChatGPT, alimentado por GPT-4, permite hasta 50 interacciones cada tres horas. Sin embargo, la generación de imágenes con esta herramienta puede requerir una espera de aproximadamente 30 segundos. OpenAI ha establecido restricciones para garantizar el uso adecuado de sus tecnologías: las creaciones que violen sus directrices pueden ser limitadas o incluso prohibidas.
Dall-E 3, por su parte, ofrece la posibilidad de generar imágenes a partir de descripciones textuales. A diferencia de otros generadores de imágenes AI como Dall-E 2 o Midjourney, ChatGPT actúa como intermediario con Dall-E 3, creando múltiples indicaciones que pueden variar desde frases largas hasta párrafos completos con detalles específicos. Si los primeros resultados no son satisfactorios, es posible ajustar aspectos como el esquema de color o la vibra general. Además, se puede solicitar más imágenes similares a una que se haya seleccionado.
Protección artística y desafíos pendientes
En un intento por proteger los derechos de los artistas, la nueva actualización del chatbot no crea imágenes si se le pide que imite a un artista contemporáneo. Sin embargo, existen formas alternativas para obtener resultados similares. Por ejemplo, se puede solicitar que diseñe una taza de café con arte al estilo Keith Haring.
A pesar de las mejoras en la calidad de las imágenes generadas, persisten problemas como distorsiones extrañas y rostros inquietantes en las imágenes creadas por Dall-E 3. Además, se han detectado errores graves, como la mala etiquetación geográfica. Un ejemplo de esto es Gaza, que fue etiquetada erróneamente como parte del Mar Mediterráneo.
Uno de los problemas más serios y preocupantes es la tendencia a revertir a estereotipos raciales cuando se representan humanos. Por ejemplo, en la creación de imágenes de «reporteros de WIRED», los resultados fueron predominantemente blancos y masculinos cuando no se especificó raza o género.
Conclusión: Necesidad de un desarrollo equitativo
En conclusión, aunque las herramientas de IA como GPT-4 y Dall-E 3 ofrecen posibilidades emocionantes para la generación de texto e imágenes, también plantean desafíos significativos. Es crucial que los desarrolladores aborden estos problemas para garantizar que estas tecnologías sean justas y equitativas para todos los usuarios.
Sarah es además de experta en marketing digital, creadora de contenido con amplia experiencia en el campo. Graduada en Sociología por la Universidad de Barcelona y con un Postgrado en Marketing Digital en Inesdi, Sarah ha logrado destacarse como Directora de Marketing Digital.
Su profundo conocimiento de las tendencias digitales y su habilidad para identificar oportunidades de crecimiento han sido fundamentales para el éxito de numerosas campañas. Además, imparte clases y conferencias en prestigiosas escuelas de negocio, universidades y eventos, compartiendo sus conocimientos y experiencias con otros profesionales y estudiantes.