Meta Platforms revoluciona las redes sociales con Llama 2 Long: El nuevo modelo de IA que supera a la competencia

"Un teléfono móvil presentado en un fondo circular, con un vibrante telón de fondo que evoca acción social, en tonos azul marino y con un enfoque clásico."

Nuevas Características de Inteligencia Artificial en Meta Platforms

Meta Platforms, la empresa matriz de Facebook, Instagram y WhatsApp, ha introducido recientemente innovaciones en inteligencia artificial (IA) para sus plataformas. Los detalles de estas novedades han sido expuestos en un artículo científico publicado por los investigadores de Meta en arXiv.org, una plataforma de acceso abierto para la divulgación de trabajos académicos.

Llama 2 Long: Un Avance en la Generación de Texto

El nuevo modelo de IA, bautizado como Llama 2 Long, se fundamenta en el modelo de código abierto Llama 2. No obstante, se ha potenciado con entrenamiento continuo y el empleo de textos más extensos. Esta mejora ha permitido a Llama 2 Long superar a sus competidores en la generación de respuestas a prompts largos.

Para desarrollar Llama 2 Long, los investigadores de Meta emplearon el original Llama 2 con diferentes tamaños de parámetros de entrenamiento. Asimismo, incorporaron más fuentes de datos de texto largo que el conjunto original. A pesar de estas modificaciones, se mantuvo la misma arquitectura del Llama 2 original, solo se alteró la codificación posicional.

Las mejoras en el rendimiento se consiguieron modificando el ángulo de rotación en la codificación RoPE (Rotary Positional Encoding), lo que permitió incluir tokens más «distantes». Además, se recurrió al aprendizaje por refuerzo con feedback humano y datos sintéticos generados por el chat Llama 2 para optimizar su rendimiento.

Superando a los Competidores y Validando el Código Abierto

Los resultados obtenidos por Llama 2 Long han superado a los modelos regulares Llama 2, Claude 2 y GPT-3.5 Turbo. Esta noticia ha sido acogida con admiración y entusiasmo por la comunidad de IA de código abierto, que ve en Llama 2 Long un importante avance en la generación de texto.

En resumen, Meta ha validado el enfoque de «código abierto» hacia la IA generativa con el lanzamiento de Llama 2 Long. Este hito indica que el código abierto puede competir con los modelos de «pago por jugar» ofrecidos por startups bien financiadas. Sin duda, este es un paso significativo en el desarrollo de la inteligencia artificial y su aplicación en las redes sociales.

Clara es creadora y editora de contenidos, con una sólida formación en ciencias y una especialización en inteligencia artificial. Su pasión por este campo en constante evolución la ha llevado a adquirir los conocimientos necesarios para comprender y comunicar los avances más recientes en este campo. Con su experiencia y habilidades en la redacción y edición de contenidos, Clara es capaz de transmitir de manera clara y efectiva conceptos complejos relacionados con la inteligencia artificial y de esta manera hacerlos accesibles para todo tipo de audiencias.

Esta entrada también está disponible en: Français Português

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *