Meta ha presentado el modelo de IA Llama 3 más grande, afirmando avances en lenguaje y matemáticas

El modelo será gratuito, desafiando el ChatGPT-4 basado en suscripción.

Nueva York:

La plataforma Meta lanzó el martes la versión más grande de su modelo de inteligencia artificial Llama 3, en su mayoría gratuito, que cuenta con capacidades multilingües y métricas de rendimiento simples que le pisan los talones a los modelos pagos de rivales como OpenAI.

El nuevo modelo llama 3 puede conversar en ocho idiomas, escribir código informático de alta calidad y resolver problemas matemáticos más complejos que las versiones anteriores, dijo la empresa matriz de Facebook en publicaciones de blog y en un artículo de investigación que anuncia el lanzamiento.

Con 405 mil millones de parámetros, o variables que el algoritmo considera para generar respuestas a las preguntas de los usuarios, eclipsa a la versión anterior lanzada el año pasado, aunque sigue siendo más pequeña que los modelos líderes ofrecidos por la competencia.

Por el contrario, se dice que el modelo GPT-4 de OpenAI tiene un billón de parámetros, y Amazon está preparando un modelo con 2 billones de parámetros.

Al promocionar Llama 3 en múltiples canales, el director ejecutivo, Mark Zuckerberg, dijo que esperaba que los futuros modelos de llama superaran en ventas a los competidores patentados durante el próximo año. El chatbot Meta AI impulsado por estos modelos estaba en camino de convertirse en el asistente de IA más popular a finales de este año, y millones de personas ya lo utilizan, dijo.

El lanzamiento se produce mientras las empresas de tecnología se apresuran a demostrar que sus crecientes carteras de grandes modelos de lenguajes ávidos de recursos pueden ofrecer ganancias suficientemente significativas en problemas conocidos como la lógica avanzada para justificar las enormes sumas que han invertido.

El principal científico de IA de Meta ha dicho que cree que tales modelos alcanzarán los límites de la lógica y requerirán otros tipos de sistemas de IA para tener éxito.

Además de su modelo insignia de 405 mil millones de parámetros, Meta también está lanzando versiones actualizadas de sus modelos Lama 3 livianos de 8 mil millones y 70 mil millones de parámetros que se presentaron inicialmente en la primavera, dijo la compañía.

Los tres nuevos modelos son multilingües y pueden manejar solicitudes de usuarios más grandes a través de una “ventana contextual” ampliada, lo que, según Ahmed Al-Dahle, jefe de IA generativa de Meta, mejorará particularmente la experiencia de creación de código informático.

“Esa fue la respuesta número uno de la comunidad”, dijo Al-Dahle a Reuters en una entrevista, señalando que las ventanas de contexto más grandes dan a los modelos algo así como una memoria larga para ayudar a procesar solicitudes de varios pasos.

Por otra parte, Al-Dahle dijo que su equipo pudo mejorar el rendimiento del modelo Llama 3 en tareas como la resolución de problemas matemáticos mediante el uso de IA para generar algunos de los datos con los que fue entrenado.

Meta hace que sus modelos de llama sean en gran medida gratuitos para que los utilicen los desarrolladores, una estrategia que, según Zuckerberg, dará sus frutos en forma de productos innovadores, menos dependencia de la competencia y una mayor participación en las principales redes sociales de la empresa. Sin embargo, algunos inversores se sorprendieron de que esto implicara costos.

La empresa también se beneficiaría si los desarrolladores optaran por utilizar el modelo gratuito en lugar del modelo de pago, lo que socavaría los modelos de negocio de sus rivales. Junto con su anuncio, Meta citó mejoras en las pruebas básicas de matemáticas y conocimientos que podrían hacer que esa perspectiva sea aún más atractiva.

Si bien el progreso en el desarrollo de la IA es notoriamente difícil de medir, los resultados de las pruebas proporcionadas por Meta muestran que su modelo Llama 3 más grande casi iguala, y en algunos aspectos, al Cloud 3.5 Sonnet de Anthropic y al GPT-4o de OpenAI, que gozan de amplia consideración. Dos de los modelos Frontier más potentes del mercado.

En el punto de referencia MATH de problemas matemáticos escritos a nivel de competencia, por ejemplo, el modelo Meta registró una puntuación de 73,8 en comparación con el 76,6 del GPT-4o y el 71,1 del Claude 3.5 Sonnet.

El modelo obtuvo una puntuación de 88,6 en la MMLU, un punto de referencia que cubre docenas de materias de matemáticas, ciencias y humanidades, mientras que el GPT-4o obtuvo una puntuación de 88,7 y el Claude 3.5 Sonnet obtuvo una puntuación de 88,3.

En su artículo, los investigadores de Meta también adelantaron las próximas versiones “multimodales” de los modelos a finales de este año que superponen capacidades de imagen, video y voz sobre el modelo de texto Core Lama 3.

Las pruebas preliminares indican que estos modelos pueden funcionar “competitivamente” con otros modelos multimodales como el Gemini 1.5 de Google y el Claude 3.5 Sonnet de Anthropic, dijeron.

(A excepción del titular, esta historia no fue editada por el personal de NDTV y apareció en un canal sindicado).

Source link