Nueva York:

El propietario de Facebook, Meta, dijo el viernes que está lanzando un lote de nuevos modelos de IA de su división de investigación, incluido un “evaluador de autoaprendizaje” que podría proporcionar un camino hacia una menor participación humana en el proceso de desarrollo de la IA.

El lanzamiento sigue a la introducción de la herramienta por parte de Meta en un artículo de agosto, que detalla cómo se basa en la misma técnica de “cadena de pensamiento” utilizada por los modelos o1 recientemente lanzados por OpenAI para tomar decisiones confiables sobre las respuestas del modelo.

Esta técnica divide problemas complejos en pasos lógicos más pequeños y parece mejorar la precisión de las respuestas a problemas desafiantes en materias como ciencias, codificación y matemáticas.

Los investigadores de Mater utilizaron datos generados por IA en su totalidad para entrenar el modelo de evaluación, eliminando la aportación humana en esa etapa.

La capacidad de utilizar la IA para evaluarla de manera confiable ofrece una idea de un posible camino para crear agentes de IA autónomos que puedan aprender de sus propios errores, dijeron a Reuters los dos metainvestigadores detrás del proyecto.

Muchos en el campo de la IA imaginan agentes como asistentes digitales que sean lo suficientemente inteligentes como para realizar una amplia gama de tareas sin intervención humana.

Los modelos de mejora automática pueden eliminar la necesidad de un proceso a menudo costoso e ineficiente llamado aprendizaje reforzado a partir de retroalimentación humana en la actualidad, que requiere aportes de anotadores humanos que deben tener habilidades especializadas para etiquetar correctamente los datos y verificar las respuestas a preguntas complejas de matemáticas y escritura. correcto

“Esperamos que, a medida que la IA se vuelva más sobrehumana, pueda probar cada vez mejor su trabajo, de modo que sea realmente mejor que el humano promedio”, dijo Jason Weston, uno de los investigadores.

“La idea de ser autodidacta y poder autoevaluarse es realmente importante para la idea de que la IA alcance este tipo de nivel sobrehumano”, dijo.

Otras empresas, incluidas Google y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF, o aprendizaje reforzado a partir de comentarios de IA. Sin embargo, a diferencia de Meta, estas empresas no lanzan sus modelos para uso público.

Otras herramientas de inteligencia artificial lanzadas por Meta el viernes incluyeron una actualización del segmento de identificación de imágenes de la compañía, Anything Model, una herramienta que acelera los tiempos de generación de respuestas de LLM y conjuntos de datos que pueden usarse para ayudar a descubrir nuevas sustancias inorgánicas.

(A excepción del titular, esta historia no fue editada por el personal de NDTV y apareció en un canal sindicado).


Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here