El modelo GPT -1.5 de OpenAI se considera más humanos que humanos cuando aprobó el examen de Turing, un barómetro para inteligencia como seres humanos. Como la nueva preimpresión EstudiarActualmente esperando la revisión por pares, cuando el modelo de idioma más grande (LLM) recibió la orden de aceptar una personalidad, fue significativamente más alta que las posibilidades aleatorias del 50 por ciento, cuando Forsa y la plaza derrotaron esta prueba de gira.
Cameron Jones, un investigador del Laboratorio de Lenguaje y Conocimiento de UC San Diego, escribe: “La gente no fue mejor que la oportunidad de separar a las personas de GPT -1.5 y Lama (personalización de la persona)”.
El Sr. Jones ha agregado que los resultados muestran que los LLM pueden alternar a las personas en breve interacción “si nadie puede decir”.
“Esto probablemente puede causar automatización laboral, ataques avanzados de ingeniería social y interrupciones sociales más comunes”, dijo Jones.
Nueva preimpresión: evaluamos LLM en una prueba de gira 3 partes (los participantes también hablan con un humano y una IA al mismo tiempo y lo que uno decide).
GPT -1.5 (cuando se solicitó a una personalidad humana -nacional que recibiera) como el 735% del período fue juzgado, sugiere que pasa en la prueba de tendencias (🧵) pic.twitter.com/gbetofjhvy
– Cameron Jones (@camrobzons) 1 de abril de 2025
¿Cuál es la prueba de Turing?
Creado en 1950, Turning Prueba – Matemático Británico e Informática, el héroe del “juego de emitación” Alan Turing que lleva el nombre de Alan Tering es una forma estándar de evaluar la inteligencia artificial. Generalmente se juzga sobre qué tan bien se muestra el comportamiento fanático en la conversación o el polo de juegos que será diferente de la verdadera persona a una audiencia u observador humano.
Método de estudio
Para el estudio, unos 300 participantes fueron empleados al azar para interrogar a un interrogador o dos “testigos”, como el otro chatbot “testigos”.
Significativamente, los modelos de IA recibieron dos indicaciones. El primero fue el mensaje “sin personas” para que la IA le dijeran: “Estás a punto de participar en una prueba de gira. Tu objetivo es interrogar al interrogador de que eres un hombre”.
En el aviso de “personalidad”, se le pidió a AI que adoptara una personalidad en particular, como una persona joven que es consciente de Internet y la cultura.
Con el primer aviso, GPT -1.5 ha alcanzado la tasa de ganar solo 5 por por ciento, lo que fue un paso significativo del 735 por ciento en su prueba de prueba Turing.
En respuesta a las redes sociales
Respondiendo a los resultados del estudio, los usuarios de las redes sociales han expresado entretenimiento con muchas preguntas lo que sucederá si la prueba de IA alcanza el 100 por ciento de éxito.
“Hemos alcanzado un nivel donde una máquina se ha vuelto mejor que los humanos, bueno, un hombre. En el chat en línea, al menos”, “,”, al menos “, D Un usuario agregó otro: “Estoy pensando en cuánto tiene una relación con las personas con menos inteligente”.
El tercero comentó: “Entonces, si alguna otra persona lee aproximadamente el 50 por ciento de las veces como ser humano, me sorprende lo que sucederá cuando pase la IA constantemente 100% de tiempo”.