Los científicos han propuesto una nueva forma de implementar redes neuronales con sistemas ópticos que podría hacer que el aprendizaje automático sea más sostenible en el futuro. Investigadores del Instituto Max Planck para la Ciencia de la Luz han publicado su nuevo método. Física de la naturalezademostrando un método mucho más simple que los métodos anteriores.

El aprendizaje automático y la inteligencia artificial se están expandiendo rápidamente con aplicaciones que van desde la visión por computadora hasta la generación de texto, como lo demuestra ChatGPT. Sin embargo, estas complejas tareas requieren redes neuronales cada vez más complejas. Algunos con muchos miles de millones de parámetros. Este rápido crecimiento en el tamaño de las redes neuronales ha puesto a las tecnologías en un camino insostenible debido al rápido aumento del consumo de energía y los tiempos de entrenamiento. Por ejemplo, se estima que el entrenamiento del GPT-3 consumió más de 1.000 megavatios de energía, el equivalente al consumo eléctrico diario de una pequeña ciudad. Esta tendencia ha llevado a la necesidad de alternativas más rápidas, más energéticamente y rentables, dando lugar al campo de rápido desarrollo de la computación neuromórfica. El campo tiene como objetivo reemplazar las redes neuronales de nuestras computadoras digitales con redes neuronales físicas. Están diseñados para realizar las operaciones matemáticas requeridas de la manera más rápida y energéticamente eficiente posible.

La óptica y la fotónica son plataformas particularmente prometedoras para la computación neuromórfica porque el consumo de energía se puede mantener al mínimo. Los cálculos se pueden realizar en paralelo a velocidades extremadamente rápidas que están limitadas únicamente por la velocidad de la luz. Sin embargo, hasta ahora han surgido dos desafíos principales: en primer lugar, se requieren altas potencias del láser para realizar los complejos cálculos matemáticos necesarios. En segundo lugar, la falta de un método de entrenamiento general eficaz para este tipo de redes neuronales físicas.

Ambos desafíos pueden superarse con un nuevo método propuesto por Clara Vanjura y Florian Marquardt del Instituto Max Planck para la Ciencia de la Luz en su nuevo artículo en Nature Physics. “Normalmente, los datos introducidos se imprimen en el campo luminoso. Sin embargo, en nuestros nuevos métodos proponemos imprimir los datos introducidos cambiando la transmisión de la luz”, explica Florian Marquardt, director del instituto. Por tanto, la señal de entrada se puede procesar de forma arbitraria. Esto es cierto incluso aunque el propio campo luminoso se comporte de la manera más sencilla: las ondas interfieren sin afectarse entre sí. Por lo tanto, su enfoque permite evitar interacciones físicas complejas para comprender funciones matemáticas esenciales que de otro modo requerirían campos de luz de alta potencia. Evaluar y entrenar esta red neuronal física sería entonces muy sencillo: “Realmente sería tan simple como enviar luz a través del sistema y observar la luz transmitida. Esto nos daría la salida de la red para medir toda la información relevante para el entrenamiento”. ” dice Clara Vanjura, primera autora del estudio. Los autores demostraron en simulaciones que su enfoque se puede utilizar para realizar tareas de clasificación de imágenes con la misma precisión que las redes neuronales digitales.

En el futuro, los autores planean colaborar con grupos experimentales para explorar la implementación de su método. Dado que su propuesta relaja significativamente los requisitos experimentales, puede aplicarse a sistemas físicamente muy diferentes. Esto abre nuevas posibilidades para los dispositivos neuromórficos que permiten el entrenamiento físico en una amplia gama de plataformas.

Source link