Inicio Artículos Dispositivos neuromórficos en TinyML

Dispositivos neuromórficos en TinyML

15 de noviembre de 2022

Autor: Eldar Sido, especialista en marketing de productos, Renesas Electronics

Las redes neuronales (NN) se han inspirado en el cerebro y el uso de terminologías de neurociencia (neuronas y sinapsis) para explicar las redes neuronales siempre ha sido motivo de queja para los neurocientíficos, ya que la generación actual de redes neuronales son polos opuestos a la forma en que funciona el cerebro. A pesar de la inspiración, la estructura general, los cálculos neuronales y las técnicas de aprendizaje entre la actual segunda generación de redes neuronales y el cerebro diferían enormemente. Esta comparación molestó tanto a los neurocientíficos que comenzaron a trabajar en la tercera generación de redes que se parecían más al cerebro, llamadas redes neuronales de picos (SNN) con hardware capaz de ejecutarlas, es decir, la arquitectura neuromórfica.

Spiking de redes neuronales

Los SNN son un tipo de red neuronal artificial (ANN) que están más estrechamente inspirados en el cerebro que su contraparte de segunda generación con una diferencia clave, en que los SNN son NN espaciotemporales, es decir, consideran el tiempo en su operación. Los SNN operan en picos discretos determinados por una ecuación diferencial que representa varios procesos biológicos. El umbral crítico se dispara después de que se alcance el potencial de membrana de la neurona (umbral de «disparo»), lo que ocurre cuando se disparan picos en esa neurona en secuencias de tiempo específicas. De manera análoga, el cerebro consta de 86 mil millones de unidades computacionales llamadas neuronas, que reciben información de otras neuronas a través de las dendritas, una vez que las entradas superan un determinado umbral, la neurona se dispara y envía un pulso eléctrico a través de una sinapsis, y el peso sináptico controla la extensión del pulso enviado a la siguiente neurona. A diferencia de otras redes neuronales artificiales, las neuronas SNN se activan de forma asincrónica en diferentes capas de la red y llegan en diferentes momentos donde, tradicionalmente, la información se propaga a través de las capas dictadas por el reloj del sistema. La propiedad espaciotemporal de los SNN, junto con la naturaleza discontinua de los picos, significa que los modelos se pueden distribuir de manera más escasa con neuronas que solo se conectan a las neuronas relevantes y usan el tiempo como variable, lo que permite que la información se codifique de manera más densa en comparación con la codificación binaria tradicional de ANN. Lo que lleva a que los SNN sean más potentes computacionalmente y más eficientes.

ann convencionales snn — Figura 1. Diferencia entre ANN convencionales y SNN.

El comportamiento asincrónico de los SNN junto con la necesidad de ejecutar ecuaciones diferenciales es computacionalmente exigente en el hardware tradicional y se tuvo que desarrollar una nueva arquitectura. Aquí es donde entra la arquitectura neuromórfica.

Arquitectura neuromórfica

La arquitectura neuromórfica es una arquitectura no-Von Neuman inspirada en el cerebro, compuesta por neuronas y sinapsis. En las computadoras neuromórficas, el procesamiento y almacenamiento de los datos ocurre en la misma región, lo que alivia el cuello de botella de Von Neuman que ralentiza el rendimiento máximo que las arquitecturas tradicionales pueden lograr debido a la necesidad de mover datos de la memoria a las unidades de procesamiento a velocidades relativamente lentas. Además, la arquitectura neuromórfica admite SNN de forma nativa y acepta picos como entradas, lo que permite codificar la información en el tiempo de llegada, la magnitud y la forma de los picos. Por lo tanto, las características clave de los dispositivos neuromórficos incluyen su escalabilidad inherente, el cálculo basado en eventos y la estocasticidad, ya que las neuronas que se activan pueden tener una sensación de aleatoriedad, lo que hace que la arquitectura neuromórfica sea atractiva debido a su operación de potencia ultrabaja, que generalmente opera en magnitudes menores que los sistemas informáticos tradicionales.

diferentes arquitecturas — Figura 2. Arquitectura de Von Neumann vs arquitectura neuromórfica (no-Von Neumann).

Pronóstico del mercado neuromórfico

Tecnológicamente, los dispositivos neuromórficos tienen el potencial de desempeñar un papel importante en la era venidera de la inteligencia artificial perimetral y terminal. Para comprender la demanda esperada de la industria, es necesario observar los pronósticos de investigación. Según un informe de Sheer Analytics & Insights, se espera que el mercado mundial de la informática neuromórfica alcance los 780 millones de dólares con una CAGR del 50,3 % para 2028 [1]. Mordor Intelligence, por otro lado, espera que el mercado alcance los 366 millones de dólares para 2026 con una CAGR del 47,4 % [2] y se puede encontrar mucha más investigación de mercado en línea que indica un aumento similar. Si bien los números de pronóstico no son consistentes entre sí, una cosa es consistente, se espera que la demanda de dispositivos neuromórficos aumente drásticamente en los próximos años y las empresas de investigación de mercado esperan que varias industrias como la industrial, automotriz, móvil y médica adopten dispositivos neuromórficos para una variedad de aplicaciones.

TinyML neuromórfico

Dado que TinyML (aprendizaje automático diminuto) tiene que ver con la ejecución de ML y NN en dispositivos con limitaciones estrictas de memoria/procesador, como los microcontroladores (MCU), es un paso natural incorporar un núcleo neuromórfico para los casos de uso de TinyML, ya que hay varias ventajas distintas.

Los dispositivos neuromórficos son procesadores basados en eventos que operan en eventos distintos de cero. La convolución basada en eventos y los productos de punto son significativamente menos costosos desde el punto de vista computacional, ya que no se procesan los ceros. El rendimiento de la convolución basada en eventos mejora aún más con la mayor cantidad de ceros en los canales de filtro o núcleos. Esto, junto con las funciones de activación, como que Relu se centre alrededor de cero, proporciona la propiedad de escasez de activación inherente de los procesadores basados en eventos, lo que reduce los requisitos efectivos de MAC.

Además, a medida que aumenta el proceso de los dispositivos neuromórficos, se puede utilizar una cuantificación más restringida, como la cuantificación de 1, 2 y 4 bits, en comparación con la cuantificación convencional de 8 bits en ANN. Además, dado que los SNN están incorporados en el hardware, los dispositivos neuromórficos (como Akida de Brainchip) tienen la capacidad única de aprendizaje On-Edge. Esto no es posible con los dispositivos convencionales, ya que solo simulan una red neuronal con arquitectura Von Neumann, lo que hace que el aprendizaje On-Edge sea computacionalmente costoso con grandes gastos generales de memoria, fuera del presupuesto de los sistemas TinyML. Además, para entrenar un modelo NN, los números enteros no proporcionarían suficiente rango para entrenar un modelo con precisión, por lo que actualmente no es factible entrenar con 8 bits en arquitecturas tradicionales. Para las arquitecturas tradicionales, actualmente, algunas implementaciones de aprendizaje en el borde con algoritmos de aprendizaje automático (codificadores automáticos, árboles de decisión) han llegado a una etapa de producción para casos de uso de análisis en tiempo real simples, mientras que los NN todavía están bajo investigación.

En resumen, las ventajas de usar dispositivos neuromórficos y SNN On-Edge:

– Consumo de energía ultra bajo (mili a microjulios por inferencia)

– Menores requisitos de MAC en comparación con los NN convencionales

– Menor uso de memoria de parámetros en comparación con los NN convencionales

– Capacidades de aprendizaje On-Edge

Casos de uso de TinyML neuromórfico

Con todo dicho y hecho, los microcontroladores con núcleos neuromórficos pueden sobresalir en casos de uso en toda la industria con sus características distintivas de aprendizaje en el borde, tales como:

En aplicaciones de detección de anomalías para equipos industriales existentes, donde el uso de la nube para entrenar un modelo es ineficiente, por lo que agregar un dispositivo de IA de punto final en el motor y el entrenamiento en el borde permitiría una fácil escalabilidad ya que el envejecimiento del equipo tiende a diferir de una máquina a otra. aunque sean del mismo modelo.
En robótica, a medida que pasa el tiempo, las articulaciones de los brazos robóticos tienden a desgastarse, desajustes y dejan de funcionar según sea necesario. Volver a sintonizar el controlador en el borde sin intervención humana mitiga la necesidad de llamar a un profesional, reduce el tiempo de inactividad y ahorra tiempo y dinero.
En las aplicaciones de reconocimiento facial, un usuario tendría que agregar su rostro al conjunto de datos y volver a entrenar el modelo en la nube. Con unas pocas instantáneas de la cara de una persona, el dispositivo neuromórfico puede identificar al usuario final a través del aprendizaje On-Edge, permitiendo que los datos de los usuarios estén seguros en el dispositivo junto con una experiencia más fluida. Esto se puede usar en automóviles, donde diferentes usuarios tienen diferentes preferencias sobre la posición del asiento, el control del clima, etc.
En las aplicaciones de detección de palabras clave, la adición de palabras adicionales para que su dispositivo las reconozca en el borde. Se puede usar en aplicaciones biométricas, donde una persona agregaría una «palabra secreta» que desearía mantener segura en el dispositivo.

on edge — Figura 3. Casos de uso de aprendizaje On-Edge para dispositivos neuromórficos

El equilibrio entre la potencia ultra baja de los dispositivos de punto final neuromórficos y el rendimiento mejorado lo hace adecuado para aplicaciones prolongadas alimentadas por batería, ejecutando algoritmos que no son posibles en otros dispositivos de baja potencia debido a que están limitados computacionalmente. O viceversa, con dispositivos de gama alta capaces de una potencia de procesamiento similar que consumen demasiada energía. Los casos de uso incluyen:

Relojes inteligentes que monitorean y procesan los datos en el punto final, enviando solo información relevante a la nube.
Sensores de cámara inteligente para detección de personas para ejecutar un comando lógico. Por ejemplo, la apertura automática de puertas cuando se acerca una persona, ya que la tecnología actual se basa en sensores de proximidad.
Área sin capacidad de conectividad o carga, como en los bosques para el seguimiento inteligente de animales o el monitoreo debajo de las tuberías oceánicas en busca de posibles grietas utilizando datos de vibración, visión y sonido en tiempo real.
Para casos de uso de monitorización de infraestructura, donde se puede usar una MCU neuromórfica para monitorear continuamente movimientos, vibraciones y cambios estructurales en puentes (a través de imágenes) para identificar fallas potenciales.

casos de uso de energia — Figura 4. Casos de uso de energía ultra baja con alto rendimiento

Conclusiones

Renesas, como líder en semiconductores, ha reconocido el gran potencial de los dispositivos neuromórficos y SNN, por lo que hemos obtenido la licencia de un núcleo neuromórfico de Brainchip [3], el primer productor comercial del mundo de IP neuromórfica, como señaló Sailesh Chittipeddi, nuestro vicepresidente ejecutivo en EEnews Europa, “En el extremo más bajo, hemos agregado una MCU ARM M33 y una red neuronal de picos con el núcleo BrainChip con licencia para aplicaciones seleccionadas; hemos obtenido la licencia de lo que necesitamos para obtener la licencia de BrainChip, incluido el software para poner la pelota en marcha”. [4]

Por lo tanto, mientras tratamos de innovar y desarrollar los mejores dispositivos posibles en el mercado, estamos emocionados de ver cómo esta innovación contribuirá a hacernos la vida más fácil.