Home Artikel Neuromorphe Geräte in TinyML

Neuromorphe Geräte in TinyML

15 November 2022

Autor: Eldar Sido, Produktmarketing-Spezialist, Renesas Electronics

Neuronale Netze (NNs) wurden vom Gehirn inspiriert, und die Verwendung neurowissenschaftlicher Terminologien (Neuronen und Synapsen) zur Erklärung neuronaler Netze war schon immer eine Quelle der Beschwerde für Neurowissenschaftler, da die aktuelle Generation neuronaler Netze weit voneinander entfernt ist das Gehirn funktioniert. Trotz der Inspiration unterschieden sich die allgemeine Struktur, neuronale Berechnungen und Lerntechniken zwischen der aktuellen zweiten Generation neuronaler Netze und dem Gehirn stark. Dieser Vergleich verärgerte Neurowissenschaftler so sehr, dass sie mit der Arbeit an der dritten Generation von Netzwerken begannen, die eher dem Gehirn ähnelten, genannt Spike Neural Networks (SNNs), mit Hardware, die in der Lage war, sie zu betreiben, nämlich der neuromorphen Architektur.

Spiking von neuronalen Netzen

SNNs sind eine Art von künstlichen neuronalen Netzwerken (KNN), die stärker vom Gehirn inspiriert sind als ihre Gegenstücke der zweiten Generation, mit einem wesentlichen Unterschied, da SNNs räumlich-zeitliche NNs sind, das heißt, sie berücksichtigen die Zeit in ihrem Betrieb. SNNs arbeiten mit diskreten Peaks, die durch eine Differentialgleichung bestimmt werden, die verschiedene biologische Prozesse darstellt. Die kritische Schwelle wird ausgelöst, nachdem das Membranpotential des Neurons erreicht ist ("Auslöseschwelle"), was auftritt, wenn in diesem Neuron zu bestimmten Zeitsequenzen Spitzen ausgelöst werden. Analog dazu besteht das Gehirn aus 86 Milliarden Recheneinheiten, Neuronen genannt, die Informationen von anderen Neuronen über Dendriten erhalten, sobald Eingaben eine bestimmte Schwelle überschreiten, das Neuron feuert und einen elektrischen Impuls durch eine Synapse sendet, und das synaptische Gewicht die Ausbreitung steuert der Impuls, der an das nächste Neuron gesendet wird. Im Gegensatz zu anderen künstlichen neuronalen Netzwerken feuern SNN-Neuronen asynchron auf verschiedenen Schichten des Netzwerks und kommen zu unterschiedlichen Zeiten an, zu denen sich Informationen traditionell über Schichten ausbreiten, die von der Systemuhr vorgegeben werden. Die raumzeitliche Eigenschaft von SNNs zusammen mit der diskontinuierlichen Natur der Spikes bedeutet, dass Modelle mit Neuronen, die nur mit relevanten Neuronen verbunden sind und Zeit als Variable verwenden, spärlicher verteilt werden können, sodass Informationen im Vergleich zur traditionellen Binärdatei von ANN dichter codiert werden können Codierung. Was dazu führt, dass SNNs rechenleistungsstärker und effizienter sind.

konventionelle ann snn — Abbildung 1. Unterschied zwischen herkömmlichem KNN und SNN.

Das asynchrone Verhalten von SNNs zusammen mit der Notwendigkeit, Differentialgleichungen auszuführen, ist rechenintensiv für herkömmliche Hardware, und es musste eine neue Architektur entwickelt werden. Hier kommt die neuromorphe Architektur ins Spiel.

Neuromorphe Architektur

Die neuromorphe Architektur ist eine Nicht-Von-Neuman-Architektur, die vom Gehirn inspiriert ist und aus Neuronen und Synapsen besteht. Bei neuromorphen Computern finden Datenverarbeitung und -speicherung in derselben Region statt, wodurch der Von-Neuman-Engpass verringert wird, der die maximale Leistung verlangsamt, die herkömmliche Architekturen aufgrund der Notwendigkeit verlangsamen können, Daten von Speicher zu Speicherverarbeitungseinheiten mit relativ langsamen Geschwindigkeiten zu verschieben. Darüber hinaus unterstützt die neuromorphe Architektur nativ SNNs und akzeptiert Spikes als Eingaben, sodass Informationen in Ankunftszeit, Größe und Form von Spikes codiert werden können. Zu den Hauptmerkmalen neuromorpher Geräte gehören daher ihre inhärente Skalierbarkeit, ereignisbasierte Berechnung und Stochastik, da das Abfeuern von Neuronen ein Gefühl der Zufälligkeit haben kann, was die neuromorphe Architektur aufgrund ihres Betriebs mit extrem geringem Stromverbrauch attraktiv macht, der im Allgemeinen bei Größenordnungen von weniger als arbeitet herkömmliche Computersysteme.

unterschiedliche Architekturen — Abbildung 2. Von-Neumann-Architektur vs. neuromorphe Architektur (Nicht-Von-Neumann).

Neuromorphe Marktprognose

Technisch gesehen haben neuromorphe Geräte das Potenzial, in der kommenden Ära der künstlichen Edge- und Endpunkt-Intelligenz eine wichtige Rolle zu spielen. Um die erwartete Nachfrage der Branche zu verstehen, ist es notwendig, sich die Forschungsprognosen anzusehen. Laut einem Bericht von Sheer Analytics & Insights wird erwartet, dass der globale Markt für neuromorphes Computing bis 780 50,3 Millionen US-Dollar mit einer CAGR von 2028 % erreichen wird [1]. Mordor Intelligence hingegen erwartet, dass der Markt bis 366 einen Wert von 2026 Millionen US-Dollar erreichen wird, bei einer CAGR von 47,4 % [2], und viel mehr Marktforschung ist online zu finden, die auf einen ähnlichen Anstieg hinweist. Während die prognostizierten Zahlen nicht übereinstimmen, ist eines konsistent: Die Nachfrage nach neuromorphen Geräten wird in den kommenden Jahren voraussichtlich dramatisch steigen, und Marktforschungsunternehmen erwarten, dass verschiedene Branchen wie Industrie, Automobil, Mobil und Medizin neuromorphe Geräte einsetzen eine Vielzahl von Anwendungen.

Neuromorphes TinyML

Da es bei TinyML (Tiny Machine Learning) darum geht, ML und NN auf Geräten mit strengen Speicher-/Prozessorbeschränkungen wie Mikrocontrollern (MCUs) auszuführen, ist es ein natürlicher Schritt, einen neuromorphen Kernel für TinyML-Anwendungsfälle zu integrieren, da es mehrere gibt deutliche Vorteile.

Neuromorphe Geräte sind ereignisbasierte Prozessoren, die mit Nicht-Null-Ereignissen arbeiten. Ereignisbasierte Faltung und Skalarprodukte sind erheblich weniger rechenintensiv, da Nullen nicht verarbeitet werden. Die ereignisbasierte Faltungsleistung wird durch mehr Nullen in den Filterkanälen oder Kerneln weiter verbessert. Zusammen mit Triggerfunktionen wie Relu, die um Null herum zentriert sind, stellt dies die inhärente Triggersparseness-Eigenschaft ereignisbasierter Prozessoren bereit, wodurch die effektiven MAC-Anforderungen reduziert werden.

Da die Verarbeitung von neuromorphen Geräten zunimmt, kann auch eine eingeschränktere Quantisierung, wie beispielsweise eine 1-, 2- und 4-Bit-Quantisierung, im Vergleich zu einer herkömmlichen 8-Bit-Quantisierung in ANN verwendet werden. Da SNNs in Hardware eingebettet sind, verfügen neuromorphe Geräte (wie Akida von Brainchip) über die einzigartige On-Edge-Lernfähigkeit. Dies ist mit herkömmlichen Geräten nicht möglich, da sie nur ein neuronales Netzwerk der Von-Neumann-Architektur simulieren, was das On-Edge-Lernen rechenintensiv mit großem Speicher-Overhead macht und außerhalb des Budgets von TinyML-Systemen liegt. Außerdem würden Ganzzahlen zum Trainieren eines NN-Modells nicht genügend Bereich bieten, um ein Modell genau zu trainieren, sodass es derzeit nicht möglich ist, mit 8 Bits auf traditionellen Architekturen zu trainieren. Für traditionelle Architekturen haben derzeit einige Edge-Learning-Implementierungen mit maschinellen Lernalgorithmen (Auto-Encoder, Entscheidungsbäume) eine Produktionsphase für einfache Echtzeit-Analytics-Anwendungsfälle erreicht, während NNs noch untersucht werden.

Zusammenfassend die Vorteile der Verwendung von neuromorphen Geräten und SNN On-Edge:

– Extrem niedriger Stromverbrauch (Milli bis Mikrojoule durch Schlussfolgerung)

– Geringere MAC-Anforderungen im Vergleich zu herkömmlichen NNs

– Weniger Parameterspeicherverbrauch im Vergleich zu herkömmlichen NNs

– On-Edge-Lernfähigkeiten

Neuromorphe TinyML-Anwendungsfälle

Nach allem, was gesagt und getan wurde, können Mikrocontroller mit neuromorphen Kernen in branchenweiten Anwendungsfällen mit ihren charakteristischen Edge-Learning-Funktionen glänzen, wie zum Beispiel:

Bei Anomalieerkennungsanwendungen für vorhandene Industrieanlagen, bei denen die Nutzung der Cloud zum Trainieren eines Modells ineffizient ist, würde das Hinzufügen eines Endpunkt-KI-Geräts in der Engine und das Training am Edge eine einfache Skalierbarkeit ermöglichen, da die Alterung der Geräte von Maschine zu Maschine unterschiedlich ist. Auch wenn es das gleiche Modell ist.
In der Robotik neigen die Gelenke der Roboterarme im Laufe der Zeit dazu, sich abzunutzen, falsch auszurichten und bei Bedarf nicht mehr zu funktionieren. Die Neueinstellung des Fahrers am Edge ohne menschliches Eingreifen verringert die Notwendigkeit, einen Fachmann zu rufen, reduziert Ausfallzeiten und spart Zeit und Geld.
Bei Gesichtserkennungsanwendungen müsste ein Benutzer sein Gesicht zum Datensatz hinzufügen und das Modell in der Cloud neu trainieren. Mit nur wenigen Schnappschüssen des Gesichts einer Person kann das neuromorphe Gerät den Endbenutzer durch On-Edge-Lernen identifizieren, wodurch die Daten der Benutzer auf dem Gerät sicher sind und ein reibungsloseres Erlebnis ermöglicht wird. Dies kann in Autos verwendet werden, wo verschiedene Benutzer unterschiedliche Vorlieben für Sitzposition, Klimatisierung usw. haben.
Fügen Sie in Schlüsselworterkennungs-Apps zusätzliche Wörter hinzu, die Ihr Gerät am Rand erkennen kann. Es kann in biometrischen Anwendungen verwendet werden, bei denen eine Person ein "geheimes Wort" hinzufügen würde, das sie auf dem Gerät sicher aufbewahren möchte.

am rand — Abbildung 3. Anwendungsfälle für On-Edge-Lernen für neuromorphe Geräte

Das Gleichgewicht zwischen dem extrem niedrigen Stromverbrauch neuromorpher Endpunktgeräte und der verbesserten Leistung macht es für erweiterte batteriebetriebene Anwendungen geeignet, bei denen Algorithmen ausgeführt werden, die auf anderen Geräten mit niedrigem Stromverbrauch aufgrund der Rechenbeschränkung nicht möglich sind. Oder umgekehrt, wenn High-End-Geräte mit ähnlicher Rechenleistung zu viel Strom verbrauchen. Zu den Anwendungsfällen gehören:

Intelligente Uhren, die Daten am Endpunkt überwachen und verarbeiten und nur relevante Informationen an die Cloud senden.
Intelligente Kamerasensoren zur Personenerkennung, um einen logischen Befehl auszuführen. Beispielsweise das automatische Öffnen von Türen bei Annäherung einer Person, da die aktuelle Technik auf Näherungssensoren basiert.
Bereiche ohne Konnektivitäts- oder Lademöglichkeiten, z. B. in Wäldern zur intelligenten Verfolgung von Tieren oder zur Überwachung von Rohrleitungen unter dem Meer auf mögliche Risse mithilfe von Schall-, Bild- und Vibrationsdaten in Echtzeit.
Für Anwendungsfälle der Infrastrukturüberwachung, bei denen eine neuromorphe MCU verwendet werden kann, um Bewegung, Vibration und strukturelle Veränderungen in Brücken (über Bildgebung) kontinuierlich zu überwachen, um potenzielle Fehler zu identifizieren.

Energieanwendungsfälle — Abbildung 4. Hochleistungsanwendungsfälle mit extrem niedrigem Stromverbrauch

Schlussfolgerungen

Renesas hat als führendes Halbleiterunternehmen das große Potenzial von neuromorphen Geräten und SNNs erkannt, daher haben wir einen neuromorphen Kern von Brainchip [3] lizenziert, dem weltweit ersten kommerziellen Hersteller von neuromorphem IP, wie Sailesh Chittipeddi, unser Executive Vice, feststellte Präsident von EEnews Europe: „Am unteren Ende haben wir eine ARM M33 MCU und ein neuronales Spike-Netzwerk mit einem für ausgewählte Anwendungen lizenzierten BrainChip-Kern hinzugefügt; Wir haben lizenziert, was wir brauchen, um BrainChip zu lizenzieren, einschließlich der Software, um den Stein ins Rollen zu bringen.“ [4]

Während wir uns bemühen, die bestmöglichen Geräte auf dem Markt zu innovieren und zu entwickeln, sind wir daher gespannt, wie diese Innovation dazu beitragen wird, unser Leben einfacher zu machen.