Inicio Artículos La frontera comercial de la Edge AI (IA on the edge): por...

La frontera comercial de la Edge AI (IA on the edge): por qué los datos, y no solo la computación, definirán la próxima era de los hogares inteligentes y el sector industrial

Autor: Axel Störmann, vicepresidente y director de tecnología de productos de memoria y SSD de KIOXIA Europe GmbH

La inteligencia artificial (IA), que antes se limitaba a la nube, ahora avanza hacia dispositivos de borde cada vez más capaces. Este cambio representa la transformación tecnológica más significativa desde la llegada de Internet, ya que está remodelando de forma fundamental la forma en que se ofrece y comercializa la inteligencia a gran escala. Sin embargo, lograr una verdadera inteligencia en el borde depende de dos factores fundamentales: los datos recopilados, almacenados y accesibles en el dispositivo, y la infraestructura de memoria que los respalda.

Si bien la teoría de la IA ha existido durante décadas, su adopción generalizada, especialmente en el borde, solo ha sido posible con la llegada de suficiente computación y memoria local. La IA sirve como elemento habilitador, y su utilidad realmente destaca cuando se pone en práctica en aplicaciones y usos específicos que requieren sus capacidades. El almacenamiento, olvidado durante mucho tiempo, está emergiendo ahora como un elemento clave (y una limitación) para la ampliabilidad de la Edge AI. La memoria flash BiCS FLASH™ 3D de KIOXIA, en particular su última generación, BiCS FLASH™ generación 8, está diseñada para proporcionar la densidad, la velocidad y la resistencia necesarias para impulsar esta próxima ola de innovación de la Edge AI.

Por qué el borde ocupa ahora un lugar central

La migración de la IA desde los centros de datos centralizados a dispositivos de borde cada vez más capaces marca un momento crucial en la tecnología. Los primeros modelos de IA, limitados a los centros de datos, se enfrentaban a importantes limitaciones, como la latencia, los problemas de privacidad y los cuellos de botella en la conectividad, lo que dificultaba su uso en tiempo real. Los sistemas de borde de primera generación carecían de la memoria y el ancho de banda necesarios para cargas de trabajo exigentes, como la visión artificial o el diagnóstico médico por imagen. Sin embargo, los avances tecnológicos han cambiado este panorama. La combinación de arquitecturas de memoria flash avanzadas, como BiCS FLASH™, y de procesadores de aprendizaje automático (ML) de bajo consumo permite ahora una inferencia de alto rendimiento directamente en el dispositivo.

Es fundamental señalar que el camino hacia la monetización de la IA no solo depende de la creación de modelos más inteligentes, sino de su aplicación en lugares donde puedan tomar decisiones en tiempo real y de gran valor, es decir, en el borde. La inferencia de la Edge AI se está convirtiendo rápidamente en el mecanismo dominante para su despliegue en el mundo real, lo que está impulsando el valor comercial en diversos sectores, desde la automoción hasta la agricultura. Vender IA de forma eficaz significa habilitarla en el borde, lo que permite un procesamiento local que supera los problemas de latencia, rendimiento insuficiente o costes prohibitivos asociados a los servicios exclusivos de la nube.

La Edge AI también constituye la base de un mundo conectado en el que la inteligencia distribuida abarca tanto el borde como la nube, creando un ecosistema de dispositivos que funcionan de forma autónoma y, al mismo tiempo, colaboran a través de redes. Un asombroso 70 % de todos los datos se genera actualmente en el borde, lo que convierte la gestión, el almacenamiento y la seguridad de estos datos en una prioridad estratégica fundamental. Tanto las empresas como los usuarios finales exigen cada vez más un rendimiento rápido, privado y fiable de los sistemas de IA integrados en el borde.

El cambio al borde no es solo una evolución técnica, sino una necesidad empresarial, ya que se prevé que la inferencia en el borde se convierta en la principal oportunidad de negocio a nivel mundial, de tal forma que supere las inversiones en la nube central. Los dispositivos de borde, especialmente en torno a aplicaciones como hogares inteligentes, automatización industrial y sistemas de automoción, requieren no solo un alto rendimiento, sino un bajo consumo de energía, una alta fiabilidad y una baja latencia. Por ejemplo, las imágenes médicas y la fabricación inteligente requieren almacenamiento local para el procesamiento, la consulta de datos históricos y la optimización continua de los modelos. Los vehículos conectados requieren almacenamiento de borde para la fusión de sensores, el registro de sistemas avanzados de asistencia al conductor (ADAS) y actualizaciones seguras por aire (OTA). Estas aplicaciones ponen de relieve la necesidad de contar con soluciones de memoria local robustas y de alto rendimiento.

Lo primero, los datos: por qué es importante el almacenamiento de borde

La recopilación y la conservación de datos sin procesar en el dispositivo debe preceder a la selección del modelo para crear sistemas de Edge AI seguros, que cumplan con la normativa y de alto rendimiento. Los datos, que antes se consideraban un coste de disposición, se han transformado en el combustible indispensable que impulsa la innovación en IA. Antes de que cualquier modelo de IA pueda ejecutarse o mejorarse, se requieren datos locales de los que aprender, sobre los que actuar y que conservar.

Este cambio fundamental en la percepción es significativo, pues los datos son el poder de las empresas y pueden considerarse como el nuevo petróleo crudo. Las empresas que poseen grandes cantidades de datos se consideran ahora ricas, en lugar de estar lastradas por los costes de almacenamiento, ya que estos datos pueden ser muy valiosos para entrenar modelos para aplicaciones médicas, automovilísticas, de automatización industrial y otras aplicaciones inteligentes.

El almacenamiento en dispositivos ofrece ventajas sustanciales, como el cumplimiento de las estrictas normativas de privacidad y una menor dependencia de redes potencialmente inestables. Además, los registros locales cifrados reducen significativamente la superficie de ataque en comparación con las soluciones que solo funcionan en la nube, lo que mejora la seguridad general del sistema.

Un almacenamiento de borde suficiente permite crear canalizaciones de IA híbridas en las que los flujos de trabajo similares a los de la nube pueden ejecutarse a nivel local, descargando en la nube solo las tareas más sensibles a la latencia o que requieren un mayor poder de cálculo. Aunque la capacidad flash adicional conlleva un coste, ofrece ventajas inestimables en términos de resiliencia, cumplimiento normativo y confianza de los usuarios.

El auge del entrenamiento y el perfeccionamiento en el borde, cada vez más común en dispositivos de larga duración como vehículos, activos de fábrica y herramientas médicas, crea cargas de trabajo de escritura sostenidas que exigen un almacenamiento de alta resistencia. La explosión de datos de sensores procedentes de cámaras, radares y telemetría significa que se deben registrar, clasificar o procesar a nivel local enormes volúmenes de entrada.

Es fundamental señalar que no existe ningún caso de negocio viable de Edge AI sin inferencia, y la inferencia requiere fundamentalmente datos. Además, los datos recopilados hoy en día no solo alimentan los modelos actuales, sino que se conservan para futuros reentrenamientos, actualizaciones de modelos y mejoras algorítmicas. Esta retención estratégica de datos garantiza la innovación y la adaptabilidad futuras.

La creciente atención prestada a la localización, impulsada por los cambios geopolíticos y las preocupaciones sobre la soberanía nacional, la sostenibilidad y la seguridad, subraya aún más la importancia del almacenamiento local de datos. Los sistemas distribuidos con procesamiento local de datos son inherentemente más seguros y fiables, ya que reducen la dependencia de entidades centralizadas y mejoran el control sobre la información confidencial. Esta toma de conciencia colectiva significa que los desarrolladores de sistemas de borde deben reevaluar fundamentalmente su acercamiento a la IA.

City isometric plan with road and buildings on smart phone. Map on mobile application. 3d vector illustration.

BiCS FLASH™ generación 8 y la Edge AI

La memoria flash 3D BiCS FLASH™ de KIOXIA está a la vanguardia en cuanto al cumplimiento de los exigentes requisitos de las modernas cargas de trabajo de Edge AI, ya que ofrece una capacidad, un rendimiento y una resistencia insuperables. KIOXIA inventó la memoria flash NAND hace más de 35 años y fue la primera en anunciar la tecnología de memoria flash 3D en 2007. La última oferta, BiCS FLASH™ generación 8, cuenta con varias innovaciones revolucionarias:

  • Arquitectura avanzada con 218 capas y tecnología CBA: la BiCS FLASH™ generación 8 emplea una estructura NAND 3D de 218 capas combinada con la tecnología de unión de obleas CMOS Directly Bonded to Array (CBA). Esta innovación arquitectónica permite fabricar los circuitos CMOS (que controlan las celdas de memoria) y la matriz de celdas de memoria en obleas separadas, cada una optimizada de forma independiente, y luego unirlas con precisión. De esta forma, se elimina la tradicional disyuntiva entre la fiabilidad de las celdas y la velocidad de E/S, lo que supone un gran avance en cuanto a eficiencia energética, rendimiento, densidad y rentabilidad. El meticuloso proceso de unión de obleas, que requiere una precisión de alineación comparable a 1 mm o menos si una oblea tuviera 1 km de diámetro, garantiza la fiabilidad y la funcionalidad del producto. A pesar de tener aproximadamente un 5 % menos de capas que algunos productos de la competencia, la BiCS FLASH™ generación 8 alcanza una densidad de gigabytes entre un 15 y un 20 % mayor, lo que demuestra el empeño de KIOXIA por lograr una integración eficiente más allá del simple aumento del número de capas.
  • Mejoras significativas en el rendimiento: la BiCS FLASH™ generación 8 ofrece un aumento del 20 % en el rendimiento de escritura y una mejora de más del 10 % en la latencia de lectura en comparación con las generaciones anteriores (concretamente, la BiCS FLASH™ generación 6). Esto se traduce en un procesamiento de datos más rápido, lo cual es crucial para la inferencia y el entrenamiento de IA en tiempo real en el borde, donde la rapidez en la toma de decisiones es fundamental. Su velocidad de interfaz también se ha incrementado significativamente hasta los 3,6 Gbps.
  • Eficiencia energética mejorada: una mejora del 30 % en la eficiencia energética (durante la operación de escritura) hace que la BiCS FLASH™ generación 8 sea especialmente adecuada para dispositivos de borde con restricciones energéticas que a menudo dependen de la energía de la batería.
  • Mayor densidad de bits: la implementación de la tecnología de reducción lateral ha dado como resultado un aumento del 50 % en la densidad de bits. Esto permite almacenar más datos en formatos compactos, una ventaja clave para los dispositivos de Edge AI que requieren almacenar grandes conjuntos de datos de forma local.
  • Soluciones de almacenamiento de alta capacidad: la BiCS FLASH™ generación 8 es compatible con configuraciones de celda de triple nivel (TLC) (3 bits por celda) y celda de cuádruple nivel (QLC) (4 bits por celda). La tecnología QLC amplía significativamente la capacidad, lo que permite alcanzar los 4 terabytes (TB) en un solo paquete utilizando una arquitectura apilada de 16 matrices. Esto satisface las crecientes necesidades de almacenamiento de las aplicaciones de Edge AI que implican un procesamiento de datos y un almacenamiento de modelos extensivos.

Más allá de estas características, la arquitectura BiCS FLASH™ generación 8 es compatible con estrategias de desplazamiento de DRAM, lo que puede reducir los costes generales del sistema sin perder rendimiento. Las memorias flash, como BiCS FLASHTM, tienen un menor consumo de energía en comparación con la DRAM, lo que las convierte en una opción atractiva para determinadas tareas de cálculo o inferencia en las que este reemplazo es factible. A medida que la inferencia de edge AI continúa expandiéndose en todas las industrias, desde el análisis minorista hasta la robótica, la demanda de soluciones de alta resistencia como BiCS FLASH™ generación 8 sin duda crecerá, lo que la convierte en fundamental para la era de la Edge AI.

KIOXIA ofrece una serie de soluciones de memoria, entre las que se incluyen la BiCS FLASH™ generación 8 y la BiCS FLASH™ generación 5, lo que demuestra su compromiso de proporcionar diversas densidades y capacidades para abarcar diversas áreas de aplicación, como la automoción y el sector industrial.

Resumen de perspectivas de futuro: el futuro de la Edge AI

El futuro de la IA está cada vez más entrelazado con las capacidades de los dispositivos en el borde. A medida que los modelos de IA siguen creciendo en tamaño y complejidad y los volúmenes de datos aumentan, la demanda de computación y almacenamiento locales se intensificará, lo que hará que las plataformas con gran capacidad de memoria, como la BiCS FLASH™ generación 8, sean esenciales.

Las tendencias emergentes definirán aún más este panorama:

  • Aprendizaje federado: un planteamiento descentralizado del aprendizaje automático en el que varios clientes entrenan un modelo de forma colaborativa, manteniendo sus datos a nivel local, lo que garantiza la privacidad y la seguridad de los datos.
  • Detección de anomalías en tiempo real: la identificación de patrones o comportamientos inusuales en los datos a medida que se producen, lo que resulta crucial para aplicaciones como la detección de fraudes, el mantenimiento predictivo y la seguridad de las redes. Los métodos de detección de anomalías sin supervisión son especialmente adecuados para el análisis en tiempo real de datos en streaming, ya que se adaptan a las tendencias cambiantes sin necesidad de disponer de conjuntos de datos preetiquetados.
  • Flujos de trabajo híbridos en el borde y en la nube: combinan las capacidades de computación en el borde y en la nube para optimizar el procesamiento y el análisis de datos. Los datos se procesan de forma local en el borde para tomar decisiones inmediatas (lo que reduce la latencia y el uso del ancho de banda y mejora la seguridad) y, a continuación, los datos refinados se transfieren a la nube para su posterior análisis, almacenamiento o procesamiento avanzado. Los ejemplos abarcan ciudades inteligentes, atención sanitaria, fabricación, comercio minorista, medios de comunicación y entretenimiento, así como recuperación ante desastres.

La dinámica del mercado indica claramente que la adopción de la tecnología está impulsada por beneficios tangibles para los usuarios. Las estrategias basadas en los datos, junto con soluciones de memoria robustas, están creando el impulso necesario para esta transformación. Los dispositivos de borde del futuro no solo ejecutarán la IA, sino que serán fundamentales para su comercialización. El valor empresarial no se derivará de la mera complejidad de los modelos de IA, sino de la inferencia oportuna, precisa y monetizable en el borde.

Sin duda, la IA alcanzará un alto grado de madurez y estandarización en muchas áreas. El cambio estratégico general se orienta hacia modelos híbridos de borde/nube, impulsados por las necesidades inmediatas de las aplicaciones, las consideraciones geopolíticas en evolución y la necesidad imperiosa de localizar los datos. Esta dinámica significa que los desarrolladores de borde deben ahora cambiar fundamentalmente su perspectiva: ya no se trata solo de «¿cómo procesaremos la IA?», sino, lo que es más importante, «¿dónde están los datos y cómo los almacenaremos?» La BiCS FLASH™ generación 8 de KIOXIA está diseñada específicamente para dar una respuesta completa a esta pregunta, lo que allana el camino para la próxima ola de innovación en Edge AI.