Autor: Frederik Haak, Director General de la división de negocios de SSD de KIOXIA Europe
A la hora de adquirir SSD (unidades de estado sólido) para centros de datos, la decisión no debe basarse únicamente en el precio. Es más importante seleccionar SSD de alta calidad que se adapten a cada aplicación específica, ya que sus costes totales son menores. ¿A qué se debe esto y a qué especificaciones y características deben prestar atención las empresas a la hora de comprar?
No es raro que los responsables de la toma de decisiones en materia de TI se centren principalmente en el precio a la hora de adquirir SSD. Al fin y al cabo, optar por modelos más económicos puede suponer un ahorro significativo, sobre todo cuando se compran grandes cantidades para equipar centros de datos y salas de servidores. Sin embargo, este planteamiento tiene sus inconvenientes, ya que el precio de compra solo representa una parte del coste total a lo largo de la vida útil de las unidades. Entre los costes adicionales se incluyen el consumo energético, la refrigeración, el mantenimiento, la sustitución de las SSD defectuosas y el tiempo de inactividad.
Estos dos últimos aspectos pueden convertirse en importantes factores de coste si falla un número de unidades superior a la media, sobre todo si los sistemas informáticos afectados no se encuentran in situ y requieren desplazamientos más largos, por ejemplo, a las instalaciones de los clientes o a centros de datos de coubicación. Estos desplazamientos aumentan considerablemente el esfuerzo necesario para sustituir las unidades SDD y prolongan el tiempo de inactividad, durante el cual es posible que las aplicaciones críticas para el negocio no estén disponibles o solo funcionen parcialmente.
MTTF: un indicador de fiabilidad
Una métrica fundamental para la fiabilidad de las SSD es el tiempo medio hasta el fallo (MTTF). Aunque este valor estadístico tiene una importancia limitada para las SSD individuales, proporciona una valiosa información sobre las tasas de fallo esperadas para un gran número de SSD. Por ejemplo, en un parque de 1000 unidades, un MTTF de 2 millones de horas, típico de muchas SSD de centros de datos, se traduce en un fallo aproximadamente cada 2000 horas, o 83 días. Algunos fabricantes, como KIOXIA, han aumentado el MTTF de las SSD para centros de datos hasta el nivel de las SSD empresariales, situándolo en 2,5 millones de horas, lo que supone una diferencia significativa: para las mismas 1000 unidades, la tasa de fallos es de uno cada 2500 horas, o 104 días. Como resultado, es necesario recurrir con mucha menos frecuencia a los técnicos de mantenimiento para sustituir las SSD defectuosas.
La tasa de fallos anualizada (AFR) puede calcularse a partir del MTTF utilizando la siguiente fórmula: AFR = tiempo de funcionamiento anual / MTTF x 100. Expresarla en forma de porcentaje la vuelve mucho más clara e indica la proporción de la flota de SSD que se espera que falle cada año. Un MTTF de 2,5 millones de horas corresponde a una AFR del 0,35 %. A modo de comparación: un MTTF de 2 millones de horas corresponde a una AFR del 0,44 %.
Las SSD para clientes pueden ser más baratas que las de centros de datos y empresas, pero suelen tener un MTTF de tan solo 1,5 millones de horas, lo que, para un parque de 1000 unidades, supondría un fallo cada 1500 horas o 62 días, al menos en teoría. En la práctica, es probable que los fallos sean significativamente más frecuentes, ya que las SSD para clientes no están diseñadas para las elevadas cargas de escritura de los servidores y los sistemas de almacenamiento. Sus celdas de memoria se desgastan más rápido de lo previsto y no pueden compensarse en la misma medida que en las SSD para centros de datos y empresas mediante celdas sobreaprovisionadas. No están diseñadas para funcionar las 24 horas del día, los 7 días de la semana, y no pueden satisfacer los elevados requisitos de rendimiento de la mayoría de las aplicaciones empresariales. Por ello, no son aptas para su uso en entornos de servidores y almacenamiento, aunque su precio pueda parecer atractivo.
Es fundamental que las condiciones sean las adecuadas
Al igual que las SSD para clientes, las SSD para centros de datos y empresas solo alcanzan el MTTF indicado cuando se utilizan en las condiciones de funcionamiento especificadas por el fabricante. Esto se refiere principalmente a la temperatura de funcionamiento y a la «resistencia», especificada en escrituras de unidad por día (DWPD). Superar los valores especificados aumenta la probabilidad de que la unidad falle, incluso durante el periodo de garantía.
Las SSD para centros de datos y empresas suelen estar diseñadas para temperaturas de funcionamiento de hasta 70 o incluso 75 grados. Esto puede parecer elevado, pero dado que los procesadores, los dispositivos de almacenamiento y otros componentes informáticos generan un calor significativo, los sistemas de servidores y almacenamiento pueden calentarse mucho bajo carga. Por lo tanto, el uso de instalaciones climatizadas es obligatorio, sobre todo porque las temperaturas superan cada vez más los 35 °C, incluso en nuestras latitudes, lo que dificulta la disipación del calor en los espacios de oficina estándar. No obstante, las empresas también deben asegurarse de que el aire frío pueda fluir libremente hacia los sistemas y las SSD, es decir, que no quede bloqueado por otros sistemas o componentes ni se mezcle con el aire caliente de salida.
La experiencia ha demostrado que los operadores de grandes centros de datos utilizan soluciones de refrigeración altamente optimizadas para maximizar la fiabilidad de sus SSD, logrando un MTTF de más de 2,5 millones de horas con modelos de alta calidad. Aunque no existe una comunicación oficial de estos valores, cualquier persona que mantenga una buena relación con su proveedor de SSD puede averiguarlos en una conversación privada.
Gestión cuidadosa de las altas cargas de escritura
Para evitar que las sobrecargas provoquen altas tasas de fallo, es importante elegir la SSD adecuada para cada aplicación. Para servidores de archivos, aplicaciones de análisis o streaming multimedia, donde las cargas de trabajo se refieren predominantemente a la lectura de datos, las SSD con un DWPD de 1 suelen ser suficientes. Se les puede escribir a plena capacidad una vez al día durante todo el periodo de garantía de cinco años. Por el contrario, cuando se trata de gestionar grandes volúmenes de datos, como los procedentes del Internet de las cosas (IoT) o del procesamiento de transacciones en línea (OLTP), se requieren SSD con 3 o incluso 10 DWPD.
La mayoría de las SSD para centros de datos y empresas están equipadas con TLC-NAND, que almacena 3 bits por celda. Sin embargo, están llegando al mercado más modelos con QLC-NAND; con 4 bits por celda, esta tecnología permite una mayor densidad de almacenamiento, lo que se traduce en un precio por gigabyte inferior al de los SSD con TLC-NAND. No obstante, dado que se almacenan más bits por celda, estas se ven sometidas a mayores cargas de escritura y se degradan más rápidamente. Por lo tanto, las SSD con QLC-NAND tienen una menor resistencia: su valor DWPD suele ser inferior a 1. Por muy rentables que sean, solo son adecuadas para aplicaciones que generan relativamente pocas operaciones de escritura, como el suministro de datos para el entrenamiento de modelos de IA. En aplicaciones con mayores cargas de escritura, optar por la tecnología supuestamente más barata puede acabar siendo un factor de aumento de los costes a largo plazo si aumentan las tasas de fallo.
En algunos casos, incluso para aplicaciones con un uso intensivo de lectura, puede merecer la pena considerar las SSD con TLC-NAND. Por un lado, tienen un menor consumo de energía y ofrecen un mejor rendimiento por vatio. Además, dado que las SSD tienen capacidades de almacenamiento más reducidas, se requieren cantidades mayores, lo que a menudo permite negociar descuentos más elevados, acercando el precio de la TLC al de la QLC, al menos en cierta medida. Por lo tanto, tiene mucho más sentido calcular los costes totales con precisión que basar una decisión únicamente en el precio de compra.
Un servicio de máxima calidad garantiza la satisfacción de los usuarios
Otra característica distintiva de las SSD es la estabilidad de la latencia, aunque esto no afecta directamente a los costes. Sin embargo, contribuye a la satisfacción del usuario y, por lo tanto, puede generar costes de forma indirecta si los clientes se marchan debido a la latencia fluctuante y a la consiguiente imposibilidad de predecir de forma fiable el rendimiento de las aplicaciones. La estabilidad de alta frecuencia significa simplemente que las SSD alcanzan de forma constante la latencia especificada. Esto resulta especialmente esencial para aplicaciones con requisitos en tiempo real, como el control de la producción y las transacciones financieras, así como en entornos altamente virtualizados con muchos recursos compartidos.
Los picos de latencia suelen producirse mientras una SSD realiza lo que se conoce como tareas de mantenimiento. Entre ellas se incluyen, entre otras cosas, el «nivelado de desgaste» (la distribución uniforme de las cargas de escritura entre todas las celdas de memoria para garantizar un desgaste uniforme) y la «recogida de basura» (liberar áreas de memoria para que puedan eliminarse de forma permanente). Los algoritmos altamente eficientes para estas tareas y los potentes controladores ayudan a garantizar una latencia baja y constante. Sin embargo, dado que las fichas técnicas de las SSD solo especifican la latencia, las empresas deben determinar por sí mismas la estabilidad de la latencia. No obstante, el esfuerzo que supone evaluarlas merece la pena, ya que las diferencias entre las SSD de alta calidad, como la KIOXIA CD8, y los modelos más económicos pueden ser notables.
En última instancia, merece especialmente la pena que las empresas con grandes infraestructuras de TI y los integradores de sistemas, que pueden gestionar casi todo de forma remota para sus clientes, salvo la sustitución de componentes de hardware, analicen de cerca el coste total de las SSD. Los modelos duraderos que ofrecen una alta estabilidad de frecuencia y se adaptan perfectamente a cada aplicación específica reducen los costes de sustitución y aumentan la satisfacción de los usuarios y los clientes, compensando así rápidamente los mayores costes iniciales.
La KIOXIA CD8 se encuentra entre las SSD con mayor estabilidad de frecuencia del sector






