Investigadores del MIT y la Universidad de Tufts han desarrollado un esquema de gestión que mejora el rendimiento de SSDs agrupados, mitigando las ralentizaciones causadas por las operaciones de borrado y escritura de bloques y la recolección de basura.
Denominado Sandook, este esquema separa las características de rendimiento a corto y largo plazo que limitan los SSDs utilizando una estructura de control de dos capas alimentada con telemetría de software agente que se ejecuta en servidores de almacenamiento.
El rendimiento de los SSDs puede fluctuar significativamente según la combinación de solicitudes de lectura y escritura. Dado que las escrituras requieren un ciclo de borrado y reescritura a nivel de bloque, son mucho más lentas que las lecturas, y el tráfico de escritura intenso puede degradar el rendimiento general de lectura. El rendimiento también puede variar entre configuraciones de SDS de diferentes proveedores, e incluso entre SSDs del mismo fabricante y lote. Cuando un controlador de SSD recupera celdas eliminadas dentro de un bloque, debe copiar los datos válidos, borrar el bloque y devolverlo al grupo libre, un proceso conocido como recolección de basura. Esta operación suele ser gestionada de forma independiente por cada controlador de SSD y puede provocar caídas de rendimiento repentinas y significativas.
Los investigadores imaginan un clúster de cómputo que consta de nodos de cómputo y servidores de almacenamiento. Un controlador central opera dentro del clúster de cómputo, junto con software cliente en servidores de cómputo y software agente en servidores de almacenamiento. Los servidores de almacenamiento utilizan SSDs estándar, listos para usar, cada uno equipado con su propio controlador nativo.
El Controlador Sandook mantiene un registro de todos los SSDs, habiendo perfilado cada uno para establecer líneas de base de rendimiento como las capacidades de IOPS. Asigna modos de lectura o escritura a unidades individuales y recibe actualizaciones de rendimiento en tiempo real cada 200 ms de los agentes Sandook en los servidores de almacenamiento. Utilizando estos datos, calcula pesos de lectura y escritura ajustados a la demanda global de E/S del clúster y comparte estas decisiones de programación con el software cliente Sandook en los servidores de cómputo.
Para las lecturas, Sandook aprovecha la replicación de bloques existente, ya utilizada para la tolerancia a fallos, para enrutar de forma flexible las solicitudes de lectura a través de réplicas en diferentes SSDs. Para las escrituras, utiliza un diseño de estructura de registro que permite que las escrituras se dirijan a cualquier SSD independientemente de la ubicación del bloque lógico. Este alto grado de flexibilidad garantiza que las políticas de programación se puedan aplicar sin restricciones.
El software cliente Sandook expone una interfaz de dispositivo de bloque estándar a las aplicaciones, enrutando de forma transparente las solicitudes de E/S a los SSDs más apropiados según las reglas de programación del controlador. También recibe el estado de los SSDs en tiempo real de los agentes del lado del almacenamiento y puede despriorizar un SSD durante la recolección de basura. Las solicitudes de lectura y escritura se redirigen entonces a otras unidades, evitando una latencia de cola excesiva en el sistema de almacenamiento general.
Los agentes Sandook (1) procesan comandos de lectura y escritura de los clientes y los reenvían a los SSDs de destino; (2) proporcionan monitorización independiente del hardware, incluyendo perfilado periódico y señales de estado en tiempo real, para soportar la programación del controlador; y (3) retransmiten señales de congestión de SSD a los clientes para que eventos a corto plazo como la recolección de basura puedan ser manejados local e inmediatamente cambiando la E/S a otros SSDs en el servidor.
La sobrecarga de memoria y CPU de monitorizar docenas de SSDs por servidor de almacenamiento es mínima.
Los investigadores evaluaron Sandook bajo cuatro cargas de trabajo:
- LeanStore: un motor de almacenamiento OLTP de alto rendimiento optimizado para CPUs multinúcleo y SSDs NVMe.
- Aprendizaje automático: entrenamiento de un modelo Unet3D CNN con PyTorch en un conjunto de datos de 180 GB.
- LZ4: compresión de imágenes en el conjunto de datos ImageNet ILSVRC2015.
- Servidor de almacenamiento: un servidor de almacenamiento de bloques de código abierto de alto rendimiento que sirve a aplicaciones sensibles a la latencia.
En general, Sandook mejora el rendimiento bruto de E/S en un 30-82% en comparación con los sistemas existentes que solo abordan una fuente de variabilidad de rendimiento, manteniendo una latencia de cola inferior a un milisegundo. Para aplicaciones no modificadas que comparten un grupo de SSDs, el rendimiento de extremo a extremo mejora entre un 12% y un 94%.
Específicamente, en comparación con sistemas anteriores, ofrece un 1,7 veces mayor rendimiento de almacenamiento, un 1,12-1,94 veces mayor rendimiento de aplicación, una latencia un 71-88% menor y una utilización de GPU un 23% mayor, sin necesidad de hardware personalizado ni cambios en las aplicaciones.
El artículo de Sandook, titulado "Unleashing The Potential of Datacenter SSDs by Taming Performance Variability" (Liberando el Potencial de los SSDs de Centro de Datos Domando la Variabilidad del Rendimiento), está disponible como PDF descargable. El trabajo se presentará en el Simposio USENIX sobre Diseño e Implementación de Sistemas en Red (NSDI 2026) en Renton, Washington, del 4 al 6 de mayo.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Director de Estrategia Global
WhatsApp / WeChat: +86 13426366826
Correo electrónico: yangyd@qianxingdata.com
Sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque de Negocio:
Distribución de Productos TIC/Integración de Sistemas y Servicios/Soluciones de Infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas mundiales para ofrecer productos fiables y servicios profesionales.
"Usando la Tecnología para Construir un Mundo Inteligente" ¡Su Proveedor de Servicios de Productos TIC de Confianza!