DapuStor J5060 Las especificaciones
| El contenido de nitrato de sodio en el agua | |
|---|---|
| Capacidad (TB) | 61.44 |
| Factor de forma | U.2 15 mm |
| Interfaz | PCIe 4.0 x4, NVMe 1.4a, soportado con dos puertos |
| Ancho de banda de lectura/escritura (128K) MB/s | 7400 / 3000 |
| Lectura/escritura aleatoria (4KB) K IOPS | 1500 / 30 (16KB) |
| La latencia aleatoria de 4K (tipo) R/W μs | 105 (4KB) / 33 (16KB) |
| La latencia secuencial de 4K (tipo) R/W μs | 7 (4KB) / 12 (16KB) |
| Potencia típica (W) | 23 |
| Potencia en reposo (W) | 5 |
| Tipo de flash | 3D Enterprise QLC y NAND Flash |
| La resistencia | 0.5 DWPD |
| El número de unidades | 2 millones de horas |
| UBER | 1 sector por 10^17 bits leídos |
| Garantización | 5 años |
DapuStor J5060 Rendimiento
Control de los puestos de control
Para evaluar el rendimiento del SSD Dapustor J5060 en el mundo real en entornos de entrenamiento de IA, utilizamos la herramienta de referencia Data and Learning Input/Output (DLIO).,DLIO está diseñado específicamente para probar patrones de E/S en cargas de trabajo de aprendizaje profundo.y formación de modelosEl siguiente gráfico ilustra cómo ambas unidades manejan el proceso a través de 99 puntos de control.prevención de la pérdida de progreso durante las interrupciones o los fallos de energíaEsta demanda de almacenamiento requiere un rendimiento robusto, especialmente bajo cargas de trabajo sostenidas o intensivas.
La plataforma elegida para este trabajo fue nuestro Dell PowerEdge R760 ejecutando Ubuntu 22.04.02 LTS. Utilizamos la versión 2.0 del benchmark DLIO del lanzamiento del 13 de agosto de 2024.
- 2 x Intel Xeon Gold 6430 (32 núcleos, 2.1GHz)
- 16 x 64 GB DDR5-4400
- SSD de 480 GB Dell BOSS
- Los cables de serie Gen5 JBOF
- 61.44TB Dapustor J5060 y otros
- 61.44TB Solidigm D5-P5336 y otros.44TB
Para asegurarnos de que nuestro benchmarking refleja escenarios del mundo real, basamos nuestras pruebas en la arquitectura del modelo LLAMA 3.1 405B. Implementamos puntos de control usando torch.save() para capturar los parámetros del modelo,estados del optimizadorNuestra configuración simuló un sistema de 8 GPU, implementando una estrategia de paralelismo híbrido con un tensor paralelo de 4 vías y un procesamiento paralelo de tubería de 2 vías distribuidos a través de las 8 GPU..Esta configuración dio como resultado tamaños de puntos de control de 1.636 GB, representativos de los requisitos de capacitación de modelos de lenguaje grandes modernos.
En general, el Dapustor J5060 demostró una sólida consistencia durante la fase inicial de prueba, con tiempos que oscilaron alrededor de 575.66 segundos para los primeros 33 puntos de control.El 5060J fue capaz de mantener un mayor rendimiento antes de que la unidad se llenó por primera vezPor otro lado, el Solidigm P5336, aunque inicialmente más lento que el J5060, demostró un rendimiento constante a medida que las pruebas continuaban.
¿Cuándo?Considerando los promedios generales, el Dapustor J5060 registró un tiempo de769.44 segundos, mientras que el Solidigm P5336 terminó en 640.17 segundosEsto pone a la Solidigm P5336 por delante en términos de ahorrar puntos de control más rápido.
En general, el Dapustor J5060 maneja bien operaciones más cortas, pero tiene problemas con escrituras sostenidas más allá de 30 minutos.el Solidigm P5336 es el mejor motor para un rendimiento constante durante tareas prolongadasEste rendimiento de escritura más débil del Dapustor J5060 es evidente cuando su velocidad de control se deteriora a medida que continúa la prueba.
Almacenamiento directo de GPU
GPU Direct Storage es una tecnología que permite la transferencia directa de datos entre dispositivos de almacenamiento y GPU, evitando la CPU y la memoria del sistema.Los datos se leen desde el almacenamiento en la memoria de la CPU y luego se copian a la memoria de la GPUEste proceso implica múltiples copias de datos, lo que conduce a un aumento de la latencia y un rendimiento reducido.GDS elimina este cuello de botella al permitir directamente que los dispositivos de almacenamiento transfieran datos desde y hacia la memoria de la GPU.
Hemos probado sistemáticamente cada combinación de los siguientes parámetros tanto en las cargas de trabajo de lectura como de escritura:
- Tamaños de bloques: 1M, 128K, 16K
- Profundidad: 128, 64, 32, 16, 8, 4, 1
Mientras revisamos nuestros resultados de GDSIO, examinamos el rendimiento de lectura y escritura de los Dapustor J5060 y Solidigm P5336 de 61.44TB.
Desempeño de lectura secuencial de GDSIO
El Dapustor J5060 alcanza un rendimiento máximo de lectura de 4,2 GiB/s en un tamaño de bloque de 1M con profundidades de IO de 64 y 128.8 GiB/s a medida que aumenta la profundidad del IOEsto muestra una clara preferencia por tamaños de bloques más grandes con altas profundidades de IO para un rendimiento óptimo.indicando la eficiencia de la unidad para manejar transferencias masivas de datos.
En comparación, el Solidigm P5336 alcanzó un rendimiento máximo similar de 4.3 GiB/s en el mismo tamaño de bloque (1M) pero logró ese rendimiento antes a una profundidad de IO de 32 y lo mantuvo constantemente a profundidades de IO más altasEsto sugiere una eficiencia ligeramente mejor en el manejo de grandes tamaños de bloques en un rango más amplio de profundidades de IO para el Solidigm P5336.
Para dar una mejor visión comparativa, tenemos un gráfico diferencial que compara ambas unidades.mientras que un bloque que se mueve hacia el lado rojo del espectro muestra una debilidadAquí, el J5060 supera al P5336 en el tamaño de bloque de 128K, excepto para las profundidades de 4 a 8 IO. Sin embargo, se observan caídas de rendimiento en profundidades de IO más altas con tamaños de bloque de 16K y 1M,Indicando una menor eficiencia en esos escenarios.
En la comparación secuencial de latencia de lectura, el Solidigm P5336 mantiene consistentemente una latencia más baja que el Dapustor J5060 en casi todos los tamaños de bloques y profundidades de IO.la brecha se hace más pronunciada a medida que aumenta la profundidad de la cola: el J5060 alcanza su punto máximo a 2.329 μs a una profundidad de 128, mientras que el P5336 se mantiene más bajo a 1.365 μs.080 μs en el J5060 frente a 5539 μs en el P5336) a profundidad 128En el tamaño de bloque de 1M, ambas unidades experimentan aumentos de latencia como se esperaba, pero el P5336 sigue siendo ligeramente mejor controlado, con 29,138 μs frente a 29,512 μs en la mayor profundidad de cola.
Desempeño de escritura secuencial de GDSIO
El Dapustor J5060 muestra un rendimiento de escritura constante de 2,7 a 2,8 GiB/s para bloques de 128K y 1M en todas las profundidades de IO (excepto 128K, 1 IO de profundidad de tamaño, que registró 2.2GiB/s. Para bloques de 16K,los rangos de rendimiento van desde 0.5 GiB/s a 1.4 GiB/s, dependiendo de la profundidad de la IO, alcanzando un máximo de 1.4 GiB/s en profundidades de la IO más altas.
En comparación, el Solidigm P5336 tiene un mejor rendimiento durante los tamaños de bloque de 128K y 1M, alcanzando un máximo de 3.2GiB/s. Para tamaños de bloque más pequeños (16K), el Solidigm P5336 también muestra un mayor rendimiento,alcanzando un pico de 1.4 GiB/s a profundidades de IO de 16 a 64. Esto indica que el Solidigm P5336 es ligeramente más eficiente con tamaños de bloque más pequeños durante las operaciones de escritura.
Pasando a una vista diferencial, vemos una apertura de brecha más grande entre el Dapustor J5060 y el rendimiento de escritura del Solidigm P5336.Nuestra comparación de rendimiento muestra que el J5060 se queda atrás del P5336 en la mayoría de las áreas, particularmente con grandes tamaños de bloques (1M) en todas las profundidades de IO. Las caídas de rendimiento alcanzan -0.5 GiB/s en las profundidades de 4 IO.no son lo suficientemente significativas como para compensar el bajo rendimiento más amplio.
Al comparar la latencia de escritura secuencial entre el Dapustor J5060 y Solidigm P5336, ambas unidades muestran un comportamiento similar en tamaños de bloques más pequeños como 16K,con Solidigm manteniendo un ligero borde a profundidades inferiores de IO, mientras que Dapustor cierra la brecha en profundidades más altas (64 y 128).Pero Dapustor siempre ofrece una latencia más baja a medida que aumenta la profundidad de IOSin embargo, con tamaños de bloques de 1M, Solidigm mantiene una clara ventaja de latencia en todas las profundidades de IO,mostrando tiempos de respuesta significativamente más rápidos bajo cargas de trabajo de escritura secuencial pesadasEn general, Solidigm se desempeña de manera más consistente, mientras que la fuerza de Dapustor es más visible en bloques de tamaño medio y colas más profundas.
Resumen de la carga de trabajo del FIO
El Flexible I/O Tester (FIO) es una herramienta de benchmarking estándar de la industria utilizada para medir el rendimiento de los dispositivos de almacenamiento en una amplia variedad de escenarios de carga de trabajo.Confiable por su versatilidad y fiabilidad, FIO simula condiciones del mundo real, proporcionando información sobre las capacidades y los límites de rendimiento de un SSD.,y IOPS a través de patrones de carga de trabajo, tamaños de bloques y profundidades de cola.
Cargas de trabajo aplicadas:
- 128K Lectura y escritura secuenciales
- 64K Lecturas y escrituras aleatorias
- 16K Lectura y escritura al azar
- Lectura y escritura aleatoria 4K
Estas cargas de trabajo representan un amplio espectro de casos de uso empresarial, incluyendo grandes transferencias secuenciales, I/O aleatorios intensivos típicos de las bases de datos,y accesos aleatorios de bloque pequeño comúnmente vistos en entornos virtualizados.
Esta sección de rendimiento resume el rendimiento del Dapustor J5060 ′s en cargas de trabajo sintéticas clave, incluidas las operaciones de lectura / escritura secuenciales y aleatorias en diferentes tamaños de bloques y profundidades de cola.Las métricas se extraen directamente de la salida de fio analizado e incluyen ancho de banda (MB / s), IOPS y percentiles de latencia de hasta 99.9999%, ofreciendo información sobre el rendimiento y el comportamiento de la cola bajo carga.
Rendimiento de lectura y escritura secuencial de 128K
| El motor | Profundidad del hilo/IO | BW (MB/s) | Las entidades de crédito | 990,0% | 990,9% | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Leído | 1T/64Q | 7,482 | 57,081 | 1.66 ms | 2.02 ms | 2.83 ms |
| Se puede utilizar el método de cálculo de las emisiones. | 1T/64Q | 7,479 | 57,057 | 1.51 ms | 1.66 ms | 1.81 ms |
| Dapustor J5060 Escribir | 1T/16Q | 3,023 | 23,063 | 0.69 ms | 0.69 ms | 0.70 ms |
| Solidigm P5336 Escribir | 1T/16Q | 3,364 | 25,669 | 2.67 ms | 3.48 ms | 4.42 ms |
El Dapustor J5060 ofrece un impresionante rendimiento de lectura secuencial a 128K, alcanzando 7.48GB/s con un control de latencia ajustado, incluso en percentiles más altos.el rendimiento de los J5060 es esencialmente el mismo (7Sin embargo, Solidigm mantiene una ligera ventaja en la consistencia de latencia, mostrando una latencia de cola ligeramente más baja.
En escrituras secuenciales de 128K (QD16), el J5060 logra un rendimiento sólido de 3,023MB/s con una latencia muy baja.Aunque a una latencia notablemente mayorEsto indica que el J5060 es un candidato más fuerte para escenarios de escritura secuencial sensibles a la latencia.
64K rendimiento de lectura y escritura aleatoria
| El motor | Profundidad | BW (MB/s) | Las entidades de crédito | 990,0% | 990,9% | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Leído | 8T/32Q | 7,475 | 114,058 | 20.05 ms | 21.89 ms | 25.82 ms |
| Se puede utilizar el método de cálculo de las emisiones. | 8T/32Q | 7,472 | 114,014 | 21.36 ms | 21.89 ms | 22.68 ms |
| Dapustor J5060 Escribir | 8T/32Q | 534 | 8,151 | 574.6 ms | 708.8 ms | 742.39 ms |
| Solidigm P5336 Escribir | 8T/32Q | 857 | 13,070 | 196.1 ms | 208.6 ms | 221.24 ms |
En lecturas aleatorias de 64K (QD256), el Dapustor J5060 sobresale con un rendimiento cercano a 7.4GB/s y una latencia bien controlada.con una latencia máxima del percentil ligeramente mejorAmbas unidades funcionan excepcionalmente aquí, con diferencias prácticas mínimas.
El rendimiento de escritura a 64K aleatorios es donde el J5060 lucha notablemente, con un rendimiento que cae bruscamente a 534MB/s y una latencia que aumenta significativamente (742.39ms a 99.99%).el Solidigm P5336 supera significativamente el J5060, ofreciendo 857MB/s y una latencia drásticamente más baja (221,24 ms en el mismo percentil), lo que lo hace mucho más adecuado para aplicaciones sensibles a la latencia y el rendimiento de escritura sostenido.
16K rendimiento aleatorio de lectura y escritura
| El motor | Profundidad | BW (MB/s) | Las entidades de crédito | 990,0% | 990,9% | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Leído | 8T/32Q | 7,430 | 453,461 | 5.28 ms | 6.39 ms | 8.16 ms |
| Se puede utilizar el método de cálculo de las emisiones. | 8T/32Q | 7,431 | 453,527 | 5.01 ms | 5.21 ms | 5.47 ms |
| Dapustor J5060 Escribir | 8T/32Q | 531 | 32,404 | 143.65 ms | 149.94 ms | 181.40 ms |
| Solidigm P5336 Escribir | 8T/32Q | 847 | 51,724 | 57.9 ms | 65.8 ms | 71.8 ms |
En la carga de trabajo de lectura aleatoria de 16K (QD256), el Dapustor logra excelentes resultados con 453K IOPS y latencia controlada.En el caso de los medicamentos de la familia de los que se trata, el valor de la dosis de Dapustor en latencia es ligeramente superior al de Dapustor (5)..47ms frente a 8.16ms a 99.99%), lo que sugiere una consistencia de latencia ligeramente mejor para Solidigm en escenarios de lectura aleatoria pesados.
El rendimiento de escritura aleatoria de 16K de los SSD Dapustor disminuye significativamente a 32K IOPS, y la latencia aumenta a 181.4ms (99.99%).entregando 51.7K IOPS y un perfil de latencia dramáticamente mejorado (71.8ms al 99.99%), lo que subraya la ventaja de Solidigm para cargas de trabajo de escritura aleatoria sensibles a la latencia.
China, China, China, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón.
Sandy Yang, directora de estrategia global
WhatsApp / WeChat: +86 13426366826 El número de teléfono es:
Correo electrónico: yangyd@qianxingdata.com
El sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque en el negocio:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas globales para ofrecer productos confiables y servicios profesionales.
Usar la tecnología para construir un mundo inteligente¡Su proveedor de servicios de productos TIC de confianza!



