La línea de Phison's Pascari X-Series está diseñada para satisfacer las diversas demandas de almacenamiento de los entornos empresariales,ofrecer soluciones personalizadas optimizadas tanto para cargas de trabajo de lectura intensiva como de escritura intensivaEn el núcleo de la línea está el X200P, un modelo de alta capacidad que admite capacidades de almacenamiento de hasta 30.72TB con una clasificación de 1 DWPD (Drive Writes Per Day).Aprovechando la tecnología PCIe Gen5 y TLC NAND, el X200P está disponible en U.3¿ Qué pasa?2, y los factores de forma E3.S ofrecen flexibilidad para integrarse sin problemas en diversas configuraciones de infraestructura empresarial.
Diseñado para ser versátil, el X200P sobresale en una amplia gama de casos de uso empresarial, incluyendo redes de entrega de contenido a gran escala, cargas de trabajo de inferencia de IA,y el archivo de datos en frío, donde la alta capacidad y el rendimiento de lectura fiable son primordialesComplementando el X200P está la serie X200E de Phison, una línea de alta resistencia optimizada específicamente para escenarios de escritura intensiva.6 TB, el X200E es ideal para aplicaciones de misión crítica como bases de datos transaccionales, análisis de datos en tiempo real y procesamiento de registros de alto volumen.
Enfocándose en el Phison Pascari X200P para esta revisión, Phison proporcionó el modelo U.2 de 7.68TB para pruebas.Hemos sometido la unidad a nuestro conjunto completo de rigurosos puntos de referencia empresariales, evaluando métricas clave como el rendimiento, la latencia y la estabilidad en diferentes perfiles de carga de trabajo.
El PhisonPascari X200PSerieEspecificaciones
| Especificaciones Phison Pascari Serie X200P | 1.92TB | 3.84TB | 7.68TB | 15.36TB | 30.72TB |
|---|---|---|---|---|---|
| Factor de forma | - ¿ Por qué?2 | ||||
| Interfaz | Las medidas de seguridad se aplican a los vehículos de la categoría M1 y M2. | ||||
| El NVMe | 2.0 | ||||
| NAND flash | 3D TLC | ||||
| Secuencia de lectura (MB/s) | 14,800 | 14,800 | 14,800 | 14,800 | 14,000 (Est.) |
| Secuencia de escritura (MB/s) | 4,300 | 8,600 | 8,700 | 8,350 | 7,500 (Est.) |
| Lectura aleatoria 4K (IOPS) | 2400 mil | 3,000K | 3,000K | 3,000K | 2300K (Est.) |
| Escribir aleatoriamente en 4K (IOPS) | 170K | 380K | 500 mil. | 500 mil. | 283K (Est.) |
| Tensión de lectura en μs | 60 | ||||
| Escribe latencia (μs) | 10 | ||||
| Potencia Actividad (W) | < 25 | ||||
| Potencia en marcha (W) | 5 | ||||
| D.O.D.P.D. (7) | 1 | ||||
| UBER | < 1 sector por cada 1018Los bits se leen. | ||||
| FTTM (en millones de horas) | 2.5 | ||||
| Garantía limitada (años) | 5 | ||||
| Temperatura de funcionamiento (°C) | De 0 a 70 | ||||
| Temperatura de no funcionamiento (°C) | -40 a 85 años | ||||
| Dimensiones (mm) | 100.10 (L) x 69.85 (W) x 15.00 (H) | ||||
| Peso (g) | 188 | 199 | 201 | 168 | < 250 |
Construcción y diseño: Phison Pascari X200P 7.68TB
Nuestra unidad de prueba es la variante de 7.68TB U.2 2.5 "de la Phison Pascari X200P, diseñada para ofrecer almacenamiento de alto rendimiento para aplicaciones empresariales.Compatible con la NVMe 2.0 especificación, y está construido en torno a la alta resistencia 3D TLC NAND con la línea completa de X200P soportando capacidades de hasta 30.72TB para acomodar diversas necesidades de almacenamiento empresarial.
Diseño físico y factor de forma
Físicamente, el X200P se adhiere al factor de forma estándar U.2 de 2,5 ", con dimensiones precisas de 100.10 mm (longitud) × 69.85 mm (ancho) × 15.00 mm (altura) y un peso de 201 gramos.La unidad está envuelta en una elegante carcasa de aluminio negro con refrigeración pasiva integrada, un diseño optimizado para gestionar eficientemente la salida térmica durante cargas de trabajo sostenidas y de alta intensidad.hacerla adaptable a varias configuraciones de infraestructura empresarial.
Especificaciones de rendimiento
Desde el punto de vista del rendimiento, el X200P cuenta con métricas de clasificación impresionantes: hasta 14.800 MB/s de lectura secuencial, 8.700 MB/s de escritura secuencial, 3 millones de IOPS de lectura aleatoria y 500.000 IOPS de escritura aleatoria.También ofrece un consumo de energía eficiente, con un consumo de energía activa inferior a 25W y un consumo de energía inactiva de sólo 5W, lo que lo convierte en una opción rentable para operaciones empresariales de alto rendimiento sostenido.
La unidad tiene una clasificación de resistencia de 1 DWPD (Drive Writes Per Day), un MTBF de 2.5 millones de horas (Tiempo Medio entre Fallas) y una garantía limitada de 5 años.funciona de forma fiable en un rango de temperatura de 0°C a 70°C, garantizando la coherencia en entornos de centros de datos exigentes.
Características de nivel empresarial
Phison equipa al X200P con un conjunto completo de características de protección y gestión de datos de clase empresarial para salvaguardar datos críticos y simplificar la implementación:
- Protección contra pérdidas de energía (PLP) para evitar la pérdida de datos durante interrupciones inesperadas de energía
- ISE (borrado seguro instantáneo) y soporte TCG Opal 2.0 para la limpieza segura de datos
- AES-XTS 256-bit Encriptación para la seguridad de datos de extremo a extremo
- Protección de rutas de datos de extremo a extremo y protección de metadatos para garantizar la integridad de los datos
- SECDED (corrección de un solo error y detección de dos errores) para mejorar la fiabilidad de los datos
- Desinfectar las operaciones para la eliminación de datos conformes
- Compatibilidad NVMe-MI (Interfaz de gestión) y SMBus para una gestión de dispositivos optimizada
- Soporte para hasta 128 espacios de nombres para optimizar la asignación de almacenamiento
En conjunto, la línea Pascari X200P combina una robusta calidad de fabricación de grado industrial, rendimiento de vanguardia,El sistema de almacenamiento de datos en la nube es una herramienta de almacenamiento de datos de alto rendimiento y confiabilidad de nivel empresarial, posicionándolo como un fuerte competidor para entornos de almacenamiento exigentes como la infraestructura de nube., cargas de trabajo de IA / ML y centros de datos virtualizados.
Pruebas de rendimiento
Plataforma de pruebas de conducción
Hemos llevado a cabo todo el benchmarking para esta revisión utilizando un Dell PowerEdge R760 ejecutando Ubuntu 22.04.02 LTS, emparejado con un cable de serie Gen5 JBOF (sólo un montón de flash) para una amplia compatibilidad con U.2, E1.S, E3.S y M.2 SSD. La configuración completa del sistema se describe a continuación:
- 2 x procesadores Intel Xeon Gold 6430 (32 núcleos, 2.1GHz)
- Modulos de RAM DDR5-4400 de 16 x 64 GB
- 480 GB Dell BOSS SSD para arranque y operaciones del sistema
- Los cables de serie Gen5 JBOF para pruebas de SSD
Comparación de los motores
Para proporcionar una comparación justa y relevante, probamos el Pascari X200P 7.68TB contra un grupo de 7.68TB PCIe Gen5 NVMe SSD con flash TLC NAND,todos dirigidos a entornos de alto rendimiento empresarialesEl conjunto de comparación incluye:
- Phison Pascari X200P 7.68TB
- Micrón 9550 7.68TB
- SanDisk SN861 7.68TB
- Se trata de un sistema de transmisión de datos.
- Kingston DC3000ME 7.68TB
Las pruebas se llevaron a cabo utilizando una mezcla de benchmarks reales y sintéticos, incluidas simulaciones de carga de trabajo de CDN, FIO (Flexible I/O Tester),y GDSIO (GPU Direct Storage I/O) para evaluar el rendimiento a través del rendimiento sostenidoAl estandarizar la capacidad, la interfaz y el tipo de NAND,Esta evaluación ofrece una comparación clara de cómo el Pascari X200P se desempeña frente a sus pares en condiciones empresariales exigentes.
Pruebas de rendimiento de CDN
Para simular cargas de trabajo realistas de contenidos mixtos en CDN (Content Delivery Network),Hemos sometido a cada SSD a una secuencia de benchmarking de múltiples fases diseñada para replicar los patrones de E/S de servidores de borde con mucho contenidoEsta secuencia incluía una gama de tamaños de bloques (tanto grandes como pequeños), distribuidos en operaciones aleatorias y secuenciales, con diferentes niveles de concurrencia para imitar las demandas del servidor de borde del mundo real.
Precondicionamiento y saturación
Antes de iniciar las pruebas de rendimiento principales, cada SSD se sometió a un llenado completo del dispositivo con un pase de escritura secuencial del 100% utilizando bloques de 1 MB,Utilizando E/S síncrona y una profundidad de cola de 4 (permitiendo cuatro trabajos simultáneos)Este paso aseguró que la unidad entró en un estado estacionario representativo del uso del mundo real.El uso de una distribución de tamaño de bloque ponderado que favorece fuertemente las transferencias de 128K (98.51%), con contribuciones menores desde bloques sub-128K hasta 8K ̇ emulando los patrones de escritura fragmentados comunes en entornos de caché distribuidos.
Suíte de pruebas principal
Las pruebas principales se centraron en operaciones de lectura y escritura aleatorias escaladas para medir el comportamiento de cada unidad bajo profundidades variables de cola y concurrencia de trabajo.seguido de un período de inactividad de 3 minutos para permitir que los mecanismos internos de recuperación estabilicen las métricas de rendimientoSe utilizaron dos perfiles de ensayo clave:
- Una distribución de tamaño de bloque fijo que favorece 128K (98,51%), con el 1,49% restante compuesto por tamaños de transferencia más pequeños (64K a 8K).con profundidades de cola de 1, 2, 4, 8, 16 y 32 ¢ perfiles de escalabilidad de rendimiento y latencia en condiciones típicas de escritura en el borde.
- Un perfil de tamaño de bloque muy mixto que imita la recuperación de contenido de CDN, con un componente dominante de 128K (83,21%) y una cola larga de más de 30 tamaños de bloque más pequeños (4K a 124K),cada uno con representación de frecuencia fraccionariaEsta distribución refleja diversos patrones de solicitud encontrados durante la búsqueda de segmentos de vídeo, el acceso a miniaturas y las búsquedas de metadatos,y fue probado a través de la misma matriz de conteo de puestos de trabajo y profundidades de cola.
Esta combinación de precondicionamiento, saturación y pruebas de acceso aleatorias de tamaño mixto revela cómo los SSD manejan entornos similares a CDN sostenidos,haciendo hincapié en la capacidad de respuesta y la eficiencia en el ámbito de la banda ancha, escenarios muy paralelos.
Resultados de la carga de trabajo de CDN
Carga de trabajo CDN de lectura 1 (Trabajo único)
En esta prueba que simula el tráfico de entrega de contenido ligero, el Pascari X200P comenzó en la parte posterior del paquete a QD1 (765MB/s) y QD2 (1,403MB/s).moviéndose hacia el centro del campo a través de QD8 y QD16En QD32, alcanzó el 13,516.8MB/s, terminando tercero en la general detrás del Kingston DC3000ME y el Micron 9550, pero superando el SanDisk SN861 y el Solidigm PS1010 en el extremo superior.
Carga de trabajo de CDN de lectura 2 (dos trabajos)
Con dos trabajos concurrentes, el Pascari X200P comenzó de nuevo en la parte posterior a QD1 (1,519MB/s) pero se escala constantemente a medida que aumentaba la profundidad de la cola.Cerró la brecha con los líderes por QD8 y terminó primero en la general en QD32 con 15 puntos.,257.6MB/s superando el rendimiento del Micron 9550, Kingston DC3000ME, Solidigm PS1010 y SanDisk SN861.
Carga de trabajo de CDN de lectura 4 (cuatro trabajos)
Con cuatro trabajos concurrentes, el Pascari X200P mostró una fuerte escalabilidad a través de las profundidades de cola.se movió hacia la parte delantera de la manada y mantuvo esta ventaja a través de QD16 y QD32, terminando primero en la general en QD32 con 15,257.6MB/s ¥ por delante del Micron 9550 y el Kingston DC3000ME.
Carga de trabajo de CDN Escribir 1 (Trabajo único):
En la prueba de escritura de CDN de un solo trabajo, el Pascari X200P siguió el paquete, logrando una velocidad máxima de 1.885MB/s en QD1 y escalando gradualmente a 5.913MB/s en QD32, terminando cuarto en general.El SanDisk SN861 y el Micron 9550 lideraron el grupo, seguido por el Kingston DC3000ME, mientras que el X200P mantuvo un escalado constante pero un rendimiento de escritura menos agresivo en este escenario de bajo hilo.
Carga de trabajo de CDN Escribir 2 (dos trabajos):
Con dos trabajos concurrentes, el Pascari X200P terminó cuarto en la general. Logró 2.762 MB/s en QD1, escalado a través de QD16, pero exhibió un cierto rendimiento de reducción por QD32 (llegando a 4.585 MB/s).El Micron 9550 y el SanDisk SN861 llevaron, seguido por el Kingston DC3000ME, con el X200P manteniendo un rendimiento estable a través de las profundidades medias de la cola, pero detrás de los líderes.
Carga de trabajo de CDN Escribir 4 (cuatro trabajos):
Con cuatro trabajos simultáneos, el Pascari X200P mantuvo el rendimiento de mitad de paquete durante la mayor parte de la prueba.Permaneció competitivo con el Kingston DC3000ME y el Solidigm PS1010 a través de las profundidades medias de la colaEl Micron 9550 y el SanDisk SN861 lideraron el campo, con el Kingston DC3000ME en tercer lugar.El X200P ofreció una escala de escritura constante bajo cargas moderadas, pero mostró límites en profundidades de cola más profundas en esta carga de trabajo de cuatro hilos.
Indicador de referencia de control DLIO
Para evaluar el rendimiento del X200P en el mundo real en entornos de entrenamiento de IA,Utilizamos la herramienta de referencia Data and Learning Input/Output (DLIO) desarrollada por Argonne National Laboratory específicamente para probar los patrones de E/S en cargas de trabajo de aprendizaje profundo. DLIO proporciona información sobre cómo los sistemas de almacenamiento manejan tareas críticas de IA como el control de puntos, la ingestión de datos y el entrenamiento de modelos.con resultados que ilustran cómo el X200P y los controladores competidores manejan 36 puntos de control esenciales para guardar estados de modelo periódicamente y evitar la pérdida de progreso durante las interrupciones.
Configuración de prueba
Para reflejar escenarios de IA del mundo real, nuestras pruebas se basaron en la arquitectura del modelo LLAMA 3.1 405B. Implementamos puntos de control usando torch.save() para capturar parámetros del modelo, estados del optimizador,y estados de capas, simulando un sistema de ocho GPU con una estrategia de paralelismo híbrido (paralelismo tensorial de 4 vías y procesamiento paralelo de tuberías de 2 vías).636GB®representativo de los requisitos de formación del modelo moderno de lenguaje grande (LLM).
Resultados del DLIO
El Pascari X200P demostró una fuerte capacidad de respuesta inicial, pero mostró un aumento de los tiempos de control a medida que se intensificaba la carga de trabajo.promedio de 467 segundos manteniendo el ritmo con unidades como el Solidigm PS1010 y el Micron 9550.
En el punto medio (puntos de control 5 ), sin embargo, el rendimiento del X200P ′ divergió.A través de los últimos tres puntos de control, fue 672 segundos en promedio, aproximadamente un 19,3% más lento que el siguiente conductor más lento (Kingston DC3000ME) y un 23% más lento que el promedio del grupo.
Cuando se observa por los promedios de paso, el X200P mostró una clara trayectoria de degradación del rendimiento: promedió 467.93 segundos en el Paso 1 (ligero detrás del campo), 662.04 segundos en el Paso 2 (14.5% más lento que el siguiente conductor más lento y0,4% más lento que el promedio del grupo), y 674,48 segundos en el paso 3 (siendo el conductor más lento, 18,9% más lento que el promedio de los otros cuatro conductores, que fue de aproximadamente 567 segundos).
Indicador de rendimiento del FIO
Para medir el rendimiento del almacenamiento a través de métricas comunes de la industria, utilizamos FIO (Flexible I / O Tester), con un proceso de prueba estandarizado para todas las unidades:Dos unidades completas se llenan con una carga de trabajo de escritura secuencial para el precondicionamiento, seguido de la medición del rendimiento en estado estacionario. Se ejecutó un nuevo llenado de precondicionamiento para cada nuevo tamaño de transferencia para garantizar resultados precisos. Nos centramos en los siguientes puntos de referencia FIO:Secuencial 128K, 64K aleatorio, 16K aleatorio, 4K aleatorio, y 128K secuencial Precondición.
Resultados de las pruebas FIO
Precondición de secuencia 128K (IODepth 256 / NumJobs 1):
El X200P terminó tercero en general, con un ancho de banda promedio de 8.371 MB/s.mostró ligeras fluctuaciones recurrentes de ancho de banda, lo que indica una menor consistencia que el Micron 9550 y el Kingston DC3000ME, que tenía curvas de rendimiento más planas y estables.
128K de latencia de precondiciones secuenciales (IODepth 256 / NumJobs 1):
El X200P tenía una latencia promedio de 3.822 ms, colocándolo tercero en general (detrás del Micron 9550 y el Kingston DC3000ME).En la actualidad, el sector de la información se encuentra en la segunda mitad de la segunda mitad de la segunda mitad de la segunda mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera mitad de la tercera.
128K escritura secuencial (IODepth 16 / NumJobs 1):
El X200P alcanzó un ancho de banda promedio de 8,369.7MB/s, terminando tercero detrás de la Micron 9550 y la Kingston DC3000ME, pero por delante de la Solidigm PS1010 y la SanDisk SN861.
128K latencia de escritura secuencial (IODepth 16 / NumJobs 1):
El X200P registró una latencia promedio de 0,238 ms, colocándolo en el cuarto lugar general, justo detrás del Kingston DC3000ME (0,235 ms) y por delante del Solidigm PS1010 y el SanDisk SN861.Mientras que su latencia fue menor que la mayoría, se quedó atrás del mejor desempeño (Micron 9550).
Lectura secuencial de 128K (IODepth 64 / NumJobs 1):
128K latencia de lectura secuencial (IODepth 64 / NumJobs 1):
El X200P registró una latencia promedio de 561.4ms, colocándolo en segundo lugar en general, detrás del Solidigm PS1010 por un pequeño margen, pero superando al Micron 9550, Kingston DC3000ME y SanDisk SN861.
64K Registro aleatorio:
El X200P ofreció un rendimiento medio de paquete en general, con cierta fluctuación en las profundidades de cola y combinaciones de hilos. Mantuvo un rendimiento estable entre 2.500MB/s y 3.600MB/s en la mayoría de las pruebas.,con un ancho de banda máximo de 6,625.92MB/s en la combinación 32/8 IODepth/NumJobs, una de las más altas de la prueba, ofreciendo un acabado fuerte.mantuvo su terreno en cargas de hilo más pesadas y funcionó mejor a mayores profundidades de cola.
Latencia de escritura aleatoria de 64K:
El X200P mostró baja latencia bajo profundidades de cola de luz a moderadas, con valores destacados de 0,023ms (1/1) y 0,041ms (2/1).La latencia aumentó significativamente con combinaciones de hilo y cola más pesadas: 4.045 ms en 16/8 y 3.019 ms en 8/8.
64K Lectura aleatoria:
El X200P funcionó consistentemente bien en todas las profundidades de cola y recuentos de hilos, siguiendo de cerca las unidades superiores.232MB/s ̊ estableciendo o superando a la competencia a los niveles de carga más altos, que demuestra una gran escalabilidad bajo un acceso paralelo pesado.
Latencia de lectura aleatoria de 64K:
El X200P mantuvo una latencia baja a través de profundidades de cola de luz a moderadas y recuentos de hilos (generalmente por debajo de 0,2 ms)..
16K Escribir al azar:
El X200P mantuvo una sólida posición en la mitad del paquete en la mayoría de las combinaciones de fila y hilo, entregando 170K ₹ 190K IOPS en configuraciones típicas (4/4, 8/4, 4/8).Rendimiento escalado significativamente a cargas más pesadas, saltando a 221K IOPS a 32/8 y alcanzando su punto máximo en 413K IOPS a 32/16 ∞ terminando justo por debajo del Kingston DC3000ME (428K IOPS)..
16K latencia de escritura aleatoria:
El X200P mantuvo una latencia muy baja en la mayoría de las configuraciones (generalmente por debajo de 0,2 ms en 4/4, 8/4, 2/8).155 ms en QD32/8Su latencia máxima (2.045 ms) se produjo en QD16/16, antes de establecerse ligeramente en QD32/16 (1.238 ms).
16K Lectura aleatoria:
El X200P ofreció un rendimiento sólido, escalando limpiamente a través de las profundidades de cola y el recuento de hilos.4K IOPS en QD32/16Sube constantemente para mantener su posición entre los mejores en condiciones de presión de lectura sostenida, demostrando un alto rendimiento y una escalabilidad efectiva.
16K latencia de lectura aleatoria:
El X200P mantuvo una latencia baja y consistente en la mayoría de las profundidades de cola y conteos de hilos, comenzando a 0,082 ms (QD1/1) y permaneciendo por debajo de 0,1 ms a través de combinaciones de rango medio (0.091 ms en QD4/1 y QD4/4La latencia aumentó ligeramente a 0.114ms (QD16/4), 0.148ms (QD16/8), y alcanzó su punto máximo en 0.568ms (QD32/16) donde todavía mantuvo 902K IOPS.
Escribir aleatoriamente en 4K:
El X200P entregó resultados estables a partir de 1/1 (91.9K IOPS), generalmente sentado en el medio al extremo inferior del paquete a través de la mayoría de las profundidades de cola y combinaciones de hilos.Su rendimiento máximo alcanzó 10,64 millones de IOPS a 32/16% competitivos pero detrás de los mejores resultados de SanDisk y Micron en algunos escenarios.
4K latencia de escritura aleatoria:
El X200P funcionó bien bajo cargas de trabajo ligeras, igualando a las unidades superiores a 0,010 ms. Sin embargo, la latencia aumentó rápidamente con cargas más pesadas: 0,247 ms a 8/16 y un pico de 0.541ms en 16/16 (el segundo más alto del grupo).
Lectura aleatoria en 4K:
El X200P comenzó en el extremo inferior (16.6K IOPS a 1/1) pero se escala predictiblemente a través del rango medio (365K IOPS a 8/4, 707K IOPS a 8/8).2M IOPS en 16/8 y 2M IOPS en 16/16En 32/16, registró 1.98M IOPS justo debajo de Kingston, colocándolo en el centro de la manada.subir constantemente al nivel de millones de IOPS y ofrecer un rendimiento constante a través de cargas de trabajo exigentes.
4K latencia de lectura aleatoria:
El X200P mantuvo un rendimiento competitivo a lo largo de la curva de carga de trabajo, comenzando a 0.059ms (QD1/1), 0.060ms (QD1/4), 0.064ms (QD1/8), y 0.067ms (QD2/8).Se mantuvo en línea con otras unidades empresarialesLa latencia máxima (0,258 ms) se produjo en QD32/16 un poco por encima de Solidigm pero similar a Kingston y Micron.
Pruebas de almacenamiento directo de GPU (GDS)
También realizamos pruebas de Magnum IO GPU Direct Storage (GDS), una característica desarrollada por NVIDIA que permite a las GPUs eludir la CPU al acceder a datos en unidades NVMe u otros dispositivos de almacenamiento de alta velocidad.Al permitir la comunicación directa entre la GPU y el almacenamiento a través del bus PCIe, GDS elimina los cuellos de botella de la CPU, reduce la latencia y mejora el rendimiento de los datos, que es crítico para las cargas de trabajo de IA intensivas en datos.
Cómo funciona el almacenamiento directo de GPU
Tradicionalmente, el procesamiento de datos de GPU requiere que los datos viajen desde las unidades NVMe a través de la CPU y la memoria del sistema antes de llegar a la GPU, introduciendo latencia y consumiendo valiosos recursos de la CPU.GDS elimina esta ineficiencia mediante la creación de un camino directo entre la GPU y el almacenamiento, reduciendo los gastos generales de movimiento de datos y permitiendo transferencias más rápidas y eficientes.
Esto es particularmente beneficioso para las cargas de trabajo de IA / ML (por ejemplo, aprendizaje profundo), que requieren procesar terabytes de datos. Cualquier retraso en la transferencia puede conducir a GPUs subutilizadas y tiempos de entrenamiento más largos.GDS también sobresale en la transmisión de grandes conjuntos de datos (procesamiento de vídeo), PNL, inferencia en tiempo real) al liberar recursos de la CPU para otras tareas, mejorando el rendimiento general del sistema.
Resultados de las pruebas GDSIO
Transmisión de lectura de GDSIO: En el tamaño del bloque de 16K, el rendimiento comenzó en 0,56 GiB/s (QD1) y aumentó a 1,80 GiB/s en QD128 modesto pero constante escalado, lo que refleja un rendimiento aceptable para tamaños de transferencia pequeños.En el tamaño de bloque 128KEl rendimiento mejoró más notablemente: 2,39 GiB/s (QD1) a 5,10 GiB/s (QD128), lo que demuestra una mejor eficiencia de escalado.15 GiB/s a QD128 ofreciendo el ancho de banda de lectura absoluto más alto, por lo que es muy adecuado para grandes transferencias secuenciales.
GDSIO Lectura de la latenciaLos resultados mostraron una relación clara entre el tamaño del bloque, el número de hilos y la latencia.La latencia aumentó de 0En el tamaño de bloque de 1M, la latencia comenzó en 0.268ms (1 hilo) y alcanzó su punto máximo en 20.324ms bajo el paralelismo máximo.
Transmisión de escritura de GDSIO (16K tamaño de bloque): El rendimiento comenzó a 0,58 GiB/s (latencia de 25,17 μs) en QD1 y aumentó a 1,22 GiB/s (latencia de 1,59 ms) en QD128lo que sugiere una saturación temprana a este pequeño tamaño de E/S.
Transmisión de escritura de GDSIO (128K tamaño de bloque): El rendimiento se escala mejor, comenzando a 2.63 GiB/s (45.55μs) y aumentando a 4.94 GiB/s (3.16ms) en QD128indicando el aumento de la carga aérea en grandes profundidades de cola.
Transmisión de escritura de GDSIO (tamaño de bloque de 1M): La unidad comenzó fuerte a 4.52 GiB/s (215μs) y alcanzó su punto máximo a 5.02 GiB/s (24.9ms) a QD128 ∞ ganancia de rendimiento mínima en comparación con 128K, con la latencia más alta de todas las pruebas,señalización de ganancias limitadas de eficiencia de transferencias más grandes que 128K en colas profundas.
GDSIO Escribir la latencia: La latencia aumentó constantemente con el tamaño del bloque y el número de hilos. En el tamaño del bloque de 16K (1 hilos), la latencia fue de 0.025ms, subiendo a 1.595ms en 128 hilos. En el tamaño del bloque de 128K, la latencia aumentó de 0.046ms a 3.159ms (128 hilos). En el tamaño de bloque de 1M, la latencia comenzó en 0.215ms y alcanzó 24.917ms en la profundidad máxima de hilo.El X200P lideró el grupo en tamaños de bloques más altos y recuentos de hilos, manteniendo la latencia más baja bajo cargas de trabajo de escritura paralela pesadas.
Conclusión
El Phison Pascari X200P 7.68TB SSD es una solución de almacenamiento de grado empresarial con TLC NAND y optimizado para el rendimiento de PCIe Gen5, que atiende a cargas de trabajo de propósito general y de contenido.Está diseñado para entornos donde el rendimiento es alto., la gran escalabilidad y la flexibilidad de despliegue tienen prioridad sobre el ajuste específico de hiperescala.2¿ Qué pasa?3, y los factores de forma E3.S, además de características de nivel empresarial como protección contra pérdidas de energía, cifrado AES-XTS de 256 bits y gestión NVMe-MI,el X200P proporciona una base sólida para la infraestructura de almacenamiento empresarial.
En términos de rendimiento, el X200P sobresale en escenarios secuenciales e intensivos en lectura, clasificándose constantemente cerca de la parte superior en pruebas de 128K y 64K y escalable efectivamente bajo cargas de trabajo de CDN.Las pruebas de FIO confirman su fortaleza en lecturas secuenciales y rendimiento competitivo en cargas de trabajo de lectura aleatoriaMientras que sigue las unidades de primer nivel (por ejemplo, Micron, SanDisk) en condiciones de escritura intensiva y altamente concurrentes, su predecible,El comportamiento de escritura eficiente lo hace adecuado para una amplia gama de implementaciones empresariales de nivel medio.
Las pruebas de GDSIO ponen de relieve las fortalezas de las unidades en aplicaciones centradas en el rendimiento:mantiene una latencia excelente en tamaños de bloques más pequeños y conduce bajo acceso paralelo pesado con grandes transferencias de bloquesAunque la latencia aumenta a profundidades de cola más profundas, la afinación de Phison asegura que la unidad permanezca estable y responda bajo presión sostenida.
En general, el Pascari X200P es un SSD empresarial bien redondeado con un alto rendimiento y un conjunto de características adaptadas a las cargas de trabajo del mundo real. It will be interesting to see if Phison can transition from a controller-first company to one offering a deep set of integrated drive solutions—and the X200P appears to be a promising step in that direction.
Diseñado para ser versátil, el X200P sobresale en una amplia gama de casos de uso empresarial, incluyendo redes de entrega de contenido a gran escala, cargas de trabajo de inferencia de IA,y el archivo de datos en frío, donde la alta capacidad y el rendimiento de lectura fiable son primordialesComplementando el X200P está la serie X200E de Phison, una línea de alta resistencia optimizada específicamente para escenarios de escritura intensiva.6 TB, el X200E es ideal para aplicaciones de misión crítica como bases de datos transaccionales, análisis de datos en tiempo real y procesamiento de registros de alto volumen.
Enfocándose en el Phison Pascari X200P para esta revisión, Phison proporcionó el modelo U.2 de 7.68TB para pruebas.Hemos sometido la unidad a nuestro conjunto completo de rigurosos puntos de referencia empresariales, evaluando métricas clave como el rendimiento, la latencia y la estabilidad en diferentes perfiles de carga de trabajo.
China, China, China, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón.
Sandy Yang, directora de estrategia global
WhatsApp / WeChat: +86 13426366826 El número de teléfono es:
Correo electrónico: yangyd@qianxingdata.com
El sitio web: www.qianxingdata.com/www.storagesserver.com
Sandy Yang, directora de estrategia global
WhatsApp / WeChat: +86 13426366826 El número de teléfono es:
Correo electrónico: yangyd@qianxingdata.com
El sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque en el negocio:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas globales para ofrecer productos confiables y servicios profesionales.
Usar la tecnología para construir un mundo inteligente¡Su proveedor de servicios de productos TIC de confianza!



