Inicio Casos

300 GB/s en 2U: El Dell PowerEdge R7725xd restablece las expectativas de rendimiento de almacenamiento

Todos los productos

Servidor del almacenamiento de estante
(165)

Servidor de la fusión de Huawei
(31)

Dell Poweredge Server
(59)

Servidor de H3C
(30)

Interruptores del Datacom
(97)

Dispositivo de la red inalámbrica (WLAN)
(21)

Router inalámbrico elegante
(10)

Disco duro HDD
(24)

SSD interno del disco duro
(16)

Tarjeta gráfica de Geforce
(27)

Procesador de la CPU de INTEL
(20)

Memoria RAM del servidor
(6)

Servidor restaurado del almacenamiento
(6)

Módulo del transmisor-receptor de SFP
(4)

Interruptor de canal de la fibra
(42)

Certificación

China Beijing Qianxing Jietong Technology Co., Ltd. certificaciones

Comentarios de cliente

El personal de ventas de la tecnología Co., Ltd de Pekín Qianxing Jietong es muy profesional y paciente. Pueden proporcionar citas rápidamente. La calidad y el empaquetado de los productos son también muy buenos. Nuestra cooperación es muy lisa.

—— LLC del》 de Festfing DV del 《

Cuando buscaba la CPU de Intel y el SSD de Toshiba urgente, Sandy de la tecnología Co., Ltd de Pekín Qianxing Jietong me dio mucha ayuda y me consiguió los productos que necesité rápidamente. La aprecio realmente.

—— Kitty Yen

Sandy de la tecnología Co., Ltd de Pekín Qianxing Jietong es un vendedor muy cuidadoso, que puede recordarme errores de la configuración a tiempo cuando compro un servidor. Los ingenieros son también muy profesionales y pueden terminar rápidamente el proceso de prueba.

—— Strelkin Mikhail Vladimirovich

Estamos muy contentos con nuestra experiencia trabajando con Beijing Qianxing Jietong. La calidad del producto es excelente y la entrega siempre es puntual. Su equipo de ventas es profesional, paciente y muy útil con todas nuestras preguntas. Realmente apreciamos su apoyo y esperamos una asociación a largo plazo. ¡Muy recomendado!

—— Ahmad Navid

Calidad: Gran experiencia con mi proveedor. El MikroTik RB3011 ya estaba usado, pero estaba en muy buen estado y todo funcionaba perfectamente.y todas mis preocupaciones fueron abordadas rápidamenteUn proveedor muy confiable, muy recomendable.

—— Geran Colesio

Estoy en línea para chatear ahora

300 GB/s en 2U: El Dell PowerEdge R7725xd restablece las expectativas de rendimiento de almacenamiento

March 12, 2026

Algunos servidores simplemente mejoran las capacidades existentes, mientras que otros redefinen completamente lo que es posible y el Dell PowerEdge R7725xd cae firmemente en esta última categoría.cuando estén equipados con 24 unidades SSD NVMe Micron 9550 PRO PCIe Gen5 y cuatro tarjetas de interfaz de red (NIC) de 2x 200GbE, este servidor 2U logró mayor rendimiento de almacenamiento en bruto que cualquier sistema que hayamos evaluado.y por la red, entregó 160 GB/s utilizando la tecnología RDMA estándar sin añadir complejidad innecesaria.

Dell PowerEdge R7725xd es un juego de computadoras.

Esto es mucho más que un servidor de almacenamiento más rápido; es un sistema que transforma la arquitectura de la computación intensiva en datos.Las capacidades de entrenamiento y inferencia de la IA de hoy en día a menudo no están limitadas por la potencia de procesamiento de la GPULos nodos GPU de alto rendimiento se quedarán inactivos si los sistemas de almacenamiento no pueden mantener el ritmo de sus demandas de datos.Para superar estas limitaciones, los equipos a menudo dependen de caché, hardware con exceso de provisiones y estrategias de clasificación complejas para garantizar que los aceleradores reciban datos lo suficientemente rápido como para justificar su inversión.

El Dell PowerEdge R7725xd aborda este cuello de botella en su raíz.con cada unidad obteniendo un enlace dedicado PCIe Gen5 x4 que se conecta directamente al complejo de CPU AMD EPYCNo hay restricción de ancho de banda de los diseños de ventilador, y no se utiliza un expansor de plano medio para reducir la concurrencia.El rendimiento se escala sin problemas porque el hardware está diseñado para agregar el rendimiento sin contención de recursosEn una configuración típica de 2 sockets, las CPU están conectadas por 4 conexiones XGMI para la comunicación entre sockets.uno de estos enlaces se reutiliza para agregar 16 carriles adicionales de PCIe Gen5 por CPU, lo que da al servidor un total de 160 carriles PCIe Gen5 96 asignados a las bahías SSD delanteras y 64 reservados para las cuatro ranuras PCIe traseras. When paired with Micron’s 9550 PRO SSDs—designed for sustained write workloads and high endurance—the system becomes a high-throughput data engine capable of supporting checkpoint-heavy and continuous streaming workloads.

Implementamos PEAK: AIO en la parte superior de esta arquitectura para aprovechar las rutas de envío paralelas y mantener la eficiencia a medida que aumenta la concurrencia.El resultado no sólo fue un rendimiento de pico impresionante, sino también un rendimiento sostenido constante bajo una carga pesadaLa plataforma puede funcionar como un nodo de ejecución local para el preprocesamiento, la capacitación o la transformación de datos, o puede entregar almacenamiento de alto ancho de banda a múltiples sistemas GPU a través de la red.Para aquellos que buscan empujar límites, incluso puede realizar ambas tareas simultáneamente.

Las cosas que hay que aprender

Un rendimiento sin precedentes en un solo nodo:El R7725xd soportó más de 300 GB/s de ancho de banda interno y 160 GB/s sobre NVMe-oF RDMA, rivalizando con los clústeres de almacenamiento multi-nodo dentro de un chasis de 2U.
Verdadera arquitectura de la 5a generación, sin interruptores, sin fan-out:Todos los SSDs 24 Micron 9550 PRO reciben carriles dedicados x4 PCIe Gen5 directamente desde el complejo de CPU, lo que permite escalar la velocidad de línea sin problemas.
Impulsado por AMD EPYC Serie 9005:Los procesadores AMD EPYC 9575F duales proporcionan el número de carriles, el ancho de banda de memoria y la topología NUMA necesarios para una I/O de alta concurrencia sostenida.
Diseñado para IA, análisis y cargas de trabajo con puntos de control:El sistema elimina los cuellos de botella de I / O que detienen las tuberías de GPU modernas, lo que permite la entrega continua de datos de alto ancho de banda.
Pico: AIO desbloquea el paralelismo completo:PEAK: La pila de software de AIO mantiene las estructuras de cola saturadas bajo carga, ofreciendo un rendimiento empresarial a una relación convincente de dólar por GB.

Construido para el rendimiento de NVMe

Entre los servidores de última generación, Dell se ha alejado de la incorporación de switches PCIe en las configuraciones de servidores densos de almacenamiento.soporte de configuraciones con hasta 16 SSDLos servidores de la generación anterior, como el PowerEdge R760, incluían un switch PCIe en configuraciones NVMe de 24 bahías.Para agilizar las compilaciones y eliminar la complejidad provocada por los switches PCIe, los servidores más nuevos adoptaron un enfoque de reducir el número de carriles PCIe en configuraciones densas de almacenamiento.

La principal diferencia entre el estándar R7725 y el R7725xd radica en cómo las plataformas asignan recursos del complejo raíz PCIe.E/S de uso general. La variante xd redistribuye este presupuesto de recursos para hacer del subsistema NVMe el principal consumidor de ancho de banda PCIe.con cada SSD obteniendo su propio punto final x4 en lugar de un enlace ascendente compartido disponible a través de un interruptor PCIe o árbol de tiempo de reutilizaciónEsto otorga a cada unidad estructuras de cola independientes y rutas DMA independientes que conducen al controlador de memoria.

La topología del plano de fondo y el riser reflejan este enfoque en el rendimiento NVMe.Así que cada procesador tiene control directo sobre una parte del conjunto de unidadesEn la práctica, esto crea dos dominios NVMe simétricos, cada uno con rasgos de latencia local y plena concurrencia de lectura / escritura.su ubicación en ranuras permitió que cada NIC residiera en un dominio PCIe alineado con el grupo NVMe correspondienteBajo NVMe-sobre-RDMA, esto significaba que el tráfico de red permanecía local en el socket que manejaba la unidad de entrada/salida asociada,evitando el salto inter-socket Infinity Fabric que generalmente agrega latencia y consume ancho de banda bajo una carga pesada.

El rendimiento térmico también apoya un rendimiento sostenido.2 sigue siendo una opción destacada en las configuraciones densas Gen5 porque proporciona un canal de flujo de aire definido y área de superficie del disipador de calor predecible para cada dispositivoLos módulos de ventilador de alta presión estática del R7725xd y los conductos del chasis mantienen un flujo de aire constante a través de las 24 bahías, lo que permite que las cargas de trabajo de escritura a toda velocidad funcionen continuamente sin estrangulamiento.El diseño mecánico complementa la arquitectura eléctrica: cada unidad puede mantener el rendimiento de velocidad completa porque la plataforma está diseñada para enfriar 24 dispositivos Gen5 simultáneos bajo carga.

Esta combinación de alineación compleja de raíz, diseño de carril de acceso a memoria no uniforme (NUMA) consistente, colocación de NIC consciente de enchufes y U térmicamente estable.2 envasado permite que el sistema logre una tasa de entrada/salida de línea a escalaLa arquitectura elimina los cuellos de botella y maximiza el potencial de rendimiento.

Dell PowerEdge R7725xd iDRAC 10 Visión general

Al igual que muchas otras plataformas de la 17a generación que hemos probado, esta generación del R7725xd cuenta con la nueva plataforma iDRAC 10 de Dell, que sirve como el centro central para la gestión remota, monitoreo de salud,y control fuera de bandaLa vista del panel de control ofrece una visión general inmediata del estado general del sistema, el estado de almacenamiento y la actividad reciente.Confirmando que el servidor está funcionando como se esperabaLos detalles clave del sistema, incluido el modelo, el nombre de host, la versión del BIOS, el nivel de firmware de iDRAC, la dirección IP y la información de licencia, se muestran en el lado derecho de la interfaz.

El tablero también incluye un panel de resumen de tareas que muestra operaciones completadas, pendientes y en curso.un registro de eventos recientes captura alertas de intrusión del chasis y mensajes de alimentaciónEl panel de consola virtual se encuentra en la esquina inferior derecha, lo que permite un control remoto completo de KVM.

La sección de almacenamiento de iDRAC 10 presenta una descripción completa de todos los discos físicos instalados en el R7725xd. El panel de resumen muestra un recuento de alto nivel de todas las unidades conectadas,acompañado de un gráfico gráfico que ilustra los estados de accionamientoEn esta configuración, 24 SSD NVMe están activos y reportan estar listos, con dos dispositivos de arranque adicionales presentes en el sistema, separados del banco NVMe frontal principal.

A la derecha, el panel Resumen de discos divide estos en discos físicos y cualquier disco virtual asociado.,todas las unidades se informan como no RAID y son direccionables individualmente, alineándose con el diseño del sistema para grandes grupos NVMe y plataformas SDS.

Debajo del resumen de estado, el área de eventos de almacenamiento registrados recientemente enumera los registros de inserción para cada SSD PCIe, organizados por bahía y ranura.Este registro confirma la detección adecuada en todas las bahías de accionamiento y ayuda a identificar cualquier problema con asientosPara las grandes implementaciones, estos registros son útiles para rastrear el aprovisionamiento de la unidad o verificar que la capacidad se ha llenado como se esperaba.

La captura de pantalla final muestra la vista detallada del dispositivo NVMe dentro de iDRAC10. Cada unidad NVMe instalada en el sistema se enumera con su estado, capacidad y ubicación de la bahía.La selección de una unidad individual abre un desglose completo de sus características.

En este ejemplo, el panel de información de la unidad muestra la cadena completa del modelo, el protocolo del dispositivo, el factor de forma y los ajustes PCIe negociados.Los dispositivos NVMe funcionan a una velocidad de enlace de 32 GT / s con una conexión x4 negociadaLa sección de información también informa el porcentaje de resistencia, el estado de reserva disponible y el tipo de protocolo.Ayudar a los administradores a monitorear las expectativas de salud y ciclo de vida de la unidad.

Este informe de unidad granular es valioso en configuraciones NVMe de alta densidad donde el ancho del enlace, la velocidad negociada y el estado de los medios influyen directamente en el comportamiento de la carga de trabajo y el rendimiento del almacenamiento.

En general, la interfaz iDRAC 10 proporciona una vista clara y centrada en el hardware de la arquitectura de almacenamiento NVMe de R7725xd, lo que permite una fácil validación del estado del enlace, el estado de la unidad,y la integridad del sistema a simple vista.

Dell PowerEdge R7725xd Rendimiento

Antes de las pruebas, nuestro sistema fue configurado con una carga equilibrada pero de alto rendimiento. El sistema está equipado con dos procesadores AMD EPYC 9575F, cada uno con 64 núcleos de alta frecuencia,y emparejado con 24 DIMM DDR5 de 32 GB que operan a 6400 MT/sPara almacenamiento, el chasis está lleno de 24 unidades SSD Micron 9550 PRO U.2 NVMe de 15.36 TB, cada una conectada a través de un enlace PCIe Gen5 x4 dedicado.y las unidades Micron 9550 PRO ofrecen velocidades de lectura secuenciales de hasta 14,000 MB/s y velocidades de escritura secuenciales de hasta 10,000 MB/s. La red es manejada por cuatro adaptadores Broadcom BCM57608 que suministran un total de ocho puertos de 200Gb,junto con un BCM57412 OCP NIC que ofrece dos puertos adicionales de 10 gigabits.

Especificaciones del sistema de ensayo

El CPU:Procesadores de alta frecuencia de 2x AMD EPYC 9575F de 64 núcleos
Memoria:El valor de las emisiones de gases de efecto invernadero es el valor de las emisiones de gases de efecto invernadero.
El almacenamiento:24x 15.36TB Micron 9550 PRO U.2 unidades (conectadas en 4x carriles de PCIe Gen5 cada uno); admite hasta 128TB unidades hoy con mayores capacidades en el horizonte
Red:4x NIC de Broadcom BCM57608 2x200G, 1x NIC de OCP de 2x10Gb de BCM57412
Interruptor:Dell PowerSwitch Z9664 es el mejor

Indicador de rendimiento del FIO

Para medir el rendimiento de almacenamiento del PowerEdge R7725xd, utilizamos métricas estándar de la industria y la herramienta FIO.

4K aleatorio 1M
Secuencial 4K 1M

FIO local ancho de banda

Al probar el acceso local a las 24 unidades NVMe PCIe Gen5 dentro del Dell PowerEdge R7725xd,El sistema muestra exactamente lo que usted esperaría de una plataforma donde cada unidad está conectada a las CPU utilizando un enlace de PCIe Gen5 de carril completo x4Sin capas de red involucradas, este es el rendimiento interno puro del diseño de almacenamiento de Dell's Gen5 y el ancho de banda PCIe de la plataforma AMD EPYC funcionando sin restricciones.

Las lecturas secuenciales comienzan a 184 GB/s con bloques 4K y se escalan rápidamente a medida que aumenta el tamaño del bloque.lo que es una fuerte indicación de lo bien que el sistema puede agregar todos los carriles 24 × 4 Gen5 en un ancho de banda de lectura sostenido sin ningún cuello de botella en la etapa del controlador.

Las escrituras secuenciales siguen una curva diferente, pero se mantienen firmemente en el rango esperado.Esto se alinea con el comportamiento de escritura de las unidades SSD Micron 9550 PRO y la sobrecarga inherente a la alta NVMe paralela escribe a través de tantos dispositivos independientes.

El rendimiento de lectura aleatoria es otro punto destacado. El sistema alcanza velocidades de casi 300 GB/s en los tamaños de bloques más pequeños, baja ligeramente en el rango medio,y luego se recupera a los 200 superiores y 300 bajos en tamaños de bloques más grandesEn 1M, las lecturas aleatorias alcanzan un máximo de 318 GB/s, lo que demuestra la capacidad de la plataforma para distribuir operaciones mixtas de manera uniforme en las 24 unidades.

Las escrituras aleatorias se producen a una velocidad más baja, lo cual es típico para las tareas de metadatos dispersos y asignación de escritura en un amplio conjunto NVMe.Los resultados se mantienen en el rango de 140 a 160 GB/s durante la mayor parte de la prueba y se reducen a poco menos de 100 GB/s a 1 M.

FIO local IOPS

Cuando se examina el lado IOPS, el R7725xd demuestra un rendimiento robusto de bloque pequeño,con tasas de solicitud que llegan a las decenas de millones antes de que los tamaños de bloques más grandes cambien la carga de trabajo hacia un perfil impulsado por ancho de banda.

En 4K, las lecturas alcanzan 44.9 millones de IOPS y las escrituras llegan a 36.3 millones.Demostrar la capacidad del sistema para distribuir eficientemente las cargas de trabajo de alta cola en todas las unidadesEstos valores se estrechan naturalmente a medida que aumentan los tamaños de los bloques, pero la progresión sigue siendo consistente a través de los rangos de 8K, 16K y 32K.

En los bloques 16K y 32K, las lecturas se establecen en 17,4 millones y 8,35 millones de IOPS, con lecturas aleatorias que coinciden estrechamente en 16,5 millones y 8,15 millones.seguimiento más bajo pero estable en patrones de acceso secuenciales y aleatorios.

A medida que nos movemos a 64K y más, las transiciones de prueba de IOPS puro a un escenario más de ancho de banda limitada. IOPS caen en el bajo rango de millones y finalmente en los cientos de miles.En el tamaño del bloque 1M, leer IOPS tierra alrededor de 300K, escribe en alrededor de 174K, y las operaciones aleatorias terminan en el mismo vecindario.

En general, los resultados locales de IOPS muestran claramente la capacidad del sistema para soportar cargas de trabajo de muy alta profundidad de cola en bloques pequeños.con escalabilidad predecible a medida que crecen las transferencias y el ancho de banda se convierte en el factor dominante.

PEAK: AIO: Por qué el Dell PowerEdge R7725xd se ajusta a esta carga de trabajo

PEAK: AIO está diseñado para entornos que requieren acceso extremadamente rápido y de baja latencia a grandes conjuntos de datos, generalmente para capacitación de IA, tuberías de inferencia, modelado financiero y análisis en tiempo real.La plataforma prospera en el almacenamiento NVMe denso, un ancho de banda PCIe equilibrado y una latencia predecible a escala.el hardware subyacente debe ofrecer un rendimiento sostenido manteniendo un rendimiento constante y repetible bajo cargas pesadas concurrentes.

Aquí es donde el Dell PowerEdge R7725xd se alinea naturalmente con PEAK: AIO. La arquitectura del sistema está diseñada para maximizar los recursos de PCIe Gen5, exponiendo todo el ancho de banda de sus 24 U montados en el frente.2 bahías NVMe directamente a las CPUEste diseño le da a PEAK: AIO el perfil de paralelismo y latencia que espera de las tuberías de datos modernas basadas en NVMe.La configuración del sistema dividió los SSD NVMe en dos grupos RAID0.

En el escenario probado, utilizamos dos sistemas de clientes conectados al R7725xd, cada uno equipado con Broadcom BCM57608 2x 200G NICs.Empujando el R7725xd en una configuración realista de alto rendimiento que refleja lo que PEAKEste nivel de ancho de banda de la red nos dio el espacio para hacer hincapié en el subsistema NVMe, la topología PCIe,y la CPU se interconecta sin cuellos de botella en la capa NIC.

El resultado es una plataforma que se alinea efectivamente con las cargas de trabajo de PEAK: AIO.y la capacidad de red para mantener la ingestión de datos de varios clientes a cientos de gigabits por clienteTodas estas características son fundamentales para alcanzar las expectativas de rendimiento de PEAK:AIO.

PEAK:AIO ️ NVMe-of RDMA ️ Ancho de banda

Examinando los resultados de ancho de banda NVMe-oF RDMA en el PowerEdge R7725xd con PEAK: AIO, la tendencia general es precisamente lo que esperamos de un sistema con tanto ancho de banda PCIe y de red.A medida que el tamaño del bloque aumentaEn la actualidad, el rendimiento aumenta rápidamente hasta que se estabiliza cerca del límite práctico de la plataforma.

En los tamaños de bloques pequeños, el rendimiento comienza en el rango medio de 20 GB / s tanto para leer como para escribir, lo cual es normal porque las transferencias 4K y 8K empujan la ruta IOPS mucho más difícil que la ruta de rendimiento.Una vez que entramos en los bloques 16K y 32KLas lecturas saltan a alrededor de 154 GB/s a 32K y continúan subiendo al rango de 160 GB/s, que es justo donde esperaríamos una configuración de doble cliente a través de cuatro enlaces de 200 Gb/s a tierra.

Los espejos de rendimiento de lectura aleatoria secuenciales casi perfectamente.Así que el ancho de banda de lectura aleatoria esencialmente sigue secuencial de lectura de ancho de banda todo el camino hacia arribaEsto indica que la pila de almacenamiento no está causando cuellos de botella en los patrones de acceso mixto,y la topología PCIe de R7725xd®s está distribuyendo la carga uniformemente a través de las 24 unidades NVMe Gen5.

El rendimiento de escritura sigue una curva similar, aunque es ligeramente inferior a las lecturas.Bajando a aproximadamente 117 GB/s a 128K pero recuperándose a medida que aumenta el tamaño del bloqueLas escrituras aleatorias se comportan de manera diferente y se aplanan más cerca de 110-117 GB/s, lo cual es normal para cargas de trabajo de cola mixta que introducen gastos adicionales.

La conclusión clave de esta sección es que el R7725xd no tiene problemas para mantener un ancho de banda extremadamente alto sobre NVMe-oF, incluso con múltiples clientes que llevan el sistema a sus límites.Una vez que los tamaños de bloques alcanzan 32K o más, el servidor satura constantemente su red disponible y ancho de banda de almacenamiento.El objetivo de la plataforma es mejorar la calidad de la información de los usuarios y mejorar la calidad de la información..

PEAK AIO ¢ NVMe-oF RDMA IOPS

En el lado de IOPS, el PowerEdge R7725xd muestra un buen rendimiento en bloques pequeños, aunque inicialmente observamos números más bajos de lo esperado;Se espera que este problema se resuelva con un mejor soporte de controladores de red en el futuro.Incluso con eso en juego, la tendencia general de escalado aparece exactamente como NVMe-oF RDMA típicamente se comporta cuando el tamaño del bloque aumenta.

En el tamaño de bloque más pequeño, el sistema puede entregar más de 6 millones de IOPS a través de cargas de trabajo secuenciales y aleatorias.y escribir al azar todos se sientan en aproximadamente el mismo rango en 4K y 8K, lo que indica que los clientes de front-end, la infraestructura PCIe y las unidades NVMe no tienen problemas para mantenerse al día con la tasa de solicitudes.

A medida que crecen los tamaños de los bloques, comienza la caída esperada en IOPS. a 32K, lee tierra alrededor de 4,7 millones de IOPS, mientras que escribe el rastro ligeramente detrás en alrededor de 4,4 millones.,La reducción de la velocidad de entrada de datos a aproximadamente 3,3 millones de IOPS, lo que se alinea con la cola adicional y el recargo de la CPU introducido por los patrones de acceso mixto.

Al pasar a los bloques grandes, IOPS continúa reduciéndose de una manera lineal predecible.y IOPS naturalmente cae a los cientos de miles de mediadosEn un tamaño de bloque de 1M, todas las cargas de trabajo convergen a 140K-153K IOPS, consistente con los números de ancho de banda que vimos en la sección anterior.

Rendimiento de almacenamiento GPUDirect

Una de las pruebas que realizamos en el R7725xd fue la prueba Magnum IO GPUDirect Storage (GDS).GDS es una característica desarrollada por NVIDIA que permite a las GPUs eludir la CPU al acceder a datos almacenados en unidades NVMe u otros dispositivos de almacenamiento de alta velocidad.En lugar de enrutamiento de datos a través de la CPU y la memoria del sistema, GDS permite la comunicación directa entre la GPU y el dispositivo de almacenamiento, reduciendo significativamente la latencia y la mejora del rendimiento de los datos.

Cómo funciona el almacenamiento GPUDirect

Tradicionalmente, cuando una GPU procesa datos almacenados en una unidad NVMe, los datos deben viajar primero a través de la CPU y la memoria del sistema antes de llegar a la GPU.Como la CPU se convierte en un intermediarioGPUDirect Storage elimina esta ineficiencia al permitir que la GPU acceda a los datos directamente desde el dispositivo de almacenamiento a través del bus PCIe.Esta ruta directa reduce el movimiento de datos por encima, lo que permite transferencias de datos más rápidas y eficientes.

Las cargas de trabajo de IA, especialmente las que implican aprendizaje profundo, consumen mucha información.y cualquier retraso en la transferencia de datos puede conducir a GPUs subutilizadas y tiempos de entrenamiento más largos. GPUDirect Storage aborda este desafío asegurando que los datos se entreguen a la GPU lo más rápido posible, minimizando el tiempo de inactividad y maximizando la eficiencia computacional.

Además, el GDS es particularmente beneficioso para cargas de trabajo que implican la transmisión de grandes conjuntos de datos, como el procesamiento de video, el procesamiento de lenguaje natural o la inferencia en tiempo real.Al reducir la dependencia de la CPU, GDS acelera el movimiento de datos y libera recursos de la CPU para otras tareas, mejorando aún más el rendimiento general del sistema.

Más allá del ancho de banda en bruto, GPUDirect con NVMe-oF (TCP / RDMA) también ofrece E / S de latencia ultra baja. Esto garantiza que las GPU nunca estén hambrientas de datos, lo que hace que el sistema sea ideal para la inferencia de IA en tiempo real,tuberías de análisis, y reproducción de vídeo.

GDSIO Lectura secuencial

Cuando se examina PEAK:AIO con un cliente que utiliza GDSIO, el rendimiento de lectura muestra un patrón de escalado claro a medida que aumenta el tamaño del bloque y el número de hilos.Este único cliente estaba conectado a través de dos enlaces 400G, limitando su potencia total a 90 GB/s.

En los tamaños de bloques más pequeños y el bajo número de hilos, el rendimiento es modesto, con lecturas 4K que comienzan alrededor de 189 MiB / s en un solo hilo.El sistema responde inmediatamente., empujando 691MiB/s a cuatro hilos y rompiendo en el rango de multi-GiB/s a medida que nos adentramos en bloques más grandes.

Los tamaños de bloques de rango medio muestran la mayor sensibilidad al número de hilos.con sólo un ligero afianzamiento más allá de esoUn patrón similar aparece en 64K y 128K, donde el sistema pasa de un bajo número de un solo dígito de GiB/s con un bajo paralelismo a más de 30 GiB/s a medida que la carga de trabajo aumenta.

Una vez que alcanzamos los tamaños de bloques más grandes, el rendimiento comienza a nivelarse a medida que el sistema se acerca a su techo de rendimiento para un solo cliente.El rendimiento sube de 11 GiB/s en un hilo a alrededor de 88 GiB/s con un alto número de hilosLas transferencias de 5 MiB y 10 MiB muestran la misma meseta, alcanzando alrededor de 89 ‰ 90 GiB/s independientemente de si la prueba se ejecuta a 64, 128 o 256 hilos.

GDSIO Escribir secuencial

En el lado de la escritura, el comportamiento de escala sigue un patrón similar a las lecturas, pero con un rendimiento ligeramente menor en la mayoría de los tamaños de bloques, lo que se espera para las cargas de trabajo de escritura secuenciales.En los tamaños de bloques más pequeñosEn cuatro hilos, el rendimiento comienza en 165 MiB/s para un solo hilo a 4K y aumenta constantemente a medida que aumenta el paralelismo.

Los tamaños de bloques de rango medio muestran ganancias más fuertes a medida que aumentan los números de hilos.Los rangos 64K y 128K continúan la tendencia, pasando de los bajos GiB/s de un solo dígito a los 30 GiB/s y 50 GiB/s a medida que la carga de trabajo se vuelve más paralela.

Las transferencias más grandes se producen cuando el sistema se asienta en su límite natural de transmisión de escritura.Las pruebas de 5 MiB y 10 MiB siguen un patrón similar, con resultados que alcanzan un máximo de alrededor de 90 GiB/s, independientemente de si el sistema se ejecuta a 64, 128 o 256 hilos.

Redefinición del rendimiento en la era Gen5

El Dell PowerEdge R7725xd trasciende el papel de un servidor de almacenamiento tradicional; marca un cambio fundamental en la forma en que se orquesta el ancho de banda dentro del rack del centro de datos.Al evitar por completo los switches PCIe y proporcionar a cada unidad NVMe una, conexión directa a la CPU, Dell ha diseñado una plataforma donde el rendimiento escala linealmente, el comportamiento térmico es totalmente predecible, y la alta concurrencia se aprovecha como una ventaja de rendimiento,más que un reto de diseño.

Cuando se combina con las unidades SSD Micron®s 9550 PRO y las capacidades de E/S paralelas del software PEAK:AIO, el R7725xd evoluciona de una carcasa NVMe densamente empaquetada a un motor de datos completo.Dentro de su compacto factor de forma 2U, el servidor no solo puede saturar su tejido PCIe local, sino también alimentar las GPU a velocidad de línea a través de RDMA, o incluso ejecutar cargas de trabajo de cómputo y almacenamiento simultáneamente.

Dell PowerEdge R7225xd heroDell PowerEdge R7225xd

En escenarios del mundo real, esta potente configuración ofrece más de 300 GB/s de rendimiento interno y 160 GB/s a través de la red.Este rendimiento rivaliza con el de los clústeres de almacenamiento multi-nodo mucho más complejos y costososEl proyecto, que se desarrolla en el marco de un proyecto de investigación, está basado en una solución simplificada y rentable de un solo nodo, que constituye un testimonio convincente del poder de la alineación arquitectónica, donde cada capa, desde el silicio en bruto hasta el software optimizado, está integrada en un conjunto de componentes de la arquitectura.está diseñado para priorizar la eficiencia y el ancho de banda alto sostenido.

El R7725xd establece un nuevo estándar para el rendimiento de almacenamiento de un solo nodo en la era Gen5.infraestructuras de análisis de alta velocidad, o entornos de entrenamiento intensivos de puntos de control, ofrece una visión de un futuro en el que los cuellos de botella del sistema son cosa del pasado, liberando un potencial de rendimiento previamente inalcanzable.

China, China, China, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón.
Sandy Yang, directora de estrategia global
WhatsApp / WeChat: +86 13426366826 El número de teléfono es:
Correo electrónico: yangyd@qianxingdata.com
El sitio web: www.qianxingdata.com/www.storagesserver.com

Enfoque en el negocio:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas globales para ofrecer productos confiables y servicios profesionales.
Usar la tecnología para construir un mundo inteligente¡Su proveedor de servicios de productos TIC de confianza!

PREV: Las nuevas JBODs PowerVault MD de Dell Technologies controlan la explosión de datos

NEXT: Comentario de la tarjeta RAID de Broadcom MegaRAID 9670W-16i

Contacto

Beijing Qianxing Jietong Technology Co., Ltd.

Persona de Contacto: Ms. Sandy Yang

Teléfono: 13426366826

300 GB/s en 2U: El Dell PowerEdge R7725xd restablece las expectativas de rendimiento de almacenamiento

Servidor del almacenamiento de estante

Servidor de la fusión de Huawei

Dell Poweredge Server

Servidor de H3C

Interruptores del Datacom

Dispositivo de la red inalámbrica (WLAN)

Router inalámbrico elegante

Disco duro HDD

SSD interno del disco duro

Tarjeta gráfica de Geforce

Procesador de la CPU de INTEL

Memoria RAM del servidor

Servidor restaurado del almacenamiento

Módulo del transmisor-receptor de SFP

Interruptor de canal de la fibra

300 GB/s en 2U: El Dell PowerEdge R7725xd restablece las expectativas de rendimiento de almacenamiento

Las cosas que hay que aprender

Dell PowerEdge R7725xd Rendimiento

Indicador de rendimiento del FIO

FIO local ancho de banda

FIO local IOPS

PEAK: AIO: Por qué el Dell PowerEdge R7725xd se ajusta a esta carga de trabajo

PEAK:AIO ️ NVMe-of RDMA ️ Ancho de banda

PEAK AIO ¢ NVMe-oF RDMA IOPS

Rendimiento de almacenamiento GPUDirect

Cómo funciona el almacenamiento GPUDirect

GDSIO Lectura secuencial

GDSIO Escribir secuencial

Redefinición del rendimiento en la era Gen5

Servidor del almacenamiento de estante

12 servidor montado en rack del estante de Lenovo ThinkSystem SR630 del servidor de las bahías 1U

Procesador de Intel Xeon E-2378G del servidor del almacenamiento de estante de ThinkSystem SR250 V2 4SFF

Servidor del soporte de estante de Inspur NF5180M6 1U del servidor del almacenamiento de estante de Intel C621A

Servidor de la fusión de Huawei

Servidor 32 DDR4 DIMMs del estante de FusionServer 5288 V6 4U 44 discos duros de 3,5 pulgadas

Servidor ultra de alta densidad 1288H V5 del almacenamiento de la red del servidor 1U de la fusión de Huawei

Almacenamiento de destello híbrido del nuevo de Gen OceanStor 5310 Huawei servidor del estante