Durante GTC 2026, VDURA mostró actualizaciones clave a su Plataforma de Datos, diseñada para mejorar la utilización de la GPU y la eficiencia de almacenamiento en entornos de IA.la disponibilidad general del acceso remoto directo a la memoria (RDMA), una vista previa de su innovadora tecnología Context-Aware Tiering, y configuraciones de infraestructura validadas construidas alrededor de CPUs AMD EPYC Turín y componentes de red NVIDIA ConnectX-7.
Estas actualizaciones están diseñadas para eliminar los cuellos de botella del movimiento de datos entre los clústeres de GPU y los sistemas de almacenamiento,al tiempo que se optimiza la colocación de datos a través de los niveles de almacenamiento para apoyar mejor la capacitación y las cargas de trabajo de inferencia de IA a gran escala.
RDMA permite las rutas de datos directas de la GPU
VDURA ha integrado soporte RDMA en toda su plataforma de datos, lo que permite a los servidores GPU acceder al almacenamiento directamente a través de la red sin la participación de la CPU.Este avance permite que las transferencias de datos de la GPU al almacenamiento eviten las rutas tradicionales mediadas por el núcleo y la CPU, reduciendo significativamente la latencia y aumentando el rendimiento, ofreciendo el camino de datos de baja latencia y alto rendimiento que la formación de IA y las cargas de trabajo de inferencia exigen a escala.
Espacio de nombres global de VDURA
La implementación de RDMA está estrechamente integrada con VDURA DirectFlow, la capa de movimiento de datos patentada de la compañía, asegurando que todo el tráfico del servidor de GPU aproveche RDMA.Al eliminar la sobrecarga de la CPU en la ruta de datosEste enfoque mantiene tasas de utilización de GPU más altas al tiempo que minimiza la latencia de la tubería en los clústeres de IA distribuidos.,una prioridad clave para las implementaciones de IA a gran escala.
Objetivos de clasificación por niveles conscientes del contexto Eficiencia de la colocación de datos
VDURA también detalló la primera fase de su capacidad Context-Aware Tiering, programada para su lanzamiento general más adelante en 2026.colocación automatizada de datos en los niveles de almacenamiento basados en el comportamiento de la carga de trabajo y los patrones de acceso en tiempo real, más allá de las políticas estáticas para garantizar que los datos se encuentren exactamente donde más se necesitan..
La fase inicial extiende el búfer DirectFlow a las SSD NVMe locales, permitiendo que los datos "hot" a los que se accede con frecuencia residan más cerca de los recursos de cómputo.Esto reduce la dependencia del almacenamiento compartido o conectado a la red para los datos activos, mejorando los tiempos de respuesta para cargas de trabajo críticas y optimizando aún más el rendimiento.
Además, la plataforma introduce controles de copia de texto de KVCache, que persisten selectivamente solo datos de inferencia críticos de persistencia en el almacenamiento duradero.Esto minimiza la actividad de E / S innecesaria mientras se mantienen las garantías de persistencia requeridas por las tuberías de inferencia de IA de producción, logrando un equilibrio entre eficiencia y fiabilidad.
VDURA también está implementando un marco unificado de Cache Context Tiering que abarca DRAM y SSD local.hacer que sea adecuado para casos de uso como la inferencia LLM de contexto largo y la generación aumentada de recuperación (RAG).
VDURA señaló que las futuras fases de Context-Aware Tiering se expandirán a la colocación de datos conscientes de la aplicación, una mayor coherencia de la caché en todos los nodos,y soporte para componentes de infraestructura emergentes como las DPUs NVIDIA BlueField-4 que amplían aún más las capacidades de la plataforma a medida que evolucionan las cargas de trabajo de IA.
Complementando estas mejoras de software, la compañía introdujo configuraciones de plataforma optimizadas que emparejan procesadores AMD EPYC Turín con adaptadores de red NVIDIA ConnectX-7.Estas configuraciones están diseñadas para complementar las rutas de datos habilitadas para RDMA, que admite una comunicación de alto rendimiento y baja latencia entre los clusters de GPU y los sistemas de almacenamiento, estableciendo un nuevo punto de referencia para la infraestructura de IA nativa de GPU.
Enfoque de la tubería de datos de IA de pila completa
El CEO de VDURA, Ken Claffey, enfatizó el enfoque de la compañía en ofrecer una plataforma de almacenamiento de IA que abarque toda la jerarquía de datos desde la memoria hasta el almacenamiento a largo plazo, sin comprometer el rendimiento.Destacó que la plataforma aprovecha el RDMA para, acceso a datos sin CPU y niveles conscientes del contexto para posicionar de manera inteligente los datos en los niveles de almacenamiento ̇ innovaciones que ayudan a las organizaciones a soportar modelos de IA más grandes, manejar más solicitudes de inferencia,y ampliar la infraestructura de IA al tiempo que cumple con los requisitos de fiabilidad de producción.
Este enfoque combinado está diseñado específicamente para soportar modelos de mayor tamaño, aumentar el rendimiento de inferencia,y mejorar la eficiencia general de la infraestructura, manteniendo al mismo tiempo los estándares de fiabilidad y cumplimiento esenciales para las implementaciones de IA en la producción.
Disponibilidad
El soporte RDMA está ahora generalmente disponible en las plataformas VDURA V5000 y V7000, listo para su despliegue inmediato.con programas de acceso temprano actualmente en curso para clientes seleccionados para probar y optimizar la tecnología antes de su lanzamiento completo.
China, China, China, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón, Japón.
Sandy Yang, directora de estrategia global
WhatsApp / WeChat: +86 13426366826 El número de teléfono es:
Correo electrónico: yangyd@qianxingdata.com
El sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque en el negocio:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas globales para ofrecer productos confiables y servicios profesionales.
Usar la tecnología para construir un mundo inteligente¡Su proveedor de servicios de productos TIC de confianza!
Sandy Yang, directora de estrategia global
WhatsApp / WeChat: +86 13426366826 El número de teléfono es:
Correo electrónico: yangyd@qianxingdata.com
El sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque en el negocio:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas globales para ofrecer productos confiables y servicios profesionales.
Usar la tecnología para construir un mundo inteligente¡Su proveedor de servicios de productos TIC de confianza!



