Inicio Casos

IBM presenta almacenamiento consciente de contenido para cargas de trabajo RAG

Todos los productos

Servidor del almacenamiento de estante
(179)

Servidor de la fusión de Huawei
(31)

Dell Poweredge Server
(59)

Servidor de H3C
(31)

Interruptores del Datacom
(96)

Dispositivo de la red inalámbrica (WLAN)
(21)

Router inalámbrico elegante
(17)

Disco duro HDD
(78)

SSD interno del disco duro
(16)

Tarjeta gráfica de Geforce
(27)

Procesador de la CPU de INTEL
(20)

Memoria RAM del servidor
(6)

Servidor restaurado del almacenamiento
(6)

Módulo del transmisor-receptor de SFP
(4)

Interruptor de canal de la fibra
(125)

Certificación

China Beijing Qianxing Jietong Technology Co., Ltd. certificaciones

Comentarios de cliente

El personal de ventas de la tecnología Co., Ltd de Pekín Qianxing Jietong es muy profesional y paciente. Pueden proporcionar citas rápidamente. La calidad y el empaquetado de los productos son también muy buenos. Nuestra cooperación es muy lisa.

—— LLC del》 de Festfing DV del 《

Cuando buscaba la CPU de Intel y el SSD de Toshiba urgente, Sandy de la tecnología Co., Ltd de Pekín Qianxing Jietong me dio mucha ayuda y me consiguió los productos que necesité rápidamente. La aprecio realmente.

—— Kitty Yen

Sandy de la tecnología Co., Ltd de Pekín Qianxing Jietong es un vendedor muy cuidadoso, que puede recordarme errores de la configuración a tiempo cuando compro un servidor. Los ingenieros son también muy profesionales y pueden terminar rápidamente el proceso de prueba.

—— Strelkin Mikhail Vladimirovich

Estamos muy contentos con nuestra experiencia trabajando con Beijing Qianxing Jietong. La calidad del producto es excelente y la entrega siempre es puntual. Su equipo de ventas es profesional, paciente y muy útil con todas nuestras preguntas. Realmente apreciamos su apoyo y esperamos una asociación a largo plazo. ¡Muy recomendado!

—— Ahmad Navid

Calidad: Gran experiencia con mi proveedor. El MikroTik RB3011 ya estaba usado, pero estaba en muy buen estado y todo funcionaba perfectamente.y todas mis preocupaciones fueron abordadas rápidamenteUn proveedor muy confiable, muy recomendable.

—— Geran Colesio

Estoy en línea para chatear ahora

IBM presenta almacenamiento consciente de contenido para cargas de trabajo RAG

April 24, 2026

IBM ha presentado una arquitectura de almacenamiento consciente del contenido (CAS) que integra el procesamiento de datos de IA directamente en la capa de almacenamiento. Este enfoque está diseñado para flujos de trabajo de generación aumentada por recuperación (RAG), ya que integra la vectorización de documentos en el propio sistema de almacenamiento, reduciendo la necesidad de canalizaciones de preprocesamiento externas.

CAS transfiere una función clave de RAG (la incrustación de documentos mediante métodos basados en modelos de lenguaje grandes o LLM) a la infraestructura de almacenamiento. Esto permite a las empresas procesar e indexar datos en su ubicación existente, alineando los sistemas de almacenamiento con cargas de trabajo impulsadas por IA y minimizando el movimiento de datos entre diferentes niveles de infraestructura. IBM posiciona esto como un medio para simplificar la implementación, al tiempo que aumenta el rendimiento y mejora la localidad de los datos para aplicaciones de IA.

Base de datos vectorial a escala

En el corazón de la implementación de CAS de IBM se encuentra una base de datos vectorial optimizada para la búsqueda semántica. Las bases de datos vectoriales admiten la búsqueda de vecinos más cercanos aproximados (ANN), lo que permite a los sistemas de IA recuperar fragmentos de datos relevantes basándose en métricas de similitud como la similitud del coseno o la distancia L2. Esta capacidad es fundamental para RAG, donde las consultas de los usuarios se convierten en vectores y se comparan con datos empresariales indexados para ofrecer respuestas contextuales.

Gráfico CAS de IBM. Fuente: IBM

IBM Research, en colaboración con Samsung y NVIDIA, presentó un sistema prototipo capaz de escalar a 100 mil millones de vectores en un solo servidor. El sistema logró más del 90 por ciento de recuperación y precisión, con una latencia de consulta promedio inferior a 700 milisegundos. Esta escala se adapta a entornos empresariales donde los conjuntos de datos pueden abarcar miles de millones de archivos y, una vez completamente indexados, crecer hasta cientos de miles de millones de vectores.

Integración de la canalización RAG

RAG se está convirtiendo en un enfoque preferido para la IA empresarial, ya que mejora la precisión de la salida sin necesidad de reentrenamiento del modelo. Funciona complementando las indicaciones con datos específicos de la empresa recuperados de una base de datos vectorial.

La canalización comienza con la ingesta de datos, donde los documentos como PDF y presentaciones se analizan, se dividen en fragmentos y se convierten en incrustaciones. Estas incrustaciones se almacenan en una base de datos vectorial que organiza los datos para una búsqueda de similitud eficiente. Durante la consulta, la entrada del usuario se incrusta y se compara con los vectores almacenados, y el contenido relevante se pasa al modelo de lenguaje como contexto. Este mecanismo de anclaje reduce las alucinaciones y aumenta la confianza en las salidas generadas por IA.

CAS de IBM integra toda esta canalización directamente en el almacenamiento, consolidando la ingesta, la indexación y la recuperación en estrecha proximidad a los datos.

Abordar los desafíos de escala y costo

Los sistemas de almacenamiento empresarial ya operan a escala de petabytes. Cuando se extienden a CAS, cada archivo puede generar cientos de vectores, lo que expande rápidamente el tamaño del conjunto de datos. Las bases de datos vectoriales tradicionales suelen escalar horizontalmente en varios servidores, lo que introduce costos adicionales y complejidad operativa. La indexación y la reindexación de grandes conjuntos de datos también se convierten en tareas que consumen mucho tiempo.

El enfoque de IBM se centra en mejorar la densidad vectorial y reducir la sobrecarga de indexación para limitar la expansión de la infraestructura. La arquitectura separa el almacenamiento de vectores e índices de la computación de consultas, lo que permite escalar de forma independiente los recursos de almacenamiento y computación. Esto es posible gracias a IBM Storage Scale y su sistema de archivos paralelos de alto rendimiento.

Arquitectura de almacenamiento y hardware

La implementación de CAS aprovecha el IBM Storage Scale System 6000 (ESS 6000), una plataforma totalmente flash diseñada para cargas de trabajo de IA y alto rendimiento. El sistema admite hasta 48 unidades NVMe por gabinete 4U, con capacidades de unidad individuales que van desde 7 TB hasta 60 TB. Integra conectividad PCIe Gen5, InfiniBand de 400 Gb o Ethernet de 200 Gb, ofreciendo hasta 340 GB/s de rendimiento de lectura y 175 GB/s de escritura por nodo, junto con hasta 7 millones de IOPS.

La plataforma también admite NVIDIA GPUDirect Storage, lo que facilita rutas de datos directas entre el almacenamiento y las GPU, así como DPUs BlueField-3 para descargar tareas de red y procesamiento de datos.

Las SSD NVMe PCIe Gen5 Samsung PM9D3a proporcionan almacenamiento de alta densidad y alto rendimiento. Basadas en V-NAND TLC de octava generación, estas unidades ofrecen hasta 30,72 TB por dispositivo, con velocidades de lectura secuencial de hasta 12 GB/s y velocidades de escritura de hasta 6,8 GB/s. El uso de SSD empresariales disponibles comercialmente permite que la arquitectura escale utilizando componentes estándar.

Indexación jerárquica y aceleración de GPU

Para abordar la indexación a escala, IBM desarrolló un modelo de indexación jerárquica que consta de múltiples subíndices que se pueden optimizar de forma independiente. Esta estructura permite actualizaciones incrementales y reindexación localizada sin interrumpir todo el conjunto de datos, mejorando tanto la disponibilidad como la eficiencia operativa.

La aceleración de GPU reduce drásticamente el tiempo de indexación en comparación con los enfoques solo de CPU. Las tareas que llevarían horas en CPU se pueden completar en minutos utilizando GPU NVIDIA. En las pruebas, la creación de índices para 100 mil millones de vectores tomó 4 días con 6 GPU NVIDIA H200, en comparación con los 120 días estimados en un sistema de CPU de doble zócalo.

El conjunto de datos completo, incluidos los vectores e índices, consumió aproximadamente 153 TiB de almacenamiento. La carga y partición inicial de datos tomó nueve días. El sistema resultante entregó una latencia de consulta promedio de 694 ms con un 90 % de recuperación, validado contra cálculos de verdad fundamental de fuerza bruta.

Hoja de ruta

IBM y NVIDIA continúan optimizando la plataforma, centrándose en reducir la latencia de indexación y consulta. Los objetivos actuales incluyen indexar 100 mil millones de vectores o más en un solo día, reducir el tiempo de ingesta de datos de nueve días a un día y disminuir la latencia de consulta al rango de 50-100 milisegundos, manteniendo un 90 por ciento de recuperación.

La integración de la indexación vectorial en sistemas de archivos estándar tiene como objetivo simplificar la implementación y reducir las barreras para la adopción de IA empresarial. Al integrar las capacidades de RAG directamente en el almacenamiento, IBM está posicionando CAS como una capa fundamental para la infraestructura habilitada para IA.

Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Director de Estrategia Global
WhatsApp / WeChat: +86 13426366826
Correo electrónico: yangyd@qianxingdata.com
Sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque empresarial:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas mundiales para ofrecer productos confiables y servicios profesionales.
¡Construyendo un mundo inteligente con tecnología! Su proveedor de servicios de productos TIC de confianza.

PREV: Dell PowerMaxOS 10.4 incluye ganancias de rendimiento, resiliencia cibernética ampliada e integración de aplicaciones modernas

NEXT: NetApp amplía la integración de Google Cloud para agilizar los datos empresariales para la IA

Contacto

Beijing Qianxing Jietong Technology Co., Ltd.

Persona de Contacto: Ms. Sandy Yang

Teléfono: 13426366826

IBM presenta almacenamiento consciente de contenido para cargas de trabajo RAG

Servidor del almacenamiento de estante

Servidor de la fusión de Huawei

Dell Poweredge Server

Servidor de H3C

Interruptores del Datacom

Dispositivo de la red inalámbrica (WLAN)

Router inalámbrico elegante

Disco duro HDD

SSD interno del disco duro

Tarjeta gráfica de Geforce

Procesador de la CPU de INTEL

Memoria RAM del servidor

Servidor restaurado del almacenamiento

Módulo del transmisor-receptor de SFP

Interruptor de canal de la fibra

IBM presenta almacenamiento consciente de contenido para cargas de trabajo RAG

Base de datos vectorial a escala

Integración de la canalización RAG

Abordar los desafíos de escala y costo

Arquitectura de almacenamiento y hardware

Indexación jerárquica y aceleración de GPU

Hoja de ruta

Servidor del almacenamiento de estante

12 servidor montado en rack del estante de Lenovo ThinkSystem SR630 del servidor de las bahías 1U

Procesador de Intel Xeon E-2378G del servidor del almacenamiento de estante de ThinkSystem SR250 V2 4SFF

Servidor del soporte de estante de Inspur NF5180M6 1U del servidor del almacenamiento de estante de Intel C621A

Servidor de la fusión de Huawei

Servidor 32 DDR4 DIMMs del estante de FusionServer 5288 V6 4U 44 discos duros de 3,5 pulgadas

Servidor ultra de alta densidad 1288H V5 del almacenamiento de la red del servidor 1U de la fusión de Huawei

Almacenamiento de destello híbrido del nuevo de Gen OceanStor 5310 Huawei servidor del estante