IBM ha presentado una arquitectura de almacenamiento consciente del contenido (CAS) que integra el procesamiento de datos de IA directamente en la capa de almacenamiento. Este enfoque está diseñado para flujos de trabajo de generación aumentada por recuperación (RAG), ya que integra la vectorización de documentos en el propio sistema de almacenamiento, reduciendo la necesidad de canalizaciones de preprocesamiento externas.
CAS transfiere una función clave de RAG (la incrustación de documentos mediante métodos basados en modelos de lenguaje grandes o LLM) a la infraestructura de almacenamiento. Esto permite a las empresas procesar e indexar datos en su ubicación existente, alineando los sistemas de almacenamiento con cargas de trabajo impulsadas por IA y minimizando el movimiento de datos entre diferentes niveles de infraestructura. IBM posiciona esto como un medio para simplificar la implementación, al tiempo que aumenta el rendimiento y mejora la localidad de los datos para aplicaciones de IA.
Base de datos vectorial a escala
En el corazón de la implementación de CAS de IBM se encuentra una base de datos vectorial optimizada para la búsqueda semántica. Las bases de datos vectoriales admiten la búsqueda de vecinos más cercanos aproximados (ANN), lo que permite a los sistemas de IA recuperar fragmentos de datos relevantes basándose en métricas de similitud como la similitud del coseno o la distancia L2. Esta capacidad es fundamental para RAG, donde las consultas de los usuarios se convierten en vectores y se comparan con datos empresariales indexados para ofrecer respuestas contextuales.
Gráfico CAS de IBM. Fuente: IBM
IBM Research, en colaboración con Samsung y NVIDIA, presentó un sistema prototipo capaz de escalar a 100 mil millones de vectores en un solo servidor. El sistema logró más del 90 por ciento de recuperación y precisión, con una latencia de consulta promedio inferior a 700 milisegundos. Esta escala se adapta a entornos empresariales donde los conjuntos de datos pueden abarcar miles de millones de archivos y, una vez completamente indexados, crecer hasta cientos de miles de millones de vectores.
Integración de la canalización RAG
RAG se está convirtiendo en un enfoque preferido para la IA empresarial, ya que mejora la precisión de la salida sin necesidad de reentrenamiento del modelo. Funciona complementando las indicaciones con datos específicos de la empresa recuperados de una base de datos vectorial.
La canalización comienza con la ingesta de datos, donde los documentos como PDF y presentaciones se analizan, se dividen en fragmentos y se convierten en incrustaciones. Estas incrustaciones se almacenan en una base de datos vectorial que organiza los datos para una búsqueda de similitud eficiente. Durante la consulta, la entrada del usuario se incrusta y se compara con los vectores almacenados, y el contenido relevante se pasa al modelo de lenguaje como contexto. Este mecanismo de anclaje reduce las alucinaciones y aumenta la confianza en las salidas generadas por IA.
CAS de IBM integra toda esta canalización directamente en el almacenamiento, consolidando la ingesta, la indexación y la recuperación en estrecha proximidad a los datos.
Abordar los desafíos de escala y costo
Los sistemas de almacenamiento empresarial ya operan a escala de petabytes. Cuando se extienden a CAS, cada archivo puede generar cientos de vectores, lo que expande rápidamente el tamaño del conjunto de datos. Las bases de datos vectoriales tradicionales suelen escalar horizontalmente en varios servidores, lo que introduce costos adicionales y complejidad operativa. La indexación y la reindexación de grandes conjuntos de datos también se convierten en tareas que consumen mucho tiempo.
El enfoque de IBM se centra en mejorar la densidad vectorial y reducir la sobrecarga de indexación para limitar la expansión de la infraestructura. La arquitectura separa el almacenamiento de vectores e índices de la computación de consultas, lo que permite escalar de forma independiente los recursos de almacenamiento y computación. Esto es posible gracias a IBM Storage Scale y su sistema de archivos paralelos de alto rendimiento.
Arquitectura de almacenamiento y hardware
La implementación de CAS aprovecha el IBM Storage Scale System 6000 (ESS 6000), una plataforma totalmente flash diseñada para cargas de trabajo de IA y alto rendimiento. El sistema admite hasta 48 unidades NVMe por gabinete 4U, con capacidades de unidad individuales que van desde 7 TB hasta 60 TB. Integra conectividad PCIe Gen5, InfiniBand de 400 Gb o Ethernet de 200 Gb, ofreciendo hasta 340 GB/s de rendimiento de lectura y 175 GB/s de escritura por nodo, junto con hasta 7 millones de IOPS.
La plataforma también admite NVIDIA GPUDirect Storage, lo que facilita rutas de datos directas entre el almacenamiento y las GPU, así como DPUs BlueField-3 para descargar tareas de red y procesamiento de datos.
Las SSD NVMe PCIe Gen5 Samsung PM9D3a proporcionan almacenamiento de alta densidad y alto rendimiento. Basadas en V-NAND TLC de octava generación, estas unidades ofrecen hasta 30,72 TB por dispositivo, con velocidades de lectura secuencial de hasta 12 GB/s y velocidades de escritura de hasta 6,8 GB/s. El uso de SSD empresariales disponibles comercialmente permite que la arquitectura escale utilizando componentes estándar.
Indexación jerárquica y aceleración de GPU
Para abordar la indexación a escala, IBM desarrolló un modelo de indexación jerárquica que consta de múltiples subíndices que se pueden optimizar de forma independiente. Esta estructura permite actualizaciones incrementales y reindexación localizada sin interrumpir todo el conjunto de datos, mejorando tanto la disponibilidad como la eficiencia operativa.
La aceleración de GPU reduce drásticamente el tiempo de indexación en comparación con los enfoques solo de CPU. Las tareas que llevarían horas en CPU se pueden completar en minutos utilizando GPU NVIDIA. En las pruebas, la creación de índices para 100 mil millones de vectores tomó 4 días con 6 GPU NVIDIA H200, en comparación con los 120 días estimados en un sistema de CPU de doble zócalo.
El conjunto de datos completo, incluidos los vectores e índices, consumió aproximadamente 153 TiB de almacenamiento. La carga y partición inicial de datos tomó nueve días. El sistema resultante entregó una latencia de consulta promedio de 694 ms con un 90 % de recuperación, validado contra cálculos de verdad fundamental de fuerza bruta.
Hoja de ruta
IBM y NVIDIA continúan optimizando la plataforma, centrándose en reducir la latencia de indexación y consulta. Los objetivos actuales incluyen indexar 100 mil millones de vectores o más en un solo día, reducir el tiempo de ingesta de datos de nueve días a un día y disminuir la latencia de consulta al rango de 50-100 milisegundos, manteniendo un 90 por ciento de recuperación.
La integración de la indexación vectorial en sistemas de archivos estándar tiene como objetivo simplificar la implementación y reducir las barreras para la adopción de IA empresarial. Al integrar las capacidades de RAG directamente en el almacenamiento, IBM está posicionando CAS como una capa fundamental para la infraestructura habilitada para IA.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Director de Estrategia Global
WhatsApp / WeChat: +86 13426366826
Correo electrónico: yangyd@qianxingdata.com
Sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque empresarial:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas mundiales para ofrecer productos confiables y servicios profesionales.
¡Construyendo un mundo inteligente con tecnología! Su proveedor de servicios de productos TIC de confianza.
Sandy Yang/Director de Estrategia Global
WhatsApp / WeChat: +86 13426366826
Correo electrónico: yangyd@qianxingdata.com
Sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque empresarial:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas mundiales para ofrecer productos confiables y servicios profesionales.
¡Construyendo un mundo inteligente con tecnología! Su proveedor de servicios de productos TIC de confianza.



