Qdrant, un proveedor de soluciones de bases de datos y búsqueda de vectores componibles, ha implementado un rendimiento de indexación mejorado, mecanismos de conmutación por error de clústeres de triple zona y funciones de registro de auditoría centradas en el cumplimiento.
La empresa desarrolla una base de datos vectorial independiente para almacenar las incorporaciones requeridas por grandes modelos de lenguaje (LLM) y agentes de IA autónomos, que comúnmente impulsan los flujos de trabajo de inferencia de IA como la generación aumentada de recuperación (RAG). Según Qdrant, los equipos de adquisiciones empresariales siempre evalúan las herramientas de búsqueda vectorial según tres criterios básicos: escalabilidad para cargas de trabajo crecientes, continuidad del servicio en medio de fallas de infraestructura y auditoría operativa rastreable.
André Zayarni, cofundador y director ejecutivo de Qdrant, comentó: "Las GPU ya no se limitan a la inferencia de modelos; también optimizan la indexación de datos. Hemos habilitado la construcción HNSW acelerada por GPU en nuestra versión de código abierto desde la v1.13, y esta capacidad ahora está disponible oficialmente en Qdrant Cloud. Combinada con la replicación multi-AZ y el registro de auditoría, la suite integrada equipa a las empresas para implementar Qdrant para cargas de trabajo de producción críticas".
Las últimas actualizaciones de productos de Qdrant cubren tres mejoras clave:
Indexación acelerada por GPU: Las pruebas comparativas confirman que las GPU dedicadas aumentan la velocidad de construcción del índice HNSW hasta cuatro veces en Qdrant Cloud. Los usuarios pueden montar recursos de GPU en clústeres existentes para manejar ráfagas de indexación de alta intensidad de manera eficiente.
Clústeres de zonas de disponibilidad múltiple (AZ): el mecanismo de replicación entre zonas de disponibilidad duplica datos en tres zonas de disponibilidad en una sola región. Elimina la latencia de conmutación por error manual, lo que garantiza operaciones de lectura y escritura ininterrumpidas incluso si una zona de disponibilidad sufre una interrupción.
Registro de auditoría: La función registra todas las operaciones basadas en API, incluidas consultas de datos, actualizaciones, eliminaciones, gestión de colecciones y tareas de instantáneas. Cada entrada de registro adopta el formato JSON estructurado, marcando identidades de usuario, claves API, marcas de tiempo, colecciones de destino y estado de autorización de operación. Cuando los sistemas autónomos ejecutan tareas basadas en datos recuperados, los registros ofrecen pistas de auditoría claras para las fuentes de solicitudes, el tiempo de ejecución y la legitimidad del acceso. Los usuarios pueden personalizar los ciclos de retención de registros y exportar registros externamente a través de API para archivarlos a largo plazo.
Actualmente, se puede acceder a la indexación acelerada por GPU en AWS, con planes en curso para ampliar la cobertura a más proveedores y regiones de la nube. Los clústeres Multi-AZ pertenecen al nivel Premium de Qdrant y ofrecen un tiempo de actividad respaldado por SLA del 99,95 %. La función de registro de auditoría está abierta a todos los clústeres pagos de Qdrant Cloud.
La documentación oficial proporciona más detalles sobre las tres nuevas capacidades.
Nota
Hierarchical Navigable Small World (HNSW) es un algoritmo diseñado para identificar vectores vecinos más cercanos. Mapea vectores en estructuras gráficas interconectadas, que se expanden drásticamente con el creciente volumen de datos. HNSW apila múltiples capas de gráficos virtuales: la capa superior dispersa contiene vectores mínimos para una búsqueda preliminar rápida, mientras que las capas inferiores almacenan cada vez más vectores hasta que la capa inferior cubre todos los puntos de datos. Cada capa actúa como un punto de entrada optimizado para la siguiente, lo que acorta considerablemente la latencia de búsqueda general.
Qdrant se enfrenta a la competencia de múltiples pares de la industria. Pinecone también adopta algoritmos HNSW y aprovecha las GPU NVIDIA para optimizar el rendimiento de integración y reclasificación. Zilliz ofrece compatibilidad con HNSW y aceleración de GPU; su base de datos subyacente Milvus integra el índice de gráficos acelerado para recuperación de vectores (CAGRA) de Nvidia CUDA de la biblioteca RAPIDS cuVS para permitir la indexación de GPU.
Beijing Qianxing Jietong Tecnología Co., Ltd.
Sandy Yang/Director de Estrategia Global
WhatsApp/WeChat: +86 13426366826
Correo electrónico: yangyd@qianxingdata.com
Sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque empresarial:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con marcas líderes a nivel mundial para ofrecer productos confiables y servicios profesionales.
“Uso de la tecnología para construir un mundo inteligente” ¡Su proveedor de servicios de productos TIC de confianza!