Para numerosas empresas, el almacén de datos ha pasado de ser un activo estratégico a una carga operativa. Plataformas propietarias de larga data como Teradata, junto con servicios exclusivos en la nube como Snowflake, han ofrecido escalabilidad y rendimiento, pero a costa de la dependencia del proveedor, precios imprevistos y adaptabilidad arquitectónica restringida.
A medida que el escrutinio regulatorio se intensifica y los análisis impulsados por IA se vuelven centrales para la ventaja competitiva, las organizaciones están reevaluando si sus plataformas de almacén actuales se alinean verdaderamente con los objetivos comerciales a largo plazo.
EDB Postgres® AI (EDB PG AI) aborda estos desafíos de frente con WarehousePG, un almacén de datos de código abierto a escala de petabytes diseñado para restaurar el control, la previsibilidad y la soberanía de los datos, todo ello sin comprometer el rendimiento. Construido sobre Postgres y diseñado para análisis masivamente paralelos, WarehousePG ofrece una forma moderna de liberarse de sistemas restrictivos mientras reduce el costo total de propiedad (TCO) hasta en un 58%.
Análisis de código abierto a escala de petabytes con Postgres en su núcleo
Los almacenes de datos empresariales ahora se están estirando más allá de sus límites de diseño originales. Conjuntos de datos de tamaño de petabytes, necesidades de implementación híbrida, requisitos de soberanía de datos y análisis impulsados por IA coexisten en entornos de producción que exigen un rendimiento excepcional y flexibilidad arquitectónica.
Las plataformas propietarias tradicionales y los almacenes solo en la nube luchan por satisfacer estas demandas simultáneamente, lo que obliga a las organizaciones a hacer concesiones entre costo, control y funcionalidad.
EDB Postgres AI para WarehousePG llena este vacío al ofrecer un almacén de datos a escala de petabytes completamente de código abierto construido sobre Postgres. Diseñado para análisis de alto rendimiento, IA en la base de datos y implementación flexible en entornos locales, en la nube e híbridos, aborda las limitaciones de los sistemas heredados y exclusivos de la nube.
Arquitectura: MPP basado en Postgres a escala
La arquitectura de procesamiento masivamente paralelo (MPP) de WarehousePG le permite escalar a cientos de nodos. En lugar de depender de un modelo de escalado de un solo servidor, distribuye tanto los datos como la ejecución de consultas en múltiples nodos de segmento, supervisados por un nodo coordinador central.
El coordinador maneja el análisis, la optimización y la planificación de la ejecución de consultas. Una vez que se finaliza un plan de consulta, las tareas se distribuyen a los segmentos, que operan en paralelo en sus particiones de datos locales. Este enfoque permite a WarehousePG ejecutar eficientemente consultas analíticas complejas, incluyendo uniones grandes, agregaciones, funciones de ventana y transformaciones, en conjuntos de datos a escala de petabytes.
Esta arquitectura elimina los cuellos de botella inherentes de las bases de datos monolíticas mientras mantiene la compatibilidad total con SQL con Postgres, lo que reduce en gran medida la curva de aprendizaje para los equipos de datos existentes.
Rendimiento predecible sin restricciones propietarias
A diferencia de los almacenes nativos de la nube que dependen de precios basados en el consumo y una gestión opaca de los recursos, WarehousePG ofrece un comportamiento de carga de trabajo determinista y un rendimiento constante. La asignación de recursos y la ejecución de consultas se controlan completamente dentro del clúster, lo que garantiza tiempos de respuesta estables incluso bajo cargas de trabajo analíticas mixtas.
Como solución con licencia Apache 2.0 construida sobre Postgres de código abierto, WarehousePG libera a las empresas de formatos de almacenamiento propietarios y motores de ejecución controlados por el proveedor. Los datos permanecen completamente accesibles, portátiles y desplegables donde la organización los necesite: en las instalaciones para el cumplimiento normativo, en la nube pública para la elasticidad o en configuraciones híbridas para la optimización de costos.
Esta independencia arquitectónica, combinada con los precios basados en núcleos de EDB, permite una reducción de hasta el 58% en el TCO, especialmente para las organizaciones que migran de plataformas propietarias de alto costo o almacenes en la nube impredecibles.
Almacenamiento híbrido y acceso SQL a lagos de datos
Los entornos analíticos modernos se extienden cada vez más por múltiples niveles de almacenamiento. WarehousePG aborda esto a través de su Platform Extension Framework (PXF), que permite el acceso SQL directo a datos externos almacenados en almacenes de objetos y sistemas de archivos distribuidos, como Amazon S3 y Hadoop Distributed File System (HDFS).
Con PXF, los ingenieros de datos pueden consultar formatos como Parquet, AVRO, JSON y CSV sin copiar datos en el almacén. Esto reduce significativamente la complejidad de ETL y la redundancia de almacenamiento, al tiempo que permite una estrategia híbrida de "datos cálidos y fríos": los conjuntos de datos accedidos con frecuencia permanecen en el almacenamiento de alto rendimiento de WarehousePG, mientras que los datos utilizados con poca frecuencia residen en almacenamiento de objetos de bajo costo.
Desde un punto de vista técnico, este enfoque preserva la semántica SQL en diversas capas de almacenamiento, lo que permite a los equipos de análisis trabajar con un único modelo de datos lógico.
Ingesta en tiempo real con FlowServer
Las canalizaciones solo por lotes ya no son suficientes para muchos casos de uso analíticos. WarehousePG incluye un componente dedicado FlowServer para la ingesta de datos en tiempo real y casi en tiempo real.
FlowServer admite la transmisión de eventos de alto rendimiento desde plataformas como Apache Kafka y RabbitMQ, lo que permite casos de uso como análisis operativos, detección de fraudes y monitoreo en tiempo real. Al ingerir datos de transmisión directamente en el almacén, las organizaciones eliminan la latencia entre los sistemas operativos y los insights analíticos.
Esta arquitectura permite que las cargas de trabajo de transmisión y por lotes coexistan dentro de la misma plataforma analítica, simplificando la infraestructura y reduciendo el movimiento de datos.
IA, ML y procesamiento vectorial en la base de datos
Una característica clave de EDB Postgres AI para WarehousePG es su soporte para análisis e IA en la base de datos, lo que elimina la necesidad de mover grandes conjuntos de datos a plataformas de aprendizaje automático (ML) externas.
WarehousePG integra MADlib para aprendizaje automático basado en SQL, lo que permite a los usuarios entrenar y puntuar modelos directamente dentro de la base de datos utilizando estructuras relacionales familiares. Para casos de uso más avanzados, la plataforma admite marcos de ML de Python en la base de datos, lo que permite a los científicos de datos operar a escala sin exportar datos.
El soporte vectorial nativo a través de la extensión pgvector permite la búsqueda de similitud, la búsqueda semántica y las cargas de trabajo de generación aumentada de recuperación (RAG) directamente dentro del almacén. Esta capacidad se está volviendo cada vez más crítica para las aplicaciones impulsadas por IA que combinan datos empresariales estructurados con contenido no estructurado como documentos y registros.
Al centralizar datos, análisis e IA, WarehousePG reduce la complejidad de las canalizaciones y acelera el tiempo para obtener insights.
Alta disponibilidad y preparación empresarial
WarehousePG está diseñado para una confiabilidad de nivel de producción. La alta disponibilidad se logra a través de un coordinador de respaldo, lo que garantiza una operación ininterrumpida si falla el coordinador principal. La tolerancia a fallos a nivel de segmento permite que las cargas de trabajo continúen ejecutándose incluso cuando los nodos individuales no están disponibles.
Las características empresariales incluyen gestión de cargas de trabajo, programación predecible de consultas y observabilidad integral, lo que garantiza una operación estable bajo una fuerte demanda analítica.
Crucialmente, las organizaciones obtienen acceso a soporte 24/7 de los expertos en Postgres de EDB, lo que cierra la brecha entre la flexibilidad de código abierto y las necesidades operativas empresariales.
Migración sin interrupciones
Para las organizaciones que se modernizan a partir de plataformas analíticas heredadas, WarehousePG ofrece un camino de bajo riesgo. Las cargas de trabajo existentes de Greenplum se pueden migrar a través de un intercambio binario, lo que permite una modernización rápida sin reescribir consultas ni volver a capacitar a los equipos. La alta paridad de SQL también simplifica las migraciones desde otros almacenes de datos propietarios basados en SQL.
Este enfoque permite a las empresas modernizarse de forma incremental, preservando la continuidad del negocio y recuperando el control sobre su pila analítica.
Reconstruyendo el almacén para análisis modernos
EDB PG AI para WarehousePG demuestra que los análisis a escala de petabytes, la preparación para IA y la soberanía de los datos no requieren plataformas propietarias ni dependencia de la nube. Al combinar la compatibilidad con Postgres, la escalabilidad MPP, el almacenamiento híbrido, la ingesta en tiempo real y las capacidades de IA y ML en la base de datos, WarehousePG ofrece una base técnicamente sólida para los análisis empresariales modernos.
Para las organizaciones que buscan un almacén de datos que priorice el control arquitectónico, el rendimiento predecible y la economía de código abierto, WarehousePG ofrece una alternativa atractiva y a prueba de futuro.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Director de Estrategia Global
WhatsApp / WeChat: +86 13426366826
Correo electrónico: yangyd@qianxingdata.com
Sitio web: www.qianxingdata.com/www.storagesserver.com
Enfoque empresarial:
Distribución de productos TIC/Integración de sistemas y servicios/Soluciones de infraestructura
Con más de 20 años de experiencia en distribución de TI, nos asociamos con las principales marcas mundiales para ofrecer productos confiables y servicios profesionales.
¡Construyendo un mundo inteligente con tecnología! Su proveedor de servicios de productos TIC de confianza.