Productos de Big Data


Google Cloud

Captura, procesa y analiza datos de manera eficiente con los productos de analíticas de datos de Google Cloud.

- Enfoque sin servidor totalmente gestionado

Descubre información valiosa para los negocios de forma eficiente gracias a los productos integrales, probados y totalmente gestionados de Google Cloud Platform (GCP) para las analíticas de datos. El enfoque sin servidor elimina toda la complejidad operativa de la analítica de datos y te permite tomar decisiones empresariales importantes con rapidez y eficiencia.

Banner de Big Data


  • BigQuery
Almacén de datos sin servidor

BigQuery es el almacén de datos sin servidor, totalmente gestionado y de bajo coste de Google. Se escala a la par que tus necesidades de almacenamiento y potencia informática. Con BigQuery obtienes una base de datos ANSI SQL en columnas que permite analizar petabytes de datos a una velocidad asombrosa. BigQuery GIS permite analizar datos geoespaciales mediante el conocido lenguaje SQL. Con BigQuery ML puedes crear y poner en práctica modelos de aprendizaje automático en datos estructurados o semiestructurados a gran escala con instrucciones SQL sencillas. BigQuery ML puedes crear y poner en práctica modelos de aprendizaje automático en datos estructurados o semiestructurados a gran escala con instrucciones SQL sencillas. BigQuery BI Engine admite paneles de control interactivos en tiempo real con una latencia de consulta de menos de un segundo. Además, BigQuery ofrece servicios de transferencia de datos, ingestión de datos flexible y tarifas de pago por uso.

Resultado de imagen de bigquery

  • Cloud Dataflow
Procesamiento de datos en streaming y por lotes

Cloud Dataflow es un servicio totalmente gestionado que está diseñado para transformar y enriquecer datos tanto en streaming  (en tiempo real) como por lotes (histórico) con la misma fiabilidad y expresividad. Como Cloud Dataflow prescinde de servidores, te libras de realizar muchas tareas operativas, como planificar la capacidad, gestionar los recursos u optimizar el rendimiento. Además, pagas únicamente por lo que usas. Cloud Dataflow no solo funciona con los productos de ingestión, almacenamiento de datos y aprendizaje automático de Google, sino también con herramientas de terceros como Apache Spark y Apache Beam.


Resultado de imagen de cloud dataflow apache spark

  • Cloud Dataproc
Apache Spark y Apache Hadoop gestionados

Cloud Dataproc es un servicio en la nube rápido, fácil de usar y totalmente gestionado para ejecutar clústeres de Apache Spark y de Apache Hadoop de una manera más sencilla y rentable. Las operaciones que antes llevaban horas o días tardan apenas unos minutos o segundos. Además, solo pagas por los recursos que utilices (con una facturación por segundo). Cloud Dataproc se integra con los servicios informáticos, de almacenamiento y de supervisión de los productos de Google Cloud. Por eso, es una plataforma completa y potente para el procesamiento de datos.


Cloud Dataproc

  • Cloud Pub/Sub
Servicio escalable de ingestión de eventos y mensajería

Cloud Pub/Sub es una base sencilla, fiable y escalable destinada a las analíticas de streaming y a los sistemas informáticos basados en eventos. Además de enviar y recibir mensajes entre aplicaciones independientes, también puedes distribuir datos entre proyectos y aplicaciones que se ejecuten en entornos híbridos, on-premise o en la nube. Gracias a su flexibilidad, puedes desacoplar sistemas y componentes alojados en GCP o en cualquier otro lugar de Internet. Cloud Pub/Sub se ha diseñado para ofrecer una entrega "al menos una vez" con una latencia baja y con una escalabilidad bajo demanda que puede llegar a decenas de millones de mensajes por segundo.


Cloud Pub/Sub


  • Cloud Data Fusion
Servicio de integración de datos sin código y totalmente gestionado

Cloud Data Fusion es un servicio de integración de datos nativo de la nube y totalmente gestionado que ayuda a los usuarios a crear y gestionar los flujos de procesamiento de datos de extracción, transformación y carga (ETL) y de extracción, carga y transformación (ELT) de forma eficiente. Gracias a su interfaz gráfica y a una extensa biblioteca de código abierto con transformaciones y conectores predefinidos, Data Fusion permite a las organizaciones dejar de centrarse en el código y la integración, y hacerlo en los datos y las acciones.


Cloud Data Fusion

  • Cloud Composer
Orquestación de flujos de trabajo


Cloud Composer es un servicio totalmente gestionado de orquestación de flujos de trabajo que permite crear, programar y supervisar los flujos de trabajo que se extienden por las nubes y los centros de datos on-premise. Cloud Composer se basa en el popular proyecto de código abierto Apache Airflow y utiliza el lenguaje de programación Python, por lo que es fácil de usar y no exige ninguna dependencia. También facilita la integración completa de las cargas de trabajo de GCP, de modo que puedes orquestar un flujo de trabajo al completo con todos los productos de Big Data de Google Cloud.

Resultado de imagen de cloud composer

  • Data Catalog
Servicio de descubrimiento de datos totalmente gestionado

Data Catalog es un servicio de gestión de metadatos escalable y totalmente gestionado que ayuda a las organizaciones a descubrir, gestionar y entender todos sus datos en Google Cloud con rapidez. Ofrece una interfaz de búsqueda para descubrir datos sencilla y fácil de usar, además de un sistema de catalogación flexible y potente para capturar metadatos técnicos y empresariales, y una base de seguridad y cumplimiento sólida gracias a la integración con prevención de la pérdida de datos (DLP) de Cloud y Gestión de Identidades y Accesos (IAM) de Cloud.

Cloud Data Catalog


  • Google Data Studio
Analíticas visuales sin servidor 

Google Data Studio es un servicio de analíticas visuales totalmente gestionado con el que los usuarios de tu organización podrán descubrir información valiosa en los datos por medio de paneles interactivos y fáciles de crear que les inspirarán a tomar mejores decisiones empresariales. Si combinas Data Studio con BigQuery BI Engine, un servicio de análisis en memoria, la exploración de los datos y la interactividad visual alcanzan velocidades inferiores a un segundo en conjuntos de datos enormes.



  • Hojas de cálculo de Google 
Big Data en hojas de cálculo conocidas

La hoja conectada es una nueva función de Hojas de cálculo que se activa únicamente cuando se usa el conector de datos de Hojas de cálculo para BigQuery, con la que podrás acceder, analizar, visualizar y colaborar en hasta 10.000 millones de filas de datos de BigQuery, sin necesidad de usar secuencias de comandos SQL. Los usuarios finales de Hojas de cálculo pueden descubrir información valiosa sin tener que pedir ayuda a expertos en BigQuery ni a analistas que dominen el lenguaje SQL. Eso supone un ahorro de tiempo para todos los implicados. Además, los usuarios podrán comprender mejor esos datos con ayuda de fórmulas de hojas de cálculo o realizar análisis en mayor profundidad con funciones como Explorar, tablas dinámicas y gráficos. Así de sencillo.

Resultado de imagen de productos de big data hojas de calculo de google


  • Cloud Dataprep
Preparación inteligente de datos

Cloud Dataprep de Trifacta es un servicio de datos inteligente que permite examinar, limpiar y disponer datos estructurados y sin estructurar de forma visual para analizarlos. Dado que prescinde de servidores y funciona a cualquier escala, no hace falta desplegar ni gestionar ninguna infraestructura. Cada vez que introduces datos en la interfaz de usuario, predice y te sugiere la transformación conveniente a continuación, así que no tienes que escribir código. Además, gracias a la detección automática de esquemas, tipos de datos, posibles uniones y anomalías, te puedes saltar el lento proceso de crear perfiles de datos para centrarte en su análisis.

Cloud Dataprep


  • Transferencia de datos de Cloud
Servicios de transferencia de datos 

La transferencia de datos de Cloud ofrece soluciones adaptadas a las necesidades particulares de transferencia de datos a Cloud Storage, BigQuery o Cloud Dataproc de forma rápida y segura. Nuestros servicios de transferencia de datos cubren cualquier necesidad: no importa si tienes 50 GB o 50 PB de datos, si realizas transferencias puntuales o periódicas.

Transferencia de datos de Cloud


  • Cloud Bigtable
Servicio de base de datos NoSQL totalmente gestionado

Cloud Bigtable es una base de datos NoSQL con enorme escalabilidad, ideal para cargas de trabajo de baja latencia y alto rendimiento. Se integra fácilmente con herramientas de Big Data tan conocidas como Hadoop y Spark, y admite la API HBase de código abierto estándar del sector. Es una elección estupenda para aplicaciones analíticas y operativas, como las de Internet de las cosas, analíticas de usuarios y analíticas de datos financieros.

Cloud Bigtable


  • Cloud Storage
Almacenamiento de objetos de Big Data 

Cloud Storage es una solución de almacenamiento de objetos unificada con la que podrás almacenar y visualizar cualquier cantidad de datos en cualquier momento y en todo el mundo. Vale para multitud de situaciones, como servir contenido de sitios web, almacenar datos para el archivado y la recuperación tras fallos o distribuir objetos de datos grandes a los usuarios mediante descarga directa.

Google Cloud Storage


  • AI Platform Notebooks
Un servicio de cuadernos para empresas que te permite poner en marcha tus proyectos en cuestión de minutos

AI Platform Notebooks es un servicio gestionado cuyo entorno de JupyterLab integrado facilita la creación de instancias preinstaladas con los frameworks más recientes de aprendizaje automático y de ciencia de datos. Está integrado con BigQuery, Cloud Dataproc y Cloud Dataflow para facilitar el desarrollo y el despliegue.

Resultado de imagen de productos AI platform notebook




Comentarios