Twitter está mejorando su juego de análisis de datos en forma de una asociación ampliada de varios años con Google Cloud. El gigante de las redes sociales comenzó a trabajar con Google en 2018 para trasladar los clústeres de Hadoop a la plataforma Google Cloud como parte de su estrategia.
Con el acuerdo ampliado, Twitter trasladará sus cargas de trabajo de análisis sin conexión, procesamiento de datos y aprendizaje automático a la nube de datos de Google. Sudhir Hasbe, director de gestión de productos y análisis de datos de Google Cloud, explicó para comprender mejor lo que esto significa: la medida le dará a Twitter la capacidad de analizar datos más rápido como parte de su objetivo de brindar una mejor experiencia al usuario.
Detrás de cada tweet, like y retweet, hay una serie de puntos de datos que ayudan a Twitter a comprender cosas sobre cómo las personas usan el servicio y qué tipo de contenido podrían querer ver. La plataforma de datos de Twitter toma billones de eventos, procesa cientos de petabytes de datos y ejecuta decenas de miles de trabajos en más de una docena de clústeres diariamente.
Al expandir su asociación con Google, Twitter está adoptando esencialmente la nube de datos de la empresa, incluidas BigQuery, Dataflow, BigTable y las herramientas de aprendizaje automático (ML) para comprender y mejorar la forma en que se utilizan las funciones de Twitter.
El CTO de Twitter, Parag Agrawal, dijo en una declaración escrita que la asociación inicial de la compañía fue exitosa y condujo a una mayor productividad por parte de sus equipos de ingeniería. “Construir sobre esta relación y las tecnologías de Google nos permitirá aprender más de nuestros datos, movernos más rápido y ofrecer contenido más relevante a las personas que usan nuestro servicio todos los días”.
Hasbe de Google Cloud cree que organizaciones como Twitter necesitan una plataforma de análisis altamente escalable para que puedan obtener valor de toda su recopilación de datos. Al expandir su asociación con Google, Twitter puede agregar significativamente más casos de uso fuera de su plataforma en la nube.
“Nuestra plataforma no tiene servidor y podemos ayudar a organizaciones, como Twitter, a escalar hacia arriba y hacia abajo automáticamente”, dijo Hasbe. “Twitter puede traer cantidades masivas de datos, analizar y obtener información sin la carga de tener que preocuparse por la infraestructura o la gestión de la capacidad o cuántas máquinas o servidores podrían necesitar”, agregó.
El cambio también facilitará que los científicos de datos de Twitter y otro personal similar creen modelos de aprendizaje automático y realicen análisis predictivos, según Hasbe. Otras organizaciones que recurrieron recientemente a Google Cloud para ayudar a navegar la pandemia incluyen Bed, Bath and Beyond, Wayfair, Etsy y The Home Depot.