Pinterest es una plataforma de búsqueda visual en la que sus usuarios descubren y guardan ideas. Y es una compañía que realiza verdaderas inversiones en Inteligencia Artificial, de formas que no resultan obvias al usuario casual. “Constantemente estamos experimentando con aplicaciones que las personas pueden imaginarse usando” dice Vijay Narayanan, la líder de Descubrimiento y Contenido. “Hay proyectos de Inteligencia Artificial enfocados en autos que se conducen solos, pero también hay una AI que usamos a diario, más accesible, que ayuda a tener una mejor vida en este momento.”
Para desarrollar esta tecnología, Pinterest sigue una regla sencilla pero ampliamente ignorada: Definir el problema antes. “No desarrolles tecnología solo por desarrollarla” dice Narayanan. “En vez de eso, desarrolla tecnología con un sentido, uno que apoye tu misión principal.” Características como la sugerencia de recetas en base a una dieta o sugerencias de decoración para un estilo específico están disponibles gracias al deep learning. Al comprender la intención detrás de una búsqueda, los modelos de deep learning de Pinterest entregan resultados altamente personalizados.
Al utilizar AI para analizar montañas de datos, Pinterest personaliza los resultados de búsqueda de cada uno de sus cientos de millones de usuarios; y es la principal razón por la que Pinterest se considera a sí misma, en su #centro, una compañía de data y AI”, de acuerdo con Vanja Josifovski, su directora de Tecnología.
En septiembre, Pinterest alcanzó 250 millones de usuarios mensuales activos. Su cofundador, Eva Sharp, declaró que mientras los usuarios pasan tiempo en otras apps populares, invierten su tiempo en Pinterest porque utilizan lo que encuentran, desde un disfraz hasta un viaje. Para que esto funcione, Pinterest debe saber lo que está quiere encontrar el usuario cuando ingresa un término de búsqueda (75% de los cuales se componen de 3 palabras o menos), y aunque no haya una respuesta clara inmediata, la experiencia de búsqueda a través del deep learning configura una. Un usuario que ingresa “BBQ” puede estar buscando recetas con la misma facilidad con la que puede estar planificando un asado.
Una de las formas en la que Pinterest hace recomendaciones relevantes es a través de una red neural llamada PinSage, desarrolladas en parte utilizando marcos de deep learning de TensorFlow y PyTorch en Amazon Web Services. Este modelo de deep learning ubica cada imagen, de acuerdo con su tema, en un “gráfico” gigantesco cargado de imágenes.
Hay 3 billones de imágenes (o nodos) formando el gráfico, y hay 18 billones de líneas que las interconectan. El resultado es un contexto detallado de cada imagen, lo que permite a Pinterest recomendar imágenes temáticamente similares a los usuarios, y las muestra de forma cohesiva en vez de en listas lineales. Los esfuerzos de la personalización utilizando deep learning utilizan más que los términos de búsqueda para mejorar. También aprenden de lo que los usuarios fotografían con sus teléfonos.
La búsqueda a través de Pinterest Lens permite a los usuarios tomar una foto de un objeto fuera de internet y recibir resultados y recomendaciones online. La foto de una manzana dará como resultados recetas como tarta o sidra. Una foto de un par de zapatillas mostrará zapatos parecidos, e incluso ropa que combine, disponible para compra.
Cuando un usuario toma una foto utilizando Lens, el algoritmo lo separa en objetos, colores, y patrones visuales. Luego utiliza esa información para hacer sugerencias, que pueden ser visualmente similares, temáticamente similares, o ambos. Cada mes, el modelo procesa (y aprende de) miles de millones de búsquedas visuales. Este año (2018) Pinterest anunció que los usuarios estaban haciendo 600 millones de búsquedas visuales al mes. El modelo mejora con cada búsqueda gracias a que recibe feedback en qué sugerencias siguen los usuarios, y cuáles ignora.
Pinterest también hace uso de Amazon Rekognition, con servicios de AI para reconocer y analizar imágenes, como parte de un enfoque multi proceso para proveer de una plataforma confiable a sus Pinners. Rekognition automáticamente filtra el contenido que viole las políticas, lo que permite que Pinterest se concentre en el descubrimiento.
Pinterest no tiene problemas atrayendo usuarios nuevos, y estos representan más oportunidades (y demandas) de diversificaciones de búsquedas. Este crecimiento, unido a los esfuerzos de la AI para capitalizar la información que recolecta de los usuarios, significa que Pinterest ha triplicado su capacidad de almacenamiento en los últimos dos años. Pinterest almacena toda esta información en el modelo basado en la nube de Amazon Web Services, las imágenes que fortalecen el modelo Lens son uno de los casos en los que Pinterest confía en Amazon S3, mientras que para entrenar e implementar modelos de deep learning utiliza instancias de Amazon EX2 P3 que aprovechan los GPUs de los NVIDIA Tesla V100 Tensor Core.
Este uso de la nube en vez de servidores sólidos le permite a Pinterest escalar sus esfuerzos en AI rápidamente manteniendo un buen performance, lo que permite a los ingenieros explorar nuevas características como Shop the Look, que identifica productos en una imagen y muestra al usuario dónde está a la venta online.