Google Duplex y el test de Turing

En los años cincuentas, el científico computista Alan Turing instituyó lo que sigue siendo la prueba definitiva para la inteligencia artificial: el Test de Turing. Si el juez no puede distinguir entre la máquina y el humano a la hora de realizar el test (que es una conversación entre un humano y una máquina), la máquina habrá superado la prueba. Ya en su época, Turing consideraba que para el 2000, las máquinas podrían hacerle pensar a los humanos que hablaban con otro ser humano 30% de las veces. Google Duplex, una de las facetas del asistente de Google que puede realizar llamadas sin nuestra intervención, no ha pasado la prueba… aun.

Una de las metas de la humanidad ha sido mantener conversaciones naturales con computadoras, tal y como se mantienen de persona a persona. En años recientes, las computadoras han avanzado en su capacidad de comprender y generar discursos naturales, especialmente cuando vemos la aplicación de redes neuronales profundas (como Google voice search o WaveNet); pero sigue siendo frustrante mantener una conversación con una voz computarizada que no comprende las inflexiones de la comunicación oral. Especialmente los sistemas telefónicos automatizados tienen dificultades para reconocer palabras simples y órdenes, no se unen al flujo de la conversación y obligan a la persona a ajustarse al sistema, y no al revés.

Con el anuncio de Google Duplex, es palpable la posibilidad de llevar conversaciones naturales y ejecutar órdenes del “mundo real” telefónicamente. La tecnología está diseñada para cumplir funciones específicas, como agendar cierto tipo de citas; y el sistema ofrece una experiencia conversacional natural, que le permite a su interlocutor hablar normalmente, como hablarían con otra persona, sin tener que adaptarse a una máquina. Duplex funciona dentro de un terreno estrecho que ha permitido la exploración extensiva, entrenando profundamente a la inteligencia artificial. Esto significa que Duplex no puede tener conversaciones de temas generales: cumple una función.

Durante la I/O 2018, el CEO de Google Sundar Pichai presentó la IA frente a 7000 personas, y frente a ella, esta misma inteligencia artificial realizó una llamada para agendar un corte de cabello de mujer. La voz de la máquina no se diferencia en nada de una voz humana, e incluso hace pausas antes de responder, alargando palabras como si pensara en lo que va a decir y utilizando trucos verbales como el “ummm”, “mmm-hh” y el “uh”. Es probable que Turing no considerara sistemas basados en voz, claramente las computadoras que hablan tienen dificultades engañando a los humanos. Pocos minutos conversando con tu asistente de voz bastan para descubrir sus limitaciones: discurso entrecortado, pronunciación rígida, tiempos de respuesta demasiado largos (especialmente si están tratando de acceder al servidor en la nube) que hacen olvidar la conversación..

La mayoría de los asistentes con inteligencia artificial pueden manejar dos solicitudes consecutivas y requieren una frase gatilladora como “Alexa”, “Hey Siri” o “Okay Google” (este último está en proceso de eliminación para hacer más sencillas las conversaciones). Google Asistant haciendo la llamada a través de Duplex no tiene este problema. Es una inteligencia artificial que comprende que las construcciones verbales que los humanos utilizan entre ellos son más complejas que las construcciones utilizadas para comunicarse con máquinas, omitiendo palabras que son indicadas por contexto, cambiando el sentido de la oración a mitad de la misma, haciendo pausas y añadiendo cláusulas subordinadas donde el lenguaje escrito no las permitiría.

En una conversación espontánea, las personas hablan más rápido y menos claramente de lo que hablan con una máquina, por lo que el reconocimiento de palabras es más complejo y hay mayores posibilidades de error; este problema se agrava con los sonidos de fondo y los problemas de calidad en las llamadas telefónicas. En las conversaciones largas, la misma oración puede tener distintos significados dependiendo del contexto, y este contexto puede haber sido claro varias oraciones atrás, lo que también incrementa el promedio de errores.Tomar elecciones en medio de conversaciones es una función que tiene que ver con la labor a realizar y el estado de la conversación, especialmente contando que hay prácticas comunes en conversaciones naturales -protocolos implícitos que incluyen elaboraciones, sincronizaciones, interrupciones y pausas, que pueden ir de 1 segundo a dos minutos-. Las conversaciones de Duplex suenan naturales por los avances en comprensión, interacción, timing y habla. Sin embargo, no pasan el test de Turing, porque este no se ha dado en las condiciones que el test demanda: un juez que desconozca que uno de los interlocutores es una inteligencia artificial, y la capacidad de dicha inteligencia artificial de mantener conversaciones complejas de larga duración.

Ya que Duplex solo puede mantener conversaciones breves, y es justo para agendar citas, aún no pasa el Test de Turing. Pero ciertamente, es la llamada robótica más impresionante que hemos escuchado.

Fuente

Previous Post¿Qué tan bien funciona la hamburguesa?

Next PostLas nuevas reacciones de Instagram Stories: Emojis de respuesta rápida

Leave a Reply Cancel Reply

Suscribite a nuestro Newsletter

Recibí semanalmente todas las novedades de nuestro blog.

Suscribirme

Suscribite a nuestro Newsletter