“Mamá, he desenchufado a Alexa porque consume mucha energía”, me dijo hace poco mi hija sin pestañear. Tiene ocho años, pero ya se debate entre dos tendencias que probablemente marcarán a la generación Alfa, la primera 100% nativa digital: las interfaces de voz y el activismo medioambiental.
Hablar con las máquinas es para ella –y probablemente también para su generación– algo completamente natural. Pregunta lo primero que se le pasa por la cabeza y, si Alexa no le entiende, reformula tranquilamente la cuestión igual que haría en cualquier conversación normal. Por primera vez, el ser humano vive y crecerá acompañado del murmullo de las interfaces de voz. Por primera vez, son las máquinas las que aprenden nuestro lenguaje para comunicarse con nosotros.
Esa naturalidad de la interacción por voz es uno de los factores que explica su rápida adopción más allá incluso de las barreras de entrada habituales, tal y como se puede comprobar en colectivos como la infancia y las personas mayores. Es sencilla de utilizar, y tampoco excesivamente cara. Los precios ultracompetitivos actuales de los altavoces inteligentes, por ejemplo, permiten llevarse uno a casa por menos de treinta euros.
Pero, ¿qué hay detrás del altavoz, de su rápida llegada al mercado y la popularización de la voz como interfaz? Esta expansión comercial no habría sido posible sin el avance exponencial que han experimentado en los últimos años tecnologías como la inteligencia artificial, la computación en la nube, el big data y el reconocimiento y síntesis de voz. Sí. Es cierto. Puede que las interfaces de voz todavía estén dando sus primeros, y en ocasiones torpes, pasos. Pero aprenden muy rápido. Cada vez más, y mejor.
Además, esta oferta se abre camino frente a una audiencia muy receptiva. Tras poco más de un año en el mercado –Google Home salió a la venta en junio de 2018 y Amazon Echo en octubre–, un 6,2% de los españoles (2,1 millones de personas) tiene en su casa un dispositivo de voz, otro 27% admite que lo tendrá en un futuro próximo. La voz, no obstante, desborda los altavoces. Más de la mitad de la población internauta en España ha interactuado a través de la voz mediante un asistente virtual en alguna ocasión. Algo que se entiende al recordar que muchos teléfonos móviles lo incorporan de serie.
Un 6,2% de los españoles ya tiene en su casa un dispositivo de voz; otro 27% asegura que lo tendrá pronto.
Esta es sola una parte del retrato actual sobre el ecosistema del audio y la voz en España que recoge el informe ¿Cómo suena tu marca? Estado de la voz y el audio en España, realizado por la consultora Prodigioso Volcán y el instituto de investigación de mercados SEIM.
Queríamos conocer la actitud de la población hacia la tecnología así como sus hábitos de uso. Para los encuestados, la comodidad (23%) y simplicidad (15,2%) de uso son las dos principales ventajas de estos dispositivos, seguidos del ahorro de tiempo (12,4%). La interacción por voz es rápida (hablamos mucho más deprisa de lo que escribimos) y, además, deja las manos libres, lo que permite hacer varias cosas a la vez. Esta agilidad se presenta como un beneficio, aun cuando de momento las principales tareas realizadas a través de los smart speakers sean muy básicas, como escuchar música (90,3%), saber el tiempo (84,1%) y realizar preguntas generales (70,1%).
Explorar los hábitos de los españoles nos permite identificar ese nuevo espacio en el que las marcas pueden interactuar con los consumidores. La interacción por voz abre nuevos momentos y puntos de contacto entre una organización y sus clientes o usuarios. Por ejemplo, hemos visto que la mayoría (73,5%) tiene el altavoz en el cuarto de estar y lo utiliza en familia. También que la primera hora del día (46,9%) o mientras se realizan tareas del hogar (72,6%) son dos momentos de actividad fundamentales.
La comodidad y simplicidad de uso, junto con el ahorro de tiempo, son las ventajas más valoradas de estos dispositivos.
¿Qué mensajes pueden tener más sentido a esas horas? ¿Ofrecer un producto? ¿Anunciar un servicio? ¿Dar una recomendación? Las marcas tienen la oportunidad de ocupar esos espacios con interacciones útiles que no solo faciliten la vida de los usuarios, sino que incluso mejoren procesos y operativas empresariales para lograr un funcionamiento más eficiente, pero sobre todo reforzar la relación con sus clientes.
Porque los dispositivos de voz no solo aportan comodidad y eficiencia, también dan a las empresas la oportunidad de crear un vínculo muy especial. La voz es la forma esencial de comunicación desde que el hombre es hombre. Antes de nacer somos capaces de reconocer la voz de nuestra madre y empezamos a oír lo que nos espera en el mundo exterior. Por eso, el oído no es simplemente una vía más de información, es un sentido que genera una fuerte conexión emocional, y las interfaces de voz tienen el potencial para crear experiencias más íntimas, personalizadas y directas, un diferencial muy valioso en medio de la saturación de impactos del ecosistema digital actual.
Y esto es solo el principio. La verdadera revolución de la voz para las organizaciones llegará cuando todas las aplicaciones, toda su arquitectura, habilite la posibilidad de interactuar de forma fluida para cualquier situación. Para el usuario, el punto de inflexión vendrá de la mano de una interfaz transversal que unifique la experiencia a lo largo de todo el día y que le permita navegar sin fricciones entre las numerosas plataformas en las que operamos habitualmente: la interfaz de interfaces.
Olalla Novoa Ojea es responsable de estrategia de voz y servicios de contenido digital en Prodigioso Volcán.