8 de julio de 2019

E

El viaje de la voz a la voz

por Chema Alonso

Hace tres años que tengo el honor de ser el Chief Data Officer del Grupo Telefónica. Fui nombrado con la misión de convertir a nuestra compañía en una organización que pusiera los datos en el centro de la toma de decisiones. Es decir, ser data-centric y tomar data-driven decisions que se dice en lengua inglesa. Estábamos en el camino de dejar de ser una empresa de telecomunicaciones para ser una empresa de telecomunicaciones y tecnología.

En el camino de transformación, nuestra empresa había comenzado a transformar su principal negocio, que era la voz, para convertirse en un proveedor de datos para Internet. Y comenzamos la tarea de hacer que esos datos que pasaban por nuestras redes y nuestros sistemas se pusieran en el corazón de nuestra compañía.

No es la primera vez que Telefónica se ha enfrentado a tales cambios y, por supuesto, no íbamos a hacerlo con miedo, sino con valentía y decisión. Está en los valores de nuestra compañía ser retadores y asumir responsabilidades de adaptación a la sociedad tan drásticas.

En aquel proceso de cambio vimos venir el tsunami de la inteligencia artificial (IA) y, en especial, la aplicación de esta al mundo de los servicios cognitivos: la visión artificial, la comprensión lectora, la lectura de labios, el reconocimiento biométrico y, por supuesto, el reconocimiento de la voz y el habla.

Los servicios cognitivos se estaban acercando a velocidad de vértigo al umbral de lo que en el campo de la IA se conoce como la paridad humana. Es decir, a tener una tasa de error igual o menor a la de una persona en el reconocimiento del habla en lenguaje natural, en capacidad de articular un discurso hablado, en capacidad de traducir conversaciones habladas entre personas en tiempo real.

Por eso, en el año 2016, cuando aún quedaba un poco de tiempo, decidimos que nuestros interfaces tecnológicos debían dejar de centrarse en la tecnología y comenzar a centrarse en cómo interactuamos los humanos. Usando el lenguaje natural hablado y escrito. Y nació Aura con aquella apuesta que abanderó Telefónica y que dice: “Durante muchos años los seres humanos hemos tenido que aprender los interfaces de la tecnología. Ya es el momento de que la tecnología aprenda los interfaces humanos”.

No nos equivocamos mucho. En el año 2018 la inteligencia artificial superó por primera vez la paridad humana en reconocimiento del lenguaje natural hablado y en traducción en tiempo real de conversaciones. Y cada día, en el año 2019, rompe una nueva barrera. La última en el mes de marzo, en comunicación basada en lectura de labios, otra forma humana de comunicarnos.

Este año, nuestra compañía sigue embarcada en este proceso de humanizar la tecnología y la misión que nos hemos marcado es precisamente esa, hacer un mundo más humano comunicando la vida de las personas. Y la voz es uno de los rasgos más humanos en la comunicación.

Pasamos de ser una compañía de voz a una compañía de datos y los datos nos han devuelto a la esencia de nuestro origen en Telefónica: la voz. Hemos sabido cuidar y llevar esa voz durante 95 años en las comunicaciones más lejanas del planeta y, aunque ahora usemos los modernos servicios cognitivos basados en inteligencia artificial, seguiremos haciéndolo.

Artículo publicado en la revista Telos 111


Ir al número ...

Autor

Doctor en Seguridad Informática por la Universidad Rey Juan Carlos e Ingeniero Técnico de Sistemas Informáticos por la Universidad Politécnica de Madrid. Es actualmente CDO –Chief Data Officer- de Telefónica. En este cargo lidera la estrategia de Big Data, Publicidad y Cuarta Plataforma de Telefónica.

Ver todos los artículos

Contenido relacionado

Comentarios