Imagina que estás en medio de la autopista y te va guiando el navegador. ?Tome la siguiente salida?. La tomas. ?Ocupe el carril de la derecha?. Lo ocupas. ?A 200 metros, gire a la derecha?. Avanzas un poco y giras. ?En la rotonda, tome la segunda salida?. Te la saltas. ?Dije que tomara la segunda salida de la rotonda. Ponga más atención, humano?.
Lógicamente, esta es una historia de ficción porque nadie usaría un navegador que imitara a un copiloto real. Pero tampoco sería popular la opción contraria, una voz que dijera que no hay problema con pasar la tarde dando vueltas. La personalidad perfecta para una inteligencia artificial (IA) está a medio camino entre cómo se comportaría una persona real y cómo lo haría Ned Flanders. Un punto medio que hoy es materia de investigación para los profesionales que crean las personalidades de las máquinas con las que interactuamos.
?En cuanto empezamos a interactuar con la IA de forma conversacional, buscamos sin darnos cuenta una personalidad en la máquina?, explica Nieves Ábalos, jefa de producto y fundadora de Monoceros Labs. ?Ocurre tanto con la voz como con el texto, pero especialmente con la voz porque es exclusivamente humana. Cuando escuchamos que algo nos habla, nuestro cerebro empieza a asociar rasgos de personalidad, una edad, un sexo? Estamos programados para ello", subraya Ábalos, que es ingeniera informática.
?Si tú no defines la personalidad de tu máquina, es probable que lo hagan tus usuarios, y no queremos eso porque no sabemos qué clase de personalidad asignarán?, apunta Helen Creeger, UX y conversation designer freelance. ?La personalidad de la máquina es la clave de la experiencia del usuario con la máquina, así que hay que construirla con cuidado?.
Construir una personalidad sintética es una tarea colectiva. Intervienen ingenieros informáticos, lingüistas, guionistas, expertas en UX, sociólogos. Una mezcla de tecnología y humanismo donde quien decide qué responde la máquina cuando le preguntas si te quiere, una de las cuestiones más demandadas junto con cuéntame un chiste, es la persona que menos sabe de informática del equipo. Lo suyo son las conversaciones humanas.
Una calculadora no es simpática, un dron no es distante y el Word no es impertinente aunque te observe desde una hoja en blanco. Sin embargo, hay un consenso mundial acerca de que Clipo, la mascota odiosa del Word, era efectivamente odiosa. ¿Por qué podemos afirmar esto con rotundidad? Porque ese clip de ojos saltones nos importunaba sin venir a cuento, es decir, se comunicaba. La personalidad de las máquinas sólo se nota si se comunican con sus usuarios.
¿Y qué clase de máquinas está obligadas a comunicarse de forma eficiente y efectiva con sus usuarios? Los asistentes conversacionales. Sean altavoces inteligentes o chatbots, estas máquinas están sirviendo de punta de lanza para el desarrollo de personalidades sintéticas. Nada es casual ni está ahí para rellenar. Ni siquiera esos chistes tan malos que te cuenta tu altavoz inteligente.
Pero hay que ir por orden. Primero se diseña la personalidad y luego se canaliza a través de la conversación. ?El proceso de creación de personalidad se asemeja muchísimo a la creación de la ficha para un personaje literario?, explica Marina Jiménez, conversational experience designer en Everis y escritora (estudió Periodismo).
?Una personalidad bien trabajada es capaz de dar la sensación de estar hablando con el mismo asistente si nos dirigimos a este en diferentes momentos y para diferentes tipos de conversación. Si es capaz de darnos la sensación de estar hablando con un mismo ente tanto si le preguntamos por sus hobbies como si le preguntamos por las cifras de facturación de la compañía el último año, estaremos ante una personalidad bien trabajada."
En el mundo real no hay dos personalidades iguales y en el tecnológico ocurre lo mismo. Sí hay, apunta Jiménez, rasgos frecuentes: ?simpatía, cercanía ?con educación?, voluntad de ayudar y ser entendido y entusiasmo?.
Lo primero que hay que saber para diseñar la personalidad de un asistente conversacional es el contexto en que se va a usar, explica Helen Creeger. "Porque no es lo mismo utilizar un asistente mientras se conduce, cuando se necesitan respuestas rápidas y funcionales, que si estás en casa y te entretienes preguntándole cosas a Alexa con las amigas."
Conocido el contexto en que se interactuará con la máquina, las preguntas para definir su personalidad se deben centrar en el usuario tipo: qué quiere hacer con la máquina, cómo se comunicará con ella, si lo hará con jerga y si hay que tener en cuenta dificultades cognitivas y problemas de accesibilidad. Es decir, qué espera de la máquina el usuario y cómo se lo va a comunicar.
Para Creeger, hay una batería de preguntas que deben responderse: ?¿la personalidad de la máquina debe inspirar confianza, ser ilusionante, servir de apoyo? ¿Debe ser sencilla y amable o es mejor que sea algo autoritaria? ¿Que se comunique de forma directa y graciosa o que sea más bien formal? ¿Debe llevar la iniciativa o que responda a lo que haga el usuario??. Dependiendo de cómo quede definida la personalidad, así será la conversación que pueda mantener la máquina con el usuario.
La tercera pata de esta fase de investigación ?las dos primeras fueron el contexto de uso y el usuario? afecta a quien pone el dinero para desarrollar la interfaz conversacional: qué quiere conseguir la empresa, el cliente. Marina Jiménez explica que en ocasiones el diseño de una personalidad ?choca? con ciertas restricciones por parte del cliente. Por ejemplo, puede que la interacción asistente-persona pida una comunicación cercana, salpimentada con humor y emojis incluso, pero el cliente puede preferir mantener la distancia y tratar al usuario de usted.
Una vez se ha hecho toda la investigación previa, hay información suficiente para elaborar la personalidad de la máquina. Y, como se dijo más arriba, el usuario percibirá la personalidad de la máquina cuando converse con ella. Un ejemplo sensacional de hasta qué punto la personalidad de la máquina es algo perceptible por el usuario es Project Susan, una skill de Alexa desarrollada por la compañía estadounidense Smart Design, pensada para facilitar la vida a Susan, una paciente de esclerosis múltiple (y ululofilia, pasión por el coleccionismo de figuras de búhos).
El diseño de la conversación debe partir de lo que le va a pedir el usuario, asi que los FAQ son un buen inicio para empezar a diseñar la conversación. A partir de esta información, ampliada con casos de uso e investigaciones internas, el departamento de diseño conversacional tiene material suficiente para elaborar un flujo de conversación efectivo, que es aquel que comienza con una pregunta pertinente del usuario y finaliza con la respuesta correcta de la máquina.
En el desarrollo de un modelo conversacional efectivo intervienen varios perfiles. Como el lingüista computacional, el primer traductor entre lo que pide el humano y lo que puede hacer la máquina. Su función es analizar todas las variantes posibles con las que el usuario puede interactuar con la máquina. Esta infinidad de posibilidades se acota y se transmite a los científicos de datos, quienes elaboran un modelo conversacional que, utilizando algoritmos de Procesamiento de Lenguajes Naturales, permita a la máquina captar, interpretar correctamente y ejecutar las peticiones de sus usuarios.
Así escrito parece sencillo, pero no lo es en absoluto. La parte un poco menos complicada es trazar la conversación lógica, donde el usuario pide claramente algo y la máquina lo entiende y lo ejecuta. Pero esto no sucede a menudo, el teléfono escacharrado hace de las suyas y los diseñadores conversacionales deben prepararse para que la conversación siga fluyendo de una forma aparentemente coherente.
Pensemos en interfaces de voz. Para Nieves Ábalos, fundadora de Monoceros Labs, hay tres razones por las que una interfaz de voz puede haber funcionado mal: 1), porque no ha oído lo que el usuario decía, es decir, que la máquina no haya percibido la onda de sonido y no haya transcrito a texto lo que dijo el usuario; 2), porque la máquina haya oído pero no entendido, esto es, que no haya creado una ?representación semántica? correcta de lo que pedía el usuario; y 3), que la interfaz haya oído y entendido correctamente lo que pedía el usuario pero que no pueda hacerlo (porque no tiene ese producto, porque no encuentra un dato, porque la función que pide el usuario está deshabilitada...) Si hablamos de personalidad, nos interesan las dos últimas opciones de fallo: cuando la máquina le tiene que decir al usuario que no le ha entendido o que no le puede ayudar.
Cuando se produce una confusión se usan los fallbacks, explica Marina Jiménez, de Everis, que son ?las respuestas prestablecidas que el chatbot produce cuando la frase emitida por el usuario no matchea ninguna intención que él controla. En estos casos podemos pedir al usuario con naturalidad, y por qué no, con humor, que nos formule la pregunta con otras palabras, o volverle a recordar lo que sí es capaz de responder?.
Un caso muy distinto es cuando el usuario no busca resolver una necesidad asociada a la máquina, sino simple charla. ?El usuario puede decir cualquier cosa en cualquier momento, y eso es súper relevante cuando diseñamos la personalidad de una voz?, explica Nieves Ábalos. ?El usuario puede preguntar por el tiempo que hace, pedir un chiste, decirle te quiero o ponerle a prueba, porque los seres humanos tendemos a poner a prueba a este tipo de asistentes. Y aquí hay que tirar de creatividad y tener respuestas para todo tipo de situaciones. A día de hoy eso se hace de forma manual. Hay copys [redactores publicitarios], lingüistas, guionistas que trabajan en este tipo de respuestas, que tienen que ser acordes con los rasgos de personalidad que se quieren transmitir?, explica Ábalos. ?¿Por qué los chistes de este tipo de asistentes son tan malos, tan neutros? Porque se ha decidido que si el rango de personalidad es inocente, los chistes también tienen que serlo?.
El campo de la personalidad de las máquinas está en pañales, así que para hablar de futuro sólo hay que esperar una semana para leer cuál ha sido el siguiente avance en materia de PLN. Sin embargo, sí hay retos a largo plazo. Para Marina Jiménez, ?el verdadero desafío a nivel conversacional es la comprensión y el ?recuerdo? dentro de la propia conversación. Si estamos interactuando con el usuario sobre una determinada cuestión y nos hace una pregunta, el asistente debe ser capaz de retomar ese tema. Este es uno de los grandes retos de la conversación?. Para Nieves Ábalos, un gran reto también es el ?contexto?, que la máquina perciba el momento y el lugar en que se produce la conversación y utilice esta información para desarrollar una conversación más natural.
Más allá del ?recuerdo? y el ?contexto?, que no dejan de ser avances técnicos, a Helen Creeger, UX y conversation designer freelance, le preocupa el género de los asistentes, en particular, que las voces de los asistentes sean, por defecto, femeninas. ?Debemos sacar el tema del género en las reuniones para definir la personalidad del asistente. Si la voz va ser femenina, pues perfecto, pero que exista una razón para que sea femenina, que no sea la opción por defecto. La voz también puede ser masculina o neutra, como Q, y se debería dar la opción al usuario de que la pudiera cambiar?.
?Es verdad que los asistentes de Amazon, Google, Apple y Microsoft son femeninos porque lo investigaron y fueron los usuarios quienes lo decidieron, pero me parece que alguien debería desafiar esto, que la razón de eso no sea simplemente porque lo quisieron los usuarios", explica Creeger. "La publicidad de los 50 y los 60 era machista porque lo querían los consumidores, pero con el tiempo la industria dejo de hacer esta clase de anuncios a pesar de que era lo que los consumidores esperaban. Me gustaría que con los asistentes de voz pasara algo parecido, que alguien desafiara la idea de que tienen que tener siempre y sólo voz femenina. Sólo así conseguiríamos que las presentaciones de los asistentes del futuro dejen de ser de un tío de mediana edad dándole órdenes a un asistente con voz de mujer?.
Imágenes |Portada|
.