Projetando uma interface conversacional: humanizando seu chatbot

Com os avanços nas tecnologias de inteligência artificial e machine learning, estamos cada vez mais perto de assistentes virtuais e chatbots humanizados. Como observado com o Teste de Turing, a esperança por um chatbot indistinguível de um humano tem sido o objetivo da inteligência artificial desde seus primórdios. A razão pela qual os bots humanizados são tão desejados é porque eles fornecem uma maneira verdadeiramente perfeita, natural e intuitiva de interagir com máquinas. Chatbots humanizados (como Alexa, Google Assistente e Siri) conseguem unir tarefas de diversos aplicativos em apenas uma interface.

 

Então, é necessário humanizar os chatbots?

Humanizar chatbots faz com que pareça que o bot está realmente nos ouvindo e respondendo. A falta de entonação, emoção e compreensão, no entanto, nos faz sentir que o bot está apenas lendo ou transmitindo informações, levando à trocas impessoais. Um chatbot humanizado também é capaz de tornar a coleta de dados e a personalização mais naturais (e aí está a diferença entre fazer um novo amigo e ser vigiado por uma corporação). Por fim, bots empáticos e que soam naturais podem tirar vantagem de “micro-momentos” para realizar cross-sell ou upsell de acordo com a necessidade do usuário.

 

Dito isto, humanizar chatbots pode ter também algumas desvantagens. A maior delas pode ser o fato de que deixar as coisas muito “abertas” pode confundir os usuários e causar ansiedade, causando um Paradoxo de Escolha – que é quando o usuário fica perdido em meio a tantas opções de escolha. Bots que são mais utilitários e menos “conversadores” também podem oferecer resultados mais rapidamente aos usuários. Nem todo mundo tem tempo para ficar de conversa fiada com um chatbot. Ainda bem que essa é uma desvantagem pequena. Se o seu chatbot for envolvente o suficiente, isso não deve ser um problema.

 

DESIGN BÁSICO DE INTERFACE CONVERSACIONAL PARA HUMANIZAR CHATBOTS

Entenda as regras de conversação para chatbots humanizados

Você pode não perceber, mas as conversas seguem um conjuntos de regras implícito. Geralmente não damos valor a essas regras; na maioria das vezes, nos aproveitamos de deixas sociais sem pensar. Mas se você examinou neuroticamente uma conversa em algum momento – por exemplo, quando você se pergunta se deveria mandar outra mensagem para seu crush mesmo que ele ainda não tenha respondido a anterior – então você está bem consciente das regras básicas e dos blocos construtores da conversação. Existem regras constitutivas (para interpretação e construção de sentido) e regras normativas (para compreender a maneira apropriada de responder) – ambas as quais um chatbot deve fazer uso em seu design de interface conversacional.

 

A primeira unidade da conversação é a tomada de vez. Parceiros de conversa tomam sua vez na conversação: a Pessoa A diz algo, a Pessoa B responde, a Pessoa A responde de volta e assim por diante. O contrário disso é um comportamento grosseiro: interrompendo e falando por cima da outra pessoa.

 

A próxima unidade é o threading (ou enredo, em tradução livre). Este é o enredo da conversação, ou a ligação entre um tópico da conversa com outro. Conforme a conversação avança, cada passo se liga contextualmente ao anterior e ao próximo. Uma falta de enredo leva à mensagens confusas, sem sentido e não-sequenciais. O enredo de conversação auxilia o botmaker – e o usuário esquecido ou confuso – a entender o fluxo conversacional. Isso pode ajudar a desenvolver e replicar designs de interface conversacional.

Responder apropriadamente a uma informação contextual nos leva à próxima unidade da conversação – a qual os chatbots mais robotizados e sistemáticos tendem a falhar. Um bot humanizado deve se basear no que o usuário disse e, então, induzi-lo a levar a conversa adiante. Ele deve usar a sintaxe para responder intuitivamente ao que foi dito. Geralmente adotamos um caminho mais curto para falar ao invés de construir frases completas. A conversação é repleta de atalhos verbais e somos capazes de compreender o que os outros dizem através do contexto.

 

  • Usuário: Como está minha agenda hoje?
  • Bot: Você tem uma reunião no Bryant Park às 15h.
  • Usuário: Devo levar um guarda-chuva?
  • Bot: Parece que irá chover hoje em Nova York.
  • Usuário: Existe algum café por perto?
  • Bot: Há o Blue Bottle Coffee no número 54 da 40th Street.
  • Usuário: Mande uma mensagem ao Greg dizendo para me encontrar no Blue Bottle Coffee ao invés do Bryant Park.
  • Bot: Certo.

 

Através de sugestões contextuais, o bot consegue compreender o que o usuário está perguntando sem precisar de todos os detalhes. Independente da localização atual do usuário, ele está perguntando sobre o clima e um café próximo ao local do encontro. Recebendo essa informação rapidamente, o usuário pode agendar uma mudança no local do evento para se manter longe da chuva.

 

Chatbots humanizados prestam atenção ao enredo conversacional e usam o processamento de linguagem natural para extrair a ideia por trás de frases e fragmentos que seriam confusos por si só.

 

Isso se torna ainda mais importante com o design de interfaces conversacionais verbais e ativadas por voz, visto que frequentemente usamos respostas fragmentadas quando falamos.

 

Estratégias usando sintaxe incluem substituição de palavras, um chatbot pode responder de vários modos à mesma pergunta. Por exemplo, ao dizer “Oi” para um robô, você pode receber “Olá”, “E aí?!” ou “Tudo bom?” como resposta. Respostas programadas de acordo com o horário são ainda mais sofisticadas. Um bot pode responder ao usuário que diz “Boa noite” com um emoji dormindo, por exemplo.

 

Outro aspecto importante para contextualizar a conversação tem a ver com erros de respostas. Dizer algo como “Desculpe, mas não entendi” não ajuda o usuário a reestruturar sua pergunta. Para antecipar o caminho variável da conversa – ou quando o usuário age de forma inesperada – um chatbot humanizado deverá fazer perguntas esclarecedoras, parafraseando perguntas e fornecendo novas instruções para solucionar erros.

 

Estratégias para humanizar chatbots

 

Além de ensinar seu bot a compreender como os humanos falam, há várias estratégias que você pode usar para humanizá-lo. A primeira é conceder-lhe compreensão emocional. A análise de sentimentos permite à IA compreender as emoções por detrás das mensagens e o quão forte ela são. Assim, poderá responder apropriadamente dependendo de como o usuário se sente.

 

Há chatbots humanizados que oferecem terapia através do Facebook Messenger e que compreendem facilmente as emoções: eles checam diariamente como o usuário está se sentindo, então respondem àquele sentimento de uma forma emocionalmente empática. Eles utilizam respostas não-verbais como emojis e gifs para demonstrar melhor as emoções. Quando um usuário responde corretamente a um quiz sobre saúde mental, por exemplo, o bot pode responder com um gif de um robô dançando. E isso tudo é incrivelmente útil para o bot, porque seu objetivo é justamente ajudar o usuário a se envolver e compreender suas emoções.

 

Outra estratégia para robôs humanizados é utilizar palavras de preenchimento ou sons não-conversacionais. Estes são os “ãns”, “ahams” e “hmmms” que frequentemente acrescentamos em nossas conversas. Embora pareça muito forçado projetar um chatbot que responda dessa forma, isso ajuda a tornar a conversação mais natural (especialmente para bots verbais que possuem voz). Um chatbot de previsão do tempo, famoso no Facebook Messenger, usa essas expressões para fazer sacadas humorísticas. Quando um usuário dá a localização para fazer a previsão do tempo, ele pode responder com “Ah é?! Minha ex é de lá. Hm, de qualquer forma, está fazendo 12ºC e está parcialmente nublado agora” (“Oh yeah? My ex is from there. Hm…anyway…it’s 55°F and partly cloudy there rn” no original em inglês).

Na frase original você também pode notar o chatbot fazendo outra coisa. Ele está usando uma gíria coloquial, trocando o “right now” (neste momento/agora) pela sigla usada na internet, “rn”. Permitir que o bot reflita o modo como as pessoas conversam entre si online faz com que o usuário se identifique e diminui as confusões quando um usuário fala utilizando uma gíria.

 

Finalmente, mesmo que não se aplique a todos os bots, expressões faciais também contribuem para um chatbot mais humano. Plataformas móveis de chat não permitem avatares dinâmicos, mas caso você desenvolva uma interface própria, você pode considerar ter um modelo. Expressões faciais e linguagem corporal é uma forma de transmitir respostas não-verbais e ajudar o usuário a simpatizar com o bot.

 

Texto originalmente publicado pelo Chatbots Journal.