Info Blogger: Pesquisador trabalha para aprimorar tecnologias de reconhecimento de voz

A Universidade de Rochester realiza estudos para garantir que máquinas, em especial dos call centers, conversem como os humanos de forma mais natural

Para James Allen, responsável pela ciência da computação da Universidade de Rochester, nos Estados Unidos, os sistemas de reconhecimento da voz ainda são considerados frustrantes, por parte dos usuários. Segundo ele, ainda falta uma compreensão adequada da linguagem, por parte das máquinas, e capacidade de interação.

Com base nessa percepção, Allen está desenvolvendo uma pesquisa acadêmica voltada a permitir que “possamos falar com uma máquina do mesmo modo que falamos a uma pessoa”, detalha o especialista.

A ideia nasceu depois de um levantamento realizado pelo cientista para um trabalho de pós-graduação, no qual ele gravava conversas em um guichê de informações em uma estação de trem. Em uma dessas conversas, um passageiro caminha até o balcão e diz: “oito e cinquenta para Windsor”. O atendente responde: “portão dez, atraso de vinte minutos”. De acordo com Allen, o atendente respondeu exatamente o que o passageiro queria, mas para sistemas computadorizados tal diálogo seria completamente confuso.

Do modo como Allen vê a questão, faltam dois elementos aos sistemas modernos: a capacidade de analisar o que está sendo dito e a capacidade de conversar com a pessoa para aprender mais sobre o que ela quer dizer.

“Diversas soluções de prateleira tendem a ser superficiais. Nós não temos uma tecnologia que nos forneça um significado das sentenças”, disse. Para isso, o cientista informa que suas pesquisas buscam usar ferramentas de processamento analítico e serviços de definição de palavras. “Assim, a máquina entenderá, por exemplo, que uma subsidiária é parte de uma companhia”, ilustra.

Outra adição necessária é a de sistemas de comunicação de duas vias entre usuários e computadores. Quando falam sobre suas necessidades, as pessoas podem fornecer informações sem seguir uma ordem particular. Cabe ao computador juntar os pedaços de informação.

O que acontece hoje

Os sistemas atuais são, na verdade, uma combinação de tecnologias variadas. Uma é o reconhecimento de voz, ou a capacidade de um computador entender ou traduzir com sucesso para texto, o que a pessoa está dizendo.

Outra tecnologia é o processamento de linguagem natural (NLP, na sigla em inglês). Ela tenta ou converter a mensagem falada em um comando que o computador possa executar, ou que possa ser repetido de forma concisa para um operador humano.

Grandes passos já foram dados nos dois campos durante as últimas décadas. Mas na maioria dos casos, as iniciativas causaram mais frustração em seus usuários. “É só eu ligar para o banco para ter problemas e brigar com esses sistemas. Eu respondo o que for preciso para que seja atendido por uma pessoa o mais rapidamente possível”, disse Allen.

Info Blogger

sexta-feira, 6 de agosto de 2010

Pesquisador trabalha para aprimorar tecnologias de reconhecimento de voz

A Universidade de Rochester realiza estudos para garantir que máquinas, em especial dos call centers, conversem como os humanos de forma mais natural

Nenhum comentário:

Postar um comentário