Tutorial

Reconhecimento de fala: reflexões sobre seus pontos fortes e fracos

Eu tenho que admitir que eu não usei nenhum tipo de reconhecimento de fala há muito tempo quando me pediram para fazer os tutoriais. A última vez que tentei reconhecimento de fala, foi com o Dragon Dictate, que era novo quando o Windows 98 também era novo. Há muito tempo atrás, em anos de computador!

Fiquei feliz em abordar esse assunto porque estava muito interessado em ver como o reconhecimento de fala melhorou. E garoto, melhorou! Até mesmo um aplicativo básico e integrado como esse fazia um ótimo trabalho "direto da caixa". Neste último artigo sobre Reconhecimento de Fala, eu gostaria de falar sobre o que aprendi enquanto me reencontrei com as maravilhas do reconhecimento de fala, e de onde eu irei daqui.

Ainda não está pronto para Star Trek

Tenho certeza que muitos de nós assistimos a tripulação da nave estelar Enterprise dizendo "Computador!" e obter uma resposta imediata. Ainda não temos computadores com a Frota, mas começando com o Windows Vista e continuando no Windows 7, temos computadores que nos ouvirão e responderão ao que dissermos - e nos responderão se "O que foi isso?" é considerado uma resposta.

Eu tive problemas quando tentei usar o Speech Recognition pela primeira vez, e a solução de problemas não foi particularmente direta. Os arquivos de ajuda nem sempre são úteis o suficiente. Consegui encontrar as respostas no site da Microsoft e em uma variedade de fóruns on-line sem muito trabalho. Foi assim que descobri que tinha esquecido que minha webcam (sentada bem na minha frente, em cima do meu monitor, e diretamente alinhada com a maneira como eu falava) também tinha um microfone ativo e aumentava a confusão. Uma vez que eu consertei isso, foi bem suave navegar a partir de então.

Eu até tentei falar com uma variedade de sotaques diferentes (BBC British e American Redneck, por exemplo) e consegui obter um reconhecimento razoavelmente bom, permitindo diferenças na pronúncia americana padrão. Claro, dizendo "amigos, romanos, compatriotas, me emprestem seus ouvidos!" enquanto fazia minhas melhores impressões de Helen Mirren e Jeff Foxworthy me fez rir demais para obter resultados totalmente precisos.

Reconhecimento de idioma

O Speech Recognition pode ser usado com diferentes idiomas, e eu pensei em testá-lo com meu limitado sotaque americano, espanhol, alemão e francês, mas infelizmente você não pode usar outros idiomas, a menos que seu sistema operacional também esteja nesse idioma. Você pode alterar o idioma do sistema operacional instalando outro pacote de idiomas da Microsoft, mas só poderá fazer isso se estiver executando o Windows 7 Ultimate ou o Windows 7 Enterprise.

O Reconhecimento de Fala está disponível para inglês dos EUA, inglês do Reino Unido, francês, espanhol, alemão, japonês, chinês tradicional e chinês simplificado, e será encontrado nas versões desses idiomas do Windows 7 (todas as versões). Lamento não poder experimentar isso. Não tenho idéia do que acontecerá com o Windows 8, mas acho que a capacidade de instalar outros pacotes de idiomas seria um bom acréscimo aos equivalentes do Windows 8 Professional do Windows 8 e superiores.

O que funciona bem

Como mencionei, o Speech Recognition foi projetado para funcionar melhor com outros softwares da Microsoft. Desde que experimentei produtos da Microsoft, tive muito sucesso (embora, como se poderia esperar, o uso do Microsoft Office Excel fosse limitado e complicado). Com outro software, foi um sucesso ou um fracasso. Eu poderia usar o navegador Google Chrome muito bem (definitivamente não tão bem quanto o Internet Explorer ) e meu programa de e-mail Eudora, que é praticamente software antigo até agora. Vale a pena experimentar seu próprio software favorito para ver o que você pode fazer. O comando "show numbers" foi especialmente útil na seleção de itens e comandos.

Também descobri que não demorou muito para que a precisão do reconhecimento melhorasse acentuadamente. Fiz os exercícios de treinamento duas vezes, e depois disso o reconhecimento foi quase 100% correto. Consegui falar um pouco mais rápido e colocar menos pausas para o software acompanhar. Eu realmente gostei de ver minha voz traduzida em palavras na tela. Minhas primeiras experiências com software de reconhecimento de voz não estavam nem perto disso.

O que não funciona bem

Como mencionei, alguns softwares são incompatíveis com o reconhecimento de fala . Eu não conseguia nem abrir o Adobe Reader nem a versão do TweetDeck do Adobe AIR . Descobri que não era possível acessar minha conta do Google com o Internet Explorer para experimentar o Google Docs. Parecia não haver maneira de falar ou soletrar minha senha. Eu suspeito que este é um problema de segurança, não permitindo que as senhas sejam ditas em voz alta onde alguém possa ouvir, mas era irritante.

Eu poderia abrir o iTunes e selecionar uma música para tocar, mas não conseguiria tocá-la. Eu poderia abrir Scrivener (meu processador de texto de escolha), mas "Mostrar números" não sobrepor números em nada que eu queria usar. Eu não fiz nenhuma experimentação muito extensa com meu software favorito - esses são apenas alguns que eu tentei. Valeria a pena para quem quer usar o Speech Recognition para testar os programas com os quais deseja usá-lo, para ter certeza de que será compatível.

Mais links e recursos

Se você ainda não viu os artigos anteriores, pode encontrá-los aqui:

  • Trabalhando com Reconhecimento de Fala: Configuração e Configuração
  • Trabalhando com Reconhecimento de Fala: Comandos, Ditando Texto e Navegando na Web
  • Solucionando problemas comuns de reconhecimento de fala

Estranhamente, é quase impossível encontrar qualquer informação sobre Reconhecimento de Fala no site do Microsoft Answers sem clicar em um link de uma pesquisa do Google ou do Bing. Não consegui obter nenhuma resposta, colocando "Speech Recognition" na caixa de pesquisa, mesmo que haja algumas dúvidas sobre isso nos fóruns. Use este link para obter a ajuda do Reconhecimento de Fala no site do Windows: Resultados da pesquisa de Reconhecimento de Fala.

Aqui está um breve artigo da Wikipedia que fala sobre a história do reconhecimento de fala na Microsoft: Windows Speech Recognition.

Aqui está uma entrada de blog que dá pensamentos do autor sobre a comparação de reconhecimento de fala com Dragon Naturally Speaking: Dragon NaturallySpeaking Versus Windows 7 Voice Recognition.

Embrulhando-o

Eu realmente gostei de trabalhar com reconhecimento de fala e maravilhar-me com as melhorias que foram feitas ao longo do tempo. Certamente seria bom o suficiente para uso diário casual, especialmente com produtos da Microsoft.

Vou continuar usando o reconhecimento de fala ? Sim, quando eu puder. Neste ponto, não preciso de nada mais sofisticado. Valeu a pena o tempo que levou para treiná-lo e treinar-me para usá-lo direito.