Recentemente o reconhecimento de voz no
Linux melhorou bastante, relembrando que em outras plataformas existem aplicativos de reconhecimento de voz bastante satisfatórios, mas existe um porém, esses aplicativos são proprietários e custam caro.
Como não poderia ser diferente, existem alternativas livres como o
Cvoicecontrol, mas ao que parece o seu desenvolvimento foi interrompido á algum tempo.
Há pouco tempo conheci o
Sphinx, um utilitário de reconhecimento de voz desenvolvido pela Carnegie Mellon University, que usado em conjunto com o
Festival fornece uma ferramenta de reconhecimento de voz espetacular.
Nesse pequeno manual quero mostrar como fazer a integração desses dois excelentes programas utilizando uma interface feita em Perl chamada
PerlBox-Voice.
Reconhecimento de voz
Para o reconhecimento de voz vamos utilizar o
Sphinx2.
Existem novas versões: o Sphinx3 e Sphinx4, porém o Sphinx2 é mais leve que as duas últimas versões e possui boas características, como reconhecimento contínuo e independência do locutor.
Você pode obter os fontes em:
Após baixá-lo é só descompactar e instalar da forma usual como segue:
$ tar zxvf sphinx2****.tgz
$ cd sphinx2****
$ ./configure
$ make
# make install
Se o seu Linux usa o sistema de pacotes RPM você pode baixá-lo em:
http://rpm.pbone.net/index.php3/stat/4/idpl/6031186/com/sphinx2-0.6-0.i386.rpm.html
Se o seu Linux usa o sistema de pacotes DEB, basta dar o comando:
# apt-get install sphinx2-bin
Síntese de voz
Para síntese de voz utilizaremos a última versão disponível do Festival.
Para isso, basta acessar o site do desenvolvedor no link abaixo:
e baixar o binário para a sua distribuição ou o source.
Caso use o Debian basta:
# apt-get install festival