Buenas a todos, en el anterior post de esta cadena os contamos una posible técnica para saltarse captchas de voz, utilizando el motor sphinx para reconocer las voces de un archivo de audio en formato WAV. Hoy nos gustaría dedicar la entrada a explicaros como es posible añadir, eliminar y modificar las palabras que entienda nuestro reconocedor de voces, ya que dependiendo del captcha ante el que os encontréis, será muy probable que debáis modificar la aplicación para adaptarla.
Si abrimos el script que os presentamos en la pasada entrada de la cadena veréis que se referencia a un archivo *.dic, situado en /usr/share/pockersphinx/model/lm/wsj.
Se trata de un diccionario en el que encontraréis la correspondencia de
las palabras que entiene el motor (en inglés, aún no he encontrado ninguno interesante para español), con los fonemas
requeridos para pronunciar dicha palabra:
Por tanto, si quisieramos enseñar a la aplicación a reconocer la palabra "EXPENSIVE", deberíamos indicarle separado por espacios sus correspondientes fonemas, "IH K S P EH N S IH V".
La labor de realizar las modificaciones es muy sencilla como veis, pero acertar con los fonemas idóneos para que el sistema produzca los menos falsos positivos es otro cantar.
Os animo a que lo probéis y a que debatamos entre todos los resultados.
Saludos!
No hay comentarios:
Publicar un comentario