En mi github tengo implementado el Eliza en version hablada.
https://github.com/4nimanegra/TalkToMeUsa la API de speech de google. Transformo lo que me hablan en texto que lo meto en el eliza que después el texto que saca lo lee. La interaccion es completamente con microfono y altavoz de movil.
No se si te servirá. Usa Cordova y los plugins:
cordova-plugin-tts
cordova-plugin-speechrecognition
Es una prueba de concepto programada en media hora por lo que no esperes ni interfaz, ni gaitas. Era para probar si podía hacer programas rápidos usando voz y altavoz. Es pantalla blanca y el elemento que escucha y habla. Le tendrás que dar los permisos que toque. Tienes el apk y los sources que son javascript.
Hay otro programa que lee lo que sale cuando sacas una foto, ahi se usa el ocr y el text to speech.
https://github.com/4nimanegra/leememisma historia, prueba de concepto muy rapida para probar. Pero tienes el código de ejemplo muy simple que funciona.
Saludos.