语音识别功能提供面向移动终端的语音识别能力。它基于华为智慧引擎(HUAWEI HiAI Engine)中的语音识别引擎,向开发者提供人工智能应用层API。该技术可以将语音文件、实时语音数据流转换为汉字序列,准确率达到90%以上(本地识别95%)。
约束与限制
- 支持的输入文件格式有wav或pcm。
- 当前仅支持对普通话的识别。
- 输入时长不能超过20s。
- 采样要求:采样率16000Hz,单声道。
- 引擎的使用必须初始化和释放处理,且调用必须在UI的主线程中进行。
- 多线程调用:HUAWEI HiAI Engine不支持同一应用使用多线程调用同一接口,这样会使某一线程调用release方法后,卸载模型,导致正在运行的另一些线程出错。故多线程执行同一功能达不到并行的效果。但是引擎支持使用多线程调用不同接口,如开启两个线程同时使用文档矫正和ASR接口。