鸿蒙开发 HarmonyOS-鸿蒙app开发 —基于javaAI语音识别概述 administrator 2023年1月6日 2023年1月6日 语音识别功能提供面向移动终端的语音识别能力。它基于华为智慧引擎(HUAWEI HiAI Engine)中的语音识别引擎,向开发者提供人工智能应用层API。该技术可以将语音文件、实时语音数据流转换为汉字序列,准确率达到90%以上(本地识别95%)。 基本概念 语音识别技术,也称为自动语音识别(Automatic Speech Recognition, ASR),可以基于机器识别和理解,将语音信号转变为文本或命令。 约束与限制 支持的输入文件格式有wav或pcm。 当前仅支持对普通话的识别。 输入时长不能超过20s。 采样要求:采样率16000Hz,单声道。 引擎的使用必须初始化和释放处理,且调用必须在UI的主线程中进行。 多线程调用:HUAWEI HiAI Engine不支持同一应用使用多线程调用同一接口,这样会使某一线程调用release方法后,卸载模型,导致正在运行的另一些线程出错。故多线程执行同一功能达不到并行的效果。但是引擎支持使用多线程调用不同接口,如开启两个线程同时使用文档矫正和ASR接口。