HarmonyOS-鸿蒙app开发 —基于javaAI语音识别概述

语音识别功能提供面向移动终端的语音识别能力。它基于华为智慧引擎（HUAWEI HiAI Engine）中的语音识别引擎，向开发者提供人工智能应用层API。该技术可以将语音文件、实时语音数据流转换为汉字序列，准确率达到90%以上（本地识别95%）。

基本概念

语音识别技术，也称为自动语音识别（Automatic Speech Recognition, ASR），可以基于机器识别和理解，将语音信号转变为文本或命令。

支持的输入文件格式有wav或pcm。
当前仅支持对普通话的识别。
输入时长不能超过20s。
采样要求：采样率16000Hz，单声道。
引擎的使用必须初始化和释放处理，且调用必须在UI的主线程中进行。
多线程调用：HUAWEI HiAI Engine不支持同一应用使用多线程调用同一接口，这样会使某一线程调用release方法后，卸载模型，导致正在运行的另一些线程出错。故多线程执行同一功能达不到并行的效果。但是引擎支持使用多线程调用不同接口，如开启两个线程同时使用文档矫正和ASR接口。

0 0 投票数

文章评分