鸿蒙开发

HarmonyOS-鸿蒙app开发 —基于javaAI语音识别概述

admin 2023年1月6日 2023年1月6日 Leave a comment

语音识别功能提供面向移动终端的语音识别能力。它基于华为智慧引擎（HUAWEI HiAI Engine）中的语音识别引擎，向开发者提供人工智能应用层API。该技术可以将语音文件、实时语音数据流转换为汉字序列，准确率达到90%以上（本地识别95%）。

基本概念

语音识别技术，也称为自动语音识别（Automatic Speech Recognition, ASR），可以基于机器识别和理解，将语音信号转变为文本或命令。

约束与限制

支持的输入文件格式有wav或pcm。
当前仅支持对普通话的识别。
输入时长不能超过20s。
采样要求：采样率16000Hz，单声道。
引擎的使用必须初始化和释放处理，且调用必须在UI的主线程中进行。
多线程调用：HUAWEI HiAI Engine不支持同一应用使用多线程调用同一接口，这样会使某一线程调用release方法后，卸载模型，导致正在运行的另一些线程出错。故多线程执行同一功能达不到并行的效果。但是引擎支持使用多线程调用不同接口，如开启两个线程同时使用文档矫正和ASR接口。

0 0 投票数

文章评分

订阅评论

0 评论

最旧

最新最多投票

内联反馈

查看所有评论

0

希望看到您的想法，请您发表评论x

()

🚀 如未找到文章请搜索栏搜素 | Ctrl+D收藏本站 | 联系邮箱:15810050733@qq.com 关闭