关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)

智能语音开发套件 ,又可称为 USB语音开发套件,可适配于不同的软硬件平台,为用户提供完整的语音开发解决方案,加快产品的落地
目前 Firefly 支持 USB语音开发套件的平台为目前主流的rk3399,rk3288,rk3328,rk3128,rk3566,rk3568平台(Android5.1,Android7.1,Android9.0,Android10.0,Android11 等)

阵列适配
MOD-MIC-4XAnalog (4MIC阵列)
产品视图
_images/4MIC_FRONT.jpg _images/4MIC_BACK.jpg**
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第1张图片
产品参数
唤醒距离:3~5m
识别距离:3~5m
声源定位:4mic水平180度
定位精度:±15°

XFM-USBMEMS-6MIC (6MIC阵列)
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第2张图片
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第3张图片
产品参数
唤醒距离:3~5m
识别距离:3~5m
声源定位:6mic360度定位
定位精度:±15°

PABasic 产品参数
PABasic为基础版功放板,帮助客户产品快速获得模拟音频信号放大、DSP音效调节的能力。
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第4张图片
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第5张图片
XFM-AEC 产品视图
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第6张图片
XFM-AEC 产品参数
⽀持5~12V 回采信号输⼊切换,主要是对回采信号接入后做分压处理,再输出分压电路处理后的音频数据。

AIUI 演示
AIUI 提供以语音交互为核心的交互解决方案,将讯飞强大的单点交互能力(前端声学处理,语义理解,语音合成,丰富的内容信源)整合为全链路的交互方案提供给广大开发者,开发者可以根据实际的业务需求,利用热词、静态实体、动态实体、所见即可说等特性,进行个性化的优化和改进,提升交互准确率,让人机交互更加流畅,真正的满足和解决用户实际使用中所遇到的问题。

用户在使用 USB语音开发套件 的时候,可接入 AIUI 开放平台 ,利用其提供的丰富API接口,自定义地实现诸如语音唤醒,语音识别,语音降噪,语义理解,语音合成,内容(信源),回声消除(需搭配 XFM-AEC 与 PABasic 硬件来实现)、全双工交互(需搭配 XFM-AEC 与 PABasic 硬件来实现)等功能。

CAEDemo 演示2 (含 XFM-AEC && PABasic 部件)
当我们在拿到 XFM-USBMEMS-6MIC 麦克风阵列的时候,可使用测试APK(CAEDemo),来进行6MIC阵列的使用和验证,若搭配 了 XFM-AEC && PABasic 部件,可适用于需要具备唤醒、降噪、回声消除、人机交互全链路能力的使用场景。

验证回声消除
硬件接法
在XFM-USBMEMS-6MIC 搭配上 XFM-AEC && PABasic 部件 的时候,除了 前面的MOD-MIC-4XAnalog 所需的 网络,Tyet-C(6MIC使用的是 Micro USB 接口) 之外,还需要一对 SPeaker 以及 一条双头Linein线,连接如图所示
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第7张图片
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第8张图片
如果是含有XFM-AEC 和PABasic部件的MOD-MIC-4XAnalog 阵列的话
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第9张图片
通过 PC端软件查看 /sdcard/cae/CAEAsrAudio文件夹内的PCM格式音频 ,可以看到,发送到AIUI平台进行语音交互的音频只有使用者的语音,歌曲的声音是消除掉了。然后就可以运行了。#有些资料是网上搜寻,有些是自己想法,如有雷同纯属巧合
关于AI视觉-如何连接使用智能语音开发套件(USB语音开发套件)_第10张图片

#欢迎留言及讨论。

你可能感兴趣的