• 售前

  • 售后

热门帖子
入门百科

服务呆板人语音对话的实现

[复制链接]
此路难行谎 显示全部楼层 发表于 2022-1-16 19:36:10 |阅读模式 打印 上一主题 下一主题
前言

  基于语音的人机交互是服务呆板人交互的最重要表现情势之一,它重要办理以语音作为信息载体,让呆板人具有像人一样的“能听会说”的本领,低沉使用门槛,且可以或许解放双手双眼的标题。以是把对话交互功能做好,是服务呆板人的底子。交互功能实现步调包罗:麦克风数据收罗、麦克风音频降噪和定向、功放声音回馈、关键词唤醒、语音辨认、语义词库查询、语音合成。

方案选型

  国内服务呆板人可选语音交互方案有科大讯飞、思必驰、百度、云知声等方案。云知声和思必驰一样平常是垂直范畴的团体办理方案的,比方车载体系的语音对话,前阶段跟思必驰的商务沟通,如果我们服务呆板人要使用他们的方案,前期落地费用须要50万大洋,后期每台还要交授权费用几千大洋,太贵了,就取消了用思必驰方案的动机,百度语音重要用于自产业物的百度导航、小度音响,在硬件支持和适配方面方面感觉不是特殊好。那照旧绕不开的路,照旧要用科大讯飞,科大讯飞的AIUI的流式交互体验确实比力棒。
   科大讯飞AIUI方案分为软核方案和硬核方案。软核方案就是须要把主板(Android 和LInux)交给科大讯飞,让他们去适配,适配好后后期使用每台会收取授权费用,可前期适配的费用是比力高的,凌驾10万大洋,而我们是做商用服务器呆板人,产物更新换代比力快,而且产量不是很大,以是我们选择了硬核的方案,硬核的方案就是使用科大讯飞核心板去实现。

实现步调

  我们呆板人接纳的CS的架构,内部有一个工控机作为服务器,呆板人全部功能和算法都跑在工控机服务器上,呆板人自带的安卓平板就是通过调用服务器接口去场景交互功能。以是团体的实现步调如下。

外围电路操持

  外围电路操持比力简单,重要是供电电路和功放板的声音回馈电路,尚有留意音频输出须要隔离,要不会功放板大概会出现噪音比力大的标题。
1.供电电路

  供电电路重要操持5V供电和3.3V供电,电路图如下。

2.功放声音回馈电路

  功放声音回馈电路留意用于流式交互方式,就是呆板人在答复标题时间,我们可以直接跟他继续对话,不须要打断。用这种交互方式就须要通过回馈消撤除呆板人自身语言的声音。

语音交互服务实现

  我们呆板人内部工控机服务器跑的是Ubuntu体系。语音辨认、唤醒、休眠、合成服务根据科大讯飞提供的AIUI模块串口开发指南来实现。语义词库我们有自己的云端可编辑的词库体系,实现的方式就是优先在我们编辑好的词库查找答案,如果找不到答案就去AIUI平台去获取答案。开发使用golang语音,摆设的方式是docker-compose,对服务呆板人当地单机摆设来说,docker-compse黑白常符合的方式。
安卓平板APP交互

  交互APP只是根据呆板人服务器提供的语音辨认,语音唤醒,语义查找、语音合成接口来根据场景实现对话功能。不外为了体验更加天然人性化,我们加了摄像头的判断,就是摄像头检测到有人来,就打开语音对话,人走开了就主动关闭对话,这种交互比力天然,比其他呆板人的交互体验好许多。

  服务呆板人对话演示

后续

  我是一位商用服务呆板人的从业者,我会把对服务呆板人这行业的想法、发展趋势和在工作中遇到的标题息争决方法分享出来。
  如果本期内容对各人有资助记得点赞哦,所写内容对各人有资助是我继续写下去的原动力。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作