科技一站

 找回密码
 立即注册
查看: 111|回复: 1

人工智能or人工智障?谁能解决智能家居的一呼百应?

[复制链接]

1

主题

6

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-12-11 18:17:52 | 显示全部楼层 |阅读模式
不少用户入门智能家居,是从一台智能音箱开始的。曾经发展得如火如荼的智能音箱行业,如今也走起了下坡路。各种智能音箱要么在家吃灰,要么仅仅是被视为蓝牙音箱。不够智能,是人们对它最大的槽点。
当你字正腔圆地对着智能音箱发问,得到的却是让人匪夷所思的回答,他像极了你那个“耳背的朋友”,曲解你的意思不说,还要硬着头皮再回答你的问题,面对它的答非所问,你还不能上火,自己买回来的就得受着,哪有扔了浪费的道理?万一以后升级变聪明了呢?
那么问题来了,智能音箱为什么听不懂人话?它还能变聪明吗?

想解答这个问题,我们需要先了解智能音箱听懂语音的工作原理。我们所说的话,对于智能音箱来说,就是非结构化数据,很随意没有章法,而智能音箱能理解的是“结构化数据”,有章法,目标明确、指令清晰。人的语音就像是一个word文档,而智能音箱能理解的结构化数据,则是梳理好的excel表格。
每次你向它发起提问的时候,它需要先把语音识别成为文字,文字再去“表格”里寻找对应的目标指令,然后它理解了,才能输出答案,再转成语音反馈给你。


整个流程对应了3种技术,其中ASR(自动语音识别)和TTS(处理结果转化成语音输出)技术相对成熟,像ASR广泛应用在语音转文字、语音输入法、智能翻译笔等应用上。据中科院2019年的测试,国内四家主流智能音箱品牌ASR识别率均在94%以上。
智能音箱听不懂我们的话,问题主要出在NLP(理解文字的意思并进行处理)环节上。
简单且指向明确的指令,它能轻松理解,比如打开电视、打开空调、播报新闻等,但是比较复杂且容易产生歧义的语料比如有同音字、语法复杂的时候(倒装句也许躺枪了),它就懵了。


面对复杂的自然语言,AI想要辨别、理解、消除歧义,必须要分析海量“语料”,对人类语言的实例进行学习。
学习的途径有三种:企业根据需求自己构造的“语料库”(比如针对特定功能,需要构造人名库、地名库、歌手名库、歌曲名库等);互联网上大量抽取的文本(最常见的是从社交网络中抽取,以便机器理解最新的口语表达方式);用户在与产品交互过程中产生的数据,(与智能音箱对话的部分内容,会被上传进厂商的语料库,供AI进行学习)。
这时候有小明就问了:那么咱天天跟AI聊天天聊,聊的时间长了,它是不是就懂了呢?答案是可以的。
这里就要提到智家大脑的“类脑智能”了,作为集思考、决策、情感于一体的家庭智慧大脑,它可以借助全屋感知“神经网络”,洞察用户的各类需求,从而不断学习用户习惯,在理解用户的这条路上,不断自挖掘、自学习、自进化,做出更多符合用户本质需求的决策。换句话说,跟它“处”久了,他就懂你了,懂你的习惯,懂你的腔调,懂你的情绪。


看到这,有朋友可能就明白了,这就是人工智能真正变得智能的时候了,走到这一步终于可以逐步脱离“智障”的苦海了。
没错,智家大脑首先基于原始系统构造的“语料库”,覆盖用户使用的大部分场景,先确保全屋智能的正常运转,丰富的语料库让小优不再迷茫,迅速get到用户的意愿。


与此同时,基于云端数据的积累,它能了解到更多用户习惯,分地域、分时间段地去为用户提供适时的服务,在云端语料不断更新的情况下,越来越能理解用户的语言。


而且在整个全屋智能系统中,现在已经有越来越多的家电内置了语音模块。也就是说,家里除了智能音箱以外,其他的家电也可以跟你聊天儿了。


但是这会面临另一个问题——一呼百应。



相信已经有朋友感受到这种痛苦了——当家里家电都能听懂人话,每次你想要发一个指令的时候,大家来“抢答”,回声响彻全屋,久久不能散去。又或者就会出现舍近求远的状况,明明你坐在客厅里发号施令,结果厨房里的热水器最热情地扯着嗓子回答你,你又不得不扯着嗓子继续陪聊。
一旦全屋智能通用一个品牌的设备,这样的问题就难以避免。如何解决?——分布式语音申请出战!
什么是分布式语音?

首先,确保语音功能实现全覆盖,音箱、智家大脑屏、家电都可以对话,最大限度地丰富语音命令入口,做到交互“无处不在”。在确保语音覆盖全屋的基础上,通过人声交互定位技术“waken”,优化交互体验。
当你在三翼鸟智慧家里喊一声“小优小优”,家里的智能音箱、智家大脑屏,以及空调、加湿器、电视机等智能家电都听到了,感知到你的需求。此时智家大脑“waken”人声交互定位技术,能够综合考虑你所在的方位,说话声音的强度、信噪比等多维条件,做出精准判断,迅速决定、就近唤醒,让最合适的那台设备来回应你。


这时,用户会感到家里的电器彼此之间有了默契,仿佛被赋予了生命一样,它们总能知道你是在叫谁,彻底向一呼百应“say no”。
文章到这里,就接近尾声了。人工智障只是一个过程,人工智能虽迟但到。当用户习惯于用语音唤醒家中的智能设备,也会遇到“一呼百应”这个过程,而三翼鸟全屋智慧“分布式语音”也将终结这个过程,最终还用户以丝滑流畅的沟通过程,和舒适便捷的智慧生活。
回复

使用道具 举报

2

主题

8

帖子

14

积分

新手上路

Rank: 1

积分
14
发表于 2022-12-11 18:18:30 | 显示全部楼层
小优:你怎么能替我发语音  [优雅]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|科技一站

GMT+8, 2025-4-19 20:56 , Processed in 0.136031 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表