思必驰副总裁:智能硬件时代下的语音技术应用

Mark wiens

发布时间:2022-10-13

思必驰副总裁:智能硬件时代下的语音技术应用

  随着移动互联网以及物联网的推广,基于人工智能的应用和产品越来越多,包括机器人等等一系列的人工智能产品。人工智能经历了计算智能、感知/表达智能、认知智能、抽象思维智能等几个阶段。从真正的人工智能,解决重组和计算,到互联网获取信息,直到现在IOT时代,智能硬件的核心是让机器能够帮我们解决问题,如此才能找到未来。

  “人机交互也是同样,真正能够帮用户解决问题。解决任务的人机交互才是好的人机交互。这是思必驰在成立之初一直在投入、研发和推动的事情。”苏州思必驰信息科技有限公司副总裁雷雄国在慧聪电子网主办的第二届HCFT智能硬件供应链大会上表示。“我们在创办公司之初,初步的想法是通过云技术的方式切入人工智能的领域,所以我们在云技术方面积累了非常好的核心技术,以及对市场、对客户的一线理解。针对这些理解,目前定位在智能硬件上的人机语音交互,同时把云机语音交互推广到了人工智能的应用领域,思必驰的定位是希望在人工智能方面,如何与更多的智能硬件合作伙伴打造更好的人机交互体验。”

  上世纪80年代,人机交互起先只是组织功能,随着技术的发展,可以进行浏览、搜索,到2010年,智能硬件时代的人机交互核心需求正向“任务处理”变迁。传统语音技术是单轮的交互,它解决了没有键盘的问题,解决了输入的问题。得益于互联网及智能终端的发展,以及智能语音方面的厂商在便捷计算、大数据方面的核心突破,使得目前在大数据的前提下,语音识别准确率大幅提升,目前基本上都已经达到了比较实用的水平。

  “有一个非常不好的消息,那就是不管语音识别怎么做,不可能到100%。针对一些特定的实际应用的场景,语音识别不可能达到90%。”雷雄国指出。噪声对于用户来说是不可避免的,对于语音识别的准确率影响也比较大。在实际的应用过程中,需要软硬件结合提供的解决方案把远场及回声部分做消除。

  语音识别最重要的是对人的语意的理解,即认知智能。人机交互过程中可能出现各种各样的问题,解决这个问题就需要把语义理解做透,把上下文,多交互,确认反复都做得比较完善,才能解决人机交互中遇到的各种各样的问题。雷雄国介绍说:“思必驰把核心的对话交互模型,以及基于对话上下文的环境感知,用户使用场景的感知,这样能够做到在正常的交互逻辑上做到多轮交互确认,以及对用户使用比较好的纠正、打断等等功能,这里的核心是要从感知到认知,认知强调的是一个大脑,这个大脑会思考,会解读当前所处的交互环境,用户的意图到底是什么。”

  认知技术核心是打断和纠正。雷雄国指出:“正常在使用的过程中,人和人之间的交互,中间可能会互相打断对方,因为他有可能觉得在那个时间点,他已经听懂了接下来要说的话是什么内容,他就打断了。目前几乎所有的人机交互都不会有这个功能,都是必须得机器说完了之后你再打断,在整个交互体验里面打断和纠正就显得非常重要。”

  总之,思必驰认为,比较好的人机交互界面是在有比较清晰的用户目标的情况下,对语义做一些认知的理解,同时在交互的过程中,能够有打断和纠正的机制。随着交互的不断深入,能够学习、推理,进而做出提示。 “目前来看,整个思必驰目前的定位是一家技术公司,整体方向是在智能硬件领域。我们是唯一一家专注在智能交互领域做语音识别,做人机交互、做人工智能的公司。我们希望在IOT时代,在人机交互方面,思必驰能够打造出让用户尖叫的交互体验的产品和技术。我们也希望这些技术、这些产品能够给我们的合作伙伴带来更多的产品亮点和卖点。”雷雄国说。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186