奇趣闻 > 数码科技 > \

语音交互和文本搜索的本质区别(续)

上一篇文章《语音交互和文本搜索的本质区别》从使用者的使用习惯入手,分析了语音交互和文本搜索的区别,主要观点有:

1.当用户使用语音交互时,用户通过语言表达的是自己的意图(语义),并不在意语言本身。

2.当用户使用语音交互时,就会默认对方是有智能,能理解自己表达的自然语言的。而当用户使用文本搜索时,习惯去操作机器,自己按照机器的规则处理。

3.当用户使用语音交互时,自然就会认为交互是个过程。处理语义也是对过程的处理,不是处理一句话或者几个关键字。

语音交互和文本搜索的巨大差异显然不仅仅是交互的介质从文本变成了语音。

我们很多同行不理解语音交互和文本搜索的巨大差异,他们认为用做搜索的思路就可以做语音交互。他们做出来的产品存在以下缺陷:

1.要求用户记住命令或者按照固定格式表达。比如:用户说“把晾衣杆降下来”可以执行,说“把衣架降下来”“降低晾衣杆”就不能执行了。用户说“关灯”能执行,说“关灯儿”不能执行了。这就是典型的命令式交互。命令式交互不是真正的语音交互。

让语音交互“去命令化”实际上是个系统性问题。尽管有些语音交互技术供应商可以穷举各种命令,但由于他们的系统结构是一个个模块拼凑起来的,进入每个模块就必然有各种命令。他们总得去让用户记住这些进入模块的命令,不然他们的那些模块可能就无法使用了。所以穷举命令并不能让语音交互的用户体验变得更好。

2.容错性差。语音交互经常遇到的问题就是语音识别出错。同音词问题,语音识别很难处理好。同音词问题还不算典型的语音识别出错。语音识别能把“前进”识别成“天津”,能把“后退”识别“回退”,这都是正常的。如果照着错误的识别结果去处理,就不可能让用户获得良好的体验。

搜索是就文本处理的,给什么样的文本就会获得相应的结果。而语音交互实际上要处理的是用户通过语言表达的语义,也就是用户意图。搜索不具备处理用户意图的抽象能力,很难让语音交互变得流畅起来。

3.在处理省略句、口语化表达、特殊句式方面存在明显缺陷。当用户用自然语言表达时,自然就会使用省略局、口语化表达和特殊句式。比如用户说:“要去北京的”就是省略句。这句话,售票员能听懂,但搜索引擎就会“一脸懵逼”。“我说去吃饭吧”,这句话的主语不是“我”。搜索技术会把“我”当成一个重要关键字去处理。“老张打了小明”“老张被小明打了”,搜索技术分不清楚这两句话的差异。

4.给用户一个列表让用户选。两个人谈话的时候,不会经常让对方做选择题。而当你使用一个用搜索技术做的问答机器人,你就得经常做选择题。我们使用搜索引擎就是每次都要做选择题,用搜索技术做的问答机器人本质还是搜索。

由于以上四个问题明显不是语音交互应该存在的问题,用搜索技术做的语音交互产品很难让用户获得良好体验。

怎样提高语音交互产品的用户体验,这是个非常庞大的工程,需要从硬件,系统,内容三个方面努力。我们氖星智能是先行者,也可能变成先烈。我们语义理解技术研发了20年,我们机器人大脑产品已经接近完善,我们提供了人机自然语言交互系统。要做好语音交互,还得硬件和内容来配合。硬件解决听得清的问题,内容解决懂得多的问题。


显示全文

相关文章