1. 主页 > 设计资讯 > 行业动态

人工智能产品经理需要了解的智能语音知识:语境

编者按:随着人工智能的发展,市场上出现了许多智能产品,其核心是解放人,利用机器帮助完成简单的任务。其中,智能语音是最常用的应用之一。本文整理了一些AI产品经理需要了解的智能语音知识,与大家分享。

经过几年的打磨,智能产品从简单的天气查询和播放歌曲开始,到前年家庭和汽车的IOT设备互联,最后到今年流行的AI生活服务。

整个演进过程不仅体现了技术的创新,也逐渐体现了用户对新功能的期待,以及对智能产品更大的接受度和容忍度。智能语音从简单的单轮命令操作逐渐演变为多次连续对话,甚至有些问题似乎与人类的智能回复相匹配。

1.智能语音的整个交互过程

主要有以下步骤:

人工智能产品经理需要了解的智能语音知识:语境(图1)

听清楚:当用户说一个词的时候,机器首先把用户的声音转换成文字,这样机器就能具体听懂用户说了什么。

理解:包括意图识别和任务分配,主要是自然语言理解技术,包括nli和nlp的技术实现。让机器明白用户在说什么。

意图识别:用户说话的意图:要结合当前的用户使用情景,服务场景,硬件环境,机器会按听懂的内容,给出一个N-bestlist,按权重进行排序。意图分发:拿到N-bestlist上面排位最靠前的意图,去请求指定的domain数据并执行任务。

渲染界面:用户听到机器的TTS回复和GUI的页面呈现内容。

第二步是对话管理,主要完成对话状态跟踪(DST),生成系统策略,以角色模型为接口进行匹配,提供语义表达的期望,分配任务记录当前的queryID和pageID。目前,它是用户在对话中需要经历的所有过程。如果需要多个会话,应该不断维护会话栈,会话栈要和当前的pageID匹配,这样用户经过多次跳转就可以到达期望的页面。所以多轮互动更复杂,更难控制。本文具体介绍了如何在产品上实现多伦交互,存在的技术问题,以及如何避免技术问题。

2.多轮互动的三种产品形式

“问题补充”

定义描述:只有用户填写确定的槽位信息,机器才能了解用户目前的真实需求。同事和机器根据用户的多个槽位回复找到对应的nli,给出用户需要的结果。定义用户需要提供什么信息的槽的集合。

应用场景:主要用于同类型的多步任务,因为机器无法在一次对话中理解用户的意图,需要进行多次对话,机器只能在得到固定数量的结果后才能给出结果。

人工智能产品经理需要了解的智能语音知识:语境(图2)

从上面的例子可以看出,只有用户说出最后一句话,手机才能打开。期间经历了【穿越电话簿】-【NLI匹配用户名】-【抽取结果】-【上下文管理】-【哪一个指的是上面的】-【通话】。基于以上内容,调用函数可以通过几个步骤来完成。

"搜索和:筛选"

定义描述:用户需要进一步缩小搜索选择范围。经过以上条件的多次过滤和累加,机器可以找到当前用户所需的结果。

应用场景:多伦过滤和搜索是用户与移动APP交互的主要应用场景。界面的过滤只能做。对于单条件过滤,如果要附加其他条件,或者与同类型服务比较,需要GUI操作或者打开新的APP重新选择。整个过程比较复杂。语音解决了用户重新选择和点击界面的操作步骤。用户可以先看票,不满意马上换火车票,不满意再退票。门票也可以筛选几次,选择自己需要的门票信息。

人工智能产品经理需要了解的智能语音知识:语境(图3)

人工智能产品经理需要了解的智能语音知识:语境(图4)

用户不需要每次对话都说明北京到上海的条件,只需要在对话开始的时候说一遍,然后根据当前出发地点和目的地查询车票和返程票。如果用户想换城市,可以查询“从深圳出发”,出发地点会改为深圳。

“跨越场景”

定义描述:不同场景中的语境参照主要是用“名称参照”和“他”来代替前面场景的主体部分。

应用场景:用户的任务是连续的,可能需要几个应用才能完成。跨场景上下文对话管理不仅让用户感受到非敏感APP的跳转,也让用户感受到语音相对于GUI操作的真正便利。

人工智能产品经理需要了解的智能语音知识:语境(图5)

从上面的交互过程可以看出,【人民百科】-【歌曲】-【电影信息】-【播放视频】的过程如果用户想按照app当前的呈现方式观看视频,不可能一分钟内完成查询并手动关闭包括【百度百科app】-【QQ音乐APP】-【腾讯视频APP】在内的三个应用。这就凸显了语音交互的优势。

3.语境互动中的问题

有了这么好的用户体验,就需要技术在没有感知的情况下为用户保驾护航,把产品体验做到极致。然而,目前的技术存在三个主要问题,无法完成所有的产品设想:

“什么时候开始放映?”

有些用户不想加入,上面也带进来了,让用户很难重新开始。例如,当用户将过滤条件“Xi安”添加到酒店页面时,当用户再次询问天气时,他会回答“Xi安天气”还是“用户当前所在城市的天气”?

“你什么时候涵盖了前面的条件?”

相同类型的结果将被覆盖。例如,9: 00之后,2: 00之后的搜索结果将被覆盖。因为没有显示清楚,用户总觉得现在的结果不是自己想要的。基于以上两种交互方式存在的问题,产品设计优化建议如下。搜索结果,显示由当前结果过滤的所有属性标签。用户可以通过GUI删除,每次暴露标签,根据当前已有的标签给出新的搜索结果。这样就解决了用户可以看到当前搜索结果的原因。其次,当用户想要重新过滤或改变过滤条件时,就更容易、更简单了。

"前一本书的预订什么时候是极限?"

可以保留多个以上过滤条件,同时过滤结果。但是,有一个问题。上述多种过滤条件的保留范围有限。目前基本保持五个过滤条件。当第六个过滤条件出现时,空之前的栈中所有数据都会被清除,最新的过滤条件会放入栈的第一个,结果会根据当前的和当前栈中的结果进行过滤。

4.产品优化策略

通过搜索条件、排序条件和筛选条件来确定哪些是需要或者可以支持多轮交互的。从产品上定义出用户使用的逻辑,方便用户在体验中更能找到产品的设计宗旨逻辑。回复的TTS需要加上用户当前的筛选条件。有些排序条件和搜索条件,产品经理需要定义什么时候回复要加上,什么时候回复tts不需要加上。如果是带屏幕的设备,可以通过显示当前结果的筛选或者搜索tag,既可以引导用户增加想要说的条件,也可以让用户明白哪些条件被覆盖掉,需要重新说。经过多伦以后,达到树形结构的最后一层,导致所有的筛选结果清除,用户重复筛选或者复用上一轮的筛选条件。建议把所有的内容都放入栈内,用户每次新的tag入栈,向前挤掉最前面的几个tag,只维护当前这个动态的固定tag的栈。

从事智能产品经理工作2年。从最初的智能产品的硬件设计和绑定设计,到智能软件交互产品的设计,经历了很多。最近也希望记录下自己的经历。可能会有错误和理解偏差。建议大家踊跃指出,共同进步~

有时乘风破浪,把我浑浊的船帆笔直地放在深深的大海上。

本文由设计学习网整理发布,不代表设计学习网立场,转载联系作者并注明出处:https://ffjianzhan.cn/xingyezixun/jhsj/633.html

联系我们

在线咨询:点击这里给我发消息

微信号:

工作日:9:30-18:30,节假日休息