前沿:

开头必须来一句,我相信语音一定是未来,我非常确认

这篇 HMI 的语言探索以介绍语音交互内容为基础,结合我的实际工作项目经验,输出总结关于语音设计的内容,最后结合案例,在对话设计中会进行深度的探索,并提出个人的想法和思路,因为有的时候深度去思考觉得我们项目还可以有很多优化的点。

进入我们今天的正题。

在说语音交互之前,先给大家讲一下题外话,关于人机交互(Human Computer Interaction)简称 HCI,可能日后我想去攻读这个硕士学位,简单来说就是指人与计算机之间通过使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。

万字长文!车载 HMI 语音设计基础知识科普

语音助手最初的载体是手机 APP,通过与用户之间的对话方式,能够帮助用户来解决问题的,随着我们现在人工智能的研发技术不断发展,包括让机器学习,语音识别、图像识别、自然语言处理、智能搜索等一系列。语音交互运用的很普遍了,不仅仅只是智能手机,现在涉及到的领域是越来越多了,如智能家居、汽车、可穿戴设备、就连商场普遍也有机器人语音对话。

万字长文!车载 HMI 语音设计基础知识科普

HMI 语音介绍

我这边就不打算讲语音的发展历史了,不然又是水了一大堆内容,我可是一个讲干货的小作家呢,如果我的小粉丝们需要的话,就私信我,我会在微信公众号更文。

语言是传递信息重要方式,对于我们用户来说,语音交互也是学习成本相对较低、容易掌握的,语音交互设计简称为 → VUI。

新能源汽车不断的发展,智能车载系统也是我们最看重的。随着语音交互的的普及,语音识别开始走入人们生活,凭借其实用性和准确性得到了用户的认可,因此在发展的过程中摒弃了传统的、繁杂的手动操作,提高安全驾驶属性和更高效的处理问题的能力,但是,在现阶段的新能源汽车发展过程中还不能完全替换掉手动操作。

万字长文!车载 HMI 语音设计基础知识科普

现在为什么用户在驾驶车的过程中,还是不会常用到语音交互,首先提到的就是用户习惯,根据数据调查,在使用语音交互的人群中,年轻人占了主力军,其余年龄段的人由于常年驾驶都是通过硬按键来操控车内空调、电话、音乐、电台、内置导航。其实就算是苹果手机中的 siri 都很少用到, 在使用初期因为技术的不成熟,再加上冰冷的对话方式使得用户不对这个买单,像我现在生活中,用到的 siri 频率也会很少,最多就是定一个闹钟,app 实在找不到就会使用到,还有无聊的时候和他进行无聊的对话,嗯就这样子。

万字长文!车载 HMI 语音设计基础知识科普

国内做语音头部公司有我们熟悉的科大讯飞,还有和多家车企合作的思必驰、云知声,对内服务的百度,搜狗,腾讯,阿里这些大咖都有自己的语音技术。

万字长文!车载 HMI 语音设计基础知识科普

再讲一下语音的基础原理内容,这一块比较难懂一点,首先你要说出你需要解决的需求、要处理什么事情,通过车载系统设备收到指令的语音 → 自动语音识别 (ASR) → 将指令转化为文本 → 自然语言处理 (NLP) → 了解用户需要解决什么问题 → 通过Skill (普及一下知识:Skill 是一种程序的语言,有notepad++,UltraEdit等,好了不啰嗦了) → 将处理好的结果处理成回复文本 → 最后再通过TTS 播报形式 → 形成回复音频 → 通过车载系统回复给用户解决结果,听起来是不是有点复杂了,我相信我是全网说的最细的了。

万字长文!车载 HMI 语音设计基础知识科普

如何去定义一个产品的语音的好坏?我觉得吧,能够让用户对于这个语音系统的满意度达到一个高标准,首先能够让系统能够听懂你所说的内容,并且给出相对应的解决方案,语音系统运用的简而易用即可,如何做到以上的要求,我会在下面对话设计中会着重讲解深挖的。

车载语音交互(VUI)基本原则

车载场景下的语音交互核心基本原则有三点:

1. 首先是安全

驾驶过程中,司机的眼睛、耳朵和手占据了大部分多任务操作,如果一些功能还需要通过眼睛和手来操作的话,会降低安全驾驶的系数,所以车载语音交互更有助于辅佐司机安全驾驶,减少注意力的分散。

万字长文!车载 HMI 语音设计基础知识科普

2. 其次是便利

语音交互设计之初,一定要考虑便利、快捷,尽量的减少每一个任务的对话次数、快速响应、将对话流程简单化,从而打破 VUI 对于用户的一个心理障碍(便利这块内容我会在后面对话设计中着重讲解)。

万字长文!车载 HMI 语音设计基础知识科普

3. 最后是愉悦

为什么要谈到愉悦,因为市场上最初的语音对话交谈,都是冷冰冰的,几乎没有情感可谈,像极了和机器人对话,并且有的时候无法处理任务就会说,超出能力范围,这是一个很不好的用户体验。现在市场上可以看到,导航软件也有语音包可以选择,这也是增加了情感化设计,这是其中的一个点。还有一个小点就是自然的对话交流,很流畅的完成用户提出的每一项任务,尽可能的规避对话中的错误,让整体的对话过程达到一个愉悦的感觉。

万字长文!车载 HMI 语音设计基础知识科普

用户语音的目的

用户在语音交互的时候,绝大多数都是带有明确指示任务指令的,也有可能是闲聊状态。

1. 任务状态下:

任务式对话中,用户需要尽快的得到想要反馈和解决方案,并且快速的完成,此类任务的反馈要求还需要清晰、简单明了。

2. 闲聊状态下:

我们经常也会问 Siri 一些无聊的问题,比如:“siri 给我来一段 Rap” 通常这类的任务带有的目的性不是很强,但是对于趣味性要求会高。

万字长文!车载 HMI 语音设计基础知识科普

市场现状(VUI+GUI)

语音是最舒服的交互形式,但是他不能完全取代 GUI,相互协作才是更佳的方案,所以现在市场上的车载系统大多数都是以语音(VUI)和图形用户界面(GUI)相组合的,也有少部分车加入其他交互方式譬如手势交互。

万字长文!车载 HMI 语音设计基础知识科普

语音与图形的交互是交叉处理,从而形成了多模,多模态在我第二篇文章也有讲到,第一次看我文章的同学们可以回顾一下,用户在对车载系统发送一个指令的同时,设备会有多种的反馈方式,首先你可以听到系统虚拟形象给你做出回答,其次你看到图形界面的变化,举一个例子,你说:“我要听周杰伦的七里香”系统就会处理讲页面跳转到音乐界面,并且播放周杰伦的七里香,如果声音小了,你可以说:“声音大一点”

万字长文!车载 HMI 语音设计基础知识科普

大家是不是发现一个问题呀?我在前面说系统首先会做出回答,然后界面才会发生变化,但是实际情况,系统语音形象没有做出任何多余的回答,而是直接听取到用户的需求,直接反馈出结果,播放了周杰伦的 #七里香#,这就是我准备在下面会重点讲到的“对话设计”

在说对话设计之前,我们先了解一下 VUI 设计师,想必大家头一次听说,还有语音(VUI)设计师嘛,国内不太注重培养 VUI 设计师,大家可以去招聘平台搜索一下语音交互设计师,很少有公司专门针对这个职位去招聘的,就算有,也是招聘算法等研发岗的职位,VUI 设计师的工作任务一般都是公司的产品经理或者交互设计师代劳了,这会肯定就有产品经理或者交互设计师想出来吐槽了,哈哈哈

万字长文!车载 HMI 语音设计基础知识科普

语音交互方式给用户听和说两个动作,相信大家也有听过 7±2 法则,因此在听到的信息设计发面需要考量,因为用户听到一遍内容之后就消失了,除非这款车机语音系统,有再次复述上一段话的功能,不然在语音设计的时候,千万不要让用户产生的认知负荷,更不要挑战用户的短时间的记忆力,最强大脑除外,我们大多数人可不是什么最强大脑是不是。再次强调一下,就算拥有复述这个功能,也要注意设计的语音内容,该功能点只是加分项而已,不能打破底线,将语音设计的原则抛之脑后。

万字长文!车载 HMI 语音设计基础知识科普

VUI & GUI 的优缺点

再分析一下图形设计(GUI)和语音设计(VUI)之间的优缺点,那我们先从优点开始说起。

万字长文!车载 HMI 语音设计基础知识科普

(1)前面我们有提到 VUI 只需要听 and 说,而 GUI 则需要触控屏幕内容,在效率和安全方面没有 VUI 好,触控操作比语音操作要相对会慢,语音交互方式中驾驶者无需离开方向盘。

(2)在对于整套车机系统而言,GUI 学习的成本远高于 VUI,因为 VUI 只要会交流即可,无须像 GUI 一样学习触控交互手势、在哪里点击等一系列问题。

(3)还有一点,图形设计是一种已经预设好了操作路径和交互方式,页面之间存在这层级交互的基本关系,用户需要根据指定的操作进行,而 VUI 则突破了 GUI 的限制,交互更快捷了,举个例子:“导航去虹桥机场”,VUI 则一步到位,而 GUI 首先需要找到导航应用的入口,然后再点击搜索输入框,输入#虹桥机场,确认完毕之后,再点击导航,我的天呐我写的都很烦了,说真的还不如语音一步到位呢。

说完优点后,我们在反思一下 VUI 还有哪些没有 GUI 做的好的点.

万字长文!车载 HMI 语音设计基础知识科普

(1)语音交互涉及到 3 块内容,语音识别,识别用户所说的内容,其次语言理解,这边会关乎到方言理解的问题,毕竟我国语言博大精深,难以参透哈哈哈,最后是语音的合成,这三块内容如果有一块出了问题,最后反馈的结果可能并不是用户想要的答案。而图形设计有这统一的执行操作指令,不会出现什么 bug 问题,如果有,那肯定就是这款车机在测试的时候测试人员遗漏的问题,可以投诉。

(2)整套车载的 GUI 设计都会有一套严谨的操作逻辑,有明确的信息分布和页面的层级关系,但是 VUI 的功能不可见(除非你看那个使用手册,哈哈哈哈哈)所有的场景 VUI 都需要去探索,在引导性方面会弱很多,所以在买车的时候抓住销售员使劲的问哈,毕竟你花了一大笔钱来买车了,在试驾的过程中也要多去询问,就先点到这里了。

(3)GUI 是可以全场景交互,不限制于任何场景,而 VUI 则会受到的场景因素较大,有较多场景中不适用语音交互,最直接的就是设置中的内容。

(4)语音设计对于用户的一个记忆力是一个考验,如果一个很长的 TTS 反馈,用户不知道哪里才是自己所需要的信息,因此在做 VUI 设计的时候尽量简短高效的句子,而 GUI 信息都会呈现在页面中,所以这个点要相对优胜于 VUI 了。

总结一下

以自然交互为主的,声音,显然是最自然的交互形式,但不能完全取代图形 GUI,而是更好的协作,尽量减少界面的形式设计,加强情感化的交互形式体验,将智能化更好的融入到车载系统中去,让每一位用户能够更好,更便捷,更安全的驾驶着汽车,是我们全体设计师的初衷。嗯,感慨了一下。

想用一个成语总结一下:相辅相成,就是这个意思

语音设计需要考虑几个要点

1. 一定要想好从哪里开始,到哪里结束

我们首先假设一个场景,调节空调温度的语音设计,那 VUI 设计师需要将这个场景的对话要贯穿该流程中去,那接下去要考虑这段对话可能出现的任何状况,以及相对应的解决反馈内容,再第二点设计 VUI 语法中,我给大家演示一下空调全方案案例。

万字长文!车载 HMI 语音设计基础知识科普

2. 设计 VUI 语法

语法就是用户输入给机器的指令,VUI 的设计师需要了解对话设计的意图,尽量要考虑用户可能表达的所有方式,将最常用的表达方式提取出来,作为指令的模版,当然越多越好,这样给用户体验带来的感受会更好,能够解决用户的问题概率也会提高,别到时候语音助手反馈:“已经超出我能力范畴 or 您换个说法试试”,我一听到这些就炸毛了,后面就不可能再去使用它了,因此 VUI 设计师一定要多考虑一下指令。语法我会在我工作实际案例有特别详细的讲解(在实际案例篇幅 – 使用语音场景分析里面),这个特别重要,大家要细细的品。

万字长文!车载 HMI 语音设计基础知识科普

3. 空调案列分享:

用户一开始的输入指令可能有 “打开制冷模式”、“打开加热模式”这些都会有点官方定义的语法感觉会很正式。

下面再延展一下用户轻松的说辞 “我有点热了帮我开一下空调”、“今天太冷了,车温度好低啊” 其实用户的说法有很多,但是空调的模式就这么几种,所以需要抓住关键词 #热、#冷、#高、#低 …,什么意思呢?因为这些关键词是起到决定性因素的内容,其他的修饰词语可能会千变万化,所以语音助手一旦检索到该词汇,就可以做出判断,到底是制冷、还是制热、还是通风等功能。先简单就介绍这一个,后面还有很多案列,大家好好看奥。

4. 如何设计好回答用户的问题

在语音基础介绍中也有提到过 TTS,他是语音交互中最主要的回答方式,就是将 VUI 设计者撰写好的对话设计脚本,通过 TTS 转化为语音去播报。回答能够给用户带来最直接的感受,回复是好是坏,会直接影响到这款语音产品的体验,想要设计好我想谈两个大方向,设计脚本尽量简洁明了,全局系统语言特点保持统一,后续有案列可以叙述讲解的。

国内外语音设计差异点

国内的语音设计和国外也会存在差异点的,首先是地方语言的差异,国内语言多达 80 种以上,汽车智能语音在方言这一块相对堪忧,能够支持的方言相对较少,这也成为了中文语音识别的一个难题。

在设计语音之初我们就得定义好,需要支持哪些方言,比如粤语、河南话、四川话等,现在的车载版本微信可以支持 20 多种方言,但是整体的车机系统可能难以做到这一点,这块内容是需要攻克的一个壁垒,据我查看国外报道,关于方言解决方案,宝马、三星和松下三家公司与语音识别公司 Nuance 合作开发新智能辅助技术,这项技术使得汽车语音系统在处理特定的方言时,可以更加容易。

万字长文!车载 HMI 语音设计基础知识科普

还有一点就是中西方语言文化差异,那就举一个例子,单从一个社会礼仪就可以展现出两者之间的差距,国人路过遇见熟人总爱嘘寒问暖 “吃饭了吗?”、“到哪儿去”、“最近怎们样呀?”等,在我们看来,这是一种有礼貌的打招呼用语,但你要跟西方人这样打招呼 “Have you had your meal?”、“Where areyou going? ”,他们则会认为,你想请他吃饭,或者干涉其私事,会引起误解,而西方人见面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn’t it? ”

实际案列讲解篇幅

1. 语音唤醒设计

车载语音唤醒分为免唤醒和需要唤醒,免唤醒的定义就是无需说出唤醒关键词或者其他任何操作,就直接可以进行与语音助手交谈并处理任务。如需要唤醒的话,触发动作可分为点击、按压、语音等,目前市场上主流的车机唤醒方式有三种:

实体按钮,好处就是能够给到用户触觉上的反馈,用户感知性强

万字长文!车载 HMI 语音设计基础知识科普

虚拟按钮:此类的按钮一般都会在中控屏幕上面,唤醒的方式是点击

万字长文!车载 HMI 语音设计基础知识科普

语音唤醒:在驾驶场景中双手被占用,不能远距离的操作中控屏幕,最佳的交互操作方式就是语音唤醒

万字长文!车载 HMI 语音设计基础知识科普

语音助手形象

在语音助手形象设计方面,会分为两种,一种是卡通化语音助手形象,而另外一种是抽象化语音助手,下面用实际案例展示一下,卡通形象我们就拿未来汽车的 NOMI,抽象化 Google 的 Android Auto 语音形象

万字长文!车载 HMI 语音设计基础知识科普

基于工业设计 2021 年 01 期的调查数据分析来看,卡通化的语音形象在亲和力上有很大的优势,能够被用户快速的接受,但是辨识度上可能存在同质化严重问题,所以在效果表现力上面有欠缺,也较难表达车企的品牌理念。抽象化的语音形象则通过造型的多变和动效丰富,从而在设计感和效果上相对突出,在传达性上也不满意,用户不容易知道当前语音是处在一个什么状态下,在亲和力上远也不如卡通化形象。

万字长文!车载 HMI 语音设计基础知识科普

使用语音场景分析(重点)

关于车内可以延展很多应用的场景,要知道用户在驾驶过程中需要完成什么样的任务,接下来我们就围绕这几个核心的功能点 → 多媒体(娱乐)、车辆控制、导航、电话,顺带将每个模块语音基础话术指令带过一下外加TTS反馈,也是让初学者熟悉一下命令,这块内容很重要奥,都是我在实际项目工作中总结出来的,大家要上点心好好看,答应我好嘛

1. 多媒体(音乐、电台)

播放音乐、电台或者是播客这些都是一辆车最为常见语音交互的功能之一吧,开车的时候都会听一些音频类内容,对于这个功能播放、暂停和切换歌曲等功能外,电台快速选择,针对这些功能我们可以划分一些子功能对应的典型话术。

音乐-话术

万字长文!车载 HMI 语音设计基础知识科普

  • 播放音乐

按歌手 → 我想听霉霉的歌、播放周杰伦的歌

歌曲名称搜索 → 播放天外来物、来一首七里香

歌手名称+歌曲名称组合精准定位(因为有很多翻唱的曲目) → 播放周杰伦的七里香

按照语种 → 我想听粤语歌、放一些英文歌

按照曲风 → 来点爵士音乐、播放摇滚音乐

  • 根据音源播放语

在线音乐 → 播放qq、网易云、酷我音乐等等(因为每一家车厂合作的音乐供应商不一样)

蓝牙音乐 → 播放蓝牙音乐、跳转到蓝牙音乐、放蓝牙歌曲、切换到蓝牙音乐、我要听蓝牙音乐

U 盘音乐 → 播放U盘音乐、听U盘音乐的歌、跳到U盘音乐

  • 音乐播放控制命令

切换当前播放列表上一首歌 → 切到上一首、上一首歌

切换当前播放列表下一首歌 → 放下一首音乐、切下一首

换一首歌播放 → 换一首歌、换一个音乐、换个歌

暂停歌曲 → 暂停音乐、音乐暂停、停止播放音乐、不想听歌了

继续播放 → 继续播放音乐、播放音乐

针对于音乐这个模块的基础语言先讲到这边了,因为在线音乐的功能相对比较多,所以后续我会对于 QQ 音乐、网易云、酷我音乐等在线音乐额外的语言控制命令再写一篇续集。

电台-话术

万字长文!车载 HMI 语音设计基础知识科普

  • 播放电台

打开电台 → 打开/开启收音机、听广播、播放电台/收音机/广播/Radio

按频率收听 → 调频<104.5>、播放调频<104.5>、收听调频<104.5>、广播<891>

按频段+频率搜索收听 → 我想听FM<104.5>、FM<104.5>、收听/播放/我要听FM<104.5>、收听AM<1045>

按电台频道搜索收听 → 我想听音乐类电台、我要听上海<民生聊聊>电台、收听<交通>/<新闻>广播

按在线音源+音频类型搜索并播放 → 播放喜马拉雅的相声

按艺术家+音频类别搜索并播放 → 我想听郭德纲的相声

  • 播放源

喜马拉雅 → 收听/打开/我想听 喜马拉雅

FM → 打开/收听/我想听/播放/我要听 FM

AM → 打开/收听/我想听/播放/我要听 AM

  • 电台扫描

扫描电台 → 扫描电台、搜索电台、重新搜台、搜寻电台、搜索频道、扫描频道

  • 电台轮播

轮播电台 → 浏览电台、电台浏览、电台轮播、轮播电台、快速浏览

  • 电台播放控制命令

上一个电台 → 上个频道、上一个台

下一个电台 → 下一个台、切到下一个台

换台 → 换一个台

暂停电台 → 暂停电台播放

收藏/订阅 节目 → 收藏、收藏这个、添加收藏、加入收藏

取消 收藏/订阅 节目 → 取消收藏、收藏取消

车辆控制-话术

基本功能包括车内空调温度调节、控制车窗开关、后视镜角度的调节,还可以切换驾驶模式、变换档位等等。

万字长文!车载 HMI 语音设计基础知识科普

  • 空调控制

空调控制 ON/OFF → 打开空调、关闭空调

空调 Auto → 打开自动空调、自动空调开启

空调打开+模式 → 太冷了、好热啊(检索到关键词,制冷/热进行切换模式)

空调风量增减 → 风量大/小一点、风大/小一点

设置风量级别 → 风量设设为2级、风量调成2级、风量最大/小

空调温度增减 → 温度高/低一点、温度调高/低一档

设置温度级别 → 温度调到xx度、温度设置xx度、温度调到最高/最低温度(空调温度调整到对应指)

空调吹风模式 → 吹脸/脚、吹脸吹脚、吹脚前除霜、前除霜(前除霜:处理前挡风玻璃的)

后窗除霜 → 打开后除霜/雾、打开后窗加热、后挡风玻璃除霜/雾

  • 车窗

开启/关闭车窗 → 开/开启/打开/关/关闭 车窗(未指定某一个窗户,打开/关闭所有车窗户)

指定开启/关闭车窗 → 开/开启/打开/关/关闭 – 左前/右前/左后右后窗 、 打开/关闭主驾旁边车窗、打开/关闭前排窗、打开/关闭后排窗、打开/关闭全部窗户

车窗开启/关闭到具体数值 → 车窗开/关一半(1/2)(车窗调节范围0-100%,根据不同车厂设定值为准)

  • 情景模式

前文中有提到 TTS 反馈,那我就在车辆控制中情景模式详细举例子给大家讲解一哈。

清凉模式 → 打开/开启/关闭 清凉模式 TTS反馈 清凉模式已打开/关闭、清凉模式已处于打开状态

温暖模式 → 打开/开启/关闭 温暖模式 TTS反馈 温暖模式已打开/关闭

雨雪模式 → 打开/开启/关闭 雨雪模式 TTS反馈 雨雪模式已打开/关闭、即将关闭车窗,请注意安全

抽烟模式 → 打开/开启/关闭 抽烟模式、我想抽烟 TTS反馈 抽烟模式已打开/关闭

导航-话术

导航是我们最常用的功能之一,对于用户而言输入地址是一件头疼的事情,所以在导航去目的地的时候,直接语音输入后,匹配所需要导航的目的地,让语音助手帮你直接导航,还可以询问语言助手到达目的地时间和距离播报,有的车机导航系统还可以支持语音缩放地图大小,省得两只手指在触控屏幕进行放大缩小操作手势,在导航中的使用语音主要的目的就是便捷与高效。导航中的执行逻辑我这边就不做过多叙述,因为相对要更专业点,后续有机会我再深挖讲解。

万字长文!车载 HMI 语音设计基础知识科普

  • 导航

公司 → 我要去公司、导航到公司、去公司、上班了

回家 → 我要回家、导航回家、回家了

注:如果没有设置公司/家的地址 需要进入设置公司/家的具体地址流程,设置完毕之后,方可语言导航去公司/家

附近加油站 → 导航到附近/周围/周边加油站、帮我找个最近的加油站

当前位置→导航到模糊的POI(会产生多个结果) → 导航到火车站(拿上海举例子:上海有虹桥火车站、上海火车站、上海南站、松江站、上海西站,因此产生了多个结果后,语音助手还会继续问到你需要导航到具体那个火车站,如果时间超过定义时间将默认为第一个)

当前位置→导航到POI简称 → 导航到人广(人民广场,要不要和我一起去吃炸鸡🐔 哈哈哈)、带我去交大(交通大学)

  • 增加途径点

附近其他 → 导航附近三甲医院

搜索指定位置+指定类型 POI → 帮我找一下南京西路的日式餐厅

搜索指定距离+指定类型 POI → 两公里以内的停车场、一公里中式快餐店

搜索指定位置+指定品牌 POI → 南京西路的古驰店

  • 导航距离/时间的播报

查询途径点的距离播报 → 距离南京西路还有多远、距离下一个途径点距离还有多少

查询途径点到达耗时播报 → 到南京西路还需要多久、距离下一个途径点还要多长时间

电话-话术

在驾驶过程如果需要拨打电话,是一件不太容易的事情,而且是极其危险的,所以需要结合语音进行来辅助,接听/挂断不管是屏幕触控还是方向盘的硬按键都可以直接操作,体验还不错,对于不习惯语音的的人来说该功能点可以替代,但总体来说,语音接通/挂断会优于屏幕触控,硬按键对于长期使用来说可能会有优过语音,对于用户来说,在安全驾驶前提下,哪种使用方式习惯就用哪种。

万字长文!车载 HMI 语音设计基础知识科普

  • 拨打电话

联系人姓名 → 打电话给老妈、呼叫老爸、联系哥哥、给姐姐打电话

拨打电话号码 → 打电话给12315、打电话给18015888888

拨打常用黄页名 → 打电话给中国电信、给上海银行打电话

  • 接听/挂断/重拨/回拨

接听 → 接听/接电话/接通电话/接听电话

挂断 → 挂断/挂电话/挂断电话/挂掉电话

重拨 → 重拨电话

回拨 → 回拨电话

对话设计

对话设计是基于人们的对话的设计语言,它集合多个设计的内容,其中包括语音用户界面设计、交互设计、视觉设计、动画设计、语音对话脚本设计、乃至还有音频设计增加语音助手的灵动性。

万字长文!车载 HMI 语音设计基础知识科普

对话设计的是否成功与否最重要的就是个性,现在市场上的许多车载语音系统对话听起来还是基本很相似,是因为很多公司都没有专业的对话设计师,要么是程序员、产品经理、好一点的公司组建一个语音组,都是从其他行业转化过来,然后将各个大厂的语音对话研究一下,就上岗了,国内优秀的 VUI 设计真的很稀缺,也是很缺少的人才,我可不想再用语音交互的时候语音助手和我说“对不起,我没懂你的意思”

对话设计师在规划用户在具体每个功能模块区域内做什么,同时还要考虑用户的需求和技术限制,对话的策略,是代表着该语音系统完整的用户体验,也包含这详细的规范定义流程和底层逻辑。

这边需要着重的讲一个小知识点:

我们会有一个误区,认为“对话”仅只是说 or 听到的内容,其实对话本质上是多模态的,对话的核心内容是对话的流程和底层逻辑,图形界面的逻辑一般都不太会用在对话内容的设计方面,基本上他们两是一个独立的个体。

对话设计需要注意点

1. 语音简短化

车载语音的对话做的是否 OK?是基于对话内容时间的长短,因为用户没办法像查看 UI 界面内容那样,去查看语音的内容。根据人的平均记忆力,如果车载语音虚拟形象说了,关于这个话题很多内容,用户可能无法记全所有的内容,这对于对话将大打折扣,因此在对话过程中需要严格遵循 → 简短明了,让每一个文字都有意义,避免重复的短语,可以让用户快速的做决定。

万字长文!车载 HMI 语音设计基础知识科普

2. 响应等待设计

当用户在用导航功能的时候,语音对话说“导航去火车站”,如果在上海的话,就有好几个火车站,需要用户再次去选择,1 虹桥火车站、2 上海火车站、3 上海南站、4 上海西站,我们在做项目的时候,体验设计师给他的定义是如果用户超过 8 秒还没有进行选择的话,默认是选择第一个,如果第一个目的地不是我想要的,那么我需要重新通过语音再次输入信息。我觉得默认选择这个选项可能会有些不妥,如果这期间来一个电话或者是微信的语音电话,那么我是不好通过语音去选择的,如果汽车不是在驾驶的状态,可以手动触控屏幕进行选择 OK 没问题,如果是驾驶状态下,就需要优化前面默认选择项了。

万字长文!车载 HMI 语音设计基础知识科普

我的想法

(1)超过 8 秒钟后,默认选择第一个没有问题,但是在用户结束自己之前任务状态后,可以说重新选择目的地,将之前的搜索出来的火车站结果都再次调出来,提供用户重新去选择。

(2)这块就更智能化一些了(这个有一点前瞻性的意思,研发要是看到这个需求估计要揍死我),当语音助手检测用户正在忙的状态时候,在 8 秒钟都没有做出选择,那么语音助手可以从第一个目的地开始播报,用户可以通过方向盘 OK 硬按键去选择自己所需要导航的目的地,在驾驶过程中,方向盘的硬按键安全性远高于中控屏幕的点击。

3. 避免过多的选择

给用户提供选择的选项列表的时,最好不要超过三个选项,给用户较少的选择,能够让用户更明确去抉择,减少过多选项对于用户的干扰,刚刚上面导航那个案例排除,上海火车站真的太多了没办法,其他城市应该还好都是 1-3 个左右。

万字长文!车载 HMI 语音设计基础知识科普

我的想法

上面实际案例就是强行逼迫用户去选择一个,这种体验很差,有一种场景,如果这三个选项都不是我想要的,你就得重新说,帮我推荐一下附近的餐厅,想想这种体验就不是我想要的,我觉得可以增加一些情感化的设计在里面,如果这三个选项都不是我想要的。

我可能会说“这些我都不想去、能不能帮我再推荐其他的”语音助手说“你可真挑食、好的,那我就再帮你找找其他美食”(我的意思就是要让机器多去自我学习,更加智能化、情感化贴近于用户的交流,这样用户才会更愿意使用语音交互)

上诉的场景是对于这块区域不熟悉的用户来搜寻美食,如果用户有直接目的需要吃什么类型的餐饮的时候,语言助手只需要推荐相关美食就好。

用户说“帮我找一下附近的海底捞”语音助手说“附近有三家海底捞,您是要去哪一家…(播报三家信息)”

(播报三家海底捞的位置和距离,甚至我想是不是可以增加排队人数的播报,如果排队人很多就可以换一家,接下来就可以和语音助手直接说帮我预约好位置,省的用户到店面还要进行排队等候)

4. 不要假设用户知道该做什么

在做对话设计的时候千万别考虑用户的思考逻辑,每个人的思考逻辑都不一样的,所以不用去猜想用户的想法,只需要提供有用的信息让用户自己选择好了,前面有提到对话设计是讲究有逻辑性的,你在设计对话剧本的时候不可能就只考虑一条线。

举个简短的例子,你在设计一个订购飞机票语音对话流程,你想法是,首先先确定目的地,哪里起飞去哪里,然后再选择时间点起飞。假设用户直接说:“帮我预定早上八点的飞机,飞往深圳。”那问题来了一开始是用户是说的时间,最后只说了目的地,没有有说出发地,因此在语音设计剧本的时候,你需要将所有能出现的状况都考虑进去。

万字长文!车载 HMI 语音设计基础知识科普

5. 语言文案设计一致性

在图形设计之前 UE 也需要将动词、名词之间的搭配提前定义好,需要全局保持一致性,这块内容有在我第二篇文章提到过,因此在对话设计过程中也要格外注意。

万字长文!车载 HMI 语音设计基础知识科普

6. 不要信息轰炸用户

现实中我们正常处理事物的时候,也是将事物划分成几块,然后按照计划步骤进行,而不是一股脑子乱做,车载语音设计也是如此,作为一个正常的用户来说,我们一次性说出的需求并不会很多,不会像专业的车机测试人员一样,去叙述一大堆信息去检测机器的运转效率,和一个处理信息的准确性,每次出差去南京走查,都会听到测试人员巴拉巴拉 一直说,我脑袋都大了,所以我们正常用户都是逐步的去说消息的,举个列子

万字长文!车载 HMI 语音设计基础知识科普

7. 避免使用专业术语

举一个场景的例子,当你在道路上开车,需要停在路边接朋友,朋友还没有到达指定位置,或者该位置是不可以停留的,语音助手正确说法“这边不可以停车,不然交警叔叔会罚款的,赶紧溜,我帮你找一个附近可以停车的地方吧” 错误的说法:“你触犯了了我国《交通法》第 XXX 条,……此处省略法律条文这边是禁止停车的”

万字长文!车载 HMI 语音设计基础知识科普

首先当你听到触犯法律,你的第一想法 what?这是什么鬼,给用户的感觉是很糟糕的,因为法律消息通常会包含长阅读并且还不自然的语言,给用户带了不好的体验,并且还未给解决的方案。一个好的语言设计方案会让人喜欢上使用它。

最后来个总结:

后续我会对于前瞻性的语音进行探索,再写一篇。前瞻性的就再举一个吧:通过面部扫描,检测到用户不开心的时候,车载系统可以推荐一些治愈系的电台,或者可以让用户放松、舒缓心理的的歌曲,或者你进行人机交谈(这个就比较高级,需要让语音系统进行大数据自我学习,达到能够和人能正常交流),让我们一起展望未来吧。

文章中如有不足之处,欢迎补充交流,我们下期见

点赞 29
收藏 82

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。