对话式交互与图形用户界面:优缺点、技术驱动及应用场景的全面比较

   日期:2024-07-23     来源:网络整理    作者:二手钢材网    浏览:202    评论:0    
核心提示:导致很多人认为对话形式(Chat)交互相对于常见的图形化界面是一种进步。以上是对话式交互的6大缺点。对话式交互很直观,用户无需学习复杂的界面或命令,可以直接用自己的语言与系统交流。就像功能点非常多产品里面我们经常找不到需要的功能在哪里一样,对话式交互没有这个问题,因为不需要在复杂的界面中寻找。

近两年,很多AI产品都采用了对话(Chat)的形式,这导致很多人认为对话式交互是对普通图形界面的改进,其实不然。

这种误解或许源于人们将AI技术等同于对话式交互,而当看到AI技术的快速发展时,人们也认为对话式交互更优。

但这种交互形式被很多AI产品采用,只是因为这波AI最大的技术进步就是大语言模型,大语言模型的核心功能之一就是生成内容,而且这种形式最早被使用,后来也被沿用。

2017年左右的上一波AI浪潮,主要的技术发展方向是计算机视觉,人脸识别、自动驾驶、OCR等都源自计算机视觉技术。

由于其技术突破不在语言方向,所以并没有产生对话形式,由此可见对话交互只是一种附属形式,并不是一种优越形式。

1、对话式交互相对于图形界面有哪些缺点?

1. 运营效率

GUI的操作过程其实就是眼睛、手、预设信息的配合,眼睛瞄准,手点击,预设信息触发相应操作,但在Chat形式下,几乎完全依赖手,因此操作效率降低。

事实上,很多在图形界面上点击几下就能解决的问题,在对话形式下可能需要多轮、多次描述才能完成,比如典型的外卖订餐场景:

使用图形界面是这样的:

图形交互界面何时提出_交互界面优缺点分析_

对于 4 种不同的设置,只需点击 4 次,但如果您使用聊天,它可能是这样的:

系统:您要大杯的还是小杯的?

用户: 大杯

系统:零卡路里糖还是蔗糖?

用户:0卡路里

系统:常糖还是半糖?

用户:普通糖

系统:热、温还是冰?

用户:热门

可以看出一个在图形界面上点击4次就能完成的操作,需要经过好几轮对话才能完成,整体效率很低,这个表单也很实在,如果不通过手机下单而是直接到店下单,店员确实需要问所有这些问题。

不过 Chat 表单在所有场景下的效率并不比 GUI 表单低。比如用手机语音助手创建日程表时,可以直接用语音下达指令:明天下午三点提醒我抢火车票,而不用打开待办事项 app-点击创建待办按钮-输入待办事项各个字段的文字-点击保存。

交互界面优缺点分析_图形交互界面何时提出_

因此还是有一个临界值,需要从点击次数、路径长度、流失程度、沟通渠道场景等多方面综合衡量。

Chat格式的每一次交互都包含操作+对象+修改内容的具体描述。比如修改代码时需要给出指令:将登​​录按钮的宽度增加到500PX。在GUI交互中需要用自然语言来描述修改方式、修改对象、修改值等,这会降低操作效率。

2. 操作模糊性

由于操作过程完全依赖自然语言的描述,当用户输入的文字不准确、有错别字、有多重含义时,可能会产生不正确的结果,用户输入的准确率较低。

一旦出现错误,就需要额外进行一轮对话来澄清,这进一步影响了运营效率。

例如,用户想搜索“苹果的营养价值”,却不小心输入了“……”,AI可能会将“”理解为一个不常见的词或者不存在的词,从而无法提供正确的苹果营养信息,或者给出不符合用户预期的结果。

这是因为“apple”是常用词,但“”可能不是,导致AI无法正确理解用户的查询意图。

同样,笔者的真实经历是,在电商平台上搜索“苹果”,显示一堆手机,但笔者其实想买几个红富士苹果,这个问题在多义词的对话式交互中很容易出现。

当然,我们可以通过提供更加完整的描述来避免误解,但是输入更加完整的描述本身就意味着更高的运营成本。

3. 自我描述能力

GUI 格式会直接在用户界面体现产品的能力,比如搜索框、时间选择器、下载等能力。Chat 格式最大的问题是需要用户能够想到,这一步将产品设计从要求产品变成了要求用户,对产品清晰度影响较大。

图形交互界面何时提出__交互界面优缺点分析

下图中,用户可以清楚的知道某一条笔记是可以导出的,而且可以导出多种格式,但是Chat这种形式,需要用户自己先考虑清楚。

4. 用户习惯

工具需要细分,手指甲剪脚趾甲剪都要细分,更别提各种大需求了,微信可以打车,滴滴APP还有几亿的日活。

打破用户习惯不是不可以,但是新方案的体验一定比老方案的体验+迁移成本要好。

人类会按照自己习惯的方式去解决问题,路径依赖会影响人们在拥有多种工具时的选择,而GUI在过去10年中已经为用户形成了极其强大的操作习惯。

生活中一些潜意识的习惯也会有影响,比如两个人聊天的时候,往往不会就一个话题进行多轮对话,可能会同时有两三个话题,这时候AI理解起来就会比较困难(因为会出现与上下文无关的句子)。

在使用多个模型/提示词/代理的产品中这个问题可能更加明显,因为当用户在对话过程中切换话题时,不确定是否可以立即切换到其他模型/提示词/代理来回答。

5. 能力提炼

尽管模型能力越来越强大,但很难想象如果把所有应用放在一起会是什么样子。分类是人类处理任务/信息的方式,由人脑的生理结构决定。“一体化”工具是一个伪命题。

现在的通用聊天大多可以用来写代码、画表格,但是通用的效果肯定不够精细,切分能力也不够强。

以绘制表格为例,一般可以快速将数据填入表格,但不一定能将某一行固定下来,更复杂的科学计算公式也无法实现。

以WPS为例,它的功能非常丰富,需要使用十几个标签+每个标签下几十个子功能来呈现。

很难想象使用通用工具如何能帮助用户达到这些功能,而且这只是WPS中的一个功能点,所以笔者坚信全能工具产品是一个伪命题。追求通用工具必然导致细化能力的不足,就像我们设计师常用的设计规范一样,在追求通用性的时候,在不同业务场景下的个性化能力就会被削弱。

6. 多语言适配

图形用户界面在面对产品国际化、多语言适配问题时,只需要翻译界面中出现的文字即可,部分文字可以用图标代替,具有更强的通用性。

但大型模型在输入和输出中都会用到大量的文本,所以能否很好地支持多种语言是一个问题。

对于一些小众语言来说,可能没有足够的数据进行模型训练,模型提供高质量服务的可能性就更小了。

以上就是对话式交互的六大弊端,我们来简单说一下

2.对话式交互的优势

1.易学性

对话式交互非常直观,用户不需要学习复杂的界面或命令,直接用自己的语言与系统沟通即可。就像我们经常在功能很多的产品中找不到需要的功能一样,对话式交互不存在这个问题,因为它不需要在复杂的界面中寻找。但用户还是需要有【这个产品用到这个功能】的知识。

图形交互界面何时提出_交互界面优缺点分析_

2.灵活性

用户可以通过对话的方式表达复杂的命令,比如手机语音助手只需要一句话就可以创建待办事项列表。不过要注意的是,这里说的“复杂命令”并非“复杂命令”,后者只能解决多步问题,每一步都比较简单。

在图形用户界面中,用户只能点击当前显示的元素(如按钮),操作依赖于屏幕的显示范围。而对话式交互不存在这个问题,因为已经用[描述]替代了必须显示在屏幕上的功能。

3.设备适应性强

对话式交互可以很方便的融入到移动设备、智能音箱或者其他IoT设备中,只要设备有麦克风、扬声器、处理器,就可以满足基本的对话式交互(具体来说是语音交互),降低了设备中屏幕的成本。

这方面已经有很多例子,比如小米的智能音箱、商场的服务机器人等。

4.可扩展性

新功能和服务的添加不需要用户下载更新或学习新的交互方式,因为没有了图形界面的限制,添加功能时无需考虑界面显示能力,也不用像GUI时代那样争抢有限的入口。

但这也会带来暴露的问题,因为功能的扩展对于用户来说是一个不可见的过程,即便使用新版功能指南,用户也只能看到一次(事实上有很大概率一次都看不到,会点击关闭)。

与GUI不同,它没有固定的显示位置,可以经常被用户看到。

专栏作家

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2