AI改变设计 : 人工智能时代的设计师生存手册
上QQ阅读APP看书,第一时间看更新

1.2 人机交互的发展历程

人工智能和人机交互的发展可以说是密不可分,相辅相成;但可能大家都很难想到的是,在60年前,人工智能和人机交互基本就是两大阵营,水火不容,我们来看看是怎么回事。

1.2.1 人工智能与智能增强

20世纪50年代,两位先后获得了图灵奖的学者在麻省理工学院见面,他们分别是马文·明斯基(Marvin Minsky)和格拉斯·恩格尔巴特(Douglas Engelbart)。明斯基曾组织并参与达特茅斯会议,他和约翰·麦卡锡(John McCarthy)一起创立了麻省理工学院人工智能研究室,被后人誉为“人工智能之父”;恩格尔巴特曾发明鼠标被誉为“鼠标之父”,他先后提出的邮件、超文本链接、视窗等概念对人机交互发展有着重大影响。听说他们见面后产生了以下争论:

明斯基:“我们要让机器变得智能,我们要让它们拥有意识。”

恩格尔巴特:“你要为机器做这些事?那你又打算为人类做些什么呢?”

其实两位图灵奖获得者来自计算机发展初期的两大阵营,明斯基代表的是人工智能(Artificial Intelligence,AI)阵营,目标是要创建一个智能机器来取代人类的认知功能和能力;恩格尔巴特代表的是智能增强(Intelligence Augmentation,IA)阵营,目标是要将智能机器用来扩展人类的认知功能和能力。两大阵营的最大矛盾在于设计的智能机器是否要基于“以人为本”,归根到底还是经济和伦理问题:智能机器是否会导致人类失业甚至活不下去。

从历史来看,科技的进步使人类的效率提高,导致部分人失业是一件非常正常的事情,但这次革新的科技将会是一款具备甚至超越人类能力的智能机器,而这个愿景可能会对人类和社会产生巨大的正面以及负面影响,所以引起了两个阵营的热烈争论。

其实AI和IA两个阵营做的研究都是使计算机更聪明,除了争论是否基于“以人为本”来设计机器外,最主要的矛盾其实是时间问题:机器拥有甚至超越人类的能力几时到来?人工智能阵营的约翰·麦卡锡认为取代人类的技术会在20世纪70年代实现,但由于技术瓶颈的限制,这个目标过了50年仍未实现。

所谓“当局者迷,旁观者清”,麦卡锡和恩格尔巴特的早期资助者约瑟夫·利克莱德(J.C.R.Licklider)认为:智能机器在达到甚至超越人类能力之前,需要处理好与人类的关系;人机交互是智能机器前进过程中的一个过渡阶段。

由于各种技术瓶颈的限制,研究人工智能的历程相当坎坷,AI阵营大大小小经历了两次寒冬,在某些年代他们基本抬不起头来。而IA阵营却不一样,基于恩格尔巴特提出的CoDIAK(Concurrent Development,Integration,and Application of Knowledge,对知识进行合作开发、集成和应用)概念框架的进一步延伸和拓展,人机交互技术得以快速发展。可以认为,计算机的几次革命和大规模普及都离不开于人机交互的改变和创新,人工智能也受益于这几次技术的变革。

1.2.2 人机交互发展的主要事件

1960年,约瑟夫·利克莱德设计了互联网的初期架构——以宽带通信线路连接的计算机网络,目的是实现信息存储、提取以及实现人机交互的功能,这个思想的创新性是继电话网络、电报网络、无线电网络之后,催生了以计算机联机为主的第四网络。同年,利克莱德提出了“人机共生”(Man-Machine Symbiosis)概念,被视为人机界面学的启蒙观点。

1962年,恩格尔巴特发表了论文《提升人类智能:一个概念性的框架》,呈现了依靠技术管理信息、帮助人们互相合作来解决世界经济和环境问题的蓝图。可以认为,后来人机交互阵营实现的各种技术例如视窗、鼠标、互联网,再到语音交互,基本停留在恩格尔巴特这个理论框架中。

1963年,计算机图形学之父伊凡·苏泽兰(Ivan Sutherland)在麻省理工的博士论文项目“画板”(Sketchpad)帮助图形、交互式计算向前大步迈进。

1964年,恩格尔巴特发明的鼠标极好地解决了人们在图形化计算机界面操纵屏幕元素的问题,为互动式计算奠定了基础,因此被IEEE列为计算机诞生50年来最重大的事件之一。

1965年,伊凡·苏泽兰提出了虚拟现实这个想法,被后人称为“VR之父”。三年后,他与鲍勃·斯普劳尔(Bob Sproull)合作开发了一台名为“达摩克利斯之剑”(Sword of Damocles)的原型机,这是世界上的第一款VR/AR HMD(head-mounted display)系统。虽然过重的达摩克利斯之剑只能镶嵌在天花板上,但VR/AR设备开始出现实物的雏形。

达摩克利斯之剑原型机

1968年,恩格尔巴特开发了世界上第一个标准化的编辑器NIB,并向1000多名全世界最顶尖的计算机精英进行展示,这次的展示包括了鼠标、多媒体和视频远程会议,展示效果轰动了全场。此外,恩格尔巴特还提出了超文本链接、电子邮件、电子出版、多窗口计算机显示器等概念,他的实验室为美国政府开发出ARPANet网络(即互联网的前身),硕果累累的他被誉为“计算机用户界面设计方案中提出最佳思路之人”。为了表彰恩格尔巴特在人机交互领域的开拓式贡献,恩格尔巴特在1997年获得了“计算机界的诺贝尔奖”——图灵奖。

1969年,在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业杂志《国际人机研究》(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。

1970年,相关学者成立了两个人机交互研究中心:一个是英国的Loughborough大学的HUSAT研究中心,另一个是美国施乐公司的Palo Alto研究中心(PARC)。

1973年,美国电报电话公司(AT&T)发明了一个新概念,名叫“蜂窝网络”(Cellular Network),它通过无线通道将终端和网络设备连接起来。同年,摩托罗拉实验室的领导者马丁·库帕(Martin Cooper)率先研发出推向民用的移动电话,被后人称为“移动电话之父”。手机的诞生意味着用户可以随时随地与朋友通信,为后续移动互联网埋下伏笔。

1973年,施乐PARC研究中心推出了世界上第一款拥有图形界面的Alto计算机,从此开启了计算机图形界面的新纪元,人机交互正式进入GUI(Graphical User Interface,图形用户界面)时代。

第一代图形界面

1983年,美国宇航局NASA开发了一款用于火星探测的虚拟环境视觉显示器VIVED VR,其作用是训练增强宇航员的临场感,使其在太空能够更好地工作。相比起“达摩克利斯之剑”,VR设备体积逐渐减小并能四处移动。

用于火星探测的虚拟环境视觉显示器VIVED VR

1990年,VR先行者杰伦·拉尼尔(Jaron Lanier)创办了VR公司VPL Research,面向民用市场推出了一系列VR设备,包括了VR手套Data Glove、VR头显Eye Phone、环绕音响系统AudioSphere、3D引擎Issac、VR操作系统Body Electric等。尽管技术不成熟、硬件成本高等一系列原因导致VR产品得不到市场的认可,但为未来的VR发展奠定了良好的理论基础。

Eye Phone和Data Glove

1980—1995年,苹果、IBM、微软等大公司相继推出自己的图形界面系统,最终微软推出的Windows 95赢得了大部分市场份额,微软从此走上帝国之路。

Windows 95使用界面

1992年,李开复博士在媒体上演示了一个名叫Casper的语音助理,这个语音助理实现了用语音直接输入文字,更改字号、字体,变换艺术字样式,打开/退出计算机程序,操作程序等功能。

1993年,苹果推出掌上计算机(PDA,个人数位助理)Apple Newton Messagepad,它能给用户带来触控屏、红外线、手写输入等一些颇具未来主义风格的人机交互功能。苹果前CEO约翰·斯考利(John Sculley)希望未来计算机也能够放到口袋,融入大世界中。同年,IBM公司在推出了Simon手机,它结合了手机和PDA的功能特点,并且首次内置了一块触摸屏,尽管早期触摸屏的触感实在是很差。

Apple Newton Messagepad

1997年,飞利浦公司推出数字化智能手机,能够无线接入电子邮件、互联网和传真。这意味着用户可以在户外随时随地接收网络信息,为移动互联网埋下伏笔。

1997年飞利浦推出的智能手机

1997年,哥伦比亚大学的斯蒂文·费恩纳(Steven Feiner)发布了世界第一个室外移动增强现实系统Touring Machine。这套系统包括一个带有完整方向追踪器的透视头戴式显示器;一个捆绑了计算机、DGPS和用于无线网络访问的数字无线电的背包;一台配有光笔和触控界面的手持式计算机。这意味着计算机从室内走向室外并实时获取真实空间信息。

The Touring Machine System

1999年,世界第一款AR开源工具ARToolKit问世了。这个开源工具由奈良先端科学技术学院(Nara Institute of Science and Technology)的加藤弘(Hirokazu Kato)开发,可以识别和追踪一个黑白的标记(Marker),并在黑白标记上显示3D图像。ARToolKit的出现使得AR技术不仅仅局限在专业的研究机构之中,许多普通程序员也都可以利用ARToolKit开发自己的AR应用。这意味着人机交互开始从二维界面转向三维空间。

ARToolKit和黑白标记

2000年,交互式语音应答(Interactive Voice Response,IVR)诞生,电话用户只要拨打移动运营商所指定号码,就可根据语音操作提示收听、点播或发送语音信息,以及使用聊天交友等互动式服务。一些银行、信用卡中心等商业机构也会通过IVR技术为电话用户提供自动化电话查询服务,例如户口余额查询、转账、更改密码。

2002年,手机和WAP技术逐渐成熟,更多的功能手机开始配备网页浏览器、电子邮件、摄像头和视频游戏等功能。当时最出名的Symbian操作系统被广泛应用在不同的功能手机上,为移动互联网奠定了良好基础。

Danger Hiptop

2004年,Web 2.0成为主流并提出了“应用软件构建在互联网”这个概念。Facebook、Youtube等社交、视频网站的相继推出,人们使用互联网的时间逐渐增多,人机交互正式进入互联网时代。这次变革意味着用户大部分数据都沉淀到每个大公司数据平台上,为人工智能发展奠定了基础。

2006年,日本游戏公司任天堂推出了新世代游戏机Wii,它比起其他游戏主机多了一个最具有创新性的硬件设备——Wii游戏手柄,它通过运动传感器简单识别玩家的手臂动作,大大提高了游戏的可玩性和互动性。

2007年,苹果公司首席执行官史蒂夫·乔布斯(Steve Jobs)在旧金山发布了iPhone和iOS。

2008年,Google发布了开源移动操作平台Android。iPhone和Android的多点触控和传感器概念彻底改变了手机的人机交互方式,逐渐完善的用户体验和不断增加的新功能使人们使用手机的时间越来越长。这次变革使人类每天产生的数据发生了爆炸性增长,人工智能即将回到人们的视野。

2009年,微软针对游戏主机Xbox 360推出了体感周边外设Kinect,它是一款3D体感摄影机,拥有即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能。玩家可以通过Kinect在游戏中跳舞或者运动,以及通过互联网和其他玩家进行语音互动。这意味着人类可以在三维空间里通过动作、手势和语音等方式与计算机进行交互。

2011年,苹果发布了语音助手Siri,随后几年里Google、亚马逊和百度相继发布了Google Assistant、Alexa和DuerosOS,语音交互时代已经来临。语音交互依赖于人工智能旗下的自然语言处理技术,这说明了新的人机交互变化也依赖于人工智能技术的成熟。

2012年,Google革命性产品Google Glass开始测试,它意味着增强现实和脱离双手操作的人机交互时代即将到来。可惜的是,Google Glass上市后在检验市场需求的同时也由于自身的诸多不足而遭遇了失败(2017年Google Glass项目重新启动并专注于企业行业应用)。

2013年:

(1)体感控制器制造公司Leap发布了体感控制器Leap Motion,它可以以超过每秒200帧的速度追踪全部10只手指,精度高达0.01毫米。这意味着人通过手势识别与计算机进行交互的精确度上升到一个新的高度。

Leap Motion

(2)加拿大创业公司Thalmic Labs推出了手势控制臂环MYO腕带。与其他通过相机技术追踪用户手势不一样的是,MYO是通过探测用户肌肉产生的电活动来感知用户的动作,官方声称MYO腕带对手势的捕捉速度非常快,有时候你甚至会觉得自己的手还没开始动MYO就已经感受到了。相比Kinect和Leap Motion,MYO的优势在于不受具体场地的限制,可以更自然、更直观地控制数字世界。随着成本的降低,通过电活动判断用户意图这项技术将会对下一轮人机交互变革带来巨大的影响。

MYO腕带

2014年:

(1)虚拟现实设备厂商Oculus被互联网巨头Facebook以20亿美元收购,随后三年索尼、谷歌、Facebook和HTC相继推出自己的虚拟现实设备PSVR、Daydream、Oculus Rift和Vive,特别一提的是Oculus的手柄Oculus Touch能够感知使用者的手指动作并在游戏中实现手势操作。沉寂了那么多年的虚拟现实终于迎来了爆发。

(2)中国公司柔宇科技发布了全球第一款国际业界最薄、厚度仅0.01毫米的全彩柔性显示屏,这项新的技术在未来会对具有屏幕设备的人机交互产生巨大影响。

柔宇全彩柔性显示屏

2015年,日本游戏公司任天堂推出了现象级AR手游Pokémon GO,微软发布了MR(Mix Reality,混合现实)眼镜Hololens,AR重新回到人们视野。

2016年:

(1)360°全景拍摄消费级相机开始涌入大众的视野,人们又多了一种记录美好瞬间的方式。除了以现有的图片、文字和小视频进行交互外,你还可以通过360°全景图片和视频等方式进行沟通和表达,更真实地还原事件和场景。这意味着VR和AR数据的积累速度会不断飙升。

(2)Google、索尼、Oculus、三星以及HTC等联合成立了全球虚拟现实协会(Global Virtual Reality Association,GVRA),目的是统一未来的VR行业规范,为虚拟现实软硬件开发和拓展打造一个健康、公平的行业环境。

2017年:

(1)日本索尼公司发布了智能触控投影仪SONY Xperia Touch,它可以在水平或垂直的表面上投射一个虚拟的屏幕并检测用户的触控手势命令。这意味着任意载体都有可能成为计算机的屏幕,与物联网整合说不定会发生不一样的化学反应。

SONY Xperia Touch

(2)2017年成为AR爆发的一年,苹果和Google相继推出ARKit和ARCore,AR领域最神秘、最受关注的创业公司Magic Leap发布了消费级AR眼镜Magic Leap One。从现有整理的资料来看,Magic Leap One将会是增强现实领域最重磅也是最具备革新的产品之一。深耕图像识别多年的Google发布了人工智能应用Google Lens,它能够实时识别用智能手机相机所拍摄的物品并提供与之相关的内容,这意味着AR中最重要的基础“识别万物”技术趋于成熟,以及基于现实空间的人机交互技术趋于成熟。

Magic Leap One

2018年:

(1)在Oculus Connect 5大会上,Facebook的CEO马克·扎克伯格(Mark Zuckerberg)发布了无线VR独立一体机Oculus Quest。这款独立VR设备将是第一款为头显设备和双手柄提供运动位置追踪的无线Oculus设备,其采用新的Oculus Insight技术可以在不放置任何传感器的情况下,准确获取用户及其周围环境的位置。

(2)柔宇科技发布了全球首款可折叠柔性屏手机FlexPai。用户可以通过自由折叠的方式,将屏幕在4.0英寸和7.8英寸自由切换,既能方便携带,又能满足办公、影音娱乐等场景下大屏操作的需求,解决了“怎样在满足大屏的同时还能控制产品的体积”这个问题。同时,由于柔性屏可以在空间z轴上发生变化,意味着未来屏幕的人机交互和信息传递可以在空间的z轴上进行,遐想空间非常巨大。

可折叠柔性屏手机FlexPai

可以从以上人机交互的发展历程了解到,在计算机发展前中期,人机交互的改变使用户产生数据的速度不断加快,这直接影响到人工智能的发展;到了2013年深度学习算法在语音和图像识别方面获得突破性进展后,人工智能开始反哺人机交互的发展,这说明人工智能和以人机交互为代表的智能增强的关系是密不可分的。现在已经很少有人谈及以往人工智能和智能增强的区别,“人工智能”这个名词逐渐成为主流。

很多专家学者对第三次人工智能浪潮给予了肯定,认为这次人工智能浪潮能引起第四次工业革命。人工智能逐渐开始在保险、金融等领域渗透,在未来,从健康医疗、交通出行、销售消费、金融服务、媒介娱乐、生产制造,到能源、石油、农业、政府等所有垂直产业都将因人工智能技术的发展而受益。

那么,这次人工智能再次爆发的原因是什么?