AI能送给视障人士一双“黑色的眼睛”吗?
被传唱一时的《你是我的眼》,其原唱者萧煌奇是一位视障人士,在失明的人生中,他一直保持乐观态度,热爱音乐与创作,一首以自己为原型的《你是我的眼》横空出世,给所有黑暗中的视障人士带来了鼓励与温暖。
你能想象吗?有一天,视障人士可能会深情款款地对AI唱起“你是我的眼/带我领略四季的变化/你是我的眼/带我阅读浩瀚的书海……”
当AI要承担起“眼睛”这个角色时,如何才能将这个世界带到视障人士的面前呢?利用高科技来“作眼”,又是否符合视障人士的真正需求?
从“感知”到“看见”:层出不穷的助视产品
不得不说,科技公司在推进前沿技术的同时,一直没有忘记对视障人士的关怀。一大批助力视障人士的产品和技术如雨后春笋般涌现,这些产品中流露的温情不仅体现了企业对视障人士的关怀,也是科技公司最好的品牌广告。
在梳理了各类与视障有关的智能产品后,我们大致将其分为以下3种类型。
1.曲线救国型
大家还记得海伦·凯勒的故事吗?海伦·凯勒的老师在教她认“water”时,让她伸出一只手去感知水的流动,并在她的另一只手上拼写了这个单词。从这里可以看出,视障人士认知世界的渠道是除了视觉的其他感官感觉,如听觉、嗅觉和触觉。
基于此,一家公司开发了一款专供视障人士使用的盲文智能手表(Dot Watch)。该手表搭载了盲文显示系统,以盲文的形式将各种信息呈现在手表的触摸表盘中。
相机也有了触摸形式。一位美国设计师专门为视障人士设计了一款2C3D相机,这款相机能通过镜头实时地将拍摄的物体转换成三维触感数据,使视障人士通过触摸屏幕表面生成的立体形状来识别面部细节,如读取表情等。
IBM推出了无障碍环境的一项发明——专为视障人士设计的新型导航App NavCog。NavCog可通过耳机与视障人士“耳语”,帮助其实时识别位置、朝向,还能辨认迎面走来的熟人。
2.外力加持型
外力加持型的载体一般是智能眼睛,主要是为视障人士打造的。
一款名为eSight的产品,结合算法和部分视障人士自身的需要,通过控制器中的液体镜头技术进行“聚焦”,视障人士利用眼镜中的Bioptic倾斜功能,不仅可以调整瞳孔距离(对焦),还可以调整图像的清晰度(颜色、对比度、亮度),从而“重获光明”。
3.直截了当型
视觉的产生依赖于三大组织器官:眼球(主要为视网膜)、视神经、视皮层。对于视障人士而言,如果想要恢复视觉,就必须拥有能替代这三种组织的假体,即视网膜假体、视神经假体和视皮层假体。
国内就有研究团队研制出了人造视网膜,其由体内电子微系统和体外电子系统两部分组成。使用方法是在视障人士眼球内部植入IC芯片,用来接收信息和传导电信号,然后为视障人士配备一个体外接收系统,如眼镜。
“眼前的黑不是黑,你说的白是什么白”
虽然现在的智能助视产品比比皆是,但要真的掀开视障人士眼前的“帘子”,恐怕还不容易。
人造视网膜技术具有很强的综合性和复杂性,需要机器视觉、IC设计、半导体工艺、纳米技术、神经科学、生物材料等十多个学科的科学家和工程师全力投入,密切配合。但即便拥有如此高精尖的团队,外界信息通过电信号传递到大脑中,视障人士感受到的也不过是一个灰色的、带有马赛克的世界。
即使是黑白的“渣像素”,也能勉强算“看见”了。而那些智能产品,如智能眼镜、认知助手等,只能提供语音让视障人士接收到相应信息。视障人士能做的就是在这些产品说“前面有障碍物,请绕过去”时无奈绕开,而不能亲眼看看阻拦自己的障碍物究竟是一块石头还是一辆单车。
当我们不断加大视障人士在其他感官上接受的信息量时,这也会带来不小的隐患。例如,从听觉入手的产品往往会让使用者戴上耳机,这就会让视障人士与周围的声音隔绝,出行在外,容易造成危险,而不戴上耳机进行电子播报,容易造成视障人士的信息外泄。
当我们将智能产品应用在视障人士身上时,除了要为他们带来生活上的便利,更要让他们看到这个美丽的世界,无障碍地探索这个世界。当我们用一种以其他感官来辅助视觉的技术思路来实现客观上的无障碍时,肯定会与视障人士主观上的无障碍有区别。
智能眼镜戴久了,人们或多或少都会产生不适感。想想我们在电影院看3D电影的时候,3D眼镜也曾让我们头晕目眩,沉浸式技术也极容易带来头晕、恶心等反应。除此之外,戴智能眼镜限制了侧面周边的视觉范围,视障人士要做到和正常人一样的移动和工作还并不容易。
要真正为视障人士带来便利,必须解决这些智能助视产品成本太高、价格太贵的问题。由于致盲因素不同,很多视障人士需要高度个性化定制的智能产品,这更加导致成本居高不下。例如,加拿大一家医疗科技公司Ocumentics在2018年开发的仿生镜片只适合25岁以上的成年人。
看得见,要以什么为标准?
归根结底,不管智能产品有多炫目,对视障人士而言,他们更在乎智能产品的实用性,而真正实用的产品于他们而言就是3个字——看得见。
仿生眼球当然具有很大的市场,但它并不适用于所有眼科疾病。智能眼镜+芯片的组合是可以通用的,因为其视觉计算能力、人脸识别等功能可以使其接收外界信息,芯片通过柔性电极阵列来传输电信号,刺激视网膜的神经细胞,进而传递到大脑中,让视障人士看见黑白的影像。
但对于市场来说,“通用的”就不具有特殊性了,所以,谁能快速抓住“通用”中的亮点及最不易解决的问题,谁就能在助视方面成为佼佼者。
神经科学家认为“人脸识别”有两个方面。其一是特征识别,也是目前的智能眼镜配备的识别类型,其二是表情识别。经过亿万年的进化,人类形成了7种与情绪密切相关的基本表情,分别是快乐、惊奇、悲伤、愤怒、厌恶、轻视和恐惧。这些基本表情是人的本能,是不需要学习的。
目前,我们还不太清楚脸部特征与表情之间的区别。当看到一个人时,我们大脑里的人脸识别机制就会开始运作,我们会在一瞬间就判断出这张脸是不是熟面孔,以及这个人的表情如何。但这对于视障人士来说却难如登天。
所以,让AI来帮助视障人士看到人的表情或许是智能助视产品在人脸识别上的真正战场。这不仅需要AI去识别更细微的脸部特征,而且还需要AI为视障人士获得更加清晰的图案,而不是一个模糊的影像。
英国《柳叶刀·全球卫生》的一份研究报告预计,当下全球视障人士数量为3600万,如果不加强对眼疾的治疗,到2050年视障人士数量将增至1.15亿。这是一个足够惊人的数据,而借助技术的力量,我们希望每一个在生活中艰难独行的视障人士,不论他们的年龄大小、环境状况如何、贫穷或富有,他们都能看到我们的美丽世界。