第1章 深度学习介绍
1-1 人工智能历经的三波浪潮
人工智能(Artificial Intelligence, AI)并非近几年才兴起,其实目前是它的第三波热潮,前两波都发展十余年后,由于一些因素而衰退,而最近这一波热潮延续至今也十年了,会不会高点已过又将走向谷底呢?要回答这问题,我们需要知道过去学者在研究上有了哪些突破与成果,以及导致前两次发展衰退的原因,所以先重点回顾一下近代AI发展史。
图1.1 人工智能的三波浪潮
(1)1956年达特茅斯(Dartmouth)学院举办AI会议,确立第一波浪潮的开始。
(2)1957年Frank Rosenblatt创建感知器(Perceptron),即简易的神经网络,可惜当时还无法解决复杂多层的神经网络,直至20世纪80年代才想出解决办法。
(3)1969年美国国防部(DARPA)基于投资报酬率过低的理由,决定缩减AI研究经费,AI迈入第一波寒冬。
(4)1980年专家系统(Expert System)兴起,企图将各行各业专家的内隐知识外显为一条条的规则,从而建立起专家系统,不过因不切实际,且需要使用大型且昂贵的计算机设备才能够建构相关系统,故而发展受挫。又不巧适逢个人计算机(PC)流行,相较之下,AI的发展势头就被掩盖下去了,至此,AI迈入第二波寒冬。
(5)2012年多伦多大学Geoffrey Hinton研发团队利用分布式计算环境及大量影像数据,结合过往的神经网络知识,开发了AlexNet神经网络,并参加ImageNet影像辨识大赛,结果一下子把错误率降低了十几个百分点,就此AI第三波浪潮兴起,至今方兴未艾。
回到前面的问题上,第三波热潮算下来也有十年的时间了,会不会又将迈入寒冬呢?其实仔细观察会发现,这波热潮相较于前两波,具备了以下几项优势。
(1)基础功能架构较好,从影像、语音、文字辨识开始,再逐步往上构建各种的应用,例如自动驾驶(Self-Driving)、对话机器人(ChatBot)、机器人(Robot)、智慧医疗、智慧城市等,这种由下往上的发展方式比较扎实。
(2)硬件的快速发展。
①遵循摩尔定律快速发展:IC上可容纳的晶体管数目,约每隔18个月至两年便会增加一倍,简单来说,就是CPU每隔两年便会增快一倍。过去50年均循此定律发展,此定律在未来十年也应该会继续适用,之后或许量子计算机(Quantum Computer)等新科技会继续接棒,它号称目前计算机要计算几百年的工作,量子计算机只需30分钟就搞定了,如果成真,到那时可能又是另一番光景了。
②云端数据中心的建立:各大IT公司在世界各地兴建大型的数据中心,收费模式采取“用多少付多少”(Pay as you go)。由于模型训练时,通常需要大量运算,如果改用云端方案的话,一般企业就不须在前期购买昂贵设备,仅须支付必要的运算费用,也免去冗长的采购流程,只要几分钟就可以开通(Provisioning)所需设备,省钱省时。
③GPU/ NPU的开发:深度学习主要是以矩阵运算为主,而GPU在这方面的运算能力比CPU快非常多倍,所以专门生产GPU的美国公司英伟达(NVIDIA)备受瞩目,市值甚至超越Intel[1]。当然其他硬件及系统厂商不会错失如此庞大的商机,纷纷积极抢食这块大饼,所以各种NPU(Neural-network Processing Unit)或xPU相继推出,使得指令周期越来越快,故而模型训练的时间能够大幅缩短,由于模型调试通常需要反复训练,所以能在短时间内得到答案的话,对数据科学家而言会是一大福音。另外,连接现场装置的计算机(Raspberry pi、Jetson Nano、Auduino等)体积越来越小,运算能力也越来越强,对于“边缘运算”也有很大的帮助,例如路口监视器、无人机等。
(3)算法推陈出新:计算能力提高后,许多无法在短时间完成训练的算法一一解封,尤其是神经网络,现在已经能够建构上百层的模型,包含高达上兆个参数,并且成功在短时间内调试出最佳模型,因此,模型设计就可以更复杂,算法逻辑也能更加完备。
(4)大量数据的搜集及标注(Labeling):人工智能必须依赖大量数据,来让计算机学习,从中挖掘知识,近年来因因特网(Internet)及手机(Mobile)的盛行,企业除了通过社群媒体搜集大量数据之外,还可由物联网(IoT)的传感器产生源源不断的数据作为深度学习的养分(训练数据),又加上这些大型网络公司的资金充足,只要雇用大量人力进行数据标注,来确保数据的质量,就能使得训练出来的模型越趋精准。
综合上述趋势发展所提供的迹象,与前两波相比,第三波热潮中AI研究成果已有一定程度的积累,硬件的发展也跟上了理论的脚步,而且大环境的支持也相对成熟,所以笔者推测目前这波热潮在短期内应该可以乐观对待。