第2章 网络AI
2.1 人工智能发展简析
人工智能(Artificial Intelligence,AI)已经成为人类社会经济和社会发展的重要支撑技术,成为推动人类进入智能时代的决定性力量,是引领新一轮科技革命、产业和社会变革的战略性技术。让机器能够像人一样思考、感受和认识世界,是人工智能科学家们孜孜以求的终极目标。算法、算力、数据规模的迅速提升,让面向特定任务的人工智能技术迎来爆发式发展。目标检测与识别、人机对弈、无人驾驶等技术实现了前所未有的突破,在局部智能水平的单项测试中甚至超越人类。
2.1.1 人工智能现状
人工智能是研究人类智能行为规律(例如,学习、计算、推理、思考、规划等),构造具有一定智慧能力的人工系统,以完成往常需要人类的智慧才能胜任的工作。这是人工智能领域的先驱、麻省理工学院计算机科学家帕特里克·亨利·温斯顿(Patrick Henry Winston)教授在《人工智能》一书中对人工智能的定义。“人工智能”一词虽然在近些年来得到了社会各界的广泛关注,但不是一个新的术语,而是经过数十年起起落落发展的研究领域。
人工智能发展简史示意如图2-1所示。图2-1从多个维度展示了人工智能发展的历史。当前,全球人工智能正处于第三次发展浪潮之中,得益于硬件水平发展的支撑,以及机器学习和深度学习方面取得的新突破,人工智能重新崛起。
2016年,AlphaGo(阿尔法狗)战胜围棋世界冠军李世石,这一次的人机对弈让人工智能正式被世人熟知,整个人工智能市场也像是被引燃了导火线,开始新一轮爆发。在此之后,人工智能取得了诸多引人瞩目的、显著的、突破性的成就。2017年,谷歌DeepMind团队的新成果AlphaZero在没有学习过任何棋谱的情况下,只是靠给定的围棋规则,通过自身的深度学习,推演出高明的走法,以100:0的成绩完胜AlphaGo。如果说,AlphaGo是计算智能阶段的标志,即证明在计算智能领域,机器能完全战胜人类,那么AlphaZero标志着人工智能已经迈上了历史的新阶段——认知智能。
图2-1 人工智能发展简史示意
2020年5月,人工智能实验室OpenAI发布了迄今为止全球规模最大的预训练语言模型——第三代通用预训练转换器(General Pre-trained Transformer-3,GPT-3)。GPT-3具有1750亿个参数,训练所用的数据量达到45TB。对于所有任务,应用GPT-3无须任何梯度的更新或微调,仅需要与模型文本交互,为其指定任务和展示少量演示即可使其完成任务。GPT-3在许多自然语言处理数据集上具有出色的性能,包括翻译、问答和文本填空任务,还包括一些需要即时推理或领域自适应的任务等,已在很多实际任务中大幅接近人类水平。
2020年11月,DeepMind公司的AlphaFold2人工智能系统在第14届国际蛋白质结构预测竞赛中取得桂冠。AlphaFold2能够精确地基于氨基酸序列,预测蛋白质的三维结构,其准确性可以与使用冷冻电子显微镜、核磁共振或X射线晶体学等实验技术解析的蛋白质的三维结构相媲美,有史以来首次把蛋白质结构预测任务做到了基本接近实用的水平。
近年来,人工智能的繁荣得益于3个主要驱动力。第一,特征降维、人工神经网络(Artificial Neural Network,ANN)、概率图形模型、强化学习和元学习等方面的新理论和新技术层出不穷,在学术和工业领域都取得了较大突破。第二,计算能力的进步使许多计算资源消耗型机器学习算法可以大规模普及。第三,在大数据时代,海量数据资源可以让机器学习模型泛化能力更强。尤其是深度学习技术可以使我们能够从更多的数据中构建合理的人工智能模型,让机器发挥更大的潜力,也让各种任务取得更好的结果。深度学习极大地改变了人们的生活,并重塑了传统的人工智能技术,人工智能理论建模、技术创新、软硬件发展等方面要素整体推进。
通过分析挖掘,《麻省理工科技评论》评选出“十大突破性技术”。其中,2013——2020年重大人工智能技术创新汇总见表2-1。
表2-12013——2020年重大人工智能技术创新汇总
当前,人工智能的发展仍处于“弱”人工智能阶段,只具备在特定领域模拟人类的能力,“工具性”仍是该阶段的主要特点,与全面模拟或者超越人类能力的强人工智能、超人工智能差距巨大。Gartner公司发布的人工智能技术成熟度曲线如图2-2所示。目前,已成熟应用的AI技术主要是语音识别,下一代即将步入生产成熟的AI技术是机器学习、计算机视觉、深度神经网络及其专用芯片、决策智能和增强智能。强化学习、自然语言处理、知识图谱、智能机器人、数字伦理等AI技术还处于研究发展中,距离生产成熟至少还需要5~10年。距离生产成熟还很遥远的技术是通用人工智能、无人驾驶汽车。通用人工智能也被称为“强人工智能”。无人驾驶虽然已经处于公开路测阶段,但是该技术的成熟应用受制于传感器技术成本高、计算能力难以应对复杂多变的现实路况等因素,可能在10年后规模成熟应用。
图2-2 Gartner公司发布的人工智能技术成熟度曲线
2.1.2 人工智能生态
目前,人工智能的产业链愈发成熟与丰富。人工智能的产业生态是典型的分层结构,一般分为基础层、技术层和应用层。人工智能产业链示意如图2-3所示。
1. 基础层
基础层主要涉及数据的收集与运算,包括AI芯片、智能传感器、大数据与云计算等。其中,智能传感器和大数据主要负责收集数据,AI芯片和云计算负责数据的运算。
芯片作为算力基础设施,是推动人工智能产业发展的动力源泉。随着人工智能算法的发展,视频图像解析、语音识别等细分领域的算力需求呈爆发式增长,通用芯片已经无法满足需求。而针对不同领域推出的专用芯片,既能够提供充足的算力,也可以满足低功耗和高可靠性要求。例如,华为、寒武纪、中星微等企业推出的推理芯片产品,可用于智能终端、智能安防、自动驾驶等领域,可以加速大规模计算,从而满足更高的算力需求。
图2-3 人工智能产业链示意
2. 技术层
技术层主要智能处理数据的挖掘、学习,是连接基础层与应用层的桥梁,是人工智能行业发展的核心。技术层包括机器学习、类脑智能计算、计算机视觉、自然语言处理、智能语音、生物特征识别等。
人工智能深度学习框架实现了对算法的封装。随着人工智能的发展,各种深度学习框架不断涌现。谷歌、微软、亚马逊和Meta(Facebook公司自2021年10月28日起使用的新名称,本书为了方便读者阅读,后文继续使用Facebook)等头部公司,推出了TensorFlow、CNTK、MXNet、PyTorch和Caffe2等深度学习框架,并广泛应用。此外,谷歌、OpenAI Lab、Facebook还推出了TensorFlowLite、Tengine和QNNPACK等轻量级深度学习框架。
近年来,国内也涌现出多个深度学习框架。百度、华为推出了PaddlePaddle(飞桨)、MindSpore,中科院计算所、复旦大学研制了Seetaface、FudanNLP。小米、腾讯、百度、阿里推出了MACE、NCNN、Paddle Lite、MNN等轻量级深度学习框架。虽然国内深度学习框架在全球占据了一席之地,但是美国的TensorFlow和PyTorch仍是主流。
3. 应用层
应用层是建立在基础层与技术层的基础上,将人工智能技术进行商业化应用,实现技术与行业融合发展,以及不同场景的应用。人工智能与传统产业的融合不仅提高了产业发展的效率,还实现产业的升级换代,形成新业态,构建新的创新生态圈,催生新的经济增长点。人工智能在智能制造、智能家居、智能交通、智能医疗、教育、金融等领域的应用,呈现全方位爆发态势。但是在应用层面发展结构性失衡问题仍然突出。受行业监管和盈利条件的限制,人工智能的行业应用程度和发展前景存在显著差异。
我国人工智能市场潜力巨大,应用空间广阔,尤其是在数据规模和产品创新能力等方面占据优势。另外,5G商用后,人工智能与行业深度融合并逐步深入复杂场景,推动更多行业进入智能化阶段。
2.1.3 人工智能发展
1. 政策层面
为了在新一轮国际科技竞争中掌握主导权,我国加快人工智能行业布局与规划,先后出台了《新一代人工智能发展规划》《促进新一代人工智能产业发展三年行动计划(2018——2020年)》《关于促进人工智能和实体经济深度融合的指导意见》《关于“双一流”建设高校促进学科融合加快人工智能领域研究生培养的若干意见》等重要文件,以加强人工智能领域标准化顶层设计,推动人工智能产业技术研发和标准制定,促进产业健康可持续发展。2020年7月,国家标准化管理委员会、中共中央网络安全和信息化委员会、国家发展和改革委员会、科学技术部、工业和信息化部联合印发《国家新一代人工智能标准体系建设指南》,形成标准引领人工智能产业发展的新格局。近年来,中国人工智能发展重要支持政策如图2-4所示。
图2-4 中国人工智能发展重要支持政策
美国在全球人工智能领域率先布局,以《为未来人工智能做好准备》《美国人工智能研究与发展策略规划》《人工智能、自动化及经济》与《美国人工智能倡议》四大政策文件为基础,形成从技术、经济、伦理、政策等多个维度指导行业发展的完整体系。2021年1月,美国国家标准协会发布《美国标准化战略2020》,进一步关注人工智能标准。
欧盟委员会于2018年发布了《欧盟人工智能战略》,推动欧盟人工智能领域的技术研发、道德规范制定,以及投资规划。2021年2月,欧洲标准化委员会和欧洲电工标准化委员会发布《欧洲标准化战略2030》提出制定人工智能领域的先进创新标准。2021年4月,欧盟委员会联合研究中心发布《人工智能标准化格局——进展情况及与人工智能监管框架提案的关系》,通过制定国际、欧洲标准来支撑人工智能监管。
2. 技术发展
结合人工智能的发展现状,人工智能下一个10年重点发展的方向包括强化学习、神经形态硬件、知识图谱、智能机器人、可解释人工智能、数字伦理、自然语言处理等技术。这些技术处于期望膨胀期,表明人们对AI最大的期待,达到稳定期需要5~10年,是人工智能未来10年的重点发展方向。
强化学习(Reinforement Learning):主要用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
神经形态硬件(Neuromorphic Hardware):旨在用与传统硬件完全不同的方式处理信息,通过模仿人脑构造来大幅提高计算机的思维能力与反应能力。
知识图谱(Knowledge Graphics):要实现真正的类人智能,机器还需要掌握大量的常识性知识,以人的思维模式和知识结构来进行语言理解、视觉场景解析和决策分析。
智能机器人(Intelligent Robot):智能机器人需要具备3个基本要素,即感觉要素、思考要素和反应要素。感觉要素是利用传感器感受内部和外部信息,例如,视觉、听觉、触觉等;思考要素是根据感觉要素所得到的信息,思考采用什么样的动作;反应要素是对外界做出反应性动作。
可解释人工智能(Explainable AI):虽然深度学习算法在语音识别、计算机视觉、自然语言处理等领域取得令人印象深刻的性能,但是它们在透明度和可解释性方面仍存在局限性。
数字伦理(Digital Ethics):作为新一轮科技革命和产业变革的重要驱动力,人工智能已上升为国家战略,人工智能将会在未来几十年对人类社会产生巨大影响。
自然语言处理(Nature Language Processing):对自然语言的深度理解需要从字面意义跃迁到言外之意,建立知识获取与语言处理双向驱动的方法体系,实现真正的语言与知识智能理解。
3. 面临挑战
人工智能的发展面临诸多安全和伦理方面的挑战。安全挑战主要包括3个方面:一是人工智能可以替代体力劳动和脑力劳动,相应的岗位替代作用影响着人类的就业安全;二是建立在大数据和深度学习基础上的人工智能技术需要海量数据来学习训练算法,容易带来数据盗用、信息泄露和个人隐私被侵害的风险,如果许多个人信息被非法利用,则会构成对个人隐私权的侵犯;三是人工智能具有强大的数据收集、分析及信息生成能力,可以生成和仿造很多东西,甚至包括人类自身。随之而生的虚假信息、欺诈信息不仅会侵蚀社会的诚信体系,还会对国家的政治安全、经济安全和社会稳定带来负面影响。
人工智能领域应用最广泛的算法是机器学习和深度学习。从宏观来看,算法是人工智能的重要组成部分,而深度学习是近年来发展最快速的机器学习算法,因其在计算机视觉、自然语言处理等领域中的优异表现,大幅加快人工智能应用的落地速度,催生了很多相关工具和平台。然而,机器学习和深度学习算法虽然在人工智能领域取得了显著成绩,但是受限于底层算法,人工智能技术目前已经触及天花板。尤其是深度学习计算所需的数据量巨大,对算力要求极高,在已经固化的硬件加速器上无法得到很好的支持,需要解决性能和灵活度之间的平衡问题。