1.1 一个由数字信息定义的时代
人类的经济发展史是一部信息分享的历史。和别的动物不同,千年以来,人类学会了收集、组织和储存大量复杂信息,并彼此分享。然而大千世界中,永远有人类难以收集的信息,或是缺失,或是不够精确,更不用说对这些信息进行处理并从中受益了。更复杂的,由于个人和企业是自利的,或有意或无意地,他们常常提供错误或不完整的信息。
为何信息分享如此重要?哈耶克对此有深刻的认识,他认为:“经济社会的首要问题,是利用好分散在个人手中的信息的问题。这是因为我们在决策场景中所必需的知识,从来不是以整体的方式存在,而是以不完整、甚至经常矛盾的方式散落在不同个体手中。”(哈耶克,1945)。他相信,推进信息分享是经济社会最重要的问题,攸关人类的经济福祉。
在理论界,过去的大半个世纪中,众多经济学家致力于研究信息的价值,并探索如何降低乃至消除信息分享的壁垒。1993年诺奖得主Douglas North认为:“协作的根本理论问题在于个人如何探知他人的偏好和行为模式”(North,1990)。在实践中,生产者越了解客户,就越能更好地服务客户。在美国,一百多年来,在每一个城市和小镇,每户家庭的基本个人信息,包括姓名、住址和电话,通过黄页的形式,都可以公开查阅到,其目的是为了帮助社会成员找到对方,促进个体与社会的连接。在医药和金融等领域,“了解你的客户”(knowing your customer,KYC)是用户获得高质量服务的前提,其中常常涉及隐私和敏感的个人信息。
信息之所以需要分享,还因为信息存在“不对称”的问题。在相互接触中,人们获得的常常是不同类型的信息。而双方往往不愿或无法可信有效地交换信息,因此,“不对称”的信息很难恢复“对称”。而信息不对称会降低经济效率,是影响市场交易效率的重要因素之一(Spence,1973,1974;Grossman and Stiglitz,1980);甚至,当信息不对称严重到一定程度,整个市场可能会就此消失(Akerlof,1970)。例如在劳动市场,缺乏有关工人能力以及企业用工需求的信息,会导致人力资源无法得到有效分配,现实表现就是失业和企业生产率低下(Phelps,1970;Pissarides,2000)。
这些思考让另外一位诺奖得主科斯推断,大部分经济活动,其背后的机制设计,本质上都是“为了降低交易成本,或弥补过高交易成本引发的交易失败,从而让个人可以自由地协商交易,并如哈耶克所言,受益于信息的扩散”。一方面,为了促进信息的收集和扩散,人类进行了诸多努力,设计不同的机制来减少交易成本。另一方面,当经济主体面临不充分或不对称信息时,我们设置不同的激励措施来鼓励主体之间进行协作(例如Hart,1988;Hart and Moore,1988;以及Holmström,1979,1982)。所以,在理论和实践中,人类社会都一直在致力于打破信息的牢笼,推进信息的交互。
20世纪40年代,克劳德·香农和阿兰·图灵的天才创想,将数据编码于“数字原子”中——今天被称为比特。自此,数据可以被数字化,现代信息科学就此滥觞。再加上新兴的半导体技术被大规模用于数据计算和储存,推动了数据的爆炸式增长。以至于到20世纪70年代,在各类文本中,“数据”一词的出现频率超越了“信息”一词。数字革命彻底改变了信息在社会和经济中扮演的角色。它一方面让信息获取前所未有地简单,人类使用信息并从中获益的难度大大降低,数据日益成为重要的生产要素。另一方面也加大了滥用信息的风险。
因为数据、信息、大数据等概念被频繁使用,在进一步论述之前,有必要建立对这些概念的共识。首先要注意的是,数据不等同于信息。数据是对事物的一系列观察,而“大数据”则是对大量“(小)数据”进行组合、存储和计算处理的过程。“数据科学”中很重要的步骤是“数据压缩”,即将大量数据集压缩成小规模,同时保留大部分有效信息的数据集,并将其转换成易于存储和解读的形式。信息是基于数据的洞见,所以信息的价值往往取决于需要回答什么问题,也就和具体的使用场景相关。
数据的广泛使用,引发了人们对三个问题的思考:我们如何在大数据时代保护个人隐私?数据应该归谁所有,以及该如何分配数据使用产生的福利和风险?大数据应用在多大程度上会带来“赢者通吃”的现象,从而阻止竞争,损害消费者和整个社会的利益?
这些是我们在本报告中尝试回答的主要问题。人类社会正处于一个关键的十字路口,一方面数据的重要性达到前所未有的高度,另一方面我们在如何治理,从而充分发挥数据的作用,并同时降低数据滥用的风险这些关键问题上,鲜有共识。要发挥数据的最大效用,需要我们更好地理解数据的本质,理解数据在真实世界是如何使用的,以及在治理数据时应该如何权衡取舍。为此,我们要区分事实和臆断、求真与恐惧。在数据时代更好地理解数据的经济学本质,或者说“数据经济学”正是本报告的主要课题。
数据经济学就是数字时代的信息经济学。本报告一方面汇聚了一批合著者,他们深刻理解信息的本质和价值,并因为对其的研究获得诺贝尔经济学奖;另一方面聚焦对“大数据”应用的详实证据,尝试用事实说话,评估“大数据”的真实影响。面对这样一个重要的话题,尊重事实而非臆测尤其重要。如同科斯(1994)所言,要远离纯粹的“黑板经济学”。他说:“我们需要更多的实证工作……一位充满灵感的理论家也许不需要,但是……灵感大多受到现象中的规律、悖论或异常现象的启发,而这些都依赖于系统的数据收集,尤其是,当我们的首要任务是打破固有的思维定式时。”