数学、模型与经济思想
作者:
洪永淼(康奈尔大学经济学系、统计学与数据科学系、厦门大学王亚南经济研究院与邹至庄经济研究中心)
汪寿阳(中国科学院数学与系统科学研究院、中国科学院大学经济与管理学院)
文章刊发:《管理世界》2020年第10期
摘要:自经济学成为一门独立的社会科学以来,其研究范式、研究方法历经演变,从早期以历史分析、逻辑分析、定性分析为主,到现在以定量分析和实证分析为主。数学公式和模型是经济思想的重要载体和表达方式。大数据时代带来的“数据革命”,凸显了定量分析的必要性和重要性,定量分析是经济学研究的“工匠精神”。但是,在实际应用中,应避免生搬硬套、滥用、误用模型与定量分析方法,强化对数学公式和模型方法的直观解释和经济解释。必须发扬“工匠精神”,才能有效地提高经济学的研究质量。
关键词:经济思想 经济学 研究范式 研究方法 数学 模型定性分析 定量分析 实证研究 大数据
一、问题的提出
长期以来,关于数学与经济思想之间的关系一直是中国经济学界经常关注和讨论的一个问题(洪永淼,2014;陆蓉、邓鸣茂,2017)。为什么中国经济学教育与研究还在纠结于数学与经济思想之间关系的问题?改革开放以来,中国经济学教育与研究到底有没有取得进步?其实这个结论是不言而喻的。40年来,中国经济学教育与研究取得了长足的发展,包括定量分析方法的广泛使用,大大提升了经济学研究的规范性和研究质量,也推动了中国经济学研究的国际交流(乌家培,2008)。之所以还存在数学与经济思想之间关系的争论,原因是多方面的,其中一个原因是中国经济学教育与研究的历史背景。40年前,中国经济学主要是定性分析,很少有定量分析,当时中国高校经济管理类的学生不用修读数学课程。另外一个原因是随着定量分析方法日益广泛的应用,滥用、误用数学公式和模型的现象普遍存在,一些研究者没有根据所研究的经济问题的本质选择合适的模型,不重视模型适用的前提条件,也不顾观测数据的具体特点,在不满足模型的前提条件时生搬硬套模型。还有,不注意对模型特别是模型参数进行直观解释,也不注意对所获得的实证研究结果从经济学角度加以解释,等等。这些问题和缺点导致研究结论不可靠,并使读者感到难以理解数学与模型所包含的经济含义。
本文的主要目的是想深入探讨数学、模型以及其他定量分析方法与经济思想之间的关系。可能有人会认为,对各种观点早已了若指掌,无需赘述,但从目前的争论看,一些关键问题还必须彻底研究清楚。作为计量经济学者,我们知道数学、计量经济学以及其他定量分析方法在经济学研究中的重要作用,同时也非常清楚定量分析方法的局限性以及滥用、误用模型的不良后果。从学术上探讨数学与经济思想之间的关系是非常有益的,这有助于我们理解定性方法和定量方法各自的优缺点,探索如何更好地将定性方法与定量方法相结合,不断改进我们的研究方法,从而进一步提升中国经济学教育与研究的质量和水平。
二、经济学研究范式、研究方法及其演变
1776年亚当·斯密撰写的《国富论》的发表,标志着经济学作为一门独立的社会科学学科的诞生。以此为起点,经济学及其研究范式、研究方法经历了很多重要的变化。1867年马克思通过对英国古典政治经济学的批判,发表了以剩余劳动价值论为基础的《资本论》,揭示了资本主义经济的内在矛盾及其历史发展规律。在《国富论》发表近一百年之后,经济学出现了“边际革命”(marginal revolution),极大推动了数学特别是微积分在经济研究中的应用,形成了体系比较严谨的新古典经济学。20世纪30年代,世界经济“大萧条”危机之后,经济学出现了“凯恩斯革命”,这是对新古典经济学的一种否定。它直面当时世界经济“大萧条”的现实,主张通过政府干预刺激需求,以达到促进经济增长的目的。凯恩斯革命使经济学家更加重视经济现实问题,以问题为导向研究经济学。凯恩斯以现实问题为导向的研究范式,开辟了计量经济学作为实证研究主要方法论的广阔的发展与应用空间。计量经济学在20世纪30年代成为一门独立的方法论学科,并在经济学实证研究中不断发展、成熟。
到了20世纪50~60年代,出现了所谓的“新古典综合”(new classical synthesis),将新古典经济学和凯恩斯经济学融合在一起,形成统一的经济学分析框架。在这个过程中,很多经济理论出现了公理化重构,以数学工具进行严密的论证,形成了体系化的经济理论。20世纪80年代以来,经济学的研究范式又出现了“实证革命”(empirical revolution),即以现实经济问题为研究对象,通过数据分析而不是数学推导,以统计学推断方法研究经济的内在逻辑关系与运行规律(Angrist et al.,2017)。实证革命的诞生使计量经济学这门方法论学科在经济学实证研究中日益发挥重要作用,使经济学研究与经济现实更加接近,并且使经济学家对经济政策的制定产生越来越重要的影响。
纵观经济学发展历史,特别是研究范式和研究方法的演变,可以看出,早期经济学研究方法大多以历史分析、逻辑分析、定性分析为主,现在则以定量分析为主。定量分析主要包括两方面的内容:一是数学推导,二是以数据为基础使用统计推断方法的实证研究。实证研究并没有涉及数学推导,但必须熟悉数据的分析、统计软件的使用以及计量经济学方法的应用。经济学定量分析方法的广泛使用,是几代经济学家为了使经济学成为一门像自然科学一样严谨的科学而不断努力的结果。数学是严谨逻辑推理的工具。在将经济思想转化为体系化的经济理论过程中,如果经过数学的严谨推导,那么在理论逻辑上就不会存在错误的空间,整个理论体系有其逻辑自洽的一致性。而以计量经济学为主要方法论的实证研究,则是在经济理论与经济现实之间搭建了一座桥梁,让我们可以检验经济理论能否解释经济现实。换句话说,定量分析方法,尤其是数学和计量经济学,能够保持理论逻辑的一致性以及理论和现实之间的一致性,从而推动经济学作为一门科学不断向前发展。
三、思想和方法是经济学研究的两大支柱
经济学有很多研究方法,如历史分析、逻辑分析、规范分析、定量分析等。思想和方法不是零和关系,并不互相排斥,而是互相补充,缺一不可。经济学研究是一个提出问题、解决问题的过程,前者需要思想,后者需要方法。
那么,经济思想是如何产生的?首先,经济思想来自于学术批判和学术争论。例如,马克思主义政治经济学的主要理论来源就是对英国古典政治经济学的批判继承与创新。其次,思想也来自于时代、来自于现实。“凯恩斯革命”就是一个典型例子。凯恩斯革命产生于20世纪20年代末30年代初的世界经济大萧条。古典经济学没有办法解释为什么大萧条会长时间存在,Keynes(1936)则针对大萧条的经济现实,从有效需求不足的角度进行解释,并提出了乘数效应的学理基础,主张通过政府干预刺激需求的方法来促进经济增长。另一个例子是Engle(1982)的ARCH波动模型。在20世纪70年代,世界经济出现了剧烈波动。首先是美国取消美元和黄金挂钩的固定汇率制度,实行浮动汇率管理制度;与此同时,世界上发生了第一次石油危机,石油生产国成立了具有卡特尔性质的石油输出国家组织,造成了油价大幅上涨以及剧烈波动;20世纪70年代末80年代初,美国经济出现了“滞胀”现象。所有这些极大地增加了当时经济的不确定性,各种经济主体包括经济决策者都迫切需要对经济不确定性进行定量测度,并在决策中考虑到不确定性的影响。ARCH模型就是在这样的背景下诞生的。
那么,经济学为什么需要数学?数学在经济学研究中发挥了什么作用?数学作为一种精确的逻辑语言与工具,能够使经济学分析严谨化。当然,也有其他方法能够使经济学分析严谨化, 例如,“以彼之矛,攻其之盾”的学术争论也能使逻辑分析严谨化。
经济现象错综复杂,若想透过经济现象揭示经济的本质特征,则需要对经济现象进行提炼,将其上升为理论。数学作为一种抽象思维工具,特别适用于从复杂经济现象中揭示其本质关系。恩格斯说过,数学是现实世界中的空间形式和数量关系,任何一门科学的真正完善在于数学工具的广泛使用。特别是经济学作为一门研究稀缺资源最优配置的科学,非常适合将优化数学方法与工具运用于经济学研究。同时,经济学充满着大量的不确定性,而概率论是描述不确定的最佳数学工具。
应该强调,经济思想特别是创造性的经济思想不是从数学推导中产生的。但是,单有思想是远远不够的,还必须有解决问题的方法,思想和方法一起才能构建一个完整的、系统化的理论。思想是提出科学问题的先导,而方法则是解决科学问题的钥匙。例如,哥德巴赫猜想(“1+1”)是数学的一个重要命题,但多少年来一直没有人能够证明这个猜想,一直到陈景润才证明了“1+2”,陈景润的方法也因此被誉为“陈氏定理”。在物理学,物理学家曾一直想测度光速有多快,美国诺贝尔物理学奖得主阿尔伯特·迈克尔逊(Albert Michelson)发明了一个实验装置,被称为迈克尔逊干涉仪,解决了这个问题。
以下我们通过几个经济学经典理论案例,说明数学在经济学中所发挥的重要作用。
一般均衡论。瓦尔拉斯1874年提出一般均衡论(Walras,1954),认为通过自由竞争,存在一组均衡价格,能够使整个经济处于均衡状态,并达到帕累托最优。瓦尔拉斯设想通过一个“拍卖”叫价机制达到这样的均衡,但没有从数学上严格证明。这个工作后来由阿罗和德布鲁(Arrow and Debreu,1954)运用数学“不动点定理”(fixed point theorem)完成了,从而为一般均衡论和新古典经济学奠定了坚实的理论基础,阿罗和德布鲁也因此获得了诺贝尔经济科学奖。可能有人会认为,用不动点定理证明一般均衡的存在,在数学上非常漂亮,理论结构也很完美,但是这些数学方法到底在现实中有没有用呢?大家可以回想一下可计算一般均衡(computational general equilibrium,CGE)模型的广泛应用。不仅在国外,中国的经济学家包括一些经济智库长期以来也大量使用可计算一般均衡模型评估各种经济政策,特别是宏观经济政策、产业政策、区域政策以及重大事件对中国与世界经济的冲击和影响。
博弈论。这原是应用数学的一个分支,后来与经济行为假设不断结合,形成了今天的博弈论,成为现代微观经济学的核心理论基础。博弈论最主要的开拓者是数学家冯·诺依曼(John von Neumann)和纳什(John Nash)以及经济学家摩根斯特恩(Oskar Morgenstern)。其中纳什是美国数学家,22岁获得普林斯顿大学数学博士学位。他和海萨尼(John Harsanyi)、泽尔滕(Reinhard Selten)一起获得了1994年的诺贝尔经济科学奖,以表彰他为博弈论奠定数学基础所做出的杰出贡献。纳什也是微分几何与偏微分方程领域的一位开拓者。
投资组合理论。马科维茨(Markowitz,1952)应用概率论与统计学的分析方法与工具,以均值和方差刻画投资组合的预期回报和风险,建立了投资组合理论。马科维茨在1990年获得诺贝尔经济科学奖,他在获奖演讲(Markowitz,1991)中这样说:“当年我在芝加哥大学进行经济学博士论文答辩时,费里德曼(Milton Friedman)教授称投资组合理论不属于经济学,因而我的论文不属于经济学范畴,也就不能授予我经济学博士学位。我知道他只是半开玩笑,因为答辩委员会并没有花费太长的时间争论就决定授予我博士学位。对于他的说法,现在我也愿意承认,当年博士论文答辩时,投资组合理论并不是经济学的一部分,但它现在是了。”这个例子说明了数学特别是概率统计方法在金融学中的创造性应用,拓展了金融学的研究领域与边界。
金融衍生产品定价理论。布莱克和斯科尔斯(Black and Scholes,1973)应用随机微分方程,结合无套利机会等金融市场基本假设,提出了欧式期权产品定价理论。这篇论文与莫顿(Merton,1973)的论文一起,奠定了后来兴起的金融工程学科与金融工程产业的理论基础,斯科尔斯和莫顿因此于1997年获得诺贝尔经济科学奖。但是Black和Scholes(1973)这篇论文因为其超前思想和高深数学,在送审发表中经历了曲折的过程,最后发表在芝加哥大学主办的《政治经济学期刊》(Journal of Political Economy)(Black,1987)。
以上讨论主要聚焦数学在经济学研究中的作用,特别是在经济思想的理论体系化过程中数学发挥的关键作用。我们知道,经济理论最主要的目的是解释现实,揭示经济的内在因果关系和运行规律。而一个经济理论能否解释经济现实,主要看这个理论和观测数据是不是具有一致性,即理论与现实的一致性。在验证理论与现实的一致性问题上,数学是无能为力的,而在这方面能够起到关键作用的是以计量经济学为方法论的实证研究。计量经济学以经济观测数据为基础,通过统计推断方法,验证一个经济理论是否能够解释经济现实,是否与观测数据具有一致性。换句话说,以计量经济学为方法论的定量研究,是连结经济理论和经济现实的一个桥梁。通过这个桥梁,可以验证一个经济理论能否解释经济现实。比如,计量经济学模型能够将一个经济假说转变为一个统计假设,然后通过观测数据验证统计假设是否成立,由此推断经济假说是否成立。需要强调,实证分析不一定都是以数据为基础的计量经济学实证分析。比如,宏观经济学有一种常用的实证分析方法就叫校准法(calibration)(Cooley,1997)。
经济学研究的一个最主要目的是揭示经济变量之间的因果关系。识别因果关系是一切科学最主要的任务。在自然科学、实验科学中识别变量之间的因果关系,可以采用实验的方法。比如,判断变量X是否与变量Y存在因果关系,是指在其他变量Z不变的情况下,X的变化会不会引起Y的变化。我们可以通过控制实验条件,让其他变量Z不变,只改变X的数量,然后观测Y的数量会不会改变。这个方法可以精确判断从X到Y是否存在因果关系。但是,经济观测数据通常并不是通过控制实验而产生的。经济系统的非实验性是经济学识别因果关系时面临的最主要挑战。而统计学和计量经济学能够提供一种方法论,在非实验性的条件下,即在其他变量Z也发生变化的现实条件下,判断X的变化会不会引起Y的变化,从而推断是否存在从X到Y的因果关系。显然这种实证分析要比通过实验方法识别从X到Y的因果关系复杂得多,但借助一些假设与经济理论,统计学和计量经济学可以解决在非实验条件下判断经济因果关系的难题,彰显了以统计学和计量经济学为基础的定量实证分析在经济研究中所发挥的重要作用(Pearl,2009;Varian,2016)。
方法不仅能够解决所研究的问题,新的科学方法还常常能够揭示数据中经济变量之间以前没有发现的逻辑关系,提供新的洞见、得出新的结论。例如,长期以来金融学家和经济学家一直深信股票市场是一个有效市场,甚至有人看到实证研究发现股票市场并非有效时,便马上下结论称实证研究的计算机程序肯定有错。Malkiel(1973)写了一本畅销书叫《漫步华尔街》(A Random Walk Down Wall Street),就讲述了为什么股票市场是有效市场,影响非常大,已再版12次。但是,Lo和MacKinlay(1999)等学者发明了一些金融计量方法,通过数据分析,以证据证明股票市场存在非有效特征,并出版了《华尔街的非随机游走》(A Non-Random Walk Down Wall Street)一书,这一论断现已被大多数人接受。
《21世纪资本论》(Capital in the Twenty-First Century)的作者、法国著名经济学家皮凯蒂(Thomas Piketty)多年来致力于建立新的分布式国民账户(distributional national accounts)数据库,他通过整合包括国民账户数据、微观调查数据、税收数据、商业银行报告在内的各种数据,对收入与财富分配进行跨国比较分析。收入与财富分配是经济学一个重要而又古老的问题。皮凯蒂批评常用的基尼系数等指标将不同阶层、不同群体的不平等混淆起来,他主张用分配表分析收入不平等的问题,因为分配表能够显示出收入与财富金字塔各自最顶端的10%和1%群体在总收入与总财富的比重(Piketty,2014)。皮凯蒂估算了近300年来多个国家的资本收入比,发现这些国家进入21世纪以来,收入与分配不平等呈现出与19世纪相似的两极分化情形,其结论冲击了西方主流经济学关于社会收入和财富分配将随着经济的充分发展而逐步趋于平等的观点,特别是诺贝尔经济科学奖得主西蒙·库兹涅茨(Simon Kuznets)的“倒U型曲线理论”。
经济学研究存在各种分析方法,如历史方法、逻辑方法和统计方法。是否可以不用定量分析方法,只用定性分析方法?当然可以。定性的历史分析、逻辑分析也可以从理论上揭示经济变量之间的逻辑关系以及经济运行规律,包括经济的历史发展趋势。但是,一旦需要将经济理论应用于解释经济现实,实证研究就不可避免。实证研究并不意味着一定要使用数据和计量经济学的分析方法,也可以使用描述研究、案例研究、校准研究等方法。但从方法论角度看,具有严谨概率论与统计学基础的计量经济学是所有实证研究方法中比较科学的一个方法。
中国数学家和经济学家探索数学在经济学研究以及经济管理中的应用已有很长的历史。20世纪60年代,著名数学家华罗庚率先开展优选学、统筹学以及经济数学的理论研究,将其应用于国民经济管理实践,取得了丰硕成果。改革开放之后,华罗庚牵头在1981年成立了中国优选法统筹法与经济数学研究会,经济数学是其中一个分会。华罗庚(1987)最后的主要研究集中在计划经济大范围最优化数学理论,类似于现代西方经济学的一般均衡论。另一方面,早在1959年,中国著名经济学家孙冶方就意识到经济学研究必须使用定量分析方法,中国科学院哲学与社会科学部在1960年成立了经济数学方法研究小组,开始研究投入产出原理、社会主义生产模型以及经济数学方法。1965年,中国著名经济学家、时任中宣部科学处处长的于光远,曾和华罗庚商量如何促进我国数学家和经济学家共同将数学方法应用于经济学研究中,并在应用过程中找到和提出新的数学方法。1979年,于光远推动开展数量经济的研究,成立了中国数量经济研究会,这个研究会就是现在的中国数量经济学会的前身。40年来,数量经济学在中国的发展非常迅速,其研究与应用也取得了很大的成就。但从整体上看,由于历史等各种原因,中国的数学家和经济学家似乎没有形成合力,中国经济学家使用数学方法研究经济理论问题的还是偏少,与国际先进水平相比,其数学化还远远不够。例如,在数理经济学和博弈论理论研究方面,中国本土经济学家发表的国际论文很少,中国经济学家的定量分析主要集中在计量经济学的理论及应用研究,特别是以计量经济学为基础的实证研究,计量经济学是国内经济学最接近国外先进水平的一个学科,但整体上也存在显著的差距(洪永淼等,2020)。
四、数学公式与模型是经济思想的重要载体
历史上,不少哲学家同时也是数学家,如笛卡尔(René Descartes)、罗素(Bertrand Russell)、莱布尼兹(Gottfried Leibniz)等,同样地,不少经济学家也是数学家或者物理学家,诺贝尔经济科学奖首届得主之一丁伯根(Jan Tinbergen)就是物理学博士。虽然数学推导产生不了经济思想,但数学公式和模型是经济思想的重要载体和表达形式。挖掘并理解数学公式和模型所包含的经济含义,是经济学学术训练不可或缺的重要组成部分。例如,在《概率论与统计学》和《计量经济学》的教学过程中,强调对数学概念、理论、方法与工具的经济解释与经济应用,对学生掌握相关知识是非常有帮助的。
在物理学中,牛顿力学、电磁学、热力学与统计物理学、量子力学和相对论,均能用非常简洁的数学公式来表述,这些数学公式包含着丰富深刻的物理含义,这是物理学的一个显著特点。经济学的数学公式和模型同样包括着丰富深刻的经济含义。例如,欧拉方程是一个在物理学和经济学中都广泛应用的数学工具,这是动态优化规划的一阶条件。在经济学中,如果一个经济主体(投资者或消费者)的目标函数是最大化其一辈子效用的总和,那么欧拉方程便刻画了在不确定条件下经济主体的最优动态消费路径或投资路径。这与物理学和天文学用欧拉方程刻画宇宙飞船从地球飞往月球的最优动态运行轨迹类似(当然取决于目标函数)。
不仅数学公式和模型包含丰富的经济含义,经济观测数据的定量分析也能产生重要的经济思想与科学问题,不应该把定量方法和经济思想对立起来。比如,宏观经济学有一个著名的“股权溢价之谜”(equity risk premium puzzle)。Mehra和Prescott(1985)在实证研究中发现,刻画宏观经济动态运行的理性期望模型,并不能解释为什么美国宏观经济存在那么大的股权溢价,即美国股市回报率减去美国国债回报率两者之差那么大。这个“股权溢价之谜”极大推动了宏观经济学相关领域的发展。金融学很喜欢研究各种异象(anomalies),即标准资本资产定价模型(capital asset pricing model,CAPM)无法解释的那部分回报率是由哪些因素决定的,这里的异象回报率与“股权溢价之谜”一样,是通过CAPM模型定量估算出来的。这些异象产生了很多很好的金融定价问题。在经济学,经济高质量发展有一个重要测度指标,就是全要素生产率(total factor productivity,TFP),也称为多要素生产率。基于微观企业数据估计整个行业乃至整个经济的生产函数,然后通过生产函数扣除生产要素对经济增长的贡献,剩余部分就是效率增长,也就是全要素生产率(Sickles and Zelenyuk,2019)。这个重要的经济学概念被写进了“党的十九大报告”。
从经济数据中总结经验典型特征事实(empirical stylized facts),可以凝练出重要的科学问题。大多数经验典型特征事实是数据中经济变量之间的统计关系。一个例子就是菲利浦斯曲线,刻画通货膨胀率和失业率之间的负相关关系(Phillips,1958)。另一个例子是美国宏观经济学家Bernanke(2004)等人发现,自20世纪80年代中期之后,美国经济增长率和通货膨胀率的波动幅度,随着时间的推移越变越小,这被称为“大缓和”(great moderation)现象。这个经验典型特征事实使经济学家纷纷提出各种理论解释为什么如此。换句话说,从数据的定量分析中总结出来的重要经验典型特征事实,可以产生重要的科学问题。Sun等(2019)发现,中国经济增长率和通货膨胀率的波动幅度,也像美国宏观经济一样,随着时间的推移越变越小,只是开始的时间起点不是20世纪80年代,而是90年代。中国经济学家似乎还没有注意到这个现象,更不用说提出经济理论解释为什么中国经济也有“大缓和”现象。
五、数学和模型的局限性
洪永淼(2007)对计量经济学模型与方法的局限性做了一些初步讨论,指出这种局限性主要是因为经济观测数据的非实验性。这里,我们从方法论角度,深入探讨数学和模型的各种局限性。
第一,模型是对复杂经济现实的高度概括与简化,当其应用于解释经济现实时,在绝大多数情况下不如自然科学解释或预测得那样精准。一个主要原因是,我们所观测到的经济现象是很多因素共同作用的结果,而这些因素,包括可观测因素和不可观测因素,有很多并没有包含在模型之中。这些被模型排除在外的因素所产生的效应无法通过实验分离开来。
第二,模型刻画的统计关系和经济因果关系存在差别。由于经济数据的非实验性特点,计量经济模型刻画的经济变量之间的关系都是统计关系,比如相关关系或者预测关系,这些关系并不一定是因果关系。在实证研究中,我们常将一个模型方程中放在右边的变量叫解释变量,放在左边的变量叫因变量,但是,即使解释变量的系数具有统计显著性,这也不意味着存在从解释变量到因变量的因果关系。要将计量经济学模型刻画的相关性或者预测关系解释为经济因果关系,需要借助经济理论和很多假设。由于经济数据非实验性的局限性,计量经济学模型的统计关系不能马上被解释为经济因果关系,这对通过实证研究识别经济因果关系带来了巨大的挑战。这是经济学实证研究和自然科学实验研究的一个重要差别。
第三,模型证据(model evidence)与数据证据(data evidence)存在差别。由于模型是一种简化,它只能捕捉数据的部分信息,因此导致模型能够提供的证据和数据本身的潜在证据存在差别(Breiman,2001)。举个例子,我们想用数据验证一个金融市场是不是有效市场,即其将来的回报率能否用历史信息来预测这样一个经济假说。如果能够利用历史信息预测将来的回报率,这将表明市场并不是有效的。我们可采用线性自回归模型,如果其中某个自回归参数具有统计显著性,即这个线性模型能够用历史数据预测将来的回报率,则有证据拒绝市场有效假说。但是,当线性自回归模型不能用历史信息预测将来的回报率时,我们并不能马上认为有效市场假说是正确的。原因很简单:一个线性自回归模型没有预测能力,并不代表未来的回报率不能用历史信息预测,因为历史数据与将来的回报率可能存在非线性关系。如果这样,线性自回归模型就可能没有办法刻画非线性关系,导致线性模型没有预测能力,但是数据本身实际上存在非线性预测关系(Hong and Lee,2003)。这个例子表明,线性自回归模型提供的证据与数据本身隐藏的证据两者之间可能存在差距,这也是任何模型都可能存在的缺陷。从这个意义上说,实证研究只能“证伪”,不能“证实”;只能“证错”,不能“证对”。
第四,简化模型可以被认为是一种错误的模型,即误设模型。并非模型误设就不能使用。误设模型可能具有一定的解释或预测能力。但是,误设模型会产生模型风险(model risk)。在金融市场上,由于大数据的可获得性和计算机信息技术的快速发展,很多金融交易都是以计算机和模型为基础进行的,误设模型可能会造成严重的金融产品定价误差、低估或放大金融风险等严重后果。同样地,在经济学研究中,误设模型可能会对经济解释与研究结论的有效性产生很大的影响(洪永淼,2020)。
第五,由于人口结构与消费者偏好变化、技术进步、体制改革、政策变动,以及外在冲击(如新冠肺炎疫情),经济结构通常具有时变性(Hong et al.,2017)。同时,由于经济主体的理性行为,一旦政府政策有新的改变,经济主体将通过预期改变其经济行为以应对这种政策改变,从而导致经济结构及相应的模型出现时变性(Lucas,1976)。一个具有时变结构的经济系统或模型将给经济学实证研究带来很大的挑战。更困难的是,由于数据等因素,根据某个统计或经济准则,可能会发现存在一个以上的模型,其解释能力或预测能力几乎相同。这就产生了一个模型识别问题,即到底哪一个是真实模型,甚至有可能所有模型都是误设模型,每个模型只能够刻画或解释经济现象的某一部分。这在计量经济学和经济学中称为模型不确定性(model uncertainty)或模型模糊性(model ambiguity)。在模型不确定性或模型模糊性的条件下,如何进行实证分析,如何进行有效的经济解释,从计量经济学方法论的视角看,面临巨大的困难与挑战。
第六,定量实证研究依赖于数据质量。经济数据大多数是观测数据,在现实中存在各种数据缺陷,比如测量误差、数据截断、数据遗失、样本选择偏差、异常值等,甚至在财务报告数据、互联网数据以及宏观数据中因为各种原因存在不同程度的数据操纵或造假。数据和模型同等重要,数据是原材料,模型是“加工厂”。如果数据质量不过关,对模型构建以及最终所得到的实证结论都会产生负面的影响。在计算机科学和统计学中,有一句著名的成语——“错进,错出”(garbage in,garbage out),就是指数据质量的重要性。
第七,数学和模型的直观性和可解释性通常不强,导致很多人觉得难以理解其经济含义。同时,一些具有很强经济含义的结构模型(structural models)对数据的拟合与解释能力较弱,而一些没有很好经济理论基础的统计模型则具有较好的拟合与预测能力。Meese和Rogoff(1983)关于外汇市场的样本外预测就是一个经典例子。他们发现,一些基于经济理论的汇率结构模型在样本外的预测能力很差,而一些没有经济理论基础的“纯粹”的时间序列统计模型则有较好的样本外预测能力,尤其是最简单的“随机游走”模型。
六、使用定量分析方法时需要注意什么?
在经济学实证研究中,经常可以看到生搬硬套、滥用、误用模型与定量分析方法,没有考虑模型与方法所适用的前提条件,忽视对数学公式和模型的直观解释和经济解释。这些做法与现象,在初学阶段是不可避免的。为了尽快纠正这些错误做法,尽量克服定量分析方法本身固有的局限性,在使用定量分析方法时,特别需要注意以下几个方面。
第一,使用什么模型应该由所研究的经济问题的性质决定。“一把钥匙只解一把锁”,不存在一种能用于研究一切经济问题的模型或方法。在许多学术论文中,常常会发现罗列了很多种模型与方法。其实,哪个或者哪些模型为什么适合于研究所感兴趣的经济问题,需要加以论证。
第二,注意每个模型或方法所适用的前提条件。例如,经典T-检验和F-检验至少要求条件同方差。如果存在条件异方差,则必须使用White(1980)提出的标准差或方差公式,否则哪怕是大样本分布理论也不再适用(洪永淼,2020)。
第三,坚持模型简约性原则。模型与方法并非越复杂越好。事实上,大家常常在应用中忽略统计学和计量经济学的一个基本思想——简约性原则,即选择能够刻画数据中变量特征与变量之间关系的最简约模型(parsimonious model)。这个思想在统计学称为KISS(Keep It Sophisticatedly Simple)原则(Zellner,2002)。需要注意,所谓越简单越好是指在能够刻画数据中重要关系的前提下。例如,一个线性回归模型,显然不能刻画非线性关系,因此不适合于研究非对称经济关系(如非对称经济周期)。这也是为什么在大数据分析中机器学习方法常有较精准的样本外预测能力的主要原因。
事实上,经济学的分析方法是分层次的。比如,经济学专业一年级本科生在学习《经济学原理》基础课程时,任课老师一般采用平白的语言,尽量避免数学工具,像导数这个词要称为斜率,二阶导数则称为曲率,供给需求就用两条曲线来代表,这种教学方式比较直观,适合培养初学者的经济思维。到了学习《中级宏观经济学》和《中级微观经济学》课程的阶段,就需要使用微积分和线性代数。例如,在学习消费者效用最大化或者是生产者利润最大化时,最大化便转成一个有约束的数学优化问题。其中,通过求一阶导数得出最优解,从这些最优解推导出需求函数和供给函数,而消费者福利则通过积分求解。到了博士生阶段,则需要使用大量比较高深抽象的数学工具。例如,之前提到的欧拉方程,是一个刻画动态优化的数学工具。Stokey和Lucas(1989)的宏观经济学教科书《经济动态中的递归方法》(Recursive Method in Economic Dynamics),需要用到泛函分析(functional analysis)和测度论(measure theory)。总之,随着学习层次的不同,使用的分析方法也不同。分析方法并非越复杂越好,够用即可。但对专业的、原创性的经济学研究,一般需要建立在严谨的学术规范体系之上,所使用的研究方法与工具也比较专业。经济是一个复杂系统。一般来说,复杂系统不可能用简单方法就可以分析透彻,故其相应的分析方法会复杂一些。正如在机器学习时,如果数据结构比较复杂,相应的算法也要复杂些,才能取得较好的预测效果。
第四,注意模型的可解释性,特别是其重要参数的经济含义,以及给予有效的经济解释的前提条件。另一方面,一个模型或方法可能预测得很好,如基于大数据的机器学习方法,但是为什么能够预测得好,其背后的统计学、经济学逻辑是什么,需要进行深入的探索与解释,否则就变成了一个“黑箱”(black box)。经济学研究的目的之一就是要破解“黑箱”的奥秘。
第五,注意模型与方法的现实关联度。2003年诺贝尔经济科学奖得主格兰杰(Clive Granger)最早将长记忆模型(long memory model)引入时间序列计量经济学(Granger,1980;Granger and Joyeux,1980)。但20年后他却批评长记忆模型与经济现实脱节,因为虽然有很多新的关于长记忆模型的计量经济学理论与方法相继提出,但这些对我们理解现实经济时间序列的记忆特征所提供的洞见并不多,是一个“空箱”(empty box)。从这个意义上说,应该避免数学和模型与经济现实严重背离或脱节,成为纯粹的数学游戏。
第六,注意数据质量,特别是数据缺陷可能带来的各种问题。针对数据缺陷,注意如何选择合适的模型,如何修补数据,以及如何解释实证结果等。
第七,注意模型证据和数据证据之间,以及统计假设和经济假说之间的差别,同时注意基于这些差别而对实证结果进行正确解释,以得出正确结论。模型数据和数据证据之间的差别,上一节已有详细讨论。经济假说(如有效市场假说)通常与模型无关(即model-free),但是为了检验经济假说,我们一般会使用一个计量经济学模型,将经济假说转化为统计假设(即参数假设),然后用数据进行检验。在将经济假说转为统计假设时,不仅需要一个具体模型,而且常常附加一些假设条件,这导致经济假说和统计假设两者之间存在一定差别,其原因与数据证据和模型证据之间存在一定差别类似。
第八,注意计量经济学模型刻画的统计关系和经济因果关系之间的差别。由于经济数据的非实验性,任何计量经济学模型所刻画的统计关系只是一种相关性或者预测关系,不能马上解释为经济因果关系。要将统计关系解释为经济因果关系,需要一些基本假设,也需要借助经济理论。计量经济学出现了一个新兴学科,叫做政策评估计量经济学(econometrics of program evaluation),就是将生物统计学、病理学的处理效应(treatment effect)方法论应用到经济学实证研究中。例如,在非实验条件下,要估计一项政策的效应有多大,可以比较这项政策实施之后所观测的经济结果和假设这项政策没有实施的条件下的经济结果两者之间的差距。在政策已实施的实际情况下假设该政策没有实施,显然是一种虚拟假设,其无法观测的经济结果因此称为“虚拟事实”(counterfactuals)。为了估计虚拟事实,需要对整个经济系统与计量经济学模型施加一系列的假设条件(Hsiao and Zhou,2019)。这些假设条件是否满足,所使用的模型是否合适,会影响到虚拟事实估计的准确性,从而影响对经济因果关系的识别与政策效应的测度。
第九,注意正确使用统计方法,例如在统计推断中正确理解和使用统计学的P值(P-value),同时要避免对一个给定的数据进行过度拟合和重复挖掘,这称为数据窥视(data snooping)(Lo and MacKinlay,1990;White,2000)。数据窥视是指对一个给定的数据,进行多次或多种模型的拟合,在这一系列试验过程中,偶然会得到一个或几个具有统计显著性的结果,但这种统计显著性并不是真正的显著性,原因在于,即使一个经济变量的真实效应为零,只要通过很多方法、各种模型反复试验,最终很可能会发现有一个或几个模型,在一定的统计显著性水平上,其变量系数不为零,于是只报告这个显著结果。事实上,这并不是真正的显著结果,因为没有将被扔掉的很多不显著的实证结果考虑在内。这种做法导致的不正确结论,称为数据窥视偏差(data snooping bias)。
第十,鼓励使用并创新交叉学科的分析方法。定量分析,特别是计量经济学的分析方法,很多来自于其他学科,包括物理学、统计学、病理学等。大家所熟悉的普通最小二乘法(ordinary least squares,OLS),早期是数学家、天文学家高斯(Johann F. Gauss)用于测量天体之间的距离的方法。而线性回归模型的“回归”(regression)一词其实是生物学家高尔顿(Galton,1877,1885)在研究人类遗传问题时提出来的。他发现高个子的家庭后代最终会回归到社会的平均身高水平,而低个子的家族后代最终也会长到社会的平均水平,他把这种现象称作“回归”。判断一个方法是否科学,不在于它是否新颖、是否复杂,而在于它是否假设更一般性的前提条件,是否具有较强的科学性,能否提供与传统方法不一样的实证结果,能否为实证研究提供新的经济学洞见。在这方面,交叉学科的方法常常会拓展研究的范围与边界,从崭新的角度看待传统的经济问题,也因此比较容易获得新的发现。现在经济学有不少新兴的学科,例如计算经济学(computational economy),计算金融学(computational finance),政策评估计量经济学(econometrics of program evaluation),以及机器学习计量经济学(machine learning econometrics),这些都是数学、统计学、病理学、计算机科学与经济学的交叉融合,这种交叉融合能够产生新学科、新方法。因此,必须重视交叉学科方法在经济学的运用,积极借鉴数学、统计学、物理学、生物统计学、心理学、信息科学等学科的研究方法,用以研究复杂的经济现象。
第十一,注意定量分析论述的可读性。定量分析由于所使用的定量方法和工具比较抽象,直观性不强,可读性也比较差,容易导致读者看不懂。应该重视定量分析表述的可读性,包括数据分析的可视化,对所使用的模型要从经济学的角度加以阐述,解释为什么这些模型和方法在经济学研究中是重要的。对模型本身所揭示的关系应该给予直观解释,特别是要从经济学视角解释模型及模型参数的经济含义。对所获得的实证结果,特别是统计估计和检验结果,也要从经济学的角度来加以阐释,并与经济理论结合起来。对必要但比较复杂的数学推导与证明,可以放到文章的附录,而不是放在文章的正文。如果我们能够从这些方面加以重视,那么定量分析和可读性两者并不矛盾,照样可以讲得很直观、很清楚。
在国外, 一些经济学顶尖和主流学术期刊的风格不尽相同,比如《美国经济评论》(American Economic Review)、《政治经济学期刊》(Journal of Political Economy)、《经济学季刊》(Quarterly Journal of Economics),这些都比较偏向经济思想以及经济故事的原创性和趣味性。虽然也要求研究方法的规范性和正确性,但并不强调或鼓励使用非常复杂的研究方法,他们一般要求所使用的模型方法具有可解释性且够用即可。另外一些期刊,像《计量经济学》(Econometrica)和《经济理论期刊》(Journal of Economic Theory),则鼓励使用现代定量方法特别是最前沿(cutting edge)、最先进(state of the art)的方法来研究经济与金融问题,在这些期刊上发表的论文大多使用比较严谨的数学方法与计量经济学模型。所以,不同期刊的要求不一样,每个期刊都有自己的特色,期刊之间存在差异。中国经济学的学术期刊也是如此,像经济学、管理学的一些主流期刊,可能比较偏好经济思想和经济故事,对研究方法的现代性和严谨性,可能没有那么高的要求,但前提必须是合乎规范的、正确的方法。而另外一些学术期刊则以方法论为主,鼓励使用最新的分析方法来研究中国经济问题。期刊之间的特色与差异并没有对错之分,这是偏好问题。这就要求研究者在投稿前要留意所投期刊的特色和要求,在文章写作时注意论文表述的风格。这里顺便提及,现代经济学的研究领域和分工越分越细,每个领域都有适合本领域的一些研究方法与工具。因此任何一个经济学家要完全看懂经济学所有领域的专业学术研究,是有相当难度的,甚至是不可能的。
第十二,在研究范式和研究方法方面,需要考虑与国际同行所使用的范式和方法接轨。过去40年,中国通过改革开放主动融入世界经济市场体系,积极参与国际分工,发挥自身的比较优势,成为世界第二大经济体,大大缩小了与发达国家的差距。与中国成功的经济转型和快速的经济发展相比,中国经济学的转型相对而言多少有点滞后,这导致了中国经济学在国际学术界的话语权和影响力相对弱一点。这里有很多原因,其中一个主要原因是我们还不善于运用“国际语言”讲述中国经济故事。所谓“国际语言”,就是让国际同行能听懂、理解、产生共鸣的方式,这种方式的最重要组成部分就是研究范式和研究方法。因此,研究范式及研究方法与国际接轨,对提升中国经济学和中国经济学家在国际学术界的话语权和影响力具有十分重要的意义。
七、大数据时代更要重视定量分析
在数字经济时代,越来越多的经济活动均由数据驱动,数据生产就好比石油生产,数据是新经济的重要生产要素。长期以来,GDP即国民生产总值(gross domestic product),一直用于衡量一个国家总的经济实力。萨缪尔森(Paul Samuelson)说,GDP是人类在20世纪最伟大的发明之一。现在出现了一个新的GDP概念,即数据生产总量(gross data product),正在成为测度一个国家在数字经济时代的财富与国力的新指标。党的十九届四中全会首次将数据列为一种重要的生产要素。
在互联网、移动互联网和人工智能为代表的计算机信息技术基础上产生的大数据,提供了以往传统数据所没有的信息和更加丰富的素材,这是一种“数据革命”,正在推动经济学研究范式特别是研究方法的深刻变革。它带来机遇,也带来巨大挑战,而这二者正在推动经济学研究向前发展。
数据分析的本质是定量分析。大数据种类繁多,形式多样,错综复杂,如存在非结构化数据、混类与混频数据,不同数据来源的收集、分析、处理与整合,需要多种定量方法共同使用,特别是机器学习方法和统计方法的结合。从本质上看,包括机器学习在内的人工智能方法是数学优化与计算机算法优化问题。人工智能特别是机器学习在经济学研究中的应用,包括对经济数据的分析、预测以及相关计算机算法程序的应用,都是比较高级的量化分析。对经济数据,特别是经济大数据的分析,其主要的目的是揭示数据中经济变量之间的逻辑关系,特别是其预测关系和因果关系,从而揭示经济运行规律,预测经济未来的走势,并且为制定政策提供科学依据。
大数据和机器学习能够极大拓展经济学研究的范围与边界。利用大数据,特别是社交网络非结构化、半结构化数据,可以构造投资者情感指数、幸福感指数、社会舆情指数、政策不确定性指数、政策变化指数等,这些是传统数据所没有的,可用以研究这些变量对经济与市场的影响或者其决定因素是什么。实时或高频大数据,使经济学家可以研究高频经济现象,例如探索实体经济与金融市场之间的互动关系、实时预测宏观经济变化趋势等。
前文提及,经济学存在各种不同的研究方法,它们各有优缺点,可以结合起来实现优势互补。例如,研究经济史,或者研究一个经济制度长期的历史发展趋势,最适合的研究方法是历史分析方法。但是如果能够通过对历史数据进行统计分析(现在不少历史数据可以通过人工智能的方法收集构建),这不但可以改进历史分析的严谨程度,还可以产生一个新的学科:量化经济史学,即用计量经济学的实证方法来研究经济史。计量经济学方法和历史分析方法完全可以兼容,可以提高经济史研究质量,并提供新的洞见、产生新的结论。
定量分析不仅在经济学研究而且在实际经济管理中也有广泛的应用。测度经济总量的GNP和GDP、物价水平的CPI和PPI、货币增长的M1和M2,衡量股市总体表现的各类指数,以及刻画收入不均等的基尼系数等,都是重要的宏观经济量化指标。此外,金融市场的α投资策略、 β投资策略与算法交易(algorithmic trading)等,都是量化投资策略。现代商业银行很多交易也都是通过模型与计算机算法程序自动进行。为什么实际应用中需要使用模型和定量方法?这里举两个例子。最近新冠肺炎疫情在全球范围内扩散,一些国家宣布禁止粮食出口。中国是全世界最大的粮食进口国之一,因此粮食预测对中国粮食安全的重要性是显而易见的。如果能够提前精确预测中国粮食产量与国际粮食价格走势,就可以及时判断到底需不需要进口粮食;如果需要的话,需要进口多少。在粮食产量预测方面,中国的数学家和经济学家取得了世界级的成就。以中科院预测科学研究中心陈锡康为代表的研究团队,过去40年一直用投入产出等数学方法和计量经济学模型,预测全国以及一些重要地区、重要省份的粮食产量,与国外粮食预测相比,不但预测的时间跨度长,预测精度也高得多。另一个例子,前期新冠肺炎疫情对中国经济产生了第一轮冲击;现在疫情在全球爆发,全球供应链遭受到了严重冲击,这对中国经济产生了第二轮冲击。精准预测国内外新冠肺炎疫情扩散对全球价值链与中国经济冲击影响的程度,特别是预测中国经济增长率、就业水平等将会因疫情而发生什么样的变化,对我们采取多大规模的经济刺激计划,保持多高的经济增长目标,是极其重要的。不管是预测粮食产量还是预测新冠肺炎疫情对中国经济的影响,这些预测的方向性很重要,但更重要的是能够精准预测粮食产量和疫情影响大小。因此需要科学的定量分析,单单定性分析是不够的。
定量分析是经济学研究中的“工匠精神”,通过仔细打磨,严谨推敲,这种“工匠精神”将大大提高中国经济学的研究质量和中国经济的精细化管理水平。2016年5月17日,习近平总书记在哲学社会科学工作座谈会上指出:“对一切有益的知识体系和研究方法,我们都要研究借鉴,不能采取不加分析、一概排斥的态度。马克思、恩格斯在建立自己理论体系的过程中就大量吸收借鉴了前人创造的成果。对现代社会科学积累的有益知识体系,运用的模型推演、数量分析等有效手段,我们也可以用,而且应该好好用。需要注意的是,在采用这些知识和方法时不要忘了老祖宗,不要失去了科学判断力。”
八、结论
随着大数据时代的到来,中国的互联网和移动互联网网民数量是全世界最多的,超过美国和欧盟所有网民人数的总和。中国是全世界第二大经济体,其消费规模已经接近美国,预计将在不远的将来超过美国,成为世界上最大的消费国,此外中国还有很多经济政策实验。因此中国经济在生产、交换和消费等方面产生了大量数据,在大数据资源方面具有很强的优势,具有产生经济理论创新和方法论创新的可能性。我们应该立足中国大地,以解决中国经济问题为导向,充分利用中国在大数据资源等方面的优势,创新定量分析方法,打造经济学研究的“工匠精神”,并且将定性分析和定量分析相结合,揭示中国经济的内在逻辑、因果关系及其运行规律,为中国经济改革与发展及全球化实践服务,同时,善于用“国际语言”讲述中国经济故事,提升中国经济学的国际影响力与国际话语权。
文章刊发:
洪永淼、汪寿阳:《数学、模型与经济思想》,《管理世界》,2020年第10期,第15~26页。