稽查政策机制设计:一个实验经济学视角(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-04 18:47:16

点击下载

作者:代志新

出版社:中国人民大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

稽查政策机制设计:一个实验经济学视角

稽查政策机制设计:一个实验经济学视角试读:

致 谢

感谢国家自然科学基金项目“信息披露,内生性税务稽查与企业纳税遵从”(项目批准号:71703161)的支持。该书属于该基金项目的阶段性研究成果。

第1章 导 论

1.1 传统计量方法在稽查政策研究领域面临的困境和挑战

自1992年诺贝尔经济学奖得主加里·贝克尔(Gary Becker)教授在1968年的研究成果(Becker,1968)发表以来,特别是近十年来,有越来越多的学者运用实证经济学方法来研究犯罪行为,经济学方法在犯罪研究领域做出了突出贡献(Levitt and Miles,2006)。Levitt和Miles(2006)在研究中总结了经济学方法的四个主要特点:(1)强调激励效用对个人行为的决定性作用;(2)运用计量经济学方法来确定非实验环境中的因果关系;(3)注重公共政策的广泛影响;(4)利用成本收益分析法来评估公共政策。然而,上述经济学研究方法也引来诸多质疑,尤其是基于宏观数据和理性行为假设展开的研究遭到很多质疑。其他反对观点则从测量误差延伸到了对经验结果的解释(Eide,2004)。近来一篇回顾近20年来刑事威慑的综述文献所得出的结论与这些反对意见一致,即支撑威慑力的证据是复杂的(Chalfin and McCrary,2014)。

1.2 实验方法的兴起

随着行为经济学和实验经济学的兴起和发展,经济学家现在能够[1]进行对照实验室实验,而非仅依靠观察现实世界经济的运行情况。正如后文所述,与传统经济方法相比,运用实验方法研究犯罪经济学的优点之一是它新生了一种能够回答有关非法行为的原因和应对等关键问题的方式。这可能部分地解释了从20世纪90年代开始实验犯罪学研究呈指数增长的原因(Mazerolle and Bennett,2011)。然而,实验犯罪学家仅专注于随机性现场试验(Sherman,2010)。即使我们相信若合理执行现场实验能让我们更接近真相,也无法避免现场实验的缺点:实地混乱的操作会导致实验所基于的一些假设无法成立,那么实验所得出的合理因果推断可能会因此存在瑕疵(Teele,2014)。

Falk和Heckman(2009)共同在《科学》(Science)杂志上发表了一篇论文,认为实验室实验是社会科学知识的主要来源。他们认为实验室实验是一种广泛使用的方法,用于推进物理和生命科学中的因果知识。然而,除心理学外,实验室实验的使用在社会科学中发展得慢得多,虽然在过去的约二十年中,实验室实验的使用已经加速。尽管如此,社会科学家们仍然面临相当大的阻力,他们认为实验室实验缺乏现实性和普遍性。他们通过将实验室社会科学实验与基于非实验数据和现场实验的研究进行比较来讨论它们的优势和局限性。最后,两位作者认为,“最近许多针对实验室实验的反对都是错误的,应该进行更多的实验室实验,而不是相反”。注释[1]参见诺贝尔奖官网。

1.3 稽查政策研究的经济学意义

本书写作的主要目的就是希望通过展示实验室实验如何对欺诈行为研究及其效率进行评估,以及评估稽查政策对于欺诈行为的有效[1]性,从而为犯罪经济学提供“技术转移”。需要声明的是,本书所用的实验研究方法和结果并非替代传统经济学犯罪研究方法,而是与之相辅相成。[2]

本书主要讨论在实验室中如何设计稽查政策来遏制欺诈行为[3](如“搭便车”、逃票、逃税)。聚焦欺诈行为,是因为其在经济生活中诸多领域都被重点关注,例如金融领域、公共交通、体育界、政治界和学术界,而且欺诈给社会造成了巨大损失。例如,美国的总税差超过美国国家税务局(Internal Revenue Service, IRS)估计的实际税负的16%,保险欺诈约占美国所有索赔支出的10%(Mazar et al.,2008)。公司丑闻(如安然公司、兴业银行和大众公司的丑闻)会给股市带来直接影响,并可能在长时间内降低消费者的信任。有关预防和侦查欺诈以及增加合规性(如税收合规性)方面的稽查政策研究,无疑对降低执法成本具有重要意义。

然而,若没有稽查和相应的处罚,合规性就无法得到保障(Scotchmer,1987)。根据贝克尔(Becker,1968)开创性论文中所提及的经济学实践方法,当设定较低的稽查概率并施以严厉处罚时,合规性能够以最低廉的成本得到保障。然而,法律或社会公约可能会禁止严厉处罚(Scotchmer,1987)。从现实角度来看,在多数情况下惩罚水平的任何变化都可能意味着必须经历复杂的立法程序(Landsberger and Meilijson,1982)。因此,执法机构不得不将稽查策略作为唯一的选择变量(Scotchmer,1987)。事实上,稽查对于确保政府制定有效的监管计划以及个人和组织能够适当遵守法规发挥着重要作用(Cason et al.,2015)。然而,高昂的稽查费用会消耗本就吃紧的监管预算,因而提高稽查有效性的研究有助于经济高效地提升合规性,这对决策者而言非常重要。这也就是本书将关注重点放在稽查政策研究的原因。注释[1]有关税收合规的实验研究有很多,对税收合规实验外部有效性的讨论可参见Alm等(2015)。[2]此处所对应的英文单词为audit,该词的意思有审计、稽查等。本书中根据不同语境和汉语使用习惯会进行一定的调整,但是总体的意思是通过某种手段,如审计、稽查、督查、暗访等来发现违规违法行为,重在强调一种发现违规行为的机制设计。[3]稽查政策同样适用于许多与欺诈相关的其他案例,涵盖腐败、保险欺诈等。

1.4 一种常见的稽查政策:严打

本书涉及三个具体的研究案例,三个案例都来源于我博士期间的研究成果,主要内容根据博士论文改写而成。三个案例都研究了在不同情境下稽查机制的设计。尤其是三篇论文都涉及一项特殊的稽查规则,即“严打”,可粗略将其定义为执法人员数量和力度的突然增加,以及对具体违法犯罪或特定地点违法犯罪行为的突然打击(Sherman,1990)。

自20世纪90年代以来,严打成为全球许多国家执法政策的重要特征之一,包括美国和中国。该政策基于两个方面的考虑:一是在违法犯罪行为高度活跃的少数地区采取严打行动能够产生足够的威慑力;二是在违法犯罪高发地区则可以遏制犯罪率的进一步攀升,那么整个城市的总体犯罪率也会下降。基于这两个方面的考虑,严打策略得到了广泛的应用。

一些在现实生活中的例子包括税务稽查、交通执法(如拦截酒驾、超速行驶)、反腐败、公共毒品市场以及城市暴力行为打击、扫黄、扫黑等亦是如此。然而,严打行动通常耗费高额成本。例如,美国运输部的国家高速公路安全管理局于2015年8 月21日至9月7日开展了一[1]年一度的“清醒驾驶,否则停车”的执法行动,以打击酒后驾车行为。此次开展的严打行动涉及全国10 000多个执法机构,对酒驾行为采取零容忍政策,酒驾司机须执行血液酒精浓度(blood alcohol content) 0.08%或者更高级别的法定限制。这项行动大约耗费了1 350万美元。

第二个例子来自法国,在位于巴黎的讽刺周刊《沙尔利周刊》(Charlie Hebdo)总部遭受恐怖袭击之后,时任法国总理瓦尔斯发表讲话称:“122 000名执法人员已经被部署来保护法国人民了”。仅11个月后,巴黎再次遭受致命袭击,法国政府为了保障国家安全,将115 000名士兵和警察部署到街道上去巡逻。

中国严打的案例也不鲜见:公检法系统不断加大对犯罪活动的惩罚力度,并在一定时期集中力量针对特定违法行为进行严厉打击(即通常所谓的严打运动)。在1983年施行了第一次“严打”之后,公安部门又在1996年、2001年和2010年分别实施了三次大规模的“严打”。

对于政府而言,这些部署和行为我们都已经习以为常。每次面临重大事件或者危机发生的时候,大量的资源就会被集中起来来进行应对。如果换一个角度,从经济学的观点来看,这些行动是否能有效地减少违法犯罪行为?潜在的违法犯罪是否会对这种严打行动做出反应?一旦严打行动取消,是否会继续发生一连串的犯罪行为?是否应当在事前公开严打行动?这种行动会对潜在的违法犯罪行为有教育效果吗?此外,严打行动应当持续多久?这些重要的问题仍然没有得到很好的解答。因此,本书的三个研究案例旨在通过提供一些实验性证据对这些问题进行初步的探讨。注释[1]英文为:Drive Sober or Get Pulled Over。

1.5 在不确定性环境下的稽查严打政策

严打政策毋庸置疑在现实社会中具有非常重要的作用,但是如何在实验室中研究严打政策是一个非常大的挑战。为了能够更系统地刻画严打政策的不同方面,本书吸收了三个研究案例,这三个研究案例是相辅相成的。第一个研究案例的主要目的是探讨否存在替代方案来提高系统性稽查方案的效率(即严打行动)。第二个研究案例从相对有效性和效率的角度考察了各种外生性严打政策。第三个研究案例从理论和实验角度考察了内生性严打的有效性问题。

通过探讨在不同情境背景下严打政策的运用,本书竭力展现使用严打行动的全貌。值得特别指出的是,三个研究案例均在模糊性环境下测试了不同的严打机制。所谓模糊性,即个人虽未被告知稽查概率,但可能凭借经验推断出来(Ellsberg,1961)。在决策理论中,不确定性分为两种:风险(risk)与模糊(ambiguity),这两种概念既有联系又有区别。风险指的是在概率分布已知(known probability)的情况下的不确定性,而模糊则表明在概率分布未知(unknown probability)的情况下的不确定性。比如对于投硬币正反面的打赌(假设硬币是在理想的状态下的,不考虑其他影响因素)属于风险性不确定性,每次赢的概率为50%。而对于明天是否下雨的打赌则属于模糊性不确定性,因为下雨的概率是未知的。在不确定的情况下,虽然(主观)期望效用理论(subjective expected utility)已经成为现代经济学中最广泛应用的理论之一,但是该理论并没有区分风险和模糊的概念,一些在现实环境中的现象都对此理论提出了挑战。之所以在实验室中创建模糊性环境,是因为执法部门通常并不会提供有关稽查概率的信息。例如,在税务领域,美国国家税务局有意识地保持稽查甄选流程的不确定性(Alm et al.,1992)。

1.6 实验研究方法的一些优势

三个研究案例均采用实验方法。因为欺诈行为天然具有隐秘性的特点,所以很难获得可靠的实证数据。此外,运用的实验方法有着诸多优点:第一,因为被试是被随机分配到控制环境中,所以有助于排除选择偏差;第二,在实验室中可以观察许多在实证数据中无法直接观察到的变量(如期望值);第三,在实验室中可创造一个良好的控制环境(如信息环境和外生随机过程);第四,实验方法能提供可复制数据;第五,在已知变量内、外生性的前提条件下做出因果推断更加清晰。

使用实验方法(实验室实验、现场实验)获得数据,是为了更好地阐释欺诈行为的决定性因素以及衡量各种威慑政策的效率。鉴于以上优势,实验方法可被认为是探究不同稽查体制合规性的原因和影响,以及执法机构如何最优地预防和抑制违法犯罪等关键问题的最适宜的方法。

当然,实验方法也招致了诸多反对意见,其中最为重要的反对观点指出,实验室实验是在高度人为设定的环境中展开的,因此实验结果无法简单地外推至真实世界,这就意味着实验室实验缺乏现实性和外部有效性。Levitt和List(2007)定义了普遍影响实验室实验的五大因素,分别是:(1)道德伦理和社会规范的约束;(2)实验员效应;(3)决策时嵌入的情境;(4)样本选择的代表性问题;(5)博弈的初始禀赋问题。Falk和Heckman(2009)以及Camerer(2015)两篇文章就Levitt和List(2007)中提及的实验室实验的限制性因素做[1]出了一一回应。注释[1]参见Fréchette和Schotter(2015)以及Charness和Fehr(2015)。

1.7 本书研究案例的主要内容介绍

1.7.1 案例一:在不确定性环境下的稽查机制优化设计

第一个研究案例探讨了一个成本较低的间断性(intermittent)稽查方案是否能够维持与系统性稽查方案相同的威慑效果。准确来说,它主要研究了当稽查(非)规律与频率存在不确定性时,对在公共品博弈背景下的合作的影响。已有研究文献表明,惩罚机制有助于减少公共品博弈中的“搭便车”行为(Fehr and Gächter,2000;Masclet et al.,2003;Bochet et al.,2006;Carpenter,2007),特别是由惩罚机制与奖励机制所带来的偏离集体成员捐献均值的正负向偏差均能增进效率(Falkinger et al.,2000)。然而,这项机制假定稽查是完美、连续、无成本的、无偏差的,尽管它有助于消除稽查的不确定性,但仍可能导致稽查成本过高。

那么,探究在不确定情境下是否能以更低频稽查来维持合作就有着重要的现实意义,如果答案是肯定的,就能最大限度地降低稽查成本,具有更强的现实性和可行性。更准确地说,这项研究是在稽查可能性不明确的公共品博弈中,施以低于其他小组平均水平的集中惩罚。随着时间的推移,我们在不同实验组中操纵稽查的强度和规律性。经过多个阶段后,所有实验组均会经历一个稽查策略转换:稽查力度降为零,但被试对这种转变毫不知情。这种研究设计的目的在于了解个人在稽查概率发生剧烈变化时如何更新有关被稽查概率的感知信念。

本案例的研究结果显示,当人们在实验机制转换之前经历过高强度系统性稽查时,被试会向下修正关于被稽查概率的感知信念,并在稽查消失后立即降低对公共品的捐献额。相比之下,当稽查最初并不太频繁和不规律时,被试将保持坚定合作的信心,并在稽查撤回后继续保持合作。

我们认为其主要原因在于稽查的不规则性和不确定性会导致对稽查概率的判断更加困难,因此在无法准确判断稽查概率的情况下,被试更愿意相信稽查的存在,采取合作的行为来规避风险。通过提升进一步稽查的频率和惩罚的严厉性,本研究还发现频繁和严格的惩罚机制对促进进一步的合作存在着教育效果。

本研究的政策建议在于,在资源稀缺和预算赤字时期,研究发现可能对公共政策具有重要影响。如果一个公共政策必须依赖系统性稽查和严厉惩罚才能达到高水平的遵从度,那么也必将因高昂的稽查成本而付出代价。因此,如果在实际政策执行中考虑稽查成本,一个更加可行的政策建议就是:实施不确定性的、强度更低的稽查测量,同时提高惩罚力度,例如增加罚款额度。1.7.2 案例二:不同严打稽查政策的效率研究

第二个研究案例的主要目的在于研究各种不同稽查严打政策的相对效率问题。在假设稽查资源是有限的情况下,是应该将稽查资源集中在一段有限时间内进行稽查严打,还是随着时间平均分配?哪种策略更加有效?经济学的一个重要的研究内容就是资源的使用效率问题,但是在稽查严打方面对于效率的研究,经济学家们却未给予足够的关注。

为了探究严打在遵守规则方面的相对效率,我们在法国的一个大城市进行了一项涉及公共交通乘客的实验室现场实验(labin-the-field)。该研究的一个重要贡献在于我们第一次能够甄别出真实世界的不诚实行为,并且将这种不诚实行为和实验室中的决策选择联系起来。具体而言,我们通过验证被试在实验结束时能否出示有效的车票,并让被试自我报告无票旅行的次数,以甄别出真正的逃票者。

此项甄别有助于观察真正的逃票者是否在实验中表现出异于非逃票者的行为,从而为实验的外部有效性提供证据。此次公共交通实验有助于研究欺诈行为如何对引入的各种稽查机制做出反应。在虚拟乘坐公共交通实验开始之前,被试需要选择是否为此次乘坐公共交通工具购票。

本案例研究了不合规行为是如何随着时间推移而演变的,这取决于在集中时间内是否被重复稽查与在分散时期中不规则稽查之间的博弈。更加具体地说,该研究分析了稽查在实施时和撤回后,个人对连续稽查的反应。我们还在实验中测试了早期或稍后阶段引入严打是否更为有效,以及是否应当在事先宣布严打行动。

此研究的主要研究结论如下:(1)与集中严打相比,分散性随机稽查能更有效地减少逃票行为,这种策略对现实世界的欺诈者影响更大;(2)长期稽查严打虽然减少了严打期间的逃票行为,但一旦严打结束,就会导致逃票行为集中爆发;(3)若事先告知稽查严打行动,将导致在非严打时期发生更多逃票事件。与分散式随机稽查相比,严打仅在短期内对买票行为产生积极影响。长远来看,严打可能会带来潜在的不利影响,因为在严打结束后逃票行为更加猖獗,甚至高于实施严打行动之前的水平。

本研究案例结果表明,在模糊性情境中,短时间内的稽查严打与随机稽查一样有效,但是长期来看,无论是在促进遵守规则还是执法机构成本收益方面来说都可能非常低效。1.7.3 案例三:在内生性严打稽查框架下信息披露对纳税遵从度的影响

第三个研究案例重点研究了内生性稽查严打机制。在现实世界中,稽查严打往往因高犯罪率和严重事故而被触发,具有内生性的特点。如前所述,在巴黎发生两起恐怖袭击不久后,法国政府实施了两次打击恐怖主义的行动。在中国,高腐败率触发了一场声势浩大的反腐败行动(既拍“苍蝇”又打“老虎”);针对新疆所发生的暴力恐怖事件,有关部门开展了一系列反恐行动。在美国,因一起严重交通事故,纽约市实施了对骑自行车者的严打行动;因暴力杀人案火速升至43年以来的高位,巴尔的摩市启动了一场名为“放下你的枪”的严打行动。该类事件数不胜数,在后面还会做进一步阐释。

尽管严打行动具有比较大的影响,但是从理论和经验的角度来看,迄今为止它并未得到经济学家的重视。为了弥补这一空白,本案例提供了一个简单的博弈论模型来刻画这一问题。通过构建博弈论模型来捕捉无处不在的内生性严打现象。

该理论模型是基于逃税为背景展开的,其中包括个人为逃避法定纳税义务而采取的非法和蓄意行为(Alm,1999)。选择逃税为背景有两个原因:一是逃税可能在所有经济犯罪中最为常见(Alm et al.,1993);二是在税务欺诈领域使用稽查严打并不少见。例如,英国税务海关总署对税收欺诈行为进行了严打,成果显著,税收收入增加了72亿英镑。中国政府也对偷漏税行为进行了多次严打。美国也不例外,美国严打离岸避税行为的步伐始终未曾放缓。其他的包括欧盟委员会已开始加强严打企业逃税行为。在模型中,稽查概率有两种,即低和高(高稽查概率代表严打)。概率的高低取决于先前的稽查结果。当平均合规水平低于某一阈值时,会触发稽查概率提高(严打发生),直到其达到阈值为止。该模型的基本预测如下:(1)被试在非严打时期将避税,在严打期间则履行纳税义务;(2)公布严打行动对纳税遵从水平并无影响;(3)策略性的互动是预测严打行动发生的关

[1]键。

随后我们利用实验室实验在不同信息设定情境下的结果来验证对该模型的预测。实验结果显示,在未宣告严打行动的处理组中,83.14%的被试在严打期间全额申报了他们的收入,因而严打持续时间很短,这表明了此类内生性严打的有效性。甚至在非严打阶段,被试所申报的收入也远高于理论预测水平。这与对现实世界观察的结果相一致:人们普遍认为在现实世界中保持着较高的遵从度水平,尽管实际稽查概率和所处罚金并不高。

本研究案例的一个关注点是信息如何影响纳税遵从行为。虽然信息在理论层面上不会对纳税遵从度产生影响,但是在现实世界中,我们观察到严打行动有些是事先公开的,有些是事后公开的,有些是不公开的。到底哪种信息设定最有效还没有相关的文献研究。因此,我们在实验中特意模拟了这些信息设定。实验结果表明:无论事前或事后公开严打,均有助于大幅提升纳税遵从度。一个有意思的研究发现是:只有当群体具有相互依赖特征时,内生性严打行动才能发挥显著效果。后文将会对这些结果进行进一步的讨论。

本研究案例的结论可能对如何设计更有效的严打政策产生重要影响,因为计划不周、思虑不全、管理不善的严打政策,可能造成的问题远比它们所解决的多。实验研究结果显示,被试能够根据严打行动的发生而迅速做出反应,这或许意味着长期性严打也许并不必要。事实上,Sherman(2014)发现在警察巡逻15分钟后,巡逻效果就开始下降,因此认为警察巡逻时间更短暂、次数更频繁,收效会更好。另一个直接的政策意义在于探讨了是否应该公开严打行动。研究结果表明:如果严打是内生性的,那么最好公开严打行动而非保密。1.7.4 本书案例研究的主要发现概括

综上所述,这三个研究案例的结论为决策者设计更高效的稽查政策提供了新的实验性证据。具体来说有如下几点重要结论。

首先,第一个研究案例的实验室实验结果表明,在不确定环境中,与定期、持续性稽查相比,使用间歇性和不定期稽查策略收效更好,因为个人会更难以预知违规的后果。此外,间歇性稽查比定期和系统性稽查政策成本更低。

其次,第二个研究案例的现场实验结果表明,从政策角度来看,当外部施以严打时,在更长时间和更广范围内的分散性稽查比长期在相同时间与范围内进行集中稽查更有效。此外,实验结果进一步显示,那些在现场的逃票者更有可能在实验室实验中选择逃票,这对实验室实验的外部有效性给予了实证支持。因为在实验室中不仅有利于探究欺诈行为的决定性因素,而且在操纵重要政策变量时,更便于观察个人将如何反应。

再次,第三个研究案例的结果表明,如果内生性地出现严打行动,即使是在非严打时期,被试也会表现出一定的遵从度;无论是提前抑或事后公布严打行动,均有利于大幅提高纳税遵从水平。另外,遵从行为将随着严打出现而迅速做出反应,被试会迅速调整自身行为,来尽量避免触发严打。

最后,研究发现,当社会成员的行为彼此有策略性依赖时,严打行动才能产生显著影响。

总而言之,尽管将这些研究结果直接应用于实践中仍需谨慎考虑,我们仍相信这些研究发现对那些正考虑采用哪种干预政策来应对非法行为的决策者而言,具有重要价值。

这三个研究案例共同围绕如何为决策者设计出更有效的稽查政策这一核心问题进行了反思,并提供了直接证据。我们相信本书可以为以后的研究提供具体的研究范例,能够激发后来者的研究灵感,同时也希望政策制定者能够积极地吸收一些研究成果并且将其转化到实践中。注释[1]稽查概率不仅取决于被试自身的选择,而且受群体选择的影响。

第2章 在模糊性环境中稽查对公共品博弈合作的影响:一个实验经济学视角

2.1 引言

众所周知,公共品的供给存在“搭便车”的问题(Isaac et al.,1985;Andreoni,1988;Ledyard,1995)。很多经济学家针对如何解决这一问题进行了很多研究。其中一个被普遍证实有效的机制就是引入惩罚措施(Fehr and Gächter,2000;Masclet et al.,2003;Bochet et al.,2006;Carpenter,2007)。

虽然惩罚能够增加合作,但是惩罚本身也同时会有一些负面作用和不利影响,例如短期内的效率损失问题,因为惩罚本身导致了成本的增加。另外一个负面作用就是可能同时改变纯粹的利他行为,具有一定的挤出效应,特别是在存在报复心理的情况下(Gächter et al.,2008;Engelmann and Nikiforakis,2014)。因此,针对惩罚本身,也有一些经济学家研究如何更加有效地利用惩罚机制。他们提出的建议包括:(1)以法律制裁代替私人惩罚来降低报复的可能性;(2)惩罚要具有足够的威慑力;(3)采取补贴和税收奖励(惩罚);等等(Yamagishi,1986;Polinsky and Shavell,2000;Andreoni and Gee,2012;Tyran and Feld,2006;Andreoni and Bergstrom,1995;Falkinger,1996)。这些措施可能会解决其中的一些问题。其中一个有意思的机制建议要根据小组成员的平均捐献额(代表了一种社会规范)的偏离大小来决定是惩罚还是奖励(Falkinger et al.,2000)。理论模型和实验结果表明该建议的优点在于可以提升效率,但是该机制假定偏差是可以被连续测量的,因此该机制可能需要较高的监督成本。而且在越来越注重公民隐私的社会中,个人也可能会拒绝这种持续的监督和稽查机制。

在本研究案例中,我们的主要目的是研究在具有模糊性的环境下一个中央集权的惩罚机制的效率问题。我们在一个动态环境中改变稽查的概率和(不)规律性,探究是否可以提高在公共品博弈中外生性[1]制裁机制的效率。在此研究中需要特别强调一下“模糊性”的定义。此处我们定义“模糊性”为实验被试关于稽查概率的信息并不是公开[2]信息,被试只能通过自己的经验来推断稽查概率的分布。通过改变稽查频率的方法,我们分析了在经历了一系列连续稽查或一系列较低频,且不规则但惩罚措施较严格的稽查后,个人如何调整其对公共品的捐献水平。基于现有文献的研究结果,我们推测,在经历了不规则稽查而不是持续稽查之后,合作可以持续更长时间。如果人们不知道稽查的确切概率,(非)规则可能会限制学习真实稽查概率的能力,从而影响其对捐献的成本和收益的评估。事实上,在不同的框架中已经表明,在模糊情况下,即使在制度改变之后,间歇性刺激也会比连续刺激更持久地影响个人行为。同样,Bereby-Meyer和Roth (2006)的研究表明,当激励的概率不确定且不是连续强化时,重复博弈的学习过程要慢得多。这也可以解释在例如道路限速、公共交通或税收稽查等现实政策中,为什么稽查频率往往是不透明的且有一个动态变化的过程。

一方面,以前的研究发现了不确定性对提高遵从度有正面积极的影响(Friedland,1982;de Angelo and Charness,2012;Tan and Yim,2013),但是另一方面,其他人的研究则表明不确定性的增加可能会带来一定的负面结果。特别地,Alm等(1992)发现税收支付如果在公共品收入之间被再次分配,不确定性反而会带来负面影响。因此,在现实生活中,也可以发现相反的例子:例如,在交通信号灯处使用固定摄像头,机场一直需要安检,等等。模糊及非规律性的稽查是否能够提高公共品供给并没有一个明确的答案。

为了研究这个问题,我们在本研究中设计了一个三人一组的线性公共品博弈实验。如果在某一轮次有稽查的情况下,其他组员的平均捐献的负偏差会触发制裁。与Falkinger(1996)的设计机制不同的是,出于简化的目的,积极的偏差并没有得到奖励。特别重要的一点就是在任何时间里,参与者都未被告知稽查发生的概率信息,他们必须通过参与博弈从自己的经验中推断出这一点。之所以强调这一点,就是因为在以往的文献中,被试往往被告知真实的稽查概率,但是我们认为在现实中,执法部门不会这样做,因此这也是本实验区别于以往文献中的实验的一个重要特点(特别是区别于Alm et al.,1992;Mittone,2006;Kastlunger et al.,2009;de Angelo and Charness,2012)。

此外,尽管博弈持续了50个轮次,但是在22个轮次后通过完全取消稽查,我们故意引入稽查概率的急剧转变。在稽查策略改变之前,稽查频率和制裁水平在不同实验组之间进行改变。在连续实验组(continuous treatment)中,对前22个轮次均进行稽查。在间歇组7(Intermittent 7)中,只有总共7次稽查在不同轮次间被随机分配,但制裁水平提升了两倍,这样做的目的在于对风险中性的被试维持大致相等的预期制裁成本,使实验组之间具有可比性。这两组实验组是主实验组。原因在于这两种主要的处理方式使我们能够衡量在稽查概率被降为零后,稽查的不规则性和频率如何影响被试的稽查概率认知和对公共品的捐献行为。

为了更进一步探究非连续稽查的效率问题,在其他实验组中,我们进一步减少了稽查次数,从7次减少到5次,从5次减少到3次,并分别称之为间歇组5和间歇组3(Intermittent 5 and Intermittent 3)。为了检验不同罚款力度对行为的影响,我们还引入了与连续组的制裁程度相同但是稽查概率和间歇组7一样的实验组,将其命名为Intermittent-7-Low,引入该组的目的在于要测试公共品捐献行为的敏感性以及与稽查数量之间的关系,以期将稽查违规行为的影响与罚款水平的影响区分开来。[3]

研究结果表明,假设稽查频率和惩罚力度在稽查机制改变前都足够高,那么在模糊性环境下,不规律的稽查策略效率是最高的。事实上,在连续稽查实验组中,在稽查策略转变前被试会倾向于在高捐献水平上合作,但取消稽查后则几乎立即选择“搭便车”。相比之下,在间歇组7中,成员对公共品的捐献额度与在稽查策略转变之前连续组中的一样多,但在稽查策略发生转变后,合作衰退发生较慢,并且比连续组更平稳。

对于上述结果发生的原因,我们认为这主要是由于参与者基于经验对稽查概率认知的高度“锚定”以及对预测偏差的较低反应造成的。被试需要记住更多的信息来改变其对稽查概率的信念更新,这必将加剧信念更新的难度。连续组的情况则不同,当稽查频率变动较小时,被试可以更容易根据前一时期的预测偏差来更新其对新的稽查频率的认知。因此,在连续组中,稽查概率的感知强度在稽查策略发生改变后剧烈变化,从而影响了合作水平。与之相反,在间歇组中稽查概率的感知缓慢平稳下降,且始终高于持续组,这也解释了其对公共品的捐献额度为什么没有发生剧烈的变化。基于这些发现,本研究案例提出的政策建议就是:在模糊性环境下,稽查严打未必是一个好的选择,特别是考虑在实际情况下稽查成本一般都比较高。我们建议可以强化稽查概率的不规律性,并且不披露相关的稽查概率信息,这也和目前的一些政策措施一致,例如税务稽查中的双盲抽查机制。

本研究案例其余部分的组织结构如下:第2.2节简要回顾了相关文献;第2.3节介绍了实验设计和程序,并阐述了我们的预测;第2.4节报告实验结果;第2.5节讨论这些结果,得出结论并对未来研究方向进行展望。注释[1]外生性的意思是惩罚机制是事先给定的,不受被试自身行为的影响。[2]在英文里,uncertainty和ambiguity两词具有一定的共同点,两者和risk的区别在于risk是可以计算出的明确的概率,而不确定性和模糊性则无法计算出明确的概率。[3]此处的惩罚力度特指罚款额度,并不是罚款额度和稽查概率的乘积。

2.2 文献综述

在现有的研究集中惩罚机制的理论文献中,有几种理论探讨了不确定性在遵守规范方面的作用。例如,Lazear(2006)通过对不同具体案例的探讨来说明什么时候信息应该更加明确以及什么时候信息不能公开。在拉齐尔(Lazear)的论文中,他举例说,教育工作者担心高风险测试会促使教师及其学生只关注测试,而忽略其他未经测试的知识方面。假设有人反驳说,虽然这可能是真的,但知道一些事情比什么都不知道更好,许多学生即使通过学习测试也会多少有所收益。拉齐尔还举了一个如何减少超速驾驶的例子来表明高风险测试的最佳规则取决于学习成本和监控(稽查)成本。对于高成本的学习者来讲,当监测技术效率低下时,最好公开将要测试的内容。这类似于告诉司机警察会在哪些路口执勤。如果知道了这些信息,驾驶员至少在这些道路上不会超速。如果当警察人数众多或相对于超速驾驶带来的罚款较高时,最好公开这些信息,这样可以形成较高的威慑。就学习而言,高成本学习者的孩子不太可能学习所有材料,因此在被告知考试内容重点时会学到更多,否则他们可能什么也不学。

Eeckhout等(2010)提出了一种基于激励的理论来研究“随机严打”政策,即高强度警务的间歇期是否可以成为最佳威慑政策。与我们的研究不同的是,打击行为是公开的,也就是存在预先的信息披露。在埃克豪特(Eeckhout)等的理论模型中,一个设定就是人们会事先被告知严打发生的时间信息。这个设定在现实中当然也有例子,但是我们认为如果严打的目的是惩治违法行为,那么公开之后严打的效果就会大打折扣,因此,我们重点强调了在模糊环境中参与者的概率感知行为。在法律和经济学的文献研究中,一些理论认为,最大化不确定性有助于遏制犯罪,因为个人无法准确评估参与此类行为的真正风险(Ross,1984;Harel and Segal,1999;Bebchuk and Kaplow,1992),此类推论的暗含假设是潜在的违法犯罪行为具有风险厌恶的特征。在税收领域,Snow和Warren(2005a)在理论上表明,稽查概率的更大不确定性只会鼓励具有风险厌恶和模糊性厌恶的纳税人的遵从度提高。同时Snow和Warren(2005b)认为,只有在个体相信大部分稽查成功概率大的情况下,提高对逃税行为稽查概率的不确定性才能相应提高纳税遵从度。Snow和Warren(2007)的另外一个研究表明,对稽查概率主观认知的贝叶斯信念更新会导致比没有这种更新时发生更多的逃税行为,这表明在这种情况下提高不确定性可能会适得其反。然而,这些研究并没有考虑不同稽查模式之间的策略转变,也没有实证的支撑。

Friedland(1982)通过对纳税遵从的实验室实验表明,关于稽查的不确定信息增加了纳税遵从度。Tan和Yim(2013)比较了总量控制的稽查模式与不确定性策略性稽查模式并将两者和一个固定税率的税制进行了比较,发现不确定性模式增加了纳税遵从度。通过比较在税收和公共品两种不同情况下增加不确定性产生的影响,Alm等(1992)发现不确定性会增加在税收环境下的遵从度,但公共品情况下的遵从度并不会增加。

在一个关于开车是否超速背景的实验中,de Angelo和Charness (2012)通过“合成抽签”(compound lottery)的方法引入了稽查威慑的不确定性,他们的研究结果表明,不确定性的增加会降低超速的可能性(类似的结果见Backer et al.,2003)。此外,Spicer和Thomas(1982)没有发现不确定性对税收遵从的积极影响。我们的工作与上述研究的不同之处在于,我们的目的不是探讨模糊性本身对被试行为的影响。相反,我们只是引入一个模糊性环境来改变稽查的顺序和稽查的概率,以此来探究在彻底取消稽查之前,规律性稽查与不规律性稽查模式对遵从度的影响。

本研究案例采用的设计方案和Kastlunger等(2009)的研究有相似之处。他们也比较研究了纳税博弈中的遵从度问题。实验初始,其稽查策略是连续的,其后改为间歇性稽查方式。一个重要的区别就是:在Kastlunger等(2009)的实验设计中,被试被告知了平均稽查概率,但是不知道其在整个实验期间的分布情况。他们的实验结果显示,如果稽查资源集中在实验轮次的早期,纳税遵从度会比较高,但是之后纳税遵从度会降低,原因在于如果被试早期经历了很多稽查,在稽查总量一定的情况下,被试会比较容易推断出后期稽查的概率比较低,因此会导致比较低的遵从度。在我们的设计中,我们也同样改变了稽查频率,但是主要目的在于要研究过去的被稽查的经验如何引发学习过程,即被试的信念是如何更新的。我们的设计和Kastlunger等(2009)的设计还有一个重要区别在于,我们的研究背景是公共品博弈而非纳税博弈,且被试不了解稽查的总体概率。Maciejovsky等(2007)也进行了和Kastlunger等人类似的研究。

2.3 实验设计及预测

2.3.1 实验组

我们的主要实验设计包括两个实验组:Cont-Low-Fine (continuous low fine,意为连续低惩罚组)和Int-High-Fine-7 [1](intermittent high fine,意为间歇高惩罚组)。为了方便,下文一律用Cont-Low-Fine和Int-High-Fine-7代指该实验组名称。在其他的实验组中,我们把间歇性稽查组的稽查频率从7降到5、从5降到3来研究是否存在最优的稽查频率。这两组实验组被称为Int-5-High-Fine(意为间歇高惩罚组5)和Int-3-High-Fine(意为间歇高惩罚组3)。为了区分惩罚力度和频率,我们又引入了不同的惩罚力度,这一新的实验组被称为Int-7-Low-Fine(意为间歇低惩罚组7)。因为在Cont-Low-Fine中的稽查策略改变之前稽查是连续的,为了验证这种连续的稽查和近似连续稽查的效果是否相同,还引入了一个近似的连续稽查组,同时也改变了稽查的力度,该实验组被称为Int-19-Low-Fine(意为间歇低惩罚组19)。

下面我们就主要实验组的实验设计进行更加详细的说明。

Cont-Low-Fine实验组

该组的主要组成部分是50个轮次的公共品线性博弈。在该公共品博弈中,每个小组都由三个固定的成员组成。为了更清楚地研究稽查策略的影响,我们设定每个小组的组成人员在整个实验期间保持不[2]变。在每一个博弈轮次开始时,每个小组成员都拥有20实验币[3](experimental currency unit),每个被试需要决定对公共账户捐献出多少单位的实验币。每个博弈轮次包括三个阶段:第一个阶段为信念诱导阶段,该阶段的目的是了解被试对稽查的概率的判断;第二个阶段为捐献阶段,被试决定捐献多少拥有的实验币到公共账户;第三个阶段为处罚阶段,在该阶段,如果有稽查且条件符合触发惩罚机制的情况,会对“搭便车者”进行惩罚。下面更具体地说明这在三个阶[4]段中的具体做法。

在捐献阶段,小组成员必须选择他们为小组账户捐赠实验币的数量(0~ 20),剩余额度被保留在他们的私人账户中。三个小组成员对公共账户的捐献总额平均分配,公共账户的边际人均收益系数(marginal per capital return rate)为0.5。

在捐献阶段,小组成员的收益函数可以写为:

式中,c 为个人的捐献额度;c 为每个小组成员的收益额度, ikk=1,2,3。

下一个阶段涉及惩罚。在某些轮次中,三个小组成员的捐献会受[5]到外部稽查。如果稽查显示一个小组成员的捐献额度少于其他两个小组成员的平均值,那么罚款就会降低其在第一个阶段的收益。其罚款是其他两个小组成员的平均捐献额度与个人捐献额度之差的1.25

[6]倍。如果在该期间没有稽查,或者如果稽查显示个体捐献额度不低于其他小组成员的平均水平,则该捐献阶段的收益保持不变。出于简化设计的目的,这里的设计机制与Falkinger(1996)建议的方法有所不同,因为我们没有奖励高于捐献平均值的正偏差,只保留了惩罚的部分。

在惩罚阶段的末尾,收益函数可以写为:

其中,是其余两个小组成员的平均捐献值。

除了对他人捐献的策略不确定性之外,我们还引入了一个不确定(模糊性)的决策环境。个体未被通知在某一特定时期内将对捐献进行稽查的可能性,他们事先也并不了解在该实验中的稽查总数。

这里只是在实验局最开始阶段告知被试小组的选择在某些轮次有被稽查的可能性。在每一个轮次结束时,被试会收到关于小组捐献加总数额的反馈,以及稽查是否发生和他们自己被罚的额度(如果惩罚发生)。因此,他们必须从自己被稽查的经验中学习稽查概率并更新关于被稽查的信念。事实上,在前22个轮次的每一个轮次中,稽查都可能会发生。之后从第23个至第50个轮次,我们把稽查概率降为0,但是没有把该信息告知被试。稽查策略改变的目的是了解被试的学习速度,也就是被试需要多久才能意识到已经没有稽查发生了。

信念诱导

为了了解被试对稽查概率的判断如何影响了他们对公共品捐献的选择,在每一个阶段的开始,我们测量了被试对稽查发生概率的主观认知。在选择他们的捐献额度之前,他们必须报告一个介于0和100之间的整数,以表明他们预计在当前期间稽查发生概率的可能性。根据激励相容原则,我们采取了二次平方的计分规则(Nyarko and Schottter,2002)。具体而言,参与者的收益是2欧元减去与预测准确性负相关的数字。减去的额度是报告的稽查概率与真实结果之间偏差的平方的两倍。假设报告的数量是∂,那么预测的收益由下式给出:

如果被试选择0或100的预测,则会导致最差或者最好的结果。被试被告知,最大化收益的最佳策略是表明他们对稽查发生的机会数量的真实信念。

实验收益

参与者将获得50期(1期即为1个轮次)博弈中每个轮次的收益加上50期中的一期可能得到的预测报酬,这些具体轮次会在实验结束时被随机抽取。我们只选择一期的预测来支付报酬,其目的在于限制投机风险(Blanco et al.,2010)。

Int-High-Fine-7实验组

间歇组与连续组相比,主要的区别有两个。第一,稽查频率在稽查转变之前间歇性发生,平均来看,每三个轮次会发生一次稽查,对于每个小组,我们在前22期中会稽查7次,其中包括对第22期的稽查。[7]我们使得所有实验组在制度转变前的上一个稽查期中保持一致。其余稽查随机独立分布于各期中。与连续组一样,在第22期后将不再进行稽查,稽查的数量、频率和分布情况也不被知晓。第二,罚款系数为Cont-Low-Fine组的3倍(即为3.75而不是1.25)。我们通过较高水平的制裁来弥补稽查概率较低的情况,因此针对风险中性个体的预期惩罚成本在两个实验组中相似,这也让两个实验组具有可比性。

该实验组的收益函数可以写为:

其他规则均与Cont-Low-Fine实验组相同。因此,如果我们观察到该组实验与前一种实验之间存在行为差异,那么该差异应该归因于稽查策略的不同。

为了进一步分离出稽查频率和惩罚力度,并找出最有效的稽查频率,我们还设计了额外的一些实验组。这些实验组和上面两组主要的实验组有一些细微的区别,下面对这些区别进行介绍。

其他实验组

为了研究公共品捐献对稽查频率的敏感性,我们设计了额外的实验组——Int-5-High-Fine和Int-3-High-Fine实验组,这两组都与Int-7-High-Fine一样,区别在于它们在前22期中的稽查次数分别从7次降到5次和3次。同样,这些信息并未告知被试,惩罚系数还是3.75。为了分离出稽查频率对决策的影响,我们还设计了Int-7-High-Fine实验组的一个变异:Int-19-Low-Fine,在该实验组中我们把稽查频率从100%降到了85%(也就是说,稽查总数从22次降到了19次,这样做的目的是为了检验在非极端情况下被试行为是否发生变化),在该组中惩罚系数是1.25,其他条件均与Cont-Low-Fine实验组一致。

对风险态度、模糊性偏好和损失厌恶的测量

在每个实验局开始之前,我们均对被试的风险态度和模糊性偏好在一个收益框架(gain domain)下进行测量。具体做法是:在阅读实验说明前,我们要求被试按照类似于Fox和Tversky (1995)的设计对一个明确的和模糊的收益选项进行选择,每个选项对应了一个可能的收益。在实验结束时,随机抽取两组决定中的一种。随后,使用[8]类似于Gächter等(2010)中的设计对被试的损失厌恶进行测度。这些选择在实验开始时被做出,但结果只在公共品博弈后公布,其目[9]的是为了避免收入效应。2.3.2 预测

首先,我们假设在有单次博弈的情形下,被试能够准确地预测稽查是否会发生。惩罚是可信的,因为它是外部给定的。在没有稽查的情况下,“搭便车”是一项占优策略,因为从小组账户中返还的边际资金比私人账户少(0.5 vs 1)。

在存在稽查的情况下,有多个纳什均衡,因为每个可能的捐献水平都是一个纳什均衡。其原因在于,如果所有成员的捐献额度相同,惩罚就不会发生。虽然存在很多个纳什均衡,但是如果考虑收入最大化的情况,那么全部捐献就是一个收入占优的纳什均衡。

其次,我们假设个人对被稽查概率有相同的先验认知,并且这些认知是风险中性的。在Cont-Low-Fine、Int-19-Low-Fine和Int-Low-Fine实验组中,如果被试认为被稽查的概率大于40%,则捐献额应为20,也就是所有的禀赋,否则捐献额应为0。在Cont-High-Fine、Int-7-High-Fine、Int-5-High-Fine、Int-3-High-Fine实验组中,如果被试认为被稽查的概率大于13%,则捐献额应为20,否则为0(见附录2.1的证明)。根据倒推归纳法,只要重复博弈是有限的,单次博弈的均衡结果在重复博弈中也适用。另外需要指出的是,因为小组成员在实验中一直保持不变,因此被试的行为也有可能受到声誉的影响,但是如果该影响存在,则其在所有实验组中都应该是一致的,因此不会影响处理效应的推断。2.3.3 学习模型

前面已经提及,参与者必须从他们过去的经验中推断稽查的概率分布。了解被试如何从过去的经验中推断稽查的概率分布对解释他们的行为具有重要意义。我们提出了一个简单的学习模型来帮助我们更好地理解这一过程。首先,我们假设在每个阶段开始时,参与者根据他们过去的稽查经验更新他们的认知。其次,我们假设他们是有限理性的且被试不是根据贝叶斯规则,而是根据对认知要求较低的类贝叶斯过程(Hogarth and Einhorn,1992;Hogarth and Villeval,2010)更新其认知的。此外,我们假设一个简单的“锚定”和调整过程,即判断以前一次评估为基础,并根据最近一段时间的经验进行更新。模型如下:

式中,S表示在经历了k(0≤k≤1)个轮次后的下一个期间稽查k将会发生;S表示在上一个期间会被稽查;s(x )表示在第k个期k-1k间是否会被稽查,如果被稽查,则s(x )=1,否则s(x )=0;w kkk是确定最新的经验证据如何修改先前认知的调整参数。该过程与[10]EWA强化学习模型类似。

当[s(x )-S]≤0时,假定w 与S成比例,我们有:kk-1kk-1

模型可以被改写为:

α和β分别代表被试对稽查过度或不足预测的态度。我们预计被试的关于稽查概率的信念更新速度受到稽查频率的影响。事实上,在连续实验组中,当经历的稽查频率变化水平较低时,α 和β应该更高。也就是说,被试更重视最新的证据,因为需要较少的信息来更新信念认知。相比之下,在间歇实验组中,参与者应该更加重视S,k-1因为需要更多的信息来评估稽查概率的变化。

我们用R软件进行了模型的仿真模拟。图2-1显示了当有超过50期时这些假设的仿真模拟结果,此处对Cont-low-Fine实验组我们设定α=β=0.05,Int-High-Fine-7组为α=β=0.02。对于每一个实验组在图2-1中显示的结果取的是30次随机仿真模拟的平均值。另外我们也对其他的α和β的取值进行了模拟,例如我们也模拟了α>β和α<β的情况,发现结果和上述取值没有显著的差异,因此上述取值是比较稳健的。[11]图2-1 对Cont-Low-Fine和Int-7-High-Fine中信念学习模型的模拟

[在Cont-Low-Fine中,α=β=0.5;在Int-7-High-Fine中,α=β=0.2)

图2-1显示我们的模型预测了不同的学习路径。在Cont-Low-Fine实验组中,稽查概率发生的主观信念在早期阶段增加并在稽查停止后立即大幅下降。在Int-High-Fine-7实验组中,稽查概率发生的主观信念在第22期之后至实验结束保持一个相对稳定的下降趋势。而且在稽查策略发生变化后,稽查概率发生的主观信念仍然高于Cont-Low-Fine实验组。

基于这个简单的模型和仿真结果,我们可以做出以下假设。

假设1:

前面实验轮次发生的稽查对于稽查概率信念的影响在连续性实验组(包括Int-19-Low-Fine,因为该实验组和连续性实验组的稽查频率比较类似)中的影响大于在间断性实验组中的影响,因为在间断性实验组中“锚定”的影响更大。

假设2:

在连续性实验组中(包括Int-19-Low-Fine),对稽查概率的信念认知在早期阶段会增加,且在第22期后当稽查结束时立即下降。

假设3:

对于Int-7-High-Fine实验组,稽查概率的信念在第22期之前会保持稳定,在第22期之后会有一个缓慢的下降,并且该信念仍然高于连续性实验组,在其他间歇组(Int 5和Int 3)中的认知演变遵循与间歇组7相同的模式。

如果我们假设实验成员风险中立,且具有相同的先验信念(即认知)。同时,如果我们考虑收益主导的概念,则可以对各实验组中的捐献行为做出以下假设。

假设4:

在连续组(Cont-Low-Fine、Cont-High-Fine,包括近似连续组Int-19-Low-Fine)中,当被试认为被稽查的可能性超过40% 时,个体将捐献其全部禀赋,否则为0。在稽查策略转变前,被试们的捐献水平越来越高;在转变后,他们会选择“搭便车”。

假设5:

在Int-7/5/3-High-Fine中,当被试认为被稽查的可能性超过13%时,个体将捐献其全部禀赋,否则为0。与Cont-Low-Fine组相比,在稽查策略转变之后,应该能在更长时间内观察到合作情况。在间歇组Int-7-Low-Fine中,“搭便车”应该发生得更早。

另外,个体更加担心受到制裁、规避风险、模糊性及损失厌恶都会增加所有实验组的预测捐献水平。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载