中国政府统计数据质量管理问题研究(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-04 06:46:09

点击下载

作者:曾五一

出版社:社会科学文献出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

中国政府统计数据质量管理问题研究

中国政府统计数据质量管理问题研究试读:

《国家哲学社会科学成果文库》出版说明

为充分发挥哲学社会科学研究优秀成果和优秀人才的示范带动作用,促进我国哲学社会科学繁荣发展,全国哲学社会科学规划领导小组决定自2010年始,设立《国家哲学社会科学成果文库》,每年评审一次。入选成果经过了同行专家严格评审,代表当前相关领域学术研究的前沿水平,体现我国哲学社会科学界的学术创造力,按照“统一标识、统一封面、统一版式、统一标准”的总体要求组织出版。全国哲学社会科学规划办公室2011年3月序

厦门大学曾五一教授主持的国家社科基金重点项目《中国政府统计数据质量管理问题研究》已经完成,并将正式出版。曾教授邀请我写序,我深感荣幸。我认真拜读了书稿,想从一个政府统计工作者的角度,谈一谈个人的体会。

改革开放以来,特别是21世纪初加入WTO以来,我国与世界上其他经济体之间的联系越来越密切。这些经济体发生的重大经济社会事件、重大经济社会问题及矛盾都会以不同的方式和程度对我国经济社会发展产生影响。随着社会主义市场经济的发展,我国的市场主体越来越多元化,决策的自主性越来越强,变动性越来越大;城乡之间、区域之间的人员、物资、资金流动日益频繁;以互联网为核心的信息技术的快速发展对市场主体的决策和生产经营方式产生了广泛、深刻而复杂的影响。因此,影响我国经济社会发展的因素越来越多,情况越来越复杂多变。在这样的背景下,准确了解和把握我国经济运行和社会发展的情况,对于各级党委和政府实施经济社会管理,企业和社会公众进行生产经营、投资和消费决策变得越来越重要。

政府统计数据是反映我国经济社会发展情况的重要信息,是各级党委和政府、企业和社会公众了解及把握我国经济运行和社会发展情况的重要工具,是各级党委和政府进行经济社会管理及决策的重要依据,也是企业和社会公众进行生产经营、投资和消费决策的重要参考。因此,各级党委和政府、企业和社会公众对政府统计数据的需求越来越多,要求越来越高。相应的,政府统计数据质量也就变得越来越重要,因为它事关政府统计数据的客观性和准确性,事关各级党委和政府经济社会管理及决策的科学性,事关企业和社会公众生产经营、投资和消费决策的正确性。所以政府统计数据质量问题极其重要,既是目前社会关注的重点问题,也是政府统计的核心问题。

长期以来,国家统计局始终高度重视统计数据质量,特别是近些年来,又采取了一系列更加有针对性的措施,以提高统计数据质量。一是加强基本单位名录库建设,提高其真实性、统一性和完整性。基本单位名录库是常规统计调查的重要基础,为了提高其真实性、统一性和完整性,国家统计局充分利用工商、税务、编制、民政等部门的行政记录和专业统计信息及时进行更新。特别是利用第三次经济普查的机会,通过与上述有关部门提供的单位进行详细比对、现场核查和采取PDA空间定位、拍摄证照等多种方式及现代化的信息手段,查清基本单位,对名录库进行系统更新。二是建立企业一套表统计制度,提高统计调查表的设计质量。对规模以上工业法人企业、有资质的建筑业法人企业、限额以上批发和零售业法人企业、限额以上住宿和餐饮业法人企业、房地产开发经营业法人企业和重点服务业法人企业的统计调查表采取统一设计,改变了以前不同行业统计调查表分别设计、统计调查指标设置不一致和相同指标含义不同的状况,实现了上述企业统计调查表设计的一体化。三是建立联网直报系统,减少数据上报中间环节的干扰。国家统计局建立了联网直报系统,在经济普查和大部分常规统计调查中,调查对象或调查人员可通过互联网直接向国家统计局报送原始数据,改变了以前由各级地方政府统计机构逐级上报的模式,对个别地方通过中间环节干扰统计数据的现象起到了有效的遏制作用。四是强化统计执法检查,维护统计调查工作的严肃性。对于虚报、瞒报、指令代报、授意编造等各种违反统计法和有关规定的行为依法进行严肃查处,并通过通报和网上曝光的方式,维护统计调查工作的严肃性,保障统计调查工作正常的生态环境。五是加大审核、检查和核查工作力度,提高基础统计数据质量。国家统计局对基层统计调查表进行严格审核,选派专业统计人员对基层单位统计调查表填报工作进行经常性检查,并针对发现的问题到基层单位进行现场核查,督促基层单位提高统计调查表的填报质量,最大限度减少基础数据的填报错误。六是加强对重要统计指标数据的质量评估,提高其与相关指标和行政记录数据之间的协调性。国家统计局每月或每个季度都会对GDP、CPI、工业增加值、全社会固定资产投资、社会消费品零售总额等重要统计指标进行数据质量评估,以提高这些重要指标与相关指标和行政记录数据之间的协调性。例如,每月都利用工业用电量、工业增值税、主要工业产品产量、工业出口交货值、工业生产者出厂价格指数等指标的增长速度数据对工业增加值增长速度数据进行评估,以提高工业增加值增长速度数据与上述相关指标增长速度数据之间的匹配性。七是及时发布各类统计数据,提高统计数据的可获得性。国家统计局通过新闻发布会、统计公报、统计年鉴、统计数据库等多种方式发布各种类型的统计数据,使用户可及时获得统计数据。

但是,由于种种原因,目前我国政府统计数据质量还存在一些问题,还不能很好地满足广大用户的要求。如何进一步提高政府统计数据质量,是当前统计理论研究和实际工作部门亟须研究解决的重要课题。曾五一教授主持的这一课题,对我国政府统计数据质量问题进行了比较全面和系统的研究,揭示了存在的问题,探索了问题成因,提出了相应的对策,对于提高我国政府统计数据质量,使政府统计更好地服务于各级党委和政府、企业和社会公众将会起到积极的促进作用。同时,这一课题研究所探讨的统计数据质量管理的理论和方法,对于统计学的发展也将会起到有效的推动作用。因此,曾五一教授主持的这项课题研究不仅具有十分重要的现实意义,而且还具有非常重要的理论价值。

读了书稿之后,该项课题研究的许多内容给我留下较深刻的印象、带给我较大的启发。一是该课题在系统梳理有关基本概念的基础上,把统计数据质量概念归纳为三个层次。第一层是统计数据质量的基本属性,指的是统计数据的准确性,也就是统计数据能够真实地反映客观事物的数量特征和数量规律的程度。这是统计数据质量最核心、最基本的要求。第二层是统计数据质量内涵的拓展性属性,这是从用户角度考察的统计数据质量的属性,包括时效性,即统计数据的提供能够及时满足用户需要的程度;可比性,即同一指标的数据在时间和空间上的可比程度;适用性,即统计数据能够满足用户分析和应用需要的程度;可获得性,即用户获取统计数据及相关辅助信息的难易程度。第三层是从全面质量管理角度考察的统计数据质量的内涵,即从统计数据的各生成环节来界定统计数据质量的内涵,包括统计生态环境的质量,统计设计的质量,统计调查与统计处理的质量,统计数据的发布、修订与评估的质量。上述统计数据质量的概念是依次被包含的关系。课题研究给出的三个层次的统计数据质量概念,层次分明,既突出了统计数据质量工作的重点,也从不同的角度界定了统计数据质量的内涵,给出了提高统计数据质量的努力方向,对于政府统计工作很有参考价值。

二是在界定统计数据质量概念和系统梳理政府统计数据生产流程的基础上,提出了对政府统计数据实施全面质量管理的基本框架。该基本框架提出,从进一步改革统计管理体制、健全统计制度方法、改进统计实践操作等方面入手,强调对统计数据生产的事前阶段、事中阶段和事后阶段实施全过程质量控制。事前质量控制包括统计制度方法的规范、统计调查方案的优化和统计指标计算方法的完善。事中质量控制包括对统计调查过程、统计数据处理过程和统计指标计算过程进行质量控制。事后质量控制包括对数据评估、数据修订和数据发布进行质量控制。统计数据生产的每个环节都会对数据质量产生影响,因此,对政府统计数据实施全面质量管理的基本框架强调对数据生产的全过程进行质量控制,对于提高政府统计数据质量很有借鉴意义。

三是对GDP、CPI、房地产价格指数等重要统计指标的数据质量问题进行了比较深入的研究,从不同的方面或不同的环节揭示了这些指标存在的数据质量问题,探讨了导致这些数据质量问题的原因,提出了解决相应问题的建议。例如,比较深入地研究了国家与地区GDP数据差距问题,探讨了产生这些问题的体制机制和统计制度方法等各方面的原因,提出了用科学的政绩观评价干部、用科学的发展观全面地评价地方经济发展、进一步推进统计管理体制改革、进一步完善统计调查制度、进一步完善GDP核算方法等一系列建议。这对于解决国家与地区GDP数据差距问题具有重要的建设意义。

四是对统计生态环境建设问题进行了比较深入的研究。在对现有的统计生态环境概念进行归纳和梳理的基础上,提炼出统计生态环境的核心内涵,给出统计生态环境的明确定义;分析了社会经济环境、政治与法制环境和体制环境等统计生态环境对统计数据质量的影响方式和程度;提出了构建有利于提高政府统计数据质量的统计生态环境的建议。这些研究对于促进良好的统计生态环境建设、提高政府统计数据质量具有积极的作用。

希望曾五一教授率领的课题组在现有成果的基础上进一步深化研究,取得更加丰硕的成果,为提高政府统计数据质量做出更多有价值的贡献。国家统计局副局长 许宪春2015年1月第一章导论

统计数据的质量是政府统计工作的生命线。如何进一步提高我国政府统计数据的质量是当前统计理论及实践部门亟待研究和解决的重要课题。本章将扼要介绍本书研究的背景、理论基础、现实意义以及本书所要研究的主要内容。第一节 研究背景和意义一 研究背景

改革开放以来,我国的政府统计部门在提高我国统计数据质量方面做出了许多努力。1983年12月,《中华人民共和国统计法》(以下简称《统计法》)的正式颁布标志着我国统计工作开始走上法治轨道。之后,经历了1996年5月和2009年6月的两次修订后,最新的《统计法》从2010年1月1日起实施。为了减少对统计活动的不当干预,国家还出台了相关制度规定:1998年颁布了《关于坚决反对和制止在统计上弄虚作假的通知》,2009年5月1日起开始实施《统计违法违纪行为处分规定》,等等。在具体的数据质量管理方面,国家统计局于1999年初首次公布了《国家局和省级统计局两级对主要的统计指标数据质量评估的实施方法》,通过统计系统内部的自我检查与评估,对地区生产总值、农业总产值、粮食产量、农民人均纯收入、工业增加值及增长速度、固定资产投资、价格指数等12项指标的数据质量进行评估。2003年,国家统计局在开始实行的统计巡查制度中,把对统计数据质量的评估作为一项重要内容列入其中。2003年11月和2004年1月,国家统计局先后颁布了《关于我国GDP核算和数据发布制度的改革》(国统字〔2003〕70号)和《关于改进和规范地区GDP核算的通知》(国统字〔2004〕4号),建立了地区GDP数据联审制度,对GDP核算与发布提出了改进和规范的措施。在国际准则对接方面,我国于2002年4月正式加入数据通用公布系统(简称GDDS)。这些法规和制度的出台,为惩治和预防统计违法行为、规范统计工作秩序、提高统计数据质量,提供了重要的法律与制度保障。

毋庸置疑,与改革开放前相比,我国的政府统计数据无论是在数量上还是在质量上都有很大的飞跃。但是应看到,随着经济全球化进程的加快和信息时代的到来,一方面,统计数据的用户越来越多,政府与社会公众对统计数据的要求越来越高;另一方面,统计工作面对的形势越来越复杂,统计数据质量控制与管理的难度不断加大。因此,我国政府统计数据的质量与政府和社会公众的要求还有一定差距。

近年来,我国的一些官方统计数据常常受到国内外媒体和一些学者的质疑。这些质疑集中体现在以下两个方面:一是不协调,即官方公布的数据相互之间存在矛盾;二是不相符,即官方公布的统计数据与人们的感觉有较大差距。例如,2001年,美国匹兹堡大学经济学教授Thomas G.Rawski在《中国经济评论》上发表了一篇文章《中国[1]GDP统计发生了什么》,该文列举了“十五”期间中国的能源增长和交通量增长与GDP增长数据不同步的事实,认为中国的官方统计明显夸大了经济增长;2005年3月,国家统计局原局长、全国政协委员李德水披露了一组数字,2004年各省份上报的全年GDP汇总数据,与国家统计局公布的总量差距高达26582亿元;2009年7月,国家统计局发布了当年上半年全国城镇单位在岗职工平均工资为14638元,与上年同期相比增长12.9%,远超同期7.1%的经济增速,一些网友称收入“被增长”;2010年3月,国家统计局发布全国70个大中城市上一年房屋销售价格上涨1.5%,这个统计数字与百姓的直观感受相差甚远,也引起了人大代表和政协委员的强烈质疑。

应当指出,改革开放以前,我国的政府统计数据很少向社会公布,社会公众对政府统计数据的质疑也无从谈起。在高度集中的经济管理体制下,社会公众对统计数据的关注度也比现在要低得多。改革开放以后,情况发生了很大变化。政府统计机构向社会公布的统计数据越来越多,决策主体的多元化和利益多元化使得社会公众对官方统计数据日益关注。因此,上述质疑的出现毋宁说是社会进步的一种表现。此外,尽管一些媒体和学者对我国的政府统计存在一些误解甚至是偏见,但是这些质疑也有其合理的一面,即由于各种原因,我国的部分官方统计数据确实存在一些质量问题。

从国际上看,自20世纪90年代以来,关于官方统计数据质量的研究逐渐成为各国官方统计机构与国际统计机构非常关注的一个热点课题。表1-1列出了联合国统计委员会、国际货币基金组织(IMF)以及经济合作与发展组织(OECD,以下简称经合组织)等国际机构关于统计数据质量研究的一些动向。根据日本伊藤阳一和水野谷武志等[2]人的分析,关于官方统计数据质量的研究之所以会成为近年来国际统计机构讨论的热点问题,其主要原因如下。第一,近年来,经济全球化进程明显加快,以计算机技术和信息技术为代表的知识经济迅速兴起,与实体经济相对应的虚拟经济也有非常大的发展,而原有的官方统计未能很好地适应这种变化,已不能很好地反映经济社会的真实动态。特别是对于20世纪90年代后半期发生的亚洲经济危机和2008年的国际金融危机,各国的官方统计未能事先提供充分有效的预警信息。第二,由于政府预算的限制,官方统计所需要的经费和人力资源难以得到保证,官方统计数据的公信力有所下降。为此,国际统计机构与各国的政府统计机构期望通过对官方统计数据质量问题的研究,唤起政府和公众对统计的关注与支持,通过相关研究和讨论,进一步改进政府的统计工作,完善统计制度与方法,以更好地满足政府与社会公众对高质量统计数据的需求。表1-1 关于统计数据质量研究的国际动向年表二 研究意义

在上述背景下,对我国官方统计数据的质量问题进行全面、系统和深入的研究,具有重大的现实和理论意义。

首先,政府统计数据是政府和公众了解宏观经济运行态势和社会发展状况的基本信息来源,也是其行为决策的主要依据。统计数据如果质量不高,就很可能会误导政府和社会公众的行为,从而造成不必要的损失。另外,在现行体制下,统计数据常被用作对地区、单位进行业绩考核的标准,在很大程度上是评判官员政绩的主要依据,同时还会直接影响到政府资源的配置。如果统计数据质量不高,不仅各地区与各单位的业绩不能得到正确评价,而且无法实现政府资源的优化配置。因此,通过这一研究,发现我国政府统计数据存在的问题,找出影响统计数据质量的具体原因,提出相应的对策,将大大提高我国政府统计数据的质量,从而可以使统计更好地为政府和社会公众服务,对促进我国国民经济和社会发展发挥重要的作用。

其次,社会各界的质疑已使我国政府统计的权威性受到了严重的挑战。对我国政府统计数据的质量进行全面科学的诊断并在此基础上加强管理,将提高我国统计数据的公信力和权威性,对塑造国家统计部门的良好形象具有深远意义。

最后,探讨和总结出一套科学的统计数据质量管理的理论、统计数据质量的诊断方法以及对统计数据进行全面质量管理的方法,对于统计学自身的发展也将起到非常重要的促进作用。第二节 研究的基本内容一 统计数据质量管理基本理论研究

为了解决我国政府统计数据存在的质量问题,有必要首先对数据质量管理的基本理论进行研究,系统地总结一套比较科学同时又能很好地与我国国情相结合的统计数据质量管理的基本理论,为本书的研究提供坚实的理论框架。基本理论研究主要包括以下几项内容。(一)统计数据质量基本概念研究

关于统计数据质量的含义,不同的统计机构和学者对此有不同的定义。例如,加拿大统计局确定了衡量数据质量的6个方面标准,即适用性、准确性、及时性、可获得性、衔接性、可解释性;英国统计局提出的数据质量的标准是准确性、及时性、有效性和客观性;Dalenius(1983)提出统计数据质量的“测量向量”,包括统计数据的准确性、经济性、保密性、相关性、及时性、数据详细程度等;Gordon Brackstone(1999,2000)提出统计数据质量的6个维度,包括相关性、准确性、及时性、可获得性、可解释性和一致性。

我们认为,统计数据的质量并不限于通常人们所理解的准确性。统计数据是统计工作的成果,统计数据的质量与统计工作的生态环境及其各个环节的工作质量密切相关。作为统计工作的一种“产品”,统计数据本身是在不断发展与变化的,其质量概念也需要与时俱进。因此,为了更深入地研究统计数据的质量问题,有必要在对国内外相关研究成果进行系统总结的基础上,进一步整理概括出一套明确的、多维的、全方位的统计数据质量概念。(二)统计数据质量评价标准研究

统计数据质量评价标准是衡量数据质量的基本尺度,具体包括数据质量公布的标准和数据质量评估的框架。

数据公布的国际标准,目前主要有国际货币基金组织指定的数据公布通用系统(General Data Dissemination System,GDDS)和数据公布特殊标准(Special Data Dissemination Standard,SDDS)。GDDS主要涉及实体经济、财政、金融、对外和社会人口五大统计部门,具体内容包括数据的范围、频率和及时性,公布数据的质量,公布数据的完整性和公众获取四个部分。SDDS包括的内容与GDDS大致相同,但提出了更高的要求。

数据质量评估的国际标准目前主要有以下几个。(1)国际货币基金组织的数据质量评估框架(Data Quality Assessment Framework,DQAF)。这个框架提供了对统计数据质量进行定性评估的一套指标体系,它从保障数据质量的前提条件(法律和机构环境等)出发,依次从保证诚信、方法健全性、准确性和可靠性、适用性、可获得性5个方面对数据质量进行了分析。(2)欧洲统计系统(European Statistical System,ESS)的统计质量保证框架。这个框架包含5个基本要素:文件、程序和统计方法的标准化、质量估量、战略规划与控制、改进质量的行动;定义了4种评估形式:自我评估、有支撑的自我评估、同行评议和滚动审议。欧洲统计系统还制定了一套完整的质量工具,包括《欧洲统计系统质量报告标准》《欧洲统计系统质量报告手册》《欧洲统计系统质量词汇》《元数据最新词汇》《欧洲调查管理人员自我评估检查单》《通过程序变数分析改进质量手册》《数据质量评估手册:方法和工具》等。2009年3月,欧洲议会和欧洲理事会还通过了新的欧洲统计条例,定义了8个质量标准,讨论了质量指标和最低标准的定义。(3)经合组织的统计活动质量框架。经合组织于2003年发布《经合组织统计活动质量框架和导则》,主要内容包括4个方面:质量的定义及维度、保证新出现统计活动质量的程序、定期评估已有统计活动质量的程序,以及一组包含整个生产过程的统计活动的基本准则与质量指南。

开展我国统计数据质量评价标准的研究,首先,要对发达国家和国际组织的标准和实践进行研究。在借鉴国际经验的基础上,结合我国的实际情况,提出适合我国国情的统计数据质量评估标准。其次,要进一步分析影响我国统计数据质量的一般原因、统计数据质量管理的基本环节,从而构建我国统计数据质量评估的基本标准。(三)构建政府统计数据全面质量管理体系的理论研究

政府统计数据是政府统计机构的生产成果。政府统计数据的生产流程具体可表现为由统计设计—统计调查—数据处理—统计估算与分析—统计数据发布—统计数据质量评估与修订等各个环节组成的全过程。统计数据生产中任何一个环节的疏漏都可能使统计数据产生质量问题。因此,有必要借鉴全面质量管理的理论,分析影响统计数据质量的各种因素,提出进一步从各个环节加强质量管理和质量控制,从而构建国家统计数据质量管理体系的基本思路。二 统计数据质量诊断与评价方法研究

为了开展统计数据质量管理问题的研究,还需要有一些诊断和评价统计数据质量的科学方法作为技术支撑。

从以往的研究成果看,数据质量诊断和评价方法主要可以分为以下五大类。1.传统分析方法

传统分析方法包括利用各指标之间理论上存在的逻辑关系、平衡关系和相关关系对统计数据的准确性进行检验的方法等。例如,张为民、崔红艳(2003)对我国2000年人口普查分年龄人口数据的准确性进行了一致性检验,他们发现:1990年0—9岁人口活到2000年没有减少反而增加了,显然有一方的数据是错误的。又如,顾海兵(1999)根据多年来我国生产法GDP和支出法GDP一直存在的较大偏差对我国GDP统计数据提出疑问。传统分析方法的优点是比较简便易行,并且可应用于统计数据生产的各个环节,因此在实践中得到了广泛的应用。但这类方法的应用必须满足一定的前提,例如,根据平衡关系去检验数据质量的方法只适用于确实存在有逻辑平衡关系的数据,而利用相关关系去检验数据质量的前提是高度的相关关系确实存在,同时与被评估指标相关联的统计数据也必须是可靠的。2.调查误差评估法

统计数据准确性评估归根结底是对数据中所包含误差的评估。从数据的生产过程来看,这种误差主要表现为调查误差。调查误差可分为抽样误差与非抽样误差。对于抽样误差,统计学中已经有一套比较成熟的事先进行测算与控制的理论与方法。因此,这里所谓的调查误差评估实际上主要是对非抽样误差进行评估。其基本思路是事后组织在更为理想和规范的调查条件下(如选调更有经验的调查员等)的抽样调查,并以此为标准去估计初始调查的误差,以此作为评估初始调查数据质量的标准。调查误差评估法从产生统计数据准确性问题的源头入手,对统计数据的可信度进行评估。这种方法比较适合对基层统计数据的评估。该类方法隐含的假设为:初始调查的非抽样误差主要来源于调查设计的不合理和调查实施过程的不规范,而事后重复调查的设计则足够合理,调查实施过程也足够规范。3.计量模型分析法

计量模型分析法是一种利用限定的计量模型,包括横截面数据模型、时间序列数据模型、面板数据模型等,检验统计数据准确性的方法。例如,湖南大学课题组曾应用生产函数模型对我国GDP数据出现的异常点进行分析。应用计量模型分析法的前提条件是:被评估的指标与其他指标之间的关系能够用相应的计量模型很好地加以描述。如果出现有关参数的符号与理论或经济常识不符的情况,则可判断可能是统计数据存在问题。另外,通过计量模型分析,也可以找出严重偏离既定模型的数据点,即所谓的异常点。通常将位于这些异常点的数据视为可能存在质量问题的统计数据。利用计量模型分析法判断统计数据质量的难点在于:当利用某种模型诊断的结果出现异常时,实际上很难判断这一异常是由数据质量引起的,还是由选用模型不恰当引起的,抑或这一异常恰好是真实情况的反映?另外,采用计量模型分析法时如涉及其他指标,则其他指标的数据必须较为准确可靠,这也是不可或缺的前提条件。4.统计分布检验法

这种方法假定所要评价的统计数据服从某种随机分布,并用不一致性测试(Discordancy Test)来识别异常点。近年来,人们较为关[3]注的Benford法则检验法,本质上也属于此类方法。例如,成邦文等(2000)的研究表明,反映现象规模大小的“社会经济规模指标”,如产量、产值、人员数量等,近似服从对数正态分布。据此,他们提出了统计数据质量检查和异常点识别的对数正态分布检验法,并将这种方法用于我国研究与开发机构年报的调查。统计分布检验法主要存在两个问题,一是在许多情况下,人们并不知道所要考察的统计数据的理论分布,现实统计数据往往并不符合任何一种理想状态的数学分布;二是统计分布检验法需要比较大的样本观测值,经济社会的统计数据常常难以满足这一要求。5.综合评价法

以上所述的几种方法主要是对统计数据的准确性进行评估和检验的方法。随着统计数据质量的概念由一维向多维发展,对统计数据质量的评估也从数据本身向整个数据生产过程的各个环节扩展,因而也就产生了对统计数据质量进行综合评价的方法。国际货币基金组织提出的ROSC-DM法(根据一定的标准与规范提出数据质量报告的方法)、欧洲统计系统提出的指标集测评方法等都属于这类方法。这类方法的特点是将统计数据质量分成若干环节或若干指标,分别给出评价的标准,先对各个环节或各项指标进行判断,再采用一定的方法将其综合,做出总的判断。综合评价法适用于对一个国家或地区的统计数据质量或统计工作质量做出综合判断。该类方法的难点在于确定各个环节或各项指标的评价标准,以及准确确定各项指标或各个环节在评价中的权重。另外,这种评价相当程度上依赖于参加评估人员的主观判断。

由以上分析可以看出,现有的各类检验与评估统计数据质量的方法都有其长处和局限性,我们在研究中,不仅要对其系统地进行总结和归纳,而且要着重分析其适用的前提、适用的场合,在此基础上还要研究与开发一些新的方法,特别是综合利用各种方法对统计数据质量进行检验与评价的组合方法。三 主要宏观经济统计数据的质量诊断与分析

以往对我国统计数据质量的具体诊断,主要是一些学者在研究我国的经济增长或其他相关经济问题时有所涉及。从研究对象上看,以往的研究主要集中于对我国国内生产总值和经济增长等少数几个指标的数据质量的评判,对其他重要的指标关注不够。关于我国统计数据质量的判断也是众说纷纭,没有一致的结论。例如,任若恩(2002)用价格指数缩减法判断1986—1994年我国GDP增长率高估了3.8个百分点;Maddison(2001)用生产指数法判断1978—1994年我国GDP增长率高估了2.4个百分点;孟连、王小鲁(2000)在发表的《对中国经济增长统计数据可信度的估计》一文中,利用生产函数的方法估计出我国1992—1997年GDP高估了2.5%左右。美国宾夕法尼亚大学的Klein和Ozmucur(2002)则认为一国经济增长是由多种因素共同决定的,没有一种单独的经济因素或指标对现代经济具有解释力,他们选取了包括能源、交通、通信、劳动力、农业、贸易、公共部门、工资、通货膨胀等在内的15个指标进行主成分分析,结果主成分变动与中国官方估计的实际GDP变动是一致的。

我们认为,影响不同指标统计数据质量的具体原因有较大差异,其中既有管理体制、利益机制等方面的原因,也有统计方法和制度的原因。要真正建立我国的统计数据全面质量管理体系,很有必要综合利用各种方法对各主要的社会经济指标从各个维度逐项进行全面系统的诊断与分析,并在此基础上进一步分析影响各种指标统计数据质量的具体原因,为寻求具体的解决办法提供依据。

宏观经济指标种类繁多,本研究所涉及的主要内容包括以下几个方面。(1)国家GDP数据的质量诊断与分析。利用各种方法和国内外的相关数据,对我国的GDP等经济指标的数据进行统计诊断和评价。(2)全国GDP与地方GDP可衔接性研究。目前我国国家一级的GDP数据与地方GDP汇总数据存在较大差距,地方GDP汇总数据远远大于全国GDP。我们将对此进行深入分析,探讨问题症结所在,同时探索解决之道。(3)普查年度与非普查年度GDP 数据可衔接性的研究。根据全国经济普查的结果,我国常规年度的全国GDP统计存在明显的漏算。我们将对该问题展开研究,并提出改进的方法。(4)固定资产投资、居民消费、政府消费和进出口总值以及GDP生产与支出之间的协调性研究。从理论上讲,GDP的生产与支出之间应保持一定的平衡关系,目前由于各种原因,我国按支出法和按生产法计算的GDP之间存在较大误差。我们要对此问题进行分析,探讨两种方法的可信度,寻求进一步缩小计算误差的方法。(5)主要物价指数包括居民消费价格指数(CPI)与住房价格指数的质量问题研究。近年来,社会公众对这方面的数据质疑较多,我们将综合利用各种方法对其数据质量进行诊断,同时分析产生质量问题的具体原因,并根据全面质量管理的理念,对提高价格指数的质量做进一步研究。四 统计生态环境建设研究

所谓统计生态环境是指所有影响统计工作的各种外部因素和条件的总称。统计生态环境包括统计管理体制、统计法规、统计理念、统计人员素质以及政府和公众对统计的态度等。

对于统计生态环境建设,以往的成果主要从统计体制、统计执法、调查方法、统计人员素质等方面进行研究。例如,周建(2005)从公共管理的视角对政府统计数据质量管理进行了研究;曾五一(2005,2009)分析了我国统计管理体制存在的问题,提出了进一步改革统计管理体制的建议;高敏雪(2009)从外部监管入手对提高统计数据质量进行分析;李金昌(2009)以统计数据质量为切入点,阐述了统计数据质量与国家统计安全、统计本质与统计法治的关系,并对实现统计法治的途径进行了探讨。

要提高统计数据的质量,仅仅依靠统计部门自身的努力或者统计方法制度的改进是不够充分的。从长远看,提高统计数据质量的根本途径在于建设良好的统计生态环境。我国在统计生态环境建设方面仍有一些问题需要进一步研究解决。其主要内容包括统计生态环境的基本概念、影响统计生态环境的主要因素、统计生态环境对统计数据质量的影响分析、如何构建有利于提高统计数据质量的统计生态环境等。因此,对统计生态环境问题的研究也是本书研究的重要内容之一。本章主要参考文献

[1]成邦文、董丽娅、杨峻:《研究开发机构统计数据质量与异常点的对数正态分布检验与识别》,《统计研究》2000年第1期。

[2]高敏雪:《从外部监督入手解决统计数据质量问题的努力》,《统计研究》2009年第9期。

[3]顾海兵:《中国统计信息失真及原因探析》,《厂长经理日报》1999年8月27日。

[4]李金昌:《统计数据统计安全与统计法治》,《统计研究》2009年第9期。

[5]刘云霞、吴曦明、曾五一:《关于综合运用Benford法则和面板模型监测统计数据质量的研究》,《统计研究》2012年第12期。

[6]卢二坡:《统计数据质量评估方法述评》,《统计与决策》2006年第12期。

[7]孟连、王小鲁:《对中国经济增长统计数据可信度的估计》,《经济研究》2000年第10期。

[8]任若恩:《中国GDP统计水分有多大——评两个估计中国GDP数据研究的若干方法问题》,《经济学》(季刊)2002年第1期。

[9]曾五一:《关于我国统计体制改革的思考》,《厦门大学学报》2005年第4期。

[10]曾五一:《国家统计数据质量研究的基本问题》,《商业经济与管理》2010年第12期。

[11]曾五一:《统计调查体系与调查方法问题研究》,中国统计出版社2009年版。

[12]张为民、崔红艳:《对中国2000年人口普查准确性的估计》,《人口研究》2003年第7期。

[13]周建:《宏观经济统计数据诊断理论、方法与应用》,清华大学出版社2005年版。

[14]〔日〕水野谷武志:《統計制度改革の国際的動向と統計品質論》,《統計研究参考資料》第112期。

[15]Gordon Brackstone,“Managing Data Quality at Statistics Canada”,Korea:Proceedings of the Statistical Quality Seminar,2000.

[16]Gordon Brackstone,“Managing Data Quality in a Statistical Agency”,Survey Methodology (2)1999.

[17]Judge,Laura Schechter,“Detecting Problems in Survey Data Using Benford’s Law”,The Journal of Human Resources (44)2009.

[18]Klein,L.R.,Ozmucur,S.,《中国经济增长率估计》,《数量经济技术经济研究》2002年第8期。

[19]Maddison,A.,“The World Economy—A Millennial Perspective”,Paris:OECD Development Centre,2001.

[20]Rawski,T.G.,“What is Happening to China’s GDP Statistics”,China Economic Review (12)2001.

[21]T.Dalenius,Errors and Other Limitations of Survey,Statistical Methods and the Improvement of Data Quality (London:Academic Press Inc.,1983).

[1] Rawski,T.G.,“What is Happening to China’s GDP Statistics”,China Economic Review (12)2001.

[2] 〔日〕水野谷武志:《統計制度改革の国際的動向と統計品質論》,《統計研究参考資料》第112期。

[3] 刘云霞、吴曦明、曾五一:《关于综合运用Benford法则和面板模型监测统计数据质量的研究》,《统计研究》2012年第12期。第二章统计数据质量管理的基本理论研究

本章为全书的研究提供基本的理论框架。我们将在系统梳理有关统计数据质量基本概念的基础上,对国际上现有的几种主要的统计数据质量的评价体系进行系统的研究,并进一步提出制定我国数据质量评价体系的基本思路。第一节 统计数据质量基本概念研究一 统计数据质量概念的演变

为了进一步开展统计数据质量管理问题的研究,有必要对统计数据质量管理的基本概念及其内涵给出科学的界定。表2-1为国内外统计机构和一些学者给出的关于统计数据质量的几种代表性定义。表2-1 统计数据质量的代表性定义续表

从以往关于统计数据质量管理的基本概念及其内涵的研究成果看,对于统计数据质量的概念,一般只是简单地罗列出几种性质,并未做详细的论述,特别是没有很好地梳理其相互之间的联系,这也影响到对统计数据质量管理及其控制问题的进一步深入研究。为此,以下我们将在参考有关研究成果的基础上,先对统计数据质量基本概念的演变做扼要的回顾,在此基础上再对统计数据质量的基本内涵做系统的归纳和总结。

政府统计数据是政府统计机构所提供的社会公共产品,是人类生产活动的一种成果。因此,对其质量概念及内涵的把握,也可以借鉴一般产品质量管理的基本理论。从历史上看,产品质量管理的基本内涵随着社会的发展以及人们对产品质量要求的提高在不断拓展。一般产品质量管理内涵的演变可以分为3个阶段:第一阶段是从生产者立场出发的质量管理(即符合性质量管理),这种质量管理的内涵是以“符合”生产者提出的一定标准的程度为衡量依据的;第二阶段是从消费者立场出发的质量管理(即满意性质量),这种质量管理的内涵是以适合顾客需要的程度为衡量依据的,是从使用角度定义产品质量的,认为产品的质量是产品的“适用性”,即“产品在使用时能成功地满足顾客需要的程度”;第三阶段是从多个角度出发的质量管理(即魅力性质量),这一内涵十分广泛,既反映了产品要符合一定标准的要求,也反映了产品要满足顾客,社会(环境、卫生),员工,投资方等相关方的要求,质量评价的对象也从产品扩展到过程、体系等所有方面。与一般产品质量管理类似,统计数据质量管理的基本概念也经历了类似的三个阶段。(一)以“准确性”为核心的统计数据质量管理

20世纪80年代以前,国际统计界基本上将统计数据质量定义为数据的准确性。关于统计数据质量管理的研究主要以提高数据准确性为基本出发点。同时,该时期的研究者主要从数理统计和抽样技术的角度,大量研究如何科学地组织调查,尽量缩小统计调查误差、控制数据质量。有的研究者通过调查方法的选择、样本代表性的优化、抽样误差的控制等保证统计数据的准确性。例如,挪威统计学家凯尔(A.N.Kiar)提出了代表性抽样方法,英国统计学家鲍莱(A.L.Bowley)对随机抽样以及非抽样误差进行了研究,汉森和赫维[1]茨(M.H.Hansen和W.N.Hurwitz)提出了调查误差模型等。(二)以“用户需求”为中心的统计数据质量管理

20世纪80年代以来,统计数据质量的含义被扩大,准确性已不再是衡量统计数据质量的唯一标准,满足用户需求(fitness for use 或者fitness for purpose)成为学者和各国统计机构研究统计数据质量时关注的话题。1980年联合国统计司出版的《统计组织手册》对政府统计资料提出了8项要求,包括:统计工作中必须充分了解使用者进行决策和研究的需要;统计服务应针对许多使用者而不是某一类使用者;统计资料要通过指标的相互联系形成有机体系;统计资料要保持历史连续性,以系统的时间序列反映历史变动;统计资料应当及时收集、加工并公布;应当保障提供调查资料的被调查者的利益或秘密;统计机构要公正客观、不受任何偏见的影响;为了统计资料的准确性和及时性,应当有能够胜任工作的业务和行政领导。Dalenius(1983)提出统计数据质量的“测量向量”,包括统计数据的准确性、经济性、保密性、相关性、及时性、数据详细程度等。Brackstone(1999)提出统计数据质量的6个维度,包括相关性、准确性、及时性、可获得性、可解释性和一致性,并进一步描述了统计机构针对每一个维度进行管理的具体方法,提出了进行有效数据质量管理所必需的5个子系统,即用户联络系统、合作计划系统、方法及标准系统、发布系统和进展系统。Wang和Strong(1996)通过调查的方式确定了满足用户需求的数据质量的四大方面,即数据内在(固有)质量、数据环境质量、数据表现质量、数据可获得性质量,它们又被分为15个维度,即可信度、准确性、客观性、数据声誉;附加信息、相关性、及时性、完整性、数据量;可解释性、便于理解性、一致性、简洁性;可得性、安全性。(三)“从源头到终端”的统计数据全面质量管理

2000年以来,伴随着全面质量管理理论的发展,在统计数据质量管理方面,许多国际组织和国家纷纷建立起各自的数据质量管理与评估框架,这些框架在以用户需求为中心的基础上,进一步要求政府统计机构必须具备生产高质量统计数据的各种前提条件和环境。这种管理是一种从源头到终端的全面质量管理,也即包括对统计生态环境、统计生产过程以及统计数据发布过程的全面控制和管理。如国际货币基金组织的数据质量评估框架(DQAF)除了包括统计数据质量的基本条件外,还包括对统计法律制度环境和统计工作等方面的要求,经合组织统计活动质量框架和导则(Quality Framework and Guidelines for OECD Statistical Activities)、欧洲统计系统也都强调从多个环节对统计数据进行全面质量管理的重要性等。二 对统计数据质量概念的整理归纳与再探讨

在国际标准化组织提出的质量管理标准体系(ISO 9000:2000)中,质量(quality)被定义为:一组固有特性满足明示的、通常隐含的或必须履行的需求或期望(要求)的程度。该体系对质量的定义包含两方面内容,一方面说明质量是综合的概念,是事物的一组特性;另一方面说明质量是满足需求或者期望的程度,质量的评估应该从需求入手。借鉴这一科学定义,我们也可以把官方统计数据质量理解为统计数据所具有的一组特性能够满足使用者需要的程度,可满足的程度越高,则统计数据的质量就越高。因此,统计数据质量具体需要涵盖哪些特性,取决于使用者对数据的要求。以往的研究者根据自己的理解给出了各种统计数据应具有的理想特性,有的甚至高达十多种。我们认为,这是不必要的,将各种性质不分主次地简单罗列,反而有可能模糊问题的本质,无助于搞好统计数据质量的管理与控制。因此很有必要对数据应具备的理想属性进行归纳。根据我们的理解,统计数据质量的概念可归纳为以下三个层次。(一)统计数据质量内涵的基本属性

统计数据的准确性是数据质量最核心、最基本的要求。如果数据不能满足准确性,即数据不能真实反映客观发生的经济现象,那么利用这样的数据进行研究的结果就一定会产生系统的偏误,不仅失去其参考价值,而且还会误导政府、企业与社会公众。因此,只有数据在一定程度上满足准确性要求,对数据的其他性质进行评估才具有现实意义。准确性是近年来我国官方统计数据最受关注和质疑的一个方面。

所谓统计数据的准确性,指的是统计数据能够真实地反映客观事物的数量特征和数量规律的程度。准确性的实现可以从“准”和“确”两个不同的维度,也就是“真实”与“可靠”两个不同的维度加以考察。“真实度”是指统计的结果与试图测量的现实目标之间的接近程度。提高统计数据的真实度,必须特别重视统计设计,特别是统计指标和统计方法制度的设计及其过程控制。以居民可支配收入的统计为例,首先必须在明确其理论内涵的基础上,科学地界定居民可支配收入的概念,并规定其包括的具体内容,同时还要科学地设计数据采集的具体方法。如果基本概念界定不科学,所规定的具体内容不正确,或者设计的统计调查方法不恰当,抑或存在一些不当的干扰都不可能得到真实反映居民可支配收入的数据。例如,以往在一些经济统计学著作中,研究者曾经将居民通过银行等渠道获得的贷款也作为居民的可支配收入,这样得到的就不是经济学理论上的居民可支配收入。再如,如果在进行调查和计算时直接以居民缴纳的所得税作为推算可支配收入的依据,或者未做必要说明直接向居民了解其收入,则常常会存在低报和漏报收入的现象,因此,通过这种方式求得的居民可支配收入统计数据可能会大大低于居民的真实收入。“可靠度”是指统计数据的可信程度。可靠度的高低可用统计指标值落在一定区间的概率的大小(又称置信度)加以衡量。要想提高统计数据的可靠度,不仅要求科学地设计统计方法与制度,而且要求统计人员严格执行统计方法与制度,排除各种干扰,杜绝造假、瞒报、谎报等违规行为,减少各种调查误差,从而确保统计过程的真实可靠。

真实度和可靠度是衡量统计数据准确性的两个基本尺度,前者重点考察测量结果能否很好地说明所要研究的问题,后者则重点考察测量结果是否存在较大的调查误差,而不涉及结果本身能否正确反映客观现实。它们之间的差别在于所涉及的误差不同,可靠度测量的是指标观测值与所选定的统计指标真值之间误差的影响,真实度除了要考察上述误差影响外,还要反映由于所选定的指标事实上包含了与测量目的无关的变量所引起的系统误差。对于统计数据的准确性而言,真实度是其本质要求,而可靠度则是提高准确性不可缺少的辅助手段。为了进一步说明其中的意义和两者的关系,我们用射击过程为例,并结合图2-1来说明。为了命中目标,射手首先应明确所要射击的靶心,然后进行规定击发数量的射击,子弹平均接近靶心的程度可比喻为测量的真实度,而子弹相互接近的程度可近似看成测量的可靠度。最理想的结果是一组射击的子弹相对集中于靶心附近(如A组),这样的测量既可靠又真实,即说明测量具有良好的可靠度和真实度。如果一组射击一致落在远离靶心的某个区域(如C组),则说明测量结果虽然可靠,但是无效,这可能是由于C射手瞄错了目标而产生了系统误差。同样道理,B组表示该组测量结果不可靠但与C组比相对有效,即B射手虽然射击技术较差,但找准了靶子,所以其成绩好于C射手。而D组表示该组测量结果既不可靠又远离目标。图2-1 真实度和可靠度的意义

引进真实度和可靠度的概念对统计数据质量的内涵进行考察,将有助于进一步开展对统计数据质量的管理与控制。如前所述,早期的数据质量评估和质量控制,主要集中在对调查方法的选择和对调查误差的评价与控制上,其实际上主要是对统计数据的可靠度进行考察,这无疑是必要的,但仍不够充分,要想真正提高统计数据的质量,还必须注意所设计的统计指标是否真正能够反映所要研究的问题。正如射手要想取得好成绩,必须首先找到真正应瞄准的目标,否则再高超的射击技术也难以发挥作用。(二)统计数据质量内涵的扩展属性

从用户的角度考察,除了准确性这一最基本的属性外,理想的官方统计数据还必须具备以下几种性质。1.及时性

指的是统计数据的提供能够及时满足用户需要的程度。这通常可以用经济现象发生的时间和最早可获得反映该现象数据的时点之间的间隔来反映。对经济现象进行研究和制定经济政策通常需要随时把握经济发展的最新动态,如果政府统计部门不能及时提供必要的数据,则很可能成为“雨后送伞”,不能真正发挥其本来应有的作用。2.可比性

指的是同一数据指标在时间和空间上的可比程度。在时间上,由于统计数据的统计制度和统计方法会有所调整,为保持一致性,要求统计部门在每次变动后,对历史数据进行追溯调整,以保持数据纵向上的可衔接性;在空间上,要求不同的国家参考的统计标准尽可能一致,在一个国家内部,则要求同一指标在不同地域的统计口径保持一致。3.适用性

指的是统计数据可满足用户分析和应用需要的程度,为了提高作为社会公共产品的统计数据的适用性,政府统计机构要了解不同类型用户的需要,所提供的统计数据在指标种类、指标定义、构成要素以及分类等方面要尽可能与用户的需求相吻合。另外,为了促进用户正确理解和应用有关统计数据,应该尽可能提供指标解释、计算方法,以及发布的统计数据与源数据(metadata)之间的衔接关系等相关辅助信息。4.可获得性

指的是数据用户获取统计数据及其相关辅助信息的难易程度。它包含两个层次的含义,一是获得统计数据本身的难易程度;二是获得相关统计信息咨询服务的难易程度。

应当指出的是,在现实的统计工作中,要使统计数据同时完全符合上述几种属性是有一定困难的。例如,在数据的准确性与及时性之间,就经常会发生鱼与熊掌难以兼得的情形:为了取得准确的数据需要做详细的调查和统计,这就需要花费大量的时间。因此,有必要做适当的取舍,或者采取其他补救的方式。例如,在对GDP进行核算时,常常先利用相关进度统计资料做速报,在大体准确的基础上满足及时性的要求,然后利用年报统计和会计报表等资料进行GDP的详细核算,最后,每隔一段时间利用经济普查的资料对GDP做进一步的修订,以满足准确性的要求。(三)从全面质量管理角度考察的统计数据质量内涵

从全面质量管理的角度考察,关于统计数据质量内涵的界定,不再单纯地停留在准确性维度或者是用户需求的角度,而是进一步拓展到为了生产高质量的统计数据,政府统计机构所必须具备的环境与各种条件。

全面质量管理是一种从源头到终端的全面管理。从生产到使用的各个环节都会影响到统计数据的质量,因此,统计数据质量的内涵也可以基于统计数据的各生成环节来界定。1.统计生态环境的质量(前提条件)

所谓统计生态环境是指所有影响统计工作的外部因素和条件的总称。高质量的统计生态环境要求有一个高效率、抗干扰的统计管理体制,一套健全的统计法规,一支高素质的统计人员队伍,充分的资金和软硬件投入,以及政府和社会公众对统计的科学态度,等等。2.统计设计的质量(事前阶段)

高质量的统计设计要求政府统计机构能够在充分考虑本国国情的基础上,尽可能地根据研究目的,参照相关国际准则,设计科学合理的统计指标体系与国民经济核算体系,提出科学可行的统计调查方案及报表编制方案,以及详尽完整和规范的专业技术人员操作指南、方法指引等标准化文本。3.统计调查与统计处理的质量(事中阶段)

提高这一阶段统计数据质量的关键在于确保源数据能够按照所设计的方案进行收集和处理,并尽量减少数据在收集和加工过程中的误差。应尽可能地提高“源数据→报告数据”这一过程的统计核算精度。4.统计数据的发布、修订与评估的质量(事后阶段)

提高这一阶段统计数据质量的关键在于按照国际准则及时发布数据,并根据用户需求提供多样化的数据产品形式;在数据诠释方面,应提供尽可能详细的指标解释、方法介绍以及必要的统计分析等;积极开展有效的报告数据质量评估和修订工作,从而形成数据生产者和使用者良性互动的局面。(四)三种统计数据质量概念的关系

图2-2是上述三种统计数据质量概念相互关系的示意图。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载