数据打架-背景现象
多种统计数据互相打架
2010年7月,国家计划生育委员会公布了《省级人口个案库数据质量评测结果》,20个省20002009年出生人口总数与人口计生统计报表数据相比高出12%。
近一两年,因统计数据的差异引来各方关注的案例不在少数,房价上涨率之争、地方GDP之和大于全国、失业率到底是多少一连串的疑问让统计数据的公信力遭受考验。甚至有报道称,连北大、清华录取的状元人数之争,也爆出与统计方式和口径有关。
数据打架现象在中国大陆地区愈演愈热闹。[1]
数据打架-案例分析
案例
国家人口和计生委消息称,2009年9月在全国范围内部署开展了人口和计划生育基础信息核查工作,各地通过信息核查均发现了一些报表未反映的出生人口。其中,有6个省核查出生比报表出生多10%以上。
解读
与以往的数据打架不同,计生委两组数字的差异,更像是一场内讧。国家计生委在通报中称,本次核查重点是2000年以来中国出生人口及其父母的相关信息。这是人口计生系统首次收集个案信息,并对其中的流动人口开展双向协查,并开展人口基础信息核查。
业内一直认为,人口计生统计报表数据有漏报的现象,所以这次他看到12%的漏报率,与之前一直流传的30%的漏报相差比较大,所以并没有吓一跳。此外,就出生数而言,人口计生报表数字一直偏低的原因,主要是超生处罚的政策。比如担心处罚故意不报,甚至举家迁离;还有一些地方或基层计生单位为保政绩,也会故意瞒报超生人口。
案例
2010年年初,房价上涨率之争引人关注。国家统计局在2009年统计报告中称,2009年70个大中城市房屋销售价格上涨1.5%。但是,国土部事业单位中国土地勘测规划院全国城市地价监测组所提供的数据显示,2009年全国住宅平均价格为4474元/平方米,涨幅为25.1%。
解读
对于房价上涨率之争,全国人大代表、湖北省统计局副局长叶青分析说,由于统计方式的不同,会带来一些统计结果的差异。
中国土地勘测规划院地价所所长赵松解释称,两个数字的模型和统计方法或许存在差异,导致了统计结果的不同,国土部不统计房价,报告中也已经标注,房价数据来自《中国统计年鉴》。
此外,得出两组统计数字的方法或许有所不同。中国统计年鉴的数字是对全国城市房地产价格进行统计,而统计局的数字则来自70个大中城市房屋销售价格。不仅是政府与研究机构存在统计方法的差异,政府之间也会存在因统计方法不同等因素,导致的数据差别。
三、害怕遗漏 地方GDP之和大于全国
案例
2009年,全国GDP增幅为8.7%,今年7月2日,国家统计局将2009年全国GDP增幅修正为9.1%。根据公开报道,各省区市GDP总量加起来,增速比8.7%要高得多。各地公布的数据,经济增速低于8.7%的仅有3个省份。其余28个省份增速都高于8.7%,其中有两个省超过16%。
解读
全国国内生产总值(GDP)数据与各省份公布的总和为何对不上?叶青昨日分析说,现在,中国实行GDP核算分别独立进行的政策,也就是说,省、市、区自己核算自己的GDP,这样多少会有误差,不会出现1 1=2的情况。
另一方面,确实存在重复计算的问题,比如生产基地,分公司不在一个地方,这样就会造成重复计算,作为地方,谁都不愿意自己的GDP被少算。此外,确实不排除人为因素,当然这种因素越来越少。
案例
2009年1月20日,人力资源和社会保障部公布2008年四季度末城镇登记失业率为4.2%,而据中国社会科学院当时公布的一项调查显示,城镇经济活动人口的失业率大概是9.4%。
解读
失业率为什么会造成这种偏差呢?对此,有专家分析认为,这与政府和学术机构因为统计口径不一样有关。
对此,人力资源和社会保障部新闻发言人尹成基当时在发布会上也解释说,两者相差悬殊,涉及两个概念,即调查失业率和登记失业率。
中国从20世纪80年代开始建立登记失业制度,但是,这个指标有其不足之处,它在一定时间内,反映总体失业状况的敏感程度不是很强。此外,有一部分失业人员没有进行登记,这就可能不是很全面地反映状况。
数据打架-影响
统计数据频频互扇耳光,房价上涨率被指是笑话。
据了解,从国际经验看,统计数据的发布并不仅仅是一连串数据的公布,更应当包括数据的来源、方法、意义和适用范围等的公开。发达国家统计机构在发布数据的同时,往往提供详尽的数据来源、生产过程、适用范围。
如果把统计数据看作是产品的话,理应有着详细的说明书。缺少说明书,数据的使用必然会遇到种种问题,对数据的误读难以避免,甚至会影响数据的公信力。
数据打架-专家建言
1、北京大学社会学系教授郭志刚认为,统计数据应该更加公开透明,统计数字怎么来的,原始数字有哪些,只有都公布了,大家才会知道你是不是有道理。
不仅要公布基础数据,郭志刚认为,要通过实事求是的工作来避免统计上的问题,并且不能总公布一个简单的结果,真正要说服人,就需要一个说明。国外原始文件有一尺厚,不怕别人问。但我们做得比较粗。
2、全国人大代表、湖北省统计局副局长叶青也认为,能公开的数据尽量都要公开。
作者:编辑、剪辑:唐培和 :10位[7111233417] 13位[9787111233411] : 出版日期:2008-2-1 定价:¥29.80 元内容提要 机械工业出版社数据库技术是信息系统的一个核心技术。本书内容全面、概念清晰、语言流畅..
作者: 编辑、剪辑:刘竹林 :10位[7508450132] 13位[9787508450131] : 出版日期:2008-1-1 定价:¥19.00 元内容提要 本书是关于大型关系数据库Oracle开发和编程的教材,本书主要内容包括,数据库原理概论、SQL..
“包”(Packet)是TCP/IP协议通信传输中的数据单位,一般也称“数据包”。有人说,局域网中传输的不是“帧”(Frame)吗?没错,但是TCP/IP协议是工作在OSI模型第三层(网络层)、第四层(传输层)上的,而帧是工作在第二层(数据..
:高晗 等编著 :10位[7508449037]13位[9787508449036] :水利水电出版社 出版日期:2007-9-1 定价:¥29.00元 内容提要 本书介绍了构架一个Web网站的全过程,使读者对Web网站的开发有一个完整的认识。首先对AS..