人口普查数据有作假吗?这种方法可以知道
人口普查是由国家制定的在规定的时间节点、统计方法、项目、调查内容下,对全国所有人口进行普遍的逐户、逐人进行全面登记调查的调查方法。
(资料图)
人口普查可以真实地了解各地现有人口发展现状,包括性别、性别比、婚姻、住房的数据。
人口普查不仅在我国进行,是在世界各国普遍进行的、被认为是关于搜集人口资料的一种最基本的方法。
但是,总会有来自民间的网友和专业的学者,质疑人口普查结果的准确程度。即我国的人口普查对外公开的结果,有没有弄虚作假?其结果,值得相信吗?
如果想回答这个问题,大约有以下有三种方法可以知道答案:
一,查阅统计机构对人口普查的质量抽查结果。
结果显示,2010年第六次全国人口普查的人口漏登率为0.12%,第七次全国人口普查的漏登率为0.05%。即六普约有160万人被漏登记,七普则为70万人。
二,通过第三方数据进行对比,如公安局的出生人口数据、住建部的城乡人口数据、卫生部门的新生儿疫苗登记数据,以及历年不同类型数据的波动对比。
有人就用疫苗数据,质疑过人口普查的真实情况;我们在昨天的文章中也说过,广州2019年和2020年常住人口有多达300万的波动,应该也是统计误差引起的。
三,数学方法,比如本福特定律。
我们在《上市公司财报有没有作假?这个方法可以知道》一文中,对十家上市企业的财务报告做了分析。数据显示,那些已经成为ST的企业,其半年前的财务报告,数据明显有偏差。
今日的数据,我们采用本福特定律的方法,观察第六次和第七次全国人口普查的区县常住人口数据,是否符合本福特定律关于各数字的分布规律,从而得到数据是否存在作假的可能。
本福特曲线是由本福特首先发现的,这个曲线说的是:一堆从实际生活中得到的数据中,首位数字中,数字1出现的概率约为总数的30%,数字2为17.6%,数字3为12.5%,数字9出现的概率是最低的,不到5%。
本福特定律,经常用于对人口普查、财务报告和选举数据进行验证,以验证这些数据是否有作假。
从国内学者和网友的实际分析来看,运行良好的上市企业,其财务数据基本符合本福特定律的分布,即财务数据相对真实。
先说验证的方法,毕竟如果不是谣传的内容,每个人都能通过相同的方法,得到相同或相似的结论。
方法为:1,获取到全国各区县的常住人口数据;2,提取各区县人口数据的首位数字(从1到9,不会为0);3,统计1到9出现的次数,计算得到和数字出现的比例;4,将数据绘制成可视化图表,可以更直观地观察数据的分布情况。
按照这种方法,我们统计得到第六次和第七次全国人口普查的数据与本福特曲线中各数字的分布情况,如下图所示。
考虑到这组数据实际上包含了全国、省级和地级行政区的数据,但我们不确定在本福特的方法中,是否应该包含这类数据。所以我们绘制了两张图表,一张包含了省市数据,一张不包含省市数据。
一,不包含省市数据的分布
二,包含省市数据的分布
从结果来看,不管是否包含省市数据,本福特曲线与人口普查的数字分布,都有明显的差异。
其中包含省市的数据中,数字2和数字8与本福特曲线的数字2和8完全重合,但其他数字同样有比较明显的偏差。
基于前述的方法,我们认为不管是第六次人口普查还是第七次人口普查,单从区县的常住人口来看,数据的分布并不十分真实,有作假的嫌疑。
但是,本福特定律是有缺陷的,即它无法指出虚假数据的具体所在位置,仅能作为饭后谈天说地骂娘的资料而已。
关于人口普查数据的真实情况,你有何高见?评论区欢迎你的看法。
关键词: