百科问答小站 logo
百科问答小站 font logo



印度的人口年龄分布为何每五年出现一个高峰? 第1页

  

user avatar   ai-tao-2 网友的相关建议: 
      

部分同意

@藕粽

的答案 (Digital Preference完全正确! 但是我认为不止是跟文盲率相关的现象).

反对

@孙毓波

的答案 (太主观).

有个叫

George Chandler Whipple

的人发现的一个现象, 进而统计的一个参量. Whipple's Index 可以用来量度人口普查的可信度. 该参数越大则越不准确. 原因就是参数越大的地区 缺乏相应的计数方式 (不只是文盲, 而只是对数字不敏感), 导致人们很随意的round up 或者 down自己的年龄. 比如说28岁会说自己 "二十多", 进而就填25 或 30. 另一个例子是偶数偏好.

这个指数就类似于"强迫症调电视音量一定要调到25或者30!!! 28 是个什么音量??!"


这个Index不代表文盲比例, 我认为最贴切的描述是"普通民众对于数字敏感程度".

就算有人不是文盲, 但是他就是倾向于把自己年龄报成个整数 (19 报 20, 31 报 30).

不是每个人都对于年龄如此敏感.


我的父亲为了工作项目年龄改过好几次, 在二代身份证之前我父亲的生日甚至是根据农历算的, 二代身份证的时候才现编了一个生日 (所以我这个不孝子每年都不给他庆生... ...T.T).

算法和参照表格如下:


Nx 表示 满了X岁的人口数量

Whipple's Index 对照量表.


引用:

ijphjournal.it/article/


WIKI如下:

Whipple's Index (ano... 请各位自行google/baidu/维基... 因为维基百科的网址中间有个 ' 号 把网址分开了于是知乎识别不出来了...)

关于India的报道如下:

Whipple’s Index shows Indians are lying less about their age

摘图:

2001 年的指数大概在170 ~200 之间浮动 (尼玛数据纯粹不可信啊...)

2010 没找到平均值. 题主你的数据里应该给出来了, 或者有哪位Demography 大神来指导一下.. 我根据最高最低估算了一下大概是个125 - 175的区间吧(也就是Bad那一栏). 说明还是很明显的倾向性.

补充: 目前只有一个民族/国家的人口普查Whipple's Index 基本对不上号, 乃我大汉族!

我大汉族因为十二生肖的事情导致成为了最有名的Whipple's Index NOT apply 的典范!!


user avatar   ozone 网友的相关建议: 
      

Digital preference. 这在文盲率较高的地区是常见现象。人们常常没能确切记录出生年月,在人口普查的时候按照约数(通常是 5、0 结尾)回答年龄。这跟具体的普查年份无关,任何时候普查都会有以 5、0 结尾的年龄为跳跃的现象。

==================================

补充

@呆涛

给出的 Whipple's Index 是量度 age reporting 准确度的一个常用指数,昨天回答的时候没想起来。但是有几点值得注意:

1-

@呆涛

给出的公式是用来测量 5、0 偏好的,但相似地可以构建别的数字偏好的公式。

2- 该指数只包含了 23 到 62 岁的年龄分布,也就是 25±2 到 60±2 的分布,Whipple 认为线性假设(见 3)对高龄组和低龄组不适用。

3- 该指数有一个重要假设:五岁年龄组内年龄分布为线性。如果有外生变量起作用,这个指数的效用就存疑。

根据

@呆涛

回答里的公式和题主给的印度普查数据(表 C-13),印度 2011 年普查全国的 Whipple's Index (5、0 偏好)是 171.04,农村地区为 180.52,城市地区为 152.88。表 C-13 是分邦、分性别、分城乡的,可以计算更多的 Whipple's Index。

@呆涛

还提到文盲率解释的问题。文盲率和这个现象(或者说 Whipple's Index)高度相关应该是个安全的说法,但文盲率(或者社经发展程度)的确是一个略显 remote 的原因。不过话说回来,用「缺乏相应的计数方式 」「对于数字敏感程度」来解释这个现象有点儿 tautologic。

另外,就像

@chenqin

指出的那样,如果要用文盲率来解释这个现象,还需要在地区内部的历史维度和地区间的比较维度上提出更合理的机制。


user avatar   chenqin 网友的相关建议: 
       @藕粽

的回答是正确的,这个问题的答案就是Digital preference。印度人口的奇怪形态就是因为记不清自己的生日而产生的误报。

人口普查中,有一个专门的名词,叫Whipple指数,范围在100到500之间,度量的是年龄尾数在0和5的集中程度。在精确度较为良好的人口普查中,Whipple指数一般在100左右,即以0和5结尾的年龄人数等于每个年龄的平均人数;当Whipple指数等于500时,代表0和5结尾的年龄人数等于每个年龄的平均人数的五倍——此时所有人的年龄都以0和5结尾。一般来说,Whipple指数和普查质量的关系如下表所示:

印度就是那种普查质量最最最低的国家。在2011年的人口普查,印度的Whipple指数是171,在差的范畴内,说明报告了0、5结尾的年龄的人数是平均人数的1.71倍。

大家不要笑,由于印度在2011年普查中采取了记录出生年份的方法,这个数字比起2001年普查的230已经有了长足进步了。从下图可以看出,尽管2011年的0、5结尾(除了0、5之外,印度人还偏好2、8结尾。这是

@呆涛

提到的偶数偏好,但印度人不喜欢4和6)的凸起仍然很吓人,但比起前两次普查,确实已经好了很多。

Digital preference的原因十分复杂。

@藕粽

说到了文盲比例,这当然是一个重要因素,比如下图是印度各邦在2001年的识字率和Whipple指数,可以明显地看到识字率越高的地区Whipple指数越低。

但我们也可以发现,对于识字率达到了90%以上的Kerala邦,Whipple指数仍然高达140,处在差的范围内。而中国在1953年的第一次人口普查时,文盲率高达80%,普查的Whipple指数却仍然只有102,数据质量十分优秀。因此,能否记住自己的生日,文盲与否会在一定范围内起到作用,但还有别的重要因素。

生肖无疑算是一个因素。汉族的生肖系统结合自我报告的年龄,一般就可以把出生年份给推定精确了。在历次人口普查中我们都可以发现,不管文盲与否,汉族人口都能精准地报告自己的生辰,而一些少数民族的报告就不那么准确。例如维族和藏族的Whipple指数都在110以上,其中维族的Whipple指数在1990年高达130。下图表示2010年普查的维族人口年龄结构,我们也能发现在0、5结尾处明显的凸起,虽然没有印度那么强烈。

但生肖也不能解释所有偏差。如果只算兽历,那么维族一样有兽历,印度其实也有,大家都有12只野兽,为什么汉族特别擅长记住自己的年龄呢?对生死的态度,可能算是另一个原因。中国的传统视生死为大,对这两个日子都记得很精确。一般墓碑上的生卒年是必不可少的。大一些的家谱里面,即使是最默默无闻的人,一般也有这样几个信息——哪年生的,老婆是谁,哪年死的。

印度对生死有着什么样的传统,我不太清楚,但是印度普查局在辩解年龄数据报告为什么那么不准确时,有一句话倒是让人印象深刻:

In country like India, the distortions are naturally greater because precise determination of age is not considered important in everyday affairs.
在印度这样的国家,(普查中的年龄)偏差较大,是因为精确判断年龄在日常生活中并不被认为是一件重要的事。

到底有多不重要?我还是难以体会,直到算出这么一幅图。

上图是印度某个人群在2004年小普查中的人口年龄结构。不出意料,波澜壮阔呀。在0、5结尾的年龄非常高,在2、8结尾的年龄也比较高,在其他年份的人口几乎减半。

但问题是,这批人是印度的大学毕业生和研究生,他们是印度学历最高的一群人,仅占印度总人口比例的4%不到,和文盲、不识数或者记性不好怎么也沾不上边。连这批人都记不住自己的生日,除了诉诸文化,我还真的想不到有什么别的解释了。




  

相关话题

  为什么刘庸天天“黑”印度,印度人却好像没什么反应? 
  如何看待这次新冠疫情中,印度的反华情绪? 
  为什么这次洞朗事件国外政府基本不表态? 
  是否可以说,只有美国这种犯罪率高同时文化创造力强的国家才能孕育出"蝙蝠侠""海扁王"等超英文化? 
  8 月 10 日,印度新冠病毒确诊病例累计超过 215 万例,印度疫情未来将会如何发展? 
  如果这次中国和印度打起来的话中国会有什么好处?俄罗斯会不会再次背后插一刀卖给印度军火? 
  2021 年全国人口为 14.1260 亿人,比上年末增加 48 万人,有哪些信息值得关注? 
  如何评价印度总理莫迪? 
  歼10与阵风对比怎样?印度购买了阵风,据说就是为了针对中国歼10,大家怎么看? 
  「知识经济」对于金融危机的爆发和持续,究竟是促进还是阻碍? 

前一个讨论
军人可以行使优先购票的权利吗?
下一个讨论
「人脑只用了不到 5%」 的说法是否确有科学依据?





© 2025-01-18 - tinynew.org. All Rights Reserved.
© 2025-01-18 - tinynew.org. 保留所有权利