基尼系数现在都快成国家机密了……但是幸好,不久前西南财经大学公布了一个《中国家庭金融调查》报告。使得我等普罗大众有机会DIY计算出一个近似值。
财经大学这份报告在网上引起轰动的一个原因是它里面提到“城市家庭户平均资产247万”,引得无数网友纷纷惊呼“被平均”,“拉国家后腿”。
而财大学生张睿则解释说:“我们的数据中,最有钱的10%的家庭占有全部样本资产的80%以上,所以提高了均值水平。而更有解释力的是中值水平(中位数),样本中家庭资产的中值为40.5万元,就是表明一般城市家庭的资产是在40.5万元以下的。”
http:// finance.people.com.cn/G B/17909235.html
这份报告其实忠实反应了我国的贫富差距现状。
然后有人人网友根据该报告DIY出了深藏的基尼系数:0.676
算法和过程如下链接:
http:// blog.renren.com/blog/25 6556892/846570469
更新答案,依旧是西南财经大学的中国家庭金融调查项目给出的,目前最权威的答案:
根据中国家庭金融调查(CHFS)的数据计算,2010年中国家庭收入的基尼系数为0.61,城镇家庭内部的基尼系数为0.56,农村家庭内部的基尼系数为0.60。2010年全球基尼系数平均为0.44。
基尼系数是量度贫富悬殊程度的标量。它的定义如下:我们首先收集社会上每一个人的总财富额,把它从少至大排序,计算它的累积函数(cumulative function),然后便可绘出图中的洛仑兹曲线(Lorenz curve)。图中横轴是人口比例的累积分布,竖轴是财富比例的累积分佈。
图一(图片来源:
File:Economics Gini coefficient2.svg)
我们先想想两个极端情况。假设社会上人人财富均等,那就给成了图中的45度直线,称平等曲线(line of (perfect) equality);但如财富集中在一人手中,那就绘成图中在右端的竖轴,称绝对不平均直线(line of perfect inequality)。而图中的洛仑兹曲线乃实际分佈。
A和B是图中两面积,基尼系数便是。
用此定义,在人人财富均等情况下,基尼系数为0;在财富一人独占的情况下,基尼系数为1。
利用这定义,基尼系数可用简单的电脑函数计算,有兴趣者可参
econ_inequality/ginicoef.py at master 路 stephenhky/econ_inequality 路 GitHub,或参考如下代码:
import numpy as np def gini_coef(wealths): cum_wealths = np.cumsum(sorted(np.append(wealths, 0))) sum_wealths = cum_wealths[-1] xarray = np.array(range(0, len(cum_wealths))) / np.float(len(cum_wealths)-1) yarray = cum_wealths / sum_wealths B = np.trapz(yarray, x=xarray) A = 0.5 - B return A / (A+B)
只用八行Python代码便可实现。
我们知道在资本主义社会中,财富分佈由Pareto distribution表示,此分佈实为幂定律(power law),即。从式中,愈小,财富分佈愈不平均,基尼纟数也大。这个关係,可从图二中看到。
图二