update 2013.2.6:
补充两张双对数图和线性回归结果。
...................................................
update 2013.1.31:
说明:根据这些统计图我并没有明确说明没有 盲目赞 的现象,只是通过统计数据直观地说明 盲目赞 的情况没有对知乎造成恶劣的影响。此篇答案不足之处在于对于知乎 盲目赞 的情况如何并没有深入地做定量深入研究。
…………………………………………
各位,请看数据:
统计数据来自1991位知友的个人数据,包括赞同数,感谢数,被关注人数,编辑数,答题数。
首先来看一下,这些知友的数据是否具有一定的代表性,请看下面这张统计图:
图 1 被关注人数曲线
图 1 中横坐标为按被关注人数升序排列后的知友的编号,图中蓝点为相应的被关注人数。可以把构成的这条曲线分成三部分:
总的来说就是大部分关注较低的普通用户、一小部分关注较高的推荐用户和某几位大佬,基本与知乎这样一个社区的用户构成相符。在此,不讨论这个曲线是否合理等相关问题,只是想说明我获得的1991名知友的数据对于知乎的用户分布具有一定的代表性。
接下来,我想先研究一下与此题相关的一个问题:粉丝多的知友是否获得的总赞同数就多?
请看下面这张统计图:
图 2 被关注人数和总赞同数
图 2 是在图 1 的基础上加入了对应编号的知友的总赞同数(图中绿点),从这张图可以看到总赞同数有上升趋势,但也有较多的高关注低赞同数的情况。我们分段来看:
图 3 编号1-1500被关注人数和总赞同数
图 4 编号1500-1991被关注人数和总赞同数
图 3 和图 4 是图 2中前后两段放大后的效果。从这两张图可以看出,总赞同数确实有上升趋势,但从图 4 下方也可以看到相当一部分高关注的知友并没有高赞同。所以说不能绝对的认为粉丝多的知友获得的总赞同数就多。
下面正式回答下这道题。(相似的问题还有:粉丝多的知友是否易于获得赞同,是否有 名人赞 现象。)
显然总赞同数高不能说明此人就易于获得赞同,还需要加入其他考量,比如答题数,编辑数等等。如果说名人易于获得赞,粉丝盲目赞,那么名人的赞答比(总赞同数/总答题数)肯定会很高。引用下此问题
如何看待粉丝多的知乎er回答问题获得的赞同数多?的问题描述: 粉丝多的用户放个屁都有人赞同 。这样的情况下名人的赞答比肯定高了。
实际情况是不是这样呢?我们来看一下统计图:
图 5 被关注人数和赞答比
注:为了能和关注人数曲线比较,赞答比在原有的基础上乘以了100。
图5中绿点为相应编号知友的赞答比,从图 5 可以看到赞答比没有明显的上升趋势,低关注用户也有较多的高赞答比。再来看下局部放大图:
图 6 编号1-1500被关注人数和赞答比
图 7 编号1500-1991被关注人数和赞答比
图 8 图 5 底部放大图
从图 6 和图 7 可以看到,两部分的赞答比分布有相似之处:有少数高赞答比的用户,大部分赞答比处于较低位置而且分布比较均匀;也有不同之处:从图8可以看出,图 7 中高赞答比的数量要比图 6 多,图 7 后半段有略微的上升趋势。但同时可以发现,图 7 中高赞答比的数量比图 6 多的不多,图 7 后半段的上升趋势与关注数曲线的趋势比还是相差甚远,因为许多名人确实能提供高质量的答案,所以这样的现象我认为还是处于正常范围。
在这里只是加入了答题数作为考量,更周全的做法是加入编辑数等,但我认为赞同比有一定的参考价值,由这些数据可以认为,虽然盲目赞的现象个例是有,但从整个社区来看,知乎在这方面还是健康发展的。
update 2013.2.6:
图 9 被关注人数-赞同数 双对数图
图 10 被关注人数-赞答比 双对数图
图 9 和 图 10 中的直线为回归直线方程。