我们先来看看2019年国内几个比较主流的动画评价网站的评分:
和bilibili评分最接近的是豆瓣剧集动画评分,这是因为在豆瓣会给剧集动画打分的受众远比剧场动画更为忠实,但是9.9分的bili平均评分相比之下更显夸张。
在我看来,bili的评分总的来说是很失败的。总有人说这样的话“bili的高分都值得看”“bili的低分”都不值得看,这就能参考了。但是,说到这我就有个问题,“值得看”和“不值得看”仅仅是二选一的答案,为何评分这里要却给出5个选择呢?
那么为什么bili能不能看的及格线是9分(十分制),而不是像我们的普通考试一样是60分(百分制)呢?
有的人说bili和淘宝/steam很像,只要不太坑爹都能有个还不错的评价,但是我个人觉得本质完全不一样。因为淘宝/steam的商品是明码标价的,价格因素影响了用户的期望。
举个例子,比如手机。
1000块钱的手机98%好评率和3000块钱手机95%好评率,大部人依然会觉得是3000块钱的商品质量更好——这是客观的评价。
好评率大家心中的这个评价其实是“我花了1000块钱买这个商品,我觉得在这个档位挺值得”——这是主观的评价。
虽然可能出现高价买了低配的手机这样的情况,但是大部分时候价格是能够反应手机这类商品的价值的。
而bili评分的动画是没有价格参考因素的,这样就变成所有价位的商品在比拼好评率,这不就乱了套了吗?”
评分系统“相对于“好/差评系统”最大的意义,就是文艺作品是很难明码标价的,需要用户去给这样的文艺作品附带一个可以当作价格那样去参考的价值。一些人说什么bili高分不一定好,但是低分一定不好;实际上就是在混淆评分的概念。
在弹幕文化发源地niconico,他们也搞了个评分系统。在作品播放结束后就有个满意度评分:
“非常满意,比较满意,一般,比较不满意,非常不满意”
因为在头几集的时候筛选出了目标观众,到故事中段留下来的普遍是固定粉丝了,因此N站的好评率走向规律一般是越来越高的。
BILIBILI的评分系统有点类似这个,因为bilibili的评分性质其是“推荐榜”,而不是“排名榜”,代表了观众对一部作品的满意程度以及推荐度。所以我们能看到niconico面对合胃口的片子时,打分对比bilibili一点也不吝啬:
其实客观上看上去,nico的5种满意程度其实和bilibili的1星-5星的打分机制区别不大,但是反应的结果和对观众的引导却比bilibili更加直观。而另外一个动画评分网站BGM在评分机制上,也远比bilibili直观、引导也做得更好:
bili一开始引入评分功能时,很多人还以为这个功能要和之前bili搞得那个兴趣圈那样创业未办而中道崩殂。不过毕竟评分栏就在新番动画的下端,非常方便就能顺手打个分。对于现在表达欲望极其强烈可大部分肚子里又没啥墨水还非常懒的年轻学生而言,没有比这个更加方便的途径。
——上图是2017年网友制作的一张bili全站动画评分参考,你找不到第二个9分档位这么密集的的评分网站的,在全世界都堪称独树一帜。
而在欧美最大的动画评分网站MAL呢,他们的评分分布是怎么样的?
——基本符合类正态分布。
为何两个网站的分布会出现这么大的差异呢?这里就不多谈了。
然而评分反映的只是一方面,在bilibili评分系统中还有其他的一些不可忽视的问题,随着这些问题“评分警察”一词也应运而生。
首先,在我看来,bilibili对评分和评分者的保护是做的非常失败的,很多作品的爱好者一方面给自己的喜欢的作品打满分,一方面却不能接受低评价用户的差评,还会滥用举报功能甚至对低评价用户私信辱骂,这完全已经违背了评分系统建立的初衷。
评分系统是什么?在我看来评分系统是一面镜子:
一部作品的评分中有特别喜欢的人、有一般喜欢的人、有不怎么喜欢的人、有比较讨厌的人...这些人的主观客观评价共同构成了一部作品最终评分的一部分。喜欢/不喜欢的人群永远是客观存在的,但是不刻意刷分的前提下,这些人所占的比例最终会处于一个稳定的数字,使得某一部作品评分也会趋于稳定,从而反映出作品的品质。
但是bili的评分系统无疑是容不下差评的,盲目追求的10分的结果是违背客观事实的,但像上图“我可以给好评,你不能给差评”这样破坏评分体系的做法得到了大多数人极大的推崇,这无疑是不合理的。
其次,bilibili的评分对比其他的评分网站还有一个特点,那些被“大UP带过节奏”的动画评分是比较极端的,这相当于一个信号“UP觉得这部动画怎么怎么样,那么我去打高/低分也是对UP的支持”、“我自己一般不打好/差评,虽然我没看过这部动画,但是我会证明我喜欢UP观点去打好/差评”。
这对于一个评分系统更是非常恶劣的影响。很多人看过zhihu、微信等公众号的影评后大概率不会去给作品的豆瓣评分添砖加瓦,但是bilibili的评分系统作为一个社区内部功能,给作品打分却是举手之间。前段时间革命机风波已经能上升成一个可笑的集体行为艺术。
在我看来评分之所以是评分,是因为7分有7分的特征,8分有8分的特征,9分有9分的特征。每个区间比较之下差异是明显的,这个我们平时也听得多了,在叫“区分度”。正因为不可能有完美的动画,所以我们才能通过评分以及评价更加清楚一部动画优劣好坏,去了解这部动画的价值。
——而bili的评分社交意义大过了评分参考,UP主认同感大过了作品认同感。而一个优秀的评分网站并不需要“我喜欢的动画是最棒的”这样的自我陶醉。
可能有虚高,但比豆瓣好多了(某编剧编了个不存在的电影在豆瓣上还得到的高评)
9.0——9.9,基本上没啥问题,剧情也不错
8.0——8.9,有一点瑕疵,但总体来说还不错
7.0——7.9,有问题和硬伤,总体来说还勉强能看
6.0——6.9,返工
5.0——5.9,需要重新设计
剩下的基本上就不怎么样了