#0 世界大学排名
2015年10月,国务院印发《统筹推进世界一流大学和一流学科建设总体方案》,目标是到2020年,若干所大学和一批学科进入世界一流行列,若干学科进入世界一流学科前列。但是,什么是世界一流大学?谁有资格评判一所大学的一流与否?难有定论。不过,由若干国际机构发布的「世界大学排名」,正在垄断对于「一流」的解读权利。
究竟哪些大学排名更科学?哪些大学排名比较「水」?本文将概要介绍有关情况,与各位读者共同探讨。
#1 大学排名的历史
对于高等院校进行量化评定的做法,远比「大学排名」更历史悠久。早在1870年,美国的教育部门就开始发布关于高等院校的统计数据,使大学间的量化对比成为可能[1]。1900年,英国人Alick Maclean发表了一本叫「我们在哪找牛人」(Where We Get Our Best Men)的著作,统计了各大学培养出的「杰出人才」的绝对值并进行排名[2],这可能是最早的大学排名之一。
1983年,U.S. News开始发布美国的最佳大学排行榜。排行榜最初的依据完全是各大学校长的评判,但随后引入了更多的指标。
在互联网上,有人指责国际大学排名是欧美教育机构对中国大学的压迫和阴谋。然而,上海交通大学实际上是最早发布具有一定影响力的世界大学排名机构——这一世界排名正是「软科世界大学学术排名」,也称软科排名。可以说,软科排名是世界大学排名竞争的滥觞。
#2 QS:声誉至上
Quacquarelli Symonds(夸夸雷利·西蒙兹)是英国一家专门负责教育及升学就业的国际高等教育咨询公司,成立于1990年。自2004年起,QS与泰晤士报高等教育专刊(Times Higher Education )共同发布世界大学排名,也称为QS-THE排名。自2010年后,双方各自单飞,分别发布自己的世界大学排名,也就是我们常说的QS排名和THE排名。
QS排名最大的特点是「声誉」占比极高,其中,学术声誉和全球雇主声誉两项的总和占到了全部指标比重的50%。那么,声誉该如何判定呢?QS采用的方式是——向「业内人士」发问卷,数以万计的问卷。
QS的学术声誉调查和全球雇主声誉调查恐怕是该领域规模最大的、数据量最多的调查之一,以此为基础而产生的排名拥有非常极端的利弊。从积极角度看,这样的调查非常直接地提供了「同行」的观点,反映了学术界和企业界中坚力量对大学实力的认可程度。然而,从另一方面来看,过于主观的判定标准使QS的排名受到了许多人的质疑。
实际上,「同行评议」是学术界的常态,也是许多「小圈子」的常态。例如,法律、金融等行业的绝大多数排行榜,都将「声誉」放在了非常重要的位置。如果学术圈内人都普遍认可大学A优于大学B,那么不就说明大学A更具有「影响力」吗?
然而,这样的评价模式很可能不仅反映了声誉,也反映了成见。人们倾向于对自己更熟悉的院校给出更高的评价——非英语国家大学、新大学、非综合性院校等就可能因此而吃亏。
最后,师生比例、国际教职工和国际学生比例意味着在QS看来,一名院士和一名普通讲师权重相同,而「国际」是唯一的加分项。这些都是QS受到诟病的主要原因。
但是,QS仍然是世界上最知名、最受认可的国际排名之一。国际教职工和国际学生较多意味着更强的国际吸引力,师生比例意味着生均教师资源,学术声誉意味着学术共同体的同行认可,全球雇主声誉意味着欧美大型企业的录用偏好——可以说,QS就是一份直观反映全球大学「声誉」的排行榜,既不用高估,也不应低估。而且,考虑到QS是世界各国HR最喜欢的排名(或许没有)之一,而就业始终是学生的重要目标——多参考QS排名,恐怕没错。
QS排名主要指标 | 比重 |
学术声誉 | 40% |
全球雇主声誉 | 10% |
师生比例 | 20% |
每位教职工的论文引用数 | 20% |
国际教职工比例 | 5% |
国际学生比例 | 5% |
#3 THE:一脉相承
泰晤士高等教育世界大学排名,又称Times排名或THE排名,是泰晤士报高等教育专刊自和QS和平分手后发布的世界大学排名,先后与路透社和爱思唯尔合作。
与QS相比,THE排名保留了声誉调查的部分,但相对较少,且更为细化。具体而言,教学声誉和研究声誉的权重之和为36%,国际化程度权重为7.5%,且细分为国际教职员/国际学生/国际科研合作三项。论文引用指标为30%,大于QS排名。较为有趣的是,THE排名还引入了大学收入、工业收入(产学研结合)和研究收入这三项经济指标,用以反映学校的综合资源。
从某种意义上说,THE和QS一脉相承,继承了QS的优点和缺点,也有所革新和改进。从整体设计上看,THE的评价指标比QS更为多元和科学,但调查数据量相对较小。
QS2021排名 | THE2021排名 |
麻省理工学院 | 牛津大学 |
斯坦福大学 | 斯坦福大学 |
哈佛大学 | 哈佛大学 |
加州理工学院 | 加州理工学院 |
牛津大学 | 麻省理工学院 |
苏黎世联邦理工大学 | 剑桥大学 |
剑桥大学 | 加州大学伯克利分校 |
帝国理工学院 | 耶鲁大学 |
芝加哥大学 | 普林斯顿大学 |
伦敦大学学院 | 芝加哥大学 |
#4 USNWR:客观公正
U.S. News & World Report是一本美国杂志,早在1987年就开始发表美国大学排名。2014年10月,U.S. News首次发布「全球最佳大学排名」,并每年更新。
相较于以声誉为主要评价指标的QS和THE排名,U.S. News排名更关注客观数据。尤其具有开创性的是,U.S. News将普通论文和高被引论文区分开来,使被更多人引用的论文具有更高的权重。
不过,即使是标榜客观公正的USNWR也有25%的权重源自研究声誉,并被细分为全球声誉和地区声誉,分别由全球学术界和所在区域(大洲)学术界进行评价(各12.5%)。这一区分是基于「研究者对于所在区域的大学有更多的了解」,然而,在实际结果中,英国和美国以外的国家的大学在排行榜中有相当的劣势,前二十五名仅有多伦多大学(并列17)和墨尔本大学(25)两所学校来自美国和英国以外的国家。
U.S. News关注学术和数据的特点也带来了一些问题。例如,它不反应学生的就业能力和非学术能力,也不考虑学生的非学术职业发展。此外,其排名虽然考虑了高质量学术论文的权重,但对于质量的判断只能利用「引用量」这一数据,且忽视了非期刊论文的学术成果。美国计算机研究协会(Computer Research Association)曾特别针对U.S. News发表声明,谴责其关于计算机科学的排名方法。在声明中,计算机研究协会强调「任何有CS研究知识的人都会把这个排名当屁放,但是其他人会被严重误导」(anyone with knowledge of CS research will see these rankings for what they are — nonsense — and ignore them. But others may be seriously misled),措辞不可谓不强烈[3]。此外,在2021年全球数学专业排名中,曲阜师范大学力压北京大学、清华大学,摘得中国区桂冠,也引发了舆论的普遍质疑。
但是,对于追求学术培养的许多学生来说,U.S. News无疑是值得参考的排名之一。
#5 ARWU:数据说话
软科世界大学学术排名(Academic Ranking of World Universities)于2003年由上海交通大学高等教育研究院世界一流大学研究中心首次发布,是世界范围内首个综合性的全球大学排名。2009年开始,ARWU改由上海软科教育信息咨询有限公司(即“上海软科”)发布。可以说,这个排名的诞生首先源自利用科研经费完成的学术成果,又逐渐发展为一家教育咨询机构。因此,现在的四大国际大学排名实质上都由商业机构运营。
尽管软科排名由中国团队独立开发,中国大学并未在软科排名上占任何便宜——实际上,由于软科排名对诺贝尔奖和菲尔兹奖的高度追求,中国的大学甚至可能在排名中吃了不小的亏。
软科排名主要指标 | 比重 |
校友获得诺贝尔奖/菲尔兹奖数 | 10% |
教职员获得诺贝尔奖/菲尔兹奖数 | 10% |
高被引学者数 | 20% |
《科学》和《自然》发文数 | 20% |
SCIE/SSCI论文发表数 | 20% |
上述数据和全职教员之比 | 10% |
软科世界排名有着浓郁的中国特色,对诺贝尔奖、高被引、Nature和Science杂志、SCI论文的追求始终如一。
软科排名的主要特点是其客观性。与其他三大主流世界大学排名相比,软科是唯一不掺杂任何主观成分的排名。更进一步讲,所有数据几乎都可以轻易收集——诺贝尔奖/菲尔兹奖的获奖者是公开数据,高被引学者是科睿唯安(Clarivate Analytics)每年发布的公开名单。《科学》和《自然》两本期刊的发文数极其有限,SCIE和SSCI的论文发表数则可以通过Web of Science简单获得——而Web of Science恰恰还是科睿唯安的旗下公司。可以说,一个本科生可能都可以通过网络爬虫技术和一定的数据分析生成与软科排名结果相差不多的「硬科排名」。
这可能恰恰是软科优势和劣势无法分割的特质——因其唯数据主义的排名逻辑,任何人都可以轻松检验其排名结果,而不会有因为商业利益而产生的公正性质疑;然而,一个如此简单就可以获得的排名,又能否真正反映一个大学的综合能力呢?许多学者曾指出软科排名的方法存在本质问题,指数选择也缺乏依据[4]。例如,Nature和Science并不是覆盖所有领域的顶级刊物,而诺贝尔奖和菲尔兹奖也仅仅覆盖了很少学科,文科和社会科学颗粒无收。在极端情况下,拥有大量诺贝尔获奖者的院校即使在过去一年的时间内毫无建树,也可以躺在功劳簿上享受排行榜前列的待遇。
#6 国内排行:深不可测
1987年9月,中国管理科学研究院赵红州研究员、蒋国华教授等发表了中国第一个大学排名。此后,许多个人、机构、院校都开始发布各种各样的大学排名。知名的排行榜包括武书连中国大学排行榜、校友会排行榜、软科中国大学排名等。
但是,许多国内排行榜透明度低、评选依据不明、评选结果难以获得普遍认可,一些知名排行榜甚至被教育部门点名批评。
校友会中国大学排名采用了「星级制」,是近年知名度和影响力较高的排名之一。但是,所谓校友会网,实质主体是「深圳艾瑞深信息咨询有限公司」,这是一个注册资本仅有30万元人民币的小微企业,官方邮箱是126邮箱,却每年发布数十个各类大学排名——不知道研究团队是否撑得住。
软科排名声称依托软科自主研发的高等教育评价专利技术和“大学360度数据监测平台”的数据支持,设置十个评价模块,细分30个评价维度,使用百余项评价指标,涉及数百个评价变量——这也是中国国内大学排行榜的典型特征之一:变量繁多。变量越多越好吗?仁者见仁智者见智。
另一个有趣的现象是,如果完全采用客观数据,文科类院校、语言类院校显然会在榜单上处于不利地位。但是,「主观评价」在国内大学排行中又遭到排斥(一方面会被怀疑不客观,另一方面愿意参与此类同行评议的学术界人士较少)。因此,与其他国际排名不同,中国的大学排行喜欢引入「高考成绩」或「生源质量」作为重要指标。例如,软科中国大学的生源质量占80分,而国际期刊论文质量+国际期刊顶尖论文+论文被引总次数+博士点数+硕士点数才仅有50分。考虑到中国特色的统一高考制度,「生源质量」至少可以为大学的录取难度提供一定的评价——但是,这意味着在这些排行榜的设计者看来,越难考的大学是越好的。实际上,这是把「同行评议」变成了「家长和考生评议」。
总而言之,国内大学排行榜虽然已经有超过20年的历史,但研究方法和研究工具都有待进一步发展,客观性和有效性也未能获得普遍认可。
#7 总结:各取所需
本质上看,任何排名都是基于特定逻辑和方法进行的带有「不可避免偏见」的评价活动,这些偏见既包括源自同行评议的主观偏见,也包括因为指标选择而产生的客观偏见。因此,一个包罗万象、完美无缺的评价体系是在逻辑上不可能存在的。
所以,固然我们可以讨论哪些排名体系或指标更加科学,但这都需要基于需求和目的。例如,如果你的目的是进入特定的企业,那么直接找这个企业的target school list;如果计划考取的企事业单位要求QS排名前N名,那么就参考QS排名即可。至于我们应该选择更「好」的大学,还是更「难」考取的大学,这又是另一个话题了。
参考文献:
[1] Meredith, M. (2004) ‘Why Do Universities Compete in the Ratings Game? An Empirical Analysis of the Effects of the U.S. News and World Report College Rankings’, Research in Higher Education, 45(5), pp. 443–461. doi: 10.1023/B:RIHE.0000032324.46716.f4.
[2] Myers, L. and Robe, J. (2009) College Rankings. History, Criticism and Reform, Center for College Affordability and Productivity.
[3] CRA (2017) CRA Statement on US News and World Report Rankings of Computer Science Universities, CRA Bulletin.
[4] Billaut, J.-C., Bouyssou, D. and Vincke, P. (2010) ‘Should you believe in the Shanghai ranking?’, Scientometrics, 84(1), pp. 237–263. doi: 10.1007/s11192-009-0115-x.