资源平台

您现在所在的位置是：首页 >> 正文

世界一流大学的学术品质评估对“双一流”建设的启示

作者：侯静发布日期：2017-09-13 浏览数：

从世界范围看，许多国家都将创建世界一流大学，作为提升国际竞争力、确保国际竞争优势的重要战略举措，并纷纷提出有关行动计划，如德国的“卓越计划”、韩国的“BK21工程”、俄罗斯的“联邦创新型大学计划”、日本的“21世纪COE计划”等。近20年来，我国政府相继实施了“211工程”和“985工程”，我国研究型大学与国外研究型大学的差距迅速缩小。在近年来的“泰晤士高等教育（THE）世界大学排名”中，北京大学清华大学都进入了全球50强；在英国QS教育集团近年来的“QS世界大学学科排名”中，我国大陆都有几十所大学入选全球顶尖学科前400名，在数量上仅次于美国。“双一流”战略的实施无疑将加速推进我国若干所大学、一批学科步入或者接近世界一流大学和一流学科的行列，而一些著名的世界一流大学排行榜自然成为一个重要的参照。因此，在未来的若干年内能在世界顶尖大学排名中占有一席之地，是我国“双一流”重点建设大学的奋斗目标。对此，我们既要看到世界大学排名及其指标体系合理性的一面，发挥其重要的导向作用，同时又要清醒地认识到，社会对一所大学是否是世界一流大学的判断，更多的是对其学术声望与社会地位的整体评估，而不是对被排行榜所肢解的若干指标的评价。本研究在对世界一流大学排行评估的方法论缺陷进行分析的基础上，提出世界一流大学排行应回归学术品质导向。在“双一流”建设中，大学的一些外在可操作性测量指标要达到世界前列，可能较易实现，但不断提高自身的学术品质，则是大学的长期追求。回归世界一流大学排行的学术品质导向，对我国“双一流”建设具有重要启示意义。

一、世界一流大学排名的教育影响

世界一流大学排名主要是社会中介机构、商业机构的排名，目前有关世界大学排名的机构多达40多个，最为有名的有泰晤士高等教育（THE）世界大学排名、上海交通大学世界大学学术排名、USNews世界大学排名和QS世界大学排名等。大学排名是一种审计文化，也是一种国际高等教育的问责运动。合理利用这些排名，大学可以塑造自己拥有高质量或者拥有国际标准的形象，鉴别自己是否属于世界一流大学或者全球顶尖研究型大学，或者是否拥有世界一流的学科专业。2013年，为提升大学的国际竞争力，日本政府随后宣布未来10年每年给予20所研究型大学20～40亿元的资金支持。这很大程度上是为了支持大学提升泰晤士高等教育排名中暴露出的国际化和引用率两个弱项指标。

大学排名体制无疑已经影响到了大学的公信力和管理。一个明显的证据是马来西亚最古老的名校马来亚大学，在没有任何真正绩效质量下降的情况下，在2005年泰晤士高等教育排名里下降了80个位次，结果导致了校长的替换和大学的尴尬。很多优秀的大学并没有出现在世界500强的大学排名榜里，他们在持续应对放之四海皆准的排名方法论，如斯洛文尼亚的马里博尔大学、埃及开罗大学、冰岛大学。世界一流也变成了西方化的同义词，就是向西方看齐，结果是都模仿西方而不是发展自己的特色。排名也影响到政府对资金的分配，在英国和新西兰，基于绩效的资金分配与奖励已经实施。此外，排名还影响了学生的入学选择，大学因此也极力采用排名机构的政策和策略优化自己在排名榜中的位置。

世界大学排名体制把大学引向了一个国际竞争的市场，促进了大学知识生产的个人主义、标准化、商品化和同质化的价值观渗透。①就个人主义而言，排名促使个人之间或者大学之间相互竞争，很多国家的大学学术生活里开始充斥着市场本位的价值观，教师们为争取更高职位而专注于自己的研究，不再花费大量时间去一起研讨，集体空间几乎消失。②标准化是高等教育问责运动的标志，通过单一化的关于大学卓越的质量定义，不同使命与背景条件的大学能够在评估中进行相互比较。为了可以比较，现在的大学排行都过于依赖文献计量学数据，这种排名机构界定的质量也因此主要是指教师们的出版数量和声誉以及机构识别的顶尖刊物，这是典型的研究导向，大学要提升位次也因此主要靠这种研究和出版。即使排名考虑到教学，但为了比较或者绩效政策也主要采用总结性评估而不会考虑形成性评估，更不会考虑环境条件。③商品化与市场竞争有关，标准化有助于商品化，商品化使得知识产品失去内在价值而获得市场价值，教室里的各种教学虽然有内在价值但排名机构没有市场手段来评估，所以评估教师工作就主要是看研究生产力。④标准化和商品化有助于同质化的价值观渗透，目前绝大多数大学排行榜都强调教师的研究生产力，出版影响和引用率，特别是用英语发表的作品更重要，原因是用英语发表的作品国际同行引用率会更高，从而有助于提升排名。如2017年的泰晤士高等教育世界大学前100名排名中，美国占41所，英国占12所，德国9所，中国2所，日本2所，法国1所，一大半的大学都属于英语国家或者曾经被英国殖民过的国家。由此，大学必须前瞻性地考虑大学的社会责任究竟是什么、应有什么样的价值观，以及对卓越（包括公共利益）的追求。

二、世界一流大学排行评估的方法论缺陷

当前的各种学科或者学校整体的学术评估结果，尽管一定程度上反映了高校的学科实力乃至办学水平，但由于排名方法论的不同，同一所高校在各类排名中的结果并不具有一致性，甚至出现排名结果存在很大矛盾。大多数全球大学排名都受到了方法论不可靠的批评，这些排名缺乏它们声称要服务于客户挑选大学的全面信息，它们过于注重英语语言出版物并依靠定量指标来对机构进行综合评估，它们认为学术同行能没有偏见地通过特定学科知识领域的研究和出版来判断出大学整体的声誉和绩效。大学排名的合法性的确值得反思，一个广泛认同的批评是大学排名顺序会产生“虚假的精确度”，因此大学排名应该更多被看做“噪声”而不是质量的变化，因为任何排名标准的调整就会导致位次的变化，任何一个排名都是一个对高等教育质量的主观价值判断，排名中选择的测量手段暗含了对质量的武断界定。即使是判断大学声誉的标准也存在严重的缺陷，因为声誉主要来自于资源，就算学术声誉反映质量特征，评价者也没有足够权威知识来判断那么多大学的质量，他们真正熟悉和了解的大学数量十分有限，更别说判断质量了。

因此，正如世界著名比较教育学家阿特巴赫所作的分析，大学排行评估方法论存在明显缺陷。这些缺陷包括：①世界大学排名指标体系缺失教学评估指标。泰晤士高等教育排名认识到了教学的重要性，也设置了若干测量质量的指标，如声誉、师生比、教师博士学位数等，但问题是这些指标并不足以测量质量本身。经济合作和发展组织正在做一些测量学生学习结果的努力，在13个国家的工程和经济学科测量学生的学习结果。②研究支配了排名，现在的排名基本上是用各种方式来测量研究生产力。这也是最容易测量且可以比较的大学产品如各种研究基金、出版、诺贝尔奖等，上海交通大学的世界大学排行指标变量设计，目前也许是相对较为准确的一个科研测量，不过权重上依然过于重视理工科而相对忽略社会科学特别是人文学科。③声誉评估的效度有疑问，如英国QS声誉调查40%来自学界，10%来自雇主；泰晤士高等教育排名，64%的调查来自北美和欧洲。不过，谁真正有这能力和学科知识基础能对数量众多的世界大学的研究声誉进行排名呢？至于教学和服务的声誉排名，那就更没办法了。④排名创设了中心与边缘，大学和学术体系中排名靠前的都是英语语言国家如美国、英国、加拿大、澳大利亚等，它们基于历史原因有更好的能力和资金吸引世界各地的教师和学生，它们有更长的学术自由传统以及竞争文化，它们有更多的英文信息数据库和非正式联系网络。在全球化背景下，如果有足够多的资源和更周密的规划，大学相对容易冲入世界一流行列，比如中国的大学就在逐渐从边缘走向中心。

三、回归世界一流大学排行的学术品质导向

从大学排行的功能看，目标导向至关重要。世界大学评估排行应对大学实现其应有的社会责任、价值观及对卓越的追求，起到引领作用。在评估中，需要思考的是评估排行的共同基石而不是去压制大学使命和培养目标的多样性及个性特色发展，从而不至于使大学在学科和专业发展方面左右折腾而浪费有限的人财物等资源，影响大学自身和社会的可持续发展。

但要重新思考、清晰界定大学的战略目标比较困难。美国学者伯顿·克拉克认为，由于高等教育的任务是知识密集型又是知识广博型的，因此很难陈述综合大学和学院的目的，更不必说一个国家的高等教育系统的目的了。很久以来，庞大的学术机构至多也只有宣而不明的目标。这种目标的含糊性在20世纪是有过之而无不及，以至想澄清目标的人不由得望而生畏。他还举例说，在英国，敏锐的观察家们尽管想忠于现实，但却不得不使用“消除无知”这类含糊的表达来解释高等教育系统的任务；在美国，几十年来，实用主义观察家只能说“教学、研究和服务”目的三位一体，而给教学内容、研究内容和应用服务内容留有无限的余地；在瑞典，“U68”全国委员会提出了诸如“民主”“个性发展”“社会变革”之类的目标；日本、加拿大、法国和德国似乎无一国确定了更为清晰的目标。对此，伯顿·克拉克认为：知识是学术系统中人们赖以开展工作的基本材料；教学和研究是制作和操作这种材料的基本活动；这些任务分成许多相互紧密联系但却独立自主的专业；这种任务的划分促使形成一种坡度平坦、联系松散的工作单位结构；这种结构促使控制权分散；最后，目的必然是模糊的，广义概括的目标可以使基层操作部门具体目标合法化。这里，我们看到的“教学、研究和服务”目的三位一体仅仅是各研究型大学的共性目标，但伯顿·克拉克所言的大学职能任务分成许多相互紧密联系但却独立自主的学科专业却并非各大学的共性。

目前的世界大学综合排行的方法论，正是依据大学的教学、科研及社会服务三大职能目标这个共性而对研究型大学有了比较的一个基础。对其他大学类型而言则不具备这个共性基础。如美国阿默斯特和斯沃斯莫尔文理学院，他们的本科生教育声誉和质量超过了很多常春藤大学，但由于机构类型不同，这些大学往往不在世界一流大学之列。另外，现实中各大学的实际学科专业在数量和规模等方面的差异太大，进而各大学的科研任务和社会服务目标差异也相差悬殊，大学排行依然会出现难以比较的方法论缺陷。因为这个差异，偏文科类、偏文理综合类、偏理工类的大学，按照现行的评估排行方法论，即使仅仅依据相对客观的文献计量学去统计各大学的科研，无论总数还是平均数抑或高引用率都难以客观反映各大学的真正办学水平。这个难以比较的大学评估综合排行导向结果是，很多大学为了提升自己的排名位次，应用了“学科优质率”概念，意思是“优质部分数量（分子）与总量（分母）的比率。大学学科优质率就是一所大学的优质学科（高水平学科）数量与学校学科总量的比率，一所大学的学科优质率越高，证明学校学科整体水平越强。提高学科优质率，就需要在增加优质学科数量的同时减少总学科数，或者是优质学科数量增加速度高于学科总量增长速度”。应该说，用这个概念来审视大学的整体学科优秀程度很有价值，问题是提高学科优质率的策略逻辑有待商榷，增加优质学科数量是大学追求的目标，但减少总学科数似乎就有仅仅为了排名而置某些已办的符合社会需求的新兴学科于不顾进而砍掉的消极后果。同时国内现实是，由于现行大学排行偏重文理学科齐全的综合性大学，很多偏理工的大学在努力发展文科类专业学院，而偏文科类的大学在努力发展理工类专业学院，而偏文理综合性的大学则在努力发展医学院。这在排名需求和社会需求之间出现了明显的伦理逻辑悖论。

从教育目的而言，全球大学之间可以真正进行比较的评估排名方法论是大学的学术品质。理解大学的学术品质含义，可以依据以下三个维度：第一，大学的学术品质，意味着大学的教学、科研及社会服务活动围绕学术而展开。诚如伯顿·克拉克所言，知识是学术系统中人们赖以开展工作的基本材料。教学、科研和服务三位一体目的，尽管历经了不同发展阶段，但不可否认的是科学研究是学术研究，教学也是一种师生之间的学术文化互动，至于社会服务更是学术研究和教学学术的社会实践应用。第二，大学的学术品质，是大学学术活动中体现出来的综合性素质要求。大学是全体师生的组织集合体，只有大学组织集体具有一定的综合性素质要求，才能履行好大学的三种职能活动。换言之，大学的学术品质要从三大职能实践活动中得到彰显和证明。这种素质彰显和证明，一方面表现为目前大学评估排行中并未全面体现出的绩效指标，另一方面也表现为目前大学评估排行中基本未全面体现出的核心竞争力指标，另外还表现为目前大学评估排行中基本未体现出来的质量保障指标。无论如何，我们固然可以依据大学职能把大学的学术品质分为教学学术品质、科研学术品质和社会服务学术品质，但这种分类属于依据活动任务与目的差异的分类，因为教学活动、科研活动或者社会服务活动中可能体现了大学组织很多相同的学术品质（素质）。第三，依据中外大学促进人的德智体全面发展的共性教育目的，以及世界一流大学是全校师生包括管理者共同努力的结果，可以发现大学的学术品质主要包含3个方面的素质要求，它们分别是：①大学的学术伦理道德品质，根据教育的历史与现实，主要表现为师生在三大职能活动中积极践行示范学术伦理道德、遵守学术伦理道德、违背学术伦理道德甚至法律底线三种不同层次的素质，真正的世界一流大学应当是学术伦理道德的积极践行示范者。2016年2月25日宁波市教育局和财政局联合发布了《宁波市高校办学绩效评价办法（试行）》，其中在一级指标里对于“严重影响高校发展和声誉事件”设置了10分扣分项目，就是包含着这方面的学术伦理道德品质评价；②大学的学术智能品质，根据大学核心竞争力和教师绩效理论，学术智能品质主要是师生在三大职能活动中体现出的竞争性教学能力素养、科研和社会服务能力素养。教学能力素养主要体现为教师来源和教学考核的竞争性、学生入学标准的竞争性以及就业竞争能力等方面，主要有国际竞争、国内高竞争、国内中度竞争、国内弱竞争四个基本能力层级；关于科研能力品质，主要有教师获取各种科研项目的竞争能力和科研成果的先进性，借鉴英国高等教育拨款委员会对其国内高校科研成果评估标准，科研成果的创新性、重要性和精确性有国际领先、国际较高、国际认可、国内认可、国内不认可五种能力层次；关于社会服务能力品质，主要有教师的学术兼职与社会服务效果、学生的社会服务项目及能力等，主要有国际认可、国内认可、不认可三个基本能力层级。③大学的学术健康保障品质，分为大学外部质量保障品质和内部质量保障品质。借鉴企业价值链管理理论，按照大学教学、科研、社会服务活动等教育基本价值链和管理活动辅助价值链的分类，大学的学术健康保障品质直接表现国家与大学为师生提供的政策制度、信息、收入、物质条件等服务的辅助价值链管理能力，最终表现为师生满意度，评估标准上可以分为非常满意、满意、一般、不太满意、不满意等5个基本层次。

四、学术品质评估对“双一流”建设的启示

任何反映大学或个人学术品质的绩效工作，一定是数量与质量的混合体。问题在于依赖数理统计的定量化学术评估机制和依赖专家智慧或者学术同行判断的定性化学术质量评估机制各有其作用和适用范围，前者更适用于基本办学条件和工作任务量评估，后者更适用于提升学术品质评估，这也是学术界批评过于依赖定量化评估但始终无法摒弃的原因。事实上，美国的顶尖大学都很重视教学质量的定性评估。其评估方式是由利益相关者进行的全覆盖面的评价，同行之间的评估、高级职员对低级职员的评估、学生对教师的评估，等等。这种评估几乎无处不在，并且其结果会对教师的岗位、职称和收入产生直接甚至是严重的影响。评估通常采取无记名问卷调查方式，有时也采取记名但绝对保密（受法律保障，泄密要负法律责任）的调查方式。美国的顶尖大学关于教学质量的评估，不仅要看教学大纲、学生作业、学生评价，还要看同事和系主任对课堂教学的观察和评论等。

以创建于1861年的公立伯克利大学和1869年的私立麻省理工学院为例，两校在声誉和产出方面都是国际公认的世界一流。它们的领导体制都是董事会制。伯克利大学有14个学院130个系和80个研究机构，学科领域涉及到了除医学以外的所有学科；麻省理工有5个学院30个系和近300个研究中心，虽然覆盖学科领域广泛，但在法学、医学、教育以及公共健康方面并不活跃。在资金方面，麻省理工学院比伯克利大学更富裕，尽管伯克利大学从州政府那里获得了学校总收入12%的经费，但2012年伯克利大学只获得了30个亿的捐款，而麻省理工学院获得了上百亿捐款。从师资情况来看，同年，伯克利大学有教师1736人，31%来自国外，麻省理工学院1806个教师中仅有7%来自国外。从学生数量看，伯克利32910个学生，本科生占60%，国外留学生占13%，而麻省理工10220个学生中外国留学生占30%，研究生占60%。从学术质量的评估机制来看，不管是研究中心还是系部或者学院，两校每6～7年就要进行自我评估一次，教学、科研和社会服务上的成就都必须详细列出。学校评估时间，一般是从9月持续到来年的5月，全体教授至少要花3个月时间阅读各种报告并撰写评估报告，这些报告要交由各级学术委员会修正并最终由校长做出对奖惩决策。定量指标除了出版物，还包括研究应用率和教学方面的学生满意度调查问卷报告。但是在评估教师的质量标准上，定量标准通常不会起主要作用。基于期刊标准的定量评估指标，一般在硬科学上考虑得的较多，但即使这样，堆积如山的出版物也不意味着会获得学术质量的声誉。学术品质主要以大学的定性评估机制为主导，而起主导作用的定性指标，通常包括在学术界的位置，在学术团体中的知名度，奖励和荣誉，研究题目包含的前沿领域以及采用的方法论等，这都指标对人文社科而言，意味着要经过教师们的多次讨论和学术交流，以判断在该领域是否开创性工作。不论什么性质的学科，其影响力一定是体现在教学、科研与社会服务中，体现在对社会可持续发展的贡献上。正是高质量的学术品质，确立了美国高等教育全球领先的地位，国际留学生的增长就是最有说服力的例子。

哈佛大学原校长陆登庭（Neil Rudenstine）曾指出：建设世界一流大学要有高水平的原创性研究、高水平的教师，培养高水平的人才，以及充足的办学经费等，这是其共性的一面。同时，每个一流大学也都有自己的特色。建设一流大学是为了适应本国社会和经济发展的需要，而且现在世界公认的一流大学，都为各自国家的发展作出了重要贡献。实际上，正是这些社会需求，促使这些大学成了世界一流大学。在国家提出 “双一流”建设的大好机遇面前，一流大学建设首先应当为国家的发展做出直接的贡献，包括基础研究、应用研究和技术开发。否则，我们建设一流大学就失去了社会基础，会受到更大的社会压力。一流学科的建设，则既要瞄准世界前沿的学科，争取有所突破，又要从国家建设需要出发，加强对能源、环境、水资源等传统学科的研究，因为这些都是我们国家在快速发展过程中、在工业化过程当中所急需的。因此，一流大学建设，不能完全按照在Nature、Science上发表多少文章，作为其是否达到世界一流大学的主要衡量标准。如果能坚持主要以大学的定性评估机制为主导来推进学术品质建设，而不是盲目追求“学术GDP”，大学就会在推进学校整体或学科建设中清楚地看到自身的质量进展和在世界一流大学丛林中的位置。（刘承波，教育部教育发展研究中心高等教育研究室副主任、副研究员）