“青年千人计划”主要面向自然科学或工程技术领域,年龄不超过40周岁,在海外知名高校取得博士学位,并有3年以上的海外科研工作经历,有潜力成为该领域学术或技术带头人。青年千人引进的潜在人选大都处于科研起步、初露锋芒的阶段,这类人才通过常规手段难以准确、批量定位,因此如何准确、高效发现优秀青年华裔科学家成为了我国科研单位人才引进的一大难题。
为了解决这一难题,我们研究开发《优秀青年华裔科学家遴选解决方案》,主要面向科研院所及高校海外青年人才引进需求,从文献计量角度出发,结合计算机辅助数据挖掘及模型计算,依据引进单位提供的人才遴选标准和要求,基于科研论文数据和学术社会网络数据,从领域大量作者群中快速、准确定位领域内表现优秀的青年华裔科学家,以帮助科研机构提高青千人才引进效率。目前该方案已经支持多家单位的人才引进工作。
实施流程:
获取高水平论文数据:基于科研院所专家提供的领域内高水平期刊列表,并结合关键词限定,构建检索策略,于Web of Science (WoS)核心合集Science Citation Index Expanded (SCI-E)数据库检索下载论文著录数据,构建领域高水平论文数据集。
信息抽取,构建作者数据库:对高水平论文数据进行文本挖掘、信息抽取、作者及机构信息规范化处理、映射,建立作者、单位、期刊、论文题目、摘要、关键词、被引次数、期刊影响因子、学科分类等信息间的关联关系,建立领域作者数据库
识别华裔科学家:基于字典匹配华人(中国)作者,获得领域华人作者数据库
识别优秀华裔科学家:基于引进单位提供的引进人才标准,构建模型计算发现优秀华裔科学家;同时基于论文关键词、摘要、学科分类等信息建立作者研究画像,依据约束条件对作者进行初步遴选
基于专家判读:引进单位专家基于已获得人才信息(所在海外机构、文章标题、摘要等信息)初步、快速判读,排除与待引进领域不符合的人才
简历采集,锁定优秀青年华裔科学家:基于LinkedIn、ResearchGate 等学术社会网络的自动采集和信息抽取,获得候选人才的学术简历,遴选满足条件的海外华裔青年科学家。