当前,很多高校科研管理部门每年都会进行科研成果统计,对本机构内科研活动状况进行定量测定。通过不同数据库的机构检索,能够反映高校科学研究的动态和水平,从而为在院校的学科建设、科研规划、人才培养、宏观决策的制定等方面建立机构知识库提供重要依据; 同时也有助于与拥有相近学科的高校进行横向比较。在实际工作中,经常会接到某高校科研处的委托,请求检索该高校人员在某个时间段( 常常是逐年委托连续起来) 发表的论文在国内外着名检索工具中的收录情况,借以统计该机构的科研成果。
1 机构检索中遇到的问题
在检索时发现,机构中英文名称不规范的情况很普遍,如机构名称有常用名称和别名,机构名称采用缩写或简写,机构改名后仍然有为数不少的作者沿用原来机构的英文名称。还有一些作者在发表论文时未使用所在机构的正式英文名称,有好几种非正式名称出现[1 -2].这给检索过程中想要求全带来极大的困难。另外,不同的数据库收录论文时着录规则不同,如果检索策略不对,会导致检索结果出入很大[3].笔者根据实际工作中积累的经验,介绍以机构委托时通常会用来统计的数据库以及在不同数据库中检索的具体方法及技巧,确保检索机构的查全率和查准率。
2 机构检索时通常选取的国内外着名数据库
现在很多高校都是综合性大学,理工文史哲经管农医教各学科都有。所以在成果统计时可以大致按照自然科学和社会科学来分类。其中,自然科学类常用的数据库有 SCI、EI Compendex、CPCI - S、MEDLINE、CSCD、CNKI 等,社会科学类常用的数据库有 SSCI、A&HCI、CPCI - SSH、CSSCI 等。这其中又区分这些数据库的核心版和非核心版的收录情况。这些数据库都是在国内外有重大影响力的数据库,其中有专门收录期刊论文的,或专门收录会议论文的,也有都收录的。
除了上述检索收录时常用的数据库,基本科学指标数据库( Essential Science Indicators,简称 ESI)也是机构检索的重要工具,它是由世界着名的学术信息出版机构美国科技信息所( ISI) 于 2001 年推出的衡量科学研究绩效、跟踪科学发展趋势的基本分析评价工具,是当今世界范围内普遍用以评价大学、科研机构、个人国际学术水平及影响力的重要指标。
3 不同数据库中可以使用的着录规则特征及基本检索方法
机构人员发表论文时一般都会在作者地址中留下机构名称、具体地址及邮编,团体作者也符合这个特点。所以检索时考虑凡地址字段中出现该机构名称即可确认是该机构人员发表的论文。
不同数据库对信息的着录规则不同,会导致同样的检索策略检索出的结果差别很大。而同一家数据库商所做的同一平台上的数据库的着录方法是基本一致的,所以这里按照不同的平台来介绍。
3. 1 ISI 平台
目前,我们常用的是 ISI 平台上的 Web of Sci-ence Core Collection 数 据 库 集,包 括: SCI / SSCI /A&HCI / CPCI - S / CPCI - SSH / CCR / IC 等 7 个数据库,该平台还有 MEDLINE/BIOSIS 等数据库。
通过在作者地址中输入机构和/或地点的完整或部分名称,可以检索“地址”字段。例如,Univ 和University 可查找记录中的地址字段出现检索词 “Univ” 的机构。
可以使用逻辑运算符( AND、OR、NOT、NEAR和 SAME) 和通配符 ( * $ ?) 来组合检索使检索结果更精确。但是检索包含上述逻辑运算符的地址,需要将该运算符名称括在引号内。
在检索时,逻辑运算符和通配符的使用与其他数据库的不同点在于:SAME 运算符指定了由运算符连接的检索词位于同一地址,而不仅仅是位于相同的字段,使得检索结果更精确。
使用 NEAR/x 可查找由该运算符连接的检索词之间相隔指定数量单词的记录。该规则也适用于单词处于不同字段的情况,用数字取代 x( x≤15) 可指定将检索词分开的最大单词数。
通配符星号 ( * ) 表示任何字符组,包括空字符,只能放在词尾。
通配符问号 ( ?) 表示任意一个字符,用于单词中间。
通配符美元符号 ( $ ) 表示零或一个字符,可用于词尾或词中间。
3. 2 Engineering Village 平台
目前,国家图书馆仅购买了该平台的 EI Com-pendex 数据库,所以以下只针对该数据库的检索规则进行介绍。
作者地址字段 Author affiliation 简写为 AF 字段。EI Compendex 数据库提供了该字段的索引,但实际按照作者机构检索时发现效果很不理想,原因在于作者对机构名称的书写不规范,用索引列表很难穷尽。
EI Compendex 数据库也提供了逻辑运算符( AND、OR、NOT、NEAR 、ONEAR 和 SAME) 和通配符 ( * $ ?) 组合检索来提高检索效率和精准度。
但是具体的使用方法和含义不尽相同。
截词符星号 ( * ) 用来检索以相同字母开始的单词。
通配符问号 ( ?) 表示任意一个字符,用于单词中间。
美元符号 ( $ ) 表示词干搜索条件。在一个完整的单词前面加上 $ ,可以将其各种形式的变形都搜索出来。
位置算符 NEAR 或 ONEAR 限制检索时两个词组之间距更邻近,ONEAR 更是限定了词与词之间的先后顺序。但它们不能与* 、?、( ) 、{ } 、“”同时使用。
3. 3 ESI 数据库
ESI 数据库的功能主要包括 3 个方面: 引用排行( Citation Rankings) 、高被引论文( Most Cited Pa-pers) 和引用分析( Citation Analysis)[7].ESI 根据各机构不同学科领域 10 年内论文的被引频次的总和对机构进行排名。ESI 中机构名称都很规范,只考虑机构的正式英文名称即可。
可以按学科浏览,查看在同一学科不同机构的排名情况; 也可以进行机构检索,查看同一机构在不同学科的排名情况; 也可以检索该机构近 10 年来在某学科的高被引论文数或热点论文数。
机构检索时默认在地址字段检索,只要包含该机构名称就符合检索条件。可以浏览字顺表进行机构检索,或用机构正式英文名称的缩写进行检索; 输入“HARVARD UNIV”,对应机构名称就是 HAR-VARD UNIV; 输入“HARVARD UNIV* ”,检索结果为包含前述两个词的任一地址,如: HARVARDUNIV 或 HARVARD UNIV MEDICAL AFFILIATES.
3. 4 中文数据库 CSCD / CSSCI / CNKI
CSCD 数据库机构字段只需了解加双引号( “”)是精确检索。不加是模糊检索。
数据库作为计算机系统的核心构成,其在数据资料调配过程中发挥重要作用,为用户检索文献资料提供了许多实用性功能。因而,用户需掌握计算机数据库检索系统的结构分布情况,实际操作按照标准化流程执行,确保数据检索与运行的稳定性。1数据库应用功能数据...
20世纪80年代中期, 教育部印发《关于在高等学校开设文献检索与利用课的意见》的通知, 文献检索课从此成为高校图书馆开设的唯一课程。1992年, 教育部又下发《文献检索课教学基本要求》。...
在当今信息爆炸的时代,文献检索是获取学科最新进展,更新专业知识及从事科学研究最基本和最重要的基本技能。各类期刊文献数据库是获取文献的主要来源。此外,利用一些搜索引擎、综合性医学论坛和部分期刊主页,还可获得大量的免费文献。现就文献检索的主要...
进行科研活动首先要确立研究题目、明确目的, 接着才是相关文献检索, 其次是进行文献综述、确立创新点, 然后进行科学试验, 分析试验现象和数据, 探求科学本质。因此, 一切科研活动离不开科技文献的检索。...
随着数据库技术的发展和科学研究的发展,数据库文献量迅速增长。数据库的查全率和查准率越来越受到重视,专家学者也开始重视数据库索引数据的质量问题。而数据库检索中,主题词、分类号都是重要的检索入口。对于CNKI的主题标引质量,南京大学信息管理学院...
文献检索(Information Retrieval), 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage andRetrieval),这是广义的信息检索。...
Thieme是德国最大的医学出版社之一,在德国斯图加特和美国纽约均设有机构,是具有百年历史的国际性科学和医学出版社。迄今为止,Thieme已出版5000多种图书,每年新增约500种,出版了190多种纸本形式和电子版本的医学和科学期刊。Thieme出版...
介绍了国内主要科技文献检索的网络数据库系统, 依据科技文献查询工作的需求特点对网上信息资源进行收集整理, 并提供了可获得国内信息资源网址的数据库和信息资源高效快速的检索途径和检索方法。...
由于分选领域的专利申请涉及分选方法较多,且很多技术方案中涉及到比较简单或为本领域技术人员公知的技术特征,对于这些技术特征需到工具书或教科书中进行检索。...
文献检索课是培养大学生们的信息意识和获取知识与信息的能力,增强他们的自学能力和独立研究能力的一门科学方法课,它是高等学校信息素质教育的核心课程,也是图书馆普及文献检索知识的重要途径[1].以文献检索课为检索主题在万方数据平台检索期刊论文,...