文献检索论文

您当前的位置:学术堂 > 图书档案学论文 > 文献检索论文 >

文献检索应用于英文数据库中的策略

来源:攀枝花学院学报 作者:张影莹
发布于:2020-03-19 共5770字

文献检索结课论文研究推荐10篇之第四篇:文献检索应用于英文数据库中的策略

  摘要:文献检索在高校教学和科研活动中正在发挥日益重要的作用, 但由于各种原因, 英文数据库文献检索在具体使用中还存在问题和困难。本文着重介绍典型英文数据库检索策略的定位方法, 目的是为高校教学、科研对接国际标准, 提供英文文献检索方面的参考。

  关键词:文献检索; 数据库; 策略;

  Abstract:

  Literature search plays an increasingly important role in universities' teaching and scientific research, but for certain reasons, there still exist problems and difficulties in the practice of using English database literature search. This essay focuses on the introduction of positioning methods employed in database search in order to provide reference to the integration between university standards and international standards in teaching and academic research.

  Keyword:

  literature search; database; strategy;

文献检索

  前言

  20世纪80年代中期, 教育部印发《关于在高等学校开设文献检索与利用课的意见》的通知, 文献检索课从此成为高校图书馆开设的唯一课程。1992年, 教育部又下发《文献检索课教学基本要求》。但随着文献载体迅速走向电子化和网络化, 数据库应用越来越普及, 教育部再没有继续下文对文献检索课进行规范 (李家清, 2004) .因不同高校馆藏和数据库建设与购置情况各不相同, 文献检索课, 特别是当下的数据库文献检索课在长期的改革和演变中逐步形成了高校自己的特色, 相关教材达到1000余种。

  随着现代信息技术的发展, 英文数据库在我国教学、科研文献检索中正在发挥日益重要的作用。可以毫不夸张地说, 当今任何高水平的教学或者有价值的科研, 都离不开英文数据库文献检索的支持。海量的检索信息上传网络, 为各领域的信息互享、科学研究, 创造了极大的便利。但是, 面对浩如烟海的各种信息资源, 很多人却一筹莫展。为了高效、便捷地利用数据库资源, 特别是英语数据库资源为教学、科研服务, 本文着重介绍英文数据库文献检索策略及定位检索策略的具体方法, 并举例加以说明。

  一、检索策略

  所谓检索策略是指对用于数据库检索的词语进行结构化安排, 它反映了为获得最佳检索结果所采取的检索词语组织方式。

  不同的数据库功能不尽相同, 所以读者有必要根据所使用的数据库调整自己的搜索策略。这个过程常常被称作检索"调整".对于研究的不同层面, 读者也可以制定单独的检索策略。

  检索策略的确定并非一蹴而就, 读者很有可能对自己的检索策略进行反复测试, 根据检索结果不断调整和优化。

  二、检索策略定位的几个方法

  接下来介绍几个确定检索策略的方法, 包括搜索词语确认、关键词搜索、截短与通配符、精准查找、相邻搜索、主题词检索、布尔逻辑检索和引文检索。

  (一) 搜索词语确认

  著者对同一概念有不同的表达。比如"自尊" (self esteem) 在其它场合可能会说成"自我价值" (self worth) 或者"自我认知" (self concept) .现在要求你检视每一个关于"自尊"的概念, 并列出它们在不同文献中出现的不同方式。

  如果你已经熟知这个话题, 那么你可以列出一系列有关这个概念的替代词语或短语。假如不太熟悉的话, 或者不想错过其它词汇搜索, 试试下面的办法:

  -用词库确认同义词;

  -在谷歌学术之类的搜索引擎上查找内容, 浏览搜索结果, 寻找替代词或短语;

  -假如你已经获得某一篇相关文章, 检查文章摘要或全文, 找到替代词汇或者短语。你也可以在数据库里查阅该文章, 在整个参考信息中找到文章主题词所涉领域, 然后将该领域文章的标题应用到自己的搜索项之中;

  检索策略在试错中不断完善。在检索和阅读过程中你会发现不同的术语和表达。记住将它们纳入你的检索策略留待甄别。

  (二) 关键词检索

  这里的关键词是你输入数据库搜索框的自然语言或者叫文本词汇和短语, 与主题词对应。

  一般而言, 关键词检索仅仅是在研究数据库里的标题和摘要中查询搜索项目, 因为研究数据库通常不包含文章全文, 只为读者提供文章相关的信息, 如作者、题目、发表日期、期刊名和摘要。

  有些数据库只能识别准确输入的词语或短语, 也就是输入什么数据库回应什么, 所以必须确认输入正确, 否则就会丢失参考信息。

  需要注意的是, 在浏览相关文章时, 将所有特殊的术语、缩略语或者其它有用的关键词记录下来, 以备日后完善检索策略之需。利用确认检索项把所有一般性的同义词都涵盖进去。

  创立包含所有同义项的列表相当费时, 但使用截短词和通配符可以节省时间和精力, 因为它们可以自动地查询到跟你关键词相关的新信息。

  (三) 截短词和通配符

  截短词和通配符只有在关键词而不是主题词检索中运用。

  1. 截短词

  截短词在单复数词语和词尾变化较大的词汇搜索中很有用。具体方法是将关键词缩略为词根 (stem) 或者词干 (trunk) , 加上截短词标记。

  众多数据库使用星号*作为截短词符号。如果不能确定使用何种符号, 阅读数据库求助信息。

  比如, 在搜索框输入"therap*", 可以查到任何一个含有therap字符串的词汇, 包括therapy, therapies, therapist, 或者therapists.

  2. 通配符

  通配符可以帮助找到不同方式拼写的词汇, 使用它可以搜索关键词中任何位置的单个字符, 或者全部缺失的字符。

  很多数据库用问号"?"作为通配符符号。如不能确定使用何种符号, 阅读求助信息。

  通配符对找出英式拼写和美式拼写单词很有用。例如, 输入"behavior?r"可以找到behaviour和behavior.

  (四) 精确查找

  如果想要搜索结果中出现的词彼此相连, 中间不插入其它词语, 就必须给搜索词加上引号, 如"self esteem".这在许多数据库搜索中都适用 (但需要注意, 有的数据库会准确按照读者输入短语的顺序自动搜索, 无需添加引号) .

  短语搜索会减少搜索结果, 增加搜索结果的关联性。

  如果不加引号, 数据库可能搜索到单个的词语:

  -两个搜索词以任意顺序排列, 如…held in esteem, self-identifying as…

  -一个搜索词在标题或者摘要的任意位置出现, 不一定紧挨在一起, 如…high esteem factors.In all cases but one, participants were found to identify the self as residing in the chest or…

  这样看起来就好像是采用了布尔逻辑算符AND, 如self AND esteem.

  建议在检索之前随时参考数据库帮助页面, 确认数据库的短语处理方式。

  (五) 相邻检索

  相邻检索用于搜索词邻近而不是完全相邻的检索。

  读者可以设定搜索结果里两个词相近的程度, 使得检索结果相关性更大, 因为一般来说, 两个词越相近, 其相互关系越紧密。

  很多数据库采用adjx标识相邻词语, 其中x表示读者允许的最多附加词数量。这里, 一些虚词如the、of、to等词汇被自动排除。而有些数据库使用不同命令如NEAR/x.检索前请查看帮助页面。

  具体案例:

  下面是在Ovid SP数据库1 (类似于Medline)  (2) 进行相邻检索的例子, 在其它数据库方法可能不一样。

  为了完成相邻检索, 将搜索词用ADJn分隔开。n代表在搜索词之间出现的主要词汇数量 (除去1) .

  比如, 输入"physician ADJ3 relationship"会在两个主干词的任意方向找到physician和relationship (相比搜索特定短语"physician relationship", 检索到的文章多得多) .

  使用这种方法可以查到带有"physician patient relationship"、"patient physician relationship"、"relationship of the physician to the patient"等等短语的文章。

  Ovid数据库不将in、on、and、the或者they这样的停用词纳入相邻检索中间隔词数量中, 因此检索结果词之间的间隔很有可能超过两个词, 但不会多于两个主干词 (而非停用词) 间隔。

  下面就是Ovid数据库相邻检索规则ADJ (n-1) , n表示在搜索词之间出现的主干词数量:

  -输入ADJ按照输入循序检索两个紧靠一起的词汇;

  -输入ADJ1检索以任意顺序相邻的两个词汇;

  -输入ADJ2检索中间最多相隔一个词的搜索词;

  -输入ADJ3检索中间最多间隔两个词的搜索词汇;

  -输入ADJn检索中间最多间隔n-1个词的搜索词汇。

  (六) 主题词检索

  所谓主题词就也叫控制术语 (controlled terms) 或者词库术语 (thesaurus terms) .采用主题词检索的原因在于, 关键词检索只能在文章标题或者摘要里找到搜索词或短语。此时读者并不想查找到所有相关关键词或者同义词, 或者, 作者文章里根本就没有读者希望找到的词语, 除非它本身是文章所涉话题。

  利用主题词检索可以查找到与主体相关的文章, 即使文章本身并未使用搜索词汇。

  那么在什么情况下使用主题词检索呢?

  如果读者要进行系统或深度研究, 就必须将主题词 (就像关键词一样) 检索作为检索策略。在检索已知重要文章时, 选择"全部参考"按钮查看数据库索引给出的主题词, 根据自己的检索策略添加相关主题词。

  哪些数据库使用主题词检索?

  主题词因数据库不同而不同, 因此有必要分别检查每一个数据库, 清楚其优先语言。通过"全部参考"读者可以看到数据库为每一篇文章提供的主题词。

  主题词检索在信息结构精密的数据库如Medline、Embase (3) 和Psyc INFO (4) 中运用流畅, 但在这些数据库进行主题词检索必须使用高级Ovid搜索屏, 点击标有"主题词自动配对"的对话框。

  例如, 在Psyc INFO数据库里, 当你输入CBT时, 就会自动将输入词汇配对到cognitive behavior therapy (认知行为疗法) .所有以"认知行为疗法"为主要话题的文献都会随该主题词被编入索引。

  通常, 读者为每一个在检索问题中辨识出来的概念作主题词检索。规定主题词的方法是索引器从控制词语列表选择合适的标题, 将其添加到文章记录里便于描述该文章的主题。

  为了避免读者检索到主题范围过于宽泛的文章, 索引器会为文章提供现有的最适合的主题词。

  (七) 布尔逻辑检索

  布尔操作符 (AND、OR和NOT) 允许读者以不同方式将搜索词语结合在一起。数据库往往用按钮或者下拉菜单形式显示布尔操作符, 便于读者将搜索词或搜索结果结合在一起。

  OR:有助于增加检索数量, 与同义词结合使得搜索结果更加完备。假如搜索self esteem OR self worth, 可以得到把两者作为主题的文章。

  AND:添加AND会减少搜索结果, 通常与不同概念结合使得搜索结果更具相关性。假如检索self esteem AND eating disorders (进食障碍) 则可以得到讨论这两个话题的文章。

  NOT:通过排除某一搜索项, NOT会减少检索结果。建议谨慎使用以免不经意漏掉相关信息。

  假如检索self esteem NOT eating disorders, 会得到谈及self esteem的文章结果但排除所有与eating disorders相关的文章。

  如果一直在进行主题词查询并且希望找到每一个搜索词的同义词, 该过程比单纯将两个简单搜索结合起来要复杂一些。

  首先, 需要使用OR (主题词和关键词) 将所有表示同一概念的同义词合并, 然后用AND将各个概念组合和合并起来。

  (八) 引文检索

  所谓引文检索的意思是, 如果读者已经查询到一篇相关文章, 那么就可以找到一系列引用该文的文章。

  使用引文检索的目的在于:

  -查询文章是否被其他作者引用;

  -查询最近发表的相同或类似主题的文章;

  -发现某已知观点、发明是如何被确认、应用、完善、拓展或者修正的;

  -帮助读者获得更加丰富的文献信息。

  提示:可以在下列数据库使用引文检索:

  -Ovid SP数据库;

  -谷歌学术;

  -科学网;

  -斯高帕斯文摘和引文数据库。

  就数据库搜索而言, 引文检索是一种很有用的检索手段, 但需要注意的是不能过度依赖它。如果总是盯着他人引用过的文章, 就会将自己的发现引入歧途。

  三、检索策略运用实例

  假如你已经熟悉上述有关self esteem的检索方法, 再看看附图里的检索历史实例, 搞清楚实际检索究竟是怎么回事。

  在这个例子里, 由于问题焦点涉及心理学, 故采用心理学数据库Psyc INFO进行检索。试验检索显示, 就本具体话题而言, Medline给出的结果要少一些, 因此建议读者多花时间去查查怎样才能找到合适的数据库。

  这个例子显示的是在检索问题范围之内对每一概念进行的主题词和关键词检索, 以及怎样运用布尔操作符将它们合并起来。同时, 该实例还告诉读者在何处运用诸如截短词、通配符和相邻检索这样的关键词技巧。




  表1 检索策略应用实例

  注:检索数据库Psyc INFO (Ovid SP) , 始于2002年;检索日期2014年8月18日

  结语

  "任何学科门类都必须有生存的哲学基础, 任何专业都必须有社会的需求空间, 任何课程都必须有自己的时代定位。" (葛敬民, 2014) 在大多数高校, 文献检索课最初都是依靠图书馆的文献资源优势, 重点讲授图书馆的检索工具。随着网络时代的到来, 现代图书馆的文献资源迅速实现电子化和公开化, 传统文献检索课赖以生存的条件快速消失, 主要文献载体发生变化, 所以, 文献检索课必须改革以适应新的形势。同时, 由于西方高校在知识产权保护和数据库建设方面走在前面, 为了培养高素质、具有国际眼光的高级人才, 高校文献检索课程改革在一定程度上需要考虑国际接轨问题。

  参考文献
  [1]葛敬民。文献检索课开设30年的回顾[J].大学图书馆学报, 2014 (4) :98-102.
  [2]李家清。我国信息素质教育研究[J].情报理论与实践, 2004 (1) :55-58.
  [3] 英国利兹大学图书馆。https://library.leeds.ac.uk, 2018年1月。

  注释
  1 Ovid SP数据平台由Ovid Databases@Ovid和SilverP later Web SPIRS两个资料库系统整合而成。Ovid Databases@Ovid和SilverP later WebSPIRS于2009年起统一移至新平台--Ovid SP.Ovid SP资料库系统提供以统一介面检索超过200种专业资料库及60余家出版社之电子期刊, 其主题范围涵盖理、工、医、农、人文、及社会科学等各学科领域之文献书目、摘要、或全文资料。2012年起Ovid SP的Wilson资料库移转至EBSCOhost平台。
  2 即MEDLARS on-Line医学文献联机数据库, 是MEDLARS系统40多个数据库中最大和使用频率最高的核心数据库, 文献存储量占整个MEDLARS系统50%以上, 是检索国际医学文献的首选数据库。
  3 EMBASE (Excerpt Medica Database) 是由荷兰Elsevier Science出版公司建立的EM的书目型数据库, 以光盘数据库、国际联机数据库及网络数据库的形式为用户提供数据。
  4 PsycI NFO是美国心理学协会 (American Psychological Association, APA) 出版的著名的文摘索引数据库, 收录有关心理学方面的期刊650种, 近200万条文献。信息覆盖超过45个国家、以30多种语言写就的心理学学术、研究和实践专著。

点击查看>>文献检索结课论文(推荐10篇)其他文章
作者单位:攀枝花学院
原文出处:张影莹.英文数据库文献检索策略定位方法[J].攀枝花学院学报,2018,35(03):98-102.
相关内容推荐
相关标签:
返回:文献检索论文