搜索引擎论文

您当前的位置:学术堂 > 图书档案学论文 > 搜索引擎论文 >

几大搜索引擎文献获取途径的实际保障能力对比(2)

来源:学术堂 作者:周老师
发布于:2015-09-17 共8331字

  1方法与步骤

  1.1从WOS2013年中国着者发表的文献中抽样

  2014年 4 月使用 WOS 平台,检索出版时间为 2013 年,着者地址含有“China”的文献,命中结果有 274631 条。根据成数的概念及以下样本数量计算公式[13- 14]:

  分析这个数据集合的参考文献,在置信度为95%的条件下需不重复随机抽取 384 篇。受WOS 对每个检索条件只显示选定排序方式前 10万条结果的限制,为避免对该结果集合抽样时样本集中在局部的问题,本文选择 3 种排序方式,每种排序方式下用等间隔法各抽取 128 篇,3 种合计共抽取 384 篇。3 种排序方式为“出版日期升序”“第一着者升序”“被引次数升序”.

  1.2对选中文献的参考文献归类,并对期刊论文类参考文献抽样

  获取这384 篇 WOS 中国着者 2013 年发表的文献后,逐篇提取各文献的参考文献,并对这些参考文献按文献类型归类计数形成表1.

  表 1 显示期刊论文类参考文献占引用文献的绝大多数,根据优先解决主要矛盾的原则,本文仅对各文献获取途径、保障期刊论文类参考文献的能力进行比较。

  根据统计学原理,比较发现服务与搜索引擎对8980 篇文献的保障情况适用抽样检验。根据样本数量计算公式,在 95%的置信度下应抽取369 篇文献。抽取方法是:先对 8980 篇文献按文献题名字母顺序排序,再以 24 为间隔用等间隔法顺序选出 369 篇作为比较用的样本。“24”

  由公式 s=INT(8980/369)计算得到,以实现对该集合的等间隔抽样。

  1.3实测各获取途径保障文献的能力

  按 1.2 节的步骤抽取样本后,对样本文献逐篇在待比较的数种文献获取途径中进行检索并记录结果。考虑到最便于用户使用的文献保障方式是“直接在线原文”,即在某服务中能查到所需文献并可直接在线打开原文,故本文以各途径能否提供所需文献的“直接在线原文”为比较重点,并根据试查情况将各获取途径对具体文献的保障能力分为4 个级别计数:(1)“直接在线原文”;(2)提供付费购买原文的链接;(3)仅文摘或简要信息;(4)查不到,最后根据结果进行分析比较。

  1.3.1 WOS“出版商处原文”功能提供“直接在线原文”的能力

  WOS是美国 Thomson Reuters 集团开发的基于 WEB 的服务,包括 SCI、SSCI、A&HCI和多个专业数据库。2014 年初 WOS 的检索结果中出现“出版商处的原文”链接,由于 WOS是科技工作者高频使用的数据库,因此考察WOS 能直接提供多少比例“直接在线原文”十分必要。

  比较 WOS 时检索条件为:数据库选项为“所有数据库”、年限范围为“所有年份”、检索途径选“标题”,用选定参考文献的完整标题作为检索条件进行检索。

  考虑到全标题检索可能因标题使用相同内容的不同格式、是否使用空格等细节造成误检,对全标题途径查不到的文献还要经过“刊名”+“出版年”的方式复核以确认该文献被 WOS 收录的真实情况。实测结果按前文所述的四个级别记录于表 2.

  1.3.2 谷歌途径文献保障能力

  谷歌是我国公认的查询外文信息的首选搜索引擎。根据谷歌使用说明,可用英文字符的双引号将被检文献的标题引起来进行精确检索。根据谷歌pagerank的原理和余慧佳论文中指出的绝大多数用户只翻看搜索引擎返回的前 10 个结果的研究成果[15],本次检验仅对谷歌服务检索结果第一页的 10 条结果进行分析,记录前 10 条结果中有无该文的在线原文链接,并检验是直接打开原文还仅是付费购买原文的链接。对全标题方式查不到的文献通过“刊名”+“出版年”+“着者”的方式复核,结果汇入表 2.

  1.3.3 谷歌学术途径文献保障能力

  谷歌学术作为谷歌公司推出的专业学术文献保障服务,在国内学术界有一定的影响力,在很多高校图书馆主页上都有谷歌学术的检索入口,也是国内很多文献用户的常用文献检索工具,故列入本文比较对象。检索方式及评价标准同谷歌,结果汇入表 2.

  1.3.4 百度途径文献保障能力

  百度是我国在线服务时间较长、影响较大的通用搜索引擎,列入本文的比较范围。在其主检索框输入待查文献标题,对结果的判断同谷歌,结果汇入表 2.

  1.3.5超星发现服务的文献保障能力

  超星发现服务是我国企业自主开发的具备中外期刊原文保障能力的资源发现服务,在“985工程”高校图书馆中用户达到 27 家。郑州大学图书馆 2010 年引进“搜递系统” [16],其后台引擎 2014 年升级为“超星发现”.投入使用以来为该馆用户提供了大量的原文服务,口碑好,根据本文研究方向将其作为“超星发现”的代表进行比较,通过“期刊”“外文检索”“文献标题”的方式检验,对标题途径查不到的文献通过“刊名”+“出版年”+“关键词”的方式复核,结果汇入表 2.

  1.3.6 e读服务文献保障能力

  e 读服务由 CALIS 于 2011 年推出,目的是建成融合全国所有高校馆馆藏资源的整合平台,以开展文献保障服务。截止笔者考察期间,使用e读服务的“985 工程”高校图书馆有 12 家,e读服务实际访问地址均为。

  根据本文研究方向,检索条件限定为“期刊文章”,检索入口为“文章名”.主要通过全标题检索,对标题途径查不到的论文通过“刊名”+“着者”+“出版年”的方式复核,结果汇入表2.

  1.3.7 Summon 服务文献保障能力

  Summon 服务于 2009 年 7 月由 SerialsSolutions 发布,本次考察时“985 工程”高校馆中已有 9 家用户。考虑到发现服务覆盖的资源与其所属机构获权的纸质及数字化资源直接相关,故从9 家使用 Summon 服务的“985 工程”高校中选择北京大学图书馆的未名学术搜索[17]作为Summon 的代表进行比较。具体检索方式为使用默认的检索设置,先通过全标题检索,对标题途径查不到的论文通过“刊名”+“着者”+“出版年”的方式核对,结果汇入表 2.

  1.3.8 EDS 服务文献保障能力

  EBSCO 公司的 EDS 服务在“985 工程”高校中也有多家部署。根据中国校友会网公布的2014 中国高校排名[18],“985 工程”高校 EDS用户中排名第一的是中国人民大学,所以本文选择了该校图书馆使用的以 EDS 为后台的Findplus服务[19]作为比较对象。检索途径也是标题,对于标题途径查不到和检索结果中不包含样本文献的情况,也根据“刊名”+“出版年”+“着者”的方式复核,结果汇入表 2.

  1.3.9 Primo 服务文献保障能力-清华大学版

    Primo服务由 Exlibris 公司于 2010 年 6 月发布,2014 年 4 月在“985 工程”高校中部署 7家。同样根据中国校友会网 2014 高校排名,选择清华大学图书馆的“水木搜索”作为 Primo 的样本进行比较,后文简称为“QHPrimo”.检索方式是按全部资源、标题途径进行,标题途径查不到的记录,再按“刊名”+“年份”+“着者”的方式复核,结果也汇入表 2.

  1.3.10 Primo 服务文献保障能力---郑州大学版

    郑州大学图书馆于2012 年引进 Primo 服务[20],以 Primo 为引擎部署名为“学术发现”服务,为与“QHPrimo”区分,后文简称“ZZU-Primo”.考虑到发现服务揭示资源的能力与所属机构获权资源及本身参数配置等因素相关,可以推测不同机构的 Primo 服务存在资源揭示能力的差异,因此在检验了“QHPrimo”的文献保障能力后也对“ZZUPrimo”的文献保障能力进行了检验,以对比引擎相同资源配置不同的情况下发现服务文献保障能力的差异。为保障比较的公正性,具体检索及复核方式与“QHPrimo”相同,结果同样汇入表2.

相关内容推荐
相关标签:
返回:搜索引擎论文