1方法与步骤
1.1从WOS2013年中国着者发表的文献中抽样
2014年 4 月使用 WOS 平台,检索出版时间为 2013 年,着者地址含有“China”的文献,命中结果有 274631 条。根据成数的概念及以下样本数量计算公式[13- 14]:
分析这个数据集合的参考文献,在置信度为95%的条件下需不重复随机抽取 384 篇。受WOS 对每个检索条件只显示选定排序方式前 10万条结果的限制,为避免对该结果集合抽样时样本集中在局部的问题,本文选择 3 种排序方式,每种排序方式下用等间隔法各抽取 128 篇,3 种合计共抽取 384 篇。3 种排序方式为“出版日期升序”“第一着者升序”“被引次数升序”.
1.2对选中文献的参考文献归类,并对期刊论文类参考文献抽样
获取这384 篇 WOS 中国着者 2013 年发表的文献后,逐篇提取各文献的参考文献,并对这些参考文献按文献类型归类计数形成表1.
表 1 显示期刊论文类参考文献占引用文献的绝大多数,根据优先解决主要矛盾的原则,本文仅对各文献获取途径、保障期刊论文类参考文献的能力进行比较。
根据统计学原理,比较发现服务与搜索引擎对8980 篇文献的保障情况适用抽样检验。根据样本数量计算公式,在 95%的置信度下应抽取369 篇文献。抽取方法是:先对 8980 篇文献按文献题名字母顺序排序,再以 24 为间隔用等间隔法顺序选出 369 篇作为比较用的样本。“24”
由公式 s=INT(8980/369)计算得到,以实现对该集合的等间隔抽样。
1.3实测各获取途径保障文献的能力
按 1.2 节的步骤抽取样本后,对样本文献逐篇在待比较的数种文献获取途径中进行检索并记录结果。考虑到最便于用户使用的文献保障方式是“直接在线原文”,即在某服务中能查到所需文献并可直接在线打开原文,故本文以各途径能否提供所需文献的“直接在线原文”为比较重点,并根据试查情况将各获取途径对具体文献的保障能力分为4 个级别计数:(1)“直接在线原文”;(2)提供付费购买原文的链接;(3)仅文摘或简要信息;(4)查不到,最后根据结果进行分析比较。
1.3.1 WOS“出版商处原文”功能提供“直接在线原文”的能力
WOS是美国 Thomson Reuters 集团开发的基于 WEB 的服务,包括 SCI、SSCI、A&HCI和多个专业数据库。2014 年初 WOS 的检索结果中出现“出版商处的原文”链接,由于 WOS是科技工作者高频使用的数据库,因此考察WOS 能直接提供多少比例“直接在线原文”十分必要。
比较 WOS 时检索条件为:数据库选项为“所有数据库”、年限范围为“所有年份”、检索途径选“标题”,用选定参考文献的完整标题作为检索条件进行检索。
考虑到全标题检索可能因标题使用相同内容的不同格式、是否使用空格等细节造成误检,对全标题途径查不到的文献还要经过“刊名”+“出版年”的方式复核以确认该文献被 WOS 收录的真实情况。实测结果按前文所述的四个级别记录于表 2.
1.3.2 谷歌途径文献保障能力
谷歌是我国公认的查询外文信息的首选搜索引擎。根据谷歌使用说明,可用英文字符的双引号将被检文献的标题引起来进行精确检索。根据谷歌pagerank的原理和余慧佳论文中指出的绝大多数用户只翻看搜索引擎返回的前 10 个结果的研究成果[15],本次检验仅对谷歌服务检索结果第一页的 10 条结果进行分析,记录前 10 条结果中有无该文的在线原文链接,并检验是直接打开原文还仅是付费购买原文的链接。对全标题方式查不到的文献通过“刊名”+“出版年”+“着者”的方式复核,结果汇入表 2.
1.3.3 谷歌学术途径文献保障能力
谷歌学术作为谷歌公司推出的专业学术文献保障服务,在国内学术界有一定的影响力,在很多高校图书馆主页上都有谷歌学术的检索入口,也是国内很多文献用户的常用文献检索工具,故列入本文比较对象。检索方式及评价标准同谷歌,结果汇入表 2.
1.3.4 百度途径文献保障能力
百度是我国在线服务时间较长、影响较大的通用搜索引擎,列入本文的比较范围。在其主检索框输入待查文献标题,对结果的判断同谷歌,结果汇入表 2.
1.3.5超星发现服务的文献保障能力
超星发现服务是我国企业自主开发的具备中外期刊原文保障能力的资源发现服务,在“985工程”高校图书馆中用户达到 27 家。郑州大学图书馆 2010 年引进“搜递系统” [16],其后台引擎 2014 年升级为“超星发现”.投入使用以来为该馆用户提供了大量的原文服务,口碑好,根据本文研究方向将其作为“超星发现”的代表进行比较,通过“期刊”“外文检索”“文献标题”的方式检验,对标题途径查不到的文献通过“刊名”+“出版年”+“关键词”的方式复核,结果汇入表 2.
1.3.6 e读服务文献保障能力
e 读服务由 CALIS 于 2011 年推出,目的是建成融合全国所有高校馆馆藏资源的整合平台,以开展文献保障服务。截止笔者考察期间,使用e读服务的“985 工程”高校图书馆有 12 家,e读服务实际访问地址均为。
根据本文研究方向,检索条件限定为“期刊文章”,检索入口为“文章名”.主要通过全标题检索,对标题途径查不到的论文通过“刊名”+“着者”+“出版年”的方式复核,结果汇入表2.
1.3.7 Summon 服务文献保障能力
Summon 服务于 2009 年 7 月由 SerialsSolutions 发布,本次考察时“985 工程”高校馆中已有 9 家用户。考虑到发现服务覆盖的资源与其所属机构获权的纸质及数字化资源直接相关,故从9 家使用 Summon 服务的“985 工程”高校中选择北京大学图书馆的未名学术搜索[17]作为Summon 的代表进行比较。具体检索方式为使用默认的检索设置,先通过全标题检索,对标题途径查不到的论文通过“刊名”+“着者”+“出版年”的方式核对,结果汇入表 2.
1.3.8 EDS 服务文献保障能力
EBSCO 公司的 EDS 服务在“985 工程”高校中也有多家部署。根据中国校友会网公布的2014 中国高校排名[18],“985 工程”高校 EDS用户中排名第一的是中国人民大学,所以本文选择了该校图书馆使用的以 EDS 为后台的Findplus服务[19]作为比较对象。检索途径也是标题,对于标题途径查不到和检索结果中不包含样本文献的情况,也根据“刊名”+“出版年”+“着者”的方式复核,结果汇入表 2.
1.3.9 Primo 服务文献保障能力-清华大学版
Primo服务由 Exlibris 公司于 2010 年 6 月发布,2014 年 4 月在“985 工程”高校中部署 7家。同样根据中国校友会网 2014 高校排名,选择清华大学图书馆的“水木搜索”作为 Primo 的样本进行比较,后文简称为“QHPrimo”.检索方式是按全部资源、标题途径进行,标题途径查不到的记录,再按“刊名”+“年份”+“着者”的方式复核,结果也汇入表 2.
1.3.10 Primo 服务文献保障能力---郑州大学版
郑州大学图书馆于2012 年引进 Primo 服务[20],以 Primo 为引擎部署名为“学术发现”服务,为与“QHPrimo”区分,后文简称“ZZU-Primo”.考虑到发现服务揭示资源的能力与所属机构获权资源及本身参数配置等因素相关,可以推测不同机构的 Primo 服务存在资源揭示能力的差异,因此在检验了“QHPrimo”的文献保障能力后也对“ZZUPrimo”的文献保障能力进行了检验,以对比引擎相同资源配置不同的情况下发现服务文献保障能力的差异。为保障比较的公正性,具体检索及复核方式与“QHPrimo”相同,结果同样汇入表2.
经过3~5年的飞速发展,目前桌面搜索和移动搜索几乎各占半壁江山,移动搜索大有赶超桌面搜索,成为主要搜索途径之势。2013~2014年中国搜索引擎行业竞争持续升级,百度独领风骚的同时,几大追随者毫不懈怠,持续练就内功,同时借助外力,以期对百度构成威胁...
本文从卷烟企业对信息数据检索的需求出发,论述了基于Solr开发出符合自身企业的搜索引擎的可行性,介绍了有关搜索引擎及Solr的相关知识。...
0引言信息检索系统主要为互联网用户提供对资源的检索服务,用户通过输入自己想要寻找的资源信息(诸如资源的部分名称,资源内容中相关关键词等),信息检索系统根据用户提供的检索需求进行资源匹配和资源定位,并按照一定的顺序将匹配的资源反馈给用户。搜...
1引言互联网的深入发展带来了各种类型信息资源数量的快速膨胀。截至2014年6月,我国拥有273万个网站,3.3亿个IPv4地址[1].面对浩瀚巨量的网络资源,用户通过搜索引擎快速获取所需信息尤为重要。目前,我国搜索引擎用户达4.9亿;网民平均使用...
1、引言近年来,随着数字化教育浪潮的不断推进,我国在教育资源建设方面已经取得了巨大的成就,各类教育资源的数量巨大且呈现几何级数增长。随着搜索引擎技术的发展,通用搜索引擎的功能变得日益强大,取得了很大的成功,但其仍有局限性,如搜索的深度不够,...
上世纪中页,传播学家麦克卢汉曾在《理解媒介:论人的延伸》中提出:媒介是人感觉能力的延伸或扩展。这一经典概念的重要意义,在于将人的单一感官和媒体的传播特征进行了对应。例如,从视角延伸到印刷媒介,从听觉延伸到广播以及视、听觉共同延伸到电视。而...
搜索引擎经历近30年的发展,目前在使用的有几种类型,如全文搜索引擎、分类目录搜索引擎、多元搜索引擎、集成搜索引擎等。但这些都是网络上的公用商业搜索引擎,它们往往不能满足企业的需要。...
第4章模型构建及假设提出。本章在前两章文献综述和理论分析的基础上,结合访谈的结果提出了搜索引擎优化方法和效果的维度,并构建了两者的概念模型,提出了各研究变量之间的假设关系。4.1访谈。访谈法是指研究者通过面对面、QQ等访谈方式,与受访者...
在搜索引擎技术的发展之下,智能检索作为一个新型的检索方式已经渗透到了网络数据的设计中,该种检测方式能够帮助人们检测出高质量的信息,是检索方式发展的一种必然需求,将数据挖掘技术应用在网络资源可以实现智能检索的发展,也能够为人们提供出更加具有针对性...
引言随着因特网中搜索引擎的发展和进步,油田数据的资源共享以及信息的集成都较之前更加便捷和有效了。从因特网搜索引擎的思想出发,借助SES系统的数据采集和搜索的机制,并且结合油田的信息和数据的共享的特点,制定了一套从结构体系好以及安全智能为主要...