文献计量学论文

您当前的位置:学术堂 > 图书档案学论文 > 文献计量学论文 >

国内文献资源共享研究领域论文的关键词分析

来源:学术堂 作者:周老师
发布于:2015-05-22 共7393字
摘要

  我国现代意义的图书馆联盟建设始于20世纪90年代中后期【1】。十几年的发展过程中,受到政府部门、图书情报领域等社会各界人士的广泛关注,全国各省市展开了图书馆联盟建设的热潮,目前已经形成全国性、区域性、系统内、系统外联盟协调共享的局面。虽然我国图书馆联盟建设取得较快发展,但图书馆联盟是一个复杂的系统,其组织建设过程涉及到文献资源的分布状况、联盟成员的共享意识、相关技术的开发应用、以及国家政策制度的保障等多个因素的影响,抓住关键因素可以最大化利用文献资源,减少浪费,利于共建共享评估工作的深入进行,提高办馆效益。

  本文试图运用词频分析方法,对国内文献资源共享研究领域论文的关键词进行统计分析。关键词是文章核心内容及作者学术观点的凝练,也是信息计量学研究的重要指标。通过对关键词词频的统计分析,可以从一个侧面显示该学科的总体内容特征、研究内容之间的内在联系、学术研究的发展脉络与发展方向、学术研究的重点与热点【2】。该研究中某个关键词出现的越频繁,表明文献资源共建共享研究领域对其关注程度越高,这个关键词也就越有可能提示图书馆联盟资源共享的一个关键影响因素。

  1数据来源及处理

  1.1数据检索策略

  以CNKI和万方数据库作为统计来源,以“图书馆联盟”、“图书馆同盟”、“图书馆联合”、“图书馆协作”、“图书馆合作体”、“图书馆合作组织”、“图书馆链”、“图书馆网”、“电子资源联盟”、“文献信息资源共享”、“图书馆协作网络联盟”、“图书文献中心”、“信息资源共享”共13个词作为检索词,以“主题”检索为检索项,选取其中的学术期刊论文、会议论文和硕博学位论文,检索年限1979年-2011年。

  1.2数据整理

  获取相关论文题录,导入Endnote X4,删除其中的重复项以及消息、广告、通知等,并结合题名、摘要将与“文献资源共享”这一主题联系并不紧密的相关项一并删除,最后确定1887条数据,其中包括1718篇学术论文、85篇会议论文、84篇硕博学位论文。使用ROST WordParser软件,并结合Excel进行关键词词频统计,在此基础上采用关键词整理方法,先统计上位关键词,再分别统计相关的下位关键词;出现同义词时,选择最常用的关键词为标准进行统计,其它相关词作补充;同义词分别统计后合并;最后以上位通用关键词进行统计、累加。

  2关键词总体状况统计

  1887条数据中,学术论文、会议论文和硕博学位论文各占91%、4.5%、4.5%,数量相差较大且三者各具特点。其中学术论文是对科学领域中某些问题进行分析和探讨,以阐述学术见解、交流科研成果;会议论文重在反映最新的科研动态,传递信息比较及时,针对性较强;学位论文一般都具有独创性,探讨的课题比较专深。因此本文重点对学术论文进行分析,会议论文和硕博论文作以补充。图1揭示了1980-2011年32年间文献资源共建共享活动相关的学术论文中关键词频次按年度变化情况。20世纪80、90年代关于图书馆联盟的文章数量较少,增长缓慢,进入21世纪后大量增加,这里将1980-1999年的前20年按五年一组分为4个时段,2000-2011年的12年间按两年一组分为6个时段。

  由图1可以看出32年间图书馆联盟资源共享活动关键词频次呈快速上升趋势,从1980-1984年的135频 次 上 升 到2010-2011年 的2417频 次 ,1980-1999年间上升较为平缓,其间1995-1999年较前些年有一个较大的增长,2000-2011年上升较为迅猛,呈直线趋势。

  另外,新增词语往往与新的知识单元联系在一起,因此可以通过计量分析新增关键词的数量来反映图书馆联盟资源共享活动的发展状况。该研究中我们将在统计年限内首次出现的词语确定为新增 关 键 词 ,最 终 分 析 结 果 也 显 示 在 图1中 .1980-1999年期间,新增关键词数量呈微波折的上升趋势,2000-2011年这一阶段新增关键词数目逐年稳定增长,该折线图走势与关键词频次变动趋势相似,但较为平缓,从1980-1984年5年新增关键词数106个,增长到2010-2011年2年新增关键词613个。通过关键词频次及新增关键词的增长状况反映出图书馆联盟文献资源共享活动在深度和广度上呈现出逐年稳定且迅速增加的趋势。

  3关键词随时间的演变分析

  不同阶段高频词更新情况及排名顺序的变化在一定程度上可以反映出图书馆联盟资源共享影响因素的演变,本文将1980年-2011年32年间的学术论文分为六个时段,前五个时段每一时段相隔五年,对1887篇文章所含关键词进行分析,前60位关键词的频次达2983次,占关键词总频次的44.33%,但只占关键词词量的2.52%.根据文献资源共享影响因素相关关键词的词频分布,并考虑可行性及有效性,我们选取前60位关键词作为研究对象,若某时段两关键词排序相同而只能选其一,则以全部时间范围内总频次较高者优先,通过观察各时段高频关键词的更新情况及排序的变化,以期对图书馆联盟资源共享影响因素做进一步的研究。

  3.1 高频关键词更新情况

    不同时段高频关键词的交替更新一定程度上代表着图书馆联盟资源共享活动的深入发展,不同时期高频关键词的显现能够从侧面反映图书馆联盟资源共享影响因素的发现及受关注状况。通过表1的对照比较可以发现,随着实践活动的开展以及理论研究的深入,不断有新的关键词跻身前60位,每个时段的高频关键词都在发生变化。

  第二时段,包括图书馆工作人员、读者服务、横向联系、中心图书馆在内的36个高频关键词上升到前60位之中,这36个关键词中,10个属于资源拥有机构即图书馆联盟的构建主体,3个与文献信息资源相关,还有4个涉及到网络技术运行环境,另外与成员馆积极开展合作活动提供用户服务、部分国家和地区的文献资源共享实践、构建模式及运行机制相关的关键词分别有3个、1个和2个。在第三时段又有文献资源布局、中小型图书馆、数据库、标准化、上海地区、OCLC、外文期刊等关键词更新到前60位中,新增的22个高频关键词中有5个代表资源拥有机构,4个属于文献信息资源,2个与网络技术运行环境相关,还有2个涉及到部分国家及地区的典型实例。第四时段有网络建设、联合编目、文献传送、医学图书馆、资源共享模式等32个跃入高频关键词行列。第五时段又更新了CALIS、NSTL、知识产权保护、西部开发等。第六时段大学城、运行机制、文化信息资源共享工程、集团采购、武汉宣言、博弈论等关键词进入前60名之列,各时段关键词更新情况列于表1.

  总体上看,与七个主题内容相关的关键词交替更新出现在前60位。这种更新是一种双向过程,退出的关键词主要分为“时隐时现”和“昙花一现”两种类型。“时隐时现”即在60位高频关键词界限上下徘徊,例如中小学图书馆、资料室、上海地区、医学图书馆等,其中某些关键词与图书馆联盟资源共享实践活动相关,如“上海地区”在第三、四时段出现频次较高,位居前60名,上海地区的文献资源共建共享活动开展较早,20世纪90年代中期上海地区文献信息资源协作网(即上海市文献资源共建共享协作网的前身)成立,当时其工作的开展及共享效果受到较高的关注,随着全国各省市文献资源共享工作的开展,之后的两个时段这一关键词再没有进入高频词之列。“昙花一现”型如县级图书馆、CALIS、知识产权保护、运行机制、文化信息资源共享工程等,其中很多关键词与图书馆联盟实践过程中出现的问题密切相关,如运行机制问题、知识产权问题,这些都是影响图书馆联盟运作成效的不可避免的问题,随着研究的深入使问题得以解决,这些关键词也就退出了高频词之列。

  3.2 高频关键词排名顺序的变化

  高频关键词排名顺序的变化是图书馆联盟资源共享活动中热点问题的外化表现,在某种程度上可以反映出文献资源共享活动影响因素的关注度转移。通过分析高频关键词位次排序的变化,可以清楚地了解哪些关键词所属的影响因素类别受关注程度在提高,哪些在下降。

  (1)统计时段内始终受到较高关注而词频居高不下。这类词主要有:网络化、联合目录、高校图书馆、图书馆、文献信息、文献资源等。属于图书馆联盟构建主体要素这一类别的图书馆,尤其是高校图书馆一直是积极倡导并参与文献资源共享活动的主体的重要组成部分,高校图书馆从1985-1989年这一时段排序10名之外,后来的四个时段上升并稳定在10名之内,图书馆在后三个时段也一直排在10名之内。编制联合目录是图书馆联盟开展的主要活动之一,在其出现的四个时段均在前20位之内,尤其是第三时段更是达到第5位。20世纪90年代万维网的兴起和技术的革新,ISBD、MARC等新概念逐渐被我国图书馆界接受,图书馆联合目录的编制也跟随着发生了改变【3】。

  (2)从无到有并迅速增长。这类词中较为突出的有信息服务、电子资源、模式等。信息服务在1980-1994年的前三个时段没有受到特别关注,该词排序位于前60名之外,到四、五时段进入前60名,第六时段上升至第20位,这一变化源于个性化信息服务研究的开展。我国图书馆个性化信息服务的研究起步较晚,1999年底,科技部支持的“中国数字图书馆示范系统”项目中提到了数字图书馆的个性化服务问题,目前关于个性化服务仍处于研究和探索阶段【4】。与图书馆联盟资源共享模式相关的资源共享模式一词在第四时段位于第60位,到第六时段上升到第26位。资源共享模式涉及到联盟的管理体制、组织制度、经费来源、采用技术、共享内容等多个方面,逐渐受到我国研究者的重视,作为国家社会科学基金项目“网络时代我国图书馆信息资源共建共享模式研究”的系列成果,分别对美国、英国、德国、加拿大、南非、新西兰、西欧、北欧以及我国台湾地区的信息资源共享模式进行了研究,对我国的图书馆联盟建设起到借鉴意义。

  (3)词频排序呈下降趋势。例如在1980-1984时段,我国关于藏书建设研究讨论活动较为频繁,1982年2月中国图书馆学会在哈尔滨召开“全国藏书建设专题学术讨论会”,重点讨论了藏书协调问题,1983年4月,全国高校图工委在成都召开“藏书建设专题研究预备会”,掀起了研究藏书建设的热潮,1984年9月,全国高校图工委在大连召开“全国高校图书馆藏书建设研讨会”,对我国文献资源建设现状和方法进行了全面深入的研究讨论。这一时期“藏书建设”关键词的排名达到第7位,但是到第三个时期的排序则降到第18位,并且在最后的三个时段都没有再进入前60名的行列,已渐渐远离文献资源共享研究者的关注焦点,类似的这种关键词还有图书馆联合、馆际协作等。

  (4)属于昙花一现的类型。如美国图书馆在1980-1984年间频次较高,后来的几个时段该词排序就没有再进入前60位,美国是图书馆联盟的发源地,研究与实践起步较早,发展比较完善,而我国在20世纪80年代初期图书馆协作实现文献资源共享的经验不足,通过借鉴国外,尤其是美国图书馆之间资源共享的经验,利于推动我国图书馆联盟建设的发展。还有文献资源布局在1990-1994年期间曾位居前60位,主要源于1990年结束了“全国文献资源调查”,对我国大部分图书情报单位的文献资源现状有了总体了解,为全国文献资源合理布局和共建共享提供了可靠依据,引起较大反响。

  4基于关键词的我国图书馆联盟

  影响因素分析4.1 基于学术论文关键词的影响因素分析。1718篇学术论文共涉及到2383个关键词,总词频为7046频次。其中出现4次以上(包含4次)的关键词有268个共4372频次,即11.25%的关键词出现的频次占据总频次的62.05%,这268个关键词代表了图书馆联盟资源共享的主要方式,结合上述分析我们从中选取影响图书馆联盟构建及其绩效的关键词,并予以分类,如表2所示。

  以上9个影响因素,可以进一步划分为三组,如图2所示。第一组是图书馆联盟构建所必备的要素支持,即表2中的前三类影响因素,包括主体要素--信息资源拥有机构,客体要素--文献信息资源,以及网络技术运行环境;第二组是图书馆联盟的内部行为影响因素,共4个,包括成员馆之间开展的各种合作活动并向用户提供服务、构建模式、管理问题、绩效评估,即表2中的四、六、七、九类;第三组图书馆联盟外部行为影响因素,分别为借鉴部分国家和地区文献资源共享的成功经验、相关的法规政策。

  4.1.1 必备要素

  第一类影响因素是图书馆联盟构建主体要素,与这类影响因素相关的关键词总词频为1028频次,包括图书馆、高校图书馆、数字图书馆、公共图书馆、资料室、社区图书馆、档案馆、军队院校等41个。图书情报机构等资源拥有单位作为文献资源共享的承担者和实施者,成为图书馆联盟的主体,其中高校图书馆、公共图书馆、科技图书馆为图书馆联盟构建之初的三大主体。随着我国信息资源开发战略的实施以及资源共享观念的普及,在高校内部,各院系资料室资源的充分利用受到关注。另外,中小学图书馆、社区图书馆、农村图书馆、档案馆等也逐步加入到资源共建共享的行列中,推进了实现全国范围内资源共享的步伐。

  第二类影响因素是图书馆联盟构建所必须的客体要素,即文献信息资源,相关关键词37个,包括信息资源、数据库、电子资源、科技文献、书目数据等,总频次达594次。文献资源形式多样,内容丰富,是图书情报机构开展资源共享活动的客观对象,也是满足用户需要的基础,文献资源的有限性、知识性和共享性决定了进行资源共建共享活动的必要性和可行性。

  第三类关键词27个,与计算机技术、网络技术、信息技术等图书馆联盟的网络运行环境相关,如图书馆系统、信息技术、计算机网络、自动化系统等,词频为329次。现代信息技术的发展使文献资源的形式发生了深刻变化,不再仅限于印刷型文献,数字化信息的频繁交换决定了网络系统建设的重要性,图书馆联盟运行过程中的软硬件设备、网络环境、网络速度等影响着联盟的共享效果。

  4.1.2 内部行为因素

  第四类30个关键词与成员馆间积极开展共建共享活动并向读者提供服务这一影响因素有关,包括馆际互借、信息服务、文献传递、集团采购、联合服务等,词频为304次。图书馆联盟的构建需要持续投入资金、设备、人才等资源,各成员馆只有通过积极开展各种活动并向读者提供服务,才能体现出采取联盟形式共建共享的优势,得到相关政府部门及社会各界的肯定与持续投入,以及其他资源拥有机构的积极参与。

  与图书馆联盟文献资源共建共享模式与机制有关的14个关键词,属第六类影响因素,包括运行机制、共享模式、利益平衡机制等,总频次为92次。

  图书馆联盟的资源共享模式由当地的经济发展状况、文献资源分布、政府部门的支持程度、成员的实力等多个因素共同决定,需要结合具体情况选择适合自身发展的模式。信息资源共建共享工作的顺利开展也需要组织协调机制、利益平衡机制、信息安全保障机制、激励机制等共享机制的协调,其中利益平衡机制被多次提出。

  第七类归于图书馆联盟的管理问题,包括知识管理、风险、集群管理等,相关关键词有6个30频次。图书馆联盟的管理,除了传统意义上的信息资源管理、人力资源管理,近几年知识管理和危机管理开始受到学者的关注。

  第九类是与绩效评估有关的3个关键词14频次,包括绩效评估、绩效评价、指标体系。科学的指标体系是客观准确评价的基础,构建评估指标体系是图书馆联盟绩效评价的核心环节。

  4.1.3 外部行为因素

  第五类是与图书馆联盟典型实例及部分国家和地区有关的关键词21个164次,如CALIS、中国、文化信息资源共享工程、美国、上海地区、OCLC、OhioLINK、CASHL等。图书馆联盟的构建及运行过程中需要不断借鉴成功的经验,国外著名的OCLC、OhioLINK以 及 国 内 运 行 较 早 的CALIS、NSTL、CASHL都提供了参考,我国经济较发达的上海、广州等东部地区的资源共建共享活动起步较早,经过十多年的发展中部地区取得快速进展,目前西部地区的资源共享工作受到极大关注,相关关键词达21次。

  第八类属知识产权问题的关键词有3个,包括知识产权、知识产权保护、知识转移,词频为30次。联盟集团采购或自行开发的数据库及其他电子资源在成员馆间大量使用的同时,都不可避免的带来知识产权问题,需要相关政策法规的保障。

  4.2 基于会议论文和硕博论文关键词的影响

  因素分析85篇会议论文涉及227个关键词356频次,其中2次以上(包含2次)的关键词41个,84篇硕博论文涉及到247个关键词,总频次为362次。为了便于对比分析,分别将会议论文中2次以上(包含2次)的41个关键词,硕博论文中2次以上(包含2次)的45个关键词进行分类统计,分类依据仍为学术论文关键词的九种类别,并统计是否出现新增类别,如表3、表4所示。

  与学术论文中主体要素关键词频次远远高于客体要素不同,会议论文的客体要素关键词总频次超出了主体要素,二者均为图书馆联盟构建所必不可少的组成部分,缺一不可,从这个角度而言,不存在主、次要之分。会议论文中关于“知识产权”和“绩效评估”的第八、九类关键词并未体现出来,因会议论文关键词总量较少,这种情况难以避免,也没有出现新增类别。硕博论文中第四类关键词,即成员馆积极开展合作活动并向用户提供服务相关关键词的数量及频次占有较大比重,用户的需求是推动文献资源共享产生和发展的内在动机,用户对图书馆联盟开展活动进而改善服务的满意度,决定了图书馆是否继续开展共享活动。另外,硕博论文中出现了“元数据”、“meta分析”两词,在学术及会议论文中也有相关关键词,只因频次较低并未显示。在图书馆界,元数据被认为是一种用来描述数字化信息资源,特别是网络信息资源的基本特征及其相互关系,从而确保这些数字化信息资源能够被计算机及其网络系统自动辨析、分解、提取和分析归纳的一整套编码体系【5】。元数据有利于解决信息组织过程中的标准化问题,力求用尽可能少的元数据较为准确地描述信息资源的主题内容,可将其归入信息组织技术类别。

  5结 语

  由以上对我国图书馆联盟领域文献的关键词的统计分析结果,可以观察到图书馆联盟资源共享的各种影响因素,随着时间的推移受关注程度不断变化。总体来看,图书情报机构、信息资源、技术发展,分别作为图书馆联盟构建的主体要素、客体要素及支撑条件,一直以来受到较高关注。随着我国全国性和地区性图书馆联盟实践的开展,逐渐显现出一些问题,如运行机制问题、管理问题、知识产权问题等,引起研究者、实践者的关注。虽然各类影响因素频次不同,关注度也有高低之分,但都应给予足够重视,因为任何一类因素都可能影响到联盟的资源共享效果或成败。最后,需要强调,本文采用的关键词分析有可能反映不了图书馆联盟影响因素的全貌,需要结合其它方法再进行综合分析。

  参考文献

  1刘艳苏。我国图书馆联盟理论与实践研究概述[J].现代情报,2009,29(3):219-222.

  2王 涓。2000~2007年国际情报学研究重点分析[J].情报杂志,2009,28(3):46-49.

  3董红霞。论我国高校图书馆联合目录的发展[J].图书情报工作,2009,53(15):78-82.

  4张雅红。高校图书馆的个性化信息服务研究[J].科技情报开发与经济,2009,19(2):41-43.

  5叶 鹰,金更达。基于元数据的信息组织与基于本体论的知识组织[J].大学图书馆学报,2004,(4):43-47.

相关内容推荐
相关标签:
返回:文献计量学论文