引言
社会科学数据( Social Scientific Data) 是描述社会科学研究对象、方法、条件、状态和其他因素的事实、数字、文字和符号,主要类型有调查数据、统计数据、记录数据、实验及模拟数据等[1,2]。在大数据背景下,社会科学数据已经越来越被视为国家的一种战略资源[3]。开放及共享社会科学数据,可以再现和验证社会科学研究过程与结果,提升研究成果质量; 可以启发其他研究者利用现有数据提出新的研究问题,推动研究创新; 可以促进社会科学研究成果为公众、企业、政府所用,充分发挥研究成果的潜在价值[4,5]。
2012 年,汤森路透在 Web of Knowledge 平台上推出了新产品 DCI ( Data Citation Index) ,它搭建了科学研究工作者与全球数据知识库之间联接的桥梁[6]。在 DCI 数据库中,每条数据记录包括数据所属的数据知识库、国家、机构、文献类型、出版年、被引频次、SU 类别等字段。截止 2014 年 6月 12 日,DCI 收录自然科学( 3291397 条) 及社会科学( 551059 条) 数据记录共 3842456 条。
本文对 DCI 收录的社会科学数据记录的国家/地区分布、机构分布、文献类型分布、学科分布及被引用情况进行统计分析,以期发现其规律、特征,为我国社会科学数据的管理与应用提供参考。
一、数据采集
在本文中,所采集的社会科学数据记录包括DCI 在 SU( Subject Area) 分类下的社会科学、人文& 艺术和图书情报学。在 DCI 的高级检索界面下,将社会科学的 24 个子类学科、人文 & 艺术的14 个子类学科、图书情报学科通过逻辑连接词“or”形成一个检索式,即“ su = Women's Studiesor su = Urban Studies or …… or su = InformationScience & Library Science”,按照这个检索式进行检索并采集数据。截止2014 年6 月12 日,通过这种采集方法,获得 DCI 社会科学数据记录 551059条。
二、数据分析
为分析社会科学数据的开放共享程度和学术影响力,本文从国家/地区、机构、文献类型、学科类别 4 个方面统计并计算了 DCI 社会科学数据的记录数、被引记录数、被引次数、H 指数 4 个评估指标。记录数指标用于评估社会科学数据的开放共享程度,该指标越大,说明开放共享程度越高。
被引记录数、被引次数、H 指数用于评估社会科学数据的学术影响力,这 3 个指标越大,说明学术影响力越高。
( 一) 国家/地区统计分析
本文利用从 DCI 中采集的 551059 条记录统计并计算了各个国家/地区的评估指标,并列出记录数靠前的10 个国家,如表 1 所示。从记录数看,美国的记录数最大,为 81261 条,占总记录数的 14.746% ,其次是德国和英国,记录数分别为 13351、2180 条,所占百分比分别为 2. 423% 、0. 396% 。从被引记录数看,美国的被引记录数最大,为 2714 条,其次是澳大利亚和英国,被引记录数分别为 396、256 条。从被引次数看,美国的被引次数最多,为37843 次 ,其次是英国和澳大利亚,被引次数分别为3533、2905 次。从 H 指数看,美国的 H 指数最大,为84,其次是英国和加拿大,H 指数分别为 25、21。
由此看出,在社会科学数据领域中,美国、德国、英国的数据开放共享程度相对较高。同时,美国、澳大利亚、英国的平均被引记录数、平均被引次数、平均 H 指数分别为 1122、14760、43,明显超过其他国家的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,美国、澳大利亚、英国的数据学术影响力相对较高。【1】
本文利用从 DCI 中采集的 551059 条记录统计并计算了各个机构的评估指标,并列出记录数靠前的 10 个机构,如表 2 所示。从记录数看,美国商务部的记录数最大,为 35484 条,占总记录数的 6. 439%,其次是慕尼黑大学和国际粮食政策研究机构,记录数分别为 9602、5080 条,所占百分比分别为 1. 742%、0. 922%。从被引记录数看,密歇根大学的被引记录数最大,为 418 条 ,其次是美国商务部和美国司法部,被引记录数分别为 396、326条。从被引次数看,美国商务部的被引次数最多,为 8164 次 ,其次是密歇根大学和美国司法部,被引次数分别为 5863、3052 次。从 H 指数看,美国商务部的 H 指数最大,为 45,其次是密歇根大学和美国司法部,H 指数分别为 41、25。
由此看出,在社会科学数据领域中,美国商务部、慕尼黑大学、国际食品政策研究机构的数据开放共享程度相对较高。同时,美国商务部、密歇根大学、美国司法部的平均被引记录数、平均被引次数、平均 H 指数分别为 380、5693、37,明显超过其他机构的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,美国商务部、密歇根大学、美国司法部的数据学术影响力相对较高。
( 三) 文献类型统计分析
DCI 将其收录的记录分为 3 种文献类型,数据知识库( Repository) 、数据研究( Data Study) 、数据集( Data Set) 。数据知识库是包含数据研究和数据集的数据库或集合,提供原始数据的存储和访问。数据研究是对知识库中保存的研究或实验的描述,包括长期的系列或纵向研究。数据集是数据知识库提供的一个或一组具有内在联系的数据文件,是集合、数据研究或实验的一部分[7]。
本文利用从 DCI 中采集的 551059 条记录统计并计算了 3 种文献类型的评估指标,如表 3 所示。从记录数看,数据集的记录数最大,为 507220条,占总记录数的 92. 045%,其次是数据研究和数据知识库,记录数分别为 43790、49 条,所占百分比分别为 7. 947%、0. 009% 。从被引记录数看,数据研究的被引记录数最大,为 5841 条 ,其次是数据集和数据知识库,被引记录数分别为 30、9条。从被引次数看,数据研究的被引次数最多,为78509 次 ,其次是数据知识库和数据集,被引次数分别为 6859、71 次。从 H 指数看,数据研究的 H指数最大,为 140,其次是数据知识库和数据集,H指数分别为 7、4。【2】
由此看出,在社会科学数据领域中,文献类型为数据集的数据开放共享程度相对较高,文献类型为数据研究的数据学术影响力相对较高。
( 四) 学科类别统计分析
本文利用从 DCI 中采集的 551059 条记录统计并计算了各个学科类别的评估指标,并列出记录数靠前的 10 个学科,如表 4 所示。从记录数看,地理的记录数最大,为 376918 条,占总记录数的 68. 399%,其次是社会学和人口统计学,记录数分别为 48260、45750 条,所占百分比分别为 8.758% 、8. 302% 。从被引记录数看,社会学的被引记录数最大,为 2117 条 ,其次是商业与经济和人口统计学,被引记录数分别为 1114、1005 条。从被引次数看,社会学的被引次数最多,为 35505次,其次是人口统计学和商业与经济,被引次数分别为 21992、1884 次。从 H 指数看,人口统计学的H 指数最大,为 96 ,其次是社会学和商业与经济,H 指数分别为 94、85。
由此看出,在社会科学数据领域中,地理、社会学、人口统计学的数据开放共享程度相对较高。同时,这3 个学科类别的平均被引记录数、平均被引次数、平均 H 指数分别为1412、19793、91,明显超过其他学科类别的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,社会学、人口统计学、商业与经济学科的数据学术影响力相对较高。【3】
三、结论及对我国的启示
本文从 DCI 中采集了社会科学、人文 & 艺术、图书情报学的数据,利用这些数据从国家/地区、机构、文献类型、学科类别4 个方面进行统计分析,得出了相关结论,并得到对我国的相关启示:
( 1) 从国家/地区分析结果可以看出,在社会科学数据领域中,欧美国家的数据开放共享程度和学术影响力相对较高。建议我国完善社会科学研究管理办法,建立我国社会科学数据开放制度,提高我国社会科学开放数据的量与质,在此基础上,逐步建立我国的社会科学数据引文索引库,促进我国社会科学数据的开放与应用。
( 2) 从机构分析结果可以看出,在社会科学数据领域中,政府的社会科学数据开放共享程度和学术影响力相对较高。建议我国在遵循《国家保密法》的前提下,建立政府数据中心,加强对政府数据的开放与应用,中心可由政府委托国家图书馆、国家档案馆、公立高校图书馆等建设。
( 3) 从文献类型分析结果可以看出,在社会科学数据领域中,文献类型为数据研究的数据的学术影响力相对较高。建议我国的社会科学研究管理部门形成原始研究数据报告与公开制度,并建立相应的原始研究数据中心。如国家社科规划办可形成国家社科基金项目的原始研究数据报告与公开制度,并建立“国家哲学社会科学基金项目原始研究数据中心”。同样,各省( 市、区) 社科规划办也可形成各省( 市、区) 社科基金项目的原始研究数据报告与公开制度,并建立“各省( 市、区) 哲学社会科学基金项目原始研究数据中心”。这样,有利于确保社科基金项目的研究质量,有利于社科研究成果的再利用,有利于哲学社会科学的创新发展。
( 4) 从学科类别分析结果可以看出,在社会科学数据领域中,社会学、人口统计学的数据开放共享程度和学术影响力相对较高。建议我国建立以我国社会科学重点学科、重点实验室、重点研究基地为中心及图书馆积极参与的各个学科的数据中心。
2014年9月19日,中国社会科学院哲学研究所和湖北省社会科学院共同举办的第25届全国社会科学哲学大会暨中国精神的哲学阐释学术研讨会在武汉召开。中共湖北省委常委、宣传部部长尹汉宁出席会议,并作了重要讲话。尹汉宁认为,围绕中国精神的哲...
当代社会科学哲学是连接社会、科学与哲学的桥梁,其研究方法在不断地探索和更新,以寻求该学科的持续、健康发展。从社会科学哲学的研究进路上看,逻辑经验分析、历史分析、实践分析逐渐淡出社会科学研究方法的主流,在经历语言转向和解释学转向后,社会科学...
近几年中,笔者曾数次赴美国作学术访问,顺便对美国的社会科学研究情况作了一些考察.下面笔者把自己的印象和认识写出来,或许有一点借鉴作用.一、美国社会科学研究的地位.社会科学在美国不算是热门行当,其规模和影响很难与自然科学相比.但美国的社会科学研究...
一、社会科学创新与信息资源.社会科学知识创新是对客观世界的探索,是对社会发展规律的揭示,是一种独立的思考和知识创造的过程.社会科学研究创新的本质特征和丰富的内涵使社会科学研究对信息资源的开发利用提出了更高的要求,对学科资源的充分占有是社会科学...
我国对社会科学科研项目的评价从建国起就有,但由于当时社会的主要矛盾和矛盾的主要方面都与自然科学研究更直接相关,政府对社会科学研究的投入相对较少,社会科学研究的发展比较缓慢。因此,对于项目是否按照预计的时间完成,项目完成的质量是否达到预期的...
评价是一种观念性活动,是一种在观念中建构价值世界的活动。〔1〕这使得评价本身一直处于争议和诘难之中,社会科学评价也不例化。而所谓科学上合理,主要在于尽我们所能做的一切,使科学的研究传统获得最大的进步,同样,这一思路表明,合理性即在于接受研...
对现代大学而言,无论是对大学教师的科研成果评价,还是其学术组织或学术共同体的绩效考核,都是大学有效实施学术管理不可或缺的且无法替代的关键环节。...
一、社会科学跨学科研究的历史前提20世纪中叶以来,社会科学跨学科研究日益兴起,并导致传统社会科学研究产生显着的变化,这也是一种历史的必然。让我们回到历史的原点来看,1945年前后出现的四个新的发展动向,即战后地区研究的兴起,人类活动范围的拓展,大学系...
关于哲学社会科学对经济发展的作用,马克思早就指出:固定资本的发展表明,一般的社会知识,已经在多么大的程度上变成了直接的生产力。钱学森1980年代也强调指出:科学技术是第一生产力。这里科学技术包括社会科学,而且在我国目前,社会科学比自然科学更...
一个国家哲学社会科学发展的程度和水平直接反映了这个国家经济、政治、文化、社会发展的程度。新中国成立以来的六十多年,中国的哲学社会科学获得了长足的发展,作为社科大...