第二章 档案检索交互概述
档案检索为档案利用工作搭起了桥梁。充分发挥馆藏档案的作用,为社会主义各项事业服务必须做好档案检索工作。纵观目前各档案馆(室)检索工作情况,虽然检索人数逐年增加,但检索满意度却持续不高。利用者查不到、查不全所需档案信息是常有的事。需要指出的是,本文所论述的交互只限于狭义的档案检索里的交互,即具体档案查找过程中所涉及的交互。
第一节 档案检索基础。
一、档案检索的含义及意义。
所谓档案检索,广义上是指对档案材料中能表征档案内容特征和形式特征的情报信息进行描述和揭示,使之有序存储,编制检索工具,建立档案信息检索系统,并按照一定的方法查找和利用档案材料的过程,即包括存储和查找两个过程。狭义上仅指档案的查找过程。
档案检索是一项复杂的系统工程,它的实践性与科学性皆强,并且涉及多个领域知识。档案数量之巨大,增长速度之惊人使得我们要从中迅速、准确、完整地查找出所需信息内容犹如大海捞针、沙里淘金般艰难,必须依靠科学的理论、方法和手段才能实现。只有档案检索工作做好了,馆藏档案的作用才能充分发挥,才能更好地为社会主义各项事业服务。首先,档案的价值必须通过档案利用才能实现,档案的利用与档案检索有着千丝万缕的关系。通过科学的检索手段和方法,人们可以快速、准确地找到所需的档案资料、以便利用。其次,档案检索工作的地位不可替代,它贯穿于整个档案管理工作过程,是档案管理工作中的必要环节。档案检索是档案管理活动中的一项独立环节,它有着自身特有的地位以及自身独特的作用。一方面,档案检索属于档案基础业务工作的范畴,另一方面,档案检索又属于档案利用服务工作的范畴。最后,档案检索可以衡量档案档案馆(室)的工作水平到底如何。档案检索工作的目的是解决档案数量激增和人们准确、及时获取档案信息之间的矛盾。一般评价档案(室)的业务水平是好还是坏,总是以提供档案材料的及时、准确程度为标志。
二、档案检索系统组成要素。
(一)档案资源。
馆藏档案资源在档案检索过程中扮演着重要角色。首先,丰富的馆藏资源是档案馆开展档案检索工作的前提和基础。档案检索系统的检索资源大多来自馆藏资源。虽然随着人类社会实践活动的持续进行,每时每刻都会形成新的档案,保存入各级各类档案馆中,但利用者的需求是无限的,且呈现多元化趋势,因此,档案检索工作的顺利开展的前提条件是档案馆不断地增加馆藏档案的数量和种类。其次,档案检索的对象是馆藏档案资源。目前,按照检索结果来看,有档案全文,文件目录,案卷目录以及照片、视频等形式多样的多媒体档案。
(二)档案利用者。
档案利用者是档案检索系统的主体因素,一切档案检索活动均是围绕利用者的特定需求开展的。没有需求,利用者则不会与档案检索系统产生任何关联;没有利用者,档案检索工作的开展则毫无意义。同时,档案检索和利用效果如何,档案馆信息服务能力也是由利用者评定的。目前,档案利用者范围逐渐扩大,已由最初的组织用户发展为个人用户,社会公众也成为了档案重要的利用群体。需要指出的是利用者的社会档案意识的高低、需求表达能力、知识结构与认知能力如何以及档案检索心理是否良好在一定程度上直接影响着档案检索效果。
(三)档案检索专职服务人员。
档案检索依据有无档案检索专职服务人员参与的方式可以分为委托式检索和非委托式检索。委托式检索,利用者将检索要求委托给档案检索专职服务人员,由他们借助检索工具检索,并将检索结果反馈给利用者;反之,非委托式检索则是利用者直接借助检索工具进行检索,查找所需档案,例如利用者登录档案网站检索档案。可见档案检索专职服务人员并不是档案检索系统组成因素的必要成分。
在委托式检索中,档案检索专职服务人员起到辅助与指导作用。可见档案检索专职服务人员的业务水平在很大程度上决定着委托式检索的效果。
(四)档案检索环境。
档案检索环境是一个宏观概念,它囊括了与档案检索全过程有关的各方面因素,不仅包括政治环境还包括经济环境以及文化环境等。国家所奉行的政治方针以及经济政策对社会科学文化发展的影响是巨大的,而社会科学文化地发展会影响人们对档案的利用需求。
三、档案检索效率。
检索效率是指在检索过程中满足利用者需要的全面性和准确性程度,它是衡量检索系统性能以及每一个检索过程质量高低的最基本的指标。
对档案检索系统而言,检索效率的优劣是评价档案检索系统质量的重要标志;对利用者而言,档案检索效率由检全率和检准率来表征。其中,检索结果中包含的相关文献与全部相关文献的百分比代表检全率;检索结果中包含的相关文献与检索结果包含的全部文献的百分比代表检准率。
检全率和检准率可量化,也非常直观,研究表明,检全率和检准率二者间存在着互逆性,即检全率的提高会造成检准率的降低,反之,检准率的提高会造成检全率的降低。这是因为检索是从既定的信息集合(数据库)中提取出与利用者需求表达最相关的过程,此过程包括信息的匹配与信息的过滤过程。当为了提高检全率而放宽检索提问请求,扩大检索范围,使用一些模糊的检索表达式,信息集合(数据库)中就会有更多记录匹配成功,这必定会检出一些相关度较低的信息,从而降低了检准率,导致利用者进行二次人工筛选。反之,如果要提高检准率,选用精准、专指度高的的词作为检索提问时,则需要过滤更多与检索提问请求相关度低的信息,检索出的信息数量比较有限,这就直接影响了检全率。
每一次检索总会存在着误差,检出一部分相关程度很低的信息,同时漏检掉一部分有用的信息。对于每一次具体的检索过程,如果一味追求检全率而忽视检准率,其结果将不尽如人意,反之亦然。评价每一次检索效果,单独使用两指标中的任何一指标也不能全面反映其效果。因此,在实际工作中,必须将两者同时使用,综合权衡,才能客观反映一个检索系统的过滤能力,同时要时刻注意二者之间相互制约的关系,从利用者实际需求与检索系统特点两方面出发,寻求检全率与检准率之间的恰当比例。
第二节 档案检索交互的含义。
档案检索是实践性、目的性很强的工作。利用者是在档案需求动机促发下采取检索档案这一行为过程的,它的实现必须通过交互的形式才能完成。所谓交互,是指发生交往和联系的过程。对于档案检索来说,交互是指利用者产生档案利用需求,进而直接或间接地向档案检索系统提出检索要求,档案检索系统在接收到检索信号后对此作出反应,将检索结果反馈给利用者的过程。成功的检索意味着档案检索系统反馈的检索结果是利用者所需的全部或部分档案信息,失败则意味着反馈的是无关的档案信息甚至是零信息。
成功的检索是每一个利用者和档案工作者共同期待的。事实上,一次性成功的档案检索并不普遍存在。这是因为档案检索的交互是一个十分复杂的过程。档案特征因素、利用者因素、档案检索专职服务人员因素、档案检索系统等因素都会直接或间接地影响甚至制约其过程。在整个档案检索过程中,利用者与检索系统的交互关系突出表现为二者是持续不断的双向交流过程。
第三节 档案检索交互过程。
档案检索的交互过程包含了利用者档案利用需求产生、档案利用需求表达、制定检索计划和方案、首次档案检索发展、检索结果进行评价、结果反馈与检索策略调整的反复调节等过程。
一、档案利用需求产生过程。
"需要"这个词源自心理学,它是指个体处于缺乏状态时而出现的体内自动平衡倾向和择取倾向.人类是具有主观能动性的生物。在日常行为中,人类个体经常处于某种缺乏状态,必须通过采取一定的行为来满足此缺乏的心理倾向。这便是需要的产生,需要往往指向特定目标。人们为解决社会实践活动中的实际问题而产生的对获得与档案有关的要求和欲望,这便是档案利用需求,包括对档案信息内容、档案信息载体、档案信息服务的各种期待。
在社会实践过程中,档案利用者的主体是由需要利用档案的个人及单位构成的。他们在需要档案资源却没有得到时便会产生利用需求。与人类其他行为动机类似,档案检索行为动机也来自人的实际需要,如查考工作依据、获取法律书证、提高知识素养以及拓展见闻等.尽管档案检索的需求动机是多种多样、千差万别的,但归结起来主要有内部因素和外部因素。
所谓内部因素,指的是档案利用者自身需要相关档案资源。在具体的档案工作实践中,内在需要一般表现为 3 个方面:一是出于好奇心的需要;二是处于胜任工作的需要;三是出于互惠、沟通信息的需要。
所谓外部因素,指的是档案利用者现有储备信息缺乏,无法满足其需要,必须从相关档案资源中获取。总体来说,档案利用需求的产生是内在因素和外在因素结合的共同结果。
在日常的工作和学习生活中,人们经常处于缺乏档案资源的状态,因而档案的利用需求是普遍存在的。
二、档案利用需求表达过程。
利用者产生利用需求动机后,就会在脑海中形成对这种需求的认识。通常此认识有两种状态。一种是潜意识认识,另一种是明确认识。也就是说利用者对利用需求并不一定能全面、准确地认识,它只是利用需求的一种心理认知状态。而利用需求的表达是将自身主观对利用需求的认识通过一定的方式,用概括性的语句或一些高级的语义结构表达出来。因此,档案利用需求的表达是利用者通过与档案检索系统的交往和互动,将映射在人脑中对有关档案利用需求认识的信息转化为确切的文字或者符号,进而转变为检索提问或者说提交检索提问表达式,这实际上是档案利用需求的外显过程。至此,利用者的档案利用需求得以表达。
档案利用需求的表达途径和方式是多种多样的,既可以向档案工作人员面对面地表达,也可以远程表达(向档案检索系统直接提交检索提问);既可以口头表达,也可以转化为文字后表达。
三、制定检索计划和方案。
在利用需求表达初步形成之后,利用者就要为接下来的检索行为制定周密的计划和方案,内容大致包括:(1)检索目的:是为了研究课题,还是为了查考工作,或是为了普及知识、拓展见闻等;(2)检索目标:是希望达到更高的检全率而适当降低检准率,还是希望达到更高的检准率而适当降低检全率;(3)检索范围:检索哪种类型档案,检索的时间和地区跨度,是否是专业范围内的档案材料等;(4)检索途径:委托式检索还是非委托式检索。通常利用者会事先尝试登录本单位或本地区档案网站检索所需档案,即非委托式检索,如果利用需求没有被满足则可能进行委托式检索。(5)检索系统的选择:手工检索系统还是其他检索系统。
四、首次档案检索行为的发展过程。
档案检索是一种信息符号的接收、反馈与转换的过程,从利用者产生需求动机开始,到首次反馈检索结果为止是成链式结构的:利用者产生需求动机 A1后,会在大脑中将客观需求整理成简单明了的需求表达 A2 直接向检索系统提交;或者将 A2 传递给档案检索专职服务人员,档案检索专职服务人员接收到A2 后,会进行一系列的心理活动,将 A2 重新整合、转换成便于检索的需求表达 A3 提交检索系统;之后检索系统首次反馈检索结果 A4,A4 可能需要调取案卷查看或者直接在线浏览。
五、检索结果进行评价过程。
利用者是具有主观能动性的个体,在档案检索利用过程中,利用者并不是被动地接受档案信息部门提供的档案信息,而是主动地、有选择性地进行取舍。在首次检索结果 A4 输出之后,利用者会随即访问每条记录的具体内容,并从自身的认知角度对检索结果与利用需求的相关性进行判断、评价、取舍。
A4 可能是相关与无关相混杂的信息集合,也可能全是无关的信息,甚至是无任何信息。这对利用者来讲有三种情况:一是查全了所需信息,即完全满足需求动机;二是查到部分所需信息,即部分满足需求动机;三是查无所需信息,即没有满足需求动机。信息检索系统从理论上讲,应检索出与需要查找的内容有关的所有信息,同时过滤掉所有的非相关信息。这种状态称为"理想检索".上述第一种情况即是理想检索。理想检索意味着利用者预期的检索目标达到了预期目标,能满足实际需求,利用者则会终止检索行为,此次档案检索活动结束。当然,利用者也会因为个人主观方面的原因,无论利用需求是否得到满足,在检索交互任一环节放弃检索行为,这也意味着档案检索活动的终止,在此不作讨论。
六、结果反馈与检索策略调整的反复调节过程。
事实上,由于各种原因存在,通常情况下,首次检索结果与预期检索目标是存在偏差的。也就是说,理想检索是难以实现的。
如果 A4 是部分所需信息或者是错误的信息,甚至是零信息,即上述第二、第三种情况,则利用者通常会进行再次搜寻。首先,利用者会自行或者与档案检索专职服务人员共同修正需求表达 B1;然后开展第二次档案检索 B2;查找出所需档案,结束第二次检索 B3.如果仍然无果,则需要重新开始另一轮的档案检索。随着检索行为的继续深入,利用者对利用需求的认识也会由最初的模糊状态逐渐清晰化,随之修改需求表达式也是常有的事。同时,在整个检索过程中,利用者的需求并不是固定不变的,会随着周围情境的变化而动态性地变化着,这时利用者就有可能重新调整检索策略。如此不断地调整检索策略和修改需求表达,反复提交检索提问式,并对每次反馈得到的检索结果进行相关性评价后最终取舍,直至检索行为结束。利用者也可能自认为没有更多的所需信息而放弃进一步的检索。
综上所述,可以看出利用者与档案检索系统的交互是双向交流的过程,最理想的是一次性往返过程,但更可能的是多次的循环过程,直至需求动机得到最大程度的满足。
第四节 档案检索交互的意义。
在特定的数据库中查找所需的信息是档案检索的原理,其核心是将利用者表达出来的档案需求与特定数据库中存储的档案信息进行匹配、比较与筛选。
档案检索是一种交互行为,是利用者向档案机构提出档案需求,档案机构传递与反馈档案信息的过程。此交互过程中呈现的往复性特征说明在整个档案检索过程中,利用者是主动分析、评价档案检索结果并选择性地接受和利用档案信息。具体而言:利用者在检索前、检索中、检索后各阶段对档案信息有不同理解,他们会根据实际需求对检索结果的相关性、真实完整性以及易用性进行判断与评价最终选择,以使检索出的档案信息与社会实践活动相适配。
经过分析,我们不难发现,对于利用者和档案检索系统来说,档案检索的交互都是有意义的。档案检索的交互是评价检索效果、检验检索工作质量、完善和优化检索系统的必要条件。通过交互,整个检索系统处于工作状态中,从而保证了双方信息的双向流动。研究档案检索的交互有助于发现检索过程中各环节的不协调之处,从而有针对性地加以调整和改进,达到提高检索效率,最大程度满足利用者需求的目的;有助于档案工作者深入、透彻地理解利用者检索行为的主观性和判断过程,从而做出决策,提升档案服务工作水平;有助于利用者在检索档案过程中省时省力,提高检索满意度。
第五节 档案检索交互与信息检索交互的区别。
作为信息家族成员之一的档案信息,在交互方面,档案检索既继承了一般信息检索所具有的共性,同时由于其原始记录性、确定性、历史性、社会性等特征,档案检索与一般信息检索存在着区别,具体表现为:
(一)检索结果的相关性更强。
信息检索是相关检索,相关性是信息检索的核心。所谓相关性,实际上是一种匹配关系,是检索系统针对用户的检索提问从数据库中匹配与之有关的信息并检出。换句话说,相关性是评价用户检出的信息与所查询的信息之间吻合程度的指标。快速、准确、系统地检索出与用户查询需求相关的信息,同时尽可能减少非相关的信息被检出是任何一个信息检索系统设计的主要目标。与一般的信息检索相比,档案检索结果的相关性更强。
众所周知,原始记录性是档案自然形成过程中与生俱来的固有的本质属性,由此引申出的真实性、完整性、确定性,这四个属性是档案区别图书、资料等相近事物的依据。为全面、真实地反映和维护档案这些与生俱来的特性,必须深化档案形成过程,遵循档案形成规律去管理它们。经过几代档案学人与档案工作者孜孜不倦的努力,总结出了来源原则在档案整理中的核心地位。目前,来源原则被奉为"档案整理的至善原则和一切原则中的最高原则".
来源原则顾名思义,是以档案的来源,即档案形成者为标准对档案进行整理和分类,它要求同一来源的档案不可分散,不同来源的档案不得混淆。
这样,既保持了档案形成过程的连续性与历史性,同时,同一形成者形成的档案集中保存在一起,该形成者活动的历史面貌也得以全面、真实地反映。档案检索经由来源原则指导下的档案整理和分类体系,并以此为基础建立档案检索系统数据库,保证了存储过程中所包含的关键字具有很强的概括档案信息语义的功能,保障了档案检索的相关性。因此,与一般的信息检索相比,档案检索查询结果的相关性更强。
(二)逻辑性更严密。
信息检索包括存储和查找两个互逆的过程,是一项极具逻辑性的系统工程。从本质上说,用户进行信息检索行为是重新获得或恢复存储信息的过程。
因此,从档案角度来说,档案检索是对档案信息固有逻辑属性的追求。
《中国档案分类法》是档案的分类体系的依据。不同历史时期的国家机构、社会组织从事社会实践活动的职能分工是不同的,《中国档案分类法》依据不同职能分工编制分类体系,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系不仅规范且严谨。依据此分类体系对档案进行分类标引,科学而实用。
《中国档案主题词表》是档案主题标引的依据,它按照档案论述和涉及的主题及事物集中档案材料,用规范化的自然语言语词作标识来直接表达档案主题概念,用参照系统间接显示概念之间的逻辑关系。
为保证档案信息的原貌,在检索标识语词的选择上要最大程度地与档案文献的主题内容相适应,其范畴索引参照档案分类法以职能分工为基础对主题词进行归类。
《中国档案分类法》和《中国档案主题词表》的编制与应用充分保障了档案检索的科学性、逻辑性。
档案检索是信息检索的一种,上述两方面的特点,仅仅从特别明显的个性角度进行分析,其他的个性在这里不一一而述。例如,由于档案某些特性的存在,档案检索存在着不确定性,主要体现为利用者对检索对象状态的不确定性和对检索过程的不确定性。利用者检索对象状态的不确定性是指利用者不能确定所需查找的档案是否在该馆馆藏范围内,是否涉密,涉密的档案是否达到开放年限等。检索过程的不确定性是指档案检索是试探性的检索,档案检索系统不处理原始的档案信息以及利用者原始的查询需求,它只提供信息表示与查询表示的关系。
第六节 档案检索交互表现形式。
如前所述,档案检索依据有无档案检索专职服务人员参与的方式可以分为非委托式检索和委托式检索。因此,在档案检索交互中,根据档案检索专职服务人员是否参与检索过程,可以把交互类型划分为直接交互和间接交互两种。
一、直接交互。
直接交互是利用者间接参与的档案检索行为,其中并无档案检索专职服务人员的参与。
直接交互的特点是:
1、反馈性能好。在直接交互中,利用者是信息的输入方,检索系统是信息的输出方,形成信息流从输入方到输出方,再从输出方到输入方的双向流动,可以看出二者始终保持着不间断的关系。这样,利用者可以快速、准确地掌握到检索结果,还可以边查、边看、边思考,随时调整检索策略。
2、利用者自由选择性强。在直接交互中,利用者可以自由地输入检索提问式,广泛地浏览各类数据库,使用各种检索工具,以此筛选出所需档案。
3、利用者对检索结果的信任度高。有研究表明,多数情况下,利用者往往会对检索人员的服务态度以及服务的质量进行猜测。由于直接交互过程中,利用者与检索系统是直接交流的,并未受到第三方的干涉,因此对检索结果的信任度高,即使是查无结果,在心理上也是易于接受的。
5、对利用者检索能力要求高。由于没有专职检索人员的协助与指导,在检索过程中需要利用者自行解决所遇到的问题,这就需要利用者有较高的检索能力。
6、检索效果较差。一般来说,利用者对检索系统不熟悉,对如何使用检索工具知之甚少,因此查阅能力较差,检不全、检不准的现象时有发生。
7、不利于及时发现检索工作出现的问题。直接交互中缺少利用者与档案工作人员的沟通,对于利用者的需求特点、检索习惯、检索效果不能及时发现并纠正。
二、间接交互。
间接交互是指利用者间接参与的档案检索,是在档案检索专职服务人员的帮助和指导下进行的检索行为。
间接交互的特点是:
1、对利用者的检索能力无要求。因为有专职检索人员的协助,所以利用者只需准确表达出自己的需求即可。
2、检索效果较好。一般情况下,专职检索人员具有丰富的检索经验,具备熟练的检索技能,能较快、较准地理解利用者需求,系统、准确地提交检索提问,并能灵活地调整检索策略,检全率和检准率较高。
3、反馈性能差。由于间接交互中增加了检索专职服务人员这个信息链,因此在检索过程中信息的流动与反馈是接力式传递的,分三个阶段进行。第一阶段是提问。利用者向档案检索专职服务人员提出检索需求;第二阶段是制定检索策略。档案检索专职服务人员将接收到的检索需求转换为自己理解的检索信号后向利用者征求意见;第三阶段是输出检索结果。档案检索专职服务人员将系统初步检索结果反馈给利用者并让其作出评价,根据其意见调整检索策略等。如此反复,直到检索行为结束。这种接力式传递方式,对于利用者来说,反馈性能差,检索策略往往不能及时、灵活地调节。
4、利用者对检索结果的信任度低。在间接交互中,检索系统对利用者可以不开放,这样利用者对检索系统的真实情况无法客观地了解,加上主观因素存在,利用者往往不大信任检索结果。尤其在遭遇拒借时,利用者反抗情绪强烈,不信任心理油然而生,影响了档案馆形象,不利于档案事业长远发展。
综上所述,两种交互方式各具特色,各有千秋。利用者要结合自身情况选择合适的交互方式。
第三章影响档案检索交互的因素分析在需求动机的促发下,利用者进行了档案检索行为,他们检索的目的十分明确。对他们而言,只要查到、查全所需的档案,检索设施是否先进以及检索环境是否优良都不是他们关注的。而检索系统通常具备一定的过滤功能,即指检索...
第一章绪论。第一节研究背景物质,能源,信息是国际公认的主宰人类基本活动的三大要素,作为家庭成员之一的档案信息,它是伴随着人类的社会实践活动产生和积累的,并因其特有的原始记录性、查考备查性被保存在各级各类档案馆(室)内,以便日后利用。社...
结语随着时代的发展以及信息技术的进步,传统的档案手工检索逐渐被淘汰,取而代之的是档案计算机检索。这不仅节约大量的人力物力,还很大程度上提高了档案检索效率。目前,政务信息公开与档案开放力度不断加大,各级各类档案馆检索人数整体呈上升趋势。我...
第四章减少档案检索往复交互的对策档案的利用是档案价值实现的先决条件,档案检索关乎档案利用的顺利进行。当前,随着政务信息公开以及国家各项惠民政策的落实,越来越多的人主动走进档案馆了解和利用档案,我国各级各类档案馆(室)迎来了档案检索的新时...
摘要档案是信息家族的重要成员,随着社会的发展以及人类各项实践活动的持续进行,档案数量与日俱增。如何从卷帙浩繁,形态多样的档案中获取所需的档案文献或信息是目前人们遇到的棘手问题。档案检索工作正是在人们快速、精准的档案信息需求与档案信息指数...