语义学论文第八篇:多学科维度词汇语义关系的研究
摘要:词汇语义关系研究是语义学研究的重点, 本文综合了近年来图情学、心理学、语言学领域对词汇语义关系所做的研究, 并选取了其中有影响力的研究成果进行分析。
关键词:词汇语义关系; 图情学; 词汇启动; 计算语言学;
词汇语义关系研究一直是语义学的研究重点, 特别是近年来, 语义关系的研究在语义推导, 知识组织系统操作, 信息检索等领域越来越显示出重要的意义。Lakoff (1987) 将那些有相似特征的词汇归为“经典”范畴, 其中最为普遍的即为同义 (synonymy) , 反义 (antonymy) , 上下义 (hyponymy) 和整体与部分 (meronymy) 的关系。而不具备相似特征的词汇被归为“非经典”范畴。本文将从多个学科维度对近年来国外词汇语义关系的研究进行梳理, 呈现词汇语义关系分类的新特点, 从而为自然语言处理, 语义学研究等提供资源。
一、图情学中的词汇语义关系研究
在图情学领域, 词库和专业术语数据库的开发使用比较早。词库有利于检索和索引语篇文件。词库中的词汇有的是靠从某一领域的文献中直接搜集整理而成, 有的是由权威机构指定为索引或搜索词汇。词库中使用的词汇语义关系主要有以下标准:同义词或近义词 (Used for) , 上义词 (BT, broad term) , 下义词 (NT, narrow term) , “相关”关系 (RT, related term) , 指既不是同义词, 也不是上义词和下义词的词汇关系。总的来说, 同义、上义和下义用来指经典词汇关系, 而“相关”关系主要是非经典关系。
在图情学领域对词汇语义关系类型有所贡献的学者早期有Willets (1975) , Raitt (1980) 和Lancaster (1986) , 近期有Vickery (1996) , Green和Bean (2001) 。其中Neelameghan (2001) 的列表最为综合, 几乎包含了大部分学者列表的关系类型。以下着重介绍Neelameghan的词汇语义关系列表。
表1 Neelameghan的语义关系列表 (2001)
二、Neelameghan的词汇语义关系研究
1976年Neelameghan和Ravichandra提出了一个词汇语义关系的综合列表, 包含29种关系, 2001年Neelameghan进行了微调, 将关系拓展至31种。他的列表包括表3所涵盖的标准关系, 同时也包括一些其他关系, 如“处所”, “活动顺序”, “同时发生的事件”, “特殊场景中活动的两个人”等。他的列表中包括一些非常概括性的关系, 比如“实体之间的相互关系”, “场景或条件以及在该场景或条件会发生的事情”。这些概括性关系是一种尝试, 力图把一些不属于任何关系的类型, 但确实存在一定关系的词对归纳起来。表4详细列出了他的语义关系类型 (2001:190-193) , 其中的例子都是宗教用语。 (见表1)
Neelameghan的列表包括了一些经典关系, 如同义和反义关系, 更多的贡献在于“相关”关系, 但有些关系类型比较模糊, 需要进一步细化。
图情学对非经典语义关系的分析是几个学科中最详细的。尤其是Neelameghan的列表综合性最强。很多图情学的研究者的关系类型都已涵盖其中, 而且, 很多其他学科讨论的非经典关系类型也涵盖在其中。唯一的问题是图情学的关系类型是没有结合语境的, 只是对于索引和搜索是有效果的。
三、心理学的词汇语义关系研究
心理学界对词汇语义关系的研究多数是在词汇启动 (Priming) 研究领域。研究者们很长一段时间遵从的是相关关系 (associative relations) 和语义关系的二分法。语义关系主要包括上位关系, 从属关系和对等关系等经典关系。而相关关系最初被认为是源于共现的频率, 是和人类头脑记忆联系机制相关的, 分类不够具体化。20世纪90年代以后, 经典关系仍占主导地位, 但非经典语义关系类型的研究也日渐增多。比较有代表性的如Hodgson (1991) , 他认为词汇相关性不是由于共现频率, 而是因为词汇之间的关系。McRae和Boisvert (1998:569) 指出词汇相关 (word association) 的概念“产生很多不规则的答案”, 并列出了10种不同关系类型的例子。在众多研究者中, Chaffin和Herrmann的研究最为详尽。
四、Chaffin和Herrmann的关系研究
Chaffin和Hermann (1984) 研究并列出了最为详尽的语义关系列表。他们摒弃了二分法, 使用了一种意义推定实验来对31种未经证明的语义关系进行推定。这个实验中, 参与者要将31张卡片分别归入相似关系中。每一张卡片包含5种该关系的例子。这些未经证明的语义关系是总结自前期的分类框架, 而且包括了其他语言学家和哲学家的分析结果。Chaffin和Herrmann使用了全部31种关系, 这个数字远大于其他研究者, 并且将这些关系分成了下面的5组 (1984:140-141) : (见表2)
实验表明人们对经典语义关系如“对比”, “相似”, “类别包含”以及“部分与整体”关系的认知是不存在困难的。与其他四个都不同的格关系, 需要被单独区别出来。格关系以及“特性相近”、“必然属性”都属于非经典关系。
他们还将关系集进行进一步对比、组合, 归纳了如下的三种关系:
1. 对比 (对比) /非反义 (其他四组关系集)
2. 逻辑 (相似, 类别包含) /语用 (格, 部分/整体)
3. 包含 (类别包含, 部分/整体) /非包含 (格, 相似)
心理学词汇启动领域的研究一直依据相关关系/语义关系的两分法, Chaffin和Hermann使用了跨学科的方法来研究关系类型, 做到了详尽化, 但是忽略了以原因为基础的关系类型。同时心理学词汇启动研究证明经典的和非经典的词汇关系都可以促使启动的出现, 这表明对两种关系类型的划分是恰当有效的。
五、语言学和计算语言学的词汇语义关系研究
语言学界对语义关系的研究多集中在经典关系范畴, Cruse (1986) 和Murphy (2012) 的研究都体现了这一点。只有Fillmore (1968) 的研究是一个特例, 他的格关系关注的是非经典关系。他后来把理论发展成框架语义学 (1982) , 并将实践运用于FrameNet项目上 (Fillmore和Baker, 2001) 。
六、Cruse和Murphy的研究
Cruse (1986) 对语义关系研究领域贡献很大。他深入分析和定义了几种经典关系:上下义, 近义词, 反义和整体与部分关系, 他将这几种关系归入四种理论关系型:身份 (同义) , 包含 (上下义, 有时包括整体与部分关系) , 重叠, 相悖 (有时是反义关系) 。与重叠相对应的关系是兼容 (狗/宠物) , 与相悖关系相对应的是不兼容 (狗/猫) 。
Cruse的研究主要是经典关系, 但是也提到了两种与格关系类似的关系, 他称之为“零转换同源词” (zero-derived paronymy) 。例如工具格 (“挖/铁锹”或者“扫/扫帚”) 和目标格 (“驾驶/交通工具”或者“骑/自行车”) 。他注意到在工具格里, 对名词的定义很可能要提到动词, 而在目标格里, 对动词的定义很可能包含名词。Cruse认为这些关系不是“真正”的关系, 而仅仅是“虚假”关系, 因为所包含的词的属性是不一样的。Cruse还定义了一种非经典关系, 叫做“内部包含” (endonymy) , 这种关系指“一个词汇的意义包含另一个词汇意义”, 比如“手和手套” (1986:123) 。
Murphy (2012) 对语义关系的研究比较新, 但基本针对的是经典关系, 包括同义词、反义词、上下义和整体与部分。她采取多学科的视角, 融合了心理学、人类学和计算语言学。和Cruse一样, Murphy关注最多的是语义关系中的一些中心关系, 即“纵聚合”关系。在“纵聚合”关系中的词汇必须属于同一词汇 (语法) 类别, 并且共享某种范式。这个范式可以是语义的 (比如说颜色词) , 也可以是屈折形式或形态学的。纵聚合关系是和横组合关系相对的。Murphy也指出在她的分析中没有考虑格关系, 但没有指出其中原因, 只隐含地表示格关系不属于“纵聚合”关系。
七、Fillmore的研究
Fillmore 1968年发表了《格辩》的论文, 影响深远。后来他开始致力于FrameNet的建立, 这是一个基于框架语义学的词汇数据网。他的格关系是一个基于词汇语义关系, 围绕句子动词的句内具体关系。
图情学研究者们在他们的研究中已经在试图突破经典关系, 他们加入的关系类型与格关系非常类似, 只是没有使用这个名称。唯一区别是图情学的类似格关系是跨句使用的, 而Fillmore的是句内使用的。另外一个区别是图情学的类似格关系是适合于通用文本的。而Fillmore的格关系所涉及的词对是依赖具体文本的, 尤其是包含这两个词的句子。他的格关系是词汇之间的语法关系而不是纯粹的词汇关系。虽然如此, 但关系类型是通用的。所有这些关系是非经典的。
总之, 在语言学领域, 词汇语义关系的研究关注的是经典关系, 但是Murphy提供的多学科调查包括了非经典关系。Cruse也简单提到了一些非经典关系类型, 但是将他们认为是“虚假”关系, 因为相关词汇不属于同一类别。综合来看, 在语言学研究领域, 经典关系一直是重点, 但是越来越多的非经典关系也开始被使用。
以上从图情学、心理学和语言学对词汇语义关系的研究我们发现, 各个学科采用不同的研究方法, 分析总结了各自的词汇语义关系列表。列表中对经典关系都有所涉及, 而对于非经典词汇语义关系的分类更值得关注、更具有应用价值。
参考文献
[1]Chaffin, R., &Herrmann, D.The similarity and diversity of semantic relations.Memory and Cognition, 1984, 12 (2) :134-141.
[2]Cruse, D.Lexical semantic relations.Cambridge, England:Cambridge University Press.1986.
[3]Fillmore, C.The case for case.In E.Bach, &R.Harms (Eds.) .Universals in linguistic theory.New York:Holt, Rinehart&Winston, 1968:1-88.
[4]Green, R., &Bean, C. (eds.) .Relationships in the organization o f knowledge.Norwell, Mass.:Kluwer Academic Publishers.2001.
[5]Hodgson, J.Informational constraints on pre-lexical priming.Language and Cognitive Processes, 1991, 6 (3) :169-205.
[6]Lakoff, G.Women, fire and dangerous things.Chicago:University of Chicago Press.1987.
[7]Lancaster, F.W.Vocabulary control for information retrieval.Arlington, VA:Information Resources Press.1986.
[8]McRae, K., &Boisvert, S.Automatic semantic similarity priming.Journal of Experimental Psychology:Learning, Memory and Cognition, 1998, 24 (3) :558-572.
[9] Murphy, M.L.Semantic relations and the lexicon.北京:世界图书出版公司, 2012.
[10]Neelameghan, A.Lateral relationships in multicultural, multilingual databases in the spiritual and religious domains:The OM Information Service.2001.
[11]Raitt, D.I.Recall and precision devices in interactive bibliographic search and retrieval systems.Alsib Proceedings, 1980, 37:281-301.
[12]Vickery, B.Conceptual relations in information systems[letter to the editor].The Journal o f Documentation, 1996, 52 (2) :198-200.
[13]Willetts, M.An investigation of the nature of the relation between terms in thesauri.Journal o f Documentation, 1975, 31:158-184.
点击查看>>语义学论文(精选论文8篇)其他文章