普通语言学论文

您当前的位置:学术堂 > 语言学论文 > 普通语言学论文 >

语料库驱动的短语学研究探析

来源:河南师范大学学报 作者:孙海燕
发布于:2018-12-24 共8746字

  摘    要: 语言哲学的一个主要议题是对意义的研究, 语料库语言学认为意义蕴含于语言使用之中, 在意义解读中必须考虑词语所出现的语境。在哲学研究中理性主义强调逻辑推理的作用, 而经验主义认为构建理论应建立在客观事实的基础上。语料库驱动的短语学研究关注对真实语料的考察, 探索语言使用中的意义单位。意义单位一般由具有确定意义的短语来实现, 短语被视为词汇和语法的界面。在语料库语言学的研究框架中, 意义单位是词汇和语法共选关系的体现, 形式和意义是密不可分的整体。

  关键词: 短语学; 语料库; 哲学; 意义单位;

语料库驱动的短语学研究探析

  Abstract: The study of meaning is one of the central issues in the philosophy of language.Corpus linguistics maintains that meaning lies in the use of language, and context should be taken into account in the interpretation of meaning.In philosophical study rationalism stresses the role of logical reasoning, while empiricism maintains that the construction of theory should be based on authentic facts.The corpus-driven study of phraseology observes the authentic data to explore the unit of meaning in language use.The unit of meaning is realized by the phrase with unambiguous meaning, and phrase is regarded as the interface between lexis and grammar.Under the framework of corpus linguistics, the unit of meaning reflects the co-selection of lexis and grammar, integrating form and meaning.

  Keyword: phraseology; corpus; philosophy; unit of meaning;

  语言哲学对语言意义的关注由来已久, 意义的解读方式和哲学流派的发展有着深刻渊源。20世纪以来语言哲学研究主要有三个模式, 一是以逻辑经验主义为代表的句法语义分析模式, 二是以言语行为理论为代表的语用学分析模式, 三是以乔姆斯基为代表的理想语法构造模式。随着句法分析模式走向衰落, 研究者愈来愈重视语言在使用中的意义。弗斯认为意义体现于它在语言中的使用, 词语的意义不是封闭自足的, 词语意义会影响出现于同一语境的其他伙伴, 语境论根据语境因素考察语句的意义, 而不将意义研究囿于语言的逻辑关系[1]。语境论思想为后来的学者带来了深刻的启示, 语料库语言学和计算机技术的迅速发展, 从根本上影响了语言研究的方法和理念, 改变了传统的语言研究范畴, 为探讨语言交际中的意义单位提供了崭新的视角。语料库语言学研究者通过分析真实语言数据, 抽象归纳出语言研究的重要理论。共选理论关注形式和意义的互选关系, 认为词语之间的共选模式体现相应的意义, 某些句法结构常常和特定的意义有关。辛克莱通过观察大量数据对意义单位进行了详尽的阐述, 认为它是词汇和词汇、词汇和语法共选关系的体现[2]。语料库研究支持形式和意义的整体性, 认为意义单位往往由整体性短语来实现。我们在研究语言时, 不能孤立地研究语言的形式, 而不考虑其意义和功能, 语言的意义、结构和功能是不可分割的整体。语料库驱动的短语学研究认为, 短语单位表达了较为完整的意义, 是语法与词汇、语义和语用的界面, 这一视角为语言研究提供了新的范畴。

  一、经验主义和理性主义之争

  经验主义和理性主义是哲学领域中的两大理论阵营, 二者的分歧对语言学研究产生了深刻影响。在认识的起源上, 理性主义强调理性和推理的作用, 认为具有普遍性的知识是先天的, 可以经过严密的逻辑推理而得到。经验主义则认为经验是一切知识的来源, 强调经验的作用以及大脑进行概括抽象的能力, 贬低理性认识的作用[3]。经验主义与理性主义之争渗透到人类的各个知识领域, 对语言哲学研究产生了直接影响, 各个流派在对意义的研究中采用了不同方法。在理性主义对意义的研究中, 人工语言学派注重对语言进行逻辑分析, 认为哲学的任务在于对自然语言进行人工分析, 由于语言的意义常常是含混不清的, 有必要进行形式化构造, 通过逻辑组合运算消除语言中的模糊因素。日常语言学派则遵循经验主义, 认为哲学的任务就是研究日常语言的用法, 语言运用中的错误在于人们不了解词语的确切涵义。

  经验主义和理性主义作为哲学的两大主要理论框架, 它们的斗争和妥协伴随着语言学的整个发展历程, 对语言研究和意义解读产生了深刻的影响。英国着名语言学家罗宾斯指出, “经验主义和理性主义的对立, 以不同的形式贯穿整个语言学历史”[4]。20世纪中叶以后, 语言学理论呈现多元化的发展特点, 但理性主义和经验主义仍然呈现对立的局面。以乔姆斯基为首的转化生成语法学派坚持理性主义, 认为人脑天生具有语言习得机制, 语言学家可以依靠自己的直觉来构建语言理论, 他们认为普通人的言语千差万别, 不能成为理想的研究对象。但生成语法有许多问题无法解决, 仅仅依赖直觉或内省数据来归纳理论无异于闭门造车, 而经验主义认为构建理论应建立在客观事实的基础上, 在研究中要尊重从生活中获得的真实语料。随着人类认识的发展和科技的进步, 经验主义学派和理性主义学派的观点也在相互渗透, 两者表现出既对立又统一的一面, 不再是非此即彼的关系。两种学说一方面各自发展, 另一方面不断融合, 在研究视角上既有分歧又相互补充。语料库语言学研究遵循经验主义, 注重可以观察的真实数据, 但并不排除研究者在解读数据时对理性的依赖, 在对意义进行阐述时强调语言的意义存在于使用之中。

  在研究方法上, 人类用于语言研究的方法大体上可以概括为两类:一类是自上而下, 另一类是自下而上。一般来说, “上”指抽象的语言学理论, “下”指真实的语料数据。传统语言学研究多采用自上而下的方法, 根据预设的理论框架来确定研究步骤并搜集证据。语料库语言学则主要依赖自下而上的方法, 通过观察和处理数据来探索理论问题。关于语言学的研究数据, 根据研究者的观察视角可以将数据分为三种类型:内省数据、诱导数据和观察数据[5]。传统语言学研究主要依赖内省数据, 研究者通过思考语言经验构建理论, 研究的焦点是语言中的聚合关系, 将语法范畴作为语言描述的起点和重中之重。在这一研究范式中研究者依赖于自身的语言直觉, 数据由研究者自己提供, 常常因其缺乏客观性而受到质疑。诱导数据主要指研究者通过实地调查所获得的数据, 如实验、问卷调查等方法, 这种数据在实验心理语言学研究中被广泛采用。但是, 它的不足之处在于调查往往花费大量时间和人力物力, 而且诱导数据有时不够真实自然。要想对语言进行科学系统的研究, 必须依赖大量实际语言使用中的语料, 也就是较为客观的观察数据。

  观察数据主要指语言研究者作为观察者所收集的真实语言材料, 数据具有较强的客观性和代表性, 当前语料库研究者所普遍采用的数据属于观察数据。随着计算机技术的发展, 语料库规模不断扩大, 各种先进的检索软件相继问世, 语料库数据在语言研究中的地位愈加重要。语料库语言学一般采用自下而上的研究方法, 通过对真实语言数据的观察来抽象出语言研究的范畴和理论。在语料库语言学领域, 研究者对使用何种数据的态度也不尽相同, 一种观点主张语料库只是众多数据中的一种, 可以和其他数据互相补充, 属于温和的经验主义, 而激进的经验主义认为一切数据都应该从语料库中提取。以辛克莱为代表的语料库语言学家反对在研究中使用内省数据, 认为语言研究应该建立在可验证的语料基础上, 提出要尊重语料库数据, 因为它们是语言使用的原材料[2]。辛克莱强调数据的大数量性, 认为只有通过对海量数据的观察才能得出可靠的结论。大型语料库可以提供频数、概率等统计信息, 我们可以通过观察语言的分布特点考察其核心用法, 传统研究中的一些理念会逐步被新的研究范畴所替代。

  计算机技术的发展使我们可以快速获取大量数据, 通过在线检索大型语料库, 我们能够获得词语的统计信息和出现的语境。在大数据时代语言研究不能依赖直觉, 使用脱离语境的句子, 对语言进行系统的研究必须基于真实自然的语言数据。比如美国当代英语语料库COCA (Corpus of Contemporary American English) , 是当今世界上最大的在线英语语料库 (http://corpus.byu.edu/coca/) , 研究者和学习者可以免费使用, 它所提供的信息使学者能够从多维视角进行语言意义的探究和解读。随着语言研究的深入, 语言分析的自动化程度不断提高, 对于语言直觉的使用和依赖也在逐步减少。在语料库语言学视角下的意义研究中, 我们应该在文本之内寻求证据, 脱离了文本进行意义解读只能是舍本逐末。在构建理论时学者们要分析语料库所提供的真实数据, 根据文本自身形成的参照体系进行意义的解读, 不能脱离语境考察语言的形式, 要综合考虑语言的意义及实现的功能。

  二、共选理论下意义与形式的关系

  现代化技术的发展和大型语料库为语言研究提供了海量数据, 语料库软件可以快速处理各种数据, 研究者不再需要依赖内省数据来考察语言使用的特点。语料库语言学遵循经验主义的实证研究方法, 认为只有通过观察大量数据才能得到可靠的结论。在语料库研究中, 研究者根据从语料库中提取的相关语言材料, 分析语言的形式、意义和功能。语料库检索软件可以快速计算数据信息, 从而揭示语言的核心用法。对意义的研究不仅是语言哲学研究的核心议题, 也是语料库语言学所关注的焦点。关于形式和意义、语法和词汇的关系, 自索绪尔区分聚合和组合的概念后, 语言学界对二者孰轻孰重一直有不同观点。聚合轴强调语法关系的作用, 组合轴则关注词语的横向组合以及这些组合如何实现意义。传统语言学重视聚合关系, 将语法置于语言研究的核心位置, 认为语言由语法与词汇两部分构成, 语法是语言构造的规则而词汇是构建语言的材料, 语法的地位高于词汇。传统语言学将语法和词汇、形式和意义割裂开来, 这种观点受到后来学者的质疑。

  语料库语言学的迅速发展使研究者开始重视组合关系, 通过先进的索引工具和从语料库提取的真实数据, 我们可以观察词语出现的语境, 分析典型的词语搭配和形式特征, 提取语料库中高频出现的短语。语境成为考察意义的重要因素, 语言的意义应该根据语境不同进行相应的解读, 意义不是一成不变的静止状态。在语言交际中, 多数情况下意义并非由孤立的单词来实现, 由多个单词组成的词项是语言交流的基本单位。词项反映了词汇和语法的共选关系, 体现出意义单位的短语取向。在辛克莱的研究体系中, 语言在横向与纵向上具有同等的意义潜势, 其中组合关系是最基础的关系, 主要表现为词语之间的共选关系。他强调形式和意义的对应关系, 认为两者之间从根本上讲并没有区别, “意义和句法是相互联系的”[2], 语法和词汇之间没有泾渭分明的界限, 比如, enjoy后面接动词-ing形式, 这一描述既可以视为词汇特点也可以归纳为语法特征。此外, 形式和意义在实际使用中有密不可分的联系, 语言的结构和功能常常具有对应关系, 某个结构一般实现特定的功能。无论是词语、搭配还是语篇, 意义都存在于一定的形式之中。韩礼德认为, 词汇是最精密的语法, 词汇和语法处于同一个连续统, 都是构建意义的源泉, 两者是不可分割的整体[6]。在词汇和语法的连续统之间存在许多兼有词汇和语法特征的固定或半固定结构, 如多词单位、词汇短语、预制复合结构、词串、公式化序列等。虽然这些术语名称各异, 但指的都是高度惯例化的词语组合。它们兼具词汇和语法特征, 一般具有较为完整的意义。在语料库语言学的研究体系中, 语言的形式与意义、结构与功能是统一的整体, 语言的意义在语言使用中得以体现。

  语料库研究者提出共选理论, 关注词汇与词汇、词汇与语法的共选关系, 认为形式和意义互相选择, 特定的句法结构常常和某些词语有关, 词与词之间的共选模式与意义直接相关[2]。语料库研究支持形式和意义的一体性, 认为意义单位由整体性短语来实现。在分析大型语料库提供的海量语料基础上, 霍斯顿和弗朗西斯提出用型式语法描述英语词汇和语法, 认为词语常常出现在特定的型式之中, 型式和意义没有泾渭分明的界限。在型式语法的框架下, 型式指与词语有对应关系并且能够体现意义的结构, 某一型式一般映射着相应的意义, 具有相同型式的词语共享特定的语义特征[7]。通过观察语料库中的大量实例, 型式语法提取了语料库中高频出现的型式及其意义, 这些研究成果在外语学习中具有较强的实用性。型式语法推动了短语学研究的发展, 短语单位是意义和结构的界面, 我们在使用语言时选择的单位常常是高频短语, 如:to sum up, broadly speaking等, 这些短语作为一个整体直接提取, 具有意义的完整性和无歧义性。这一观点受到心理语言学研究的支持, 霍伊提出词汇触发理论, 认为词汇是复杂的、系统的, 语法是词汇结构的产物[8]。在这一理论中, 搭配被视为构成语言自然性的关键因素, 搭配的产生和词汇触发有密切的关系, 语法和词汇选择都由触发控制, 人们根据头脑中的网络模式运用词语。根据词汇触发理论, 词汇的意义和词汇网络、词语搭配密切相关, 这里的词汇网络和共选理论的主张在实质上异曲同工。

  在共选理论的视域下, 词语的选择会影响在同一语境内其他词的选择, 不仅对词语产生意义上的传染, 而且执行重要的语用功能。语料库语言学在意义解析的过程中, 发现某些词语会吸引具有相似特点的搭配词, 沾染上搭配词的态度意义从而形成特定的语义韵。语义韵通常分为三类:消极语义韵、中性语义韵和积极语义韵[9]。语义韵体现了意义表征中的共享机制, 在一定情景中共现的词语不仅分享相邻伙伴的意义, 而且共同实现某种交际目的, 反映了说话者对讲话内容的情感态度。语义韵拓展了意义研究的范畴, 是语料库语言学对意义研究的重要贡献, 它既考虑了语义特征又关注语用功能, 体现了语言使用者对说话对象的评价意义, 这一发现对外语教学带来了有益的借鉴, 在学习过程中学习者不能局限于掌握词语的语义特点, 而且要了解词语搭配所传染的氛围, 恰当地实现特定话语目的。词汇和典型搭配词共同出现结为伙伴, 传达特定的意义和功能, 我们在储存和提取语言时, 一般以语言中的预制块件为单位, 这些短语在语言交际中具有重要功能, 影响语言产出的流利性、地道性等关键因素。

  三、短语学视野下的意义研究

  对语言意义的研究要涉及多个方面和维度。利奇认为, 一个词汇通常具有七个方面的意义, 包括理性意义、内涵意义、社会意义、情感意义、反映意义、搭配意义、主题意义[10]。对语言意义的解释是一个复杂的现象, 我们在研究意义时要考虑多种因素。在对意义的研究中, 语料库语言学与其他语言学不同, 它不去寻求语言使用之外的理想语言, 也摒弃形式化算法和逻辑公式, 认为语言的意义只能用语言来描述。语言运用是一种社会行为, 语言在交际中呈现意义并在使用中产生各种关系, 比如词语的搭配关系或词类的共选关系, 可以说意义体现于多个词及其语法结构共选构成的短语之中。语料库研究者重视对文本的解读, 认为所有意义和知识都存在于文本之中, 无论是词语搭配还是多词序列组成的意义单位, 其意义都要通过所出现的语境来解释, 根据关联文本来证实, 因此话语的意义存在于文本内部, 不能依赖外部标准来解释或验证意义。

  制约语言使用的主要因素是语法规则和词汇选择。辛克莱提出英语词汇选择的两大规则:开放选择原则和习语原则[2]。开放选择原则认为语篇构成是大量复杂选择的结果, 语言使用者通过语法规则来构造语言。习语原则指语言使用者掌握大量预制短语, 它表明语言使用的短语倾向, 认为词语通过组合在具体的语境中获得确定的意义。词语意义的确立往往依赖于在使用中与其他词语的共现, 即词语只有处于一定的语境中才能消除歧义, 因此对意义的研究不能脱离语境。由词语搭配或多词序列构成的意义单位, 在解读中必须通过所出现的语境及关联文本。意义单位是文本中最小的、单义性的、无歧义的单位, 而单义性是意义单位的基本属性[11]。意义单位是具有结构模式的“词项”, 词项可以是单个词、复合词、短语甚至习语, 以词项为单位更有利于意义研究。在语料库语言学研究中, 文本是意义的唯一来源, 我们无法通过任何外部的标准来确定意义。语言学研究的主要对象是实际的文本或对文本的解释, 对作者意图的解读只能通过对文本的分析来进行。因此, 所有的语言事实和对意义的解释都存在于文本之中。

  如上文所述, 对语言意义的研究应基于语言内部证据, 根据文本包含的语境信息进行释义, 我们无法在语言之外寻求意义的逻辑分析。在短语学对意义单位的研究中, 可以采用语料库语言学方法分析以下内容:词语搭配选择, 类联接选择, 语义趋向分析和语义韵分析。搭配选择指词语的共选关系, 类联接属于语法的共选关系, 语义趋向考察词语的语义特征, 语义韵则关注说话者的态度、评价及功能的实现。这一研究方法兼顾横向的组合关系和纵向的聚合关系, 将语言的意义和功能结合起来。在传统的意义研究中, 研究者主要分析单个词语的意义, 而在语料库研究中意义单位常常由短语来实现。语言使用中许多短语倾向于在特定语境内高频出现, 反映了使用者的态度或评价意义。我们以idea为例, 观察以下例子来归纳它所构成的意义单位:

  1) without the faintest idea 2) I didn’t have the faintest idea

  3) didn’t seem to have the slightest idea4) I haven’t got the slightest idea

  通过分析这些例子, 可以发现节点词左边常出现faintest、slightest这样的形容词。进一步观察可知, the faintest idea常出现在not have the faintest idea这一短语中。如果我们将the faintest idea视为搭配内核, 其左边高频出现的动词是have, 在语义上常和not这样具有否定含义的词语共现, 换言之, 它常常出现在“not have+名词”这一结构中, 表达否定含义。我们可以把“do not have the faintest/slightest idea”当作一个扩展意义单位, 它兼具语法特征和语义信息。扩展意义单位是一个集形式、意义、功能于一体的概念, 不仅涵盖具体的词汇与语法特点, 也包括说话人的意图与态度。语料库驱动的短语学研究表明, 语言的意义和形式不可分离, 无论是语言研究还是二语习得, 在对意义进行分析时都要考察词语的语境, 关注词语构成的高频短语。

  语料库研究方法挑战了以前的语言理论和范式, 对传统的语法范畴提出质疑, 认为词汇和语法、结构和意义之间没有截然界限, 词汇和语法互相选择, 结构和意义互为映射。由于意义单位常常由半固定短语实现, 储存大量常用的短语是地道流畅表达的关键。高频短语具有重要的语用功能, 比如组织语篇、维持社交关系, 它们具有较为完整的意义, 可以作为现成的结构整体提取, 有助于提高语言输出的自然性和流利性, 因此在外语教学中应将常用短语置于核心位置。教师和学生通过提取索引行, 观察词语的搭配、类联接以及语义特点, 结合语境归纳词语所在的意义单位, 这种以学习者为中心的探索式学习模式可以提高学生的语言分析水平。短语学研究成果不仅可以应用于外语教学, 也为翻译研究提供了有益借鉴。意义单位模型的构建对翻译对等关系的探索具有极高的参考价值, 研究者可以基于平行语料库的证据来考察翻译中的对等单位。在关于翻译对等的研究中, 我们不能只关注词语对等, 还要考虑搭配、语义趋向和语义韵方面的和谐关系[12]。语料库研究表明, 节点词倾向于与具有特定语义特征的词语共现, 构成的常用短语反映了说话者的情感态度, 对语言的交际效果产生很大影响。在翻译活动中选择对等单位时应考虑到词语的语义氛围, 考察词语的语境信息及构成的高频短语, 尽量避免原文和译文的语义韵冲突, 力图两种语言在意义的表达和功能的实现上较为一致。

  四、结语

  语料库语言学遵循哲学领域中经验主义的研究路线, 采用自下而上的研究方法, 在研究中以大量自然发生的数据为基础, 通过对真实语言数据的观察来抽象出语言研究的范畴和理论。语料库语言学研究表明词汇和语法是不可分割的整体, 形式和意义互相映射, 在语言使用中人们一般以整体性短语为意义单位。语料库语言学重视对文本的解读, 认为对意义的研究不能脱离语境, 意义在具体使用中得到体现, 语义和功能被视为表达意义的连续体。在语料库驱动的短语学研究框架下, 我们可以从词语的搭配、类联接、语义趋向和语义韵方面分析语言使用中的意义单位, 意义单位反应了词汇和词汇、词汇和语法的共选关系, 经常由固定或半固定短语实现。在共选理论视域下, 短语单位体现了意义和结构的映射关系, 是词汇和语法、语义和语用的界面。短语学研究表明掌握大量短语可以提高语言表达的地道性和流畅性, 二语学习者储存丰富的短语有助于成功实现交际目的。语料库语言学以其可靠的研究方法和数据, 在对意义的解读中提出了新的研究范式, 推动了短语学的发展, 丰富和开拓了语言学研究的视野。

  参考文献:

  [1]Firth, J.R.Papers in Linguistics:1934-1951[M].London:Oxford University Press, 1957.
  [2]Sinclair, J.Trust the Text[M].London:Routledge, 2004.
  [3]陈勇.论经验主义和理性主义之争——关于西方语言学研究中的认识论[J].外语学刊, 2003 (3) :57-62.
  [4]罗宾斯.简明语言学史[M].许德宝, 等译.北京:中国社会科学出版社, 1997.
  [5]Widdowson, H.The limitations of linguistics applied[J].Applied Linguistics, 2000 (1) :3-25.
  [6]Halliday, M.A.K.An Introduction to Functional Grammar[M].London:Arnold, 1994:15.
  [7]Hunston, S.&Francis, G.Pattern Grammar:A Corpus-Driven Approach to the Lexical Grammar of English[M].Amsterdam:Benjamins, 2000:252-253.
  [8]Hoey, M.Lexical Priming[M].London and New York:Routledge, 2005.
  [9]Stubbs, M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers, 1996.
  [10]Leech, G.Semantics[M].Harmondsworth:The Penguin Group, 1974.
  [11]Teubert, W.Writing, hermeneutics and corpus linguistics[M]//W, Teubert&R, Krishnamurthy.Corpus Linguistics:Critical Concepts in Linguistics.London and New York:Routledge, 2007:134-159.
  [12]陆军、卫乃兴.扩展意义单位模型下的英汉翻译对等型式构成研究[J].外语教学与研究, 2012 (3) :424-436.

作者单位:
原文出处:孙海燕.短语学视野下的意义研究及哲学渊源[J].河南师范大学学报(哲学社会科学版),2018,45(06):135-139.
相关内容推荐
相关标签:
返回:普通语言学论文