自然辩证法论文

您当前的位置:学术堂 > 哲学论文 > 自然辩证法论文 >

数据与科学理论的语义模型

来源:未知 作者:傻傻地鱼
发布于:2017-02-08 共6117字
  本篇论文快速导航:

展开更多

  2、 数据与科学理论的语义模型。

  理论的"公认观点",也称为理论的句法观。在传统科学哲学中对科学理论的解释中占主流地位。简单来说,就是将理论解释为一种公理化的系统 TC,其中公理 T 是用理论语句 TC 所描述的理论定律;C 是连接 T 和观察语句 Vo 之间的对应规则。这一模式的成立,需要预设两个前提:一个是观察与理论的二分原则,另一个是在观察和理论语句之间存在着对应规则(或桥接原则)。本章主要讨论以苏佩斯为代表的语义观。因为苏佩斯在抛弃对应规则,转而讨论模型的概念时引入了数据这一重要因素。由此而确立了以他为代表的数据语义观。

  2.1 科学理论表征的模型等级系统。

  理论语义观主张科学理论的核心工作是提供一套模型或模型簇,用来表征经验现象。一般地,语义观十分强调模型的等级层次,"认为它们介于自然系统与理论结构之间。"为了代替"公认观点"的对应规则,语义观抓住了模型最为根本的功能和作用,即表征功能。模型的表征体现为两个方面:一方面模型表征了已选定的部分世界(对象系统),这类模型立足于对象的性质,即现象模型和数据模型;另一方面,一个模型可以通过说明和解释定理和公理来表征一个理论。

  一旦,模型同时具备这两种意义上的表征功能,它就能完整联系理论和现象世界。

  "一般认为,现象涵盖了对象世界的所有相关性质和普遍特征的概念,而科学模型就是对现象的表征。"当然,我们也要对不同种类的模型加以区分。"模型分为质料模型和形式模型,形式模型表达了物理实体和过程的结构或形式,没有涉及特定物理或属性的任何语义内容。质料模型是一个物理实体,或者描述一个物理实体,如用小球表示电子,所以,质料模型是语义结构,因为它引入了对真实或虚拟实体的指称。"我们经常听到的 DNA 双螺旋模型、气体的弹球模型,玻尔的原子模型等等就是质料模型。

  理论语义观之父苏佩斯最早提出模型的等级系统。在 1962 年《数据模型》

  一文中,它挖掘了理论结构如何在实验环境下与现象相联系。基于数学学习理论实验的例子,他说理论和实验之间的联系通过非演绎的模型等级层次相互协调,这些层次包括实验的模型、数据模型、实验设计和其他情况均同条件。而科学理论化的过程就是经历了从复杂的数据、数据模型、理论模型,最后到理论的不断提升。

  苏佩斯主张,在理论到现象之间存在一个不同层级的等级系统,这个等级系统是由不同类型的模型来连接的。他说:"在对经验理论和有关数据之间的关系进行严格分析时需要有不同逻辑类型的种种模型的等级系统。而整个模型的等级系统处在基本理论模型和全部实验经验之间。而且,对于等级系统的每一层次,存在一个独立的理论。通过与低一层次的理论形式联系,就赋予了某一层次的理论以经验意义。"也就是说,数据与理论之间存在一个模型的等级系统,系统的每一层级的模型都可以表征一个理论,模型通过下一层级的经验检验,使得本层级的理论获得经验的意义。由此,也避免了因理论的不断升级而最终脱离语义内容的句法理论观的困境。通过这样一个等级系统,我们可以构造出从高等级理论到低等级现象之间的通路。

  2.1.1 以理论相似性划分的模型系统。

  第一步,从现象到数据,数据源于现象,是对现象的特定状态的表征。第二步,就是从数据到数据模型,对于数据模型的定义,苏佩斯同塔尔斯基的模型是一致的,都是将模型作为二阶语言。数据模型的出现不再仅仅是描述现象,它可以指称现象实体,具有语义内容。数据模型一定要在的理论的指引下对数据进行"改造".所以,数据虽然源于现象,但数据模型却并非对现象的全等描写。第三步,从数据模型到理论模型。在科学研究中,数据模型作为研究对象来参与理论的构造。语义模型观认为,数据模型与理论模型的同构关系决定了二者的适应性,理论模型所要阐明的对象间关系同数据模型展示的内容具有相同种类的结构。

  第四步,从理论模型到理论。以数据模型作为经验对象,通过对数据模型的归纳、类比抽象而获得更高一层级的理论模型。对于语义观来说,理论就是一些具有相同结构的模型的集合,而理论所讨论的种种对象就是这些模型中的表征。

  理论与数据模型之间的联系是极为复杂的,一个理论可以对应几种理论模型,只要模型与模型之间是同构的,就可以为理论服务而构成一个模型系统。理论与理论模型之间的关系往往是一对多的关系,不同理论模型之间为同构关系,可以统一为同一理论,这些同构模型一起构成了模型系统,它们之间的相互关系是对理论内容的解释。拥有相同结构的种种模型构成了从现象到理论的等级系统。图中数据模型、理论模型和理论之间由箭头联系起来,三种因素或模型之间之所以能够相互联系,是因为不同层次之间具有相似性。"这种相似性是模型之间的相似,可以说是理论背景的相似。以数据模型为分界线,从数据往上就是理论结构的部分。"由直线联系起来的因素之间往往没有很强的相关理论束缚,比如从实验仪器对现象表征得到的数据,一般是通过普遍性定律得到,包括光学定律、度量标准和基础物理定律等;从数据建模得到的数据模型往往依赖统计和数据挖掘工具。

  所以,三者之间的理论联系与待测理论之间并没有太强的关联性。

  2.1.2 以理论模型、实验模型和数据模型划分的模型等级。

  对于上述等级系统也存在不同角度的解读。同样是将数据和理论通过一系列模型等级层次联系起来,我们可以把模型等级划分为三个层次,即理论模型、实验模型和数据模型。"理论模型和实验模型是与理论相关的,数据模型描述了在一个特定实验中集中获得的数据。"比如,理论模型可以基于科学理论,比如理想气体定律。实验模型可以基于实验理论。描述数据的数据模型从特定实验中获得。需要注意的是,理论模型和实验模型同时都与理论相联系。

  在实验语境下,通过理论模型而表达的科学假设,正是通过实验模型与由实验而产生的"原始"数据相联系。简单地说,实验模型构成数据模型与理论模型之间的连接。这一模型是关于如何实验性地测试,在理论模型中被陈述的假设。

  在这一背景下,实验模型仍然忽略了许多在实验中的出现的实际问题。比如,模型可能是过于理想化的,像假设无摩擦的平面。"实验主义认为模型是关于实验的概念,而非关于实验可能产生的实际经验结果。所以,在测试铅的熔点例子中,实验模型可能是关于测量铅的温度而产生的有用、可靠结果的方法。"不同于待测理论和与理论相关的模型,实验理论和与其相关的模型包含对于实验的参考。比如,一个理论模型可能包含在理想气体模型中的特定变量,像温度、气压和理想气体体积。在一个可能的实验中,气体体积保持恒定,实验理论可能会将在气压和非理想气体体积之间的关系详细化。实验模型可能会包含实验中关于温度和气压的可能值。数据模型可能会包含在特定实验过程中的温度和体积读数。在给定实验中,并不是所有的数据集都算作是数据模型。为了使得数据集成为数据模型,在实验理论中的特定状态必须保持在可接受的特定范围之内。

  我们在决定给定的数据集是否构成数据模型时,还会用统计测试的方式来考量数据集。

  2.2 理论语义观中的数据模型。

  2.2.1 从数据到数据建模。

  当科学家获得原始数据的时候,其在科学实践中是不可用的。大量数据的堆叠往往呈现无规律的混乱状态,因为原始数据存在大量噪音,并且在通往理论的道路上我们更需要抽象的、一般性的表达,而非具体的、特定状态的表征。出于这个原因,数据在被分析之前必须要经历处理。数据处理的第一步就是去除数据集合中的噪音。比如,如果我们要画出太阳系的行星划过夜空的位置,就必须找出每一次测量中存在的错误,可能是因为望远镜的瑕疵、人为因素、大气层状况或者其他环境因素。我们在获得行星轨迹的大量测量数据集时,必须要先完成两件事情:(1)试图找出错误的数据并去除,(2)穿过剩下的点画出一条平滑的曲线,以此在离散的数据集之间模拟出行星的运动轨迹,毕竟物体运动总不可能是跳跃的。所以,我们在处理数据时,是从一系列离散点的集合中描绘出一条行星运动的连续平滑的曲线。只有经历必要的处理程序的原始数据才能成为可用的形式,而最后我们画出来的行星轨迹就被称为数据模型。

  我们发现,"在数据处理过程中,数据的很多性质已然被改变,或是数据点被排除,或是离散的数值被平滑、连续的曲线所取代。第一步就称为数据还原,第二步称为曲线拟合。"在物理学实验或化学实验中,这两个步骤在构建图表时极为常见,比如在固体物理试验中温度和电阻率的对比图,或在理想气体实验中温度和压强的对比图。拟合曲线与原始数据集一般很相似,但却是连续的,而且也不与原始数据点完全一致。这种近似曲线就是数据模型,它相似于原始数据,是科学家根据数据的相关层面构造出来的。

  使用数据模型的数据解释是为理论目标服务的,并且数据解释往往存在多种方式,这取决与我们在处理数据之前采取何种假设。这种数据模型表达的多重可实现性,以不同的方式来针对于它们旨在表征的实在世界的实体之间拥有的相似性与非相似性。比如,在统计研究人均 GDP 变化与人均收入数据时,通过线性图的方式可以分别直观的展现两类经济统计量的变化趋势,但是忽略了两类数据之间的对比。通过直方图将两者按照时间排列在一起,可以产生直接对比,显示出人均收入与 GDP 的比重。所以,当选择用线性图而非直方图来描述数据集时,我们知道在数据中特定的规律需要被强调,同时其他信息可能会被忽略。在了解在数据模型和被表征的实在世界对象之间的相似性和非相似性,科学家可以在构造和处理数据模型时作出相应改变。

  2.2.2 数据模型作为中介。

  与其说科学家假设了数据中的模式与规律,不如说数据模型的构造涉及到科学解释。在许多例子中,传统意义上原始数据的获得已经嵌入了理论原则,或者至少在性质上数据的纳入就包含很强的操作目标,也是经过研究者决策的产物。

  这就说明,数据模型从一开始就涉及解释,并且鉴于其所涉及问题的理论目标,模型的可靠性也被多种标准所评估。当然,"不是所有的理论模型都是从理论意义上导出的,也不是每一个现象模型完全不能独立与理论概念和参数设定。"而在特定情况下,在构造数据模型的时,科学家会利用理论元素来指导数据模型的产生。

  借助数据模型的描述,可以提高我们对于理论原理和基于理论约束的模型之间的相互作用的理解。当科学家面对涉及多个工具的复杂实验,每一个都产生大量数据,如果从方法论意义上对每一个原始数据进行解释将是不可能的。我们压根不会解释科学如何识别数据中的模式,而是假定在给定数据集中存在一系列模式的事实。如果我们作出这一预设,数据研究将难以推进。所以,"需要意识到实验本身就包含了许多数据模型,我们的任务就是识别产生这些数据模型的理论假设和目标。"甚至对于反实在论的语义论者来说,模型常常超越了理论,而更好表征了物理系统。卡特莱特(N. Cartwright)就表示"在物理学中,理论的基本原理并没有表征真实所发生的,相反,理论给出了在抽象概念之间的纯粹的抽象关系,它告诉我们系统的'能力'和'倾向'取决于这些原理。这样的话,如果我们想表征真实发生的,就需要超越理论而建造模型。"虽然,笔者本人并不赞同这种科学理论立场,但是,卡特莱特很好的表达出数据模型相对于理论的独立性与自治性。

  我们考虑起初苏佩斯提出数据模型概念的原因,其在解决理论与现象的关系时遇到了与逻辑经验主义相同的难题。不同于后者关于桥接原则的立场,苏佩斯选择了模型论的进路。同时,将数据纳入模型的讨论框架中,他提出理论所面对的不是原始数据而是数据模型,数据模型的建构是复杂的、创造性的过程。他写道:"对经验理论和相关数据之间关系的严格分析,需要有不同逻辑类型的各种模型的等级系统。"数据模型的作用类似于一个中介,其作用就是不停的调节理论与现象之间的关系。也正是如此,所以苏佩斯就需要大量工作以解释理论、数据、和现象之间的差异和联系。作为语义理论者,他关注于模型的不同类型,通过复杂模型之间的关系,辅以群论关系的形式加以分析。但是,他依然很难解释数据与现象之间的差别,这里数据被用来确证和建立现象。因为数据自身并不能构成现象,所以,即使模型论的同构关系十分巧妙,在通往现象的道路上,语义论者依然束手无策。

  2.3 数据语义模型的经验主义特征

  在苏佩斯看来,数据模型就是塔尔斯基意义上的模型,即数据理论的模型。

  数据模型远非"所观察到的描述",即所谓的"现象".对于任何给定的实验,数据模型的准确定义是在实验过程方面,以及所研究现象的的经验理论方面,需要数据理论的存在。通过两个事情连接了高层理论和现象:数据的实验理论和现象的实验理论。他通过数据模型的集合来形式化地描绘数据的实验理论,并且该形式化分析必须是起始于数据模型。要联系数据和现象,我们必须要确定模型之间拥有相同的结构。但是,因为缺乏现象的经验理论,我们只能预设现象拥有或存在某种"结构",但是,我们却不能根据他的模型的共享结构来描述现象的结构特性。如果,我们以对数据模型的描述方式覆盖现象的结构,将彻底落入经验主义的境地。因此,实在论者很难从现象模型的共享结构的意义上去说明该现象本身的结构。

  虽然苏佩斯早在 1960 年就指出,科学所要关心的问题并不是未经加工的观察,而是数据模型。但是,语义观仍然摆脱不了一个很大的弱点,它默认接受了传统假设-演绎方法中作出的关于理论术语和观察术语的区分。语义观把科学知识构想为模型等级,其中,有些模型更特殊并更接近于数据,有些模型是理论的且更远离世界。在很多被数学化的科学中,我们用可测量的量来表示理想化的真实世界的性质,而非原始经验的观察特性。力学理论就是关于这样的经验:"借助于质点、时间和空间、质量以及力的作用的变量集合的理解,我们将力学理论和经验联系起来。这些元素表征了理想化的力学实体,及其可测量的特性。这是,我们不得不考虑"不可观察量术语"的含义,但是,观察负载理论这更一般的论题,使得'可观察'与'不可观察'之间的区分变得模糊不清,这也使得苏佩斯对数据的分析与理论模型息息相关。"现在,观察与理论的二分被认为是过于简单的。科学结构主义者为此提供了三个选择来挽救共享结构的正当性:"(1)从方法论的视角,放弃对现象结构的讨论,转而关注有结构的数据模型。(2)从经验主义出发,认为将现象构造成数据模型的是那些高层次的理论。(3)从实在论出发,认为是世界构造了现象。"经验主义的观点,如范·弗拉森认为如果两个结构是同构的,那么彼此都可以嵌入对方,如果一个结构与另一个结构部分同构,我们就说前者可以嵌入后者。这种科学结构主义的经验论立场通过消除现象与数据模型之间的区分,从而避免了为什么我们可以假设数据模型能够表征现象的问题。实在论者始终认为世界建构了现象,借助"无奇迹"论证以回应反实在论的驳斥,并解释了为什么辨明数据模型的结构和现象的结构之间关系是必要的。因为,如果不存在(数据模型)理论和实在世界(现象)之间的同构关系,那么科学发展中所有成就都将成为奇迹。

  除去任何一种立场,我们可以清楚的是,没有关于现象的理论,我们不可能仅仅运用数据模型来形式化现象结构。而且,也不能通过对模型之间共享结构的语义观来完全解释从理论到现象的适应性,并从而建立理论与世界的联系。所以,数据模型在表征和解释世界的过程中极为重要,但是,在数据模型之下,相比于了解各个模型之间的等级同构,我们需要的更多合理性解释。

返回本篇论文导航
作者单位:
相关内容推荐
相关标签:
返回:自然辩证法论文