3、作为科学理论基础的数据模型
前面,我们提到语义论者为放弃逻辑经验主义在观察语句和理论语句之间建立起来的"对应规则",试图通过模型等级系统重构经验知识。由于传统科学中赋予"观察"特殊的地位,从而使得观察与理论的二分原则根深蒂固。本章主要阐述科学理论的数据基础观,它试图彻底打破二分原则以建立新的科学解释的框架。基础观最早见于 1988 年《哲学评论》中的《拯救现象》一文,该文由匹兹堡大学教授波根和伍德沃德完成。他们立足于实在论,从认识论角度深度挖掘了数据在科学实践中的作用,最终将科学的大厦建构于数据的基础之上。这一颇具远见的方案预见了 20 年后大数据方法和技术的核心理念。
3.1 数据-现象-理论三元区分模式。
自上世纪 60 年代起,很多学者开始反对观察与理论的二分。从学术流派上看主要存在两种反对模式:一个是从实在论角度进行反对,如麦克斯韦(G.Maxwell)。他认为可观察与纯理论的区分是含混的,比如基因的概念原本只是理论实体,而现在却变成了可观察实体;另一个是从科学认识论的角度进行反对,如汉森(N. Hanson)。他提出"观察渗透理论"命题,即每一个观察语句都是负载着理论的。即便如此,延续了逻辑实证主义传统的"后实证主义"依然继承了观察与理论二分遗产,通过区分观察与观察力的概念来解决上述难题,指出那些实证主义认为的所谓不可观察实体其实完全是可以观察到的,由此试图保证观察在科学中的地位。
波根和伍德沃德(下文以 BW 代替)认为,"讨论观察的分类以及区分哪些观察是理论负载的对于我们理解科学并不是那么重要的。"尽管在早期科学发展中,基于观察的科学解释基本够用,例如早期天文学家通过肉眼或简单的望远镜观察星空,试图创造理论以解释和预测所观察到的。但是如果建立科学规律只是为了解释和预测可观察对象未免过于天真、原始了。科学得以进步的两个重要来源,"包括我们对观察和测量的错误进行系统处理,以及通过数据分析和数据还原使得我们不再需要理论解释我们直观看到的。"传统的科学分析忽视了数据与现象之间的区别。数据往往视为观察的一种表达方式,在观察到理论的归纳过程中数据起着重要作用,往往是理论推导的决定性证据。所以,对于逻辑经验主义,数据和现象都在可观察范围之内,两者并没有本质的区别。BW 解释数据于现象之间的区分,指出科学实验中存在大量因果因素,这些因素依赖于具体的实验设定、测量仪器和数据处理、数据分析方法。
相应的,对于现象,只需要较少的和可控范围内的因果因素被考虑到。他们说:"为了解释现象而不是数据,科学家需要避免阐释大量存在的独立的、局部的和特性的(idiosyncratic)因果实践,它们往往涉及特定实验和观察语境的细节。
相反的,科学家需要在不同的语境中集中关注于那些持续的、稳定的东西".
通过严格的区分数据和现象,BW 认为直观的数据为证明现象的存在提供了证据;理论并不能解释数据,而是预测和解释了现象的事实。由此,在数据、现象和理论之间构建出新的科学发现模式,简称 D-P-T 模式。主要观点如下:(1)科学现象是不可观察到的,这与我们的直觉相悖,而数据可直接观察到,数据是现象的证据,(2)数据推出现象,只有通过数据作为证据才能显示现象的存在,(3)基于实验和统计方法,数据的可靠性得以保证,(4)理论没有预测和解释数据而是现象。
根据这四个命题,他们得以将矛头直接指向经验主义。经验主义认为感知和感官经验具有认识论上的特殊地位,使我们坚信观察到的就是事物本身的样子。
但是,很多理论所指称的对象是不可观察的(简单的如力、重力等),确认观察不到的对象是存在的,这一说法本身至少是缺乏根据的,大部分科学现象都是不可观察的;所以,"确定现象存在的理由并不能建立在人类知觉系统的事实上。"从这一点出发重新考虑经验主义的理论认识,即认为成功的理论应该是经验上适当的。即使我们同意范×弗拉森所说的"经验适当性"(empirical adequacy)原则,对于"经验适当性"这一概念,就是说理论必须"拯救"或适当于科学家所能够观察到的;但问题是我们无法在可观察现象与不可观察现象之间做出严格区分,现象的存在并不建立在人类的感知系统基础上,而是科学家通过其他途径推断出来的。这一事实使得经验主义的信念陷入困难境地,他们需要解释,如果现象是观察不到的,如何通过观察推出科学理论或根据建构的正确理论来解释我们观察到的。"逻辑经验主义在理论实体和可观察项之间通常不做区分,而这两者之间就涉及数据和现象的综合(conflation),也就说数据和现象都一并属于可观察项,如此说显然是不合法的。"按照经验主义对"观察"的执着和对理论的定位,难道科学理论最终要预测和解释可观察的数据吗?
用理论解释和预测科学数据没有问题,但确是很困难的,理论只能解释现象而非数据。一个典型的例子,铅的熔点测量实验:为什么科学家确定铅的熔点是327 ,因为实验室产生了大量数据,最终取了一个平均值,铅的熔点准确为327.5±0.1 .一个相关理论可以解释铅为什么在大约 327 时熔化,但却不能解释为什么是 327 ,前者说的是现象而后者是一个准确数据。数据是通过仪器记录的观察和测量的结果,作为特定实验环境下的产物,不仅受人类的感官系统影响,获得的数据还因为外界干扰因素、统计推断、数据压缩等产生误差。原理上,理论很难对数据做出解释和预测,干扰和噪音受到了技术的限制;况且科学家也没有必要对数据做出解释,理论解释现象就够了。
由此,我们可以构造出以数据为基础的知识大厦,现象通过数据分析推导出来。需要澄清的是,杂乱、复杂的原始数据表征特定实验的不同状态,其本身不会为现象和理论提供证据,只有建立在数据集基础上的数据模型才能表征现象和正确理论。BW 的 D-P-T 模式在方法论上简化了科学推理的进程,我们可以在认识论上还原为一般实在论的模型。实在论认为理论模型表征了自然世界,最为重要的是理论模型的等级层次位于顶端,数据模型随后,后面是数据,接着是对物理事物的一些关系,它们联系着高层理论。
区别于其他实在论最为核心的改进是从数据到现象的过程。一般而言,我们认为好的科学理论应该拯救现象,这其中就引出"现象是什么"的问题。但这其实很难回答,就如同回答"什么是世界本身"一样,因为世界是及其丰富和复杂的。在经验主义的立场而言,理论应该拯救表象(appearance),而像 BW 这样实在论者则会反对。与理论的语义观不同,BW 认为表象更为复杂,现象完全不同于表象,现象是通过数据推出的。这就是我们上面看到的模型中,现象位于数据模型之上。
科学结构三元区分为以数据为主导的科学研究领域做出了开创性的工作,我们先分析 D-P-T 模式是否能避免传统二分原则的两大缺点。第一,关于不可观察对象的指称问题,新模型中不再直接讨论观察,而是以现象代替,那么只需要保证现象的形而上学地位;现象本质上就是事实,是世界结构的反应,所以上述问题也就不复存在了。第二,关于理论负载的问题,根据上述两个命题(1)现象不可观察,可观察数据作为现象的证据,(4)理论没有预测和解释数据而是现象:
可以得到数据在这个意义上是不需要也没有受到理论负载的。
简单的看,新模式已经将基于观察和理论的传统科学范式完全变换了,在不同的框架下讨论问题就需要对数据、现象以及其间关系有更深的解释,才能去考究这样的科学解释是否真正满足科学实践的客观性、合理性。同时,BW 的数据基础主义与图 1 中的语义观也不同,现象与表象之间被间隔开,使得表征直接与实在世界相联系。如此,我们就要面临最为直接的挑战:"对于经验主义,如何给予理论恰当地描述了表象以合法性,因为此时,理论是用以拯救了现象的;对于实在论者,如何给予理论恰当地描述了世界以合法性,这里,理论也用以拯救现象。"
3.2 科学结构三元区分的基础主义特征。
在逻辑实经验主义之后,兴起了关于实在论与反实在论的争论,其核心问题就是关于理论实体和科学定律存在问题。实在论看来,理论定律就是自然定律,它们是自然现象的背后的因果机制,而反实在论则认为包括理论实体在内的科学定律皆是经验意义上推导或建构的。以此为背景,新经验主义就打着"拯救现象"的旗号宣称,科学理论仅仅是拯救现象而非指称物理实在。在此,他们将现象归于经验范围内的表象。如在范×弗拉森看来:"科学理论就是详尽的说明一簇结构及其模型,其次是详细阐述那些模型的某些基本要素,以作为可观察现象的直接表象的候补。这些能够在实验和测量报告中加以描述的结构,我们称之为表象:如果理论具有某种模型,以致所有现象都与此模型的经验结构同构,那么理论在经验上是适当的。"但是,很显然 BW 并不认为现象仅仅是经验层面的,应为数据是可观察并且独立于理论的,由数据推导的现象也必然是独立于理论系统的。
先不说该推论是否合理,很显然 BW 的新模式所刻画的现象是传统实在论意义上的,所以从数据出发而建立的理论既是拯救自然实在的现象。
D-P-T 模式重建科学知识的大厦,相比与逻辑经验主义将观察作为基础,BW则是选择将数据作为整栋大厦的地基。数据的作用是作为现象存在的证据,研究者不需要执着于数据的系统的解释和推导,无论是从基础理论得到的数据,还是通过测量操作辅助相关理论的假设而得到的数据。所以,可以将这一实践模型扩充为科学发现的基础主义。同时,我们也要将其与引言中论述的数据本体论基础主义区分开来,数据概念的基础主义是通过还原的方式将数据的概念回归到最为基础的形而上学层面中,而科学知识的基础主义则仅仅是认识论的一种知识发现过程或固定模式。很显然的,认识论的基础主义是具有实践意义的,它往往指导着科学家的实验和理论化程序。
最为明显的也是根本性的区别就是数据于现象的位置调换,这也体现出两种不同立场的强烈对比。语义模型观以数据模型解释和补充理论模型,这一部分完全是经验建构的,很难完成拯救实在现象的任务,也使得模型论跌入经验主义的泥潭。以数据为出发点的基础主义坚持数据的独立性,这是完成数据-现象推理的关键。如伍德沃德讲:"基于数据的推理可以保证相关推理可以相对地独立于待测理论。在这一框架下,现象-现象推论可以独立完成,而无需依赖于数据的理论解释。"关于数据的推理和发现至少是独立于主要的科学理论,这也是将数据作为基础推导的合理性之一,也是基础主义最大的弊病。这一点我会在下一节中重点讨论。但是,需要我们注意的是,在很多科学领域,如基因学、神经科学和气象学等等,科学家拥有大量的数据,却对相应的理论知之甚少。我们很难通过借鉴其他基础学科(如物理学)的成熟规律来解决这一困难。实际上,很多交叉学科和新兴学科都面临这样的问题,这些领域的发展现状就是,数据丰富而理论匮乏。所以,这一状况下,那些能够从数据中提取信息的技术变得相当重要。
3.3 数据基础主义模式的解释与困境。
3.3.1 数据的可靠性怀疑。
D-P-T 模式得以可行首先要保证数据的可靠性,也就说如果数据依然是受理论负载的话,那么我们就会认为新模式只不过是观察-理论二分的一个变种,客观性依然受到质疑。波根和伍德沃德澄清,"要保证数据的可靠性,不需要也没有寻求理论的检验,实验中,数据产生的过程是十分复杂的,我们不可能去解释单个数据产生的原因,但明显可以识别(identify)这些原因并通过相应的程序控制在合适的范围内。"由此试图区分数据的可靠性和数据的理论解释两个问题,认为科学家不需要用理论去解释数据,但似乎这样的区分无关痛痒,因为我们必须要考虑数据的挖掘、产生和分析是否受到了理论的影响。正如辛德勒(S.Schindler)对 BW 所坚定的首要前提提出反驳,"他们说数据-现象推论过程中,数据的可靠性构成了第一步,而数据的可靠性并不需要寻求理论的检验才能完成。"辛德勒将其用来立论的两个案例重新论述从而指出:获得数据的实验一定是理论支配的,甚至没有理论背景支持的数据是没有意义的。
BW 反对数据可能的是理论负载的说法。他们认为,数据的可靠性被测试,可以完全与测量本身无关以及科学家如何"输入"无关。不用说,观察者涉及数据的生产过程,但是观察者并没有组成整个数据生产过程。科学家可能要设定测量仪器,读取仪表数值,但是,如果大部分测量由观察者完成,它也会是例外。
当然,读取计量器可能存在偏差,但总是可以使用合理的方法修正和控制偏差。
存在相应的统计检查和实际技巧,比如将一面镜子置于指针的后面以避免仪表读数的偏差,或者使用多个不同的独立观察者。相对的,科学家感知的缺憾也不会成为数据不可靠的主要原因。通常,在数据产生过程中,科学家的工作仅仅构成了其中的一小部分。BW 就讲:"虽然感知是数据解释的核心(感知的可靠性值得怀疑),这一过程的可靠性一般从数据转移到了现象,更多的与数据分析的非感知技术,以及非感觉的控制策略相关(如统计理论)".
这里需要区分两种理论负载的情况,"强理论负载"和"弱理论负载".在使用测量仪器或删除误差大的数据时,必定是依赖于某种光学理论或统计方法,这时我们谈负载就是说数据带有很强的理论负载。但是,类似的光学、数学理论可能与要检验的理论之间并没有很强的相关性,实验数据未必就是目标理论所直接预测的结果,这个意义上,数据的获得就是弱理论负载。计量经济学中的模型的构建就是一个典型例子,研究者通过对实际经济活动的观察,得到诸多经济数据,习惯性的将统计数据描写在坐标系上,形成一系列点的集合。在利用这些点构造数据模型时,会舍弃一些明显不在一个方向上的点,假定这些数据的产生是偶然现象或者数据采集过程存在漏洞与误差。总之,研究者会忽略掉一些不必要的点,并倾向于把具备相同趋势的点连接成一条平滑的曲线,并且认为曲线是更好的拟合了客观世界的。数据模型的建立被认为是依照背景知识、简单性和概率分析等综合因素考虑的结果,即在数据模型背后存在一个数据理论,这一理论是数据模型的集合。在数据理论的指导下,我们构造关于实在世界的数据模型。
虽然,BW 在文中没有直接阐释数据模型的负载,而是一概论之为数据,或许他们所说的数据是宽泛意义上的数据概念集合。我们需要意识到,及时存在完全纯粹的原始数据,它们也是无用的,只有模型化的数据集才具有解释性和复用性。按苏佩斯所说:"任何一个给定试验的数据模型的精确定义都需要一个从给定试验程序意义上理解的数据理论,就像是那种从经验主义的意义上去研究现象的理论。因此,两种东西联系了高层理论与现象:一个是实验上的数据理论,一个经验意义上的现象理论".如此说来,数据模型的获得必定有很强的经验负载。伍德沃德后来承认:"数据的获取以及数据-现象推论过程有大量的经验假设为背景,但这并不能说明数据是理论负载的。"如此,按他所述就相当于"弱理论负载"的情况。所以,D-P-T 模式下,引入数据的概念并没有比传统的观察过程更为优越,还是不能完全保证数据获得的客观性。
3.3.2 数据-现象推论的合法性。
波根和伍德沃德十分强调数据与现象的区分,数据为现象提供证据,现象是数据推出的(data to phenomena reasoning/inference)。说数据为现象提供证据并不难理解,一般通过观察只能看到事物的表象,而正确数据的获得可以帮助我们修改对于事物的认识。但是,数据是如何推导出不可观察现象,这一点似乎并没有说清楚。根据数据和现象的定义:"数据从测量和实验中产生,拥有公共记录的标准,它们为现象的存在或为某些现象的性质提供证据。现象是稳定的、可重复的效果,或者是被理论预测和系统解释的过程,这些过程可以为理论提供证据."比如测量金属熔点的例子,实验员通过大量数据和计算平均值方法得到铅的熔点大约为 327.5±0.1 之间,他们解释说,铅的熔点虽然不可观察,但是可以通过大量数据经统计模型递归得出。容易产生疑问的是,可观察的数据是如何推出不可观察的现象,如何保证这一推断的决定性。实验数据表征不可观察对象,我们用数据记录下云室中水蒸气凝结形成的水滴形态,结合背景理论解释为中微子运动轨迹,但是我们观察喷气式飞机留下的尾迹也是如此,于是就认为是飞机穿过了云室吗?很显然不能这样判断,那么仅仅依靠数据就不能判决性(sentential)的认为水蒸气凝结是因为中微子的运动结果。由此可知,数据-现象推论充满着不确定性。
麦卡利斯特(J. McAllister)分析了数据-现象推论如何得以可能,包括这一推论在科学实践中的运用条件,提出现象的理论渗透观点,认为"现象自身就是调查者,现象是被实验者假定的。"麦卡利斯特站在反实在论的角度指出现象的非实在性,当然这也是与新模式的前提相悖。格利莫(B. Glymour)批评波根、伍德沃德包括麦卡利斯特过于强调对数据与现象的区分。如果现象是总体统计学意义上的,那么波根和伍德沃德只是从统计学上给众所周知的区别安上了一个新的名字。"为代替样本和总体统计学,他们指定新的词语例如'数据'和'现象'.
因此,数据-现象区分没有为科学哲学提供新的见解。并且这种区分是多余的,同时这一术语变化也是极其误导人的。"格利莫从科学数据对于理论的表达方式的角度反对数据-现象的区分,因为从数据推出理论总需要统计的概念分析,过于注重现象与理论的关系是没有必要的。艾普尔(J.Apel 2009)质疑在数据与现象之间做出的区分对建构经验主义所构成反驳力度,认为"数据与现象的概念区分本身是十分含糊的,这一区分并不能解决实在论与建构经验论之争的任何问题。"可以发现,三元区分中对于现象的处理并不是传统意义上的,这一点很重要。
我们对于现象的传统认识比较粗糙和开放,比如说现象是可以观察、感知到的实验发生过程,包括物体、属性、事件、过程、状态等。即使感知不是那么准确,谈现象也就是在说存在于这个世界的实体和活动。但他们定义的现象更为抽象、更为广泛,不仅仅在传统的本体论范畴讨论,现象还包括比如铅的熔点或精神病人因大脑额叶损坏而引起的心理缺陷等,这些无法观察以及用传统方式分类的范畴。他们认为"严格的界定和分类现象的范畴是不重要的,重要是现象在科学研究中解释和预测作用是完全不同于数据的。"但是,这种说法显然不能令人满意,为了保证数据-现象推理的有效性以及严格的区分现象和理论,需要说清楚到底什么是现象。
3.3.3 现象语句与理论语句的区分。
在 D-P-T 模式中,理论解释和预测了现象,现象被称为被解释项,理论称为解释项。据此,他们将现象和理论做出区分。在观察-理论二分模式下,理论术语和观察术语的区分被认为是过度简单化的,"理论术语缘以指称不可观察实体,观察术语与理论术语之间存在对应规则。传统的经验主义将理论的正确性建立在观察经验之上,所以对应规则只能对理论性词语给出经验的全部可观察性的解释。
这样的话,理论术语和观察术语之间就不可能没有共同的外延",那么,观察与理论的本质区分将很难保证。类似的,我们对现象和理论的直观区分,比如说:"杯子从桌子上落下,摔在了地板上",这是我们观察到的事件状态,属于现象陈述;对应的,用来表述不可观察的实体的语句就是理论陈述,如:"存在牛顿万有引力定律规定的重力使得杯子落下".但是,如果站在反对经验主义的立场认为现象是不可观察的,这就将我们对于现象的理解推向更为抽象的层面,据此现象陈述应改为"杯子因重力落在地上",因为理论陈述同样是指称不可观察实体,现象陈述与理论陈述就不存在原则上的差异。
自古以来人类对简单性的不竭追求,或许是在寻求便于逼近真理的方式和可以展现世界本质的简单性道路。简单性的寻求在技术层面则是复杂性的不断增长,技术复杂性及其衍生的系列问题迫使我们不得不重新审视主体的意向,为走出技术复杂性的困境寻求出路。1、技...
技术伴随着人类社会的产生而产生,人类社会又随着技术的发展而发展。今天,人类已经生活在一个普遍技术化的时代,技术的高度社会化、普及化和一体化是不争的事实。技术活动不仅是提高综合国力、改善生活质量、保障民族安全的基本手段,而且也是现...
承认并探询知识的可靠基础是人类的古老理想,柏拉图和亚里士多德以来的大多数思想家都追求确定无疑的知识,他们在自然科学中找到标准的范例。科学的方法、科学的结论和科学的假定都是不容置疑的,科学成为理性的代名词。牛顿、爱因斯坦、达尔文、弗洛伊德和...
摘要:通过钱学森之问,我们对高等教育目前存在的问题以及现状进行了分析,提出了对于杰出人才的培养,需要从学校、以人为本、创新精神的角度来研究对策。关键词:钱学森之问,高等教育,对策一、引言:从钱学森之问说起为什么我们的学校总是培养不出杰出...
当代哲学在信念的评判上处于两难境地,哲学家们要么陷入重建真理概念的泥潭中艰难自拔,要么选择抛弃真理原则的工具主义。按照事实符合论定义的真理概念遭到上帝之眼、怀疑论的批评;取而代之的每一个真理解释也都面临这样那样的问题:融贯论不能排除幻想...
摘要人与自然的关系是人类的永恒主题。随着当今工业和科学技术的迅猛发展,以及人们生活水平的不断提高,生态危机已成为人们日益关注的问题。为了解决生态危机,国内外学者纷纷到马克思的着作中力求挖掘出人与自然和谐相处的哲学思想,寻找根治生态危机的...
一、自然辩证法的理论定位与学术研究的关系问题1.自然辩证法教育中基本理论的特质---确定性众所周知,自然辩证法是研究自然界及科学技术发展的一般规律和人类认识、改造自然的一般方法的科学。作为马克思恩格斯奠基的一门科学,自然辩证法的理论体系是统一...
在我国技术哲学事业的初创与建制时期,陈昌曙先生既致力于工程主义技术哲学传统的研究,也注意吸纳人文主义的技术哲学思想,其中包括各种技术批判思想和理论。在其论着中,陈先生不但在多处提及并阐述已有的技术批判思想,而且承认技术批判思想具有一定的合...
自STS在中国诞生以来,国内一直延续着学派述评和思想评介的研究道路,应该说,经过几十年的努力,我国STS学者较为全面的了解了国际STS研究的主要研究方法和理论,初步构建起了STS研究的理论图景。目前,STS一方面要走形而上式的理论研究,为STS寻找合法性哲...
其实,很多科学实验都蕴藏着人生的哲理,也可以说是生活的哲学。然而,红尘之中踽踽独行的人们,似乎早已被灯红酒绿的浮华遮住了眼眸,很少能够静下心来,浸没在自然的怀抱中感悟人生之理。于是,真正能够洞悉科学实验中的奥妙,并将其应用于日常生活的人可...