数据分析是一项统计学知识运用较多的工作,各种统计运算和推理,不外乎是分辨两种现象之间关联的出现是否属偶然事件,以及关联的强度。数据分析方法视操作论点和收集数据的不同而有不同选择。本文的内容可包括几方面的说明:数据处理和初步分析;分析方法以及选择该方法合理性的说明;统计检验;计算机程序及其他技术性信息。视分析方法不同写作时可有所侧重。
一、分析方法
数据处理和初步分析是根据待论证的论点,将实验观察等原始数据或二次数据进行统计学处理,并用相应文字或图表表达,供在定量分析中应用。分析方法介绍是这一节的重点内容。学位论文常用到多元回归和线性结构方程等统计分析方法,介绍这些方法的目的是要反映自己的研究的个性,不能照搬教科书上已有的内容。
如用多元回归方法,需要说明的内容有:自变量选择的根据和过程,是用的逐项加入法还是逐项减入法,或者是用因子分析法,以及这些方法运用的过程;每个(组)变量对因变量解释度的贡献大小;对各回归系数统计检验的方法;回归方程求解的计算机软件名称。
如用线性结构方程方法,需要说明的内容有:反映研究问题涉及的变量及变量结构的概念模型;包含各潜变量(名义变量)和显变量(操作变量)及相互关联的结构方程模型;问卷中,各问项一致性的检验方法;各路径系数和回归权重的统计检验方法;结构方程模型拟合度的判断方法。
各种复杂的统计学运算,都有相应的计算机软件。论文要说明使用的是何种软件,如果在求解方法等方面有改进之处,也应该写上,这虽不属于新论点范围,也算论证过程的贡献。
有的学位论文,在介绍多元回归时,将最小二乘法求回归系数的原理说一遍;使用因子分析方法时,将主成分分析的原理从头道来;采用结构方程模型,便叙述结构方程模型的来由和基本原理及建模方法,等等。这些内容属于书本上已有的知识,大可不必写在论文里面,否则反而冲淡了自已的研究内容,评阅专家看过这些内容,不会加分,反而可能减分。有个别论文只介绍分析方法,却不见后续内容,如用一节的篇幅来说明“囚徒困境”的原理,却没有针对本研究问题而构建的博弈模型,这就更不可取。
数据分析结果有可能支持也可能不支持原定的假设,不支持的结果同样有价值,起到证伪的作用。根据不支持的分析结果反过来修改原假设,也是常见的事。
二、分析结果
这一节描述统计方法分析数据的结果,“结果”相应的英文字为“results” ,也可以是“findings”。“findings”意为“发现”,能更明确表达这节的作用,所述的结果一定是本研究有而前人没有说过的内容。通常是用表格或图形来显示数据结果,然后加以解释。
1.结果表述。
表格按行列显示数据,如用回归分析,一般包括描述统计数据,如均值均方差等,以及显著性检验如t, F值等。吴量福《公共组织与私营组织中信息系统的异同点》一文的数据分析结果见表11-1。表中共五列,第一列的自变量分两类:以实际统计数据为基础的硬指标,以及以问卷数据为基础的软指标。第二、三列分别表示公共组织和私营组织的各项自变量的平均值。第四列表示每个变量的自由度,即参与计算的样本总数减2。第五列表示显著性检验结果,由于是检验两组织之间各变量平均值之间的差异,采用t检验,单边检验。列出根据样本数据算出的甲种误差产生的概率p值,显著度a=0.05。
接着,根据图表列出的数据,说明这些结果对研究假设的支持情况。该论文有四个研究假设:①私营组织较公共组织更重视IT;②私营组织较公共组织投入IT更多;③私营组织的CEO较公共组织的CEO更重视IT培训;④私营组织较公共组织对IT培训投人更多。
表11-1的数据表明,假设②④成立,私营组织和公共组织的投入分别是$644 930和$182119,人均IT投人分别是$4 546和$676。私营组织和公共组织的IT培训投人分别是$17 436和$7 550,人均IT培训投入分别为$147和$37。这几项差异除一项外均通过 显著性检验(p<0.05)。同时,统计检验不支持假设①③,公共组织管理层对IT在决策过程中的重要性打分是3.88 ,略高于私营组织的3. 75(5级计分) ,公共组织CEO对IT培训的态度略低于私营组织,分别是6. 77和7. 00( 10级计分)。IT对终端用户培训重要性以及IT培训的重要性两变量的得分,情况类似。
而且这几项的显著性检验未获通过(p>0.05) ,可以判定假设①③未获支持。结果的表述中要用数据说话,切忌“大约”“大多数”“个别”“明显下降”等模糊字样。
2.结果解释
数据分析结果可能包括一些与预期不一致的问题,可以在这一节加以解释。
如“公共组织与私营组织的计算机技术”一文原有四个假设,预计IT和IT培训的投人,以及高层管理人员对IT和IT培训的重视程度方面,私营组织都领先于公共组织。分析结果,IT和IT培训投人的两个假设通过,而有关重视程度差异的两个假设却未通过,这就是说,两类组织的高层管理人员都同样重视IT和IT培训,但在实际行动上,公共组织却逊于私营组织。对于这种“言行不一”的现象,作者在文中提出了自己的解释。前述《勤劳而不富有》一文,论证了中国交易制度不完善、制度成本高的事实。然而,发展经济学有个观点,完善的交易制度是发展经济的重要条件,中国30多年来经济的高速发展却是在不发达的交易制度下实现的,现实与理论之间岂不有矛盾?作者对这个矛盾作出解释,认为勤劳与制度成本之间可相互替代( trade-off),勤劳弥补了制度成本的不足,因而维持了经济高速发展。
论证章是学位论文的主体内容,2万~3万字(不含图表)是适当的篇幅。
本文对研究设计阶段的质量检查,数据收集阶段的质量检查及数据分析及结论阶段的质量检查进行探究。...
变量是可测的名词。一项科学研究,特别是实证研究,需要定量的数据作为分析基础,总免不了处理许多变量。...
在撰写硕士论文时候,数据引用尤为重要,因为现在是一个数据说话的时代,能够打动人的往往是用数据说话的理性分析。那么硕士论文数据可以修改吗?下面我们就为大家分析一二,让大家了解一下硕士论文的数据可不可以修改。...