现有统计数据都属于二次数据,有两类来源:一类是组织内部,如企业财务报表、市场调查报告等;另一类是政府公共组织和咨询机构公布的资料。原始数据的优点是可以完全按研究者的要求去收集数据,贴近操作变量的含义,并可监控外部的干扰因素,以保证数据的信度和效度。缺点是费时、成本高。二次数据优缺点正好相反。二次数据由于成本低、费时少,吸引研究者优先考虑采用。如果研究对象是过去的事件,那更要依赖二次数据。
应用现有统计数据进行论证, 一定要服从研究假设的要求和操作变量的含义。由于二次数据原收集者的意图与二次数据引用者所欲达到的目的不可能相同,这会导致在应用中出现问题,研究者需要心中有数,多加辨别,消除偏差。值得注意的问题有研究对象错位,以及信度和效度不足。
一、区位谬误
统计报表的数据一般都经过分类,多半是以地域、组织等群体为分析单位,但许多研究者又期望使用这些数据来作出以个体为分析单位的论断。这种由于分析单位引起的偏差称为区位谬误( ecological fllacy)。 例如,城市人口比重大的省份,其大学升学率也高,但这组数据并不能作为“城市学生的大学升学率高于农村学生的大学升学率”这个假设的论据。因为这组统计数据是以“省份”为分析对象,而后者的结论是以“学生”为分析对象得出的,不能以“省份”的数据推出“学生”个体的结论。如果要做比较研究的话,就须将“学生”作为分析对象,从农村学生和城市学生中抽样,在两组样本符合同一性和环境条件同一性的情况下进行测试,才可能对农村学生和城市学生升人大学可能性的差异作出科学判断。
同样,以个体为分析单位的数据用来推断以群体为分析单位的论断也会引起个体谬误( individualistic fllacy)。例如,数据显示大学本科毕业生的创业成功率大于博士毕业生的创业成功率,如用此数据来推论博士创业的企业要比本科生创业的企业绩效差,这就不确切了,前者分析单位是毕业生个体,而后者分析单位是企业。博士创业可能成功率低,但创业成功后,企业绩效未必就比较差,至少要另行研究才能得出结论。
分析单位的错位,不仅发生在个体与群体之间,个体与另一个体,群体与另一群体之间也可能出现类似情况。
二、信度和效度
现有统计数据能否应用,要考察所提供的数据是否信度合格,即数据是否精确地描述了某个变量的属性。为此,要了解这些数据是由谁收集的,收集的目的何在,并分析所用的收集方法是否存在什么缺陷。
从效度出发,首先要考察数据的时间幅度和空间范围。查看数据是何时收集的,是否适用于本研究。如果用10年前的调研统计数据去说明当前的消费行为;用江苏企业的数据来说明山西或黑龙江企业的问题;企业的数据用于学校,那效度就差。其次,数据是代表某个变量的属性,应用数据时要考虑到数据背后的变量是什么,原研究者对该变量赋予了怎样的含义,与本研究对此变量的定义是否一致。
一些公共组织发布的各种指数(生活质量指数、满意度、集聚度、透明度和廉政指数等),其实都是变量或变量组合。如果某项研究对这些指数赋予不同的含义,又用这些数据来论证自已的假设,那效度势必打折扣。
本文对研究设计阶段的质量检查,数据收集阶段的质量检查及数据分析及结论阶段的质量检查进行探究。...
问卷主要包含问项和量表(答案)两项内容。访谈法则由访谈人向被访者提出问题并记录答案,访谈或问卷都要提出问题和收集答案,都涉及问项构造和量表设计。...
本文的内容可包括几方面的说明:数据处理和初步分析;分析方法以及选择该方法合理性的说明;统计检验;计算机程序及其他技术性信息。...
实验法是一种受控的观测方法。当检验假设是“变量X变化将引起变量Y的变化”时,实验法论证就是有目的地改变X值,并保持其他条件不变,然后观察它对Y的影响。...
人们面对年龄、工资、年产值和利润等这些单变量的统计数据,总是希望用最简明的指标和工具来表述它的特征,以便比较分析。...
变量是可测的名词。一项科学研究,特别是实证研究,需要定量的数据作为分析基础,总免不了处理许多变量。...
在撰写硕士论文时候,数据引用尤为重要,因为现在是一个数据说话的时代,能够打动人的往往是用数据说话的理性分析。那么硕士论文数据可以修改吗?下面我们就为大家分析一二,让大家了解一下硕士论文的数据可不可以修改。...
毕业季来临,想必大家都在想着怎么才能写好毕业论文,下面以“数据挖掘研究生怎么写论文”为例,给大家带来相关知识阅读,欢迎指正。...
将个人的、主观的定性判断尽可能转化为具有共性的、定量的结果。问卷可以说是管理研究从思辨方法转向科学方法的一座桥梁。...
各学科研究方法有所不同,但每项研究都须依靠数据。数据收集是实证研究工作中最重要和关键的环节。数据可分为一次数据和二次数据。...