大数据评价方法实证研究,信息管理论文

　　第 5 章实证研究

　　本文在第四章构建了政府大数据质量评价体系的基础上，来设计问专家卷，对样本进行描述性统计分析，然后对用户满意度指标体系进行了信度分析和合理性检验，来改善问卷的合理性和可靠性，进而对数据进行主成分分析，找出质量评价指标的主成分的得分和排序，确定指标的权重，并计算各个维度指标的满意度，最后对满意度的结果进行讨论，并提出改进建议。

　　5.1 问卷的设计。

　　5.1.1 问卷设计原则。

　　问卷设计要遵循以下原则：第一、处理便捷，问卷采集的数据要方便计算机录入、数据处理等。第二、题量适当，问卷中问题的数量要控制得当，过多过细的问题会让被调查者无法回答，从而影响问卷质量。要选择具有代表性的、易与理解和回答的问题；第三、层次合理，问卷问题的设计要具有逻辑性，回答顺序符合被访问者的思维习惯；第四、主题明确，围绕所需要的主要问题来确定问卷的结构，做到问题重点突出。

　　5.1.2 问卷设计问卷是调查的一种基本方法，问卷的设计将直接影响调查数据的质量。本文参考了大量文献，设计出用户政府大数据质量评价的关键指标的问卷，然后进行信度和合理性分析，剔除不合适的指标，再通过计算出每个指标的权重，并最终确定质量评价得分。

　　5.1.3 调查对象选取。

　　调查问卷的发放以经常使用或比较了解政府大数据的人员为主，选择了部分政府办公公开场所、相关企业、重点高校、作为调查问卷主要发放范围。调查和访问的用户主要包括为企业信息化管理人员、科研人员、相关专业高学历人士等等。

　　5.2 描述性统计分析。

　　本文发放了问卷210份，回收有效问卷200份，有效回收率为95.2%.被调查者基本情况。

　　问卷的发放对象以硕士学历和博士学历居多，硕士学历几乎占了一半，博士学历的比例是21.5%,而教授的比例最小，为2.5%.从受访用户的年龄来看，年龄在40岁以上的有16人，仅占8%,而20-25岁年龄段的较多，有28.5%,25-30岁的年龄段的用户占41.1%,这两个年龄段是接触政府大数据最多的人群，共占了79.6%.从学科分布来看，经济管理类人数最多，占43.5%,工科、理科分别占22.5%和16%,而文科仅有5.5%的比例。

　　本文导入数据 SPSS 软件进行初步分析，得到了原始数据的总体统计结果。

　　5.3 信度分析与合理性检验。

　　5.3.1 信度分析。

　　信度是指教育信息化用户满意度测评问卷中设置的指标反映用户评价的可靠程度。测验信度越高，表示测验结果越可信。本文采用问卷分析中最常用的克朗巴哈 a 可靠性系数法来测量问卷的可靠性。

　　计分析软件对预调查收集到的数据进行可靠性分析，得到的结果如表所示。结果显示如下表，本问卷的（Alpha 值）都在 0.7 以上，所以本文中问卷的指标是政府大数据质量评价的重要因素。

　　5.3.2 合理性检验。

　　因子分析目的是为了描述隐藏在一组测量到变量中的一些基本、无法直接检测到的主成分隐形变量，为了检验本文调查问卷设计的合理性：首先要对每个测评指标给用户评价产生的影响进行检验；其次对问卷中测评指标分类合理性进行检验。采用因子分析对这两方面的合理性进行检验。由测评指标的共同度检验每一项指标对用户评价结果的影响程度。共同度越大，表示该指标对公因子的共同依赖程度越大，即解释该指标就越有效一般来说，当共同度大于0.5时，公因子就能较好地解释指标了，共同度相对较小的，可以剔除。结果如下表，二级测评指标的共同度全部大于0.65,说明政府数据用户对各项指标的满意度是比较显著的。

　　当问卷的信度过高，可剔除共同度较低的指标来消除工作量较大的问题。当问卷信度较低，可根据因子分析的结果重新调整分类，剔除共同度较低的指标，来改善问卷的可信性和合理性。

　　5.4 主成分分析和评价。

　　5.4.1 计算相关系数矩阵。

　　本文的研究数据来源于调查问卷，对用户态度的衡量选择了李克特量表，利用SPSS软件进行初步分析，根据张文彤的研究认为，当因子负载小于0.3时，该因子对变量变异解释微乎其微，而0.5亦可作为衡量变量的解释程度是否符合标准的临界值。因此，若出现因子负载小于0.5或者两个以上大于0.5的指标出现，我们将删除此项。经三次剔除，共剔除13项，得到新的指标体系。

　　利用新的体系得出相关系数矩阵表，并根据SPSS的分析，KMO的值是0.935,说明这51个指标是适合进行主成分分析的。

　　5.4.2 计算相关系数矩阵特征值和累积贡献率。

　　运用 SPSS 的 factor 软件计算得到的相关系数矩阵的特征值和累积贡献率如表共有六个主成分，各特征值的累积贡献率达到 65.345%,即用这六个主成分来代表原来的指标，信息的损失率大约是 34.655%,说明这六个主成分所代表的信息量在原来指标全部信息量中的比例较高，选择这六个主成分，分别设为 Y1,Y2,Y3,Y4,Y5,Y6 来代表第一、二、？六个主成分。本文按照相关系数矩阵 R 的特征值≥1 和累计贡献率≥65%的原则提取主成分因子。

　　5.4.3 确定主成分。

　　主成分分析试将第 i 个主成分和第 i 个主成分的相关系数 R（Y,X）称为第i 个主成分在第 j 个原始指标上的载荷量，该相关系数矩阵就是载荷矩阵。ijR的大小反映了主成分指标与原始指标关系的密切程度，为分析主成分的现实意义提供了依据，如果主成分的现实意义无法解释，那么该主成分是不可靠的。

　　通过 SPSS 分析软件分析得到的本次实证分析的主成分载荷矩阵。

　　由主成分计算结果数据表可知，第一主成分的方差贡献率最大，是19.558%,由主成分载荷矩阵可知，第一主成分在政府大数据的准确维度、数量级的被调查者和制度性因素、全面性的制度因素、实时性维度、融合性维度、增值性的政府部门因素和制度性因素都大于50%,因此它是有以上内容所刻画的总体指标。第二主成分的方差贡献率是18.003%,在可解释性维度、透明性维度、可理解性维度方面有较大载荷，而在正确性维度、效益性的政府部门因素和被调查者因素有负面影响。第三主成分的方差是9.613%,它在可衔接性的被调查者和制度性因素、多样性被调查者和制度性因素、可操作性被调查者和制度性因素上具有较大载荷，反映了在这等方面用户满意的程度。第四主成分的方差贡献率是7.058%,在相关性的制度性因素、效益性的被调查者和制度性因素具有较高的载荷。第五主成分方差贡献率是6.531%,在可取得性的政府部门和被调查者因素、安全性的制度性因素有较大载荷。第六主成分的方差贡献率是4.551%,在客观性的被调查者因素上有大于50%的载荷。

返回本篇论文导航