第 5 章 实证研究
本文在第四章构建了政府大数据质量评价体系的基础上,来设计问专家卷,对样本进行描述性统计分析,然后对用户满意度指标体系进行了信度分析和合理性检验,来改善问卷的合理性和可靠性,进而对数据进行主成分分析,找出质量评价指标的主成分的得分和排序,确定指标的权重,并计算各个维度指标的满意度,最后对满意度的结果进行讨论,并提出改进建议。
5.1 问卷的设计。
5.1.1 问卷设计原则。
问卷设计要遵循以下原则:第一、处理便捷,问卷采集的数据要方便计算机录入、数据处理等。第二、题量适当,问卷中问题的数量要控制得当,过多过细的问题会让被调查者无法回答,从而影响问卷质量。要选择具有代表性的、易与理解和回答的问题;第三、层次合理,问卷问题的设计要具有逻辑性,回答顺序符合被访问者的思维习惯;第四、主题明确,围绕所需要的主要问题来确定问卷的结构,做到问题重点突出。
5.1.2 问卷设计问卷是调查的一种基本方法,问卷的设计将直接影响调查数据的质量。本文参考了大量文献,设计出用户政府大数据质量评价的关键指标的问卷,然后进行信度和合理性分析,剔除不合适的指标,再通过计算出每个指标的权重,并最终确定质量评价得分。
5.1.3 调查对象选取。
调查问卷的发放以经常使用或比较了解政府大数据的人员为主,选择了部分政府办公公开场所、相关企业、重点高校、作为调查问卷主要发放范围。调查和访问的用户主要包括为企业信息化管理人员、科研人员、相关专业高学历人士等等。
5.2 描述性统计分析。
本文发放了问卷210份,回收有效问卷200份,有效回收率为95.2%.被调查者基本情况。
问卷的发放对象以硕士学历和博士学历居多,硕士学历几乎占了一半,博士学历的比例是21.5%,而教授的比例最小,为2.5%.从受访用户的年龄来看,年龄在40岁以上的有16人,仅占8%,而20-25岁年龄段的较多,有28.5%,25-30岁的年龄段的用户占41.1%,这两个年龄段是接触政府大数据最多的人群,共占了79.6%.从学科分布来看,经济管理类人数最多,占43.5%,工科、理科分别占22.5%和16%,而文科仅有5.5%的比例。
本文导入数据 SPSS 软件进行初步分析,得到了原始数据的总体统计结果。
5.3 信度分析与合理性检验。
5.3.1 信度分析。
信度是指教育信息化用户满意度测评问卷中设置的指标反映用户评价的可靠程度。测验信度越高,表示测验结果越可信。本文采用问卷分析中最常用的克朗巴哈 a 可靠性系数法来测量问卷的可靠性。
计分析软件对预调查收集到的数据进行可靠性分析,得到的结果如表所示。结果显示如下表,本问卷的(Alpha 值)都在 0.7 以上,所以本文中问卷的指标是政府大数据质量评价的重要因素。
5.3.2 合理性检验。
因子分析目的是为了描述隐藏在一组测量到变量中的一些基本、无法直接检测到的主成分隐形变量,为了检验本文调查问卷设计的合理性:首先要对每个测评指标给用户评价产生的影响进行检验;其次对问卷中测评指标分类合理性进行检验。采用因子分析对这两方面的合理性进行检验。由测评指标的共同度检验每一项指标对用户评价结果的影响程度。共同度越大,表示该指标对公因子的共同依赖程度越大,即解释该指标就越有效一般来说,当共同度大于0.5时,公因子就能较好地解释指标了,共同度相对较小的,可以剔除。结果如下表,二级测评指标的共同度全部大于0.65,说明政府数据用户对各项指标的满意度是比较显著的。
当问卷的信度过高,可剔除共同度较低的指标来消除工作量较大的问题。当问卷信度较低,可根据因子分析的结果重新调整分类,剔除共同度较低的指标,来改善问卷的可信性和合理性。
5.4 主成分分析和评价。
5.4.1 计算相关系数矩阵。
本文的研究数据来源于调查问卷,对用户态度的衡量选择了李克特量表,利用SPSS软件进行初步分析,根据张文彤的研究认为,当因子负载小于0.3时,该因子对变量变异解释微乎其微,而0.5亦可作为衡量变量的解释程度是否符合标准的临界值。因此,若出现因子负载小于0.5或者两个以上大于0.5的指标出现,我们将删除此项。经三次剔除,共剔除13项,得到新的指标体系。
利用新的体系得出相关系数矩阵表,并根据SPSS的分析,KMO的值是0.935,说明这51个指标是适合进行主成分分析的。
5.4.2 计算相关系数矩阵特征值和累积贡献率。
运用 SPSS 的 factor 软件计算得到的相关系数矩阵的特征值和累积贡献率如表共有六个主成分,各特征值的累积贡献率达到 65.345%,即用这六个主成分来代表原来的指标,信息的损失率大约是 34.655%,说明这六个主成分所代表的信息量在原来指标全部信息量中的比例较高,选择这六个主成分,分别设为 Y1,Y2,Y3,Y4,Y5,Y6 来代表第一、二、?六个主成分。本文按照相关系数矩阵 R 的特征值≥1 和累计贡献率≥65%的原则提取主成分因子。
5.4.3 确定主成分。
主成分分析试将第 i 个主成分和第 i 个主成分的相关系数 R(Y,X)称为第i 个主成分在第 j 个原始指标上的载荷量,该相关系数矩阵就是载荷矩阵。ijR的大小反映了主成分指标与原始指标关系的密切程度,为分析主成分的现实意义提供了依据,如果主成分的现实意义无法解释,那么该主成分是不可靠的。
通过 SPSS 分析软件分析得到的本次实证分析的主成分载荷矩阵。
由主成分计算结果数据表可知,第一主成分的方差贡献率最大,是19.558%,由主成分载荷矩阵可知,第一主成分在政府大数据的准确维度、数量级的被调查者和制度性因素、全面性的制度因素、实时性维度、融合性维度、增值性的政府部门因素和制度性因素都大于50%,因此它是有以上内容所刻画的总体指标。第二主成分的方差贡献率是18.003%,在可解释性维度、透明性维度、可理解性维度方面有较大载荷,而在正确性维度、效益性的政府部门因素和被调查者因素有负面影响。第三主成分的方差是9.613%,它在可衔接性的被调查者和制度性因素、多样性被调查者和制度性因素、可操作性被调查者和制度性因素上具有较大载荷,反映了在这等方面用户满意的程度。第四主成分的方差贡献率是7.058%,在相关性的制度性因素、效益性的被调查者和制度性因素具有较高的载荷。第五主成分方差贡献率是6.531%,在可取得性的政府部门和被调查者因素、安全性的制度性因素有较大载荷。第六主成分的方差贡献率是4.551%,在客观性的被调查者因素上有大于50%的载荷。
摘要大数据正在成为新的经济增长点,面对大数据时代的来临,集中掌握着资金、人力、政策等资源优势的政府部门当仁不让的扮演着重要角色。政府既是推进政府大数据发展的主体,也是自身需要经现代化信息技术关联分析后发现新知识、创造新价值的研究客体,其数...
第4章基于大数据处理的管理模型4.1管理变革演进的模型每一次管理上的变革都是管理模式与新的信息通信技术相辅相成的,进而我们提出了管理复杂程度+信息技术的管理模式的演进模型(见图4.1)。基于该模型,我们可以看出管理上的模式随着信息技术的发...
第6章加强和改善政府大数据质量的措施6.1严格管控政府大数据的数据源质量。根据前文实证研究结果可知,权重达到40.857%数据源质量依旧是政府用户眼中政府大数据质量的重中之重,结合我国的数据高速发展的数据环境和数据质量发展空间,政府必须严格控...
4基于大数据云平台的森林资源信息管理系统设计4.1需求分析。目前用于揭示林业生产管理的内在规律,发现数据之间的关联关系,反映林业生产活动的变化规律和生产经营的发展方向,分析部门之间的相关性,数据的合理性,林业生产经营与经济发展及产业结构之...
第3章大数据环境下车联网用户信息行为的影响因素分析3.1大数据环境下车联网用户信息行为及其研究意义。3.1.1车联网用户信息行为。车联网用户是指加入车联网的汽车用户,而加入车联网的汽车用户中,除乘用车外,还有监管车辆、政府公务用车等。本文主...
提出有效的改善措施, 进一步完善和发展计算机数据库技术, 解决目前尚存的问题, 让我们的数据库信息的安全性和完整性得到保障, 将创新更优秀的理论应用到实际生活中, 让计算机数据库技术更好地为我们的生活和工作提供服务和便利。...
第5章基于大数据处理的管理模式下信息处理框架设计在大数据背景下,管理的关键就是信息数据的整合与分析,在各个模块中,信息系统的存在尤为重要,数据的传递、收集、服务的提供都离不开信息系统,它是对整个管理模式的一个关键支撑。5.1需求分析首先...
摘要大数据是近年提出的一个新型课题,随着信息技术发展,网络进步,各种移动终端普及应用,人们所面对数据量正越来越大,在生活方方面面均有所体现,人们正面对着大数据时代。随着工业革命的进程,技术的进步在管理方式的演进中的作用越来越明显。大数据...
5.5政府大数据质量评价。5.5.1指标权重系数的确定。5.5.3政府大数据质量评价结果分析。(1)一级指标。该指标体系的整体质量评价满意度得分为80.42,得分尚可。如果换算回5级量表,该得分十分接近4级满意,说明在该体系下用户对政府大数据的数据质...
第4章政府大数据质量评价指标体系的构建4.1政府大数据质量评价指标体系的设立。4.1.1政府大数据质量评价体系的构建原则。构建政府大数据质量评价体系是非常重要的工作,正如前文所说,质量评价体系的构建直接影响质量评价的结果,一个好的质量评价...