4 数据收集与评估
4.1 调查的实施
4.1.1 调查方法
本研究采用的是便利抽样的方式,利用网络问卷的方式来获取样本数据。相对于传统的纸质问卷而言,网络问卷具有成本更低廉、样本无地理位置限制等等诸多优势。本研究涉及微信营销,采用网络问卷的方式,更符合微信用户的特点,更容易得到被调查者的认可和反馈。
通过扣扣、微信,向所在的群里推送群消息,以及向好友推送消息消息主要包括问卷星网站链接(问卷 ID 为 4554551)和简单的说明,鼓励群成员积极填写问卷,并鼓励他们转发此链接,从而获得更多的样本容量。
本课题研究的主要内容是微信营销对消费者购买决策的影响,对受访者年龄、工作单位并没有什么特殊的要求,不过需要两个基本要求:受访者必须使用过微信,受访者曾经有独立购物经验,如果有网购经历更好。
4.1.2 样本容量的确定
使用结构方程模型对变量进行评估和关系判定时,样本容量的大小对其最终效果又存在影响。样本的数量在什么区间才能使研究结果在置信区间内成立。研究样本的容量与研究内容、研究目的、科研经费、时间跨度,置信区间的范围等多项因素有关。因此,大量的学者对次进行了研究分析。
1996 年。Lomax 和 Schumarker 通过实际调研发现,若采用 SEM,其样本容量一般在 200 到 500 之间。1957 年,Bentler 和 Chou 则建议,研究的变量符合正态分布,并无大量缺省的情况下,每个研究变量只需要 5 个个案就足够了。若不符合正态分布,则要求至少在 10 个以上。
从理论上讲,对于 SEM 分析而言,样本数量越大越好。但是在实际调研过程中,卡方值会因为样本容量过大而变得显着,导致整个模型被拒接的可能性比较大。样本容量过小,不具有代表性。
4.1.3 数据清理
本次问卷从 2014 年 7 月份开始,11 月初结束,共收到问卷 268 份。由于问卷星系统的设置限定,如果发生漏答题目,该问卷是不能被提交的,因此样本中并没有漏答的情况。但是由于问卷的设计逻辑关系,和对每一份问卷的分析,删掉随意作答的问卷。
例如有 12 位被调查者并没有关注过企业微信号或者公众号,而对后面的问题进行了随意填写。该问卷作为无效处理。
经过数据清理后,有效问卷数量是 256 份,有效问卷比为 95.52%.本问卷共有 31个问题(3 个个人信息和 1 个基本问题),问项与样本的比例大概在 1:8.25,超过 1:5的最低标准。因此本研究的样本容量是符合调研的基本需求的。
4.2 问卷描述性统计
我们可以从数据基础统计分析得出所研究数据的基本规律,找出总体特征,为后面的细致分析打下基础。
4.2.1 样本人口统计数据特征
表 4.1、表 4.2、表 4.3 是正式调查样表的基本特征。通过对数据的分析,可以看出被调查者大部分集中在 18~26 岁之间,其中 23~26 岁百分比高达 73.43%,而大学本科学历和研究生比例占比高达 98%,这是因为便利抽样,大部分的被调查者来自本人研究生同学。研究生的比例和年龄的区间大体上是吻合的。
4.2.2 企业微信关注特征
表 4.4 是被调查者关注企业微信号/公众号的数目,从表中可以读出,大多数人只关注了 4 到 6 个企业微信号/公众号,其中关注 7~9 个企业的有 27.34%,关注 10 到 12 个企业的人数百分比为 21.09%.
4.2.3 测量指标的描述性统计
描述性统计主要包括两个极值、平均值、标准差、偏度、峰度等统计量。被调查者回答问题的差异可以通过两个极值来反映,而样本数据的总体分布情况可以通过标准差、偏度、峰值来反应。当偏度值大于 3 时,或者峰值大于 20,就意味着某些变量分布是不符合要求的。
从表中可以看出,变量的最大值均为 5,最小值为 1.若符合标准正态分布时,偏度统计量和封堵统计量应接近零。最大偏度系数为 0.114,最大峰值为 1.496,最大均值为 3.79,最小均值为 2.79.这几项指标表明所有的变量符合正态分布,由此可见整个问卷调查数据是有效的。
4.3 数据探索性因子分析
评估数据质量是通过分析样本数据的信度和效度来实现的。具体评估指标见第三章第四小节。
4.3.1 效度分析
本研究在阅读大量文献的基础上,经过对专家和部分用户的访谈构建基本模型和初步的问卷调查,并对其进回访,修正问卷调查和假设模型,从而保证正是问卷调查的有效性。主要包括微信营销、品牌形象、购买决策这三个层面的正式问卷的结构效度分析。
对于不同层面进行 KMO 样本检测和 Bartlett 球体检验。具体量化表见下表。
首先对微信营销的三个变量进行 KMO 和 Bartlett 氏球体检验。当样本足够的时候,K M O 系数为 0.872,采用 Bartlett 氏球体检验,卡方值为 2243.537,自由度为 193,显着性水平为 0,这些数据表明是适合做因子分析的,具体见表 4.6.
对微信营销层面采取主成分分析法,提取特征根不小于 2 的因子,共有 3 个,累计解释方差为 0.681,经过旋转后的,他们的成分矩阵见表 4.7.这三个变量的测量项在对应的成分上均超过 0.5,是符合我们的检测标准的。
对品牌形象的三个变量进行 KMO 和 Bartlett 氏球体检验。当样本足够的时候,KMO 系数为 0.826,采用 Bartlett 氏球体检验,卡方值为 1375.658,自由度为 164,显着性水平为 0,这些数据表明是适合做因子分析的,具体见表 4.8.
对品牌形象采取主成分分析法,提取特征根不小于 2 的因子,共有 3 个,累计解释方差为 0.732 经过旋转后的,他们的成分矩阵见表 4.9.这三个变量的测量项在对应的成分上均超过 0.5,是符合我们的检测标准的。
对购买决策进行 KMO 和 Bartlett 氏球体检验。当样本足够的时候,KMO 系数为0.761,采用 Bartlett 氏球体检验,卡方值为 294.253,自由度为 25,显着性水平为 0,这些数据表明是适合做因子分析的,具体见表 4.10.
对品牌形象采取主成分分析法,提取特征根不小于 2 的因子,共有 1 个,累计解释方差为 0.824,经过旋转后的,他们的成分矩阵见表 4.11.测量项在对应的成分上均超过 0.5,是符合我们的检测标准的。
4.3.2 信度分析
在对微信营销、品牌形象、购买决策三个层面上的 7 个变量进行量分析 27 项测向的一致性,具体情况见下表 4.12.有表中的数据可以看出,所有的变量的 Cronbach's a均大于 0.7,是符合要求的。
4.4 数据验证性因子分析
该部分需要对几个部分进行测量,测量项目的信度、组合信度、测量因子效度 AVR.
一般认为,当项目的标准负载大于 0.5,组合信度大于 0.7,而 AVE 的平方根与相关系数进行比较,若前者远大于后者则说明不同潜变量之间的测量项目之间具有明显的差异。
表 4.13 为两两相关项的相关系数,该系数与 AVE 的平方根相比较,可以看出是符合要求的,表 4.14 给出验证性因子分析结果。
4.5 本章小结
本章主要在对各变量量表设计的基础上形成了初步问卷,并为确保调查工具更加准确,进行了预调研,在预先测试基础上重新修正调查测项,并形成最终调查问卷,然后我们根据研究需要,确定了样本容量的大小以及样本选择的对象,在以上所有工作基础上进行了问卷的正式发放与回收,并完成了对数据的初步分析,为后续结构方程模型引入以及假设验证做好了准备。