第 4 章 模型构建及假设提出。
本章在前两章文献综述和理论分析的基础上,结合访谈的结果提出了搜索引擎优化方法和效果的维度,并构建了两者的概念模型,提出了各研究变量之间的假设关系。
4.1 访谈。
访谈法是指研究者通过面对面、QQ 等访谈方式,与受访者进行交流,以获取受访者客观、真实的访谈结果,用有限样本来代表总体的特征,辅助进行实证分析的一种研究方法。访谈时候要讲究灵活性,根据被调查者的类型,适当调整访谈问题。营造一种轻松愉悦的访谈氛围,让受访者畅所欲言,真实记录访谈资料,获取有效全面的实证资料,为本文研究打好基础。
4.1.1 访谈目的。
在选取搜索引擎优化方法和效果构建模型前进行访谈,是为了更好的了解现实企业中开展搜索引擎优化的主要方法,以及带来的效果。参考受访者提供的访谈成果,最终构建搜索引擎优化的概念模型。开展本次访谈主要有以下几个目的:
(1)了解受访者对搜索引擎优化的认知情况,在企业的应用现状,为模型构建提供依据。
(2)获知较为全面有效的搜索引擎优化方法,和受访者探讨相关优化方法的科学性和合理性,为自变量的选取增加依据。
(3)深刻认识搜索引擎优化所带来的影响,为因变量的选取增加依据。
(4)明确搜索引擎优化不仅要面向搜索引擎,更要面对广大用户,尤其是自己的目标客户。
4.1.2 访谈内容。
本研究共选取了 20 位访谈对象,其中,5 名来自不同高校的电子商务专业的老师,其他 15 名是企业的领导和员工。此次访谈主要采用的是面对面访谈、电话访谈、QQ、微信和邮件访谈,访谈内容是开放式的,没有固定答案,便于受访者畅所欲言,从而获取更多有价值的信息。
访谈开始时,先询问受访者对企业搜索引擎优化的了解情况,记录他们对企业开展搜索引擎优化的态度。在受访者对搜索引擎优化有了初步的认识后,根据提前拟好的访谈提纲开始正式的访谈。访谈提纲如下所示:
(1)请问您了解企业的搜索引擎优化吗?您认为企业应该开展搜索引擎优化吗?
(2)您了解的搜索引擎优化方法都有哪些?您认为哪些方法重要呢?
(3)您认为搜索引擎优化能给企业网站带来什么影响呢?
(4)您认为搜索引擎优化仅仅是面向搜索引擎的吗?
(5)您对本次访谈有什么意见和建议呢?
4.1.3 访谈结论。
根据访谈提纲与受访者进行沟通交流,并记录整理访谈结果,主要得出以下结论:
(1)受访者都对企业的搜索引擎优化有一定的了解,并认为企业应该开展搜索引擎优化。其中,高校的 5 名电商老师对搜索引擎优化有较为系统的认识,能够较全面的说出搜索引擎优化的概念。企业领导和员工中有 10 名受访者表示熟悉搜索引擎优化,且自己企业正在尝试开展搜索引擎优化。剩余 5 名受访者不熟悉搜索引擎优化,但通过企业培训和互联网学习,能基本了解搜索引擎优化。
(2)受访者认为企业开展搜索引擎优化可以重点从关键词、链接、标题、网站内容等角度着手。有些受访者还提到了搜索引擎优化的其他方法,如长尾关键词、错误页面、网站更新频率、Meta 描述等。对于搜索引擎优化带来的影响,受访者普遍认为搜索引擎优化能够提高网站在搜索引擎中的收录数量和自然排名,增加用户的访问流量,最终实现转化和销售,将访问者变成真正的消费者,达成买卖,或扩大网站的曝光机会,起到宣传的效果。
(3)搜索引擎优化不仅仅是面向搜索引擎的,更重要的是面向用户,因为单纯提高在搜索引擎中的排名,不一定会有用户的点击量。电商老师谈到在进行搜索引擎优化时候,一定要从用户的角度出发,满足用户的需求。用户有特定的搜索偏好,该偏好会直接影响用户的信息搜索行为[48],这就决定了他们点击行为的不同。网站排名靠前,且网站内容与自己需求相符,用户会去访问点击查看购买,用户的行为会影响搜索引擎的判断和网站排名。优化过程不能忽视对用户的友好性,根据用户的搜索偏好来确定关键词,使用用户常用的关键词,增加被搜索的概率。
(4)访谈结论表明,受访者普遍对搜索引擎优化给予了较高的期望,认为搜索引擎优化在企业网络营销中扮演着重要的角色,尤其是资金匮乏的中小企业,搜索引擎优化以成本低、持久稳定、不用承担无效点击风险的优势,被企业所拥护。他们表示会积极开展搜索引擎优化,使用白帽技术来不断尝试有效科学的优化方法。搜索引擎优化不仅要对搜索引擎友好,更要对用户友好,要提高用户的上网体验,增加他们的访问量,挽留用户增加浏览时间和浏览频率。本次访谈的受访者是与搜索引擎优化有着直接关系的人员,他们的建议更有针对性,更值得借鉴。
4.2 变量选取。
4.2.1 搜索引擎优化方法变量的选取。
总结国内外文献综述,搜索引擎优化相关理论和访谈结论,得出搜索引擎优化主要方法有关键词选择、关键词密度、关键词分布位置、Title 长度、Title 中关键词的个数、Meta 描述长度、Meta 描述中关键词的个数、内部链接、导入链接、导出链接、404 错误页面、页面打开速度、域名、网站地图、网站内容及更新频率、长尾关键词、主动访问用户数等。
虽然这些方法在进行网站优化时候都起着一定作用,但是进行实证研究,这些方法并不是都适用。不合适的原因主要有以下方面,一是有些方法没法定量描述,如关键词分布位置、网站内容等。二是某些定量方法是有长度限制的,也已经被先前研究者证实过,如关键词数量,标题长度、Meta 描述长度。三是数据缺失,有些网站可能没有站点地图,网站更新频率无法查找,主动访问用户数难以获取。四是我们搜索的主要是已经存在的网站,那么网站域名存在时间的长短、域名内是否有关键词,是后期很难改动的,所以不予考虑。最后是根据文献综述看出,导出链接较之导入链接和内部链接,重要性次之,因此本文只研究导入链接和内部链接。
基于以上各方面的考虑,选取的自变量为:关键词密度、长尾关键词、Title中关键词的个数、Meta 描述中关键词的个数、内部链接、导入链接、404 错误页面、页面打开速度共八个变量。
(1)关键词密度。
关键词是用户在搜索引擎搜索框中输入的核心词,百度会自动提炼用户输入内容的重要关键词。关键词选择要恰当,如果选取不当,搜索引擎可能会把握不准网站要优化的核心关键词,用户进行检索时候,搜索引擎不会将相关优化页面呈现给用户,或者不会将网页排在搜索结果中靠前的位置。关键词如果选取不恰当,即使排在搜索结果的前几页,但是不满足用户的需求,也不会有访问量。在一定范围内,一个网页的关键词出现频率越高,搜索引擎会认为该网页内容与相应关键词的相关性越高,从而在搜索引擎中的排名越高。但是关键词的出现频率有一定的限制,并非越多越好,于是搜索引擎优化的研究者提出了关键词密度的概念。
合理的关键词密度能够提高网站排名,关键词密度太低,优化效果不明显,达不到优化的目的;过度使用可能会造成关键词堆砌,会受到搜索引擎的惩罚,因此对关键词密度的优化就很重要。几乎每个学者都会提到关键词密度的优化,但是目前来关于关键词密度的合理范围,研究者没得出一致的结论。马晓玲(2005)提出关键字的密度最好不超过文本数的 3%或者更少,企业要借助工具软件来控制关键词密度。焦丽(2009)等、任勇旗(2009)等认为企业开展搜索引擎优化要将关键词密度控制在 1%-7%.Ravi Sen(2005)、付真真(2009)提出关键词密度的合理范围为 2%-8%.魏兆连(2010)认为关键词密度在 3%-8%是一个较为适当的范围。
设定这一变量就是为了探究关键词密度与搜索引擎优化效果的关系,若关键词密度对搜索引擎优化有影响,就要尝试分析合理的关键词密度取值。
(2)长尾关键词。
长尾关键词就是在核心词的基础上加上如地区、品牌、用途等的修饰词而组成的,一般比较长,虽然搜索次数少但转化率较高。如化妆品这一关键词,可以构成的长尾关键词有:韩国化妆品、化妆品代理、化妆品试用中心等。任勇旗(2009)等认为如果网站名气大,可以将自己的品牌加到关键词列表中。王新昊(2012)等提出长尾关键词能提高网站在搜索引擎中的综合排名,使用长尾关键词进行优化不仅成本低,还能实现用户的精准匹配并提高用户的转化率。很多学者都开始谈及长尾关键词在搜索引擎优化中的重要性,企业也逐步尝试长尾关键词在网站的使用,本文就试图探究长尾关键词的个数对搜索引擎优化的影响,研究的长尾关键词范围仅限于标题和 Meta 标签中,包括 Meta Keywords 和 MetaDescription.
(3)Title 中关键词的个数。
标题是网页的核心,浏览器顶端的显示条出现的信息就是网页标题,一般也就是搜索引擎的搜索结果标题。在源代码中对应的 HTML 语言为:<title>标题</title>.通过阅读百度官方文件知道,百度搜索引擎只会保留标题前 60 个字节的内容,过长会被截取掉,不利于用户找到自己想要的信息,因此标题的长度要有一定的限制,周鑫(2014)提到标题长度会负向影响到网站的跳出率,因此长尾关键词应该在规定范围内尽可能的长。基于此,我们对标题长度不作过多研究。
标题最先被用户看到,Title 中要放一定的关键词(马晓玲,2005)。站在用户的角度确定关键词,当用户搜索时候,标题中的关键词会增加权重,从而使网站在搜索引擎中的排名靠前,增加了用户点击的可能性。将关键词放在靠近标题的位置,这样对搜索引擎和用户都更友好。魏兆连(2010)提到标题中关键词只放 1-2 个,过多会稀释核心关键词,搜索引擎无法准确判断页面要突出的关键词。
标题中到底要放多少关键词,标题中关键词的个数是如何影响搜索引擎优化效果的,因此本文确定了这一自变量,并用实证验证标题中关键词的个数与搜索引擎优化效果的关系。
(4)Meta 描述中关键词的个数。
Meta 描述在源代码中的描述是:<meta name="description"content="网页描述">.百度官方文件显示,Meta description 不参与网页权值的计算,但是它会影响用户体验。用户判断搜索内容是否是自己想要的,主要就是参考 Metadescription.
尽管搜索引擎技术的不断发展,Meta 标签的设计对于搜索引擎优化来说还是很有必要的,但是很多企业网站是没有进行 Meta 标签优化的。大型企业凭借本身的知名度或许影响不大,但对于中小企业来说,这是将网页内容展现给用户的很好途径。马晓玲(2005),陈炎龙(2006)等提出要在 Meta 描述中加入主要的关键词。吴泽欣(2014)认为在限定的范围内,主关键词出现 5 次左右,每个辅关键词只出现 1 次是比较合理的。如果主辅关键词长度过大,要适当的缩小主辅关键词的出现频率。冯英健(2013)认为不能在 Meta 描述中堆砌关键词,要自然而然的描述网页核心内容。
(5)内部链接。
内部链接指网站内部页面之间的链接关系,虽然焦丽(2009)等学者提出内部链接对搜索引擎优化效果的影响不大,但内部链接与外部链接不同的是,它受网站管理者直接控制的,建立网站地图、控制网页到首页的点击距离、网站导航中的链接文字放上关键词,都对搜索引擎优化有帮助。唐卫东,刘存后(2011)提出合理的内部链接有利于提高用户体验和搜索引擎对网站的爬行索引效率,进而提高在搜索引擎中的收录数和网站权重[49].搜索引擎对每个页面的内部链接数量有一定限制,规划页面时要将内部链接数量控制在合理范围内(吴泽欣,2014)。
马晓玲等(2005)提出一个页面中的内部链接应少于 100 个。本文研究的是搜索结果对应的百度快照页面中内部链接数量对搜索引擎优化效果的影响,以及适合的内部链接数。
(6)导入链接。
导入链接,又叫反向链接,是别的网站指向自己网站的链接,是其他网站为自己的网站投票。导入链接越多,导入链接的质量越高,说明其他的有质量网站对自己网站更认可,搜索引擎会增加自己网站的权重,从而使网站排名靠前。导入链接是众研究学者都非常重视的优化因素,国内的学者马晓玲、任勇旗及国外的学者 Er.Tanveer Singh 等都提到导入链接的重要性。昝辉(2015)提出导入链接数越多,投票越多,对排名越有利。导出链接是与导入链接相对应的,是指自己网站指向别的网站的链接。搜索引擎对每个页面导出链接的数量是有限制的,不能在同一页面上堆放过多导出链接。导出链接过多,会使目标页面得到的权重降低,还会被搜索引擎误以为是垃圾页面(吴泽欣,2014)。导出链接是给别的网站投票,重要性次之,本文不考虑。
(7)404 错误页面。
404 错误页面是指用户访问的页面不存在或链接错误而返回的页面。404 错误难以避免,一般用户碰到默认的 404 错误页面,关闭窗口离开浏览页面的概率是非常大的。但是客制化的 404 错误以愉悦诙谐的方式告诉用户页面已经出错,并提供点击选项,帮助用户继续进入网站访问其他的界面,效果是非常显着的。
Fuxue Wang(2011)、李忆(2014)、昝辉(2015)等提出了特别设计的 404错误页面能提供更多信息,是有利于搜索引擎优化效果的。404 错误页面形成原因很多,本文只是考虑用户输入错误链接时候,查看到的 404 错误页面形式,是服务器默认错误页面还是客制化的错误页面。客制化的 404 错误页面就是经过特别设计的错误页面,配以诙谐可爱的语言提示用户错误原因,如域名解析错误。
此外,还要提供给用户返回首页的链接或站内搜索框或联系客服等解决方法。
(8)页面打开速度。
页面打开速度,就是用户点击某网页时候,该网页的下载速度。如果网页打开速度太慢,迟迟不能完整显示甚至毫无反应,用户是没有耐心等着页面打开的,这样网页被关闭的概率会很大,网站可能就失去了一个潜在客户,因此对页面打开速度的优化是很有必要的。很多学者已经提出了相关的研究,如马晓玲等(2005)提到要提高服务器响应速度;毛冠嫱(2011)等认为页面显示速度快,不仅方便用户查找所需信息,还有利于搜索引擎抓取;周鑫(2014)通过实证研究了页面反应速度对搜索引擎优化效果的影响;昝辉(2015)认为页面打开速度是影响自然搜索排名的直接因素之一。因此要将页面打开速度纳入搜索引擎优化方法中,并分析是如何影响搜索引擎优化效果的。
为了方便收集数据,研究百度搜索引擎中的不同排名网站相应的优化方法,首先明确搜索引擎优化方法的相关说明和优化方式。
4.2.2 搜索引擎优化效果变量的选取。
在选取了搜索引擎优化方法维度之后,我们需要对这八大搜索引擎优化方法的效果进行衡量,因此需要选取搜索引擎优化效果维度。由以上文献梳理得出,搜索引擎优化效果测量的主要指标有:搜索引擎收录数、在搜索引擎中的排名、Alexa 排名和 China Rank 中国网站排名、PV 页面浏览量、IP 地址访问量。
研究没选 China Rank 中国网站排名,原因是本文搜索的网站范围很广,中国网站排名只对在中国注册的网站和部分在中国运营的外国网站进行排名,有一定局限性。Alexa 世界排名不适合作为本研究的因变量,主要有两方面原因。一方面是,Alexa 在中国的排名主要是面向大型企业,如百度、淘宝、新浪等,但我们研究的主要是中小企业,中小企业数量巨大,很多中小企业是无法在 Alexa网站查看到排名的。另一方面是,Alexa 网站的排名是通过对 Alexa 工具条用户采样得到的[50](余梁,2004),而且工具条必须安装在 IE 浏览器中。国内网民平时上网,一般是不会安装 Alexa 插件的,使用 IE 外别的浏览器的用户也大有人在。这部分用户的访问数据,是无法发送给 Alexa 服务器的。对于中文网站来说,Alexa 排名与网站实际访问情况有差异。
在基于百度搜索引擎的基础上,排除掉不适合的指标,最终选取的因变量是百度收录数、百度自然排名、访问量(日均 IP 访问量)。
(1)百度收录数。
百度收录数,或者称之为百度索引数,指的是百度收录网站的页面数量。百度收录的页面数也可以反映搜索引擎优化的效果,一般来说,优化过的网站收录数量比没有优化过的网站要多。谭思云(2008)认为开展搜索引擎优化的前提是,让搜索引擎收录尽可能多的页面。何艳东(2009)提出从网站自身、空间、域名、外部链接四个方面来优化网站,并使网站快速被搜索引擎收录并提高网站在搜索引擎中的排名。昝辉(2015)提到页面收录是进行搜索引擎排名的基础,因此增加在搜索引擎中的收录数是进行搜索引擎优化的目的之一。
本文基于百度搜索引擎进行实证研究,百度收录数可以通过在百度搜索框中输入"site:网站域名"进行查询。只有页面先被搜索引擎收录到索引数据库中,用户在输入关键词搜索时候,搜索引擎才有可能将页面返回给用户。该方法来查询收录数量,往往不够准确。但考虑到网站的某些重要数据只有内部管理员可以获取,其他人是没法查看的,本文为研究需要,仅通过 site:网站域名获得估算百度收录量。搜索引擎收录是网站获得排名的基础,因而也是衡量网站优化效果的指标之一。
(2)百度自然排名。
搜索引擎优化因为成本低、见效快,更能精准定位用户的搜索需求,而被企业所信赖,尤其是中小企业。大型企业资金充足,完全可以通过付费推广实现好的排名,又加上大型企业的品牌影响力,链接广度,在搜索引擎中的收录数量本身就不少,进入倒排索引库的页面数量也很多,所以在搜索引擎中的排名不会太差。但是中小企业本身资金缺乏,在付费推广方面不占优势,因此就积极开展搜索引擎优化来提高自然排名,以获得较好的访问量。本研究主要关注的就是典型的中小企业的搜索引擎优化方法,研究其搜索引擎优化方法与效果的关系。搜索引擎优化的基本目标就是增加在搜索引擎中的收录数,提高在搜索引擎中的自然排名,所以网站自然排名就是非常重要的用来衡量优化效果的指标。
薛晓霞等(2009)提出在网站设计开发之初,就要将搜索引擎工作原理,还有搜索引擎对网站的审核规则和评价标准考虑其中。采取网站主题与内容相关性的策略、关键词策略、网站命名策略、页面设计策略和站内站外链接策略,最大限度地提高网站在搜索引擎中的自然排名[51].唐卫东,刘存后(2011)提出了用户需求、用户体验为核心的关键词优化策略,主要包括用户需求定位,竞争对手分析、长尾关键词的挖掘、网站结构、链接等策略。这些适合中小企业电子商务网站的中长期优化和推广的优化策略有助于提高在搜索引擎中的收录量和自然排名,从而获得更高的访问量。庞东升(2012)提出了针对中小企业的搜索引擎优化方法,如创造高质量的原创内容并有规律地更新,多使用静态页面,多使用文字,丰富网站的关键词,优化站点的内部链接和外部链接等。方便搜索引擎来访,以提高网站在搜索引擎中的自然排名,使得用户的浏览量增加,增强网站的销售能力和宣传能力[52].
梳理文献总结出,企业搜索引擎优化做的好,可以提高网站在搜索引擎中的自然排名。在统计网站自然排名时候,要去掉推广链接和广告投放区域,重点搜集中小企业的优化排名。探究中小企业的搜索引擎优化方法与效果的关系,为中小企业开展搜索引擎优化起到一定的借鉴作用。
(3)访问量。
搜索引擎优化的目的就是给用户创造良好、有效的用户体验[53](PalviArora,2014),探究用户的访问情况是评测优化效果的良好指标。页面收录是基础,搜索引擎对收录来的原始页面提取关键词,建立页面与关键词的正向索引,再对所有关键词重组,建立关键词与页面的倒排索引。用户在搜索框中输入关键词,搜索引擎很快的从倒排索引中匹配与之相关的网页,并通过排名算法将页面返回给用户,满足用户快速获取信息的需求,使用户得到良好的上网体验,用户访问量也会增加。
访问量能简单的反映网站的访问情况,搜索引擎优化效果可以通过访问量来体现。企业在评价网站的访问情况时,主要是从 IP 地址访问量和页面浏览量来权衡的。
IP(独立 IP),即拥有特定唯一 IP 地址的计算机访问网站的次数(付真真,2009)。一个 IP 只计算一次,一天之内相同的 IP 地址多次访问某一网站,IP 地址访问数也只计算一次。付真真认为统计 IP 地址数较易实现,真实性较高,已经被大多数机构用来作为衡量网站流量的指标。
PV(Page View),即页面浏览量或点击量。用户每访问一次网站的页面就会被记录一次,一天之内多次访问同一页面,页面浏览量累计。该指标反映的是用户访问网站页面的总数量,在一定程度上可以体现搜索引擎优化的效果。
Fuxue Wang(2011)确定了搜索引擎收录数量、独立 IP 的数量、PV 浏览量等变量来体现搜索引擎优化的效果。李忆(2014)认为日均 IP 地址访问量和日均页面访问量有很强的共线性。周鑫(2014)提到将 IP 数和页面浏览量两者结合起来,从而更好的反映访客对该网站的访问情况。考虑到有些用户可能反复查看自己对网站感兴趣的页面,若次数被累计,对反映优化效果没有很大作用。所以本文选取独立 IP 访问量,同一 IP 多次访问只记一次,为收集数据方便,用一周平均的日均 IP 访问量来表示,反映平均每天访问网站的独立 IP 数。
【摘要】从知识管理、知识服务和科研教育三个不同角度分析机构知识库的应用环境,考虑技术互操作、语义互操作、管理互操作和多个相关利益方需求,构建相应的互操作应用需求框架,系统分析已有和正在制定的基础互操作规范、扩展互操作规范和管理互操...
经过3~5年的飞速发展,目前桌面搜索和移动搜索几乎各占半壁江山,移动搜索大有赶超桌面搜索,成为主要搜索途径之势。2013~2014年中国搜索引擎行业竞争持续升级,百度独领风骚的同时,几大追随者毫不懈怠,持续练就内功,同时借助外力,以期对百度构成威胁...
本文从卷烟企业对信息数据检索的需求出发,论述了基于Solr开发出符合自身企业的搜索引擎的可行性,介绍了有关搜索引擎及Solr的相关知识。...
0引言信息检索系统主要为互联网用户提供对资源的检索服务,用户通过输入自己想要寻找的资源信息(诸如资源的部分名称,资源内容中相关关键词等),信息检索系统根据用户提供的检索需求进行资源匹配和资源定位,并按照一定的顺序将匹配的资源反馈给用户。搜...
1语音信息及其特点自然界存在着各种各样的声音,对声音进行数字化处理得到的结果称为音频,是一种重要的计算机多媒体信息。20Hz~20kHz是正常的人耳能够感知合理频率范围。音频信息中的一种重要类型为语音,具有以下重要特征:(1)由高度抽象的概念交流...
1引言互联网的深入发展带来了各种类型信息资源数量的快速膨胀。截至2014年6月,我国拥有273万个网站,3.3亿个IPv4地址[1].面对浩瀚巨量的网络资源,用户通过搜索引擎快速获取所需信息尤为重要。目前,我国搜索引擎用户达4.9亿;网民平均使用...
1引言在线社交网络是一种在信息网络上由社会个体集合及个体之间的连接关系构成的社会性结构。在线社交网络可分为4类:1)即时消息类应用,是一种提供在线实时通信的平台,如QQ、微信等;2)在线社交类应用,是一种提供在线社交关系的平台,如Facebook...
1、引言近年来,随着数字化教育浪潮的不断推进,我国在教育资源建设方面已经取得了巨大的成就,各类教育资源的数量巨大且呈现几何级数增长。随着搜索引擎技术的发展,通用搜索引擎的功能变得日益强大,取得了很大的成功,但其仍有局限性,如搜索的深度不够,...
上世纪中页,传播学家麦克卢汉曾在《理解媒介:论人的延伸》中提出:媒介是人感觉能力的延伸或扩展。这一经典概念的重要意义,在于将人的单一感官和媒体的传播特征进行了对应。例如,从视角延伸到印刷媒介,从听觉延伸到广播以及视、听觉共同延伸到电视。而...
大数据的理论及特征胡春明:大数据在今天已经不是一个新鲜的词汇。不管以前是不是叫大数据,人们都是在用数据看世界。数据分析方法往往采用了统计学上的采样法。只要采样方法在一些情况下足够好,样本数据就能足够反应真实世界的特点。从得到的样本数据...