摘 要: 本文简要介绍了搜索引擎的原理,指出了大数据环境下搜索引擎用户数据信息存在的安全问题,并针对当今大数据发展趋势,提出了保障搜索引擎用户信息安全的建议。文章具有一定的参考价值。
关键词: 大数据; 搜索引擎; 信息安全;
在大数据时代,搜索引擎帮助用户获取了众多的信息,给用户带来了极大的方便。但是,也引起了一系列的信息安全问题。因此有必要就大数据趋势下的搜索引擎用户信息安全问题进行深入探讨。
1 、搜索引擎原理
通常情况下,搜索引擎可以通过定期搜索和提交网站搜索两种方式实现自动信息搜集功能。其中,定期搜索是通过引擎派出的“蜘蛛”程序实现对IP地址范围内的互联网站的检索。如果在检索过程中发现了新的网站,就会将其自动提取到自己的数据库中。而提交网站搜索是网站拥有者主动向搜索引擎提交网址。
2 、大数据环境下搜索引擎用户信息安全存在的问题
2.1 、信息失真
在使用搜索引擎的时候经常会遇到精度降低、信息失真的问题。用户在利用引擎进行搜索的过程中经常会面临众多的虚假信息,其还会严重威胁个人的生命财产安全。并且,有的钓鱼网站专门冒充正常网站发布很多的虚假信息,给大数据信息的可靠性造成了严重的影响。图1展示了搜索引擎常见的安全事件所占比例。
2.2 、诱发诈骗
在数据信息层出不穷的今天,用户总会不知不觉泄露部分个人隐私。例如在在线交互时,浏览过程也会带来许多副产物,个别非法用户将其进行深入挖掘就会发现其潜在的商业价值,这样不法分子就会通过量化搜索的方式寻求更多的信息,并在此基础上实施诈骗。
图1 搜索引擎发生安全事件所占比例
2.3、 个人信息泄露
就目前互联网的使用情况来看,大部分用户在信息安全方面的意识还比较淡薄。例如,在登录社交网站或者使用公共Wi Fi时,通常要对账户密码进行设置,而这在无形之中就让用户同意了相关的用户协议。在大数据全面普及开来的今天,搜索引擎已全方位融入了我们的工作与生活。尽管大数据为我们提供了众多便捷的服务,但也出现了相当数量的信息泄露事件。不过据调查,用户在使用搜索引擎发生安全事件后,基本只是对相应网址进行了屏蔽或者减少了对相应搜索引擎的使用频率,而对有关问题进行申诉或投诉的用户相当少。
2.4、 数据信息无意识泄露
在大数据时代,网络信息相关技术都在不断发展、不断普及,无论对于个人,还是对于社会、企业以及政府等部门,只要其在网络上有过运行信息,与之有关的身份特征、使用习惯、关注点、兴趣、爱好以及资料等有关信息都会成为能够被存储、被用于分析的数据。所以,对于网络社会来说,任何人的任何行为都会一直处于被实时监视的状态,只要在信息网络中有过的行为都必然会留下足迹。需要关注的是,通常情况下,在信息网络中留下的种种痕迹都会以数据的形式留存在相关的信息系统中,加上当今大力推进的大数据技术的支持,这些数据信息就很容易被整合、计算与处理。基于以上分析不难看出,上述众多无意识的行为很容易成为非法分子恶意网络搜索、恶意网络攻击、恶意窃取信息的途径,并且这些类型的资源是十分容易且无意识、有针对性地威胁到个人、社会、企业以及政府机构等的安全的。所以,如果不懂得正确应用大数据信息技术,就很有可能给社会乃至国家带来众多的安全隐患。
3、 大数据趋势下保障搜索引擎用户信息安全的建议
3.1、 管理方面
(1)明确数据使用者的责任
一方面,数据使用者应当充分了解自身的责任,要有意识地保证其输出数据结果的真实性、可靠性。同时,数据使用者要注意设置隐私保护模式。特别是在当今大数据技术突飞猛进的时代,数据使用者要更加注意自身行为,要勇敢担起自身责任,禁止出现个人数据被非法再利用的行为出现。
(2)提升搜索行业的自律性
事实上,出现用户数据信息安全问题并不是单独某个搜索引擎造成的,整个搜索行业都有脱不开的关系。因此,整个搜索引擎行业都应当高度重视自律性问题。为此,相关的搜索引擎企业需要制定科学、有效的行业准则,不断提升员工的职业操守,全方位规范对数据的操作行为,严格避免操作不当或为了谋取商业利益造成用户信息被泄露等一系列的安全问题。
(3)完善相关的法律保护
尽管我国已出台了《侵权责任法》、《信息安全技术公共及商用服务信息系统个人信息保护指南》等相关规定用于保护个人信息安全。但是,总体来说我国在用户信息安全保护方面的法规条例还相对零散。因此,必须结合大数据时代的特征制定针对性强的有关法律保护,以不断完善大数据时代的隐私保护法。
3.2、 技术方面
(1)用户安全补丁
一方面,用户要注意有效利用安全补丁修复系统漏洞,以更好地解决网络信息问题。同时,用户应当意识到自己才是处理网络数据信息安全问题的最好补丁。因此,用户必须想方设法不断提升自身的知识水平与自我保护能力,让自己具有充足的能力评估威胁,从而全力维护个人信息的私密性。
(2)技术保护
为了在充分实现大数据安全高效搜索的同时做好隐私保护,就要在技术保护方面下足功夫。如图2所示,可以从大数据中信息归约与知识发掘、用户搜索需求感知的任务表示与管理以及隐私感知的快速高精度智慧解答等方面入手,寻求科学的技术支撑。
针对以上三大科学问题,将内容细致划分并寻求各自的特点。如图3所示,要深入挖掘面向大数据的信息融合以及知识萃取的相关技术,要充分考虑大数据高维度、时空演化等特有属性研究粒度化的知识表示和推演技术。由于现有的用户平台不能充分感知不同用户的个性化需求,而且众多平台的特征参数未对用户透明,所以要考虑建设支持平台与用户互动的搜索任务表示模型。同时,要全面掌握用户搜索任务的数据资源特点,着力研究基于用户体验驱动的任务管理技术。另外,大数据搜索是具有生命周期的,要结合不同阶段的特征搭建基于差分隐私的安全搜索机制。
图2 技术支撑关系
图3 科学问题细化
4 、结论
在大数据趋势下,搜索引擎用户信息安全面临着众多的问题与威胁。因此,必须结合行业特征,利用科学方法,采取有效监管措施保证数据信息安全。
参考文献
[1]王赛.营销4.0:从传统到数字,营销的“变”与“不变”—“现代营销学之父”菲利普·科特勒专访[J].清华管理评论,2017(03):60-64.
[2]许超.面向信息安全的垂直搜索引擎的研究与实现[D].上海:华东理工大学,2014.
[3]梅丹.基于信息安全领域本体的语义搜索引擎的设计与实现[D].上海:华东理工大学,2012.
[4]陈华,黄东军.搜索引擎与个人信息安全[J].电脑知识与技术,2010(11):2584-2585,2590.
[5](英)维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.
[6]周丽娜.大数据背景下的网络隐私法律保护:搜索引擎、社交媒体与被遗忘权[J].国际新闻界,2015(8):136-153.
经过3~5年的飞速发展,目前桌面搜索和移动搜索几乎各占半壁江山,移动搜索大有赶超桌面搜索,成为主要搜索途径之势。2013~2014年中国搜索引擎行业竞争持续升级,百度独领风骚的同时,几大追随者毫不懈怠,持续练就内功,同时借助外力,以期对百度构成威胁...
本文从卷烟企业对信息数据检索的需求出发,论述了基于Solr开发出符合自身企业的搜索引擎的可行性,介绍了有关搜索引擎及Solr的相关知识。...
0引言信息检索系统主要为互联网用户提供对资源的检索服务,用户通过输入自己想要寻找的资源信息(诸如资源的部分名称,资源内容中相关关键词等),信息检索系统根据用户提供的检索需求进行资源匹配和资源定位,并按照一定的顺序将匹配的资源反馈给用户。搜...
1引言互联网的深入发展带来了各种类型信息资源数量的快速膨胀。截至2014年6月,我国拥有273万个网站,3.3亿个IPv4地址[1].面对浩瀚巨量的网络资源,用户通过搜索引擎快速获取所需信息尤为重要。目前,我国搜索引擎用户达4.9亿;网民平均使用...
1、引言近年来,随着数字化教育浪潮的不断推进,我国在教育资源建设方面已经取得了巨大的成就,各类教育资源的数量巨大且呈现几何级数增长。随着搜索引擎技术的发展,通用搜索引擎的功能变得日益强大,取得了很大的成功,但其仍有局限性,如搜索的深度不够,...
上世纪中页,传播学家麦克卢汉曾在《理解媒介:论人的延伸》中提出:媒介是人感觉能力的延伸或扩展。这一经典概念的重要意义,在于将人的单一感官和媒体的传播特征进行了对应。例如,从视角延伸到印刷媒介,从听觉延伸到广播以及视、听觉共同延伸到电视。而...
大数据的理论及特征胡春明:大数据在今天已经不是一个新鲜的词汇。不管以前是不是叫大数据,人们都是在用数据看世界。数据分析方法往往采用了统计学上的采样法。只要采样方法在一些情况下足够好,样本数据就能足够反应真实世界的特点。从得到的样本数据...
搜索引擎经历近30年的发展,目前在使用的有几种类型,如全文搜索引擎、分类目录搜索引擎、多元搜索引擎、集成搜索引擎等。但这些都是网络上的公用商业搜索引擎,它们往往不能满足企业的需要。...
第4章模型构建及假设提出。本章在前两章文献综述和理论分析的基础上,结合访谈的结果提出了搜索引擎优化方法和效果的维度,并构建了两者的概念模型,提出了各研究变量之间的假设关系。4.1访谈。访谈法是指研究者通过面对面、QQ等访谈方式,与受访者...
在搜索引擎技术的发展之下,智能检索作为一个新型的检索方式已经渗透到了网络数据的设计中,该种检测方式能够帮助人们检测出高质量的信息,是检索方式发展的一种必然需求,将数据挖掘技术应用在网络资源可以实现智能检索的发展,也能够为人们提供出更加具有针对性...