摘要:在信息网络时代, 大数据的收集、开发与利用具有重要的商业价值, 受到了政府与企业的高度关注。然而, 如何界定大数据的财产性质在学术界尚未达成一致意见。目前, 关于大数据的财产性质存在汇编作品说、邻接权客体说、新型财产权说的争论。大数据符合我国法律对商业秘密的定义, 应当把大数据定位于商业秘密。借助已有的商业秘密相关立法, 可以为大数据提供全面化、立体化保护。当大数据是以个人信息为内容时, 侵犯大数据的行为可能同时构成对个人信息的侵犯。基于大数据而得出的研究成果, 以是否独立于大数据为标准, 可以分别视为作品和汇编作品。
关键词:大数据; 信息财产权; 知识产权; 商业秘密;
目前, 大数据的收集、开发与利用已经成为一个热门话题, 得到了政府与企业的高度重视, 同时, 大数据研究成果已经被广泛应用于物流、广告、交通、医疗等领域, 取得了良好的经济效益和社会效果。近年来, 因为大数据归属而引发的争端开始出现, “丰鸟大战”的本质是顺丰与“菜鸟”对物流大数据的争夺。随着大数据经济的发展, 以大数据为核心的争端将会更为激烈。然而, 法律界对于大数据的法律性质仍然存在争议, 这使得保护大数据的法律规范不够明确, 严重影响着大数据经济的进一步发展。
为了明确大数据争端适用的法律规范, 应当对大数据的财产性质进行研究。本文首先对大数据的含义做出说明;其次, 对已有的大数据财产性质的观点进行梳理, 指出目前学说存在的问题;再次, 提出大数据属于商业秘密的观点, 并对此进行论证;最后, 在此基础上对侵犯大数据适用法律的问题展开研究。
一、大数据的含义界定
虽然大数据已经成为理论界与学术界讨论的热点词汇, 然而, 学者们经常在不同意义上使用大数据。有学者在数据信息本体意义上理解大数据的含义, 也有学者认为大数据实际上是指一种分析方法。按照国务院出台的《促进大数据发展行动纲要》对大数据的界定, 大数据是以容量大、类型多、存取速度快、价值密度低为主要特征的数据集合。这是我国权威部门对大数据的规范定义, 本文即在该意义上使用大数据。结合我国规范性文件对大数据的定义, 有必要对大数据的内涵展开深入剖析。
首先, 大数据是相对于少量数据或者单个数据而言的, 这是大数据“容量大”特点的体现。大数据是海量数据的集合, 举例而言, 如果每十分钟测量一次气温, 每次的测量结果构成一个气温数据, 那么, 一年中所测量的气温数据集合在一起就可以称为大数据。按照同样的逻辑, 每个人的个人信息是单个数据, 当大量的个人信息汇集到一起就形成了大数据。其次, 大数据具有“类型多”的特点。大数据的类型取决于构成大数据的单个数据的类型, 天气、交通、经济、身体指标、比赛成绩等等信息都可以表现为数据, 单个数据种类的繁多决定了大数据的类型也非常多样。最后, 大数据“价值密度低”的特点决定了无序性是大数据的常态。大数据的本质是把海量单个数据集合在一起而形成数据库, 而不考虑该数据是否准确或者有用, 同时, 数据的简单集合难以体现出相关性。大数据能否呈现出相关性取决于使用的研究工具和研究方法, 在很多时候, 即使方法、工具得当也不能找出大数据中的规律。
值得说明的是, 大数据不是网络时代的产物, 而是一种客观存在。当人们在谈及大数据时, 往往是在信息网络意义上而言的。其实, 人类社会无时无刻不在产生数据, 例如, 古代社会中人们的衣食住行、国家的宏观数据、自然界的风云变换等大量信息均可以称为大数据, 只是古代社会欠缺收集和分析数据的能力, 很多数据要么没有被记录或者被记录于纸张之中, 古代社会中的大数据未能表现为数字化。现代信息网络技术的发展, 使得数据的收集与处理变得极为便捷, 为大数据的应用提供了现实基础。也就是说, “存取速度快”并非大数据的固有特征, 而是信息网络技术为大数据赋予的新特点。
二、大数据财产性质的检视与批判
通过对相关学说的梳理, 关于大数据的法律性质, 目前主要存在汇编作品说、邻接权客体说、新型财产权说等观点, 其中, 汇编作品说、邻接权客体说均是从知识产权角度理解大数据的法律性质。
笔者认为, 把大数据作为汇编作品混淆了大数据与大数据研究成果。我国《著作权法》第14条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料, 对其内容的选择或者编排体现独创性的作品, 为汇编作品”。可见, 大数据的独创性需要通过对数据的选择或者编排体现。大数据是海量单个数据的集合, 这种数据的简单集合不能体现知识产权客体所要求的独创性。有学者已经明确指出:“大数据是一种信息和符号的集合, 并未加入人类自身主观的内容, 很难将其认定为是人类智力劳动的成果”。当然, 经过科学的分析与处理, 人们可以发现大数据中的相关性, 这种研究方法以及所得出的结论体现着研究者的独创性。然而, 这种独创性是针对大数据的研究成果而非大数据本身而言的。换言之, 以汇编作品保护大数据只是对大数据研究成果独创性的保护, 而不涉及对大数据本身的保护。举例而言, 油画作品是由多种颜料组合而完成, 而著作权所保护的对象是画家通过油画作品所表现出的独创性, 而不是保护创作该油画所用的颜料。
对大数据的选择或者编排体现出独创性的作品属于汇编作品, 而大数据仅仅表现为数据的集合时, 这种不具备独创性的数据集合是否值得保护以及如何保护, 才是大数据的财产属性应当着力解决的问题。例如, 某网购平台技术人员非法进入该网购系统后台, 拷贝平台收集的大量顾客信息、浏览记录、购买记录等大数据, 将拷贝的大数据卖给他人, 应当如何评价此行为的法律性质?认为大数据是集合物 (即大数据是物权客体) 的学者可能认为, 该行为应当构成盗窃罪。按照刑法理论, 构成盗窃罪要求行为人打破他人对财物的占有、建立自己对财物的占有, 也就是说, 行为人在得到财物的同时, 被害人失去财物。大数据以电子数据的形式呈现, 窃取大数据的行为往往是通过拷贝复制的方式实施, 行为人虽然得到了大数据, 但是权利人并未因此丧失对大数据的占有, 不符合盗窃罪“打破占有”的构成要件。
邻接权客体说认为, 应当把无独创性的数据库置于邻接权的保护范围, 该观点得到欧盟《数据库保护指令》的支持。在著作权法理论中, 邻接权的权利性质经历了一些变化, 传统观点认为, 邻接权就是作品传播者权, 是因为作品的传播而产生的权利, 而现代观点认为邻接权的客体可以与作品无关, 例如, 某人用录音机录制了稻田中的蛙声, 虽然青蛙的叫声不能称为“作品”, 但是, 对蛙声的录音仍然属于录音制品。当然, 把邻接权的客体扩展到作品以外的对象是否合适, 还需要理论上的进一步探讨。从目前的立法来看, 我国《著作权法》仅承认表演者权、录制者权、广播组织权和出版者权四类邻接权, 即使把大数据理解为邻接权客体具有合理性, 要想以邻接权保护大数据仍然需要立法的确认。
可见, 从知识产权的角度出发, 不管是把大数据集合 (数据库) 作为汇编作品还是邻接权客体均欠缺合理性。大数据属于新型财产权的观点正是由此得出。新型财产说与知识产权说的根本争议在于, 大数据能否成为知识产权的客体。新型财产说的逻辑是, 大数据不符合既有的物权、知识产权等财产类型, 只能将其归类为新类型的信息财产权。这意味着如果能够论证大数据属于既有的财产类型, 新型财产说也就不攻自破。
三、大数据财产性质的界定———商业秘密说之提倡
笔者认为, 应当把大数据的法律性质界定为商业秘密, 即以现有的商业秘密法律规范保护大数据。对于商业秘密的含义, 我国《反不正当竞争法》《刑法》中均进行了界定。《反不正当竞争法》第9条规定:“本法所称的商业秘密, 是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息和经营信息。”我国《刑法》第219条规定:“本条所称商业秘密, 是指不为公众所知悉, 能为权利人带来经济利益, 具有实用性并经权利人采取保密措施的技术信息和经营信息。”从以上两个法律规定可以看出, 商业秘密具有价值性、实用性、采取保密措施的特点。笔者认为, 权利人收集的大数据完全符合上述特点。
首先, 大数据具有价值性。大数据具有商业价值、财产价值的观点已经被人们所广泛接受。目前, 我国已经有数十家主要从事大数据开发研究的上市公司, 根据相关调研测算, 2016年我国大数据核心产业的市场规模达到168亿元, 2017年~2018年维持40%左右的高速增长, 大数据的价值性已经毋庸置疑。其次, 大数据具有实用性。大数据需要经过数据的挖掘分析才能用于生产经营, 但是这不妨碍其属于商业秘密。“商业秘密的实用性不等于其在当前环境下可用于生产经营生活, 在未来可实现的条件下可用于生产经营的信息也具有实用性。”另外, 数据无时无刻不在产生, 人们不可能收集研究所有的数据, 这意味着人们采取技术措施收集研究的大数据都是有用的, 否则, 没有人会花费时间和精力收集研究大数据。挖掘分析大数据也确实可以得到有价值的信息, 也在侧面论证了大数据的实用性。最后, 现实中的绝大多数大数据均采取了保密措施, 符合商业秘密保密性的特点。大数据既是IT企业的核心资产, 也是核心竞争优势, 现代IT企业对于收集的大数据都已经采取了极为严格的保密措施。商业秘密所要求的保密性为大数据是否属于商业秘密提供了明确标准:采取了严格保密措施的大数据属于商业秘密, 而没有被采取保密措施的大数据则不属于商业秘密。
除此之外, 大数据与商业秘密具有较大的相似性, 其中, 突出表现在二者均具备可复制性。商业秘密是承载特定内容的技术信息和经营信息, 而信息可以同时被很多主体所知晓, 即在别人得知该信息后, 不影响权利人继续掌握该信息。大数据也具有相同的特点, 即使大数据被别人所复制窃取, 权利人并未失去该数据, 只是其不再独占大数据中的经营信息, 对其商业核心竞争力产生影响。商业秘密和大数据的可复制性使得侵犯行为不能被评价为以转移占有为核心的盗窃罪, 这也是立法者在侵犯财产罪之外单独制定侵犯商业秘密罪的重要原因。
在《民法总则》草案中, 立法者曾经把“数据信息”作为知识产权的客体, 但是, 在最终的法律规范中未出现“数据信息”的表述。由此可见, 立法者已经意识到, 大数据与知识产权客体具有相似性, 却又不能确定大数据是否属于一种独立的知识产权客体。本文将大数据界定为商业秘密, 而商业秘密是知识产权的法定客体, 该做法符合立法者意图把数据信息作为知识产权客体的立法原意, 同时也避免了创制新客体可能导致的问题。大数据在信息时代的重要性日益明显, 为了实现对大数据的全面化、立体化保护, 必须构建从民法、行政法到刑法的法律规范;如果把大数据作为一种特殊的财产 (知识产权) 类型, 就应当在法律上设置出一套崭新的制度, 这种制度成本是昂贵而无益的。把大数据解释为商业秘密, 可以直接适用现有的商业秘密法律规范, 无论在理论研究还是司法适用上都更具可操作性。
四、大数据保护的法律规范
1. 大数据本身的保护。
为了保护商业秘密, 我国已经构建了民法、行政法、刑法的规范体系。由于大数据属于商业秘密, 完全可以使用该规范体系实现对大数据的全面化、立体化保护。
首先, 大数据属于知识产权的客体, 侵犯大数据的行为就是对他人知识产权的侵犯, 在民事角度而言, 按照《民法总则》以及《侵权责任法》的规定, 侵犯他人大数据给大数据权利人造成损害的, 应当承担赔偿责任。其次, 我国《反不正当竞争法》第21条规定, 经营者侵犯商业秘密的, 由监督检查部门责令停止违法行为, 处十万元以上五十万元以下的罚款;情节严重的, 处五十万元以上三百万元以下的罚款。最后, 我国《刑法》第219条规定了“侵犯商业秘密罪”, 对于不正当手段获取商业秘密, 披露、使用或者允许他人使用不法获取的商业秘密, 违反保守商业秘密的约定披露、使用或者允许他人使用其掌握的商业秘密, 均属于犯罪行为。尤其是通过侵犯商业秘密罪, 为保护大数据提供了坚实的后盾法保障———对于严重侵犯大数据的行为, 公安机关可以立案侦查, 通过技术措施可以更为迅速地锁定犯罪嫌疑人, 最终达到震慑犯罪的效果。
2. 大数据组成物的保护。
前文已述, 大数据是大量单个数据的集合。如果组成大数据的单个数据值得特殊保护, 侵犯大数据的行为可能同时侵犯其他利益。其中, 最为典型的就是由个人信息组成的大数据。
近年来, 国家加大了对个人信息的保护力度, 具体表现为在《民法》和《刑法》中增设了保护个人信息的条款与罪名。《民法总则》第111条规定, “自然人的个人信息受法律保护”;《刑法》第253条之一规定了“侵犯公民个人信息罪”, 对于违反国家规定向他人出售提供个人信息或者非法获取个人信息的行为, 应当追究刑事责任。根据“两高”《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第1条的规定, 个人信息的核心特征是可识别性。只要该信息直接或者通过与其他信息结合能够确定自然人身份, 就应当认定为个人信息, 可以看出, 国家加强对个人信息的保护最终是为了保障个人隐私以及私生活的安宁。
大数据保护与个人信息保护不冲突, 当大数据是以个人信息为内容时, 侵犯该大数据的行为可能同时构成对个人信息的侵犯。由于民法与刑法在立法目的上的差异, 侵犯以个人信息为内容的大数据在民法评价和刑法评价上具有不同的效果。民法采取填平原则, 主要是以赔偿的方式弥补违法行为给他人造成的损害, 所以, 侵权行为人应当同时向大数据权利人和个人信息所有人赔偿损失。刑法以行为为核心, 坚持一行为一犯罪的理念, 行为人非法获取以个人信息为内容的大数据, 可能同时构成侵犯公民个人信息罪和侵犯商业秘密罪, 按照想象竞合的处理原则, 择一重罪处断。
3. 大数据研究成果的保护。
收集大数据不是目的, 从大数据中发现规律进而指导生产生活才是大数据的真正价值所在。根据大数据而得出的研究成果不同于大数据本身。人们常常把大数据称为信息时代的石油, 笔者认为, 这个比喻极为恰当。从地层中开采出来的石油本身不具备使用价值, 只有经过加工、炼制、分馏后所得到的柴油、汽油、塑料、沥青等等产品才具备使用价值。大数据也是一样, 大数据本身不具备使用价值, 经过数据挖掘、数据分析后产生的大数据研究成果才具有使用价值。
为了发现大数据中蕴含的规律性, 研究人员需要对大数据进行数据挖掘和分析, 得出的相关分析成果, 因为具备独创性而成为著作权的客体。例如, 网购平台会收集人们网购时浏览的记录以及购买的商品, 大量网购者的上述信息构成大数据, 而研究人员利用数据挖掘、数据分析技术可以发现人们浏览和购买商品时哪些因素起到重要作用。至于该研究成果属于汇编作品还是作品, 取决于原创性的高低。如果研究者的原创性仅体现在数据的选择或者编排上, 应当认定为汇编作品;如果研究者根据大数据形成了独立于大数据的成果, 即研究成果中已经看不到具体的单个数据, 而是表现为其他形式的研究报告, 该研究成果属于作品, 研究者享有完整的著作权。
参考文献
[1]杨永凯.互联网大数据的法律治理研究——以大数据的财产属性为中心[J].石河子大学学报 (哲学社会科学版) , 2018, (2) :68.
[2]王广震.大数据的法律性质探析——以知识产权法为研究进路[J].重庆邮电大学学报 (社会科学版) , 2017, (4) :58.