摘 要: 数据确权存在多种理论,首先可置于既有制度规范中考察。这可能涉及物权法、合同法、知识产权法、竞争法、个人信息保护法等诸多规范。然而,无论是单独适用还是综合适用,既有规范均无法充分解答数据权属、保护与利用的问题。其次,从数据新型权利理论来看,亦未能实现数据确权。该类理论多建立在劳动赋权的简单论证之上,并未深入研究数据权利的生产机制,以致数据权利主体、客体均难以判定,且无法回应实践中的数据治理问题。数据确权的困境植根于以意志论、利益论为代表的传统权利理论无法解释新的数据问题。通过对数据权利生产机制考察发现,算法在数据价值与数据权利的形成中处于核心地位。因此,可通过算法规制反向实现数据确权。
关键词: 数据; 非个人数据; 数据权利; 新型权利; 个人信息;
Abstract: There are many theories about data right, which can be first examined in existing institutional norms. It may involve the regulation of Property Law, Contract Law, Intellectual Property Law, Competition Law, and Personal Information Protection Law. However, whether it is applied separately or comprehensively, neither the norms can fully answer the questions of data ownership, protection and utilization. Secondly, from the perspective of the new data right theory, it is not perfect. This kind of theory is based on the simple argumentation of labor empowerment. The production mechanism of data right has not been carefully studied, so that the subject and object of data right are difficult to judge and data right cannot respond to data governance problems. The analysis shows that dilemmas of data right is rooted in the traditional rights theory represented by the theory of will and interest cannot explain the new data problem. Through the data right production mechanism, algorithm is at the core of data value and data right. Therefore, Data right can be achieved through algorithmic regulation.
Keyword: data; non-personal data; data right; new rights; personal information;
数据权利不同于数据保护。在欧美语境下,数据保护特指个人信息保护。而在中国语境中,基于《民法总则》第111条与第127条对个人信息与数据的区分,笔者探讨的数据权利与数据确权均限于非个人数据的权属问题,虽有所涉及但并不包含个人信息保护的问题。当前,国家已多次提出数据确权的要求。《“十三五”国家信息化规划》即指出加快推动“数据权属、数据管理”的立法。第十三届全国人大会议期间,全国人大财经委提出完善“数据权属、权利、交易等规则”。党的十九大期间,***总书记更是明确提出“制定数据资源确权、开放、流通、交易相关制度,完善数据产权保护制度”的要求。
然而,立法却一直未对数据权属作出正面回应。《民法总则》第127条实质完全回避了这一问题。从数据权利的司法实践来看,亦面临巨大挑战。法谚有云“无救济则无权利”。数据权实质未获法院的直接认可,常通过在个案中激活《反不正当竞争法》一般条款的特殊渠道获得救济,其能否成为一项新权利尚存疑问。新型权利的形成可体现为从个案裁判到司法解释,再到法律规定的“三部曲”。1显现于个案裁判中的数据确权诉求仍需进行仔细辨析。根据既有的理论与实践,适用既有规范与创设数据新型权利是关于数据权属的两类主张。由这两类主张出发,结合既有案例可知,当前数据确权面临多重困境。
一、既有规范适用的类型及缺陷
从新型权利生产的前提来看,需根据既有规范对数据确权进行仔细考察,从而与某些“仅具有描述性意义、个案价值,而不具有普遍意义”的权利诉求相区别。2由此,数据权才不至于沦为一句口号,闹出数据时代“接吻权”的笑话。若既有制度规范能解决实践中所提出的数据权属、保护与利用的问题,数据确权便是一个伪命题。根据所适用规范所属的法律部门进行划分,实务中主要存在适用物权法、合同法、知识产权法、竞争法、个人信息保护法、综合适用既有规范等六种类型。相应地,从这些既有制度规范出发,也有众多学说试图以“旧瓶装新酒”的形式将数据权利诉求纳入其中。然而,由于既有制度框架源于工商业时代的立法,实无力回应大数据时代的问题,相关学说亦无法涵盖新兴的数据确权需要,未能回答实践中涌现的难题。
(一)适用物权法
适用物权法将首先涉及数据属性的判断。一方面,若将之判断为公有品,则数据公有。上海市数据交易中心《流通数据处理准则》即注意到了“数据具有社会性、公共性”。有学者立足于数据的公共性,认为公共领域是数据权存在的基础。尤其是涉及公权力运行的情形时,数据是“网络社会中的公物”。3另一方面,若将数据判断为可私有的客体,则可能存在一种数据所有权,尤其是个人对个人数据的所有权。4欧盟《一般数据保护条例》序言第68条即采取了这一理论。此外,美国《统一计算机信息交易法》亦对信息财产权作出了规定。我国目前数据亦以被认作一种交易标的进行交易。
然而,适用物权法的缺陷在于,数据公有忽视私益保护,数据私有又有违物权原则,实不符合现行《物权法》的规定。首先,数据不属《物权法》第五章所规定的专属国家所有的客体。无可否认,数据涉及公共利益。然而,数据的公共性可说明,数据收集、使用、处理、存储均需要被规制,却不可得出数据公有的结论。事实上,不得损害公共利益本身已为《物权法》第7条所明确规定。此外,如赫拉利所分析,若将所有数据公有化,则可能面临公权力过大的问题。5其次,数据本身不具有物权属性。一方面,欧盟意义上的数据所有权指的是个人对个人信息的自决权,并非笔者讨论的非个人数据权利问题;另一方面,根据物权法定原则,从美国的信息财产权与我国数据交易亦无法直接得出数据物权的结论。数据虽被称为“新石油”,但又与石油不同,其无法与电子载体相分离,不具有物的独立性;同时其可被无限复制、任意删除,不同的复制体亦可为不同人所控制,在支配上无法实现完全的排他性,不具有物的特定性。因此,相同数据上可能存在数个数据权利,故亦不符合一物一权原则。上海市数据交易中心《流通数据处理准则》就明确规定了数据权利共存原则。事实上,数据所有权的主张在根本上亦与物权不符,其实质上并不强调一种唯一的独占权利,而是强调数据访问和利用的权利。6
(二)适用合同法
实践中随着数据交易而出现的数据服务合同属于无名合同,当然可适用合同法。对此,有学者主张,债法足以解决关于数据的争议。其从根本上否定数据的权利客体地位,同时否定数据的财产性,主张数据是中立的工具,且数据价值受制于内容。7
然而,适用合同法的缺陷在于,完全忽视了数据交易的客体。虽注意到了数据的非独立性与非特定性,但却无法对数据资产进行有效解释。大数据交易强调的也是其掌握的可交易数据,而非交易本身。在资产收购与破产重组等案件中数据服务合同难以解释更是可见一斑。在破产案件中,若只依数据服务合同进行判断,则将无法对相关数据进行处置。在资产收购案件中,往往也存在共享数据的愿望。如2018年为整合“摩拜单车”掌握的海量数据资源,“美团”即对其进行了收购。更为重要的是,合同相对性原则下,实无力解决实践中多发的第三人非法利用数据问题。“新浪诉脉脉案”一审法院即指出仅凭《开发者协议》无法约束非脉脉用户,仍需取得用户授权。8此外,若否定数据的权利客体地位,还将导致数据的占有保护受除斥期间限制、纯粹经济损失的保护困难、无法提起执行异议、无法行使破产取回权、不利于进行担保融资等问题。
(三)适用知识产权法
着作权、商业秘密、数据库保护是适用知识产权法保护数据的三类依据。第一,数据可根据《着作权法》受保护。在早期数据争议中,企业多以着作权侵权为由起诉。如“弘历通诉鑫三汛案”即为侵犯计算机软件着作权纠纷,法院认定弘历通公司的数据分析属于汇编作品受保护。9对此,有学者认为数据是着作权客体,也有学者认为属于邻接权客体。10第二,数据还可能属于商业秘密。根据《民法通则》第123条的规定,商业秘密属于知识产权客体。在“安克诚诉辰邮科技案”“万联网络诉周惠民案”等案件中,法院均肯定了人群信息数据库属于商业秘密。11“新浪诉脉脉案”中新浪亦通过合同约定将相关数据界定为商业秘密。122019年《反不正当竞争法》修订后,即增加了电子侵入的侵权手段,且将商业秘密的范围在技术信息和经营信息外加了“等”字。这看似解决了以商业秘密保护数据的法律障碍。第三,特定的数据库受法律保护。虽然我国暂未建立数据库保护制度,但根据欧盟《关于数据库法律保护的指令》,数据制作人对虽不符合着作权保护要求,但经系统有序安排的数据或数据集亦有为期15年的专有财产权。
然而,适用知识产权法的缺陷在于,其存在非常大的局限性,即着作权限于汇编数据,商业秘密限于秘密数据,数据权限于结构化数据。首先,单纯的数据与作品还是存在显着区别。诚如学者李爱君的分析,数据不具独创性、期限性、法定性的知识产权必要特征,也不必然是智力劳动成果,更不需经过知识产权取得的相关法定程序。13因此,数据亦难以实现知识产权上的垄断和独占。此外,由于《专利法》明确规定智力活动的规则和方法不具可专利性,大数据相关算法亦无法取得专利保护。由此可见,以知识产权保护数据适用效果不佳,存在巨大的局限性。在“大众点评诉爱帮第一案”中,法院认为,涉案数据整体不构成汇编作品,且点评数据的着作权应由平台与用户共有,平台不可单独起诉。14其次,数据不等于秘密,其可为多人共享,亦不具独占特征。单个、少量的数据亦不必然符合商业秘密的价值要件。归根到底商业秘密说仅提供竞争法上的法益保护,不具排他效力,无法解决实践中纷繁复杂的数据侵害问题。如通过爬虫抓取公开数据、通过算法还原原始数据、个人非法获取企业数据等问题通过商业秘密的角度均无法解决。此外,将数据纳入商业秘密将直接导致《民法总则》第123条与第127条的冲突,若数据属于第123条中的商业秘密,第127条的规定就显得多余且混乱。最后,数据库保护的数据限于原创性的结构化数据,且以数据库制作人的实质性投入为条件,亦无法覆盖我国数据权利的诉求。15
(四)适用竞争法
当前,适用竞争法保护企业数据是司法实务中经常采取路径。众多案例均采取激活不正当竞争一般条款的思路进行裁判。“新浪诉脉脉案”中,二审法院即指出了互联网行业中适用《反不正当竞争法》第2条的六大要件。16通过对相关要件的分析,“淘宝诉美景案”中二审法院更是明确指出,案涉数据产品“无疑属于竞争法意义上的财产权益”。17有学者认为,一般条款是“一份给予司法机关的授权书”,为实务中通过“诚实信用”和“商业道德”判断数据不正当竞争提供了依据。18
然而,适用竞争法的缺陷在于,激活本属于释义规定的《反不正当竞争法》第2条具有极大的不确定性,六大要件亦将通过不正当竞争保护数据权益的门槛大大提高,将无法实现维护数据支配权的诉求。如“大众点评诉百度案”中,法院即明确指出初始版本的百度仅抓取显示少量大众点评信息,尚属“慎地少量使用来自其他网站的点评信息”不构成侵权,只是当其后大量抓取信息时才构成不正当竞争。19“百度诉爱帮第二案”中,二审法院亦强调,使用他人数据的限度是“控制在合理范围内”且“不得造成市场替代的后果。”20同时,从域外法来看,建立在数据之上的竞争法法益亦未得到普遍认可。对于开放的网络数据,阻止他人获取数据甚至反而可能构成不正当竞争行为。例如,美国知名的“hiQ诉领英案”中,hiQ即认为领英阻止他人获取其会员数据的目的在于将相关数据货币化,从而构成不公平竞争。根据hiQ的要求,加州北部法院即发布了要求领英移除相关技术措施的预先禁令。21总的来说,一般条款的适用取决于个案衡量的非常规操作,不宜成为一种特定的保护模式,否则将有损司法的正当性和安定性,更有“向一般条款逃逸”的危险。不得不适用一般条款进行裁判,恰好说明了法律制度供给存在严重危机,现有体系无法回应数据权利问题。
(五)适用个人信息保护法
虽然我国并未建立统一的《个人信息保护法》,但个人信息保护法律体系已见雏形。《刑法》第253条、《民法总则》第111条、《消费者权益保护法》第29条、《电子商务法》第23条、第25条以及《网络安全法》第四章等涉及个人信息法律保护。在数据交易中,上海市数据交易中心《流通数据处理准则》即明确将隐私管理、数据透明、告知同意、使用合法和限制等个人信息保护准则纳入其中。“新浪诉脉脉案”更是确立了着名的三重授权原则,强调第三方获取用户信息应坚持“用户授权”+“平台授权”+“用户授权”三重授权以及符合“合法、正当、必要的原则”。22“腾讯诉抖音案”中法院即援引这一原则作出裁判。23有学者认为,通过个人数据财产权理论可实现数据保护。24事实上,数据权利与个人信息保护确实密切相关。诚如王利明教授所言,个人信息收集利用的过程也是数据财产流转的过程。25
然而,适用个人信息保护法的缺陷在于,既未能有效全面保护个人信息,亦无法回应非个人数据的权属问题。首先,致力于保护个人信息的三重授权原则存在内部缺陷。一方面,对于已取得用户同意但未取得企业同意的信息收集行为,是否按照该原则而具有违法性不无疑问。如2017年华为曾未经腾讯授权而通过用户点击同意的方式收集微信聊天记录以实现定向推送。另一方面,其亦未对用户同意的范围与权限作进一步限制。在德国“WhatsAPP案”中,法院认为WhatsAPP获取用户联系人信息不仅需要用户的有效同意,更需要所有联系人的书面同意。26其次,个人信息保护与非个人数据保护是两个不同的层面,分别为《民法总则》第111条与第127条所规定,各属人格权保护与财产权保护内容。全国人大财经委亦将完善“数据权属、权利、交易等规则”与在“个人信息保护法中规范数据权利的保护”并列提出。将数据权利与个人信息保护相混淆,完全无视企业的权利诉求,未能回应非个人数据权属问题。事实上,我国法院亦意识到数据权利与个人信息权利存在区别。“淘宝诉美景案”中一审法院即明确指出具有财产性利益的大数据产品应是“与网络用户信息、原始网络数据无直接对应关系的衍生数据”。27
(六)综合适用既有规范
由于单独适用某一法律均有不周全之处,是否可以综合适用既有规范以保护数据值得考察。有学者主张,数据上存在多元的权益,兼具财产权、人格权、国家主权三重属性。28亦有学者借助制度经济学上“权利束”的概念对数据上的利益进行分割,试图通过数据这一“束点”分割出人格权、财产权以及数据上的公权力。29
然而,综合适用既有规范的缺陷在于,仍无法覆盖数据权利的诉求。首先,上文已指出数据不具物权属性,无法适用物权法。关注非个人数据确权的数据权利与个人信息保护亦非同一问题。合同法路径更是直接回避了问题的实质,无法回答数据交易的客体属性。其次,虽然知识产权法和竞争法在一定范围内可保护数据。但极其有限,两者相加亦无法实现对数据的周全保护。网络空间中大量存在由计算机自动抓取、生产的海量数据,这些数据不具独创性,并未保密,亦未结构化,无法获得知识产权法保护。此时,企业往往会通过Robots协议声明不允许爬虫抓取这些数据。然而,若第三方少量或部分地抓取这些数据进行公开,根据竞争法未形成市场替代后果,亦无法获得竞争法保护。即便是第三方全部抓取这些数据,在没有竞争关系且未转让、公开相关数据之时,竞争法亦无力处理。再次,同一个数据行为涉嫌侵权,无法综合适合类型不同的法律规范。此时形成的是请求权竞合关系。然而,无论是选择哪个规范,如前文所述,又均存在缺陷。最后,“权利束”理论一般用于解释财产权,从数据“权利束”中分离人格权甚至公权力的尝试不仅缺乏理论依据,而且容易沦为一个逃避数据属性难题的选择。
综上,既有制度可在一定程度上回应公共数据管理、数据服务合同、汇编数据保护、秘密数据保护、数据库保护、数据的竞争法保护、数据利用中的个人信息保护等问题,却依然无法解答数据私益保护、数据交易的客体属性、非竞争关系的数据使用等问题,且未能以权利的形式保护数据,数据新型权利存在构建的可能与空间。
二、新型权利理论的模型及困境
新型权利理论在我国既有制度框架外探寻数据权利的可能空间,该理论主张设立新型的数据财产权。有学者认为,这一权利属于数据制造者对数据集合占有、处理、处分的财产权。30或企业基于“数据池”形成的“一个抽象的集合性财产权利”。31也有学者认为,具体应包含数据经营权与数据资产权,其中数据资产权受期限、市场经济秩序、社会公共利益、信息数据安全等限制。32甚至有学者主张,数据权利应通过创设代码空间权解决,即赋予“代码空间主体对代码空间的保持、利用、管理和控制的自由”。33目前,关于数据新型权利的内涵与构造尚存多种理论争议,未能形成通说。虽然这些新型权利理论注意到数据作为新权利客体的革命性挑战,但却未能脱离既有分析框架,其建立在劳动赋权的理论之上,并未深入研究数据权利的生产机制。以致数据权利主体、客体均难以判定,且无法回应实践中的数据治理问题。
(一)劳动赋权的失败
新型权利理论模型仍植根洛克的劳动赋权理论对数据财产权进行论证,认为企业投入的成本是赋权的关键。34虽然“大众点评诉爱帮第二案”“新浪诉脉脉案”中法院都强调了经营者所付出的成本,“淘宝诉美景案”中一审法院更是直接认定“数据产品系淘宝公司的劳动成果”。35但诚如“大众点评诉百度案”二审法院所指,我国并不存在所谓“劳动成果权”,由于“模仿自由”,使用他人劳动成果也不能与“搭便车”和“不劳而获”划等号。36数据劳动本身并不能直接推出数据权利。数据权利的生产至少还涉及谁在生产、通过什么生产工具生产、生产出何种价值的问题。劳动只是在最低限度说明了数据是被生产的事实,远未能回应数据权利的生产机制问题。
其中,对于谁在生产(劳动)的不同回答,将形成不同的数据新型权利主体。一方面,由于企业在数据采集、处理上投入了大量成本,其通常被认为是数据制造产者。37用户通常不是非个人数据保护关注的重点。在“淘宝诉美景案”中一审法院认为,个人对“单个用户信息尚无独立的财产权或财产性权益可言”,按此逻辑数据财产性权利的主体只能是对数据收集、加工、整理的数据制造者。张玉洁、胡振吉更是明确指出,在“涉数”典型案件中,法院实际上关注的是“平台大数据优势的维持”。38另一方面,也有学者提出,企业数据亦离不开用户使用,并提出“数据作为劳动”,主张用户才是真正的数据生产者。39显现出巨大财产价值的大数据往往来源于对个人数据收集和处理,即便是将讨论对象限制在匿名化处理后的非个人数据之中,也不能当然排除个人作为权利主体。虽然欧盟《非个人数据自由流动框架》在数据的定义上排除了个人数据,但近年来也有国家在个人信息保护法中对个人数据定义进行扩展,将企业数据一并纳入其中保护。此外,数据具有占有主体非唯一的特征,可由多主体共享,此时如何确认权利主体更是不无疑问。
(二)基本范畴的模糊
数据权利基本范畴共识的缺失,直接导致了数据权利无法在同一框架内进行讨论。数据信息权利理论似未仔细思考“当我们谈数据权利的时候究竟在谈些什么”。在数据权利客体的问题上,关于数据与信息关系的争议已闯进语义的迷宫。实践中,数据与信息常被混用。而根据国际标准化组织的定义,信息是在特定语境下具有特定含义的知识,而数据则是该知识的表现形式。40信息与数据又存在内容与形式之别。在这一区分基础上,究竟何者是受法律保护之客体亦不无疑问。如在“淘宝诉美景案”中,一审法院虽明确承认信息与数据是内容与形式的关系,却同时指出“原始数据所具有的实用价值在于其所包含的网络用户信息内容,而不在于其形式。”41似乎认为“大数据权益”的实质应在于信息内容。
有学者认为,数据权利客体应根据数据的内在层次进行划分。如纪海龙认为,信息在符号层上表现为数据文件,而在内容层上数据文件中的信息内容为数据信息,两者应区分为不同客体。42另一方面,梅夏英则在主张数据并非权利客体的同时,对数据与信息作详细区分。其先是认为,信息可通过数据以外的渠道表达,而数据既是信息媒介也是信息本体,在互联网环境下数据更具产生信息的功能。43随后即修正其观点指出,数据与信息是“工具和本体的关系”,数据指的是物理技术上的比特流,是传递信息的工具,并依赖于代码。44上述学者虽对数据和信息的内涵问题作了精细化分析,却未能从数据价值链生成的角度进行研究,从而使得数据权利客体问题变得异常复杂。
此外,从数据本身来看,数据与大数据的关系亦不甚明晰。大数据的特征常被概括为“4V”,即容量大、类型多、存取速度快、应用价值高。该描述为国务院《印发促进大数据发展行动纲要》《贵州省大数据发展应用促进条例》等文件所采纳。诚如《促进大数据发展行动纲要》所指,“大数据成为推动经济转型发展的新动力”,在数据权利中探讨的数据价值通常指的亦是大数据的价值,单个数据的价值则尚未获得认可。例如“淘宝诉美景案”中,一审法院即将原始数据与大数据相区别,仅认可了包括原始数据与衍生数据的大数据产品具有财产性权益。45对此问题,实务界有观点认为,大数据主要指衍生数据,其中原始数据与衍生数据是不同的权利客体,应分别对应个人信息权与企业数据权。46然而,以大小的相对概念、抽象的“4V”特征区分大小数据缺乏可操作性,单个、少量数据或原始数据强调的是数据的数量和来源,并未强调有无识别性,更不能等同于个人信息的概念,更无法直接否定其价值。
(三)数据治理的缺失
最为重要的是,数据新型权利理论强调数据的控制权和财产权,将无力协调数据利用与数据治理的关系。数据采集、存储、加工、利用的各个环节,均可能产生新的社会问题。
第一,数据控制权可能导致“数据孤岛”的形成。由于产权的原因,数据呈现出割裂分散局面,不利于形成更具价值的大数据资源。而大数据的价值又依赖于“全样本”分析,单一、片面的数据价值有限。
第二,迷信数据“全能”的数据利用可能忽视现实存在的“数据鸿沟”。如查德威克所指,由于人们获取计算机和互联网的获取差异,技能和信息素养的技能差异,利用信息满足社会提升的经济机会差异,以及利用网络提高政治参与度的民主机会差异,“数据鸿沟”客观存在。47
第三,不加限制的数据利用更可能产生破坏市场秩序的结果。一方面,企业可能利用定价数据进行市场价格操纵,通过“算法合谋”,形成垄断行为。另一方面,“大数据杀熟”亦将有害于消费者利益保护。2018年阿里、滴滴、携程利用数据进行差异化定价被媒体曝光。事实上,国外众多企业也在进行“大数据杀熟”。2012年谷歌甚至为“电子产品动态定价”申请了专利。48
第四,虽然数据权利基于非个人数据展开,但依然与个人密切相关。匿名数据并不能保证100%的安全,且在一定情况下可还原特定为个人信息。平台企业通过对用户的匿名数据进行分析,也能完整拼凑出用户的“数字人格”。研究表明,只要掌握超过300个社交网络中的“点赞”,算法对一个人的了解程度就可能超过其配偶。49
第五,数据利用还可能出错。奥尼尔即将处理数据的算法称为“数字杀伤性武器”。50现实生活中,信用评分、工作评估、金融分析、犯罪预测等基于数据的算法已对人们生活产生了极大影响。现实生活中已经出现了大量的数据错误致害案例。如将普通人错误标注为犯罪嫌疑人、将旅客错误标注为恐怖分子、将“无家可归者”错误标记为“乞讨者”等。51此外,数据利用还存在“算法歧视”问题。典型如黑人被识别成大猩猩,在犯罪风险评估中被预测为高犯罪风险,在检索结果中与被逮捕相关联等。
第七,数据的不当利用可能导致“数字霸权”的产生。企业在掌握了海量数据的控制权同时,也掌握了前所未有的权力。“平台治理”的难点在于对平台事实上行使的公权力进行规制。赫拉利担忧,数据的大量汇集将导致“监控社会”与“数字独裁”的形成。52更有学者认为,纳粹德国运用了数据处理技术协助大屠杀的进行。53
第八,数据财产权将不利于“算法黑箱”的监管。2017年美国加州即开始推动关“算法审计”的立法,试图对算法可靠性进行规制。54然而,由于控制和保密的要求,试图将监管权力延伸到数据及算法之中存在一定障碍。此外,海量数据和复杂算法亦使监管的进行困难重重。
综上,数据信息权利理论虽存在多种模型,但均无力解决数据权利主客体不明与数据利用导致的治理危机。而这些问题,均根源于理论模型脱离了现实发展与需求,未能跳出既有的权利理论。应由数据权利生产机制本身出发,破解数据确权困境。
三、数据确权困境的成因及破解
利用法理学的经典权利理论分析可知,既有规范适用与数据新型权利两种路径背后有意志论与利益论的传统权利理论支撑。两种路径的困境,反映的正是新业态下传统权利理论的失效。数据确权必须回归到数据权利的生产机制中,对算法进行考察,明确算法在数据价值、数据权利生产中所处的中心地位。并提取数据确权理论的最大公约数,以合法性作为算法规制的中心,破解数据确权困境。
(一)困境成因:传统权利理论的失效
在传统权利理论中,存在意志说、利益说、资格说、自由说、要求说、选择说、法力说、可能性说等多种权利理论。其中,意志理论和利益理论又是最为典型的传统权利理论。以康德哲学为基础的意志理论立足于法律规则,更关注权利人的支配力、个人意志与自由;以功利主义为基础的利益理论立足于法益保护,更注重权利人的福祉、社会目的。这些理论虽有着重要意义,面对数据权利之时却显得力不从心。
适用既有规范的路径即是以意志论为导向。在数据权利未确立的当前,面对现实的纠纷,论证者常借用意志论的逻辑,为关于数据的主张探寻请求权基础。在“新浪诉脉脉”中,一审法院即采取了意志论的逻辑指出,“用户有权在充分表达自由意志的情况下向他人提供自己的信息或不提供信息”。55然而,法院却未进一步承认企业对于数据的支配力,只是通过相关合同条款对数据授权进行解读。这是由于意志论常采取“审视法律规则内容”的方式识别权利。56
由于既有规范只能非常有限地回应数据权利诉求,在制度供给不足的现状下,数据制造者的主张无法形成温德沙伊德所指的“法律规则所赋予的意志的支配力或统治力”。57这一状况实际上亦说明了数据确权的必要。此外,意志论实际上主张的是,法律规则承认权利主体的意志优于义务主体的意志。然而,依据不同的制度规范,数据制造者的数据控制诉求与数据使用者基于信息自由流动的主张、用户控制其信息的意志之间的关系均不相同。例如,适用物权法可能得出数据公有的结论,适用个人信息保护法也可能得出在个人信息外无数据权利的结论。在适用法律规则难以确定,综合适用规则亦无法解决数据确权的情况下,基于意志论的主张难以发挥作用。
在面对新型权利主张时,利益论有其独特的优势。自耶林以来,利益论即主张法律保护或促进权利主体的利益是权利不可或缺的要素。58施瓦布更是主张,“把着眼于利益保护和利益实现的目的纳入权利定义”。59数据新型权利的核心即被认为是“数据经营者(企业)应有的财产利益诉求”。60在既有规范适用上,数据利益亦是不可或缺的核心概念。在“大众点评诉爱帮第二案”中,一审法院即将相关数据“能为汉涛公司带来合法利益”作为竞争法保护的重要理由。61事实上,在“涉数”典型案例中,众多法院均将数据作为竞争法上的利益。从侧面中亦可体现,通过探寻规则的目的,以识别法律所保护利益的利益论方法。
具体而言,判断某种利益是否受保护必涉及利益衡量的法律方法适用。拉伦茨即指出,利益衡量中应根据个案中法益的重要性进行。62于柏华进一步提出,可通过“利益的相对重要性”标准判断利益诉求是否构成权利。63“大众点评诉百度案”中,法院即明确指出“要兼顾信息获取者、信息使用者和社会公众三方的利益”,若未能遵循“最少、必要”原则抓取数据且产生实质替代则构成不正当竞争。64“淘宝诉美景案”中,法院注意到了“网络运营者与网络用户间的利益分配与权利冲突”,并指出应综合法律原则、法律规定、法律关系和社会公共利益作评判。65“新浪诉脉脉案中”,法院亦力图兼顾对经营者的竞争利益与消费者的个人权益的保护。66
然而,无论是既有规范适用还是新型权利理论均未能将数据利益与其他利益相剥离。如适用竞争法的司法实践既未将数据利益从“诚实信用”“商业道德”之中相剥离,亦未判定个人信息保护与数据利益保护、企业数据保护与用户利益维护的价值位阶,只是笼统将涉及其他利益的法律规定作为数据处理合法性的判定因素。因此,实际上并未在识别案涉利益的基础上,对利益类型作出区分,并比较判断利益的抽象重要性。从而回避了数据权利诉求的实质,未能实现数据确权。事实上,数据上存在多元利益早已成为一种普遍共识。67通过利益论抽象主张数据利益亦未能回答数据权利的问题。此外,基本数据新型权利理论虽致力于数据利益的剥离,但往往又将数据权利、个人信息保护、算法规制、平台治理等相关内容割裂研究,仅关注到“数据资源确权”的面前,而忽略了“开放、流通、交易相关制度”的面向,从而致陷入自说自话的误区。
可见,在面对数据确权这一新生事物时,传统权利法理开始失效。数据权利不能生搬硬套经典权利理论,亦不可充当立法者的角色自行创造。诚如马克思所言,“立法者并不创立法律,他只是在揭示和表述法律”。68陈彦晶即指出,“新型权利的研究应当是一个发现的过程,而非一个创造的过程”。69对数据权利的研究必须重视数据权利的生产机制,探寻其背后的社会基础,尤其是“问题语境、社会环境、文化观念变迁”,70在理论上对数据权利进行识别。
(二)算法中心:数据权利的生产机制
基于数据价值而产生的社会变迁,形成了数据确权的社会基础。在互联网、人工智能、大数据技术引领经济发展的当下,数据被称为“新石油”,已成为一种极其重要的资源,具有巨大的价值。随着贵阳、上海、武汉、盐城、北京等地一批数据交易平台的逐步设立,数据产品作为交易客体也已得到普遍的承认。在市场经济中,数据的作用亦日益显着。“数字的手”已有替代“无形的手”的趋势。71
而数据价值则是以算法为核心的。单个、少量的数据价值密度低,而经算法收集、加工、处理后形成的数据集合则价值倍增,尤其是被称为大数据的衍生数据集合本身即以价值密度高为特征。由此,便形成了数据价值链。这一价值链可表示为“原始数据(个人信息+其他数据)→算法(处理)→(大)数据(衍生数据)”。借用莱斯格所提出的“法律-社群规范-市场-架构”的网络法经典分析框架,72在数据价值生产中,算法处于架构的地位,决定了数据的价值。数据抓取、数据处理、数据应用均离不开算法,正是这些算法实现了低价值的原始数据向高价值的衍生数据转化。数据经济的实质便是“算法定义经济”。73因此,算法也是法律的最佳规制对象。
同时,算法亦在数据权利生产中处于中心地位。数据价值只能催生出数据权利诉求,而无法直接推导出数据权利。数据权利生产机制的正确表示应为“数据价值→权利诉求→数据权利”。诚如坎贝尔所指,“权利”被用以表达和确认各种社会、政治相关的主张。74数据确权实际上便是数据制造者,在数据资源产生极大价值的新业态中,对社会资源分配的一种主张。为了进一步维护这种主张,数据制造者又依靠算法进行加密或验证,防止数据被他人窃取。即便是简单的以文本文档形式存在的Robots协议,亦是数据制造者通过算法手段维护自身数据权益的尝试。实践中,这种尝试也得到了法院的支持。75此外,域外相关算法规制的经验亦表明,算法规制将使数据利用边界得以明晰。以欧盟的数据实践为例,其虽均未构建数据权利,但通过一系列法律对数据采集、存储、处理中的算法进行规制。尤其是与企业数据行为息息相关的个人信息保护与非个人数据利用的市场监管方面存在众多针对算法的规范。如《一般数据保护条例》(GDPR)在对个人信息保护规范进行升级的同时还引入了算法解释权的概念。《金融工具市场指令2》(MiFID II)更是明确对高频交易算法进行规制。反观我国,几乎不存在针对数据算法的制度规范,可适用于数据的法律规范亦是相对零散。因此,无法判断数据行为的合法空间,即无法判断数据权利的边界。
数据权利的生产并不绝对依赖于权利化的法律规范,通过公共强制的算法义务规范,亦可反推出数据权利。如格伦顿所指,“就法律目的而言,一项权利只是一个‘预言’,它预示着公共强制将适用于那些违反它的人”。76法经济学的规则菜单亦表明,在正向赋权的财产规制外,还存在为责任定价的责任规制、施加交易限制的管制规则以及禁止交易的禁易规则。77由于算法在数据价值与数据权利中所处的特殊地位,设置针对算法的数据责任规制、管制规制、禁易规则,即可清晰描绘出数据财产权的轮廓。
(三)算法规制:以数据合法破解困境
以算法规制实现数据权利指的是,以算法为中心建立数据交易管制规则、违法数据禁易规制、打破“数据壁垒”的责任规制,通过这些规则的设置为合法的数据行为勾勒出边界。数据制造者对合法的数据,即可享有数据财产权。这一方案即可解决适用既有规范无法周全的问题,亦可解决数据信息权利难以构建的困境。
第一,算法的视角可破解简单劳动赋权下权利主体的困境。以算法为中心的数据价值与数据权利生产并非一方简单地投入物理劳动,而是数据制造者以算法投入使数据价值倍增。也正是由于以企业为代表的数据制造者进行了相应的算法投入,并希望收获通过算法获取的数据价值,由此产生了数据权利诉求。因此,投入相关算法的数据制造者是数据权利的主体。
第二,算法的中心地位亦可破解权利客体的难题。经算法处理的非个人数据是数据权利的客体。通过算法获取的数据体现为代码符号,而通过算法加工处理的数据亦常反映相关内容。无论是代码层上的数据,还是内容层上的信息均具有价值。尤其是在大数据的语境下,更是既包含了代码层面的原始数据,亦包含了具有内容分析属性的衍生数据。算法处理的数据并不以代码/内容或大/小进行区分,只要是经算法处理的非个人数据,均具有一定的价值,可成为数据权利客体。
第三,算法合法所保障的数据合法,是数据确权理论的最大公约数。无论通过何种路径保护数据,无一不以数据合法为前提。为司法实务所广泛认可的数据“合法、正当、必要的原则”,78实际上亦可归结为数据合法。正当、必要亦是助益于合法的判断。然而,理论与实务虽承认数据合法作为数据确权的前提,却往往又在这一前提之外设置其他条件。抛弃除合法以外的其他条件,承认数据制造者对于合法数据具有数据财产权,可全面回应数据权利诉求,于数据新型权利的构建而言显然更为合理。
第四,立足于作为规制对象的算法,数据权利可通过算法合法性判断。算法合法性并不限于算法的合法,而是算法主导的数据行为合法。赋予合法数据以权利,是数据自由流动的前提和要求。数据合法与否,并不以是否获得授权为判断标准,应以是否违反相关规定判定。同时,应排除技术中立的抗辩。与合法数据相对,应建立违法数据的禁易规则与涉及公共利益数据的责任规则。
第五,以算法规制实现数据赋权,不仅可塑造数据权限,还可平衡数据之上的多元利益,协调数据权利与既有规范、算法治理的关系。以数据与个人信息保护的利益平衡为例,即便是匿名的非个人数据在数据采集、数据处理时仍可能涉及个人信息保护问题,在数据清洗、数据还原时亦可能显现出具有识别性的信息。因此,需以用户为中心规则塑造算法规制的具体规则。如构建风险最小化的算法设计标准、确立算法解释权、制定数据迁移标准、建立算法审计制度等。其中,数据迁移标准又有减少“数据孤岛”与“数据鸿沟”的作用。算法审计制度更可直接针对“算法合谋”“算法致害”“算法歧视”“算法黑箱”等现象,进一步规制“数字霸权”。此外,数据权利至少还受国家利益和公共利益约束。正是这些具体的约束标准,塑造了数据权利的范围。
由此可见,虽然数据确权存在困境,但并不表明数据权利无从确立。由数据权利的生产机制可知,数据权利研讨必须结合算法规制的内容进行转向。以算法规制的思维,协调数据权利与数据治理的关系,以合法性的原则与用户为中心的规则构建数据权利的规制框架。
注释
1参见王庆廷:《新兴权利渐进入法的路径探析》,《法商研究》2018年第1期,第30页。
2参见彭诚信:《现代权利理论研究:基于“意志理论”与“利益理论”的评析》,法律出版社2017年版,第310页。
3参见段泽孝:《人工智能时代互联网诱导行为的算法规制》,《江西社会科学》2019年第2期,第26页。
4See Václav Jane?ek, Ownership of personal data in the Internet of Things, Computer Law & Security Review 34(2018), pp.1039-1052.
5See Yuval Noah Harari, Why technology favors tyranny, The Atlantic 10(2018), pp.64-70.
6参见[美]安德雷斯·韦思岸:《大数据和我们》,胡小锐、李凯平译,中信出版社2016年版,第185页。
7参见梅夏英:《数据的法律属性及其民法定位》,《中国社会科学》2016年第9期,第181页。
8参见(2015)海民(知)初字第12602号民事判决书。
9参见(2008)朝民初字第17787号民事判决书。
10参见林华:《大数据的法律保护》,《电子知识产权》2014年第8期,第80页。
11参见(2006)沪高民三(知)终字第92号民事判决书,(2011)沪高民三(知)终字第100号民事判决书。
12前引〔8〕
13参见李爱君:《数据权利属性与法律特征》,《东方法学》2018年第3期,第71-72页。
14参见(2009)一中民终字第5031号民事裁定书。
15参见[澳]马克·戴维森:《数据库的法律保护》,朱理译,北京大学出版社2007年版,第51页。
16北京知识产权法院在援引最高人民法院(2009)民申字第1065号判决中所列的适用不正当竞争一般条款的三个条件的基础上,增加了三个条件,形成了互联网行业中适用《反不正当竞争法》第2条的六大条件:法律未作规定;损害及因果关系;违反诚实信用原则和商业道德;损害消费者利益;破坏市场竞争秩序;存在证明不正当性的证据。参见(2016)京73民终588号民事判决书。
17浙01民终7312号《民事判决书》。
18参见许可:《数据保护的三重进路——评新浪微博诉脉脉不正当竞争案》,《上海大学学报》(社会科学版)2017年第6期,第21页。
19参见(2016)沪73民终242号民事判决书。
20参见(2011)一中民终字第7512号民事判决书。
21See hiQLabs, Inc. v. LinkedIn Corp., 273 F.?Supp.3d 1099 (N.D. Cal. 2017).
22前引〔16〕。
23参见(2019)津0116民初2091号民事裁定书。
24See Paul M. Schwartz, Property, privacy, and personal data, Harvard Law Review 7(2004), pp.2056-2128.
25参见王利明:《数据共享与个人信息保护》,《现代法学》2019年第1期,第47页。
26参见周学峰、李平主编:《网络平台治理与法律责任》,中国法制出版社2018年版,第135页。
27浙8601民初4034号民事判决书。
28前引〔13〕,李爱君文,第64页。
29参见闫立东:《以“权利束”视角探究数据权利》,《东方法学》2019年第2期,第61-62页。
30前引〔18〕,许可文,第23页。
31胡凌:《论赛博空间的架构及其法律意蕴》,《东方法学》2018年第3期,第94页。
32参见龙卫球:《再论企业数据保护的财产权化路径》,《东方法学》2018年第3期,第60-63页。
33吴伟光:《构建网络经济中的民事新权利:代码空间权》,《政治与法律》2018年第4期,第115页。
34前引〔32〕,龙卫球文,第50页。
35前引〔27〕。
36前引〔19〕。
37前引〔32〕,龙卫球文,第50页。
38参见张玉洁、胡振吉:《我国大数据法律定位的学说论争、司法立场与立法规范》,《政治与法律》2018年第10期,第147页。
39See Arrieta Ibarra I, Goff L, Jiménez Hernández D, et al, Should we treat data as labor? Moving beyond ‘free’, Social Science Electronic Publishing, 1(2017), pp.1-2.
40See ISO/IEC 2382:2015.
41前引〔27〕。
42参见纪海龙:《数据的私法定位与保护》,《法学研究》2018年第6期,第72页。
43前引〔7〕,梅夏英文,第168页。
44参见梅夏英:《虚拟财产的范畴界定和民法保护模式》,《华东政法大学学报》2017年第5期,第46页。
45前引〔27〕。
46参见戴昕:《数据隐私问题的维度扩展与议题转换:法律经济学视角》,《交大法学》2019年第1期,第40页。
47参见[英]查德威克:《互联网政治学:国家、公民与新传播技术》,任孟山译,华夏出版社2010年版,第69页。
48参见[美]多梅尔:《算法时代》,胡小锐、钟毅译,中信出版社2016年版,第40页。
49参见涂子沛:《数文明:大数据如何重塑人类文明、商业形态和个人世界》,中信出版社2018年版,第8页。
50参见[美]凯西·奥尼尔:《算法霸权:数字杀伤性武器的威胁》,马青玲译,中信出版社2018年版,第21页。
51前引〔48〕,多梅尔书,第136-140页。
52前引〔5〕,Yuval Noah Harari文, 第64-70页。
53参见[英]维克托·迈尔-舍恩伯格、[英]肯尼思·库克耶:《大数据时代》盛杨燕、周涛译,浙江人民出版社2013年版,第196页。
54See the New York City Council, Algorithmic Accountability Bill, Int. No. 1696-A.
55前引〔8〕。
56前引〔2〕,彭诚信书,第122-123页。
57转引自方新军:《权利客体论》,中国政法大学出版社2012年版,第110页。
58参见杨春福:《权利法哲学研究导论》,南京大学出版社2000年版,第64页。
59[德]迪特尔·施瓦布:《民法导论》,郑冲译,法律出版社2006年版,第134页。
60前引〔32〕,龙卫球文,第53页。
61参见(2010)海民初字第24463号民事判决书。
62参见[德]卡尔·拉伦茨:《法学方法论》,陈爱娥译,商务印书馆2003年版,第276-286页。
63参见于柏华:《权利认定的利益判准》,《法学家》2017年第6期,第1页。
64前引〔19〕。
65前引〔27〕。
66前引〔8〕。
67前引〔26〕,闫立东文,第58-59页。
68[德]马克思:《马克思恩格斯全集》(第1卷),人民出版社1956年版,第183、316页。
69陈彦晶:《发现还是创造:新型权利的表达逻辑》,《苏州大学学报》(哲学社会科学版)2017年第5期,第74页。
70前引〔63〕,于柏华文,第3页。
71参见[英]阿里尔·扎拉奇,[美]莫里斯·E·斯图克:《算法的陷阱:超级平台、算法垄断与场景欺骗》,余潇译,中信出版社2018年版,第39页。
72参见[美]劳伦斯·莱斯格:《代码2.0:网络空间中的法律》,李旭、沈伟伟译,清华大学出版社2018年版,第135页。
73参见徐恪、李沁:《算法统治世界:智能经济的隐形秩序》,清华大学出版社2017年版,第18页。
74See Tom Campbell, Rights: A critical introduction, London: Routledge, 2006, p.3.
75参见常鸣:百度诉奇虎360违反Robots协议案一审宣判, 载北京市第一中级人民法院网http://bj1zy.chinacourt.gov.cn/article/detail/2014/09/id/1446252.shtml,2014年9月18日。
76[美]格伦顿:《权利话语:穷途末路的政治言辞》,周威译,北京大学出版社2006年版,第115页。
77参见凌斌:《法律救济的规则选择: 财产规则、责任规则与卡梅框架的法律经济学重构》,《中国法学》2012年第6期,第5页。
78前引〔16〕。