摘要:我国法定刑事证据种类的限制主要用于规范证据审查规则,不应该僵化适用,应设置较为开放的证据形式准入门槛。大数据证据是在收集海量数据的基础上利用机器逻辑的算法得出的判断性结论,与电子数据相比内部包含算法的运行,与鉴定意见相比内部算法逻辑属于机器逻辑,而非人的专业知识的判断,属于新兴的、独立的证据形式。犯罪行为实施的时间段内所有的涉案数据均应尽可能地封存原始存储介质,以录像或者其他恰当方式记录收集过程和封存样态。内部算法应该遵循机器逻辑,可以通过数据管理人、数据分析人、专家辅助人当庭接受质证的方式审查算法的合理性,避免算法逻辑存在歧视性。
关键词:大数据证据;证据形式;电子数据;算法逻辑;二元性内部结构;
Abstract:The restrictions on the types of legal criminal evidence in China are mainly used to standardize the rules of evidence examination, and should not be applied rigidly, but should set a relatively open threshold of evidence form access. Big data evidence is a judgment conclusion based on the collection of massive data and the use of the algorithm of machine logic. Compared with electronic data, the internal algorithm logic contains the operation of the algorithm. Compared with the appraisal opinion, the internal algorithm logic belongs to the machine logic rather than the judgment of human expertise, and it is a new and independent form of evidence. All data involved in the crime during the time period shall be sealed on the original storage medium as far as possible, and the collection process and sealed state shall be recorded by video recording or other appropriate means. The internal algorithm should follow the machine logic, and the rationality of the algorithm can be examined by data manager, data analyst and expert assistant to accept cross-examination in court to avoid discrimination in algorithm logic.
Keyword:big data evidence; evidence form; electronic data; algorithm logic; internal structure of duality;
随着网络科技的发展,我们已经进入数据时代。大数据作为数据时代的重要产物,不仅广泛应用于生活领域、商业领域,而且在司法领域起到了重要的助推作用。移动支付和直播网购成为我国现阶段的主要生活方式,这种无现金的购物方式在全世界也是最为先进的。新兴的生活模式势必会形成公民生活离不开网络数据的输出这一局面。在司法实践中,大数据信息为刑事犯罪提供重要的破案线索,例如,基于海量数据提取与现有信息具有联系性的数据进行比对,从而锁定犯罪嫌疑人;新冠肺炎疫情防控期间通过行踪轨迹等大数据查找违法犯罪行为;针对海量资金账户信息进行大数据分析等。大数据证据广泛存在于刑事诉讼中,不仅局限于经济犯罪和计算机网络犯罪,多数刑事案件中都存在大数据信息,因为人们的日常生活永远伴随着数据的印记。大数据信息作为一种新兴的数据模式在各个领域都需要深入研究,在刑事司法领域,它的概念、特征、存在形式等问题是关乎定罪量刑的重要问题。那么,如何界定大数据证据,大数据证据如何具有证据准入资格是刑事庭审中有待明晰的重要议题,笔者拟对大数据证据的内涵及法律地位进行深入的探讨,以期为刑事审判工作提供可操作的参考指引,梳理大数据证据与相关证据的联系与区别。
一、缘起:“封闭式”的刑事证据种类
证据是证据事实和证据载体的有机统一,证据载体就是通常所说的证据表现形式,证据的法定表现形式又称为“法定证据种类”[1]270。刑事诉讼法第50条列明了八种证据类型,是否意味着我国对于刑事证据类型进行了封闭式限定,即证据材料必须以八种形式之一体现才符合证据形式合法的要求,这个问题值得探讨。2021年开始施行的《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第101条新增的一项内容是:有关部门对事故进行调查形成的报告,在刑事诉讼中可以作为证据使用;报告中涉及专门性问题的意见,经法庭查证属实,且调查程序符合法律、有关规定的,可以作为定案的根据。此处的“可以作为证据使用”是从法律层面拓展了刑事证据的法定形式,在原有的基础之上增加了“事故调查报告”。此条文可以做以下延伸理解,司法解释颁布之前“事故调查报告”不可以直接作为证据使用,需要由法官审查之后转化为法定证据形式方可使用。由此可见,我国在立法层面对于证据形式进行了限定。
我国司法制度和证据制度是学苏联的,苏联证据法的特点之一,是将证据法定种类一项一项列举出来,这种列举式的优点是哪些证据可以在司法中应用非常清楚,证据的法定形式一目了然,但缺点是列举不周延,需要根据诉讼新情况、新变化随时作出调整,如果调整不及时,司法活动中对于新出现的证据种类,办案人员难免产生困惑[2]。随着社会经济、网络科技的发展,新型的犯罪领跑司法,证据规范呈现出滞后的局面。视听资料和电子数据分别是1996年和2012年刑事诉讼法修改之后新增的证据种类,在此之前,对于两种证据应该如何界定,是否可以作为证据适用等问题一度成为法学界争论的焦点。法律规范不可能实时更新,而新型证据随时都可能出现,如果对刑事证据种类进行僵化式的、封闭式的限定,势必会使审判活动步履艰难。
笔者认为,我国法律之所以归纳八种证据种类是为了规范庭审认定规则,为法官审查证据提供有差别的指引,因为不同种类的证据审查规则和要点均不同,以证据种类的不同设定不同的审查规则不仅能够促进证据规则的适用,而且可以限制法官的自由裁量权。从立法层面限定法定证据形式具有实践意义,但是不应该过于僵化。限制法定证据形式的核心目的在于规范法庭调查,为不同种证据设定不同的法庭调查规则,而不是以法定证据形式为门槛将能够证明案件事实的证据排除在外。对于大数据证据的认定也是如此,应该基于大数据证据的特征为其设定规范的调查程序。如果大数据信息依据其内容特征可以转化为鉴定意见或者书证等法定证据形式,则以法定证据审查规则予以审查,如果不能转化为法定证据形式,在证据形式合法性审查层面允许其以大数据证据这一新兴形式准入,准入之后按照大数据证据自身特征进行法庭审查,主要包括数据库操作人员就海量数据本身来源、体量设定、算法等问题出庭进行说明,这一部分内容后文会详细阐述。
二、何谓刑事司法中的“大数据证据”
(一)大数据证据的内涵
数据是人的行为活动在互联网存储介质中留下的可查询的痕迹,大数据从字面理解,强调数据在量的层面的集合。所谓大数据,是指“体量超过了典型数据库软件工具捕获、存储、管理和分析数据能力的数据集”[3]。这一概念较为直观地描述了大数据信息容量极大的本质特点。而突显大数据算法特质的概念,则由国际数据中心(IDC)提出,它们认为,大数据就是“旨在通过实现高速捕获、收集、分析,以经济地从多样的极大量数据中挖掘价值”[3]。我们之所以将大数据证据作为新兴证据来研究它的证据准入问题和证据形式定位问题,就是因为它与现有的八种法定证据均有区别,不能转化为任何一种形式或者被任何一种所包含。实践中涉及大数据信息的证据很多,但只有符合大数据证据内部构成的信息材料才能被称为大数据证据。大数据证据由两部分组成:一是作为来源的海量电子数据;二是针对海量数据设定的算法结论,此处的算法多数通过建模分析进行,两者缺一不可,刑事诉讼中的材料必须同时具备以上两个要素才能界定为大数据证据。作为基础的海量数据本身属于电子数据,但是单一的电子数据与案件事实不具有关联性,继而不能作为证据使用,必须在统计一定数量的基础之上结合科学逻辑进行分析,得出的结论才能证明案件事实。综上,刑事诉讼中的大数据证据是指对于案件发生过程中产生的或者与案件有关的海量电子数据进行符合逻辑的模型分析之后得出的能够证明案件事实的结论,大数据证据的落脚点是“结论”,而非哪个数据本身。
(二)大数据证据与电子数据的区别
2012年刑事诉讼法新增了电子数据这一法定证据种类,我们要严格区分大数据证据与电子数据,避免实践中将两者的认定规则混淆。电子数据具有单一性,大数据证据是在电子数据基础上衍生而来的,是海量电子数据在合理算法的整合下,通过分析得出的结论,它并不是海量电子数据本身,但是它的形成是以此为基础的。大数据证据的内部构成一定包含算法,而电子数据不包含。这里需要重点分析大数据比对和针对一定数量的数据分析统计。大数据比对属于查找线索的侦查手段,多用于锁定犯罪嫌疑人,例如,通过人脸指纹或者其他信息的识别确定犯罪嫌疑人的真实身份或者准确位置。此类信息材料是在海量的电子数据中利用识别技术查找特定信息,以此内容来证明案件事实的,内部包含“识别技术”这一符合机器逻辑的算法,属于大数据证据。通过云端储存的数个电子数据分析特定人或者特定物的行为轨迹在实践中也是非常常见的,例如,通过GPS系统中的多个信息片段还原出某一车辆的行踪轨迹,此类信息材料仅是通过数个电子数据本身共同来证明案件事实,不包含算法,应该属于集成型电子数据。如果是通过提取沿途监控录像来还原行踪轨迹则属于视听资料的范畴。如果是通过一定数量1的电子数据直接证明案件事实的证据不属于大数据证据。例如,侦查人员通过查询犯罪嫌疑人近期的聊天记录或者网页浏览记录证明其于被害人之间存在过节,有犯罪动机,或者搜索过与犯罪相关的物品,此处的一定数量的浏览记录和聊天记录属于电子数据,而不属于大数据证据。大数据证据是基于海量数据结合分析得出的结论,此结论仅凭一个或者少量的数据是无法得出的。通过网页浏览记录、手机浏览记录等多个信息证明犯罪嫌疑人的犯罪动机或者犯罪故意,此类浏览记录属于电子数据,内部的分析仅是对材料的简单整合,既不包含机器算法,也不包含复杂的逻辑设定。
(三)大数据证据与鉴定意见的区别
大数据证据和鉴定意见这两种证据在实践中存在着容易混淆的现象。从概念出发,鉴定意见是指国家专门机关就案件中的专门性问题,指派或者聘请具有专门知识的鉴定人进行鉴定后出具的判断性意见。鉴定意见也包含两部分内容,一部分是作为鉴定对象的检材本身,另一部分是鉴定人的专业知识技能。它与大数据证据的根本区别在于后一部分,大数据证据中包含的算法一般是符合机器逻辑的机器算法,包含科技成分,而鉴定意见中包含“算法”是人的专业知识,例如,医学知识或者精算知识等。实践中,有一些情况是将大数据证据认定为鉴定意见2,笔者认为,这样认定并不合理,对于机器算法逻辑的审查尚不属于我国司法鉴定的范畴,实践中可以责令数据库管理比对人员或者其他具有大数据建模经验的人员充当专家辅助人的角色,接受当庭质证。
实践中我们应该对于不同的证据种类进行明确的区分,因为不同种证据的审查判断规则不同,审查侧重点也不同。对于电子数据我们要重点审查是否按照规定收集、固定原始储存介质;对于大数据证据我们除了要审查电子数据的收集、提取是否规范,还需要审查内部算法是否客观;对于鉴定意见我们要重点审查鉴定人以及机构的法律资质。准确区分证据种类能够有效防止法官的恣意擅断。
三、大数据证据在刑事司法中的法律地位
大数据证据作为数据时代的新兴产物,具有强科技性,与电子数据和视听资料相类似,具有科技性的证据一旦进入诉讼环节和法官视野,与传统的物证、书证、各类证言相比,更容易增强主观的内心确信程度,通过影响法官自由心证使法官更倾向于相信大数据所主张的事实存在。无论是普通民众还是刑事诉讼中的司法工作人员面对大数据证据,内心的潜意识会形成“铁证”的认识,即使在与其他证据的印证过程中存在矛盾,自由心证也会倾向于相信大数据证据所主张的内容。越是看似科学、客观的证明力强的证据越应该从源头审查,因为这样的证据一旦被认定会对案件事实的证明产生很大影响,所以,我们应该尽可能收集、固定、分析出真实的、不受污染篡改的、不带歧视性的大数据证据。
明确大数据证据的法律定位是研究大数据证据的起点,关系到后续具体审查判断规则的运用。对于大数据证据的证据形式是否合法学术界存在较大的争议。有观点认为,应该依据大数据证据体现的具体内容将现有法定证据种类作为其落脚点,即将大数据证据转化为鉴定意见或者专家辅助人意见在审判阶段予以审查[4]85-88。大数据分析尚未被列入独立的鉴定项目,目前通行的以检验报告形式说明大数据分析结果的做法,是现实法律框架下有效且经济的选择。书证是另一种常见的大数据形式,多用于说明直接由大数据平台或大情报系统导出的信息记录,可以更为直观明确地表达意见观点[5]。有观点认为,应当将大数据证据单独作为一种新兴的证据种类,未来的证据法中,大数据分析报告有必要单列出来。修改后的刑事诉讼法对于证据概念采用材料说,放宽了对证据资格的限制。例如,经济犯罪案件中,提取一段时间内的账户资金数据后,通过建模进行可疑资金分析,资金大数据分析报告如果对案件事实具有证明价值,只要不违反法律规定,在刑事诉讼中可以作为证据使用[2]。有观点认为,大数据证据无法在法定证据种类中定位的问题并非是无法逾越的屏障,应该将理论重心放置在法定的证据方法而非证据种类。大数据证据在证据方法上宜采用类似于电子数据勘验的方法,在法庭审理过程中由控方传唤从事数据库管理的操作人员当庭展示,或者由鉴定人、专家辅助人出庭接受质证。证据方法具有一定的开放性,并不必然对应某一种证据形式[6]。
在当下的数据时代,越来越多的大数据信息进入刑事诉讼中,我们不应该否定大数据证据作为刑事证据的准入资格,研究的侧重点在于大数据证据应该以何种形式发挥证明作用。大数据证据从本质上与电子数据、视听资料、鉴定意见等法定证据形式均有区别,内部结构具有二元性,内部算法主要依据机器逻辑进行,落脚点是通过建模分析得出的与基础电子数据无关的判断性结论。笔者认为,基于大数据证据内部结构特征,不宜将其僵化地转化为某一法定证据形式,更不宜以封闭式的证据形式直接将其排除在外,而应该以一种新的、独立的证据形式登场,继而扩大数据时代的刑事证据维度。
四、大数据证据在刑事司法中的适用与展望
对于大数据证据的收集程序和审查判断应该建立规范化的操作流程。经济类犯罪案件和计算机信息系统相关犯罪案件中包含大量资金数据或者其他网络数据的往来信息,单个信息是以电子数据的形式存在于网络中,但是单个信息无法证明案件事实,我们必须分析整合大量信息得出与案件事实相关的结论才能作为证据使用。面对海量数据,不可能实现人工分析,必须借助科技手段建立数据分析模型,以量化嵌入的方式获取结论。大数据证据的审查判断包括两个方面:一是对海量电子数据本身的收集和固定;二是对算法逻辑是否合理的审查判断。
(一)海量电子数据的审查判断
首先来分析海量数据的收集审查问题。作为基础的海量电子数据本身具有大体量的特征,这一特征不仅是区分大数据证据的核心,还是收集审查的难点所在。现行法律对于单个电子数据的收集做出了明确的规定,但是针对批量数据的收集方式并没有详细的规定。大数据中的海量数据不可能是一个一个收集而来的,而应该是一部分一部分收集而来,在兼顾公正与效率的双重价值下我们仅需要以批次为单位对几大部分的数据收集程序统一审查,这样不仅能够实现司法资源的有效配置,而且符合海量数据的批量特征。例如,对犯罪时间段内同一系统中的账户往来资金统一冻结,或者查封同一网站中的若干账号,以备后期模型分析使用。具体收集程序按照电子数据的程序进行,即由两名以上侦查人员在见证人的见证下扣押、封存原始存储介质,以录像或者其他恰当方式记录收集过程和封存样态。可以被包含在大数据证据中的电子数据不再需要单独作为一类证据予以审查。电子数据是一种互联网产生的静态数据,而大数据证据则运用了模型分析,加入了机器逻辑,可视为一种动态的数据结论。对于收集程序的审查除了常规的收集主体及步骤之外,还需要审查数据的体量、结点,即收集哪一时间段内哪些电子数据能够保证海量电子数据的范围是合理的。一般来说,我们应该收集犯罪行为实施的时间段内所有的涉案数据,对于犯罪行为发生前后的数据一般来说不需要收集,但是如果有证据显示以上数据与犯罪行为的事实、犯罪主体的主观心态、犯罪后的悔罪心态有密切联系的话,仍然属于证据的范畴,应该适当扩大收集范围。
(二)内部算法的审查判断
其次来分析算法逻辑合理性的审查。对于大数据证据内部算法的审查是研究大数据证据的难点,由于个案存在差异性,无法罗列不同案件的内部算法,笔者仅从宏观角度对于内部算法逻辑的构建进行初步的研究。大数据在不同领域的应用发挥着不同的作用。在商业领域,大数据分析结论有着指导经营、拓展市场等作用,例如,美国沃尔玛超市的大数据分析显示,每到周末来购买啤酒的人高概率的会去买尿不湿。包括沃尔玛超市的数据分析人员在内,许多人却始终认为啤酒和尿不湿是两个完全不相关的商品。上述案例所反映的原理正是大数据与传统人类裁判者思维的不同[3]。超市经营者可以据此分析调整两种商品的摆放位置,或者设置套餐销售。大数据分析报告为经营者提供了新的销售思路和方案,而这一销售思路是在机器逻辑的客观分析之下形成的,如果依靠人的主管认识很难得出这一结论。在科技领域,大数据分析结论可以作为研发新产品的依据,为流水生产线提供具体的操作流程。在司法领域,大数据既可以以一种新的侦查手段提供案件线索,也可以作为证据证明案件事实。不同领域的大数据分析结论都包含算法逻辑,如前文所述,内部分析都是经过机器的客观逻辑进行的。算法逻辑的设定一般包括两种:一种是机器本身识别出来的相关关系,例如,沃尔玛超市对于购物习惯的数据统计,啤酒和尿不湿是不具有联系的两种品类,它们的联系源于数据的客观记忆,它是大数据统计下的客观结论,完全为一种机器记忆,不掺杂任何人的主观认知;另一种是人的思维下的因果关系,例如,通过大数据显示甲的行踪和上网记录等内容推断甲的心理活动,从而推断甲是否可能存在犯罪故意。这种逻辑是基于人的主观认知而形成的,因为刑事司法对于事实的认定强调具有法律上的因果关系,所以此逻辑更接近裁判者的思维和审判逻辑。
大数据证据的形成是否一定要遵循因果关系的逻辑是一个值得思考的问题。笔者认为不需要,我们之所以允许作为新兴证据形式的大数据证据进入刑事诉讼中,就是因为它可以借助科技自身的力量,利用机器逻辑得出结论,对于案件事实的证明具有不可替代的价值,其他证据无法比拟,而利用判断性结论证明案件事实的时候才需要遵循法律中的因果逻辑。大数据证据内部算法的运行模式是内部分析逻辑,利用大数据证据证明案件事实是外部分析逻辑,两者应该分开考虑。英美证据法上的弗赖伊判例和多伯特判例为科学证据中蕴含的科学原理的审查设置了两种不同的审查标准。多伯特判例中的“综合观察标准”取代了先前的“普遍接受标准”,在确定一项科学原理是否成立时,需要裁判者从多个方面进行验证和审查。大数据证据在实践中可以通过数据管理人、数据分析人、专家辅助人当庭接受质证的方式审查算法的合理性,主要通过检验、复查来避免算法逻辑存在歧视性。此外,机器逻辑运行下不可避免地存在错误率,我们运行机器逻辑本身蕴含的一定范围内的容错率,只是在最终认定案件事实的时候需要由法官整体把握。我们不得动摇人类作为司法决策者的主体地位,接受来自算法的支持而非支配[7]。
大数据证据具有衍生性、科技性、间接性等特点[8]。大数据证据与其他证据类型最大的区别在于审查内容的双重性,即海量数据本身和算法结论。大数据证据的审查较为复杂,基于来源数据的多样化和算法内在逻辑的异样化难以设定统一的审查标准,目前只能从宏观的视角梳理大数据证据的认定规则,大数据证据的认定规则应该遵循两步走的审查模式,即通过证据能力和证明力的动态审查之后方能转化为定案根据。大数据证据的获得不仅涉及海量数据的提取,而且需要具有科技能力的机构进行建模分析,实践中作为个体主体的辩方往往很难获取,多数由侦查机关利用大数据侦查手段而获得。基于大数据证据的公有性,我们要避免诉讼中出现控辩失衡的局面,未来应该从两个方面消除大数据证据在审判阶段的适用风险:一是将科学的庭审认定规则辐射到审前阶段,规范审前阶段的取证程序,避免有问题的证据进入法官视野,使其产生难以消除的认识偏差;二是通过细化认定规则为法官提供审查指引,科学判断大数据证据的实用价值,即能否转化为定案根据。大数据证据作为新兴的蕴含科技要素的证据形式,它在证据能力和证明力的评价方面与现有法定证据形式均有区别,如何结合大数据证据的二元性内部结构规范它的证据审查判断规则还需在实践中逐步探索。
参考文献
[1]陈瑞华刑事证据法[M].北京:北京大学出版社, 2021.
[2]何家弘,邓昌智,张桂勇 ,等.大数据侦查给证据法带来的挑战[J].人民检察, 2018(1):54-57.
[3]元轶.证据制度循环演进视角下大数据证据的程序规制:以神示证据为切入[J] .政法论坛, 2021(3):132-142.
[4]万春.网络犯罪指导性案例实务指引[M].北京:中国检察出版社,2018.
[5]罗文华.大数据证据之实践与思考[J]中国刑事警察, 2019(5):18-20.
[6]林喜芬.大数据证据在刑事司法中的运用初探[J].法学论坛, 2021(3):27-36.
[7]谢澍.人工智能如何“无偏见”地助力刑事司法:由“证据指引”转向“证明辅助”[J].法律科学(西北政法大学学报) , 2020(5):109-119.
[8]张吉喜,孔德伦.论刑事诉讼中的大数据证据[J].贵州大学学报(社会科学版) , 2020(4):82-88.
注释
1这里的“一定数量”与大数据证据中包含的海量电子数据相比数量极少。
2比如:眉山市东坡区人民法院(2018)川1402刑初44号刑事判决书;单县人民法院(2019)鲁1722刑初215号刑事判决书。
在推进智慧法院的建设中更应注意对案件大数据库的保护和备份,法院既是使用技术的一方,也应当是研发技术的参与者。在核心技术的研发中更要积极参与,对于司法核心信息的绝对保护也应当引起高度的重视。...
笔者拟对大数据证据的内涵及法律地位进行深入的探讨,以期为刑事审判工作提供可操作的参考指引,梳理大数据证据与相关证据的联系与区别。...