□从我国刑事证据审查机制看,目前所建立的是以法定证据类型为横向坐标,以“资料—证明—定案依据”为纵向审核流程的基础架构。大数据证据作为一种新兴的证据类型,理应适用现行刑事证据审查的体系框架。因而,可以按照刑事证据审查两道门槛分为“证明材料—证据”和“证据—定案根据”两个阶段对大数据证据进行审查。

  □由“材料”到“证据”的审查是对证据准入资格的审查。证据准入资格审查应符合两大要求:材料转化为证据要具备合法性,证据材料要具备证明能力。其中,具备证明能力是实质性要件,合法性要求更多是形式上的要件。证据准入资格的审查可以借助证据能力的审查标准开展。

  在信息技术高速发展的时代背景下,大数据证据越来越多地出现在诉讼中。然而,目前我国立法和司法解释中尚未对大数据证据的证据属性、审查运用等作出明确规定,理论上关于大数据证据的证据属性与审查标准的讨论尚未形成一致意见,司法实践中对于大数据证据的裁量标准也缺乏统一尺度。因此,亟须构建大数据证据审查体系,通过对大数据证据的合理审查促进诉讼质效提升。

  要建立大数据证据的审查体系,首先必须厘清大数据证据的内涵和属性。我国学界对于大数据证据的定义有争论而无定论,目前已形成了鉴定意见说、电子证据说、独立证据说三种观点。一般来说,大数据证据的形成过程为:搜集汇总基础海量数据并逐步进行数据信息清洗—建构算法分析模型—形成分析研究结论即大数据分析报告。从结构上看,大数据证据呈现出海量电子数据、大数据技术、书面分析报告“三位一体”的结构;从内容上看,大数据证据具有“算法黑箱”“专业壁垒”“弱关联性”等特征;从空间上看,大数据证据具有海量电子数据与实物载体“虚实结合”的特征。这些特性决定了大数据证据具备远超于电子数据载体所能承受的数据体量和证据形式,且大数据技术“机器”决策也不同于鉴定“人”的决策。因此,有必要确立大数据证据独立的证据地位,并基于大数据证据的特征构建相应审查体系。

  从我国刑事证据审查机制看,目前所建立的是以法定证据类型为横向坐标,以“资料—证明—定案依据”为纵向审核流程的基础架构。大数据证据作为一种新兴的证据类型,理应适用现行刑事证据审查的体系框架。因而,可以按照刑事证据审查两道门槛分为“证明材料—证据”和“证据—定案根据”两个阶段对大数据证据进行审查。

  第一阶段:“证明材料—证据”阶段的审查

  由“材料”到“证据”的审查是对证据准入资格的审查。根据刑事诉讼法第50条规定:“可以用于证明案件事实的材料,都是证据。”可见,“材料说”已经得到立法的采纳。“材料说”对部分还未来得及被法律纳入法定证据种类的案件证据材料放宽了限制,从而为大数据证据的适用提供了依据。但该条规定也对证据准入资格提出了要求,即必须具备能够证明案件事实的能力。由此,证据准入资格审查应符合两大要求:材料转化为证据要具备合法性,以及证据材料要具备证明能力。其中,具备证明能力是实质性要件,合法性要求更多是形式上的要件。证据准入资格的审查可以借助证据能力的审查标准开展。证据能力的审查一般分为:合法性审查、相关性审查、可靠性审查。大数据证据的合法性属于法律建构上的问题,尚无明文规定,因此,目前对大数据证据的证据能力审查应主要从相关性检验和科学可靠性检验展开。

  基于大数据在结构上的特性,审查大数据证据的相关性可从三个方面进行:其一,技术选择的相关性。大数据技术选择须首先满足证据有助于发现案件事实因果关系的基础性要求,但不宜要求过高,只需满足大数据证据能够证明待证事实的可能性即可;其二,数据的相关性要求。海量基础数据之间应具有关联性;基础电子数据与案件事实之间应具有相关性,这也是大数据与案件具有相关性的内在要求;其三,结论的相关性要求。最终得出的结论即大数据分析报告要与待证要件事实之间具有相关性,且能够发挥证明效果。

  作为一种以数据科学为依托的证据,大数据证据的科学可靠性检验同样可从三个不同层面进行:第一,技术的可靠性。简单来讲,就是用以算法模型为核心的数据处理方法将非结构化的海量数据结构化,并从中寻找数据与数据之间以及数据与案件事实之间的关联。违反有关技术的操作不仅可能影响海量电子数据资料的真实合法性,更可能影响大数据及分析报告的可靠性。对大数据证据的技术可靠性证成主要包括:选择该算法模型的原因、算法模型设计是否有效合理、分析报告是否有效三个方面。第二,数据的可靠性。大数据证据的可靠性要求大数据形成过程中产生的信息与原始数据要保持一致,包括数据收集、数据清洗和数据标注三个阶段的准确与真实,且没有被更改、删减,在完整性的基础之上还需要满足数据与数据之间、数据与客观事实之间不矛盾的要求。第三,结论的可靠性。大数据分析报告作为大数据证据最终的产物是基于目标海量基础数据分析得到的,需要满足大数据分析报告与原始基础数据、待证事实之间具有唯一的对应关系。除此之外,还要求对于不能被司法人员直观认知的报告,要通过专门机构或者人员进行辅助分析,从而判断该报告与其他证据是否相互印证,是否具有可解释性。

  第二阶段:“证据—定案根据”阶段的审查

  “证据—定案根据”阶段的审查是对定案根据资格的审查,更多涉及司法人员的自由心证。由于证明力的审查是大数据证据成为定案依据的必要条件而不是充分条件,这一阶段的审查与证明力的审查并不全然相同。

  大数据证据必须查证属实。根据刑事诉讼法第42条第3款规定:“证据必须经过查证属实,才能作为定案的根据。”该规定一方面要求大数据分析的结论确实为真,并能够达到证明标准:另一方面也强调了证据转化为定案根据的程序性要件,即大数据证据需要经过“当庭出示、辨认、质证等法庭调查程序”查明属实后,才能作为定案的根据。

  大数据证据的证明力要求。证明力从本质上来说主要体现在证据相关性的大小。证明力的审查与前述证据能力审查环节中相关性审查无本质差异,区别仅在于一个审查“有无”,一个更看重“程度”。但是,证明力的审查仍应在前述相关性要求的基础上注意以下三个方面:首先,证据之间具有相关性,也就是大数据证据之间以及与其他证据的证明之间必须存在一定的交集;其次,大数据证据与其他证据共同指向同一待证事实,“孤证不能定罪”;最后,能够合理排除证据之间的矛盾。这三个阶段的要求层层递进,从正反两面提出整体性要求。

  排除合理怀疑的审查要求。大数据证据作为定案根据还需要达到能够排除合理怀疑的程度,这主要涉及司法人员的自由心证,从而实现证明标准的主客观结合。虽然我国刑事诉讼定罪证明标准是综合全案证据排除合理怀疑,而不是根据单个证据就可以排除合理怀疑,但是二者并不完全对立,如果一个大数据证据存在不可排除的合理怀疑,那么它与其他诸多证据组合成的整体可能会存在证明风险。

  构建大数据证据的审查体系,还应注重配套制度的完善,特别是完善大数据证据的“鉴真”制度。鉴真是对证据来源和提取过程的要求,即由专业人员对科学技术作出鉴别意见,揭示证据的真实性和相关性,具体包括以下两个方面:其一,对大数据证据的外部载体进行鉴真。海量电子数据经过数据提取、清洗等过程和算法的作用后呈现的物质载体就是大数据证据的外部载体。对外部载体进行鉴真需要对证据保管链条的完整性进行证明,以确保大数据在上述整个过程中始终保持同一性。其二,对大数据证据的内部载体进行鉴真。对内部载体进行鉴真,应当对生成大数据证据的数据或代码的完整性进行审查,避免数据或代码被调换、编辑。

  完善大数据证据的质证机制。大数据证据基于复杂的算法技术和数据采集等存在证据偏在问题,导致辩方在与控方对抗中处于弱势地位。因此,完善大数据证据的质证机制就尤为重要。由于大数据证据的证明机制以及算法黑箱的特点,应注重大数据证据源代码的开示,让主导证据生成的源代码在质证过程中发挥重要作用,同时可以适用专家辅助人制度,以应对因专业性程度较高导致的诉讼不平衡问题。