CN113642986A

CN113642986A - 构建数字公证的方法

Info

Publication number: CN113642986A
Application number: CN202110879972.2A
Authority: CN
Inventors: 不公告发明人
Original assignee: Shanghai Shiyou Intelligent Technology Co ltd
Current assignee: Shanghai Shiyou Intelligent Technology Co ltd
Priority date: 2021-08-02
Filing date: 2021-08-02
Publication date: 2021-11-12
Anticipated expiration: 2041-08-02
Also published as: CN113642986B

Abstract

本发明公开了构建数字公证的方法，包括：通过对录像、录音、拍照、网页、APP等场景提供多种取证手段，合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链，通过数据分析，识别证据真伪，对上报的材料进行加密处理，全部上传至区块链，同时利用AI模拟出自适应的证伪技术与伪造技术对抗，判断并排除不可信证据，模拟对抗解决方案，结合变分自编码和生成对抗网络技术帮助在构建数字公证时保持了模型的稳定性，本发明构建了智能化的第三方公证机构，用虚拟化、智能化的方法代替公证部门，减少了人为因素，节省了公证机构的人力、物力和财力，帮助企业节省了成本和精力。

Description

构建数字公证的方法

技术领域

本发明涉及数字公证技术领域，具体为构建数字公证的方法。

背景技术

数据公证为企业提供了数字公证服务，为录像、录音、拍照、网页、APP等场景提供多种取证手段以合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链，再通过数据分析识别证据的真伪，对上报的材料进行加密处理后全部上传至区块链，区块链能够推进信息互联共享，进一步加强公证处与外部机构的协调沟通，为办理公证业务提供有效的信息核实手段，结合区块链不可篡改、可溯源的特性，能够全程参与见证，增加了公证结果的可信度，但是，现有技术中公证机构缺乏技术辅助，公证效率低；其次，构建数字公证，需要采集公证部门工作流程和专家公证经验，制定虚拟的公证人员，公证过程主要是公证专家利用工作经验和工作流程、关联分析办法，最后确定真伪，然而现实生活中的公证，证据千差万别，伪造技术创新层出不穷，也可能是由AI自动模拟生成，公证业务受较多人为因素影响，不能实现公证的智能化和自动化，构建智能化的第三方公证机构，用虚拟化、智能化的方法代替公证部门，减少了人为因素，节省了公证机构的人力、物力和财力，也帮助企业节省了成本和精力。

所以，人们需要构建数字公证的方法来解决上述问题。

发明内容

本发明的目的在于提供构建数字公证的方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：构建数字公证的方法，其特征在于：包括以下步骤：

S1：获取数据，筛查数据类型并设置标签；

S2：关联分析上报到数字公证模型的企业历史数据，设定企业核实真伪指标，自动设定关联分析模式；

S3：精细化关联分析模式；

S4：依据环境变化进行数据分析，描绘关联曲线，采集行为特征数据；

S5：对关联分析模式进行可用性判断；

S6：指标检测，对检测出的问题数据进行打标签；

S7：指标识别，判断是否存在漏判、错判；

S8：利用AI模拟出自适应证伪技术。

进一步的，在步骤S1-S2中：获取录像、录音、拍照、网页、APP的数据，筛查获取到的数据类型并设置标签：将结构化数据设标签0，非结构化数据设标签1；关联分析上报到数字公证模型的企业各方面数据，可以是企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化等，根据对应企业历史数据，勾画特征图谱，分析行为特点、规律趋势，设定对应企业的核实真伪指标，自动设定关联分析模式：为结构化数据和非结构化数据设定不同的关联分析模式，将没有关联性的证据直接排除，例如：依据企业不动产、房产租赁信息、水电费、水电使用时间关联分析房产是否抵押担保；或者依据动产、车辆信息、保养时间、违规情况、行驶情况关联分析车辆是否抵押担保等。

进一步的，在步骤S3中：设置指标分析点，取N+1模式，其中，N+1>10，分析N点之间的关联性，使用贝叶斯网络和贝叶斯算法进行深度学习，适应环境变化，采用概率推理方法，根据不同的环境、状态选择不同的数据分析方法，例如：对车辆保险的证据分析，需要分析车况、保养情况、出险情况、违章情况，关联分析出该车保险是否骗保。

进一步的，在步骤S5中：通过X个数据，其中，X>3，验证关联分析模式是否具有逻辑性：通过证据之间的相互印证，凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性，用查证属实的实物证据作为参照来检验言词证据，证据之间相互加强对方对待证事实，排除相互之间矛盾和无法解释的疑问：利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断，通过判断各证据之间的一致或者矛盾关系辨别证据真伪，进行证据审查和分析，利用逻辑定律中的同一律、矛盾律和排中律审查分析证据，证明证据与对应事实间的客观联系，主要为因果联系，与事件发生相关的空间、时间、条件、方法、手段的事实，判断形成的证据链是否完整并排除可疑点：查看相互关联证据间的关联性，查询证据本身与对应事实有无联系以及联系的紧密、强弱程度，判断能否形成完整的证据链：若无法形成证据闭环，则证据不完整，无法验证事实，进行证据排除，进行逻辑推理，用逻辑推理公式验证证据的可靠性，例如：证据1、证据2能证明证据3，利用逻辑推理验证证据1、证据2、证据4能否证明证据3，并结合双向RNN和专家经验来检验证据的证明力，此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则相互证伪有利于初次有效地排除可疑点。

进一步的，在步骤S6中：利用先验概率模型进行指标检测：求得统计检测量和判决门限，若统计检测量小于判决门限，判断对应指标可用；反之，判断指标不可用，对检测出的问题数据进行打标签，利用基于漏检概率的多指标可用性确定方法，对不同设置情况分别进行统计，利用最大似然估计法排除问题指标，排除步骤为：首先，观测指标值的矩阵H可以由QR分解为：

其中：Q₁为m×4矩阵，Q₂为m×(m-4)矩阵，R为4×4矩阵，0为(m-4)×4矩阵，m表示观测的指标数量；其次，设概率密度函数为：

其中，p为概率，b为问题指标数，σ为误差值，T为预先设定的阈值；然后，设第i个指标对应的偏差向量使似然函数

的值达到最大，化简并代入偏差向量μ＝[0…b_i…0]得：

其中，f为系数，y为量测方程，最后，将上式对参数b_i并令其为零，得：2S_iy-2b_iS_ii＝0；可得参数b_i的最大似然估计值为：

使得

达到最大值，最大值为：(S_iy)²/S_ii-y^TSy，其中，S_i为矩阵S的第i行的元素，S_ii为矩阵S主对角线上的第i个元素，在m个指标中，判断使似然函数值达到最大的为问题指标，将其排除，提高了指标检测的准确度。

进一步的，在步骤S7中：采集到检测到的有问题采样点数为n，实际有问题的采样点数为n’，正确识别问题的采样点数为M，根据下列公式分别计算指标检测率w和指标识别率W：

若w＝100％且W＝100％，判断没有漏判和错判；若w≠100％，判断指标检测存在漏判和错判；若W≠100％，判断指标识别存在漏判和错判，有利于二次有效地排除可疑点，得到更精确的排除结果。

进一步的，在步骤S8中：所述利用AI模拟出自适应证伪技术，包括以下步骤：

S11：依据可用性判断结果选择证伪方法；

S12：通过神经网络对同类问题数据进行深度学习和数据挖掘；

S13：甄别数据侵权和证据真伪的各类状况，分析证据适用范围、影响和产生后果；

S14：判断证据与其他证据的关联性、逻辑性，对判断情况设定标签；

S15：判断证据是否破坏伦理或公证规则，确定结果的危险程度；

S16：根据危险等级排除不可信证据；

S17：完善各类证伪方案；

判断证据是否破坏伦理或公证规则的方式属于现有技术，例如：甲男与乙女存在事实婚姻，现分割财产，但是通过验证甲男和乙女的身份证、户口簿，发现甲男是乙女的父亲，判断其破坏了伦理道德、公序良俗，违反了公证规则。

进一步的，在步骤S12中：通过神经网络对同类问题数据进行深度学习和数据挖掘，用自编码器搜索图像和视频，用简单理解网络处理非机构化数据，用深度置信网络处理结构化数据，自动识别无标记数据并添加标签，变分自编码是基于变分思想的深度学习的生成式模型，假设xx为随机变量，zz为隐变量，变分自编码提出了变分下届的概念，通过变分函数q(z)q(z)来对后验概率p(z|x)p(z|x)进行替换，并用KL散度度量两者的近似程度，有利于简化在面对大规模复杂数据时的难求解问题，利用变分自编码技术有利于很好地针对图像的特征进行建模。

进一步的，在步骤S13中：利用RNN深度学习和Python数据分析，对数据侵权和证据真伪的各类状况进行甄别，并把相关场景学习构建再现，对数据进行关联比对分析，利用因果推断模型确定证据适用范围、影响和产生后果。

进一步的，在步骤S17中：若需要设计强化版证据证伪工具，则由生成对抗网络模拟证据并自行处理，通过强化学习完善各类证伪方案，自动建立与之对抗的优化版筛选方案，并自主学习建立逻辑关系，设定证伪的逻辑公示，验证真伪措施，在生成式模型中，生成对抗网络(GAN)是一类特殊的存在，它的提出不仅使各个领域的发展达到新的高度，更是促使人工智能领域走向了一个具有“思想”的时代，GAN是一个具有对抗思想的网络结构，虽然GAN的变种模型层出不穷、用途广泛，但其核心和对抗思想却可以一直保持不变；GAN是一个无监督生成式模型，与变分自编码相比，GAN没有使用变分下届，模型主要分为两类：一类是生成式模型，另一类是判别式模型，生成式模型会对xx和yy的联合分布p(x，y)p(x，y)进行建模，通过贝叶斯公式来求得yy的条件后验概率p(y|x)p(y|x)，最后选择使p(y|x)p(y|x)取得最大值的yiyi作为模型的输出；而判别式模型则会直接给出p(y|x)p(y|x)的表达式，二者之间存在的差异如下：

(1)生成式模型会对数据的分布做出一定的假设，并且只有在满足这些假设时，它才能在这些服从假设概率分布的数据上得到不错的效果，若假设不成立，则判别式模型将会有更好的学习效果；

(2)若需要对类别进行更新，生成式模型只需要对新的xx和yy的联合概率分布p(x，y)p(x，y)计算即可，而判别式模型则需要对整个p(y|x)p(y|x)进行重新训练；

(3)在对错误率进行分析方面，生成式模型最终得到的错误率将比判别式模型的错误率更高，但是生成式模型的抽样复杂性较低，只需要很少的样本就可以使错误率收敛；

(4)对于无标签的数据，生成式模型(例如：深度信念网络DBN)能更好地利用数据本身所包含的信息；

(5)判别式模型通常需要解决凸优化问题。

与现有技术相比，本发明所达到的有益效果是：

1.本发明通过通过对录像、录音、拍照、网页、APP等场景提供多种取证手段，合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链，通过数据分析，识别证据真伪，对上报的材料进行加密处理，全部上传至区块链，构建了一个人工智能的第三方监管人，代替相关人员帮助企业合规整改，并帮助了有关部门监督企业合规、参与企业治理，结合变分自编码VAE与生成对抗网络GAN，使用GAN的判别器学习特征表示，变分自编码VAE为重构目标提供帮助，能够在生成增强版的判别器的同时保持模型的稳定，利用AI模拟出自适应的证伪技术与伪造技术对抗，有效判别出证据的真假，避免有关人员生成足够逼真的证据来欺骗相关部门人员，判断并排除不可信证据，模拟对抗解决方案，节省了相关部门人力、物力、财力，也帮助企业节省了成本和精力。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明构建数字公证的方法的步骤图；

图2是本发明的AI模拟出自适应证伪技术的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

请参阅图1-2，本发明提供技术方案：构建数字公证的方法，其特征在于：包括以下步骤：

S1：获取数据，筛查数据类型并设置标签；

S3：精细化关联分析模式；

S5：对关联分析模式进行可用性判断；

S6：指标检测，对检测出的问题数据进行打标签；

S7：指标识别，判断是否存在漏判、错判；

S8：利用AI模拟出自适应证伪技术。

在步骤S1-S2中：获取录像、录音、拍照、网页、APP的数据，筛查获取到的数据类型并设置标签：将结构化数据设标签0，非结构化数据设标签1；关联分析上报到数字公证模型的企业各方面数据，可以是企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化等，根据对应企业历史数据，勾画特征图谱，分析行为特点、规律趋势，设定对应企业的核实真伪指标，自动设定关联分析模式：为结构化数据和非结构化数据设定不同的关联分析模式，将没有关联性的证据直接排除，例如：依据企业不动产、房产租赁信息、水电费、水电使用时间关联分析房产是否抵押担保；或者依据动产、车辆信息、保养时间、违规情况、行驶情况关联分析车辆是否抵押担保等。

在步骤S3中：设置指标分析点，取N+1模式，其中，N+1>10，分析N点之间的关联性，使用贝叶斯网络和贝叶斯算法进行深度学习，适应环境变化，采用概率推理方法，根据不同的环境、状态选择不同的数据分析方法，例如：对车辆保险的证据分析，需要分析车况、保养情况、出险情况、违章情况，关联分析出该车保险是否骗保。

在步骤S5中：通过X个数据，其中，X>3，验证关联分析模式是否具有逻辑性：通过证据之间的相互印证，凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性，用查证属实的实物证据作为参照来检验言词证据，证据之间相互加强对方对待证事实，排除相互之间矛盾和无法解释的疑问：利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断，通过判断各证据之间的一致或者矛盾关系辨别证据真伪，进行证据审查和分析，利用逻辑定律中的同一律、矛盾律和排中律审查分析证据，证明证据与对应事实间的客观联系，主要为因果联系，与事件发生相关的空间、时间、条件、方法、手段的事实，判断形成的证据链是否完整并排除可疑点：查看相互关联证据间的关联性，查询证据本身与对应事实有无联系以及联系的紧密、强弱程度，判断能否形成完整的证据链：若无法形成证据闭环，则证据不完整，无法验证事实，进行证据排除，进行逻辑推理，用逻辑推理公式验证证据的可靠性，例如：证据1、证据2能证明证据3，利用逻辑推理验证证据1、证据2、证据4能否证明证据3，并结合双向RNN和专家经验来检验证据的证明力，此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则，相互证伪，便于初次有效地排除可疑点。

在步骤S6中：利用先验概率模型进行指标检测：求得统计检测量和判决门限，若统计检测量小于判决门限，判断对应指标可用；反之，判断指标不可用，对检测出的问题数据进行打标签，利用基于漏检概率的多指标可用性确定方法，对不同设置情况分别进行统计，利用最大似然估计法排除问题指标，排除步骤为：首先，观测指标值的矩阵H可以由QR分解为：

的值达到最大，化简并代入偏差向量μ＝[0…b_i…0]得：

使得

达到最大值，最大值为：(S_iy)²/S_ii-y^TSy，其中，S_i为矩阵S的第i行的元素，S_ii为矩阵S主对角线上的第i个元素，在m个指标中，判断使似然函数值达到最大的为问题指标，将其排除，能够提高指标检测的准确度。

在步骤S7中：采集到检测到的有问题采样点数为n，实际有问题的采样点数为n’，正确识别问题的采样点数为M，根据下列公式分别计算指标检测率w和指标识别率W：

若w＝100％且W＝100％，判断没有漏判和错判；若w≠100％，判断指标检测存在漏判和错判；若W≠100％，判断指标识别存在漏判和错判，便于二次有效地排除可疑点，得到更精确的排除结果。

在步骤S8中：利用AI模拟出自适应证伪技术，包括以下步骤：

S11：依据可用性判断结果选择证伪方法；

S16：根据危险等级排除不可信证据；

S17：完善各类证伪方案；

在步骤S12中：通过神经网络对同类问题数据进行深度学习和数据挖掘，用自编码器搜索图像和视频，用简单理解网络处理非机构化数据，用深度置信网络处理结构化数据，自动识别无标记数据并添加标签，变分自编码是基于变分思想的深度学习的生成式模型，假设xx为随机变量，zz为隐变量，变分自编码提出了变分下届的概念，通过变分函数q(z)q(z)来对后验概率p(z|x)p(z|x)进行替换，并用KL散度度量两者的近似程度，有利于简化在面对大规模复杂数据时的难求解问题，利用变分自编码技术便于很好地针对图像的特征进行建模。

在步骤S13中，利用RNN深度学习和Python数据分析，对数据侵权和证据真伪的各类状况进行甄别，并把相关场景学习构建再现，对数据进行关联比对分析，利用因果推断模型确定证据适用范围、影响和产生后果。

在步骤S17中：若需要设计强化版证据证伪工具，则由生成对抗网络模拟证据并自行处理，通过强化学习完善各类证伪方案，自动建立与之对抗的优化版筛选方案，并自主学习建立逻辑关系，设定证伪的逻辑公示，验证真伪措施，在生成式模型中，生成对抗网络(GAN)是一类特殊的存在，它的提出不仅使各个领域的发展达到新的高度，更是促使人工智能领域走向了一个具有“思想”的时代，GAN是一个具有对抗思想的网络结构，虽然GAN的变种模型层出不穷、用途广泛，但其核心和对抗思想却可以一直保持不变；GAN是一个无监督生成式模型，与变分自编码相比，GAN没有使用变分下届，模型主要分为两类：一类是生成式模型，另一类是判别式模型，生成式模型会对xx和yy的联合分布p(x，y)p(x，y)进行建模，通过贝叶斯公式来求得yy的条件后验概率p(y|x)p(y|x)，最后选择使p(y|x)p(y|x)取得最大值的yiyi作为模型的输出；而判别式模型则会直接给出p(y|x)p(y|x)的表达式，二者之间存在的差异如下：

(5)判别式模型通常需要解决凸优化问题。

实施例一：获取录像、录音、拍照、网页、APP的数据，筛查获取到的数据类型并设置标签：将结构化数据设标签0，非结构化数据设标签1，关联分析上报到数字公证模型的企业各方面数据：包括企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化，根据企业上述历史数据勾画出对应企业特征图谱、行为特点、规律趋势，设定对应企业的核实真伪指标为：不动产、房产租赁信息、水电费、水电使用时间，自动设定关联分析模式，关联分析房产是否抵押担保，设置指标分析点，取N+1＝16模式，分析15点之间的关联性，使用贝叶斯网络和贝叶斯算法进行深度学习，适应环境变化，根据环境调整进行数据分析，勾画出关联分析设置的特征图谱、特点、趋势、规律等，画出关联曲线，利用模型进行行为特征采集，然后进行可用性判断：通过X＝10个数据，验证关联分析模式是否具有逻辑性，从而相互证伪，之后用先验概率模型进行指标检测和识别，判断是否是漏判、错判：采集到检测到的有问题采样点数为n＝15，实际有问题的采样点数为n’＝15，正确识别问题的采样点数为M＝12，根据公式

计算指标检测率w＝100％，根据公式

计算指标识别率W＝80％，判断识别存在漏判、错判，重新进行指标识别，待不存在漏判、错判后利用AI模拟出自适应证伪技术与伪造技术进行对抗。

最后应说明的是：以上所述仅为本发明的优选实例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.构建数字公证的方法，其特征在于：包括以下步骤：

S1：获取数据，筛查数据类型并设置标签；

S3：精细化关联分析模式；

S5：对关联分析模式进行可用性判断；

S6：指标检测，对检测出的问题数据进行打标签；

S7：指标识别，判断是否存在漏判、错判；

S8：利用AI模拟出自适应证伪技术。

2.根据权利要求1所述的构建数字公证的方法，其特征在于：在步骤S1-S2中：获取录像、录音、拍照、网页、APP的数据，筛查获取到的数据类型并设置标签：将结构化数据设标签0，非结构化数据设标签1；关联分析上报到数字公证模型的企业各方面数据，根据对应企业历史数据，勾画特征图谱，分析行为特点、规律趋势，设定对应企业的核实真伪指标，自动设定关联分析模式：为结构化数据和非结构化数据设定不同的关联分析模式，将没有关联性的证据直接排除。

3.根据权利要求1所述的构建数字公证的方法，其特征在于：在步骤S3-S4中：设置指标分析点，取N+1模式，其中，N+1>10，分析N点之间的关联性，使用贝叶斯网络和贝叶斯算法进行深度学习，适应环境变化，采用概率推理方法，根据不同的环境、状态选择不同的数据分析方法。

4.根据权利要求1所述的构建数字公证的方法，其特征在于：在步骤S5中：通过X个数据，其中，X>3，验证关联分析模式是否具有逻辑性：通过证据之间的相互印证，凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性，用查证属实的实物证据作为参照来检验言词证据，证据之间相互加强对方对待证事实，排除相互之间矛盾和无法解释的疑问：利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断，通过判断各证据之间的一致或者矛盾关系辨别证据真伪，进行证据审查和分析，利用逻辑定律中的同一律、矛盾律和排中律审查分析证据，证明证据与对应事实间的客观联系：查看相互关联证据间的关联性，查询证据本身与对应事实有无联系以及联系的紧密、强弱程度，判断能否形成完整的证据链：若无法形成证据闭环，则证据不完整，无法验证事实，进行证据排除，进行逻辑推理，用逻辑推理公式验证证据的可靠性，并结合双向RNN和专家经验来检验证据的证明力，此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则。

5.根据权利要求1所述的构建数字公证的方法，其特征在于：在步骤S6中：利用先验概率模型进行指标检测：求得统计检测量和判决门限，若统计检测量小于判决门限，判断对应指标可用；反之，判断指标不可用，对检测出的问题数据进行打标签，利用基于漏检概率的多指标可用性确定方法，对不同设置情况分别进行统计，利用最大似然估计法排除问题指标，排除步骤为：首先，观测指标值的矩阵H可以由QR分解为：

的值达到最大，化简并代入偏差向量μ＝[0…b_i…0]得：

使得

达到最大值，最大值为：(S_iy)²/S_ii-y^TSy，其中，S_i为矩阵S的第i行的元素，S_ii为矩阵S主对角线上的第i个元素，在m个指标中，判断使似然函数值达到最大的为问题指标，将其排除。

6.根据权利要求1所述的构建数字公证的方法，其特征在于：在步骤S7中：采集到检测到的有问题采样点数为n，实际有问题的采样点数为n’，正确识别问题的采样点数为M，根据下列公式分别计算指标检测率w和指标识别率W：

若w＝100％且W＝100％，判断没有漏判和错判；若w≠100％，判断指标检测存在漏判和错判；若W≠100％，判断指标识别存在漏判和错判。

7.根据权利要求1所述的构建数字公证的方法，其特征在于：在步骤S8中：所述利用AI模拟出自适应证伪技术，包括以下步骤：

S11：依据可用性判断结果选择证伪方法；

S16：根据危险等级排除不可信证据；

S17：完善各类证伪方案。

8.根据权利要求7所述的构建数字公证的方法，其特征在于：在步骤S12中：通过神经网络对同类问题数据进行深度学习和数据挖掘，用自编码器搜索图像和视频，用简单理解网络处理非机构化数据，用深度置信网络处理结构化数据，自动识别无标记数据并添加标签。

9.根据权利要求7所述的构建数字公证的方法，其特征在于：在步骤S13中：利用RNN深度学习和Python数据分析，对数据和证据真伪的各类状况进行甄别，并把相关场景学习构建再现，对数据进行关联比对分析，利用因果推断模型确定证据适用范围、影响和产生后果。

10.根据权利要求7所述的构建数字公证的方法，其特征在于：在步骤S17中：通过强化学习完善各类证伪方案，自动建立与之对抗的优化版筛选方案，并自主学习建立逻辑关系，设定证伪的逻辑公示，验证真伪措施。