CN113642986A - 构建数字公证的方法 - Google Patents

构建数字公证的方法 Download PDF

Info

Publication number
CN113642986A
CN113642986A CN202110879972.2A CN202110879972A CN113642986A CN 113642986 A CN113642986 A CN 113642986A CN 202110879972 A CN202110879972 A CN 202110879972A CN 113642986 A CN113642986 A CN 113642986A
Authority
CN
China
Prior art keywords
evidence
data
index
constructing
judgment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110879972.2A
Other languages
English (en)
Other versions
CN113642986B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shiyou Intelligent Technology Co ltd
Original Assignee
Shanghai Shiyou Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shiyou Intelligent Technology Co ltd filed Critical Shanghai Shiyou Intelligent Technology Co ltd
Priority to CN202110879972.2A priority Critical patent/CN113642986B/zh
Publication of CN113642986A publication Critical patent/CN113642986A/zh
Application granted granted Critical
Publication of CN113642986B publication Critical patent/CN113642986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Primary Health Care (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)

Abstract

本发明公开了构建数字公证的方法,包括:通过对录像、录音、拍照、网页、APP等场景提供多种取证手段,合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链,通过数据分析,识别证据真伪,对上报的材料进行加密处理,全部上传至区块链,同时利用AI模拟出自适应的证伪技术与伪造技术对抗,判断并排除不可信证据,模拟对抗解决方案,结合变分自编码和生成对抗网络技术帮助在构建数字公证时保持了模型的稳定性,本发明构建了智能化的第三方公证机构,用虚拟化、智能化的方法代替公证部门,减少了人为因素,节省了公证机构的人力、物力和财力,帮助企业节省了成本和精力。

Description

构建数字公证的方法
技术领域
本发明涉及数字公证技术领域,具体为构建数字公证的方法。
背景技术
数据公证为企业提供了数字公证服务,为录像、录音、拍照、网页、APP等场景提供多种取证手段以合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链,再通过数据分析识别证据的真伪,对上报的材料进行加密处理后全部上传至区块链,区块链能够推进信息互联共享,进一步加强公证处与外部机构的协调沟通,为办理公证业务提供有效的信息核实手段,结合区块链不可篡改、可溯源的特性,能够全程参与见证,增加了公证结果的可信度,但是,现有技术中公证机构缺乏技术辅助,公证效率低;其次,构建数字公证,需要采集公证部门工作流程和专家公证经验,制定虚拟的公证人员,公证过程主要是公证专家利用工作经验和工作流程、关联分析办法,最后确定真伪,然而现实生活中的公证,证据千差万别,伪造技术创新层出不穷,也可能是由AI自动模拟生成,公证业务受较多人为因素影响,不能实现公证的智能化和自动化,构建智能化的第三方公证机构,用虚拟化、智能化的方法代替公证部门,减少了人为因素,节省了公证机构的人力、物力和财力,也帮助企业节省了成本和精力。
所以,人们需要构建数字公证的方法来解决上述问题。
发明内容
本发明的目的在于提供构建数字公证的方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:构建数字公证的方法,其特征在于:包括以下步骤:
S1:获取数据,筛查数据类型并设置标签;
S2:关联分析上报到数字公证模型的企业历史数据,设定企业核实真伪指标,自动设定关联分析模式;
S3:精细化关联分析模式;
S4:依据环境变化进行数据分析,描绘关联曲线,采集行为特征数据;
S5:对关联分析模式进行可用性判断;
S6:指标检测,对检测出的问题数据进行打标签;
S7:指标识别,判断是否存在漏判、错判;
S8:利用AI模拟出自适应证伪技术。
进一步的,在步骤S1-S2中:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1;关联分析上报到数字公证模型的企业各方面数据,可以是企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化等,根据对应企业历史数据,勾画特征图谱,分析行为特点、规律趋势,设定对应企业的核实真伪指标,自动设定关联分析模式:为结构化数据和非结构化数据设定不同的关联分析模式,将没有关联性的证据直接排除,例如:依据企业不动产、房产租赁信息、水电费、水电使用时间关联分析房产是否抵押担保;或者依据动产、车辆信息、保养时间、违规情况、行驶情况关联分析车辆是否抵押担保等。
进一步的,在步骤S3中:设置指标分析点,取N+1模式,其中,N+1>10,分析N点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,采用概率推理方法,根据不同的环境、状态选择不同的数据分析方法,例如:对车辆保险的证据分析,需要分析车况、保养情况、出险情况、违章情况,关联分析出该车保险是否骗保。
进一步的,在步骤S5中:通过X个数据,其中,X>3,验证关联分析模式是否具有逻辑性:通过证据之间的相互印证,凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性,用查证属实的实物证据作为参照来检验言词证据,证据之间相互加强对方对待证事实,排除相互之间矛盾和无法解释的疑问:利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断,通过判断各证据之间的一致或者矛盾关系辨别证据真伪,进行证据审查和分析,利用逻辑定律中的同一律、矛盾律和排中律审查分析证据,证明证据与对应事实间的客观联系,主要为因果联系,与事件发生相关的空间、时间、条件、方法、手段的事实,判断形成的证据链是否完整并排除可疑点:查看相互关联证据间的关联性,查询证据本身与对应事实有无联系以及联系的紧密、强弱程度,判断能否形成完整的证据链:若无法形成证据闭环,则证据不完整,无法验证事实,进行证据排除,进行逻辑推理,用逻辑推理公式验证证据的可靠性,例如:证据1、证据2能证明证据3,利用逻辑推理验证证据1、证据2、证据4能否证明证据3,并结合双向RNN和专家经验来检验证据的证明力,此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则相互证伪有利于初次有效地排除可疑点。
进一步的,在步骤S6中:利用先验概率模型进行指标检测:求得统计检测量和判决门限,若统计检测量小于判决门限,判断对应指标可用;反之,判断指标不可用,对检测出的问题数据进行打标签,利用基于漏检概率的多指标可用性确定方法,对不同设置情况分别进行统计,利用最大似然估计法排除问题指标,排除步骤为:首先,观测指标值的矩阵H可以由QR分解为:
Figure BDA0003191813420000031
其中:Q1为m×4矩阵,Q2为m×(m-4)矩阵,R为4×4矩阵,0为(m-4)×4矩阵,m表示观测的指标数量;其次,设概率密度函数为:
Figure BDA0003191813420000032
其中,p为概率,b为问题指标数,σ为误差值,T为预先设定的阈值;然后,设第i个指标对应的偏差向量使似然函数
Figure BDA0003191813420000033
的值达到最大,化简并代入偏差向量μ=[0…bi…0]得:
Figure BDA0003191813420000034
其中,f为系数,y为量测方程,最后,将上式对参数bi并令其为零,得:2Siy-2biSii=0;可得参数bi的最大似然估计值为:
Figure BDA0003191813420000035
Figure BDA0003191813420000036
使得
Figure BDA0003191813420000037
达到最大值,最大值为:(Siy)2/Sii-yTSy,其中,Si为矩阵S的第i行的元素,Sii为矩阵S主对角线上的第i个元素,在m个指标中,判断使似然函数值达到最大的为问题指标,将其排除,提高了指标检测的准确度。
进一步的,在步骤S7中:采集到检测到的有问题采样点数为n,实际有问题的采样点数为n’,正确识别问题的采样点数为M,根据下列公式分别计算指标检测率w和指标识别率W:
Figure BDA0003191813420000041
Figure BDA0003191813420000042
若w=100%且W=100%,判断没有漏判和错判;若w≠100%,判断指标检测存在漏判和错判;若W≠100%,判断指标识别存在漏判和错判,有利于二次有效地排除可疑点,得到更精确的排除结果。
进一步的,在步骤S8中:所述利用AI模拟出自适应证伪技术,包括以下步骤:
S11:依据可用性判断结果选择证伪方法;
S12:通过神经网络对同类问题数据进行深度学习和数据挖掘;
S13:甄别数据侵权和证据真伪的各类状况,分析证据适用范围、影响和产生后果;
S14:判断证据与其他证据的关联性、逻辑性,对判断情况设定标签;
S15:判断证据是否破坏伦理或公证规则,确定结果的危险程度;
S16:根据危险等级排除不可信证据;
S17:完善各类证伪方案;
判断证据是否破坏伦理或公证规则的方式属于现有技术,例如:甲男与乙女存在事实婚姻,现分割财产,但是通过验证甲男和乙女的身份证、户口簿,发现甲男是乙女的父亲,判断其破坏了伦理道德、公序良俗,违反了公证规则。
进一步的,在步骤S12中:通过神经网络对同类问题数据进行深度学习和数据挖掘,用自编码器搜索图像和视频,用简单理解网络处理非机构化数据,用深度置信网络处理结构化数据,自动识别无标记数据并添加标签,变分自编码是基于变分思想的深度学习的生成式模型,假设xx为随机变量,zz为隐变量,变分自编码提出了变分下届的概念,通过变分函数q(z)q(z)来对后验概率p(z|x)p(z|x)进行替换,并用KL散度度量两者的近似程度,有利于简化在面对大规模复杂数据时的难求解问题,利用变分自编码技术有利于很好地针对图像的特征进行建模。
进一步的,在步骤S13中:利用RNN深度学习和Python数据分析,对数据侵权和证据真伪的各类状况进行甄别,并把相关场景学习构建再现,对数据进行关联比对分析,利用因果推断模型确定证据适用范围、影响和产生后果。
进一步的,在步骤S17中:若需要设计强化版证据证伪工具,则由生成对抗网络模拟证据并自行处理,通过强化学习完善各类证伪方案,自动建立与之对抗的优化版筛选方案,并自主学习建立逻辑关系,设定证伪的逻辑公示,验证真伪措施,在生成式模型中,生成对抗网络(GAN)是一类特殊的存在,它的提出不仅使各个领域的发展达到新的高度,更是促使人工智能领域走向了一个具有“思想”的时代,GAN是一个具有对抗思想的网络结构,虽然GAN的变种模型层出不穷、用途广泛,但其核心和对抗思想却可以一直保持不变;GAN是一个无监督生成式模型,与变分自编码相比,GAN没有使用变分下届,模型主要分为两类:一类是生成式模型,另一类是判别式模型,生成式模型会对xx和yy的联合分布p(x,y)p(x,y)进行建模,通过贝叶斯公式来求得yy的条件后验概率p(y|x)p(y|x),最后选择使p(y|x)p(y|x)取得最大值的yiyi作为模型的输出;而判别式模型则会直接给出p(y|x)p(y|x)的表达式,二者之间存在的差异如下:
(1)生成式模型会对数据的分布做出一定的假设,并且只有在满足这些假设时,它才能在这些服从假设概率分布的数据上得到不错的效果,若假设不成立,则判别式模型将会有更好的学习效果;
(2)若需要对类别进行更新,生成式模型只需要对新的xx和yy的联合概率分布p(x,y)p(x,y)计算即可,而判别式模型则需要对整个p(y|x)p(y|x)进行重新训练;
(3)在对错误率进行分析方面,生成式模型最终得到的错误率将比判别式模型的错误率更高,但是生成式模型的抽样复杂性较低,只需要很少的样本就可以使错误率收敛;
(4)对于无标签的数据,生成式模型(例如:深度信念网络DBN)能更好地利用数据本身所包含的信息;
(5)判别式模型通常需要解决凸优化问题。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过通过对录像、录音、拍照、网页、APP等场景提供多种取证手段,合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链,通过数据分析,识别证据真伪,对上报的材料进行加密处理,全部上传至区块链,构建了一个人工智能的第三方监管人,代替相关人员帮助企业合规整改,并帮助了有关部门监督企业合规、参与企业治理,结合变分自编码VAE与生成对抗网络GAN,使用GAN的判别器学习特征表示,变分自编码VAE为重构目标提供帮助,能够在生成增强版的判别器的同时保持模型的稳定,利用AI模拟出自适应的证伪技术与伪造技术对抗,有效判别出证据的真假,避免有关人员生成足够逼真的证据来欺骗相关部门人员,判断并排除不可信证据,模拟对抗解决方案,节省了相关部门人力、物力、财力,也帮助企业节省了成本和精力。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明构建数字公证的方法的步骤图;
图2是本发明的AI模拟出自适应证伪技术的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1-2,本发明提供技术方案:构建数字公证的方法,其特征在于:包括以下步骤:
S1:获取数据,筛查数据类型并设置标签;
S2:关联分析上报到数字公证模型的企业历史数据,设定企业核实真伪指标,自动设定关联分析模式;
S3:精细化关联分析模式;
S4:依据环境变化进行数据分析,描绘关联曲线,采集行为特征数据;
S5:对关联分析模式进行可用性判断;
S6:指标检测,对检测出的问题数据进行打标签;
S7:指标识别,判断是否存在漏判、错判;
S8:利用AI模拟出自适应证伪技术。
在步骤S1-S2中:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1;关联分析上报到数字公证模型的企业各方面数据,可以是企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化等,根据对应企业历史数据,勾画特征图谱,分析行为特点、规律趋势,设定对应企业的核实真伪指标,自动设定关联分析模式:为结构化数据和非结构化数据设定不同的关联分析模式,将没有关联性的证据直接排除,例如:依据企业不动产、房产租赁信息、水电费、水电使用时间关联分析房产是否抵押担保;或者依据动产、车辆信息、保养时间、违规情况、行驶情况关联分析车辆是否抵押担保等。
在步骤S3中:设置指标分析点,取N+1模式,其中,N+1>10,分析N点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,采用概率推理方法,根据不同的环境、状态选择不同的数据分析方法,例如:对车辆保险的证据分析,需要分析车况、保养情况、出险情况、违章情况,关联分析出该车保险是否骗保。
在步骤S5中:通过X个数据,其中,X>3,验证关联分析模式是否具有逻辑性:通过证据之间的相互印证,凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性,用查证属实的实物证据作为参照来检验言词证据,证据之间相互加强对方对待证事实,排除相互之间矛盾和无法解释的疑问:利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断,通过判断各证据之间的一致或者矛盾关系辨别证据真伪,进行证据审查和分析,利用逻辑定律中的同一律、矛盾律和排中律审查分析证据,证明证据与对应事实间的客观联系,主要为因果联系,与事件发生相关的空间、时间、条件、方法、手段的事实,判断形成的证据链是否完整并排除可疑点:查看相互关联证据间的关联性,查询证据本身与对应事实有无联系以及联系的紧密、强弱程度,判断能否形成完整的证据链:若无法形成证据闭环,则证据不完整,无法验证事实,进行证据排除,进行逻辑推理,用逻辑推理公式验证证据的可靠性,例如:证据1、证据2能证明证据3,利用逻辑推理验证证据1、证据2、证据4能否证明证据3,并结合双向RNN和专家经验来检验证据的证明力,此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则,相互证伪,便于初次有效地排除可疑点。
在步骤S6中:利用先验概率模型进行指标检测:求得统计检测量和判决门限,若统计检测量小于判决门限,判断对应指标可用;反之,判断指标不可用,对检测出的问题数据进行打标签,利用基于漏检概率的多指标可用性确定方法,对不同设置情况分别进行统计,利用最大似然估计法排除问题指标,排除步骤为:首先,观测指标值的矩阵H可以由QR分解为:
Figure BDA0003191813420000071
其中:Q1为m×4矩阵,Q2为m×(m-4)矩阵,R为4×4矩阵,0为(m-4)×4矩阵,m表示观测的指标数量;其次,设概率密度函数为:
Figure BDA0003191813420000081
其中,p为概率,b为问题指标数,σ为误差值,T为预先设定的阈值;然后,设第i个指标对应的偏差向量使似然函数
Figure BDA0003191813420000082
的值达到最大,化简并代入偏差向量μ=[0…bi…0]得:
Figure BDA0003191813420000083
其中,f为系数,y为量测方程,最后,将上式对参数bi并令其为零,得:2Siy-2biSii=0;可得参数bi的最大似然估计值为:
Figure BDA0003191813420000084
Figure BDA0003191813420000085
使得
Figure BDA0003191813420000086
达到最大值,最大值为:(Siy)2/Sii-yTSy,其中,Si为矩阵S的第i行的元素,Sii为矩阵S主对角线上的第i个元素,在m个指标中,判断使似然函数值达到最大的为问题指标,将其排除,能够提高指标检测的准确度。
在步骤S7中:采集到检测到的有问题采样点数为n,实际有问题的采样点数为n’,正确识别问题的采样点数为M,根据下列公式分别计算指标检测率w和指标识别率W:
Figure BDA0003191813420000087
Figure BDA0003191813420000088
若w=100%且W=100%,判断没有漏判和错判;若w≠100%,判断指标检测存在漏判和错判;若W≠100%,判断指标识别存在漏判和错判,便于二次有效地排除可疑点,得到更精确的排除结果。
在步骤S8中:利用AI模拟出自适应证伪技术,包括以下步骤:
S11:依据可用性判断结果选择证伪方法;
S12:通过神经网络对同类问题数据进行深度学习和数据挖掘;
S13:甄别数据侵权和证据真伪的各类状况,分析证据适用范围、影响和产生后果;
S14:判断证据与其他证据的关联性、逻辑性,对判断情况设定标签;
S15:判断证据是否破坏伦理或公证规则,确定结果的危险程度;
S16:根据危险等级排除不可信证据;
S17:完善各类证伪方案;
判断证据是否破坏伦理或公证规则的方式属于现有技术,例如:甲男与乙女存在事实婚姻,现分割财产,但是通过验证甲男和乙女的身份证、户口簿,发现甲男是乙女的父亲,判断其破坏了伦理道德、公序良俗,违反了公证规则。
在步骤S12中:通过神经网络对同类问题数据进行深度学习和数据挖掘,用自编码器搜索图像和视频,用简单理解网络处理非机构化数据,用深度置信网络处理结构化数据,自动识别无标记数据并添加标签,变分自编码是基于变分思想的深度学习的生成式模型,假设xx为随机变量,zz为隐变量,变分自编码提出了变分下届的概念,通过变分函数q(z)q(z)来对后验概率p(z|x)p(z|x)进行替换,并用KL散度度量两者的近似程度,有利于简化在面对大规模复杂数据时的难求解问题,利用变分自编码技术便于很好地针对图像的特征进行建模。
在步骤S13中,利用RNN深度学习和Python数据分析,对数据侵权和证据真伪的各类状况进行甄别,并把相关场景学习构建再现,对数据进行关联比对分析,利用因果推断模型确定证据适用范围、影响和产生后果。
在步骤S17中:若需要设计强化版证据证伪工具,则由生成对抗网络模拟证据并自行处理,通过强化学习完善各类证伪方案,自动建立与之对抗的优化版筛选方案,并自主学习建立逻辑关系,设定证伪的逻辑公示,验证真伪措施,在生成式模型中,生成对抗网络(GAN)是一类特殊的存在,它的提出不仅使各个领域的发展达到新的高度,更是促使人工智能领域走向了一个具有“思想”的时代,GAN是一个具有对抗思想的网络结构,虽然GAN的变种模型层出不穷、用途广泛,但其核心和对抗思想却可以一直保持不变;GAN是一个无监督生成式模型,与变分自编码相比,GAN没有使用变分下届,模型主要分为两类:一类是生成式模型,另一类是判别式模型,生成式模型会对xx和yy的联合分布p(x,y)p(x,y)进行建模,通过贝叶斯公式来求得yy的条件后验概率p(y|x)p(y|x),最后选择使p(y|x)p(y|x)取得最大值的yiyi作为模型的输出;而判别式模型则会直接给出p(y|x)p(y|x)的表达式,二者之间存在的差异如下:
(1)生成式模型会对数据的分布做出一定的假设,并且只有在满足这些假设时,它才能在这些服从假设概率分布的数据上得到不错的效果,若假设不成立,则判别式模型将会有更好的学习效果;
(2)若需要对类别进行更新,生成式模型只需要对新的xx和yy的联合概率分布p(x,y)p(x,y)计算即可,而判别式模型则需要对整个p(y|x)p(y|x)进行重新训练;
(3)在对错误率进行分析方面,生成式模型最终得到的错误率将比判别式模型的错误率更高,但是生成式模型的抽样复杂性较低,只需要很少的样本就可以使错误率收敛;
(4)对于无标签的数据,生成式模型(例如:深度信念网络DBN)能更好地利用数据本身所包含的信息;
(5)判别式模型通常需要解决凸优化问题。
实施例一:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1,关联分析上报到数字公证模型的企业各方面数据:包括企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化,根据企业上述历史数据勾画出对应企业特征图谱、行为特点、规律趋势,设定对应企业的核实真伪指标为:不动产、房产租赁信息、水电费、水电使用时间,自动设定关联分析模式,关联分析房产是否抵押担保,设置指标分析点,取N+1=16模式,分析15点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,根据环境调整进行数据分析,勾画出关联分析设置的特征图谱、特点、趋势、规律等,画出关联曲线,利用模型进行行为特征采集,然后进行可用性判断:通过X=10个数据,验证关联分析模式是否具有逻辑性,从而相互证伪,之后用先验概率模型进行指标检测和识别,判断是否是漏判、错判:采集到检测到的有问题采样点数为n=15,实际有问题的采样点数为n’=15,正确识别问题的采样点数为M=12,根据公式
Figure BDA0003191813420000101
计算指标检测率w=100%,根据公式
Figure BDA0003191813420000102
计算指标识别率W=80%,判断识别存在漏判、错判,重新进行指标识别,待不存在漏判、错判后利用AI模拟出自适应证伪技术与伪造技术进行对抗。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.构建数字公证的方法,其特征在于:包括以下步骤:
S1:获取数据,筛查数据类型并设置标签;
S2:关联分析上报到数字公证模型的企业历史数据,设定企业核实真伪指标,自动设定关联分析模式;
S3:精细化关联分析模式;
S4:依据环境变化进行数据分析,描绘关联曲线,采集行为特征数据;
S5:对关联分析模式进行可用性判断;
S6:指标检测,对检测出的问题数据进行打标签;
S7:指标识别,判断是否存在漏判、错判;
S8:利用AI模拟出自适应证伪技术。
2.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S1-S2中:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1;关联分析上报到数字公证模型的企业各方面数据,根据对应企业历史数据,勾画特征图谱,分析行为特点、规律趋势,设定对应企业的核实真伪指标,自动设定关联分析模式:为结构化数据和非结构化数据设定不同的关联分析模式,将没有关联性的证据直接排除。
3.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S3-S4中:设置指标分析点,取N+1模式,其中,N+1>10,分析N点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,采用概率推理方法,根据不同的环境、状态选择不同的数据分析方法。
4.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S5中:通过X个数据,其中,X>3,验证关联分析模式是否具有逻辑性:通过证据之间的相互印证,凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性,用查证属实的实物证据作为参照来检验言词证据,证据之间相互加强对方对待证事实,排除相互之间矛盾和无法解释的疑问:利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断,通过判断各证据之间的一致或者矛盾关系辨别证据真伪,进行证据审查和分析,利用逻辑定律中的同一律、矛盾律和排中律审查分析证据,证明证据与对应事实间的客观联系:查看相互关联证据间的关联性,查询证据本身与对应事实有无联系以及联系的紧密、强弱程度,判断能否形成完整的证据链:若无法形成证据闭环,则证据不完整,无法验证事实,进行证据排除,进行逻辑推理,用逻辑推理公式验证证据的可靠性,并结合双向RNN和专家经验来检验证据的证明力,此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则。
5.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S6中:利用先验概率模型进行指标检测:求得统计检测量和判决门限,若统计检测量小于判决门限,判断对应指标可用;反之,判断指标不可用,对检测出的问题数据进行打标签,利用基于漏检概率的多指标可用性确定方法,对不同设置情况分别进行统计,利用最大似然估计法排除问题指标,排除步骤为:首先,观测指标值的矩阵H可以由QR分解为:
Figure FDA0003191813410000021
其中:Q1为m×4矩阵,Q2为m×(m-4)矩阵,R为4×4矩阵,0为(m-4)×4矩阵,m表示观测的指标数量;其次,设概率密度函数为:
Figure FDA0003191813410000022
其中,p为概率,b为问题指标数,σ为误差值,T为预先设定的阈值;然后,设第i个指标对应的偏差向量使似然函数
Figure FDA0003191813410000023
的值达到最大,化简并代入偏差向量μ=[0…bi…0]得:
Figure FDA0003191813410000024
其中,f为系数,y为量测方程,最后,将上式对参数bi并令其为零,得:2Siy-2biSii=0;可得参数bi的最大似然估计值为:
Figure FDA0003191813410000025
Figure FDA0003191813410000031
使得
Figure FDA0003191813410000032
达到最大值,最大值为:(Siy)2/Sii-yTSy,其中,Si为矩阵S的第i行的元素,Sii为矩阵S主对角线上的第i个元素,在m个指标中,判断使似然函数值达到最大的为问题指标,将其排除。
6.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S7中:采集到检测到的有问题采样点数为n,实际有问题的采样点数为n’,正确识别问题的采样点数为M,根据下列公式分别计算指标检测率w和指标识别率W:
Figure FDA0003191813410000033
Figure FDA0003191813410000034
若w=100%且W=100%,判断没有漏判和错判;若w≠100%,判断指标检测存在漏判和错判;若W≠100%,判断指标识别存在漏判和错判。
7.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S8中:所述利用AI模拟出自适应证伪技术,包括以下步骤:
S11:依据可用性判断结果选择证伪方法;
S12:通过神经网络对同类问题数据进行深度学习和数据挖掘;
S13:甄别数据侵权和证据真伪的各类状况,分析证据适用范围、影响和产生后果;
S14:判断证据与其他证据的关联性、逻辑性,对判断情况设定标签;
S15:判断证据是否破坏伦理或公证规则,确定结果的危险程度;
S16:根据危险等级排除不可信证据;
S17:完善各类证伪方案。
8.根据权利要求7所述的构建数字公证的方法,其特征在于:在步骤S12中:通过神经网络对同类问题数据进行深度学习和数据挖掘,用自编码器搜索图像和视频,用简单理解网络处理非机构化数据,用深度置信网络处理结构化数据,自动识别无标记数据并添加标签。
9.根据权利要求7所述的构建数字公证的方法,其特征在于:在步骤S13中:利用RNN深度学习和Python数据分析,对数据和证据真伪的各类状况进行甄别,并把相关场景学习构建再现,对数据进行关联比对分析,利用因果推断模型确定证据适用范围、影响和产生后果。
10.根据权利要求7所述的构建数字公证的方法,其特征在于:在步骤S17中:通过强化学习完善各类证伪方案,自动建立与之对抗的优化版筛选方案,并自主学习建立逻辑关系,设定证伪的逻辑公示,验证真伪措施。
CN202110879972.2A 2021-08-02 2021-08-02 构建数字公证的方法 Active CN113642986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110879972.2A CN113642986B (zh) 2021-08-02 2021-08-02 构建数字公证的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110879972.2A CN113642986B (zh) 2021-08-02 2021-08-02 构建数字公证的方法

Publications (2)

Publication Number Publication Date
CN113642986A true CN113642986A (zh) 2021-11-12
CN113642986B CN113642986B (zh) 2024-04-16

Family

ID=78419384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110879972.2A Active CN113642986B (zh) 2021-08-02 2021-08-02 构建数字公证的方法

Country Status (1)

Country Link
CN (1) CN113642986B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1441935A (zh) * 2000-05-24 2003-09-10 埃塞柯尔比茨公司 用于初始文件的再现和验证的系统和方法
CN102609640A (zh) * 2004-10-25 2012-07-25 安全第一公司 安全数据分析方法和系统
CN103530603A (zh) * 2013-09-24 2014-01-22 杭州电子科技大学 基于环路图模型的视频异常检测方法
CN105184386A (zh) * 2015-07-22 2015-12-23 中国寰球工程公司 一种结合专家经验和历史数据建立异常事件预警系统的方法
CN108038131A (zh) * 2017-11-17 2018-05-15 上海数据交易中心有限公司 数据质量分析预处理方法及装置、存储介质、终端
CN109902165A (zh) * 2019-03-08 2019-06-18 中国科学院自动化研究所 基于马尔科夫逻辑网的智能交互式问答方法、系统、装置
CN110674840A (zh) * 2019-08-22 2020-01-10 中国司法大数据研究院有限公司 一种基于贝叶斯网络的多方证据关联模型构建方法和证据链提取方法及装置
CN110969556A (zh) * 2019-09-30 2020-04-07 上海仪电(集团)有限公司中央研究院 机器学习多维度多模型融合河道水质异常检测方法及装置
CN111291962A (zh) * 2019-12-19 2020-06-16 韩兆鹤 预防和打击ai犯罪与ai数据侵权的方法
CN112235295A (zh) * 2020-10-14 2021-01-15 安徽理工大学 一种煤矿安全隐患排查与预警方法
CN112785138A (zh) * 2021-01-18 2021-05-11 内蒙古电力(集团)有限责任公司呼和浩特供电局 基于数值天气进行三跨线路监测分析预警的方法
CN113010572A (zh) * 2021-03-18 2021-06-22 杭州码全信息科技有限公司 基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法
US20210201328A1 (en) * 2016-12-02 2021-07-01 Persephone GmbH System and method for managing transactions in dynamic digital documents

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1441935A (zh) * 2000-05-24 2003-09-10 埃塞柯尔比茨公司 用于初始文件的再现和验证的系统和方法
CN102609640A (zh) * 2004-10-25 2012-07-25 安全第一公司 安全数据分析方法和系统
CN103530603A (zh) * 2013-09-24 2014-01-22 杭州电子科技大学 基于环路图模型的视频异常检测方法
CN105184386A (zh) * 2015-07-22 2015-12-23 中国寰球工程公司 一种结合专家经验和历史数据建立异常事件预警系统的方法
US20210201328A1 (en) * 2016-12-02 2021-07-01 Persephone GmbH System and method for managing transactions in dynamic digital documents
CN108038131A (zh) * 2017-11-17 2018-05-15 上海数据交易中心有限公司 数据质量分析预处理方法及装置、存储介质、终端
CN109902165A (zh) * 2019-03-08 2019-06-18 中国科学院自动化研究所 基于马尔科夫逻辑网的智能交互式问答方法、系统、装置
CN110674840A (zh) * 2019-08-22 2020-01-10 中国司法大数据研究院有限公司 一种基于贝叶斯网络的多方证据关联模型构建方法和证据链提取方法及装置
CN110969556A (zh) * 2019-09-30 2020-04-07 上海仪电(集团)有限公司中央研究院 机器学习多维度多模型融合河道水质异常检测方法及装置
CN111291962A (zh) * 2019-12-19 2020-06-16 韩兆鹤 预防和打击ai犯罪与ai数据侵权的方法
CN112235295A (zh) * 2020-10-14 2021-01-15 安徽理工大学 一种煤矿安全隐患排查与预警方法
CN112785138A (zh) * 2021-01-18 2021-05-11 内蒙古电力(集团)有限责任公司呼和浩特供电局 基于数值天气进行三跨线路监测分析预警的方法
CN113010572A (zh) * 2021-03-18 2021-06-22 杭州码全信息科技有限公司 基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
叶阿忠: "《高级计量经济学》", 厦门大学出版社, pages: 16 - 18 *
魏生;戴科冕;: "区块链金融场景应用分析及企业级架构探讨", 广东工业大学学报, no. 02, 4 January 2010 (2010-01-04), pages 16 - 18 *

Also Published As

Publication number Publication date
CN113642986B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
Ferrer et al. Bias and discrimination in AI: a cross-disciplinary perspective
Ghori et al. Performance analysis of machine learning classifiers for non-technical loss detection
CN112491796B (zh) 一种基于卷积神经网络的入侵检测及语义决策树量化解释方法
Johansson et al. Detection of vessel anomalies-a Bayesian network approach
CN110213244A (zh) 一种基于时空特征融合的网络入侵检测方法
CN113283909B (zh) 一种基于深度学习的以太坊钓鱼账户检测方法
CN112711757B (zh) 一种基于大数据平台的数据安全集中管控方法及系统
Nieto Acevedo et al. Decision-making model at higher educational institutions based on machine learning
Shakya Application of machine learning techniques in credit card fraud detection
CN114022058A (zh) 基于时序知识图谱的中小企业失信风险预测方法
CN111506710A (zh) 基于谣言预测模型的信息发送方法、装置和计算机设备
CN117349437A (zh) 基于智能ai的政府信息管理系统及其方法
CN113642986A (zh) 构建数字公证的方法
CN115099504B (zh) 基于知识图谱补全模型的文物安防风险要素识别方法
CN116306969A (zh) 基于自监督学习的联邦学习方法和系统
CN117009509A (zh) 数据安全分级方法、装置、设备、存储介质和程序产品
CN115293249A (zh) 一种基于动态时序预测的电力系统典型场景概率预测方法
CN112766320B (zh) 一种分类模型训练方法及计算机设备
CN117992861B (zh) 一种电力数据精准度稽查方法及系统
Galimyanov et al. Research and forecasting of educational process parameters by using artificial intelligence
Braune et al. Behavioral clustering for point processes
CN113138924B (zh) 一种基于图学习的线程安全代码识别方法
CN115118450B (zh) 融合多级特征的增量式动态权值集成学习入侵检测方法
CN114863356B (zh) 一种基于残差聚合图网络的群体活动识别方法及系统
CN114510431B (zh) 一种工作量感知智能合约缺陷预测方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant