CN113642986A - 构建数字公证的方法 - Google Patents
构建数字公证的方法 Download PDFInfo
- Publication number
- CN113642986A CN113642986A CN202110879972.2A CN202110879972A CN113642986A CN 113642986 A CN113642986 A CN 113642986A CN 202110879972 A CN202110879972 A CN 202110879972A CN 113642986 A CN113642986 A CN 113642986A
- Authority
- CN
- China
- Prior art keywords
- evidence
- data
- index
- constructing
- judgment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000005516 engineering process Methods 0.000 claims abstract description 16
- 238000007405 data analysis Methods 0.000 claims abstract description 10
- 238000001514 detection method Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000010219 correlation analysis Methods 0.000 claims description 19
- 230000000875 corresponding effect Effects 0.000 claims description 19
- 238000013135 deep learning Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 230000006399 behavior Effects 0.000 claims description 8
- 230000007613 environmental effect Effects 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 238000012098 association analyses Methods 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 230000001364 causal effect Effects 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 3
- 238000012552 review Methods 0.000 claims 2
- 230000002787 reinforcement Effects 0.000 claims 1
- 239000000463 material Substances 0.000 abstract description 8
- 230000003042 antagnostic effect Effects 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract 2
- 230000007246 mechanism Effects 0.000 description 7
- 230000005611 electricity Effects 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Molecular Biology (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Fuzzy Systems (AREA)
- Primary Health Care (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
Abstract
本发明公开了构建数字公证的方法,包括:通过对录像、录音、拍照、网页、APP等场景提供多种取证手段,合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链,通过数据分析,识别证据真伪,对上报的材料进行加密处理,全部上传至区块链,同时利用AI模拟出自适应的证伪技术与伪造技术对抗,判断并排除不可信证据,模拟对抗解决方案,结合变分自编码和生成对抗网络技术帮助在构建数字公证时保持了模型的稳定性,本发明构建了智能化的第三方公证机构,用虚拟化、智能化的方法代替公证部门,减少了人为因素,节省了公证机构的人力、物力和财力,帮助企业节省了成本和精力。
Description
技术领域
本发明涉及数字公证技术领域,具体为构建数字公证的方法。
背景技术
数据公证为企业提供了数字公证服务,为录像、录音、拍照、网页、APP等场景提供多种取证手段以合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链,再通过数据分析识别证据的真伪,对上报的材料进行加密处理后全部上传至区块链,区块链能够推进信息互联共享,进一步加强公证处与外部机构的协调沟通,为办理公证业务提供有效的信息核实手段,结合区块链不可篡改、可溯源的特性,能够全程参与见证,增加了公证结果的可信度,但是,现有技术中公证机构缺乏技术辅助,公证效率低;其次,构建数字公证,需要采集公证部门工作流程和专家公证经验,制定虚拟的公证人员,公证过程主要是公证专家利用工作经验和工作流程、关联分析办法,最后确定真伪,然而现实生活中的公证,证据千差万别,伪造技术创新层出不穷,也可能是由AI自动模拟生成,公证业务受较多人为因素影响,不能实现公证的智能化和自动化,构建智能化的第三方公证机构,用虚拟化、智能化的方法代替公证部门,减少了人为因素,节省了公证机构的人力、物力和财力,也帮助企业节省了成本和精力。
所以,人们需要构建数字公证的方法来解决上述问题。
发明内容
本发明的目的在于提供构建数字公证的方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:构建数字公证的方法,其特征在于:包括以下步骤:
S1:获取数据,筛查数据类型并设置标签;
S2:关联分析上报到数字公证模型的企业历史数据,设定企业核实真伪指标,自动设定关联分析模式;
S3:精细化关联分析模式;
S4:依据环境变化进行数据分析,描绘关联曲线,采集行为特征数据;
S5:对关联分析模式进行可用性判断;
S6:指标检测,对检测出的问题数据进行打标签;
S7:指标识别,判断是否存在漏判、错判;
S8:利用AI模拟出自适应证伪技术。
进一步的,在步骤S1-S2中:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1;关联分析上报到数字公证模型的企业各方面数据,可以是企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化等,根据对应企业历史数据,勾画特征图谱,分析行为特点、规律趋势,设定对应企业的核实真伪指标,自动设定关联分析模式:为结构化数据和非结构化数据设定不同的关联分析模式,将没有关联性的证据直接排除,例如:依据企业不动产、房产租赁信息、水电费、水电使用时间关联分析房产是否抵押担保;或者依据动产、车辆信息、保养时间、违规情况、行驶情况关联分析车辆是否抵押担保等。
进一步的,在步骤S3中:设置指标分析点,取N+1模式,其中,N+1>10,分析N点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,采用概率推理方法,根据不同的环境、状态选择不同的数据分析方法,例如:对车辆保险的证据分析,需要分析车况、保养情况、出险情况、违章情况,关联分析出该车保险是否骗保。
进一步的,在步骤S5中:通过X个数据,其中,X>3,验证关联分析模式是否具有逻辑性:通过证据之间的相互印证,凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性,用查证属实的实物证据作为参照来检验言词证据,证据之间相互加强对方对待证事实,排除相互之间矛盾和无法解释的疑问:利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断,通过判断各证据之间的一致或者矛盾关系辨别证据真伪,进行证据审查和分析,利用逻辑定律中的同一律、矛盾律和排中律审查分析证据,证明证据与对应事实间的客观联系,主要为因果联系,与事件发生相关的空间、时间、条件、方法、手段的事实,判断形成的证据链是否完整并排除可疑点:查看相互关联证据间的关联性,查询证据本身与对应事实有无联系以及联系的紧密、强弱程度,判断能否形成完整的证据链:若无法形成证据闭环,则证据不完整,无法验证事实,进行证据排除,进行逻辑推理,用逻辑推理公式验证证据的可靠性,例如:证据1、证据2能证明证据3,利用逻辑推理验证证据1、证据2、证据4能否证明证据3,并结合双向RNN和专家经验来检验证据的证明力,此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则相互证伪有利于初次有效地排除可疑点。
进一步的,在步骤S6中:利用先验概率模型进行指标检测:求得统计检测量和判决门限,若统计检测量小于判决门限,判断对应指标可用;反之,判断指标不可用,对检测出的问题数据进行打标签,利用基于漏检概率的多指标可用性确定方法,对不同设置情况分别进行统计,利用最大似然估计法排除问题指标,排除步骤为:首先,观测指标值的矩阵H可以由QR分解为:
其中:Q1为m×4矩阵,Q2为m×(m-4)矩阵,R为4×4矩阵,0为(m-4)×4矩阵,m表示观测的指标数量;其次,设概率密度函数为:
其中,f为系数,y为量测方程,最后,将上式对参数bi并令其为零,得:2Siy-2biSii=0;可得参数bi的最大似然估计值为:
使得达到最大值,最大值为:(Siy)2/Sii-yTSy,其中,Si为矩阵S的第i行的元素,Sii为矩阵S主对角线上的第i个元素,在m个指标中,判断使似然函数值达到最大的为问题指标,将其排除,提高了指标检测的准确度。
进一步的,在步骤S7中:采集到检测到的有问题采样点数为n,实际有问题的采样点数为n’,正确识别问题的采样点数为M,根据下列公式分别计算指标检测率w和指标识别率W:
若w=100%且W=100%,判断没有漏判和错判;若w≠100%,判断指标检测存在漏判和错判;若W≠100%,判断指标识别存在漏判和错判,有利于二次有效地排除可疑点,得到更精确的排除结果。
进一步的,在步骤S8中:所述利用AI模拟出自适应证伪技术,包括以下步骤:
S11:依据可用性判断结果选择证伪方法;
S12:通过神经网络对同类问题数据进行深度学习和数据挖掘;
S13:甄别数据侵权和证据真伪的各类状况,分析证据适用范围、影响和产生后果;
S14:判断证据与其他证据的关联性、逻辑性,对判断情况设定标签;
S15:判断证据是否破坏伦理或公证规则,确定结果的危险程度;
S16:根据危险等级排除不可信证据;
S17:完善各类证伪方案;
判断证据是否破坏伦理或公证规则的方式属于现有技术,例如:甲男与乙女存在事实婚姻,现分割财产,但是通过验证甲男和乙女的身份证、户口簿,发现甲男是乙女的父亲,判断其破坏了伦理道德、公序良俗,违反了公证规则。
进一步的,在步骤S12中:通过神经网络对同类问题数据进行深度学习和数据挖掘,用自编码器搜索图像和视频,用简单理解网络处理非机构化数据,用深度置信网络处理结构化数据,自动识别无标记数据并添加标签,变分自编码是基于变分思想的深度学习的生成式模型,假设xx为随机变量,zz为隐变量,变分自编码提出了变分下届的概念,通过变分函数q(z)q(z)来对后验概率p(z|x)p(z|x)进行替换,并用KL散度度量两者的近似程度,有利于简化在面对大规模复杂数据时的难求解问题,利用变分自编码技术有利于很好地针对图像的特征进行建模。
进一步的,在步骤S13中:利用RNN深度学习和Python数据分析,对数据侵权和证据真伪的各类状况进行甄别,并把相关场景学习构建再现,对数据进行关联比对分析,利用因果推断模型确定证据适用范围、影响和产生后果。
进一步的,在步骤S17中:若需要设计强化版证据证伪工具,则由生成对抗网络模拟证据并自行处理,通过强化学习完善各类证伪方案,自动建立与之对抗的优化版筛选方案,并自主学习建立逻辑关系,设定证伪的逻辑公示,验证真伪措施,在生成式模型中,生成对抗网络(GAN)是一类特殊的存在,它的提出不仅使各个领域的发展达到新的高度,更是促使人工智能领域走向了一个具有“思想”的时代,GAN是一个具有对抗思想的网络结构,虽然GAN的变种模型层出不穷、用途广泛,但其核心和对抗思想却可以一直保持不变;GAN是一个无监督生成式模型,与变分自编码相比,GAN没有使用变分下届,模型主要分为两类:一类是生成式模型,另一类是判别式模型,生成式模型会对xx和yy的联合分布p(x,y)p(x,y)进行建模,通过贝叶斯公式来求得yy的条件后验概率p(y|x)p(y|x),最后选择使p(y|x)p(y|x)取得最大值的yiyi作为模型的输出;而判别式模型则会直接给出p(y|x)p(y|x)的表达式,二者之间存在的差异如下:
(1)生成式模型会对数据的分布做出一定的假设,并且只有在满足这些假设时,它才能在这些服从假设概率分布的数据上得到不错的效果,若假设不成立,则判别式模型将会有更好的学习效果;
(2)若需要对类别进行更新,生成式模型只需要对新的xx和yy的联合概率分布p(x,y)p(x,y)计算即可,而判别式模型则需要对整个p(y|x)p(y|x)进行重新训练;
(3)在对错误率进行分析方面,生成式模型最终得到的错误率将比判别式模型的错误率更高,但是生成式模型的抽样复杂性较低,只需要很少的样本就可以使错误率收敛;
(4)对于无标签的数据,生成式模型(例如:深度信念网络DBN)能更好地利用数据本身所包含的信息;
(5)判别式模型通常需要解决凸优化问题。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过通过对录像、录音、拍照、网页、APP等场景提供多种取证手段,合法、客观、便捷地将产生的电子数据进行固定并形成完整的证据链,通过数据分析,识别证据真伪,对上报的材料进行加密处理,全部上传至区块链,构建了一个人工智能的第三方监管人,代替相关人员帮助企业合规整改,并帮助了有关部门监督企业合规、参与企业治理,结合变分自编码VAE与生成对抗网络GAN,使用GAN的判别器学习特征表示,变分自编码VAE为重构目标提供帮助,能够在生成增强版的判别器的同时保持模型的稳定,利用AI模拟出自适应的证伪技术与伪造技术对抗,有效判别出证据的真假,避免有关人员生成足够逼真的证据来欺骗相关部门人员,判断并排除不可信证据,模拟对抗解决方案,节省了相关部门人力、物力、财力,也帮助企业节省了成本和精力。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明构建数字公证的方法的步骤图;
图2是本发明的AI模拟出自适应证伪技术的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1-2,本发明提供技术方案:构建数字公证的方法,其特征在于:包括以下步骤:
S1:获取数据,筛查数据类型并设置标签;
S2:关联分析上报到数字公证模型的企业历史数据,设定企业核实真伪指标,自动设定关联分析模式;
S3:精细化关联分析模式;
S4:依据环境变化进行数据分析,描绘关联曲线,采集行为特征数据;
S5:对关联分析模式进行可用性判断;
S6:指标检测,对检测出的问题数据进行打标签;
S7:指标识别,判断是否存在漏判、错判;
S8:利用AI模拟出自适应证伪技术。
在步骤S1-S2中:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1;关联分析上报到数字公证模型的企业各方面数据,可以是企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化等,根据对应企业历史数据,勾画特征图谱,分析行为特点、规律趋势,设定对应企业的核实真伪指标,自动设定关联分析模式:为结构化数据和非结构化数据设定不同的关联分析模式,将没有关联性的证据直接排除,例如:依据企业不动产、房产租赁信息、水电费、水电使用时间关联分析房产是否抵押担保;或者依据动产、车辆信息、保养时间、违规情况、行驶情况关联分析车辆是否抵押担保等。
在步骤S3中:设置指标分析点,取N+1模式,其中,N+1>10,分析N点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,采用概率推理方法,根据不同的环境、状态选择不同的数据分析方法,例如:对车辆保险的证据分析,需要分析车况、保养情况、出险情况、违章情况,关联分析出该车保险是否骗保。
在步骤S5中:通过X个数据,其中,X>3,验证关联分析模式是否具有逻辑性:通过证据之间的相互印证,凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性,用查证属实的实物证据作为参照来检验言词证据,证据之间相互加强对方对待证事实,排除相互之间矛盾和无法解释的疑问:利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断,通过判断各证据之间的一致或者矛盾关系辨别证据真伪,进行证据审查和分析,利用逻辑定律中的同一律、矛盾律和排中律审查分析证据,证明证据与对应事实间的客观联系,主要为因果联系,与事件发生相关的空间、时间、条件、方法、手段的事实,判断形成的证据链是否完整并排除可疑点:查看相互关联证据间的关联性,查询证据本身与对应事实有无联系以及联系的紧密、强弱程度,判断能否形成完整的证据链:若无法形成证据闭环,则证据不完整,无法验证事实,进行证据排除,进行逻辑推理,用逻辑推理公式验证证据的可靠性,例如:证据1、证据2能证明证据3,利用逻辑推理验证证据1、证据2、证据4能否证明证据3,并结合双向RNN和专家经验来检验证据的证明力,此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则,相互证伪,便于初次有效地排除可疑点。
在步骤S6中:利用先验概率模型进行指标检测:求得统计检测量和判决门限,若统计检测量小于判决门限,判断对应指标可用;反之,判断指标不可用,对检测出的问题数据进行打标签,利用基于漏检概率的多指标可用性确定方法,对不同设置情况分别进行统计,利用最大似然估计法排除问题指标,排除步骤为:首先,观测指标值的矩阵H可以由QR分解为:
其中:Q1为m×4矩阵,Q2为m×(m-4)矩阵,R为4×4矩阵,0为(m-4)×4矩阵,m表示观测的指标数量;其次,设概率密度函数为:
其中,f为系数,y为量测方程,最后,将上式对参数bi并令其为零,得:2Siy-2biSii=0;可得参数bi的最大似然估计值为:
使得达到最大值,最大值为:(Siy)2/Sii-yTSy,其中,Si为矩阵S的第i行的元素,Sii为矩阵S主对角线上的第i个元素,在m个指标中,判断使似然函数值达到最大的为问题指标,将其排除,能够提高指标检测的准确度。
在步骤S7中:采集到检测到的有问题采样点数为n,实际有问题的采样点数为n’,正确识别问题的采样点数为M,根据下列公式分别计算指标检测率w和指标识别率W:
若w=100%且W=100%,判断没有漏判和错判;若w≠100%,判断指标检测存在漏判和错判;若W≠100%,判断指标识别存在漏判和错判,便于二次有效地排除可疑点,得到更精确的排除结果。
在步骤S8中:利用AI模拟出自适应证伪技术,包括以下步骤:
S11:依据可用性判断结果选择证伪方法;
S12:通过神经网络对同类问题数据进行深度学习和数据挖掘;
S13:甄别数据侵权和证据真伪的各类状况,分析证据适用范围、影响和产生后果;
S14:判断证据与其他证据的关联性、逻辑性,对判断情况设定标签;
S15:判断证据是否破坏伦理或公证规则,确定结果的危险程度;
S16:根据危险等级排除不可信证据;
S17:完善各类证伪方案;
判断证据是否破坏伦理或公证规则的方式属于现有技术,例如:甲男与乙女存在事实婚姻,现分割财产,但是通过验证甲男和乙女的身份证、户口簿,发现甲男是乙女的父亲,判断其破坏了伦理道德、公序良俗,违反了公证规则。
在步骤S12中:通过神经网络对同类问题数据进行深度学习和数据挖掘,用自编码器搜索图像和视频,用简单理解网络处理非机构化数据,用深度置信网络处理结构化数据,自动识别无标记数据并添加标签,变分自编码是基于变分思想的深度学习的生成式模型,假设xx为随机变量,zz为隐变量,变分自编码提出了变分下届的概念,通过变分函数q(z)q(z)来对后验概率p(z|x)p(z|x)进行替换,并用KL散度度量两者的近似程度,有利于简化在面对大规模复杂数据时的难求解问题,利用变分自编码技术便于很好地针对图像的特征进行建模。
在步骤S13中,利用RNN深度学习和Python数据分析,对数据侵权和证据真伪的各类状况进行甄别,并把相关场景学习构建再现,对数据进行关联比对分析,利用因果推断模型确定证据适用范围、影响和产生后果。
在步骤S17中:若需要设计强化版证据证伪工具,则由生成对抗网络模拟证据并自行处理,通过强化学习完善各类证伪方案,自动建立与之对抗的优化版筛选方案,并自主学习建立逻辑关系,设定证伪的逻辑公示,验证真伪措施,在生成式模型中,生成对抗网络(GAN)是一类特殊的存在,它的提出不仅使各个领域的发展达到新的高度,更是促使人工智能领域走向了一个具有“思想”的时代,GAN是一个具有对抗思想的网络结构,虽然GAN的变种模型层出不穷、用途广泛,但其核心和对抗思想却可以一直保持不变;GAN是一个无监督生成式模型,与变分自编码相比,GAN没有使用变分下届,模型主要分为两类:一类是生成式模型,另一类是判别式模型,生成式模型会对xx和yy的联合分布p(x,y)p(x,y)进行建模,通过贝叶斯公式来求得yy的条件后验概率p(y|x)p(y|x),最后选择使p(y|x)p(y|x)取得最大值的yiyi作为模型的输出;而判别式模型则会直接给出p(y|x)p(y|x)的表达式,二者之间存在的差异如下:
(1)生成式模型会对数据的分布做出一定的假设,并且只有在满足这些假设时,它才能在这些服从假设概率分布的数据上得到不错的效果,若假设不成立,则判别式模型将会有更好的学习效果;
(2)若需要对类别进行更新,生成式模型只需要对新的xx和yy的联合概率分布p(x,y)p(x,y)计算即可,而判别式模型则需要对整个p(y|x)p(y|x)进行重新训练;
(3)在对错误率进行分析方面,生成式模型最终得到的错误率将比判别式模型的错误率更高,但是生成式模型的抽样复杂性较低,只需要很少的样本就可以使错误率收敛;
(4)对于无标签的数据,生成式模型(例如:深度信念网络DBN)能更好地利用数据本身所包含的信息;
(5)判别式模型通常需要解决凸优化问题。
实施例一:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1,关联分析上报到数字公证模型的企业各方面数据:包括企业经营状况、财务报表、企业发展阶段、企业合规制度、合规管理机构、合规培训、合规文化,根据企业上述历史数据勾画出对应企业特征图谱、行为特点、规律趋势,设定对应企业的核实真伪指标为:不动产、房产租赁信息、水电费、水电使用时间,自动设定关联分析模式,关联分析房产是否抵押担保,设置指标分析点,取N+1=16模式,分析15点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,根据环境调整进行数据分析,勾画出关联分析设置的特征图谱、特点、趋势、规律等,画出关联曲线,利用模型进行行为特征采集,然后进行可用性判断:通过X=10个数据,验证关联分析模式是否具有逻辑性,从而相互证伪,之后用先验概率模型进行指标检测和识别,判断是否是漏判、错判:采集到检测到的有问题采样点数为n=15,实际有问题的采样点数为n’=15,正确识别问题的采样点数为M=12,根据公式计算指标检测率w=100%,根据公式计算指标识别率W=80%,判断识别存在漏判、错判,重新进行指标识别,待不存在漏判、错判后利用AI模拟出自适应证伪技术与伪造技术进行对抗。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.构建数字公证的方法,其特征在于:包括以下步骤:
S1:获取数据,筛查数据类型并设置标签;
S2:关联分析上报到数字公证模型的企业历史数据,设定企业核实真伪指标,自动设定关联分析模式;
S3:精细化关联分析模式;
S4:依据环境变化进行数据分析,描绘关联曲线,采集行为特征数据;
S5:对关联分析模式进行可用性判断;
S6:指标检测,对检测出的问题数据进行打标签;
S7:指标识别,判断是否存在漏判、错判;
S8:利用AI模拟出自适应证伪技术。
2.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S1-S2中:获取录像、录音、拍照、网页、APP的数据,筛查获取到的数据类型并设置标签:将结构化数据设标签0,非结构化数据设标签1;关联分析上报到数字公证模型的企业各方面数据,根据对应企业历史数据,勾画特征图谱,分析行为特点、规律趋势,设定对应企业的核实真伪指标,自动设定关联分析模式:为结构化数据和非结构化数据设定不同的关联分析模式,将没有关联性的证据直接排除。
3.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S3-S4中:设置指标分析点,取N+1模式,其中,N+1>10,分析N点之间的关联性,使用贝叶斯网络和贝叶斯算法进行深度学习,适应环境变化,采用概率推理方法,根据不同的环境、状态选择不同的数据分析方法。
4.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S5中:通过X个数据,其中,X>3,验证关联分析模式是否具有逻辑性:通过证据之间的相互印证,凭借此证据内容与彼证据内容的符合程度来确认此证据的真实性,用查证属实的实物证据作为参照来检验言词证据,证据之间相互加强对方对待证事实,排除相互之间矛盾和无法解释的疑问:利用循环神经网络、递归神经网络、逻辑推理和双向RNN进行可用性判断,通过判断各证据之间的一致或者矛盾关系辨别证据真伪,进行证据审查和分析,利用逻辑定律中的同一律、矛盾律和排中律审查分析证据,证明证据与对应事实间的客观联系:查看相互关联证据间的关联性,查询证据本身与对应事实有无联系以及联系的紧密、强弱程度,判断能否形成完整的证据链:若无法形成证据闭环,则证据不完整,无法验证事实,进行证据排除,进行逻辑推理,用逻辑推理公式验证证据的可靠性,并结合双向RNN和专家经验来检验证据的证明力,此处专家经验的法则专指日常生活经验法则、专业经验和习惯法则。
5.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S6中:利用先验概率模型进行指标检测:求得统计检测量和判决门限,若统计检测量小于判决门限,判断对应指标可用;反之,判断指标不可用,对检测出的问题数据进行打标签,利用基于漏检概率的多指标可用性确定方法,对不同设置情况分别进行统计,利用最大似然估计法排除问题指标,排除步骤为:首先,观测指标值的矩阵H可以由QR分解为:
其中:Q1为m×4矩阵,Q2为m×(m-4)矩阵,R为4×4矩阵,0为(m-4)×4矩阵,m表示观测的指标数量;其次,设概率密度函数为:
其中,f为系数,y为量测方程,最后,将上式对参数bi并令其为零,得:2Siy-2biSii=0;可得参数bi的最大似然估计值为:
7.根据权利要求1所述的构建数字公证的方法,其特征在于:在步骤S8中:所述利用AI模拟出自适应证伪技术,包括以下步骤:
S11:依据可用性判断结果选择证伪方法;
S12:通过神经网络对同类问题数据进行深度学习和数据挖掘;
S13:甄别数据侵权和证据真伪的各类状况,分析证据适用范围、影响和产生后果;
S14:判断证据与其他证据的关联性、逻辑性,对判断情况设定标签;
S15:判断证据是否破坏伦理或公证规则,确定结果的危险程度;
S16:根据危险等级排除不可信证据;
S17:完善各类证伪方案。
8.根据权利要求7所述的构建数字公证的方法,其特征在于:在步骤S12中:通过神经网络对同类问题数据进行深度学习和数据挖掘,用自编码器搜索图像和视频,用简单理解网络处理非机构化数据,用深度置信网络处理结构化数据,自动识别无标记数据并添加标签。
9.根据权利要求7所述的构建数字公证的方法,其特征在于:在步骤S13中:利用RNN深度学习和Python数据分析,对数据和证据真伪的各类状况进行甄别,并把相关场景学习构建再现,对数据进行关联比对分析,利用因果推断模型确定证据适用范围、影响和产生后果。
10.根据权利要求7所述的构建数字公证的方法,其特征在于:在步骤S17中:通过强化学习完善各类证伪方案,自动建立与之对抗的优化版筛选方案,并自主学习建立逻辑关系,设定证伪的逻辑公示,验证真伪措施。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110879972.2A CN113642986B (zh) | 2021-08-02 | 2021-08-02 | 构建数字公证的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110879972.2A CN113642986B (zh) | 2021-08-02 | 2021-08-02 | 构建数字公证的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642986A true CN113642986A (zh) | 2021-11-12 |
CN113642986B CN113642986B (zh) | 2024-04-16 |
Family
ID=78419384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110879972.2A Active CN113642986B (zh) | 2021-08-02 | 2021-08-02 | 构建数字公证的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642986B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1441935A (zh) * | 2000-05-24 | 2003-09-10 | 埃塞柯尔比茨公司 | 用于初始文件的再现和验证的系统和方法 |
CN102609640A (zh) * | 2004-10-25 | 2012-07-25 | 安全第一公司 | 安全数据分析方法和系统 |
CN103530603A (zh) * | 2013-09-24 | 2014-01-22 | 杭州电子科技大学 | 基于环路图模型的视频异常检测方法 |
CN105184386A (zh) * | 2015-07-22 | 2015-12-23 | 中国寰球工程公司 | 一种结合专家经验和历史数据建立异常事件预警系统的方法 |
CN108038131A (zh) * | 2017-11-17 | 2018-05-15 | 上海数据交易中心有限公司 | 数据质量分析预处理方法及装置、存储介质、终端 |
CN109902165A (zh) * | 2019-03-08 | 2019-06-18 | 中国科学院自动化研究所 | 基于马尔科夫逻辑网的智能交互式问答方法、系统、装置 |
CN110674840A (zh) * | 2019-08-22 | 2020-01-10 | 中国司法大数据研究院有限公司 | 一种基于贝叶斯网络的多方证据关联模型构建方法和证据链提取方法及装置 |
CN110969556A (zh) * | 2019-09-30 | 2020-04-07 | 上海仪电(集团)有限公司中央研究院 | 机器学习多维度多模型融合河道水质异常检测方法及装置 |
CN111291962A (zh) * | 2019-12-19 | 2020-06-16 | 韩兆鹤 | 预防和打击ai犯罪与ai数据侵权的方法 |
CN112235295A (zh) * | 2020-10-14 | 2021-01-15 | 安徽理工大学 | 一种煤矿安全隐患排查与预警方法 |
CN112785138A (zh) * | 2021-01-18 | 2021-05-11 | 内蒙古电力(集团)有限责任公司呼和浩特供电局 | 基于数值天气进行三跨线路监测分析预警的方法 |
CN113010572A (zh) * | 2021-03-18 | 2021-06-22 | 杭州码全信息科技有限公司 | 基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法 |
US20210201328A1 (en) * | 2016-12-02 | 2021-07-01 | Persephone GmbH | System and method for managing transactions in dynamic digital documents |
-
2021
- 2021-08-02 CN CN202110879972.2A patent/CN113642986B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1441935A (zh) * | 2000-05-24 | 2003-09-10 | 埃塞柯尔比茨公司 | 用于初始文件的再现和验证的系统和方法 |
CN102609640A (zh) * | 2004-10-25 | 2012-07-25 | 安全第一公司 | 安全数据分析方法和系统 |
CN103530603A (zh) * | 2013-09-24 | 2014-01-22 | 杭州电子科技大学 | 基于环路图模型的视频异常检测方法 |
CN105184386A (zh) * | 2015-07-22 | 2015-12-23 | 中国寰球工程公司 | 一种结合专家经验和历史数据建立异常事件预警系统的方法 |
US20210201328A1 (en) * | 2016-12-02 | 2021-07-01 | Persephone GmbH | System and method for managing transactions in dynamic digital documents |
CN108038131A (zh) * | 2017-11-17 | 2018-05-15 | 上海数据交易中心有限公司 | 数据质量分析预处理方法及装置、存储介质、终端 |
CN109902165A (zh) * | 2019-03-08 | 2019-06-18 | 中国科学院自动化研究所 | 基于马尔科夫逻辑网的智能交互式问答方法、系统、装置 |
CN110674840A (zh) * | 2019-08-22 | 2020-01-10 | 中国司法大数据研究院有限公司 | 一种基于贝叶斯网络的多方证据关联模型构建方法和证据链提取方法及装置 |
CN110969556A (zh) * | 2019-09-30 | 2020-04-07 | 上海仪电(集团)有限公司中央研究院 | 机器学习多维度多模型融合河道水质异常检测方法及装置 |
CN111291962A (zh) * | 2019-12-19 | 2020-06-16 | 韩兆鹤 | 预防和打击ai犯罪与ai数据侵权的方法 |
CN112235295A (zh) * | 2020-10-14 | 2021-01-15 | 安徽理工大学 | 一种煤矿安全隐患排查与预警方法 |
CN112785138A (zh) * | 2021-01-18 | 2021-05-11 | 内蒙古电力(集团)有限责任公司呼和浩特供电局 | 基于数值天气进行三跨线路监测分析预警的方法 |
CN113010572A (zh) * | 2021-03-18 | 2021-06-22 | 杭州码全信息科技有限公司 | 基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法 |
Non-Patent Citations (2)
Title |
---|
叶阿忠: "《高级计量经济学》", 厦门大学出版社, pages: 16 - 18 * |
魏生;戴科冕;: "区块链金融场景应用分析及企业级架构探讨", 广东工业大学学报, no. 02, 4 January 2010 (2010-01-04), pages 16 - 18 * |
Also Published As
Publication number | Publication date |
---|---|
CN113642986B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ferrer et al. | Bias and discrimination in AI: a cross-disciplinary perspective | |
Ghori et al. | Performance analysis of machine learning classifiers for non-technical loss detection | |
CN112491796B (zh) | 一种基于卷积神经网络的入侵检测及语义决策树量化解释方法 | |
Johansson et al. | Detection of vessel anomalies-a Bayesian network approach | |
CN110213244A (zh) | 一种基于时空特征融合的网络入侵检测方法 | |
CN113283909B (zh) | 一种基于深度学习的以太坊钓鱼账户检测方法 | |
CN112711757B (zh) | 一种基于大数据平台的数据安全集中管控方法及系统 | |
Nieto Acevedo et al. | Decision-making model at higher educational institutions based on machine learning | |
Shakya | Application of machine learning techniques in credit card fraud detection | |
CN114022058A (zh) | 基于时序知识图谱的中小企业失信风险预测方法 | |
CN111506710A (zh) | 基于谣言预测模型的信息发送方法、装置和计算机设备 | |
CN117349437A (zh) | 基于智能ai的政府信息管理系统及其方法 | |
CN113642986A (zh) | 构建数字公证的方法 | |
CN115099504B (zh) | 基于知识图谱补全模型的文物安防风险要素识别方法 | |
CN116306969A (zh) | 基于自监督学习的联邦学习方法和系统 | |
CN117009509A (zh) | 数据安全分级方法、装置、设备、存储介质和程序产品 | |
CN115293249A (zh) | 一种基于动态时序预测的电力系统典型场景概率预测方法 | |
CN112766320B (zh) | 一种分类模型训练方法及计算机设备 | |
CN117992861B (zh) | 一种电力数据精准度稽查方法及系统 | |
Galimyanov et al. | Research and forecasting of educational process parameters by using artificial intelligence | |
Braune et al. | Behavioral clustering for point processes | |
CN113138924B (zh) | 一种基于图学习的线程安全代码识别方法 | |
CN115118450B (zh) | 融合多级特征的增量式动态权值集成学习入侵检测方法 | |
CN114863356B (zh) | 一种基于残差聚合图网络的群体活动识别方法及系统 | |
CN114510431B (zh) | 一种工作量感知智能合约缺陷预测方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |