CN116484841A - 基于自动化审核的信息校验系统及方法 - Google Patents
基于自动化审核的信息校验系统及方法 Download PDFInfo
- Publication number
- CN116484841A CN116484841A CN202310523444.2A CN202310523444A CN116484841A CN 116484841 A CN116484841 A CN 116484841A CN 202310523444 A CN202310523444 A CN 202310523444A CN 116484841 A CN116484841 A CN 116484841A
- Authority
- CN
- China
- Prior art keywords
- target user
- length
- fixed
- input
- information verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 59
- 230000013016 learning Effects 0.000 claims abstract description 50
- 230000007246 mechanism Effects 0.000 claims abstract description 40
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000012550 audit Methods 0.000 claims description 31
- 238000007726 management method Methods 0.000 claims description 25
- 238000013500 data storage Methods 0.000 claims description 23
- 230000009469 supplementation Effects 0.000 claims description 19
- 238000010295 mobile communication Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 230000010365 information processing Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种基于自动化审核的信息校验系统,涉及信息校验领域,所述系统包括:偏好分析机构,设置在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处,用于获取目标用户对应的各项偏好数据;自动审核器件,用于基于固定字符长度的定长输入文字以及目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户。本发明还涉及一种基于自动化审核的信息校验方法。通过本发明,针对现有技术中无法对用户输入文字执行自动化真伪校验的技术问题,能够在信息校验端采用定制智能模型对接收到的每一份用户输入文字执行自动化审核,从而解决了上述技术问题。
Description
技术领域
本发明涉及信息校验领域,尤其涉及一种基于自动化审核的信息校验系统及方法。
背景技术
当前,由于各种数字信息伪造技术的提升以及AI模型对信息模仿的不断应用和提升,导致在信息接收端对接收到的用户文字数据无法审核其是否真实来自对应的目标用户,进而无法判断接收到的用户文字数据的可靠性和有效性,为后续文字数据的应用营造了难题。
示例地,中国发明专利公开文本CN113887345A提出的一种结合AI和RPA的文本信息处理方法、装置及存储介质,该方法包括:接收用户端的文本信息处理请求,其中,文本信息处理请求中包括:待处理信息文件以及待处理信息文件的信息处理类型;基于光学字符识别OCR获取待处理信息文件的文本信息;根据信息处理类型,控制RPA机器人对所述文本信息进行处理;由此,根据待处理信息文件的信息处理类型,控制RPA机器人对文本信息进行处理,简化了文本信息处理流程,同时结合光学字符识别OCR技术实现了文本信息的智能化审核,减少了人工干预,提高了文本信息处理的效率和准确性,降低了企业成本。
示例地,中国发明专利公开文本CN115330392A提出的一种用户身份信息的校验方法及系统、存储介质、电子设备,涉及生物识别领域,其中,该方法包括:获取待校验用户在当前业务流程的身份标识、生物特征分片数据和视频帧数据;在身份标识通过校验的情况下,采用动作检测模型识别视频帧数据中的人体动作,并将人体动作与当前业务流程中的动作要求指令进行比对;采用将生物特征分片数据与预先录入的生物特征集合进行比对;在待校验用户的人体动作和生物特征都通过比对的情况下,确认待校验用户的身份信息通过校验,生成用户校验报告。本发明解决了相关技术中,由于金融机构线上业务系统不成熟、生物识别手段单一造成的用户信息泄露的技术问题。
由此可见,现有技术中虽然采用了各种电子化信息校验机制对过往的人工信息校验机制进行了有效替换,然而这些机制的应用领域狭窄且通常需要依赖两种以上的电子识别模式,其操作繁琐的同时缺乏对用户输入文本的真实性进行自动化审核的校验解决方案,因此,针对每一份用户输入文本的真伪校验,仍需要研究一种可靠且操作简便的技术方案。
发明内容
为了解决相关领域中的技术缺陷,本发明提供了一种基于自动化审核的信息校验系统及方法,能够在信息校验端采用完成预设数目的多次学习后的BP神经网络对接收到的每一份用户输入文字执行自动化审核,从而完成对每一份用户输入文字是否真实由目标用户输入的真伪性进行信息校验,为用户输入文字的后续使用提供有效保障。
根据本发明的第一方面,提供了一种基于自动化审核的信息校验系统,所述方法包括:
偏好分析机构,设置在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处,用于获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
数据存储机构,设置在远端的用户管理服务器附近,所述用户管理服务器与所述信息校验端无线连接,用于从所述数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据;
文字处理机构,设置在所述信息校验端,用于对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
自动审核器件,设置在所述信息校验端,分别与所述偏好分析机构以及所述文字处理机构连接,用于基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联。
根据本发明的第二方面,提供了一种基于自动化审核的信息校验系统,所述方法包括存储器以及一个或多个处理器,所述存储器存储有计算机程序,所述计算机程序被配置成由所述一个或多个处理器执行以完成以下步骤:
在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
从设置在远端的用户管理服务器附近的数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据,所述用户管理服务器与所述信息校验端无线连接;
在所述信息校验端对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
在所述信息校验端基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联。
根据本发明的第三方面,提供了一种基于自动化审核的信息校验方法,所述方法包括:
在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
从设置在远端的用户管理服务器附近的数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据,所述用户管理服务器与所述信息校验端无线连接;
在所述信息校验端对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
在所述信息校验端基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联。
相比较于现有技术,本发明至少具备以下三处主要的发明点:
主要发明点(1):在信息校验端,对接收到的每一份用户输入文字执行是否真实由目标用户输入的自动化审核,所述自动化审核采用完成预设数目的多次学习后的BP神经网络,且基础数据为对用户输入文字进行截取或者补零获得的固定字符长度的定长输入文字以及目标用户对应的各项偏好数据;
主要发明点(2):执行自动化审核的BP神经网络为针对性设计的审核模型,其针对性在于选择的目标用户对应的各项偏好数据包括目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,固定字符长度的定长输入文字的定制获取机制,以及训练的次数与固定字符长度的取值单调正向关联;
主要发明点(3):对执行自动化审核的BP神经网络的输入内容和输出内容进行归一化的数值处理以保证网络的运行以及审核结果的可靠性和稳定性,其中,采用各个组成字符的ASCLL码表示模式对固定字符长度的定长输入文字进行数值表示,以及采用不同的二进制数值对标记接收到的用户输入文字是否归属于目标用户的审核标记进行不同赋值。
附图说明
以下将结合附图对本发明的实施例进行描述,其中:
图1为根据本发明的基于自动化审核的信息校验系统及方法的技术流程图。
图2为根据本发明的实施例1示出的基于自动化审核的信息校验系统的结构示意图。
图3为根据本发明的实施例2示出的基于自动化审核的信息校验系统的结构示意图。
图4为根据本发明的实施例3示出的基于自动化审核的信息校验系统的结构示意图。
图5为根据本发明的实施例4示出的基于自动化审核的信息校验系统的结构示意图。
图6为根据本发明的实施例5示出的基于自动化审核的信息校验系统的结构示意图。
图7为根据本发明的实施例6示出的基于自动化审核的信息校验系统的结构示意图。
图8为根据本发明的实施例7示出的基于自动化审核的信息校验方法的步骤流程图。
实施方式
如图1所示,给出了根据本发明示出的基于自动化审核的信息校验系统及方法的技术流程图。
如图1所示,本发明的具体的技术流程如下:
第一步,在信息校验端建立针对性设计的神经网络,所述针对性设计的神经网络为完成预设数目的多次学习后的BP神经网络,用于对每一份用户输入文字自动化审核其是否真实由目标用户输入;
图1中,完成预设数目的多次学习后的BP神经网络包括输入层、隐藏层以及输出层,其中,所述隐藏层设置在所述输入层和所述输出层之间;
第二步,获取用于执行自动化审核的基础数据,所述基础数据为对用户输入文字进行截取或者补零获得的固定字符长度的定长输入文字以及目标用户对应的各项偏好数据;
第三步,运行所述针对性设计的神经网络以获得其输出的自动化审核结果,所述自动化审核结果标记用户输入文字是否真实由目标用户输入;
示例地,不同的自动化审核结果可以分别标记用户输入文字真实由目标用户输入或者用户输入文字并非真实由目标用户输入。
本发明的关键点在于:用于对每一份用户输入文字执行自动化审核的针对性设计的神经网络,以及为所述针对性设计的神经网络选择的各项定制输入数据,从而保证了每一次自动化审核结果的准确性和稳定性。
下面,将对本发明的基于自动化审核的信息校验系统及方法以实施例的方式进行具体说明。
实施例1
图2为根据本发明的实施例1示出的基于自动化审核的信息校验系统的结构示意图。
如图2所示,所述基于自动化审核的信息校验系统包括以下部件:
偏好分析机构,设置在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处,用于获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
示例地,可以采用多个不同的数据获取单元用于分别获取所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量;
数据存储机构,设置在远端的用户管理服务器附近,所述用户管理服务器与所述信息校验端无线连接,用于从所述数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据;
示例地,可以采用FLASH闪存、MMC存储芯片或者TF存储芯片来实现所述数据存储机构;
文字处理机构,设置在所述信息校验端,用于对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
自动审核器件,设置在所述信息校验端,分别与所述偏好分析机构以及所述文字处理机构连接,用于基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
示例地,可以采用数值仿真模式实现对完成预设数目的多次学习后的BP神经网络的网络构建以及网络测试;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联;
例如,所述预设数目的取值与所述固定字符长度的取值单调正向关联包括:所述固定字符长度的取值为2000字符时,所述预设数目的取值为100,所述固定字符长度的取值为5000字符时,所述预设数目的取值为150,所述固定字符长度的取值为10000字符时,所述预设数目的取值为200,以及所述固定字符长度的取值为20000字符时,所述预设数目的取值为300;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度大于所述固定字符长度时,截取所述用户输入文字的最前端的固定字符长度数量的多个字符以作为所述固定字符长度的定长输入文字;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度小于所述固定字符长度时,将所述用户输入文字作为固定字符长度的定长输入文字的最前端的多个字符,将所述固定字符长度的定长输入文字的剩余各个字符执行补零操作;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容;
示例地,将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容包括:将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容并行输入到所述采用完成预设数目的多次学习后的BP神经网络;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容。
实施例2
图3为根据本发明的实施例2示出的基于自动化审核的信息校验系统的结构示意图。
如图3所示,与图2中的实施例不同,所述基于自动化审核的信息校验系统还包括以下组件:
用户管理服务器,设置在所述信息校验端的远端,且所述用户管理服务器通过移动通信器件与所述信息校验端无线连接;
示例地,可以采用云计算服务器、大数据服务器或者区块链服务器来实现所述用户管理服务器。
实施例3
图4为根据本发明的实施例3示出的基于自动化审核的信息校验系统的结构示意图。
如图4所示,与图3中的实施例不同,所述基于自动化审核的信息校验系统还包括以下组件:
移动通信器件,设置在所述用户管理服务器附近且同时与所述用户管理服务器以及所述信息校验端连接;
例如,可以采用时分双工通信器件或者频分双工通信器件来实现所述移动通信器件。
实施例4
图5为根据本发明的实施例4示出的基于自动化审核的信息校验系统的结构示意图。
如图5所示,与图4中的实施例不同,所述基于自动化审核的信息校验系统还包括以下组件:
网络学习器件,与所述自动审核器件连接,用于对BP神经网络执行预设数目的多次学习,并将完成预设数目的多次学习后的BP神经网络发生给所述自动审核器件使用;
示例地,可以采用ASIC芯片、SOC芯片或者FPGA芯片来实现所述网络学习器件。
实施例5
图6为根据本发明的实施例5示出的基于自动化审核的信息校验系统的结构示意图。
如图6所示,与图5中的实施例不同,所述基于自动化审核的信息校验系统还包括以下组件:
参数存储器件,与所述自动审核器件连接,用于存储完成预设数目的多次学习后的BP神经网络的各项网络参数;
从某种意义上来说,完成预设数目的多次学习后的BP神经网络的各项网络参数代表了完成预设数目的多次学习后的BP神经网络。
接着,继续对本发明的各个实施例进行详细的描述。
在根据本发明的各个实施例的基于自动化审核的信息校验系统中:
获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量包括:所述目标用户对应的平均语句长度为所述目标用户过往输入的各个历史语句分别对应的各个语句长度的平均数值;
例如,可以采用二进制数值对所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量分别进行表示;
其中,获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量包括:所述目标用户对应的平均段落长度为所述目标用户过往输入的各个历史段落分别对应的各个段落长度的平均数值;
其中,获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量包括:所述目标用户对应的连词偏好信息为设定数量的多个惯用词语分别对应的所述目标用户偏好的多个后续连接词语;
其中,所述目标用户对应的连词偏好信息为设定数量的多个惯用词语分别对应的所述目标用户偏好的多个后续连接词语包括:针对每一个惯用词语,其对应的所述目标用户偏好的后续连接词语为所述目标用户最常输入到所述惯用词语后方的词语;
其中,针对每一个惯用词语,其对应的所述目标用户偏好的后续连接词语为所述目标用户最常输入到所述惯用词语后方的词语包括:针对所述惯用词语,将所述目标用户偏好连接在其后的各个词语进行连接次数的排序,将连接次数最多的词语作为其对应的所述目标用户偏好的后续连接词语;
其中,将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容包括:当输出的审核标记为0B00时,标记接收到的用户输入文字不归属于目标用户;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度等于所述固定字符长度时,直接将所述用户输入文字作为所述固定字符长度的定长输入文字。
实施例6
图7为根据本发明的实施例6示出的基于自动化审核的信息校验系统的结构方框图。
如图7所示,所述基于自动化审核的信息校验系统包括存储器以及一个或多个处理器,所述存储器存储有计算机程序,所述计算机程序被配置成由所述一个或多个处理器执行以完成以下步骤:
在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
示例地,可以采用多个不同的数据获取单元用于分别获取所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量;
从设置在远端的用户管理服务器附近的数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据,所述用户管理服务器与所述信息校验端无线连接;
在所述信息校验端对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
在所述信息校验端基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
示例地,可以采用数值仿真模式实现对完成预设数目的多次学习后的BP神经网络的网络构建以及网络测试;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联;
例如,所述预设数目的取值与所述固定字符长度的取值单调正向关联包括:所述固定字符长度的取值为2000字符时,所述预设数目的取值为100,所述固定字符长度的取值为5000字符时,所述预设数目的取值为150,所述固定字符长度的取值为10000字符时,所述预设数目的取值为200,以及所述固定字符长度的取值为20000字符时,所述预设数目的取值为300;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度大于所述固定字符长度时,截取所述用户输入文字的最前端的固定字符长度数量的多个字符以作为所述固定字符长度的定长输入文字;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度小于所述固定字符长度时,将所述用户输入文字作为固定字符长度的定长输入文字的最前端的多个字符,将所述固定字符长度的定长输入文字的剩余各个字符执行补零操作;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容;
如图7所示,示例性地,给出了N个处理器,其中,N为大于等于1的自然数。
实施例7
图8为根据本发明的实施例7示出的基于自动化审核的信息校验方法的步骤流程图。
如图8所示,所述基于自动化审核的信息校验方法包括以下步骤:
S801:在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
示例地,可以采用多个不同的数据获取单元用于分别获取所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量;
S802:从设置在远端的用户管理服务器附近的数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据,所述用户管理服务器与所述信息校验端无线连接;
S803:在所述信息校验端对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
S804:在所述信息校验端基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
示例地,可以采用数值仿真模式实现对完成预设数目的多次学习后的BP神经网络的网络构建以及网络测试;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联;
例如,所述预设数目的取值与所述固定字符长度的取值单调正向关联包括:所述固定字符长度的取值为2000字符时,所述预设数目的取值为100,所述固定字符长度的取值为5000字符时,所述预设数目的取值为150,所述固定字符长度的取值为10000字符时,所述预设数目的取值为200,以及所述固定字符长度的取值为20000字符时,所述预设数目的取值为300;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度大于所述固定字符长度时,截取所述用户输入文字的最前端的固定字符长度数量的多个字符以作为所述固定字符长度的定长输入文字;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度小于所述固定字符长度时,将所述用户输入文字作为固定字符长度的定长输入文字的最前端的多个字符,将所述固定字符长度的定长输入文字的剩余各个字符执行补零操作;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容。
另外,本发明还可以引用以下具体技术内容以突出本发明的突出性的实质性特点以及显著性的技术进步:
将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容包括:采用各个组成字符的ASCLL码表示模式对所述固定字符长度的定长输入文字进行数值表示以输入到所述完成预设数目的多次学习后的BP神经网络;
其中,将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容包括:当输出的审核标记为0B01时,标记接收到的用户输入文字归属于目标用户。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备/计算机可读存储介质/计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种基于自动化审核的信息校验系统,其特征在于,所述方法包括:
偏好分析机构,设置在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处,用于获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
数据存储机构,设置在远端的用户管理服务器附近,所述用户管理服务器与所述信息校验端无线连接,用于从所述数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据;
文字处理机构,设置在所述信息校验端,用于对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
自动审核器件,设置在所述信息校验端,分别与所述偏好分析机构以及所述文字处理机构连接,用于基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联。
2.如权利要求1所述的基于自动化审核的信息校验系统,其特征在于:
对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度大于所述固定字符长度时,截取所述用户输入文字的最前端的固定字符长度数量的多个字符以作为所述固定字符长度的定长输入文字;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度小于所述固定字符长度时,将所述用户输入文字作为固定字符长度的定长输入文字的最前端的多个字符,将所述固定字符长度的定长输入文字的剩余各个字符执行补零操作;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据。
3.如权利要求2所述的基于自动化审核的信息校验系统,其特征在于:
基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据作为采用完成预设数目的多次学习后的BP神经网络的逐项输入内容;
其中,基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户包括:将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容。
4.如权利要求3所述的基于自动化审核的信息校验系统,其特征在于,所述系统还包括:
用户管理服务器,设置在所述信息校验端的远端,且所述用户管理服务器通过移动通信器件与所述信息校验端无线连接。
5.如权利要求3所述的基于自动化审核的信息校验系统,其特征在于,所述系统还包括:
移动通信器件,设置在所述用户管理服务器附近且同时与所述用户管理服务器以及所述信息校验端连接。
6.如权利要求3所述的基于自动化审核的信息校验系统,其特征在于,所述系统还包括:
网络学习器件,与所述自动审核器件连接,用于对BP神经网络执行预设数目的多次学习,并将完成预设数目的多次学习后的BP神经网络发生给所述自动审核器件使用。
7.如权利要求3所述的基于自动化审核的信息校验系统,其特征在于,所述系统还包括:
参数存储器件,与所述自动审核器件连接,用于存储完成预设数目的多次学习后的BP神经网络的各项网络参数。
8.如权利要求3-7任一所述的基于自动化审核的信息校验系统,其特征在于:
获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量包括:所述目标用户对应的平均语句长度为所述目标用户过往输入的各个历史语句分别对应的各个语句长度的平均数值;
其中,获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量包括:所述目标用户对应的平均段落长度为所述目标用户过往输入的各个历史段落分别对应的各个段落长度的平均数值;
其中,获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量包括:所述目标用户对应的连词偏好信息为设定数量的多个惯用词语分别对应的所述目标用户偏好的多个后续连接词语;
其中,所述目标用户对应的连词偏好信息为设定数量的多个惯用词语分别对应的所述目标用户偏好的多个后续连接词语包括:针对每一个惯用词语,其对应的所述目标用户偏好的后续连接词语为所述目标用户最常输入到所述惯用词语后方的词语;
其中,针对每一个惯用词语,其对应的所述目标用户偏好的后续连接词语为所述目标用户最常输入到所述惯用词语后方的词语包括:针对所述惯用词语,将所述目标用户偏好连接在其后的各个词语进行连接次数的排序,将连接次数最多的词语作为其对应的所述目标用户偏好的后续连接词语;
其中,将标记接收到的用户输入文字是否归属于目标用户的审核标记作为完成预设数目的多次学习后的BP神经网络的单项输出内容包括:当输出的审核标记为0B00时,标记接收到的用户输入文字不归属于目标用户;
其中,对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字包括:在所述用户输入文字的字符长度等于所述固定字符长度时,直接将所述用户输入文字作为所述固定字符长度的定长输入文字。
9.一种基于自动化审核的信息校验系统,其特征在于,所述方法包括存储器以及一个或多个处理器,所述存储器存储有计算机程序,所述计算机程序被配置成由所述一个或多个处理器执行以完成以下步骤:
在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
从设置在远端的用户管理服务器附近的数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据,所述用户管理服务器与所述信息校验端无线连接;
在所述信息校验端对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
在所述信息校验端基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联。
10.一种基于自动化审核的信息校验方法,其特征在于,所述方法包括:
在校验接收到的用户输入文字是否真实由目标用户输入的信息校验端处获取所述目标用户对应的各项偏好数据,所述目标用户对应的各项偏好数据包括所述目标用户对应的平均语句长度、平均段落长度、连词偏好信息以及单位时间输入字符数量,所述用户输入文字由多段文字段落组成且由信息输出端输入到信息校验端;
从设置在远端的用户管理服务器附近的数据存储机构内读出所述目标用户对应的各项偏好数据,并通过移动通信器件向所述信息校验端无线发送所述目标用户对应的各项偏好数据,所述用户管理服务器与所述信息校验端无线连接;
在所述信息校验端对接收到的用户输入文字执行固定字符长度的截取或补充以获得字符长度等于所述固定字符长度的定长输入文字;
在所述信息校验端基于所述固定字符长度的定长输入文字以及所述目标用户对应的各项偏好数据采用完成预设数目的多次学习后的BP神经网络自动化审核接收到的用户输入文字是否归属于目标用户;
其中,所述数据存储机构包括多个存储单元,用于分别存储多个不同用户对应的各项偏好数据;
其中,所述预设数目的取值与所述固定字符长度的取值单调正向关联。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310523444.2A CN116484841B (zh) | 2023-05-10 | 2023-05-10 | 基于自动化审核的信息校验系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310523444.2A CN116484841B (zh) | 2023-05-10 | 2023-05-10 | 基于自动化审核的信息校验系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116484841A true CN116484841A (zh) | 2023-07-25 |
CN116484841B CN116484841B (zh) | 2023-10-03 |
Family
ID=87219470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310523444.2A Active CN116484841B (zh) | 2023-05-10 | 2023-05-10 | 基于自动化审核的信息校验系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484841B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033441A (zh) * | 2018-08-16 | 2018-12-18 | 安徽大尺度网络传媒有限公司 | 一种基于大数据分析的推送方法及装置 |
CN109446521A (zh) * | 2018-10-18 | 2019-03-08 | 京东方科技集团股份有限公司 | 命名实体识别方法、装置、电子设备、机器可读存储介质 |
CN110599195A (zh) * | 2019-08-02 | 2019-12-20 | 广东工业大学 | 一种识别刷单的方法 |
CN110941712A (zh) * | 2019-11-21 | 2020-03-31 | 清华大学深圳国际研究生院 | 一种用户级别的个性化文本摘要生成方法和系统 |
KR102115551B1 (ko) * | 2019-08-06 | 2020-05-26 | 전자부품연구원 | 글로스를 이용한 수어 번역 장치 및 번역모델 학습장치 |
CN111277579A (zh) * | 2016-05-06 | 2020-06-12 | 青岛海信移动通信技术股份有限公司 | 一种识别验证信息的方法和设备 |
CN114155529A (zh) * | 2021-11-05 | 2022-03-08 | 深圳市标准技术研究院 | 结合文字视觉特征和文字内容特征的违规广告识别方法 |
US20220172039A1 (en) * | 2020-11-30 | 2022-06-02 | Microsoft Technology Licensing, Llc | Machine learning techniques to predict document type for incomplete queries |
KR20220090675A (ko) * | 2020-12-22 | 2022-06-30 | 경북대학교 산학협력단 | 사용자의 선호도를 분석하는 대화 매칭 장치 및 방법 |
KR20220150122A (ko) * | 2021-05-03 | 2022-11-10 | 삼성생명보험주식회사 | 텍스트 교정 방법 및 장치 |
-
2023
- 2023-05-10 CN CN202310523444.2A patent/CN116484841B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111277579A (zh) * | 2016-05-06 | 2020-06-12 | 青岛海信移动通信技术股份有限公司 | 一种识别验证信息的方法和设备 |
CN109033441A (zh) * | 2018-08-16 | 2018-12-18 | 安徽大尺度网络传媒有限公司 | 一种基于大数据分析的推送方法及装置 |
CN109446521A (zh) * | 2018-10-18 | 2019-03-08 | 京东方科技集团股份有限公司 | 命名实体识别方法、装置、电子设备、机器可读存储介质 |
CN110599195A (zh) * | 2019-08-02 | 2019-12-20 | 广东工业大学 | 一种识别刷单的方法 |
KR102115551B1 (ko) * | 2019-08-06 | 2020-05-26 | 전자부품연구원 | 글로스를 이용한 수어 번역 장치 및 번역모델 학습장치 |
CN110941712A (zh) * | 2019-11-21 | 2020-03-31 | 清华大学深圳国际研究生院 | 一种用户级别的个性化文本摘要生成方法和系统 |
US20220172039A1 (en) * | 2020-11-30 | 2022-06-02 | Microsoft Technology Licensing, Llc | Machine learning techniques to predict document type for incomplete queries |
KR20220090675A (ko) * | 2020-12-22 | 2022-06-30 | 경북대학교 산학협력단 | 사용자의 선호도를 분석하는 대화 매칭 장치 및 방법 |
KR20220150122A (ko) * | 2021-05-03 | 2022-11-10 | 삼성생명보험주식회사 | 텍스트 교정 방법 및 장치 |
CN114155529A (zh) * | 2021-11-05 | 2022-03-08 | 深圳市标准技术研究院 | 结合文字视觉特征和文字内容特征的违规广告识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116484841B (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10402163B2 (en) | Intelligent data extraction | |
CN112631997B (zh) | 数据处理方法、装置、终端及存储介质 | |
CN108876166A (zh) | 财务风险验证处理方法、装置、计算机设备及存储介质 | |
US12118552B2 (en) | User profiling based on transaction data associated with a user | |
CN107256428B (zh) | 数据处理方法、数据处理装置、存储设备及网络设备 | |
CN111310440B (zh) | 文本的纠错方法、装置和系统 | |
CN109388675A (zh) | 数据分析方法、装置、计算机设备及存储介质 | |
CN108550065B (zh) | 评论数据处理方法、装置及设备 | |
CN111324739B (zh) | 一种文本情感分析方法及系统 | |
CN110598070A (zh) | 应用类型识别方法及装置、服务器及存储介质 | |
CN114387061A (zh) | 产品推送方法、装置、电子设备及可读存储介质 | |
CN113837113A (zh) | 基于人工智能的文档校验方法、装置、设备及介质 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN115392237B (zh) | 情感分析模型训练方法、装置、设备及存储介质 | |
CN112052305A (zh) | 信息提取方法、装置、计算机设备及可读存储介质 | |
US20240005089A1 (en) | Document auto-completion | |
CN117251547A (zh) | 用户提问应答方法及其装置、设备、介质 | |
CN112749563A (zh) | 一种命名实体识别数据标注质量评估与控制方法及系统 | |
CN112667802A (zh) | 业务信息录入方法、装置、服务器和存储介质 | |
CN114398560B (zh) | 基于web平台的营销界面设置方法、装置、设备及介质 | |
CN116228274A (zh) | 标签信息处理方法、装置、存储介质、电子设备及系统 | |
CN112989053A (zh) | 一种期刊推荐方法及装置 | |
CN117313736A (zh) | 评论文本的隐式需求识别方法及装置 | |
CN116484841B (zh) | 基于自动化审核的信息校验系统及方法 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |