CN116340820A - 数据审核方法、装置、系统与计算机可读存储介质 - Google Patents

数据审核方法、装置、系统与计算机可读存储介质 Download PDF

Info

Publication number
CN116340820A
CN116340820A CN202310275816.4A CN202310275816A CN116340820A CN 116340820 A CN116340820 A CN 116340820A CN 202310275816 A CN202310275816 A CN 202310275816A CN 116340820 A CN116340820 A CN 116340820A
Authority
CN
China
Prior art keywords
data
auditing
model
audit
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310275816.4A
Other languages
English (en)
Inventor
朱瑞峰
文俊杰
阳璐
李金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Merchants Bank Co Ltd
Original Assignee
China Merchants Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Merchants Bank Co Ltd filed Critical China Merchants Bank Co Ltd
Priority to CN202310275816.4A priority Critical patent/CN116340820A/zh
Publication of CN116340820A publication Critical patent/CN116340820A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3684Test management for test design, e.g. generating new test cases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3692Test management for test results analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据审核方法、装置、系统和计算机可读存储介质,该方法包括:获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;基于所述数据类型对所述业务数据进行提取,得到待审核数据;确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。本发明通过对业务数据进行分类和提取,得到待审核数据,再确定待审核数据对应的目标审核模型,通过目标审核模型对待审核数据进行审核,避免人工审核导致的效率和准确性降低,进而提高数据审核的效率和准确性。

Description

数据审核方法、装置、系统与计算机可读存储介质
技术领域
本发明涉及金融科技技术领域,尤其涉及数据审核方法、装置、系统与计算机可读存储介质。
背景技术
金融机构包含的相关业务多种多样,并且金融机构每日都会有大量相关业务的需要处理,而相关业务的数据审核是必不可少的环节。金融机构相关业务的传统的数据审核(贷款审批、服务审核、资料录入等)依赖人工处理,耗费大量人力物力,且效率较低,并且各种业务的数据的审核规则差异性较大,通过人工对相关业务的数据进行审核容易导致审核准确性较低。
因此,如何提高数据审核的效率和准确性,是急需解决的问题。
发明内容
本发明的主要目的在于提出一种数据审核方法、装置、系统与计算机可读存储介质,旨在解决如何提高数据审核的效率和准确性的问题。
为实现上述目的,本发明提供一种数据审核方法,所述数据审核方法包括如下步骤:
获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
基于所述数据类型对所述业务数据进行提取,得到待审核数据;
确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
可选地,对所述业务数据进行分类,确定所述业务数据的数据类型的步骤包括:
获取所述业务数据对应的预设业务场景配置信息和预设分类识别配置信息;
基于所述预设业务场景配置信息和所述预设分类识别配置信息对所述业务数据进行分类,确定所述业务数据的数据类型。
可选地,基于所述数据类型对所述业务数据进行提取,得到待审核数据的步骤包括:
基于所述数据类型,确定对应的提取方式;
基于所述提取方式对所述业务数据进行提取,得到待审核数据。
可选地,审核模型类型包括预设审核模型和自定义审核模型,所述确定目标审核模型的步骤包括:
接收审核模型配置指令,并基于所述审核模型配置指令确定审核模型类型;
若确定所述审核模型类型为所述预设审核模型,则根据所述数据类型在预设审核模型集合中确定目标审核模型;
若确定所述审核模型类型为所述自定义审核模型,则获取所述审核模型配置指令对应的审核规则信息,基于所述审核规则信息创建自定义审核模型,并将所述自定义审核模型作为目标审核模型。
可选地,接收审核规则信息,基于所述审核规则信息创建自定义审核模型的步骤包括:
获取所述审核模型配置指令对应的审核规则信息,并检测所述审核规则信息是否符合预设规范;
若所述审核规则信息符合所述预设规范,则基于所述审核规则信息创建自定义预审核模型;
获取验证数据,基于所述验证数据对所述自定义预审核模型进行验证,得到验证结果;
将所述验证结果与所述验证数据对应的第一审核结果进行对比,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型。
可选地,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型步骤包括:
若所述验证结果与所述第一审核结果相同,则获取测试业务场景和所述测试业务场景对应的测试数据;
基于所述测试业务场景和所述测试数据对所述自定义预审核模型进行测试,得到测试结果;
将所述测试结果与所述测试数据对应的第二审核结果进行对比,若所述测试结果与所述第二审核结果相同,则将自定义预审核模型作为自定义审核模型。
可选地,基于所述目标审核模型对所述待审核数据进行审核的步骤包括:
获取所述业务数据对应的配置信息,并将所述待审核数据输入所述目标审核模型;
基于所述目标审核模型结合所述配置信息对所述待审核数据进行审核。
此外,为实现上述目的,本发明还提供一种数据审核装置,所述数据审核装置包括:
分类模块,用于获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
提取模块,用于基于所述数据类型对所述业务数据进行提取,得到待审核数据;
审核模块,用于确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
进一步地,所述分类模块还用于:
获取所述业务数据对应的预设业务场景配置信息和预设分类识别配置信息;
基于所述预设业务场景配置信息和所述预设分类识别配置信息对所述业务数据进行分类,确定所述业务数据的数据类型。
进一步地,所述提取模块还用于:
基于所述数据类型,确定对应的提取方式;
基于所述提取方式对所述业务数据进行提取,得到待审核数据。
进一步地,所述审核模块还包括确定模块,所述确定模块还用于:
接收审核模型配置指令,并基于所述审核模型配置指令确定审核模型类型;
若确定所述审核模型类型为所述预设审核模型,则根据所述数据类型在预设审核模型集合中确定目标审核模型;
若确定所述审核模型类型为所述自定义审核模型,则获取所述审核模型配置指令对应的审核规则信息,基于所述审核规则信息创建自定义审核模型,并将所述自定义审核模型作为目标审核模型。
进一步地,所述确定模块包括验证模块,所述验证模块用于:
获取所述审核模型配置指令对应的审核规则信息,并检测所述审核规则信息是否符合预设规范;
若所述审核规则信息符合所述预设规范,则基于所述审核规则信息创建自定义预审核模型;
获取验证数据,基于所述验证数据对所述自定义预审核模型进行验证,得到验证结果;
将所述验证结果与所述验证数据对应的第一审核结果进行对比,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型。
进一步地,所述确定模块包括测试模块,所述测试模块用于:
若所述验证结果与所述第一审核结果相同,则获取测试业务场景和所述测试业务场景对应的测试数据;
基于所述测试业务场景和所述测试数据对所述自定义预审核模型进行测试,得到测试结果;
将所述测试结果与所述测试数据对应的第二审核结果进行对比,若所述测试结果与所述第二审核结果相同,则将自定义预审核模型作为自定义审核模型。
进一步地,所述审核模块还用于:
获取所述业务数据对应的配置信息,并将所述待审核数据输入所述目标审核模型;
基于所述目标审核模型结合所述配置信息对所述待审核数据进行审核。
此外,为实现上述目的,本发明还提供一种数据审核系统,所述数据审核系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据审核程序,所述数据审核程序被所述处理器执行时实现如上所述的数据审核方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据审核程序,所述数据审核程序被处理器执行时实现如上所述的数据审核方法的步骤。
本发明提出的数据审核方法,获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;基于所述数据类型对所述业务数据进行提取,得到待审核数据;确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。本发明通过对业务数据进行分类和提取,得到待审核数据,再确定待审核数据对应的目标审核模型,通过目标审核模型对待审核数据进行审核,避免人工审核导致的效率和准确性降低,进而提高数据审核的效率和准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明数据审核方法第一实施例的流程示意图;
图3为本发明数据审核方法第二实施例的流程示意图;
图4为本发明数据审核方法第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将集合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例设备可以是PC机或服务器设备。
如图1所示,该设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据审核程序。
其中,操作系统是管理和控制便携数据审核系统与软件资源的程序,支持网络通信模块、用户接口模块、数据审核程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
在图1所示的数据审核系统中,所述数据审核系统通过处理器1001调用存储器1005中存储的数据审核程序,并执行下述数据审核方法各个实施例中的操作。
基于上述硬件结构,提出本发明数据审核方法实施例。
参照图2,图2为本发明数据审核方法第一实施例的流程示意图,所述方法包括:
步骤S10,获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
步骤S20,基于所述数据类型对所述业务数据进行提取,得到待审核数据;
步骤S30,确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
本实施例数据审核方法运用于金融机构的数据审核系统中,数据审核系统可以应用在终端或者PC设备,为描述方便,以数据审核系统为例进行描述;数据审核系统获取业务数据,并对业务数据进行分类,确定业务数据的数据类型;数据审核系统基于业务数据的数据类型对业务数据进行提取,得到待审核数据;数据审核系统确定目标审核模型,并基于目标审核模型对待审核数据进行审核。需要说明的是,业务数据包括:票据、文本、音频和图像等;数据类型包括票据的类型、文本的类型、音频的类型和图像的类型等;不同的业务数据对应的审核模型不同,不同的审核模型对应不同的审核规则。
本实施例的数据审核方法,获取业务数据,并对业务数据进行分类,确定业务数据的数据类型;基于数据类型对业务数据进行提取,得到待审核数据;确定目标审核模型,并基于目标审核模型对待审核数据进行审核。数据审核系统通过对业务数据进行分类和提取,得到待审核数据,再确定待审核数据对应的目标审核模型,通过目标审核模型对待审核数据进行审核,避免人工审核导致的效率和准确性降低,进而提高数据审核的效率和准确性。
以下将对各个步骤进行详细说明:
步骤S10,获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
在本实施例中,相关业务人员向数据审核系统输入需要进行审核的业务数据,并对业务数据进行分类的配置和审核业务场景的配置;数据审核系统接收业务数据和相应的配置信息,并基于配置信息对业务数据进行分类,确定业务数据的数据类型。
示例性地,相关业务人员输入业务数据包括票据数据、文本数据和音频数据,并且相关业务人员进行分类的配置和审核业务场景的配置,审核系统接收所有的业务数据,基于配置信息对业务数据进行分类,将业务数据分类成票据、文本和音频三大类型,也即将业务数据中的票据数据分类为票据,将业务数据中的文本数据分类到文本,将业务数据中的音频数据分类到音频,进而确定业务数据中包含的数据类型,以便于后续针对不同数据类型的业务数进行相应处理。
具体地,步骤S10包括:
步骤S101,获取所述业务数据对应的预设业务场景配置信息和预设分类识别配置信息;
在该步骤中,数据审核系统获取业务数据对应的预设业务场景配置信息和预设分类识别配置信息,可以理解的是,相关业务人员在输入业务数据时会进行分类的配置和审核业务场景的配置,数据审核系统接收相应的配置信息,进而将配置信息保存在预设业务场景配置信息和预设分类识别配置信息。
具体地,相关业务人员进行审核业务场景的配置,首先进入数据审核系统的信息创建页面,按页面提示内容输入场景相关信息,选择场景类型(智能分类、智能识别、智能审核、报文审核),输入完成后点击下一步,进入分类识别配置。相关业务人员进入数据审核系统的分类识别配置页面,根据需要审核的业务数据,进行对应的分类识别配置。以业务数据为票据为例:相关业务人员进入数据审核系统的分类识别配置页面后,选择前述步骤配置完成的审核业务场景需要分类识别的单据,并可自定义添加关键字分类单据;添加前述步骤配置完成的审核业务场景对应的报文信息,输入报文名称、添加报文字段(英文字段、中文字段、报文映射、描述信息);对需要分类识别的单据,设置别名、选择是否识别人脸、配置单张或多张单据等;进而完成分类识别配置。
步骤S102,基于所述预设业务场景配置信息和所述预设分类识别配置信息对所述业务数据进行分类,确定所述业务数据的数据类型。
在该步骤中,数据审核系统基于预设业务场景配置信息和预设分类识别配置信息,确定分类方式和分类逻辑,进而基于分类方式和分类逻辑对业务数据进行分类,确定业务数据的数据类型。具体地,数据审核系统首先读取预设业务场景配置信息确定分类方式,读取预设分类识别配置信息确定分类逻辑,进而基于对应的分类方式和分类逻辑,对业务数据进行分类,确定业务数据的数据类型,也即,如票据业务数据,分类确定票据业务数据包括发票、提单、股票等;如文本业务数据,分类确定文本业务数据包括申请书、请求书、合同等。分类方式包括模型分类和关键词分类,模型包括:NLP(Nature LanguageProcessing,自然语言处理)分类模型、图像分类模型和语音分类模型等,关键词分类通常是对于票据、文本等业务数据进行的,是识别票据、文本等业务数据中的关键字进而确定票据、文本等业务数据的数据类型。
以下以票据为例,说明票据业务数据的分类过程:
数据审核系统接收票据业务数据,并判断票据是否已经被分类,若是,则直接确定票据业务数据的数据类型,若否,则识别票据中是否含有敏感词;若票据中含有敏感词,则获取预设的敏感词场景配置,根据敏感词场景配置对票据的敏感词进行处理,进而提取票据的文字确定票据业务数据的数据类型;若票据中不含有敏感词,则读取预设业务场景配置信息确定分类方式;若分类方式为模型分类,则通过适配器模块将票据业务数据输入NLP分类模型、图像分类模型进行处理,确定票据业务数据的数据类型,并进一步确定票据业务数据是否区分联次信息,若区分联次,则进一步区分票据业务数据的联次信息;若分类方式为关键词分类,则识别票据业务数据是否包含发票接口关键词,若有,则请求发票接口,抽取票据业务数据的信息,并判断抽取的票据业务数据的信息是否成功,若成功,则根据抽取的票据业务数据的信息确定票据业务数据的数据类型;若失败或票据业务数据不包含发票接口关键词,则判断票据业务数据是否包含询证函接口关键词,若有,则请求询证函接口,抽取票据业务数据的信息,并判断抽取的票据业务数据的信息是否成功,若成功,则根据抽取的票据业务数据的信息确定票据业务数据的数据类型;若失败或票据业务数据不包含询证函接口关键词,则判断票据业务数据是否为PDF文件且单结果,若是,则将该PDF文件转换成图片,若将该PDF文件转换成图片失败,则结束分类过程,返回无法分类该票据业务数据的提示;若成功将该PDF文件转换成图片,则ORC(Optical Character Recognition,光学字符识别)带角度对图片中的票据信息进行识别,进而进行关键词分类,若关键词分类成功,则根据关键词确定票据业务数据的数据类型,并判断票据业务数据是否区分联次信息,若区分联次,则进一步区分票据业务数据的联次信息;若关键词分类失败,则判断图片是否支持旋转,若不支持,则结束分类过程,返回无法分类该票据业务数据的提示;若支持,则对图片进行四次旋转,并在每一次旋转之后进行关键词分类,若关键词分类成功,则根据关键词确定票据业务数据的数据类型,并判断票据业务数据是否区分联次信息,若区分联次,则进一步区分票据业务数据的联次信息;若关键词分类失败,则判断图片是否支持旋转,若不支持,则结束分类过程,返回无法分类该票据业务数据的提示。
步骤S20,基于所述数据类型对所述业务数据进行提取,得到待审核数据;
具体地,步骤S20包括:
步骤S201,基于所述数据类型,确定对应的提取方式;
步骤S202,基于所述提取方式对所述业务数据进行提取,得到待审核数据。
在本实施例中,数据审核系统对业务数据进行分类后,确定业务数据的数据类型,根据数据类型确定对应的提取方式,并基于提取方式对对应数据类型的业务数据进行提取和封装,得到待审核数据。具体地,业务数据中通常包含多种数据类型,如票据的类型、文本的类型、音频的类型和图像的类型等,数据审核系统业务数据进行分类,确定业务数据的数据类型,也即,如票据业务数据,分类确定票据业务数据包括发票、提单、股票等;如文本业务数据,分类确定文本业务数据包括申请书、请求书、合同等。对于票据业务数据对应一种提取方式,对于票据业务数据具体的发票、提单、股票等分别存在不同的提取方式,提取方式可以由相关业务人员自定义,也可以由数据审核系统根据数据类型确定。
示例性的,数据审核系统对业务数据进行分类确定其中的票据业务数据包括发票、提单、股票等,数据审核系统根据发票确定对应的提取方式,根据提单确定对应的提取方式,根据股票确定对音的提取方式,分别提取发票、提单、股票中需要进行审核的内容,并对这些内容分别进行封装,进而得到发票对应的待审核数据,提单对应的待审核数据,股票对应的待审核数据。
步骤S30,确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
在本实施例中,数据审核系统根据确定的待审核数据确定目标审核模型,并基于目标审核模型对所述待审核数据进行审核。可选地,数据审核系统接收相关业务人员的审核模型配置指令,确定目标审核模型。需要说明的是,目标审核模型可以是数据审核系统中预先设定的审核模型,还可以是相关业务人员通过审核模型配置指令配置的自定义审核模型,自定义审核模型中包括相关业务人员设定的审核规则。
具体地,步骤S30包括:
步骤S301,获取所述业务数据对应的配置信息,并将所述待审核数据输入所述目标审核模型;
在该步骤中,数据审核系统获取业务数据对应的配置信息,配置信息包括数据审核系统根据相关业务人员的配置确定的预设业务场景配置信息和预设分类识别配置信息,并将待审核数据输入确定的目标审核模型中。
步骤S302,基于所述目标审核模型结合所述配置信息对所述待审核数据进行审核。
在该步骤中,数据审核系统基于配置信息,确定审核场景,通过目标审核模型基于其中的审核规则和审核场景对待审核数据进行审核,得到审核结果,并将审核结果向相关业务人员进行展示。
本实施例的数据审核系统获取业务数据,并对业务数据进行分类,确定业务数据的数据类型;基于数据类型对业务数据进行提取,得到待审核数据;确定目标审核模型,并基于目标审核模型对待审核数据进行审核。通过对业务数据进行分类和提取,得到待审核数据,再确定待审核数据对应的目标审核模型,通过目标审核模型对待审核数据进行审核,避免人工审核导致的效率和准确性降低,进而提高数据审核的效率和准确性。
进一步地,参考图3,基于本发明数据审核方法第一实施例,提出本发明数据审核方法第二实施例。
数据审核方法的第二实施例与数据审核方法的第一实施例的区别在于,确定目标审核模型的步骤包括:
步骤S303,接收审核模型配置指令,并基于所述审核模型配置指令确定审核模型类型;
在该步骤中,数据审核模型接收相关业务人员输入的审核模型配置指令,获取审核模型配置指令中的配置内容,进而根据配置内容确定审核模型类型。
步骤S304,若确定所述审核模型类型为所述预设审核模型,则根据所述数据类型在预设审核模型集合中确定目标审核模型;
在该步骤中,数据审核模型识别配置内容,确定配置内容中是否存在相关业务人员配置的审核规则,当不存在相关业务人员配置的审核规则时,数据审核系统可确定审核模型类型为所述预设审核模型,并根据业务数据的数据类型在预设审核模型集合中确定目标审核模型;需要说明的是,预设审核模型集合是提前设定在数据审核系统中的,预设审核模型集合中的每个预设审核模型中都会对应的一个通用的审核规则。
步骤S305,若确定所述审核模型类型为所述自定义审核模型,则获取所述审核模型配置指令对应的审核规则信息,基于所述审核规则信息创建自定义审核模型,并将所述自定义审核模型作为目标审核模型。
在该步骤中,数据审核模型识别配置内容,确定配置内容中是否存在相关业务人员配置的审核规则,当存在相关业务人员配置的审核规则时,数据审核系统可确定审核模型类型为所述自定义审核模型,并根据相关业务人员配置的审核规则创建自定义审核模型,并将创建的自定义审核模型作为目标审核模型。
具体地,步骤S305包括:
步骤S3051,获取所述审核模型配置指令对应的审核规则信息,并检测所述审核规则信息是否符合预设规范;
在该步骤中,数据审核系统获取审核模型配置指令对应的审核规则信息,并检测审核规则信息是否符合预设规范。具体地,审核规则信息是通过预设的编程语言进行编辑的,数据审核系统自动校验审核规则信息是否符合预设的编码语言对应的预设规范;
进一步地,数据审核系统若确定自动校验审核规则信息不符合预设的编码语言对应的预设规范,则自动根据预设规范对审核规则信息进行修改;可选地,数据审核系统若确定自动校验审核规则信息不符合预设的编码语言对应的预设规范,则向相关业务人员发送提示,以便于相关业务人员对审核规则信息进行修改。
步骤S3052,若所述审核规则信息符合所述预设规范,则基于所述审核规则信息创建自定义预审核模型;
在该步骤中,数据审核系统若确定自动校验审核规则信息符合预设的编码语言对应的预设规范,则基于审核规则信息创建自定义预审核模型。
步骤S3053,获取验证数据,基于所述验证数据对所述自定义预审核模型进行验证,得到验证结果;
在该步骤中,数据审核系统获取验证数据,基于验证数据对自定义预审核模型进行验证,得到验证结果。
步骤S3054,将所述验证结果与所述验证数据对应的第一审核结果进行对比,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型。
在该步骤中,数据审核系统将验证结果与验证数据对应的第一审核结果进行对比,若验证结果与第一审核结果相同,则将自定义预审核模型作为自定义审核模型;若验证结果与第一审核结果不相同,则向相关业务人员发送提示,以便于相关业务人员对审核规则信息进行修改后,根据修改后的审核规则信息重新建立自定义预审核模型;直至最终确定自定义审核模型。
本实施例的数据审核系统根据相关业务人员的审核模型配置指令,确定目标审核模型为预设审核模型或自定义审核模型,并对自定义审核模型中的审核规则信息和自定义审核模型自身分别进行验证,进而得到目标审核模型,提高了目标审核模型的准确性,进而有助于提高数据审核的效率和准确性。
进一步地,参考图4,基于本发明数据审核方法第一实施例和第二实施例,提出本发明数据审核方法第三实施例。
数据审核方法的第三实施例与数据审核方法的第一实施例和第二实施例的区别在于,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型步骤包括:
步骤S30541,若所述验证结果与所述第一审核结果相同,则获取测试业务场景和所述测试业务场景对应的测试数据;
步骤S30542,基于所述测试业务场景和所述测试数据对所述自定义预审核模型进行测试,得到测试结果;
步骤S30543,将所述测试结果与所述测试数据对应的第二审核结果进行对比,若所述测试结果与所述第二审核结果相同,则将自定义预审核模型作为自定义审核模型。
在步骤S30541至步骤S30543中,数据审核系统将验证结果与验证数据对应的第一审核结果进行对比,若验证结果与第一审核结果相同后,数据审核系统获取测试业务场景和测试业务场景对应的测试数据,基于测试业务场景和测试数据对自定义预审核模型进行测试,得到测试结果,数据审核系统将测试结果与测试数据对应的第二审核结果进行对比,若测试结果与第二审核结果相同,则将自定义预审核模型作为自定义审核模型;若测试结果与第二审核结果不相同,则向相关业务人员发送提示,以便于相关业务人员对审核规则信息进行修改后,根据修改后的审核规则信息重新建立自定义预审核模型;直至最终确定自定义审核模型。
在本实施例的数据审核系统在确定自定义预审核模型的验证结果与第一审核结果相同后,通过基于测试业务场景和测试数据对自定义预审核模型进行测试,进一步提高最终得到的自定义审核模型的准确性,进而有助于提高数据审核的效率和准确性。
本发明还提供一种数据审核装置,数据审核装置包括:
分类模块,用于获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
提取模块,用于基于所述数据类型对所述业务数据进行提取,得到待审核数据;
审核模块,用于确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
进一步地,所述分类模块还用于:
获取所述业务数据对应的预设业务场景配置信息和预设分类识别配置信息;
基于所述预设业务场景配置信息和所述预设分类识别配置信息对所述业务数据进行分类,确定所述业务数据的数据类型。
进一步地,所述提取模块还用于:
基于所述数据类型,确定对应的提取方式;
基于所述提取方式对所述业务数据进行提取,得到待审核数据。
进一步地,所述审核模块还包括确定模块,所述确定模块还用于:
接收审核模型配置指令,并基于所述审核模型配置指令确定审核模型类型;
若确定所述审核模型类型为所述预设审核模型,则根据所述数据类型在预设审核模型集合中确定目标审核模型;
若确定所述审核模型类型为所述自定义审核模型,则获取所述审核模型配置指令对应的审核规则信息,基于所述审核规则信息创建自定义审核模型,并将所述自定义审核模型作为目标审核模型。
进一步地,所述确定模块包括验证模块,所述验证模块用于:
获取所述审核模型配置指令对应的审核规则信息,并检测所述审核规则信息是否符合预设规范;
若所述审核规则信息符合所述预设规范,则基于所述审核规则信息创建自定义预审核模型;
获取验证数据,基于所述验证数据对所述自定义预审核模型进行验证,得到验证结果;
将所述验证结果与所述验证数据对应的第一审核结果进行对比,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型。
进一步地,所述确定模块包括测试模块,所述测试模块用于:
若所述验证结果与所述第一审核结果相同,则获取测试业务场景和所述测试业务场景对应的测试数据;
基于所述测试业务场景和所述测试数据对所述自定义预审核模型进行测试,得到测试结果;
将所述测试结果与所述测试数据对应的第二审核结果进行对比,若所述测试结果与所述第二审核结果相同,则将自定义预审核模型作为自定义审核模型。
进一步地,所述审核模块还用于:
获取所述业务数据对应的配置信息,并将所述待审核数据输入所述目标审核模型;
基于所述目标审核模型结合所述配置信息对所述待审核数据进行审核。
本发明还提供一种数据审核系统。
本发明的数据审核系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据审核程序,所述数据审核程序被所述处理器执行时实现如上所述的数据审核方法的步骤。
其中,在所述处理器上运行的数据审核程序被执行时所实现的方法可参照本发明数据审核方法各个实施例,此处不再赘述。
本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有数据审核程序,所述数据审核程序被处理器执行时实现如上所述的数据审核方法的步骤。
其中,在所述处理器上运行的数据审核程序被执行时所实现的方法可参照本发明数据审核方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书与附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种数据审核方法,其特征在于,所述数据审核方法包括如下步骤:
获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
基于所述数据类型对所述业务数据进行提取,得到待审核数据;
确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
2.如权利要求1所述的数据审核方法,其特征在于,所述对所述业务数据进行分类,确定所述业务数据的数据类型的步骤包括:
获取所述业务数据对应的预设业务场景配置信息和预设分类识别配置信息;
基于所述预设业务场景配置信息和所述预设分类识别配置信息对所述业务数据进行分类,确定所述业务数据的数据类型。
3.如权利要求1所述的数据审核方法,其特征在于,所述基于所述数据类型对所述业务数据进行提取,得到待审核数据的步骤包括:
基于所述数据类型,确定对应的提取方式;
基于所述提取方式对所述业务数据进行提取,得到待审核数据。
4.如权利要求1所述的数据审核方法,其特征在于,审核模型类型包括预设审核模型和自定义审核模型,所述确定目标审核模型的步骤包括:
接收审核模型配置指令,并基于所述审核模型配置指令确定审核模型类型;
若确定所述审核模型类型为所述预设审核模型,则根据所述数据类型在预设审核模型集合中确定目标审核模型;
若确定所述审核模型类型为所述自定义审核模型,则获取所述审核模型配置指令对应的审核规则信息,基于所述审核规则信息创建自定义审核模型,并将所述自定义审核模型作为目标审核模型。
5.如权利要求4所述的数据审核方法,其特征在于,所述获取所述审核模型配置指令对应的审核规则信息,基于所述审核规则信息创建自定义审核模型的步骤包括:
获取所述审核模型配置指令对应的审核规则信息,并检测所述审核规则信息是否符合预设规范;
若所述审核规则信息符合所述预设规范,则基于所述审核规则信息创建自定义预审核模型;
获取验证数据,基于所述验证数据对所述自定义预审核模型进行验证,得到验证结果;
将所述验证结果与所述验证数据对应的第一审核结果进行对比,若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型。
6.如权利要求5中所述的数据审核方法,其特征在于,所述若所述验证结果与所述第一审核结果相同,则将自定义预审核模型作为自定义审核模型步骤包括:
若所述验证结果与所述第一审核结果相同,则获取测试业务场景和所述测试业务场景对应的测试数据;
基于所述测试业务场景和所述测试数据对所述自定义预审核模型进行测试,得到测试结果;
将所述测试结果与所述测试数据对应的第二审核结果进行对比,若所述测试结果与所述第二审核结果相同,则将自定义预审核模型作为自定义审核模型。
7.如权利要求1所述的数据审核方法,其特征在于,所述基于所述目标审核模型对所述待审核数据进行审核的步骤包括:
获取所述业务数据对应的配置信息,并将所述待审核数据输入所述目标审核模型;
基于所述目标审核模型结合所述配置信息对所述待审核数据进行审核。
8.一种数据审核装置,其特征在于,所述数据审核装置包括:
分类模块,用于获取业务数据,并对所述业务数据进行分类,确定所述业务数据的数据类型;
提取模块,用于基于所述数据类型对所述业务数据进行提取,得到待审核数据;
审核模块,用于确定目标审核模型,并基于所述目标审核模型对所述待审核数据进行审核。
9.一种数据审核系统,其特征在于,所述数据审核系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据审核程序,所述数据审核程序被所述处理器执行时实现如权利要求1至7中任一项所述的数据审核方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据审核程序,所述数据审核程序被处理器执行时实现如权利要求1至7中任一项所述的数据审核方法的步骤。
CN202310275816.4A 2023-03-09 2023-03-09 数据审核方法、装置、系统与计算机可读存储介质 Pending CN116340820A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310275816.4A CN116340820A (zh) 2023-03-09 2023-03-09 数据审核方法、装置、系统与计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310275816.4A CN116340820A (zh) 2023-03-09 2023-03-09 数据审核方法、装置、系统与计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN116340820A true CN116340820A (zh) 2023-06-27

Family

ID=86883362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310275816.4A Pending CN116340820A (zh) 2023-03-09 2023-03-09 数据审核方法、装置、系统与计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN116340820A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235406A (zh) * 2023-11-14 2023-12-15 广东省电信规划设计院有限公司 基于区块链的信息内容安全的管控方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235406A (zh) * 2023-11-14 2023-12-15 广东省电信规划设计院有限公司 基于区块链的信息内容安全的管控方法及装置
CN117235406B (zh) * 2023-11-14 2024-03-19 广东省电信规划设计院有限公司 基于区块链的信息内容安全的管控方法及装置

Similar Documents

Publication Publication Date Title
CN111274782A (zh) 一种文本审核方法、装置、计算机设备及可读存储介质
US20170098192A1 (en) Content aware contract importation
JP5352279B2 (ja) 印刷物管理システム
US8315874B2 (en) Voice user interface authoring tool
US9317396B2 (en) Information processing apparatus including an execution control unit, information processing system having the same, and stop method using the same
CN113627145A (zh) 一种参数化配置的文件生成方法、装置、设备和介质
CN116340820A (zh) 数据审核方法、装置、系统与计算机可读存储介质
US11960849B2 (en) Using machine learning models to analyze contractual terms and clauses in a legal contract, to recommend edits, and to make changes to a workflow
CN113032834A (zh) 一种数据库表格处理方法、装置、设备及存储介质
CN114626341A (zh) 文档转换方法、装置及存储介质
CN110728593A (zh) 案件的立案方法和装置、电子设备和存储介质
CN114743012A (zh) 一种文本识别方法及装置
CN110533381B (zh) 案件管辖权审核方法、装置、计算机设备和存储介质
US20200302076A1 (en) Document processing apparatus and non-transitory computer readable medium
CN114549177A (zh) 保函审查方法、装置、系统与计算机可读存储介质
CN113537964A (zh) 申请单处理方法、设备、存储介质及装置
US20020073003A1 (en) Disbursement tracking system
US20230125177A1 (en) Methods and systems for matching and optimizing technology solutions to requested enterprise products
CN110895924A (zh) 一种文档内容朗读方法、装置、电子设备及可读存储介质
CN114625872A (zh) 基于全局指针的风险审核方法、系统、设备及存储介质
US7428697B2 (en) Preserving content or attribute information during conversion from a structured document to a computer program
CN114764560A (zh) 流程表单生成方法、设备、存储介质及装置
CN112597209A (zh) 数据的验证方法、装置、系统及计算机可读存储介质
CN111151008A (zh) 游戏运营数据的校验方法、装置、配置后台及介质
CN114157439A (zh) 漏洞扫描方法、计算设备及记录介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination