CN116610674A - 信息处理方法、装置、设备及存储介质 - Google Patents

信息处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116610674A
CN116610674A CN202310565299.4A CN202310565299A CN116610674A CN 116610674 A CN116610674 A CN 116610674A CN 202310565299 A CN202310565299 A CN 202310565299A CN 116610674 A CN116610674 A CN 116610674A
Authority
CN
China
Prior art keywords
information
field
target
determining
source information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310565299.4A
Other languages
English (en)
Inventor
张子寻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310565299.4A priority Critical patent/CN116610674A/zh
Publication of CN116610674A publication Critical patent/CN116610674A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1004Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本公开提供了一种信息处理方法、装置、设备及存储介质,可以应用于大数据、人工智能、物联网等技术领域以及金融领域。该方法包括:响应于接收到信息表单,确定基于信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息;根据目标字段属性信息类别的字段信息在每个候选字段来源信息下的信息录入准确率,从至少一个候选字段来源信息中确定与目标字段属性信息相对应的目标字段来源信息;以及根据目标字段来源信息,从信息表单中确定目标字段的录入信息。

Description

信息处理方法、装置、设备及存储介质
技术领域
本公开涉及大数据、人工智能、物联网等技术领域以及金融领域,尤其涉及一种信息处理方法、装置、设备、介质和程序产品。
背景技术
金融领域普遍采用碎片化文档录入方式开展集约运营的业务办理,即通过搭建碎片化识别处理流程,完成从前台凭证影像的扫描,到后台碎片信息的切割和录入,最终实现整笔业务的提交。其中,针对交易信息的录入,主要通过交易凭证影像切割后相关碎片的人工录入实现。
发明人在实现本公开构思的过程中发现,随着金融产品的不断推陈出新,消费者对个性化金融服务、金融产品需求的不断提高,碎片化录入流程下手工录入业务量已呈现爆发式增长,对人力成本的占用极大,仅依赖单一的碎片化录入流程导致的交易信息差错现象也与日俱增,亟需通过先进的技术手段,在降低手工处理业务量的同时,进一步提高业务办理精度。
发明内容
鉴于上述问题,本公开提供了信息处理方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种信息处理方法,包括:响应于接收到信息表单,确定基于所述信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息;根据所述目标字段属性信息类别的字段信息在每个所述候选字段来源信息下的信息录入准确率,从所述至少一个候选字段来源信息中确定与所述目标字段属性信息相对应的目标字段来源信息;以及根据所述目标字段来源信息,从所述信息表单中确定所述目标字段的录入信息。
本公开的第二方面提供了一种信息处理装置,包括:第一确定模块,用于响应于接收到信息表单,确定基于所述信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息;第二确定模块,用于根据所述目标字段属性信息类别的字段信息在每个所述候选字段来源信息下的信息录入准确率,从所述至少一个候选字段来源信息中确定与所述目标字段属性信息相对应的目标字段来源信息;以及第三确定模块,用于根据所述目标字段来源信息,从所述信息表单中确定所述目标字段的录入信息。
本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述信息处理方法。
本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述信息处理方法。
本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述信息处理方法。
根据本公开提供的信息处理方法、装置、设备、介质和程序产品,通过响应于接收到信息表单,确定基于信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息;根据目标字段属性信息类别的字段信息在每个候选字段来源信息下的信息录入准确率,从至少一个候选字段来源信息中确定与目标字段属性信息相对应的目标字段来源信息;以及根据目标字段来源信息,从信息表单中确定目标字段的录入信息。通过在考虑目标字段属性信息的基础上,结合候选字段来源信息的信息录入准确率确定的目标字段来源信息,从信息表单中确定目标字段的录入信息,构建了多元化的场景识别和处理方案,克服了由碎片录入人员通过手工方式完成信息录入时存在的不足,可以精准、快速的实现信息的智能抓取和自动录入,减轻了作业人员的录入压力,降低了单笔业务的平均处理时间和人力资源投入,进一步提升了信息处理效率。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的信息处理方法的应用场景图;
图2示意性示出了根据本公开实施例的信息处理方法的流程图;
图3示意性示出了根据本公开实施例的通过多元化场景识别处理提升集约运营信息录入效率的整体流程图
图4示意性示出了根据本公开实施例的信息处理装置的结构框图;以及
图5示意性示出了根据本公开实施例的适于实现信息处理方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
在本公开的技术方案中,所涉及的数据(如包括但不限于用户个人信息)的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
本公开的实施例提供了一种信息处理方法、装置、设备、介质和程序产品。该方法包括:响应于接收到信息表单,确定基于信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息。根据目标字段属性信息类别的字段信息在每个候选字段来源信息下的信息录入准确率,从至少一个候选字段来源信息中确定与目标字段属性信息相对应的目标字段来源信息。根据目标字段来源信息,从信息表单中确定目标字段的录入信息。
图1示意性示出了根据本公开实施例的信息处理方法的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括第一终端设备101、第二终端设备102、第三终端设备103、网络104和服务器105。网络104用以在第一终端设备101、第二终端设备102、第三终端设备103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用第一终端设备101、第二终端设备102、第三终端设备103中的至少一个通过网络104与服务器105交互,以接收或发送消息等。第一终端设备101、第二终端设备102、第三终端设备103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
第一终端设备101、第二终端设备102、第三终端设备103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用第一终端设备101、第二终端设备102、第三终端设备103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的信息处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的信息处理装置一般可以设置于服务器105中。本公开实施例所提供的信息处理方法也可以由不同于服务器105且能够与第一终端设备101、第二终端设备102、第三终端设备103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信息处理装置也可以设置于不同于服务器105且能够与第一终端设备101、第二终端设备102、第三终端设备103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
需要说明的是,本公开信息处理方法、信息处理装置、计算机系统、计算机可读存储介质和计算机程序产品可用于大数据、人工智能、物联网等技术领域以及金融领域,也可用于除大数据、人工智能、物联网等技术领域以及金融领域之外的任意领域,本公开信息处理方法、信息处理装置、计算机系统、计算机可读存储介质和计算机程序产品的应用领域不做限定。
以下将基于图1描述的场景,通过图2~图3对公开实施例的信息处理方法进行详细描述。
图2示意性示出了根据本公开实施例的信息处理方法的流程图。
如图2所示,该实施例的信息处理方法包括操作S210~S230。
在操作S210,响应于接收到信息表单,确定基于信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息。
根据本公开的实施例,可以通过在终端设备的相关系统中录入信息,和/或由用户填写纸质信息,通过扫描纸质文件,将相关信息提交到系统中。经由系统对收到的信息进行转化,可以得到信息表单。信息表单中可以包括二维码信息和验印信息。
根据本公开的实施例,目标字段属性信息可以包括如下中的任意之一:数字型字段、文字型字段、日期型字段、勾选型字段等,且可不限于此。数字型字段的输入值可以为阿拉伯数字格式,例如简称N。文字型字段的输入值可以为文本格式,包括中文及其他常用外文,例如简称W。日期型字段的输入值可以为中文日期格式,可以固定为“X年X月X日”(可不限于此),例如简称D。勾选型字段的输入值可以为勾选框加后方选项格式,可以固定为“□XXX”(可不限于此),例如简称K。
根据本公开的实施例,候选字段来源信息可以包括如下中的至少之一:交易赋值、二维码赋值、机器学习赋值、验印赋值、学习库赋值、手工录入等,且可不限于此。交易赋值可以为系统抓取前台工作人员提交的基础业务信息,或抓取外部系统推送业务中自带交易信息下的字段值,例如简称A。二维码赋值可以为系统通过抓取凭证影像中的二维码信息,解析并翻译后输出的字段值,例如简称B。机器学习赋值可以为系统通过抓取凭证影像信息,如针对其中的模糊信息或不清楚、不完整信息,利用机器学习模型识别并输出的具有完整信息的字段值,例如简称C。验印赋值可以为系统抓取电子验印环节中,外部程序校验客户印鉴信息后输出的字段值,例如简称D。学习库赋值可以为系统根据高频调用的业务信息,建立可推荐已有业务信息的学习库,并利用学习库功能识别并输出的字段值,例如简称E。手工录入可以为通过系统推送碎片任务至作业人员后,由作业人员根据碎片影像手工录入的字段值,例如简称F。凭证影像可以包括上述信息表单。
根据本公开的实施例,目标字段可以表征如下中的至少之一:信息表单中目标字段属性信息类别的字段,基于该信息表单中的二维码信息、验印信息等其中至少之一获得的目标字段属性信息类别的字段,与该信息表单相关的基于交易赋值、手工录入等其中至少一种方式录入的字段等,且可不限于此。
根据本公开的实施例,基于上述字段属性和字段来源,例如可以得到如表1所示的多种信息录入场景。
表1:
需要说明的是,表1仅是示意性示出了相关信息录入场景,但可不限于此。在实际业务中,还可以包括其他可能的各类场景,如WB、DB等,以及不限于如上限定的字段属性和字段来源确定的场景等。
在操作S220,根据目标字段属性信息类别的字段信息在每个候选字段来源信息下的信息录入准确率,从至少一个候选字段来源信息中确定与目标字段属性信息相对应的目标字段来源信息。
根据本公开的实施例,候选字段来源信息仅包括一个信息的情况下,可以将该候选字段来源信息确定为候选字段来源信息。在候选字段来源信息包括多个信息的情况下,可以通过计算上述信息录入准确率,确定目标字段来源信息。确定的目标字段来源信息可以为一个或多个。
例如,目标字段属性信息为N,候选字段来源信息包括A、B、C、D。可以首先计算NA、NB、NC、ND各个场景的信息录入准确率。然后,可以将其中准确性较高的一个或多个场景对应的候选字段来源信息确定为目标字段来源信息。
在操作S230,根据目标字段来源信息,从信息表单中确定目标字段的录入信息。
例如,目标字段来源信息为A,可以获取目标字段的交易赋值信息,作为目标字段的录入信息。
例如,目标字段来源信息为C和E,可以首先获取目标字段的机器学习赋值信息和学习库赋值信息。然后,根据机器学习赋值信息和学习库赋值信息,确定目标字段的录入信息。
通过本公开的上述实施例,通过在考虑目标字段属性信息的基础上,结合候选字段来源信息的信息录入准确率确定的目标字段来源信息,从信息表单中确定目标字段的录入信息,构建了多元化的场景识别和处理方案,克服了由碎片录入人员通过手工方式完成信息录入时存在的不足,可以精准、快速的实现信息的智能抓取和自动录入,减轻了作业人员的录入压力,降低了单笔业务的平均处理时间和人力资源投入,进一步提升了信息处理效率。
以下结合具体实施例,对图2所示的方法做进一步说明。
根据本公开的实施例,在执行上述操作S220之前,可以首先根据信息录入场景的识别和分类,确定特定字段属性在不同来源下的信息录入准确率,该方法可以包括:针对每个候选字段来源信息,确定在预设时间段内基于候选字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数。根据总字段数和正确字段数,确定信息录入准确率。
根据本公开的实施例,预设时间段可以包括一天、两天或一个月等,且可不限于此。例如,预设时间段可以为一个月,并可以定义表征信息录入准确率的指标Y1。Y1可以通过公式(1)计算得到,且可不限于此。
Y1=当月录入正确字段数/当月全部字段数 公式(1)
其中,Y1可以表征特定字段属性、特定字段来源对应的信息录入准确率,用于计算Y1的当月录入正确字段数和当月全部字段数可以分别表征在一个月内基于特定候选字段来源信息获得的特定字段属性信息类别的字段信息的总字段数和正确字段数。
根据本公开的实施例,上述根据总字段数和正确字段数,确定信息录入准确率可以包括:根据总字段数和正确字段数,确定预设时间段内的初始准确率。根据多个预设时间段内的多个初始准确率的平均值,确定信息录入准确率。
例如,预设时间段可以为一天,并可以定义表征信息录入准确率的指标Y2。Y2可以通过公式(2)~(3)计算得到,且可不限于此。
X=当日录入正确字段数/当日全部字段数 公式(2)
Y2=AVERAGE(X1、X2、...、X30) 公式(3)
其中,X可以表征特定字段属性、特定字段来源对应的当日信息录入准确率,用于计算X的当日录入正确字段数和当日全部字段数可以分别表征在一天内基于特定候选字段来源信息获得的特定字段属性信息类别的字段信息的总字段数和正确字段数。X1、X2、...、X30分别可以表征最近30天内,每天动态监测的特定字段属性、特定字段来源对应的当日信息录入准确率。Y2可以表征特定字段属性、特定字段来源对应的日信息录入准确率在一个月内的平均值,可用于确定上述信息录入准确率。
根据本公开的实施例,上述操作S220可以包括:将至少一个候选字段来源信息中,信息录入准确率最高的预设数目个候选字段来源信息,确定为目标字段来源信息。
根据本公开的实施例,预设数目可以为1、2或其他数目。例如,预设数目可以为2。可以首先结合公式(1)或公式(2)~(3)计算得到特定字段属性在不同字段来源的信息录入准确率,如可以首先计算得到YA、YB、YC、YD、YE、YF。然后,可以结合例如公式(4),按信息录入准确率由高到低进行排序,并可将排序结果的前两项确定为当前预设时间段(如当日)特定字段属性执行信息采集方案的信息来源,并基于此制定相应场景的信息采集方案。
Z=LAGRE(YA、YB、YC、YD、YE、YF) 公式(4)
Z可以表征特定字段属性下,各字段来源对应按信息录入准确率由高到低排列的集合。
通过本公开的上述实施例,可以结合字段属性信息和字段来源信息,筛选确定信息录入准确率较高的信息获取方式,基于该方式获取并记录信息,可有效提高信息录入效率及准确率。
根据本公开的实施例,目标字段来源信息例如至少包括第一字段来源信息和第二字段来源信息。在结合公式(4)计算得到的指标Z确定特定字段属性下按信息录入准确率由高到低排列的信息来源集合之后,系统可以根据已受理业务中包含的目标字段,按Z指标集合中各信息来源的优先级排序,并自动抓取例如满足目标字段业务特殊性的前两项的字段值。然后,可以针对该两项字段值的一致性进行自动核对,并对核对情况进行信息采集结果确认,以最终确定目标字段的录入信息。
根据本公开的实施例,对应于上述自动核对及确认过程,上述操作S230可以包括:根据第一字段来源信息,从信息表单中确定目标字段的第一信息。根据第二字段来源信息,从信息表单中确定目标字段的第二信息。响应于确定第一信息与第二信息相同,将第一信息或第二信息确定为录入信息。
例如,在确定目标字段来源信息包括第一字段来源信息和第二字段来源信息之后,可以针对信息表单,结合第一字段来源信息和第二字段来源信息执行信息采集方案。然后,可以对采集得到的第一信息和第二信息的一致性进行自动核对,并对该核对情况进行信息采集结果确认。在该过程中,在第一信息与第二信息相同的情况下,系统可以自动确认第一信息和第二信息所表征的字段值为目标字段的最终录入信息。
根据本公开的实施例,上述操作S230还可以包括:响应于确定第一信息和第二信息不同,根据目标字段、第一信息和第二信息,生成待校验任务。将待校验任务发送至校验终端。
例如,在对第一信息和第二信息进行自动核对的过程中,确定第一信息与第二信息不同的情况下,系统可以自动生成目标字段的待校验任务,并可将该待校验任务推送至信息校验终端进行人工处理。信息校验人员可以根据第一信息、第二信息的结果对应的字段值,结合整笔业务的交易信息、凭证影像等进行综合判断后,手工确认第一信息、第二信息的正确性。也可以手工录入人工确认后的其他结果信息,并以此作为目标字段的最终录入信息。
通过本宫安康的上述实施例,通过对第一信息和第二信息进行自动核对,可以提高自动录入效率。
根据本公开的实施例,在基于前述过程确定目标字段的最终录入信息之后,可以结合该最终录入信息联动更新特定字段属性下相关信息来源的准确率,作为下一个预设时间段(如次日)制定信息录入采集方案的基础数据。
根据本公开的实施例,上述至少一个候选字段来源信息可以至少包括第一字段来源信息和第二字段来源信息。上述预设时间段可以包括与生成信息表单的时间相对应的目标预设时间段。对应于前述信息来源准确率更新的过程,上述信息处理方法还可以包括:响应于确定第一信息与第二信息相同,将目标预设时间段内基于第一字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。将目标预设时间段内基于第二字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。
例如,在第一信息与第二信息相同的情况下,可以将第一信息、第二信息各自对应的字段属性下信息来源的“当日录入正确字段数”加1,并可将该字段属性下信息来源的“当日全部字段数”加1。
根据本公开的实施例,上述信息处理方法还可以包括:响应于确定第一信息记录正确,且确定第二信息记录错误,将目标预设时间段内基于第一字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。将目标预设时间段内基于第二字段来源信息获得的目标字段属性信息类别的字段信息的总字段数加一,正确字段数保持不变。
例如,在第一信息与第二信息不同,且经信息校验终端人工确认后,确定其中第一信息正确,第二信息错误的情况下,可以将第一信息对应字段属性下信息来源的“当日录入正确字段数”加1,第二信息对应字段属性下信息来源的“当日录入正确字段数”不变,并可将第一信息、第二信息各自对应的字段属性下信息来源的“当日全部的字段数”加1。
根据本公开的实施例,上述至少一个候选字段来源信息还可以包括第三字段来源信息。上述信息处理方法还可以包括:响应于确定第一信息与第二信息均记录错误,获取对应于目标字段的人工录入信息。响应于确定人工录入信息与第三信息相同,将目标预设时间段内基于第三字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一,第三信息表征根据第三字段来源信息,从信息表单中确定的目标字段的信息。
例如,在第一信息与第二信息不同,且经信息校验终端人工确认后,第一信息和第二信息均错误,并由信息校验人员手工录入其他结果的情况下,可以将手工录入结果与目标字段下除第一信息、第二信息之外外的其他信息来源进行比对,如存在比对结果一致的记录,可以将一致记录对应字段属性下信息来源的“当日录入正确字段数”加1,并可将该字段属性下信息来源的“当日全部字段数”加1。否则该字段属性下信息来源的“当日录入正确字段数”不变。
通过本公开的上述实施例,通过实时更新信息录入准确率,可以进一步提高后续信息录入效率及准确性。
以下结合图3和具体实施例,对通过多元化场景识别处理提升集约运营信息录入效率的整体流程进行详细描述。
图3示意性示出了根据本公开实施例的通过多元化场景识别处理提升集约运营信息录入效率的整体流程图。
如图3所示,该方法包括操作S310~S350。
在操作S310,根据字段属性信息和字段来源信息,识别信息录入场景。
例如,根据生产实际业务情况,目标字段“账号”为数字型(N)字段,该字段对应信息来源有5种,分别为交易带入(A)、二维码赋值(B)、机器学习赋值(C)、验印赋值(D)、手工录入(F),对应的信息录入场景为NA、NB、NC、ND、NF。
在操作S320,根据个信息录入场景的信息录入准确率,制定信息采集方案。
例如,根据生产实时数据的监控和测算:最近30天内,信息录入场景NA、NB、NC、ND、NF对应信息录入准确率的平均值Y分别为97%、93%、96%、85%、92%,由高到低排列分别为NA、NC、NB、NF、ND,则当日数字型(N)字段下Z指标的集合为(NA、NC、NB、NF、ND)。
在操作S330,执行信息采集方案。
例如,根据目标字段“账号”的业务特殊性,该字段的信息来源仅涉及NB、NC、ND、NF场景,系统识别对应的字段值分别为“123”、“234”、“345”、“456”,结合当日Z指标的集合(NA、NC、NB、NF、ND),自动抓取NC(“234”)、NB(“123”)作为第一信息和第二信息的结果。
在操作S340,通过自动核对和手工录入的方式确定信息采集结果,即目标自动的最终录入信息。
例如,对第一信息和第二信息两个结果的字段值的一致性进行自动核对。经核对,第一信息和第二信息的字段值不一致,系统自动生成“账号”字段的待校验任务,并推送至信息校验终端进行人工处理。此时信息校验人员根据第一信息和第二信息对应的字段值,结合整笔业务的交易信息、凭证影像等进行综合判断后,确认两录的字段值均错误,并手工录入“456”作为“账号”字段的最终输出结果进行交易信息的录入。
在操作S350,根据采集得到的正确结果,更新信息录入准确率。
例如,在完成信息采集结果确认后,系统可以联动更新数字型(N)字段下相关信息来源的准确率。其中:NC、NB作为第一信息和第二信息,因字段识别结果均为错误,对应的“当日录入正确字段数”保持不变。NA因“账号”字段的业务特殊性不涉及采集,对应的“当日录入正确字段数”保持不变。ND与信息校验人员手工录入的结果不一致,对应的“当日录入正确字段数”保持不变。NF与信息校验人员手工录入的结果一致,对应的“当日录入正确字段数”加1。同时数字型(N)字段下的二维码赋值(B)、机器学习赋值(C)、验印赋值(D)、手工录入(F)等信息来源的“当日全部字段数”加1。以上更新后数据将作为次日数字型(N)字段制定信息录入采集方案的基础数据。
通过本公开的上述实施例,通过对信息录入场景的智能识别,制定对应信息录入的最优方案,通过系统对信息录入方案的自动执行与核对,实现对不同场景下交易信息手工录入环节的有效替代,同时,通过智能技术的综合判断以及机器学习模型辅助业务开办,进一步提升交易信息录入的处理精度,整体提升金融行业在集约运营模式下的业务处理效率。
基于上述信息处理方法,本公开还提供了一种信息处理装置。以下将结合图4对该装置进行详细描述。
图4示意性示出了根据本公开实施例的信息处理装置的结构框图。
如图4所示,该实施例的信息处理装置400包括第一确定模块410、第二确定模块420和第三确定模块430。
第一确定模块410,用于响应于接收到信息表单,确定基于信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息。在一实施例中,第一确定模块410可以用于执行前文描述的操作S210,在此不再赘述。
第二确定模块420,用于根据目标字段属性信息类别的字段信息在每个候选字段来源信息下的信息录入准确率,从至少一个候选字段来源信息中确定与目标字段属性信息相对应的目标字段来源信息。在一实施例中,第二确定模块420可以用于执行前文描述的操作S220,在此不再赘述。
第三确定模块430,用于根据目标字段来源信息,从信息表单中确定目标字段的录入信息。在一实施例中,第三确定模块430可以用于执行前文描述的操作S230,在此不再赘述。
根据本公开的实施例,第二确定模块包括第一确定单元。
第一确定单元,用于将至少一个候选字段来源信息中,信息录入准确率最高的预设数目个候选字段来源信息,确定为目标字段来源信息。
根据本公开的实施例,目标字段来源信息至少包括第一字段来源信息和第二字段来源信息。第三确定模块包括第二确定单元、第三确定单元和第四确定单元。
第二确定单元,用于根据第一字段来源信息,从信息表单中确定目标字段的第一信息。
第三确定单元,用于根据第二字段来源信息,从信息表单中确定目标字段的第二信息。
第四确定单元,用于响应于确定第一信息与第二信息相同,将第一信息或第二信息确定为录入信息。
根据本公开的实施例,第三确定模块还包括生成单元和发送单元。
生成单元,用于响应于确定第一信息和第二信息不同,根据目标字段、第一信息和第二信息,生成待校验任务。
发送单元,用于将待校验任务发送至校验终端。
根据本公开的实施例,信息采集装置还包括第五确定模块和第六确定模块。
第五确定模块,用于针对每个候选字段来源信息,确定在预设时间段内基于候选字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数。
第六确定模块,用于根据总字段数和正确字段数,确定信息录入准确率。
根据本公开的实施例,第六确定模块包括第五确定单元和第六确定单元。
第五确定单元,用于根据总字段数和正确字段数,确定预设时间段内的初始准确率。
第六确定单元,用于根据多个预设时间段内的多个初始准确率的平均值,确定信息录入准确率。
根据本公开的实施例,至少一个候选字段来源信息至少包括第一字段来源信息和第二字段来源信息,预设时间段包括与生成信息表单的时间相对应的目标预设时间段。信息采集装置还包括第一更新模块和第二更新模块。
第一更新模块,用于响应于确定第一信息与第二信息相同,将目标预设时间段内基于第一字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。
第二更新模块,用于将目标预设时间段内基于第二字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。
根据本公开的实施例,信息采集装置还包括第三更新模块和第四更新模块。
第三更新模块,用于响应于确定第一信息记录正确,且确定第二信息记录错误,将目标预设时间段内基于第一字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。
第四更新模块,用于将目标预设时间段内基于第二字段来源信息获得的目标字段属性信息类别的字段信息的总字段数加一,正确字段数保持不变。
根据本公开的实施例,至少一个候选字段来源信息还包括第三字段来源信息。信息采集装置还包括获取模块和第五更新模块。
获取模块,用于响应于确定第一信息与第二信息均记录错误,获取对应于目标字段的人工录入信息。
第五更新模块,用于响应于确定人工录入信息与第三信息相同,将目标预设时间段内基于第三字段来源信息获得的目标字段属性信息类别的字段信息的总字段数和正确字段数均加一,第三信息表征根据第三字段来源信息,从信息表单中确定的目标字段的信息。
根据本公开的实施例,第一确定模块410、第二确定模块420和第三确定模块430中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一确定模块410、第二确定模块420和第三确定模块430中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一确定模块410、第二确定模块420和第三确定模块430中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图5示意性示出了根据本公开实施例的适于实现信息处理方法的电子设备的方框图。
如图5所示,根据本公开实施例的电子设备500包括处理器501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 503中,存储有电子设备500操作所需的各种程序和数据。处理器501、ROM502以及RAM 503通过总线504彼此相连。处理器501通过执行ROM 502和/或RAM 503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 502和RAM 503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备500还可以包括输入/输出(I/O)接口505,输入/输出(I/O)接口505也连接至总线504。电子设备500还可以包括连接至输入/输出(I/O)接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至输入/输出(I/O)接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 502和/或RAM 503和/或ROM 502和RAM 503以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的物品推荐方法。
在该计算机程序被处理器501执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分509被下载和安装,和/或从可拆卸介质511被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (13)

1.一种信息处理方法,包括:
响应于接收到信息表单,确定基于所述信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息;
根据所述目标字段属性信息类别的字段信息在每个所述候选字段来源信息下的信息录入准确率,从所述至少一个候选字段来源信息中确定与所述目标字段属性信息相对应的目标字段来源信息;以及
根据所述目标字段来源信息,从所述信息表单中确定所述目标字段的录入信息。
2.根据权利要求1所述的方法,其中,所述根据所述目标字段属性信息类别的字段信息在每个所述候选字段来源信息下的信息录入准确率,从所述至少一个候选字段来源信息中确定与所述目标字段属性信息相对应的目标字段来源信息包括:
将所述至少一个候选字段来源信息中,信息录入准确率最高的预设数目个候选字段来源信息,确定为所述目标字段来源信息。
3.根据权利要求1所述的方法,其中,所述目标字段来源信息至少包括第一字段来源信息和第二字段来源信息;所述根据所述目标字段来源信息,从所述信息表单中确定所述目标字段的录入信息包括:
根据所述第一字段来源信息,从所述信息表单中确定所述目标字段的第一信息;
根据所述第二字段来源信息,从所述信息表单中确定所述目标字段的第二信息;以及
响应于确定所述第一信息与所述第二信息相同,将所述第一信息或所述第二信息确定为所述录入信息。
4.根据权利要求3所述的方法,其中,所述根据所述目标字段来源信息,从所述信息表单中确定所述目标字段的录入信息还包括:
响应于确定所述第一信息和所述第二信息不同,根据所述目标字段、所述第一信息和所述第二信息,生成待校验任务;以及
将所述待校验任务发送至校验终端。
5.根据权利要求3或4所述的方法,还包括:在所述根据所述目标字段属性信息类别的字段信息在每个所述候选字段来源信息下的信息录入准确率,从所述至少一个候选字段来源信息中确定与所述目标字段属性信息相对应的目标字段来源信息之前,
针对每个所述候选字段来源信息,确定在预设时间段内基于所述候选字段来源信息获得的所述目标字段属性信息类别的字段信息的总字段数和正确字段数;以及
根据所述总字段数和所述正确字段数,确定所述信息录入准确率。
6.根据权利要求5所述的方法,其中,所述根据所述总字段数和所述正确字段数,确定所述信息录入准确率包括:
根据所述总字段数和所述正确字段数,确定所述预设时间段内的初始准确率;以及
根据多个预设时间段内的多个初始准确率的平均值,确定所述信息录入准确率。
7.根据权利要求5所述的方法,其中,所述至少一个候选字段来源信息至少包括所述第一字段来源信息和所述第二字段来源信息,所述预设时间段包括与生成所述信息表单的时间相对应的目标预设时间段;所述方法还包括:
响应于确定所述第一信息与所述第二信息相同,将所述目标预设时间段内基于所述第一字段来源信息获得的所述目标字段属性信息类别的字段信息的总字段数和正确字段数均加一;以及
将所述目标预设时间段内基于所述第二字段来源信息获得的所述目标字段属性信息类别的字段信息的总字段数和正确字段数均加一。
8.根据权利要求6所述的方法,还包括:
响应于确定所述第一信息记录正确,且确定所述第二信息记录错误,将所述目标预设时间段内基于所述第一字段来源信息获得的所述目标字段属性信息类别的字段信息的总字段数和正确字段数均加一;以及
将所述目标预设时间段内基于所述第二字段来源信息获得的所述目标字段属性信息类别的字段信息的总字段数加一,正确字段数保持不变。
9.根据权利要求6所述的方法,其中,所述至少一个候选字段来源信息还包括第三字段来源信息;所述方法还包括:
响应于确定所述第一信息与所述第二信息均记录错误,获取对应于所述目标字段的人工录入信息;以及
响应于确定所述人工录入信息与第三信息相同,将所述目标预设时间段内基于所述第三字段来源信息获得的所述目标字段属性信息类别的字段信息的总字段数和正确字段数均加一,所述第三信息表征根据所述第三字段来源信息,从所述信息表单中确定的所述目标字段的信息。
10.一种信息处理装置,包括:
第一确定模块,用于响应于接收到信息表单,确定基于所述信息表单获得的目标字段的目标字段属性信息和至少一个候选字段来源信息;
第二确定模块,用于根据所述目标字段属性信息类别的字段信息在每个所述候选字段来源信息下的信息录入准确率,从所述至少一个候选字段来源信息中确定与所述目标字段属性信息相对应的目标字段来源信息;以及
第三确定模块,用于根据所述目标字段来源信息,从所述信息表单中确定所述目标字段的录入信息。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~9中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~9中任一项所述的方法。
CN202310565299.4A 2023-05-18 2023-05-18 信息处理方法、装置、设备及存储介质 Pending CN116610674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310565299.4A CN116610674A (zh) 2023-05-18 2023-05-18 信息处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310565299.4A CN116610674A (zh) 2023-05-18 2023-05-18 信息处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116610674A true CN116610674A (zh) 2023-08-18

Family

ID=87677582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310565299.4A Pending CN116610674A (zh) 2023-05-18 2023-05-18 信息处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116610674A (zh)

Similar Documents

Publication Publication Date Title
CN109344170B (zh) 流数据处理方法、系统、电子设备及可读存储介质
EP3399443A1 (en) Automated assistance for generating relevant and valuable search results for an entity of interest
US20140215301A1 (en) Document template auto discovery
CN112488652A (zh) 工单审核方法、系统、终端和存储介质
CN112445866A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN111651552A (zh) 结构化信息确定方法、装置和电子设备
US20140173422A1 (en) Document template auto discovery
CN115982241A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
CN115422202A (zh) 业务模型的生成方法、业务数据查询方法、装置及设备
CN115471228A (zh) 金融业务凭证检核方法、装置、设备及存储介质
CN116610674A (zh) 信息处理方法、装置、设备及存储介质
US20130300562A1 (en) Generating delivery notification
CN113743692B (zh) 业务风险评估方法、装置、计算机设备和存储介质
CN113918525A (zh) 数据交换调度方法、系统、电子设备、介质及程序产品
US11093899B2 (en) Augmented reality document processing system and method
CN112801688A (zh) 估值失败原因的定位方法和装置
CN112734352A (zh) 一种基于数据维度的单据审核方法和装置
US20220391922A1 (en) Automated docketing checker
CN118096102A (zh) 邮件生成方法、装置、设备、存储介质和程序产品
CN116049508A (zh) 测试要素信息生成方法、装置、设备及存储介质
CN115688687A (zh) 一种数据处理方法、装置、设备及介质
CN118071524A (zh) 产品处理方法、装置、设备、存储介质和程序产品
CN115689263A (zh) 信息生成方法、装置、设备及存储介质
KR101617651B1 (ko) 트랜잭션 에디터를 이용한 이 기종간 데이터 전송 시스템 및 방법
CN116107851A (zh) 仿真测试方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination