CN116955283A - 业务信息查询方法、装置、设备、介质和产品 - Google Patents
业务信息查询方法、装置、设备、介质和产品 Download PDFInfo
- Publication number
- CN116955283A CN116955283A CN202310825973.8A CN202310825973A CN116955283A CN 116955283 A CN116955283 A CN 116955283A CN 202310825973 A CN202310825973 A CN 202310825973A CN 116955283 A CN116955283 A CN 116955283A
- Authority
- CN
- China
- Prior art keywords
- information
- service
- file
- query
- source electronic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012795 verification Methods 0.000 claims abstract description 166
- 238000004590 computer program Methods 0.000 claims abstract description 40
- 238000005516 engineering process Methods 0.000 claims abstract description 28
- 238000012216 screening Methods 0.000 claims abstract description 17
- 238000012015 optical character recognition Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 49
- 238000013145 classification model Methods 0.000 claims description 7
- 230000006698 induction Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004801 process automation Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种业务信息查询方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:接收业务信息查询请求,从文件分类目录中获取与业务信息查询请求相应的目标核销源电子文件;利用光学字符识别技术,对目标核销源电子文件进行文字识别,得到目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从第一业务查询信息中筛选出第二业务查询信息;将第二业务查询信息输入业务系统的查询页面,获得与第二业务查询信息相应的结果信息。本申请提供的方法,能够避免出现信息漏查的风险,从而提高查询准确率。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种业务信息查询方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
近年来,信用卡不良资产呈日渐增长趋势,对信用卡客户进行核销是对信用卡不良资产进行处理的常用手段,在对信用卡客户进行核销之前,需要先对拟核销客户进行客户信息查询、催收记录查询和个贷信息查询。
目前,信用卡客户核销是相关业务人员根据核销清单文件,手工登录贷后管理系统、或全球信贷与代理投资管理系统,进行客户信息查询、催收记录查询和个贷信息查询,但是,由于核销数据体量大、任务紧,这种方法容易漏查信息,难以保证信息查询的准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够保证信息查询准确性的业务信息查询方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种业务信息查询方法,所述方法包括:
接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;
利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;
将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
在其中一个实施例中,所述接收业务信息查询请求之前,还包括:
将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型;
根据所述查询类型,将所述核销源电子文件存储至文件分类目录的相应位置,所述查询类型表征所述核销源电子文件存储的业务查询信息的种类。
在其中一个实施例中,所述将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型之前,还包括:
获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;
基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
在其中一个实施例中,所述将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息之后,还包括:
基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;
将文件类型相同的结果文件合并为同一个文件。
在其中一个实施例中,所述基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中,包括:
判断所述信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将所述文本信息存储至预设格式的文件中。
在其中一个实施例中,所述基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息,包括:
判断是否存在包含所述预设关键字的第一业务查询信息,若存在,则将所述第一业务查询信息确定为第二业务查询信息。
第二方面,本申请还提供了一种业务信息查询装置,所述装置包括:
接收模块,用于接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;
文字识别模块,用于利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;
信息查询模块,用于将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的任意一个实施例中的方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
上述业务信息查询方法、装置、计算机设备、存储介质和计算机程序产品,接收业务信息查询请求,从文件分类目录中获取与业务信息查询请求相应的目标核销源电子文件;利用光学字符识别技术,对目标核销源电子文件进行文字识别,得到目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从第一业务查询信息中筛选出第二业务查询信息;将第二业务查询信息输入业务系统的查询页面,获得与第二业务查询信息相应的结果信息。本申请提供的方法,利用光学字符识别技术,将目标核销源电子文件中所有第一业务查询信息识别出来,从而避免出现信息漏查的风险,提高查询准确率,并利用预设关键字,从第一业务查询信息中筛选出第二业务查询信息,作为最终的查询信息,能够进一步提升查询准确率。
附图说明
图1为一个实施例中业务信息查询方法的应用环境图;
图2为一个实施例中业务信息查询方法的流程示意图;
图3为一个实施例中核销源电子文件存储方法的流程示意图;
图4为一个实施例中业务信息查询装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的业务信息查询方法,可以应用于如图1所示的应用环境中。其中,RPA(Robotic Process Automation,机器人流程自动化)机器人102在接收到业务信息查询请求后,从文件分类目录104中获取与业务信息查询请求相应的目标核销源电子文件,RPA是在人工智能和自动化技术的基础上,依据预先录制的脚本与现有用户系统进行交互,从而完成预期任务的技术。
RPA主要包括三大特性:(1)RPA通过模拟,增强人类与计算机的交互过程,接管了原有工作流程中的人工操作部分,实现全流程的自动化;(2)RPA类似外挂系统,无需改造现有系统,部署在客户桌面环境而不是后台服务器,通过控制引擎,实现大量重复性、具备规则性的工作流程任务自动处理,因此,RPA具有对企业现有系统影响小、基本不编码、实施周期短(一般只有一两周)、以及对非技术的业务人员友好等特性;(3)RPA不仅可以模拟人类,而且可以利用各项AI技术,实现一些传统必须人工处置的自动化操作目标。
在一个实施例中,如图2所示,提供了一种业务信息查询方法,以该方法应用于图1中的RPA机器人为例进行说明,包括以下步骤:
S202、接收业务信息查询请求,从文件分类目录中获取与业务信息查询请求相应的目标核销源电子文件,文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息。
其中,业务信息查询请求是工作人员根据业务需求,在终端输入,并发送至RPA机器人的查询请求,文件分类目录根据核销源电子文件中所存储的业务查询信息的信息种类,分类存储核销源电子文件。在信用卡核销场景中,核销指的是信用卡客户长期不还信用卡欠款,银行会将该信用卡进行销户,业务查询信息指的是与信用卡相关的客户信息,例如,业务查询信息可以包括信用卡客户的个贷查询清单、催收记录查询清单以及客户基本信息,其中,客户基本信息可以包括信用卡归属支行、卡号以及客户证件号码,核销和业务查询信息也可以用于其他业务场景,本申请实施例对此不作具体限定。
S204、利用光学字符识别技术,对目标核销源电子文件进行文字识别,得到目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从第一业务查询信息中筛选出第二业务查询信息。
其中,光学字符识别技术指的是对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,也就是将图像中的文字进行识别,并以文本的形式返回。第一业务查询信息指的是目标核销源电子文件中包含的所有文字信息,预设关键字是与查询业务相关的字词,第二业务查询信息指的是目标核销源电子文件中与查询业务相关的文字信息。对目标核销源电子文件进行文字识别的识别结果中可以包括多种字符,例如,识别结果中可以包括汉字、阿拉伯数字、特殊字符以及标点符号。
S206、将第二业务查询信息输入业务系统的查询页面,获得与第二业务查询信息相应的结果信息。
其中,在信用卡核销场景中,业务系统可以是贷后管理系统、或全球信贷与代理投资管理系统,在其他业务场景中,业务系统也可以是其他的,本申请实施例对此不作具体限定。
具体地,RPA机器人根据预设网址,打开业务系统的登录页面,在登录页面通过模拟键盘操作输入用户账号和登录密码,模拟鼠标点击登录,进入到登录系统中,并基于第二业务查询信息,通过获取网页源代码、所需控件元素标签以及所需控件元素属性,进入到查询页面,最后在查询页面得到结果信息。
上述业务信息查询方法中,接收业务信息查询请求,从文件分类目录中获取与业务信息查询请求相应的目标核销源电子文件;利用光学字符识别技术,对目标核销源电子文件进行文字识别,得到目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从第一业务查询信息中筛选出第二业务查询信息;将第二业务查询信息输入业务系统的查询页面,获得与第二业务查询信息相应的结果信息。本申请提供的方法,利用光学字符识别技术,将目标核销源电子文件中所有第一业务查询信息识别出来,从而避免出现信息漏查的风险,提高查询准确率,并利用预设关键字,从第一业务查询信息中筛选出第二业务查询信息,作为最终的查询信息,能够进一步提升查询准确率。
在一些实施例中,如图3所示,接收业务信息查询请求之前,还包括:
S302、将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型。
其中,文件处理与分类模型可以为卷积神经网络,文件处理与分类模型也可以为其他的,本申请实施例对此不作具体限定。
S304、根据查询类型,将核销源电子文件存储至文件分类目录的相应位置,查询类型表征核销源电子文件存储的业务查询信息的种类。
其中,文件分类目录中的每一个位置都设置有相应的标签,在RPA机器人获取到业务信息查询请求后,直接可以根据标签从文件分类目录中获取相应的核销源电子文件。
本步骤中,基于文件处理与分类模型,将核销源电子文件存储至文件分类目录中,能够有效提高后续从文件分类目录中获取核销源电子文件的效率。
在一些实施例中,将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型之前,还包括:获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
其中,所有历史核销源电子文件都设置有一个分类标签,用于表征所存储的业务查询信息的种类。
本步骤中,利用历史核销源电子文件对初始文件处理与分类模型进行训练,得到预训练的文件处理与分类模型,能够提高后续对核销源电子文件进行分类存储的准确性。
在一些实施例中,将第二业务查询信息输入业务系统的查询页面,获得与第二业务查询信息相应的结果信息之后,还包括:基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;将文件类型相同的结果文件合并为同一个文件。
其中,RPA机器人基于VBA(Visual Basic for Applications),根据信息类型生成相应文件类型的结果文件,并将结果信息存储至生成的结果文件中,例如,文件类型可以为excel类型或者word类型,在信用卡核销场景中,结果文件中存储的结果信息可以包括信用卡归属支行、卡号、客户证件号码、催收登记方式、催收时间、催收情况说明、贷款种类、贷款是否结清、是否逾期、贷款支行以及客户信息截图,在其他业务场景,结果文件也可以存储其他结果信息,本申请实施例对此不作具体限定。
本步骤中,基于信息类型,将结果信息存储至相应的结果文件中,能够提高后续工作人员对结果文件中的结果信息进行查看的效率。
在一些实施例中,基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中,包括:判断信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将文本信息存储至预设格式的文件中。
其中,预设格式可以为word格式,预设格式也可以为其他文件格式,本申请实施例对此不作具体限定。
本步骤中,将信息图像进行处理后再存储至预设格式的文件中,能够提高后续工作人员对结果文件中的结果信息进行查看的效率。
在一些实施例中,基于预设关键字,从第一业务查询信息中筛选出第二业务查询信息,包括:判断是否存在包含预设关键字的第一业务查询信息,若存在,则将第一业务查询信息确定为第二业务查询信息。
其中,若不存在包含预设关键字的第一业务查询信息,说明第一业务查询信息出现错误,则将存储该第一业务查询信息的目标核销源电子文件,从文件分类目录中删除。
本步骤中,通过预设关键字,从第一业务查询信息中确定第二业务查询信息,能够使得后续查询的结果信息更加准确。
在一个实施例中,提供了另一种业务信息查询方法,该方法包括以下内容:
(1)获取、处理、分类信用卡核销组卷源电子文件。
其中,信用卡核销组卷源电子文件包括个贷查询清单、催收记录查询清单、客户信息查询清单,其中,清单中信息有序号、归属支行、卡号、证件号码、客户信息号等,根据实际需要进行设置,本发明实施例不做限定。RPA机器人可以获取信用卡核销组卷源电子文件。
首先将信用卡核销组卷源电子文件输入到文件处理与分类模型中,得到信用卡核销组卷源电子文件的处理和分类结果,然后对分类后的信用卡核销组卷源电子文件进行文字识别,获得待处理操作类型和待处理客户信息的文字识别结果,根据预设关键字从待处理客户信息的文字识别结果中,获得多个字段键值对作为待查询信息。
RPA机器人会对所述信用卡核销组卷源电子文件进行处理和分类整理,将相同分类结果的电子文件存储到同一个分类目录下,可以获得各个分类目录和各个分类目录下的电子文件,并且得到各个文件对应的处理结果,用于查询模块进行不同的信息查询。
在将信用卡核销组卷源电子文件输入到文件处理与分类模型中之前,还包括:获取信用卡核销组卷源电子文件处理和分类训练样本、以及对应的处理和分类标签,基于分类训练样本、对应的分类标签、处理标签以及原始模型,训练获得文件处理与分类模型。
(2)基于信用卡核销组卷源电子文件,获取待处理操作类型和待处理客户信息。
具体地,RPA机器人获取待处理操作类型,并对信用卡核销组卷源电子文件进行文字识别,读取需要在登录贷后管理系统、或全球信贷与代理投资管理系统中进行查询操作的信息,作为查询信息。查询信息包括卡号、证件号码、客户信息号,根据实际需要进行设置,本发明实施例不做限定。
(3)获取当前待处理客户信息,登录贷后管理系统、或者全球信贷与代理投资管理系统,查询对应的客户结果信息。
具体地,RPA机器人在获得待处理客户信息之后,可以登录贷后管理系统、或全球信贷与代理投资管理系统,根据所述待处理客户信息,进入到信息查询页面,查询对应的客户信息结果信息。
例如,RPA机器人根据预设网址,打开贷后管理系统、或全球信贷与代理投资管理系统登录页面,在登录页面通过模拟键盘操作输入用户账号和登录密码,模拟鼠标点击登录,进入到贷后管理系统或全球信贷与代理投资管理系统中。根据所述待处理客户信息,通过获取网页源代码和所需控件元素标签、属性等,进入到所述信息查询页面。
(4)基于查询的客户结果信息,生成结果信息文件,并根据文件类型合并结果信息文件。
具体地,RPA机器人结合VBA、图像识别技术基于查询结果信息,判断结果文件类型并生成对应的结果文件,其中,结果文件包含序号、归属支行、卡号、证件号码、客户信息号、催收登记方式、催收时间、催收情况说明、贷款种类、是否结清、是否逾期、贷款支行等信息以及客户信息截图,根据实际需要进行设置,本发明实施例不做限定。
RPA机器人结合VBA基于所述人信用卡核销组卷源电子文件和生成的结果信息文件,判断结果文件类型和是否需要进行合并,对于需要合并的结果文件进行合并操作。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的业务信息查询方法的业务信息查询装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个业务信息查询装置实施例中的具体限定可以参见上文中对于业务信息查询方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种业务信息查询装置400,包括:接收模块401、文字识别模块402和信息查询模块403,其中:
接收模块401,用于接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息。
其中,业务信息查询请求是工作人员根据业务需求,在终端输入,并发送至RPA机器人的查询请求,文件分类目录根据核销源电子文件中所存储的业务查询信息的信息种类,分类存储核销源电子文件。在信用卡核销场景中,核销指的是信用卡客户长期不还信用卡欠款,银行会将该信用卡进行销户,业务查询信息指的是与信用卡相关的客户信息,例如,业务查询信息可以包括信用卡客户的个贷查询清单、催收记录查询清单以及客户基本信息,其中,客户基本信息可以包括信用卡归属支行、卡号以及客户证件号码,核销和业务查询信息也可以用于其他业务场景,本申请实施例对此不作具体限定。
文字识别模块402,用于利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息。
其中,光学字符识别技术指的是对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,也就是将图像中的文字进行识别,并以文本的形式返回。第一业务查询信息指的是目标核销源电子文件中包含的所有文字信息,预设关键字是与查询业务相关的字词,第二业务查询信息指的是目标核销源电子文件中与查询业务相关的文字信息。对目标核销源电子文件进行文字识别的识别结果中可以包括多种字符,例如,识别结果中可以包括汉字、阿拉伯数字、特殊字符以及标点符号。
信息查询模块403,用于将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
其中,在信用卡核销场景中,业务系统可以是贷后管理系统、或全球信贷与代理投资管理系统,在其他业务场景中,业务系统也可以是其他的,本申请实施例对此不作具体限定。
具体地,RPA机器人根据预设网址,打开业务系统的登录页面,在登录页面通过模拟键盘操作输入用户账号和登录密码,模拟鼠标点击登录,进入到登录系统中,并基于第二业务查询信息,通过获取网页源代码、所需控件元素标签以及所需控件元素属性,进入到查询页面,最后在查询页面得到结果信息。
在一些实施例中,业务信息查询装置400,具体用于:将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型;根据所述查询类型,将所述核销源电子文件存储至文件分类目录的相应位置,所述查询类型表征所述核销源电子文件存储的业务查询信息的种类。
其中,文件处理与分类模型可以为卷积神经网络,文件处理与分类模型也可以为其他的,本申请实施例对此不作具体限定。文件分类目录中的每一个位置都设置有相应的标签,在RPA机器人获取到业务信息查询请求后,直接可以根据标签从文件分类目录中获取相应的核销源电子文件。
在一些实施例中,业务信息查询装置400,还用于:获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
其中,所有历史核销源电子文件都设置有一个分类标签,用于表征所存储的业务查询信息的种类。
在一些实施例中,业务信息查询装置400,还用于:基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;将文件类型相同的结果文件合并为同一个文件。
其中,RPA机器人基于VBA(Visual Basic for Applications),根据信息类型生成相应文件类型的结果文件,并将结果信息存储至生成的结果文件中,例如,文件类型可以为excel类型或者word类型,在信用卡核销场景中,结果文件中存储的结果信息可以包括信用卡归属支行、卡号、客户证件号码、催收登记方式、催收时间、催收情况说明、贷款种类、贷款是否结清、是否逾期、贷款支行以及客户信息截图,在其他业务场景,结果文件也可以存储其他结果信息,本申请实施例对此不作具体限定。
在一些实施例中,业务信息查询装置400,还用于:判断所述信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将所述文本信息存储至预设格式的文件中。
其中,预设格式可以为word格式,预设格式也可以为其他文件格式,本申请实施例对此不作具体限定。
在一些实施例中,文字识别模块402,还用于:判断是否存在包含所述预设关键字的第一业务查询信息,若存在,则将所述第一业务查询信息确定为第二业务查询信息。
其中,若不存在包含预设关键字的第一业务查询信息,说明第一业务查询信息出现错误,则将存储该第一业务查询信息的目标核销源电子文件,从文件分类目录中删除。
上述业务信息查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储业务数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务信息查询方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
在一个实施例中,处理器执行计算机程序时所实现的接收业务信息查询请求之前,还包括:将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型;根据所述查询类型,将所述核销源电子文件存储至文件分类目录的相应位置,所述查询类型表征所述核销源电子文件存储的业务查询信息的种类。
在一个实施例中,处理器执行计算机程序时所实现的将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型之前,还包括:获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
在一个实施例中,处理器执行计算机程序时所实现的将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息之后,还包括:基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;将文件类型相同的结果文件合并为同一个文件。
在一个实施例中,处理器执行计算机程序时所实现的基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中,包括:判断所述信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将所述文本信息存储至预设格式的文件中。
在一个实施例中,处理器执行计算机程序时所实现的基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息,包括:判断是否存在包含所述预设关键字的第一业务查询信息,若存在,则将所述第一业务查询信息确定为第二业务查询信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
在一个实施例中,计算机程序被处理器执行时所实现的接收业务信息查询请求之前,还包括:将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型;根据所述查询类型,将所述核销源电子文件存储至文件分类目录的相应位置,所述查询类型表征所述核销源电子文件存储的业务查询信息的种类。
在一个实施例中,计算机程序被处理器执行时所实现的将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型之前,还包括:获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
在一个实施例中,计算机程序被处理器执行时所实现的将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息之后,还包括:基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;将文件类型相同的结果文件合并为同一个文件。
在一个实施例中,计算机程序被处理器执行时所实现的基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中,包括:判断所述信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将所述文本信息存储至预设格式的文件中。
在一个实施例中,计算机程序被处理器执行时所实现的基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息,包括:判断是否存在包含所述预设关键字的第一业务查询信息,若存在,则将所述第一业务查询信息确定为第二业务查询信息。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
在一个实施例中,计算机程序被处理器执行时所实现的接收业务信息查询请求之前,还包括:将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型;根据所述查询类型,将所述核销源电子文件存储至文件分类目录的相应位置,所述查询类型表征所述核销源电子文件存储的业务查询信息的种类。
在一个实施例中,计算机程序被处理器执行时所实现的将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型之前,还包括:获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
在一个实施例中,计算机程序被处理器执行时所实现的将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息之后,还包括:基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;将文件类型相同的结果文件合并为同一个文件。
在一个实施例中,计算机程序被处理器执行时所实现的基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中,包括:判断所述信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将所述文本信息存储至预设格式的文件中。
在一个实施例中,计算机程序被处理器执行时所实现的基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息,包括:判断是否存在包含所述预设关键字的第一业务查询信息,若存在,则将所述第一业务查询信息确定为第二业务查询信息。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种业务信息查询方法,其特征在于,所述方法包括:
接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;
利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;
将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
2.根据权利要求1所述的方法,其特征在于,所述接收业务信息查询请求之前,还包括:
将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型;
根据所述查询类型,将所述核销源电子文件存储至文件分类目录的相应位置,所述查询类型表征所述核销源电子文件存储的业务查询信息的种类。
3.根据权利要求2所述的方法,其特征在于,所述将多个核销源电子文件输入预训练的文件处理与分类模型,确定每个核销源电子文件的查询类型之前,还包括:
获取多个历史核销源电子文件,将所有历史核销源电子文件的分辨率和文件字段格式分别设置为预设分辨率和预设文件字段格式;
基于分辨率和文件字段格式的设置结果,将所有历史核销源电子文件输入初始文件处理与分类模型,得到预训练的文件处理与分类模型。
4.根据权利要求1所述的方法,其特征在于,所述将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息之后,还包括:
基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中;
将文件类型相同的结果文件合并为同一个文件。
5.根据权利要求4所述的方法,其特征在于,所述基于每个结果信息对应的信息类型,将结果信息存储至相应文件类型的结果文件中,包括:
判断所述信息类型是否为信息图像,若是,则利用图像识别技术从信息图像中识别出相应的文本信息,并将所述文本信息存储至预设格式的文件中。
6.根据权利要求1所述的方法,其特征在于,所述基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息,包括:
判断是否存在包含所述预设关键字的第一业务查询信息,若存在,则将所述第一业务查询信息确定为第二业务查询信息。
7.一种业务信息查询装置,其特征在于,所述装置包括:
接收模块,用于接收业务信息查询请求,从文件分类目录中获取与所述业务信息查询请求相应的目标核销源电子文件,所述文件分类目录中存储有多个核销源电子文件,每个核销源电子文件存储有至少一种业务查询信息;
文字识别模块,用于利用光学字符识别技术,对所述目标核销源电子文件进行文字识别,得到所述目标核销源电子文件存储的第一业务查询信息,并基于预设关键字,从所述第一业务查询信息中筛选出第二业务查询信息;
信息查询模块,用于将所述第二业务查询信息输入业务系统的查询页面,获得与所述第二业务查询信息相应的结果信息。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310825973.8A CN116955283A (zh) | 2023-07-06 | 2023-07-06 | 业务信息查询方法、装置、设备、介质和产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310825973.8A CN116955283A (zh) | 2023-07-06 | 2023-07-06 | 业务信息查询方法、装置、设备、介质和产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116955283A true CN116955283A (zh) | 2023-10-27 |
Family
ID=88445473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310825973.8A Pending CN116955283A (zh) | 2023-07-06 | 2023-07-06 | 业务信息查询方法、装置、设备、介质和产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955283A (zh) |
-
2023
- 2023-07-06 CN CN202310825973.8A patent/CN116955283A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111309759A (zh) | 企业科技项目智能匹配平台 | |
CN113377936B (zh) | 智能问答方法、装置及设备 | |
CN112990281A (zh) | 异常投标识别模型训练方法、异常投标识别方法及装置 | |
CN113868498A (zh) | 数据存储方法、电子装置、装置及可读存储介质 | |
CN112434884A (zh) | 一种供应商分类画像的建立方法及装置 | |
CN113868419B (zh) | 基于人工智能的文本分类方法、装置、设备及介质 | |
CN111444368B (zh) | 构建用户画像的方法、装置、计算机设备及存储介质 | |
US20220405235A1 (en) | System and method for reference dataset management | |
CN116955283A (zh) | 业务信息查询方法、装置、设备、介质和产品 | |
CN113901817A (zh) | 文档分类方法、装置、计算机设备和存储介质 | |
CN111027296A (zh) | 基于知识库的报表生成方法及系统 | |
CN112418260A (zh) | 模型训练方法、信息提示方法、装置、设备及介质 | |
CN117058432B (zh) | 图像查重方法、装置、电子设备及可读存储介质 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 | |
CN115049470A (zh) | 数据处理方法、装置、计算机设备、存储介质和程序产品 | |
CN118172021A (zh) | 审批文本的处理方法、装置、计算机设备和存储介质 | |
CN116862695A (zh) | 数据核算管理系统、方法、存储介质、电子设备 | |
CN117725196A (zh) | 一种根据企业信息进行项目推荐的方法及系统 | |
CN116561247A (zh) | 风险预警方法、装置、计算机设备和存储介质 | |
CN118037458A (zh) | 业务请求的处理方法、装置、计算机设备和存储介质 | |
CN115033483A (zh) | 测试用例增强方法、装置、计算机设备及存储介质 | |
CN117829774A (zh) | 报名数据的处理方法、装置、服务器及存储介质 | |
CN117725931A (zh) | 一种公司名称识别方法及系统 | |
Manikandan et al. | A Document Imaging Technique for Implementing Electronic Loan Approval Process | |
CN115689477A (zh) | 业务方案生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |