CN109670165B - 信息提取方法、装置、设备及存储介质 - Google Patents
信息提取方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109670165B CN109670165B CN201811085897.7A CN201811085897A CN109670165B CN 109670165 B CN109670165 B CN 109670165B CN 201811085897 A CN201811085897 A CN 201811085897A CN 109670165 B CN109670165 B CN 109670165B
- Authority
- CN
- China
- Prior art keywords
- extraction
- information
- target
- template
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 427
- 230000011218 segmentation Effects 0.000 claims abstract description 60
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000002159 abnormal effect Effects 0.000 claims description 27
- 230000005856 abnormality Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 13
- 238000007726 management method Methods 0.000 claims description 12
- 238000012790 confirmation Methods 0.000 claims description 7
- 238000012550 audit Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种信息提取方法、装置、设备及存储介质,即在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息。本发明实现合同信息的自动提取,避免人工提取,提升用户体验,提升提取效率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种信息提取方法、装置、设备及计算机可读存储介质。
背景技术
随着生活水平的提高,银行对接的业务需求也不断增加。每家银行都会有不同条款的合同,且每笔贷款都会需要签署多份合同。为了便于管理合同,工作人员需要根据不同需求人工提取某些合同信息,如合同交易方、履约方式、合同有效期等,从而根据提取的合同信息进行合同数据汇总或者合同查找等管理操作。因此,如何解决现有技术中需要人工提取合同信息的技术问题,成为了目前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种信息提取方法、装置、设备及计算机可读存储介质,旨在解决现有技术中需要人工提取合同信息的技术问题。
为实现上述目的,本发明提供一种信息提取方法,所述信息提取方法包括以下步骤:
在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;
将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;
若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
可选地,所述将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板的步骤包括:
若所述预设提取模板库中不存在所述目标提取模板,则反馈不存在目标提取模板的提醒消息至所述需求方;
在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
可选地,所述在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方的步骤之后,还包括:
获取所述当前提取模板的模板标识,并将所述模板标识和当前提取模板添加至所述预设提取模板库。
可选地,所述在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理的步骤包括:
在接收到所述需求方发送的信息提取指令时,获取所述需求方对应的账号信息,并将所述账号信息和预设权限用户列表进行比对,判断所述需求方是否具有提取权限;
若所述需求方具有所述提取权限,则获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理。
可选地,所述在接收到所述需求方发送的信息提取指令时,获取所述需求方对应的账号信息,并将所述账号信息和预设权限用户列表进行比对,判断所述需求方是否具有提取权限的步骤之后,还包括:
若所述需求方不具有所述提取权限,则生成无提取权限的提醒消息,并将所述提醒消息反馈至所述需求方。
可选地,所述若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方的步骤包括:
若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息;
根据预设信息模板,判断所述目标合同信息是否存在信息异常;
若所述目标合同不存在信息异常,则根据预设审核流程,将所述目标合同信息传送至对应审核节点,以便对应审核人进行审核;
在接收到审核人反馈的确认指令时,则将所述目标合同信息反馈至所述需求方。
可选地,所述根据预设信息模板,判断所述目标合同信息是否存在信息异常的步骤之后,还包括:
若所述目标合同信息存在信息异常,则获取所述目标合同信息中的异常信息,根据所述异常信息生成提取异常提醒消息,并将所述异常提醒消息反馈至预设管理端,以便管理人员进行异常处理。
此外,为实现上述目的,本发明还提供一种信息提取装置,所述信息提取装置包括:
需求获取模块,用于在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;
模板判断模块,用于将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;
信息提取模块,用于若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
此外,为实现上述目的,本发明还提供一种信息提取设备,所述信息提取设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的信息提取程序,其中所述信息提取程序被所述处理器执行时,实现如上述的信息提取方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息提取程序,其中所述信息提取程序被处理器执行时,实现如上述的信息提取方法的步骤。
本发明提供一种信息提取方法,即在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。通过上述方式,本发明通过提供预设提取模板库,并根据提取需求中的需求标识和模板库中各个预设提取模板,实现合同信息的自动提取,避免人工提取,提升用户体验,提升提取效率。
附图说明
图1为本发明实施例方案中涉及的信息提取设备的硬件结构示意图;
图2为本发明信息提取方法第一实施例的流程示意图;
图3为本发明信息提取方法第二实施例的流程示意图;
图4为本发明信息提取方法第三实施例的流程示意图;
图5为本发明信息提取装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的信息提取方法主要应用于信息提取设备,该信息提取设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的信息提取设备的硬件结构示意图。本发明实施例中,信息提取设备可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对信息提取设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及信息提取程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的信息提取程序,并执行本发明实施例提供的信息提取方法。
本发明实施例提供了一种信息提取方法。
参照图2,图2为本发明信息提取方法第一实施例的流程示意图。
本实施例中,所述信息提取方法包括以下步骤:
步骤S10,在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;
目前,为了便于管理合同,工作人员需要根据不同需求人工提取某些合同信息,如合同交易方、履约方式、合同有效期等,从而根据提取的合同信息进行合同数据汇总或者合同查找等管理操作。但是通过人工提取信息,不仅浪费了大量人力,而且容易造成信息填写失误等问题。
本实施例中,为了解决上述问题,提供一种信息提取方法,该信息提取方法应用于信息提取系统,可包括服务器以及安装在终端上的客户端。其中,需求方可通过客户端发送提取指令。服务器在接收到需求方发送的信息提取指令时,可对所述信息提取指令进行解析,以解析出所述信息提取指令中的信息提取需求。其中,所述信息提取需求可以包括合同交易方、交易类型、履约方式、履约计划、履约有效期中其中一种或者多种。该信息提取需求可以是提取关键字或者是定义好提取字段的提取表格等。可根据历史信息提取需求设置预设提取数据库。可以将各个信息提取需求(提取关键字或者提取表格)设置为提取模板,并将各个提取模板存储至所述预设提取数据库中。通过预设提取数据库中的提取模板完成信息提取,避免需求方重复编写提取需求模板,提升用户体验。在确定需求方的信息提取需求时,可根据所述信息提取需求对应的信息标识,在合同数据库中确定待提取合同信息。或者是直接获取所述信息提取需求中的待提取合同信息。其中,所述待提取合同信息为需要进行信息提取的合同信息。在确定待提取合同信息后,为了便于后续的信息提取,通过预设分词工具对所述待提取合同信息进行分词处理。其中,预设分词工具可以是ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System,汉语词法分析系统)、SCWS(Simple Chinese Words Segmentation,简易中文分词系统)或者Paoding(庖丁解牛分词器)。
步骤S20,将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;
本实施例中,可预定义信息提取需求命名规则,该命名规则可以根据提取信息类型,如合同履约方式提取需求、合同交易方提取需求或者合同交易类型、履约有效期提取需求等,命名规则可以为系统预先设定供需求方根据实际需要进行选择。所述需求标识可以是需求名称,还可以是预定义的需求编码,根据该需求标识在预设提取模板库中进行查找比对。若所述预设提取模板库中存在某一提取模板与所述需求标识匹配,或者所述预设提取模板库中存在某几个提取模板与所述需求标识匹配,则获取上述提取模板作为目标提取模板。
步骤S30,若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
本实施例中,若在所述预设提取模板库中确定一提取模板为目标提取模板,则根据所述目标提取模板,如提取关键字或提取表格,在已经进行分词处理后的待提取合同信息中进行信息提取。具体实施例中,若所述信息提取需求对应所述预设提取模板库中的多个提取模板相匹配,则根据上述多个提取模板生成目标提取模板。具体可以是将多个提取关键字进行组合或者将多个提取字段进行组合生成目标提取表格等。更多实施例中,还可以进行提取关键字或者提取字段查重等处理,去除重复提取字段或提取关键字,以提高提取效率。通过目标提取模板在待提取合同信息中进行信息提取需求对应的信息提取,如提取贷款合同的合同交易双方、贷款金额、贷款计划等,可根据目标提取模板首先提取出交易类型为贷款的合同,然后根据合同交易双方对应的关键字或者关键字段,提取出合同交易双方字段后的字词信息,然后依次或者同时根据贷款金额的关键字或者关键字段,提取出贷款金额字段后的字词信息,然后依次或者同时根据贷款计划的关键字或者关键字段,提取出贷款计划字段后的字词信息。由此完成信息提取,并根据上述提取字词信息和关键字或关键字段,生成目标合同信息,并根据所述信息提取指令将所述目标合同信息反馈至需求方。
本实施例提供一种信息提取方法,即在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。通过上述方式,本发明通过提供预设提取模板库,并根据提取需求中的需求标识和模板库中各个预设提取模板,实现合同信息的自动提取,避免人工提取,提升用户体验,提升提取效率。
参照图3,图3为本发明信息提取方法第二实施例的流程示意图。
基于上述图2所示实施例,本实施例中,所述步骤S20之后,还包括:
步骤S40,若所述预设提取模板库中不存在所述目标提取模板,则反馈不存在目标提取模板的提醒消息至所述需求方;
步骤S50,在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
本实施例中,若所述预设提取模板库中的所有提取模板均与所述目标提取模板不相同,即预设提取模板库中的提取模板不符合用户的提取需求。生成对应的提醒消息,如不存在当前需求对应目标提取模板的提醒消息至所述需求方的客户端,以提醒需求方该提取进度。具体实施例中,所述需求方可上传所述提取需求对应的当前提取模板,以便服务器根据所述当前提取模板在分词后的待提取合同信息中提取对应的目标合同信息,并在提取完成后将所述目标合同信息反馈至所述需求方。更多实施例中,服务器可将所述信息提取需求进行解析,获取对应的提取关键字段,并根据所述提取关键字段自动生成对应的目标提取模板,并根据所述目标提取模板完成所述目标合同信息的提取。
进一步地,所述步骤S42之后,还包括:
获取所述当前提取模板的模板标识,并将所述模板标识和当前提取模板添加至所述预设提取模板库。
本实施例中,在接收到所述需求方反馈的当前提取模板时,获取所述模板标识,并将所述模板标识与所述当前提取模板进行关联,然后将所述模板标识与当前提取模板对应添加至所述预设提取模板库中,从而实现所述预设提取模板库的不断更新。
参照图4,图4为本发明信息提取方法第三实施例的流程示意图。
基于上述图3所示实施例,本实施例中,所述步骤S30具体包括:
步骤S31,若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息;
步骤S32,根据预设信息模板,判断所述目标合同信息是否存在信息异常;
步骤S33,若所述目标合同不存在信息异常,则根据预设审核流程,将所述目标合同信息传送至对应审核节点,以便对应审核人进行审核;
步骤S34,在接收到审核人反馈的确认指令时,则将所述目标合同信息反馈至所述需求方。
本实施例中,在完成所述目标合同信息的提取后,可对所述目标合同信息进行格式或者错别字等异常校对。根据预设信息模板,如格式模板或者错别字校对模板等,对所述目标合同信息进行校对,即判断所述目标合同信息是否存在信息异常。若所述目标合同信息中不存在信息异常,则可将所述目标合同信息提交至对应信息审核链中的审核节点,如对应审核人的审核系统,以便对应审核人对所述目标合同信息进行对应的内容审核。若接收到所述审核人反馈的确认指令,即表示所述目标审核信息不存在内容问题,即可将所述目标合同信息反馈至所述需求方,完成提取人物。
进一步地,所述步骤S34之后,还包括:
若所述目标合同信息存在信息异常,则获取所述目标合同信息中的异常信息,根据所述异常信息生成提取异常提醒消息,并将所述异常提醒消息反馈至预设管理端,以便管理人员进行异常处理。
本实施例中,若接收到所述审核人反馈的异常指令时,根据所述审核人指出的异常标识,生成对应的异常提醒,并将所述异常提醒反馈至管理方,以便管理方进行对应的提取模板调整,并重新进行目标合同信息的提取。从而不断提高所述预设提取模板库中提取模板的提取准确度。
进一步地,步骤S10具体包括:
在接收到所述需求方发送的信息提取指令时,获取所述需求方对应的账号信息,并将所述账号信息和预设权限用户列表进行比对,判断所述需求方是否具有提取权限;
若所述需求方具有所述提取权限,则获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理。
若所述需求方不具有所述提取权限,则生成无提取权限的提醒消息,并将所述提醒消息反馈至所述需求方。
本实施例中,为了提升信息安全性,预设根据权限用户信息建立预设权限用户列表,然后将所述需求方的账号与所述预设权限用户列表进行查找匹配,判断所述预设权限用户列表中是否存在US噢书需求方账号,以判断所述需求方是否具有提取权限。若所述需求方具有提取权限,则进行对应的提取操作,若所述需求方不具有提取权限,则生成对应的无提取权限的提醒消息,以提醒所述需求方了解当前提取进度,如当前无提取权限,请优先获取提取权限。
此外,本发明实施例还提供一种信息提取装置。
参照图5,图5为本发明信息提取装置第一实施例的功能模块示意图。
本实施例中,所述信息提取装置包括:
需求获取模块10,用于在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;
模板判断模块20,用于将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;
第一提取模块30,用于若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
进一步地,所述信息提取装置还包括:
第一提醒模块,用于若所述预设提取模板库中不存在所述目标提取模板,则反馈不存在目标提取模板的提醒消息至所述需求方;
第二提取模块,用于在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方。
模板添加模块,用于获取所述当前提取模板的模板标识,并将所述模板标识和当前提取模板添加至所述预设提取模板库。
进一步地,所述第一提取模块30还包括:
第一提取单元,用于若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息;
异常判断单元,用于根据预设信息模板,判断所述目标合同信息是否存在信息异常;
信息审核单元,用于若所述目标合同不存在信息异常,则根据预设审核流程,将所述目标合同信息传送至对应审核节点,以便对应审核人进行审核;
信息确认单元,用于在接收到审核人反馈的确认指令时,则将所述目标合同信息反馈至所述需求方。
异常反馈单元,用于若所述目标合同信息存在信息异常,则获取所述目标合同信息中的异常信息,根据所述异常信息生成提取异常提醒消息,并将所述异常提醒消息反馈至预设管理端,以便管理人员进行异常处理。
进一步地,所述需求获取模块10包括:
权限判断单元,用于在接收到所述需求方发送的信息提取指令时,获取所述需求方对应的账号信息,并将所述账号信息和预设权限用户列表进行比对,判断所述需求方是否具有提取权限;
第二提取单元,用于若所述需求方具有所述提取权限,则获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理。
权限提醒单元,用于若所述需求方不具有所述提取权限,则生成无提取权限的提醒消息,并将所述提醒消息反馈至所述需求方。
其中,上述信息提取装置中各个模块与上述信息提取方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有信息提取程序,其中所述信息提取程序被处理器执行时,实现如上述的信息提取方法的步骤。
其中,信息提取程序被执行时所实现的方法可参照本发明信息提取方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种信息提取方法,其特征在于,所述信息提取方法包括以下步骤:
在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;
将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;
若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方;其中,还可以进行提取关键字或者提取字段查重的处理;
所述将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板的步骤之后,还包括:
若所述预设提取模板库中不存在所述目标提取模板,则反馈不存在目标提取模板的提醒消息至所述需求方;
在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方;
所述在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方的步骤之后,还包括:
获取所述当前提取模板的模板标识,并将所述模板标识和当前提取模板添加至所述预设提取模板库;
所述若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方的步骤包括:
若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息;
根据预设信息模板,判断所述目标合同信息是否存在信息异常;其中,在完成所述目标合同信息的提取后,对所述目标合同信息进行格式或者错别字的异常校对,以判断所述目标合同信息是否存在信息异常;
若所述目标合同不存在信息异常,则根据预设审核流程,将所述目标合同信息传送至对应审核节点,以便对应审核人进行审核;
在接收到审核人反馈的确认指令时,则将所述目标合同信息反馈至所述需求方。
2.如权利要求1所述的信息提取方法,其特征在于,所述在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理的步骤包括:
在接收到所述需求方发送的信息提取指令时,获取所述需求方对应的账号信息,并将所述账号信息和预设权限用户列表进行比对,判断所述需求方是否具有提取权限;
若所述需求方具有所述提取权限,则获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理。
3.如权利要求2所述的信息提取方法,其特征在于,所述在接收到所述需求方发送的信息提取指令时,获取所述需求方对应的账号信息,并将所述账号信息和预设权限用户列表进行比对,判断所述需求方是否具有提取权限的步骤之后,还包括:
若所述需求方不具有所述提取权限,则生成无提取权限的提醒消息,并将所述提醒消息反馈至所述需求方。
4.如权利要求1所述的信息提取方法,其特征在于,所述根据预设信息模板,判断所述目标合同信息是否存在信息异常的步骤之后,还包括:
若所述目标合同信息存在信息异常,则获取所述目标合同信息中的异常信息,根据所述异常信息生成提取异常提醒消息,并将所述异常提醒消息反馈至预设管理端,以便管理人员进行异常处理。
5.一种信息提取装置,其特征在于,所述信息提取装置包括:
需求获取模块,用于在接收到需求方发送的信息提取指令时,获取所述信息提取指令中的信息提取需求,根据所述信息提取需求确定对应的待提取合同信息,并通过预设分词工具将所述待提取合同信息进行分词处理;
模板判断模块,用于将所述信息提取需求对应的需求标识与预设提取模板库进行比对,判断所述预设提取模板库中是否存在与所述信息提取需求匹配的目标提取模板;
信息提取模块,用于若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方;其中,还可以进行提取关键字或者提取字段查重的处理;
所述信息提取装置用于实现:
若所述预设提取模板库中不存在所述目标提取模板,则反馈不存在目标提取模板的提醒消息至所述需求方;
在接收到所述需求方反馈的当前提取模板时,根据所述当前提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息,并将所述目标合同信息反馈至所述需求方;
所述信息提取装置用于实现:
获取所述当前提取模板的模板标识,并将所述模板标识和当前提取模板添加至所述预设提取模板库;
所述信息提取装置用于实现:
若所述预设提取模板库中存在所述目标提取模板,则根据所述目标提取模板,在分词后的待提取合同信息中提取所述信息提取指令对应的目标合同信息;
根据预设信息模板,判断所述目标合同信息是否存在信息异常;其中,在完成所述目标合同信息的提取后,对所述目标合同信息进行格式或者错别字的异常校对,以判断所述目标合同信息是否存在信息异常;
若所述目标合同不存在信息异常,则根据预设审核流程,将所述目标合同信息传送至对应审核节点,以便对应审核人进行审核;
在接收到审核人反馈的确认指令时,则将所述目标合同信息反馈至所述需求方。
6.一种信息提取设备,其特征在于,所述信息提取设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的信息提取程序,其中所述信息提取程序被所述处理器执行时,实现如权利要求1至4中任一项所述的信息提取方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息提取程序,其中所述信息提取程序被处理器执行时,实现如权利要求1至4中任一项所述的信息提取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811085897.7A CN109670165B (zh) | 2018-09-18 | 2018-09-18 | 信息提取方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811085897.7A CN109670165B (zh) | 2018-09-18 | 2018-09-18 | 信息提取方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109670165A CN109670165A (zh) | 2019-04-23 |
CN109670165B true CN109670165B (zh) | 2024-05-07 |
Family
ID=66142418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811085897.7A Active CN109670165B (zh) | 2018-09-18 | 2018-09-18 | 信息提取方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670165B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188165A (zh) * | 2019-04-24 | 2019-08-30 | 平安科技(深圳)有限公司 | 合同模板获取方法、装置、存储介质和计算机设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108182172A (zh) * | 2017-12-07 | 2018-06-19 | 中仁车汇科技发展(深圳)有限公司 | 一种信息提取的方法和设备以及计算机存储介质 |
WO2018149082A1 (zh) * | 2017-02-17 | 2018-08-23 | 平安科技(深圳)有限公司 | 合同生成方法、装置、服务器和存储介质 |
-
2018
- 2018-09-18 CN CN201811085897.7A patent/CN109670165B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018149082A1 (zh) * | 2017-02-17 | 2018-08-23 | 平安科技(深圳)有限公司 | 合同生成方法、装置、服务器和存储介质 |
CN108182172A (zh) * | 2017-12-07 | 2018-06-19 | 中仁车汇科技发展(深圳)有限公司 | 一种信息提取的方法和设备以及计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
一种健康医疗保险格式条款的结构化处理方法;张晶晶 等;智能计算机与应用;第8卷(第3期);第87-90页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109670165A (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111125512B (zh) | 业务推荐处理方法、装置及系统 | |
CN108446341B (zh) | 业务状态查询方法、装置、计算机设备和存储介质 | |
CN108256591B (zh) | 用于输出信息的方法和装置 | |
CN109657216B (zh) | 合同生成方法、装置、设备及存储介质 | |
CN109271410B (zh) | 银行回单的提取方法、装置及计算机可读存储介质 | |
CN109801174B (zh) | 理赔数据处理方法、装置、设备及计算机可读存储介质 | |
CN109726987B (zh) | 事件汇报方法、装置、设备及计算机可读存储介质 | |
US11170214B2 (en) | Method and system for leveraging OCR and machine learning to uncover reuse opportunities from collaboration boards | |
EP3588376A1 (en) | System and method for enrichment of ocr-extracted data | |
CN110704426B (zh) | 数据校验方法、电子装置及计算机可读存储介质 | |
CN109784738B (zh) | 审批方法及审批装置 | |
CN109902095B (zh) | 保单信息更新方法、装置、终端及计算机可读存储介质 | |
CN110689325A (zh) | 信息处理方法、装置及计算机可读存储介质 | |
CN109308346B (zh) | 一种在线图文转换系统 | |
WO2020028373A1 (en) | Electronic document workflow | |
CN114331315A (zh) | 结合rpa和ai的社保业务处理方法及装置 | |
CN112637282A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN109670165B (zh) | 信息提取方法、装置、设备及存储介质 | |
CN109214362B (zh) | 单据处理方法及相关设备 | |
CN110533381B (zh) | 案件管辖权审核方法、装置、计算机设备和存储介质 | |
CN110086826B (zh) | 信息处理方法 | |
CN109241499B (zh) | 一种在线图文转换方法 | |
CN111208999A (zh) | 基于模板的指令生成方法、装置、终端设备和存储介质 | |
CN110727710A (zh) | 数据分析方法、装置、计算机设备和存储介质 | |
CN112069230B (zh) | 数据分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |