CN108171600A - 征信报告解析方法、服务器及存储介质 - Google Patents

征信报告解析方法、服务器及存储介质 Download PDF

Info

Publication number
CN108171600A
CN108171600A CN201810053224.7A CN201810053224A CN108171600A CN 108171600 A CN108171600 A CN 108171600A CN 201810053224 A CN201810053224 A CN 201810053224A CN 108171600 A CN108171600 A CN 108171600A
Authority
CN
China
Prior art keywords
target
report
analytical model
modell analytical
analytic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810053224.7A
Other languages
English (en)
Inventor
张天生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qianhai Shenzhen Nationwide Financial Services Inc
Original Assignee
Qianhai Shenzhen Nationwide Financial Services Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qianhai Shenzhen Nationwide Financial Services Inc filed Critical Qianhai Shenzhen Nationwide Financial Services Inc
Priority to CN201810053224.7A priority Critical patent/CN108171600A/zh
Publication of CN108171600A publication Critical patent/CN108171600A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers

Abstract

本发明公开了一种征信报告解析方法、服务器及存储介质。所述征信报告解析方法包括:服务器响应于征信报告查询指令,获取目标征信报告;从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。本发明中通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。

Description

征信报告解析方法、服务器及存储介质
技术领域
本发明涉及金融业信贷技术领域,尤其涉及征信报告解析方法、服务器及存储介质。
背景技术
金融业信贷业务,对于客户征信报告有强相关依赖要求,人行征信报告具有统一、全面及权威等方面的重要意义,所以各贷款业务均使用征信报告进行风险评估,以科学及安全可控的开展业务。由于征信报告的重要性,各金融机构均会成立独立的征信系统,获取、解析和存储征信数据,以便重用、把控、精细化分析以及输入风险评估决策系统。在征信系统中,其重要模块在于报告解析,具体体现为:征信报告样式多样:银行版WORD、超级文本标记语言(Hyper Text Markup Language,HTML)及便携式文档格式(Portable DocumentFormat,PDF)格式,个人版WORD、HTML及PDF格式,个人版一页双版格式等;各银行特有的征信数据,格式定义各不相同,如:JavaScript对象标记语言(JavaScript Object Notation,JSON)、可扩展标记语言(Extensible Markup Language,XML)、WORD、数据传输对象(DataTransfer Object,DTO)或HTML等不同文档结构;人行、银行及金融机构,均不断丰富模板内容。如何高效灵活应对各式各样的征信报告格式从而获取到用户信息是亟待解决的技术问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供征信报告解析方法、服务器及存储介质,旨在解决如何高效灵活应对各式各样的征信报告格式从而获取到用户信息的技术问题。
为实现上述目的,本发明提供一种征信报告解析方法,所述征信报告解析方法包括以下步骤:
服务器响应于征信报告查询指令,获取目标征信报告;
从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;
根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。
优选地,所述根据所述目标文档结构类型确定目标解析模型,具体包括:
从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。
优选地,所述响应于征信报告查询指令,获取目标征信报告之前,所述征信报告解析方法还包括:
获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。
优选地,所述为各文档结构类型分别建立对应的解析模型,具体包括:
分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。
优选地,所述根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息,具体包括:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。
优选地,所述调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息,具体包括:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径遍历所述目标征信报告,将遍历到的标题作为目标标题进行定位,根据所述目标标题查找目标内容,对所述目标内容进行萃取,获得用户信息。
优选地,所述根据所述目标标题查找目标内容,具体包括:
根据所述目标标题通过所述目标解析模型中的预设匹配函数查找目标内容。
优选地,所述对所述目标内容进行萃取,获得用户信息,具体包括:
通过所述目标解析模型中的预设解析器,递归萃取所述目标内容,获得用户信息。
此外,为实现上述目的,本发明还提供一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的征信报告解析程序,所述征信报告解析程序配置为实现如上文所述征信报告解析方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有征信报告解析程序,所述征信报告解析程序被处理器执行时实现如上文所述的征信报告解析方法的步骤。
本发明中通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。
附图说明
图1是本发明征信报告解析方法实施例方案涉及的硬件运行环境的服务器结构示意图;
图2为本发明征信报告解析方法第一实施例的流程示意图;
图3为本发明征信报告解析方法第二实施例的流程示意图;
图4为本发明征信报告解析方法第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的服务器结构示意图。
如图1所示,该服务器可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本发明中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及征信报告解析程序。
在图1所示的服务器中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接外设;所述服务器通过处理器1001调用存储器1005中存储的征信报告解析程序,并执行以下操作:
响应于征信报告查询指令,获取目标征信报告;
从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;
根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径遍历所述目标征信报告,将遍历到的标题作为目标标题进行定位,根据所述目标标题查找目标内容,对所述目标内容进行萃取,获得用户信息。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
根据所述目标标题通过所述目标解析模型中的预设匹配函数查找目标内容。
进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:
通过所述目标解析模型中的预设解析器,递归萃取所述目标内容,获得用户信息。
本实施例通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。
基于上述硬件结构,提出本发明征信报告解析方法的实施例。
参照图2,图2为本发明征信报告解析方法第一实施例的流程示意图,提出本发明征信报告解析方法第一实施例。
在第一实施例中,所述征信报告解析方法包括以下步骤:
步骤S10,服务器响应于征信报告查询指令,获取目标征信报告;
应理解的是,服务器响应于征信报告查询指令,可通过征信报告查询服务获取目标征信报告,征信报告查询服务与解析服务可以独立部署,其交互可通过微服务消息总线通知。
步骤S20,从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;
可理解的是,通常征信报告的文档结构类型包括:JSON、XML、PDF、WORD、DTO及HTML等,针对不同的文档结构类型需要用到不同的Xpath路径表达式,从而确定文档中目标内容的位置,XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,有不同类型的节点,包括元素节点,属性节点和文本节点,提供在数据结构树中找寻节点的能力。因此针对不同的文档结构类型分别建立对应的解析模型,调用与所述目标征信报告的目标文档结构类型对应的目标解析模型可以对所述目标征信报告进行快速解析。虽然对于相同文档结构类型可能存在多个格式的征信报告,比如JSON结构类型的征信报告包括个人版及银行版等,但是可以使用相同的JSON解析模型对个人版及银行版的JSON结构类型的征信报告进行解析。
在具体实现中,通常针对不同的文档结构类型分别建立对应的解析模型,将建立的各种解析模型与对应的文档结构类型预先按照映射关系进行存储,在确定了所述目标征信报告的目标文档结构类型时,直接从预先建立的映射关系表中获取对应的目标解析模型,本实施例中,所述根据所述目标文档结构类型确定目标解析模型,具体包括:从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。
可理解的是,通常征信报告解析方法可基于征信报告解析系统,所述系统可以包括征信报告查询模块及征信报告解析模块,每一个解析模型可以为一个微服务单元,征信报告解析模块可以是所述征信报告解析系统的统筹单元,还可以负责对外应用程序编程接口(Application Programming Interface,API)及柜面系统调用等,所有解析模型都从属所述征信报告解析模块。
步骤S30,根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。
应理解的是,获取到与所述目标征信报告的目标文档结构类型对应的目标解析模型,则根据所述目标解析模型可以高效地对所述目标征信报告进行解析。整体解析时间均在秒级,例如:JSON、XML结构文档表现最快,其节点简单,结构清晰易于建立模型;WORD结构文档相对复杂,同时需要结合自定义解析器以支持XPath语言的解析模型,通常耗时控制在500ms内;HTML结构文档,其标签语言最为复杂,数量繁多,通常平均解析耗时3.5s。根据不同结构文档建立不同解析模型,在实际使用中,模型支持良好,解析时效能满足业务需求。
需要说明的是,所述用户信息通常包括用户姓名、身份证信息、配偶信息及通讯地址等信息,可将解析获得的用户信息发送出去,给需要的服务提供数据服务,如征信存储服务或评分服务等。
本实施例中,通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。
参照图3,图3为本发明征信报告解析方法第二实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明征信报告解析方法的第二实施例。
在第二实施例中,所述步骤S10之前,还包括:
步骤S01,获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。
可理解的是,征信报告的文档结构类型多变,个人版或银行版等风格各异的格式版本,使得解析耗费较多时间,为了高效地对各种版本的征信报告进行解析,可预先获取多种不同的文档结构类型,可通过征信报告查询服务获取多种不同的文档结构类型的征信报告,针对不同的文档结构类型建立对应的Xpath路径的表达式,通过与文档结构类型对应的Xpath路径的表达式,能够绝对及相对的实现内容定位,从而快速解析文件内容。
应理解的是,通常征信报告的文档结构类型包括:JSON、XML、WORD、DTO及HTML等,针对不同的文档结构类型需要用到不同的Xpath路径表达式,因为底层实现不同,标签属性也不同,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型,对于相同文档结构类型可能存在多个格式的征信报告,比如HTML结构类型的征信报告包括个人版及银行版等,可以使用相同的HTML解析模型对个人版及银行版的HTML结构类型的征信报告进行解析。同时,所述服务器提供自定义接口,如果出现新的文档结构类型,但目前API未提供对应文档结构类型的XPath访问的,均可以自定义XPath语法,建立新的对应的解析模型,再调用新的解析模型对新的文档结构类型进行解析。本实施例中,所述步骤步骤S01,具体包括:获取多种不同的文档结构类型,分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。
需要说明的是,现有技术中,文档结构类型JSON、XML、DTO及HTML都支持Xpath路径语言,WORD文档结构类型不支持Xpath路径语言,可以根据WORD文档的结构自定义一套Xpath路径表达式,使得其支持WORD文档结构,再结合WORD文档支持的解析器,建立解析模型。
本实施例中,引入XPath技术,结合文档结构类型建立模型,通过XML语言建立模型,支持绝对、相对内容定位,快速解析文件内容。对于传统不可配置的硬编码解析文件内容而言,适用性、灵活性及兼容性更广,更具有拓展性。
参照图4,图4为本发明征信报告解析方法第三实施例的流程示意图,基于上述图3所示的第二实施例,提出本发明征信报告解析方法的第三实施例。
在第三实施例中,所述步骤S30,具体包括:
步骤S301,调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。
在具体实现中,预先建立与各文档结构类型对应的各解析模型,对目标征信报告进行解析时,从所述目标征信报告提取目标文档结构类型,调用与所述目标文档结构类型对应的目标解析模型,所述目标解析模型中包括与目标文档结构类型对应的Xpath路径的表达式,根据Xpath路径的表达式萃取目标征信报告的文档内容,从而获得目标征信报告中的用户信息,可将萃取出的用户信息复制到预设的固定模板中,发送至征信存储服务或评分服务等其他服务模块,为其他服务模块提供用户信息。
应理解的是,所述用户信息通常包括用户姓名、身份证信息、配偶信息及通讯地址等信息,所述用户信息可能在所述目标征信报告的文档中的不同位置,为了将所述目标征信报告中的所有用户信息都萃取出来,通常采用遍历文档的方式,通过与目标文档结构类型对应的Xpath路径的表达式对所述目标征信报告进行遍历,通常目标征信报告中包括多个标题,与标题对应的内容为用户对应的信息,可将遍历文档时遍历到的标题,作为目标标题,通过所述目标标题匹配目标区域,对所述目标区域进行内容萃取,所述目标征信报告遍历结束,则对应的用户信息都被萃取出来,如果根据所述目标标题未找到所述目标区域,则目标征信报告中没有与所述目标标题对应的内容。本实施例中,所述步骤S301,具体包括:调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径遍历所述目标征信报告,将遍历到的标题作为目标标题进行定位,根据所述目标标题查找目标内容,对所述目标内容进行萃取,获得用户信息。
需要说明的是,在所述目标征信报告中通过所述Xpath路径的表达式定位到目标标题,可通过预设匹配函数找到与所述目标标题对应的目标内容,比如:预设匹配函数F(Xpath)=content,本实施例中,所述根据所述目标标题查找目标内容,具体包括:根据所述目标标题通过所述目标解析模型中的预设匹配函数查找目标内容。
可理解的是,内容萃取一般通过相对坐标(Xpath,Xpath')获取,函数F(Xpath,Xpath')=contents即为取到相应位置的文档内容,获得所述用户信息。在萃取所述目标征信报告的文档内容时,可通过与所述目标文档结构类型对应的预设解析器,递归抓取文档内容,直至文档遍历结束,获得所述用户信息,本实施例中,所述对所述目标内容进行萃取,获得用户信息,具体包括:通过所述目标解析模型中的预设解析器,递归萃取所述目标内容,获得用户信息。
本实施例中,通过调用与目标征信报告的目标文档结构类型对应的目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息,根据不同结构文档的不同解析模型中的对应的Xpath路径实现快速解析所述目标征信报告,在实际使用中,各解析模型支持良好,提高了各文档结构类型的征信报告的解析时效,能满足各种业务需求。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有征信报告解析程序,所述征信报告解析程序被处理器执行时实现如下操作:
响应于征信报告查询指令,获取目标征信报告;
从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;
根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径遍历所述目标征信报告,将遍历到的标题作为目标标题进行定位,根据所述目标标题查找目标内容,对所述目标内容进行萃取,获得用户信息。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
根据所述目标标题通过所述目标解析模型中的预设匹配函数查找目标内容。
进一步地,所述征信报告解析程序被处理器执行时还实现如下操作:
通过所述目标解析模型中的预设解析器,递归萃取所述目标内容,获得用户信息。
本实施例中,通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种征信报告解析方法,其特征在于,所述征信报告解析方法包括以下步骤:
服务器响应于征信报告查询指令,获取目标征信报告;
从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;
根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。
2.如权利要求1所述的征信报告解析方法,其特征在于,所述根据所述目标文档结构类型确定目标解析模型,具体包括:
从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。
3.如权利要求2所述的征信报告解析方法,其特征在于,所述响应于征信报告查询指令,获取目标征信报告之前,所述征信报告解析方法还包括:
获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。
4.如权利要求3所述的征信报告解析方法,其特征在于,所述为各文档结构类型分别建立对应的解析模型,具体包括:
分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。
5.如权利要求4所述的征信报告解析方法,其特征在于,所述根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息,具体包括:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。
6.如权利要求5所述的征信报告解析方法,其特征在于,所述调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息,具体包括:
调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径遍历所述目标征信报告,将遍历到的标题作为目标标题进行定位,根据所述目标标题查找目标内容,对所述目标内容进行萃取,获得用户信息。
7.如权利要求6所述的征信报告解析方法,其特征在于,所述根据所述目标标题查找目标内容,具体包括:
根据所述目标标题通过所述目标解析模型中的预设匹配函数查找目标内容。
8.如权利要求7所述的征信报告解析方法,其特征在于,所述对所述目标内容进行萃取,获得用户信息,具体包括:
通过所述目标解析模型中的预设解析器,递归萃取所述目标内容,获得用户信息。
9.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的征信报告解析程序,所述征信报告解析程序配置为实现如权利要求1至8中任一项所述的征信报告解析的方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有征信报告解析程序,所述征信报告解析程序被处理器执行时实现如权利要求1至8中任一项所述的征信报告解析方法的步骤。
CN201810053224.7A 2018-01-19 2018-01-19 征信报告解析方法、服务器及存储介质 Pending CN108171600A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810053224.7A CN108171600A (zh) 2018-01-19 2018-01-19 征信报告解析方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810053224.7A CN108171600A (zh) 2018-01-19 2018-01-19 征信报告解析方法、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN108171600A true CN108171600A (zh) 2018-06-15

Family

ID=62515360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810053224.7A Pending CN108171600A (zh) 2018-01-19 2018-01-19 征信报告解析方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN108171600A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447787A (zh) * 2018-10-26 2019-03-08 平安科技(深圳)有限公司 征信报告自动解析方法、装置、计算机设备以及存储介质
CN109902113A (zh) * 2019-01-17 2019-06-18 平安科技(深圳)有限公司 征信反馈报告处理方法及装置、存储介质、计算机设备
CN110187916A (zh) * 2019-05-31 2019-08-30 四川长虹电器股份有限公司 基于数据配置生成Word文档的方法
CN110348680A (zh) * 2019-06-04 2019-10-18 深圳前海新心金融管理有限公司 基于统一模板的征信报告智能解析方法以及装置
CN110399453A (zh) * 2019-05-21 2019-11-01 平安普惠企业管理有限公司 征信报告处理方法及装置、电子设备和非暂态存储介质
CN110688830A (zh) * 2019-09-26 2020-01-14 中国银行股份有限公司 征信模板的转换方法及装置
CN110888926A (zh) * 2019-10-22 2020-03-17 北京百度网讯科技有限公司 医疗文本结构化的方法以及装置
CN110990397A (zh) * 2019-11-01 2020-04-10 东方微银科技(北京)有限公司 一种征信数据提取方法及设备
WO2020087981A1 (zh) * 2018-10-29 2020-05-07 平安医疗健康管理股份有限公司 风控审核模型生成方法、装置、设备及可读存储介质
CN111651413A (zh) * 2020-07-01 2020-09-11 中国银行股份有限公司 征信报告文件解析方法及装置
CN113204621A (zh) * 2021-05-12 2021-08-03 北京百度网讯科技有限公司 文档入库、文档检索方法,装置,设备以及存储介质
CN113592625A (zh) * 2021-07-27 2021-11-02 京东科技控股股份有限公司 征信报告的生成方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452555A (zh) * 2008-12-31 2009-06-10 中国建设银行股份有限公司 查询个人信用信息的方法、系统及个人信用查询系统
CN102591971A (zh) * 2011-12-31 2012-07-18 北京百度网讯科技有限公司 一种网页信息提取的方法和设备
CN104217036A (zh) * 2014-10-08 2014-12-17 广州华多网络科技有限公司 一种网页内容提取方法和设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452555A (zh) * 2008-12-31 2009-06-10 中国建设银行股份有限公司 查询个人信用信息的方法、系统及个人信用查询系统
CN102591971A (zh) * 2011-12-31 2012-07-18 北京百度网讯科技有限公司 一种网页信息提取的方法和设备
CN104217036A (zh) * 2014-10-08 2014-12-17 广州华多网络科技有限公司 一种网页内容提取方法和设备

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447787A (zh) * 2018-10-26 2019-03-08 平安科技(深圳)有限公司 征信报告自动解析方法、装置、计算机设备以及存储介质
WO2020087981A1 (zh) * 2018-10-29 2020-05-07 平安医疗健康管理股份有限公司 风控审核模型生成方法、装置、设备及可读存储介质
CN109902113A (zh) * 2019-01-17 2019-06-18 平安科技(深圳)有限公司 征信反馈报告处理方法及装置、存储介质、计算机设备
CN109902113B (zh) * 2019-01-17 2024-04-02 平安科技(深圳)有限公司 征信反馈报告处理方法及装置、存储介质、计算机设备
CN110399453A (zh) * 2019-05-21 2019-11-01 平安普惠企业管理有限公司 征信报告处理方法及装置、电子设备和非暂态存储介质
CN110187916B (zh) * 2019-05-31 2022-09-02 四川长虹电器股份有限公司 基于数据配置生成Word文档的方法
CN110187916A (zh) * 2019-05-31 2019-08-30 四川长虹电器股份有限公司 基于数据配置生成Word文档的方法
CN110348680A (zh) * 2019-06-04 2019-10-18 深圳前海新心金融管理有限公司 基于统一模板的征信报告智能解析方法以及装置
CN110688830A (zh) * 2019-09-26 2020-01-14 中国银行股份有限公司 征信模板的转换方法及装置
CN110688830B (zh) * 2019-09-26 2023-09-22 中国银行股份有限公司 征信模板的转换方法及装置
CN110888926A (zh) * 2019-10-22 2020-03-17 北京百度网讯科技有限公司 医疗文本结构化的方法以及装置
CN110888926B (zh) * 2019-10-22 2022-10-28 北京百度网讯科技有限公司 医疗文本结构化的方法以及装置
CN110990397A (zh) * 2019-11-01 2020-04-10 东方微银科技(北京)有限公司 一种征信数据提取方法及设备
CN111651413A (zh) * 2020-07-01 2020-09-11 中国银行股份有限公司 征信报告文件解析方法及装置
CN113204621A (zh) * 2021-05-12 2021-08-03 北京百度网讯科技有限公司 文档入库、文档检索方法,装置,设备以及存储介质
CN113592625A (zh) * 2021-07-27 2021-11-02 京东科技控股股份有限公司 征信报告的生成方法、装置及电子设备
CN113592625B (zh) * 2021-07-27 2024-04-05 京东科技控股股份有限公司 征信报告的生成方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN108171600A (zh) 征信报告解析方法、服务器及存储介质
CN104881488B (zh) 基于关系表的可配置信息抽取方法
US8683324B2 (en) Dynamic generation of target files from template files and tracking of the processing of target files
CN100489879C (zh) 一种对页面数据进行校验的方法、系统和服务器
CN101025738B (zh) 一种免模板动态网站生成方法
US9092443B2 (en) Dynamic generation of target files from template files and tracking of the processing of target files
CN103077185B (zh) 一种基于对象的自定义扩展信息的方法
CN100568226C (zh) 用于重新格式化具有混乱超链接的区域的方法
CN104123399B (zh) 一种跨平台的题库资源构建方法
US20040221233A1 (en) Systems and methods for report design and generation
CN103853806A (zh) 一种表格转换方法及装置
CN102103605A (zh) 一种智能提取文档结构的方法及系统
CN104391786A (zh) 网页自动化测试系统及其方法
US7370060B2 (en) System and method for user edit merging with preservation of unrepresented data
CN101561725B (zh) 一种手写快速输入的方法和系统
CN106899750A (zh) 基于卡片的信息展示方法、信息展示业务的处理方法及装置
CN112016290A (zh) 一种文档自动排版方法、装置、设备及存储介质
CN111597489B (zh) 一种基于移动端可拖拽自定义表单组件的实现方法及装置
CN103049494B (zh) 一种xml文档的表格存储方法及装置
CN104182228A (zh) 一种创建网络应用的方法和系统
US9319374B2 (en) Personalized bookmarking of textsite applications via a text message
JP4976083B2 (ja) 情報共有システムの情報連携プログラム
CN108241499A (zh) 字段值注释的更新方法、装置及计算机可读存储介质
CN105808628B (zh) 网页转码方法、装置及系统
CN107203525A (zh) 数据库的处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180615

RJ01 Rejection of invention patent application after publication