CN115018613A - 报告分析方法、装置、设备、存储介质及产品 - Google Patents
报告分析方法、装置、设备、存储介质及产品 Download PDFInfo
- Publication number
- CN115018613A CN115018613A CN202210417591.7A CN202210417591A CN115018613A CN 115018613 A CN115018613 A CN 115018613A CN 202210417591 A CN202210417591 A CN 202210417591A CN 115018613 A CN115018613 A CN 115018613A
- Authority
- CN
- China
- Prior art keywords
- information
- report
- post
- content
- target post
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 85
- 238000004590 computer program Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种报告分析方法、装置、设备、存储介质及产品,包括:基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种报告分析方法、装置、设备、存储介质及产品。
背景技术
金融业务的贷后管理工作十分重要,但目前的信贷管理工作中,普遍存在重视市场营销、业务拓展,却轻视内部管理、风险控制工作的情况,而负责贷后管理工作的人员有可能会被动应付贷后管理工作,其反应在贷后管理报告中时,往往会表现为贷后管理报告的质量不佳。
但是贷后管理报告包含了大量的非结构化的文本数据,使得贷后检查人员监测比较麻烦。而且贷后管理工作中要求贷后报告要覆盖一定的业务比例和频次,会产生大量的贷后管理报告,贷后检查人员很难通过人工审核发现贷后管理报告中的问题。
因此,如何有效对贷后管理报告进行分析已经成为业界亟待解决的问题。
发明内容
本发明提供一种报告分析方法、装置、设备、存储介质及产品,用以解决现有技术中不能很好的对贷后管理报告进行分析的缺陷。
本发明提供一种报告分析方法,包括:
基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;
基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;
基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;
基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
根据本发明提供的一种报告分析,所述内容丰富度信息,通过如下方式得到:
基于所述历史贷后报告中每个历史贷后报告子模块的字数统计结果,确定目标贷后报告中每个目标贷后报告子模块的七九分位数;
基于所述目标贷后报告对应的客户风险分类信息和所述七九分位数,得到每个目标贷后报告子模块的预期字数信息;
基于每个目标贷后报告子模块的实际字数信息和所述预期字数信息,得到每个所述目标贷后报告子模块的内容丰富度信息;
基于每个所述目标贷后报告子模块的内容丰富度信息,得到所述目标贷后报告的内容丰富度信息。
根据本发明提供的一种报告分析,所述内容原创度信息,通过如下方式得到:
对多个所述历史贷后报告中进行文本相似度分析,得到所述历史贷后报告中的模板文本;
基于所述模板文本对所述目标贷后报告进行对比分析,得到所述目标贷后报告中的差异文本信息;
基于所述差异文本信息,确定所述目标贷后报告的内容原创度信息。
根据本发明提供的一种报告分析,所述基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,包括:
基于词频-逆文本频率指数算法,对所述目标贷后报告中的所述常见词进行分析,得到所述常见词的权重信息;
基于所述常见词的权重信息确定所述目标贷后报告的内容相关度信息。
根据本发明提供的一种报告分析,所述风险揭示度信,通过如下方式得到:
将所述贷后数据中,中高风险等级或跟进处理状态的预警信号确定为目标风险点;
基于所述目标贷后报告关联的风险点与所述目标风险点确定目标贷后报告的风险揭示度信息。
根据本发明提供的一种报告分析,所述基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果,包括:
根据动态加权算法对所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息进行计算,得到所述目标贷后报告的分析结果;
其中,所述内容丰富度的权值低于所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息的权值。
本发明还提供一种报告分析装置,包括:
第一分析模块,用于基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;
第二分析模块,用于基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;
第三分析模块,用于基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;
第四分析模块,用于基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述报告分析方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述报告分析方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述报告分析方法。
本发明提供的一种报告分析方法、装置、设备、存储介质及产品,通过从内容丰富度、内容原创度、内容相关度和风险揭示度这四个角度充分对目标贷后报告进行分析,从而完成对于目标贷后报告的自动化评估,最终得到能够帮助识别出质量不佳的贷后管理报告的分析结果。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的报告分析方法流程示意图;
图2为本申请实施例提供的报告分析装置结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本申请实施例提供的报告分析方法流程示意图,如图1所示,包括:
步骤110,基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;
具体地,本申请实施例中描述的目标贷后报告具体是当前时段需要进一步进行分析评估的贷后管理报告,该目标贷后报告中具体包括贷后报告业务情况、财务分析、借款人管理、担保管理、固定资产项目、资金流向分析、批复条件落实情况等多个子模块。
本申请实施例中所描述的历史贷后报告是指已经完成分析的贷后管理报告,其是当前时段之前的贷后管理报告,更具体地,为保证数据的有效性,本申请实施例中的历史贷后报告可以与目标贷后报告来自同一主体的历史贷后报告,且该历史贷后报告的选取时间不会与当前时段相隔太久。
本申请实施例中低质量的贷后报告往往会出现报告整体字数较少,或者报告中重复内容较多的情况,因此本申请实施例中进一步通过从内容丰富度和内容原创度方面来进行分析,从而及时发现上述问题。
本申请实施例中的内容丰富度信息具体可以是用于评估目标贷后报告中字数的合理性,从而发现目标贷后报告中各模块字数偏少的问题。
本申请实施例中所描述的内容原创度信息具体是利用分词、文本相似算法,计算文本相似度,发现目标贷后报告中出现重复内容较多的问题。
步骤120,基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;
具体地,本申请实施例中所描述的内容相关度信息主要是用于评价目标贷后报告中各个子模块的内容与子模块的主体是否符合的问题。
本申请实施例中所描述的常见词具体是指在目标贷后报告中出现频次较高的词,其具体可以是目标贷后报告中出现次数超过第一预设阈值的单词,该第一预设阈值可以是预先设定的数值,例如20或者10次。
在本申请实施例中,常见词往往在一定程度上与该段的文本主题存在关联关系,因此本申请实施例中可以通过根据常见词的出现次数,从而有效分析目标贷后报告的内容相关度信息。
步骤130,基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;
具体地,本申请实施例中所描述的风险揭示度信息的分析,可以有效帮助发现目标贷后报告没有对客户风险进行分析的问题。
本申请实施例中所描述的风险揭示度信息具体代表了目标贷后报告中对应该揭示的客户风险的揭示情况。
本申请实施例中所描述的目标风险点信息具体可以是根据目标贷后报告对应的贷后数据进行分析后,得到的目标贷后报告中应该标识出的风险点信息。
该贷后数据具体可以是通过在数据库中查询贷后启用表表字段和贷后预警信号表字段得到的,其具体可以包括贷后报告中客户贷后分级、信用评级等相关数据,以及预警信号触发时间、风险等级、处理状态等信息。
本发明实施例中通过判断目标风险点是否在目标贷后报告中被勾选,从而确定目标贷后报告的风险揭示度信息。
步骤140,基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
具体地,在本申请实施例中,在分别从丰富度、原创度、相关度、风险揭示度四个维度,对目标贷后报告的各个子模块进行评分后,结合各维度得分,采用动态加权算法,动态下调了丰富度得分占比,适当提高原创度、相关度和风险揭示度占比计算得到目标贷后报告的分析结果。
在本申请实施例中,通过从内容丰富度、内容原创度、内容相关度和风险揭示度这四个角度充分对目标贷后报告进行分析,从而完成对于目标贷后报告的自动化评估,最终得到能够帮助识别出质量不佳的贷后管理报告的分析结果。
可选地,所述内容丰富度信息,通过如下方式得到:
基于所述历史贷后报告中每个历史贷后报告子模块的字数统计结果,确定目标贷后报告中每个目标贷后报告子模块的七九分位数;
基于所述目标贷后报告对应的客户风险分类信息和所述七九分位数,得到每个目标贷后报告子模块的预期字数信息;
基于每个目标贷后报告子模块的实际字数信息和所述预期字数信息,得到每个所述目标贷后报告子模块的内容丰富度信息;
基于每个所述目标贷后报告子模块的内容丰富度信息,得到所述目标贷后报告的内容丰富度信息。
具体地,本申请实施案例中所描述的字数统计结果具体是指其对应的文件中文字的数量。
本申请实施例中所描述的七九分位数具体包括七分位数和九分位数。
本申请实施例中所描述的客户风险分类信息,具体是目标贷后报告对应主体的风险分类信息,其用于标示该目标贷后报告对应主体的主体风险程度,其风险分类等级越高,则对应的目标贷后报告对于内容丰富度的要求就越高,其风险等级越低,则对应的目标贷后报告对于内容丰富度的要求就越低。
本申请实施例中,通过各个历史贷后报告子模块的字数统计结果,通过统计学方法,选取七九分位数为各模块的合理字数区间,即预期字数信息。
再根据预期字数信息,设计字数分段评分函数,对贷后报告中各模块的不同的内容字数进行丰富度的评分。其中字数分段评分函数的确定主要利用统计学理论结合业务经验,使得分数分布符合业务需要、能够满足正态分布。
字数分段评分函数如下:
param为中间参数,其作用主要用来调节七、九分位数对应的分数;param公式如下所示:
其中,a为历史贷后报告字数统计结果的七分位数,b为历史贷后报告字数统计结果的九分位数。
在本申请实施例中,通过对大量历史贷后报告中各个子模块字数的特点进行分析,从而为目标贷后报告中各个子模块确定合适的七九分位数,然后结合不同客户风险分类信息对应的字数需求,最终确定目标贷后报告中各个子模块的合理预期字数信息,从而根据每个子模块的实际字数信息和预期字数信息,得到目标贷后报告的内容丰富度信息。
可选地,所述内容原创度信息,通过如下方式得到:
对多个所述历史贷后报告中进行文本相似度分析,得到所述历史贷后报告中的模板文本;
基于所述模板文本对所述目标贷后报告进行对比分析,得到所述目标贷后报告中的差异文本信息;
基于所述差异文本信息,确定所述目标贷后报告的内容原创度信息。
具体地,本申请实施例中所描述在对目标贷后报告进行内容原创度分析的过程中,也需要进一步分别分析目标贷后报告中每个子模块的内容原创度,再进一步确定该目标贷后报告的整体内容原创度。
本申请实施例中,首先利用自然语言分词技术对大量历史贷后报告内各模块文本进行分词,生成词组,然后针对于每个子模块的词组,借助文本相似算法(杰卡德相似算法)计算文本相似度sim,从而得到会在历史贷后报告中多次出现的词组,将该词组作为模板文本,即认为目标贷后报告中的模板本文不属于具备原创度的文本。
在得到模板文本后,基于模板文本,确定目标贷后报告中的差异文本,然后设计词组差异公式,使用差异文本的个数进一步计算原创度得分,针对模板类报告有及时更新相关数据信息的情况,提高原创度得分,使结果更为合理。其中词组差异公式是基于差异文本数字n进一步对sim值进行调整,利用统计学理论设计以下sim公式,将相似度sim进一步根据差异数字n的大小进行调整,如果是模板类的报告内容中的差异数字越多,认为文本相似度越小,进而在计算原创度sim_score时得分得以提高。
词组差异公式具体为:
原创度得分公式为:
sim_score=100.0*(1-sim)
其中,n为差异文本数字。
在本申请实施例中,通过对历史贷后报告进行相似度分析,找出其中会反复出现,不具备原创度的模板文本,进而根据该模板文本确定目标贷后报告中具备原创性的文本,从而得到目标贷后报告的内容原创度信息。
可选地,所述基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,包括:
基于词频-逆文本频率指数算法,对所述目标贷后报告中的所述常见词进行分析,得到所述常见词的权重信息;
基于所述常见词的权重信息确定所述目标贷后报告的内容相关度信息。
具体的,本申请实施例中所描述的词频-逆文本频率指数算法(term frequency–inverse document frequency,TF-IDF),是一种用于信息检索与数据挖掘的常用加权技术,用以评估字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
本申请实施例中所描述的常见词具体可以是指在目标贷后报告中出现频次较高,目标贷后报告的主题内容存在关联的词组。
在本申请实施例中可以分别分析目标贷后报告中每个子模块常见词的权重进行分析,然后各模块的关键词库和关键词权重得分,再对单一模块的全部关键词进行求和,计算得到句子级别的TF-IDF值,再利用统计学理论设计评分函数,将TF-IDF值转换为相应分数。
在本申请实施例中,利用TF-IDF算法,对每个子模块进行分析,可以有效发现内容与模块主题不符的问题,从而得到内容相关度信息。
可选地,所述风险揭示度信,通过如下方式得到:
将所述贷后数据中,中高风险等级或跟进处理状态的预警信号确定为目标风险点;
基于所述目标贷后报告关联的风险点与所述目标风险点确定目标贷后报告的风险揭示度信息。
具体地,本申请实施例中所描述的贷后数据具体可以是目标贷后报告关联的贷后启用表和贷后预警信号表中获取的数据,其具体可以包括:客户贷后分级、信用评级等相关数据、预警信号触发时间、风险等级、处理状态等信息。
目标贷后报告展示和导出时涉及了多张数据表关联使用,相关的信息后期模型上线后是通过贷后数据库查询出来再后台代码拼接好消息,通过卡夫卡传递给模型服务器。
更具体地,在本申请实施例中,可以根据业务经验预先设定风险触发条件,将贷后分级分为四级,在目标贷后报告有效期内出现中高风险且被认定为属实的或者任务状态为跟进处理的预警信号等情况认定为客户经理至少应该分析到的风险点,并在目标贷后报告中勾选。
本申请实施例中,首先,判断客户经理是否勾选了风险点,借助句子向量模型分别计算风险点与目标贷后报告内容的向量,使用余弦相似度计算贷后报告分析内容与风险点匹配程度,从而有效实现确定目标贷后报告的风险揭示度信息。
可选地,所述基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果,包括:
根据动态加权算法对所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息进行计算,得到所述目标贷后报告的分析结果;
其中,所述内容丰富度的权值低于所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息的权值。
具体地,本申请实施例中,在分别从丰富度、原创度、相关度、风险揭示度四个维度,对目标贷后报告的各个子模块进行评分,得到报告的四个维度质量评分后,结合各维度得分,采用动态加权算法,动态下调了内容丰富度信息占比,适当提高内容原创度信息、内容相关度信息和风险揭示度信息占比计算得到所述目标贷后报告的分析结果。
更具体地,本申请实施例中可以根据分析结果从而有效确定目标贷后报告的质量。
在得到分析结果后,进一步将该分析结果展示在前端页面,在贷后管理报告任务页面显示报告得分和建议供贷后管理人员参考。
在本申请实施例中,通过下调内容丰富度信息占比,适当提高内容原创度信息、内容相关度信息和风险揭示度信息占比,最终得到更为合理的目标贷后报告分析结果。
下面对本发明提供的报告分析装置进行描述,下文描述的报告分析装置与上文描述的报告分析方法可相互对应参照。
图2为本申请实施例提供的报告分析装置结构示意图,如图2所示,包括:第一分析模块210、第二分析模块220、第三分析模块230和第四分析模块240;其中,第一分析模块210用于基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;其中,第二分析模块220用于基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;其中,第三分析模块230用于基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;其中,第四分析模块240用于基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
在本申请实施例中,通过从内容丰富度、内容原创度、内容相关度和风险揭示度这四个角度充分对目标贷后报告进行分析,从而完成对于目标贷后报告的自动化评估,最终得到能够帮助识别出质量不佳的贷后管理报告的分析结果。
图3是本发明提供的电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行报告分析方法,该方法包括:基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的报告分析方法,该方法包括:基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的报告分析方法,该方法包括:基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种报告分析方法,其特征在于,包括:
基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;
基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;
基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;
基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
2.根据权利要求1所述的报告分析方法,其特征在于,所述内容丰富度信息,通过如下方式得到:
基于所述历史贷后报告中每个历史贷后报告子模块的字数统计结果,确定目标贷后报告中每个目标贷后报告子模块的七九分位数;
基于所述目标贷后报告对应的客户风险分类信息和所述七九分位数,得到每个目标贷后报告子模块的预期字数信息;
基于每个目标贷后报告子模块的实际字数信息和所述预期字数信息,得到每个所述目标贷后报告子模块的内容丰富度信息;
基于每个所述目标贷后报告子模块的内容丰富度信息,得到所述目标贷后报告的内容丰富度信息。
3.根据权利要求1所述的报告分析方法,其特征在于,所述内容原创度信息,通过如下方式得到:
对多个所述历史贷后报告中进行文本相似度分析,得到所述历史贷后报告中的模板文本;
基于所述模板文本对所述目标贷后报告进行对比分析,得到所述目标贷后报告中的差异文本信息;
基于所述差异文本信息,确定所述目标贷后报告的内容原创度信息。
4.根据权利要求1所述的报告分析方法,其特征在于,所述基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,包括:
基于词频-逆文本频率指数算法,对所述目标贷后报告中的所述常见词进行分析,得到所述常见词的权重信息;
基于所述常见词的权重信息确定所述目标贷后报告的内容相关度信息。
5.根据权利要求1所述的报告分析方法,其特征在于,所述风险揭示度信,通过如下方式得到:
将所述贷后数据中,中高风险等级或跟进处理状态的预警信号确定为目标风险点;
基于所述目标贷后报告关联的风险点与所述目标风险点确定目标贷后报告的风险揭示度信息。
6.根据权利要求1所述的报告分析方法,其特征在于,所述基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果,包括:
根据动态加权算法对所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息进行计算,得到所述目标贷后报告的分析结果;
其中,所述内容丰富度的权值低于所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息的权值。
7.一种报告分析装置,其特征在于,包括:
第一分析模块,用于基于历史贷后报告的文本信息对目标贷后报告进行分析,得到所述目标贷后报告的内容丰富度信息和内容原创度信息;
第二分析模块,用于基于所述目标贷后报告中常见词的出现次数,得到所述目标贷后报告的内容相关度信息,其中,所述常见词是所述目标贷后报告中出现次数超过第一预设阈值的单词;
第三分析模块,用于基于所述目标贷后报告和目标风险点信息,确定目标贷后报告的风险揭示度信息,其中,所述目标风险点信息是基于所述目标贷后报告对应的贷后数据确定的;
第四分析模块,用于基于所述内容丰富度信息、所述内容原创度信息、所述内容相关度信息和所述风险揭示度信息,得到所述目标贷后报告的分析结果。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述报告分析方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述报告分析方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述报告分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210417591.7A CN115018613A (zh) | 2022-04-20 | 2022-04-20 | 报告分析方法、装置、设备、存储介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210417591.7A CN115018613A (zh) | 2022-04-20 | 2022-04-20 | 报告分析方法、装置、设备、存储介质及产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115018613A true CN115018613A (zh) | 2022-09-06 |
Family
ID=83068047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210417591.7A Pending CN115018613A (zh) | 2022-04-20 | 2022-04-20 | 报告分析方法、装置、设备、存储介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115018613A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116228265A (zh) * | 2023-03-24 | 2023-06-06 | 北京中诺链捷数字科技有限公司 | 发票风险识别方法、装置和设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200013122A1 (en) * | 2009-06-18 | 2020-01-09 | Fiduciary Benchmarks Insights, Llc | System and method for evaluating defined contribution plans |
CN112037039A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 一种贷款评估方法及装置 |
CN113965759A (zh) * | 2021-11-04 | 2022-01-21 | 周国强 | 一种视频帧的压缩方法及系统 |
-
2022
- 2022-04-20 CN CN202210417591.7A patent/CN115018613A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200013122A1 (en) * | 2009-06-18 | 2020-01-09 | Fiduciary Benchmarks Insights, Llc | System and method for evaluating defined contribution plans |
CN112037039A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 一种贷款评估方法及装置 |
CN113965759A (zh) * | 2021-11-04 | 2022-01-21 | 周国强 | 一种视频帧的压缩方法及系统 |
Non-Patent Citations (1)
Title |
---|
王旸: "面向信息产品的社会化媒体平台数据资源管理方法研究", 《中国博士学位论文全文数据库 经济与管理科学辑》, 15 May 2019 (2019-05-15), pages 152 - 68 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116228265A (zh) * | 2023-03-24 | 2023-06-06 | 北京中诺链捷数字科技有限公司 | 发票风险识别方法、装置和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220147023A1 (en) | Method and device for identifying industry classification of enterprise and particular pollutants of enterprise | |
KR102026304B1 (ko) | Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 | |
CN107025596B (zh) | 一种风险评估方法和系统 | |
CN111881983B (zh) | 基于分类模型的数据处理方法、装置、电子设备及介质 | |
CN106447239B (zh) | 一种数据发布的审核方法及装置 | |
CN112685324B (zh) | 一种生成测试方案的方法及系统 | |
KR20190110084A (ko) | Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 | |
CN111984792A (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN104850617A (zh) | 短文本处理方法及装置 | |
CN108667678A (zh) | 一种基于大数据的运维日志安全检测方法及装置 | |
Pratiwi et al. | Implementation of rumor detection on twitter using the svm classification method | |
CN115563268A (zh) | 一种文本摘要的生成方法及装置、电子设备、存储介质 | |
CN115018613A (zh) | 报告分析方法、装置、设备、存储介质及产品 | |
CN113934848A (zh) | 一种数据分类方法、装置和电子设备 | |
EP1886206A1 (en) | Test mining systems and methods for early detection and warning | |
CN108021595B (zh) | 检验知识库三元组的方法及装置 | |
CN111832266A (zh) | 专利申请文件撰写质量的在线分析方法及系统 | |
CN112487181A (zh) | 关键词确定方法和相关设备 | |
WO2019218517A1 (zh) | 服务器、文本数据的处理方法及存储介质 | |
CN115660451A (zh) | 基于rpa的供应商风险预警方法、装置、设备及介质 | |
CN115495587A (zh) | 一种基于知识图谱的告警分析方法及装置 | |
CN110795537B (zh) | 一种确定目标商品的改进策略的方法、装置、设备和介质 | |
CN114911936A (zh) | 一种模型训练、评论识别方法、装置、电子设备及介质 | |
KR20190048012A (ko) | 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 감성레벨산출시스템 및 그 제어방법 | |
CN113159921B (zh) | 一种逾期预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |