CN115809370A

CN115809370A - 征信产品推荐方法、装置、存储介质及服务器

Info

Publication number: CN115809370A
Application number: CN202310046409.6A
Authority: CN
Inventors: 姜超泽
Original assignee: Smart Control Nanjing Intelligent Technology Co ltd
Current assignee: Smart Control Nanjing Intelligent Technology Co ltd
Priority date: 2023-01-31
Filing date: 2023-01-31
Publication date: 2023-03-17

Abstract

本申请公开了一种征信产品推荐方法、装置、存储介质及服务器。该征信产品推荐方法包括：获取用户征信和税务信息；在所述用户征信和税务信息中抽离出多维度用户特征及其变量；采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池；判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。本申请解决了由于考虑的维度过少，且并未考虑不同银行的要求也各不相同造成的推荐精准度不高的技术问题。

Description

征信产品推荐方法、装置、存储介质及服务器

技术领域

本申请涉及金融数据处理领域，具体而言，涉及一种征信产品推荐方法、装置、存储介质及服务器。

背景技术

发明人发现，目前的智能推荐征信产品方法仅仅考量了特定的维度，考虑的维度过少，且并未考虑不同银行的要求也各不相同，导致推荐精准度不高。

针对相关技术中考虑的维度过少，且并未考虑不同银行的要求也各不相同造成的推荐精准度不高的问题，目前尚未提出有效的解决方案。

发明内容

本申请的主要目的在于提供一种征信产品推荐方法、装置、存储介质及服务器，以解决考虑的维度过少，且并未考虑不同银行的要求也各不相同造成的推荐精准度不高的问题。

为了实现上述目的，根据本申请的一个方面，提供了一种征信产品推荐方法。

根据本申请的征信产品推荐方法包括：获取用户征信和税务信息；在所述用户征信和税务信息中抽离出多维度用户特征及其变量；采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池；判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。

进一步的，获取用户征信和税务信息之后，在所述用户征信和税务信息中抽离出多维度用户特征及其变量之前还包括：对所述用户征信和税务信息执行预设清洗操作。

进一步的，对所述用户征信和税务信息执行预设清洗操作包括：对所述用户征信和税务信息执行预设的缺失值处理、异常值处理、数据转换、异常值分析过滤、数据类型检查、数据预处理的操作。

进一步的，在所述用户征信和税务信息中抽离出多维度用户特征及其变量之后，采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池之前还包括：判断所述多维度用户特征变量中的关键特征变量是否满足第二预设征信标准；如果满足，则采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征。

进一步的，获取用户征信信息包括：接收用户征信报告；采用OCR技术从所述用户征信报告中识别出文字信息；对所述文字信息进行排列组合，得到txt文档；将txt文档填写到用户征信模板中，得到用户征信信息。

进一步的，获取税务信息包括：通过税务接口获取税务报告；通过整理所述税务报告，从中提取纳税情况和开票情况；将纳税情况和开票情况填写到税务模板中，得到税务信息。

为了实现上述目的，根据本申请的另一方面，提供了一种征信产品推荐装置。

根据本申请的征信产品推荐装置包括：获取模块，用于获取用户征信和税务信息；划分模块，用于采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征；构建模块，用于根据所述多维度用户特征、用户征信和税务信息构建变量池；判断模块，用于判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。

进一步的，还包括：第二判断模块，用于判断所述多维度用户特征变量中的关键特征变量是否满足第二预设征信标准；如果满足，则采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征。

根据本申请的计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述的征信产品推荐方法。

根据本申请的服务器，包括：存储器和处理器，所述存储器中存储有计算机程序，其中，所述处理器被设置为运行所述计算机程序以执行所述的征信产品推荐方法。

在本申请实施例中，采用智能推荐征信产品的方式，通过获取用户征信和税务信息；在所述用户征信和税务信息中抽离出多维度用户特征及其变量；采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池；判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户；达到了充分考量了多维度数据，且考虑了不同银行的要求的目的，从而实现了有效提高推荐精准度的技术效果，进而解决了由于考虑的维度过少，且并未考虑不同银行的要求也各不相同造成的推荐精准度不高的技术问题。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的征信产品推荐方法的流程示意图；

图2是根据本申请实施例的征信产品推荐装置的结构示意图；

图3（a）-图3（b）是根据本申请优选实施例的用户征信报告示意图；

图4是根据本申请优选实施例的txt文档示意图；

图5是根据本申请优选实施例的用户征信信息示意图；

图6是根据本申请优选实施例的税务信息示意图；

图7是根据本申请优选实施例的数据立方示意图；

图8是根据本申请优选实施例的缺失值，异常值处理的界面示意图；

图9是根据本申请优选实施例的数据转换，数据类型检查的界面示意图；

图10是根据本申请优选实施例的异常值的分析过滤的界面示意图；

图11是根据本申请优选实施例的数据预处理的界面示意图。

实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请中，术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例，并非用于限定所指示的装置、元件或组成部分必须具有特定方位，或以特定方位进行构造和操作。

并且，上述部分术语除了可以用于表示方位或位置关系以外，还可能用于表示其他含义，例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言，可以根据具体情况理解这些术语在本发明中的具体含义。

此外，术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如，可以是固定连接，可拆卸连接，或整体式构造；可以是机械连接，或电连接；可以是直接相连，或者是通过中间媒介间接相连，又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

根据本发明实施例，提供了一种征信产品推荐方法，如图1所示，该方法包括如下的步骤S101至步骤S104：

步骤S101、获取用户征信和税务信息；

多名用户提交的征信、税务相关的资料经过转化得到机器可识别的数字化信息，即用户征信和税务信息；通过ocr，接口等形式进行数据转化。

在一种具体的实施方式中，获取用户征信信息包括：接收用户征信报告；采用OCR技术从所述用户征信报告中识别出文字信息；对所述文字信息进行排列组合，得到txt文档；将txt文档填写到用户征信模板中，得到用户征信信息。

将如图3（a）-图3（b）所示的用户征信报告的图片通过OCR技术把文字提取处理，再通过文字排列组合方式生成如图4所示的txt文档，最后将填写到用户征信模板中，得到如图5所示的用户征信信息。实现了在图片中自动提取征信产品推荐所需的信息，并且自动将这些信息填写到模板中，无需人工从图片中收集相应的信息，有效提升了智能化程度。

在一种具体的实施方式中，获取税务信息包括：通过税务接口获取税务报告；通过整理所述税务报告，从中提取纳税情况和开票情况；将纳税情况和开票情况填写到税务模板中，得到税务信息。

先根据用户的唯一识别信息，可以直接通过税务接口接入税务系统，从中获取该用户对应的税务报告，然后提取纳税情况和开票情况，最后将提取的纳税情况和开票情况写到税务模板中，得到如图6所示的税务信息；采用接口形式直接导入对应的信息，为后续征信推荐提供数据支持。

步骤S102、在所述用户征信和税务信息中抽离出多维度用户特征及其变量；

多维度用户特征及其变量包括：法人征信特征、企业负载情况及税务发票情况等。

法人征信特征变量也有多个维度，包括：法人持股比例、法人在公司的时间、法人涉及其他企业，风险程度等、法人住所及所在地是否是高危诈骗风险地区、法人办理信用卡张数、信用卡授予的额度、历史所有卡的还款记录、履约情况、额定时间内金额数、法人征信查询次数、征信查询情况、贷款账户等。本实施例中，每个变量还被赋予不同的权重值。

企业负债情况也有多个维度，包括：企业在某一个行业的负债比例情况，已经借款产品，借款属性，有没有担保关联企业，行政处罚有哪些，数量多少，哪些行政处罚可以忽略，法人变更信息，最终受益人信息变更，时间，主要成员变更，对外投资变更，有关联企业敏感舆情，对相关机构调查，扣证等正对相关行业及显示情况多对多等匹配，大股东有没有涉及持有别对企业，并且当了法人有违规操作，民事诉讼等一些列变量值相关信息，企业征信查询情况，数量等。

税务发票情况，供应链上下游有什么明星企业，国企合作，根据往年交易往来及开票数据筛查判断（一年交易金额，频次等都是需要我们筛选不同行业规则），有没有欠税，增值税缴纳，营业所得税，部分税种根据行业特征缴纳情况等等都是形成变量等要素。

本实施例中，可以是采用要素识别并提取的方式，尽可能多的提取以上的用户特征及其变量，不再局限于特定的维度，尽可能多的丰富特征维度，为后续变量池的构建提供支持；也可以是根据多对多的匹配，根据行业要求，产品要求等，变量值都会通过业务要求等不同变化匹配，不再局限于特定的维度，根据不同行业、产品要求进行多对多的特征匹配，有效丰富特征维度，为后续变量池的构建提供支持。

步骤S103、采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池；

针对用户征信和税务信息，通过要素分解的体系化方法构建出完备的变量池。具体地，变量池可以基于不同的业务维度进行表示；比如：某企业涉及如下表格所示的贷款产品：

表格中每一行表示某个时间段内某个贷款产品在某个地区的借贷金额。很明显，这些数据涉及到了时间、地区、产品三个维度。在对这样的数据进行分析时，不同的维度都会基于某个所感兴趣的业务维度提出问题：企业融资维度上关心各个地区的借贷情况，及企业负债情况，时间维度考虑企业负债偿还周期及偿还顺序，产品维度关注贷款产品利率及额度。即通过提问可以使得不同业务维度对应不同维度的用户特征及其变量。

如图7所示，变量池也可以采用数据立方表示，即将该表格转换为另一种数据格式- "三维空间立方体"。

示例中模拟的这个数据分析场景较为特殊，因为只有三个业务维度，所以可以直观的将数据想象成一个三维立方体。

实际情况中，企业维度进行数据分析时往往要参考更多的维度，而且提出的问题也会更加复杂，此时，已经不能将数据以经典的三维立方体结构进行呈现。

虽然无法在三维空间中呈现更多维度的数据结构，但是面对更多维度时进行数据分析的思路却完全不变，不同的角色只需要从自身所关注的维度出发并提出问题即可，即不需要了解十几甚至几十维的数据如何存储，也无需考虑多维数据查询的具体实现方式。还有，企业开票，企业缴纳税款，税款种类、企业客户群体、企业供应商群体、企业借贷违约时间、借贷比重、企业法人借贷产品、信用卡逾期、等等上百种维度。以更多产品、场景去分析企业用户的各个维度构建完整变量池后分析出企业的真正特性。

根据本行业需要，划分不同维度，给用户打上标签，让海量的数据标签化为用户特征，以用户为单位的标签集合，全量刻画用户特征，就是数据立方，维度指标所阐述的标签集合。

在一些实施例中，还采取笛卡尔积的交叉组合方式，以及专家经验的筛选，使得变量池到达效果与成本的权衡结果。

变量池实现了全量刻画多维度用户特征，为后续征信产品推荐提供了保证。

步骤S104、判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。

为了使算法进行银行产品匹配，系统会拉取银行相关征信产品进入数据库。第一预设征信标准为预先设置的，不同业务维度对应一个征信标准，且不同银行可以根据实际情况调整该第一预设征信标注。如此，根据变量池中的多维度用户特征，可以对用户进行多维度侦测。即可以判断多维度用户特征的变量是否满足相应的标准，如果满足，则将该变量池中对应的产品维度下的征信产品全部推荐给用户。比如以年龄，公司变更时间，注册资金，信贷产品准入区域，持股比例等维度进行侦测。如此，实现了多维度侦测，充分考虑了特征维度对征信产品推荐的影响，也考虑了不同银行不同要求对产品推荐的影响，大大提高了推荐精度。

从以上的描述中，可以看出，本发明实现了如下技术效果：

根据本发明实施例，优选的，获取用户征信和税务信息之后，在所述用户征信和税务信息中抽离出多维度用户特征及其变量之前还包括：

对所述用户征信和税务信息执行预设清洗操作。

具体的，对所述用户征信和税务信息执行预设清洗操作包括：

对所述用户征信和税务信息执行预设的缺失值处理、异常值处理、数据转换、异常值分析过滤、数据类型检查、数据预处理的操作。

对缺失值，异常值处理：如图8所示，为扫描用户征信账户时候，缺失了内容。针对征信账户每期还款数据，当前逾期总次数，金额等综合评断。同时对用户征信账户对权重有一定考虑。例如：通过前面数据逾期汇总次数，金额能够判断，那么默认情况下，数据补全成，跟平时正常还款月份一样处理把数据补偿成跟有月份数据正常对值一样。如果没有任何数据做支持或者线索，通过该账户类型权重比例来判断，【贷记卡账户】相对比例下，放弃该数值，不纳入评估数据维度中。

数据转换，数据类型检查：如图9所示，这类数据字段，时常因为数据信息的不完整，取不到完整数据。该字段只做信息保留，不做数据分析。所以该字段数据，可以转为字符串形式保存。涉及到需要用到的账户做校验时候，才转换成数据做比对。这样能够合理提高信息录入效率，及不必要的工作量。同时有些数据因为ocr ，或者录入操作失误等问题，获取数据不符合字段赋予对类型，直接会报错，导致程序问题，这类我们会把值转换成默认对符合数据类型的值。

异常值的分析过滤：异常值分析，通过图10可以看到把无效值去掉。保存完整值。

数据预处理：如图11所示，通过查询记录我们能够统计不同银行拉取用户征信的记录。在办理企业贷款业务中，征信查询次数容易超，会影响业务的办理，并且征信比没有问题的企业的也会因为在一段时间过多的查询次数导致不能办理。这里我们把这些信息做了规则分析，变成可用数据对使用1.不同银行查询次数统计 2.同一家银行查询次数筛选3.查询用户对筛选。最后处理出一个真实可用，参考价值对征信查询次数，作为用户画像维度对评估因素，做参考。

根据本发明实施例，优选的，在所述用户征信和税务信息中抽离出多维度用户特征及其变量之后，采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池之前还包括：

判断所述多维度用户特征变量中的关键特征变量是否满足第二预设征信标准；

如果满足，则采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征。

第二预设征信标准为预先设置的风控规则。具体地，需要判断用户是否具备还款能力、还款意愿。判定为具有还款能力、还款意愿的，则采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征。实现了企业借贷后的违约概率的自动评判，仅在判定为违约概率低时，才进行下一步的多维度侦测，否则直接将该用户判定为征信资质不符。

设定的风控规则包括：行业限制筛查，企业名称-企业状态，是否正常经营还是异常，企业名称变更，成立时间，注册地址，行业，案件，法人页及法人情况，企业是否为高新技术等其他词条，曾用名时间，成立时间（不满6个月），区域是否需要上游，法人占股（如0，需看大股东最终受益人等，并备注占股），法人变更等。

不具备还款能力、还款意愿的情形如下：1、民事案件：21年至今需提供结案证明，民事案件20年之前不用管，其他案件（执行案件需确认结案），刑事案件无法办理，法人近2年失信（确认征信产品内容，及各项比重）强制执行，需完结3个月后才能办理（以完结日期为准）企业限制高消费或列入失信企业（结案）（2年内不能做）（确认企业开票和纳税是否符合然后提供税务授权链接）法人限制高消费或列入失信（结案），需结案提供优质下游，和银行有纠纷，5年以内结案也无法办理，股权被冻结，无法办理，驳回上诉，维持原判---完结，二审结果让一审重新审核--未完结，提示信息：被提及案件也算被告，企业欠税情况。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

根据本发明实施例，还提供了一种用于实施上述征信产品推荐方法的装置，如图2所示，该装置包括：

获取模块10，用于获取用户征信和税务信息；

划分模块20，用于采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征；

构建模块30，用于根据所述多维度用户特征、用户征信和税务信息构建变量池；

第一判断模块40，用于判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。

从以上的描述中，可以看出，本发明实现了如下技术效果：

对所述用户征信和税务信息执行预设清洗操作。

根据本发明实施例，优选的，还包括：第二判断模块，用于

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种征信产品推荐方法，其特征在于，包括：

获取用户征信和税务信息；

在所述用户征信和税务信息中抽离出多维度用户特征及其变量；

采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池；

判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。

2.根据权利要求1所述的征信产品推荐方法，其特征在于，获取用户征信和税务信息之后，在所述用户征信和税务信息中抽离出多维度用户特征及其变量之前还包括：

对所述用户征信和税务信息执行预设清洗操作。

3.根据权利要求2所述的征信产品推荐方法，其特征在于，对所述用户征信和税务信息执行预设清洗操作包括：

4.根据权利要求1所述的征信产品推荐方法，其特征在于，在所述用户征信和税务信息中抽离出多维度用户特征及其变量之后，采用要素分解的体系化方法，根据所述多维度用户特征及其变量、用户征信和税务信息构建变量池之前还包括：

5.根据权利要求1所述的征信产品推荐方法，其特征在于，获取用户征信信息包括：

接收用户征信报告；

采用OCR技术从所述用户征信报告中识别出文字信息；

对所述文字信息进行排列组合，得到txt文档；

将txt文档填写到用户征信模板中，得到用户征信信息。

6.根据权利要求1所述的征信产品推荐方法，其特征在于，获取税务信息包括：

通过税务接口获取税务报告；

通过整理所述税务报告，从中提取纳税情况和开票情况；

将纳税情况和开票情况填写到税务模板中，得到税务信息。

7.一种征信产品推荐装置，其特征在于，包括：

获取模块，用于获取用户征信和税务信息；

划分模块，用于采用要素分解的体系化方法划分所述用户征信和税务信息，得到多维度用户特征；

构建模块，用于根据所述多维度用户特征、用户征信和税务信息构建变量池；

第一判断模块，用于判断所述变量池是否满足第一预设征信标准，并将满足第一预设征信标准的征信产品推荐给用户。

8.根据权利要求7所述的征信产品推荐装置，其特征在于，还包括：第二判断模块，用于

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至7中任一项所述的征信产品推荐方法。

10.一种服务器，包括：存储器和处理器，其特征在于，所述存储器中存储有计算机程序，其中，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7中任一项所述的征信产品推荐方法。