CN109558592A

CN109558592A - 基于人工智能获取客户信用风险评估信息的方法及设备

Info

Publication number: CN109558592A
Application number: CN201811442526.XA
Authority: CN
Inventors: 曹欣田; 靳晓晨; 张红亮
Original assignee: Shanghai Point Information Technology Co Ltd
Current assignee: Shanghai Point Information Technology Co Ltd
Priority date: 2018-11-29
Filing date: 2018-11-29
Publication date: 2019-04-02

Abstract

本发明内容公开了基于人工智能获取用于客户信用风险评估的信息的方法、设备及存储设备，所述方法包括：获取客户的文本痕迹；基于客户信息，采用命名实体识别技术从文本痕迹中得到与客户信息相关的所有条目；对每个条目进行语句处理来确定条目的句子组成成分；基于每个条目的句子组成成分对条目进行反欺诈过滤，确定客户是否命中与欺诈相关联的风险控制规则；基于关注词词库、风险词库以及每个过滤后的条目的句子组成成分对条目进行信息抽取处理，确定条目是否命中任一风险控制规则；以及对每个过滤后的条目进行情感分析处理以得到与客户有关的经营分析评价。本发明内容从多个维度提供了用于风险评估的信息，提高了授信审批的效率和监控频率。

Description

基于人工智能获取客户信用风险评估信息的方法及设备

技术领域

本发明内容涉及客户信用评估技术领域，更为具体地涉及一种基于人工智能获取用于客户信用风险评估的信息的方法、一种基于人工智能获取用于客户信用风险评估的信息的设备及一种相应的计算机可读存储介质。

背景技术

在传统的银行信贷实践中，传统的风险评估是劳动密集型的行业，处理客户的风险评估消耗的时间成本和人力成本较大；并且风险评估依赖于企业的资产负债表、利润表、现金流量表以及纳税情况等信息，但是小微企业普遍缺失这些信息，从而在现有金融信贷实践中，小微企业的授信审核、还款监控、客户关系管理通常一方面依赖对企业的贷前、贷中、贷后的经营流水进行评估或监控，另一方面来自各种征信数据反映的司法、工商等信息。例如，为了获得客户的非经营相关的信息，风险控制方现在大多采取对接第三方征信数据的方式，获得客户工商信息、司法信息等负面征信信息；同时如果可以有人工介入，则会人工在搜索引擎搜寻客户名称以发现是否在网上有负面信息。

人工智能(Artificial Intelligence，英文缩写为AI)，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着大数据和人工智能技术的发展，信用贷款行业开始向技巧型和智能化发展。例如，有的机构可以通过采用机器语音或者智能客服来辅助人工对客户进行与风险评估相关的信息的核实。

发明内容

本发明的实施例提供了一种基于人工智能获取用于客户信用风险评估的信息的方法、设备及计算机可读存储介质，可以利用对小微企业在互联网中留下的文本痕迹进行分析，从而极大地减少客户信用评估过程中的人工干预，提高了后续信贷审批和监控的效率，同时也可以与其他的风控规则或模型有机结合。

针对上述问题，本发明内容的第一方面提出了基于人工智能获取用于客户信用风险评估的信息的方法，所述方法包括：

A.获取客户的文本痕迹；

B.基于客户信息，采用命名实体识别技术从所述文本痕迹中得到与所述客户信息相关的所有条目；

C.对每个条目进行语句处理来确定所述条目的句子组成成分；

D.基于每个条目的句子组成成分对所述条目进行反欺诈过滤，确定所述客户是否命中与欺诈相关联的风险控制规则；

E.基于关注词词库、风险词库以及每个过滤后的条目的句子组成成分对所述条目进行信息抽取处理，确定所述条目是否命中任一风险控制规则；以及

F.对每个过滤后的条目进行情感分析处理以得到与所述客户有关的经营分析评价。

本发明内容的第二方面提出了基于人工智能获取用于客户信用风险评估的信息的设备，所述设备包括：

处理器；

存储器，其用于存储指令，当所述指令执行时使得所述处理器执行以下操作：

A.获取客户的文本痕迹；

本发明内容的第三方面提出了一种计算机可读存储介质，其具有存储在其上的计算机可读程序指令，所述计算机可读程序指令用于执行根据上述第一方面所述的基于人工智能获取用于客户信用风险评估的信息的方法。

依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的方法、设备以及相对应的计算机可读存储介质能够在多个维度上获得用于客户信用风险评估的信息，以便于在贷款审批过程中，尤其在人工审批的场景中能够提升审批效率和可靠度，同时本文所公开的技术方案还具备一定程度的反欺诈能力，使得通过本发明内容所得到的信息能够与其他风险控制规则、模型相互配合以得到更优化的效果。

附图说明

结合附图并参考以下详细说明，本发明的各实施例的特征、优点及其他方面将变得更加明显，在此以示例性而非限制性的方式示出了本发明的若干实施例，在附图中：

图1为依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的方法的流程图；

图2a-图2c为依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的方法的实施例之一的示意图；

图3a-图3c为依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的方法的实施例之二的示意图；

图4a-图4c为依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的方法的实施例之三的示意图；

图5a-图5b为依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的方法的实施例之四的示意图；以及

图6示出了依据本发明内容的基于人工智能获取用于客户信用风险评估的信息的设备的实施例600的示意图。

具体实施方式

以下参考附图详细描述本发明的各个示例性实施例。附图中的流程图和框图示出了根据本发明的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意，在有些作为备选的实现中，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以使用专用硬件与计算机指令的组合来实现。

本文所使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语，即“包括/包含但不限于”，表示还可以包括其他内容。术语“基于”是“至少部分地基于"。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”，等等。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。对于附图中的各单元之间的连线，仅仅是为了便于说明，其表示至少连线两端的单元是相互通信的，并非旨在限制未连线的单元之间无法通信。

本发明内容中的术语“客户”是指申请信用贷款的个人或企业。

本发明内容中的术语“文本痕迹”是指客户在互联网上操作所留下的记录以及其他人在互联网上操作留下的与客户有关的记录。

本发明内容中的术语“词性字典”是指存储各种名词、动词、形容词、副词、代词、数词及量词的数据库。

本发明内容中的术语“风险控制规则”是指基于风险控制方的风险偏好和容忍度所设定的，根据客户信息反映的不同特征而分别采取不同措施的对应关系的集合。

本发明内容中的术语“情感语义词库”是指存储正面情绪词、负面情绪词、观点引述词、虚拟语气词、转折词、名词性情感词、近义词、否定词、伪否定词的数据库。

本发明内容中的术语“小微企业”是指农、林、牧、渔业，采矿业，制造业，批发和零售业，交通运输、仓储和邮政业，住宿和餐饮业，信息传输、软件和信息技术服务业，房地产业，租赁和商务服务业，居民服务、修理和其他服务业，文化、体育和娱乐业等15个行业门类以及社会工作行业大类根据不同行业的从业人数、营业收入的标准划分的小型或微型企业(具体划分标准请参见http://www.stats.gov.cn/tjgz/tzgb/201801/t20180103_ 1569254.html)。

本发明内容的实施例主要关注以下技术问题：在现有金融信贷实践中虽然对小微企业的授信审核、还款监控、客户关系管理开发出了更先进的评估其经营状况、司法、工商等征信信息的方式，但是这些征信信息的更新严重滞后。因此，例如，对于企业法人代表的人品情况、纠纷情况、产品服务质量等等信息，风险控制方都无法获知或及时获知，而这些信息应该是经营恶化的先导指标，理应纳入风险评估体系。

为解决这些问题，本发明内容实现了基于人工智能获取用于客户信用风险评估的信息的方法，能够实现对小微企业在互联网中留下的文本痕迹进行分析。随着自然语言处理(Natural Language Processing，简称NLP)技术的发展，能够实现及时对客户在网络中留下的文本痕迹进行分析，以便于实现对小微企业的贷款前的授信审核、贷款中的还款监控、贷款后的客户关系管理等行为进行判断，最终将所获得的信息用于对客户信用的风险评估。

图1示出了基于人工智能获取用于客户信用风险评估的信息的方法的示例性流程图。在本实施例中的具体执行步骤如下：

步骤110：获取客户的文本痕迹。具体包括：

首先，基于与存储所述客户的文本痕迹的第三方之间的通信关系，从所述第三方中获取所述客户的文本痕迹，其中，所述第三方包括所述客户在其上发布信息的社交网络平台、所述客户所属领域的网络平台。

其次，基于所述客户授权，从所述客户的产品和服务所依托的网络平台中合法抓取所述客户的文本痕迹。

在本实施例中，采用爬虫技术或与提供数据的第三方的合作关系来获得客户的文本痕迹。例如，客户自身在社交网络平台上留下的动态信息、顾客在客户的产品和服务所依托的网络平台上对该客户的评论、顾客或相关人士在客户所属领域的网络平台上对客户品牌的评论等。

步骤120：基于客户信息，采用命名实体识别(Named Entity Recognition，简称NER)技术从所述文本痕迹中得到与所述客户信息相关的所有条目。

在本实施例中，对于步骤120的实现，具体采用如下操作方式：

采用正则表达式(Regular Expression)从所述文本痕迹中获得与所述客户信息相匹配的句子作为与所述客户相关的条目，并将其他无关语句删除。其中，所述客户信息是客户名称、联系方式、客户身份信息、统一社会信用代码、与所述客户相关联的店铺名称等中的一项或多项。

步骤130：对每个条目进行语句处理来确定所述条目的句子组成成分。具体如下：

首先，对所述条目进行分词处理，获得所述条目中的所有词语。

其次，基于词性字典对分词处理得到的词语进行词性标注。在本步骤中，可以通过词性字典来明确该条目中的哪些词语是名词、动词、形容词、副词、介词、连词等不同的词性。

再次，采用依存句法分析(Dependency Parsing)技术确定被词性标注的词语所属的句子组成成分。例如，基于词语的词性以及词语在条目中的位置来判断该词语属于该条目的主语、谓语、宾语或是其他句子组成成分。

步骤140：基于每个条目的句子组成成分对所述条目进行反欺诈过滤，确定所述客户是否命中与欺诈相关联的风险控制规则。

如图2a所示，示出了实现步骤140的示例性操作流程：

步骤141：将所述条目的句子组成成分与所述客户有关的其他条目的句子组成成分进行一一对比。

步骤142：确定所述条目与所述客户有关的任一其他条目之间的相似度是否超过所设定可接受的文本相似度阈值。

在确定所述相似度未超过所设定可接受的文本相似度阈值的情况下，执行步骤143，将所述条目保留。

在确定所述相似度超过所设定可接受的文本相似度阈值的情况下，执行步骤144，将所述条目作为欺诈行为删除并记录欺诈行为的数量。

然后执行步骤145，在所述欺诈行为的数量超过了所设定可接受的欺诈行为许可阈值的情况下，确定所述客户命中与欺诈相关联的风险控制规则。

如图2b所示，经计算，条目211与条目212的相似度是0.7614；如图2c所示，经计算，条目221与条目222的相似度是0.9661；在所设定可接受的文本相似度阈值大于0.77的情况下，条目211与条目212的相似度未超过所设定可接受的文本相似度阈值，则将条目211和条目212保留；同时条目221与条目222的相似度超过了所设定可接受的文本相似度阈值，则将条目221和条目222均作为欺诈行为删除，并且对于该客户的欺诈行为数量增加2条。当该客户的欺诈行为的数量超过了所设定可接受的欺诈行为许可阈值时，则该客户命中了与欺诈相关联的风险控制规则。

在本发明内容中，可接受的文本相似度阈值、可接受的欺诈行为许可阈值可以根据客户所属领域、客户自身情况以及风险控制方自身要求进行设定。

本文所采用的反欺诈过滤技术是指利用判断文本相似度技术来识别出客户刷好评的欺诈行为，从而实现本发明真实的反映客户在实际运营过程中的信用度的目的。

步骤150：基于关注词词库、风险词库以及每个过滤后的条目的句子组成成分对所述条目进行信息抽取处理，确定所述条目是否命中任一风险控制规则。

如图3a所示，示出了实现步骤150的示例性操作流程：

步骤151：确定所述过滤后的条目中的任一句子组成成分是否与所述关注词词库中的任一关注词相互匹配，其中，所述关注词词库中所包括的关注词是风险控制规则中的关键词以及所述风险控制规则衍生出的关键词。

步骤152：确定所述过滤后的条目中的任一句子组成成分是否与所述风险词库中的任一风险词相互匹配，其中，所述风险词库中所包括的风险词是命中风险控制规则的词语以及命中词语的衍生词语。

步骤153：在既存在与所述关注词词库中的关注词相互匹配的句子组成成分又存在与所述风险词库中的风险词相互匹配的句子组成成分的情况下，采用依存句法分析技术确定所述条目中存在的关注词与风险词之间的句子成分关系。

步骤154：基于所述关注词与所述风险词之间的句子成分关系确定是否命中与所述关注词和所述风险词相关联的风险控制规则。

图3b示出了步骤150中实现信息抽取的一个示例性实施例，其中，“张三拖欠员工工资三个月”，命中了客户信息词“张三”，关注词词库中的“员工”、“工资”以及风险词库中的“拖欠”，接着依存句法分析发现“张三”与“拖欠”构成了主谓关系，同时“拖欠”是核心词，且“拖欠”与“工资”构成了动宾关系，以及“员工”与“工资”构成了定中关系，确定该客户的确拖欠了工资，确定该条目命中了与拖欠工资相关联的风险控制规则。

在本文中“风险控制规则”一般分为三类：一般风险、关注风险和拒绝风险。当条目命中一般风险时，是指在此环节(例如，步骤150)中未发现客户风险，允许客户进入下一流程的评估；当条目命中关注风险时，是指在此环节(例如，步骤150)中未发现客户存在拒绝风险，允许客户进入下一流程的评估但最终要对其作出降额或提高费率的处理决定；当条目命中拒绝风险时，是指在此环节(例如，步骤150)中发现客户存在严重的信用问题并拒绝客户进入下一流程的评估。

图3c示出了步骤150中实现信息抽取的另一个示例性实施例，其中，“张三从不拖欠工资”，命中了客户信息词“张三”，关注词词库中的“员工”、“工资”以及风险词库中的“拖欠”，接着依存句法分析发现“张三”与“拖欠”构成了主谓关系，同时“拖欠”是核心词，且“拖欠”与“工资”构成了动宾关系，另外通过依存句法分析技术还确定该条目中的“从不”与“拖欠”构成了状中结构，并且由于“从不”作为否定词否定了状语中心语“拖欠”的含义，因此本条目表明客户并未拖欠工资，因此没有命中与拖欠工资相关联的风险控制规则。

本文所公开的信息抽取技术能够确定客户是否违反的任一项风险控制规则，从而将违反信息作为与客户信用风险控制相关的信息，以便于后续对客户贷款申请过程中做出拒绝处理或贷款中做出预警处理的依据。

步骤160：对每个过滤后的条目进行情感分析(Sentiment Analysis)处理以得到与所述客户有关的经营分析评价。

在步骤160中，具体包括句子级别的情感分析和属性级别的情感分析，本发明内容将采用图4a-图4c以及图5a-图5b分别对所公开的句子级别的情感分析和属性级别的情感分析进行详细描述。

如图4a-图4c所示，可以基于情感语义词库，采用双向长短期记忆技术确定所述条目是否是对所述客户的正面评价，以实现对于条目进行的句子级别的情感分析。

在图4a中，步骤1611：采用所述双向长短期记忆(Bi-directional Long Short-Term Memory，简称Bi-LSTM)技术确定所述条目中的形容词、副词与核心词的依赖关系，其中，所述核心词是与所述客户信息、风险控制规则相关联的词语。

在本步骤中，可以采用Bi-LSTM技术有效地捕捉条目中形容词、否定副词与核心词的距离较长时的依赖关系。例如“我不觉得这家餐厅好吃”，既有“不”又有“好”，并且“不”与“好”的距离较长。另外，还可以采用Bi-LSTM技术处理条目中从后至前的关系。例如，“这家分店味道不行，不如xxx的那家店好吃”，句子里有表示“好吃”的意思，但并非指代核心词，而是后句对前句做了否定。

步骤1612：基于所述情感语义词库确定所述条目中的形容词、副词是否具有褒义词含义。

在本步骤中，基于情感语义词库中存储的正负面情绪词、观点引述词、虚拟语气词、转折词、名词性情感词、否定词、伪否定词、近义词等等，来确定条目中的形容词、副词是褒义词还是贬义词。

步骤1613：采用所述双向长短期记忆技术将所述条目中的形容词、副词的褒贬程度进行权值计算。

步骤1614：当所述权值属于设定的正面评价范围内时，确定所述条目是对所述客户的正面评价。

如图4b所示，所提取的条目“M饭馆味道不错，服务挺好，值得一去”中的形容词、副词“不错”、“挺好”等均是褒义词，采用所述双向长短期记忆技术上述形容词、副词的褒贬程度进行权值计算得到的权值是0.952，当设定的正面评价范围是(0.6,1]时，则可以判断该条目属于正面评价。

如图4c所示，所提取的条目“M饭馆味道不错，但服务不好”中的形容词“不错”是褒义词、形容词“不好”是贬义词，采用所述双向长短期记忆技术上述形容词、副词的褒贬程度进行权值计算得到的权值是0.5，当设定的负面评价范围是[0,0.5)、中性评价＝[0.5,0.6]、正面评价范围是(0.6,1]时，则可以判断该条目属于中性评价。

如图5a-图5b所示，可以基于所述客户所属领域的语料库抽取所述条目中的一个或多个标签，采用所述双向长短期记忆技术确定所述条目是否是对其包括的每个标签的正面评价，以实现对于条目进行的属性级别的情感分析。

在图5a中，步骤1621：基于所述客户所属领域的语料库，采用所述双向长短期记忆技术抽取所述条目中的一个或多个标签，其中，每个领域的语料库包括与所述领域相关联的关注词语。

例如，餐饮领域的语料库至少存储了与“味道”、“环境”、“服务”、“卫生”等相关联的关注词语。

步骤1622：针对所述条目中的每个标签，采用依存句法分析技术在所述条目中得到与每个标签相关的短语。

步骤1623：采用双向长短期记忆技术将所述短语中的形容词、副词的褒贬程度进行权值计算；

步骤1624：当所述权值属于设定的正面评价范围内时，确定所述条目中对所述标签的评价是正面评价。

如图5b所示，所提取的条目“M饭馆味道不错，但服务不好”中基于餐饮领域的语料库提取两个标签“味道”、“服务”。然后，分别针对“味道”的分句(例如，M饭馆味道不错)、“服务”的分句(例如，但服务不好)进行褒贬程度的权值计算。在本示例中，与“味道”相关联的形容词“不错”是褒义词，与“服务”相关联的形容词“不好”是贬义词，采用所述双向长短期记忆技术上述形容词的褒贬程度分别进行权值计算得到的权值是0.9、0.3，当设定的负面评价范围是[0,0.5)、中性评价＝[0.5,0.6]、正面评价范围是(0.6,1]时，则可以判断对“味道”是正面评价，对“服务”是负面评价。

在做过上述句子级别的情感分析和属性级别的情感分析之后，可以分别从上述两个维度(句子级别、属性级别)得到相应的经营分析评价。最后将这些经由分析评价、是否命中任一风险控制规则的信息与其他风控规则/模型的耦合；例如，选出最近记录(RecentRecord)、记录频率(Record Frequency)，以计算出诸如记录总数、最近90天总条数、好评占比、最近90天好评占比、记录的间隔时间等特征，训练时根据客户的行业、记录的媒介等细分领域，挑选出有效特征，以客户的逾期指标作为响应变量，结合客户的其他个人信息、经营信息、负面信息等建立出模型。

图1所示的基于人工智能获取用于客户信用风险评估的信息的方法的示例性流程图中的步骤150与步骤160可以同时执行或者先执行步骤160再执行步骤150，也即步骤150与步骤160的执行方式不限于图1所示的示例。

尽管本文所公开的基于人工智能获取用于客户信用风险评估的信息的方法能够实现从不同维度获取用于客户信用风险评估的信息(例如，是否命中与欺诈行为相关联的风险控制规则，是否命中其他风险控制规则(例如，一般风险类、关注风险类以及拒绝风险类风险控制规则)，与客户有关的经营分析评价等)，但是仅利用客户的文本痕迹决定客户信用的风险评估结果是远远不够的，还需要与该客户的其他风险控制模型进行有机结合。例如，与风险控制模型相结合，正常情况下风险控制团队都会为客户建立申请评分卡(也称为A卡)模型、行为评分卡(也称为B卡)模型以及催收评分卡(也称为C卡)模型。此时，根据客户的文本痕迹得到的相关信息可以作为变量输入这些评分卡模型中，或者综合评分模型中的特征直接作为变量进入评分卡模型中，以使评分卡模型拥有更多的信息维度，提高评分卡模型的风险评估效果。

图6示出了依据本发明内容所公开的基于人工智能获取用于客户信用风险评估的信息的设备600的示意图。从图6中可以看出，基于区块链对业务系统的文件进行处理的设备600包括处理器610以及与处理器610耦接的存储器620。其中，存储器620存储有指令。该指令在由处理器610执行时使得处理器610执行以下动作：

A.获取客户的文本痕迹；

在依据本发明内容的一个实施例中，所述步骤A进一步包括：

基于与存储所述客户的文本痕迹的第三方之间的通信关系，从所述第三方中获取所述客户的文本痕迹，其中，所述第三方包括所述客户在其上发布信息的社交网络平台、所述客户所属领域的网络平台；

基于所述客户授权，从所述客户的产品和服务所依托的网络平台中抓取所述客户的文本痕迹。

在依据本发明内容的一个实施例中，所述步骤B进一步包括：

采用正则表达式从所述文本痕迹中获得与所述客户信息相匹配的句子作为与所述客户相关的条目，其中，所述客户信息是客户名称、联系方式、客户身份信息、统一社会信用代码、与所述客户相关联的店铺名称中的一项或多项。

在依据本发明内容的一个实施例中，所述步骤C进一步包括：

对所述条目进行分词处理；

基于词性字典对分词处理得到的词语进行词性标注；

采用依存句法分析技术确定被词性标注的词语所属的句子组成成分。

在依据本发明内容的一个实施例中，所述步骤D进一步包括：

将所述条目的句子组成成分与所述客户有关的其他条目的句子组成成分进行一一对比；

确定所述条目与所述客户有关的任一其他条目之间的相似度是否超过所设定可接受的文本相似度阈值；

在确定所述相似度未超过所设定可接受的文本相似度阈值的情况下，将所述条目保留；或者

在确定所述相似度超过所设定可接受的文本相似度阈值的情况下，将所述条目作为欺诈行为删除并记录欺诈行为的数量；

在所述欺诈行为的数量超过了所设定可接受的欺诈行为许可阈值的情况下，确定所述客户命中与欺诈相关联的风险控制规则。

在依据本发明内容的一个实施例中，所述步骤E进一步包括：

确定所述过滤后的条目中的任一句子组成成分是否与所述关注词词库中的任一关注词相互匹配，其中，所述关注词词库中所包括的关注词是风险控制规则中的关键词以及所述风险控制规则衍生出的关键词；

确定所述过滤后的条目中的任一句子组成成分是否与所述风险词库中的任一风险词相互匹配，其中，所述风险词库中所包括的风险词是命中风险控制规则的词语以及命中词语的衍生词语；

在既存在与所述关注词词库中的关注词相互匹配的句子组成成分又存在与所述风险词库中的风险词相互匹配的句子组成成分的情况下，采用依存句法分析技术确定所述条目中存在的关注词与风险词之间的句子成分关系；

基于所述关注词与风险词之间的句子成分关系确定是否命中与所述关注词和所述风险词相关联的风险控制规则。

在依据本发明内容的一个实施例中，所述步骤F进一步包括：

F1.基于情感语义词库，采用双向长短期记忆技术确定所述条目是否是对所述客户的正面评价；

F2.基于所述客户所属领域的语料库抽取所述条目中的一个或多个标签，采用所述双向长短期记忆技术确定所述条目是否是对其包括的每个标签的正面评价。

在依据本发明内容的一个实施例中，所述步骤F1进一步包括：

采用所述双向长短期记忆技术确定所述条目中的形容词、副词与核心词的依赖关系，其中，所述核心词是与所述客户信息、风险控制规则相关联的词语；

基于所述情感语义词库确定所述条目中的形容词、副词是否具有褒义词含义；

采用所述双向长短期记忆技术将所述条目中的形容词、副词的褒贬程度进行权值计算；

当所述权值属于设定的正面评价范围内时，确定所述条目是对所述客户的正面评价。

在依据本发明内容的一个实施例中，所述步骤F2进一步包括：

基于所述客户所属领域的语料库，采用所述双向长短期记忆技术抽取所述条目中的一个或多个标签，其中，每个领域的语料库包括与所述领域相关联的关注词语；

针对所述条目中的每个标签，采用依存句法分析技术在所述条目中得到与每个标签相关的短语；

采用双向长短期记忆技术将所述短语中的形容词、副词的褒贬程度进行权值计算；

当所述权值属于设定的正面评价范围内时，确定所述条目中对所述标签的评价是正面评价。

此外，上述方法能够通过计算机程序产品，即计算机可读存储介质来实现。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本发明内容的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。本文所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

本文所公开的基于人工智能获取用于客户信用风险评估的信息的方法、设备及存储介质能够在对小微企业进行授信审核、二次客户开发的过程中提高对客户识别的准确度，并且能够在贷款中提高对客户的监控程度。

应当注意，尽管在上文的详细描述中提及了设备的若干装置或子装置，但是这种划分仅仅是示例性而非强制性的。根据本发明的实施例，上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之，上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。

以上所述仅为本发明的实施例可选实施例，并不用于限制本发明的实施例，对于本领域的技术人员来说，本发明的实施例可以有各种更改和变化。凡在本发明的实施例的精神和原则之内，所作的任何修改、等效替换、改进等，均应包含在本发明的实施例的保护范围之内。

虽然已经参考若干具体实施例描述了本发明的实施例，但是应该理解，本发明的实施例并不限于所公开的具体实施例。本发明的实施例旨在涵盖在所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释，从而包含所有这样的修改及等同结构和功能。

Claims

1.一种基于人工智能获取用于客户信用风险评估的信息的方法，所述方法包括：

A.获取客户的文本痕迹；

2.根据权利要求1所述的方法，其中，所述步骤A进一步包括：

3.根据权利要求1所述的方法，其中，所述步骤B进一步包括：

4.根据权利要求1所述的方法，其中，所述步骤C进一步包括：

对所述条目进行分词处理；

基于词性字典对分词处理得到的词语进行词性标注；

5.根据权利要求1所述的方法，其中，所述步骤D进一步包括：

6.根据权利要求1所述的方法，其中，所述步骤E进一步包括：

基于所述关注词与所述风险词之间的句子成分关系确定是否命中与所述关注词和所述风险词相关联的风险控制规则。

7.根据权利要求3所述的方法，其中，所述步骤F进一步包括：

F2.基于所述客户所属领域的语料库抽取所述条目中的一个或多个标签，采用所述双向长短期记忆技术确定所述条目是否是对其包括的标签的正面评价。

8.根据权利要求7所述的方法，其中，所述步骤F1进一步包括：

9.根据权利要求7所述的方法，其中，所述步骤F2进一步包括：

10.一种基于人工智能获取用于客户信用风险评估的信息的设备，所述设备包括：

处理器；

A.获取客户的文本痕迹；

11.根据权利要求10所述的设备，其中，所述步骤A进一步包括：

12.根据权利要求10所述的设备，其中，所述步骤B进一步包括：

13.根据权利要求10所述的设备，其中，所述步骤C进一步包括：

对所述条目进行分词处理；

基于词性字典对分词处理得到的词语进行词性标注；

14.根据权利要求10所述的设备，其中，所述步骤D进一步包括：

15.根据权利要求10所述的设备，其中，所述步骤E进一步包括：

16.根据权利要求12所述的设备，其中，所述步骤F进一步包括：

17.根据权利要求16所述的设备，其中，所述步骤F1进一步包括：

18.根据权利要求16所述的设备，其中，所述步骤F2进一步包括：

19.一种计算机可读存储介质，其具有存储在其上的计算机可读程序指令，所述计算机可读程序指令用于执行根据权利要求1至9中任一项所述的基于人工智能获取用于客户信用风险评估的信息的方法。