CN112069808A - 融资风控方法、装置、计算机设备及存储介质 - Google Patents
融资风控方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112069808A CN112069808A CN202011038222.4A CN202011038222A CN112069808A CN 112069808 A CN112069808 A CN 112069808A CN 202011038222 A CN202011038222 A CN 202011038222A CN 112069808 A CN112069808 A CN 112069808A
- Authority
- CN
- China
- Prior art keywords
- financing
- text
- wind control
- information
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000003058 natural language processing Methods 0.000 claims abstract description 41
- 230000004927 fusion Effects 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 21
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 230000002457 bidirectional effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000013468 resource allocation Methods 0.000 claims description 2
- 238000003672 processing method Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Abstract
本发明公开了融资风控方法、装置、计算机设备及存储介质,包括:输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;通过预设知识图谱获取所述文本实体对应的知识信息;将所述知识信息与所述文本实体进行融合以生成融合序列;通过自然语言处理模型输出所述融合序列对应的语义结果;根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。本发明实现了融资风控的机器处理,同时相比现有一般自然语义处理方法具有更强的理解能力和针对性,提升了对融资风控处理效率和安全性。
Description
技术领域
本发明涉及自然语言处理,尤其涉及一种融资风控方法、装置、计算机设备及存储介质。
背景技术
在现有的融资风控方案,例如用于保理服务中的应收账款融资风控,主要是通过人工登录到验证网站,输入担保人或登记证明编号,下载应收账款转让查询文件,然后逐笔阅读转让财产描述,根据个人语义理解来判断是否存在风险。
显然这种人工检查的方法效率不高,业务办理量依赖人员数量,不易动态扩展,不利于业务扩容。
发明内容
有鉴于此,本发明提出一种融资风控方法、装置、计算机设备及存储介质,用于解决现有技术中融资风控通过人工核查效率低下的问题。
首先,为实现上述目的,本发明提出一种融资风控方法,所述方法包括:
输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;
通过预设知识图谱获取所述文本实体对应的知识信息;
将所述知识信息与所述文本实体进行融合以生成融合序列;
通过自然语言处理模型输出所述融合序列对应的语义结果;
根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。
优选的,所述输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体包括:
对所述文本信息进行词性和语法提取以得到由若干个单词组成的文本序列;
对所述文本序列进行分词处理;
根据分词处理后的文本序列,确定所述文本序列中包含的所述文本实体。
优选的,所述通过预设知识图谱获取所述文本实体对应的知识信息之前还包括:
收集与所述文本信息相关的的原始数据以构建所述知识图谱;
从所述原始数据中提取所述文本信息对应的实体、关系和属性信息。
优选的,所述将所述知识信息与所述文本实体进行融合以生成融合序列包括:
抽取所述知识信息和所述文本实体中的依赖特征;
将所述依赖特征映射到为向量表中以作为所述自然语言处理的模型的底层特征向量。
优选的,所述通过自然语言处理模型输出所述融合序列对应的语义结果包括:
预训练所述自然语言处理模型;
将所述融合序列对应的向量表输入所述自然语言处理模型,以输出所述语义结果。
优选的,所述将所述融合序列对应的向量表输入所述自然语言处理模型以输出所述语义结果包括:
将所述向量表与所述自然语言处理模型的双向长短期记忆网络序列进行连接合并;
将连接合并所述双向长短期记忆网络序列的向量表输入所述自然语言处理模型的全连接层,以输出所述语义结果。
优选的,所述根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果之后还包括:
将根据所述语义结果或风险提示结果上传至区块链中。
为实现上述目的,本发明还提供一种融资风控装置,所述装置包括:
预处理模块,用于输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;
知识校验模块,用于通过预设知识图谱获取所述文本实体对应的知识信息;
知识融合模块,用于将所述知识信息与所述文本实体进行融合以生成融合序列;
语义输出模块,用于通过自然语言处理模型输出所述融合序列对应的语义结果;
风险预警模块,用于根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。
为实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
相较于传统技术,本发明实施例的融资风控方法、装置、计算机设备及存储介质,通过对融资文本进行文本实体的提取,然后调用知识图谱获取对应的知识信息进行校验以消除歧义,最后将融合有知识图谱知识信息的文本内容输入自然语义处理模型以得到对应语义结果,实现了融资风控的机器处理,同时相比现有一般自然语义处理方法具有更强的理解能力和针对性,提升了对融资风控处理效率和安全性。
附图说明
图1为本发明实施例的应用环境示意图;
图2为本发明实施例一的融资风控方法的流程示意图;
图3为图2中输入融资类型文本信息进行预处理以得到所述文本信息对应的文本实体的流程示意图;
图4为图2中通过预设知识图谱获取所述文本实体对应的知识信息之前的流程示意图;
图5为图2中将所述知识信息与所述文本实体进行融合以生成融合序列的流程示意图;
图6为图2中通过自然语言处理模型输出所述融合序列对应的语义结果流程示意图;
图7为图6中将所述融合序列对应的向量表输入所述自然语言处理模型以输出所述语义结果的流程示意图;
图8为本发明计算机设备之实施例三的数据的可视化装置结构示意图;
图9为本发明计算机设备之实施例四的硬件结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
请参阅图1,示出了本发明实施例的实施环境示意图。该实施环境包括:用户端10和服务端12。
用户端10是具有网络访问功能的电子设备,该设备可以是智能手机、平板电脑或者个人计算机等。
其中,用户端10安装有可以访问服务端12的程序11,用户在程序11通过账号和密码登录访问服务端12后,即可对服务端12执行特定操作和输入。
服务端12是一台服务器、若干服务器构称的服务器集群或者云计算中心。服务端12中存储了程序13,程序13包括前端模块和后端模块,前端模块和后端模块可通过接口互相调用,用户在程序11通过账号和密码登录或者通过账号和密码登录访问服务端12的程序13后,即可对程序13执行特定操作和输入。
在本实施例中,服务端12中存储有数据库和数据表。不同的数据库可以通过用户10的触发指令获取数据库中的数据。
在其他实施例中,数据库也可以存储在服务端12集群中的不同服务器,或者通过网络连接的不同网络节点中,或者存储在用户段10本地。
用户端10和服务端12通过网络连接,网络中可包括网络节点,网络可以是互联网,局域网或者区块链网络。
本发明实施例的融资风控方法可单独应用于程序11或程序13中,也可以分布式的同时应用于程序11和程序13中,或者以区块链形式存储于网络的节点中。
实施例一
本实施例的一种融资风控方法,通过对融资文本进行文本实体的提取,然后调用知识图谱获取对应的知识信息进行校验以消除歧义,最后将融合有知识图谱知识信息的文本内容输入自然语义处理模型以得到对应语义结果,实现了融资风控的机器处理,同时相比现有一般自然语义处理方法具有更强的理解能力和针对性,提升了对融资风控处理效率和安全性。
请参考图2,本实施例的一种融资风控方法,包括以下步骤:
步骤S100,输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;
在示例性的实施例中,所述融资类型文本信息具体为保理服务中的应收账款融资信息,保理服务,是一项集贸易融资、信用风险保障以及销售账户管理和催收于一体的综合性金融服务,帮助企业利用应收账款这种流动资产进一步扩大业务规模,同时,通过保理提供的信用风险保障消除赊账销售所带来的买方潜在的信用风险,减少企业的担忧。应收账款融资是指针对被保理的应收账款,可以按预先约定的比率,通常为发票金额的一部分,比如80%,当然也可以是全部,为企业提供即时的贸易融资。
风控文本信息可以由用户在融资风控系统中输入查询条件获得。其中,查询条件可以为输入担保人,或者输入登记证明编号,融资风控系统接收用户输入的查询条件后,生成融资风控信息,用户可以根据自己的需求下载融资风控信息,其中下载格式可以为PDF(Portable Document Format,可携带文档格式)文件或者表格格式等文件,读取文件中的转让财产描述,作为融资风控文本信息。
请参考图3,在示例性的实施例中,步骤S100还可以进一步包括:
步骤S101:对所述文本信息进行词性和语法提取以得到由若干个单词组成的文本序列;
具体的,文本序列是指具有一定长度,用于表达特定需求的文本,其可以是来自于任何数据源的,用于各种不同语言文字书写的语句。单词是文本序列中的基本组成元素。对于文本序列的自然语言处理是指根据序列中的单词以及单词之间的关联关系,得出文本序列想要表达的用户需求的过程。在示例性的实施例中,利用词性标注工具和语法结构工具可以分别将输入文本的词性、语法结构标注出来,得到文本序列。
步骤S102:对所述文本序列进行分词处理;
具体的,对所述文本序列进行分词处理,获得多个单词。分词处理是一项非常常用的处理方式,经过分词处理后的文本序列可以被切分为多个按次序排列的单词。在示例性的实施例中,获取分词后,识别并删除所述单词中的停用词。“停用词”是一些没有实际含义,普遍存在于语句中的词语。这些词语需要在进行自然语言处理和分析前删除,以提升处理效率和避免干扰。在实际操作过程中,可以提供预先建立的停用词表或者停用词词典来识别和删除原文本信息中包含的停用词。具体的停用词可以根据实际情况而进行设定。
步骤S103:根据分词处理后的文本序列,确定所述文本序列中包含的所述文本实体;
具体的,实体是指现实世界中具有区别性,可以独立存在的事务或者抽象概念。例如“南京市””和“长江大桥”等等都可以被认为是一个实体。在一段文本序列中,可以包含有多个不同的实体。在示例性的实施例中,通过自然语言处理模型,确定所述文本序列中包含的实体。
步骤S200:通过预设知识图谱获取所述文本实体对应的知识信息;
具体的,知识图谱本质上是一种语义网络。其结点代表实体或者概念,边代表实体/概念之间的各种语义关系。其作为一个知识库,可以通过实体-关系-实体以及实体-属性-属性值等的三元数组来表达和描述具体的事实,每一个实体是一个独立的节点,通过边的方式与其他实体、属性或者属性值相关联。其中,属性是用于描述实体,一个实体可能具有多个不同的属性,属性值是属性的取值,都是知识图谱中的节点。关系表示两个实体之间的联系关系,在知识图谱中由边来表示。
请参考图4,在示例性的实施例中,步骤S200之前可以进一步包括:
步骤S201:收集与所述文本信息相关的的原始数据以构建所述知识图谱;
步骤S202:从所述原始数据中提取所述文本信息对应的实体、关系和属性信息。
在确定文本序列中包含的实体后,可以相应的在知识图谱中寻找相同的实体,从而得到该实体的相关知识。考虑到不同的实体在知识图谱中以节点的形式存在。在本实施例中,以知识信息来表示该实体节点与其他节点之间的关联。具体可以使用任何类型的方式构建需要使用的知识图谱,将松散的数据组织成便于计算机处理和使用的数据。
例如,首先收集公开可用的结构化数据、半结构化数据和非结构化数据。然后,针对不同的数据类型,利用不同的方式从数据中提取实体、关系和属性等信息。
利用知识图谱解释文本中的实体,例如文本:“南京市长江大桥”,解析时可能会理解为“南京市长江大桥”或者“南京市长江大桥”,但是知识图谱分析南京市长是“张三”,或其他人,没有“江大桥”这个人,所以根据知识图谱判断理解是“南京市长江大桥”,这样有助于消除分歧。知识图谱还可以增加关联属性,比如公司和法人,公司和主营商品等等,这些内容都有助于提高自然能语言处理模型的信息抽取能力。
步骤S300:将所述知识信息与所述文本实体进行融合以生成融合序列;
具体的,融合序列是指将知识图谱提供的知识信息与文本序列对应的实体进行信息融合后获得的输出序列。换言之,融合是在文本序列的单词中添加有该单词对应的实体在知识图谱中记录的知识信息。
如上所记载的,知识图谱中存在有多个不同的实体节点。知识信息就是指该实体节点在知识图谱中与其他的节点之间的连接关系。例如,在知识图谱中,可以获得“张三”这一实体节点存在与属性节点“市长”之间的联系。由此,可以将其作为知识信息与文本序列中包含的单词“张三”进行信息融合。
通过在进行自然语言处理前,将外部知识引入文本序列的方式可以很好的帮助提升语义理解的准确性,尤其是在一些特殊的专业领域中,可以令模型更好的辨识这些专业领域中的特别术语或者特定的表达方式。
请参考图5,在示例性的实施例中,步骤S300还可以进一步包括:还包括:
步骤S301:抽取所述知识信息和所述文本实体中的依赖特征;
步骤S302:将所述依赖特征映射到为向量表中以作为所述自然语言处理的模型的底层特征向量。
将知识信息和文本实体中单词均转换为向量表,以提供深度学习模型所需要的底层特征向量。
具体的,该向量化过程可以被通过数据编码和重解码的方法实现。具体为,抽取知识信息和单词的特征,将其映射到对应的向量中。对于文本序列而言,不同的单词之间总是会存在有依赖关系,知识图谱中的实体信息也类似。亦即,某些单词之间是存在强联系的,通过其组合表达特定的内在含义。例如,某些句式中特定的语法特征。在示例性的实施例中,在进行向量化时,可以基于注意力机制,捕获不同的所述单词之间以及不同的所述实体信息之间的依赖关系。
步骤S400,通过自然语言处理模型输出所述融合序列对应的语义结果。
具体的,请参考图6,步骤S400具体包括:
步骤S410:预训练所述自然语言处理模型;
预训练是通过设计好的网络结构来做语言模型任务,然后把大量甚至是无穷尽的无标注的自然语言文本利用起来,预训练任务把大量语言学知识抽取出来编码到网络结构中,当手头任务带有标注信息的数据有限时,这些先验的语言学特征当然会对手头任务有极大的特征补充作用,因为当数据有限的时候,很多语言学现象是覆盖不到的,泛化能力就弱,集成尽量通用的语言学知识自然会加强模型的泛化能力。
步骤S420:将所述融合序列对应的向量表输入所述自然语言处理模型,以输出所述语义结果。
其中,请参考图7,步骤S420具体包括:
步骤S421:将所述向量表与所述自然语言处理模型的双向长短期记忆网络序列进行连接合并;
步骤S422:将连接合并所述双向长短期记忆网络序列的向量表输入所述自然语言处理模型的全连接层,以输出所述语义结果。
将融合序列作为模型的输入,经过训练好模型的计算后,可以输出融合序列的意图,用以表示对应文本信息的语义。
在示例性的实施例中,本方法基于自然语言处理的应收账款融资风控方法中,包括输入查询条件,可以选择输入担保人,或者输入登记证明编号;下载登记信息;下载PDF文件或者表格格式等文件;读取文件中的转让财产描述;NLP(Natural LanguageProcessing,自然语言处理)信息抽取,其中,NLP信息抽取通过训练完成的自然语言处理模型实现,在本实施例中,自然语言处理模型的结构包括:
输入层:输入读取的“转让财产描述”对应的文本。
嵌入层:对输入文本编码,为提高NLP性能,使用中文预训练模型作为编码器。
双向长短期记忆网络层:在本实施例中,在双向长短期记忆网络层、全连接层之间融入先验知识,先验知识包含词性标注、语法结构和知识图谱,将这些先验知识应用到本实施例的自然语言处理模型中,可以达到更好的信息抽取效果。
全连接层:将输出限定在规定的类别上。
逻辑回归层:选取最大概率类别。
返回结果层。例如:发票编号、公司名称等等。
举例如下:当输入文本为:【浙江AAA消防工程有限公司】将与【金华BBB置业有限公司】签订的【金华市CCC项目消防工程】(008.001-工程施工类-2018-0341)项下应收账款人民币【346250.6600】元(付款单编号:【工程施工类-2019-0580】)转让给【EEE资产管理有限公司】,对应发票号:【30577857】
输出:
{"result":
{"公司名称":
["宁波FFF投资有限公司",
"浙江AAA消防工程有限公司",
"深圳GGG商业保理有限公司"],
"发票编号":["36284495","36284496"],
"合同名称":["HHH项目消防工程承包合同"],
"合同编号":["008.001-工程施工类-2018-0341"],
"相关金额":["1547061.0000"]}}。
步骤S500,根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。
具体的,对比输出结果和现有的融资信息,当现有的融资信息中包括输出结果时,则确定为重复融资。
例如,在以上输出的结果中公司名称、发票编号,合同名称等出现在现在已有的融资信息中时,确定为重复融资,输出对应的风险提示结果,例如“疑似重复融资,请核查!”等。
在本实施例中,步骤S500之后还包括:
将根据所述语义结果或风险提示结果上传至区块链中。
所述所述语义结果或风险提示结果得到对应的摘要信息,具体来说,摘要信息由所述语义结果或风险提示结果进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证所述语义结果或风险提示结果是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例提供的融资风控方法、装置、计算机设备及存储介质,通过对融资文本进行文本实体的提取,然后调用知识图谱获取对应的知识信息进行校验以消除歧义,最后将融合有知识图谱知识信息的文本内容输入自然语义处理模型以得到对应语义结果,实现了融资风控的机器处理,同时相比现有一般自然语义处理方法具有更强的理解能力和针对性,提升了对融资风控处理效率和安全性。
实施例二
请继续参阅图8,示出了本发明知识图谱的推荐装置的程序模块示意图。在本实施例中,融资风控装置20可以包括或被分割成一个或程序模块,一个或者程序模块被存储于存储介质中,并由一个或处理器所执行,以完成本发明,并可实现上述融资风控方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述融资风控装置20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
预处理模块201,用于输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;
知识校验模块202,用于通过预设知识图谱获取所述文本实体对应的知识信息;
知识融合模块203,用于将所述知识信息与所述文本实体进行融合以生成融合序列;
语义输出模块204,用于通过自然语言处理模型输出所述融合序列对应的语义结果;
风险预警模块205,用于根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。
实施例三
参阅图9,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者服务器所组成的服务器集群)等。如图9所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及融资风控装置20。其中:
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如上述实施例所述的融资风控装置20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行融资风控装置20,以实现上述实施例的融资风控方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图9仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述知识图谱的推荐装置20还可以被分割为一个或者程序模块,所述一个或者程序模块被存储于存储器21中,并由一个或处理器(本实施例为处理器22)所执行,以完成本发明。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储知识图谱的推荐装置20,被处理器执行时实现上述实施例所述的融资风控方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种融资风控方法,其特征在于,所述方法包括:
输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;
通过预设知识图谱获取所述文本实体对应的知识信息;
将所述知识信息与所述文本实体进行融合以生成融合序列;
通过自然语言处理模型输出所述融合序列对应的语义结果;
根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。
2.如权利要求1所述的融资风控方法,其特征在于,所述输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体包括:
对所述文本信息进行词性和语法提取以得到由若干个单词组成的文本序列;
对所述文本序列进行分词处理;
根据分词处理后的文本序列,确定所述文本序列中包含的所述文本实体。
3.如权利要求1或2所述的融资风控方法,其特征在于,所述通过预设知识图谱获取所述文本实体对应的知识信息之前还包括:
收集与所述文本信息相关的的原始数据以构建所述知识图谱;
从所述原始数据中提取所述文本信息对应的实体、关系和属性信息。
4.如权利要求3所述的融资风控方法,其特征在于,所述将所述知识信息与所述文本实体进行融合以生成融合序列包括:
抽取所述知识信息和所述文本实体中的依赖特征;
将所述依赖特征映射到为向量表中以作为所述自然语言处理的模型的底层特征向量。
5.如权利要求4所述的融资风控方法,其特征在于,所述通过自然语言处理模型输出所述融合序列对应的语义结果包括:
预训练所述自然语言处理模型;
将所述融合序列对应的向量表输入所述自然语言处理模型,以输出所述语义结果。
6.如权利要求5所述的融资风控方法,其特征在于,所述将所述融合序列对应的向量表输入所述自然语言处理模型以输出所述语义结果包括:
将所述向量表与所述自然语言处理模型的双向长短期记忆网络序列进行连接合并;
将连接合并所述双向长短期记忆网络序列的向量表输入所述自然语言处理模型的全连接层,以输出所述语义结果。
7.如权利要求6所述的融资风控方法,其特征在于,所述根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果之后还包括:
将根据所述语义结果或风险提示结果上传至区块链中。
8.一种融资风控装置,其特征在于,所述装置包括:
预处理模块,用于输入融资类型文本信息进行预处理,以得到所述文本信息对应的文本实体;
知识校验模块,用于通过预设知识图谱获取所述文本实体对应的知识信息;
知识融合模块,用于将所述知识信息与所述文本实体进行融合以生成融合序列;
语义输出模块,用于通过自然语言处理模型输出所述融合序列对应的语义结果;
风险预警模块,用于根据所述语义结果比对历史融资数据,当所述语义结果匹配所述历史融资数据时,输出对应的风险提示结果。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述融资风控方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项所述融资风控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011038222.4A CN112069808A (zh) | 2020-09-28 | 2020-09-28 | 融资风控方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011038222.4A CN112069808A (zh) | 2020-09-28 | 2020-09-28 | 融资风控方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112069808A true CN112069808A (zh) | 2020-12-11 |
Family
ID=73683565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011038222.4A Pending CN112069808A (zh) | 2020-09-28 | 2020-09-28 | 融资风控方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112069808A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598519A (zh) * | 2020-12-28 | 2021-04-02 | 深圳市佑荣信息科技有限公司 | 基于nlp技术的应收账款质押转让登记财产的系统及方法 |
CN116228265A (zh) * | 2023-03-24 | 2023-06-06 | 北京中诺链捷数字科技有限公司 | 发票风险识别方法、装置和设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201126442A (en) * | 2010-01-29 | 2011-08-01 | Vteam System Co Ltd | A system to avoid duplicated accounts receivable (A/R) assignments and/or advancements |
CN106157140A (zh) * | 2014-09-25 | 2016-11-23 | 天逸财金科技服务股份有限公司 | 交易单据比对方法及系统 |
CN109345399A (zh) * | 2018-10-23 | 2019-02-15 | 平安科技(深圳)有限公司 | 理赔风险评估方法、装置、计算机设备及存储介质 |
CN109522465A (zh) * | 2018-10-22 | 2019-03-26 | 国家电网公司 | 基于知识图谱的语义搜索方法及装置 |
CN110363667A (zh) * | 2019-06-19 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 基于ai的订单融资处理方法、装置、计算机设备及存储介质 |
US20190333143A1 (en) * | 2018-04-30 | 2019-10-31 | Darren Williams | System for enabling short-term financing |
CN111026842A (zh) * | 2019-11-29 | 2020-04-17 | 微民保险代理有限公司 | 自然语言处理方法、自然语言处理装置及智能问答系统 |
CN111061856A (zh) * | 2019-06-06 | 2020-04-24 | 北京理工大学 | 一种基于知识感知的新闻推荐方法 |
CN111652704A (zh) * | 2020-06-09 | 2020-09-11 | 唐松 | 一种基于知识图谱和图深度学习的金融信用风险评估方法 |
-
2020
- 2020-09-28 CN CN202011038222.4A patent/CN112069808A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201126442A (en) * | 2010-01-29 | 2011-08-01 | Vteam System Co Ltd | A system to avoid duplicated accounts receivable (A/R) assignments and/or advancements |
CN106157140A (zh) * | 2014-09-25 | 2016-11-23 | 天逸财金科技服务股份有限公司 | 交易单据比对方法及系统 |
US20190333143A1 (en) * | 2018-04-30 | 2019-10-31 | Darren Williams | System for enabling short-term financing |
CN109522465A (zh) * | 2018-10-22 | 2019-03-26 | 国家电网公司 | 基于知识图谱的语义搜索方法及装置 |
CN109345399A (zh) * | 2018-10-23 | 2019-02-15 | 平安科技(深圳)有限公司 | 理赔风险评估方法、装置、计算机设备及存储介质 |
CN111061856A (zh) * | 2019-06-06 | 2020-04-24 | 北京理工大学 | 一种基于知识感知的新闻推荐方法 |
CN110363667A (zh) * | 2019-06-19 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 基于ai的订单融资处理方法、装置、计算机设备及存储介质 |
CN111026842A (zh) * | 2019-11-29 | 2020-04-17 | 微民保险代理有限公司 | 自然语言处理方法、自然语言处理装置及智能问答系统 |
CN111652704A (zh) * | 2020-06-09 | 2020-09-11 | 唐松 | 一种基于知识图谱和图深度学习的金融信用风险评估方法 |
Non-Patent Citations (2)
Title |
---|
XIAOJUAN ZHAO ET AL: "Multi-source knowledge fusion:a survey", 《WORLD WIDE WEB》, 8 April 2020 (2020-04-08), pages 2567 - 2592, XP037172940, DOI: 10.1007/s11280-020-00811-0 * |
赵杰著: "《搜索引擎技术》", 哈尔滨:哈尔滨工程大学出版社, pages: 76 - 95 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598519A (zh) * | 2020-12-28 | 2021-04-02 | 深圳市佑荣信息科技有限公司 | 基于nlp技术的应收账款质押转让登记财产的系统及方法 |
CN116228265A (zh) * | 2023-03-24 | 2023-06-06 | 北京中诺链捷数字科技有限公司 | 发票风险识别方法、装置和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457302B (zh) | 一种结构化数据智能清洗方法 | |
CN109189888B (zh) | 电子装置、侵权分析的方法及存储介质 | |
CN112015430A (zh) | JavaScript代码翻译方法、装置、计算机设备及存储介质 | |
CN101231651A (zh) | 计算计算机网络上电子文档的重要性的计算机装置和方法 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN112149387A (zh) | 财务数据的可视化方法、装置、计算机设备及存储介质 | |
CN115618371A (zh) | 一种非文本数据的脱敏方法、装置及存储介质 | |
CN112069808A (zh) | 融资风控方法、装置、计算机设备及存储介质 | |
CN115687647A (zh) | 公证文书生成方法、装置、电子设备及存储介质 | |
CN114461761A (zh) | 基于标签匹配的搜索方法、系统、计算机设备及存储介质 | |
CN113869789A (zh) | 一种风险监控的方法、装置、计算机设备及存储介质 | |
CN111984674A (zh) | 结构化查询语言的生成方法及系统 | |
CN117195886A (zh) | 基于人工智能的文本数据处理方法、装置、设备及介质 | |
CN113626605B (zh) | 信息分类方法、装置、电子设备及可读存储介质 | |
CN114492446B (zh) | 法律文书处理方法、装置、电子设备及存储介质 | |
CN113705201B (zh) | 基于文本的事件概率预测评估算法、电子设备及存储介质 | |
CN111429110B (zh) | 门店标准化审核方法、装置、设备及存储介质 | |
CN113344674A (zh) | 基于用户购买力的产品推荐方法、装置、设备及存储介质 | |
CN112818199A (zh) | 网页访问方法、装置、计算机设备及存储介质 | |
CN113704478B (zh) | 文本要素提取方法、装置、电子设备及介质 | |
CN113688049B (zh) | 基于录入信息的可回溯性检测方法、装置、设备及介质 | |
US20240152706A1 (en) | Translation Review Suitability Assessment | |
WO2019019456A1 (zh) | 理赔数据处理方法、装置、计算机设备和存储介质 | |
CN116702779A (zh) | 地址识别方法和装置、电子设备及存储介质 | |
CN113449115A (zh) | 佛学数据收集方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201211 |