CN111178704B - 一种风险目标识别方法及设备 - Google Patents

一种风险目标识别方法及设备 Download PDF

Info

Publication number
CN111178704B
CN111178704B CN201911303356.1A CN201911303356A CN111178704B CN 111178704 B CN111178704 B CN 111178704B CN 201911303356 A CN201911303356 A CN 201911303356A CN 111178704 B CN111178704 B CN 111178704B
Authority
CN
China
Prior art keywords
risk
data
target
message
cleaning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911303356.1A
Other languages
English (en)
Other versions
CN111178704A (zh
Inventor
邸宏鸣
惠昱禅
王钒骁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongfang Weiyin Technology Co ltd
Oriental micro bank technology (Chongqing) Co.,Ltd.
Original Assignee
Oriental Micro Silver Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oriental Micro Silver Technology Beijing Co ltd filed Critical Oriental Micro Silver Technology Beijing Co ltd
Priority to CN201911303356.1A priority Critical patent/CN111178704B/zh
Publication of CN111178704A publication Critical patent/CN111178704A/zh
Application granted granted Critical
Publication of CN111178704B publication Critical patent/CN111178704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种风险目标识别方法及设备,通过获取目标对象不同来源的数据报文;利用结构化查询语句对所述数据报文进行数据整理,生成标准报文;根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项;根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分;根据所述真实风险得分识别风险目标。通过应用本申请的技术方案,可以对目标进行客观的风险等级评价,准确识别出风险目标,可以做到准确掌握目标对象目前的真实风险情况或危害等级,进而可以对目标对象进行更为准确的判断或限制、监控等措施。

Description

一种风险目标识别方法及设备
技术领域
本发明涉及数据分析领域,特别是指一种风险目标识别方法及设备。
背景技术
随着现代社会的发展及互联网技术的普及,越来越多的休闲、经济或社会活动移动到了互联网中进行。从而如何确定出这些活动中的风险目标成为一个越来越热门的话题。目前市场上现有技术多数使用的数据都是通过目标自主上传的数据,再结合自身风控模型得到一个对目标的风险评价,但是这种结果很难被应用,因为由于是自主上传的数据,目标数据中大部分关键数据往往都是被夸大或经过修饰的数据,这直接导致风险结果的不准确,而这部分不准确的风险会直接或间接的被其他提供服务的机构或个人所承担。
发明内容
有鉴于此,本发明的目的在于提出一种风险目标识别方法及设备,用以对目标进行客观的风险等级评价,准确识别出风险目标。
基于上述目的,一方面,本发明提供了一种风险目标识别方法,包括:
获取目标对象不同来源的数据报文;
利用结构化查询语句对所述数据报文进行数据整理,生成标准报文;
根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项;
根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分;
根据所述真实风险得分识别风险目标。
在一些实施方式中,所述利用结构化查询语句对所述数据报文进行数据整理,生成标准报文,具体包括:
根据编码规则对所述数据报文进行解析,提取键值对模式的数据字段;
利用所述结构化查询语句对所述数据字段进行结构调整,生成标准字段;
根据预设的清洗规则,将所述标准字段与所述清洗规则进行匹配并执行字段清洗,生成所述标准报文。
在一些实施方式中,所述根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项,具体包括:
根据所述指标构造规则,确定所述风险指标项需要的报文字段及标准值,按照构建所述风险指标项的所述指标构造规则对所述报文字段中的数据进行计算得到计算值,所述标准值及所述计算值构成所述风险指标项。
在一些实施方式中,所述通过所述风险指标项及所述权重值,得到真实风险得分,具体包括:
计算所述计算值与所述标准值之间的偏离度,根据预设的评分对照表及所述偏离度,确定所述风险指标项的初始风险得分;
结合所述初始风险得分及所述权重值,得到真实风险得分。
在一些实施方式中,所述根据所述真实风险得分识别风险目标,具体包括:
汇总所有所述真实风险得分得到最终风险等级,当所述最终风险等级满足预设条件时,认定目标为风险目标,输出所述最终风险等级。
在一些实施方式中,所述输出目标对象的所述最终风险等级之后,还包括:
根据所有所述数据报文,按照预设的画像规则,生成目标画像;
将所述最终风险等级作为风险等级项加入所述目标画像,生成目标风险画像,输出所述目标风险画像。
另一方面,本申请还提供了一种风险目标识别设备,包括:
获取模块,获取目标对象不同来源的数据报文;
整理模块,利用结构化查询语句对所述数据报文进行数据整理,生成标准报文;
构件模块,根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项;
计算模块,根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分;
识别模块,根据所述真实风险得分识别风险目标。
在一些实施方式中,所述整理模块利用结构化查询语句对所述数据报文进行数据整理,生成标准报文,具体包括:
根据编码规则对所述数据报文进行解析,提取键值对模式的数据字段;
利用所述结构化查询语句对所述数据字段进行结构调整,生成标准字段;
根据预设的清洗规则,将所述标准字段与所述清洗规则进行匹配并执行字段清洗,生成所述标准报文。
在一些实施方式中,所述构件模块根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项,具体包括:
根据所述指标构造规则,确定所述风险指标项需要的报文字段及标准值,按照构建所述风险指标项的所述指标构造规则对所述报文字段中的数据进行计算得到计算值,所述标准值及所述计算值构成所述风险指标项。
在一些实施方式中,所述构件模块通过所述风险指标项及所述权重值,得到真实风险得分,具体包括:
计算所述计算值与所述标准值之间的偏离度,根据预设的评分对照表及所述偏离度,确定所述风险指标项的初始风险得分;
结合所述初始风险得分及所述权重值,得到真实风险得分。
在一些实施方式中,所述识别模块根据所述真实风险得分识别风险目标,具体包括:
汇总所有所述真实风险得分得到最终风险等级,当所述最终风险等级满足预设条件时,认定目标为风险目标,输出所述最终风险等级。
在一些实施方式中,所述识别模块输出目标对象的所述最终风险等级之后,还包括:
根据所有所述数据报文,按照预设的画像规则,生成目标画像;
将所述最终风险等级作为风险等级项加入所述目标画像,生成目标风险画像,输出所述目标风险画像。
从上面所述可以看出,本发明提供的一种风险目标识别方法及设备,通过获取目标对象不同来源的数据报文;利用结构化查询语句对所述数据报文进行数据整理,生成标准报文;根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项;根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分;根据所述真实风险得分识别风险目标。通过应用本申请的技术方案,可以对目标进行客观的风险等级评价,准确识别出风险目标,可以做到准确掌握目标对象目前的真实风险情况或危害等级,进而可以对目标对象进行更为准确的判断或限制、监控等措施。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提出的一种风险目标识别方法的流程示意图;
图2为本发明实施例提出的一种数据清洗指标构造的流程示意图;
图3为本发明实施例提出的一种风险目标识别设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件、物件或者方法步骤涵盖出现在该词后面列举的元件、物件或者方法步骤及其等同,而不排除其他元件、物件或者方法步骤。
如背景技术所言,现代社会,随着信息交互的越来越迅速,越来越多的业务已经摆脱传统的屯长的交互过程,变的越来越迅捷便利。但随之而来的是,各行各业对客户或目标的风险把控要求也越来越高,其主要体现在需要更为快速的识别出客户或目标是否符合要求或没有超出风险承受范围。进而如何快速准确的确定目标是否有风险,或确定目标的风险等级为多少,然后迅速的根据目标风险进行合理的应对和调整。但是,现有技术中,目标多数使用的数据都是通过自身上传的数据或是其他渠道获得的目标数据,并结合风控模型得到一个对目标的风险结果,但是这种结果很难被应用,因为目标数据中涉及的利己数据往往都是被夸大的数据,这直接导致风险结果被高估,而这部分被高估的风险会被评价机构或对方机构或个人承担。
为此本申请设计实现了一种风险目标识别方法,通过获取目标多个来源的数据,对这些数据进行清洗整理,再提取计算,之后根据不同来源进行加权,最终确定目标的风险得分,并将风险目标识别出来。以此实现对目标进行客观的风险等级评价,准确识别出风险目标,可以做到准确掌握目标对象目前的真实风险情况或危害等级,进而可以对目标对象进行更为准确的判断或限制、监控等措施。
以下结合附图,详细说明本说明书实施例提供的技术方案。
如图1所示,为本实施例的一种风险目标识别方法的流程示意图,该方法具体包括以下步骤:
步骤101,获取目标对象不同来源的数据报文。
本步骤旨在,获取目标对象的数据报文。其中,数据报文是指可以反映目标对象的具体情况的报文,其本身通过第三方供应商进行数据收集并生成对应的报文,其数据至少包括目标对象的税务数据、财务数据、司法数据、征信数据、行业数据、工商数据等等。不同来源是指通过第三方供应商得到目标对象不同提供者的数据,作为举例:第三方供应商可以为安硕、中诚信等等;不同提供者可以为目标对象自己提供的财务报表、税务机构提供的目标对象的税务报表、纳税申报表、银行机构提供的目标对象的财政报表、贷款申报表等等。另外,本方案加入了目标对象的税务数据,做到税务、工商、司法数据的高效结合,通过集合多维度的数据,准确还原目标的真实状况。
其中,获取报文的途径可以为很多种,例如:通过接收用户手动输入的报文来获取、通过互联网查询需要的报文并获取、通过专用的对接接口由第三方直接将报文传输过来进行获取等等。同时,获取到报文后的处理也可以是很多种,例如:直接将获取到的报文进行下一步利用、将获取到的报文进行存储并在需要时再进行调取利用、将获取到的报文进行信息提取并进行存储等等。
可见,基于上述的不同的数据报文内容,可以多样并更真实的反应目标对象的真实基础状况。同时可以看出,在取得数据报文之后,还可以根据不同的具体应用场景灵活的变换对数据报文之后的处理。其不同的处理方式均不会影响本发明的保护范围。
步骤102,利用结构化查询语句对所述数据报文进行数据整理,生成标准报文。
本步骤旨在,对获取到的报文进行数据整理,使输出的报文格式和内容符合之后的数据需求。其整理过程可以包括格式的调整和数据内容的清洗等等。具体的,对报文进行格式的调整可以是:直接对报文整体进行调整,使报文格式符合之后步骤的需求;或是仅对报文的部分进行调整,例如可以是对具体数据字段、或是具体报文名称等等进行调整。同时,本申请所述的结构化查询语句即为结构化查询语言(SQL语句),其是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
之后进行清洗,其清洗的方式可以为:对整片报文进行统一的清洗,例如:去除空格、数字数据去逗号、将同种类型数据的数据单位进行统一等等;或是针对不同的字段设置不同的需求,并按照需求进行清洗,例如:对报告编号等仅进行去除空格的清洗;对数据合计等进行去除空格、数据逗号的清洗等等;对证件类型进行去除空格、人员信息识别的清洗等等。另外,清洗后的数据可以直接用于之后的步骤或是先存储于数据库中。
可见,不同的报文格式的调整方式及不同的对数据清洗方式只要能达到相应的目的,不同的方法均不会影响本发明的保护范围。
步骤103,根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项。
本步骤旨在,根据各个指标的构造规则建立对应风险指标项。其中,指标构造规则是指各个单独的指标所对应的指标计算方式,例如:指标为流动比率,则其指标构造规则为流动比率=流动资产合计/流动负债合计;指标为速动比率,则其指标构造规则为速动比率=(流动资产合计-存货)/流动负债合计;指标为保守速动比率,则其指标构造规则为保守速动比率=(货币资金+短期投资+应收票据+应收账款净额)/流动负债;指标为存货周转率,则其指标构造规则为存货周转率=产品销售成本/[(期初存货+期末存货)/2]等等。
之后,按照不同的指标需求,提取对应的字段,查找需求的数据,进行计算后生成风险指标项。其可以是:直接将数据提取出来,按照规则计算后生成风险指标项;或是获取报文中对应指标的标准值,并将数据提取计算后的结果与标准值比较生成风险指标项;或是获取报文中对应的数据并根据指标名称查找数据库中所述指标的标准值,之后再对数据进行计算,并与标准值比较后生成风险指标项等等。由此,风险指标项可以是包含标准值的,也可以是不包含标准值或标准值为空的等等。
步骤104,根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分。
本步骤旨在,根据数据报文的不同来源确定这个数据报文所对应的权重值,并将这个权重值利用到所有用这篇数据报文中数据得到的风险指标项上,从而最终计算出真实风险得分。同时,因初始数据包含税务数据等数据维度,所以可以更佳的量化目标的真实风险。
由前述可知,不同来源可以为很多种,而不同来源的数据报文往往会包含各种相同的具体数据,进而可能会生成相同的风险指标项。之后得到真实风险得分的方式可以为很多种,例如:如果存在相同项的风险指标项则结合权重计算出一个综合风险指标项,而没有相同项的风险指标项则不结合权重而直接用这个风险指标项;还可以是在没有相同项的风险指标项时还是会结合权重去计算等等。同时,由于风险指标项可能存在标准值,也可能不存在标准值,其存在标准值的可以先计算与标准值之间的偏离度,进而基于偏离度确定一个初始得分,再与权重值结合。而如果没有标准值,则可以直接通过权重来进行调整,例如:目标的财务报表等,由于其涉及的数据可能较大,从而将其对应的权重调小到一个合理的范围内。
步骤105,根据所述真实风险得分识别风险目标。
本步骤旨在,根据得分识别出风险目标。其中,真实风险得分的形式本身就可以为很多种,例如:针对目标很可能存在多个指标或数据项,从而真实风险得分可以是以报表形式出现的,也可以是将全部的数据项汇总后得到的一个具体数值等。
从而,通过真实风险得分识别风险目标的方式可以为,将全部真实风险得分汇总后得到一个具体得分,之后再根据这个具体得分按照预设的风险目标得分阈值,判断出目标对象是否为风险对象;还可以为,针对每个真实风险得分进行单独评价,之后根据孰严原则,即选取评价结果最严重的一个作为对象的风险等级,再基于这个风险等级判断目标对象是否为风险对象等等。
之后,当识别出风险对象后,可以直接输出评判结果进行展示,或将风险对象进行醒目表示;还可以对风险对象执行更为严格的审查程序或人工审查,或是降低或限制对风险对象的权限等等。
通过应用本申请的技术方案,该方案通过获取目标对象不同来源的数据报文;利用结构化查询语句对所述数据报文进行数据整理,生成标准报文;根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项;根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分;根据所述真实风险得分识别风险目标。通过应用本申请的技术方案,可以对目标进行客观的风险等级评价,准确识别出风险目标,可以做到准确掌握目标对象目前的真实风险情况或危害等级,进而可以对目标对象进行更为准确的判断或限制、监控等措施。
在本申请的可选实施例中,为了快速获取到需要的数据,并将数据迅速调整成需要的格式,建立起标准统一格式的数据报文,并有针对性的清洗每一个数据,使清洗后的每一个数据可以被精确的识别。所述利用结构化查询语句对所述数据报文进行数据整理,生成标准报文,具体包括:
根据编码规则对所述数据报文进行解析,提取键值对模式的数据字段;
利用所述结构化查询语句对所述数据字段进行结构调整,生成标准字段;
根据预设的清洗规则,将所述标准字段与所述清洗规则进行匹配并执行字段清洗,生成所述标准报文。
其中,调整的方式即为将原始的数据字段调整成本方案需要的字段格式,之后,按照具体的字段类型执行对应的清洗。例如:对报告编号等仅进行去除空格的清洗;对数据合计等进行去除空格、数据逗号的清洗等等;对证件类型进行去除空格、人员信息识别的清洗等等。
在本申请的可选实施例中,为了针对具有标准参数的风险指标项,其在生成时能同时体现出其应有的正常标准值或标准范围。所述根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项,具体包括:
根据所述指标构造规则,确定所述风险指标项需要的报文字段及标准值,按照构建所述风险指标项的所述指标构造规则对所述报文字段中的数据进行计算得到计算值,所述标准值及所述计算值构成所述风险指标项。
在本申请的可选实施例中,为了准确得出具有标准值的风险指标项的风险得分,并使风险得分依据其来源获得相应的权重配比。所述通过所述风险指标项及所述权重值,得到真实风险得分,具体包括:
计算所述计算值与所述标准值之间的偏离度,根据预设的评分对照表及所述偏离度,确定所述风险指标项的初始风险得分;
结合所述初始风险得分及所述权重值,得到真实风险得分。
其中,评分对照表是针对每个风险指标项的偏离度设定的一个对照得分表,使初始风险得分与偏离度之间存在对应关系及正相关或负相关关系。
在本申请的可选实施例中,为了综合评价目标,实现对目标整体风险的判断,防止过于严苛的评价目标而导致的可能的片面性。所述根据所述真实风险得分识别风险目标,具体包括:
汇总所有所述真实风险得分得到最终风险等级,当所述最终风险等级满足预设条件时,认定目标为风险目标,输出所述最终风险等级。
由前述可知,在判断时存在一种判断方式为选取评价结果最严重的一个作为对象的风险等级,而这种方式可能会导致判断过于严苛而导致的片面性,即,要求目标对象的每一项指标都必须正常,而只要有一项有偏差则认为目标对象是不合格的或有风险的。
在本申请的可选实施例中,为了有效全面的评价目标对象,并展示给需要的用户查阅。所述输出目标对象的所述最终风险等级之后,还包括:
根据所有所述数据报文,按照预设的画像规则,生成目标画像;
将所述最终风险等级作为风险等级项加入所述目标画像,生成目标风险画像,输出所述目标风险画像。
其中,目标画像可以为人物画像或企业画像等等,这里的画像并不是对目标对象的自然特征的描绘,而是基于目标对象的各种社会数据生成与目标对象相关的类似多维度形式的目标分析报告。
在具体的应用场景中,数据获取阶段。数据来源于第三方供应商,如:安硕、中诚信等第三方机构、银行、税务局、法院等等。通过调用专用接口,第三方供应商根据电子授权书提供数据报文。
在具体的应用场景中,对数据报文进行整理清洗过程如图2所示。利用SQL语句从数据库中提取数据,并对提取数据进行整合,对各项数据的原始表名进行替换,成为标准表名,清洗主要针对不同的字段进行清洗,直接通过SQL进行过滤清洗,清洗及构造之后的数据以标准表形式存储于数据库中。根据标准的字段名称确定该字段需要执行何种的清洗规则,再根据清洗规则清洗对应的数据。经过清洗规则之后,得到的字段就是最终用于分析以及指标构建的字段。
在具体的应用场景中,目标对象的不同来源可以包括:税务数据、财务数据、司法数据、征信数据、行业数据、工商数据、基本情况等等。而方案会针对每一个来源的数据进行多方评价,汇总所有评价后最终评估出针对每个来源的权重值。例如:对于税务数据邀请多方专家进行评价打分,企业专家、机构专家、行业专家等等,综合评分求取均值之后再以此得到税务数据具体的权重值。
在具体的应用场景中,如对企业目标的风险识别中,在进行目标画像时,先将洗后的数据字段导入“企业风险画像”系统中,运用“画像模型”将不同字段组成指标,通过将企业不同指标按照不同行业不同权重比例的方式进行汇总组成专属于企业的模块,这些不同维度模块可以从“企业基本情况”、“司法情况”、“税务情况”、“工商情况”、“企业征信”、“个人征信”等维度组成一幅初步的“企业画像”模型。之后,把企业的最终风险等级导入“企业画像”模型中,并对风险目标进行显著表示。使得两大块模型结果进行结合,将企业量化的最终风险等级,通过“企业画像”的形式变成简单易懂的可视化“企业风险画像”,企业最终风险等级输入到“企业风险画像”模型中结合其他不同维度进行分析,由“企业风险画像”系统对企业各维度数据进行解读汇总,输出的结果是精准的企业风险情况,并通过用户画像系统可以进行查询及图谱展示。本方案对现有技术模型进行了升级,在模型中增加更多的可以验证目标信息的数据维度,其中就包括税务数据、工商、司法等数据,通过增加非目标财务信息数据维度(非目标自主提供的),可以更加精准的分析目标当前真实状况,从整体上分析目标的现状及风险。通过加入对税务数据的解读、分析,使风险目标识别方法和目标画像有了共同的维度,两者得出的结果可以更好地融合,从税务的角度发现目标隐藏的风险,也可以将目标画像变得更加精确。同时加入税务数据,也使得风险预测模型更加完整,预测的准确度更高。
基于同一发明构思,本发明实施例还提供了一种风险目标识别设备,如图3所示,包括:
获取模块301,获取目标对象不同来源的数据报文;
整理模块302,利用结构化查询语句对所述数据报文进行数据整理,生成标准报文;
构件模块303,根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项;
计算模块304,根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分;
识别模块305,根据所述真实风险得分识别风险目标。
在一个可选的实施例中,所述整理模块302利用结构化查询语句对所述数据报文进行数据整理,生成标准报文,具体包括:
根据编码规则对所述数据报文进行解析,提取键值对模式的数据字段;
利用所述结构化查询语句对所述数据字段进行结构调整,生成标准字段;
根据预设的清洗规则,将所述标准字段与所述清洗规则进行匹配并执行字段清洗,生成所述标准报文。
在一个可选的实施例中,所述构件模块303根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项,具体包括:
根据所述指标构造规则,确定所述风险指标项需要的报文字段及标准值,按照构建所述风险指标项的所述指标构造规则对所述报文字段中的数据进行计算得到计算值,所述标准值及所述计算值构成所述风险指标项。
在一个可选的实施例中,所述构件模块303通过所述风险指标项及所述权重值,得到真实风险得分,具体包括:
计算所述计算值与所述标准值之间的偏离度,根据预设的评分对照表及所述偏离度,确定所述风险指标项的初始风险得分;
结合所述初始风险得分及所述权重值,得到真实风险得分。
在一个可选的实施例中,所述识别模块305根据所述真实风险得分识别风险目标,具体包括:
汇总所有所述真实风险得分得到最终风险等级,当所述最终风险等级满足预设条件时,认定目标为风险目标,输出所述最终风险等级。
在一个可选的实施例中,所述识别模块305输出目标对象的所述最终风险等级之后,还包括:
根据所有所述数据报文,按照预设的画像规则,生成目标画像;
将所述最终风险等级作为风险等级项加入所述目标画像,生成目标风险画像,输出所述目标风险画像。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种风险目标识别方法,其特征在于,包括:
获取目标对象不同来源的数据报文,其中,数据报文是指反映目标对象的具体情况的报文,其本身通过第三方供应商进行数据收集并生成对应的报文,不同来源是指通过第三方供应商得到目标对象不同提供者的数据;
利用结构化查询语句对所述数据报文进行数据整理,生成标准报文,具体包括: 根据编码规则对所述数据报文进行解析,提取键值对模式的数据字段;利用所述结构化查询语句对所述数据字段进行结构调整,生成标准字段;根据预设的清洗规则,将所述标准字段与所述清洗规则进行匹配并执行字段清洗,生成所述标准报文;所述数据整理是直接对报文整体进行调整或是仅对报文的部分进行调整,包括对数据字段、或是报文名称进行调整,所述清洗的方式包括对整片报文进行统一的清洗,包括去除空格、数字数据去逗号、将同种类型数据的数据单位进行统一;或是针对不同的字段设置不同的需求,并按照需求进行清洗,包括对报告编号仅进行去除空格的清洗、对数据合计进行去除空格、数据逗号的清洗、对证件类型进行去除空格;
根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项,具体包括:根据所述指标构造规则,确定所述风险指标项需要的报文字段及标准值,按照构建所述风险指标项的所述指标构造规则对所述报文字段中的数据进行计算得到计算值,所述标准值及所述计算值构成所述风险指标项;
根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分,具体包括:计算所述计算值与所述标准值之间的偏离度,根据预设的评分对照表及所述偏离度,确定所述风险指标项的初始风险得分; 结合所述初始风险得分及所述权重值,得到真实风险得分;
根据所述真实风险得分识别风险目标,汇总所有所述真实风险得分得到最终风险等级,当所述最终风险等级满足预设条件时,认定目标为风险目标,输出所述最终风险等级;根据所有所述数据报文,按照预设的画像规则,生成目标画像; 将所述最终风险等级作为风险等级项加入所述目标画像,生成目标风险画像,输出所述目标风险画像。
2.一种风险目标识别设备,其特征在于,包括:
获取模块,获取目标对象不同来源的数据报文,其中,数据报文是指反映目标对象的具体情况的报文,其本身通过第三方供应商进行数据收集并生成对应的报文,不同来源是指通过第三方供应商得到目标对象不同提供者的数据;
整理模块,利用结构化查询语句对所述数据报文进行数据整理,生成标准报文,具体包括:根据编码规则对所述数据报文进行解析,提取键值对模式的数据字段; 利用所述结构化查询语句对所述数据字段进行结构调整,生成标准字段;根据预设的清洗规则,将所述标准字段与所述清洗规则进行匹配并执行字段清洗,生成所述标准报文;所述数据整理是直接对报文整体进行调整或是仅对报文的部分进行调整,包括对数据字段、或是报文名称进行调整,所述清洗的方式包括对整片报文进行统一的清洗,包括去除空格、数字数据去逗号、将同种类型数据的数据单位进行统一;或是针对不同的字段设置不同的需求,并按照需求进行清洗,包括对报告编号仅进行去除空格的清洗、对数据合计进行去除空格、数据逗号的清洗、对证件类型进行去除空格;
构件模块,根据指标构造规则,对所述标准报文进行字段提取,按照所述指标构造规则对提取字段进行计算,生成风险指标项,具体包括:根据所述指标构造规则,确定所述风险指标项需要的报文字段及标准值,按照构建所述风险指标项的所述指标构造规则对所述报文字段中的数据进行计算得到计算值,所述标准值及所述计算值构成所述风险指标项;
计算模块,根据所述数据报文的不同来源,确定所述风险指标项对应的权重值,通过所述风险指标项及所述权重值,得到真实风险得分,具体包括:计算所述计算值与所述标准值之间的偏离度,根据预设的评分对照表及所述偏离度,确定所述风险指标项的初始风险得分;结合所述初始风险得分及所述权重值,得到真实风险得分;
识别模块,根据所述真实风险得分识别风险目标,汇总所有所述真实风险得分得到最终风险等级,当所述最终风险等级满足预设条件时,认定目标为风险目标,输出所述最终风险等级;根据所有所述数据报文,按照预设的画像规则,生成目标画像; 将所述最终风险等级作为风险等级项加入所述目标画像,生成目标风险画像,输出所述目标风险画像。
CN201911303356.1A 2019-12-17 2019-12-17 一种风险目标识别方法及设备 Active CN111178704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911303356.1A CN111178704B (zh) 2019-12-17 2019-12-17 一种风险目标识别方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911303356.1A CN111178704B (zh) 2019-12-17 2019-12-17 一种风险目标识别方法及设备

Publications (2)

Publication Number Publication Date
CN111178704A CN111178704A (zh) 2020-05-19
CN111178704B true CN111178704B (zh) 2021-03-12

Family

ID=70656386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911303356.1A Active CN111178704B (zh) 2019-12-17 2019-12-17 一种风险目标识别方法及设备

Country Status (1)

Country Link
CN (1) CN111178704B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111614663B (zh) * 2020-05-20 2022-04-08 杭州蚂蚁聚慧网络技术有限公司 一种业务风险确定方法、装置及电子设备
CN111815175B (zh) * 2020-07-08 2021-01-29 睿智合创(北京)科技有限公司 一种嵌套列表形式的五层结构xml语言交互应用方法
CN111932268B (zh) * 2020-08-03 2024-01-26 中国工商银行股份有限公司 企业风险识别方法及装置
CN111932135B (zh) * 2020-08-13 2023-09-26 中国工商银行股份有限公司 基于分布式数据库的客户风险识别方法及装置
CN118171910A (zh) * 2020-08-13 2024-06-11 支付宝(杭州)信息技术有限公司 业务风险识别方法、装置及电子设备
CN114595463A (zh) * 2022-03-10 2022-06-07 浙江网商银行股份有限公司 风险检测方法以及装置
CN115239215B (zh) * 2022-09-23 2022-12-20 中国电子科技集团公司第十五研究所 一种基于深度异常检测的企业风险识别方法和系统
CN116311828A (zh) * 2023-05-11 2023-06-23 武汉科迪智能环境股份有限公司 报警管理方法、装置、计算机设备及计算机可读存储介质
CN117689484A (zh) * 2023-11-30 2024-03-12 北京罗格数据科技有限公司 一种财务风险监督方法及装置
CN118037515A (zh) * 2024-04-12 2024-05-14 广东省食品检验所(广东省酒类检测中心) 食品安全抽检风险分级预警方法、存储介质及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8478628B1 (en) * 2007-11-28 2013-07-02 Emc Corporation Component based risk system
CN110246030A (zh) * 2019-06-21 2019-09-17 深圳前海微众银行股份有限公司 多方联动的贷后风险管理方法、终端、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8671040B2 (en) * 2010-07-23 2014-03-11 Thomson Reuters Global Resources Credit risk mining
CN110009225B (zh) * 2019-04-03 2023-10-31 平安科技(深圳)有限公司 风险评估系统构建方法、装置、计算机设备和存储介质
CN110348705B (zh) * 2019-06-25 2023-07-04 创新先进技术有限公司 用于风险控制的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8478628B1 (en) * 2007-11-28 2013-07-02 Emc Corporation Component based risk system
CN110246030A (zh) * 2019-06-21 2019-09-17 深圳前海微众银行股份有限公司 多方联动的贷后风险管理方法、终端、装置及存储介质

Also Published As

Publication number Publication date
CN111178704A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN111178704B (zh) 一种风险目标识别方法及设备
CN107622432A (zh) 商户评价方法及系统
CN108376317B (zh) 一种知识产权政策风险防范系统、基于该系统的知识产权交易系统和方法
CN106780012A (zh) 一种互联网信贷方法及系统
CN109711955B (zh) 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN111143339B (zh) 一种业务资源的分配方法、装置、设备及存储介质
CA3138730A1 (en) Public-opinion analysis method and system for providing early warning of enterprise risks
CN105677727A (zh) 数据检索及检索结果呈现方法和系统
CN110929969A (zh) 一种供应商的评价方法及装置
Da Silva et al. Selecting audit samples using Benford's Law
CN111061704B (zh) 一种财务分析报表生成方法及设备
WO2020034626A1 (zh) 服务推荐方法、装置、电子设备及存储介质
CN109542956A (zh) 报表生成方法、装置、计算机设备和存储介质
CN113989019A (zh) 识别风险的方法、装置、设备及存储介质
CN110009297A (zh) 一种基于信用的资质信息审核方法、装置及设备
CN111047426A (zh) 一种基于资金交易的可疑账户分析方法、系统及存储介质
CN112801498A (zh) 风险识别模型的训练方法、风险识别方法、装置及设备
CN110751361A (zh) 一种银行需求条目级管理方法及系统
CN110717754A (zh) 商品的交易方法、服务器、用户端、实验室端及系统
CN112328868A (zh) 一种基于信息数据的信用评估与授信申请系统及方法
CN109146667B (zh) 一种基于量化统计的外部接口综合应用模型的构建方法
Sun et al. An active and dynamic credit reporting system for SMEs in China
CN110458571A (zh) 一种信息泄露的风险识别方法、装置及设备
CN109636627B (zh) 基于区块链的保险产品管理方法、装置、介质及电子设备
CN115564591A (zh) 一种融资产品的确定方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 10-7, 10-8, 10 Qingyun Road, Jiangbei District, Chongqing 400025

Patentee after: Dongfang Weiyin Technology Co.,Ltd.

Address before: 10-7, 10-8, 10 Qingyun Road, Jiangbei District, Chongqing 400025

Patentee before: Oriental micro bank technology (Chongqing) Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 10-7, 10-8, 10 Qingyun Road, Jiangbei District, Chongqing 400025

Patentee after: Oriental micro bank technology (Chongqing) Co.,Ltd.

Address before: 100044 4th floor, Ronghui international building, building 1, courtyard 42, gaoliangxie street, Haidian District, Beijing

Patentee before: Oriental micro silver technology (Beijing) Co.,Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 400025 unit 08, floor 23, No. 1, Qingyun Road, Jiangbei District, Chongqing

Patentee after: Dongfang Weiyin Technology Co.,Ltd.

Address before: 10-7, 10-8, 10 Qingyun Road, Jiangbei District, Chongqing 400025

Patentee before: Dongfang Weiyin Technology Co.,Ltd.