CN110135693A - 一种风险识别方法、装置、设备及存储介质 - Google Patents

一种风险识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110135693A
CN110135693A CN201910296003.7A CN201910296003A CN110135693A CN 110135693 A CN110135693 A CN 110135693A CN 201910296003 A CN201910296003 A CN 201910296003A CN 110135693 A CN110135693 A CN 110135693A
Authority
CN
China
Prior art keywords
risk
business datum
rule
point
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910296003.7A
Other languages
English (en)
Inventor
白洁
贺敏
张东雷
王秀文
柳力多
董琳
罗引
杜慧
王磊
赵菲菲
曹家
张西娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
Beijing Zhongke Song Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Song Polytron Technologies Inc filed Critical Beijing Zhongke Song Polytron Technologies Inc
Priority to CN201910296003.7A priority Critical patent/CN110135693A/zh
Publication of CN110135693A publication Critical patent/CN110135693A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及一种风险识别方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用预设风险规则从业务数据中提取风险关联数据;利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险关联数据的风险点类别信息。该方法可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。

Description

一种风险识别方法、装置、设备及存储介质
技术领域
本申请涉及金融风险控制领域,尤其涉及一种风险识别方法、装置、设备及存储介质。
背景技术
随着我国经济和社会的发展,各类融资平台的数量呈现爆发式增长。互联网与金融的融合进一步催生了一系列新的融资模式,例如:P2P(peer-to-peer,个人对个人)众筹。与此同时,相应的监管措施还未健全,各类融资平台的市场混乱,违法违规现象频发。不仅限制了该行业的健康发展,还为我国经济带来了巨大的风险和隐患。
在实际应用中,由于融资平台的数量多,新增速度快,所以,单靠人力对每个融资平台的风险进行有效识别的难度比较大。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种风险识别方法、装置、设备及存储介质。
第一方面,本申请实施例提供了一种风险识别方法,包括:
获取与业务数据对应的预设风险规则和风险分析模型;
利用所述预设风险规则从所述业务数据中提取风险关联数据;
利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
可选的,获取与所述业务数据对应的预设风险规则,包括:
获取所述业务数据的业务类型;
构建与所述业务类型对应的多个一级风险点;
为每个所述一级风险点分别构建多个二级风险点;
为每个所述二级风险点分别增加描述信息,形成所述预设风险规则。
可选的,获取与所述业务数据对应的预设风险规则,包括:
获取所述业务数据的业务类型;
从预设的风险规则集合中查找与所述业务类型对应的预设风险规则。
可选的,所述利用所述预设风险规则从所述业务数据中提取风险关联数据,包括:
从所述业务数据中,提取与目标平台标识相匹配的匹配文本信息;
对所述匹配文本信息进行命名实体识别,得到目标实体;
若所述目标实体与所述目标平台标识相匹配,则将包括所述目标实体的匹配文本信息确定为平台相关文本信息;
根据每个所述二级风险点的所述描述信息,分别生成筛选规则;
利用所述筛选规则,从所述平台相关文本信息中筛选出所述风险关联数据。
可选的,所述利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息,包括:
以语句为单位,对所述风险关联数据进行划分,得到首尾相连的多个单条文本;
将多个所述单条文本逐个输入所述风险分析模型,得到与每个所述单条文本分别对应的风险点识别类别;
从多个所述风险点识别类别中,统计与每个所述一级风险点分别对应的二级风险点的种类数,得到所述风险点类别信息。
可选的,所述方法还包括:
构建训练数据集和基本模型,所述训练数据集包括:与每个所述二级风险点分别对应的风险关联数据,及与每个所述二级风险点分别对应的风险不关联数据;
利用所述训练数据集,训练所述基本模型,得到所述风险分析模型。
可选的,所述方法还包括:
获取校验数据集,所述校验数据集包括:已校验单条文本;
统计所述校验数据集中包括的文本的数量;
判断所述数量是否大于数量阈值;
若所述数量大于所述数量阈值,则将所述校验数据集中的文本加入所述训练数据集,得到更新数据集;
利用所述更新数据集,更新所述风险分析模型。
第二方面,本申请实施例提供了一种风险识别装置,包括:获取模块、提取模块和识别模块;
所述获取模块,用于获取与业务数据对应的预设风险规则和风险分析模型;
所述提取模块,用于利用所述预设风险规则从所述业务数据中提取风险关联数据;
所述识别模块,用于利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
第三方面,本申请实施例提供了一种风险识别设备,包括:处理器、存储器、通信接口和总线;
所述处理器、所述存储器与所述通信接口通过所述总线完成相互间的通信;
所述通信接口用于外部设备之间的信息传输;
所述处理器用于调用所述存储器中的程序指令,以执行如第一方面中任一项所述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面中任一项所述方法的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例提供的风险识别方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用所述预设风险规则从所述业务数据中提取风险关联数据;利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。所以,本申请实施例可以自动利用预设风险规则从业务数据中提取风险关联数据,利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险点类别信息,因此,可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的风险识别方法的流程图;
图2为本申请实施例提供的风险分析模型的结构示意图;
图3为本申请实施例提供的风险识别装置的结构示意图;
图4为本申请实施例提供的风险识别设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种风险识别方法、装置、设备及存储介质,可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
首先,对本申请实施例中的一种风险识别方法进行详细介绍,如图1所示,风险识别方法可以包括步骤S101至步骤S103:
S101,获取与业务数据对应的预设风险规则和风险分析模型。
S102,利用所述预设风险规则从所述业务数据中提取风险关联数据。
S103,利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
本申请实施例提供的风险识别方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用所述预设风险规则从所述业务数据中提取风险关联数据;利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。所以,本申请实施例可以自动利用预设风险规则从业务数据中提取风险关联数据,利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险点类别信息,因此,可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
在本申请的又一实施例中,在前述步骤S101至步骤S103的实施例的基础上,获取与所述业务数据对应的预设风险规则,可以包括步骤S201至步骤S204:
S201,获取所述业务数据的业务类型。
示例性的,所述业务数据可以为互联网融资平台数据,或者,可以为互联网教育平台数据,或者,可以为互联网租房平台数据等。若所述业务数据为互联网融资平台数据,则可以获取互联网融资平台数据的业务类型为互联网融资业务。
其中,可以从互联网开源渠道和/或特定业务部门渠道获取所述业务数据。示例性的,可以利用定向导入方式从特定业务部门渠道获取所述业务数据。可以利用爬虫技术动态从互联网开源渠道获取所述业务数据。以业务数据为互联网融资平台数据为例进行说明。互联网融资平台数据可以包括:各融资平台所属公司的工商信息、官方网站描述内容、发布的融资项目具体信息、通过公开渠道进行宣传的内容以及社交媒体平台等公开渠道中涉及各融资平台的评论内容等。
S202,构建与所述业务类型对应的多个一级风险点。
示例性的,以业务类型为互联网融资业务为例进行说明,互联网融资业务与一级风险点之间的对应关系可以如表1所示。
表1
S203,为每个所述一级风险点分别构建多个二级风险点。
其中,以业务类型为互联网融资业务为例进行说明,对于每个一级风险点,一个一级风险点与多个二级风险点之间的对应关系可以如表2所示。
表2
示例性的,以一级风险点为涉嫌传销为例进行说明,涉嫌传销可以对应层级推广、推广奖励、收入门费和高额返利等二级风险点。
S204,为每个所述二级风险点分别增加描述信息,形成所述预设风险规则。
示例性的,以业务类型为互联网融资业务为例进行说明,与所述业务数据对应的预设风险规则可以如表3所示。
表3
其中,以二级风险点为层级推广为例进行说明,层级推广对应的描述信息可以包括:“层级”、“层级发展”和“层级奖励”等内容。与二级风险点对应的描述信息可以认为是二级风险点在网络上的具体表现形式的相关描述内容。
在本申请的又一实施例中,在前述步骤S101至步骤S103的实施例的基础上,获取与所述业务数据对应的预设风险规则,可以包括步骤S301至步骤S302:
S301,获取所述业务数据的业务类型。
示例性的,所述业务数据可以为互联网融资平台数据,或者,可以为互联网教育平台数据,或者,可以为互联网租房平台数据等。若所述业务数据为互联网融资平台数据,则可以获取互联网融资平台数据的业务类型为互联网融资业务。
其中,可以从互联网开源渠道和/或特定业务部门渠道获取所述业务数据。示例性的,可以利用定向导入方式从特定业务部门渠道获取所述业务数据。可以利用爬虫技术动态从互联网开源渠道获取所述业务数据。以业务数据为互联网融资平台数据为例进行说明。互联网融资平台数据可以包括:各融资平台所属公司的工商信息、官方网站描述内容、发布的融资项目具体信息、通过公开渠道进行宣传的内容以及社交媒体平台等公开渠道中涉及各融资平台的评论内容等。
S302,从预设的风险规则集合中查找与所述业务类型对应的预设风险规则。
具体的,可以利用业务类型与预设风险规则之间的对应关系,从预设的风险规则集合中查找与所述业务类型对应的预设风险规则。示例性的,业务类型与预设风险规则之间的对应关系可以如表4所示。
表4
业务类型 预设风险规则
互联网融资业务 A
互联网教育业务 B
互联网租房业务 C
举例说明,若业务类型为互联网融资业务,则可以从预设的风险规则集合{A,B,C}中查找与互联网融资业务对应的预设风险规则A。
本申请实施例中,获取与所述业务数据对应的预设风险规则,包括:获取所述业务数据的业务类型;从预设的风险规则集合中查找与所述业务类型对应的预设风险规则。获取业务数据的业务类型后,从预设的风险规则集合中查找与所述业务类型对应的预设风险规则,若从预设的风险规则集合中,未查找到与所述业务类型对应的预设风险规则,则可以构建与业务类型对应的预设风险规则。
在本申请的又一实施例中,在前述步骤S201至步骤S204的实施例的基础上,步骤S102可以包括步骤S1021至步骤S1025:
S1021,从所述业务数据中,提取与目标平台标识相匹配的匹配文本信息。
示例性的,目标平台标识可以为待识别的融资平台的名称。举例说明,若目标平台标识为“微交易”,那么,“鼎金国际微交易投资有什么赚钱技巧新手怎么倍投”可以为与“微交易”相匹配的匹配文本信息。
S1022,对所述匹配文本信息进行命名实体识别,得到目标实体。
示例性的,若匹配文本信息为“鼎金国际微交易投资有什么赚钱技巧新手怎么倍投”,那么,步骤S1022就是对“鼎金国际微交易投资有什么赚钱技巧新手怎么倍投”进行命名实体识别,得到目标实体“鼎金国际微交易”。若匹配文本信息为“微交易投资有什么赚钱技巧新手怎么倍投”,那么,步骤S1022就是对“微交易投资有什么赚钱技巧新手怎么倍投”进行命名实体识别,得到目标实体“微交易”。
S1023,若所述目标实体与所述目标平台标识相匹配,则将包括所述目标实体的匹配文本信息确定为平台相关文本信息。
示例性的,若目标平台标识为“微交易”,目标实体为“鼎金国际微交易”,则说明目标实体与所述目标平台标识不匹配,不能将“鼎金国际微交易投资有什么赚钱技巧新手怎么倍投”确定为平台相关文本信息。若目标平台标识为“微交易”,目标实体为“微交易”,则说明目标实体与所述目标平台标识相匹配,可以将“微交易投资有什么赚钱技巧新手怎么倍投”确定为平台相关文本信息。
S1024,根据每个所述二级风险点的所述描述信息,分别生成筛选规则。
其中,以二级风险点为层级推广为例进行说明。以预设的组合方式对“层级”、“层级发展”和“层级奖励”进行组合,得到与“层级推广”对应的筛选规则。预设的组合方式可以包括:与运算、或运算和非运算等。示例性的,与“层级推广”对应的筛选规则可以为:包括“层级”、“层级发展”和“层级奖励”中的至少之一。
其中,也可以根据与每个一级风险点分别对应的多个二级风险点,生成筛选规则。以“涉嫌传销”为例进行说明,以预设的组合方式对“层级推广”、“推广奖励”、“收入门费”和“高额返利”进行组合,得到与“涉嫌传销”对应的筛选规则。示例性的,与“涉嫌传销”对应的筛选规则可以为:包括“层级推广”、“推广奖励”、“收入门费”和“高额返利”中的至少之一。
S1025,利用所述筛选规则,从所述平台相关文本信息中筛选出所述风险关联数据。
其中,筛选规则的数量是多个。若平台相关文本信息中的语句满足多个筛选规则中的任意一个筛选规则,则可以筛选出对应的语句。
其中,平台相关文本信息中包括至少一个句子。示例性的,若平台相关文本信息为:语句S1+语句S2+语句S3+语句S4+语句S5,语句S2、语句S3和语句S4均满足筛选规则,那么可以将“语句S2+语句S3+语句S4”筛选出来,得到风险关联数据“语句S2+语句S3+语句S4”。
在本申请的又一实施例中,在前述步骤S201至步骤S204的实施例的基础上,步骤S103可以包括步骤S1031至步骤S1033:
S1031,以语句为单位,对所述风险关联数据进行划分,得到首尾相连的多个单条文本。
示例性的,若风险关联数据为“语句S2+语句S3+语句S4”,那么,可以将风险关联数据划分为:语句S2、语句S3和语句S4。语句S2、语句S3和语句S4均可以为单条文本。举例说明,语句S3的具体内容可以为“微交易投资有什么赚钱技巧新手怎么倍投”。
S1032,将多个所述单条文本逐个输入所述风险分析模型,得到与每个所述单条文本分别对应的风险点识别类别。
其中,风险分析模型可以为:基于双向GRU(Gated Recurrent Unit,门控循环单元)神经网络的分类模型。示例性的,风险分析模型可以如图2所示,风险分析模型可以包括双向GRU神经网络21、池化层22、第一全连接层23和第二全连接层24,双向GRU神经网络21可以包括:正向门控循环单元211和反向门控循环单元212。其中,正向门控循环单元211的文本输入端与风险分析模型的文本输入端连接,反向门控循环单元212的文本输入端与风险分析模型的文本输入端连接,正向门控循环单元211的输出端、反向门控循环单元212的输出端均与池化层22的输入端连接,池化层22的输出端与第一全连接层23的输入端连接,第一全连接层23的输出端与第二全连接层24的输入端连接,第二全连接层24的输出端与风险分析模型的输出端连接。
其中,以单条文本为语句S3为例进行说明,语句S3输入进风险分析模型的文本输入端,分类模型对语句S3进行风险识别,从风险分析模型的输出端输出与语句S3对应的风险点识别类别。
示例性的,风险点识别类别可以包括:被输入的单条文本是否对应风险点,以及,被输入的单条文本对应的风险点的具体类型。风险点识别类别可以为(是,涉嫌传销),或者,可以为(否,NULL)。
S1033,从多个所述风险点识别类别中,统计与每个所述一级风险点分别对应的二级风险点的种类数,得到所述风险点类别信息。
示例性的,风险点类别信息可以如表5所示。
表5
本申请实施例中,利用基于双向GRU(Gated Recurrent Unit,门控循环单元)神经网络的分类模型对单条文本的风险进行识别,具有识别速度快、识别准确率高的特点,因此,可以辅助相关人员实现快速准确的融资平台风险定位与监管。
在本申请的又一实施例中,在前述步骤S201至步骤S204的实施例的基础上,所述风险识别方法还可以包括步骤S401至步骤S402:
S401,构建训练数据集和基本模型,所述训练数据集包括:与每个所述二级风险点分别对应的风险关联数据,及与每个所述二级风险点分别对应的风险不关联数据。
其中,以二级风险点“涉嫌传销”为例进行说明,示例性的,在步骤S401中,可以获取2000条与“涉嫌传销”对应的风险关联数据,以及,获取2000条与“涉嫌传销”对应的风险不关联数据。其中,训练数据集中的风险关联数据与风险不关联数据均可以是人工标注的数据。
S402,利用所述训练数据集,训练所述基本模型,得到所述风险分析模型。
在本申请的又一实施例中,在前述步骤S1031至步骤S1033的实施例的基础上,所述风险识别方法还可以包括步骤S501至步骤S505:
S501,获取校验数据集,所述校验数据集包括:已校验单条文本。
其中,已校验单条文本可以是人工标注的文本。
S502,统计所述校验数据集中包括的文本的数量。
S503,判断所述数量是否大于数量阈值。
其中,数量阈值可以根据实际需要进行人工设置,示例性的,数量阈值可以为49。
S504,若所述数量大于所述数量阈值,则将所述校验数据集中的文本加入所述训练数据集,得到更新数据集。
S505,利用所述更新数据集,更新所述风险分析模型。
本申请实施例中,数量阈值可以根据实际需要进行人工设置,所以,不需要大量的人工标注的文本(可以表示风险分析模型的实际工作情况),就可以实现对风险分析模型的动态化调整,由于本申请实施例根据风险分析模型的实际工作情况对风险分析模型进行动态化调整,所以,调整后的风险分析模型可以对风险点进行有效的识别,提高识别准确性和识别效率。同时,由于本申请实施例具有智能化的人机交互模式,所以,能够辅助相关人员实现快速准确的融资平台风险定位与监管。
在本申请的又一实施例中,对本申请实施例中的一种风险识别装置进行详细介绍,如图3所示,风险识别装置可以包括:获取模块31、提取模块32和识别模块33。
所述获取模块31,用于获取与业务数据对应的预设风险规则和风险分析模型。
所述提取模块32,用于利用所述预设风险规则从所述业务数据中提取风险关联数据。
所述识别模块33,用于利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
本申请实施例提供的风险识别装置包括:获取模块、提取模块和识别模块;所述获取模块,用于获取与业务数据对应的预设风险规则和风险分析模型;所述提取模块,用于利用所述预设风险规则从所述业务数据中提取风险关联数据;所述识别模块,用于利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息,所以,本申请实施例可以自动利用预设风险规则从业务数据中提取风险关联数据,利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险点类别信息,因此,可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
在本申请的又一实施例中,对本申请实施例中的一种风险识别设备进行详细介绍,如图4所示,风险识别设备可以包括:处理器401、存储器402、通信接口403和总线404。
所述处理器401、所述存储器402与所述通信接口403通过所述总线404完成相互间的通信。
所述通信接口403用于外部设备之间的信息传输。
示例性的,外部设备可以为用户设备UE。
所述处理器401用于调用所述存储器402中的程序指令,以执行如上述任一项实施例所述的风险识别方法的步骤。
具体而言,所述处理器401用于执行所述风险识别程序,以实现以下步骤:获取与业务数据对应的预设风险规则和风险分析模型;利用所述预设风险规则从所述业务数据中提取风险关联数据;利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
在本申请的又一实施例中,对本申请实施例中的一种计算机可读存储介质进行详细介绍,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上述任一项实施例所述风险识别方法的步骤。
其中,所述计算机可读存储介质可以存储有一个或者多个计算机指令。所述计算机可读存储介质可以包括易失性存储器,例如随机存取存储器;所述计算机可读存储介质也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;所述计算机可读存储介质还可以包括上述种类的存储器的组合。
具体而言,所述计算机指令使所述计算机执行以下步骤:获取与业务数据对应的预设风险规则和风险分析模型;利用所述预设风险规则从所述业务数据中提取风险关联数据;利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC)、数字信号处理器(DigitalSignalProcessing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(ProgrammableLogicDevice,PLD)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种风险识别方法,其特征在于,包括:
获取与业务数据对应的预设风险规则和风险分析模型;
利用所述预设风险规则从所述业务数据中提取风险关联数据;
利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
2.根据权利要求1所述的方法,其特征在于,获取与所述业务数据对应的预设风险规则,包括:
获取所述业务数据的业务类型;
构建与所述业务类型对应的多个一级风险点;
为每个所述一级风险点分别构建多个二级风险点;
为每个所述二级风险点分别增加描述信息,形成所述预设风险规则。
3.根据权利要求1所述的方法,其特征在于,获取与所述业务数据对应的预设风险规则,包括:
获取所述业务数据的业务类型;
从预设的风险规则集合中查找与所述业务类型对应的预设风险规则。
4.根据权利要求2所述的方法,其特征在于,所述利用所述预设风险规则从所述业务数据中提取风险关联数据,包括:
从所述业务数据中,提取与目标平台标识相匹配的匹配文本信息;
对所述匹配文本信息进行命名实体识别,得到目标实体;
若所述目标实体与所述目标平台标识相匹配,则将包括所述目标实体的匹配文本信息确定为平台相关文本信息;
根据每个所述二级风险点的所述描述信息,分别生成筛选规则;
利用所述筛选规则,从所述平台相关文本信息中筛选出所述风险关联数据。
5.根据权利要求2所述的方法,其特征在于,所述利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息,包括:
以语句为单位,对所述风险关联数据进行划分,得到首尾相连的多个单条文本;
将多个所述单条文本逐个输入所述风险分析模型,得到与每个所述单条文本分别对应的风险点识别类别;
从多个所述风险点识别类别中,统计与每个所述一级风险点分别对应的二级风险点的种类数,得到所述风险点类别信息。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
构建训练数据集和基本模型,所述训练数据集包括:与每个所述二级风险点分别对应的风险关联数据,及与每个所述二级风险点分别对应的风险不关联数据;
利用所述训练数据集,训练所述基本模型,得到所述风险分析模型。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取校验数据集,所述校验数据集包括:已校验单条文本;
统计所述校验数据集中包括的文本的数量;
判断所述数量是否大于数量阈值;
若所述数量大于所述数量阈值,则将所述校验数据集中的文本加入所述训练数据集,得到更新数据集;
利用所述更新数据集,更新所述风险分析模型。
8.一种风险识别装置,其特征在于,包括:获取模块、提取模块和识别模块;
所述获取模块,用于获取与业务数据对应的预设风险规则和风险分析模型;
所述提取模块,用于利用所述预设风险规则从所述业务数据中提取风险关联数据;
所述识别模块,用于利用所述风险分析模型对提取到的所述风险关联数据进行风险点识别,得到所述风险关联数据的风险点类别信息。
9.一种风险识别设备,其特征在于,包括:处理器、存储器、通信接口和总线;
所述处理器、所述存储器与所述通信接口通过所述总线完成相互间的通信;
所述通信接口用于外部设备之间的信息传输;
所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7中任一项所述方法的步骤。
CN201910296003.7A 2019-04-12 2019-04-12 一种风险识别方法、装置、设备及存储介质 Pending CN110135693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910296003.7A CN110135693A (zh) 2019-04-12 2019-04-12 一种风险识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910296003.7A CN110135693A (zh) 2019-04-12 2019-04-12 一种风险识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110135693A true CN110135693A (zh) 2019-08-16

Family

ID=67569825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910296003.7A Pending CN110135693A (zh) 2019-04-12 2019-04-12 一种风险识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110135693A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580170A (zh) * 2019-09-12 2019-12-17 中国工商银行股份有限公司 软件性能风险的识别方法及装置
CN110751517A (zh) * 2019-10-17 2020-02-04 支付宝(杭州)信息技术有限公司 互助项目中的增信方法以及装置
CN110852761A (zh) * 2019-10-11 2020-02-28 支付宝(杭州)信息技术有限公司 制定反作弊策略的方法、装置及电子设备
CN110881032A (zh) * 2019-11-06 2020-03-13 国网浙江武义县供电有限公司 账号越权操作的识别方法及装置
CN110930165A (zh) * 2019-11-08 2020-03-27 国家计算机网络与信息安全管理中心 互联网金融网站的异常检测方法及装置
CN111402054A (zh) * 2020-03-16 2020-07-10 中科天玑数据科技股份有限公司 一种股权融资平台风险判定方法及系统
CN111553487A (zh) * 2020-05-25 2020-08-18 支付宝(杭州)信息技术有限公司 一种业务对象识别方法及装置
CN111612604A (zh) * 2020-06-03 2020-09-01 云南电网有限责任公司 一种内部审计中的风险控制方法及系统
CN112348675A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 一种提供标准化评注的智能风险评估方法、装置和电子设备
WO2021098651A1 (zh) * 2019-11-22 2021-05-27 深圳前海微众银行股份有限公司 一种风险实体获取方法及装置
CN113032434A (zh) * 2021-03-18 2021-06-25 上海数禾信息科技有限公司 用于风险模型训练的数据处理方法和装置
CN113361644A (zh) * 2021-07-03 2021-09-07 上海理想信息产业(集团)有限公司 模型训练方法、电信业务特征信息提取方法、装置及设备
CN113537794A (zh) * 2021-07-22 2021-10-22 北京中科闻歌科技股份有限公司 对目标对象的分析方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067157A (zh) * 2017-03-01 2017-08-18 北京奇艺世纪科技有限公司 业务风险评估方法、装置及风控系统
CN107644340A (zh) * 2016-07-22 2018-01-30 阿里巴巴集团控股有限公司 风险识别方法、客户端设备及风险识别系统
EP3425531A1 (en) * 2017-05-05 2019-01-09 Ping An Technology (Shenzhen) Co., Ltd. System, method, electronic device, and storage medium for identifying risk event based on social information
CN109492945A (zh) * 2018-12-14 2019-03-19 深圳壹账通智能科技有限公司 企业风险识别监控方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644340A (zh) * 2016-07-22 2018-01-30 阿里巴巴集团控股有限公司 风险识别方法、客户端设备及风险识别系统
CN107067157A (zh) * 2017-03-01 2017-08-18 北京奇艺世纪科技有限公司 业务风险评估方法、装置及风控系统
EP3425531A1 (en) * 2017-05-05 2019-01-09 Ping An Technology (Shenzhen) Co., Ltd. System, method, electronic device, and storage medium for identifying risk event based on social information
CN109492945A (zh) * 2018-12-14 2019-03-19 深圳壹账通智能科技有限公司 企业风险识别监控方法、装置、设备及存储介质

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580170A (zh) * 2019-09-12 2019-12-17 中国工商银行股份有限公司 软件性能风险的识别方法及装置
CN110580170B (zh) * 2019-09-12 2023-07-21 中国工商银行股份有限公司 软件性能风险的识别方法及装置
CN110852761A (zh) * 2019-10-11 2020-02-28 支付宝(杭州)信息技术有限公司 制定反作弊策略的方法、装置及电子设备
CN110751517A (zh) * 2019-10-17 2020-02-04 支付宝(杭州)信息技术有限公司 互助项目中的增信方法以及装置
CN110881032B (zh) * 2019-11-06 2022-02-22 国网浙江武义县供电有限公司 账号越权操作的识别方法及装置
CN110881032A (zh) * 2019-11-06 2020-03-13 国网浙江武义县供电有限公司 账号越权操作的识别方法及装置
CN110930165A (zh) * 2019-11-08 2020-03-27 国家计算机网络与信息安全管理中心 互联网金融网站的异常检测方法及装置
WO2021098651A1 (zh) * 2019-11-22 2021-05-27 深圳前海微众银行股份有限公司 一种风险实体获取方法及装置
CN111402054A (zh) * 2020-03-16 2020-07-10 中科天玑数据科技股份有限公司 一种股权融资平台风险判定方法及系统
CN111553487A (zh) * 2020-05-25 2020-08-18 支付宝(杭州)信息技术有限公司 一种业务对象识别方法及装置
CN111553487B (zh) * 2020-05-25 2021-04-27 支付宝(杭州)信息技术有限公司 一种业务对象识别方法及装置
CN111612604A (zh) * 2020-06-03 2020-09-01 云南电网有限责任公司 一种内部审计中的风险控制方法及系统
CN112348675A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 一种提供标准化评注的智能风险评估方法、装置和电子设备
CN113032434A (zh) * 2021-03-18 2021-06-25 上海数禾信息科技有限公司 用于风险模型训练的数据处理方法和装置
CN113361644A (zh) * 2021-07-03 2021-09-07 上海理想信息产业(集团)有限公司 模型训练方法、电信业务特征信息提取方法、装置及设备
CN113361644B (zh) * 2021-07-03 2024-05-14 上海理想信息产业(集团)有限公司 模型训练方法、电信业务特征信息提取方法、装置及设备
CN113537794A (zh) * 2021-07-22 2021-10-22 北京中科闻歌科技股份有限公司 对目标对象的分析方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110135693A (zh) 一种风险识别方法、装置、设备及存储介质
CN105808988B (zh) 一种识别异常账户的方法及装置
CN110119882A (zh) 一种平台风险监控方法、装置、设备及存储介质
WO2018014610A1 (zh) 基于c4.5决策树算法的特定用户挖掘系统及其方法
CN105095223B (zh) 文本分类方法及服务器
US20190102655A1 (en) Training data acquisition method and device, server and storage medium
US9531751B2 (en) System and method for identifying phishing website
CN103544188B (zh) 移动互联网内容的用户偏好推送方法与装置
CN106709777A (zh) 一种订单聚类方法及装置,以及反恶意信息的方法及装置
CN108197330A (zh) 基于社交平台的数据挖掘方法及装置
CN103164698B (zh) 文本指纹库生成方法及装置、文本指纹匹配方法及装置
CN106777331A (zh) 知识图谱生成方法及装置
CN104221017A (zh) 使用示例来查找连接语料库中的数据
CN107463683A (zh) 代码元素的命名方法及终端设备
CN110046196A (zh) 标识关联方法及装置、电子设备
CN109714356A (zh) 一种异常域名的识别方法、装置及电子设备
CN108197243A (zh) 一种基于用户身份的输入联想推荐方法及装置
CN107908796A (zh) 电子政务查重方法、装置以及计算机可读存储介质
US20190005057A1 (en) Methods and Devices for File Folder Path Identification and File Folder Cleaning
CN109783724A (zh) 社交网络信息的管理方法、终端设备及介质
CN112861894A (zh) 一种数据流分类方法、装置及系统
CN107886373A (zh) 基于关键词的广告推送方法、广告推送装置及电子终端
US9830533B2 (en) Analyzing and exploring images posted on social media
CN104182539A (zh) 异常信息批量处理的方法及系统
Krenn et al. Predicting the Future of AI with AI: High-quality link prediction in an exponentially growing knowledge network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20191218

Address after: 100028 room 0715, 7th floor, Yingu building, No.9 building, Beisihuan West Road, Haidian District, Beijing

Applicant after: Beijing Zhongke song Polytron Technologies Inc

Applicant after: State Computer Network and Information Safety Management Center

Address before: 100028, 715 floor, 7 floor, 9 building, North Fourth Ring Road West, Haidian District, Beijing.

Applicant before: Beijing Zhongke song Polytron Technologies Inc

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190816

RJ01 Rejection of invention patent application after publication