CN114625747B - 基于信息安全的风控更新方法及系统 - Google Patents
基于信息安全的风控更新方法及系统 Download PDFInfo
- Publication number
- CN114625747B CN114625747B CN202210518415.2A CN202210518415A CN114625747B CN 114625747 B CN114625747 B CN 114625747B CN 202210518415 A CN202210518415 A CN 202210518415A CN 114625747 B CN114625747 B CN 114625747B
- Authority
- CN
- China
- Prior art keywords
- wind control
- control data
- data set
- updated
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Security & Cryptography (AREA)
- Artificial Intelligence (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供的基于信息安全的风控更新方法及系统,涉及信息安全技术领域。在本发明中,将当前形成的每一条新的风控数据标记为新的风控样本数据。从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。依据新的风控样本数据,分别对每一个待更新风控数据集合进行更新处理,以输出对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个目标风控数据集合对应的新的风险系数。基于上述方法,可以改善现有技术中风控管理的可靠度不佳的问题。
Description
技术领域
本发明涉及信息安全技术领域,具体而言,涉及一种基于信息安全的风控更新方法及系统。
背景技术
随着数据挖掘技术的精度和可靠度的不断提高,使得其应用范围得到了不断的扩展,例如,为了实现风险管控,需要对历史数据进行特征挖掘,以便于基于挖掘结果对之后的数据进行鉴别、判断等。特别是在涉及信息安全时,对于数据进行鉴别的精度需求就更高,因而,需要保障对历史数据进行特征挖掘得到的数据特征的可靠性,但是,在现有技术中,挖掘得到的数据特征一般会随着时间的发展而难以满足当前的数据鉴别需求,即使得存在风控管理的可靠度不佳的问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于信息安全的风控更新方法及系统,以改善现有技术中风控管理的可靠度不佳的问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种基于信息安全的风控更新方法,应用于风控管理服务器,所述基于信息安全的风控更新方法包括:
在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据;
从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,每一个所述风控数据集合包括多条风控样本数据,每一条风控样本数据具有风控标签信息,所述风控标签信息用于表征对应的所述风控样本数据是否属于具有风险的异常风控样本数据,每一个所述风控数据集合具有依据包括的多条风控样本数据的风控标签信息确定出的风险系数,所述风险系数用于表征与该风险系数对应的风控数据集合包括的风控样本数据匹配的待处理风控数据属于具有风险的异常风控样本数据的概率;
依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据的步骤,包括:
在每一次形成新的风控数据之后,统计当前形成的新的风控数据的数量,以输出对应的风控数据统计数量;
将所述风控数据统计数量与预先配置的统计数量参考值进行大小比较处理,以输出对应的数量大小比较结果;
倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则依据当前形成的每一条新的风控数据进行样本确定处理,以形成新的风控样本数据,以输出多条新的风控样本数据。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则依据当前形成的每一条新的风控数据进行样本确定处理,以形成新的风控样本数据,以输出多条新的风控样本数据的步骤,包括:
倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则对于当前形成的每一条新的风控数据,依据预先确定的多个特征维度对该新的风控数据进行解析处理,以输出该新的风控数据对应的特征解析结果,所述特征解析结果用于表征对应的所述新的风控数据是否包括所述多个特征维度对应的多条风控样本子数据;
对于当前形成的每一条新的风控数据,倘若该新的风控数据对应的特征解析结果表征该新的风控数据包括所述多个特征维度对应的多条风控样本子数据,则将该新的风控数据标记为候选风控数据;
从标记出的所述候选风控数据中提取出多条候选风控数据,再将该多条候选风控数据分别标记为新的风控样本数据。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述从标记出的所述候选风控数据中提取出多条候选风控数据,再将该多条候选风控数据分别标记为新的风控样本数据的步骤,包括:
对于每一条所述候选风控数据,确定该候选风控数据是否由所述多个特征维度对应的多条风控样本子数据构成;
对于每一条所述候选风控数据,倘若该候选风控数据由所述多个特征维度对应的多条风控样本子数据构成,则将该候选风控数据标记为新的风控样本数据,倘若该候选风控数据包括的风控样本子数据对应的特征维度的数量多于所述多个特征维度的数量,则从该候选风控数据中提取出所述多个特征维度对应的多条风控样本子数据,以构成新的风控样本数据。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,包括:
对于预先配置的多个风控数据集合中的每一个风控数据集合,对该风控数据集合包括的风控样本数据的数量进行统计,以输出该风控数据集合对应的样本数据数量,再依据该样本数据数量进行负相关系数确定处理,以输出该风控数据集合对应的第一系数;
依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,包括:
依据每一个所述风控数据集合对应的风险系数,对所述多个风控数据集合进行聚类处理,以输出所述多个风控数据集合对应的至少一个集合聚类簇,每一个集合聚类簇包括至少一个风控数据集合;
对于所述至少一个集合聚类簇中的每一个集合聚类簇,对该集合聚类簇包括的风控数据集合的数量进行统计处理,以输出该集合聚类簇对应的集合统计数量,再依据该集合统计数量进行负相关系数确定处理,以输出该集合聚类簇包括的每一个风控数据集合对应的第二系数;
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,包括:
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数;
对所述多条新的风控样本数据进行数量统计处理,以输出所述多条新的风控样本数据对应的新数据数量统计值,再依据该新数据数量统计值进行正相关数量确定处理,以输出对应的目标数量;
从所述多个风控数据集合中确定出数量为所述目标数量且对应的融合系数最大的至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数的步骤,包括:
对于每一个所述待更新风控数据集合,依据该待更新风控数据集合包括的风控样本数据的数量和该待更新风控数据集合对应的风险系数与其它风控数据集合对应的风险系数之间的大小关系进行样本分配系数确定处理,以输出该待更新风控数据集合对应的样本分配系数;
依据每一个所述待更新风控数据集合对应的样本分配系数,分别对每一个所述待更新风控数据集合进行样本分配比例确定处理,以输出每一个所述待更新风控数据集合对应的样本分配比例,每一个所述待更新风控数据集合对应的样本分配比例的和值等于1;
依次对所述多条新的风控样本数据进行遍历;
对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度;
对于每一个所述待更新风控数据集合,对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度进行均值计算,以输出该待更新风控数据集合对应的数据相似度代表值;
将当前遍历到的新的风控样本数据分配至对应的数据相似度代表值具有最大值的待更新风控数据集合中,直到该待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,再当前遍历到的新的风控样本数据分配至对应的数据相似度代表值具有最二大值的待更新风控数据集合中,直到每一个待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,以形成每一个所述待更新风控数据集合对应的目标风控数据集合;
对于每一个所述目标风控数据集合,依据该目标风控数据集合包括的风控样本数据和新的风控样本数据,对该目标风控数据集合具有的风险系数进行更新处理,以输出该目标风控数据集合对应的新的风险系数。
在一些优选的实施例中,在上述基于信息安全的风控更新方法中,所述对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度的步骤,包括:
对所述风控样本数据进行关键词提取处理,以输出对应的第一关键词集合,再对所述当前遍历到的新的风控样本数据进行关键词提取处理,以输出对应的第二关键词集合,所述第一关键词集合包括多个第一关键词,所述第二关键词集合包括多个第二关键词;
对于所述第一关键词集合中的每一个第一关键词,依据通信连接的目标数据库中的文本数据,对该第一关键词进行相关关键词的确定处理,以输出该第一关键词对应的相关关键词,该相关关键词为所述文本数据中与该第一关键词之间具有最大语义相关度的一个词语;
依据所述第一关键词集合中的每一个第一关键词对应的相关关键词进行集合构建处理,以输出所述第一关键词集合对应的相关关键词集合,再依据所述第一关键词集合包括的第一关键词和所述第二关键词集合包括的第二关键词,对所述第一关键词集合和所述第二关键词集合进行集合重合度计算处理,以输出对应的第一集合重合度,再依据所述相关关键词集合包括的相关关键词和所述第二关键词集合包括的第二关键词,对所述第一关键词集合和所述第二关键词集合进行集合重合度计算处理,以输出对应的第二集合重合度;
对所述第一关键词集合包括的第一关键词进行数量统计,以输出所述第一关键词集合对应的第一数值,再依据所述目标数据库中的文本数据,对所述第一关键词集合包括的每两个第一关键词进行语义相关度计算处理,再对所述第一关键词集合包括的每两个第一关键词之间的语义相关度进行均值计算,以输出所述第一关键词集合对应的语义相关度,再依据所述第一关键词集合对应的第一数值和对应的语义相关度进行向量构建处理,以输出所述第一关键词集合对应的第一向量;
对所述相关关键词集合包括的相关关键词进行数量统计,以输出所述相关关键词集合对应的第一数值,再依据所述目标数据库中的文本数据,对所述相关关键词集合包括的每两个相关关键词进行语义相关度计算处理,再对所述相关关键词集合包括的每两个相关关键词之间的语义相关度进行均值计算,以输出所述相关关键词集合对应的语义相关度,再依据所述相关关键词集合对应的第一数值和对应的语义相关度进行向量构建处理,以输出所述相关关键词集合对应的第一向量;
对所述第二关键词集合包括的第二关键词进行数量统计,以输出所述第二关键词集合对应的第二数值,再依据所述目标数据库中的文本数据,对所述第二关键词集合包括的每两个第二关键词进行语义相关度计算处理,再对所述第二关键词集合包括的每两个第二关键词之间的语义相关度进行均值计算,以输出所述第二关键词集合对应的语义相关度,再依据所述第二关键词集合对应的第二数值和对应的语义相关度进行向量构建处理,以输出所述第二关键词集合对应的第二向量;
依据所述第一关键词集合对应的第一向量和所述第二关键词集合对应的第二向量进行点乘处理,以输出对应的第一点乘值,再依据所述相关关键词集合对应的第一向量和所述第二关键词集合对应的第二向量进行点乘处理,以输出对应的第二点乘值;
依据所述第一点乘积和所述第二点乘积分别确定出所述第一关键词集合对应的第一加权系数和所述相关关键词集合对应的第二加权系数,再依据所述第一加权系数和所述第二加权系数对所述第一集合重合度和所述第二集合重合度进行加权求和计算,以输出所述风控样本数据与所述当前遍历到的新的风控样本数据之间的数据相似度。
本发明实施例还提供一种基于信息安全的风控更新系统,应用于风控管理服务器,所述基于信息安全的风控更新系统包括:
数据标记模块,用于在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据;
数据集合标记模块,用于从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,每一个所述风控数据集合包括多条风控样本数据,每一条风控样本数据具有风控标签信息,所述风控标签信息用于表征对应的所述风控样本数据是否属于具有风险的异常风控样本数据,每一个所述风控数据集合具有依据包括的多条风控样本数据的风控标签信息确定出的风险系数,所述风险系数用于表征与该风险系数对应的风控数据集合包括的风控样本数据匹配的待处理风控数据属于具有风险的异常风控样本数据的概率;
风险系数更新模块,用于依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数。
本发明实施例提供的一种基于信息安全的风控更新方法及系统,先将当前形成的每一条新的风控数据标记为新的风控样本数据。然后,从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。最后,可以依据新的风控样本数据,分别对每一个待更新风控数据集合进行更新处理,以输出对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个目标风控数据集合对应的新的风险系数。在形成新的风控数据之后,可以对风险系数进行更新处理,使得新的风险系数可以满足当前的数据需求,从而提高对于风险管控的可靠度,进而改善现有技术中风控管理的可靠度不佳的问题。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的风控管理服务器的结构框图。
图2为本发明实施例提供的基于信息安全的风控更新方法包括的各步骤的流程示意图。
图3为本发明实施例提供的基于信息安全的风控更新系统包括的各模块的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明实施例提供了一种风控管理服务器。其中,所述风控管理服务器可以包括存储器和处理器。
详细地,在一种实施方式中,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例提供的基于信息安全的风控更新方法。
详细地,在一种实施方式中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable ProgrammableRead-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable ProgrammableRead-Only Memory,EEPROM)等。所述处理器可以是一种通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
参照图2,本发明实施例还提供一种基于信息安全的风控更新方法,可应用于上述风控管理服务器。其中,所述基于信息安全的风控更新方法有关的流程所定义的方法步骤,可以由所述风控管理服务器实现。
下面将对图2所示的具体流程,进行详细阐述。
步骤S110,在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据。
在本发明实施例中,所述风控管理服务器可以执行步骤S110,即在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据。
步骤S120,从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
在本发明实施例中,所述风控管理服务器可以执行步骤S120,即从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。每一个所述风控数据集合包括多条风控样本数据,每一条风控样本数据具有风控标签信息,所述风控标签信息用于表征对应的所述风控样本数据是否属于具有风险的异常风控样本数据,每一个所述风控数据集合具有依据包括的多条风控样本数据的风控标签信息确定出的风险系数,所述风险系数用于表征与该风险系数对应的风控数据集合包括的风控样本数据匹配的待处理风控数据属于具有风险的异常风控样本数据的概率。
步骤S130,依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数。
在本发明实施例中,所述风控管理服务器可以执行步骤S130,即依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数(例如,可以基于所述目标风控数据集合中属于具有风险的异常风控样本数据的数量占比确定)。
基于上述步骤,即先将当前形成的每一条新的风控数据标记为新的风控样本数据。然后,从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。最后,可以依据新的风控样本数据,分别对每一个待更新风控数据集合进行更新处理,以输出对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个目标风控数据集合对应的新的风险系数。在形成新的风控数据之后,可以对风险系数进行更新处理,使得新的风险系数可以满足当前的数据需求,从而提高对于风险管控的可靠度,进而改善现有技术中风控管理的可靠度不佳的问题。
详细地,在一种实施方式中,步骤S110可以进一步包括以下的各步骤:
在每一次形成新的风控数据之后,统计当前形成的新的风控数据的数量,以输出对应的风控数据统计数量;
将所述风控数据统计数量与预先配置的统计数量参考值进行大小比较处理,以输出对应的数量大小比较结果;
倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则依据当前形成的每一条新的风控数据进行样本确定处理,以形成新的风控样本数据,以输出多条新的风控样本数据。
详细地,在一种实施方式中,所述倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则依据当前形成的每一条新的风控数据进行样本确定处理,以形成新的风控样本数据,以输出多条新的风控样本数据的步骤,可以进一步包括以下的各步骤:
倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则对于当前形成的每一条新的风控数据,依据预先确定的多个特征维度(如信用评估对应的特征维度、工作描述对应的特征维度、社交关系对应的特征维度等)对该新的风控数据进行解析处理,以输出该新的风控数据对应的特征解析结果,所述特征解析结果用于表征对应的所述新的风控数据是否包括所述多个特征维度对应的多条风控样本子数据;
对于当前形成的每一条新的风控数据,倘若该新的风控数据对应的特征解析结果表征该新的风控数据包括所述多个特征维度对应的多条风控样本子数据,则将该新的风控数据标记为候选风控数据;
从标记出的所述候选风控数据中提取出多条候选风控数据,再将该多条候选风控数据分别标记为新的风控样本数据。
详细地,在一种实施方式中,所述从标记出的所述候选风控数据中提取出多条候选风控数据,再将该多条候选风控数据分别标记为新的风控样本数据的步骤,可以进一步包括以下的各步骤:
对于每一条所述候选风控数据,确定该候选风控数据是否由所述多个特征维度对应的多条风控样本子数据构成;
对于每一条所述候选风控数据,倘若该候选风控数据由所述多个特征维度对应的多条风控样本子数据构成,则将该候选风控数据标记为新的风控样本数据,倘若该候选风控数据包括的风控样本子数据对应的特征维度的数量多于所述多个特征维度的数量,则从该候选风控数据中提取出所述多个特征维度对应的多条风控样本子数据,以构成新的风控样本数据。
详细地,在一种实施方式中,步骤S120可以进一步包括以下的各步骤:
对于预先配置的多个风控数据集合中的每一个风控数据集合,对该风控数据集合包括的风控样本数据的数量进行统计,以输出该风控数据集合对应的样本数据数量,再依据该样本数据数量进行负相关系数确定处理,以输出该风控数据集合对应的第一系数;
依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
详细地,在一种实施方式中,所述依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,可以进一步包括以下的各步骤:
依据每一个所述风控数据集合对应的风险系数,对所述多个风控数据集合进行聚类处理(可以参照现有的聚类技术,如最邻近算法等),以输出所述多个风控数据集合对应的至少一个集合聚类簇,每一个集合聚类簇包括至少一个风控数据集合;
对于所述至少一个集合聚类簇中的每一个集合聚类簇,对该集合聚类簇包括的风控数据集合的数量进行统计处理,以输出该集合聚类簇对应的集合统计数量,再依据该集合统计数量进行负相关系数确定处理,以输出该集合聚类簇包括的每一个风控数据集合对应的第二系数;
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理(如加权求和计算),以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
详细地,在一种实施方式中,所述对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,可以进一步包括以下的各步骤:
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数;
对所述多条新的风控样本数据进行数量统计处理,以输出所述多条新的风控样本数据对应的新数据数量统计值,再依据该新数据数量统计值进行正相关数量确定处理,以输出对应的目标数量;
从所述多个风控数据集合中确定出数量为所述目标数量且对应的融合系数最大的至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。
详细地,在一种实施方式中,步骤S130可以进一步包括以下的各步骤:
对于每一个所述待更新风控数据集合,依据该待更新风控数据集合包括的风控样本数据的数量和该待更新风控数据集合对应的风险系数与其它风控数据集合对应的风险系数之间的大小关系进行样本分配系数确定处理,以输出该待更新风控数据集合对应的样本分配系数(所述样本分配系数可以参照上述的融合系数的计算方式);
依据每一个所述待更新风控数据集合对应的样本分配系数,分别对每一个所述待更新风控数据集合进行样本分配比例确定处理,以输出每一个所述待更新风控数据集合对应的样本分配比例,每一个所述待更新风控数据集合对应的样本分配比例的和值等于1(所述样本分配比例和所述样本分配系数之间可以具有正相关关系);
依次对所述多条新的风控样本数据进行遍历;
对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度;
对于每一个所述待更新风控数据集合,对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度进行均值计算,以输出该待更新风控数据集合对应的数据相似度代表值;
将当前遍历到的新的风控样本数据分配至对应的数据相似度代表值具有最大值的待更新风控数据集合中,直到该待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,再当前遍历到的新的风控样本数据分配至对应的数据相似度代表值具有最二大值的待更新风控数据集合中,直到每一个待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,以形成每一个所述待更新风控数据集合对应的目标风控数据集合;
对于每一个所述目标风控数据集合,依据该目标风控数据集合包括的风控样本数据和新的风控样本数据,对该目标风控数据集合具有的风险系数进行更新处理,以输出该目标风控数据集合对应的新的风险系数。
详细地,在一种实施方式中,所述对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度的步骤,可以进一步包括以下的各步骤:
对所述风控样本数据进行关键词提取处理,以输出对应的第一关键词集合,再对所述当前遍历到的新的风控样本数据进行关键词提取处理,以输出对应的第二关键词集合,所述第一关键词集合包括多个第一关键词,所述第二关键词集合包括多个第二关键词;
对于所述第一关键词集合中的每一个第一关键词,依据通信连接的目标数据库中的文本数据,对该第一关键词进行相关关键词的确定处理,以输出该第一关键词对应的相关关键词,该相关关键词为所述文本数据中与该第一关键词之间具有最大语义相关度的一个词语;
依据所述第一关键词集合中的每一个第一关键词对应的相关关键词进行集合构建处理,以输出所述第一关键词集合对应的相关关键词集合,再依据所述第一关键词集合包括的第一关键词和所述第二关键词集合包括的第二关键词,对所述第一关键词集合和所述第二关键词集合进行集合重合度计算处理(可以参照现有的技术重合度的计算方式),以输出对应的第一集合重合度,再依据所述相关关键词集合包括的相关关键词和所述第二关键词集合包括的第二关键词,对所述第一关键词集合和所述第二关键词集合进行集合重合度计算处理,以输出对应的第二集合重合度;
对所述第一关键词集合包括的第一关键词进行数量统计,以输出所述第一关键词集合对应的第一数值,再依据所述目标数据库中的文本数据,对所述第一关键词集合包括的每两个第一关键词进行语义相关度计算处理,再对所述第一关键词集合包括的每两个第一关键词之间的语义相关度进行均值计算,以输出所述第一关键词集合对应的语义相关度,再依据所述第一关键词集合对应的第一数值和对应的语义相关度进行向量构建处理,以输出所述第一关键词集合对应的第一向量;
对所述相关关键词集合包括的相关关键词进行数量统计,以输出所述相关关键词集合对应的第一数值,再依据所述目标数据库中的文本数据,对所述相关关键词集合包括的每两个相关关键词进行语义相关度计算处理,再对所述相关关键词集合包括的每两个相关关键词之间的语义相关度进行均值计算,以输出所述相关关键词集合对应的语义相关度,再依据所述相关关键词集合对应的第一数值和对应的语义相关度进行向量构建处理,以输出所述相关关键词集合对应的第一向量;
对所述第二关键词集合包括的第二关键词进行数量统计,以输出所述第二关键词集合对应的第二数值,再依据所述目标数据库中的文本数据,对所述第二关键词集合包括的每两个第二关键词进行语义相关度计算处理,再对所述第二关键词集合包括的每两个第二关键词之间的语义相关度进行均值计算,以输出所述第二关键词集合对应的语义相关度,再依据所述第二关键词集合对应的第二数值和对应的语义相关度进行向量构建处理,以输出所述第二关键词集合对应的第二向量;
依据所述第一关键词集合对应的第一向量和所述第二关键词集合对应的第二向量进行点乘处理,以输出对应的第一点乘值,再依据所述相关关键词集合对应的第一向量和所述第二关键词集合对应的第二向量进行点乘处理,以输出对应的第二点乘值;
依据所述第一点乘积和所述第二点乘积分别确定出所述第一关键词集合对应的第一加权系数和所述相关关键词集合对应的第二加权系数,再依据所述第一加权系数和所述第二加权系数对所述第一集合重合度和所述第二集合重合度进行加权求和计算,以输出所述风控样本数据与所述当前遍历到的新的风控样本数据之间的数据相似度。
详细地,在另一种实施方式中,所述对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度的步骤,可以进一步包括以下的各步骤:
对所述风控样本数据进行关键词提取处理,以输出所述风控样本数据对应的第一关键词集合,再对所述当前遍历到的新的风控样本数据进行关键词提取处理,以输出所述当前遍历到的新的风控样本数据对应的第二关键词集合,所述第一关键词集合包括多个第一关键词,所述第二关键词集合包括多个第二关键词;
对所述风控样本数据进行分句处理,以输出所述风控样本数据对应的多个第一样本语句,对于每一个所述第一样本语句,依据所述第一关键词集合包括的第一关键词,对该第一样本语句进行语句重要系数确定处理,以输出该第一样本语句对应的语句重要系数,该语句重要系数与所述第一样本语句中具有的第一关键词的数量正相关;
对所述当前遍历到的新的风控样本数据进行分句处理,以输出所述当前遍历到的新的风控样本数据对应的多个第二样本语句,对于每一个所述第二样本语句,依据所述第二关键词集合包括的第二关键词,对该第二样本语句进行语句重要系数确定处理,以输出该第二样本语句对应的语句重要系数,该语句重要系数与所述第二样本语句中具有的第二关键词的数量正相关;
对所述第一关键词集合和所述第二关键词集合进行交集确定处理,以输出对应的相同关键词集合;
对于每一个所述第一样本语句,分别对该第一样本语句与所述相同关键词集合中的每一个相同关键词进行紧密度计算处理,以输出该第一样本语句与所述相同关键词集合中的每一个相同关键词之间的数据紧密度,再将该第一样本语句与所述相同关键词集合中的每一个相同关键词之间的数据紧密度中的最大值,标记为该第一样本语句对应的数据紧密度,所述第一样本语句和所述相同关键词在所述风控样本数据中间隔的文字数目与所述数据紧密度之间具有负相关关系;
对于每一个所述第二样本语句,分别对该第二样本语句与所述相同关键词集合中的每一个相同关键词进行紧密度计算处理,以输出该第二样本语句与所述相同关键词集合中的每一个相同关键词之间的数据紧密度,再将该第二样本语句与所述相同关键词集合中的每一个相同关键词之间的数据紧密度中的最大值,标记为该第二样本语句对应的数据紧密度,所述第二样本语句和所述相同关键词在所述当前遍历到的新的风控样本数据中间隔的文字数目与所述数据紧密度之间具有负相关关系;
对于每一个所述第一样本语句,对该第一样本语句对应的语句重要系数和该第一样本语句对应的数据紧密度进行融合处理,以输出该第一样本语句对应的加权系数,对于每一个所述第二样本语句,对该第二样本语句对应的语句重要系数和该第二样本语句对应的数据紧密度进行融合处理(如加权求和计算),以输出该第二样本语句对应的加权系数;
对于每一个所述第一样本语句,依据预设数量值对该第一样本语句进行滑窗处理,以输出该第一样本语句对应的至少一个第一滑窗序列,再对于每一个所述第二样本语句,依据所述预设数量值对该第二样本语句进行滑窗处理,以输出该第二样本语句对应的至少一个第二滑窗序列,对于每一个所述第一样本语句和每一个所述第二样本语句,依据该第一样本语句对应的每一个第一滑窗序列和该第二样本语句对应的每一个第二滑窗序列之间的序列相似度(可以参照现有技术中对于序列相似度的技术方式),对该第一样本语句和该第二样本语句之间的语句相似度进行确定处理(如计算均值),以输出该第一样本语句和该第二样本语句之间的语句相似度;
对于每一个所述第一样本语句,依据该第一样本语句与每一个所述第二样本语句之间的语句相似度,从所述多个第二样本语句中提取出该第一样本语句对应的目标第二样本语句(对应的语句相似度可以具有最大值),再将该第一样本语句对应的加权系数和该目标第二样本语句对应的加权系数,以及该第一样本语句和该目标第二样本语句之间的语句相似度进行乘积计算处理,以输出该第一样本语句对应的加权语句相似度;
对每一个所述第一样本语句对应的加权语句相似度进行和值计算处理,以输出所述风控样本数据与所述当前遍历到的新的风控样本数据之间的数据相似度(即一个所述第一样本语句对应的加权语句相似度的和值)。
参照图3,本发明实施例还提供一种基于信息安全的风控更新系统,可应用于上述风控管理服务器。其中,所述基于信息安全的风控更新系统可以包括数据标记模块、数据集合标记模块和风险系数更新模块。
详细地,在一种实施方式中,所述数据标记模块,用于在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据。所述数据集合标记模块,用于从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,每一个所述风控数据集合包括多条风控样本数据,每一条风控样本数据具有风控标签信息,所述风控标签信息用于表征对应的所述风控样本数据是否属于具有风险的异常风控样本数据,每一个所述风控数据集合具有依据包括的多条风控样本数据的风控标签信息确定出的风险系数,所述风险系数用于表征与该风险系数对应的风控数据集合包括的风控样本数据匹配的待处理风控数据属于具有风险的异常风控样本数据的概率。所述风险系数更新模块,用于依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数。
综上所述,本发明提供的一种基于信息安全的风控更新方法及系统,先将当前形成的每一条新的风控数据标记为新的风控样本数据。然后,从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合。最后,可以依据新的风控样本数据,分别对每一个待更新风控数据集合进行更新处理,以输出对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个目标风控数据集合对应的新的风险系数。在形成新的风控数据之后,可以对风险系数进行更新处理,使得新的风险系数可以满足当前的数据需求,从而提高对于风险管控的可靠度,进而改善现有技术中风控管理的可靠度不佳的问题。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于信息安全的风控更新方法,其特征在于,应用于风控管理服务器,所述基于信息安全的风控更新方法包括:
在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据;
从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,每一个所述风控数据集合包括多条风控样本数据,每一条风控样本数据具有风控标签信息,所述风控标签信息用于表征对应的所述风控样本数据是否属于具有风险的异常风控样本数据,每一个所述风控数据集合具有依据包括的多条风控样本数据的风控标签信息确定出的风险系数,所述风险系数用于表征与该风险系数对应的风控数据集合包括的风控样本数据匹配的待处理风控数据属于具有风险的异常风控样本数据的概率;
依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数;
所述从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,包括:
对于预先配置的多个风控数据集合中的每一个风控数据集合,对该风控数据集合包括的风控样本数据的数量进行统计,以输出该风控数据集合对应的样本数据数量,再依据该样本数据数量进行负相关系数确定处理,以输出该风控数据集合对应的第一系数;
依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合;
所述依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,包括:
依据每一个所述风控数据集合对应的风险系数,对所述多个风控数据集合进行聚类处理,以输出所述多个风控数据集合对应的至少一个集合聚类簇,每一个集合聚类簇包括至少一个风控数据集合;
对于所述至少一个集合聚类簇中的每一个集合聚类簇,对该集合聚类簇包括的风控数据集合的数量进行统计处理,以输出该集合聚类簇对应的集合统计数量,再依据该集合统计数量进行负相关系数确定处理,以输出该集合聚类簇包括的每一个风控数据集合对应的第二系数;
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合;
所述对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合的步骤,包括:
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数;
对所述多条新的风控样本数据进行数量统计处理,以输出所述多条新的风控样本数据对应的新数据数量统计值,再依据该新数据数量统计值进行正相关数量确定处理,以输出对应的目标数量;
从所述多个风控数据集合中确定出数量为所述目标数量且对应的融合系数最大的至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合;
所述依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数的步骤,包括:
对于每一个所述待更新风控数据集合,依据该待更新风控数据集合包括的风控样本数据的数量和该待更新风控数据集合对应的风险系数与其它风控数据集合对应的风险系数之间的大小关系进行样本分配系数确定处理,以输出该待更新风控数据集合对应的样本分配系数;
依据每一个所述待更新风控数据集合对应的样本分配系数,分别对每一个所述待更新风控数据集合进行样本分配比例确定处理,以输出每一个所述待更新风控数据集合对应的样本分配比例,每一个所述待更新风控数据集合对应的样本分配比例的和值等于1;
依次对所述多条新的风控样本数据进行遍历;
对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度;
对于每一个所述待更新风控数据集合,对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度进行均值计算,以输出该待更新风控数据集合对应的数据相似度代表值;
将当前遍历到的新的风控样本数据分配至对应的数据相似度代表值具有最大值的待更新风控数据集合中,直到该待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,直到每一个待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,以形成每一个所述待更新风控数据集合对应的目标风控数据集合;
对于每一个所述目标风控数据集合,依据该目标风控数据集合包括的风控样本数据和新的风控样本数据,对该目标风控数据集合具有的风险系数进行更新处理,以输出该目标风控数据集合对应的新的风险系数。
2.如权利要求1所述的基于信息安全的风控更新方法,其特征在于,所述在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据的步骤,包括:
在每一次形成新的风控数据之后,统计当前形成的新的风控数据的数量,以输出对应的风控数据统计数量;
将所述风控数据统计数量与预先配置的统计数量参考值进行大小比较处理,以输出对应的数量大小比较结果;
倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则依据当前形成的每一条新的风控数据进行样本确定处理,以形成新的风控样本数据,以输出多条新的风控样本数据。
3.如权利要求2所述的基于信息安全的风控更新方法,其特征在于,所述倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则依据当前形成的每一条新的风控数据进行样本确定处理,以形成新的风控样本数据,以输出多条新的风控样本数据的步骤,包括:
倘若所述数量大小比较结果表征所述风控数据统计数量大于所述统计数量参考值,则对于当前形成的每一条新的风控数据,依据预先确定的多个特征维度对该新的风控数据进行解析处理,以输出该新的风控数据对应的特征解析结果,所述特征解析结果用于表征对应的所述新的风控数据是否包括所述多个特征维度对应的多条风控样本子数据;
对于当前形成的每一条新的风控数据,倘若该新的风控数据对应的特征解析结果表征该新的风控数据包括所述多个特征维度对应的多条风控样本子数据,则将该新的风控数据标记为候选风控数据;
从标记出的所述候选风控数据中提取出多条候选风控数据,再将该多条候选风控数据分别标记为新的风控样本数据。
4.如权利要求3所述的基于信息安全的风控更新方法,其特征在于,所述从标记出的所述候选风控数据中提取出多条候选风控数据,再将该多条候选风控数据分别标记为新的风控样本数据的步骤,包括:
对于每一条所述候选风控数据,确定该候选风控数据是否由所述多个特征维度对应的多条风控样本子数据构成;
对于每一条所述候选风控数据,倘若该候选风控数据由所述多个特征维度对应的多条风控样本子数据构成,则将该候选风控数据标记为新的风控样本数据,倘若该候选风控数据包括的风控样本子数据对应的特征维度的数量多于所述多个特征维度的数量,则从该候选风控数据中提取出所述多个特征维度对应的多条风控样本子数据,以构成新的风控样本数据。
5.如权利要求1所述的基于信息安全的风控更新方法,其特征在于,所述对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度的步骤,包括:
对所述风控样本数据进行关键词提取处理,以输出对应的第一关键词集合,再对所述当前遍历到的新的风控样本数据进行关键词提取处理,以输出对应的第二关键词集合,所述第一关键词集合包括多个第一关键词,所述第二关键词集合包括多个第二关键词;
对于所述第一关键词集合中的每一个第一关键词,依据通信连接的目标数据库中的文本数据,对该第一关键词进行相关关键词的确定处理,以输出该第一关键词对应的相关关键词,该相关关键词为所述文本数据中与该第一关键词之间具有最大语义相关度的一个词语;
依据所述第一关键词集合中的每一个第一关键词对应的相关关键词进行集合构建处理,以输出所述第一关键词集合对应的相关关键词集合,再依据所述第一关键词集合包括的第一关键词和所述第二关键词集合包括的第二关键词,对所述第一关键词集合和所述第二关键词集合进行集合重合度计算处理,以输出对应的第一集合重合度,再依据所述相关关键词集合包括的相关关键词和所述第二关键词集合包括的第二关键词,对所述第一关键词集合和所述第二关键词集合进行集合重合度计算处理,以输出对应的第二集合重合度;
对所述第一关键词集合包括的第一关键词进行数量统计,以输出所述第一关键词集合对应的第一数值,再依据所述目标数据库中的文本数据,对所述第一关键词集合包括的每两个第一关键词进行语义相关度计算处理,再对所述第一关键词集合包括的每两个第一关键词之间的语义相关度进行均值计算,以输出所述第一关键词集合对应的语义相关度,再依据所述第一关键词集合对应的第一数值和对应的语义相关度进行向量构建处理,以输出所述第一关键词集合对应的第一向量;
对所述相关关键词集合包括的相关关键词进行数量统计,以输出所述相关关键词集合对应的第一数值,再依据所述目标数据库中的文本数据,对所述相关关键词集合包括的每两个相关关键词进行语义相关度计算处理,再对所述相关关键词集合包括的每两个相关关键词之间的语义相关度进行均值计算,以输出所述相关关键词集合对应的语义相关度,再依据所述相关关键词集合对应的第一数值和对应的语义相关度进行向量构建处理,以输出所述相关关键词集合对应的第一向量;
对所述第二关键词集合包括的第二关键词进行数量统计,以输出所述第二关键词集合对应的第二数值,再依据所述目标数据库中的文本数据,对所述第二关键词集合包括的每两个第二关键词进行语义相关度计算处理,再对所述第二关键词集合包括的每两个第二关键词之间的语义相关度进行均值计算,以输出所述第二关键词集合对应的语义相关度,再依据所述第二关键词集合对应的第二数值和对应的语义相关度进行向量构建处理,以输出所述第二关键词集合对应的第二向量;
依据所述第一关键词集合对应的第一向量和所述第二关键词集合对应的第二向量进行点乘处理,以输出对应的第一点乘值,再依据所述相关关键词集合对应的第一向量和所述第二关键词集合对应的第二向量进行点乘处理,以输出对应的第二点乘值;
依据所述第一点乘值和所述第二点乘值分别确定出所述第一关键词集合对应的第一加权系数和所述相关关键词集合对应的第二加权系数,再依据所述第一加权系数和所述第二加权系数对所述第一集合重合度和所述第二集合重合度进行加权求和计算,以输出所述风控样本数据与所述当前遍历到的新的风控样本数据之间的数据相似度。
6.一种基于信息安全的风控更新系统,其特征在于,应用于风控管理服务器,所述基于信息安全的风控更新系统包括:
数据标记模块,用于在形成新的风控数据之后,将当前形成的每一条新的风控数据标记为新的风控样本数据,以输出多条新的风控样本数据;
数据集合标记模块,用于从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,每一个所述风控数据集合包括多条风控样本数据,每一条风控样本数据具有风控标签信息,所述风控标签信息用于表征对应的所述风控样本数据是否属于具有风险的异常风控样本数据,每一个所述风控数据集合具有依据包括的多条风控样本数据的风控标签信息确定出的风险系数,所述风险系数用于表征与该风险系数对应的风控数据集合包括的风控样本数据匹配的待处理风控数据属于具有风险的异常风控样本数据的概率;
风险系数更新模块,用于依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数;
所述从预先配置的多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,包括:
对于预先配置的多个风控数据集合中的每一个风控数据集合,对该风控数据集合包括的风控样本数据的数量进行统计,以输出该风控数据集合对应的样本数据数量,再依据该样本数据数量进行负相关系数确定处理,以输出该风控数据集合对应的第一系数;
依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合;
所述依据每一个所述风控数据集合对应的第一系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,包括:
依据每一个所述风控数据集合对应的风险系数,对所述多个风控数据集合进行聚类处理,以输出所述多个风控数据集合对应的至少一个集合聚类簇,每一个集合聚类簇包括至少一个风控数据集合;
对于所述至少一个集合聚类簇中的每一个集合聚类簇,对该集合聚类簇包括的风控数据集合的数量进行统计处理,以输出该集合聚类簇对应的集合统计数量,再依据该集合统计数量进行负相关系数确定处理,以输出该集合聚类簇包括的每一个风控数据集合对应的第二系数;
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合;
所述对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和对应的第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数,再依据每一个风控数据集合对应的融合系数,从所述多个风控数据集合中确定出至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合,包括:
对于每一个所述风控数据集合,依据该风控数据集合对应的第一系数和第二系数进行系数融合处理,以输出该风控数据集合对应的融合系数;
对所述多条新的风控样本数据进行数量统计处理,以输出所述多条新的风控样本数据对应的新数据数量统计值,再依据该新数据数量统计值进行正相关数量确定处理,以输出对应的目标数量;
从所述多个风控数据集合中确定出数量为所述目标数量且对应的融合系数最大的至少一个风控数据集合,再将该至少一个风控数据集合中的每一个风控数据集合标记为待更新风控数据集合;
所述依据所述多条新的风控样本数据,分别对每一个所述待更新风控数据集合进行更新处理,以输出每一个所述待更新风控数据集合对应的目标风控数据集合,再分别依据每一个目标风控数据集合包括的风控样本数据,对每一个目标风控数据集合具有的风险系数进行更新处理,以输出每一个所述目标风控数据集合对应的新的风险系数,包括:
对于每一个所述待更新风控数据集合,依据该待更新风控数据集合包括的风控样本数据的数量和该待更新风控数据集合对应的风险系数与其它风控数据集合对应的风险系数之间的大小关系进行样本分配系数确定处理,以输出该待更新风控数据集合对应的样本分配系数;
依据每一个所述待更新风控数据集合对应的样本分配系数,分别对每一个所述待更新风控数据集合进行样本分配比例确定处理,以输出每一个所述待更新风控数据集合对应的样本分配比例,每一个所述待更新风控数据集合对应的样本分配比例的和值等于1;
依次对所述多条新的风控样本数据进行遍历;
对于每一个所述待更新风控数据集合,分别对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据进行数据相似度计算处理,以输出该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度;
对于每一个所述待更新风控数据集合,对该待更新风控数据集合包括的每一条风控样本数据与当前遍历到的新的风控样本数据之间的数据相似度进行均值计算,以输出该待更新风控数据集合对应的数据相似度代表值;
将当前遍历到的新的风控样本数据分配至对应的数据相似度代表值具有最大值的待更新风控数据集合中,直到该待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,直到每一个待更新风控数据集合分配到的新的风控样本数据的比例等于该待更新风控数据集合对应的样本分配比例,以形成每一个所述待更新风控数据集合对应的目标风控数据集合;
对于每一个所述目标风控数据集合,依据该目标风控数据集合包括的风控样本数据和新的风控样本数据,对该目标风控数据集合具有的风险系数进行更新处理,以输出该目标风控数据集合对应的新的风险系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210518415.2A CN114625747B (zh) | 2022-05-13 | 2022-05-13 | 基于信息安全的风控更新方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210518415.2A CN114625747B (zh) | 2022-05-13 | 2022-05-13 | 基于信息安全的风控更新方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114625747A CN114625747A (zh) | 2022-06-14 |
CN114625747B true CN114625747B (zh) | 2022-08-12 |
Family
ID=81907156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210518415.2A Active CN114625747B (zh) | 2022-05-13 | 2022-05-13 | 基于信息安全的风控更新方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114625747B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109300042A (zh) * | 2018-09-11 | 2019-02-01 | 广州财略金融信息科技有限公司 | 一种基于大数据的风控系统 |
CN114004481A (zh) * | 2021-10-28 | 2022-02-01 | 中国建设银行股份有限公司 | 一种风险信息确定方法、装置、设备及存储介质 |
CN114330966A (zh) * | 2021-10-15 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种风险预测方法、装置、设备以及可读存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7865427B2 (en) * | 2001-05-30 | 2011-01-04 | Cybersource Corporation | Method and apparatus for evaluating fraud risk in an electronic commerce transaction |
US7584081B2 (en) * | 2005-11-21 | 2009-09-01 | Chevron U.S.A. Inc. | Method, system and apparatus for real-time reservoir model updating using ensemble kalman filter |
US11055772B1 (en) * | 2013-07-31 | 2021-07-06 | Intuit Inc. | Instant lending decisions |
CN109684369B (zh) * | 2017-10-18 | 2021-12-10 | 北京京东尚科信息技术有限公司 | 信息更新方法和装置 |
CN108985559A (zh) * | 2018-06-08 | 2018-12-11 | 平安科技(深圳)有限公司 | 风控数据处理方法、装置、计算机设备及存储介质 |
CN110147823B (zh) * | 2019-04-16 | 2023-04-07 | 创新先进技术有限公司 | 一种风控模型训练方法、装置及设备 |
US10504028B1 (en) * | 2019-04-24 | 2019-12-10 | Capital One Services, Llc | Techniques to use machine learning for risk management |
CN110888990B (zh) * | 2019-11-22 | 2024-04-12 | 深圳前海微众银行股份有限公司 | 文本推荐方法、装置、设备及介质 |
CN113240192A (zh) * | 2021-06-01 | 2021-08-10 | 平安科技(深圳)有限公司 | 模型训练及预测方法、装置、计算机设备及存储介质 |
CN113256402A (zh) * | 2021-06-03 | 2021-08-13 | 上海冰鉴信息科技有限公司 | 风险控制规则确定方法、装置和电子设备 |
CN113362072B (zh) * | 2021-06-30 | 2023-09-08 | 成都一蟹科技有限公司 | 风控数据处理方法、装置、电子设备及存储介质 |
CN113568604B (zh) * | 2021-09-26 | 2022-01-07 | 深圳万顺叫车云信息技术有限公司 | 风控策略的更新方法、装置及计算机可读存储介质 |
CN114095282B (zh) * | 2022-01-21 | 2022-04-15 | 杭银消费金融股份有限公司 | 一种基于短文本特征提取的风控处理方法及设备 |
-
2022
- 2022-05-13 CN CN202210518415.2A patent/CN114625747B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109300042A (zh) * | 2018-09-11 | 2019-02-01 | 广州财略金融信息科技有限公司 | 一种基于大数据的风控系统 |
CN114330966A (zh) * | 2021-10-15 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种风险预测方法、装置、设备以及可读存储介质 |
CN114004481A (zh) * | 2021-10-28 | 2022-02-01 | 中国建设银行股份有限公司 | 一种风险信息确定方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114625747A (zh) | 2022-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115098650B (zh) | 基于历史数据模型的评论信息分析方法及相关装置 | |
CN111984792A (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN114444619B (zh) | 样本生成方法、训练方法、数据处理方法以及电子设备 | |
CN114647636B (zh) | 大数据异常检测方法及系统 | |
CN112528022A (zh) | 主题类别对应的特征词提取和文本主题类别识别方法 | |
CN111209929A (zh) | 访问数据处理方法、装置、计算机设备及存储介质 | |
CN114625747B (zh) | 基于信息安全的风控更新方法及系统 | |
CN116720119A (zh) | 应用于多端业务交互的大数据识别方法及系统 | |
CN115146653B (zh) | 对话剧本构建方法、装置、设备及存储介质 | |
CN116681350A (zh) | 智慧工厂故障检测方法及系统 | |
CN115203758A (zh) | 一种数据安全存储方法、系统及云平台 | |
CN113656586B (zh) | 情感分类方法、装置、电子设备及可读存储介质 | |
CN113095073B (zh) | 语料标签生成方法、装置、计算机设备和存储介质 | |
CN113064984B (zh) | 意图识别方法、装置、电子设备及可读存储介质 | |
CN115098548A (zh) | 一种数据决策方法、系统及云平台 | |
CN109885710B (zh) | 基于差分演化算法的用户画像刻画方法及服务器 | |
CN114528378A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN113627514A (zh) | 知识图谱的数据处理方法、装置、电子设备和存储介质 | |
CN115187153B (zh) | 应用于业务风险溯源的数据处理方法及系统 | |
CN115314550B (zh) | 基于数字化的智慧医疗信息推送方法及系统 | |
CN114996589B (zh) | 基于防疫大数据的线上资讯推送方法及系统 | |
CN116975300B (zh) | 基于大数据集合的信息挖掘方法及系统 | |
CN116662415B (zh) | 基于数据挖掘的智能匹配方法及系统 | |
CN113590935B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN114625786B (zh) | 一种基于风控技术的动态数据挖掘方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |