CN112966113A - 一种数据的风险防控方法、装置及设备 - Google Patents
一种数据的风险防控方法、装置及设备 Download PDFInfo
- Publication number
- CN112966113A CN112966113A CN202110347777.5A CN202110347777A CN112966113A CN 112966113 A CN112966113 A CN 112966113A CN 202110347777 A CN202110347777 A CN 202110347777A CN 112966113 A CN112966113 A CN 112966113A
- Authority
- CN
- China
- Prior art keywords
- risk
- data
- target
- type
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002265 prevention Effects 0.000 title claims abstract description 186
- 238000000034 method Methods 0.000 title claims abstract description 122
- 238000001514 detection method Methods 0.000 claims abstract description 134
- 238000012545 processing Methods 0.000 claims abstract description 101
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 65
- 238000000605 extraction Methods 0.000 claims description 35
- 230000011218 segmentation Effects 0.000 claims description 29
- 238000003860 storage Methods 0.000 claims description 22
- 230000006399 behavior Effects 0.000 claims description 10
- 238000000513 principal component analysis Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 6
- 238000011217 control strategy Methods 0.000 claims description 5
- 238000003064 k means clustering Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 12
- 238000013145 classification model Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000032683 aging Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本说明书实施例公开了一种数据的风险防控方法、装置及设备,该方法包括:获取待检测的目标数据;对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种数据的风险防控方法、装置及设备。
背景技术
在涉及个人信息的体系内(尤其是在金融体系内),信息盗用、用户欺诈、作弊等各种风险形式变化多样,在与攻击者的不断对抗中,会不断出现新的风险手法或批量的聚集性风险。
通常,针对出现的新的风险手法或批量的聚集性风险,可以通过人工逐步感知后,再部署相应的策略进行防控,但是,上述方式的时效慢,而且,其中涉及的模型一般是进行整体的优化学习,这样,该模型针对新的风险手法和批量的聚集性风险的学习往往无法达到较好的覆盖。为此,需要提供一种更加智能化、时效更快的风险防控方式。
发明内容
本说明书实施例的目的是提供一种更加智能化、时效更快的风险防控方式。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种数据的风险防控方法,所述方法包括:获取待检测的目标数据。对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果。如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例提供的一种数据的风险防控装置,所述装置包括:目标数据获取模块,获取待检测的目标数据。风险检测模块,对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果。模型更新模块,如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。风险防控模块,基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例提供的一种数据的风险防控设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取待检测的目标数据。对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果。如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取待检测的目标数据。对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果。如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本说明书一种数据的风险防控方法实施例;
图1B为本说明书一种数据的风险防控方法的处理过程的示意图;
图2A为本说明书一种用户进行风险投诉的页面示意图;
图2B为本说明书一种数据的风险防控系统的结构示意图;
图3为本说明书另一种数据的风险防控方法的处理过程的示意图;
图4为本说明书又一种数据的风险防控方法的处理过程的示意图;
图5为本说明书又一种数据的风险防控方法的处理过程的示意图;
图6为本说明书一种数据的风险防控装置实施例;
图7为本说明书一种数据的风险防控设备实施例。
具体实施方式
本说明书实施例提供一种数据的风险防控方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1A和图1B所示,本说明书实施例提供一种数据的风险防控方法,该方法的执行主体可以为服务器或终端设备,其中,该终端设备可以如笔记本电脑或台式电脑等计算机设备,还可以如手机或平板电脑等移动终端设备。该服务器可以是为某项业务(如进行交易的业务或金融业务等)或需要对某业务或数据进行风险防控的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。本实施例中的执行主体以服务器为例进行说明,对于执行主体为终端设备的情况,可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S102中,获取待检测的目标数据。
其中,目标数据可以是任意存在某一种或多种不同风险的数据,目标数据可以通过多种不同的方式提供,例如,用户可以通过预先设定的投诉机制或上报机制向风险防控方提供相应的投诉信息或上报存在风险的数据等,此外,目标数据还可以通过网络爬虫的方式从指定的网络中获取的数据,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,在涉及个人信息的体系内(尤其是在金融体系内),信息盗用、用户欺诈、作弊等各种风险形式变化多样,在与攻击者的不断对抗中,会不断出现新的风险手法或批量的聚集性风险。通常,针对出现的新的风险手法或批量的聚集性风险,可以通过人工逐步感知后,再部署相应的策略进行防控,但是,上述方式的时效慢,而且,其中涉及的模型一般是进行整体的优化学习,这样,该模型针对新的风险手法和批量的聚集性风险的学习往往无法达到较好的覆盖。为此,需要提供一种更加智能化、时效更快的风险防控方式。本说明书实施例提供一种可选的风险防控方式,具体可以包括以下内容:
在实际应用中,可以通过多种不同的方式获取待检测的目标数据,具体如,如图2A所示,某金融类应用程序中设置有风险投诉入口(具体可以如以超链接的形式呈现,或以按键的形式呈现等),如图2B所示,当某用户在使用该金融类应用程序的过程中,通过该金融类应用程序接收到兼职刷单的信息,此时,用户可以将接收到的信息通过上述风险投诉入口发送给该金融类应用程序的运营方的服务器,服务器可以获取用户上传的信息,并可以将该信息作为待检测的目标数据。
在实际应用中,除了可以通过上述方式获取待检测的目标数据外,还可以通过多种不同的方式获取待检测的目标数据,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S104中,对目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果。
其中,预设的风险类型可以是预先设定的存在风险的数据所对应的类型,该风险类型可以包括多种,例如兼职刷单类、假冒公检法类、交备用金类等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,为了提供更加智能化、时效更快的风险防控方式,首先需要快速识别和感知新的风险手法或新的批量聚集性风险,基于此,通过上述方式得到待检测的目标数据后,可以对目标数据进行风险检测,在实际应用中,可以通过多种不同的方式分别对目标数据进行风险检测,例如,可以通过分类或聚类的方式对目标数据进行风险检测,同时,也可以通过其它设定的风险检测规则对目标数据进行风险检测,其中的风险检测规则可以包括多种,例如通过关键词或关键字等确定新风险的规则,或者,通过指定用户或指定数据上传方提供的风险信息即确定为存在风险的信息的规则等,具体可以根据实际情况设定,本说明书实施例对此不做限定。本实施例中,以分类、聚类和关键词分析等方式对目标数据进行风险检测,具体地,可以先对目标数据进行分类,从而确定目标数据属于哪一种风险类型,其中对目标数据进行分类的具体处理可以通过多种方式实现,例如可以通过相关历史数据预先训练分类模型,然后,可以基于训练后的分类模型对目标数据进行分类,分类模型输出的结果即可以为目标数据对应的分类类别,可以将得到的分类类别作为目标数据对应的风险类型。如果分类模型无法确定目标数据对应的分类类别,则可以将目标数据的风险类型确定为新的风险类型。此外,通过上述方式对目标数据进行分类后,还可以进一步对目标数据进行聚类处理,具体处理过程可以是通过预设的聚类算法对目标数据进行聚类,得到目标数据对应的聚类类别,该聚类类别可以是分类类别下的子类别,例如分类类别为兼职刷单类,聚类类别可以为交备用金类,其中,交备用金类可以为兼职刷单类下的子类别等,具体可以根据实际情况设定,本说明书实施例对此不做限定。此外,为了及时发现新的风险,还可以对目标数据进行关键词提取,得到目标数据中包含的关键词或关键字,通过对提取的关键词或关键字进行分析,确定目标数据中可能存在的风险,从而确定目标数据是否为新的风险类型的风险数据。通过上述方式得到相应的结果后,可以对得到的结果进行综合分析,进而确定目标数据对应的目标风险类型是否属于预设的风险类型,并得到相应的风险检测结果。
在步骤S106中,如果上述风险检测结果指示目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。
其中,风险对抗模型可以是预先通过指定算法构建,并通过获取的相关历史数据作为样本对上述构建的模型进行训练后得到的模型,其中的指定算法可以包括多种,例如神经网络模型、多层感知模型等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,通过上述步骤S104的处理得到相应的风险检测结果后,可以对该检测结果的内容进行分析,确定目标数据对应的目标风险类型是否属于预设的风险类型,如果该风险检测结果指示目标风险类型不属于预设的风险类型,则表明目标数据为新增加的风险类型的数据,这样,通过上述方式快速识别和感知新的风险手法和新的批量聚集风险,之后,需要通过模型学习等方式对风险对抗模型进行更新,以使得更新后的风险对抗模型能够识别和感知上述出现的新风险手法和新的批量聚集风险,具体地,可以通过多种不同的方式获取属于目标风险类型的风险数据,例如,可以通过购买的方式向多个不同的用户购买属于目标风险类型的风险数据,或者,可以预先设定一定的时长(如7天或30天等),在上述设定的时长内收集用户上传或投诉的数据,可以从收集的数据中获取属于目标风险类型的风险数据等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
获取到属于目标风险类型的风险数据后,可以通过获取的风险数据对当前使用的风险对抗模型进行训练,然后,可以对训练后的风险对抗模型的输出准确性进行评估,如果评估结果为未通过,则可以再次通过多种不同的方式获取属于目标风险类型的风险数据,并可以通过获取的风险数据继续对风险对抗模型进行训练,之后再次对训练后的风险对抗模型的输出准确性进行评估,重复执行上述处理过程,直到评估结果为通过为止。如果评估结果为通过,则表明训练后的风险对抗模型能够对目标风险类型的风险数据进行风险防控。
需要说明的是,上述风险对抗模型是以只包含一个模型为例进行详细说明,在实际应用中,上述风险对抗模型还可以包括多个不同的子模型,例如,风险对抗模型中可以包括新增加的第一风险类型对应的子模型、新增加的第二风险类型对应的子模型、预设的风险类型对应的子模型和当前已存在的风险类型对应的子模型等,在此情况下,可以使用上述属于目标风险类型的风险数据构建目标风险类型对应的子模型,同时,还可以使用上述属于目标风险类型的风险数据对当前已存在的风险类型对应的子模型进行训练,以更新当前已存在的风险类型对应的子模型等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S108中,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理。
在实施中,通过上述方式得到训练后的风险对抗模型后,可以使用训练后的风险对象模型对当前系统中可能存在的风险进行防控,即当预设的风险类型的风险数据输入到训练后的风险对象模型后,可以得到该风险数据对应的风险类型,并可以将相应的通知消息发送给管理设备,当目标风险类型的风险数据输入到训练后的风险对象模型后,可以得到该风险数据对应的风险类型,并可以将相应的通知消息发送给管理设备等,以实现对接收到的风险数据进行风险防控处理。
本说明书实施例提供一种数据的风险防控方法,通过对获取的待检测的目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,如果目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理,这样,在检测到新的风险类型的数据时,可以及时通过新的风险类型的数据训练并更新相应的风险对抗模型,使得风险对抗模型具备对新的风险类型的数据的风险防控,从而能够针对新的风险手法和批量的聚集性风险的模型学习达到较好的覆盖,而且在风险防控的过程中更加智能化、风险防控的时效更加快速。
实施例二
如图3所示,本说明书实施例提供一种数据的风险防控方法,该方法的执行主体可以为服务器或终端设备,其中,该终端设备可以如笔记本电脑或台式电脑等计算机设备,还可以如手机或平板电脑等移动终端设备。该服务器可以是为某项业务(如进行交易的业务或金融业务等)或需要对某业务或数据进行风险防控的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。本实施例中的执行主体以服务器为例进行说明,对于执行主体为终端设备的情况,可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S302中,获取待检测的目标数据。
其中,目标数据可以包括用户的风险投诉数据,以及用户的风险投诉数据对应的关联行为数据。其中的用户的风险投诉数据可以是用户在获取到某风险数据后,向相应的组织或机构进行风险投诉的数据,其中的关联行为数据可以包括从用户获取到该风险数据开始,直到用户完成对该风险数据的投诉为止的过程中用户的操作行为数据,或者,上述过程中部分时间段内用户的操作行为数据,或者,上述过程中一个或多个不同的时间点上用户的操作行为数据等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实际应用中,上述步骤102的处理中对目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果的具体处理可以通过多种不同的方式实现,以下提供一种可选的处理方式,如图4所示,具体可以参见下述步骤S304和步骤S306,以及下述步骤S308~步骤S312,以及下述步骤S314~步骤S316的处理。
在步骤S304中,对目标数据进行分类,得到目标数据对应的分类类型。
在实施中,如图4所示,不同的应用场景下往往包括多种不同的风险实现手法,例如,针对欺诈场景,可以包括多种不同的欺诈手法,具体如兼职刷单手法、假冒公检法手法等,可以针对不同的应用场景下不同的风险实现手法设置相应的风险类型。此外,还可以基于不同的风险类型设置不同的分类类型,例如,针对上述兼职刷单手法,可以设置兼职刷单的分类类型,针对上述假冒公检法手法,可以设置假冒公检法的分类类型等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实际应用中,对目标数据进行分类的方式可以多种多样,例如,可以通过人工标注的数据对预设的分类模型(可以通过指定的分类算法构建)进行有监督的多分类任务的模型训练,得到训练后的分类模型。然后,可以基于训练后的分类模型对目标数据进行分类,得到目标数据对应的分类类型。
在步骤S306中,如果上述分类类型对应的风险类型不属于预设的风险类型,则将该分类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
在实施中,如果上述分类类型对应的风险类型不属于预设的风险类型,则表明目标数据属于新的风险实现手法,此时,可以将该分类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
上述步骤S306的具体处理过程除了可以通过上述方式实现外,还可以通过多种不同的方式实现,以下再提供一种可选的处理方式,具体可以包括以下内容:如果上述分类类型对应的风险类型不属于预设的风险类型,且基于预设的时序异常检测规则确定该分类类型的数据的数据量存在增加趋势,则将给分类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
其中,时序异常检测规则可以是基于时间顺序进行异常检测的规则,例如,在每天的7:00-10:00,用户对某数据的访问在上述时间段内呈现稳定的分布状态,通过上述信息设置相应的时序异常检测规则后,可以通过时序异常检测规则实时检测在上述时间段内用户对该数据的访问所呈现稳定的分布状态或分布趋势,以判断是否出现异常。在实际应用中,时序异常检测规则可以包括多种,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,如果上述分类类型对应的风险类型不属于预设的风险类型,则表明目标数据属于新的风险实现手法,此时,可以获取下一周期或前一周期内的该分类类型的数据,并可以通过时序异常检测规则将其与当前该分类类型的数据进行比较,确定该分类类型的数据的数据量是否存在增加趋势,如果通过时序异常检测规则确定该分类类型的数据的数据量存在增加趋势,则表明目标数据属于新的风险实现手法,且具有风险增加的趋势,此时,可以将该分类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
在步骤S308中,对目标数据进行聚类,得到目标数据对应的聚类类型。
在实施中,可以直接通过预先设定的聚类算法对目标数据进行聚类,得到目标数据对应的聚类类型,其中,该聚类算法可以包括多种,具体如该聚类算法可以包括k-Means聚类算法和DBScan聚类算法等,具体可以根据实际情况设定,本说明书实施例对此不做限定。具体的聚类处理过程可以根据不同的聚类算法对应的算法流程执行相应的聚类处理,本说明书实施例在此不再赘述。
上述步骤S308的具体处理方式可以多种多样,以下再提供一种可选的处理方式,具体可以包括步骤A2~步骤A8的处理。
在步骤A2中,对目标数据进行特征提取,得到目标数据对应的嵌入Embedding特征。
在实施中,可以通过预设的算法将目标数据转化为向量的形式,然后,可以基于目标数据对应的向量进行特征提取,得到目标数据对应的嵌入Embedding特征。
上述步骤A2的具体处理方式可以多种多样,以下再提供一种可选的处理方式,具体可以包括:通过预设的特征提取算法对目标数据进行特征提取,得到目标数据对应的嵌入Embedding特征,该特征提取算法包括TF-IDF算法、LSA算法、Word2Vec算法中的一种或多种。
上述具体的特征提取处理过程可以根据不同的特征提取算法对应的算法流程执行相应的特征提取处理,本说明书实施例在此不再赘述。
在步骤A4中,对目标数据对应的Embedding特征进行Bin分割处理,得到该Embedding特征对应的Bin分割数据。
在实施中,得到目标数据对应的Embedding特征后,可以将Embedding特征划分为多个不同的部分,每个部分可以作为一个Bin分割数据,从而可以得到该Embedding特征对应的一个或多个Bin分割数据。
在步骤A6中,对上述Embedding特征对应的Bin分割数据进行PCA降维处理,得到该Bin分割数据对应的预设维度数据。
其中,预设维度数据可以是设定数量的维度对应的数据,具体如包括3个维度的数据,或者,包括5个维度的数据等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤A8中,基于预设的聚类算法对上述Bin分割数据对应的预设维度数据进行聚类,得到目标数据对应的聚类类型。
具体的聚类处理过程可以根据不同的聚类算法对应的算法流程执行相应的聚类处理,本说明书实施例在此不再赘述。
在步骤S310中,如果目标数据对应的聚类类型对应的风险类型不属于预设的风险类型,则获取预设周期内的待检测数据,并对待检测数据进行聚类,得到待检测数据对应的聚类类型。
其中,预设周期可以包括多种,例如7天或30天等。
在实施中,可以根据实际情况预先设定数据采集的周期,如7天。如果目标数据对应的聚类类型对应的风险类型不属于预设的风险类型,则表明目标数据属于新的风险实现手法,此时,可以获取下一周期或前一周期内的该聚类类型的数据(即待检测数据),然后,可以通过上述方式对待检测数据进行聚类(即直接通过聚类算法对待检测数据进行聚类,或者,可以通过如上所述的步骤A2~步骤A8的处理实现对待检测数据的聚类),从而得到待检测数据对应的聚类类型。
在步骤S312中,如果待检测数据对应的聚类类型中包括目标数据对应的聚类类型,则将目标数据对应的聚类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
在实施中,如果待检测数据对应的聚类类型中包括目标数据对应的聚类类型,则表明预设周期中也包含目标数据对应的聚类类型的风险数据,则可以将待检测数据与目标数据进行比较,确定该聚类类型的数据的数据量是否存在增加趋势,如果通过时序异常检测规则确定该分类类型的数据的数据量存在增加趋势,则表明目标数据属于新的风险实现手法,且具有风险增加趋势,甚至存在批量趋势,此时,可以将该聚类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
在步骤S314中,对目标数据进行关键词提取,得到目标数据中包含的关键词。
在实施中,如图4所示,可以对目标数据中包含的内容进行分析,然后,可以对目标数据进行分词处理,得到一个或多个不同的关键词。可以基于关键词在目标数据中出现的频次,或者,关键词在目标数据中的重要性或权重等方式从目标数据中获取一个或多个关键词,例如,可以基于TF-IDF算法计算每一个关键词的TF-IDF数值,可以选取TF-IDF数值大于预设阈值的关键词作为目标数据中包含的关键词,或者,可以选取分词处理后得到的关键词作为目标数据中包含的关键词。
在步骤S316中,如果目标数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,且目标关键词对应的数据存在预设的风险,则确定目标数据对应的目标风险类型不属于预设的风险类型,得到相应的风险检测结果。
在实施中,可以获取预设时间段内产生的相关数据(如7天内用户上传的风险投诉数据等),并可以通过如上所述的方式获取预设时间段内获取的数据包含的关键词,其中的预设时间段可以根据实际情况设定,具体如3天或24小时等。如果目标数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,则可以对目标关键词进行分析,确定该目标关键词对应的数据是否存在预设的风险,如果目标关键词对应的数据存在预设的风险,则表明目标数据包含新的风险类型的数据,此时,可以确定目标数据对应的目标风险类型不属于预设的风险类型,进而可以得到相应的风险检测结果。
在步骤S318中,如果上述风险检测结果指示目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。
在步骤S320中,通过预设的风险类型的数据和属于目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型。
其中,风险防控模型可以是与上述风险对抗模型不同的模型,例如上述风险对抗模型可以只针对新增加的风险类型的数据,即风险对抗模型可以只针对商户预设的风险类型之外的风险类型的数据,而风险防控模型可以针对当前已出现的风险类型(包括预设的风险类型和新增加的风险类型等)的数据等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,如图4所示,为了更好对当前的风险防控模型的风险防控效果进行更新和改善,也可以基于目标风险类型的风险数据对当前的风险防控模型进行训练,具体地,可以获取指定周期或指定时间段内获取到的用户上传的风险投诉数据,该风险投诉数据中可以包括预设的风险类型的数据和属于目标风险类型的风险数据,然后,可以通过预设的风险类型的数据和属于目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型。
在实际应用中,针对上述步骤S318和步骤S320的处理,以存在风险的整体案件及确定的新的风险类型的风险为两个任务,可以采用多任务方法训练上述各个模型,即存在风险的整体案件与新的风险类型可以在训练的第一阶段,同时进行训练,在第二阶段的训练中,可以利用迁移学习的方式对上述模型进行训练。然后,可以对训练后的模型进行评估分析,评估新的风险类型在聚集风险上的覆盖率,并与以全量欺诈案件建模后在提取的新的风险类型在聚集风险上的覆盖率进行比较,如果高出后者,则选择风险对抗模型上线,否则进行数据分析生成相应的特征对模型进行优化,或者,选择风险对抗模型暂时不上线等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S322中,基于训练后的风险防控模型和训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理。
上述步骤S322的具体处理可以多种多样,以下提供一种可选的处理方式具体可以参加下述步骤B2~步骤B8的处理。
在步骤B2中,将目标风险类型的风险数据输入到训练后的风险防控模型中,得到目标风险类型的风险数据存在风险的第一概率。
在步骤B4中,将目标风险类型的风险数据输入到训练后的风险对抗模型中,得到目标风险类型的风险数据存在风险的第二概率。
在步骤B6中,如果第二概率大于第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理。
上述步骤B6的具体处理可以多种多样,以下提供一种可选的处理方式,具体可以包括以下内容:如果第二概率大于第一概率,则基于第一概率和第二概率,确定目标风险类型的风险数据所需执行的风险防控策略,以对目标风险类型的风险数据进行风险防控处理
其中,风险防控策略可以包括多种,例如,如果第二概率和第一概率均大约预设的概率阈值,则表明该风险数据存在风险,可以对目标风险类型的风险数据进行隔离或删除,同时可以对后续出现目标风险类型的风险数据进行预警处理等。
在步骤B8中,如果第二概率不大于第一概率,则基于训练后的风险防控模型对目标风险类型的风险数据进行风险防控处理。
本说明书实施例提供一种数据的风险防控方法,通过对获取的待检测的目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,如果目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理,这样,在检测到新的风险类型的数据时,可以及时通过新的风险类型的数据训练并更新相应的风险对抗模型,使得风险对抗模型具备对新的风险类型的数据的风险防控,从而能够针对新的风险手法和批量的聚集性风险的模型学习达到较好的覆盖,而且在风险防控的过程中更加智能化、风险防控的时效更加快速。
实施例三
本实施例将结合具体的应用场景,对本说明书实施例提供的一种数据的风险防控方法进行详细的阐述,相应的应用场景为针对用户的信息欺诈场景,其中的待检测的目标数据可以为欺诈风险数据,风险实现手法可以为欺诈手法等。如图5所示,本说明书实施例提供一种数据的风险防控方法,该方法的执行主体可以为服务器或终端设备,其中,该终端设备可以如笔记本电脑或台式电脑等计算机设备,还可以如手机或平板电脑等移动终端设备。该服务器可以是为某项业务(如进行交易的业务或金融业务等)或需要对某业务或数据进行风险防控的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。本实施例中的执行主体以服务器为例进行说明,对于执行主体为终端设备的情况,可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S502中,获取待检测的欺诈风险数据。
其中,欺诈风险数据可以包括针对欺诈风险的用户投诉数据,以及用户投诉数据对应的关联行为数据。
在实际应用中,上述步骤102的处理中对目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果的具体处理可以通过下述方式实现,具体可以参见下述步骤S504和步骤S506,以及下述步骤S508~步骤S518,以及下述步骤S520~步骤S522的处理。
在步骤S504中,对欺诈风险数据进行分类,得到欺诈风险数据对应的分类类型。
在实施中,可以包括多种不同的欺诈手法,具体如兼职刷单手法、假冒公检法手法等,可以针对不同的欺诈手法设置相应的风险类型。
在实际应用中,对欺诈风险数据进行分类的方式可以多种多样,如可以通过人工标注的数据对预设的分类模型(可以通过指定的分类算法构建)进行有监督的多分类任务的模型训练,得到训练后的分类模型。然后,可以基于训练后的分类模型对欺诈风险数据进行分类,得到欺诈风险数据对应的分类类型。
在步骤S506中,如果上述分类类型对应的风险类型不属于预设的风险类型,且基于预设的时序异常检测规则确定该分类类型的数据的数据量存在增加趋势,则将给分类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
在步骤S508中,对欺诈风险数据进行特征提取,得到欺诈风险数据对应的嵌入Embedding特征。
具体可以通过预设的特征提取算法对目标数据进行特征提取,得到目标数据对应的嵌入Embedding特征,该特征提取算法包括TF-IDF算法、LSA算法、Word2Vec算法中的一种或多种。
在步骤S510中,对欺诈风险数据对应的Embedding特征进行Bin分割处理,得到该Embedding特征对应的Bin分割数据。
在步骤S512中,对上述Embedding特征对应的Bin分割数据进行PCA降维处理,得到该Bin分割数据对应的预设维度数据。
在步骤S514中,基于预设的聚类算法对上述Bin分割数据对应的预设维度数据进行聚类,得到欺诈风险数据对应的聚类类型。
在步骤S516中,如果欺诈风险数据对应的聚类类型对应的风险类型不属于预设的风险类型,则获取预设周期内的待检测数据,并对待检测数据进行聚类,得到待检测数据对应的聚类类型。
在步骤S518中,如果待检测数据对应的聚类类型中包括目标数据对应的聚类类型,则将欺诈风险数据对应的聚类类型对应的风险类型作为目标风险类型,并生成用于指示目标风险类型不属于预设的风险类型的风险检测结果。
在步骤S520中,对欺诈风险数据进行关键词提取,得到欺诈风险数据中包含的关键词。
在步骤S522中,如果欺诈风险数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,且目标关键词对应的数据存在预设的风险,则确定欺诈风险数据对应的目标风险类型不属于预设的风险类型,得到相应的风险检测结果。
在步骤S524中,如果上述风险检测结果指示目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型。
在步骤S526中,通过预设的风险类型的数据和属于目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型。
在步骤S528中,将目标风险类型的风险数据输入到训练后的风险防控模型中,得到目标风险类型的风险数据存在风险的第一概率。
在步骤S530中,将目标风险类型的风险数据输入到训练后的风险对抗模型中,得到目标风险类型的风险数据存在风险的第二概率。
在步骤S532中,如果第二概率大于第一概率,则基于第一概率和第二概率,确定目标风险类型的风险数据所需执行的风险防控策略,以对目标风险类型的风险数据进行风险防控处理。
在步骤S534中,如果第二概率不大于第一概率,则基于训练后的风险防控模型对目标风险类型的风险数据进行风险防控处理。
本说明书实施例提供一种数据的风险防控方法,通过对获取的待检测的目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,如果目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理,这样,在检测到新的风险类型的数据时,可以及时通过新的风险类型的数据训练并更新相应的风险对抗模型,使得风险对抗模型具备对新的风险类型的数据的风险防控,从而能够针对新的风险手法和批量的聚集性风险的模型学习达到较好的覆盖,而且在风险防控的过程中更加智能化、风险防控的时效更加快速。
实施例四
以上为本说明书实施例提供的数据的风险防控方法,基于同样的思路,本说明书实施例还提供一种数据的风险防控装置,如图6所示。
该数据的风险防控装置包括:目标数据获取模块601、风险检测模块602、模型更新模块603和风险防控模块604,其中:
目标数据获取模块601,获取待检测的目标数据;
风险检测模块602,对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
模型更新模块603,如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
风险防控模块604,基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述风险检测模块602,包括:
分类单元,对所述目标数据进行分类,得到所述目标数据对应的分类类型;
风险检测单元,如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述风险检测单元,如果所述分类类型对应的风险类型不属于预设的风险类型,且基于预设的时序异常检测规则确定所述分类类型的数据的数据量存在增加趋势,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述风险检测模块602,包括:
第一聚类单元,对所述目标数据进行聚类,得到所述目标数据对应的聚类类型;
第二聚类单元,如果所述目标数据对应的聚类类型对应的风险类型不属于预设的风险类型,则获取预设周期内的待检测数据,并对所述待检测数据进行聚类,得到所述待检测数据对应的聚类类型;
风险检测单元,如果所述待检测数据对应的聚类类型中包括所述目标数据对应的聚类类型,则将所述目标数据对应的聚类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述第一聚类单元,对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征;对所述目标数据对应的Embedding特征进行Bin分割处理,得到所述Embedding特征对应的Bin分割数据;对所述Embedding特征对应的Bin分割数据进行PCA降维处理,得到所述Bin分割数据对应的预设维度数据;基于预设的聚类算法对所述Bin分割数据对应的预设维度数据进行聚类,得到所述目标数据对应的聚类类型。
本说明书实施例中,所述聚类算法包括k-Means聚类算法和DBScan聚类算法。
本说明书实施例中,所述第一聚类单元,通过预设的特征提取算法对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,所述特征提取算法包括TF-IDF算法、LSA算法、Word2Vec算法中的一种或多种。
本说明书实施例中,所述风险检测模块602,包括:
关键词提取单元,对所述目标数据进行关键词提取,得到所述目标数据中包含的关键词;
风险检测单元,如果所述目标数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,且所述目标关键词对应的数据存在预设的风险,则确定所述目标数据对应的目标风险类型不属于预设的风险类型,得到相应的风险检测结果。
本说明书实施例中,所述装置还包括:
防控模型训练模块,通过预设的风险类型的数据和属于所述目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型;
所述风险防控模块604,基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述风险防控模块604,包括:
第一概率确定单元,将所述目标风险类型的风险数据输入到训练后的风险防控模型中,得到所述目标风险类型的风险数据存在风险的第一概率;
第二概率确定单元,将所述目标风险类型的风险数据输入到训练后的风险对抗模型中,得到所述目标风险类型的风险数据存在风险的第二概率;
第一风险防控单元,如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理;
第二风险防控单元,如果所述第二概率不大于所述第一概率,则基于训练后的风险防控模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述第一风险防控单元,如果所述第二概率大于所述第一概率,则基于所述第一概率和所述第二概率,确定所述目标风险类型的风险数据所需执行的风险防控策略,以对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述目标数据包括用户的风险投诉数据,以及用户的风险投诉数据对应的关联行为数据。
本说明书实施例提供一种数据的风险防控装置,通过对获取的待检测的目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,如果目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理,这样,在检测到新的风险类型的数据时,可以及时通过新的风险类型的数据训练并更新相应的风险对抗模型,使得风险对抗模型具备对新的风险类型的数据的风险防控,从而能够针对新的风险手法和批量的聚集性风险的模型学习达到较好的覆盖,而且在风险防控的过程中更加智能化、风险防控的时效更加快速。
实施例五
以上为本说明书实施例提供的数据的风险防控装置,基于同样的思路,本说明书实施例还提供一种数据的风险防控设备,如图7所示。
所述数据的风险防控设备可以为上述实施例提供的终端设备或服务器等。
数据的风险防控设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据的风险防控设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在数据的风险防控设备上执行存储器702中的一系列计算机可执行指令。数据的风险防控设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入输出接口705,一个或一个以上键盘706。
具体在本实施例中,数据的风险防控设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据的风险防控设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待检测的目标数据;
对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行分类,得到所述目标数据对应的分类类型;
如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果,包括:
如果所述分类类型对应的风险类型不属于预设的风险类型,且基于预设的时序异常检测规则确定所述分类类型的数据的数据量存在增加趋势,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行聚类,得到所述目标数据对应的聚类类型;
如果所述目标数据对应的聚类类型对应的风险类型不属于预设的风险类型,则获取预设周期内的待检测数据,并对所述待检测数据进行聚类,得到所述待检测数据对应的聚类类型;
如果所述待检测数据对应的聚类类型中包括所述目标数据对应的聚类类型,则将所述目标数据对应的聚类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述对所述目标数据进行聚类,得到所述目标数据对应的聚类类型,包括:
对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征;
对所述目标数据对应的Embedding特征进行Bin分割处理,得到所述Embedding特征对应的Bin分割数据;
对所述Embedding特征对应的Bin分割数据进行PCA降维处理,得到所述Bin分割数据对应的预设维度数据;
基于预设的聚类算法对所述Bin分割数据对应的预设维度数据进行聚类,得到所述目标数据对应的聚类类型。
本说明书实施例中,所述聚类算法包括k-Means聚类算法和DBScan聚类算法。
本说明书实施例中,所述对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,包括:
通过预设的特征提取算法对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,所述特征提取算法包括TF-IDF算法、LSA算法、Word2Vec算法中的一种或多种。
本说明书实施例中,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行关键词提取,得到所述目标数据中包含的关键词;
如果所述目标数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,且所述目标关键词对应的数据存在预设的风险,则确定所述目标数据对应的目标风险类型不属于预设的风险类型,得到相应的风险检测结果。
本说明书实施例中,还包括:
通过预设的风险类型的数据和属于所述目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型;
所述基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
将所述目标风险类型的风险数据输入到训练后的风险防控模型中,得到所述目标风险类型的风险数据存在风险的第一概率;
将所述目标风险类型的风险数据输入到训练后的风险对抗模型中,得到所述目标风险类型的风险数据存在风险的第二概率;
如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理;
如果所述第二概率不大于所述第一概率,则基于训练后的风险防控模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
如果所述第二概率大于所述第一概率,则基于所述第一概率和所述第二概率,确定所述目标风险类型的风险数据所需执行的风险防控策略,以对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述目标数据包括用户的风险投诉数据,以及用户的风险投诉数据对应的关联行为数据。
本说明书实施例提供一种数据的风险防控设备,通过对获取的待检测的目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,如果目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理,这样,在检测到新的风险类型的数据时,可以及时通过新的风险类型的数据训练并更新相应的风险对抗模型,使得风险对抗模型具备对新的风险类型的数据的风险防控,从而能够针对新的风险手法和批量的聚集性风险的模型学习达到较好的覆盖,而且在风险防控的过程中更加智能化、风险防控的时效更加快速。
实施例六
进一步地,基于上述图1A至图5所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
获取待检测的目标数据;
对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行分类,得到所述目标数据对应的分类类型;
如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果,包括:
如果所述分类类型对应的风险类型不属于预设的风险类型,且基于预设的时序异常检测规则确定所述分类类型的数据的数据量存在增加趋势,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行聚类,得到所述目标数据对应的聚类类型;
如果所述目标数据对应的聚类类型对应的风险类型不属于预设的风险类型,则获取预设周期内的待检测数据,并对所述待检测数据进行聚类,得到所述待检测数据对应的聚类类型;
如果所述待检测数据对应的聚类类型中包括所述目标数据对应的聚类类型,则将所述目标数据对应的聚类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
本说明书实施例中,所述对所述目标数据进行聚类,得到所述目标数据对应的聚类类型,包括:
对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征;
对所述目标数据对应的Embedding特征进行Bin分割处理,得到所述Embedding特征对应的Bin分割数据;
对所述Embedding特征对应的Bin分割数据进行PCA降维处理,得到所述Bin分割数据对应的预设维度数据;
基于预设的聚类算法对所述Bin分割数据对应的预设维度数据进行聚类,得到所述目标数据对应的聚类类型。
本说明书实施例中,所述聚类算法包括k-Means聚类算法和DBScan聚类算法。
本说明书实施例中,所述对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,包括:
通过预设的特征提取算法对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,所述特征提取算法包括TF-IDF算法、LSA算法、Word2Vec算法中的一种或多种。
本说明书实施例中,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行关键词提取,得到所述目标数据中包含的关键词;
如果所述目标数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,且所述目标关键词对应的数据存在预设的风险,则确定所述目标数据对应的目标风险类型不属于预设的风险类型,得到相应的风险检测结果。
本说明书实施例中,还包括:
通过预设的风险类型的数据和属于所述目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型;
所述基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
将所述目标风险类型的风险数据输入到训练后的风险防控模型中,得到所述目标风险类型的风险数据存在风险的第一概率;
将所述目标风险类型的风险数据输入到训练后的风险对抗模型中,得到所述目标风险类型的风险数据存在风险的第二概率;
如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理;
如果所述第二概率不大于所述第一概率,则基于训练后的风险防控模型对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
如果所述第二概率大于所述第一概率,则基于所述第一概率和所述第二概率,确定所述目标风险类型的风险数据所需执行的风险防控策略,以对所述目标风险类型的风险数据进行风险防控处理。
本说明书实施例中,所述目标数据包括用户的风险投诉数据,以及用户的风险投诉数据对应的关联行为数据。
本说明书实施例提供一种存储介质,通过对获取的待检测的目标数据进行风险检测,以确定目标数据对应的目标风险类型是否属于预设的风险类型,如果目标风险类型不属于预设的风险类型,则获取属于目标风险类型的风险数据,并通过属于目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型,基于训练后的风险对抗模型对目标风险类型的风险数据进行风险防控处理,这样,在检测到新的风险类型的数据时,可以及时通过新的风险类型的数据训练并更新相应的风险对抗模型,使得风险对抗模型具备对新的风险类型的数据的风险防控,从而能够针对新的风险手法和批量的聚集性风险的模型学习达到较好的覆盖,而且在风险防控的过程中更加智能化、风险防控的时效更加快速。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (15)
1.一种数据的风险防控方法,所述方法包括:
获取待检测的目标数据;
对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
2.根据权利要求1所述的方法,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行分类,得到所述目标数据对应的分类类型;
如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
3.根据权利要求2所述的方法,所述如果所述分类类型对应的风险类型不属于预设的风险类型,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果,包括:
如果所述分类类型对应的风险类型不属于预设的风险类型,且基于预设的时序异常检测规则确定所述分类类型的数据的数据量存在增加趋势,则将所述分类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
4.根据权利要求1-3中任一项所述的方法,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行聚类,得到所述目标数据对应的聚类类型;
如果所述目标数据对应的聚类类型对应的风险类型不属于预设的风险类型,则获取预设周期内的待检测数据,并对所述待检测数据进行聚类,得到所述待检测数据对应的聚类类型;
如果所述待检测数据对应的聚类类型中包括所述目标数据对应的聚类类型,则将所述目标数据对应的聚类类型对应的风险类型作为所述目标风险类型,并生成用于指示所述目标风险类型不属于预设的风险类型的风险检测结果。
5.根据权利要求4所述的方法,所述对所述目标数据进行聚类,得到所述目标数据对应的聚类类型,包括:
对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征;
对所述目标数据对应的Embedding特征进行Bin分割处理,得到所述Embedding特征对应的Bin分割数据;
对所述Embedding特征对应的Bin分割数据进行PCA降维处理,得到所述Bin分割数据对应的预设维度数据;
基于预设的聚类算法对所述Bin分割数据对应的预设维度数据进行聚类,得到所述目标数据对应的聚类类型。
6.根据权利要求5所述的方法,所述聚类算法包括k-Means聚类算法和DBScan聚类算法。
7.根据权利要求5所述的方法,所述对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,包括:
通过预设的特征提取算法对所述目标数据进行特征提取,得到所述目标数据对应的嵌入Embedding特征,所述特征提取算法包括TF-IDF算法、LSA算法、Word2Vec算法中的一种或多种。
8.根据权利要求1所述的方法,所述对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果,包括:
对所述目标数据进行关键词提取,得到所述目标数据中包含的关键词;
如果所述目标数据包含的关键词中包括相对于预设时间段内获取的数据包含的关键词不同的目标关键词,且所述目标关键词对应的数据存在预设的风险,则确定所述目标数据对应的目标风险类型不属于预设的风险类型,得到相应的风险检测结果。
9.根据权利要求1所述的方法,所述方法还包括:
通过预设的风险类型的数据和属于所述目标风险类型的风险数据对当前的风险防控模型进行训练,得到训练后的风险防控模型;
所述基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
10.根据权利要求9所述的方法,所述基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
将所述目标风险类型的风险数据输入到训练后的风险防控模型中,得到所述目标风险类型的风险数据存在风险的第一概率;
将所述目标风险类型的风险数据输入到训练后的风险对抗模型中,得到所述目标风险类型的风险数据存在风险的第二概率;
如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理;
如果所述第二概率不大于所述第一概率,则基于训练后的风险防控模型对所述目标风险类型的风险数据进行风险防控处理。
11.根据权利要求10所述的方法,所述如果所述第二概率大于所述第一概率,则基于训练后的风险防控模型和训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理,包括:
如果所述第二概率大于所述第一概率,则基于所述第一概率和所述第二概率,确定所述目标风险类型的风险数据所需执行的风险防控策略,以对所述目标风险类型的风险数据进行风险防控处理。
12.根据权利要求1所述的方法,所述目标数据包括用户的风险投诉数据,以及用户的风险投诉数据对应的关联行为数据。
13.一种数据的风险防控装置,所述装置包括:
目标数据获取模块,获取待检测的目标数据;
风险检测模块,对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
模型更新模块,如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
风险防控模块,基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
14.一种数据的风险防控设备,所述数据的风险防控设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取待检测的目标数据;
对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
15.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取待检测的目标数据;
对所述目标数据进行风险检测,以确定所述目标数据对应的目标风险类型是否属于预设的风险类型,得到相应的风险检测结果;
如果所述风险检测结果指示所述目标风险类型不属于预设的风险类型,则获取属于所述目标风险类型的风险数据,并通过属于所述目标风险类型的风险数据对当前的风险对抗模型进行训练,得到训练后的风险对抗模型;
基于训练后的风险对抗模型对所述目标风险类型的风险数据进行风险防控处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110347777.5A CN112966113A (zh) | 2021-03-31 | 2021-03-31 | 一种数据的风险防控方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110347777.5A CN112966113A (zh) | 2021-03-31 | 2021-03-31 | 一种数据的风险防控方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112966113A true CN112966113A (zh) | 2021-06-15 |
Family
ID=76280473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110347777.5A Pending CN112966113A (zh) | 2021-03-31 | 2021-03-31 | 一种数据的风险防控方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966113A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113344695A (zh) * | 2021-06-21 | 2021-09-03 | 支付宝(杭州)信息技术有限公司 | 一种弹性风控方法、装置、设备和可读介质 |
CN113992429A (zh) * | 2021-12-22 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 一种事件的处理方法、装置及设备 |
CN115730233A (zh) * | 2022-10-28 | 2023-03-03 | 支付宝(杭州)信息技术有限公司 | 一种数据处理方法、装置、可读存储介质以及电子设备 |
CN116070916A (zh) * | 2023-03-06 | 2023-05-05 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
-
2021
- 2021-03-31 CN CN202110347777.5A patent/CN112966113A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113344695A (zh) * | 2021-06-21 | 2021-09-03 | 支付宝(杭州)信息技术有限公司 | 一种弹性风控方法、装置、设备和可读介质 |
CN113992429A (zh) * | 2021-12-22 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 一种事件的处理方法、装置及设备 |
CN115730233A (zh) * | 2022-10-28 | 2023-03-03 | 支付宝(杭州)信息技术有限公司 | 一种数据处理方法、装置、可读存储介质以及电子设备 |
CN116070916A (zh) * | 2023-03-06 | 2023-05-05 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200202449A1 (en) | Risk identification model building and risk identification | |
CN112966113A (zh) | 一种数据的风险防控方法、装置及设备 | |
CN108596410B (zh) | 一种风控事件自动处理方法及装置 | |
CN109214421B (zh) | 一种模型训练方法、装置、及计算机设备 | |
CN109508879B (zh) | 一种风险的识别方法、装置及设备 | |
US11580222B2 (en) | Automated malware analysis that automatically clusters sandbox reports of similar malware samples | |
CN110633989A (zh) | 一种风险行为生成模型的确定方法及装置 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN112257114A (zh) | 一种应用程序隐私合规检测方法、装置、设备和介质 | |
CN113221747B (zh) | 一种基于隐私保护的隐私数据处理方法、装置及设备 | |
CN110021150B (zh) | 一种数据处理方法、装置及设备 | |
CN110634030A (zh) | 应用的业务指标挖掘方法、装置及设备 | |
CN113468520A (zh) | 应用于区块链业务的数据入侵检测方法及大数据服务器 | |
CN111538869A (zh) | 一种交易异常群组的检测方法、装置及设备 | |
CN114445207B (zh) | 基于数字人民币的税务管理系统 | |
CN110033092B (zh) | 数据标签生成、模型训练、事件识别方法和装置 | |
CN109492401B (zh) | 一种内容载体风险检测方法、装置、设备及介质 | |
CN115408449B (zh) | 一种用户行为的处理方法、装置及设备 | |
CN115567371B (zh) | 一种异常检测方法、装置、设备及可读存储介质 | |
CN116822606A (zh) | 一种异常检测模型的训练方法、装置、设备及存储介质 | |
CN110705439B (zh) | 一种信息的处理方法、装置及设备 | |
CN111242195B (zh) | 模型、保险风控模型训练方法、装置及电子设备 | |
CN109146395B (zh) | 一种数据处理的方法、装置及设备 | |
CN111914868A (zh) | 模型训练方法、异常数据检测方法、装置和电子设备 | |
CN111368164A (zh) | 一种爬虫识别模型训练、爬虫识别方法、装置、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210615 |