WO2020038100A1 - 一种特征关系推荐方法及装置、一种计算设备及存储介质 - Google Patents
一种特征关系推荐方法及装置、一种计算设备及存储介质 Download PDFInfo
- Publication number
- WO2020038100A1 WO2020038100A1 PCT/CN2019/092738 CN2019092738W WO2020038100A1 WO 2020038100 A1 WO2020038100 A1 WO 2020038100A1 CN 2019092738 W CN2019092738 W CN 2019092738W WO 2020038100 A1 WO2020038100 A1 WO 2020038100A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- entity
- feature relationship
- sample
- feature
- relationship
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013145 classification model Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
- G06N5/047—Pattern matching networks; Rete networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
一种特征关系推荐方法及装置、一种计算设备及存储介质,其中,所述方法包括:基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联(202);基于所述参数实体和预设算子实体之间的特征关系构建知识图谱(204);基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐(206)。
Description
本申请涉及计算机安全技术领域,特别涉及一种特征关系推荐方法及装置、一种计算设备及存储介质。
随着支付宝业务的发展,支付宝的安全环境时刻在变,传统的依赖于人工制作特征关系越来越显得捉襟见肘。
目前,现有特征关系推荐通常采用以下方式:
暴力搜索以及人工挑选判断,但是这种方案依赖于人力,且暴力搜索太耗资源;
借助启发式搜索算法搜索,然后通过一定的评价模型挑选,但是该方案没有引入业务知识,搜索空间仍然很大,难以搜索出有效的特征关系。
发明内容
有鉴于此,本申请实施例提供了一种特征关系推荐方法及装置、一种计算设备及存储介质,以解决现有技术中存在的技术缺陷。
本申请实施例公开了一种特征关系推荐方法,所述方法包括:
基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联;
基于所述参数实体和预设算子实体之间的特征关系构建知识图谱;
基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
另一方面,本申请实施例公开了一种特征关系推荐装置,所述装置包括:
确定模块,被配置为基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联;
构建模块,被配置为基于所述参数实体和预设算子实体之间的特征关系构建知识图谱;
抽取模块,被配置为基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
另一方面,本申请还提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行时实现所述特征关系推荐方法的步骤。
另一方面,本申请还提供了一种计算机可读存储介质,其存储有计算机指令,该程序被处理器执行时实现所述特征关系推荐方法的步骤。
本申请提供的一种特征关系推荐方法及装置、一种计算设备及存储介质,所述方法包括基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联;基于所述参数实体和预设算子实体之间的特征关系构建知识图谱;基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
图1为本说明书一实施例提供的一种计算设备的结构框图;
图2为本说明书一实施例提供的一种特征关系推荐方法的流程图;
图3为本说明书一实施例提供的一种参数实体示意图;
图4为本说明书一实施例提供的一种特征关系推荐方法的流程图;
图5为本说明书一实施例提供的一种特征关系推荐方法的流程图;
图6为本说明书一实施例提供的一种特征关系推荐方法的流程图;
图7为本说明书一实施例提供的一种特征关系推荐装置的结构示意图。
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求 书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先对本说明书一个或多个实施例中使用到的技术术语进行解释。
知识图谱:(Knowledge Graph/Vault)又称为科学知识图谱,知识工程中以图的形式组织的知识集群,其由不同类型的实体作为节点、关系作为连接节点的边所构成的。
知识推理:在知识图谱中,根据现有知识,通过一定的逻辑推断,补充和发现新的知识。
在本说明书一个或多个实施例中,提供了一种特征关系推荐方法及装置、计算设备和计算机存储介质,在下面的实施例中逐一进行详细说明。
参见图1,本说明书一个实施例提供了一种计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110、处理器120和通信接口140。所述处理器120与所述存储器110通过总线130相连接,数据库150用于存储访问请求的日志数据。
所述通信接口140使得计算设备100能够经由一个或多个网络通信。这些网络的示例包括局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。网络接口可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
所述存储器110,被配置为存储通信接口140通过总线130发送的业务数据以及存储在存储器110上并可在处理器120上运行的计算机指令。
所述处理器120,被配置为获取存储在存储器110的业务数据后,执行存储在存储器110上的计算机指令,实现对所述待识别对象的验证。
所述计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。
其中,处理器120可以执行图2所示方法中的步骤。图2是示出了本说明书一个实施例提供的特征关系推荐方法的示意性流程图,包括步骤202至步骤206。
步骤202:基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联。
本说明书一个或多个实施例中,所述业务数据包括但不限于交易数据、登陆数据或转账数据等。
所述参数实体根据所述业务数据中的参数本体确定,所述参数本体为概念,对应的所述参数实体则是具体概念的实例。
例如,参见图3,所述参数本体包括各个概念本体:事件、账户、设备或者位置,对应的所述参数实体在具体的应用场景中则为具体概念的实例:中间实体为某个支付宝事件eventid:4a8167a*****、三号和四号实体为某个支付宝账号id:208821*****和208890*****、二号实体为某个手机设备位置服务信息的geohash值:wm6n;一号实体为某个手机设备的IP:117.136.**.**。
实际应用中所述参数实体包括但不限于事件、账户、身份证、设备、手机号、位置服务((LBS,Location Based Services)、IP等具体的实体。
其中,所述节点实体包括但不限于设备实体、账户实体和/或交易实体。
本说明书一个或多个实施例中,所述参数实体包括节点实体和事件实体,各个所述节点实体之间通过所述事件实体关联,例如所述节点实体包括账户1、账户2,所述事件实体为转账3块钱,则可以所述节点实体就可以通过所述事件实体关联,表示为账户1向账户2转账3块钱,实际使用中可以表示支付宝事件交易或者登陆等关系。
步骤204:基于所述参数实体和预设算子实体之间的特征关系构建知识图谱。
本说明书一个或多个实施例中,所述预设算子实体可以通过现有特征获取,例如,若所述现有特征包括“某时间段内支付宝账户id的最大移动速度”,则对应的算子实体包括梯度算子;若现有特征包括“某个支付宝手机使用设备的历史位置离散度”,则对 应的算子实体包括熵算子;若现有特征包括“某个支付宝账户3天内累计红包金额”,则对应的算子实体包括求和算子。
实际应用中,首先根据现有特征,对特征中算子进行分类,将不同类的算子,命名为不同的算子本体,例如velocity算子、sequence算子、topology算子等,然后对不同算子本体具体实例化后,即为各自对应的算子实体,例如累计求和、求熵、求梯度等。
基于所述参数实体和预设算子实体之间的特征关系构建知识图谱,所述算子实体可以根据所述知识图谱完成基本的查询、标注、计算、推理和预测等。
步骤206:基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
本说明书一个或多个实施例中,所述推理规则包括路径排列算法(Path Ranking),采用所述Path Ranking算法基于所述知识图谱进行新的特征关系的抽取,获得新增特征关系并推荐。
参见图4,基于推理规则从所述知识图谱抽取特征关系包括步骤402至步骤406。
步骤402:基于推理规则从原有的所述节点实体与事件实体中搜索出原有的所述节点实体间的新增事件实体。
参见图5,本说明书一个或多个实施例中,,以所述节点实体包括账户A、账户B和账户C,所述事件实体包括转账3块钱为例,三个所述节点实体通过所述事件实体进行关联分别为:账户A向账户B转账3块钱,账户B向账户C转账3块钱,基于所述Path Ranking算法可以得出原有的所述节点实体间的新增事件实体:账户A向账户C转账3块钱。
步骤404:为所述新增事件实体、原有的所述节点实体与事件实体匹配符合第一预设条件的算子实体,确定所述新增事件实体、原有的所述节点实体与事件实体以及所述算子实体之间的组合特征关系。
本申请说明书一个或多个实施例中,所述第一预设条件包括但不限于实际需求特征,例如,以图5为例,若所述第一预设条件包括“账户A两天内累计转账次数”,则匹配的算子实体则为求和算子。
以新增事件实体包括账户A向账户C转账3块钱,原有的所述节点实体与事件实体之间的关联包括:账户A向账户B转账3块钱,账户B向账户C转账3块钱,账户A向账户D转账1块钱,所述算子实体包括求和算子为例,确定所述新增事件实体、原有 的所述节点实体与事件实体与所述算子实体之间的组合特征关系,所述组合特征关系包括“账户A累计转账次数”以及“账户A累计转账金额”等。
步骤406:所述组合特征关系表征从所述知识图谱抽取的第一特征关系。
本申请说明书一个或多个实施例中,所述第一特征关系即为所述组合特征关系。
实际使用中,首先通过推理规则推理补充节点实体与事件实体关系,以推理出哪些节点实体之间可以组成抽象的key-collection关系;然后根据key_collection关系、原有的所述节点实体与事件实体的关系,匹配符合条件的算子实体,确定组合特征关系。
例如节点实体包括身份证、卡号、手机号、支付宝账号、ip、手机设备号等,然后以所述节点实体为key主键,对其他事件实体和节点实体包括交易金额、登陆lbs位置、交易时间、登陆城市、身份证、卡号、手机号等进行group统计,统计身份证为key主键分别与交易金额、登陆lbs位置、交易时间、登陆城市、其他身份证、卡号、手机号等组成的key-collection关系,以及卡号为key主键分别与交易金额、登陆lbs位置、交易时间、登陆城市、身份证、其他卡号、手机号等组成的key-collection关系等。
有了key-collection关系,再配合算子实体,就可以组成特征关系了。以支付宝账号为key,对该账号下出现过所有身份证进行group,结合count算子,可以组成“某个支付宝账号下经过去重的身份证个数”组合特征关系;以身份证号为key,对该身份证发生的交易金额group,结合sum算子,组成“某个支付宝账号下累计消费金额”组合特征关系;以手机设备账号为key,对该手机设备账号下的lbs group,结合maxDistance算子,组成“该手机设备最大移动距离”组合特征关系。
本申请说明书一个或多个实施例中,所述装置还包括:第二预设条件,
基于所述第二预设条件对所述组合特征关系进行过滤;
基于过滤后的所述组合特征关系表征所述知识图谱抽取第二特征关系。
本申请说明书一个或多个实施例中,所述第二预设条件包括但不限于在所述组合特征关系中新增的知识图谱中的节点实体。
例如所述组合特征关系包括“该手机设备最大移动距离”,所述第二预设条件包括新增的知识图谱中的节点实体“时间窗口3天”,即可得到“该手机设备3天内最大移动距离”的组合特征关系,该组合特征关系即为第二特征关系。
实际使用中,所述Path Ranking算法将每种不同的关系路径作为一维特征,通过在 知识图谱中统计大量的关系路径构建关系分类的特征向量,建立关系分类器进行新的特征关系抽取。
本说明书一个或多个实施例中,所述推理规都是在一阶逻辑推理的框架下,采用霍恩子句的形式实现的,可以根据人工知识写成,也可以采用机器学习的方式,基于数据学习出规则,例如采用人工神经网络的学习训练实现规则,采用所述推理规则输入的是各参数实体、算子实体以及各参数实体和算子实体之间的关系,输出的是抽取出的新的特征关系,实现新增特征关系的推荐。
本说明书一个或多个实施例中,所述方法将业务数据通过参数实体、算子实体以及参数实体和算子实体之间的特征关系在知识图谱中实现,使用推理规则基于原有的特征关系对新的特征关系搜索进行指导约束,避免了大量无意义特征关系的搜索和推荐。
参见图6,本说明书一个或多个实施例提供了一种特征关系推荐方法的示意性流程图,包括步骤602至步骤612。
步骤602:基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联。
步骤604:基于所述参数实体和预设算子实体之间的特征关系构建知识图谱。
步骤606:基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
步骤608:基于预先训练的分类模型确定所述新增特征关系对应的标签,其中,所述标签包括黑标签和白标签。
本说明书一个或多个实施例中,对所述分类模型进行预先训练包括如下步骤:
获取训练样本数据集,其中,所述训练样本数据集中包括参数实体样本和算子实体样本之间的特征关系样本以及所述特征关系样本对应的样本标签,所述样本标签包括白样本标签和黑样本标签;
基于树类模型训练所述分类模型,所述分类模型使得所述特征关系样本与所述样本标签相关联。
本说明书一个或多个实施例中,通过所述分类模型得到每个与白样本标签对应的特征关系样本的重要程度。
本说明书一个或多个实施例中,所述树类模型包括XGBoost模型。
本说明书一个或多个实施例中,若将所述分类模型应用在金融行业返欺诈中,则所 述白标签可以为无欺诈风险的标签,所述黑标签可以为有欺诈风险的标签。
基于预先训练的分类模型确定所述新增特征关系对应的标签包括:根据预先训练的分类模型可以确定出哪些新增特征关系为无欺诈风险的白标签,哪些新增特征关系为有欺诈风险的黑标签。
步骤610:基于预先训练的分类模型确定与白标签对应的新增特征关系的重要程度。
本说明书一个或多个实施例中,确定出所述新增特征关系对应的标签之后,确定出与白标签对应的新增特征关系的重要程度。而对于与黑标签对应的新增特征关系的重要程度则不用获取,降低工作量提高分类模型的工作效率。
步骤612:若所述重要程度大于预设阈值,则将所述与白标签对应的新增特征关系添加至知识图谱。
本说明书一个或多个实施例中,所述预设阈值根据实际应用进行设定,可以设置为80%、95%或100%等,本申请对此不作任何限定。
若所述预设阈值为80%,某个为白标签的新增特征关系的重要程度为85%,所述新增特征关系的重要程度大于预设阈值,则将所述新增特征关系添加至知识图谱。
本说明书一个或多个实施例中,例如若新增特征关系为:“支付宝账户的6小时内最大移动速度”,将该特征输入到XGBoost模型中,评判该特征的重要程度为89%,预设阈值为85%,则在知识图谱中构建“支付宝账户实体、lbs实体、梯度算子实体”三者之间特征关系。
本说明书一个或多个实施例中,所述方法根据分类模型实现对新增特征关系的分类以及对白标签对应的新增特征关系进行重要程度评价,将重要程度达到设定要求的新增特征关系添加进构建的知识图谱中,丰富所述知识图谱,使得知识图谱的扩展性能越来越好。
参见图7,本说明书一个或多个实施例提供了一种特征关系推荐装置,包括:
确定模块702,被配置为基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联;
构建模块704,被配置为基于所述参数实体和预设算子实体之间的特征关系构建知识图谱;
抽取模块706,被配置为基于推理规则从所述知识图谱抽取特征关系,获得新增特 征关系并推荐。
可选地,所述装置还包括:
标签选择模块,被配置为基于预先训练的分类模型确定所述新增特征关系对应的标签,其中,所述标签包括黑标签和白标签。
可选地,所述装置还包括:
重要程度确定模块,被配置为基于预先训练的分类模型确定与白标签对应的新增特征关系的重要程度;
添加模块,被配置为若所述重要程度大于预设阈值,则将所述与白标签对应的新增特征关系添加至知识图谱。
可选地,所述分类模型通过如下步骤训练:
获取训练样本数据集,其中,所述训练样本数据集中包括参数实体样本和算子实体样本之间的特征关系样本以及所述特征关系样本对应的样本标签,所述样本标签包括白样本标签和黑样本标签;
基于树类模型训练所述分类模型,所述分类模型使得所述特征关系样本与所述样本标签相关联。
可选地,所述装置还包括:
获取模块,被配置为通过所述分类模型得到每个与白样本标签对应的特征关系样本的重要程度。
可选地,所述抽取模块包括:
新增子模块,被配置为基于推理规则从原有的所述节点实体与事件实体中搜索出原有的所述节点实体间的新增事件实体;
组合特征关系确定子模块,被配置为为所述新增事件实体、原有的所述节点实体与事件实体匹配符合第一预设条件的算子实体,确定所述新增事件实体、原有的所述节点实体与事件实体与所述算子实体之间的组合特征关系;
特征关系抽取子模块,被配置为基于所述组合特征关系表征从所述知识图谱抽取的第一特征关系。
可选地,所述装置还包括:第二预设条件,
基于所述第二预设条件对所述组合特征关系进行过滤;
基于过滤后的所述组合特征关系表征从所述知识图谱抽取的第二特征关系。
可选地,所述树类模型包括XGBoost模型。
可选地,所述推理规则包括路径排列算法。
可选地,所述算子实体包括求和算子、熵算子或梯度算子。
本说明书一个或多个实施例中,所述装置将业务数据通过参数实体、算子实体以及参数实体和算子实体之间的特征关系在知识图谱中实现,使用推理规则基于原有的特征关系对新的特征关系搜索进行指导约束,避免了大量无意义特征关系的搜索和推荐。
本说明书一个或多个实施例中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述特征关系推荐方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的特征关系推荐方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述特征关系推荐方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请实施例中所述支付涉及的技术载体,例如可以包括近场通信(Near Field Communication,NFC)、WIFI、3G/4G/5G、POS机刷卡技术、二维码扫码技术、条形码扫码技术、蓝牙、红外、短消息(Short Message Service,SMS)、多媒体消息(Multimedia Message Service,MMS)等。
所述计算机指令包括计算机指令代码,所述计算机指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携 带所述计算机指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。
Claims (22)
- 一种特征关系推荐方法,其特征在于,包括:基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联;基于所述参数实体和预设算子实体之间的特征关系构建知识图谱;基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
- 根据权利要求1所述的方法,其特征在于,还包括:基于预先训练的分类模型确定所述新增特征关系对应的标签,其中,所述标签包括黑标签和白标签。
- 根据权利要求2所述的方法,其特征在于,还包括:基于预先训练的分类模型确定与白标签对应的新增特征关系的重要程度;若所述重要程度大于预设阈值,则将所述与白标签对应的新增特征关系添加至知识图谱。
- 根据权利要求2所述的方法,其特征在于,所述分类模型通过如下步骤训练:获取训练样本数据集,其中,所述训练样本数据集中包括参数实体样本和算子实体样本之间的特征关系样本以及所述特征关系样本对应的样本标签,所述样本标签包括白样本标签和黑样本标签;基于树类模型训练所述分类模型,所述分类模型使得所述特征关系样本与所述样本标签相关联。
- 根据权利要求4所述的方法,其特征在于,所述分类模型使得所述特征关系样本与所述样本标签相关联之后,还包括:通过所述分类模型得到每个与白样本标签对应的特征关系样本的重要程度。
- 根据权利要求1所述的方法,其特征在于,基于推理规则从所述知识图谱抽取特征关系包括:基于推理规则从原有的所述节点实体与事件实体中搜索出原有的所述节点实体间的新增事件实体;为所述新增事件实体、原有的所述节点实体与事件实体匹配符合第一预设条件的算子实体,确定所述新增事件实体、原有的所述节点实体与事件实体与所述算子实体之间的组合特征关系;基于所述组合特征关系表征从所述知识图谱抽取的第一特征关系。
- 根据权利要求6所述的方法,其特征在于,还包括:第二预设条件,基于所述第二预设条件对所述组合特征关系进行过滤;基于过滤后的所述组合特征关系表征从所述知识图谱抽取的第二特征关系。
- 根据权利要求4所述的方法,其特征在于,所述树类模型包括XGBoost模型。
- 根据权利要求1所述的方法,其特征在于,所述推理规则包括路径排列算法。
- 根据权利要求1所述的方法,其特征在于,所述算子实体包括求和算子、熵算子或梯度算子。
- 一种特征关系推荐装置,其特征在于,包括:确定模块,被配置为基于业务数据确定参数实体,其中,所述参数实体包括事件实体以及节点实体,并且所述节点实体通过所述事件实体进行关联;构建模块,被配置为基于所述参数实体和预设算子实体之间的特征关系构建知识图谱;抽取模块,被配置为基于推理规则从所述知识图谱抽取特征关系,获得新增特征关系并推荐。
- 根据权利要求11所述的装置,其特征在于,所述装置还包括:标签选择模块,被配置为基于预先训练的分类模型确定所述新增特征关系对应的标签,其中,所述标签包括黑标签和白标签。
- 根据权利要求12所述的装置,其特征在于,所述装置还包括:重要程度确定模块,被配置为基于预先训练的分类模型确定与白标签对应的新增特征关系的重要程度;添加模块,被配置为若所述重要程度大于预设阈值,则将所述与白标签对应的新增特征关系添加至知识图谱。
- 根据权利要求12所述的装置,其特征在于,所述分类模型通过如下步骤训练:获取训练样本数据集,其中,所述训练样本数据集中包括参数实体样本和算子实体样本之间的特征关系样本以及所述特征关系样本对应的样本标签,所述样本标签包括白样本标签和黑样本标签;基于树类模型训练所述分类模型,所述分类模型使得所述特征关系样本与所述样本标签相关联。
- 根据权利要求14所述的装置,其特征在于,所述装置还包括:获取模块,被配置为通过所述分类模型得到每个与白样本标签对应的特征关系样本的重要程度。
- 根据权利要求11所述的装置,其特征在于,所述抽取模块包括:新增子模块,被配置为基于推理规则从原有的所述节点实体与事件实体中搜索出原有的所述节点实体间的新增事件实体;组合特征关系确定子模块,被配置为为所述新增事件实体、原有的所述节点实体与事件实体匹配符合第一预设条件的算子实体,确定所述新增事件实体、原有的所述节点实体与事件实体与所述算子实体之间的组合特征关系;特征关系抽取子模块,被配置为基于所述组合特征关系表征从所述知识图谱抽取的第一特征关系。
- 根据权利要求16所述的装置,其特征在于,所述装置还包括:第二预设条件,基于所述第二预设条件对所述组合特征关系进行过滤;基于过滤后的所述组合特征关系表征从所述知识图谱抽取的第二特征关系。
- 根据权利要求14所述的装置,其特征在于,所述树类模型包括XGBoost模型。
- 根据权利要求11所述的装置,其特征在于,所述推理规则包括路径排列算法。
- 根据权利要求11所述的装置,其特征在于,所述算子实体包括求和算子、熵算子或梯度算子。
- 一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-10任意一项所述方法的步骤。
- 一种计算机可读存储介质,其存储有计算机指令,其特征在于,该程序被处理器执行时实现权利要求1-10任意一项所述方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SG11202010836TA SG11202010836TA (en) | 2018-08-22 | 2019-06-25 | Feature relationship recommendation method, apparatus, computing device, and storage medium |
EP19852264.1A EP3779729A4 (en) | 2018-08-22 | 2019-06-25 | RECOMMENDATION PROCEDURE AND DEVICE FOR RELATIONSHIP OF FEATURES, COMPUTING DEVICE, AND STORAGE MEDIUM |
US17/084,436 US11244232B2 (en) | 2018-08-22 | 2020-10-29 | Feature relationship recommendation method, apparatus, computing device, and storage medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810959354.7 | 2018-08-22 | ||
CN201810959354.7A CN109189937B (zh) | 2018-08-22 | 2018-08-22 | 一种特征关系推荐方法及装置、一种计算设备及存储介质 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US17/084,436 Continuation US11244232B2 (en) | 2018-08-22 | 2020-10-29 | Feature relationship recommendation method, apparatus, computing device, and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020038100A1 true WO2020038100A1 (zh) | 2020-02-27 |
Family
ID=64918936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2019/092738 WO2020038100A1 (zh) | 2018-08-22 | 2019-06-25 | 一种特征关系推荐方法及装置、一种计算设备及存储介质 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11244232B2 (zh) |
EP (1) | EP3779729A4 (zh) |
CN (1) | CN109189937B (zh) |
SG (1) | SG11202010836TA (zh) |
TW (1) | TWI705341B (zh) |
WO (1) | WO2020038100A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112650482A (zh) * | 2020-12-25 | 2021-04-13 | 浙江蓝卓工业互联网信息技术有限公司 | 一种逻辑组件的推荐方法及相关装置 |
CN112906391A (zh) * | 2021-03-16 | 2021-06-04 | 合肥讯飞数码科技有限公司 | 元事件抽取方法、装置、电子设备和存储介质 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109189937B (zh) * | 2018-08-22 | 2021-02-09 | 创新先进技术有限公司 | 一种特征关系推荐方法及装置、一种计算设备及存储介质 |
CN111522886B (zh) * | 2019-01-17 | 2023-05-09 | 中国移动通信有限公司研究院 | 一种信息推荐方法、终端及存储介质 |
CN112950324B (zh) * | 2021-03-15 | 2022-06-03 | 重庆邮电大学 | 一种知识图谱辅助的成对排序个性化电商推荐方法及系统 |
CN113505214A (zh) * | 2021-06-30 | 2021-10-15 | 北京明略软件系统有限公司 | 内容推荐方法、装置、计算机设备和存储介质 |
CN115048533B (zh) * | 2022-06-21 | 2023-06-27 | 四维创智(北京)科技发展有限公司 | 知识图谱构建的方法、装置、电子设备及可读存储介质 |
CN116414872B (zh) * | 2023-04-11 | 2024-02-20 | 浙商证券股份有限公司 | 基于自然语言识别及知识图谱的数据搜索方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170185908A1 (en) * | 2014-09-18 | 2017-06-29 | Huawei Technologies Co.,Ltd. | Method and device for predicting information propagation in social network |
CN107665252A (zh) * | 2017-09-27 | 2018-02-06 | 深圳证券信息有限公司 | 一种创建知识图谱的方法及装置 |
CN108109063A (zh) * | 2017-12-07 | 2018-06-01 | 上海点融信息科技有限责任公司 | 用于预测标签预测值的方法、装置和计算机可读存储介质 |
CN108287881A (zh) * | 2017-12-29 | 2018-07-17 | 北京理工大学 | 一种基于随机游走关系发现的优化方法 |
CN109189937A (zh) * | 2018-08-22 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 一种特征关系推荐方法及装置、一种计算设备及存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9704130B2 (en) * | 2009-10-26 | 2017-07-11 | International Business Machines Corporation | Standard based mapping of industry vertical model to legacy environments |
US10303999B2 (en) * | 2011-02-22 | 2019-05-28 | Refinitiv Us Organization Llc | Machine learning-based relationship association and related discovery and search engines |
CN103699663B (zh) * | 2013-12-27 | 2017-02-08 | 中国科学院自动化研究所 | 一种基于大规模知识库的热点事件挖掘方法 |
US10474949B2 (en) * | 2014-08-19 | 2019-11-12 | Qualcomm Incorporated | Knowledge-graph biased classification for data |
CN104462501A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于结构化数据的知识图谱构建方法和装置 |
US9547823B2 (en) * | 2014-12-31 | 2017-01-17 | Verizon Patent And Licensing Inc. | Systems and methods of using a knowledge graph to provide a media content recommendation |
US11675824B2 (en) * | 2015-10-05 | 2023-06-13 | Yahoo Assets Llc | Method and system for entity extraction and disambiguation |
US20170097984A1 (en) * | 2015-10-05 | 2017-04-06 | Yahoo! Inc. | Method and system for generating a knowledge representation |
US10354204B2 (en) * | 2016-04-21 | 2019-07-16 | Sas Institute Inc. | Machine learning predictive labeling system |
US10275690B2 (en) * | 2016-04-21 | 2019-04-30 | Sas Institute Inc. | Machine learning predictive labeling system |
CN106022834B (zh) * | 2016-05-24 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN108615044A (zh) * | 2016-12-12 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种分类模型训练的方法、数据分类的方法及装置 |
CN106815369B (zh) * | 2017-01-24 | 2019-09-20 | 中山大学 | 一种基于Xgboost分类算法的文本分类方法 |
CN108334528B (zh) * | 2017-03-02 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法和装置 |
CN106934042B (zh) * | 2017-03-16 | 2020-05-29 | 中国人民解放军国防科学技术大学 | 一种知识图谱表示系统及其实施方法 |
CN107016072B (zh) * | 2017-03-23 | 2020-05-15 | 成都市公安科学技术研究所 | 基于社交网络知识图谱的知识推理系统及方法 |
CN110869920B (zh) * | 2017-08-02 | 2021-11-26 | 埃森哲环球解决方案有限公司 | 多维工业知识图形 |
CN107748754B (zh) * | 2017-09-15 | 2021-10-26 | 广州唯品会研究院有限公司 | 一种知识图谱完善方法和装置 |
US20190172075A1 (en) * | 2017-12-01 | 2019-06-06 | International Business Machines Corporation | Maintaining Dynamic Product Catalogs By Tracking Current Trends |
CN108154198B (zh) * | 2018-01-25 | 2021-07-13 | 北京百度网讯科技有限公司 | 知识库实体归一方法、系统、终端和计算机可读存储介质 |
US11960981B2 (en) * | 2018-03-09 | 2024-04-16 | Zestfinance, Inc. | Systems and methods for providing machine learning model evaluation by using decomposition |
-
2018
- 2018-08-22 CN CN201810959354.7A patent/CN109189937B/zh active Active
-
2019
- 2019-06-19 TW TW108121186A patent/TWI705341B/zh active
- 2019-06-25 SG SG11202010836TA patent/SG11202010836TA/en unknown
- 2019-06-25 WO PCT/CN2019/092738 patent/WO2020038100A1/zh active Application Filing
- 2019-06-25 EP EP19852264.1A patent/EP3779729A4/en not_active Withdrawn
-
2020
- 2020-10-29 US US17/084,436 patent/US11244232B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170185908A1 (en) * | 2014-09-18 | 2017-06-29 | Huawei Technologies Co.,Ltd. | Method and device for predicting information propagation in social network |
CN107665252A (zh) * | 2017-09-27 | 2018-02-06 | 深圳证券信息有限公司 | 一种创建知识图谱的方法及装置 |
CN108109063A (zh) * | 2017-12-07 | 2018-06-01 | 上海点融信息科技有限责任公司 | 用于预测标签预测值的方法、装置和计算机可读存储介质 |
CN108287881A (zh) * | 2017-12-29 | 2018-07-17 | 北京理工大学 | 一种基于随机游走关系发现的优化方法 |
CN109189937A (zh) * | 2018-08-22 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 一种特征关系推荐方法及装置、一种计算设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
ANONYMOUS: "Inference Based on Large-Scale Knowledge Map", 30 August 2016 (2016-08-30), pages 1 - 25, XP055746315, Retrieved from the Internet <URL:http://www.cbdio.com/BigData/2016-08/30/content_5224578.htm> * |
See also references of EP3779729A4 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112650482A (zh) * | 2020-12-25 | 2021-04-13 | 浙江蓝卓工业互联网信息技术有限公司 | 一种逻辑组件的推荐方法及相关装置 |
CN112906391A (zh) * | 2021-03-16 | 2021-06-04 | 合肥讯飞数码科技有限公司 | 元事件抽取方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
SG11202010836TA (en) | 2020-11-27 |
US11244232B2 (en) | 2022-02-08 |
US20210049478A1 (en) | 2021-02-18 |
TW202009741A (zh) | 2020-03-01 |
EP3779729A1 (en) | 2021-02-17 |
EP3779729A4 (en) | 2021-08-11 |
CN109189937B (zh) | 2021-02-09 |
CN109189937A (zh) | 2019-01-11 |
TWI705341B (zh) | 2020-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020038100A1 (zh) | 一种特征关系推荐方法及装置、一种计算设备及存储介质 | |
TWI732226B (zh) | 分類模型生成方法及裝置、資料識別方法及裝置 | |
Bi et al. | A big data clustering algorithm for mitigating the risk of customer churn | |
CN113536383B (zh) | 基于隐私保护训练图神经网络的方法及装置 | |
CN112269805B (zh) | 数据处理方法、装置、设备及介质 | |
WO2022100518A1 (zh) | 一种基于用户画像的物品推荐方法和装置 | |
CN111400504A (zh) | 企业关键人的识别方法和装置 | |
WO2023185539A1 (zh) | 机器学习模型训练方法、业务数据处理方法、装置及系统 | |
Ji et al. | Multi-range gated graph neural network for telecommunication fraud detection | |
WO2022188646A1 (zh) | 图数据处理方法、装置、设备、存储介质及程序产品 | |
Zhao et al. | Finding critical users in social communities via graph convolutions | |
CN111353103A (zh) | 用于确定用户社群信息的方法和装置 | |
CN116340643B (zh) | 对象推荐的调整方法及装置、存储介质、电子设备 | |
Srinivasa et al. | Network Data Analytics | |
WO2023143570A1 (zh) | 一种连接关系预测方法及相关设备 | |
CN115221954B (zh) | 用户画像方法、装置、电子设备以及存储介质 | |
CN111209403A (zh) | 数据处理方法、装置、介质及电子设备 | |
WO2023284516A1 (zh) | 基于知识图谱的信息推荐方法、装置、设备、介质及产品 | |
Zhao et al. | TrCMP: A dependable app usage inference design for user behavior analysis through cyber-physical parameters | |
Ahmadi et al. | Inductive and transductive link prediction for criminal network analysis | |
CN111615178B (zh) | 识别无线网络类型及模型训练的方法、装置及电子设备 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN110163761B (zh) | 基于图像处理的可疑项目成员识别方法及装置 | |
Wang et al. | Sequence-Graph Fusion Neural Network for User Mobile App Behavior Prediction | |
CN114390550A (zh) | 一种网络类型识别的方法、相关装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19852264 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2019852264 Country of ref document: EP Effective date: 20201029 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 19852264 Country of ref document: EP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |