CN111046299B - 针对关系网络的特征信息提取方法及装置 - Google Patents
针对关系网络的特征信息提取方法及装置 Download PDFInfo
- Publication number
- CN111046299B CN111046299B CN201911288471.6A CN201911288471A CN111046299B CN 111046299 B CN111046299 B CN 111046299B CN 201911288471 A CN201911288471 A CN 201911288471A CN 111046299 B CN111046299 B CN 111046299B
- Authority
- CN
- China
- Prior art keywords
- matrix
- nodes
- node
- node vector
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 567
- 239000013598 vector Substances 0.000 claims abstract description 288
- 238000013507 mapping Methods 0.000 claims abstract description 97
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 85
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000009467 reduction Effects 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims description 85
- 238000011156 evaluation Methods 0.000 claims description 30
- 238000009826 distribution Methods 0.000 claims description 29
- 238000010801 machine learning Methods 0.000 claims description 13
- 238000012546 transfer Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 19
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 208000019360 selective pituitary resistance to thyroid hormone Diseases 0.000 description 1
- 208000003126 selective pituitary thyroid hormone resistance Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供了一种针对关系网络的特征信息提取方法及装置。关系网络表征多个实体对象之间的关联关系,节点代表实体对象,利用关系网络包括的N个节点以及节点之间的连接边可以对应得到N*N维邻接矩阵;对邻接矩阵进行降维,使得得到的映射矩阵的行数或者列数为预设的节点向量维数D,且节点向量维数D小于N;对映射矩阵进行正交化处理,使得得到的正交化矩阵进一步提取邻接矩阵中的重要信息,再对正交化矩阵进行特征值分解,利用特征值分解结果确定邻接矩阵对应的节点向量矩阵,确定的节点向量矩阵中的节点向量可以表征实体对象的特征信息。其中,关系网络包含个人数据。
Description
技术领域
本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及针对关系网络的特征信息提取方法及装置。
背景技术
关系网络是对现实世界中实体节点之间连接关系的描述,其广泛应用于各种计算机信息处理中。关系网络包含节点以及节点之间的连接边,节点可以对应于现实世界中的实体。例如,节点可以代表用户或物品等。不同节点之间存在连接关系时,其间即可以形成连接边。例如,不同用户之间通过电话号码进行过通话,则两个用户之间可以形成连接边;某用户购买过某物品,则该用户与该物品之间可以形成连接边,等等。因此,关系网络包含了个人数据。基于关系网络提取的节点向量,包含了关系网络中个人数据的特征信息,即可以使用节点向量来表征个人数据的特征信息。
希望能有改进的方案,更为高效地从关系网络中提取实体对象的特征信息,以便进行基于关系网络的进一步分析。
发明内容
本说明书一个或多个实施例描述了针对关系网络的特征信息提取方法及装置,以便在尽可能从关系网络中提取到准确的特征信息的情况下提高特征提取时的速度。
第一方面,实施例提供了一种针对关系网络的特征信息提取方法,通过计算机执行,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,方法包括:
获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
对所述映射矩阵进行正交化处理,得到提取的邻接矩阵的正交化矩阵;
对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理。
在另一种实施方式中,对所述邻接矩阵进行降维,得到映射矩阵的步骤,包括:
获取随机矩阵;其中,所述随机矩阵的行数或列数为所述预设的节点向量维数D;
将所述邻接矩阵通过所述随机矩阵进行映射,得到所述映射矩阵。
在另一种实施方式中,所述获取随机矩阵的步骤,包括:
按照以下分布之一生成随机矩阵中的元素数据:高斯分布,泊松分布,均匀分布。
在另一种实施方式中,所述对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵的步骤,包括:
对所述映射矩阵进行正交分解,得到列正交矩阵;
将所述邻接矩阵通过所述列正交矩阵进行映射,得到提取的所述邻接矩阵的正交化矩阵。
在另一种实施方式中,所述对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵的步骤,包括:
对所述正交化矩阵进行奇异值分解,基于得到的左奇异矩阵确定特征向量矩阵;
将所述列正交矩阵通过所述特征向量矩阵进行映射,得到所述邻接矩阵对应的节点向量矩阵。
在另一种实施方式中,所述基于得到的左奇异矩阵确定特征向量矩阵的步骤,包括:
将得到的左奇异矩阵直接确定为特征向量矩阵;或者,
利用对所述正交化矩阵进行奇异值分解后得到的对角矩阵中的元素数据,对所述左奇异矩阵进行加权,得到特征向量矩阵。
第二方面,实施例提供了一种基于关系网络的业务处理方法,通过计算机执行,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述方法包括:
获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息;
利用所述节点向量,采用机器学习进行针对所述实体对象的业务处理。
第三方面,实施例提供了一种基于关系网络的商品信息推送方法,通过计算机执行,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述方法包括:
获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用第一方面所述的方法生成;
利用所述节点向量矩阵,确定第一用户的节点向量与第二用户的节点向量之间的相关度;
利用所述相关度以及与所述第一用户相关联的商品信息,向所述第二用户推送商品信息。
第四方面,实施例提供了一种基于关系网络的商品信息推送方法,通过计算机执行,所述关系网络包括N个节点以及节点之间的连接边,所述节点包含代表用户的用户节点和代表商品的商品节点,所述方法包括:
获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用第一方面所述的方法生成;
利用所述节点向量矩阵,确定商品节点的节点向量与用户节点的节点向量之间的相关度;
利用所述相关度,向用户推送商品信息。
第五方面,实施例提供了一种基于关系网络的用户状态评估方法,通过计算机执行,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述方法包括:
获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用第一方面所述的方法生成;
利用所述节点向量矩阵,确定不同用户的节点向量之间的相关度;
利用所述相关度,对待评估用户进行状态评估。
在另一种实施方式中,所述节点之间的连接边信息包括用户之间的好友关系信息;所述利用所述相关度,对待评估用户进行状态评估的步骤,包括:
利用所述相关度,对待评估用户进行信用状态评估。
在另一种实施方式中,所述节点之间的连接边信息包括用户之间的转账关系信息;所述利用所述相关度,对待评估用户进行状态评估的步骤,包括:
利用所述相关度,对待评估用户进行风险状态评估。
第六方面,实施例提供了一种针对关系网络的特征信息提取装置,部署在计算机中,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述装置包括:
第一获取单元,配置为获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
降维单元,配置为对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
正交化单元,配置为对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
第一确定单元,配置为对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理。
在另一种实施方式中,所述降维单元具体配置为:
获取随机矩阵;其中,所述随机矩阵的行数或列数为所述预设的节点向量维数D;
将所述邻接矩阵通过所述随机矩阵进行映射,得到所述映射矩阵。
在另一种实施方式中,所述降维单元,获取随机矩阵时,包括:
按照以下分布之一生成随机矩阵中的元素数据:高斯分布,泊松分布,均匀分布。
在另一种实施方式中,所述正交化单元,具体配置为:
对所述映射矩阵进行正交分解,得到列正交矩阵;
将所述邻接矩阵通过所述列正交矩阵进行映射,得到提取的所述邻接矩阵的正交化矩阵。
在另一种实施方式中,所述第一确定单元,具体配置为:
对所述正交化矩阵进行奇异值分解,基于得到的左奇异矩阵确定特征向量矩阵;
将所述列正交矩阵通过所述特征向量矩阵进行映射,得到所述邻接矩阵对应的节点向量矩阵。
在另一种实施方式中,所述第一确定单元,基于得到的左奇异矩阵确定特征向量矩阵时,包括:
将得到的左奇异矩阵直接确定为特征向量矩阵;或者,
利用对所述正交化矩阵进行奇异值分解后得到的对角矩阵中的元素数据,对所述左奇异矩阵进行加权,得到特征向量矩阵。
第七方面,实施例提供了一种基于关系网络的业务处理装置,部署在计算机中,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述装置包括:
第一获取单元,配置为获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
降维单元,配置为对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
正交化单元,配置为对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
第一确定单元,配置为对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息;
业务处理单元,配置为利用所述节点向量,采用机器学习进行针对所述实体对象的业务处理。
第八方面,实施例提供了一种基于关系网络的商品信息推送装置,部署在计算机中,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述装置包括:
第二获取单元,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用第六方面所述的装置生成;
第二确定单元,配置为利用所述节点向量矩阵,确定第一用户的节点向量与第二用户的节点向量之间的相关度;
第一推送单元,配置为利用所述相关度以及与所述第一用户相关联的商品信息,向所述第二用户推送商品信息。
第九方面,实施例提供了一种基于关系网络的商品信息推送装置,部署在计算机中,所述关系网络包括N个节点以及节点之间的连接边,所述节点包含代表用户的用户节点和代表商品的商品节点,所述装置包括:
第三获取单元,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用第六方面所述的装置生成;
第三确定单元,配置为利用所述节点向量矩阵,确定商品节点的节点向量与用户节点的节点向量之间的相关度;
第二推送单元,配置为利用所述相关度,向用户推送商品信息。
第十方面,实施例提供了一种基于关系网络的用户状态评估装置,部署在计算机中,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述装置包括:
第四获取单元,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用第六方面所述的装置生成;
第四确定单元,配置为利用所述节点向量矩阵,确定不同用户的节点向量之间的相关度;
评估单元,配置为利用所述相关度,对待评估用户进行状态评估。
在另一种实施方式中,所述节点之间的连接边信息包括用户之间的好友关系信息;所述评估单元,具体配置为:
利用所述相关度,对待评估用户进行信用状态评估。
在另一种实施方式中,所述节点之间的连接边信息包括用户之间的转账关系信息;所述评估单元,具体配置为:
利用所述相关度,对待评估用户进行风险状态评估。
第十一方面,实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面到第五方面中提供的任一方法。
第十二方面,实施例提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面到第五方面中提供的任一方法。
本说明书实施例提供的针对关系网络的特征信息提取方法及装置,通过对邻接矩阵进行降维得到映射矩阵,对映射矩阵进行正交化处理,得到邻接矩阵的正交化矩阵,对正交化矩阵进行特征值分解,利用特征值分解结果确定邻接矩阵的节点向量矩阵。当关系网络中的节点数量非常大时,直接对邻接矩阵进行特征值分解,其处理速度会非常缓慢。对邻接矩阵进行降维,能够大幅地减少邻接矩阵中的冗余信息,并提取邻接矩阵中的有用信息,同时降低矩阵维度能够很大程度上提高特征值分解过程的速度;对映射矩阵进行正交化处理,则能够进一步提取邻接矩阵中的重要特征,使得对正交化矩阵进行特征值分解进而得到节点向量矩阵时,能够尽可能从关系网络中提取到准确的特征信息,因此整体方案能够在尽可能提取准确的特征信息的同时提高特征信息提取的速度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书示出的一个关系网络示例图;
图2为一个实施例中针对关系网络的特征信息提取方法的流程示意图;
图3为另一个实施例中针对关系网络的特征信息提取方法的流程示意图;
图4为将邻接矩阵降维得到的两种映射矩阵的示意图;
图5为一个实施例中基于关系网络的商品信息推送方法的流程示意图;
图6为另一个实施例中基于关系网络的商品信息推送方法的流程示意图;
图7为一个实施例中基于关系网络的用户状态评估方法的流程示意图;
图8为一个实施例的针对关系网络的特征信息提取装置的示意框图;
图9为一个实施例中基于关系网络的商品信息推送装置的示意框图;
图10为另一个实施例中基于关系网络的商品信息推送装置的示意框图;
图11为一个实施例中基于关系网络的用户状态评估装置的示意框图;
图12为一个实施例中基于关系网络的业务处理装置的示意框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
关系网络可以表征多个实体对象之间的关联关系。关系网络包括多个节点和节点之间的连接边。节点可以代表现实世界中的实体对象,连接边可以表示实体对象之间的关联关系。节点可以代表各种类型的实体对象,例如可以代表用户、物品、服务、社会组织等实体对象中的至少一种。其中,物品可以包括商品,社会组织可以包括企业、商店、工厂、公司和学校等。在形成关系网络时,可以采集一段时间内各个节点之间的关联行为数据,利用该关联行为数据,可以形成对应的关系网络。因此,关系网络可以包含个人数据。例如,可以采集一段时间内用户对商品的点击行为数据,将用户和商品作为节点,利用该点击行为数据,即可以形成与点击商品行为对应的关系网络。图1为本说明书示出的一个关系网络示例图。其中,用户和商品为节点,其间的直线代表节点之间的连接边。
关系网络中的节点可以均为同类型的实体,也可以包括不同类型的实体。例如,关系网络中的节点可以均代表用户,也可以既包含用户节点又包括商品节点。在确定节点之间的连接边时,可以根据预先定义的节点之间的关联行为来形成节点之间的连接边。其中,关联行为可以包括:用户对商品之间的点击行为、购买行为,用户与用户之间的好友关系行为、转账行为等。好友关系行为可以包括社交关系行为、媒介关系行为、亲属关系行为等。
连接边信息可以包括与节点之间的关联行为对应的信息。例如,连接边信息可以包括点击的次数、购买的次数、转账次数、转账金额、好友关系行为时间长度以及行为的方向性等信息。
上述关系网络中包含了能体现节点与其他节点之间关联行为的特征信息,即包含了个人数据的特征信息。为了使得关系网络能更容易被利用,可以将关系网络中的节点作为矩阵的行或者列,将节点之间的连接边信息作为矩阵元素数据,得到关系网络对应的邻接矩阵。为了便于说明,下面将关系网络包括的节点数量采用N来表示,N可以为大于2的整数,例如N可以为100万、1亿或者10亿等。邻接矩阵即为N*N维矩阵。
对邻接矩阵进行特征值分解,可以得到节点向量矩阵。特征值分解,是提取矩阵中数据特征的矩阵处理方式。节点向量矩阵包含节点对应的节点向量,该节点向量可以用来表征上述特征信息。即节点向量,用于表征本节点与其他节点之间关联行为的特征信息。节点向量的维数D可以为大于0的整数,例如D可以为50、100或200等。
例如,针对邻接矩阵其中N个行代表N个节点,N个列代表N个节点,元素aij代表第i个节点与第j个节点之间的连接边信息。如果第i个节点与第j个节点之间存在关联行为,则aij为该关联行为对应的具体取值;如果不存在关联行为,则aij可以为0。
对上述邻接矩阵进行特征值分解得到的节点向量矩阵可以表示为其中,N个行代表N个节点,行向量即为节点向量,节点向量为D维。也可以采用/>表示,其中,行向量Ai=[ai1 … aiD]。当然,节点向量矩阵也可以采用/>表示,这种情况下,N个列则代表N个节点,列向量即为节点向量,节点向量也为D维。
节点向量是高度抽象化、数据化的节点特征信息,利用节点向量之间的相关度,可以实现商品信息推送、用户信用评估、用户风险评估等应用。
为了更清楚地说明本说明书中的特征信息提取方法,在图2对应的实施例中,不区分节点的类型,即认为该关系网络为同质网络。图2为一个实施例中提供的针对关系网络的特征信息提取方法的一种示意图。该方法执行主体可以为计算机,具体的可以为任何具有计算、处理能力的装置、设备、平台或设备集群。具体的特征信息提取方法通过以下步骤S210~S240来说明。
步骤S210,获取用于表征关系网络中节点之间的连接边信息的N*N维邻接矩阵A。该邻接矩阵可以采用A来表示,其具有N行N列。
步骤S220,对邻接矩阵进行降维,得到映射矩阵,以使得映射矩阵的行数或者列数为预设的节点向量维数D。其中,节点向量维数D小于N。具体的,D可以为远小于N的整数。例如,D为100,N为10亿。映射矩阵可以采用Y表示。
对邻接矩阵A进行降维时,可以采用随机投影(Random Projection)或者主成分分析(Principal components analysis,PCA)等算法对邻接矩阵进行线性变换来实现。
当N非常大时,邻接矩阵A即为数据量非常庞大的方阵,直接对该邻接矩阵A进行特征值分解,能够得到节点向量矩阵,但是运算速度会非常缓慢。而邻接矩阵A自身的数据非常稀疏,同时也包含了非常多的冗余信息。对邻接矩阵A进行降维,得到的映射矩阵为N*D维或者D*N维的矩阵。由于D为远远小于N的整数,因此映射矩阵Y相比于邻接矩阵A,在很大程度上减少了冗余信息,提取了邻接矩阵A中的有用信息。
步骤S230,对映射矩阵Y进行正交化处理,得到提取的邻接矩阵A的正交化矩阵B。其中,正交化矩阵可以采用B表示。
为了在大幅度提高计算速度的同时,在一定程度上保证特征提取过程的有效性,本实施例增加了正交化处理过程。对映射矩阵Y进行正交化处理,能够进一步提取邻接矩阵的重要特征,使得最终提取的特征信息,相比于直接对邻接矩阵A进行特征值分解提取的特征信息,在准确性上基本持平。
步骤S240,对正交化矩阵B进行特征值分解,利用特征值分解结果确定邻接矩阵A对应的节点向量矩阵U。其中,节点向量矩阵可以采用U表示。节点向量矩阵U由N个节点的节点向量构成,节点向量可以表征实体对象的特征信息。特征值分解为将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法。本实施例中的特征值分解可以采用奇异值分解(Singular Value Decomposition,SVD)或与SVD分解类似的方法进行。
节点向量可以用于利用机器学习进行业务处理。具体的,计算机可以利用节点向量,采用机器学习进行针对实体对象的业务处理。例如,业务处理可以包括针对商品信息的推送以及针对用户的状态评估等。
综上所述,当关系网络中的节点数量非常大时,直接对邻接矩阵进行特征值分解,其处理速度会非常缓慢。对邻接矩阵进行降维,能够大幅地减少邻接矩阵中的冗余信息,并提取邻接矩阵中的有用信息,同时降低矩阵维度能够很大程度上提高特征值分解过程的速度;对映射矩阵进行正交化处理,则能够进一步提取邻接矩阵中的重要特征,使得对正交化矩阵进行特征值分解进而得到节点向量矩阵时,能够尽可能从关系网络中提取到准确的特征信息,因此整体方案能够在尽可能提取准确的特征信息的同时提高特征信息提取的速度。
在另一种实施例中,步骤S220,对邻接矩阵A进行降维,得到映射矩阵Y时,具体可以获取随机矩阵R,将邻接矩阵A通过随机矩阵R进行映射,得到映射矩阵Y。该方式对应的是随机投影方式。其中,随机矩阵R的行数或列数为预设的节点向量维数D。
在获取随机矩阵R时,可以按照以下分布之一生成随机矩阵R中的元素数据:高斯分布,泊松分布,均匀分布。例如,按照高斯分布生成随机矩阵R中的元素数据时,可以按照元素数据满足均值为0,标准差为1/D的高斯分布进行生成。类似的,对泊松分布或均匀分布也进行类似的设置,也能够得到随机矩阵R。
在另一种实施方式中,也可以预先按照上述分布之一生成随机矩阵R中的元素数据,并将该随机矩阵R保存在指定位置;当需要获取随机矩阵R时,直接从指定位置获取。
将邻接矩阵A通过随机矩阵R进行映射,可以理解为通过随机矩阵R对邻接矩阵进行线性变换的过程。
随机投影能够提取邻接矩阵A中的特征数据,其理论依据是J-L引理,即在将高维欧氏空间里的节点集合映射到低维空间里时,其相对距离能够得到一定误差范围内的保持。相对距离体现的即为节点之间的特征信息。因此,采用随机投影的方式能够实现对邻接矩阵进行降维,且能够保持较高的运算速度。
在另一种实施例中,参见图3所示,图3为在图2基础上的改进。步骤S230,对映射矩阵Y进行正交化处理,得到提取的邻接矩阵的正交化矩阵B时,可以通过步骤S231和S232执行。
步骤S231,对映射矩阵Y进行正交分解,得到列正交矩阵Q。步骤S232,将邻接矩阵A通过列正交矩阵Q进行映射,得到提取的邻接矩阵A的正交化矩阵B。其中,列正交矩阵采用Q表示。对映射矩阵Y进行的正交分解可以为QR正交分解,该QR正交分解是一种非常快速的分解方式。QR正交分解可以将待正交分解矩阵分解成列正交矩阵和上三角矩阵的乘积,分解公式为:
待正交分解矩阵m*n=列正交矩阵m*n·上三角矩阵n*n。
其中,m和n为分别为矩阵的行数和列数,为通用表示符号。
对映射矩阵Y进行正交分解后,再将邻接矩阵A通过列正交矩阵Q进行映射,能够使得正交化矩阵B包含邻接矩阵A中更多的特征信息,提高所提取特征的准确性。
步骤S240,对正交化矩阵B进行特征值分解,利用特征值分解结果确定邻接矩阵A对应的节点向量矩阵U的步骤,可以通过步骤S241和步骤S242执行。
步骤S241,对正交化矩阵B进行奇异值分解,基于得到的左奇异矩阵S确定特征向量矩阵K。步骤S242,将列正交矩阵Q通过特征向量矩阵K进行映射,得到邻接矩阵A对应的节点向量矩阵U。其中,左奇异矩阵采用S表示,特征向量矩阵采用K表示。
正交化矩阵B为非方阵,奇异值分解(SVD)能够针对非方阵进行特征值分解。SVD分解能够将待分解矩阵分解为左奇异矩阵、对角矩阵和右奇异矩阵的乘积,分解公式为:
其中,T为矩阵转置符号。左奇异矩阵和右奇异矩阵均为分解得到的特征向量,对角矩阵对角线上的元素为对应的特征值。特征值表示特征向量的重要程度。
基于得到的左奇异矩阵S确定特征向量矩阵K时,可以将得到的左奇异矩阵S直接确定为特征向量矩阵K,或者,利用对正交化矩阵B进行奇异值分解后得到的对角矩阵中的元素数据,对左奇异矩阵S进行加权,得到特征向量矩阵K。
在对左奇异矩阵S进行加权时,可以直接将对角矩阵中的数据乘以左奇异矩阵S,也可以将对角矩阵中的数据进行预设变换后的值乘以左奇异矩阵S。预设变换可以为求平方根或求三次方根等。
确定的特征向量矩阵K,可以理解为确定了待特征值分解矩阵的正交基,将列正交矩阵Q通过特征向量矩阵K进行映射,能够得到更准确的邻接矩阵A的近似低维正交映射矩阵U,即节点向量矩阵U。因此,本实施例能够在尽可能保持节点的特征信息准确性的情况下,较大程度上提高了运算的速度。
在另一种实施方式中,步骤S230中,可以直接对映射矩阵Y进行正交分解,将得到的列正交矩阵Q作为提取的邻接矩阵A的正交化矩阵B。
在另一种实施方式中,步骤S240中,可以对正交化矩阵B进行类似于奇异值分解的特征值分解,利用特征值分解结果确定邻接矩阵A对应的节点向量矩阵U。也可以对正交化矩阵B进行奇异值分解,基于得到的左奇异矩阵S确定特征向量矩阵K,将映射矩阵Y通过特征向量矩阵K进行映射,得到邻接矩阵A对应的节点向量矩阵U。
相比较来说,通过图3所示实施例中的方式确定的节点向量矩阵U能更准确地体现节点的特征信息,即能够提高特征信息的准确性。
下面结合具体实例对本说明书的实施例进行说明。
当关系网络包括N个节点时,其对应的邻接矩阵可以表示为AN*N。预先设定节点向量的维数为D。按照高斯分布生成随机矩阵RN*D,该随机矩阵R的行数为N,列数为D。采用以下公式将邻接矩阵A通过随机矩阵R进行映射,得到映射矩阵Y:
YN*D=AN*N·RN*D
对映射矩阵Y进行以下QR正交分解,得到列正交矩阵Q:
QN*D=QR_PRTH(YN*D)
采用以下方式将邻接矩阵A通过列正交矩阵Q进行映射,得到提取的邻接矩阵A的正交化矩阵B:
BD*N=(QN*D)T·AN*N
其中,正交化矩阵B也可以称为侧映矩阵,其维度为D*N。接下来对正交化矩阵B进行特征值分解:
S为左奇异矩阵,维度为D*D。当直接将左奇异矩阵S作为特征向量矩阵K时,可以采用以下方式将列正交矩阵Q通过特征向量矩阵K进行映射,得到邻接矩阵A对应的节点向量矩阵U:
UN*D=QN*D·SD*D
所得到的矩阵U即为所求的节点向量矩阵,其维度为N*D,即该矩阵中每一行为一个节点的节点向量,节点向量的维数为D。
依据图2给出的发明思路,上述实施实例还可以有不同的形式。例如,生成的随机矩阵还可以为RD*N,该随机矩阵R的行数为D,列数为N。采用以下公式将邻接矩阵A通过随机矩阵R进行映射,得到映射矩阵Y:
YD*N=RD*N·AN*N
参见图4,该图4为将邻接矩阵降维得到的两种映射矩阵的示意图。其中,方框的形状代表矩阵的大体形状,邻接矩阵AN*N可以降维成映射矩阵YN*D或者映射矩阵YD*N。
当得到的映射矩阵为YD*N时,对映射矩阵Y进行以下QR正交分解,得到列正交矩阵Q:
QD*N=QR_ORTH(YD*N)
将邻接矩阵A通过列正交矩阵Q进行映射,得到的正交化矩阵B的方式为:
BD*N=QD*N·AN*N
通过以下方式将列正交矩阵Q通过左奇异矩阵S进行映射,得到节点向量矩阵U:
UN*D=(QD*N)T·SD*D
上述矩阵变换过程仅为举例。根据上述实例,还可以在不付出创造性劳动的情况下得到更多不同的具体实施方式,这些实施方式均在实现图2所示实施例的方式之内。
图5为一个实施例中提供的基于关系网络的商品信息推送方法的示意图。该方法执行主体可以为计算机,具体的可以为任何具有计算、处理能力的装置、设备、平台或设备集群。关系网络包括N个节点以及节点之间的连接边,节点代表用户,连接边用于表示用户之间的关联关系。该方法可以包括:
步骤S510,获取关系网络的节点向量矩阵。其中,该节点向量矩阵可以采用图2所示实施例的方法生成。节点向量矩阵包含了N个代表用户的节点向量。用户可以采用用户账号、用户序号等表示。
步骤S520,利用该节点向量矩阵,确定第一用户U1的节点向量与第二用户U2的节点向量之间的相关度。其中,第一用户可以为被参考用户,采用U1表示;第二用户可以为待推送商品信息的用户,采用U2表示。在确定相关度之前,可以根据第一用户和第二用户,从节点向量矩阵中获取第一用户的节点向量和第二用户的节点向量。
在确定两个节点向量之间的相关度时,可以计算两个节点向量之间的向量距离,将该向量距离确定为第一用户的节点向量与第二用户的节点向量之间的相关度。其中,向量距离可以包括向量夹角余弦。
第一用户和第二用户的数量均可以为一个或者多个。当第一用户的数量为M1个,第二用户的数量为M2个时,确定第一用户的节点向量与第二用户的节点向量之间的相关度时,可以确定不同的第一用户与不同的第二用户之间的M1*M2个组合,得到M1*M2个组合对应的节点向量之间的相关度。
步骤S530,利用上述相关度以及与第一用户U1相关联的商品信息,向第二用户U2推送商品信息。
具体的,可以将相关度大于第一预设相关度阈值的第一用户确定为第一参考用户,获取与第一参考用户相关联的商品信息,利用该商品信息向第二用户推送商品信息。利用该商品信息向第二用户推送商品信息时,可以推送该商品信息中的全部或部分。
其中,与第一参考用户相关联的商品信息,可以包括第一参考用户购买过的商品信息,或者购买过预设数量次的商品信息。商品信息可以包括商品的编号或序号等。
在一种具体实施方式中,可以在预设的触发条件满足时获取关系网络的节点向量矩阵,执行图5实施例的商品信息推送方法。预设的触发条件可以包括,预设周期到来时,或者关系网络中的信息更新时等。该节点向量矩阵也可以为在上述触发条件满足时生成,这样获取到的节点向量矩阵是依据更新后的连接边信息生成。依据更新后的节点向量之间的相关度进行的推送,能提高商品推送的合理性和有效性。
本实施例中采用图2所示实施例的方法生成节点向量矩阵,通过对邻接矩阵进行降维和正交化处理,能够提高特征值分解的速度和所提取特征信息的准确性。当节点向量矩阵能够更准确地体现节点的特征信息时,依据其中的节点向量之间的相关度进行的商品推送也会更加合理和有效。
图6为一种实施例中提供的基于关系网络的商品信息推送方法的示意图。该方法执行主体可以为计算机,具体的可以为任何具有计算、处理能力的装置、设备、平台或设备集群。关系网络包括N个节点以及节点之间的连接边,节点包含代表用户的用户节点和代表商品的商品节点,连接边用于表示用户之间、用户与商品之间的关联关系。该方法可以包括:
步骤S610,获取关系网络的节点向量矩阵。其中,该节点向量矩阵可以采用图2所示实施例的方法生成。节点向量矩阵包含了用户节点的节点向量和商品节点的节点向量共N个。
步骤S620,利用该节点向量矩阵,确定商品节点Ci的节点向量与用户节点Ua的节点向量之间的相关度。其中,商品节点采用Ci表示,用户节点采用Ua表示。该用户节点Ua可以理解为待推送商品信息的用户对应的节点,该商品节点Ci可以理解为待选商品对应的节点。
在确定相关度之前,可以根据商品节点和用户节点,从节点向量矩阵中获取商品节点的节点向量和用户节点的节点向量。在确定两个节点向量之间的相关度时,可以计算两个节点向量之间的向量距离,将该向量距离确定为商品节点的节点向量与用户节点的节点向量之间的相关度。其中,向量距离可以包括向量夹角余弦。
步骤S620中的用户节点和商品节点的数量均可以为一个或者多个。当商品节点的数量为M3个,用户节点的数量为M4个时,确定商品节点的节点向量与用户节点的节点向量之间的相关度时,可以确定不同商品节点与不同用户节点之间的M3*M4个组合,得到M3*M4个组合对应的节点向量之间的相关度。
步骤S630,利用上述相关度,向用户推送商品信息,即向用户节点Ua对应的用户推送商品信息。
具体的,可以将相关度大于第二预设相关度阈值的商品节点Ci对应的商品信息中的部分或全部,推送至用户。
本实施例中采用图2所示实施例的方法生成节点向量矩阵,通过对邻接矩阵进行降维和正交化处理,能够提高特征值分解的速度和所提取特征信息的准确性。当节点向量矩阵能够更准确地体现节点的特征信息时,依据其中的节点向量之间的相关度进行的商品推送也会更加合理和有效。
图7为一个实施例提供的基于关系网络的用户状态评估方法的示意图。该方法执行主体可以为计算机,具体的可以为任何具有计算、处理能力的装置、设备、平台或设备集群。关系网络包括N个节点以及节点之间的连接边,节点代表用户,连接边用于表示用户之间的关联关系。该方法包括:
步骤S710,获取关系网络的节点向量矩阵。其中,该节点向量矩阵可以采用图2所示实施例的方法生成。节点向量矩阵包含了N个用户的节点向量。
步骤S720,利用该节点向量矩阵,确定不同用户的节点向量之间的相关度。不同用户为至少两个用户,其中包括待评估用户和用于对待评估用户进行状态评估的第二参考用户。待评估用户采用Ev表示,第二参考用户采用Re表示。在确定相关度之前,可以根据待评估用户和第二参考用户,从节点向量矩阵中获取待评估用户的节点向量和第二参考用户的节点向量。
在确定两个节点向量之间的相关度时,可以计算两个节点向量之间的向量距离,将该向量距离确定为待评估用户的节点向量与第二参考用户的节点向量之间的相关度。其中,向量距离可以包括向量夹角余弦。
待评估用户和第二参考用户的数量均可以为一个或者多个。当待评估用户的数量为M5个,第二参考用户的数量为M6个时,确定待评估用户的节点向量与第二参考用户的节点向量之间的相关度时,可以确定待评估用户与第二参考用户之间的M5*M6个组合,得到M5*M6个组合对应的节点向量之间的相关度。
步骤S730,利用该相关度,对待评估用户Ev进行状态评估。
具体的,在对待评估用户Ev的状态进行评估时,可以结合第二参考用户Re的状态以及两者节点向量之间的相关度进行。
在信贷场景中,以用户为节点,用户之间的好友关系视为连接边,可以定义节点之间的连接边信息包括用户之间的好友关系信息。此时,可以利用该相关度,对待评估用户进行信用状态评估。在认为第二参考用户为信用状态较好的用户的情况下,当相关度大于第三预设相关度阈值时,确定待评估用户的信用状态较好;当相关度不大于第三预设相关度阈值时,确定待评估用户的信用状态待定。
例如,第二参考用户Re可以为信用状态较好的用户,待评估用户包括Ev1和Ev2,确定待评估用户Ev1和Ev2分别与第二参考用户Re之间的相关度为0.8和0.3,当第三预设相关度阈值为0.6时,由于0.8大于0.6,于是认为待评估用户Ev1与第二参考用户Re之间存在足够强的好友关系,可以确定待评估用户Ev1的信用状态较好。由于0.3小于0.6,于是认为待评估用户Ev2与第二参考用户Re之间的好友关系不够强,可以确定待评估用户Ev2的信用状态待定。
在支付反欺诈场景中,可以定义节点之间的连接边信息包括用户之间的转账关系信息,用户之间的转账关系可以为有方向的连接边,转账的数额为连接边的权值。在表示连接边的方向性时,可以采用正负号。例如,节点1向节点2转账,以及节点2向节点1转账,两种情况下连接边的正负不同。
在这种场景中,可以利用上述相关度,对待评估用户进行风险状态评估。在认为第二参考用户的风险状态较高的前提下,当相关度大于第四预设相关度阈值时,确定待评估用户的风险状态较高;当相关度不大于第四预设相关度阈值时,确定待评估用户的风险状态待定。
例如,第二参考用户Re可以为高欺诈风险的用户,待评估用户包括Ev3和Ev4,确定待评估用户Ev3和Ev4分别与第二参考用户Re之间的相关度为0.7和0.01,当第四预设相关度阈值为0.5时,由于0.7大于0.5,于是可以认为待评估用户Ev1与第二参考用户Re之间存在足够强的关联关系,可以将待评估用户Ev1确定为高欺诈风险的用户。由于0.01小于0.5,于是可以认为待评估用户Ev2与第二参考用户Re之间的关联关系不够强,可以确定待评估Ev2的欺诈风险待定。
本实施例中采用图2所示实施例的方法生成节点向量矩阵,通过对邻接矩阵进行降维和正交化处理,能够提高特征值分解的速度和所提取特征信息的准确性。当节点向量矩阵能够更准确地体现节点的特征信息时,依据其中的节点向量之间的相关度进行的状态评估也会更加准确。
以支付反欺诈场景的数据进行真实测试,结果显示,常规的生成节点向量矩阵的方法需要运行800多分钟,而本实施例提供的方法只需要运行约20分钟即可,准确度与常规方法基本持平。在商品推荐场景中,节点向量矩阵的生成速度也有几十倍的提升,准确度略有下降。
上述对本说明书特定实施例进行了描述。其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行,并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的,或者可能是有利的。
图8为一个实施例中提供的针对关系网络的特征信息提取装置示意框图。该装置800可以部署在计算机中,具体的可以部署在任何具有计算、处理能力的装置、设备、平台或设备集群中。该装置实施例与图2所示的方法实施例相对应。该关系网络表征多个实体对象之间的关联关系,并且包括N个代表实体对象的节点以及节点之间的连接边,该装置800包括:
第一获取单元810,配置为获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
降维单元820,配置为对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
正交化单元830,配置为对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
第一确定单元840,配置为对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵。其中,节点向量矩阵由N个节点的节点向量构成,节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理。
在另一实施例中,降维单元820具体配置为:
获取随机矩阵;其中,所述随机矩阵的行数或列数为所述预设的节点向量维数D;
将所述邻接矩阵通过所述随机矩阵进行映射,得到所述映射矩阵。
在一种具体实施例中,降维单元820获取随机矩阵时,包括:
按照以下分布之一生成随机矩阵中的元素数据:高斯分布,泊松分布,均匀分布。
在另一实施例中,正交化单元830具体配置为:
对所述映射矩阵进行正交分解,得到列正交矩阵;
将所述邻接矩阵通过所述列正交矩阵进行映射,得到提取的所述邻接矩阵的正交化矩阵。
在另一实施例中,第一确定单元840具体配置为:
对所述正交化矩阵进行奇异值分解,基于得到的左奇异矩阵确定特征向量矩阵;
将所述列正交矩阵通过所述特征向量矩阵进行映射,得到所述邻接矩阵对应的节点向量矩阵。
在一种具体实施例中,第一确定单元840基于得到的左奇异矩阵确定特征向量矩阵时,包括:
将得到的左奇异矩阵直接确定为特征向量矩阵;或者,
利用对所述正交化矩阵进行奇异值分解后得到的对角矩阵中的元素数据,对所述左奇异矩阵进行加权,得到特征向量矩阵。
图9为一个实施例中提供的基于关系网络的商品信息推送装置的示意框图。该装置900可以部署在计算机中,具体的可以部署在任何具有计算、处理能力的装置、设备、平台或设备集群中。该装置实施例与图5所示的方法实施例相对应。上述关系网络包括N个节点以及节点之间的连接边,节点代表用户,该装置900包括:
第二获取单元910,配置为获取所述关系网络的节点向量矩阵;其中,节点向量矩阵采用图8所示的装置生成;
第二确定单元920,配置为利用所述节点向量矩阵,确定第一用户的节点向量与第二用户的节点向量之间的相关度;
第一推送单元930,配置为利用所述相关度以及与所述第一用户相关联的商品信息,向所述第二用户推送商品信息。
图10为一个实施例中提供的基于关系网络的商品信息推送装置的示意框图。该装置1000可以部署在计算机中,具体的可以部署在任何具有计算、处理能力的装置、设备、平台或设备集群中。该装置实施例与图6所示的方法实施例相对应。上述关系网络包括N个节点以及节点之间的连接边,节点包含代表用户的用户节点和代表商品的商品节点,该装置1000包括:
第三获取单元1010,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用图8所示的装置生成;
第三确定单元1020,配置为利用所述节点向量矩阵,确定商品节点的节点向量与用户节点的节点向量之间的相关度;
第二推送单元1030,配置为利用所述相关度,向用户推送商品信息。
图11为一个实施例中提供的基于关系网络的用户状态评估装置的示意框图。该装置1100可以部署在计算机中,具体的可以部署在任何具有计算、处理能力的装置、设备、平台或设备集群中。该装置实施例与图7所示的方法实施例相对应。上述关系网络包括N个节点以及节点之间的连接边,节点代表用户,该装置1100包括:
第四获取单元1110,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用图8所示的装置生成;
第四确定单元1120,配置为利用所述节点向量矩阵,确定不同用户的节点向量之间的相关度;
评估单元1130,配置为利用所述相关度,对待评估用户进行状态评估。
在另一种实施例中,所述节点之间的连接边信息包括用户之间的好友关系信息;所述评估单元1130具体配置为:
利用所述相关度,对待评估用户进行信用状态评估。
在另一种实施例中,所述节点之间的连接边信息包括用户之间的转账关系信息;所述评估单元1130具体配置为:
利用所述相关度,对待评估用户进行风险状态评估。
图12为一个实施例中基于关系网络的业务处理装置的示意框图。该装置1200可以部署在计算机中,具体的可以部署在任何具有计算、处理能力的装置、设备、平台或设备集群中。该装置实施例与图2所示的方法实施例相对应。该关系网络表征多个实体对象之间的关联关系,并且包括N个代表实体对象的节点以及节点之间的连接边,该装置1200包括:
第一获取单元1210,配置为获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
降维单元1220,配置为对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
正交化单元1230,配置为对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
第一确定单元1240,配置为对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵。其中,节点向量矩阵由N个节点的节点向量构成,节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理;
业务处理单元1250,配置为利用所述节点向量,采用机器学习进行针对所述实体对象的业务处理。
上述装置实施例与方法实施例相对应,具体说明可以参见方法实施例部分的描述,此处不再赘述。装置实施例是基于对应的方法实施例得到,与对应的方法实施例具有同样的技术效果,具体说明可参见对应的方法实施例。
在本说明书的一实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行图2到图7所描述的方法。
在本说明书的一实施例中,还提供了一种计算设备,包括存储器和处理器,存储器中存储有可执行代码,处理器执行可执行代码时,可以实现图2到图7所描述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于存储介质和计算设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (26)
1.一种针对关系网络的特征信息提取方法,通过计算机执行,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述实体对象包括用户和/或商品;所述方法包括:
获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;所述连接边信息包括:用户节点与用户节点之间的连接边信息,和/或,用户节点与商品节点之间的连接边信息;
对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
对所述正交化矩阵进行奇异值分解,利用奇异值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理。
2.根据权利要求1所述的方法,所述对所述邻接矩阵进行降维,得到映射矩阵的步骤,包括:
获取随机矩阵;其中,所述随机矩阵的行数或列数为所述预设的节点向量维数D;
将所述邻接矩阵通过所述随机矩阵进行映射,得到所述映射矩阵。
3.根据权利要求2所述的方法,所述获取随机矩阵的步骤,包括:
按照以下分布之一生成随机矩阵中的元素数据:高斯分布,泊松分布,均匀分布。
4.根据权利要求1所述的方法,所述对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵的步骤,包括:
对所述映射矩阵进行正交分解,得到列正交矩阵;
将所述邻接矩阵通过所述列正交矩阵进行映射,得到提取的所述邻接矩阵的正交化矩阵。
5.根据权利要求4所述的方法,所述利用奇异值分解结果确定所述邻接矩阵对应的节点向量矩阵的步骤,包括:
基于奇异值分解得到的左奇异矩阵确定特征向量矩阵;
将所述列正交矩阵通过所述特征向量矩阵进行映射,得到所述邻接矩阵对应的节点向量矩阵。
6.根据权利要求5所述的方法,所述基于奇异值分解得到的左奇异矩阵确定特征向量矩阵的步骤,包括:
将得到的左奇异矩阵直接确定为特征向量矩阵;
或者,
利用对所述正交化矩阵进行奇异值分解后得到的对角矩阵中的元素数据,对所述左奇异矩阵进行加权,得到特征向量矩阵。
7.一种基于关系网络的业务处理方法,通过计算机执行,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述方法包括:
获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
对所述正交化矩阵进行奇异值分解,利用奇异值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息;
利用所述节点向量,采用机器学习进行针对所述实体对象的业务处理。
8.一种基于关系网络的商品信息推送方法,通过计算机执行,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述方法包括:
获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用权利要求1所述的方法生成;
利用所述节点向量矩阵,确定第一用户的节点向量与第二用户的节点向量之间的相关度;
利用所述相关度以及与所述第一用户相关联的商品信息,向所述第二用户推送商品信息。
9.一种基于关系网络的商品信息推送方法,通过计算机执行,所述关系网络包括N个节点以及节点之间的连接边,所述节点包含代表用户的用户节点和代表商品的商品节点,所述方法包括:
获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用权利要求1所述的方法生成;
利用所述节点向量矩阵,确定商品节点的节点向量与用户节点的节点向量之间的相关度;
利用所述相关度,向用户推送商品信息。
10.一种基于关系网络的用户状态评估方法,通过计算机执行,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述方法包括:
获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用权利要求1所述的方法生成;
利用所述节点向量矩阵,确定不同用户的节点向量之间的相关度;
利用所述相关度,对待评估用户进行状态评估。
11.根据权利要求10所述的方法,所述节点之间的连接边信息包括用户之间的好友关系信息;所述利用所述相关度,对待评估用户进行状态评估的步骤,包括:
利用所述相关度,对待评估用户进行信用状态评估。
12.根据权利要求10所述的方法,所述节点之间的连接边信息包括用户之间的转账关系信息;所述利用所述相关度,对待评估用户进行状态评估的步骤,包括:
利用所述相关度,对待评估用户进行风险状态评估。
13.一种针对关系网络的特征信息提取装置,部署在计算机中,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述实体对象包括用户和/或商品;所述装置包括:
第一获取单元,配置为获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;所述连接边信息包括:用户节点与用户节点之间的连接边信息,和/或,用户节点与商品节点之间的连接边信息;
降维单元,配置为对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
正交化单元,配置为对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
第一确定单元,配置为对所述正交化矩阵进行奇异值分解,利用奇异值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理。
14.根据权利要求13所述的装置,所述降维单元,具体配置为:
获取随机矩阵;其中,所述随机矩阵的行数或列数为所述预设的节点向量维数D;
将所述邻接矩阵通过所述随机矩阵进行映射,得到所述映射矩阵。
15.根据权利要求14所述的装置,所述降维单元,获取随机矩阵时,包括:
按照以下分布之一生成随机矩阵中的元素数据:高斯分布,泊松分布,均匀分布。
16.根据权利要求13所述的装置,所述正交化单元,具体配置为:
对所述映射矩阵进行正交分解,得到列正交矩阵;
将所述邻接矩阵通过所述列正交矩阵进行映射,得到提取的所述邻接矩阵的正交化矩阵。
17.根据权利要求16所述的装置,所述第一确定单元,具体配置为:
对所述正交化矩阵进行奇异值分解,基于奇异值分解得到的左奇异矩阵确定特征向量矩阵;
将所述列正交矩阵通过所述特征向量矩阵进行映射,得到所述邻接矩阵对应的节点向量矩阵。
18.根据权利要求17所述的装置,所述第一确定单元,基于奇异值分解得到的左奇异矩阵确定特征向量矩阵时,包括:
将得到的左奇异矩阵直接确定为特征向量矩阵;
或者,
利用对所述正交化矩阵进行奇异值分解后得到的对角矩阵中的元素数据,对所述左奇异矩阵进行加权,得到特征向量矩阵。
19.一种基于关系网络的业务处理装置,部署在计算机中,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,所述装置包括:
第一获取单元,配置为获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
降维单元,配置为对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
正交化单元,配置为对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵;
第一确定单元,配置为对所述正交化矩阵进行奇异值分解,利用奇异值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息;
业务处理单元,配置为利用所述节点向量,采用机器学习进行针对所述实体对象的业务处理。
20.一种基于关系网络的商品信息推送装置,部署在计算机中,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述装置包括:
第二获取单元,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用权利要求13所述的装置生成;
第二确定单元,配置为利用所述节点向量矩阵,确定第一用户的节点向量与第二用户的节点向量之间的相关度;
第一推送单元,配置为利用所述相关度以及与所述第一用户相关联的商品信息,向所述第二用户推送商品信息。
21.一种基于关系网络的商品信息推送装置,部署在计算机中,所述关系网络包括N个节点以及节点之间的连接边,所述节点包含代表用户的用户节点和代表商品的商品节点,所述装置包括:
第三获取单元,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用权利要求13所述的装置生成;
第三确定单元,配置为利用所述节点向量矩阵,确定商品节点的节点向量与用户节点的节点向量之间的相关度;
第二推送单元,配置为利用所述相关度,向用户推送商品信息。
22.一种基于关系网络的用户状态评估装置,部署在计算机中,所述关系网络包括N个节点以及节点之间的连接边,所述节点代表用户,所述装置包括:
第四获取单元,配置为获取所述关系网络的节点向量矩阵;其中,所述节点向量矩阵采用权利要求13所述的装置生成;
第四确定单元,配置为利用所述节点向量矩阵,确定不同用户的节点向量之间的相关度;
评估单元,配置为利用所述相关度,对待评估用户进行状态评估。
23.根据权利要求22所述的装置,所述节点之间的连接边信息包括用户之间的好友关系信息;所述评估单元,具体配置为:
利用所述相关度,对待评估用户进行信用状态评估。
24.根据权利要求22所述的装置,所述节点之间的连接边信息包括用户之间的转账关系信息;所述评估单元,具体配置为:
利用所述相关度,对待评估用户进行风险状态评估。
25.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-12中任一项的所述的方法。
26.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-12中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911288471.6A CN111046299B (zh) | 2019-12-11 | 2019-12-11 | 针对关系网络的特征信息提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911288471.6A CN111046299B (zh) | 2019-12-11 | 2019-12-11 | 针对关系网络的特征信息提取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111046299A CN111046299A (zh) | 2020-04-21 |
CN111046299B true CN111046299B (zh) | 2023-07-18 |
Family
ID=70236439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911288471.6A Active CN111046299B (zh) | 2019-12-11 | 2019-12-11 | 针对关系网络的特征信息提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111046299B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021223165A1 (en) * | 2020-05-07 | 2021-11-11 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for object evaluation |
CN112039843B (zh) * | 2020-07-24 | 2024-02-02 | 中国人民解放军陆军工程大学 | 基于矩阵补全的用户多域权限联合估计方法 |
CN112380494B (zh) * | 2020-11-17 | 2023-09-01 | 中国银联股份有限公司 | 一种确定对象特征的方法及装置 |
CN112989170A (zh) * | 2021-03-24 | 2021-06-18 | 北京百度网讯科技有限公司 | 应用于信息搜索的关键词匹配方法、信息搜索方法及装置 |
CN113609328B (zh) * | 2021-07-29 | 2023-07-04 | 湖南工商大学 | 一种融合内容感知和特征相似度的推荐方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201523224D0 (en) * | 2015-12-31 | 2016-02-17 | Murphy Dominic F | Defining edges and their weights between nodes in a network |
CN109906450A (zh) * | 2016-09-16 | 2019-06-18 | 阿尔卡特朗讯 | 用于通过相似性关联对电子信息排名的方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2568852C (en) * | 2004-06-03 | 2013-01-22 | Japan Science And Technology Agency | High-speed high-accuracy matrix singular value decomposition method, program, and device |
CN102467709B (zh) * | 2010-11-17 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 一种发送商品信息的方法和装置 |
US10374765B2 (en) * | 2016-12-15 | 2019-08-06 | Qualcomm Incorporated | Quantized K-resource element row-column interleaver |
CN110032665B (zh) * | 2019-03-25 | 2023-11-17 | 创新先进技术有限公司 | 确定关系网络图中图节点向量的方法及装置 |
-
2019
- 2019-12-11 CN CN201911288471.6A patent/CN111046299B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201523224D0 (en) * | 2015-12-31 | 2016-02-17 | Murphy Dominic F | Defining edges and their weights between nodes in a network |
CN109906450A (zh) * | 2016-09-16 | 2019-06-18 | 阿尔卡特朗讯 | 用于通过相似性关联对电子信息排名的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111046299A (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111046299B (zh) | 针对关系网络的特征信息提取方法及装置 | |
CN110032665B (zh) | 确定关系网络图中图节点向量的方法及装置 | |
Sun et al. | A review of Nyström methods for large-scale machine learning | |
Balzano et al. | Online identification and tracking of subspaces from highly incomplete information | |
CN112182245B (zh) | 一种知识图谱嵌入模型的训练方法、系统和电子设备 | |
Yin et al. | Incomplete multi-view clustering via subspace learning | |
Sussman et al. | A consistent adjacency spectral embedding for stochastic blockmodel graphs | |
Tsai | Dimensionality reduction techniques for blog visualization | |
JP5323860B2 (ja) | 混合された信号を複数の成分信号に分離する方法 | |
Arridge et al. | Variational Gaussian approximation for Poisson data | |
Cui et al. | Data-free likelihood-informed dimension reduction of Bayesian inverse problems | |
Fang et al. | Graph regularised sparse NMF factorisation for imagery de‐noising | |
US9147162B2 (en) | Method for classification of newly arrived multidimensional data points in dynamic big data sets | |
Moreno et al. | Tied Kronecker product graph models to capture variance in network populations | |
CN110348906A (zh) | 一种基于多类型隐式反馈的改进商品推荐方法 | |
Zhang et al. | Low‐rank preserving embedding regression for robust image feature extraction | |
Sankar et al. | A dynamic wrapper‐based feature selection for improved precision in content‐based image retrieval | |
Feng et al. | Orthogonal random projection for tensor completion | |
Christiansen et al. | Improved approximation of the sum of random vectors by the skew normal distribution | |
Hu et al. | Consensus multiple kernel K-means clustering with late fusion alignment and matrix-induced regularization | |
Remil et al. | Data‐Driven Sparse Priors of 3D Shapes | |
Liu et al. | Locality constrained dictionary learning for non‐linear dimensionality reduction and classification | |
Aggarwal et al. | Probabilistic and statistical models for outlier detection | |
Yang | Distance‐preserving dimensionality reduction | |
Kwak et al. | Dimensionality reduction based on ICA for regression problems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40028421 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |