CN114579813A - 一种数据的处理方法、装置及设备 - Google Patents
一种数据的处理方法、装置及设备 Download PDFInfo
- Publication number
- CN114579813A CN114579813A CN202210296698.0A CN202210296698A CN114579813A CN 114579813 A CN114579813 A CN 114579813A CN 202210296698 A CN202210296698 A CN 202210296698A CN 114579813 A CN114579813 A CN 114579813A
- Authority
- CN
- China
- Prior art keywords
- node
- data
- graph structure
- model
- target graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 25
- 238000000547 structure data Methods 0.000 claims abstract description 270
- 238000012545 processing Methods 0.000 claims abstract description 190
- 238000000034 method Methods 0.000 claims abstract description 113
- 238000013145 classification model Methods 0.000 claims abstract description 106
- 238000012549 training Methods 0.000 claims description 104
- 238000009826 distribution Methods 0.000 claims description 47
- 239000011159 matrix material Substances 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 36
- 238000003860 storage Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 15
- 239000006185 dispersion Substances 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 18
- 238000004590 computer program Methods 0.000 description 11
- 230000006872 improvement Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 241000220225 Malus Species 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 235000015203 fruit juice Nutrition 0.000 description 5
- 235000020166 milkshake Nutrition 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 241000234295 Musa Species 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Evolutionary Computation (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例公开了一种数据的处理方法、装置及设备,该方法包括:接收针对目标图结构数据的节点分类请求;将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征;基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。通过上述数据的处理方法,可以提高节点分类模型的抗噪能力,提高节点分类准确性。
Description
技术领域
本文件涉及人工智能领域,尤其涉及一种数据的处理方法、装置及设备。
背景技术
随着计算机技术的飞速发展,各行各业都面临着大数据处理的问题,如何从大数据中提取出有价值的信息,以支撑面临日益复杂的业务需求是各行各业亟待解决的问题,而图结构数据因其能够利用可视化技术描述知识资源及其载体,所以,可以结合图结构数据用于解决文本语义相似度、相似商品推荐或智能问答系统等大数据处理问题。
但是,由于图结构数据可能包含大量噪声节点,在对图结构数据进行节点分类处理时,由于噪声节点的干扰可能造成节点分类效果差,数据处理准确性差等问题,基于此,需要提供一种提高针对图结构数据的节点分类准确性的技术方案。
发明内容
本说明书实施例的目的是提供一种提高针对图结构数据的节点分类准确性的技术方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
第一方面,本说明书实施例提供的一种数据的处理方法,所述方法包括:
接收针对目标图结构数据的节点分类请求,所述目标图结构数据包含噪声节点;
将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
第二方面,本说明书实施例提供的一种数据的处理方法,所述方法包括:
将多个目标图结构数据输入节点分类模型进行迭代训练,每个所述目标图结构数据包含噪声节点;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
第三方面,本说明书实施例提供的一种数据的处理装置,所述装置包括:
第一接收模块,被配置为接收针对目标图结构数据的节点分类请求,所述目标图结构数据包含噪声节点;
特征提取模块,被配置为将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
分值确定模块,被配置为基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
结果确定模块,被配置为将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
第四方面,本说明书实施例提供的一种数据的处理装置,所述装置包括:
训练模块,被配置为将多个目标图结构数据输入节点分类模型进行迭代训练,每个所述目标图结构数据包含噪声节点;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
第五方面,本说明书实施例提供的一种数据的处理设备,所述数据的处理设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令包括用于执行如第一方面中所述的方法中的步骤。
第六方面,本说明书实施例提供的一种数据的处理设备,所述数据的处理设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令包括用于执行如第二方面中所述的方法中的步骤。
第七方面,本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行如第一方面中所述的方法中的步骤。
第八方面,本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行如第二方面中所述的方法中的步骤。
综上,本说明书提供的上述技术方案,由于第一特征对应的数据服从正太分布,因而,在第一特征的辅助下,可以获得更加丰富的节点表示,即在对目标图结构数据进行节点分类处理时,可以通过第一特征使目标图结构数据中的节点对应的数据服从正太分布,同时,由于节点分值可以用于表征节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此,在节点分类处理中,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,即在第一特征和节点分值的辅助下,可以降低噪声节点在节点分类处理中的干扰,提高节点分类模型的抗噪能力,获得准确的节点分类结果,提高针对目标图结构数据的节点分类准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一种数据的处理方法实施例;
图2为本说明书一种噪声节点的示意图;
图3为本说明书一种节点分类模型的示意图;
图4为本说明书又一种数据的处理方法实施例;
图5为本说明书一种检索结果的示意图;
图6为本说明书又一种数据的处理方法实施例;
图7为本说明书又一种数据的处理方法实施例;
图8为本说明书又一种数据的处理方法实施例;
图9为本说明书又一种节点分类模型处理过程的示意图;
图10为本说明书一种数据的处理过程的示意图;
图11为本说明书一种数据的处理实例的示意图;
图12为本说明书一种数据的处理装置实施例;
图13为本说明书又一种数据的处理装置实施例;
图14为本说明书一种数据的处理设备实施例。
具体实施方式
本说明书实施例提供一种数据的处理方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本申请的发明构思如下:在对图结构数据进行节点分类处理时,由于图结构数据可能包含大量噪声节点,会造成节点分类效果差,数据处理准确性差等问题。基于上述问题,本技术方案通过接收针对目标图结构数据的节点分类请求,将目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,第一结果包括目标图结构数据对应的第一特征,第一特征对应的数据服从正态分布,基于第一结果,确定第一特征对应的节点分值,节点分值用于表征目标图结构数据中的节点的离散程度,将目标图结构数据、第一特征和节点分值输入节点分类模型的第二子模型,对目标图结构数据进行节点分类处理,得到目标图结构数据的节点分类结果。这样,由于第一特征对应的数据服从正太分布,因而,在第一特征的辅助下,可以获得更加丰富的节点表示,即在对目标图结构数据进行节点分类处理时,可以通过第一特征使目标图结构数据中的节点对应的数据服从正太分布,同时,由于节点分值可以用于表征节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此,在节点分类处理中,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,即在第一特征和节点分值的辅助下,可以降低噪声节点在节点分类处理中的干扰,提高节点分类模型的抗噪能力,获得准确的节点分类结果,提高针对目标图结构数据的节点分类准确性。
如图1所示,本说明书实施例提供一种数据的处理方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的一个服务器,也可以是由多个不同的服务器构成的服务器集群,该服务器可以是提供针对图结构数据的节点分类处理服务的服务器等,具体可以根据实际情况设定。该方法可以应用于对图结构数据的处理中。
该方法具体可以包括以下步骤:
在步骤S102中,接收针对目标图结构数据的节点分类请求。
其中,服务器可以接收任意终端设备(如手机、平板电脑等移动终端设备、个人计算机等终端设备,或服务器等)发送的针对目标图结构数据的节点分类请求,目标图结构数据可以是如知识图谱等任意能够表示节点以及节点关联关系的图数据,节点可以用于表示实体或者概念,节点关联关系可以用于表示实体/概念之间的语义关系,节点分类请求可以是通过节点的属性信息和/或节点关联关系等对节点进行分类处理的请求。
在实施中,随着计算机技术的飞速发展,各行各业都面临着大数据处理的问题,如何从大数据中提取出有价值的信息,支撑面临日益复杂的业务需求,是各行各业亟待解决的问题,而图结构数据因其能够利用可视化技术描述知识资源及其载体,所以,可以结合图结构数据用于解决文本语义相似度、相似商品推荐或智能问答系统等大数据处理问题。为降低噪声节点的干扰,获取准确的节点分类结果,以提高数据利用率低,本说明书实施例提供一种可实现的处理方式,具体可以包括以下内容:
服务器可以与一个或多个终端设备建立数据连接,以接收终端设备发送的针对目标图结构数据的节点分类请求。
此外,节点分类请求中还可以携带有终端设备的设备标识、请求时间等验证信息,用于使服务器基于该验证信息对终端设备进行身份验证,并在身份验证通过后进行对应的数据处理等操作。
另外,目标图结构数据可以由任意用户数据、业务数据等数据确定,例如,目标图结构数据可以由预设业务的业务数据确定,具体如,可以针对资源流转业务的用户信息确定目标图结构数据中的节点,针对资源流转业务的资源流转信息确定目标图结构数据中的节点关联信息。或者,目标图结构数据还可以由某用户在预设时段内的购买信息确定,具体如,可以基于某用户在预设时段内所购买的商品信息确定目标图结构数据中的节点,基于该用户所购买的商品之间的预设关联关系,确定目标图结构数据中的节点关联关系。
上述目标图结构数据的确定方法是一种可选地、可实现的确定方法,在实际应用场景中,还可以有多种不同的确定方法,具体可以根据实际情况设定。
此外,由于目标图结构数据可以是根据用户数据、业务数据等构建的,因而,构建的目标图结构数据中可能包含大量影响节点分类处理准确性的噪声节点,例如,以目标图结构数据是针对资源流转业务构建的图结构数据为例,服务器可以通过终端设备获取针对资源流转业务的用户数据和/或业务数据,并根据获取的用户数据和/或业务数据构建对应的目标图结构数据,但是,由于终端设备中安装的资源流转应用程序还可以为用户提供多种其他服务(如即时通讯服务等),而终端设备的数据处理能力有限,所以,终端设备发送给服务器的数据中可能还包括与资源流转业务无关的用户数据和/或业务数据,因此,服务器构建的目标图结构数据中可能包含影响节点分类处理准确性的噪声节点,例如,如图2所示,服务器构建的目标图结构数据中可能包含4个节点,其中,节点4的节点特征与其他节点的节点特征之间的差异度大于设于差异度,则节点4即为目标图结构数据中的噪声节点。
在步骤S104中,将目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果。
其中,第一结果包括目标图结构数据对应的第一特征,第一特征对应的数据服从正太分布,第一子模型可以为任意能够对图结构数据进行特征提取的模型,例如,第一子模型可以为基于变分图自动编码器(Variational Graph Auto Encoder,VGAE)构建的模型,VGAE可以由编码器(Encode)和解码器(Decode)组成,编码器可以将图结构数据映射到服从正太分布的低维空间,解码器可以从正态分布中任意采样一个低维向量表示(即第一特征),使得该向量表示可以还原图结构数据的结构信息,由于第一特征的数据是从正太分布中采样得到,而不生成随机噪声,因而VGAE也可以起到抗噪声的作用。
在实施中,以目标图结构数据是由预设第一时段内用户1针对预设业务的业务数据确定的图结构数据为例,具体如,以预设业务为资源流转业务为例,可以基于用户1在预设第一时段内的资源流转用户信息(如资源接收用户、中间用户和资源发出用户等),确定目标图结构数据中的节点,并基于用户1在预设第一时段内的资源流转信息,确定目标图结构数据中的节点关联信息。
可以将目标图结构数据输入预先训练的节点分类模型的第一子模型,输出包含第一特征的第一结果。
在步骤S106中,基于第一结果,确定第一特征对应的节点分值。
其中,节点分值可以用于表征目标图结构数据中的节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此可以通过节点分值,识别噪声节点并降低噪声节点在节点分类处理中的干扰。
在实施中,可以通过VGAE的编码器部分学习节点低维向量标识(即第一特征)的方差,在通过方差确定目标图结构数据中节点对应的节点分值。
节点对应的方差越大,可以认为该节点对于节点分类处理的帮助的不确定性越大,因而,可以根据方差确定节点分值,再通过节点分值降低噪声节点在节点分类处理中的干扰。
此外,上述节点分值的确定方法还可以有多种,例如,还可以通过第一特征的标准差、极差等确定节点分值,可以根据实际应用场景的不同选取不同的确定方法,本说明书实施例对此不做具体限定。
在步骤S108中,将目标图结构数据、第一特征和节点分值输入节点分类模型的第二子模型,对目标图结构数据进行节点分类处理,得到目标图结构数据的节点分类结果。
其中,节点分类模型可以为基于历史图结构数据,对第一子模型和第二子模型进行训练得到,第二子模型可以为由任意深度学习算法构建的模型,用于对图结构数据进行节点分类处理,例如,第二子模型可以为由图卷积神经网络(Graph ConvolutionalNetworks,GCN)构建的模型。
在实施中,可以通过历史目标图结构数据对节点分类模型进行训练,以得到预先训练的节点分类模型,其中,可以通过历史目标图结构数据对节点分类模型的第一子模型进行模型训练,确定历史目标图结构数据对应的历史第一特征,在基于历史第一特征、历史目标图结构数据对节点分类模型的第二子模型进行模型训练,得到预先训练的节点分类模型。
由于VGAE采用了编码-解码结构,因而,通过VGAE构建的第一子模型得到的第一特征,可以尽可能的还原目标图结构数据的结构信息,即可以通过VGAE对目标图结构数据进行节点表示学习,得到能够表征目标图结构数据的主要信息的第一特征,并且不生成随机噪声,在第一特征的辅助下,可以使节点在分类处理中获得更加丰富的表示,即使节点对应的数据在分类处理中拥有服从正太分布的特征。另外,如图3所示,在节点分值的作用下,可以间接增强与节点均值距离较近(即节点分值较小)的节点的重要性,削弱与节点均值较远的节点(即节点分值较大)的重要性。即在第一特征和节点分值的辅助下,通过第二子模型对目标图结构数据进行节点分类处理,可以得到更为准确的节点分类结果,同时,也可以提高针对目标图结构数据的数据利用率。
本说明书实施例提供一种数据的处理方法,通过将多个目标图结构数据输入节点分类模型进行迭代训练,每个目标图结构数据包含噪声节点,其中,节点分类模型包括第一子模型和第二子模型,每次训练节点分类模型的具体实现方式为:利用目标图结构数据对节点分类模型的第一子模型进行模型训练,利用第二特征、第二特征对应的节点分值和目标图结构数据对第二子模型进行模型训练,第二特征对应的节点分值是由训练第一子模型过程中产生的第一结果确定的,第一结果包括第二特征,第二特征对应的数据服从正态分布,节点分值用于表征目标图结构数据中的节点的离散程度,这样,由于第一特征对应的数据服从正太分布,因而,在第一特征的辅助下,可以获得更加丰富的节点表示,即在对目标图结构数据进行节点分类处理时,可以通过第一特征使目标图结构数据中的节点对应的数据服从正太分布,同时,由于节点分值可以用于表征节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此,在节点分类处理中,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,即在第一特征和节点分值的辅助下,可以降低噪声节点在节点分类处理中的干扰,提高节点分类模型的抗噪能力,获得准确的节点分类结果,提高针对目标图结构数据的节点分类准确性。
本说明书一个或多个实施例中,服务器在得到针对目标图结构数据的节点分类结果后,还可以基于节点分类结果提供相似节点检索服务,相应的,如图4所示,还可以执行下述步骤S202~S208的处理。
在步骤S202中,接收针对第一信息的信息检索请求。
其中,信息检索请求可以用于获取与第一信息的信息相似度大于预设相似度的信息,第一信息可以是用户信息、业务信息等,例如,第一信息可以是用户1的属性信息,针对第一信息的信息检索请求可以是用于获取与用户1的属性信息的相似度大于预设相似度的信息,以根据获取的信息确定与用户1的相似度较高的用户。
在步骤S204中,确定目标图结构数据中与第一信息对应的第一节点。
在实施中,以目标图结构数据是由预设第一时段内用户2的信息分享数据确定的图结构数据为例,服务器可以获取用户2在该预设第一时段内,在即时通讯应用程序中触发视频信息分享功能、图片信息分享功能以及文字信息分享功能等信息分享功能所对应的第一分享数据(包括分享用户、分享内容等),并根据分享用户确定目标图结构数据中的节点,根据用户2与分享用户之间的用户关系、分享用户与分享用户之间的用户关系,确定目标图结构数据中的节点关联关系。
例如,获取的用户2在预设第一时段内,在即时通讯应用程序触发的信息分享数据可以包括:将视频信息分享给用户3和用户4,将文字信息分享给用户5和用户6,其中,由于用户2是将用户7转发的视频信息分享给用户3和用户4,且用户7是转发的用户8发布的视频信息,且用户2与用户8之间并不存在通讯关系,因而,获取的用户2在预设第一时段内的信息分享数据还包括:转发与用户7和用户8相关的视频信息。
因此,由于用户2与用户8之间并不存在通讯关系,所以,基于上述信息分享数据构建的图结构数据中可能噪声节点(即与用户8对应的节点)。
服务器可以将构建的目标图结构数据输入预先训练的节点分类模型,得到目标图结构数据的节点分类结果,得到的节点分类结果具体可以为:用户3、用户4、用户7和用户8为一类,用户5和用户6为一类。
终端设备在检测到用户2在即时通讯应用程序中触发信息分享功能并选择用户3为信息分享对象的情况下,终端设备可以向服务器发送针对用户3的相似用户检索请求,其中,用户3的信息即为第一信息,相似用户检索请求即为信息检索请求,服务器可以将目标图结构数据中与用户3的信息对应的节点确定为第一节点。
在步骤S206中,基于目标图结构数据的节点分类结果获取第一目标节点。
其中,第一目标节点的类别与第一节点的类别相同。
在步骤S208中,针对信息检索请求反馈检索结果。
其中,检索结果包括第一目标节点对应的信息。
在实施中,以上述步骤S204中的目标图结构数据的节点分类结果为例,第一目标节点即为用户4、用户7和用户8对应的节点,服务器可以获取第一目标节点对应的用户信息(即用户4、用户7和用户8的用户信息),并将用户4、用户7和用户8的用户信息作为检索结果反馈给终端设备。
如图5所示,终端设备可以在检测到用户2在即时通讯应用程序中触发信息分享功能,并选择用户3为信息分享对象的情况下,显示用户4、用户7和用户8的用户信息,并可以接收用户2在用户4、用户7和用户8中的一个或多个对应控件上的确定指令,以将待分享内容在分享给用户3的同时,分享给用户4、用户7和用户8中的一个或多个。
这样,可以在目标图结构数据中包含噪声节点的情况下,实现对目标图结构数据的准确分类处理,即得到准确度高的分类处理结果,以提高相似节点的搜索效率和搜索准确性,以提高用户的使用体验。
另外,终端设备在获取到用户4、用户7和用户8的用户信息后,还可以根据用户2的通讯信息对这3个用户进行筛选处理,即终端设备将与用户2存在通讯关系的用户4和用户7反馈给用户2。
本说明书一个或多个实施例中,目标图结构数据还可以为基于与目标标识具有预设对应关系的第二信息确定的图结构数据,相应的,如图6所示,还可以执行下述步骤S302~S308的处理。
在步骤S302中,基于第二信息确定目标图结构数据。
在步骤S304中,确定目标图结构数据中与目标信息对应的第二节点。
其中,目标信息可以为第二信息中的任意一个或多个信息,第二信息可以与目标标识具有预设对应关系,目标标识可以是用户标识、设备标识等,例如,第二信息可以包含目标标识对应的设备在预设时段内生成的购买信息,具体如,目标标识对应的设备中可以安装有商品交易应用程序,第二信息可以包含:2021年11月1日购买了苹果,2021年11月2日购买了果汁等,目标信息可以为苹果和果汁等。
服务器可以根据预设时间段内目标标识对应的设备提供的多个第二信息,构建对应的目标图结构数据,终端设备(即目标标识对应的设备)在检测到针对该商品交易应用程序的启动指令的情况下,可以向服务器发送针对苹果和奶昔的信息展示请求,服务器可以根据终端设备提供的目标信息,确定目标图结构数据中的第二节点(即与苹果、奶昔对应的节点)。
在步骤S306中,基于目标图结构数据的节点分类结果确定待推荐的第二目标节点。
其中,第二目标节点的类别与目标图结构数据中的第二节点的类别相同。
在步骤S308中,向目标标识对应的设备输出推荐信息。
其中,推荐信息可以包括第二目标节点对应的信息。
在实施中,假设获取的第二目标节点包含与第二节点1对应的第二目标节点1,以及与第二节点2对应的第二目标节点2,那么,可以将第二目标节点1以及第二目标节点2对应的信息,确定为推荐信息,并向目标标识对应的设备输出该推荐信息以反馈给用户,其中,第二节点1可以为与苹果对应的节点,第二节点2可以为与奶昔对应的节点。
终端设备可以在商品交易应用程序的初始页面,显示苹果、香蕉、奶昔和果汁等商品,以实现有针对性的商品推荐功能,提高相似商品的确定准确性,避免在用户数据中存在噪声数据情况下,无法准确确定相似商品导致的用户体验较差的问题。其中,香蕉可以为与第二目标节点1对应的商品,果汁可以为与第二目标节点2对应的商品,即香蕉和苹果对应的节点的类别相同,果汁和奶昔对应的节点的类别相同。
如图7所示,本说明书实施例提供又一种数据的处理方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的一个服务器,也可以是由多个不同的服务器构成的服务器集群,该服务器可以是提供针对图结构数据的节点分类处理服务的服务器等,具体可以根据实际情况设定。该方法可以应用于对图结构数据的处理中。
该方法具体可以包括以下步骤:
在步骤S702中,将多个目标图结构数据输入节点分类模型进行迭代训练。
其中,目标图结构数据可以是如知识图谱等任意能够表示节点以及节点关联关系的图数据,节点可以用于表示实体或者概念,节点关联关系可以用于表示实体/概念之间的语义关系,节点分类请求可以是通过节点的属性信息和/或节点关联关系等对节点进行分类处理的请求。
节点分类模型包括第一子模型和第二子模型。每次训练节点分类模型的具体实现方式为:利用目标图结构数据对节点分类模型的第一子模型进行模型训练。
第一子模型可以为基于变分图自动编码器(Variational Graph Auto Encoder,VGAE)构建的模型,VGAE可以由编码器(Encode)和解码器(Decode)组成,编码器可以将图结构数据映射到服从正太分布的低维空间,解码器可以从正态分布中任意采样一个低维向量表示(即第一特征),使得该向量表示可以还原图结构数据的结构信息,由于第一特征是从正太分布中采样得到,而不生成随机噪声,因而VGAE也可以起到抗噪声的作用。
利用第二特征、第二特征对应的节点分值和目标图结构数据对第二子模型进行模型训练。第二特征对应的节点分值是由训练第一子模型过程中产生的第一结果确定的,第一结果包括第二特征,第二特征对应的数据服从正态分布,节点分值用于表征目标图结构数据中的节点的离散程度。
第二子模型可以为由任意深度学习算法构建的模型,可以用于对图结构数据进行节点分类处理,例如,第二子模型可以为由图卷积神经网络(Graph ConvolutionalNetworks,GCN)构建的模型。
由于目标图结构数据中可能存在影响节点分类准确性的噪声节点,若直接通过GCN对目标图结构数据进行节点分类处理,噪声节点就会对节点分类结果的准确性造成较大的影响。所以,可以将目标图结构数据输入第一子模型,获得对应数据满足正太分布的第一特征,并在第一特征的辅助下,通过第二子模型对目标图结构数据进行节点分类处理,实现信息融合,使目标图结构数据的节点对应的数据服从正太分布,即噪声节点的表示同样服从正太分布,以降低噪声节点对节点分类处理的干扰,另外,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,提高节点分类模型的抗攻击的能力。
本说明书实施例提供一种数据的处理方法,通过将多个目标图结构数据输入节点分类模型进行迭代训练,每个目标图结构数据包含噪声节点,其中,节点分类模型包括第一子模型和第二子模型,每次训练节点分类模型的具体实现方式为:利用目标图结构数据对节点分类模型的第一子模型进行模型训练,利用第二特征、第二特征对应的节点分值和目标图结构数据对第二子模型进行模型训练,第二特征对应的节点分值是由训练第一子模型过程中产生的第一结果确定的,第一结果包括第二特征,第二特征对应的数据服从正态分布,节点分值用于表征目标图结构数据中的节点的离散程度,这样,由于第一特征对应的数据服从正太分布,因而,在第一特征的辅助下,可以获得更加丰富的节点表示,即在对目标图结构数据进行节点分类处理时,可以通过第一特征使目标图结构数据中的节点对应的数据服从正太分布,同时,由于节点分值可以用于表征节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此,在节点分类处理中,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,即在第一特征和节点分值的辅助下,可以降低噪声节点在节点分类处理中的干扰,提高节点分类模型的抗噪能力,获得准确的节点分类结果,提高针对目标图结构数据的节点分类准确性。
如图8所示,本说明书一个或多个实施例中,第二子模型包含两层数据处理层和分类层,第一层数据处理层的输入数据为目标图结构数据,第二层数据处理层的输入数据由第一层数据处理层输出的处理结果、第二特征和节点分值确定,分类层的输入数据为第二层数据处理层的处理结果。
本说明书一个或多个实施例中,上述利用目标图结构数据对节点分类模型的第一子模型进行模型训练的处理可以多种多样,以下提供一种可选的处理方式,如第一结果还包括第二特征对应的方差,如图9所示,具体可以包括以下步骤S7022~S7026的处理。
在步骤S7022中,将目标图结构数据输入第一子模型的特征提取层,得到第二特征。
上述步骤S7022中,得到第二特征的处理可以多种多样,以下提供一种可选的处理方式,具体可以包括以下步骤A2的处理。
在步骤A2中,将节点特征矩阵和邻接矩阵,输入第一子模型的特征提取层,得到第二特征。
其中,节点特征矩阵可以为基于目标图结构数据的节点特征确定,邻接矩阵可以为基于目标图结构数据的节点关联信息和预设训练参数确定。
在实施中,如图8所示,假设目标图结构数据中的节点之间的边的权重是可以学习的,即可以对目标图结构数据的边缘的权重进行初始化,可以基于目标图结构数据的节点关联信息和预设训练参数,确定用于反映节点之间的连接情况的邻接矩阵,例如,A=softmax(A0*W0),其中,A为邻接矩阵,且A∈RV*V,A0为基于目标图结构数据的节点关联信息构建的初始矩阵,W0为初始的预设训练参数,服从均匀分布,且W0∈RV*V,V为目标图结构数据中的节点个数。
可以将邻接矩阵和节点特征矩阵输入第一子模型的特征提取层,得到第二特征,即Z(1)=GCN(A,X,W1),其中,Z(1)为第二特征,A为邻接矩阵,X为节点特征矩阵,且X∈RV*C,W1为第一训练参数,并且W1∈RC*F,C为节点特征矩阵的维数。
在步骤S7024中,通过第一子模型,确定第二特征对应的均值和方差。
在步骤S7026中,基于方差,确定第二特征对应的节点分值。
在实施中,可以将方差代入下列公式,得到第二特征对应的节点分值,
本说明书一个或多个实施例中,上述利用第二特征、第二特征对应的节点分值和目标图结构数据对第二子模型进行模型训练的处理可以多种多样,以下提供一种可选的处理方式,如图9所示,具体可以包括以下步骤S7028~S70224的处理。
在步骤S7028中,基于均值和方差,确定第一输入数据。
上述步骤S7028中,生成第一输入数据的处理可以多种多样,以下提供一种可选的处理方式,具体可以包括以下步骤B2的处理。
在步骤B2中,基于目标矩阵、均值和方差,确定第一输入数据。
其中,目标矩阵服从正太分布,例如,目标矩阵可以是由预设随机数生成算法生成的随机数构成的服从正太分布的矩阵。
在步骤S70210中,将第一输入数据输入第一子模型的重构层,得到第一子模型的模型输出结果。
在实施中,如图8所示,第一子模型可以包含特征提取层、用于确定第一特征的均值的第一数据处理层、用于确定第一特征的方差的第二数据处理层和重构层,可以通过重构层来重构目标图数据的图结构,第一子模型的输出结果即为重构的邻接矩阵,即可以通过计算每两个节点之间存在边的概率来重构图。
这样,可以通过特征提取层提取出目标图结构数据的主要信息,在将提取出的第二特征传递给第二子模型的数据处理层进行处理,可以丰富数据处理层的节点标识,提升第二子模型的节点分类效果。
在步骤S70212中,将目标图结构数据输入第二子模型的第一层数据处理层,得到第一处理结果。
在步骤S70214中,基于第一处理结果、节点分值和第二特征,生成第二处理结果。
上述步骤S70214中,生成第二处理结果的处理可以多种多样,以下提供一种可选的处理方式,具体可以包括以下步骤C2~C4的处理。
在步骤C2中,根据第一调节参数和第一处理结果确定第一子数据,根据第二调节参数、节点分值和第二特征确定第二子数据。
在步骤C4中,基于第一子数据和第二子数据,生成第二处理结果。
其中,第一调节参数和第二调节参数具有预设数值关系,例如,第一调节参数和第二调节参数的和可以为1,如第二调节参数可以为0.1,则第一调节参数可以为0.9。
在实施中,可以将第一调节参数、第一处理结果、第二调节参数、节点分值和第二特征中的第一子特征代入公式α+γ=1,得到第一输入数据,其中,H(1)为第一输入数据,γ为第一调节参数,S为节点分值,为第一处理结果,α为第二调节参数,Z(1)为第二特征。
在步骤S70216中,将第二处理结果输入第二子模型的第二层数据处理层,得到第三处理结果。
在实施中,H(2)=GCN(A,H(1),W5),其中,H(2)为第三处理结果,H(1)为第二处理结果,A为邻接矩阵,且A∈RV*V,X为节点特征矩阵,且X∈RV*C,C为目标图结构数据的维数,W5为第六训练参数。
在步骤S70218中,将第三处理结果输入第一子模型的分类层,得到目标图结构数据的节点分类结果。
在步骤S70220中,根据损失函数、均值、方差、第二子模型的节点分类结果和第一子模型的模型输出结果,确定损失值。
上述步骤S70220中,确定损失值的处理可以多种多样,以下提供一种可选的处理方式,具体可以包括以下步骤D2~D4的处理。
在步骤D2中,获取目标图结构数据的实际节点分类结果。
在步骤D4中,根据损失函数、目标图结构数据的实际节点分类结果、节点分类结果、邻接矩阵、重构的邻接矩阵、预设训练参数、均值和方差,确定损失值。
此外,本说明书一个或多个实施例中损失函数包含第一交叉熵函数、第二交叉熵函数、预设分布距离确定函数以及惩罚函数,第一交叉熵函数通过节点分类结果和实际节点分类结果之间的距离确定,第二交叉熵函数通过邻接矩阵和重构的邻接矩阵之间的距离确定,预设分布距离确定函数通过均值和方差与正太分布之间的距离确定,惩罚函数用于对预设训练参数进行处理。
在实施中,可以将目标图结构数据的实际节点分类结果、节点分类结果、邻接矩阵、重构的邻接矩阵、预设训练参数、均值和方差代入下述损失函数,以确定损失值:
其中,L为损失值,为节点分类结果,Y为目标图结构数据的实际节点分类结果,A′为重构的邻接矩阵,A为邻接矩阵,为均值,为方差,θ为训练过程中的训练参数(即包括上述预设训练参数、第一训练参数~第六训练参数),J()为交叉熵函数,KL()用于衡量当前分布与标准正太分布的距离,λ为预设调节参数,||θ||2表示对θ进行正则化处理。
在步骤S70222中,若损失值满足停止训练条件,则停止对第一子模型和第二子模型训练
在步骤S70224中,基于停止训练时的第一子模型和第二子模型,确定节点分类模型。
此外,本说明书一个或多个实施例中,在步骤S70420后,若损失值不满足停止训练条件,如图9所示,可以执行下述步骤S70226。
在步骤S70226中,若损失值不满足停止训练条件,则将目标图结构数据输入第一子模型的特征提取层,得到第二特征,并基于第一处理结果、节点分值,对第二特征进行更新处理。
在实施中,得到第三处理结果,其中,Z(1)’为更新后的第二特征,γ为第一调节参数,S为节点分值,为第一处理结果,α为第二调节参数,Z(1)为第二特征。可以将更新后的第二特征作为第二特征,并继续执行步骤S70216~S70220。
本说明书实施例提供一种数据的处理方法,通过将多个目标图结构数据输入节点分类模型进行迭代训练,每个目标图结构数据包含噪声节点,其中,节点分类模型包括第一子模型和第二子模型,每次训练节点分类模型的具体实现方式为:利用目标图结构数据对节点分类模型的第一子模型进行模型训练,利用第二特征、第二特征对应的节点分值和目标图结构数据对第二子模型进行模型训练,第二特征对应的节点分值是由训练第一子模型过程中产生的第一结果确定的,第一结果包括第二特征,第二特征对应的数据服从正态分布,节点分值用于表征目标图结构数据中的节点的离散程度,这样,由于第一特征对应的数据服从正太分布,因而,在第一特征的辅助下,可以获得更加丰富的节点表示,即在对目标图结构数据进行节点分类处理时,可以通过第一特征使目标图结构数据中的节点对应的数据服从正太分布,同时,由于节点分值可以用于表征节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此,在节点分类处理中,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,即在第一特征和节点分值的辅助下,可以降低噪声节点在节点分类处理中的干扰,提高节点分类模型的抗噪能力,获得准确的节点分类结果,提高针对目标图结构数据的节点分类准确性。
以下通过具体的应用场景对上述数据的处理进行详细说明,该场景可以包括:相似商品推荐场景、智能问答场景以及信息分享等场景进行说明,具体可以包括以下内容:
如图10所示,本说明书实施例中的数据的处理方法对应的系统架构中可以包括服务器1001和一个或多个终端设备1002,服务器1001与每个终端设备1002之间建立通信连接,终端设备1002可以为任意终端设备,例如,手机、平板电脑等移动终端设备,还可以如笔记本电脑等终端设备,还可以如智能手表、手环等可穿戴设备等。终端设备1002可以向服务器1001发送数据处理请求,服务器1001通过预先设定的处理机制对终端设备1002的相关信息进行检测后,确定该终端设备1002能够与服务器1001建立连接后,可以与终端设备1002建立连接并进行对应的数据处理等操作。
基于上述系统架构,以及上述图1~图9相关的处理过程,在该场景的具体应用中,服务器可以获取某用户的用户行为对应的历史对象信息,并基于历史对象信息构建与该用户对应的历史目标图结构数据,例如,用户1在预设模型构建周期内,通过终端设备中的某阅读应用程序浏览了若干文本信息,则历史对象信息可以是与浏览行为对应的文本信息。
服务器可以根据获取的历史对象信息构建与用户1对应的历史目标图结构数据,服务器可以基于上述方法获取与多个目户对应的历史目标图结构数据,并由获取的目标图结构数据构建训练数据集。
服务器可以基于训练数据集中的多个历史目标图结构数据,对节点分类模型进行训练,得到训练后的节点分类模型。例如,服务器可以将多个历史目标图结构数据输入由GAE构建的第一子模型进行模型训练,确定历史目标图结构数据对应的第二特征以及与第二特征对应的方差,并基于方差,确定历史目标图结构数据中节点对应的节点分值,其中,第二特征对应的数据服从正太分布。
在第二特征和节点分值的辅助下,服务器可以基于目标图结构数据对节点分类模型中由GCN构建的第二子模型进行模型训练,得到训练后的节点分类模型。具体的模型训练的过程可以参见本说明书实施例提供的数据的处理方法的处理过程,在此不再赘述。
服务器在得到训练后的节点分类模型后,可以获取与目标用户的目标标识对应的第二信息,例如,假设目标用户对应的目标标识为用户2,第二信息可以是用户2的用户行为对应的对象信息,具体如,获取的与用户2对应的对象信息包括:标题为“ab”的文本信息1、标题为“abc”的文本信息2、标题为“abd”的文本信息3、标题为“abd”的游戏信息1、标题为“ab”的游戏信息2、标题为“ab”的购物信息,其中,由于标题为“ab”的购物信息与文本信息和游戏信息虽在标题相似度较高,但特征相似度较低,显然,该购物信息为对象信息中的噪声信息。
服务器可以基于目标标识对应的第二信息,构建目标图结构数据,并将目标图结构数据输入预先训练的节点分类模型中由GAE构建的第一子模型,通过第一子模型对目标图结构数据进行特征提取,得到第一特征,并通过第一子模型,确定第一特征对应的节点分值。再将第一特征、节点分值和目标图结构数据输入节点分类模型中由GCN构建的第二子模型,对目标图结构数据进行节点分类处理,得到与每个目标用户对应的目标图结构数据的节点分类结果。
基于上述节点分类处理,得到的节点分类结果可以为:针对用户3的目标图结构数据的节点分类结果可以包含:标题为“ab”的文本信息1、标题为“abc”的文本信息2、标题为“abd”的文本信息3与标题为“ab”的广告信息为一类,标题为“abd”的游戏信息1和标题为“ab”的游戏信息2为一类。
这样,即使目标图结构数据中包含噪声节点,服务器也可以获取较为准确的节点分类结果,并将与目标标识对应的节点分类结果返回给对应的终端设备,以使终端设备基于节点分类结果为目标标识对应的目标用户提供推荐服务。例如,假设针对用户2的目标信息为标题为“ab”的文本信息1,则服务器可以将标题为“abc”的文本信息2、标题为“abd”的文本信息3与标题为“ab”的广告信息返回给用户2的终端设备,以为目标标识对应的目标用户提供推荐服务。
此外,上述是以目标用户(即与目标标识对应的用户)的用户行为对应的对象信息为例,生成对应的节点分类结果以确定待推荐的信息,为用户提供推荐服务,除此之外,还可以根据用户针对某业务的咨询信息生成对应的节点分类结果,以确定对应的话术,为用户提供智能问答服务等。
服务器可以通过目标图结构数据对每个目标标识对应的目标图结构数据进行信息补充,可以提高针对每个目标图结构数据的节点分类的准确性和数据利用率,提高数据处理的准确性。
另外,本说明书实施例还通过实验对提供的数据的处理方法进行了有效性验证,具体如,服务器可以获取与文章引用网络相关的数据集(如数据集1、数据集2以及数据集3),通过若干分类模型(如GCN模型、LP模型、ICA模型等)以及本说明书实施例提供的节点分类模型,实现对数据集中文章类别的分类处理,通过100次迭代处理,得到的每个模型的分类准确度如下表1所示。
表1
从上表1可以看出,本说明书实施例提供的节点分类模型的节点分类准确性高于其他分类模型。
另外,如图11所示,本说明书实施例通过在数据集中增加不同数量的噪声数据的方式,验证本说明书实施例提供的节点分类模型的防御对抗攻击的效果,由于GCN模型对小的扰动比较敏感,即如果对输入做一些小的变动,就会对GCN的结果造成较大的影响,而本说明书实施例提供的节点分类模型,可以在第一特征和节点分值的辅助下,提高节点分类模型的抗噪能力,获得准确的节点分类结果,即可以提高针对目标图结构数据的节点分类准确性,实现节点分类模型鲁棒性的改善。从图11中可以看出,当噪声数据的数量越多,GCN模型的分类准确度越小于本说明书提供的节点分类模型的准确度。
以上为本说明书实施例提供的数据的处理方法,基于同样的思路,本说明书实施例还提供一种数据的处理装置,该数据的处理装置中包括如上述实施例中的服务器的所有功能单元,如图12所示。
该数据的处理装置包括:第一接收模块1201、特征提取模块1202、分值确定模块1203和结果确定模块1204,其中:
第一接收模块1201,被配置为接收针对目标图结构数据的节点分类请求;
特征提取模块1202,被配置为将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
分值确定模块1203,被配置为基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
结果确定模块1204,被配置为将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
本说明书实施例提供的数据的处理装置能够实现上述数据的处理方法对应的实施例中的各个过程,为避免重复,这里不再赘述。
需要说明的是,本说明书实施例提供的数据的处理装置与本说明书实施例提供的数据的处理方法基于同一发明构思,因此该实施例的具体实施可以参见前述数据的处理方法的实施,重复之处不再赘述。
以上为本说明书实施例提供的数据的处理方法,基于同样的思路,本说明书实施例还提供一种数据的处理装置,该数据的处理装置中包括如上述实施例中的服务器的所有功能单元,如图13所示。
该数据的处理装置包括:训练模块1301,其中:
训练模块1301,被配置为将多个目标图结构数据输入节点分类模型进行迭代训练;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
本说明书实施例提供的数据的处理装置能够实现上述数据的处理方法对应的实施例中的各个过程,为避免重复,这里不再赘述。
需要说明的是,本说明书实施例提供的数据的处理装置与本说明书实施例提供的数据的处理方法基于同一发明构思,因此该实施例的具体实施可以参见前述数据的处理方法的实施,重复之处不再赘述。
对应上述实施例提供的数据的处理方法,基于相同的技术构思,本说明书实施例还提供了一种数据的处理设备,该数据的处理设备用于执行上述的数据的处理方法,图14为实现本说明书各个实施例的一种数据的处理设备的硬件结构示意图,图14所示的数据的处理设备140包括但不限于:射频单元141、网络模块142、音频输出单元143、输入单元144、传感器145、用户输入单元146、接口单元147、存储器148、处理器149、以及电源1410等部件。本领域技术人员可以理解,图14中示出的数据的处理设备结构并不构成对数据的处理设备的限定,数据的处理设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,接口单元147,用于接收针对目标图结构数据的节点分类请求;
处理器149,用于将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
处理器149,用于基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
处理器149,用于将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
在另一种具体的实施例中,处理器149,还用于将多个目标图结构数据输入节点分类模型进行迭代训练;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
需要说明的是,本说明书实施例提供的数据的处理设备140能够实现上述数据的处理方法实施例中数据的处理设备实现的各个过程,为避免重复,这里不再赘述。
优选的,本说明书实施例还提供一种数据的处理设备,包括处理器149,存储器148,存储在存储器148上并可在所述处理器149上运行的计算机程序,该计算机程序被处理器149执行时实现上述数据的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
进一步地,基于上述图1到图11所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
接收针对目标图结构数据的节点分类请求;
将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
在另一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
将多个目标图结构数据输入节点分类模型进行迭代训练;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
需要说明的是,本说明书实施例提供的存储介质能够实现上述数据的处理方法实施例中数据的处理设备实现的各个过程,为避免重复,这里不再赘述。
本说明书实施例提供一种存储介质,通过将多个目标图结构数据输入节点分类模型进行迭代训练,每个目标图结构数据包含噪声节点,其中,节点分类模型包括第一子模型和第二子模型,每次训练节点分类模型的具体实现方式为:利用目标图结构数据对节点分类模型的第一子模型进行模型训练,利用第二特征、第二特征对应的节点分值和目标图结构数据对第二子模型进行模型训练,第二特征对应的节点分值是由训练第一子模型过程中产生的第一结果确定的,第一结果包括第二特征,第二特征对应的数据服从正态分布,节点分值用于表征目标图结构数据中的节点的离散程度,这样,由于第一特征对应的数据服从正太分布,因而,在第一特征的辅助下,可以获得更加丰富的节点表示,即在对目标图结构数据进行节点分类处理时,可以通过第一特征使目标图结构数据中的节点对应的数据服从正太分布,同时,由于节点分值可以用于表征节点的离散程度,离散程度可以反映节点之间的差异程度,即离散程度越高的节点是噪声节点的可能性越大,对节点分类处理的准确性的影响程度也越大,因此,在节点分类处理中,可以通过节点分值,降低与其他节点之间的差异程度较大的节点对节点分类处理的影响,即在第一特征和节点分值的辅助下,可以降低噪声节点在节点分类处理中的干扰,提高节点分类模型的抗噪能力,获得准确的节点分类结果,提高针对目标图结构数据的节点分类准确性。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (16)
1.一种数据的处理方法,其特征在于,所述方法包括:
接收针对目标图结构数据的节点分类请求;
将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
2.根据权利要求1所述的方法,其特征在于,在得到所述目标图结构数据的节点分类结果之后,所述方法还包括:
接收针对第一信息的信息检索请求,所述信息检索请求用于获取与所述第一信息的信息相似度大于预设相似度的信息;
确定所述目标图结构数据中与所述第一信息对应的第一节点;
基于所述目标图结构数据的节点分类结果获取第一目标节点,所述第一目标节点的类别与所述第一节点的类别相同;
针对所述信息检索请求反馈检索结果,所述检索结果包括所述第一目标节点对应的信息。
3.根据权利要求1所述的方法,其特征在于,在所述接收针对目标图结构数据的节点分类请求之前,所述方法还包括:
基于第二信息确定所述目标图结构数据;
在得到所述目标图结构数据的节点分类结果之后,所述方法还包括:
确定所述目标图结构数据中与目标信息对应的第二节点,所述目标信息为第二信息中的任意一个或多个信息,所述第二信息与目标标识具有预设对应关系;
基于所述目标图结构数据的节点分类结果确定待推荐的第二目标节点,所述第二目标节点的类别与所述目标图结构数据中的第二节点的类别相同;
向所述目标标识对应的设备输出推荐信息,所述推荐信息包括所述第二目标节点对应的信息。
4.一种数据的处理方法,其特征在于,所述方法包括:
将多个目标图结构数据输入节点分类模型进行迭代训练;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
5.根据权利要求4所述的方法,其特征在于,所述第二子模型包含两层数据处理层和分类层,第一层所述数据处理层的输入数据为所述目标图结构数据,第二层所述数据处理层的输入数据由所述第一层数据处理层输出的处理结果、所述第二特征和所述节点分值确定,所述分类层的输入数据为所述第二层数据处理层的处理结果。
6.根据权利要求5所述的方法,其特征在于,所述第一结果还包括所述第二特征对应的方差,所述利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练,包括:
将所述目标图结构数据输入所述第一子模型的特征提取层,得到所述第二特征;
通过所述第一子模型,确定所述第二特征对应的均值和方差;
基于所述方差,确定所述第二特征对应的节点分值。
7.根据权利要求6所述的方法,其特征在于,所述利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练,包括:
基于所述均值和所述方差,确定第一输入数据;
将所述第一输入数据输入所述第一子模型的重构层,得到所述第一子模型的模型输出结果;
将所述目标图结构数据输入所述第二子模型的第一层数据处理层,得到第一处理结果;
基于所述第一处理结果、所述节点分值和所述第二特征,生成第二处理结果;
将所述第二处理结果输入所述第二子模型的第二层数据处理层,得到第三处理结果;
将所述第三处理结果输入所述第一子模型的分类层,得到所述目标图结构数据的节点分类结果;
根据损失函数、所述均值、所述方差、所述第二子模型的节点分类结果和所述第一子模型的模型输出结果,确定损失值;
若所述损失值满足停止训练条件,则停止对所述述第一子模型和所述第二子模型训练;
基于停止训练时的所述第一子模型和所述第二子模型,确定所述节点分类模型。
8.根据权利要求7所述的方法,所述方法还包括:
若所述损失值不满足所述停止训练条件,则将所述目标图结构数据输入所述第一子模型的特征提取层,得到所述第二特征,并基于所述第一处理结果、所述节点分值,对所述第二特征进行更新处理。
9.根据权利要求7所述的方法,其特征在于,所述将所述目标图结构数据输入所述第一子模型的特征提取层,得到所述第二特征,包括:
将节点特征矩阵和邻接矩阵,输入所述第一子模型的特征提取层,得到所述第二特征;所述节点特征矩阵为基于所述目标图结构数据的节点特征确定,所述邻接矩阵为基于所述目标图结构数据的节点关联信息和预设训练参数确定。
10.根据权利要求9所述的方法,其特征在于,所述第一子模型的模型输出结果包括重构的邻接矩阵,所述根据损失函数、所述均值、所述方差、所述第二子模型的节点分类结果和所述第一子模型的模型输出结果,确定损失值,包括:
获取所述目标图结构数据的实际节点分类结果;
根据所述损失函数、所述目标图结构数据的实际节点分类结果、所述节点分类结果、所述邻接矩阵、所述重构的邻接矩阵、所述预设训练参数、所述均值和所述方差,确定所述损失值。
11.根据权利要求10所述的方法,其特征在于,所述损失函数包含第一交叉熵函数、第二交叉熵函数、预设分布距离确定函数以及惩罚函数,所述第一交叉熵函数通过所述节点分类结果和所述实际节点分类结果之间的距离确定,所述第二交叉熵函数通过所述邻接矩阵和所述重构的邻接矩阵之间的距离确定,所述预设分布距离确定函数通过所述均值和所述方差与正太分布之间的距离确定,所述惩罚函数用于对所述预设训练参数进行处理。
12.根据权利要求7所述的方法,其特征在于,所述基于所述第一处理结果、所述节点分值和所述第二特征,生成第二处理结果,包括:
根据第一调节参数和所述第一处理结果确定第一子数据,根据第二调节参数、所述节点分值和所述第二特征确定第二子数据,所述第一调节参数和所述第二调节参数具有预设数值关系;
基于所述第一子数据和所述第二子数据,生成所述第二处理结果。
13.一种数据的处理装置,其特征在于,所述装置包括:
第一接收模块,被配置为接收针对目标图结构数据的节点分类请求;
特征提取模块,被配置为将所述目标图结构数据输入预先训练的节点分类模型的第一子模型,得到第一结果,所述第一结果包括所述目标图结构数据对应的第一特征,所述第一特征对应的数据服从正态分布;
分值确定模块,被配置为基于所述第一结果,确定所述第一特征对应的节点分值,所述节点分值用于表征所述目标图结构数据中的节点的离散程度;
结果确定模块,被配置为将所述目标图结构数据、所述第一特征和所述节点分值输入所述节点分类模型的第二子模型,对所述目标图结构数据进行节点分类处理,得到所述目标图结构数据的节点分类结果。
14.一种数据的处理装置,其特征在于,所述装置包括:
训练模块,被配置为将多个目标图结构数据输入节点分类模型进行迭代训练;
其中,所述节点分类模型包括第一子模型和第二子模型;
每次训练节点分类模型的具体实现方式为:
利用所述目标图结构数据对所述节点分类模型的第一子模型进行模型训练;
利用第二特征、所述第二特征对应的节点分值和所述目标图结构数据对所述第二子模型进行模型训练;
所述第二特征对应的节点分值是由训练所述第一子模型过程中产生的第一结果确定的,所述第一结果包括所述第二特征,所述第二特征对应的数据服从正态分布,所述节点分值用于表征所述目标图结构数据中的节点的离散程度。
15.一种数据的处理设备,其特征在于,所述数据的处理设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行;
所述可执行指令包括用于执行如权利要求1-3任一项所述的方法中的步骤,或者,所述可执行指令包括用于执行如权利要求4-12任一项所述的方法中的步骤。
16.一种存储介质,其特征在于,所述存储介质用于存储计算机可执行指令;
所述可执行指令使得计算机执行如权利要求1-3任一项所述的方法,或者,所述可执行指令使得计算机执行如权利要求4-11任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210296698.0A CN114579813A (zh) | 2022-03-24 | 2022-03-24 | 一种数据的处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210296698.0A CN114579813A (zh) | 2022-03-24 | 2022-03-24 | 一种数据的处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114579813A true CN114579813A (zh) | 2022-06-03 |
Family
ID=81781670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210296698.0A Pending CN114579813A (zh) | 2022-03-24 | 2022-03-24 | 一种数据的处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114579813A (zh) |
-
2022
- 2022-03-24 CN CN202210296698.0A patent/CN114579813A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20160170982A1 (en) | Method and System for Joint Representations of Related Concepts | |
CN107391545B (zh) | 一种对用户进行分类的方法、输入方法及装置 | |
CN109344406B (zh) | 词性标注方法、装置和电子设备 | |
CN113688313A (zh) | 一种预测模型的训练方法、信息推送的方法及装置 | |
CN110020427B (zh) | 策略确定方法和装置 | |
WO2023045605A9 (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN108346107B (zh) | 一种社交内容风险识别方法、装置以及设备 | |
Zhu et al. | Multimodal Fusion Method Based on Self‐Attention Mechanism | |
CN110738562B (zh) | 一种风险提醒信息的生成方法、装置及设备 | |
CN116306868B (zh) | 一种模型的处理方法、装置及设备 | |
US20240265198A1 (en) | Reply content processing method and interaction method for interactive content of media content | |
CN111507726B (zh) | 一种报文生成方法、装置及设备 | |
CN113157941B (zh) | 业务特征数据处理、文本生成方法、装置及电子设备 | |
CN113221717A (zh) | 一种基于隐私保护的模型构建方法、装置及设备 | |
CN116611497B (zh) | 一种点击率预估模型训练方法和装置 | |
CN116630480B (zh) | 一种交互式文本驱动图像编辑的方法、装置和电子设备 | |
CN115545943A (zh) | 一种图谱的处理方法、装置及设备 | |
CN114579813A (zh) | 一种数据的处理方法、装置及设备 | |
CN108805628B (zh) | 一种电子商务推荐方法 | |
CN114662706B (zh) | 一种模型训练方法、装置及设备 | |
CN117093863A (zh) | 一种模型的处理方法、装置及设备 | |
CN118469010A (zh) | 一种模型的安全防护方法、装置及设备 | |
CN114781488A (zh) | 一种样本生成方法、装置以及设备 | |
CN118658167A (zh) | 一种模型的处理方法、装置及设备 | |
CN117493666A (zh) | 物品冷启动推荐方法和物品冷启动推荐模型训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |