CN113722437A - 基于人工智能的用户标签识别方法、装置、设备及介质 - Google Patents

基于人工智能的用户标签识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN113722437A
CN113722437A CN202111009548.9A CN202111009548A CN113722437A CN 113722437 A CN113722437 A CN 113722437A CN 202111009548 A CN202111009548 A CN 202111009548A CN 113722437 A CN113722437 A CN 113722437A
Authority
CN
China
Prior art keywords
matrix
similarity matrix
target
network
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111009548.9A
Other languages
English (en)
Other versions
CN113722437B (zh
Inventor
陈雪娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111009548.9A priority Critical patent/CN113722437B/zh
Publication of CN113722437A publication Critical patent/CN113722437A/zh
Application granted granted Critical
Publication of CN113722437B publication Critical patent/CN113722437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,提供了一种基于人工智能的用户标签识别方法、装置、设备及介质。所述方法包括:获取用户群的相关信息(如,线上医疗平台的行为信息)并构建用户群的拓扑网络,将拓扑网络输入图卷积神经网络后,计算拓扑网络的一阶、二阶相似矩阵及Dice相似度矩阵,从而计算得到拓扑网络的目标相似矩阵,基于目标相似矩阵计算得到拓扑网络的低维矩阵,将低维矩阵对应的第一类型节点作为样本集,训练图卷积神经网络得到目标分类模型,基于目标分类模型识别低维矩阵的第二类型节点,得到各第二类型节点对应用户的目标标签。本发明可以提高节点标签识别的准确性。本发明还涉及区块链技术领域,上述目标标签可以存储于一区块链的节点中。

Description

基于人工智能的用户标签识别方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的用户标签识别方法、装置、设备及存储介质。
背景技术
目前,现有的节点分类方法主要是基于矩阵分解的方法或基于随机游走的方法。基于矩阵分解的方法由于在矩阵分解过程中涉及到频繁的矩阵运算,导致了较高的系统资源和时间开销,因此不适用于大规模网络的节点分类任务。虽然基于随机游走的方法能够克服这一点,但是基于随机游走的方法主要面向网络的拓扑结构而忽略了节点的属性特征(例如,用户在线上医疗平台的行为属性信息等),从而造成信息利用不完全,影响节点分类识别的准确性。
发明内容
鉴于以上内容,本发明提供一种基于人工智能的用户标签识别方法、装置、设备及存储介质,其目的在于解决现有技术中节点分类识别准确性较低的问题。
为实现上述目的,本发明提供一种基于人工智能的用户标签识别方法,该方法包括:
从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络;
将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵;
基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵;
以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
优选的,所述拓扑网络的一个节点对应所述用户群的一个用户,相连的节点指示具有关联关系的用户。
优选的,所述Dice相似度矩阵的计算公式包括:
Figure BDA0003238138750000021
其中,
Figure BDA0003238138750000022
表示所述Dice相似度矩阵中第i行第j列的元素,|Com(vi,vj)|表示节点vi和节点vj公共邻居节点的数量,|Neighbor(vi)|表示节点vi的邻居节点数量,|Neighbor(vj)|表示节点vj的邻居节点数量。
优选的,所述目标相似矩阵的计算公式包括:
Figure BDA0003238138750000027
其中,S表示所述目标相似矩阵,Sfirst表示所述一阶相似矩阵,Ssecond表示所述二阶相似矩阵,SDice表示所述Dice相似度矩阵,η和
Figure BDA0003238138750000023
均表示预先设置的平衡系数。
优选的,所述低维矩阵的计算公式包括:
Figure BDA0003238138750000024
其中,H表示所述低维矩阵,σ()表示非线性激活函数,
Figure BDA0003238138750000025
表示对角矩阵,
Figure BDA0003238138750000026
A表示基于所述相关信息构建的所述拓扑网络的邻接矩阵,I表示所述邻接矩阵对应的自环矩阵,S表示所述目标相似矩阵,X表示预先构建的所述用户群的特征向量矩阵,W表示学习的权重矩阵。
优选的,所述一阶相似矩阵包括基于所述相关信息构建的所述拓扑网络的邻接矩阵,所述二阶相似矩阵包括所述一阶相似矩阵的余弦相似度矩阵。
优选的,所述目标分类模型的训练过程包括:
利用softmax函数计算得到所述低维矩阵中第一类型节点的预测标签,根据预设的损失函数计算出第一类型节点的预测标签,与第一类型节点对应的真实标签的总损失值,当所述总损失值小于预设阈值时,得到所述目标分类模型。
为实现上述目的,本发明还提供一种基于人工智能的用户标签识别装置,该基于人工智能的用户标签识别装置包括:
构建模块:用于从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络;
第一计算模块:用于将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵;
第二计算模块:用于基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵;
识别模块:用于以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的基于人工智能的用户标签识别方法的任意步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有基于人工智能的用户标签识别程序,所述基于人工智能的用户标签识别程序被处理器执行时,实现如上所述基于人工智能的用户标签识别方法的任意步骤。
本发明提出的基于人工智能的用户标签识别方法、装置、设备及存储介质,通过同时捕捉到网络节点间的低阶和高阶相似性,并利用捕捉到的节点相似性来指导卷积过程中的节点特征聚合,从而实现区分不同邻域节点重要性的功能,学习出融合了多种相似性的节点低维表示向量,解决了现有图卷积神经网络方法在特征聚合时不能有效区分不同邻接节点重要性的问题,提高了下游节点分类任务的准确率,其中低阶相似性包括网络的一阶相似性,高阶相似性包括Dice相似性和二阶相似性。基于学习到的低维矩阵,在反向传播优化下,针对所有带标签的节点计算交叉熵损失函数,以识别得到未知节点的标签,提高了节点标签识别准确性。
附图说明
图1为本发明基于人工智能的用户标签识别方法较佳实施例的流程图示意图;
图2为本发明基于人工智能的用户标签识别装置较佳实施例的模块示意图;
图3为本发明电子设备较佳实施例的示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于人工智能的用户标签识别方法。参照图1所示,为本发明基于人工智能的用户标签识别方法的实施例的方法流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。基于人工智能的用户标签识别方法包括:
步骤S10:从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络。
在本实施例中,可以从预设数据库(本地数据库或第三方数据库)获取用户群的相关信息(各用户的社交信息以及各用户的属性信息),用户属性信息中除了包括用户的个人资料信息(性别、职业等)之外,还可以包括用户在某平台(例如,线上医疗平台)的行为信息(例如,搜索过哪些医院或者药品、浏览或收藏过哪些医疗科普的文章等)。用户的社交信息不仅可以包括用户在医疗平台上的行为信息,还可以包括社交平台的好友关系、共同投资等,这些信息体现了用户之间的社交关系。其中,关注关系可以单向关注关系或者双向关注关系。
基于用户群中各用户的相关信息构建一个拓扑网络。其中,在该拓扑网络上,所述拓扑网络的一个节点对应所述用户群的一个用户,相连的节点指示具有关联关系的用户,即具有关联关系的用户之间通过一条边相连接。该拓扑网络可以抽象表示成一个连通图G=(V,E,X),V={v1,v2,…,vn}代表拓扑网络中的n个节点集合,E表示边的集合,eii=(vi,vj)∈E表示节点vi和vj间的边。X={x1,x2,…,xn},xi表示节点vi的特征向量。拓扑网络G的邻接矩阵A,A为n行n列的矩阵,如果节点vi和vj之间有连边,则Aij=1。
步骤S20:将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵。
在本实施例中,若拓扑网络中的两个节点存在直接连接的边,则表示这两个节点存在一阶相似度,若拓扑网络中的两个节点存在公共的邻居节点,则表示这两个节点存在二阶相似度。
将拓扑网络输入图卷积神经网络后,分别计算拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵,计算出来的多种相似性(例如,二阶相似性)在卷积操作中能够有效嵌入到节点的低维表示中,从而解决现有方法不能很好捕捉拓扑网络的多种相似性的问题。通过计算出拓扑网络的多种相似性矩阵,用于指导节点的特征聚合,从而实现区分不同邻域节点的重要性的功能。
其中,所述一阶相似矩阵包括基于所述相关信息构建的所述拓扑网络的邻接矩阵,所述二阶相似矩阵包括所述一阶相似矩阵的余弦相似度矩阵。
拓扑网络的一阶相似矩阵Sfirst可表示为:
Figure BDA0003238138750000051
二阶相似矩阵用一阶相似矩阵Sfirst的余弦相似度矩阵来表示。具体地,令:
Figure BDA0003238138750000052
表示vi与其它节点间的一阶相似度向量值,则vi和vj间的二阶相似度可以定义为:
Figure BDA0003238138750000053
之后,计算拓扑网络的Dice相似度矩阵,Dice相似度矩阵的计算公式包括:
Figure BDA0003238138750000054
其中,
Figure BDA0003238138750000055
表示所述Dice相似度矩阵中第i行第j列的元素,|Com(vi,vj)|表示节点vi和节点vj公共邻居节点的数量,|Neighbor(vi)|表示节点vi的邻居节点数量,|Neighbor(vj)|表示节点vj的邻居节点数量。
步骤S30:基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵。
在本实施例中,根据拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵,计算得到拓扑网络的目标相似矩阵。
具体地,所述目标相似矩阵的计算公式包括:
Figure BDA0003238138750000061
其中,S表示所述目标相似矩阵,Sfirst表示所述一阶相似矩阵,Ssecond表示所述二阶相似矩阵,SDice表示所述Dice相似度矩阵,η和
Figure BDA0003238138750000062
均表示预先设置的平衡系数。目标相似矩阵中两个节点间的相似度值代表两个节点间的重要程度。
之后将目标相似矩阵代入低维矩阵的计算公式,中得到拓扑网络的低维矩阵,具体地,所述低维矩阵的计算公式包括:
Figure BDA0003238138750000063
其中,H表示所述低维矩阵,σ()表示非线性激活函数,
Figure BDA0003238138750000064
表示对角矩阵,
Figure BDA0003238138750000065
A表示基于所述相关信息构建的所述拓扑网络的邻接矩阵,I表示所述邻接矩阵对应的自环矩阵,S表示所述目标相似矩阵,X表示预先构建的所述用户群的特征向量矩阵,W表示学习的权重矩阵。
步骤S40:以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
在本实施例中,第一类型节点是指已经标注了标签的用户,即该用户的真实标签,将低维矩阵中对应的第一类型节点作为样本集训练图卷积神经网络,得到目标分类模型,具体地,利用softmax函数计算得到所述低维矩阵中第一类型节点的预测标签,根据预设的损失函数计算出第一类型节点的预测标签,与第一类型节点对应的真实标签的总损失值,当所述总损失值小于预设阈值时,得到所述目标分类模型。
进一步地,当总损失值大于或等于预设阈值时,再利用softmax函数计算样本集中的第一类型节点的预测标签,根据预设的损失函数计算出第一类型节点的预测标签与对应的真实标签的损失值,直至达到停止训练的条件为止。其中,停止训练的条件可以为,损失函数的总损失值小于预设阈值或训练次数达到预设次数。基于学习到的低维矩阵,在反向传播优化下,针对所有带标签的节点计算损失函数,以训练得到目标分类模型。
得到目标分类模型之后,根据目标分类模型识别低维表示矩阵的第二类型节点,即拓扑网络中未知标签的节点(待识别的节点),得到各第二类型节点对应用户的目标标签。
在一个实施例中,预设的损失函数的计算公式包括:
Z=softmax(H)
Figure BDA0003238138750000071
其中,softmax为非线性激活函数,本方案的softmax采用Pytorch框架中的torch.nn.functional.log_softmax函数。YL表示第一类型节点的标签,F表示特征维度数量,Z表示softmax函数计算出的预测标签矩阵,Zlf表示矩阵Z中的第l行第f列对应的元素,Ylf表示所有节点的真实标签矩阵中第l行第f列对应的元素,L表示训练的损失值。
在一个实施例中,所述方法还包括:根据用户的目标标签,对不同标签的用户定向推荐相关的信息。
现有的信息推荐方案往往会根据客户的信息(例如,职业及兴趣等)来推荐特定用户感兴趣的信息(例如,健康管理类的文章、医疗的科普文章等等),通常具有相似兴趣或者职业类别的客户往往倾向于了解类似的信息,因此,根据用户的相关信息得到用户所属的类别或该客户的标签,可以实现更精准地推荐。
参照图2所示,为本发明基于人工智能的用户标签识别装置100的功能模块示意图。
本发明所述基于人工智能的用户标签识别装置100可以安装于电子设备中。根据实现的功能,所述基于人工智能的用户标签识别装置100可以包括构建模块110、第一计算模块120、第二计算模块130及识别模块140。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
构建模块110,用于从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络。
在本实施例中,可以从预设数据库(本地数据库或第三方数据库)获取用户群的相关信息(各用户的社交信息以及各用户的属性信息),用户属性信息中除了包括用户的个人资料信息(性别、职业等)之外,还可以包括用户在某平台(例如,线上医疗平台)的行为信息(例如,搜索过哪些医院或者药品、浏览或收藏过哪些医疗科普的文章等)。用户的社交信息不仅可以包括用户在医疗平台上的行为信息,还可以包括社交平台的好友关系、共同投资等,这些信息体现了用户之间的社交关系。其中,关注关系可以单向关注关系或者双向关注关系。
基于用户群中各用户的相关信息构建一个拓扑网络。其中,在该拓扑网络上,所述拓扑网络的一个节点对应所述用户群的一个用户,相连的节点指示具有关联关系的用户,即具有关联关系的用户之间通过一条边相连接。该拓扑网络可以抽象表示成一个连通图G=(V,E,X),V={v1,v2,…,vn}代表拓扑网络中的n个节点集合,E表示边的集合,eij=(vi,vj)∈E表示节点vi和vj间的边。X={x1,x2,…,xn},xi表示节点vi的特征向量。拓扑网络G的邻接矩阵A,A为n行n列的矩阵,如果节点vi和vj之间有连边,则Aij=1。
第一计算模块120,用于将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵。
在本实施例中,若拓扑网络中的两个节点存在直接连接的边,则表示这两个节点存在一阶相似度,若拓扑网络中的两个节点存在公共的邻居节点,则表示这两个节点存在二阶相似度。
将拓扑网络输入图卷积神经网络后,分别计算拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵,计算出来的多种相似性(例如,二阶相似性)在卷积操作中能够有效嵌入到节点的低维表示中,从而解决现有方法不能很好捕捉拓扑网络的多种相似性的问题。通过计算出拓扑网络的多种相似性矩阵,用于指导节点的特征聚合,从而实现区分不同邻域节点的重要性的功能。
其中,所述一阶相似矩阵包括基于所述相关信息构建的所述拓扑网络的邻接矩阵,所述二阶相似矩阵包括所述一阶相似矩阵的余弦相似度矩阵。
拓扑网络的一阶相似矩阵Sfirst可表示为:
Figure BDA0003238138750000091
二阶相似矩阵用一阶相似矩阵Sfirst的余弦相似度矩阵来表示。具体地,令:
Figure BDA0003238138750000092
表示vi与其它节点间的一阶相似度向量值,则vi和vj间的二阶相似度可以定义为:
Figure BDA0003238138750000093
之后,计算拓扑网络的Dice相似度矩阵,Dice相似度矩阵的计算公式包括:
Figure BDA0003238138750000094
其中,
Figure BDA0003238138750000095
表示所述Dice相似度矩阵中第i行第j列的元素,|Com(vi,vj)|表示节点vi和节点vj公共邻居节点的数量,|Neighbor(vi)|表示节点vi的邻居节点数量,|Neighbor(vj)|表示节点vj的邻居节点数量。
第二计算模块130:用于基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵。
在本实施例中,根据拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵,计算得到拓扑网络的目标相似矩阵。
具体地,所述目标相似矩阵的计算公式包括:
Figure BDA0003238138750000098
其中,S表示所述目标相似矩阵,Sfirst表示所述一阶相似矩阵,Ssecond表示所述二阶相似矩阵,SDice表示所述Dice相似度矩阵,η和
Figure BDA0003238138750000097
均表示预先设置的平衡系数。目标相似矩阵中两个节点间的相似度值代表两个节点间的重要程度。
之后将目标相似矩阵代入低维矩阵的计算公式,中得到拓扑网络的低维矩阵,具体地,所述低维矩阵的计算公式包括:
Figure BDA0003238138750000096
其中,H表示所述低维矩阵,σ()表示非线性激活函数,
Figure BDA0003238138750000101
表示对角矩阵,
Figure BDA0003238138750000102
A表示基于所述相关信息构建的所述拓扑网络的邻接矩阵,I表示所述邻接矩阵对应的自环矩阵,S表示所述目标相似矩阵,X表示预先构建的所述用户群的特征向量矩阵,W表示学习的权重矩阵。
识别模块140,用于以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
在本实施例中,第一类型节点是指已经标注了标签的用户,即该用户的真实标签,将低维矩阵中对应的第一类型节点作为样本集训练图卷积神经网络,得到目标分类模型,具体地,利用softmax函数计算得到所述低维矩阵中第一类型节点的预测标签,根据预设的损失函数计算出第一类型节点的预测标签,与第一类型节点对应的真实标签的总损失值,当所述总损失值小于预设阈值时,得到所述目标分类模型。
进一步地,当总损失值大于或等于预设阈值时,再利用softmax函数计算样本集中的第一类型节点的预测标签,根据预设的损失函数计算出第一类型节点的预测标签与对应的真实标签的损失值,直至达到停止训练的条件为止。其中,停止训练的条件可以为,损失函数的总损失值小于预设阈值或训练次数达到预设次数。基于学习到的低维矩阵,在反向传播优化下,针对所有带标签的节点计算损失函数,以训练得到目标分类模型。
得到目标分类模型之后,根据目标分类模型识别低维表示矩阵的第二类型节点,即拓扑网络中未知标签的节点(待识别的节点),得到各第二类型节点对应用户的目标标签。
在一个实施例中,预设的损失函数的计算公式包括:
Z=softmax(H)
Figure BDA0003238138750000103
其中,softmax为非线性激活函数,本方案的softmax采用Pytorch框架中的torch.nn.functional.log_softmax函数。YL表示第一类型节点的标签,F表示特征维度数量,Z表示softmax函数计算出的预测标签矩阵,Zlf表示矩阵Z中的第l行第f列对应的元素,Ylf表示所有节点的真实标签矩阵中第l行第f列对应的元素,L表示训练的损失值。
在一个实施例中,所述基于人工智能的用户标签识别装置100还包括推荐模块150,用于根据用户的目标标签,对不同标签的用户定向推荐相关的信息。
现有的信息推荐方案往往会根据客户的信息(例如,职业及兴趣等)来推荐特定用户感兴趣的信息(例如,健康管理类的文章、医疗的科普文章等等),通常具有相似兴趣或者职业类别的客户往往倾向于了解类似的信息,因此,根据用户的相关信息得到用户所属的类别或该客户的标签,可以实现更精准地推荐。
参照图3所示,为本发明电子设备1较佳实施例的示意图。
该电子设备1包括但不限于:存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络,获取原始数据。其中,所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobilecommunication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件,例如基于人工智能的用户标签识别程序10的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行基于人工智能的用户标签识别程序10的程序代码等。
显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-EmittingDiode,OLED)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面,例如显示数据统计的结果。
网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口),该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
图3仅示出了具有组件11-14以及基于人工智能的用户标签识别程序10的电子设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
该电子设备1还可以包括射频(Radio Frequency,RF)电路、传感器和音频电路等等,在此不再赘述。
在上述实施例中,处理器12执行存储器11中存储的基于人工智能的用户标签识别程序10时可以实现如下步骤:
从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络;
将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵;
基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵;
以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
所述存储设备可以为电子设备1的存储器11,也可以为与电子设备1通讯连接的其它存储设备。
关于上述步骤的详细介绍,请参照上述图2关于基于人工智能的用户标签识别装置100实施例的功能模块图以及图1关于基于人工智能的用户标签识别方法实施例的流程图的说明。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性的,也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有基于人工智能的用户标签识别程序10,所述基于人工智能的用户标签识别程序10被处理器执行时实现如下操作:
从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络;
将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵;
基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵;
以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
本发明之计算机可读存储介质的具体实施方式与上述基于人工智能的用户标签识别方法的具体实施方式大致相同,在此不再赘述。
本发明可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
在另一个实施例中,本发明所提供的基于人工智能的用户标签识别方法,为进一步保证上述所有出现的数据的私密和安全性,上述所有数据还可以存储于一区块链的节点中。例如相关信息及目标相似矩阵等,这些数据均可存储在区块链节点中。
需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,电子装置,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于人工智能的用户标签识别方法,其特征在于,所述方法包括:
从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络;
将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵;
基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵;
以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
2.如权利要求1所述的基于人工智能的用户标签识别方法,其特征在于,所述拓扑网络的一个节点对应所述用户群的一个用户,相连的节点指示具有关联关系的用户。
3.如权利要求1所述的基于人工智能的用户标签识别方法,其特征在于,所述Dice相似度矩阵的计算公式包括:
Figure FDA0003238138740000011
其中,
Figure FDA0003238138740000012
表示所述Dice相似度矩阵中第i行第j列的元素,|Com(vi,vj)|表示节点vi和节点vj公共邻居节点的数量,|Neighbor(vi)|表示节点vi的邻居节点数量,|Neighbor(vj)|表示节点vj的邻居节点数量。
4.如权利要求1所述的基于人工智能的用户标签识别方法,其特征在于,所述目标相似矩阵的计算公式包括:
Figure FDA0003238138740000013
其中,S表示所述目标相似矩阵,Sfirst表示所述一阶相似矩阵,Ssecond表示所述二阶相似矩阵,SDice表示所述Dice相似度矩阵,η和
Figure FDA0003238138740000014
均表示预先设置的平衡系数。
5.如权利要求1所述的基于人工智能的用户标签识别方法,其特征在于,所述低维矩阵的计算公式包括:
Figure FDA0003238138740000021
其中,H表示所述低维矩阵,σ()表示非线性激活函数,
Figure FDA0003238138740000022
表示对角矩阵,
Figure FDA0003238138740000023
A表示基于所述相关信息构建的所述拓扑网络的邻接矩阵,I表示所述邻接矩阵对应的自环矩阵,S表示所述目标相似矩阵,X表示预先构建的所述用户群的特征向量矩阵,W表示学习的权重矩阵。
6.如权利要求1所述的基于人工智能的用户标签识别方法,其特征在于,所述一阶相似矩阵包括基于所述相关信息构建的所述拓扑网络的邻接矩阵,所述二阶相似矩阵包括所述一阶相似矩阵的余弦相似度矩阵。
7.如权利要求1至6中任意一项所述的基于人工智能的用户标签识别方法,其特征在于,所述目标分类模型的训练过程包括:
利用softmax函数计算得到所述低维矩阵中第一类型节点的预测标签,根据预设的损失函数计算出第一类型节点的预测标签,与第一类型节点对应的真实标签的总损失值,当所述总损失值小于预设阈值时,得到所述目标分类模型。
8.一种基于人工智能的用户标签识别装置,其特征在于,所述装置包括:
构建模块:用于从预设数据库获取用户群的相关信息,基于所述相关信息构建所述用户群的拓扑网络;
第一计算模块:用于将所述拓扑网络输入图卷积神经网络,计算所述拓扑网络的一阶相似矩阵、二阶相似矩阵及Dice相似度矩阵;
第二计算模块:用于基于所述一阶相似矩阵、所述二阶相似矩阵及所述Dice相似度矩阵,计算得到所述拓扑网络的目标相似矩阵,基于所述目标相似矩阵计算得到所述拓扑网络的低维矩阵;
识别模块:用于以所述低维矩阵中已标注标签的第一类型节点作为样本集,训练所述图卷积神经网络得到目标分类模型,基于所述目标分类模型识别所述低维矩阵中未标注标签的第二类型节点,得到各第二类型节点对应用户的目标标签。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的基于人工智能的用户标签识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有基于人工智能的用户标签识别程序,所述基于人工智能的用户标签识别程序被处理器执行时,实现如权利要求1至7中任一项所述基于人工智能的用户标签识别方法的步骤。
CN202111009548.9A 2021-08-31 2021-08-31 基于人工智能的用户标签识别方法、装置、设备及介质 Active CN113722437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111009548.9A CN113722437B (zh) 2021-08-31 2021-08-31 基于人工智能的用户标签识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111009548.9A CN113722437B (zh) 2021-08-31 2021-08-31 基于人工智能的用户标签识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113722437A true CN113722437A (zh) 2021-11-30
CN113722437B CN113722437B (zh) 2023-06-23

Family

ID=78679413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111009548.9A Active CN113722437B (zh) 2021-08-31 2021-08-31 基于人工智能的用户标签识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113722437B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114266512A (zh) * 2022-02-28 2022-04-01 成都数之联科技股份有限公司 一种用户用能行为分析方法及系统及装置及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122455A (zh) * 2017-04-26 2017-09-01 中国人民解放军国防科学技术大学 一种基于微博的网络用户增强表示方法
US20210034737A1 (en) * 2019-07-30 2021-02-04 Sakif Hossain Khan Detection of adverserial attacks on graphs and graph subsets
CN112541904A (zh) * 2020-12-16 2021-03-23 西安电子科技大学 一种无监督遥感图像变化检测方法、存储介质及计算设备
CN112800234A (zh) * 2021-04-15 2021-05-14 腾讯科技(深圳)有限公司 信息处理方法、装置、电子设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122455A (zh) * 2017-04-26 2017-09-01 中国人民解放军国防科学技术大学 一种基于微博的网络用户增强表示方法
US20210034737A1 (en) * 2019-07-30 2021-02-04 Sakif Hossain Khan Detection of adverserial attacks on graphs and graph subsets
CN112541904A (zh) * 2020-12-16 2021-03-23 西安电子科技大学 一种无监督遥感图像变化检测方法、存储介质及计算设备
CN112800234A (zh) * 2021-04-15 2021-05-14 腾讯科技(深圳)有限公司 信息处理方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
解书颖: "基于节点表示的跨网络节点关联研究", 中国优秀硕士学位论文全文数据库信息科技辑, pages 139 - 79 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114266512A (zh) * 2022-02-28 2022-04-01 成都数之联科技股份有限公司 一种用户用能行为分析方法及系统及装置及介质

Also Published As

Publication number Publication date
CN113722437B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
WO2019169756A1 (zh) 产品推荐方法、装置及存储介质
CN110866181B (zh) 资源推荐的方法、装置及存储介质
CN108427708B (zh) 数据处理方法、装置、存储介质和电子装置
CN109284372B (zh) 用户操作行为分析方法、电子装置及计算机可读存储介质
CN106503269A (zh) 应用推荐的方法、装置及服务器
WO2020192013A1 (zh) 定向广告投放方法和装置、设备及存储介质
CN111667067A (zh) 基于图神经网络的推荐方法、装置和计算机设备
CN113626607B (zh) 异常工单识别方法、装置、电子设备及可读存储介质
CN111914159B (zh) 一种信息推荐方法及终端
CN113435202A (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
CN110852785B (zh) 用户分级方法、装置及计算机可读存储介质
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN114880566A (zh) 基于图神经网络的用户行为分析方法、装置、设备及介质
CN113656690B (zh) 产品推荐方法、装置、电子设备及可读存储介质
CN113722437B (zh) 基于人工智能的用户标签识别方法、装置、设备及介质
CN113420018A (zh) 用户行为数据分析方法、装置、设备及存储介质
CN111652282B (zh) 基于大数据的用户偏好分析方法、装置及电子设备
CN115712684B (zh) 一种物联网中物品动态信息的存储方法及系统
CN113706252B (zh) 产品推荐方法、装置、电子设备及存储介质
Kuo et al. Integration of artificial immune system and k-means algorithm for customer clustering
CN115860835A (zh) 基于人工智能的广告推荐方法、装置、设备及存储介质
CN115392361A (zh) 一种智能排序方法、装置、计算机设备及存储介质
CN112085566B (zh) 基于智能决策的产品推荐方法、装置及计算机设备
CN114219663A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN113761375A (zh) 基于神经网络的消息推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant