CN113065321B - 基于lstm模型和超图的用户行为预测方法及系统 - Google Patents

基于lstm模型和超图的用户行为预测方法及系统 Download PDF

Info

Publication number
CN113065321B
CN113065321B CN202110420046.9A CN202110420046A CN113065321B CN 113065321 B CN113065321 B CN 113065321B CN 202110420046 A CN202110420046 A CN 202110420046A CN 113065321 B CN113065321 B CN 113065321B
Authority
CN
China
Prior art keywords
node
user
neighborhood
cooperation
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110420046.9A
Other languages
English (en)
Other versions
CN113065321A (zh
Inventor
龙水彬
李荣华
秦宏超
王国仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202110420046.9A priority Critical patent/CN113065321B/zh
Publication of CN113065321A publication Critical patent/CN113065321A/zh
Application granted granted Critical
Publication of CN113065321B publication Critical patent/CN113065321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于LSTM模型和超图的用户行为预测方法及系统,涉及多人编辑协作技术领域,包括根据多个用户以及用户的交互关系构建用户协作超图;用户协作超图中的节点表示用户,超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为;基于用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;根据获取的当前阶段用户协作行为数据以及当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受。本发明能够达到预测多个用户行为的目的。

Description

基于LSTM模型和超图的用户行为预测方法及系统
技术领域
本发明涉及多人编辑协作技术领域,特别是涉及一种基于LSTM模型和超图的用户行为预测方法及系统。
背景技术
随着云存储系统技术的发展,有很多终端设备可以接入到云存储系统中。现有技术提供的各种同步网盘产品,可以将不同用户的终端设备与云存储系统的文件同步服务器相连,来帮助不同用户同时编辑同一篇文章。
在执行现有技术过程中,发明人发现:现有的二元结构图的边只能关联两个节点,即只能表示两个用户之间的协作关系,无法表达两个以上用户的协作行为。
发明内容
本发明的目的是提供一种基于LSTM模型和超图的用户行为预测方法及系统,以达到预测多个用户行为的目的。
为实现上述目的,本发明提供了如下方案:
一种基于LSTM模型和超图的用户行为预测方法,包括:
根据多个用户以及用户的交互关系,构建用户协作超图;所述用户协作超图中的节点表示用户,所述用户协作超图中的超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为;
基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;所述D邻域展开树包括根节点以及与所述根节点关联的其它节点;所述D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;
获取当前阶段用户协作行为数据;
根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受。
可选的,所述基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树,具体包括:
确定深度距离D;
基于所述深度距离D和所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;其中,一个所述D邻域展开树中关联不同的节点。
可选的,所述D邻域展开树中相邻层的节点和节点之间的距离为一条超边。
可选的,在执行所述根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受之前,还包括:
确定所述当前阶段用户协作行为数据关联的D邻域展开树的每个超边对应的特征向量。
可选的,所述根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受,具体包括:
根据根节点a建立的D邻域展开树Ta以及所述D邻域展开树Ta关联的D邻域展开树,以所述D邻域展开树Ta的超边对应的特征向量为输入,按D邻域展开树Ta的拓扑结构自底向上依次计算一遍基于LSTM构建的序列学习器的前向输出,得到关于根节点a的预测结果;所述根节点a为发送编辑行为的用户,或者称为当前阶段用户;所述预测结果包括接受和还原。
一种基于LSTM模型和超图的用户行为预测系统,包括:
用户协作超图构建模块,用于根据多个用户以及用户的交互关系,构建用户协作超图;所述用户协作超图中的节点表示用户,所述用户协作超图中的超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为;
D邻域展开树构建模块,用于基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;所述D邻域展开树包括根节点以及与所述根节点关联的其它节点;所述D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;
当前阶段用户协作行为数据获取模块,用于获取当前阶段用户协作行为数据;
预测模块,用于根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受。
可选的,所述D邻域展开树构建模块,具体包括:
深度距离D确定单元,用于确定深度距离D;
D邻域展开树构建单元,用于基于所述深度距离D和所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;其中,一个所述D邻域展开树中关联不同的节点。
可选的,所述D邻域展开树中相邻层的节点和节点之间的距离为一条超边。
可选的,还包括:
特征向量确定模块,用于确定所述当前阶段用户协作行为数据关联的D邻域展开树的每个超边对应的特征向量。
可选的,所述预测模块,具体包括:
预测单元,用于根据根节点a建立的D邻域展开树Ta以及所述D邻域展开树Ta关联的D邻域展开树,以所述D邻域展开树Ta的超边对应的特征向量为输入,按D邻域展开树Ta的拓扑结构自底向上依次计算一遍基于LSTM构建的序列学习器的前向输出,得到关于根节点a的预测结果;所述根节点a为发送编辑行为的用户,或者称为当前阶段用户;所述预测结果包括接受和还原。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明在超图这一全新数据结构上,使用超图的邻域展开算法,并基于序列学习器完成节点标签向量的预测工作,进而确定下一阶段用户编辑行为是否被接受。显然,本发明能够应用于多人编辑协作的用户行为预测上。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为原图G的示意图;
图2为关于节点a且D=2的展开树Ta的示意图;
图3为图预测模型的原理示意图;
图4为本发明基于LSTM模型和超图的用户行为预测方法的流程示意图;
图5为本发明超图的示意图;
图6为本发明关于节点a且D=1的超图展开树Ta的示意图;
图7为本发明序列学习器的原理示意图;
图8为本发明基于LSTM模型和超图的用户行为预测系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于LSTM模型和超图的用户行为预测方法及系统,以达到预测多个用户行为的目的。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
术语解释
超图为图论中的一种高维数据结构,由顶点和超边组成;超图H用有序二元组(V,E)表示,其中,V为超图中的顶点集合,E为超图中的超边集合;每条超边可关联2个及以上的顶点。
LSTM全称为长短期记忆网络(Long Short Term Memory networks,LSTM),是循环卷积网络(Recurrent Neural Network,RNN)的改进版,是常用于处理时间序列数据的神经网络。
混淆矩阵:在预测模型的评价中,预测模型预测的标签有“真”和“假”,实际真实情况也有“真”和“假”两种情况,基于预测模型和真实情况的“真、假”两个维度所构成的二维矩阵称作混淆矩阵,如表1所示。
表1混淆矩阵元素示意表
Figure BDA0003027476510000051
精确率:计算在预测情况为“真”的示例中有多少个预测对的(即有多少个真实结果也为“真”的),所占的比率,即精确率
Figure BDA0003027476510000052
召回率:计算在真实情况为“真”的实例中模型预测了多少个对的(即有多少个预测结果也为“真”的),所占的比率,即召回率
Figure BDA0003027476510000053
F1分数:用于衡量精确率和召回率的评价公式,即精确率越高、召回率越高则F1值越高,即F1分数
Figure BDA0003027476510000054
目前现有技术给出了在原图上分层使用LSTM预测模型来对节点的局部邻域进行分析推断,进而获取原图上的一些预测信息。其中,原图为G=(V,E),V是节点集合,E是边集合,每个边e∈E有M维特征向量g(e),每个节点v∈V也与一个标签向量相关联。
学习策略:将根据图结构和边集合的特征向量学习预测节点对应的标签向量。具体如下:
为了预测节点v的标签向量,选取某一合适的深度D(D>0),在原图G中从节点v的邻域按距离D展开得到以节点v为根的树Tv,在树Tv中从叶子节点开始自下而上分层使用序列学习器学习。其中,序列学习器作用于每个非叶子节点上,输入其子节点的标签向量以及它关联的边集合的特征向量并使用,输出学习的特征向量并传向父节点,层层传递最终得到根节点v的标签向量yv
而在原图G上基于节点v的D邻域为从节点v出发,所到达的所有距离不超过距离D的节点,并依据拓扑结构所构成的树Tv。其中节点v位于根,深度为0,对于树Tv中的边集合(u,w),假设节点u的深度d(u)小于节点w的深度d(w),则有d(w)=d(u)+1,且边集合(u,w)也真实存在于原图G中,而原图G中的一个节点可能对应展开树Tv中多个节点,此时将以重命名的方式展开,新节点也将继承原图节点的标签向量。图1为原图G,图2为关于节点a且D=2的展开树Ta
序列学习器是一种机器学习算法,可以接受任意长度的特征向量序列作为输入,并生成单个标签向量作为输出。现有技术使用的是长短期记忆网络LSTM,用L(W)表述,其中,参数向量W为序列学习器的参数。现有技术中将原图按深度D分层,分别使用L1,L2,...,LD进行训练学习,其中,Li负责汇总树中第i深度处的子级信息,并为第i-1深度处的父级Li-1提供一些计算信息,最终学习的信息按层级自下而上汇总到根节点中。对于所有深度1<d≤D的学习器,Ld可能出现多次(因为一个父亲节点下可能有多个子节点),这些Ld共享相同的参数,计算时在正向传播与反向传播中分别处理。
如图3所示,从叶子节点开始,学习器L2分别输入第3层节点所关联的边集合的特征向量,计算并输出对应的特征向量,即节点b输入g(b,e),g(b,c),输出f(b)并与g(a,b)共同作为输入提供给学习器L1,而节点c'和节点d也类似,最终学习器L1根据学习器L2的输入以及节点a所邻接的节点b、节点c'和节点d所关联边集合的特征向量,计算节点a的标签向量f(a)。
由于原图的边集合中的一条边只关联两个节点,而在超图的边集合中的一条超边可能关联两个或以上的节点,即超图的边集合是多元关系,所以上述图预测模型无法应用在超图这样的数据结构上,若将超图重新拆分成普通图,则存在代价过高且规模量大的缺陷,进而无法被接受。因此需要重新定义超图的展开树以及学习策略,以实现超图数据的预测问题。
实施例一
本发明实施例在超图这种多元边集关系的图数据结构上,基于超图节点的局部邻域信息和长短期记忆网络构建多层体系结构,使用机器学习算法完成预测问题。
如图4所示,本发明实施例提供的一种基于LSTM模型和超图的用户行为预测方法,包括如下步骤。
步骤400:根据多个用户以及用户的交互关系,构建用户协作超图;所述用户协作超图中的节点表示用户,所述用户协作超图中的超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为。
步骤410:基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;所述D邻域展开树包括根节点以及与所述根节点关联的子节点;所述D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;所述D邻域展开树中相邻层的节点和节点之间的距离为一条超边。
步骤410具体包括:确定深度距离D;基于所述深度距离D和所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;其中,一个所述D邻域展开树中关联不同的节点。
下面详细介绍下用户协作超图以及D邻域展开树。
定义用户协作超图H=(V,E)中的节点V代表用户,节点V的D邻域表示为节点V经过不超过D条超边可达的节点子图,在关系中代表这些用户短时间内同时编辑同一篇文章,用户协作超图中的超边则表示在协作关系中与超边关联的用户发生着信息编辑的交互。
基于节点v的D邻域展开树Tv,节点v为根节点,树中的d(1<d<D)层的节点y中与d-1层父节点x以及d+1层子节点z1,z2,...,zt相连,即y节点与d-1层的父节点x相距1条超边,y节点和每个子(即d+1层)节点z1,z2,...,zt也各相距1条超边,即D邻域展开树中只保证相邻层父节点和子节点的距离关系。由于超图存在多元关系,与传统图的v邻域树展开不同的是,在展开树中若该节点已经存在则不再新建复制节点。
如图5和图6所示,基于节点a的超图展开树Ta中,节点a为根节点,深度为1,超边中节点a相邻的节点为b,c,因此节点b,c的深度为1且与节点a相连,而节点c又分别于节点e,节点d,节点f相邻于不同超边中,因此节点d,节点e,节点f位于树中深度2的位置且与节点c相连。而每条超边有特征向量,即超边{a,b,c}的特征向量为g(a,b,c),超边{c,d,f}的特征向量为g(c,d,f),超边{c,e}的特征向量为g(c,e)。在展开树Ta中,每条超边可映射于原图H关联节点的一条超边并对应它的特征向量VF,特征向量来源于超边上的信息属性,其中,F为的特征向量。例如树中(a,b)和(a,c)对应特征向量g(a,b,c),边(c,d)和(c,f)对应特征向量g(c,d,f),边(c,e)特征向量对应g(c,e)。
步骤420:获取当前阶段用户协作行为数据。
步骤430:根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受。
在执行步骤430之前,还需要确定所述当前阶段用户协作行为数据关联的D邻域展开树的每个超边对应的特征向量;其中,每条超边关联着维度为F的特征向量,是通过用户历史30天编辑行为以及社区其他行为数据(编辑内容、编辑时长、访问频率等)和用户画像(内容质量、编写经历、性别、年龄、工作等特征)分析学习而来。
从节点a计算的超图展开树Ta依据邻域参数D使用LSTM构建的序列学习器L1,L2,...,LD分别用于树中1至D层的节点训练学习,其中,Li负责汇总树中第i深度处的子级信息,并为第i-1深度处的父级Li-1提供一些计算信息,第d层同层的多个兄弟节点共享序列学习器参数Wd,最终学习的信息按层级自下而上汇总到根节点中。最终根节点的序列学习器L1输出f(a)∈{T,F},即预测该用户未来编辑行为在与其它用户协作时“是”/“否”会被接受还是还原。
LSTM解决了长序列数据训练过程中梯度消失爆炸的问题。其计算通常包括输入门计算、记忆门(也称之为遗忘门)计算、单元状态计算以及隐藏状态向量计算四部分。
输入门计算公式为:f(t)=f(wf*Xi+Uf*h(t-1)+bf)。
记忆门计算公式为:i(t)=f(wi*Xi+Ui*h(t-1)+bi)。
单元状态计算公式为:m(t)=tanh(Wm*Xi+Um*h(t-1)+bm)。
隐藏状态向量计算公式为:h(t)=f(t)*h(t-1)+i(t)*m(t)。
其中,f(t)表示LSTM编码器第t个数据节点的输入门;i(t)表示LSTM编码器第t个数据节点的记忆门;m(t)表示LSTM编码器第t个数据节点的单元状态(也称之为候选隐藏状态);h(t)表示LSTM编码器第t个数据节点的隐藏状态向量;h(t-1)表示LSTM编码器第t-1个数据节点的隐藏状态向量;f表示非线性激活函数,可以基于实际的需求选取合适的非线性激活函数,例如sigmoid函数。wf和Uf表示输入门的权重矩阵;bf表示输入门的偏置项。wi和Ui表示记忆门的权重矩阵;bi表示记忆门的偏置项;Wm和Um表示单元状态的权重矩阵;bm表示单元状态的偏置项;tanh为一个曲面正切函数。
前向传播时,按深度从叶子节点向根节点进行传播。如图7所示,在深度2位置节点c的序列学习器L2接收超边{c,e}、{c,d,f}的特征向量g(c,e)和g(c,d,f)作为输入,计算并输出f(c),并和超边{a,b,c}的特征向量g(a,b,c)连接一并作为序列学习器L1的输入,最终计算并输出f(a)完成一次前向传播的过程。在反向传播时,按照树Ta的拓扑结构从根节点a开始向下传播依次计算每层学习器的损失函数。对于深度1<d<D的节点u根据该层序列学习器Ld的输出f(u),基于子节点v1,v2,...,vm计算
Figure BDA0003027476510000091
并将损失结果传播到v中用以计算d+1层节点的损失,直到叶子节点为止。对于1≤d≤D每层序列学习器Ld的学习参数Wd的变化ΔWd是基于该层的节点v1,v2,...,vm的损失均值即ΔWd=(Δ12+...+Δm)/m,其中Δi来自于vi节点的损失值,在LSTM模型的实际经验上训练迭代到100代左右可使得损失值稳定在设定的∈<10-3阈值内。
在模型训练中,将收集到的海量标记数据的60%作为训练集,其余40%作为测试集,训练过程中每次前向传播计算根节点u输出f(u),再从根节点反向传播计算每个序列学习器的损失项并更新参数,并根据预测结果的召回率和F1分数来验证并改善该模型。在后续的预测工作中,当这些用户再次编辑修改文章时,对应的超边特征向量也会发生变化(例如当节点a修改并提交文章时,根据该节点的修改内容和历史行为信息,超边{a,b,c}上的特征向量g(a,b,c)也会有相应变化),预测时以超边上特征向量作为输入,按超图展开树Ta的拓扑结构自底向上依次算一遍模型网络的前向输出,最终得到关于节点a本次编辑未来被“接收”还是“拒绝”的预测结果f(a)。
实施例二
为实现上述目的,本发明实施例还提供了一种基于LSTM模型和超图的用户行为预测系统,如图8所示,包括:
用户协作超图构建模块800,用于根据多个用户以及用户的交互关系,构建用户协作超图;所述用户协作超图中的节点表示用户,所述用户协作超图中的超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为。
D邻域展开树构建模块810,用于基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;所述D邻域展开树包括根节点以及与所述根节点关联的其它节点;所述D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;所述D邻域展开树中相邻层的节点和节点之间的距离为一条超边。
当前阶段用户协作行为数据获取模块820,用于获取当前阶段用户协作行为数据。
预测模块830,用于根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受。
其中,所述D邻域展开树构建模块810,具体包括:深度距离D确定单元,用于确定深度距离D;D邻域展开树构建单元,用于基于所述深度距离D和所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;其中,一个所述D邻域展开树中关联不同的节点。
本发明实施例提供的系统还包括:特征向量确定模块,用于确定所述当前阶段用户协作行为数据关联的D邻域展开树的每个超边对应的特征向量。
所述预测模块830,具体包括:预测单元,用于根据根节点a建立的D邻域展开树Ta以及所述D邻域展开树Ta关联的D邻域展开树,以所述D邻域展开树Ta的超边对应的特征向量为输入,按D邻域展开树Ta的拓扑结构自底向上依次计算一遍基于LSTM构建的序列学习器的前向输出,得到关于根节点a的预测结果;所述根节点a为发送编辑行为的用户,或者称为当前阶段用户;所述预测结果包括接受和还原
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种基于LSTM模型和超图的用户行为预测方法,其特征在于,包括:
根据多个用户以及用户的交互关系,构建用户协作超图;所述用户协作超图中的节点表示用户,所述用户协作超图中的超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为;
基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;所述D邻域展开树包括根节点以及与所述根节点关联的其它节点;所述D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;基于节点v的D邻域展开树Tv,节点v为根节点,树中的d层的节点y中与d-1层父节点x以及d+1层子节点z1,z2,...,zt相连,y节点与d-1层的父节点x相距1条超边,y节点和每个子节点z1,z2,...,zt也各相距1条超边,D邻域展开树中只保证相邻层父节点和子节点的距离关系,1<d<D;
获取当前阶段用户协作行为数据;
根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受;
在执行所述根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受之前,还包括:
确定所述当前阶段用户协作行为数据关联的D邻域展开树的每个超边对应的特征向量;
所述根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受,具体包括:
根据根节点a建立的D邻域展开树Ta以及所述D邻域展开树Ta关联的D邻域展开树,以所述D邻域展开树Ta的超边对应的特征向量为输入,按D邻域展开树Ta的拓扑结构自底向上依次计算一遍基于LSTM构建的序列学习器的前向输出,得到关于根节点a的预测结果;所述根节点a为发送编辑行为的用户,或者称为当前阶段用户;所述预测结果包括接受和还原。
2.根据权利要求1所述的一种基于LSTM模型和超图的用户行为预测方法,其特征在于,所述基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树,具体包括:
确定深度距离D;
基于所述深度距离D和所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;其中,一个所述D邻域展开树中关联不同的节点。
3.一种基于LSTM模型和超图的用户行为预测系统,其特征在于,包括:
用户协作超图构建模块,用于根据多个用户以及用户的交互关系,构建用户协作超图;所述用户协作超图中的节点表示用户,所述用户协作超图中的超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为;
D邻域展开树构建模块,用于基于所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;所述D邻域展开树包括根节点以及与所述根节点关联的其它节点;所述D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;基于节点v的D邻域展开树Tv,节点v为根节点,树中的d层的节点y中与d-1层父节点x以及d+1层子节点z1,z2,...,zt相连,y节点与d-1层的父节点x相距1条超边,y节点和每个子节点z1,z2,...,zt也各相距1条超边,D邻域展开树中只保证相邻层父节点和子节点的距离关系,1<d<D;
当前阶段用户协作行为数据获取模块,用于获取当前阶段用户协作行为数据;
预测模块,用于根据所述当前阶段用户协作行为数据以及所述当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受;
特征向量确定模块,用于确定所述当前阶段用户协作行为数据关联的D邻域展开树的每个超边对应的特征向量;
所述预测模块,具体包括:
预测单元,用于根据根节点a建立的D邻域展开树Ta以及所述D邻域展开树Ta关联的D邻域展开树,以所述D邻域展开树Ta的超边对应的特征向量为输入,按D邻域展开树Ta的拓扑结构自底向上依次计算一遍基于LSTM构建的序列学习器的前向输出,得到关于根节点a的预测结果;所述根节点a为发送编辑行为的用户,或者称为当前阶段用户;所述预测结果包括接受和还原。
4.根据权利要求3所述的一种基于LSTM模型和超图的用户行为预测系统,其特征在于,所述D邻域展开树构建模块,具体包括:
深度距离D确定单元,用于确定深度距离D;
D邻域展开树构建单元,用于基于所述深度距离D和所述用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;其中,一个所述D邻域展开树中关联不同的节点。
CN202110420046.9A 2021-04-19 2021-04-19 基于lstm模型和超图的用户行为预测方法及系统 Active CN113065321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110420046.9A CN113065321B (zh) 2021-04-19 2021-04-19 基于lstm模型和超图的用户行为预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110420046.9A CN113065321B (zh) 2021-04-19 2021-04-19 基于lstm模型和超图的用户行为预测方法及系统

Publications (2)

Publication Number Publication Date
CN113065321A CN113065321A (zh) 2021-07-02
CN113065321B true CN113065321B (zh) 2022-09-13

Family

ID=76567160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110420046.9A Active CN113065321B (zh) 2021-04-19 2021-04-19 基于lstm模型和超图的用户行为预测方法及系统

Country Status (1)

Country Link
CN (1) CN113065321B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971733A (zh) * 2021-10-29 2022-01-25 京东科技信息技术有限公司 一种基于超图结构的模型训练方法、分类方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894502B (zh) * 2016-03-30 2019-10-11 浙江大学 基于超图模型的rgbd图像显著性检测方法
CN112417219B (zh) * 2020-11-16 2022-07-01 吉林大学 基于超图卷积的超边链接预测方法

Also Published As

Publication number Publication date
CN113065321A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
US11880959B2 (en) Method for point cloud up-sampling based on deep learning
Adeli et al. Dynamic fuzzy wavelet neural network model for structural system identification
CN114503121A (zh) 资源约束的神经网络架构搜索
CN111737535B (zh) 一种基于元结构和图神经网络的网络表征学习方法
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
CN111506814B (zh) 一种基于变分自注意力网络的序列推荐方法
CN112184391A (zh) 一种推荐模型的训练方法、介质、电子设备和推荐模型
Khan et al. Evolving a psycho-physical distance metric for generative design exploration of diverse shapes
US20220114289A1 (en) Computer architecture for generating digital asset representing footwear
CN115797606B (zh) 基于深度学习的3d虚拟数字人交互动作生成方法及系统
CN112667920A (zh) 基于文本感知的社交影响力预测方法、装置及设备
CN116186390A (zh) 一种融合超图的对比学习会话推荐方法
CN116956116A (zh) 文本的处理方法和装置、存储介质及电子设备
CN113065321B (zh) 基于lstm模型和超图的用户行为预测方法及系统
Du et al. Image recommendation algorithm combined with deep neural network designed for social networks
Chen et al. Deciphering the noisy landscape: Architectural conceptual design space interpretation using disentangled representation learning
Dehbi et al. Learning grammar rules of building parts from precise models and noisy observations
Leon-Garza et al. A type-2 fuzzy system-based approach for image data fusion to create building information models
Hu Functional-link nets with genetic-algorithm-based learning for robust nonlinear interval regression analysis
Chaudhari et al. Evaluating designer learning and performance in interactive deep generative design
Piccolotto et al. Visual parameter space exploration in time and space
Zhang et al. RSVRs based on feature extraction: a novel method for prediction of construction projects’ costs
Mirra et al. Exploring a design space of shell and tensile structures generated by AI from historical precedents
CN116467466A (zh) 基于知识图谱的编码推荐方法、装置、设备及介质
CN116302088A (zh) 一种代码克隆检测方法、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant