CN108804633A - 基于行为语义知识网络的内容推荐方法 - Google Patents

基于行为语义知识网络的内容推荐方法 Download PDF

Info

Publication number
CN108804633A
CN108804633A CN201810555990.3A CN201810555990A CN108804633A CN 108804633 A CN108804633 A CN 108804633A CN 201810555990 A CN201810555990 A CN 201810555990A CN 108804633 A CN108804633 A CN 108804633A
Authority
CN
China
Prior art keywords
node
project
network
behavior
semantic knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810555990.3A
Other languages
English (en)
Other versions
CN108804633B (zh
Inventor
陈磊
胡澜涛
张博
林乐宇
冯喆
饶君
刘书凯
刘毅
丘志杰
孙振龙
王良栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810555990.3A priority Critical patent/CN108804633B/zh
Publication of CN108804633A publication Critical patent/CN108804633A/zh
Application granted granted Critical
Publication of CN108804633B publication Critical patent/CN108804633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于行为语义知识网络的内容推荐方法、计算机设备及存储介质,该基于行为语义知识网络的内容推荐方法包括:获取各用户标识关联的项目行为数据以及各项目行为数据对应项目的属性特征数据;基于各项目行为数据以及属性特征数据,确定行为语义知识网络;获取目标推荐用户标识关联的特征数据;基于特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点;将行为语义知识网络中,与对应于特征数据的节点相似的网络节点对应标示的内容,确定为目标推荐用户标识对应的待推荐内容;向目标推荐用户标识推荐待推荐内容。基于本方法可提高推荐准确性。

Description

基于行为语义知识网络的内容推荐方法
技术领域
本申请涉及数据处理技术领域,特别涉及一种基于行为语义知识网络的内容推荐方法、计算机设备及存储介质。
背景技术
随着互联网技术的发展,涌现了大量的应用程序,为用户提供了便利。例如,社交应用,为用户之间的交流提供了便利,视频应用,为用户观看视频提供了便利。
目前,应用程序一般会有推荐功能,即为用户推荐其可能感兴趣的内容。常用的推荐方法有基于协同过滤算法的推荐方法,然而,该推荐方法主要将单一数据作为推荐依据,进行相似计算从而实现推荐,其相似结果中可能出现一些与目标推荐用户标识不相关的推荐结果,即导致推荐不准确。
发明内容
基于此,有必要针对现有推荐不准确的问题,提出一种基于行为语义知识网络的内容推荐方法、计算机设备及存储介质。
一种行为语义知识网络确定方法,包括步骤:
获取各用户标识关联的项目行为数据以及各项目行为数据对应项目的属性特征数据;
基于各项目行为数据以及对应的属性特征数据,确定行为语义知识网络,行为语义知识网络包括各网络节点以及网络节点关联关系;各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据,或各网路节点包括标示对应的项目行为数据对应项目的各项目节点以及标示对应的属性特征数据的各属性节点;
获取目标推荐用户标识关联的特征数据;
基于特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点;
将行为语义知识网络中,与对应于特征数据的节点相似的网络节点对应标示的内容,确定为目标推荐用户标识对应的待推荐内容;
将待推荐内容推荐给目标推荐用户标识。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
上述基于行为语义知识网络的内容推荐方法、计算机设备及存储介质,基于各项目行为数据以及各项目行为数据对应项目的属性特征数据,建立各网络节点以及网络节点关联关系,确定行为语义知识网络。其中,项目行为数据可准确反映用户对项目的行为,属性特征数据可准确反应该项目的特点,行为语义知识网络中的网络节点考虑了各项目行为数据以及项目的属性特征数据,各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据,或各网路节点包括标示对应的项目行为数据对应项目的各项目节点以及标示对应的属性特征数据的各属性节点。网络关联关系基于项目行为数据对应项目与其对应的属性特征数据建立,可使行为语义知识网络能准确表征各项目之间以及各项目与其属性特征数据之间的关系,使行为语义知识网络能准确反映各用户的行为情况、行为数据中项目的属性特征以及两者之间的关系。基于对应于目标推荐用户标识关联的特征数据的节点以及行为语义知识网络,可准确确定与对应于特征数据的节点相似的网络节点对应标示的内容,从而可准确确定目标推荐用户标识对应的待推荐内容并推荐给目标推荐用户标识对应的用户,可提高推荐准确性。
附图说明
图1为一个实施例中推荐项目确定方法的应用环境图;
图2为一个实施例的行为语义知识网路确定方法的流程示意图;
图3为一个实施例的推荐内容确定方法中确定行为语义知识网络的方式的子流程示意图;
图4为一个实施例的知识图谱结构示意图;
图5为一个实施例的项目属性网络结构示意图;
图6为一个实施例的项目行为网络结构示意图;
图7为一个实施例的行为语义知识网络结构示意图;
图8为一个实施例中行为语义知识网络中各节点的向量确定原理图;
图9为Skip-Gram方法的原理图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本申请,并不限定本申请的保护范围。
本申请提供的推荐项目确定方法,可应用于如图1示所示的应用环境图。如图1所示,终端10与服务器20通过网络进行通信。服务器20可通过获取行为语义知识网络中各节点分别对应的向量,获取目标推荐用户标识关联的特征数据,并基于特征数据以及各节点分别对应的向量,确定目标推荐用户标识对应的待推荐项目,向目标推荐用户标识对应的终端10推送待推荐项目,实现推荐。终端10获取服务器20推送的待推荐项目,可执行相应操作。例如,在获取到服务器20推送的视频时,在终端10,可对视频进行播放操作,实现对视频的播放。
该终端10可以是任何一种能够实现智能输入输出的设备,例如,台式电脑或移动终端,移动终端可以是智能手机、平板电脑、车载电脑、穿戴式智能设备等。服务器20可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,提供一种实施例的行为语义知识网络确定方法,以应用于图1中的服务器20为例进行说明,包括步骤S210至步骤S260。
S210:获取各用户标识关联的项目行为数据以及各项目行为数据对应项目的属性特征数据。
用户关联的项目行为数据表示用户标识针对该项目进行某个行为产生的行为数据,即可以理解为用户行为数据或对项目的行为数据,可反映用户对项目的行为。例如,用户A对项目a进行了某种行为(阅读或播放等)产生用户A关联的对该项目a的行为数据,对项目b进行某种行为(阅读或播放等)产生用户A关联的对该项目b的行为数据,用户B对项目b进行了某种行为(阅读或播放等)产生用户B关联的对该项目b对应的行为数据。形式可表示为<A,{a,b}>,即表示用户A产生的行为数据中包括项目a和项目b。用户B对项目c进行了某种行为(阅读或播放等)产生用户B关联的对该项目c对应的行为数据,则用户A关联的各项目行为数据包括用户A分别对项目a和b的行为数据,用户B关联的各项目项目行为数据包括用户B分别对项目b和c的行为数据。根据用户标识关联的项目行为数据,可确定用户标识关联的项目,例如,可确定用户A关联项目a和b。一个用户标识关联的项目行为数据中可以包括多个项目,即上述各用户标识关联的项目行为数据可分别包括多个项目。另外,项目行为数据中还可记录项目对应的行为时间,通过该行为时间可知用户对该项目进行行为的时间,即可获知其中各项目的行为顺序。
属性特征数据为表征对象特点的数据,即对象具有的性质,项目的属性特征数据即为表征项目特点的数据。在一个示例中,项目的属性特征数据可以包括实体(Entity)、关键词(用于表示项目核心内容的词,例如,对于文章项目,可以从文章正文、标题中抽取表示该文章核心内容的一组词)、类目(用于区分类别)以及媒体标识(即该项目的上传者或发送者)等。其中,实体,具有唯一指向性,可区分可识别的事务,也叫命名实体(Named Entity),可以是人名、机构名、地名以及其他所有以名称为标识的实体,更广泛的实体还包括数字、日期、货币、地址等。在本实施例中,实体可以包括人名、地名以及机构名。项目可以理解为一系列数据的集合,例如,可以是文章(文字的集合)、视频(图像信息的集合)等。在一个示例中,可通过项目的名称表示该项目,即上述项目可以是项目的名称,例如,一篇文章的标题,一个视频的名称等。
S220:基于各项目行为数据以及属性特征数据,确定行为语义知识网络,行为语义知识网络包括各网络节点以及网络节点关联关系。
各项目行为数据以及各项目对应的属性特征数据确定后,可基于各项目行为数据以及各项目对应的属性特征数据建立各网络节点以及网络节点关联关系,以确定行为语义知识网络。亦即是说,行为语义知识网络中的各网络节点是与项目行为数据对应的项目和该项目对应的属性特征数据相关的。另外,还基于上述数据建立各网络节点的关联关系,即网络节点不是孤立的节点,存在关联关系。其中,网络节点关联关系基于各项目行为数据以及属性特征数据确定。
其中,各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据,即每个网络节点不但标示了项目还标示了对应的属性特征数据,即一个项目与其对应的属性特征数据对应一个网络节点。
具体地,每个网络节点标示了不同的项目行为数据对应的项目以及与该项目对应的属性特征数据,即一个项目行为数据对应的项目与该项目对应的属性特征数据可同时对应于一个网络节点。若获知一个项目对应的网络节点,根据该网络节点标示的内容即可快速获知该项目对应的属性特征数据。若获知属性特征数据的网络节点,根据该网络节点标示的内容即可快速获知该属性特征数据对应的项目。
或者,各网路节点包括各项目行为数据对应项目的项目节点以及各项目的属性特征数据对应的属性节点,各项目节点分别标示对应的项目行为数据对应项目,各属性节点分别标示对应的属性特征数据。即一个网络节点对应一个数据,项目或属性特征数据。
即项目与属性特征数据分开对应于不同网络节点,一个项目节点标示一个对应的项目,一个属性节点标示一个属性特征数据。项目对应的项目节点与该项目对应的属性特征数据对应的属性节点之间存在关联关系,且项目对应的项目节点之间的关联关系基于项目行为数据确定。在获知项目对应的项目节点之后,可根据上述网络节点关联关系,获知与该项目节点相似的项目节点或属性节点。
S230:获取目标推荐用户标识关联的特征数据。
目标推荐用户标识表示等待推荐并可接收推荐项目的用户标识。特征数据可反映目标推荐用户标识的特点,具体可反映目标推荐用户的静态特点或/和动态特点。
服务器中记录有不同用户关联的特征数据,在一个示例中,服务器可主动向用户进行内容推荐,此时,获取目标推荐用户标识关联的特征数据即可。在另一个示例中,服务器可基于用户发送的内容推荐请求进行内容推荐,具体地,接收内容推荐请求,内容推荐请求可以包括目标推荐用户标识,如此,可基于该目标推荐用户标识,获取其对应的特征数据。
S240:基于特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点。
基于各项目行为数据以及各项目的属性特征数据已确定行为语义知识网络,在需要进行内容推荐时,首先基于待推荐用户标识的特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点(即行为语义知识网络中各网络节点中与特征数据相关的节点),可以理解,该特征数据中存在属于行为语义知识网络中对应于特征数据的节点对应标示的内容中的数据。例如,该特征数据中包括电影A,即表示该目标推荐用户对该电影A进行了某种行为继而产生了对该电影A的行为数据,在行为语义知识网络的各网络节点中存在内容为该电影A的网络节点,该网络节点则可以作为对应于特征数据的节点。
S250:将行为语义知识网络中,与对应于特征数据的节点相似的网络节点对应标示的内容,确定为目标推荐用户标识对应的待推荐内容。
在行为语义知识网络中确定与对应于特征数据的节点后,由于与对应于特征数据的节点是根据目标推荐用户标识的特征数据确定的,与目标推荐用户标识关联,将从行为语义知识网络中,与对应于特征数据的节点相似的网络节点对应标示的内容作为目标推荐用户标识对应的待推荐内容,即确定待推荐内容过程中既考虑了项目行为数据,又考虑了属性特征数据,可提高待推荐项目的准确性。
S260:向目标推荐用户标识推荐待推荐内容。
在确定待推荐内容后,即可向目标推荐用户标识对应目标推荐用户推荐待推荐内容,目标推荐用户可对待推荐内容进行相应的行为,例如,针对视频推荐内容,可进行播放行为,实现对推荐的视频的播放。在一个示例中,该目标推荐用户可以是终端用户,也可以是应用程序内容提供商。
上述推荐项目确定方法,基于各项目行为数据以及各项目行为数据对应项目的属性特征数据,建立各网络节点以及网络节点关联关系,确定行为语义知识网络。其中,项目行为数据可准确反映用户对项目的行为,属性特征数据可准确反应该项目的特点,行为语义知识网络中的网络节点考虑了各项目行为数据以及项目的属性特征数据,各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据,或各网路节点包括标示对应的项目行为数据对应项目的各项目节点以及标示对应的属性特征数据的各属性节点。网络关联关系基于项目行为数据对应项目与其对应的属性特征数据建立,可使行为语义知识网络能准确表征各项目之间以及各项目与其属性特征数据之间的关系,使行为语义知识网络能准确反映各用户的行为情况、行为数据中项目的属性特征以及两者之间的关系。基于对应于目标推荐用户标识关联的特征数据的节点以及行为语义知识网络,可准确确定与对应于特征数据的节点相似的网络节点对应标示的内容,从而可准确确定目标推荐用户标识对应的待推荐内容并推荐给目标推荐用户标识对应的用户,可提高推荐准确性。
如图3所示,在一个实施例中,确定行为语义知识网络的方式包括:
S321:基于各项目行为数据以及对应的属性特征数据,确定项目属性网络;
S321:基于各项目行为数据,确定项目行为网络;
S321:基于项目属性网络与项目行为网络的相同项目,关联项目属性网络与项目行为网络,确定行为语义知识网络。
即在本实施例中,各网络节点包括各项目节点以及各属性节点。项目属性网络包括上述各项目节点、上述各属性节点以及各项目节点分别与对应属性特征数据对应的属性节点之间的关联关系,项目行为网络包括各项目节点,以及各项目节点之间的关联关系。项目属性网络与项目行为网络之间存在项目的关联,若项目属性网络与项目行为网络之间存在相同项目(对应相同项目节点),则可通过相同项目即可将项目属性网络与知识图谱进行关联,如此,可实现项目属性网络和项目行为网络的关联,得到行为语义知识网络。
例如,在项目属性网络中,包括项目X1、项目X1对应的属性特征(关键词为G1、实体为S1、类目为L1以及媒体标识为M1)、项目X2、项目2对应的属性特征(关键词为G2、实体为S2、类目为L2以及媒体标识为M2),项目X3、项目3对应的属性特征(关键词为G3、实体为S3、类目为L3以及媒体标识为M3)。在项目行为网络中,包括项目X1、项目X2、项目X3以及项目X1和项目X2之间的对应关系。如此,项目属性网络与项目行为网络中存在的相同项目为项目X1、项目X2和项目X3,通过项目X1、项目X2和项目X3可关联项目属性网络与项目行为网络,从而,得到行为语义知识网络。
在一个实施例中,基于各项目行为数据,确定项目行为网络,包括:根据预设网络构建条件,基于各项目行为数据,确定项目行为网络。
确定项目行为网络主要是根据各项目行为数据确定各项目之间的对应关系,例如,用户A关联的项目行为数据中有项目X1和项目X2,需要确定项目X1和项目X2之间是否存在某种关联关系,如何确定是否存在关联关系,则是根据预设网络构建条件确定,可以理解,在项目之间满足预设网络构建条件时,认为项目之间存在关联关系,否则不存在关联关系。
在一个实施例中,基于各项目行为数据,确定项目行为网络,包括:基于各项目行为数据对应项目,建立各项目节点;在同一用户关联的项目行为数据对应项目之间的属性特征数据中的类目相同,且项目之间的行为顺序差小于预设差值时,建立该项目之间的关联关系。
首先,基于各项目行为数据对应项目,建立各项目节点,即建立的项目节点与项目对应,项目的数量(同一项目的数量为1,即不同用户对相同项目进行了相关行为,则该项目的数量仍然为1)与项目节点的数量相同。例如,用户A关联的各项目行为数据中涉及项目a和项目b,用户B关联的各项目行为数据中涉及项目b和项目c,若根据用户A和用户B关联的项目行为数据建立项目行为网络,则首先基于项目a、项目b和项目c建立三个项目节点(项目b是用户A和用户B进行的相同项目)。
建立项目节点之后,则需要建立项目节点之间的关联关系。然而,不是每个项目节点和其他所有项目节点之间都有关联关系,满足预设网络构建条件的两个项目节点之间才建立关联关系。可以理解,项目行为网络中项目节点之间的关联关系的预设网络构建条件为在同一用户关联的项目之间的属性特征数据中的类目相同,且项目之间的行为顺序差小于预设差值。得到的项目行为网络中存在关联关系的两个项目节点之间对应的属相特征数据中类目相同,且两个项目节点对应的项目进行行为的顺序差小于预设差值,项目行为网络表征了项目之间的关联关系。
在本实施例中,属性特征数据包括类目,类目用于区别不同的类别,即通过类目可区别项目的类别,各项目对应的类目可预先确定。例如,一个视频项目,其类目为体育类视频。项目之间的行为顺序,指同一用户下关联的项目对应的行为时间先后顺序(行为时间指对项目进行某种行为的时间),例如,用户A关联的项目X1、项目X2和项目X3,均为视频项目,且类目均相同,其先对项目X1进行播放,后对项目X2进行播放,再对项目X3进行播放,则用户A对项目X1、项目X2和项目X3的行为顺序依次为项目X1、项目X2和项目X3。项目X1和项目X2的顺序是相邻的,顺序差为1,若预设差值为5,则满足顺序差小于5,且项目X1和项目X2之间可以建立关联关系。项目X2和项目X2的顺序是相邻的,顺序差为1,则满足顺序差小于5,且项目X2和项目X3之间可以建立关联关系,项目X1和项目X3之间的顺序差为2,若预设差值为5,则满足顺序差小于5,且项目X1和项目X3之间可以建立关联关系。若项目X1和项目X2的类目相同,均为体育类视频,而X3的类目与项目X1的类目不同,为娱乐类视频,即使项目X1和项目X3、项目X2和项目X3之间的顺序差均满足小于预设差值,但类目不同,不能建立关联关系,此时,只建立项目X1和项目X2之间的关联关系。
即在本实施例中,在确定项目行为网络过程中,考虑了项目的行为顺序,项目属性网络考虑了项目的属性特征数据,如此,行为语义知识网络即蕴含了行为数据中的项目之间的关联性,又具备了项目语义上的相似性,如此可提高行为语义知识网络的准确性,从而可为推荐过程提供准确依据,以提高后续推荐准确性。
在一个实施例中,建立该项目之间的关联关系之后,还包括:将项目行为网络中相邻的两个项目之间的距离设置为预设值;将项目行为网络中相邻的两个项目之间的权重,设置为各用户对应的该相邻的两个项目之间的初始权重之和。
以上述用户A的项目X1、项目X2和项目X3中两两之间均建立有关联关系为例,由于在建立项目行为网络过程中,不止用到一个用户关联的行为数据,例如,针对用户B,其关联的项目X1、项目X2和项目X4,均为视频项目,且类目均相同,两两之间均满足预设网络构建条件,即针对用户B,可建立项目X1和项目X2、项目X2和项目X4以及项目X1和项目X4之间的关联关系。
在建立项目X1和项目X2、项目X2和项目X3以及项目X1和项目X3之间的对应关系后,对项目X1和项目X2、项目X2和项目X3以及项目X1和项目X3之间的关联关系分别设置一个初始权重,建立项目X1和项目X2、项目X2和项目X4以及项目X1和项目X4之间的关联关系,对建立项目X1和项目X2、项目X2和项目X4以及项目X1和项目X4之间的关联关系分别设置一个初始权重,即在建立项目之间的对应关系后时,将项目行为网络中相邻的两个项目(可以理解两个项目之间具有直接连边(即直接关联关系))之间的初始权重设置为预设权重。针对用户A和用户B,均包括项目X1和项目X2之间的对应关系,将用户A和用户B下的项目X1和项目X2之间的初始权重相加,则得到项目行为网路中项目X1和项目X2之间的权重。
在一个实施例中,在确定所述行为语义知识网络中对应于所述特征数据的节点之前,确定行为语义知识网络之后,还包括:基于行为语义知识网络,确定各节点序列,节点序列中的各节点属于行为语义知识网络中的网络节点;分别对各节点序列中的各节点进行向量初始化,获得各节点序列中的各节点的初始向量;根据各节点序列中的各节点的初始向量进行学习训练,确定行为语义知识网络中的各网络节点分别对应的向量。
节点序列中的节点依次排列,将各节点序列作为训练集,首先将各节点序列中的节点进行向量初始化,获得各节点序列中的各节点的初始向量,即初始时,各节点通过对应的初始向量表示,然而,初始向量是随机初始化的,不能作为节点的最终向量,需要根据节点序列中的各节点的初始向量进行学习训练,确定行为语义知识网络中的各节点分别对应的向量。
基于该行为语义知识网络进行内容推荐过程中,在与对应于特征数据的节点相似的项目节点确定的过程中,采用网络节点对应的向量进行相似度的计算(例如,可以是节点对应的向量之间的距离作为节点之间的相似度),将相似度大于预设相似度的节点作为相似的项目节点。
在一个实施例中,可通过预设训练模型基于节点序列中的各节点的初始向量进行学习训练。即根据各节点序列中的节点的初始向量进行学习训练,确定行为语义知识网络中各节点分别对应的向量,包括:基于各节点序列以及各节点序列中各节点的初始向量,通过预设训练模型进行学习训练,确定行为语义知识网络中各网络节点分别对应的向量。
即各节点序列以及各节点序列中节点的初始向量作为预设训练模型的输入进行训练,输入一个节点的初始向量,输出的是行为语义知识网络中各节点分别对应的预测向量,经过不断的训练,即可确定行为语义知识网络中各节点分别对应的向量。在一个示例中,预设训练模型可以采用Skip-Gram训练模型。
在一个实施例中,基于行为语义知识网络,确定各节点序列,包括:
从行为语义知识网络中的各网络节点中选择一个未被选择过的网络节点作为当前节点,将当前节点添加到当前节点序列;
基于当前节点选择当前待添加节点,当前待添加节点为当前节点的各邻居节点中,满足预设添加条件的邻居节点;
将当前待添加节点添加到当前节点序列;
将当前待添加节点作为当前节点,返回基于当前节点选择当前待添加节点的步骤,直至当前节点序列中的节点的数量达到预设节点数量;
创建新的空节点序列作为新的当前节点序列,返回从各网络节点中选择一个未被选择过的网络节点作为当前节点的步骤,直至各节点序列的数目达到预设序列数目。
初始时,当前节点序列为空,即没有节点。首先从行为语义知识网络中的各网络节点中选择一个未被选择过的网络节点作为当前节点,将当前节点添加到当前节点序列,此时,当前序列中包括一个节点。然后从当前节点的各邻居节点中筛选一个邻居节点即当前待添加节点添加到当前序列中,并把当前待添加节点作为当前节点,如此循环,直至当前节点序列中的节点的数量达到预设节点数量,即当前节点序列中的节点的数量已满足要求,此时可停止对当前节点序列添加节点,即得到一个当前节点序列。
然而,为了确保训练的准确性,需要的不止一个节点序列作为训练集,需要利用预设序列数目个节点序列作为训练集。则在当前节点序列中的节点的数量达到预设节点数量时,确定当前节点序列作为各节点序列中的一条序列时,还需确定其他节点序列,此时,创建新的空节点序列作为新的当前节点序列,返回从各节点中选择一个未被选择过的节点作为当前节点的步骤,直至各节点序列的数目达到预设序列数目,直至各节点序列的数目达到预设序列数目,得到预设序列数目个当前节点序列即为各节点序列,如此循环,可得到预设序列数目个当前节点序列即各节点序列。
在一个实施例中,根据邻居节点相对于当前节点的跳转概率以及随机参数值,确定邻居节点是否满足预设添加条件,跳转概率根据该邻居节点与上一次添加到该当前节点序列的节点之间的距离确定。
即根据邻居节点相对于当前节点的跳转概率以及随机参数值确定当前待添加节点,邻居节点相对于当前节点的跳转概率与随机参数值对应时(即满足预设添加条件),则将该邻居节点作为当前待添加节点。可以理解,预设添加条件为邻居节点相对于当前节点的跳转概率与随机参数值对应,满足预设添加条件时,则将该邻居节点作为当前待添加节点。例如,当前节点为1,其邻居节点包括节点2、节点3和节点4,节点2、节点3和节点4相对于节点1的跳转概率分别为0.2、1和0.5,然而,随机参数值与跳转概率有预设对应关系,当前的随机参数值为3,对应的跳转概率是0.5,则将节点4作为当待添加节点。
首先,从行为语义知识网络中的各网络节点中选择一个未被选择过的网络节点座位当前节点序列中第一个节点,在从行为语义知识网络中各网络节点中确定当前节点序列中第二个节点时,需要利用当前节点的邻居节点与上一次添加到该当前节点序列的节点,然而,此时与上一次添加到该当前节点序列的节点并没有,在本实施例中,预先设置一个预设节点作为上一次添加到该当前节点序列的节点。
相邻的两个节点之间的距离为预设值,相隔一个节点的两个节点之间的距离则为预设值的两倍。在一个示例中,在邻居节点与上一次添加到该当前节点序列的节点之间的距离为第一预设距离值时,该邻居节点相对于当前节点的跳转概率为第一预设概率,在邻居节点与上一次添加到该当前节点序列的节点之间的距离为第二预设距离值时,该邻居节点相对于当前节点的跳转概率为第二预设概率,在邻居节点与上一次添加到该当前节点序列的节点之间的距离为第三预设距离值时,该邻居节点相对于当前节点的跳转概率为第三预设概率。
在一个实施例中,上述行为语义知识网络确定方法,还包括步骤:获取知识图谱,其中,知识图谱包括各图谱节点以及图谱节点关联关系。
在本实施例中,确定行为语义知识网络的方式包括:基于各项目行为数据、属性特征数据以及知识图谱,确定行为语义知识网络。
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱包括图谱节点(即实体对应的节点)与图谱节点关联关系(图谱关系)组成。本实施例确定的行为语义知识网络还包括知识图谱对应的图谱节点以及图谱节点关联关系。
基于知识图谱、对各项目的行为数据以及各项目的属性特征确定的行为语义知识网络,其行为语义知识网络考虑了各项目的行为数据、属性特征数据以及知识图谱,可准确表征各项目之间、各项目与属性特征之间以及实体之间的关系,基于该行为语义知识网络进行推荐,可提高推荐准确性。
在一个实施例中,基于各项目行为数据、属性特征数据以及知识图谱,确定行为语义知识网络,包括:
基于各项目行为数据以及对应的属性特征数据,确定项目属性网络,项目属性网络包括各项目行为数据对应项目的项目节点分别与属性特征数据对应的属性节点之间的关联关系;
基于各项目行为数据,确定项目行为网络,项目行为网络包括各项目行为数据对应项目的项目节点之间的关联关系;
基于知识图谱与项目属性网络的相同属性特征数据,关联知识图谱与项目属性网络,并基于项目属性网络与项目行为网络的相同项目,关联项目属性网络与项目行为网络,确定行为语义知识网络;其中,网络节点包括各项目行为数据对应项目的项目节点、各项目的属性特征数据对应的属性节点以及各图谱节点。
即行为语义知识网络不仅包括项目行为网络和项目属性网络,还包括知识图谱。可以理解为行为语义知识网络基于知识图谱、各项目的行为数据以及各项目的属性特征确定,行为语义知识网络中各节点包括各项目对应的项目节点、各项目的属性特征对应的属性节点以及知识图谱对应的图谱节点。
知识图谱包括各实体(属性特征的一种)对应的图谱节点之间的对应关系,项目属性网络包括各项目节点、各属性节点以及各项目节点分别与对应属性特征数据对应的属性节点之间的关联关系,项目行为网络包括各项目节点,以及各项目节点之间的关联关系,项目属性网络与知识图谱之间存在属性特征数据对应的属性节点的关联,若项目属性网络与知识图谱之间存在相同属性节点(即,属性特征相同,本实施例中相同属相特征采用相同实体),则可通过相同属性节点即可将项目属性网络与知识图谱进行关联。项目属性网络与项目行为网络之间存在项目的关联,若项目属性网络与项目行为网络之间存在相同项目(即相同项目节点),则可通过相同项目即可将项目属性网络与知识图谱进行关联,如此,可实现知识图谱、项目属性网络和项目行为网络的关联,得到行为语义知识网络。
例如,在知识图谱中,包括实体S1、实体S2、实体S3、实体S4、实体S5、实体S6、实体S1和实体S2之间的关系、实体S3和实体S4之间的关系以及实体S5和实体S6之间的关系。在项目属相网络中,包括项目X1、项目X1对应的属性特征(关键词为G1、实体为S1、类目为L1以及媒体标识为M1)、项目X2、项目2对应的属性特征(关键词为G2、实体为S2、类目为L2以及媒体标识为M2),项目X3、项目3对应的属性特征(关键词为G3、实体为S3、类目为L3以及媒体标识为M3)。在项目行为网络中,包括项目X1、项目X2、项目X3以项目X1和项目X2之间的对应关系。如此,项目属性网络与知识图谱中存在的相同属性特征为实体S1和实体S2,通过实体S1和实体S2即可关联项目属性网络与知识图谱。项目属性网络与项目行为网络中存在的相同项目为项目X1、项目X2和项目X3,通过项目X1、项目X2和项目X3可关联项目属性网络与项目行为网络,从而,得到行为语义知识网络。
在一个实施例中,目标推荐用户标识关联的特征数据包括目标推荐用户标识关联的项目行为数据;
在各网路节点包括各项目节点以及各属性节点时,基于特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点,包括:根据目标推荐用户标识关联的项目行为数据,确定目标推荐用户标识关联的项目,并确定行为语义知识网络中的该项目的项目节点;行为语义知识网络中对应于特征数据的节点,为确定的行为语义知识网络中的该项目的项目节点。
目标推荐用户标识关联的项目行为数据表示目标推荐用户标识针对项目进行某个行为产生的行为数据。例如,用户A播放了视频项目X1,则产生用户A关联的项目X1的行为数据。根据目标推荐用户标识关联的项目行为数据,可确定目标推荐用户标识关联的项目,例如,可确定用户A关联项目X1,从而确定项目X1在行为语义知识网络中的对应的项目节点。对应于特征数据的节点即为目标推荐用户标识关联的项目在行为语义知识网络中对应的项目节点。
可以理解,在本实施例中,是通过对应于特征数据的项目节点为依据,确定相似的网络节点,并将相似的网络节点对应标识的内容作为待推荐内容。
在一个实施例中,将行为语义知识网络中,与对应于特征数据的节点相似的网络节点对应标示的内容,确定为目标推荐用户标识对应的待推荐内容,包括:
确定行为语义知识网络中,与确定的行为语义知识网络中的该项目对应的项目节点相似的项目节点,并将确定的项目节点对应的项目,确定为目标推荐用户标识对应的待推荐内容;或
确定行为语义知识网络中,与确定的行为语义知识网络中的该项目对应的项目节点相似的相似属性节点,并将确定的相似属性节点对应的属性特征数据,确定为目标推荐用户标识对应的待推荐内容。
可以理解,在本实施例中,是通过对应于特征数据的项目节点为依据,确定与该对应于特征数据的项目节点相似的项目节点(即上述相似的网络节点即为相似的项目节点)或相似属性节点(即上述相似的网络节点即为相似属性节点),并将相似的项目节点的项目或相似属性节点对应的属性特征数据作为待推荐内容。
在一个实施例中,目标推荐用户标识关联的特征数据包括目标推荐用户标识关联的属性特征数据;
在各网路节点包括各项目节点以及各属性节点时,基于特征数据以及行为语义知识网络中各节点,确定行为语义知识网络中对应于特征数据的节点,包括:根据目标推荐用户标识关联的属性特征数据,确定行为语义知识网络中的该属性特征数据的属性节点;行为语义知识网络中对应于特征数据的节点,为确定的行为语义知识网络中的该属性特征的属性节点。
目标推荐用户标识关联的项目的属性特征数据,表示目标推荐用户标识针对项目进行某个行为,该项目与目标推荐用户标识关联,而关联的该项目有对应的属性特征数据。在行为语义知识网络中包括属性特征数据对应的属性节点,根据目标推荐用户标识关联的项目的属性特征数据,确定行为语义知识网络中的该属性特征的属性节点。例如,用户A播放了视频项目X1,项目X1对应的媒体标识(一个属性特征数据)为M1,则可确定行为语义知识网络中的该媒体标识M1的属性节点,用户B播放了视频项目X2,项目X2对应的媒体标识为M2,则可确定行为语义知识网络中的该媒体标识M2的属性节点。
可以理解,在本实施例中,是通过对应于特征数据的属性节点为依据,确定相似的网络节点,并将相似的网络节点对应标识的内容作为待推荐内容。
在一个实施例中,将行为语义知识网络中,与对应于特征数据的节点相似的网络节点对应标示的内容,确定为目标推荐用户标识对应的待推荐内容,包括:
确定行为语义知识网络中,与确定的行为语义知识网络中的该属性特征数据的属性节点相似的项目节点,并将确定的项目节点对应的项目,确定为目标推荐用户标识对应的待推荐内容;或/和
确定行为语义知识网络中,与确定的行为语义知识网络中的该属性特征数据的属性节点相似的相似属性节点,并确定相似属性节点对应的项目节点,并将确定的项目节点对应的项目,确定为目标推荐用户标识对应的待推荐内容。
在确定行为语义知识网络中对应于特征数据的节点为确定的行为语义知识网络中的目标推荐用户标识关联的属性特征数据的属性节点后,不但可确定行为语义知识网络中,与确定的行为语义知识网络中的该属性特征数据的属性节点相似的相似项目节点,即通过该属性节点确定相似项目节点,即上述相似的网络节点为相似项目节点。还可确定与确定的行为语义知识网络中的该属性特征的属性节点相似的相似属性节点,即通过该属性节点确定相似的相似属性节点,然后再根据相似属性节点确定对应的项目节点,即上述相似的网络节点为相似属性节点对应的项目节点。又可以将上述确定的相似项目节点和确定的相似属性节点对应的项目节点作为上述相似的网络节点,将确定的相似的网络节点的项目作为待推荐内容。
在一个实施例中,在与对应于特征数据的节点相似的网络节点为相似的项目节点时,向目标推荐用户标识推荐待推荐内容,包括:
基于各待推荐内容对应的项目节点以及各待推荐内容对应的属性特征数据对应的属性节点,通过预设点击量预测模型进行预测,确定各待推荐内容的点击量;
根据各待推荐内容的点击量,将点击量较大的预设个数个待推荐内容推荐给目标推荐用户标识。
即待推荐内容为确定的相似项目节点对应的项目。为了避免推荐量过大,影响用户对应的终端的运行以及给用户造成困扰,可从待推荐内容中选择部分进行推荐,在本实施例中,可通过点击量预测模型对点击量进行预测,即获得各待推荐内容的点击量,将点击量较大的预设个数个待推荐内容推荐给目标推荐用户标识。
在一个实施例中,目标推荐用户标识关联的特征数据包括目标推荐用户标识关联的项目行为数据或目标推荐用户标识关联的属性特征数据;
在各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据时,基于特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点,包括:根据目标推荐用户标识关联的项目行为数据,确定目标推荐用户标识关联的项目,并确定行为语义知识网络中的该项目的网络节点;
行为语义知识网络中对应于特征数据的节点,为确定的行为语义知识网络中的该项目的网络节点。
在另一个实施例中,目标推荐用户标识关联的特征数据包括目标推荐用户标识关联的项目行为数据或目标推荐用户标识关联的属性特征数据;
在各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据时,基于特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于特征数据的节点,根据目标推荐用户标识关联的属性特征数据,确定行为语义知识网络中的该属性特征数据的网络节点;
行为语义知识网络中对应于特征数据的节点,为确定的行为语义知识网络中的该属性特征数据的网络节点。
即在各网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据时,表示一个网络节点不但标示有项目还标示对应的属性特征数据。此时,通过项目行为数据或属性特征数据均可找到对应的网络节点,将找到的网络节点作为行为语义知识网络中对应于特征数据的节点。
在一个实施例中,在各所述网络节点分别标示对应的项目行为数据对应项目以及该项目对应的属性特征数据时,所述确定行为语义知识网络的方式包括:
基于各所述项目行为数据,确定行为语义知识网络,所述行为语义知识网络包括各所述项目行为数据对应项目的网络节点。
基于各所述项目行为数据,确定行为语义知识网络的方式与上述确定项目行为网络的方式类似,不同之处在于,上述确定的行为语义知识网络中项目节点仅标示项目,本实施例确定的行为语义知识网络中各网络节点不但标示项目,还标示该项目对应的属性特征数据。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
下面以一具体实施例对上述行为语义知识网络确定方法以及推荐项目确定方法的过程加以具体说明。以基于知识图谱、项目行为数据以及属性特征数据确定行为语义知识网络,各网络节点包括各项目节点、各属性节点和各图谱节点为例进行说明。上述关联关系可以理解为连接关系。
1、行为语义知识网络构建
行为语义知识网络,包含三个子网络:知识图谱(实体关系网络)、项目属性网络以及项目行为网络。
1.1、知识图谱(实体关系网络):
如图4所示,知识图谱是实体与实体之间关系的网络表示。在知识图谱中,图谱节点是实体或概念节点,连边是实体与实体,或实体与概念之间的关系。数据来自挖掘的知识图谱。知识图谱的实体关系网络可用三元组的形式表示:<entity1,relation,entity2>,表示实体entity1与实体entity2之间具有relation关系,例如,在图4中,实体9和实体10是夫妻关系,具体比如,<姚明,夫妻,叶莉>,姚明和叶莉为实体,关系为夫妻。
1.2、项目属性网络:
如图5所示,项目属性网络通过item(项目)的相同属性特征将各项目与对应的属性节点连接成网络。item的属性特征来自对item的属性抽取。比如,item的属性特征可以包括:类目(category)、关键词(Tag)、实体(Entity)以及媒体标识(media)等。可以用如下格式表示:<item,category,media,{Tag/Entity list}>。例如,<vid:a00250p1ez9,category:1538934,media:6128473,Tag list:{吐槽大会2,吐槽大会,林雪,吴昕,明星吐槽,搞笑吐槽,内地综艺}>,可以理解,上述项目中的实体为空。
1.3、项目行为网络:
如图6所示,项目行为网络的节点是item,即项目节点。以阅读行为为例,项目节点之间的边描述了用户阅读item的顺序及相邻关系。可表示为<u1,{item1,item2,item4}>,<u2,{item3,item2}>的形式。具体项目行为网络建方法如下:
1.3.1、获取行为数据:比如,<u,{item1,item2,item4}>,表示用户u的行为数据,关联的项目有item1,item2和item4,即用户u对项目item1,item2和item4进行了相关的行为。
1.3.2、Item间构建连边需满足以下条件:
a)连边两端的项目节点需满足同一类目条件;
b)连边两端的项目节点之间的行为顺序差小于5(预设差值)。其中,相邻项目节点之间的距离可以定义为1。
例如,用户u1历史行为数据:<u1,{item1(category:1),item2(category:2),item3(category:1),item4(category:1),item5(category:2)}>。
得到连边关系及权重:<item1,item3,1>,<item1,item4,1>,<item3,item4,1>,<item2,item5,1>,表示项目item1与项目item3有连边,对应的权重为1,项目item1与项目item4有连边,对应的权重为1,项目item3与项目item4有连边,对应的权重为1。最后对所有用户得到的相同两个项目之间连边权重求和。
三个子网络根据相同节点做融合,并调整子网络边权重比例。知识图谱与项目属性网络通过Tag/Entity关联,项目属性网络与项目行为网络通过item本身进行关联。经过边权重调整,最终得到行为语义知识网络,如图7所示。
在本实施例中,采用最近1个月内的行为数据、属性特征自己知识图谱,确保数据的实时性,提高行为语义知识网络的准确性。
2、行为语义知识网络中各节点的向量确定
对行为语义知识网络进行表示学习,可采用node2vec算法。node2vec基本思想类似word2vec,首先根据改进的伪随机游走方法得到节点序列,然后以此为数据输入通过skip-gram训练算法得到每个节点的向量表示。
为了更好的学习行为语义知识网络中各节点的内容相似性与结构相似性,算法对随机游走进行优化。定义了两个参数p(上述第一预设概率可以为1/p)、q(上述第三预设概率可以为1/q)来调节跳转概率,上述第三预设概率可以为1。假如现在游走到节点v,首先计算其邻居节点与上一个节点t的距离d,从而得到跳转概率α:
若q很小,则随机游走偏向往深度游走,反之偏向往广度游走,若p很小,则随机游走偏向回到刚经过的上一个节点。两个极端的方向就是BFS(广度优先算法(Breadth-First-Search),是一种图形搜索演算法。简单的说,BFS是从根节点开始,沿着树的宽度遍历树的节点,如果发现目标,则演算终止)和DFS(深度优先搜索(Depth-First-Search),是一种图形搜索演算法。DFS是从根节点开始,沿着树的深度遍历树的节点,如果发现目标,则演算终止)。BFS注重邻近的节点并刻画了相对局部的一种网络表示,体现内容的相似性;DFS反应更高层面上的节点间的同质性,体现节点间的结构相似性。
如图8所示,Skip-Gram对节点序列进行向量表示学习。算法思想是建立一个神经网络,训练集是由节点组成的序列(图8中包括3个节点序列),输入一个节点的向量,输出各个节点对应的预测向量。Skip-Gram引入窗口大小w作为参数,输入节点所在节点序列窗口范围内的上下文作为正例,采用随机采样方法选择负例。
举例,“一个/有效/的/学习/方法/是/理论/与/实践/相/结合”,我们的上下文窗口大小取值为4,特定的这个词"理论"是我们的输入,8个上下文词是我们的输出。这样我们的输入是特定词,输出是与输入之间的相似度大小排前8的8个词。图9中,如图9所示,通过Skip-Gram算法进行学习时,输入层(Input layer,一个神经元)的输入向量xk的维度为V,隐含层(Hidden layer),输入层和隐含层之间的权重向量为WV×N,输出层有C个神经元,每个神经元对应的维度为V。即输出层有词汇表大小C个神经元。隐藏层的神经元个数可根据实际制定,即表示学习的结果向量维度V。在本实施中,C与行为语义知识网络中各节点的数量相同。
Skip-Gram算法对训练数据计算最大似然,使用SGD(梯度下降法是一个最优化算法,通常也称为最速下降法。最速下降法是求解无约束优化问题,最速下降法是用负梯度方向为搜索方向的,最速下降法越接近目标值,步长越小,前进越慢)优化算法来进行求解。得到行为语义知识网络中各节点的向量化表示。
3、待推荐项目的确定以及推荐
3.1、在本申请中,可通过以下三种方式实现待推荐项目的确定:
a)、通过目标推荐用户标识关联的项目对应的项目节点,确定相似的项目节点。由于行为语义知识网络中各项目节点的向量已确定,可以根据节点的向量,通过计算目标推荐用户标识关联的项目对应的项目节点与各节点的余弦相似度,得到相似的项目节点,将其对应的项目作为待推荐项目。
b)、通过目标推荐用户标识关联的项目对应的属性特征对应的属性节点,确定相似的项目节点。行为语义知识网络中各属性节点的向量已确定(例如,Tag、Entity、category、media)。Tag、Entity、category和media通过用户行为可以累积到用户属性特征上。通过属性特征的属性节点,确定与其对应的相似的项目节点,将相似的项目节点对应的项目作为待推荐项目。既满足了用户兴趣,还跳过特征拉倒排索引的步骤。
c)、通过属性特征扩展相似属性特征。即通过目标待推荐用户关联的项目对应的属性特征的属性节点,确定与属性节点对应的相似属性节点,再通过相似属性节点定位到对应的相似的项目节点,将相似的项目节点对应的项目作为待推荐项目,具有更好的试探性与扩展性。
3.2、CTR(CTR(Click-Through-Rate)即点击通过率,是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即该广告的实际点击次数(严格的来说,可以是到达目标页面的数量)除以广告的展现量(Showcontent))计算是最终精选排序的算法逻辑,包含特征抽取,并在特征抽取的基础上通过模型来预估文档在特定用户请求时的排序关系,异构网络会将item数据的向量表示与itemfeature的扩展泛化结果提供为CTR的特征抽取的输入,进行模型预估。
在本申请中,通过预设点击量预测模型,基于各待推荐项目对应的项目节点的向量以及各待推荐项目对应的属性特征对应的属性节点的向量,确定各待推荐项目的点击量;根据各待推荐项目的点击量,将点击量较大的预设个数个待推荐项目推荐给目标推荐用户标识。
上述将行为语义知识网络应用于内容推荐场景,另外,还可上述行为语义知识网络应用于节点分类和连接预测。针对节点分类,在大规模网络中,一部分的节点被打上了类别标签,比如兴趣、类别、信仰等,利用行为语义知识网络的连接关系,将无标签的节点分类到特定的标签上,实现节点分类。针对链接预测,也称链路预测(Link Prediction),指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可实现一种行为语义知识网络确定方法和推荐内容确定方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种基于行为语义知识网络的内容推荐方法,其特征在于,包括步骤:
获取各用户标识关联的项目行为数据以及各所述项目行为数据对应项目的属性特征数据;
基于各所述项目行为数据以及所述属性特征数据,确定行为语义知识网络,所述行为语义知识网络包括各网络节点以及网络节点关联关系;各所述网络节点分别标示对应的项目行为数据对应项目以及与该项目对应的属性特征数据,或各所述网路节点包括标示对应的项目行为数据对应项目的各项目节点以及标示对应的属性特征数据的各属性节点;
获取目标推荐用户标识关联的特征数据;
基于所述特征数据以及所述行为语义知识网络中各网络节点,确定所述行为语义知识网络中对应于所述特征数据的节点;
将所述行为语义知识网络中,与对应于所述特征数据的节点相似的网络节点对应标示的内容,确定为所述目标推荐用户标识对应的待推荐内容;
向所述目标推荐用户标识推荐所述待推荐内容。
2.根据权利要求1所述的方法,其特征在于,所述确定行为语义知识网络的方式包括:
基于各所述项目行为数据以及对应的所述属性特征数据,确定项目属性网络,所述项目属性网络包括各所述项目行为数据对应项目的项目节点分别与属性特征数据对应的属性节点之间的关联关系;
基于各所述项目行为数据,确定项目行为网络,所述项目行为网络包括各所述项目行为数据对应项目的项目节点之间的关联关系;
基于所述项目属性网络与所述项目行为网络的相同项目,关联所述项目属性网络与所述项目行为网络,确定所述行为语义知识网络;各所述网络节点包括各所述项目节点以及各所述属性节点。
3.根据权利要求2所述的方法,其特征在于,基于各所述项目行为数据,确定项目行为网络,包括:
基于各所述项目行为数据对应项目,建立各所述项目节点;
在同一用户关联的项目行为数据对应项目之间的属性特征数据中的类目相同,且项目之间的行为顺序差小于预设差值时,建立该项目之间的关联关系。
4.根据权利要求3所述的方法,其特征在于,建立该项目之间的关联关系之后,还包括:
将所述项目行为网络中相邻的两个项目之间的距离设置为预设值;
将所述项目行为网络中相邻的两个项目之间的权重,设置为各所述用户对应的该相邻的两个项目之间的初始权重之和。
5.根据权利要求1所述的方法,其特征在于,确定所述行为语义知识网络之后,还包括:
基于所述行为语义知识网络,确定各节点序列,所述节点序列中的各节点属于所述行为语义知识网络中的网络节点;
分别对各所述节点序列中的各节点进行向量初始化,获得各所述节点序列中的各节点的初始向量;
根据各所述节点序列中的各节点的初始向量进行学习训练,确定所述行为语义知识网络中的各网络节点分别对应的向量。
6.根据权利要求5所述的方法,其特征在于,基于所述行为语义知识网络,确定各节点序列,包括:
从所述行为语义知识网络中的各所述网络节点中选择一个未被选择过的网络节点作为当前节点,将所述当前节点添加到当前节点序列;
基于所述当前节点选择当前待添加节点,所述当前待添加节点为所述当前节点的各邻居节点中,满足预设添加条件的邻居节点;
将所述当前待添加节点添加到所述当前节点序列;
将所述当前待添加节点作为当前节点,返回基于所述当前节点选择当前待添加节点的步骤,直至所述当前节点序列中的节点的数量达到预设节点数量;
创建新的空节点序列作为新的当前节点序列,返回从各所述网络节点中选择一个未被选择过的网络节点作为当前节点的步骤,直至各所述节点序列的数目达到预设序列数目。
7.根据权利要求6所述的方法,其特征在于,
根据所述邻居节点相对于所述当前节点的跳转概率以及随机参数值,确定所述邻居节点是否满足所述预设添加条件,所述跳转概率根据该邻居节点与上一次添加到该当前节点序列的节点之间的距离确定。
8.根据权利要求1所述的方法,其特征在于,还包括步骤:获取知识图谱,其中,所述知识图谱包括各图谱节点以及图谱节点关联关系;
所述确定行为语义知识网络的方式包括:
基于各所述项目行为数据、所述属性特征数据以及所述知识图谱,确定所述行为语义知识网络。
9.根据权利要求8所述的方法,其特征在于,基于各所述项目行为数据、所述属性特征数据以及所述知识图谱,确定所述行为语义知识网络,包括:
基于各所述项目行为数据以及对应的所述属性特征数据,确定项目属性网络,所述项目属性网络包括各所述项目行为数据对应项目的项目节点分别与属性特征数据对应的属性节点之间的关联关系;
基于各所述项目行为数据,确定项目行为网络,所述项目行为网络包括各所述项目行为数据对应项目的项目节点之间的关联关系;
基于知识图谱与项目属性网络的相同属性特征数据,关联所述知识图谱与所述项目属性网络,并基于项目属性网络与项目行为网络的相同项目,关联所述项目属性网络与所述项目行为网络,确定行为语义知识网络;其中,所述网络节点包括各所述项目行为数据对应项目的项目节点、各所述项目的属性特征数据对应的属性节点以及各所述图谱节点。
10.根据权利要求1所述的方法,其特征在于,所述目标推荐用户标识关联的特征数据包括目标推荐用户标识关联的项目行为数据;
在各所述网路节点包括各所述项目节点以及各所述属性节点时,基于所述特征数据以及行为语义知识网络中各网络节点,确定行为语义知识网络中对应于所述特征数据的节点,包括:根据目标推荐用户标识关联的项目行为数据,确定目标推荐用户标识关联的项目,并确定行为语义知识网络中的该项目的项目节点;
所述行为语义知识网络中对应于所述特征数据的节点,为确定的行为语义知识网络中的该项目的项目节点。
11.根据权利要求10所述的方法,其特征在于,将所述行为语义知识网络中,与对应于所述特征数据的节点相似的网络节点对应标示的内容,确定为所述目标推荐用户标识对应的待推荐内容,包括:
确定所述行为语义知识网络中,与确定的行为语义知识网络中的该项目对应的项目节点相似的项目节点,并将确定的项目节点对应的项目,确定为所述目标推荐用户标识对应的待推荐内容;或
确定所述行为语义知识网络中,与确定的行为语义知识网络中的该项目对应的项目节点相似的相似属性节点,并将确定的相似属性节点对应的属性特征数据,确定为所述目标推荐用户标识对应的待推荐内容。
12.根据权利要求1所述的方法,其特征在于,所述目标推荐用户标识关联的特征数据包括目标推荐用户标识关联的属性特征数据;
在各所述网路节点包括各所述项目节点以及各所述属性节点时,基于所述特征数据以及行为语义知识网络中各节点,确定行为语义知识网络中对应于所述特征数据的节点,包括:根据目标推荐用户标识关联的属性特征数据,确定行为语义知识网络中的该属性特征数据的属性节点;
所述行为语义知识网络中对应于所述特征数据的节点,为确定的行为语义知识网络中的该属性特征的属性节点。
13.根据权利要求12所述的方法,其特征在于,将所述行为语义知识网络中,与对应于所述特征数据的节点相似的网络节点对应标示的内容,确定为所述目标推荐用户标识对应的待推荐内容,包括:
确定所述行为语义知识网络中,与确定的行为语义知识网络中的该属性特征数据的属性节点相似的项目节点,并将确定的项目节点对应的项目,确定为所述目标推荐用户标识对应的待推荐内容;
确定所述行为语义知识网络中,与确定的行为语义知识网络中的该属性特征数据的属性节点相似的相似属性节点,并确定相似属性节点对应的项目节点,并将确定的项目节点对应的项目,确定为所述目标推荐用户标识对应的待推荐内容。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
CN201810555990.3A 2018-06-01 2018-06-01 基于行为语义知识网络的内容推荐方法 Active CN108804633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810555990.3A CN108804633B (zh) 2018-06-01 2018-06-01 基于行为语义知识网络的内容推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810555990.3A CN108804633B (zh) 2018-06-01 2018-06-01 基于行为语义知识网络的内容推荐方法

Publications (2)

Publication Number Publication Date
CN108804633A true CN108804633A (zh) 2018-11-13
CN108804633B CN108804633B (zh) 2021-10-08

Family

ID=64090049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810555990.3A Active CN108804633B (zh) 2018-06-01 2018-06-01 基于行为语义知识网络的内容推荐方法

Country Status (1)

Country Link
CN (1) CN108804633B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800342A (zh) * 2018-12-13 2019-05-24 中国科学院信息工程研究所 一种基于节点影响力的多关系网络数据量化表示方法
CN109829057A (zh) * 2019-01-11 2019-05-31 中山大学 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
CN110188201A (zh) * 2019-05-27 2019-08-30 上海上湖信息技术有限公司 一种信息匹配方法及设备
CN110335112A (zh) * 2019-06-18 2019-10-15 中国平安财产保险股份有限公司 一种产品推荐方法、装置及计算机存储介质
CN110442977A (zh) * 2019-08-08 2019-11-12 广州华建工智慧科技有限公司 基于建筑施工工序网络推荐的移动端bim模型智能缓存方法
CN110909258A (zh) * 2019-11-22 2020-03-24 上海喜马拉雅科技有限公司 一种信息推荐方法、装置、设备及存储介质
CN110955834A (zh) * 2019-11-27 2020-04-03 西北工业大学 一种知识图谱驱动的个性化精准推荐方法
CN111160552A (zh) * 2019-12-17 2020-05-15 北京百度网讯科技有限公司 负采样处理方法、装置、设备和计算机存储介质
CN111353001A (zh) * 2018-12-24 2020-06-30 杭州海康威视数字技术股份有限公司 对用户进行分类的方法和装置
CN111488441A (zh) * 2020-04-08 2020-08-04 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答系统和电子设备
WO2020192534A1 (zh) * 2019-03-26 2020-10-01 华为技术有限公司 搜索方法、终端及介质
CN112115233A (zh) * 2020-09-27 2020-12-22 北京百度网讯科技有限公司 关系网络生成方法、装置、电子设备及存储介质
CN112131320A (zh) * 2019-06-25 2020-12-25 杭州海康威视数字技术股份有限公司 异常数据的检测方法、装置及存储介质
CN112765486A (zh) * 2021-01-22 2021-05-07 重庆邮电大学 一种融合知识图谱的注意力机制的电影推荐方法
CN113392330A (zh) * 2021-08-17 2021-09-14 湖南轻悦健康管理有限公司 一种基于互联网行为的大数据处理方法及系统
CN113641919A (zh) * 2021-10-12 2021-11-12 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
WO2022048368A1 (zh) * 2020-09-02 2022-03-10 深圳壹账通智能科技有限公司 基于知识图谱的推荐方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631859A (zh) * 2013-10-24 2014-03-12 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法
CN106447066A (zh) * 2016-06-01 2017-02-22 上海坤士合生信息科技有限公司 一种大数据的特征提取方法和装置
CN107145977A (zh) * 2017-04-28 2017-09-08 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN107194469A (zh) * 2017-05-11 2017-09-22 西安电子科技大学 基于时间序列数据和随机梯度下降法的网络重构方法
CN107330798A (zh) * 2017-06-05 2017-11-07 大连理工大学 一种基于种子节点传播的社交网络间用户身份识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631859A (zh) * 2013-10-24 2014-03-12 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法
CN106447066A (zh) * 2016-06-01 2017-02-22 上海坤士合生信息科技有限公司 一种大数据的特征提取方法和装置
CN107145977A (zh) * 2017-04-28 2017-09-08 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN107194469A (zh) * 2017-05-11 2017-09-22 西安电子科技大学 基于时间序列数据和随机梯度下降法的网络重构方法
CN107330798A (zh) * 2017-06-05 2017-11-07 大连理工大学 一种基于种子节点传播的社交网络间用户身份识别方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800342A (zh) * 2018-12-13 2019-05-24 中国科学院信息工程研究所 一种基于节点影响力的多关系网络数据量化表示方法
CN111353001A (zh) * 2018-12-24 2020-06-30 杭州海康威视数字技术股份有限公司 对用户进行分类的方法和装置
CN111353001B (zh) * 2018-12-24 2023-08-18 杭州海康威视数字技术股份有限公司 对用户进行分类的方法和装置
CN109829057A (zh) * 2019-01-11 2019-05-31 中山大学 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
CN109829057B (zh) * 2019-01-11 2023-02-21 中山大学 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
WO2020192534A1 (zh) * 2019-03-26 2020-10-01 华为技术有限公司 搜索方法、终端及介质
CN110188201A (zh) * 2019-05-27 2019-08-30 上海上湖信息技术有限公司 一种信息匹配方法及设备
CN110335112A (zh) * 2019-06-18 2019-10-15 中国平安财产保险股份有限公司 一种产品推荐方法、装置及计算机存储介质
CN112131320A (zh) * 2019-06-25 2020-12-25 杭州海康威视数字技术股份有限公司 异常数据的检测方法、装置及存储介质
CN110442977B (zh) * 2019-08-08 2023-09-29 广州华建工智慧科技有限公司 基于建筑施工工序网络推荐的移动端bim模型智能缓存方法
CN110442977A (zh) * 2019-08-08 2019-11-12 广州华建工智慧科技有限公司 基于建筑施工工序网络推荐的移动端bim模型智能缓存方法
CN110909258B (zh) * 2019-11-22 2023-09-29 上海喜马拉雅科技有限公司 一种信息推荐方法、装置、设备及存储介质
CN110909258A (zh) * 2019-11-22 2020-03-24 上海喜马拉雅科技有限公司 一种信息推荐方法、装置、设备及存储介质
CN110955834A (zh) * 2019-11-27 2020-04-03 西北工业大学 一种知识图谱驱动的个性化精准推荐方法
CN110955834B (zh) * 2019-11-27 2023-07-07 西北工业大学 一种知识图谱驱动的个性化精准推荐方法
CN111160552B (zh) * 2019-12-17 2023-09-26 北京百度网讯科技有限公司 新闻信息的推荐处理方法、装置、设备和计算机存储介质
CN111160552A (zh) * 2019-12-17 2020-05-15 北京百度网讯科技有限公司 负采样处理方法、装置、设备和计算机存储介质
CN111488441A (zh) * 2020-04-08 2020-08-04 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答系统和电子设备
WO2022048368A1 (zh) * 2020-09-02 2022-03-10 深圳壹账通智能科技有限公司 基于知识图谱的推荐方法、装置、计算机设备及存储介质
CN112115233A (zh) * 2020-09-27 2020-12-22 北京百度网讯科技有限公司 关系网络生成方法、装置、电子设备及存储介质
CN112115233B (zh) * 2020-09-27 2024-03-26 北京百度网讯科技有限公司 关系网络生成方法、装置、电子设备及存储介质
CN112765486B (zh) * 2021-01-22 2022-04-05 重庆邮电大学 一种融合知识图谱的注意力机制的电影推荐方法
CN112765486A (zh) * 2021-01-22 2021-05-07 重庆邮电大学 一种融合知识图谱的注意力机制的电影推荐方法
CN113392330A (zh) * 2021-08-17 2021-09-14 湖南轻悦健康管理有限公司 一种基于互联网行为的大数据处理方法及系统
CN113392330B (zh) * 2021-08-17 2021-10-26 湖南轻悦健康管理有限公司 一种基于互联网行为的大数据处理方法及系统
CN113641919A (zh) * 2021-10-12 2021-11-12 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN108804633B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN108804633A (zh) 基于行为语义知识网络的内容推荐方法
Jain et al. Opinion leader detection using whale optimization algorithm in online social network
WO2020147594A1 (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN104462364B (zh) 搜索推荐方法及装置
CN110162695A (zh) 一种信息推送的方法及设备
CN104915734B (zh) 基于时间序列的商品热度预测方法和系统
US8543532B2 (en) Method and apparatus for providing a co-creation platform
CN109062994A (zh) 推荐方法、装置、计算机设备和存储介质
CN110162690A (zh) 确定用户对物品的兴趣度的方法与装置、设备和存储介质
CN103902697B (zh) 组合搜索方法、客户端和服务器
KR100930786B1 (ko) 광고 리스트 생성 방법 및 시스템
US20140067535A1 (en) Concept-level User Intent Profile Extraction and Applications
CN104679743A (zh) 一种确定用户的偏好模式的方法及装置
CN103577549A (zh) 一种基于微博标签的人群画像系统和方法
Sansonetti Point of interest recommendation based on social and linked open data
CN106844341A (zh) 基于人工智能的新闻摘要提取方法及装置
CN112380433B (zh) 面向冷启动用户的推荐元学习方法
CN110223186A (zh) 用户相似度确定方法以及信息推荐方法
CN109740152A (zh) 文本类目的确定方法、装置、存储介质和计算机设备
CN106557480A (zh) 查询改写的实现方法及装置
CN112989169A (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
Menk et al. Recommendation systems for tourism based on social networks: A survey
US20170315676A1 (en) Dynamic content insertion
Doan et al. Modeling location-based social network data with area attraction and neighborhood competition
CN108121749A (zh) 网站用户行为分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant