CN107391509A - 标签推荐方法及装置 - Google Patents

标签推荐方法及装置 Download PDF

Info

Publication number
CN107391509A
CN107391509A CN201610323645.8A CN201610323645A CN107391509A CN 107391509 A CN107391509 A CN 107391509A CN 201610323645 A CN201610323645 A CN 201610323645A CN 107391509 A CN107391509 A CN 107391509A
Authority
CN
China
Prior art keywords
label
theme
resource
recommendation
recommend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610323645.8A
Other languages
English (en)
Other versions
CN107391509B (zh
Inventor
秦兵
陈虹
董振江
刘挺
薛涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610323645.8A priority Critical patent/CN107391509B/zh
Priority to PCT/CN2017/081584 priority patent/WO2017198039A1/zh
Publication of CN107391509A publication Critical patent/CN107391509A/zh
Application granted granted Critical
Publication of CN107391509B publication Critical patent/CN107391509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明提供了一种标签推荐方法及装置,其中,该方法包括:从标签层次体系中选择出资源的每个主题对应的候选标签;从每个主题对应的候选标签中选择出每个主题对应的推荐标签;根据每个主题的权重在每个主题对应的推荐标签中进行标签推荐,解决了相关技术中为资源定义的社会化标签不准确的问题。

Description

标签推荐方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种标签推荐方法及装置。
背景技术
随着网络搜索引擎的快速发展,大家正在享受着快速便捷的资源获取方式,比如,用户通过网络进行资源的分享,检索和发现等。当用户在网络中分量某一个文章,或者视频片段时,会给该文章或者视频定义一个标签(又可以称为社会化标签),例如,言情。此时,其他网络用户就可以根据该用户定义的标签查找资源并访问资源。但是,由于网络用户的数量众多,对于相同的一篇文文章,或者相同的一个视频,每个用户所定义的标签大多是不相同的。例如,对于某一篇文章,用户A定义的标签为言情,然而,用户B定义的标签为惊悚,其他用户定义的标签还可能是军旅、战争等标签。因此,上述过多的标签导致对该文章的定义偏离了其原有的属性,为该资源所定义的标签不准确,致使用户获取到的资源并非是真正想要的资源,降低了用户体验。
针对相关技术中为资源定义的社会化标签不准确的问题,目前还没有有效的解决方案。
发明内容
本发明实施例提供了一种标签推荐方法及装置,以至少解决相关技术中为资源定义的社会化标签不准确的问题。
根据本发明的一个实施例,提供了一种标签推荐方法,包括:从所述标签层次体系中选择出资源的每个主题对应的候选标签;从所述每个主题对应的候选标签中选择出每个主题对应的推荐标签;根据所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
可选地,从所述标签层次体系中选择出所述资源的每个主题对应的候选标签包括:遍历所述标签层次体系中各个分支,从每个分支中选择出候选标签,将从所有分支中选择出的候选标签作为与所述每个主题对应的候选标签。
可选地,遍历所述标签层次体系中各个分支,从每个分支中选择出候选标签包括:对于所述标签层次体系中的每个分支,从所述分支中的指定标签节点中选择出候选标签,其中,所述指定标签节点为所述分支中除属性标签节点以及所述资源的标签节点的上一节点之外的节点。
可选地,根据所述每个主题的权重从所述每个主题对应的推荐标签中进行标签推荐包括:确定所述每个主题对应的推荐标签对于所述资源的推荐值,并确定所述每个主题的权重,其中,所述推荐值用于指示所述推荐标签推荐给资源的概率;根据确定出的所述推荐标签对于所述资源的所述推荐值和所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
可选地,所述推荐标签的数量为多个,确定所述每个主题对应的推荐标签对于所述资源的推荐值包括:确定多个推荐标签的每个推荐标签在所述每个主题中的重要值,以及确定所述多个推荐标签中的所述每个推荐标签与所述资源的关联度值,其中,所述关联度值为所述每个推荐标签与所述资源之间的最短路径长度;根据所述重要值和所述关联度值确定所述每个主题对应的推荐标签对于所述资源的推荐值。
可选地,所述推荐值通过以下公式得到:Jz(w,s)=Rz(w)*Fz(w,s),其中,Rz(w)为所述每个推荐标签在所述每个主题中的重要值,Fz(w,s)为所述每个推荐标签与所述资源的关联度值,Jz(w,s)为所述推荐值。
可选地,确定所述每个主题的权重包括:获取所述资源所属的全部主题的数量;计算所述每个主题在所述资源所属的全部主题中排序位置;基于所述排序位置和所述数量确定所述每个主题的权重值。
可选地,所述权重通过以下公式得到:其中,qz为所述每个主题在所述资源所属的全部主题中排序位置,Cz,s为所述资源所属的全部主题的数量,Iz(s)为所述每个主题的权重主题的权重。
可选地,计算所述每个主题在所述资源所属的全部主题中排序位置包括:基于所述主题的标签层次体系,计算所述资源距离所述每个主题根节点的最短路径长度;根据计算得到的所述资源距离所述每个主题根节点的最短路径长度确定所述每个主题在所述资源所属的全部主题中排序位置。
可选地,根据确定出的所述每个推荐标签对于所述资源的所述推荐值和所述每个主题的权重从所述每个主题对应的推荐标签中进行标签推荐包括:计算所述每个推荐标签在所述每个主题中对于所述资源的推荐值与所述每个推荐标签在所述每个主题中的权重值的加权和,得到多个加权和;根据计算出的所述多个加权和从所述每个主题对应的推荐标签中进行标签推荐。
可选地,根据计算出的所述加权和从所述每个主题对应的推荐标签中进行标签推荐包括:将计算得到的所述多个加权和按照由高到低的顺序进行排序,得到排序列表;确定所述排序列表中目标加权和对应的推荐标签为对所述资源进行推荐的标签,其中,所述目标加权和为所述多个加权和中大于或者等于预设加权和的加权和。
根据本发明的一个实施例,还提供了一种标签推荐装置,包括:第一选择模块,用于从所述标签层次体系中选择出资源的每个主题对应的候选标签;第二选择模块,用于从所述每个主题对应的候选标签中选择出每个主题对应的推荐标签;推荐模块,用于根据所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
可选地,所述第一选择模块包括:遍历选择单元,用于遍历所述标签层次体系中各个分支,从每个分支中选择出候选标签,将从所有分支中选择出的候选标签作为与所述每个主题对应的候选标签。
可选地,所述遍历选择单元用于:对于所述标签层次体系中的每个分支,从所述分支中的指定标签节点中选择出候选标签,其中,所述指定标签节点为所述分支中除属性标签节点以及所述资源的标签节点的上一节点之外的节点。
可选地,所述推荐模块包括:确定单元,用于确定所述每个主题对应的每个推荐标签对于所述资源的推荐值,并确定所述每个主题的权重,其中,所述推荐值用于指示所述每个推荐标签推荐给资源的概率;推荐单元,用于根据确定出的所述每个推荐标签对于所述资源的所述推荐值和所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
可选地,所述推荐标签的数量为多个,所述确定单元用于:确定多个推荐标签的每个推荐标签在所述每个主题中的重要值,以及确定所述多个推荐标签中的所述每个推荐标签与所述资源的关联度值,其中,所述关联度值为所述每个推荐标签与所述资源之间的最短路径长度;根据所述重要值和所述关联度值确定所述每个主题对应的推荐标签对于所述资源的推荐值。
可选地,所述推荐值通过以下公式得到:Jz(w,s)=Rz(w)*Fz(w,s),其中,Rz(w)为所述每个推荐标签在所述每个主题中的重要值,Fz(w,s)所述每个推荐标签与所述资源的关联度值,Jz(w,s)为所述推荐值。
可选地,所述确定单元用于:获取所述资源所属的全部主题的数量;计算所述每个主题在所述资源所属的全部主题中排序位置;基于所述排序位置和所述数量确定所述每个主题的权重值。
可选地,所述权重通过以下公式得到:其中,qz为所述每个主题在所述资源所属的全部主题中排序位置,Cz,s为所述资源所属的全部主题的数量。
可选地,所述确定单元用于:基于所述主题的标签层次体系,计算所述资源距离所述每个主题根节点的最短路径长度;根据计算得到的所述资源距离所述每个主题根节点的最短路径长度确定所述每个主题在所述资源所属的全部主题中排序位置。
可选地,所述推荐单元用于:计算所述每个推荐标签在所述每个主题中对于所述资源的推荐值与所述每个推荐标签在所述每个主题中的权重值的加权和,得到多个加权和;根据计算出的所述多个加权和从所述每个主题对应的推荐标签中进行标签推荐。
可选地,所述推荐单元用于:将计算得到的所述多个加权和按照由高到低的顺序进行排序,得到排序列表;确定所述排序列表中目标加权和对应的推荐标签为对所述资源进行推荐的标签,其中,所述目标加权和为所述多个加权和中大于或者等于预设加权和的加权和。
通过本发明,基于建立的主题的标签层次体系,选择每个主题的推荐标签,然后再依据每个主题的权重将选择的每个主题的推荐标签进行标签推荐,由此可见,采用上述方案能够准确地为相应地资源推荐标签,因此,提高了为资源推荐的社会化标签的准确度,从而解决了相关技术中为资源定义的社会化标签不准确的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种标签推荐方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种标签推荐方法的流程图;
图3是根据本发明实施例的一种标签层次体系的示意图;
图4是根据本发明实施例的一种标签推荐装置的结构框图一;
图5是根据本发明实施例的一种标签推荐装置的结构框图二;
图6是根据本发明实施例的一种标签推荐装置的结构框图三;
图7是根据本发明实施例标签推荐装置的结构图;
图8是根据本发明实施例标签推荐方法的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本申请实施例1所提供的装置实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种标签推荐方法的移动终端的硬件结构框图,如图1所示,移动终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的载波相位恢复装置对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的装置。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network InterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种标签推荐方法,图2是根据本发明实施例的一种标签推荐方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,从标签层次体系中选择出资源的每个主题对应的候选标签;
标签层次体系为依据资源的社会化标签构建的基于主题的标签层次体系,其中,主题用于反映资源的部分属性,标签是为资源设置的社会化标签,社会化标签是用户对资源设置的标签。
步骤S204,从每个主题对应的候选标签中选择出每个主题对应的推荐标签;
步骤S206,根据每个主题的权重在每个主题对应的推荐标签中进行标签推荐。
在本发明实施例中,上述资源可以为网络资源,例如,网络中某个博客发表的一篇文章,还可以为某个电影、电视,以及视频片段等资源。主题用于表征资源的部分属性。例如,某个博客发表的一篇文章的属性可以是该文章的题材,主题还可以是该文章的作者国籍,是国内,还是国外,主题还可以是该文章的发表时间等。又例如,某个电影的主题可以为该电影的演员、导演、题材、所属国家等信息。如果上述文章的主题为题材,则用于表征题材属性的标签可以包括言情、军事、古装、悬疑,惊悚等。
对于某个博客发表的一篇文章,不同的阅读者会定义不同的标签,但是每个阅读者定义的标签往往是不相同的,因此,在本发明实施例中,可以首先在阅读者定义的多个标签中为该文章选择候选标签,然后在候选标签中选择出每个主题对应的推荐标签(又可称为标签推荐),最后,根据选择出的每个主题对应的推荐标签为资源进行标签推荐。
在本发明实施例中,上述标签层次体系可以为树状,此时,从标签层次体系中选择出资源的每个主题对应的候选标签可以具体为:遍历标签层次体系中各个分支,从每个分支中选择出候选标签,将从所有分支中选择出的候选标签作为与每个主题对应的候选标签。
具体地,遍历标签层次体系中各个分支,从每个分支中选择出候选标签可以具体为:对于标签层次体系中的每个分支,从分支中的指定标签节点中选择出候选标签,其中,指定标签节点为分支中除属性标签节点以及资源的标签节点的上一节点之外的节点。
下面结合图3对本发明实施例进行说明。由于主题标签层次体系是关于某个具体主题,逐渐细化的描述,在主题标签层次体系包括至少一个分支,上述主题标签层次体系可以为如图3所示的一种树状的标签层次体系。在该标签层次体系图中,用“---”线所表示的分支即为该树状图的一个分支。在为资源的每个主题选择候选标签时,可以在如图3中所示的树状图的各个分支中选择出候选标签。
下面以一个分支为例进行说明。在如图3所示的树状体系图中,主题z所在节点为根节点,图3中的叶子节点即为属性标签节点,属性标签节点也即属性1至属性n所在的节点即为属性标签节点,叶子节点的上一节点即为资源s的标签节点。如图3所示,在该分支中,还包括开放分类标签节点和标签w。在该分支中,从根节点到包含待推荐资源s所在节点的标签,以及该资源s的属性标签(即,上述属性1至属性n所在的节点)是与待推荐资源s最为相关的标签,因此,可以在从根节点到包含待推荐资源所在节点中的标签和资源s的属性标签中选择每个主题在该分支中的候选标签,然后将所有分支中选择出的候选标签作为该主题中的候选标签。
具体地,由于在该分支中,与资源s最相关的标签,除了位于其上位节点的开放分类标签和位于其下位的属性标签之外,就是从根节点z到资源s之间的分支中的所有标签,因此可以遍历该分支上除了属性标签和开放分类标签之外的所有标签节点,然后选择出该主题在该分支上的候选标签,其中,该分支上除了属性标签和开放分类标签之外的所有标签节点可以包含位于主题标签层次体系较上层的主题核心标签和其他非核心标签。
在本发明实施例中,在选择出每个主题的候选标签之后,还可以在每个主题的候选标签中选择推荐标签,然后根据每个主题的权重从每个主题对应的推荐标签中进行标签推荐。由于资源的多个主题的侧重点可能不相同,因此,可以为每个主题确定一个权重值,以根据该权重值在每个主题的推荐标签中进行标签推荐,具体可以通过以下方式进行标签推荐:确定每个主题对应的每个推荐标签对于资源的推荐值,并确定每个主题的权重,其中,推荐值用于指示每个推荐标签推荐给资源的概率,然后,根据确定出的每个推荐标签对于资源的推荐值和每个主题的权重在每个主题对应的推荐标签中进行标签推荐。
在如图3所示的标签体系图中,由于资源s所属的主题可以有多个,因此,可以首先计算其中任一个主题z对应的一个或者多个推荐标签在该主题z中对于资源s的推荐值Jz(w,s),然后,根据计算出的每个主题的推荐值Jz(w,s)和该主题z的权重Iz(s)从每个主题对应的推荐标签中进行标签推荐,即根据推荐值Jz(w,s)和权重Iz(s)从每个主题的推荐标签中选择为用户进行推荐的标签。其中,Jz(w,s)表示主题z对于资源的推荐值,Iz(s)表示主题z的权重,主题z为资源所属的多个主题中的任一个主题。
如果推荐标签的数量为多个,则确定每个主题对应的推荐标签对于资源的推荐值可以具体为:确定多个推荐标签的每个推荐标签在每个主题中的重要值,以及确定多个推荐标签中的每个推荐标签与资源的关联度值,其中,关联度值为每个推荐标签与资源之间的最短路径长度;根据重要值和关联度值确定每个主题对应的推荐标签对于资源的推荐值。
在本发明实施例中,可以通过公式Jz(w,s)=Rz(w)*Fz(w,s)计算主题z中每个推荐标签对于资源的推荐值,其中,Rz(w)表示主题z的每个推荐标签在主题z中的重要值(又可以称为重要性值),其中,该重要性值表示每个推荐标签在所属主题中的重要程序,该值可以通过主题标签层次体系构建时的主题标签抽取阶段得到,主题z为资源所属的多个主题中的任一个主题。Fz(w,s)表示主题z的每个推荐标签w与资源s的关联度值(又可以称为相关程度),该关联度值表示主题z中的每个推荐标签与资源s的关联程度,其中,关联度值的计算方法为:在以主题z为根节点的主题标签层次体系中,主题z的每个推荐标签w与资源s之间的最短路径长度(又可称为边权重之和)的倒数,其中,边权重取自于主题标签层次体系构建的结果。
如果资源所属的主题为多个,则确定每个主题的权重可以具体为:获取资源所属的全部主题的数量;计算每个主题在资源所属的全部主题中排序位置;基于排序位置和数量确定每个主题的权重值。
在本发明实施例中,可以通过公式计算每个主题的权重,其中,Iz(s)即为主题z的权重,主题z为资源s所属的多个主题中的任意一个主题,Iz(s)用于表征主题z对于资源s的重要性,如上述公式所示,每个主题的权重可以由资源s所属的全部主题的数目Cz,s,以及主题z在资源s所属的全部主题中的排序位置qz共同决定。
其中,排序位置qz的计算方法是:基于主题的标签层次体系,计算资源距离每个主题根节点的最短路径长度;根据计算得到的资源距离每个主题根节点的最短路径长度确定每个主题在资源所属的全部主题中排序位置。
具体地,对于资源s所属的全部主题,分别在对应的主题标签层次体系中,计算出资源s距离每个主题根节点的最短路径长度(又可以称为边权重之和)。然后,按照从大到小的顺序,排序得到主题z在资源s所属主题集合中的位置,即上述排序位置qz
通过上述步骤确定出每个主题的权重和推荐值之后,根据确定出的每个推荐标签对于资源的推荐值和每个主题的权重从每个主题对应的推荐标签中进行标签推荐可以具体为:计算每个推荐标签在每个主题中对于资源的推荐值与每个推荐标签在每个主题中的权重值的加权和,得到多个加权和;根据计算出的多个加权和从每个主题对应的推荐标签中进行标签推荐。
其中,根据计算出的加权和从每个主题对应的推荐标签中进行标签推荐包括:将计算得到的多个加权和按照由高到低的顺序进行排序,得到排序列表;确定排序列表中目标加权和对应的推荐标签为对资源进行推荐的标签,其中,目标加权和为多个加权和中大于或者等于预设加权和的加权和。
具体地,考虑到每个资源往往属于多个主题,不同主题对于资源的重要性也不尽相同,其中,重要性值越高的主题推荐出的标签对于资源也会越重要。因此,在综合资源所属全部主题的标签推荐中,主题对于资源的重要性也是影响标签推荐的主要因素。于是,进一步通过公式J(w,s)=∑zRz(w)*Iz(s)*Fz(w,s),并根据资源s所属的每个主题z对于资源s的重要性Iz(s),为每个主题z的推荐标签分配权重,并综合资源所属的全部主题,计算得出每个主题z的推荐标签对于资源s的推荐值J(w,s)。
例如,资源s所属的主题包括主题1、主题2和主题3,上述三个主题的权重分别为a、b、c,其中,a>b>c;主题1中的推荐标签包括标签1、标签2、标签3、标签4,主题2中的推荐标签包括标签1、标签2、标签5,主题3中的推荐标签包括标签1、标签2、标签3,其中,主题1、主题2和主题3中的标签1为相同的标签,标签2为相同的标签,标签3为相同的标签。首先计算标签1、标签2、标签3、标签4在主题1中对于资源s的推荐值分别为k1、k2、k3、k4,然后上述推荐值k1、k2、k3、k4均分别乘以主题1的权重a,得到k1*a、k2*a、k3*a、k4*a;然后,计算标签1、标签2、标签5在主题1中对于资源s的推荐值分别为k5、k6、k7,然后上述推荐值k5、k6、k7均分别乘以主题2的权重b,得到k5*b、k6*b、k7*b;接下来计算标签1、标签2、标签3在主题3中对于资源s的推荐值分别为k8、k9、k10,然后上述推荐值k8、k9、k10均分别乘以主题3的权重c,得到k8*c、k9*c、k10*c。最后,计算上述标签1至标签5对于资源的推荐值,分别为:k1*a+k5*b+k8*c、k2*a+k6*b+k9*c、k3*a+k10*c、k4*a、k7*b,将上述得到的每个标签对于资源的推荐进行排序,得到排序列表,在该排序列表中选择推荐值较大的标签推荐给该资源。假设标签1、标签2、标签3、标签5的对于资源推荐值较大,则将上述标签1、标签2、标签3、标签5推荐给资源。
通过上述步骤,首先基于建立的主题的标签层次体系,选择每个主题的推荐标签,然后再依据每个主题的权重将选择的每个主题的推荐标签进行标签推荐,由此可见,采用上述方案能够准确地为相应地资源推荐标签,因此,提高了为资源推荐的社会化标签的准确度,从而解决了相关技术中为资源定义的社会化标签不准确的问题。
可选地,上述步骤S202-S206的执行主体可以为web服务器等,但不限于此。
标签推荐作为推荐任务的一种,是企业界和学术界广泛关注的研究课题,不仅有助于提高社会化标签的质量,使社会化标签在资源揭示、分享、组织、检索、发现、使用中的作用得以更好地发挥,还有助于简化用户的标注程序,改善用户对社会化标签应用系统的体验。同时,标签推荐作为主题标签层次体系的应用,可以从实用角度评价主题标签层次体系的质量,促进主题标签层次体系评价以及相关研究的共同发展。
需要说明的是,在本发明实施例中,除上述标签推荐方式之外,还可以通过以下方式进行标签推荐:基于内容的标签推荐系统、基于协同过滤的标签推荐系统、基于关联规则的标签推荐系统、基于张量分解的标签推荐系统、基于图的标签推荐系统、基于知识的标签推荐系统和基于混合方法的标签推荐系统。
(1)基于内容的标签推荐系统不存在冷启动的问题,主要是使用机器学习的方法对待标注的资源提取内容特征,并计算每一个特征的重要性。然后,计算已有标签和待标注资源内容特征之间的语义相似度。接着,根据特征的重要性值排序标签推荐的候选,并从中推荐出排序靠前的标签。
(2)基于协同过滤的标签推荐系统与资源的内容无关,只需要分析其他用户对相同资源标注的标签,或者该用户的标注历史和喜好,找到最相似的用户。然后,将最相似的用户所使用的标签作为标签推荐的结果。但是,这类系统存在数据稀疏和冷启动的问题。
(3)基于关联规则的标签推荐系统需要人工预先定义一些标签推荐的规则,或者通过分析用户标注发现关联规则,对资源进行标签推荐。基于关联规则的标签推荐系统优点是简单直接,但是无法保证规则的质量,而且不能动态更新。随着规则数量的不断增多,系统会变得越来越难以管理。
(4)基于张量分解的标签推荐系统针对用户、标签、资源三者之间的关系,选择三阶张量而不是二阶矩阵的方式建模,原因在于二阶矩阵对于关系的描述往往不够全面,容易遗漏其中的部分关系。继而,使用高阶奇异值分解对三阶张量降维,通过分析发现的潜在语义给资源推荐合适的标签。
(5)基于图的标签推荐系统受到PageRank算法的启发,在由用户、标签、资源三者之间的关系组成的无向异构图上随机游走,迭代计算并推荐出评分最高的标签。
(6)基于知识的标签推荐系统需要资源的领域先验知识,并能够将知识以易于推理的方式存储于知识库中,作为标签推荐的依据。然后,围绕标签推荐依据,制定合理的标签推荐策略。最后,从标签推荐候选中,对待推荐的资源进行标签推荐。可见,基于知识的标签推荐系统研究的瓶颈在于标签推荐依据的建设。
(7)由于上述标签推荐系统各有优缺点,研究者往往采取由综合多种混合方法的标签推荐系统,以获得更好的推荐结果。
主题标签层次体系评价的方法主要可以归纳为:人工评价、语义评价、实用评价、分布评价四种。(1)人工评价根据人工预先设定的标准对从社会化标签中构建的主题标签层次体系打分,通过综合不同评价人员的打分得到最终的评价结果。(2)语义评价通过从社会化标签中构建的主题标签层次体系和参考层次体系的对比,获得评价的结果。语义评价的关键是参考层次体系的选择,可以根据具体情况来定,具有较大的灵活性。首先,参考层次体系可以是普遍认可的标准层次体系,如ODP(Open Directory Project)、LACC(Library of AmericanCongress Classification)、DC(Dublin Core Ontology)、Wikipedia、WordNet、中图分类法等;其次,参考层次体系也可以是数据来源层次体系;再次,参考层次体系还可以是目前较先进的技术产生的主题标签层次体系。(3)实用评价将从社会化标签中构建的主题标签层次体系应用到具体任务中,通过对任务支持和完成情况的评价,间接评价主题标签层次体系的质量。(4)通过标签的分布程度,评价从社会化标签中构建的主题标签层次体系。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例该的方法。
实施例2
在本实施例中还提供了一种标签推荐装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的一种标签推荐装置的结构框图一,如图4所示,该装置包括:
第一选择模块41,用于从标签层次体系中选择出资源的每个主题对应的候选标签;
第二选择模块43,用于从每个主题对应的候选标签中选择出每个主题对应的推荐标签;
推荐模块45,用于根据每个主题的权重在每个主题对应的推荐标签中进行标签推荐。
图5是根据本发明实施例的一种标签推荐装置的结构框图二,如图5所示,标签层次体系为树状,第一选择模块41包括:
遍历选择单元51,用于遍历标签层次体系中各个分支,从每个分支中选择出候选标签,将从所有分支中选择出的候选标签作为与每个主题对应的候选标签;
可选地,遍历选择单元用于:对于标签层次体系中的每个分支,从分支中的指定标签节点中选择出候选标签,其中,指定标签节点为分支中除属性标签节点以及资源的标签节点的上一节点之外的节点。
图6是根据本发明实施例的一种标签推荐装置的结构框图三,如图6所示,推荐模块45包括:
确定单元61,用于确定每个主题对应的每个推荐标签对于资源的推荐值,并确定每个主题的权重,其中,推荐值用于指示每个推荐标签推荐给资源的概率;
推荐单元63,用于根据确定出的每个推荐标签对于资源的推荐值和每个主题的权重在每个主题对应的推荐标签中进行标签推荐;
可选地,推荐标签的数量为多个,确定单元用于:
确定多个推荐标签的每个推荐标签在每个主题中的重要值,以及确定多个推荐标签中的每个推荐标签与资源的关联度值,其中,关联度值为每个推荐标签与资源之间的最短路径长度;
根据重要值和关联度值确定每个主题对应的推荐标签对于资源的推荐值。
可选地,推荐值通过以下公式得到:Jz(w,s)=Rz(w)*Fz(w,s),其中,Rz(w)为每个推荐标签在每个主题中的重要值,Fz(w,s)为每个推荐标签与资源的关联度值,Jz(w,s)为推荐值。
可选地,确定单元用于:获取资源所属的全部主题的数量;计算每个主题在资源所属的全部主题中排序位置;基于排序位置和数量确定每个主题的权重值。
可选地,权重通过以下公式得到:其中,qz为每个主题在资源所属的全部主题中排序位置,Cz,s为资源所属的全部主题的数量。
可选地,确定单元用于:基于主题的标签层次体系,计算资源距离每个主题根节点的最短路径长度;
根据计算得到的资源距离每个主题根节点的最短路径长度确定每个主题在资源所属的全部主题中排序位置。
可选地,推荐单元用于:计算每个推荐标签在每个主题中对于资源的推荐值与每个推荐标签在每个主题中的权重值的加权和,得到多个加权和;根据计算出的多个加权和从每个主题对应的推荐标签中进行标签推荐。
可选地,推荐单元用于:将计算得到的多个加权和按照由高到低的顺序进行排序,得到排序列表;确定排序列表中前预设数量的加权和对应的推荐标签为对资源进行推荐的标签。
实施例3
图7是根据本发明优选实施例的一种标签推荐装置的结构图,如图7所示,该装置包括以下模块:标签推荐依据模块71、推荐候选标签模块73、标签推荐模块75和标签推荐功能模块77。
如图7所示,首先,通过标签推荐依据模块71确定出待推荐资源的所属多个主题中的候选标签;接下来,通过推荐候选标签模块73在多个主题中的候选标签中选择推荐标签;然后,标签推荐模块75通过应用上述步骤S206中所描述的标签推荐方法进行标签推荐,最后通过标签推荐功能模块77实现标签推荐的功能;同时,标签推荐功能模块77还可以通过标签推荐功能的实现效果间接评价标签推荐依据模块71。
图8是根据本发明优选实施例的一种标签推荐方法的流程图,如图8所示,包括多个主题标签层次体系,其中,主题分别为主题1、主题2、主题3等多个主题。资源1在主题1中的推荐标签为标签1、标签2、标签3,……,标签n等多个标签,资源1在主题2中的推荐标签为标签1、标签2、标签3,……,标签m等多个标签,资源1在主题3中的推荐标签为标签1、标签2、标签3,……,标签k等多个标签。通过上述步骤S208中的标签推荐方法进行标签推荐之后,为资源1推荐的标签为标签1、标签2、标签3,……,标签h等多个标签。需要说明的是,在本发明实施例中,为资源1推荐的标签可以为主题1至主题3中的一个或者多个标签,该一个或者多个标签对于资源1的推荐值大于剩余未推荐标签对于资源的推荐值。
下面就资源1的推荐标签的获取方法进行介绍。首先,以自动构建完成的主题标签层次体系作为标签推荐依据,从中确定出待推荐资源的候选标签。然后,在此基础上,根据标签推荐策略,从待推荐资源所属的每一个主题标签层次体系的候选标签中,获得与此主题相关的推荐标签。最后,综合资源所属的全部主题,排序得到资源最终的推荐标签,按照步骤S208中的标签推荐方法为资源选取最终的推荐标签。
在本发明实施例中,基于主题标签层次体系是自动构建的主题标签层次体系,步骤S206中所描述的标签推荐方法是整个系统的核心,通过上述标签推荐功能模块77所实现的标签推荐功能可以简单地形式化描述为:可以按照每个主题的推荐标签对于资源s的推荐值J(w,s)从高到低排序的标签列表,为待推荐的资源s(资源名称)提供最终的推荐标签。
基于标签推荐依据模块71自动构建的主题标签层次体系,通过推荐候选标签模块73,在每一个主题对应的主题标签层次体系中,得出该资源在此主题中的推荐标签结果。然后,根据不同主题对于资源s的重要性不同,为每个主题相关的标签推荐结果分配权重。最后,综合资源所属的全部主题,排序得到资源最终的标签推荐结果。
以主题z为根节点的主题标签层次体系中,对于待推荐资源s的推荐标签w,推荐标签w在主题z中的重要性以及推荐标签w与资源s的相关程度是影响标签推荐的主要因素。为此,通过公式Jz(w,s)=Rz(w)*Fz(w,s)计算推荐标签w在主题z中对于资源s的推荐值Jz(w,s)。
其中,Rz(w)表示标签w在主题z中的重要性值,通过主题标签层次体系构建时的主题标签抽取阶段得到。Fz(w,s)表示标签w与资源s的相关程度,计算方法为:在以z为根节点的主题标签层次体系中,标签w与资源s之间的最短路径长度(边权重之和)的倒数,其中,边权重取自于主题标签层次体系构建的结果。
考虑到资源往往属于多个主题,不同主题对于资源的重要性也不尽相同。假设,重要性值越高的主题推荐出的标签对于资源也会越重要。因此,在综合资源所属全部主题的标签推荐中,主题对于资源的重要性也是影响标签推荐的主要因素。于是,我们进一步通过公式J(w,s)=∑zRz(w)*Iz(s)*Fz(w,s),根据资源s所属的每个主题z对于资源s的重要性Iz(s),为每个具体主题z推荐的标签w分配权重,并综合资源所属的全部主题,计算得出标签w对于资源s的推荐值J(w,s)。
其中,Iz(s)表示主题z对于资源s的重要性,如公式所示,由资源s所属的全部主题的数目Cz,s,以及主题z在资源s所属主题集合中的排序位置qz共同决定。
其中,qz的计算方法是:对于资源s所属的全部主题,分别在对应的主题标签层次体系中,计算出资源s距离每个主题根节点的最短路径长度(边权重之和)。然后,按照从大到小的顺序,排序得到主题z在资源s所属主题集合中的位置。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本发明的保护范围应以权利要求所述为准。
实施例4
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的装置可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的装置。
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1;从所述标签层次体系中选择出资源的每个主题对应的候选标签;
S2,从所述每个主题对应的候选标签中选择出每个主题对应的推荐标签;
S3,根据所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
可选地,存储介质还被设置为存储用于执行上述实施例记载的装置步骤的程序代码:
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行上述实施例记载的装置步骤。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种标签推荐方法,其特征在于,包括:
从标签层次体系中选择出资源的每个主题对应的候选标签;
从所述每个主题对应的候选标签中选择出每个主题对应的推荐标签;
根据所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
2.根据权利要求1所述的方法,其特征在于,从所述标签层次体系中选择出所述资源的每个主题对应的候选标签包括:
遍历所述标签层次体系中各个分支,从每个分支中选择出候选标签,将从所有分支中选择出的候选标签作为与所述每个主题对应的候选标签。
3.根据权利要求2所述的方法,其特征在于,遍历所述标签层次体系中各个分支,从每个分支中选择出候选标签包括:
对于所述标签层次体系中的每个分支,从所述分支中的指定标签节点中选择出候选标签,其中,所述指定标签节点为所述分支中除属性标签节点以及所述资源的标签节点的上一节点之外的节点。
4.根据权利要求1所述的方法,其特征在于,根据所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐包括:
确定所述每个主题对应的推荐标签对于所述资源的推荐值,并确定所述每个主题的权重,其中,所述推荐值用于指示所述推荐标签推荐给资源的概率;
根据确定出的所述推荐标签对于所述资源的所述推荐值和所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
5.根据权利要求4所述的方法,其特征在于,所述推荐标签的数量为多个,确定所述每个主题对应的推荐标签对于所述资源的推荐值包括:
确定多个推荐标签中的每个推荐标签在所述每个主题中的重要值,以及确定所述多个推荐标签中的所述每个推荐标签与所述资源的关联度值,其中,所述关联度值为所述每个推荐标签与所述资源之间的最短路径长度的倒数;
根据所述重要值和所述关联度值确定所述每个主题对应的推荐标签对于所述资源的推荐值。
6.根据权利要求5所述的方法,其特征在于,所述推荐值通过以下公式得到:Jz(w,s)=Rz(w)*Fz(w,s),其中,Rz(w)为所述每个推荐标签在所述每个主题中的重要值,Fz(w,s)为所述每个推荐标签与所述资源的关联度值,Jz(w,s)为所述推荐值。
7.根据权利要求4所述的方法,其特征在于,确定所述每个主题的权重包括:
获取所述资源所属的全部主题的数量;
计算所述每个主题在所述资源所属的全部主题中排序位置;
基于所述排序位置和所述数量确定所述每个主题的权重值。
8.根据权利要求7所述的方法,其特征在于,所述权重通过以下公式得到:其中,qz为所述每个主题在所述资源所属的全部主题中排序位置,Cz,s为所述资源所属的全部主题的数量,Iz(s)为所述每个主题的权重。
9.根据权利要求8所述的方法,其特征在于,计算所述每个主题在所述资源所属的全部主题中排序位置包括:
基于所述主题的标签层次体系,计算所述资源距离所述每个主题根节点的最短路径长度;
根据计算得到的所述资源距离所述每个主题根节点的最短路径长度确定所述每个主题在所述资源所属的全部主题中排序位置。
10.根据权利要求4所述的方法,其特征在于,根据确定出的所述每个推荐标签对于所述资源的所述推荐值和所述每个主题的权重从所述每个主题对应的推荐标签中进行标签推荐包括:
计算所述每个推荐标签在所述每个主题中对于所述资源的推荐值与所述每个推荐标签在所述每个主题中的权重值的加权和,得到多个加权和;
根据计算出的所述多个加权和从所述每个主题对应的推荐标签中进行标签推荐。
11.根据权利要求10所述的方法,其特征在于,根据计算出的所述加权和从所述每个主题对应的推荐标签中进行标签推荐包括:
将计算得到的所述多个加权和按照由高到低的顺序进行排序,得到排序列表;
确定所述排序列表中目标加权和对应的推荐标签为对所述资源进行推荐的标签,其中,所述目标加权和为所述多个加权和中大于或者等于预设加权和的加权和。
12.一种标签推荐装置,其特征在于,包括:
第一选择模块,用于从所述标签层次体系中选择出资源的每个主题对应的候选标签;
第二选择模块,用于从所述每个主题对应的候选标签中选择出每个主题对应的推荐标签;
推荐模块,用于根据所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
13.根据权利要求12所述的装置,其特征在于,所述第一选择模块包括:
遍历选择单元,用于遍历所述标签层次体系中各个分支,从每个分支中选择出候选标签,将从所有分支中选择出的候选标签作为与所述每个主题对应的候选标签。
14.根据权利要求13所述的装置,其特征在于,所述遍历选择单元用于:
对于所述标签层次体系中的每个分支,从所述分支中的指定标签节点中选择出候选标签,其中,所述指定标签节点为所述分支中除属性标签节点以及所述资源的标签节点的上一节点之外的节点。
15.根据权利要求12所述的装置,其特征在于,所述推荐模块包括:
确定单元,用于确定所述每个主题对应的推荐标签对于所述资源的推荐值,并确定所述每个主题的权重,其中,所述推荐值用于指示所述推荐标签推荐给资源的概率;
推荐单元,用于根据确定出的所述推荐标签对于所述资源的所述推荐值和所述每个主题的权重在所述每个主题对应的推荐标签中进行标签推荐。
16.根据权利要求15所述的装置,其特征在于,所述推荐标签的数量为多个,所述确定单元用于:
确定多个推荐标签的每个推荐标签在所述每个主题中的重要值,以及确定所述多个推荐标签中的所述每个推荐标签与所述资源的关联度值,其中,所述关联度值为所述每个推荐标签与所述资源之间的最短路径长度;
根据所述重要值和所述关联度值确定所述每个主题对应的推荐标签对于所述资源的推荐值。
17.根据权利要求16所述的装置,其特征在于,所述推荐值通过以下公式得到:Jz(w,s)=Rz(w)*Fz(w,s),其中,Rz(w)为所述每个推荐标签在所述每个主题中的重要值,Fz(w,s)所述每个推荐标签与所述资源的关联度值,Jz(w,s)为所述推荐值。
18.根据权利要求15所述的装置,其特征在于,所述确定单元用于:
获取所述资源所属的全部主题的数量;
计算所述每个主题在所述资源所属的全部主题中排序位置;
基于所述排序位置和所述数量确定所述每个主题的权重值。
19.根据权利要求18所述的装置,其特征在于,所述权重通过以下公式得到:其中,qz为所述每个主题在所述资源所属的全部主题中排序位置,Cz,s为所述资源所属的全部主题的数量。
20.根据权利要求19所述的装置,其特征在于,所述确定单元用于:
基于所述主题的标签层次体系,计算所述资源距离所述每个主题根节点的最短路径长度;
根据计算得到的所述资源距离所述每个主题根节点的最短路径长度确定所述每个主题在所述资源所属的全部主题中排序位置。
21.根据权利要求15所述的装置,其特征在于,所述推荐单元用于:
计算所述每个推荐标签在所述每个主题中对于所述资源的推荐值与所述每个推荐标签在所述每个主题中的权重值的加权和,得到多个加权和;
根据计算出的所述多个加权和从所述每个主题对应的推荐标签中进行标签推荐。
22.根据权利要求21所述的装置,其特征在于,所述推荐单元用于:
将计算得到的所述多个加权和按照由高到低的顺序进行排序,得到排序列表;
确定所述排序列表中目标加权和对应的推荐标签为对所述资源进行推荐的标签,其中,所述目标加权和为所述多个加权和中大于或者等于预设加权和的加权和。
CN201610323645.8A 2016-05-16 2016-05-16 标签推荐方法及装置 Active CN107391509B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610323645.8A CN107391509B (zh) 2016-05-16 2016-05-16 标签推荐方法及装置
PCT/CN2017/081584 WO2017198039A1 (zh) 2016-05-16 2017-04-24 标签推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610323645.8A CN107391509B (zh) 2016-05-16 2016-05-16 标签推荐方法及装置

Publications (2)

Publication Number Publication Date
CN107391509A true CN107391509A (zh) 2017-11-24
CN107391509B CN107391509B (zh) 2023-06-02

Family

ID=60324842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610323645.8A Active CN107391509B (zh) 2016-05-16 2016-05-16 标签推荐方法及装置

Country Status (2)

Country Link
CN (1) CN107391509B (zh)
WO (1) WO2017198039A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697258A (zh) * 2018-12-27 2019-04-30 丹翰智能科技(上海)有限公司 一种用于确定目标用户的定制财经信息的方法与设备
CN109710852A (zh) * 2018-12-27 2019-05-03 丹翰智能科技(上海)有限公司 一种用于确定财经信息的标签信息的方法与设备
CN110309294A (zh) * 2018-03-01 2019-10-08 优酷网络技术(北京)有限公司 内容集合的标签确定方法及装置
CN111061889A (zh) * 2018-10-16 2020-04-24 京东方科技集团股份有限公司 图片多标签的自动识别方法和装置
CN111212303A (zh) * 2019-12-30 2020-05-29 咪咕视讯科技有限公司 视频推荐方法、服务器和计算机可读存储介质
CN112148964A (zh) * 2019-06-29 2020-12-29 阿里巴巴集团控股有限公司 信息处理、推荐方法、系统及设备
CN112669137A (zh) * 2020-12-21 2021-04-16 招商局金融科技有限公司 基于存量客户的风险分析方法、装置及计算机可读存储介质
CN113301095A (zh) * 2020-12-08 2021-08-24 阿里巴巴集团控股有限公司 提供云端对象的数据的方法以及装置
CN113516538A (zh) * 2021-07-28 2021-10-19 云南腾云信息产业有限公司 一种信息推送方法、装置及计算机设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326203B (zh) * 2021-06-22 2022-08-12 深圳前海微众银行股份有限公司 一种信息推荐方法、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002048911A1 (en) * 2000-12-17 2002-06-20 Gammasite Inc. A system and method for multi-class multi-label hierachical categorization
CN102567392A (zh) * 2010-12-24 2012-07-11 华东师范大学 一种基于时间窗口兴趣主题挖掘的控制方法
CN103886034A (zh) * 2014-03-05 2014-06-25 北京百度网讯科技有限公司 一种建立索引及匹配用户的查询输入信息的方法和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120166414A1 (en) * 2008-08-11 2012-06-28 Ultra Unilimited Corporation (dba Publish) Systems and methods for relevance scoring
CN105022797B (zh) * 2015-06-30 2018-10-09 北京奇艺世纪科技有限公司 一种资源的主题处理方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002048911A1 (en) * 2000-12-17 2002-06-20 Gammasite Inc. A system and method for multi-class multi-label hierachical categorization
CN102567392A (zh) * 2010-12-24 2012-07-11 华东师范大学 一种基于时间窗口兴趣主题挖掘的控制方法
CN103886034A (zh) * 2014-03-05 2014-06-25 北京百度网讯科技有限公司 一种建立索引及匹配用户的查询输入信息的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵亚楠等: "基于社会化标注的博客标签推荐方法", 《计算机工程与设计》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309294A (zh) * 2018-03-01 2019-10-08 优酷网络技术(北京)有限公司 内容集合的标签确定方法及装置
CN110309294B (zh) * 2018-03-01 2022-03-15 阿里巴巴(中国)有限公司 内容集合的标签确定方法及装置
CN111061889A (zh) * 2018-10-16 2020-04-24 京东方科技集团股份有限公司 图片多标签的自动识别方法和装置
CN111061889B (zh) * 2018-10-16 2024-03-29 京东方艺云(杭州)科技有限公司 图片多标签的自动识别方法和装置
CN109697258A (zh) * 2018-12-27 2019-04-30 丹翰智能科技(上海)有限公司 一种用于确定目标用户的定制财经信息的方法与设备
CN109710852A (zh) * 2018-12-27 2019-05-03 丹翰智能科技(上海)有限公司 一种用于确定财经信息的标签信息的方法与设备
CN112148964A (zh) * 2019-06-29 2020-12-29 阿里巴巴集团控股有限公司 信息处理、推荐方法、系统及设备
CN112148964B (zh) * 2019-06-29 2022-11-18 阿里巴巴集团控股有限公司 信息处理、推荐方法、系统及设备
CN111212303A (zh) * 2019-12-30 2020-05-29 咪咕视讯科技有限公司 视频推荐方法、服务器和计算机可读存储介质
CN113301095A (zh) * 2020-12-08 2021-08-24 阿里巴巴集团控股有限公司 提供云端对象的数据的方法以及装置
CN112669137A (zh) * 2020-12-21 2021-04-16 招商局金融科技有限公司 基于存量客户的风险分析方法、装置及计算机可读存储介质
CN112669137B (zh) * 2020-12-21 2024-03-26 招商局金融科技有限公司 基于存量客户的风险分析方法、装置及计算机可读存储介质
CN113516538A (zh) * 2021-07-28 2021-10-19 云南腾云信息产业有限公司 一种信息推送方法、装置及计算机设备

Also Published As

Publication number Publication date
CN107391509B (zh) 2023-06-02
WO2017198039A1 (zh) 2017-11-23

Similar Documents

Publication Publication Date Title
CN107391509A (zh) 标签推荐方法及装置
Javed et al. Community detection in networks: A multidisciplinary review
US9483500B2 (en) Automatic discovery of popular landmarks
CN106030571B (zh) 基于知识图动态地修改用户界面的元素
Mihalcea et al. Graph-based natural language processing and information retrieval
CN110059271B (zh) 运用标签知识网络的搜索方法及装置
CN110532451A (zh) 针对政策文本的检索方法和装置、存储介质、电子装置
CN110321482A (zh) 一种信息的推荐方法、装置及设备
CN108304493B (zh) 一种基于知识图谱的上位词挖掘方法及装置
CA2802887A1 (en) Systems of computerized agents and user-directed semantic networking
CN110287313A (zh) 一种风险主体的确定方法及服务器
CN109189990A (zh) 一种搜索词的生成方法、装置及电子设备
CN110209810A (zh) 相似文本识别方法以及装置
CN105184326A (zh) 基于图数据的主动学习多标签社交网络数据分析方法
CN110222194A (zh) 基于自然语言处理的数据图表生成方法和相关装置
CN109300041A (zh) 理财策略推荐方法、电子装置及可读存储介质
Flexer et al. Mutual proximity graphs for improved reachability in music recommendation
CN107391540A (zh) 一种小程序展示方法、装置及分类器
CN106708834A (zh) 一种对象搜索方法、装置及服务器
Arora et al. Cross-domain based event recommendation using tensor factorization
CN108153754A (zh) 一种数据处理方法及其装置
Helic et al. Building directories for social tagging systems
Benavent et al. FCA-based knowledge representation and local generalized linear models to address relevance and diversity in diverse social images
KR20180035633A (ko) 인간 의사결정 프로세스의 기계학습에 기초한 의사 결정을 위한 인공지능
CN109271416A (zh) 时间管理推荐方法、电子装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant