CN111324724A - 数据处理方法及装置、电子设备和计算机可读存储介质 - Google Patents

数据处理方法及装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111324724A
CN111324724A CN202010090410.5A CN202010090410A CN111324724A CN 111324724 A CN111324724 A CN 111324724A CN 202010090410 A CN202010090410 A CN 202010090410A CN 111324724 A CN111324724 A CN 111324724A
Authority
CN
China
Prior art keywords
label
tree
tag
target
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010090410.5A
Other languages
English (en)
Other versions
CN111324724B (zh
Inventor
吴文李
刘明亮
莫闻政
黄嘉成
王柳盈
刘剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010090410.5A priority Critical patent/CN111324724B/zh
Publication of CN111324724A publication Critical patent/CN111324724A/zh
Application granted granted Critical
Publication of CN111324724B publication Critical patent/CN111324724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种数据处理方法、装置以及电子设备和计算机可读存储介质,该方法包括:获取目标物料的关键字标签;确定所述关键字标签相对于所述目标物料的标签权重;以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重;根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。根据本公开实施例提供的技术方案可以获取能够准确表征目标物料的物料标签及其相对于目标物料的标签权重。

Description

数据处理方法及装置、电子设备和计算机可读存储介质
技术领域
本公开涉及计算机与互联网技术领域,尤其涉及一种数据处理方法及装置、电子设备和计算机可读存储介质。
背景技术
在当前互联网时代,无论是手游还是端游已经逐步成为人们在休闲娱乐生活中不可或缺的重要组成部分。然而,目前各个游戏厂商推出的游戏种类层出不穷、游戏数量日益增多,由此为游戏玩家选择所要进行游玩的游戏项目带来一定的困惑,甚至在经过长时间浏览之后,仍然无法抉择所要下载并游玩的游戏。
相关技术中,可以使用包括物料标签的目标物料描述目标游戏,其中目标物料既可以是对目标游戏进行推荐的一篇文章或一句话,也可以是对目标游戏中某一装备进行推荐的文章或一句话等,其中目标物料的物料标签可以是能够精准描述目标物料的词语。
在游戏推荐中,可以将描述目标游戏的物料标签与游戏玩家的兴趣偏好做匹配,以实现对游戏玩家的游戏推荐。例如假设目标游戏玩家的兴趣偏好中包括“野牛冲锋枪”,那么就可以将推荐物料中包括“野牛冲锋枪”这一物料标签的目标游戏推荐给目标游戏玩家。
因此,一种可以准确地确定目标物料的物料标签以及其相对于目标物料的标签权重的方法对于游戏推荐来说至关重要。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例提供一种数据处理方法及装置、电子设备和计算机可读存储介质,能够有效地确定描述目标物料的标签及其权重。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提出一种数据处理方法,该方法包括:获取目标物料的关键字标签;确定所述关键字标签相对于所述目标物料的标签权重;以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重。
在一些实施例中,所述中间节点包括第一中间节点和第二中间节点,所述第一中间节点在所述标签树中处于第一层级,所述第二中间节点在所述标签树中处于第二层级,所述第一层级大于第二层级;其中,根据所述子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权,包括:根据所述第一中间节点的子节点的标签权重和所述第一层级确定所述第一中间节点的标签权重;根据所述第二中间节点的子节点的标签权重和所述第二层级确定所述第二中间节点的标签权重,其中所述第一中间节点的标签权重小于第二中间节点标签权重。
在一些实施例中,根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重,包括:根据公式
Figure BDA0002383518110000021
确定所述中间节点的标签权重;其中m代表所述中间节点的子节点的个数,wi代表所述中间节点的第i个子节点的标签权重,Δx代表所述中间节点的当前层级与所述叶子节点的层级差,i为大于或者等于1,且小于或者等于m的正整数。
在一些实施例中,获取目标物料的关键字标签,包括:获取所述目标物料所属的第一对象;从关键字数据库获取所述第一对象的关键字;对所述目标物料进行分词处理,获得第一目标分词;将所述第一目标分词与所述第一对象的关键字进行匹配,确定所述目标物料中的关键字标签。
在一些实施例中,确定所述关键字标签相对于所述目标物料的标签权重,包括:对所述目标物料进行分词处理,获得第二目标分词;根据所述第二目标分词构建词语有向图,并获取每个第二目标分词的初始权重值;根据所述词语有向图以及各个目标分词的初始权重值进行加权求和的迭代处理,获取所述关键字标签相对于所述目标物料的标签权重。
在一些实施例中,以所述关键字标签为叶子节点构建所述目标物料的标签树,包括:获取所述目标物料所属的第二对象的全局标签树;以所述关键字标签为起点,在所述全局标签树中不断向上回溯,直至找到所述全局标签树的根节点以生成所述关键字标签的链状标签路径;以所述全局标签树的根节点为起点,将各个关键字标签的链状标签路径合并,生成所述目标物料的标签树。
在一些实施例中,所述数据处理方法还包括:根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。
在一些实施例中,所述关键字标签包括第一关键字标签和第二关键字标签,所述标签树包括逻辑标签树和物理标签树;其中,根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签,包括:以所述第一关键字标签为叶子节点构建所述目标物料的逻辑标签树;以所述第二关键字标签为叶子节点构建所述目标物料的物理标签树;若所述逻辑标签树和所述物理标签树包括相同的标签,则对所述相同的标签进行去重处理;将去重处理后的逻辑标签树与物理标签树中的标签进行合并处理,以确定所述目标物料的物料标签。
在一些实施例中,所述数据处理方法还包括:获取目标对象的兴趣标签;根据所述目标对象的兴趣标签在多个目标物料的物料标签中确定匹配标签;根据所述匹配标签对应的标签权重确定目标标签;根据所述目标标签对应的目标物料向所述目标对象进行物料推荐。
在一些实施例中,获取目标对象的兴趣标签,包括:获取所述目标对象的历史行为以及所述历史行为对应的历史物料,所述历史物料包括历史物料标签和所述历史物料标签的标签权重;根据所述历史物料标签的标签权重在所述历史物料标签中确定所述目标对象的兴趣标签。
本公开实施例提出一种数据处理装置,包括:关键字标签获取模块、标签权重获取模块、标签树构建模块、第一标签权重确定模块和第二标签权重确定模块。
其中,所述关键字标签获取模块可以配置为获取目标物料的关键字标签;标签权重获取模块,配置为确定所述关键字标签相对于所述目标物料的标签权重;所述标签树构建模块可以配置为以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;所述第一标签权重确定模块可以配置为根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;所述第二标签权重确定模块可以配置为根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重。
本公开实施例提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一项所述的数据处理方法。
本公开实施例提出一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述任一项所述的数据处理方法。
本公开某些实施例提供的数据处理方法、装置及电子设备和计算机可读存储介质,可以从目标物料中确定关键子标签,并以目标物料的关键字标签为叶子节点构建所述目标物料的标签树,然后根据所述关键标签的标签权重自下而上的确定标签树中各个节点的权重。一方面,确定了可以描述目标物料的标签树,另一方面准确的确定了标签树中各个标签相对于所述目标物料的标签权重。通过目标物料的标签树中的各个标签相对于所述目标物料的标签权重可以确定所述目标物料的物料标签,并可以进一步的根据所述目标物料的物料标签向目标对象进行物料推荐。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了应用于本公开实施例的数据处理方法或数据处理装置的示例性系统架构的示意图。
图2是根据一示例性实施例示出的一种应用于数据处理装置的计算机系统的结构示意图。
图3是根据一示例性实施例示出的一种数据处理方法的流程图。
图4是根据一示例性实施例示出的一种有关于目标游戏中的野牛冲锋枪的推荐物料的示意图。
图5是根据一示例性实施例示出的一种目标物料的逻辑标签树。
图6是根据一示例性实施例示出的一种目标物料的物理标签树。
图7是图3中步骤S1在一示例性实施例中的流程图。
图8是图3中步骤S2在一示例性实施例中的流程图。
图9是根据一示例性实施例示出的一种词语有向图的示意图。
图10是根据一示例性实施例示出的一种权重初始化后词语有向图的示意图。
图11是根据一示例性实施例示出的一种权重确定后词语有向图的示意图。
图12是图3中步骤S3在一示例性实施例中的流程图。
图13是图3中步骤S5在一示例性实施例中的流程图。
图14是根据一示例性实施例示出的一种数据处理方法。
图15是根据一示例性实施例示出的一种逻辑标签树的示意图。
图16是根据一示例性实施例示出的一种物理标签树的示意图。
图17是根据一示例性实施例示出的一种数据处理方法。
图18是图17中步骤S81在一示例性实施例中的流程图。
图19是根据一示例性实施例示出的一种数据处理方法。
图20是根据一示例性实施例示出的一种数据处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
本公开所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图仅为本公开的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和步骤,也不是必须按所描述的顺序执行。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本说明书中,用语“一个”、“一”、“该”、“所述”和“至少一个”用以表示存在一个或多个要素/组成部分/等;用语“包含”、“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”、“第二”和“第三”等仅作为标记使用,不是对其对象的数量限制。
下面结合附图对本公开示例实施方式进行详细说明。
图1示出了可以应用于本公开实施例的数据处理方法或数据处理装置的示例性系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。其中,终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、虚拟现实设备、智能家居等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
服务器105可例如获取目标物料的关键字标签;服务器105可例如确定所述关键字标签相对于所述目标物料的标签权重;服务器105可例如以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;服务器105可例如根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;服务器105可例如根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的,服务器105可以是一个实体的服务器,还可以为多个服务器组成,根据实际需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图2,其示出了适于用来实现本申请实施例的终端设备的计算机系统200的结构示意图。图2示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从储存部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统200操作所需的各种程序和数据。CPU 201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的储存部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块和/或单元和/或子单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元和/或子单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些模块和/或单元和/或子单元的名称在某种情况下并不构成对该模块和/或单元和/或子单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备可实现功能包括:获取目标物料的关键字标签;确定所述关键字标签相对于所述目标物料的标签权重;以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
图3是根据一示例性实施例示出的一种数据处理方法的流程图。本公开实施例所提供的方法可以由任意具备计算处理能力的电子设备处理,例如上述图1实施例中的服务器105和/或终端设备102、103,在下面的实施例中,以服务器105为执行主体为例进行举例说明,但本公开并不限定于此。
在游戏领域中,通常会通过一些推荐物料向目标用户推荐目标游戏,该推荐物料既可以是推荐目标游戏的一篇文章或一句话,也可以是推荐目标游戏中某一装备的一篇文章或一句话等。例如,在《XX精英》游戏中有一款冲锋枪叫做“野牛冲锋枪”,为了向用户推荐“野牛冲锋枪”,通常可以提供例如“野牛冲锋枪使用9毫米的子弹,相比其他冲锋枪他最大的特点就是拥有最高53发的子弹容量!超大的子弹容量可以进行更强的火力压制.......”之类的推荐文本,该推荐文本就可以是该游戏中“野牛冲锋枪”的推荐物料。
在一些实施例中,为了方便用户检索或查找感兴趣的推荐物料信息,通常通过一些标签对该推荐物料进行关联性描述。另外,还可以按照各个标签相对于推荐物料的贡献为各个标签赋予权重,权重值越大表示该标签与推荐物料的关联性越强。
为了更加准确、简捷的描述目标游戏,通常还会获取权重值靠前的几个标签作为推荐物料的物料标签。
在相关技术中,通常可以通过以下步骤获取推荐物料的物料标签:
对推荐物料进行分词处理以获得分词结果;根据各个分词结果对推荐物料的贡献大小人工为各个分词赋予权重(或者计算各个分词的全局TFIDF(Term Frequency InverseDocument Frequency,词频逆文本频率指数)值以作为所述权重);通过权重对各个分词进行排序,获取排序靠前的几个分词作为所述目标物料的物料标签。
但是,上述方法存在以下问题:
1、通过人手工为各个分词进行打分,人力成本过高、速度较慢。
2、全局TFIDF值描述的是各个分词相对于全局物料的权重,偏离了标签是为了表征其在当前物料中的重要程度这一目标。
3、仅从推荐物料中获取标签并不能完整、准确的描述推荐物料。例如,对于“野牛冲锋枪使用9毫米的子弹,相比其他冲锋枪他最大的特点就是拥有最高53发的子弹容量!超大的子弹容量可以进行更强的火力压制.......”这篇推荐物料来说,“野牛冲锋枪”、“子弹”可以成为该推荐物料的标签,可以从一定程度上对该推荐物料进行描述,但是这种描述是不准确的,并没有能够从内容分类或者物理分类的角度对该推荐物料进行描述。很容易理解,该推荐物料其实是对“野牛冲锋枪”进行描述,而“野牛冲锋枪”也是一种装备,所以“装备”应该也是该推荐物料的一个标签。
因此,如何获得可以准确、全面描述推荐物料的物料标签成为至关重要的问题。
参照图3,本公开实施例提供的数据处理方法可以包括以下步骤。
在步骤S1中,获取目标物料的关键字标签。
在一些实施例中,所述目标物料可以是任一篇文本资料,例如可以是上述目标游戏中的推荐物料(例如对目标游戏中的某一款枪的进行推荐的物料),也可以是一些新闻物料、销售物料等文本资料。
在一些实施例中,可以通过一些标签来准确、简洁的表征该目标物料。其中,所述标签可以包括关键字标签和非关键字标签,所述关键字标签可以指的目标物料中实际存在的可以描述目标物料的一些关键词,假设目标物料为“野牛冲锋枪使用9毫米的子弹,相比其他冲锋枪他最大的特点就是拥有最高53发的子弹容量!”,那么“野牛冲锋枪”、“子弹”等与该推荐物料关联度较高的词就可以是该推荐物料的关键字标签;所述非关键字标签可以指的是抽象的,用于表征一种分类或某种语义概念,且不一定会出现在物料内容中的词语,例如由于上述物料中的“野牛冲锋枪”在游戏中是一种装备,那么“装备”就可以成为上述推荐物料的非关键字标签,以实现对该目标物料进行一定程度上的描述。
在一些实施例中,可以通过人工或者计算机直接确定所述目标物料的关键字标签。
在另外一些实施例中,还可以通过以下步骤确定所述目标物料的关键字标签:获取所述目标物料所属的第一对象;从关键字数据库获取所述第一对象的关键字;对所述目标物料进行分词处理,获得第一目标分词;将所述第一目标分词与所述第一对象的关键字进行匹配,确定所述目标物料中的关键字标签。
所述目标物料所属的第一对象可以指的是所述目标物料所属的类别(假设所述目标物料是某个游戏的推荐物料,那么该游戏所属的类别(例如闯关类)就可以是所述第一对象);所述目标物料所属的第一对象还可以指的是所述目标物料所属的对象(假设目标物料是某个游戏中的一个装备的推荐物料,那么所述第一对象就可以是该游戏)。
一般来说,可以预先为第一对象设置关键字数据库,然后将第一对象中包括的目标物料中的分词结果与所述关键字数据库做比对,以确定所述目标物料中的关键字标签。
假设目标物料是器械类游戏中的某个“器械游戏XX”对应的推荐物料,那么该器械类游戏就可以是第一对象。
首先,可以为该器械类游戏(可能会包括很多个游戏)预先构建关键字数据库(即预先指定哪些词语可以是该器械类游戏中的关键字);然后对“器械游戏XX”对应的推荐物料进行分词处理,以获得第一目标分词;最后将“器械游戏XX”对应的推荐物料的第一目标分词与该器械类游戏的关键字数据库做比对,以确定“器械游戏XX”对应的推荐物料的关键字标签。
在一些实施例中,所述非关键字标签可以包括逻辑标签和物理标签。其中,所述逻辑标签可以指的是抽象的可以用于表征物料的分类或某些归属关系且不一定出现在目标物料中的标签,又称之为公共标签。所述逻辑标签对应的物品仅在逻辑上存在,在实际中可能并不存在。例如,“教学”、“策略”、“官方资讯”、“赛事”、“教学大神”等就是一种逻辑标签;所述物理标签可以指的是具体的可以实实在在表征一个物件(例如游戏中出现的武器名称、人物名称、地点、打法、绰号等)且不一定出现在目标物料中的标签,又称之为内容标签。例如假设目标物料中存在“野牛冲锋枪”、“野狼冲锋枪”等关键字标签,可以进一步的将上述两种枪上位称之为“冲锋枪”,该“冲锋枪”就可以是所述目标物料的物理标签,再例如,XX荣耀游戏中的“X白”、“X则天”等人物名称。
在步骤S2中,确定所述关键字标签相对于所述目标物料的标签权重。
在一些实施例中,可以初始化所述关键字标签的标签权重,例如可以将所述关键字标签的TFIDF值作为所述关键字标签的标签权重,也可以通过人工定义确定所述关键字标签的标签权重,还可以通过训练完成的神经网络模型确定所述关键字标签的标签权重。
在步骤S3中,以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点。
为了能够自下而上、由具体到抽象的通过标签来描述目标物料,本实施例构建了目标物料的标签树。
由于关键字标签通常在物料内容中出现,是具体的、实实在在表征一个物件的标签,可以利用内容中的上下文关系计算出其相对当前物料的重要性,即标签权重;而非关键字标签通常是未在物料内容中出现过,是抽象的,需要依赖关键字权重才能推导出它本身的权重。将关键字标签设置为叶子节点,只需要将权重单向向上传导即可推导非关键字标签的权重。若将其设为中间节点,那么与之关联的节点会非常多,复杂度增加的同时带来更多的不确定性。因此,本实施例使用关键字标签为叶子节点构建标签树。
图4是根据一示例性实施例示出的一种有关于目标游戏中的野牛冲锋枪的推荐物料的示意图。
在一些实施例中,图4所示的“内容”框中对应的文字可以是目标物料,“标签”框中可以包括该目标物料的关键字标签,例如:和平精英,冲锋器1XX,冲锋枪2XX,野牛冲锋枪,冲锋枪,野牛,子弹等。
在一些实施例中,可以根据所述关键字标签在所述目标游戏对应的标签数据库中确定所述关键字标签对应的父标签、祖父标签…,以构建如图5或图6所示的目标物料的标签树。
在一些实施例中,可以针对目标游戏提前构建一个大的标签库,标签库中的每条标签中都记录了它与父类标签的关联,原则上来说所述标签库可以是一个大的网状结构,对所述网状结构里边形成环的节点做冗余处理后可以形成一颗庞大的仅有一个根节点的树状结构。
在本实施例中,通过标签树对目标物料进行描述可以产生以下有益效果。
(1)标签树的树状结构有利于清晰描述标签之间的层次关系。每个物料可能包含几个到几十个标签,标签与标签之间存在关联关系,若通过标签树来表征标签之间的关系,可以自下而上、由具体到抽象的通过标签来描述目标物料,使得标签之间的层次关系更加清楚;(2)构建标签树有利于标签权重的传导。树状结构相对网状结构而言,不存在环,权重传递不会出现死循环传递。
图5是根据一示例性实施例示出的一种目标物料的逻辑标签树。图6是根据一示例性实施例示出的一种目标物料的物理标签树。
在一些实施例中,根据所述目标物料得到关键字标签不仅可以形成目标物料的逻辑标签树,也可以形成所述目标物料的物理标签树。所述逻辑标签树可以抽象的从逻辑方面对所述目标物料进行描述,所述物理标签树可以从具体的内容方面对所述目标物料进行描述。同时使用逻辑标签树和物理标签树可以对目标物料从逻辑和物理两个方面进行准确和全面地描述。
在步骤S4中,根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重。
在步骤S5中,根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重。
在步骤S6中,根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。
在一些实施例中,可以将标签权重较大的几个标签作为所述目标物料的物料标签,以更加简洁、准确的描述目标物料。
本实施例提供的技术方案,可以从目标物料中确定关键子标签,并以目标物料的关键字标签为叶子节点构建所述目标物料的标签树,然后根据所述关键标签的标签权重自下而上的确定标签树中各个中间节点的权重。一方面,确定了可以描述目标物料的标签树,另一方面准确的确定了标签树中各个标签相对于所述目标物料的标签权重。通过目标物料的标签树中的各个标签相对于所述目标物料的标签权重可以确定所述目标物料的物料标签,并可以进一步的根据所述目标物料的物料标签向目标对象进行物料推荐。
图7是图3中步骤S1在一示例性实施例中的流程图。参考图7,上述步骤S1可以包括以下步骤。
在步骤S11中,获取所述目标物料所属的第一对象。
所述目标物料所属的第一对象可以指的是所述目标物料所属的类别(假设所述目标物料是某个游戏的推荐物料,那么该游戏所属的类别(例如闯关类)就可以是所述第一对象);所述目标物料所属的第一对象还可以指的是所述目标物料所属的对象(假设目标物料是某个游戏中的一个装备的推荐物料,那么所述第一对象就可以是该游戏)。
一般来说,可以预先为第一对象设置关键字数据库,然后将第一对象中包括的目标物料中的分词结果与所述关键字数据库做比对,以确定所述目标物料中的关键字标签。
假设目标物料是器械类游戏中的某个“器械游戏XX”对应的推荐物料,那么该器械类游戏就可以是第一对象。
首先,可以为该器械类游戏(可能会包括很多个游戏)预先构建关键字数据库(即预先指定哪些词语可以是该器械类游戏中的关键字);然后对“器械游戏XX”对应的推荐物料进行分词处理,以获得第一目标分词;最后将“器械游戏XX”对应的推荐物料的第一目标分词与该器械类游戏的关键字数据库做比对,以确定“器械游戏XX”对应的推荐物料的关键字标签。
在步骤S12中,从关键字数据库获取所述第一对象的关键字。
在一些实施例中,可以通过人工或计算机提前构建一个大的关键字数据库,所述关键字数据库可以包括第一对象的关键字数据库,当所述第一对象的确定后,所述第一对象的关键字数据库也可以被确定,所述第一对象可能会包括多个关键字。
在另外一些实施例中,可以通过人工或计算机直接构建第一对象的关键字数据库,所述第一对象可能会包括多个关键字。
在步骤S13中,对所述目标物料进行分词处理,获得第一目标分词。
在一些实施例中,可以通过“结巴”技术对所述目标物料进行分词,然后去除“的”、“得”、“了”等无意义的停用词以及标点符号等,获得第一目标分词。
在步骤S14中,将所述第一目标分词与所述第一对象的关键字进行匹配,确定所述目标物料中的关键字标签。
在一些实施例中,若所述第一目标分词恰好是所述第一对象的关键字,则所述第一目标分词就是所述目标物料的关键字标签,若所述第一目标分词不是所述第一对象的关键字,则对第一目标分词不做处理。
本实施例提供的技术方案可以通过将目标物料中的分词与关键字标签库中的关键字进行比对,以确定目标物料中关键字标签。通过本实施例提供的技术方案可以从目标物料中确定能够准确表征目标物料特征的关键字标签。
图8是图3中步骤S2在一示例性实施例中的流程图。参考图8,上述步骤S2可以包括以下步骤。
在一些实施例中,可以通过TextRank(文本排名)模型确定所述关键字标签相对于所述目标物料的标签权重。
在步骤S21中,对所述目标物料进行分词处理,获得第二目标分词。
在一些实施例中,可以通过“结巴”技术对所述目标物料进行分词,然后去除“的”、“得”、“了”等无意义的停用词以及标点符号等,获得多个第二目标分词。
假设目标物料为:《和平精英》完爆UMP9,最牛冲锋枪来袭。冲锋枪家族里有一把枪,可谓是抢尽了其他枪械的风头,它就是“野牛”,一把光听名字都极具威慑力的冲锋枪!
对上述目标物料进行分词后可以获得第二目标分词:和平精英、完爆、UMP9、最牛、冲锋枪、来袭、冲锋枪、家族、一把、枪、可谓、抢尽、其他、枪械、风头、野牛、一把、光听、名字、及其、威慑力、冲锋枪。
在步骤S22中,根据所述第二目标分词构建词语有向图,并获取每个第二目标分词的初始权重值。
一般来说,一个词语相与目标物料的关联性不仅取决于它出现在目标物料中的次数,还取决于每个指向他的词语出现的次数之和。如果词语A出现在词语B之后,则可以认为词语A指向词语B。为了明确目标物料中各个词语之间的指向关系,本实施例根据目标物料的分词结果构建了有向图,有向图是由名称和名次之间的有向线段组成,其中有向线段描述了词语之间的指向关系。
例如,可以根据图4中内容框中的文本构建如图9所示的有向图。
如图9所示,箭头代表了词语A和词语B的上下文关系。例如“冲锋枪”通过箭头分别指向了“来袭”和“家族”,也就是说“冲锋枪”分别是“来袭”和“家族”的这两个词语的上一个词语。
图10可以表示对图9中的第二目标分词的权重进行初始化后的结果,例如可以令每个第二目标分词的初始权重值为0.15。
在步骤S23中,根据所述词语有向图以及各个目标分词的初始权重值进行加权求和的迭代处理,获取所述关键字标签相对于所述目标物料的标签权重。
在一些实施例中,可以根据公式(1)更新迭代各个第二目标分词对应的权重值,直至收敛。
Figure BDA0002383518110000171
其中,Vi、Vj、Vj分别代表第i、j、k个目标分词,i、j、k为大于或者等于1的正整数,Ws(Vi)、Ws(Vj)分别代表第i、j个目标分词的权重值,In(Vi)代表指向第i个目标分词的所有目标分词的集合,Out(Vj)代表第j个目标分词指向的所有的目标分词的集合,Wij用于表示第i个目标分词和第j个目标分词之间的边连接具有不同的重要程度,d代表阻尼系数,一般取经验值为0.85。
图11可以代表迭代更新后获得的第二目标分词的权重值。
在一些实施例中,当第二目标分词的标签权重确定之后,可以将第二目标分词与所述目标物料所属的第一对象的关键字数据库做比对,以从所述第二目标分词中确定关键字标签及其对应的标签权重。
本实施例采用常用分词方法对目标物料进行分词及预处理,基于分词结果构建有向图以表征各个第二目标分词之间的连接关系,接着对各个第二目标分词的权重进行初始化;然后使用词连接关系迭代计算各个第二目标分词的TextRank得分,以TextRank得分作第二目标分析相对于目标物料的标签权权重。通过TextRank算法第二目标分词相对于目标物料的标签权重,充分考虑了第二目标分词在目标物料中的重要性,可有效反映第二目标分词与目标物料的关联度,提升二者之间关联精度;最后将第二目标分词与目标物料所属的第一对象的关键字数据库做比可以确定所述目标物料的关键字标签及其对应的标签权重。
图12是图3中步骤S3在一示例性实施例中的流程图。参考图12,上述步骤S3可以包括以下步骤。
在步骤S31中,获取所述目标物料所属的第二对象的全局标签树。
在一些实施例中,所述目标物料可以是有关于第二对象中涉及物品的物料,例如所述目标物料可以是目标游戏中某类枪械的推荐物料,那么所述目标游戏就可以是所述第二对象。
例如,目标物料是器械类游戏中的某个“器械游戏XX”对应的推荐物料,那么该器械类游戏就可以是第一对象。
在一些实施例中,可以针对目标游戏提前构建一个大的全局标签库,所述全局标签库中的每条标签都记录了它与父类标签的关联,原则上来说所述标签库可以是一个大的网状结构,对所述网状结构里边形成环的节点做冗余处理后可以形成一颗庞大的仅有一个根节点的全局标签树。
在步骤S32中,以所述关键字标签为起点,在所述全局标签树中不断向上回溯,直至找到所述全局标签树的根节点以生成所述关键字标签的链状标签路径。
在一些实施例中,根据所述关键字标签在所述全局标签树中确定所述目标物料的标签树可以描述为一棵树的逆生长过程,整个过程可以分为两个部分:父类节点查找和父类节点合并。
其中,父类节点查找可以描述为:分别以每个关键字标签为起点,在所述全局标签树中不断向上回溯,直至找到所述全局标签树的根节点,那么从根节点到每个关键字标签就可以形成一条链状的路径,有N个关键字标签,就有N条链状路径,N为大于或等于1的正整数。
例如,“和平精英”、“子弹”、“野牛”、“野牛冲锋枪”、“冲锋枪1XX”和“野牛冲锋枪2XX”可以都是目标物料的关键字标签,根据上述关键字标签在全局标签树中可以确定六条链状路径:
链路1,游戏内容标签-公共标签内容-攻略/教学-其他-子弹;
链路2,游戏内容标签-公共标签内容-攻略/教学-装备-冲锋枪-野牛;
链路3,游戏内容标签-公共标签内容-攻略/教学-装备-冲锋枪-野牛冲锋枪;
链路4,游戏内容标签-公共标签内容-攻略/教学-装备-冲锋枪-冲锋枪1XX;
链路5,游戏内容标签-公共标签内容-攻略/教学-装备-冲锋枪-冲锋枪2X;
链路6,游戏内容标签-和平精英。
在步骤S33中,以所述全局标签树的根节点为起点,将各个关键字标签的链状标签路径合并,生成所述目标物料的标签树。
在一些实施例中,父类节点合并过程可以描述为:新建一个队列,从所述全局标签树的根节点开始进队列,对N条链状路径中与根节点关联的所有节点进行重复节点查找,一旦找到将重复节点合并;查找及合并结束后,将与根节点步长为1的所有节点进队列,开启与根节点步长为2的重复节点查找及合并......;重复上述过程直至所有节点都进队列,那么所述目标物料的标签树就产生了。
在一些实施例中,对上述链路1-链路6进行进行合并处理,可以生成如图5所示的标签树。
可以理解的是,在目标物料的标签树生成之后,可以对所述标签树进行修剪,例如可以将不重要的节点删除。基于此,所述标签树中的叶子节点可能就不是所述关键字标签。
通过本实施例提供的方法构建的标签树不仅包括可以具体描述目标物料的关键子标签,还可以包括从不同分类角度对目标物料进行描述的非关键字标签,使得可以从多个层次或角度对目标物料的特征进行描述。
图13是图3中步骤S5在一示例性实施例中的流程图。
在一些实施例中,所述中间节点包括第一中间节点和第二中间节点,所述第一中间节点在所述标签树中处于第一层级,所述第二中间节点在所述标签树中处于第二层级,所述第一层级大于第二层级。
参考图13,上述步骤S5可以包括以下步骤。
在步骤S51中,根据所述第一中间节点的子节点的标签权重和所述第一层级确定所述第一中间节点的标签权重。
在一些实施例中,初始化过程让所述目标物料的标签书中部分节点获得了相应的权重,有权重的标签集中在树的叶子节点和部分中间节点(节点合并之后,某些叶子节点成为另外一些叶子节点的父类节点)。因此,为获取它们的父类及以上节点的权重,我们将这些权重设计成自下而上传递,计算过程包含:(1)如果当前节点是叶子节点且为关键字标签,那么该节点权重等于关键字权重。(2)如果当前节点是叶子节点,但它不是关键字标签,那么该节点权重等于所述目标物料范围内所有关键字权重的均值(某些叶子节点被修剪后,导致非关键字节点成为叶子节点)。(3)如果当前节点为中间节点,可以根据以下步骤确定标签权重:根据所述中间节点在所述标签树中的当前层级确定所述中间节点与所述标签树的叶子节点的层级差;对所述中间节点的子节点的标签权重求均值;根据所述中间节点与所述叶子节点的层级差,对所述均值按照指数衰减进行处理,以获得所述中间节点的标签权重。假设它包含m个子节点,每个子节点的权重为wi,那么它的权重
Figure BDA0002383518110000201
其中,Δx=当前层级-最大层级(可以是叶子节点所在层级),是所述中间节点与所述叶子节点的层级差。这里,通过层级差来实现向上方向的指数衰减,相对均匀线性衰减传递的方式而言,指数衰减速度是先慢后块,当层级差大到一定程度后,标签权重衰减至零,更符合用户对标签词汇从具体到抽象的过程。例如,当一个“野牛冲锋枪”的忠实粉丝收到推荐系统推送的“野牛冲锋枪”的攻略,满意度是100分,若推送“冲锋枪”的攻略,满意度是90分,而推荐“装备”的攻略可能就只有70分满意度了,因此,指数衰减的权重传递更符合用户喜好的一个自然规律。
在另外一些实施例中,还可以根据
Figure BDA0002383518110000211
等公式自下而上的确定所述中间节点的标签权重。
其中m代表所述中间节点的子节点的个数,wi代表所述中间节点的第i个子节点的标签权重,Δx代表所述中间节点的当前层级与所述叶子节点的层级差,i为大于或者等于1,且小于或者等于m的正整数。
在另外一些实施例中,还可以对中间节点的各个子节点的权重进行归一化处理,以确定所述中间节点的标签权重。
在步骤S52中,根据所述第二中间节点的子节点的标签权重和所述第二层级确定所述第二中间节点的标签权重,其中所述第一中间节点的标签权重小于第二中间节点标签权重。
本实施例提供的技术方案,一方面可以使得标签树中低层级标签的标签权重大于高层及标签的标签权重,实现了随着层级的增加标签权重逐渐衰减的过程,另一方面通过指数衰减函数对中间节点的子节点的标签权重进行处理以确定中间节点的标签权重,可以保证中间节点的标签权重相对于中间节点的子节点的标签权重呈现指数衰减形式,指数衰减的权重传递更符合用户喜好的一个自然规律。
图14是根据一示例性实施例示出的一种数据处理方法。
在一些实施例中,可以根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。其中所述物料标签可以指的是能准确表征所述目标物料的标签(可以是目标物料各个标签中标签权重较大的几个标签)。
在一些实施例中,所述关键字标签包括第一关键字标签和第二关键字标签,所述标签树包括逻辑标签树和物理标签树。其中,所述第一关键字标签的父节点、祖父节点等可以是逻辑标签,根据所述第一关键字标签可以构建目标物料的逻辑标签树;所述第二关键字标签的父节点、祖父节点等可以是物理标签,根据所述第一关键字标签可以构建目标物料的物理标签树。
参考图14,上述数据处理方法可以包括以下步骤。
在一些实施例中,所述目标物料不仅可以从逻辑内容上进行描述,还可以从具体的物理分类上进行描述,因此所述目标物料不仅可以包括逻辑标签树还可以包括物理标签树。
在一些实施例中,由于目标游戏中的子弹既可以是逻辑标签树中的关键字标签也可以是物理标签树中的关键字标签的父节点,例如关键字标签“冲锋枪”的父节点。由此可见,所述物理标签树和所述逻辑标签树可以包括相同的节点,也可以包括不同的节点。
在步骤S71中,以所述第一关键字标签为叶子节点构建所述目标物料的逻辑标签树。
在步骤S72中,以所述第二关键字标签为叶子节点构建所述目标物料的物理标签树。
在一些实施例中,当所述逻辑标签树和所述物理标签树确定之后,可以通过叶子节点的标签权重自下而上的确定所述逻辑标签树和所述物理标签树中各个节点的标签权重值。
如图15和图16所示,如果当前节点是叶子节点且为关键字标签,那么该节点权重等于关键字权重;如果当前节点是叶子节点,但它不是关键字标签,那么该节点权重等于所述目标物料范围内所有关键字权重的均值(某些叶子节点被修剪后,导致非关键字节点成为叶子节点);如果当前节点为中间节点,假设它包含m个子节点,每个子节点的权重为wi,那么它的权重
Figure BDA0002383518110000221
Figure BDA0002383518110000222
其中,Δx=当前层级-最大层级(可以是叶子节点所在层级)。
在步骤S73中,若所述逻辑标签树和所述物理标签树包括相同的标签,则对所述相同的标签进行去重处理。
在一些实施例中,若发现所述物理标签树和所述逻辑标签树中包括相同的标签,则将相同的标签合并,并选中较大(或较小或权重均值等)权重作为该标签的权重。
在步骤S74中,将去重处理后的逻辑标签树与物理标签树中的标签进行合并处理,以确定所述目标物料的物料标签。
在本实施例提供的技术方案中,一方面,构建了逻辑标签树和物理标签树,从抽象和具体等不同的角度对目标物料进行了描述;另一方面,通过对逻辑标签树和物理标签树的标签进行去重、合并以及排序,确定了可以准确描述目标物料的物料标签。
图17是根据一示例性实施例示出的一种数据处理方法。参考图17,上述数据处理方法可以包括以下步骤。
在步骤S81中,获取目标对象的兴趣标签。
在一些实施例中,所述目标对象的兴趣标签可以是用来表征所述目标对象兴趣、偏好的标签,例如当目标对象访问推荐系统时,他会点击、收藏、点赞或点踩一系列的物料,那么这些物料的标签汇总后便形成了该用户的偏好(用标签标识)。例如,假设目标对象偏爱“野牛冲锋枪”,可能来源于他非常喜欢收藏“野牛冲锋枪”相关的攻略。
在步骤S82中,根据所述目标对象的兴趣标签在多个目标物料的物料标签中确定匹配标签。
在一些实施例中,可以根据所述目标对象的兴趣标签、所述兴趣标签的同义词等在所述多个目标物料的物料标签中确定与之匹配的匹配标签。
在步骤S83中,根据所述匹配标签对应的标签权重确定目标标签。
在一些实施例中,可以根据标签权重对所述匹配标签进行排序,然后在匹配标签中选取排序前几的作为所述目标标签。
在步骤S84中,根据所述目标标签对应的目标物料向所述目标对象进行物料推荐。
在一些实施例中,可以将标签权重排序前几的目标标签对应的目标物料向目标对象进行推荐,以提高目标对象点击目标物料或目标物料对应产品的概率。
图18是图17中步骤S81在一示例性实施例中的流程图。参考图18,上述步骤S81可以包括以下步骤。
在步骤S811中,获取所述目标对象的历史行为以及所述历史行为对应的历史物料,所述历史物料包括历史物料标签和所述历史物料标签的标签权重。
在一些实施例中,所述历史行为可以指的是点击、收藏、点赞等行为,所述历史行为对应的历史物料可以指的是所述目标对象在过去的时间段里点击、收藏、点赞或点踩的物料。
在步骤S812中,根据所述历史物料标签的标签权重在所述历史物料标签中确定所述目标对象的兴趣标签。
在一些实施例中,假设物料1带有标签A、B、C,标签权重分别为[0.8,0.3,0.1],物料2带有标签A、C、D,标签权重分别为[0.8、0.2、0.5]。假设目标对象在过去的一段时间内点击过物料1和物料2,那么目标对象就可以被贴上标签A、B、C、D四个标签,四个标签的标签权重分别为A[0.8,0.8]、B[0.3]、C[0.1,0.2]、D[0.5]。很明显,B和D均只包括一个权重,A和C包括不止一个权重。为了确定A和C的标签权重,我们可以对A和C做一个PCA的降维,将A和C的权重向量降至1维。那么A[0.8,0.8]的PCA输出可以为0.9,C[0.1,0.2]的PCA输出可以为0.3,因此可以[A,B,C,D]对应的标签权重为[0.9,0.3,0.3,0.5]。
在一些实施例中,可以假设标签权重大于或等于0.5才有效,所述目标对象的兴趣标签可以为A和D,标签权重分别为0.9和0.5。
本实施例提供的技术方案,可以根据目标对象的历史行为以及历史行为对应的历史物料确定可以准确描述目标对象兴趣、偏好的兴趣标签。
图19是根据一示例性实施例示出的一种数据处理方法。参考图19,上述数据处理方法可以包括以下步骤。
在步骤S1901中,获取目标物料的关键字标签。
在步骤S1902中,获取目标物料的关键字标签。
在步骤S1903中,以所述关键字标签为叶子节点构建所述目标物料的逻辑标签树,所述逻辑标签树包括第一中间节点,所述第一中间节点包括子节点。
在步骤S1904中,根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的第一子节点的标签权重。
在步骤S1905中,根据所述第一子节点的标签权重和所述第一中间节点在所述标签树中的当前层级确定所述第一中间节点的标签权重。
在步骤S1906中,以所述关键字标签为叶子节点构建所述目标物料的物理标签树,所述标签树包括第二中间节点,所述第二中间节点包括第二子节点。
在步骤S1907中,根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的第二子节点的标签权重。
在步骤S1908中,根据所述第二子节点的标签权重和所述第二中间节点在所述标签树中的当前层级确定所述第二中间节点的标签权重。
在步骤S1909中,将所述逻辑标签树与所述物理标签树中相同的标签合并。
在步骤S1910中,按照标签权重对所述逻辑标签树和物理标签树中的各个标签进行排序,并将排序前N的标签作为所述目标物料的物料标签,N为大于或者等于1的正整数。
在步骤S1911中,根据目标对象的兴趣标签和所述目标物料的物料标签向所述目标对象推荐所述目标物料。
本公开实施例提供的技术方案,可以从目标物料中确定关键子标签,并以目标物料的关键字标签为叶子节点构建所述目标物料的标签树,然后根据所述关键标签的标签权重自下而上的确定标签树中各个节点的权重。一方面,确定了可以描述目标物料的标签树,另一方面准确的确定了标签树中各个标签相对于所述目标物料的标签权重。通过目标物料的标签树中的各个标签相对于所述目标物料的标签权重可以确定所述目标物料的物料标签,并可以进一步的根据所述目标物料的物料标签向目标对象进行物料推荐。
图20是根据一示例性实施例示出的一种数据处理装置的框图。参照图20,本公开实施例提供的数据处理装置2000可以包括:关键字标签获取模块2001、标签权重获取模块2002、标签树构建模块2003、第一标签权重确定模块2004、第二标签权重确定模块以及物料标签确定模块2006。
其中,所述关键字标签获取模块2001可以配置为获取目标物料的关键字标签;所述标签权重获取模块2002可以配置为确定所述关键字标签相对于所述目标物料的标签权重;所述标签树构建模块2003可以配置为以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;所述第一标签权重确定模块2004可以配置为根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;所述第二标签权重确定模块2005可以配置为根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重;所述物料标签确定模块可以配置为根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。
在一些实施例中,所述中间节点包括第一中间节点和第二中间节点,所述第一中间节点在所述标签树中处于第一层级,所述第二中间节点在所述标签树中处于第二层级,所述第一层级大于第二层级。
在一些实施例中,所述第二标签权重确定模块2005可以包括:第一中间节点标签权重确定单元和第二中间节点权重确定单元。
其中,所述第一中间节点标签权重确定单元可以配置为根据所述第一中间节点的子节点的标签权重和所述第一层级确定所述第一中间节点的标签权重;所述第二中间节点权重确定单元可以配置为根据所述第二中间节点的子节点的标签权重和所述第二层级确定所述第二中间节点的标签权重,其中所述第一中间节点的标签权重小于第二中间节点标签权重。
在一些实施例中,所述第二标签权重确定模块2005还可以配置为根据公式
Figure BDA0002383518110000261
确定所述中间节点的标签权重;其中m代表所述中间节点的子节点的个数,wi代表所述中间节点的第i个子节点的标签权重,Δx代表所述中间节点的当前层级与所述叶子节点的层级差,i为大于或者等于1,且小于或者等于m的正整数。
在一些实施例中,所述关键字标签获取模块2001可以包括:第一对象获取单元、第一对象关键字确定单元、第一目标分词获取单元以及目标物料关键字确定单元。
其中,所述第一对象获取单元可以配置为获取所述目标物料所属的第一对象;所述第一对象关键字确定单元可以配置为从关键字数据库获取所述第一对象的关键字;所述第一目标分词获取单元可以配置为对所述目标物料进行分词处理,获得第一目标分词;所述目标物料关键字确定单元可以配置为将所述第一目标分词与所述第一对象的关键字进行匹配,确定所述目标物料中的关键字标签。
在一些实施例中,所述标签权重获取模块2002还可以包括:第二目标分词获取单元、初始化单元、迭代单元。
其中,所述第二目标分词获取单元可以配置为对所述目标物料进行分词处理,获得第二目标分词;所述初始化单元可以配置为根据所述第二目标分词构建词语有向图,并获取每个第二目标分词的初始权重值;所述迭代单元可以配置为根据所述词语有向图以及各个目标分词的初始权重值进行加权求和的迭代处理,获取所述关键字标签相对于所述目标物料的标签权重。
在一些实施例中,所述关键字标签包括第一关键字标签和第二关键字标签,所述标签树包括逻辑标签树和物理标签树。
在一些实施例中,所述物料标签确定模块可以包括:逻辑标签树构建单元、物理标签树构建单元、去重单元以及合并单元。
其中,所述逻辑标签树构建单元可以配置为以所述第一关键字标签为叶子节点构建所述目标物料的逻辑标签树;所述物理标签树构建单元可以配置为以所述第二关键字标签为叶子节点构建所述目标物料的物理标签树;所述去重单元可以配置为若所述逻辑标签树和所述物理标签树包括相同的标签,则对所述相同的标签进行去重处理;所述合并单元可以配置为将去重处理后的逻辑标签树与物理标签树中的标签进行合并处理,以确定所述目标物料的物料标签。
在一些实施例中,所述数据处理转置2000还可以包括:兴趣标签确定模块、匹配标签确定模块、目标标签确定模块以及推荐模块。
其中,所述兴趣标签确定模块可以配置为获取目标对象的兴趣标签;所述票标签确定模块可以配置为根据所述目标对象的兴趣标签在多个目标物料的物料标签中确定匹配标签;所述目标标签确定模块可以配置为根据所述匹配标签对应的标签权重确定目标标签;所述推荐模块可以配置为根据所述目标标签对应的目标物料向所述目标对象进行物料推荐。
在一些实施例中,所述兴趣标签确定模块可以包括:历史物料获取单元和兴趣标签获取单元。
其中,所述历史物料获取单元可以配置为获取所述目标对象的历史行为以及所述历史行为对应的历史物料,所述历史物料包括历史物料标签和所述历史物料标签的标签权重;所述兴趣标签获取单元可以配置为根据所述历史物料标签的标签权重在所述历史物料标签中确定所述目标对象的兴趣标签。
由于本公开的示例实施例的数据处理装置2000的各个功能模块与上述数据处理方法的示例实施例的步骤对应,因此在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者智能设备等)执行根据本公开实施例的方法,例如图3的一个或多个所示的步骤。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不限于这里已经示出的详细结构、附图方式或实现方法,相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims (12)

1.一种数据处理方法,其特征在于,包括:
获取目标物料的关键字标签;
确定所述关键字标签相对于所述目标物料的标签权重;
以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;
根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;
根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重;
根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。
2.根据权利要求1所述方法,其特征在于,所述中间节点包括第一中间节点和第二中间节点,所述第一中间节点在所述标签树中处于第一层级,所述第二中间节点在所述标签树中处于第二层级,所述第一层级大于第二层级;其中,根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权,包括:
根据所述第一中间节点的子节点的标签权重和所述第一层级确定所述第一中间节点的标签权重;
根据所述第二中间节点的子节点的标签权重和所述第二层级确定所述第二中间节点的标签权重,其中所述第一中间节点的标签权重小于第二中间节点标签权重。
3.根据权利要求1或2所述方法,其特征在于,根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重,包括:
根据所述中间节点在所述标签树中的当前层级确定所述中间节点与所述标签树的叶子节点的层级差;
对所述中间节点的子节点的标签权重求均值;
根据所述中间节点与所述叶子节点的层级差,对所述均值按照指数衰减进行处理,以获得所述中间节点的标签权重。
4.根据权利要求1所述方法,其特征在于,获取目标物料的关键字标签,包括:
获取所述目标物料所属的第一对象;
从关键字数据库获取所述第一对象的关键字;
对所述目标物料进行分词处理,获得第一目标分词;
将所述第一目标分词与所述第一对象的关键字进行匹配,确定所述目标物料中的关键字标签。
5.根据权利要求1所述方法,其特征在于,确定所述关键字标签相对于所述目标物料的标签权重,包括:
对所述目标物料进行分词处理,获得第二目标分词;
根据所述第二目标分词构建词语有向图,并获取每个第二目标分词的初始权重值;
根据所述词语有向图以及各个目标分词的初始权重值进行加权求和的迭代处理,获取所述关键字标签相对于所述目标物料的标签权重。
6.根据权利要求1所述方法,其特征在于,以所述关键字标签为叶子节点构建所述目标物料的标签树,包括:
获取所述目标物料所属的第二对象的全局标签树;
以所述关键字标签为起点,在所述全局标签树中不断向上回溯,直至找到所述全局标签树的根节点以生成所述关键字标签的链状标签路径;
以所述全局标签树的根节点为起点,将各个关键字标签的链状标签路径合并,生成所述目标物料的标签树。
7.根据权利要求1所述方法,其特征在于,所述关键字标签包括第一关键字标签和第二关键字标签,所述标签树包括逻辑标签树和物理标签树;其中,根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签,包括:
以所述第一关键字标签为叶子节点构建所述目标物料的逻辑标签树;
以所述第二关键字标签为叶子节点构建所述目标物料的物理标签树;
若所述逻辑标签树和所述物理标签树包括相同的标签,则对所述相同的标签进行去重处理;
将去重处理后的逻辑标签树与物理标签树中的标签进行合并处理,以确定所述目标物料的物料标签。
8.根据权利要求1所述方法,其特征在于,还包括:
获取目标对象的兴趣标签;
根据所述目标对象的兴趣标签在多个目标物料的物料标签中确定匹配标签;
根据所述匹配标签对应的标签权重确定目标标签;
根据所述目标标签对应的目标物料向所述目标对象进行物料推荐。
9.根据权利要求8所述方法,其特征在于,获取目标对象的兴趣标签,包括:
获取所述目标对象的历史行为以及所述历史行为对应的历史物料,所述历史物料包括历史物料标签和所述历史物料标签的标签权重;
根据所述历史物料标签的标签权重在所述历史物料标签中确定所述目标对象的兴趣标签。
10.一种数据处理装置,其特征在于,包括:
关键字标签获取模块,配置为获取目标物料的关键字标签;
标签权重获取模块,配置为确定所述关键字标签相对于所述目标物料的标签权重;
标签树构建模块,配置为以所述关键字标签为叶子节点构建所述目标物料的标签树,所述标签树还包括中间节点;
第一标签权重确定模块,配置为根据所述关键字标签对应的叶子节点的标签权重确定所述中间节点的子节点的标签权重;
第二标签权重确定模块,配置为根据所述中间节点的子节点的标签权重和所述中间节点在所述标签树中的当前层级确定所述中间节点的标签权重;
物料标签确定模块,配置为根据所述标签树中各个节点的标签权重,确定所述目标物料的物料标签。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一项所述的方法。
CN202010090410.5A 2020-02-13 2020-02-13 数据处理方法及装置、电子设备和计算机可读存储介质 Active CN111324724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010090410.5A CN111324724B (zh) 2020-02-13 2020-02-13 数据处理方法及装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010090410.5A CN111324724B (zh) 2020-02-13 2020-02-13 数据处理方法及装置、电子设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111324724A true CN111324724A (zh) 2020-06-23
CN111324724B CN111324724B (zh) 2023-04-11

Family

ID=71172753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010090410.5A Active CN111324724B (zh) 2020-02-13 2020-02-13 数据处理方法及装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111324724B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111884940A (zh) * 2020-07-17 2020-11-03 中国人民解放军国防科技大学 兴趣匹配方法、装置、计算机设备和存储介质
CN111931504A (zh) * 2020-08-13 2020-11-13 北京深演智能科技股份有限公司 实体的标签的确定方法、装置、存储介质和处理器
CN112508284A (zh) * 2020-12-10 2021-03-16 网易(杭州)网络有限公司 展示物料预处理方法、投放方法、系统、装置与设备
CN112597135A (zh) * 2021-01-04 2021-04-02 天冕信息技术(深圳)有限公司 用户分类方法、装置、电子设备及可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360227B1 (en) * 1999-01-29 2002-03-19 International Business Machines Corporation System and method for generating taxonomies with applications to content-based recommendations
US6738767B1 (en) * 2000-03-20 2004-05-18 International Business Machines Corporation System and method for discovering schematic structure in hypertext documents
CN101425061A (zh) * 2007-10-31 2009-05-06 财团法人资讯工业策进会 概念关联网络的数据标签建构方法与系统
CN102306204A (zh) * 2011-09-28 2012-01-04 武汉大学 基于文本结构权重的主题区域识别方法
CN103116588A (zh) * 2011-11-17 2013-05-22 腾讯科技(深圳)有限公司 一种个性化推荐方法及系统
CN104090886A (zh) * 2013-12-09 2014-10-08 深圳市腾讯计算机系统有限公司 构建用户实时画像的方法及装置
CN106919695A (zh) * 2017-03-07 2017-07-04 维沃移动通信有限公司 一种信息推荐方法及终端
CN106970991A (zh) * 2017-03-31 2017-07-21 北京奇虎科技有限公司 相似应用的识别方法、装置和应用搜索推荐方法、服务器
CN107491479A (zh) * 2017-07-05 2017-12-19 上海大学 一种基于本体库的标签管理方法
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
CN107766467A (zh) * 2017-09-29 2018-03-06 北京金山安全软件有限公司 一种信息检测方法、装置、电子设备及存储介质
CN109325179A (zh) * 2018-09-17 2019-02-12 青岛海信网络科技股份有限公司 一种内容推广的方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360227B1 (en) * 1999-01-29 2002-03-19 International Business Machines Corporation System and method for generating taxonomies with applications to content-based recommendations
US6738767B1 (en) * 2000-03-20 2004-05-18 International Business Machines Corporation System and method for discovering schematic structure in hypertext documents
CN101425061A (zh) * 2007-10-31 2009-05-06 财团法人资讯工业策进会 概念关联网络的数据标签建构方法与系统
CN102306204A (zh) * 2011-09-28 2012-01-04 武汉大学 基于文本结构权重的主题区域识别方法
CN103116588A (zh) * 2011-11-17 2013-05-22 腾讯科技(深圳)有限公司 一种个性化推荐方法及系统
CN104090886A (zh) * 2013-12-09 2014-10-08 深圳市腾讯计算机系统有限公司 构建用户实时画像的方法及装置
CN106919695A (zh) * 2017-03-07 2017-07-04 维沃移动通信有限公司 一种信息推荐方法及终端
CN106970991A (zh) * 2017-03-31 2017-07-21 北京奇虎科技有限公司 相似应用的识别方法、装置和应用搜索推荐方法、服务器
CN107491479A (zh) * 2017-07-05 2017-12-19 上海大学 一种基于本体库的标签管理方法
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
CN107766467A (zh) * 2017-09-29 2018-03-06 北京金山安全软件有限公司 一种信息检测方法、装置、电子设备及存储介质
CN109325179A (zh) * 2018-09-17 2019-02-12 青岛海信网络科技股份有限公司 一种内容推广的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHENGSHENG SHI 等: ""Layered and Weighted Tree Matching Algorithm for Automatic Web Data Records Recognition"" *
时宇岑 等: ""基于多开发者社区的用户推荐算法"" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111884940A (zh) * 2020-07-17 2020-11-03 中国人民解放军国防科技大学 兴趣匹配方法、装置、计算机设备和存储介质
CN111931504A (zh) * 2020-08-13 2020-11-13 北京深演智能科技股份有限公司 实体的标签的确定方法、装置、存储介质和处理器
CN112508284A (zh) * 2020-12-10 2021-03-16 网易(杭州)网络有限公司 展示物料预处理方法、投放方法、系统、装置与设备
CN112597135A (zh) * 2021-01-04 2021-04-02 天冕信息技术(深圳)有限公司 用户分类方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN111324724B (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
CN111324724B (zh) 数据处理方法及装置、电子设备和计算机可读存储介质
CN107491534B (zh) 信息处理方法和装置
CN110147551B (zh) 多类别实体识别模型训练、实体识别方法、服务器及终端
CN106709040B (zh) 一种应用搜索方法和服务器
KR20190118477A (ko) 엔티티 추천 방법 및 장치
CN110457708B (zh) 基于人工智能的词汇挖掘方法、装置、服务器及存储介质
CN111382283B (zh) 资源类别标签标注方法、装置、计算机设备和存储介质
CN110597962A (zh) 搜索结果展示方法、装置、介质及电子设备
US20220172260A1 (en) Method, apparatus, storage medium, and device for generating user profile
US11537918B2 (en) Systems and methods for document similarity matching
CN111368555B (zh) 一种数据识别方法、装置、存储介质和电子设备
CN114896377A (zh) 一种基于知识图谱的答案获取方法
CN114386435A (zh) 智能聊天频道处理器
Hsu et al. A hybrid Latent Dirichlet Allocation approach for topic classification
CN115982463A (zh) 资源推荐方法、装置、设备及存储介质
Ezaldeen et al. Semantics-aware context-based learner modelling using normalized PSO for personalized E-learning
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
Sarwar et al. Exploiting ontology recommendation using text categorization approach
Prasanth et al. Effective big data retrieval using deep learning modified neural networks
Kamruzzaman et al. Text classification using association rule with a hybrid concept of naive Bayes classifier and genetic algorithm
Jeong et al. Discovery of research interests of authors over time using a topic model
EP4261763A1 (en) Apparatus and method for providing user's interior style analysis model on basis of sns text
CN113537731B (zh) 基于强化学习的设计资源能力评估方法
CN112330387B (zh) 一种应用于看房软件的虚拟经纪人
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024681

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant