CN105989018B - 标签生成方法及标签生成装置 - Google Patents

标签生成方法及标签生成装置 Download PDF

Info

Publication number
CN105989018B
CN105989018B CN201510044990.3A CN201510044990A CN105989018B CN 105989018 B CN105989018 B CN 105989018B CN 201510044990 A CN201510044990 A CN 201510044990A CN 105989018 B CN105989018 B CN 105989018B
Authority
CN
China
Prior art keywords
label
tag
integrated
content
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510044990.3A
Other languages
English (en)
Other versions
CN105989018A (zh
Inventor
康战辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510044990.3A priority Critical patent/CN105989018B/zh
Publication of CN105989018A publication Critical patent/CN105989018A/zh
Application granted granted Critical
Publication of CN105989018B publication Critical patent/CN105989018B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种标签生成方法及标签生成装置,该标签生成方法包括获取多个自定义标签以及与自定义标签对应的标签内容列表;展开多个标签内容列表,获取多个标签内容列表中的所有标签内容,以生成标签内容和自定义标签的对应关系表;根据对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征;以及根据标签内容的备用整合标签以及备用整合标签的标签特征,生成标签内容的至少一个整合标签。本发明还提供一种标签生成装置。本发明的标签生成方法及标签生成装置通过对应关系表自动生成整合标签,生成的整合标签的准确度高且整合标签的更新速度快。

Description

标签生成方法及标签生成装置
技术领域
本发明涉及互联网领域,特别是涉及一种标签生成方法及标签生成装置。
背景技术
随着社会的发展,用户通过网络进行互动的情景越来越多,如用户A听到某首歌曲、某部电影或某本书,他可以根据自己对该歌曲、电影或书籍的理解或感想用简单的单词制作歌曲标签、电影标签或书籍标签;如一部恐怖电影可以打上“悬疑”以及“恐怖”的标签,一首动感歌曲可以打上“运动”以及“动感”的标签等。这样其他用户可以通过用户A制作的标签更好的了解上述歌曲、电影或书籍的内容,同时其他用户也可通过上述标签进行搜索,以找到自己喜爱的歌曲、电影以及书籍。
但是上述自定义标签或UGC(User Generated Content,用户生成内容)标签基于人工制作编辑,可能存在覆盖面不够以及不符合其他用户的输入习惯,因此生成的标签的准确度较低。同时由于是人工进行制作编辑,如果系统对标签的更新速度较慢的话,还可能导致系统对新流行标签的响应不及时。
发明内容
本发明实施例提供一种准确度较高且更新速度快的标签生成方法及标签生成装置;以解决现有的标签生成方法及标签生成装置的准确度较低以及标签更新速度较慢的技术问题。
本发明实施例提供一种标签生成方法,其包括:
获取多个自定义标签以及与所述自定义标签对应的标签内容列表;
展开多个所述标签内容列表,获取多个所述标签内容列表中的所有标签内容,以生成所述标签内容和所述自定义标签的对应关系表,其中一个所述标签内容对应至少一个所述自定义标签;
根据所述对应关系表,生成每个所述标签内容的备用整合标签以及所述备用整合标签的标签特征;以及
根据所述标签内容的备用整合标签以及所述备用整合标签的标签特征,生成所述标签内容的至少一个整合标签,其中所述整合标签为所述备用整合标签中的至少一个。
本发明实施例还提供一种标签生成装置,其包括:
列表获取模块,用于获取多个自定义标签以及与所述自定义标签对应的标签内容列表;
对应关系表生成模块,用于展开多个所述标签内容列表,获取多个所述标签内容列表中的所有标签内容,以生成所述标签内容和所述自定义标签的对应关系表,其中一个所述标签内容对应至少一个所述自定义标签;
备用整合标签生成模块,用于根据所述对应关系表,生成每个所述标签内容的备用整合标签以及备用整合标签的标签特征;以及
整合标签生成模块,用于根据所述标签内容的备用整合标签以及备用整合标签的标签特征,生成所述标签内容的至少一个整合标签,其中所述整合标签为所述备用整合标签中的至少一个。
相较于现有技术的标签生成方法及标签生成装置,本发明的标签生成方法及标签生成装置通过对应关系表生成整合标签,生成标签的准确度较高且整合标签的更新速度快;解决了现有的标签生成方法及标签生成装置的准确度较低以及标签更新速度较慢的技术问题。
附图说明
图1为本发明的标签生成方法的第一优选实施例的流程图;
图2为本发明的标签生成方法的第一优选实施例的步骤S103的流程图;
图3为本发明的标签生成方法的第二优选实施例的流程图;
图4为本发明的标签生成方法的第二优选实施例的步骤S205的流程图之一;
图5为本发明的标签生成方法的第二优选实施例的步骤S205的流程图之二;
图6为本发明的标签生成方法的第三优选实施例的流程图;
图7为本发明的标签生成方法的第四优选实施例的流程图;
图8为本发明的标签生成装置的第一优选实施例的结构示意图;
图9为本发明的标签生成方法的第一优选实施例的备用整合标签生成模块的结构示意图;
图10为本发明的标签生成装置的第二优选实施例的结构示意图;
图11为本发明的标签生成装置的第二优选实施例的整合标签生成模块的结构示意图之一;
图12为本发明的标签生成装置的第二优选实施例的整合标签生成模块的结构示意图之二;
图13为本发明的标签生成装置的第三优选实施例的结构示意图;
图14为本发明的标签生成装置的第四优选实施例的结构示意图。
具体实施方式
本发明的标签生成装置优选设置在服务器计算机中,该服务器计算机可自动且及时的生成整合标签,以解决现有的服务器计算机标签的生成标签的准确度较低以及标签更新速度较慢的技术问题。
请参照图1,图1为本发明的标签生成方法的第一优选实施例的流程图。本优选实施例的标签生成方法包括:
步骤S101,获取多个自定义标签以及与自定义标签对应的标签内容列表;
步骤S102,展开多个标签内容列表,获取多个标签内容列表中的所有标签内容,以生成标签内容和自定义标签的对应关系表;
步骤S103,根据对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征;
步骤S104,根据标签内容的备用整合标签以及备用整合标签的标签特征,生成标签内容的至少一个整合标签。
下面详细说明本优选实施例的标签生成方法的各步骤的具体流程。
在步骤S101中,标签生成装置获取多个自定义标签以及与自定义标签对应的标签内容列表,自定义标签可为歌曲标签、书籍标签或电影标签等。标签内容列表可为该具有该歌曲标签的歌曲列表,具有该书籍标签的书籍列表以及具有该电影标签的电影列表等。随后转到步骤S102。
在步骤S102中,标签生成装置展开步骤S101中获取的标签内容列表,获取标签内容列表中的所有标签内容,即获取歌曲列表中的所有歌曲、书籍列表中的所有书籍以及电影列表中的所有电影等。然后生成标签内容与自定义标签的对应关系表,即歌曲与歌曲标签、书籍和书籍标签以及电影和电影标签的对应关系表。这里一个标签内容对应至少要一个自定义标签。随后转到步骤S103。
在步骤S103中,标签生成装置根据步骤S102生成的对应关系表,生成每个标签内容,如歌曲、书籍或电影等的备用整合标签以及备用整合标签的标签特征;这里的备用整合标签是指备用或潜在的歌曲标签、书籍标签或电影标签;备用整合标签的标签特征是指备用或潜在的歌曲标签、书籍标签或电影标签的出现次数或出现频率等参数。具体请参照图2,图2为本发明的标签生成方法的第一优选实施例的步骤S103的流程图。该步骤S103包括:
步骤S1031,标签生成装置对对应关系表中的自定义标签进行分词操作,以生成标签内容的备用整合标签。这里可通过分词操作将自定义标签划分为多个词语,如自定义标签为“2014巴西世界杯”,则可将该自定义标签分为“2014”、“巴西”以及“世界杯”三个词语,并将这三个词语设定为相应的标签内容的备用整合标签,为了便于用户对备用整合标签的理解,这里的备用整合标签优选为名词标签。随后转到步骤S1032。
步骤S1032,标签生成装置统计备用整合标签在所有与备用整合标签对应的标签内容中的出现次数以及出现频率。如统计备用整合标签“世界杯”在对应关系表中的所有标签内容中的出现次数以及出现频率,如所有的歌曲中,有两首歌曲的备用整合标签均为“世界杯”,则备用整合标签“世界杯”的出现次数为2;如共有10首歌曲,则备用整合标签“世界杯”的出现频率为0.2。随后转到步骤S1033。
步骤S1033,标签生成装置根据备用整合标签在标签内容中的出现次数以及出现频率,生成备用整合标签的标签特征。这里备用整合标签的标签特征可为词频(TermFrequency)以及反文档频率(Inverse Document Frequency)等,当然这里也可直接设置备用整合标签的出现频率以及出现次数为备用整合标签的标签特征。随后转到步骤S104。
在步骤S104中,标签生成装置根据步骤S103中获取的标签内容的备用整合标签以及所述备用整合标签的标签特征,生成所述标签内容的至少一个整合标签。这里的整合标签是指正式的歌曲标签、书籍标签或电影标签。其中整合标签为备用整合标签中的至少一个。这里可以通过预设公式对备用整合标签的标签特征以及标签内容的属性特征进行解析,从而获取相应的整合标签。具体如何利用预设公式生成整合标签,请参见下述优选实施例的相关描述。
这样即完成了本优选实施例的标签生成方法的整合标签的生成过程。
本优选实施例的标签生成方法通过对应关系表自动生成整合标签,生成标签的准确度较高且整合标签的更新速度快。
请参照图3,图3为本发明的标签生成方法的第二优选实施例的流程图。本优选实施例的标签生成方法包括:
步骤S201,获取多个自定义标签以及与自定义标签对应的标签内容列表;
步骤S202,展开多个标签内容列表,获取多个标签内容列表中的所有标签内容,以生成标签内容和自定义标签的对应关系表;
步骤S203,根据对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征;
步骤S204,获取标签内容的属性特征;
步骤S205,根据标签内容的备用整合标签、备用整合标签的标签特征以及标签内容的属性特征,生成标签内容的至少一个整合标签。
本优选实施例的步骤S201至步骤S203与上述第一优选实施例的步骤S101和步骤S103中的描述相同或相似,具体请参见上述第一优选实施例的步骤S101和步骤S103中的相关描述。
在步骤S204中,标签生成装置获取相应的标签内容的属性特征,如用户通过自定义标签获取标签内容的次数、用户通过自定义标签浏览标签内容的次数或用户通过自定义标签收听标签内容的次数等。随后转到步骤S205。
在步骤S205中,标签生成装置根据步骤S203中获取的标签内容的备用整合标签、所述备用整合标签的标签特征以及步骤S204中获取的标签内容的属性特征,生成所述标签内容的至少一个整合标签。具体请参照图4,图4为本发明的标签生成方法的第二优选实施例的步骤S205的流程图之一。该步骤S205包括:
步骤S2051A,标签生成装置根据备用整合标签的标签特征、标签内容的属性特征以及预设公式,生成备用整合标签的标签值;该标签值用来反映该备用整合标签的用户接受程度。如备用整合标签的词频较高,且用户通过自定义标签获取标签内容的次数也较高,即标签内容的属性特征值也较高,则备用整合标签的标签值也较高,备用整合标签的用户接受程度也较高。如备用整合标签的词频较低,且用户通过自定义标签获取标签内容的次数也较低,即标签内容的属性特征值也较低,则备用整合标签的标签值也较低,备用整合标签的用户接受程度也较低。
步骤S2052A,标签生成装置将步骤S2051A生成的备用整合标签的标签值与预设阈值进行比较,生成比较结果。该预设阈值为一工人设定值。
步骤S2053A,标签生成装置根据步骤S2052A获取的比较结果,获取标签内容的至少一个整合标签。如标签值大于等于预设阈值,则将该标签值对应的备用整合标签设置为整合标签;如标签值小于预设阈值,则放弃该标签值对应的备用整合标签。
当然这里还可采用另一方式生成整合标签,具体请参照图5,图5为本发明的标签生成方法的第二优选实施例的步骤S205的流程图之二。该步骤S205包括:
步骤S2051B,标签生成装置根据备用整合标签的标签特征、标签内容的属性特征以及预设公式,生成备用整合标签的标签值。
步骤S2052B,标签生成装置将备用整合标签的标签值按预设规则进行排序,生成排序结果。
步骤S2053B,标签生成装置根据步骤S2052B获取的排序结果,获取标签内容的至少一个整合标签。如将排序结果中前两位的标签值对应的备用整合标签设置为整合标签等。
这样即完成了本优选实施例的标签生成方法的整合标签的生成过程。
本优选实施例的标签生成方法在第一优选实施例的基础上,通过标签内容的属性特征生成整合标签,使得整合标签的用户接受程度更高。
请参照图6,图6为本发明的标签生成方法的第三优选实施例的流程图。本优选实施例的标签生成方法包括:
步骤S301,获取多个自定义标签以及与自定义标签对应的标签内容列表;
步骤S302,展开多个标签内容列表,获取多个标签内容中的所有标签内容,以生成标签内容和自定义标签的对应关系表;
步骤S303,根据对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征;
步骤S304,获取自定义标签以及对应的标签内容列表的制作参数;
步骤S305,根据标签内容的备用整合标签、备用整合标签的标签特征、以及自定义标签以及对应的标签内容的优先级,生成标签内容的至少一个整合标签。
本优选实施例的步骤S301至步骤S303与上述第一优选实施例的步骤S101和步骤S103中的描述相同或相似,具体请参见上述第一优选实施例的步骤S101和步骤S103中的相关描述。
在步骤S304中,标签生成装置获取自定义标签以及对应的标签内容列表的制作参数,该制作参数包括自定义标签以及对应的标签内容的优先级。这里自定义标签以及对应的标签内容的优先级可人工进行设定或根据以往记录进行设定,如某个类别或某个用户设定的自定义标签以及对应的标签内容比较受到用户的认可,则可对该类别或该用户设定的自定义标签以及对应的标签内容设置较高的优先级。随后转到步骤S305。
在步骤S305中,标签生成装置根据步骤S303中获取的标签内容的备用整合标签、所述备用整合标签的标签特征以及步骤S304中获取的自定义标签以及对应的标签内容的优先级,生成所述标签内容的至少一个整合标签。其中优先级别较高的自定义标签包括的备用整合标签的标签值较高,用户接受的程度也较高。
这样即完成了本优选实施例的标签生成方法的整合标签的生成过程。
本优选实施例的标签生成方法在第一优选实施例的基础上,通过自定义标签以及对应的标签内容的优先级生成整合标签,使得整合标签的用户接受程度更高。
请参照图7,图7为本发明的标签生成方法的第四优选实施例的流程图。本优选实施例的标签生成方法可使用上述电子设备112进行实施,本优选实施例的标签生成方法包括:
步骤S401,获取多个自定义标签以及与自定义标签对应的标签内容列表;
步骤S402,展开多个标签内容列表,获取多个标签内容列表中的所有标签内容,以生成标签内容和自定义标签的对应关系表;
步骤S403,根据对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征;
步骤S404,根据标签内容的备用整合标签以及备用整合标签的标签特征,生成标签内容的至少一个整合标签;
步骤S405,判断是否生成标签内容的整合标签;如生成标签内容的整合标签,则转到步骤S406;如未生成标签内容的整合标签,则转到步骤S407;
步骤S406,对整合标签进行存储操作;
步骤S407,生成用户提示信息。
本优选实施例的步骤S401至步骤S404与上述第一优选实施例的步骤S101和步骤S104中的描述相同或相似,具体请参见上述第一优选实施例的步骤S101和步骤S104中的相关描述。
标签生成装置判断步骤S404中是否生成标签内容的至少一个整合标签,如生成了标签内容的整合标签,则标签生成装置对生成的整合标签进行存储操作;如未生成标签内容的整合标签,则标签生成装置生成用户提示信息,提示用户未生成相应的整合标签。
这样即完成了本优选实施例的标签生成方法的整合标签的生成过程。
本优选实施例的标签生成方法在第一优选实施例的基础上,对整合标签的生成进行自动监控以及提示,便于及时对整合标签进行更新。
本发明还提供一种标签生成装置,请参照图8,图8为本发明的标签生成装置的第一优选实施例的结构示意图。本优选实施例的标签生成装置80可使用上述标签生成方法的第一优选实施例进行实施。该标签生成装置80包括列表获取模块81、对应关系表生成模块82、备用整合标签生成模块83以及整合标签生成模块84。列表获取模块81用于获取多个自定义标签以及与自定义标签对应的标签内容列表;对应关系表生成模块82用于展开多个标签内容列表,获取多个标签内容列表中的所有标签内容,以生成标签内容和自定义标签的对应关系表,其中一个标签内容对应至少一个自定义标签;备用整合标签生成模块83用于根据对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征;整合标签生成模块84用于根据标签内容的备用整合标签以及备用整合标签的标签特征,生成标签内容的至少一个整合标签,其中整合标签为备用整合标签中的至少一个。
请参照图9,,图9为本发明的标签生成方法的第一优选实施例的备用整合标签生成模块的结构示意图。该备用整合标签生成模块83包括分词单元831、统计单元832以及标签特征生成单元833。分词单元831用于对对应关系表中的自定义标签进行分词操作,以生成标签内容的备用整合标签;统计单元832用于统计备用整合标签在所有与备用整合标签对应的标签内容中的出现次数以及出现频率;标签特征生成单元833用于根据备用整合标签在标签内容中的出现次数以及出现频率,生成备用整合标签的标签特征。
本优选实施例的标签生成装置80使用时,首先列表获取模块81获取多个自定义标签以及与自定义标签对应的标签内容列表,自定义标签可为歌曲标签、书籍标签或电影标签等。标签内容列表可为该具有该歌曲标签的歌曲列表,具有该书籍标签的书籍列表以及具有该电影标签的电影列表等。
随后对应关系表生成模块82展开列表获取模块81获取的标签内容列表,获取标签内容列表中的所有标签内容,即获取歌曲列表中的所有歌曲、书籍列表中的所有书籍以及电影列表中的所有电影等。然后生成标签内容与自定义标签的对应关系表,即歌曲与歌曲标签、书籍和书籍标签以及电影和电影标签的对应关系表。这里一个标签内容对应至少要一个自定义标签。
然后备用整合标签生成模块83根据对应关系表生成模块82生成的对应关系表,生成每个标签内容,如歌曲、书籍或电影等的备用整合标签以及备用整合标签的标签特征;这里的备用整合标签是指备用或潜在的歌曲标签、书籍标签或电影标签;备用整合标签的标签特征是指备用或潜在的歌曲标签、书籍标签或电影标签的出现次数或出现频率等参数。具体包括:
备用整合标签生成模块83的分词单元831对对应关系表中的自定义标签进行分词操作,以生成标签内容的备用整合标签。这里可通过分词操作将自定义标签划分为多个词语,如自定义标签为“2014巴西世界杯”,则可件该自定义标签分为“2014”、“巴西”以及“世界杯”三个词语,并将这三个词语设定为相应的标签内容的备用整合标签,为了便于用户对备用整合标签的理解,这里的备用整合标签优选为名词标签。
备用整合标签生成模块83的统计单元832统计备用整合标签在所有与备用整合标签对应的标签内容中的出现次数以及出现频率。如统计备用整合标签“世界杯”在对应关系表中的所有标签内容中的出现次数以及出现频率,如所有的歌曲中,有两首歌曲的备用整合标签均为“世界杯”,则备用整合标签“世界杯”的出现次数为2;如共有10首歌曲,则备用整合标签“世界杯”的出现频率为0.2。
备用整合标签生成模块83的标签特征生成单元833根据备用整合标签在标签内容中的出现次数以及出现频率,生成备用整合标签的标签特征。这里备用整合标签的标签特征可为词频(Term Frequency)以及反文档频率(Inverse Document Frequency)等,当然这里也可直接设置备用整合标签的出现频率以及出现次数为备用整合标签的标签特征。
最后整合标签生成模块84根据备用整合标签生成模块83获取的标签内容的备用整合标签以及所述备用整合标签的标签特征,生成所述标签内容的至少一个整合标签。这里的整合标签是指正式的歌曲标签、书籍标签或电影标签。其中整合标签为备用整合标签中的至少一个。这里可以通过预设公式对备用整合标签的标签特征以及标签内容的属性特征进行解析,从而获取相应的整合标签。
这样即完成了本优选实施例的标签生成装置80的整合标签的生成过程。
本优选实施例的标签生成装置通过对应关系表自动生成整合标签,生成标签的准确度较高且整合标签的更新速度快。
请参照图10,图10为本发明的标签生成装置的第二优选实施例的结构示意图。本优选实施例的标签生成装置1000在第一优选实施例的基础上还包括标签属性特征获取模块1001,该标签属性特征获取模块1001用于获取标签内容的属性特征,其中属性特征包括标签内容的热度或标签内容的浏览量。整合标签生成模块1002具体用于根据标签内容的备用整合标签、备用整合标签的标签特征以及标签内容的属性特征,生成标签内容的至少一个整合标签。
请参照图11,图11为本发明的标签生成装置的第二优选实施例的整合标签生成模块的结构示意图之一。其中该整合标签生成模块1002包括标签值生成单元1101、比较结果生成单元1102以及整合标签生成单元1103。标签值生成单元1101用于根据备用整合标签的标签特征、标签内容的属性特征以及预设公式,生成备用整合标签的标签值;比较结果生成单元1102用于将备用整合标签的标签值与预设阈值进行比较,生成比较结果;整合标签生成单元1103用于根据比较结果,获取标签内容的至少一个整合标签。
本优选实施例与上述第一优选实施例的区别在于,备用整合标签生成模块903根据对应关系表生成模块生成的对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征后,标签属性特征获取模块1001获取相应的标签内容的属性特征,如用户通过自定义标签获取标签内容的次数、用户通过自定义标签浏览标签内容的次数或用户通过自定义标签收听标签内容的次数等。
随后整合标签生成模块1002根据备用整合标签生成模块83获取的标签内容的备用整合标签、备用整合标签的标签特征以及标签属性特征获取模块1001获取的标签内容的属性特征,生成所述标签内容的至少一个整合标签。具体包括:
整合标签生成模块1002的标签值生成单元1101根据备用整合标签的标签特征、标签内容的属性特征以及预设公式,生成备用整合标签的标签值;该标签值用来反映该备用整合标签的用户接受程度。如备用整合标签的词频较高,且用户通过自定义标签获取标签内容的次数也较高,即标签内容的属性特征值也较高,则备用整合标签的标签值也较高,备用整合标签的用户接受程度也较高。如备用整合标签的词频较低,且用户通过自定义标签获取标签内容的次数也较低,即标签内容的属性特征值也较低,则备用整合标签的标签值也较低,备用整合标签的用户接受程度也较低。
整合标签生成模块1002的比较结果生成单元1102将标签值生成单元生成的备用整合标签的标签值与预设阈值进行比较,生成比较结果。该预设阈值为一工人设定值。
整合标签生成模块1002的整合标签生成单元1103根据比较结果生成单元获取的比较结果,获取标签内容的至少一个整合标签。如标签值大于等于预设阈值,则将该标签值对应的备用整合标签设置为整合标签;如标签值小于预设阈值,则放弃该标签值对应的备用整合标签。
请参照图12,图12为本发明的标签生成装置的第二优选实施例的整合标签生成模块的结构示意图之二。其中该整合标签生成模块也可包括标签值生成单元1201、排序结构生成单元1202以及整合标签生成单元1203。标签值生成单元1201用于根据备用整合标签的标签特征、标签内容的属性特征以及预设公式,生成备用整合标签的标签值;比较结果生成单元1202用于将备用整合标签的标签值按预设规则进行排序,生成排序结果;整合标签生成单元1203用于根据排序结果,获取标签内容的至少一个整合标签。
整合标签生成模块生成整合标签的步骤包括:
整合标签生成模块的标签值生成单元1201根据备用整合标签的标签特征、标签内容的属性特征以及预设公式,生成备用整合标签的标签值。
整合标签生成模块的排序结构生成单元1202将备用整合标签的标签值按预设规则进行排序,生成排序结果。
整合标签生成模块的整合标签生成单元1203根据排序结构生成单元1202获取的排序结果,获取标签内容的至少一个整合标签。如将排序结果中前两位的标签值对应的备用整合标签设置为整合标签等。
这样即完成了本优选实施例的标签生成装置1000的整合标签的生成过程。
本优选实施例的标签生成装置在第一优选实施例的基础上,通过标签内容的属性特征生成整合标签,使得整合标签的用户接受程度更高。
请参照图13,图13为本发明的标签生成装置的第三优选实施例的结构示意图。本优选实施例的标签生成装置1300在第一优选实施例的基础上还包括标签制作参数获取模块1301,该标签制作参数获取模块1301用于获取自定义标签以及对应的标签内容列表的制作参数;其中制作参数包括所述自定义标签以及对应的所述标签内容的优先级。整合标签生成模块1302具体用于根据标签内容的备用整合标签、备用整合标签的标签特征、以及自定义标签以及对应的标签内容的优先级,生成标签内容的至少一个整合标签。
本优选实施例与上述第一优选实施例的区别在于,备用整合标签生成模块83根据对应关系表生成模块生成的对应关系表,生成每个标签内容的备用整合标签以及备用整合标签的标签特征后,标签制作参数获取模块1301获取自定义标签以及对应的标签内容列表的制作参数,该制作参数包括自定义标签以及对应的标签内容的优先级。这里自定义标签以及对应的标签内容的优先级可人工进行设定或根据以往记录进行设定,如某个类别或某个用户设定的自定义标签以及对应的标签内容比较受到用户的认可,则可对该类别或该用户设定的自定义标签以及对应的标签内容设置较高的优先级。
随后整合标签生成模块1302根据备用整合标签生成模块83获取的标签内容的备用整合标签、备用整合标签的标签特征以及标签制作参数获取模块1301获取的自定义标签以及对应的标签内容的优先级,生成所述标签内容的至少一个整合标签。其中优先级别较高的自定义标签包括的备用整合标签的标签值较高,用户接受的程度也较高。
这样即完成了本优选实施例的标签生成装置1300的整合标签的生成过程。
本优选实施例的标签生成装置在第一优选实施例的基础上,通过自定义标签以及对应的标签内容的优先级生成整合标签,使得整合标签的用户接受程度更高。
请参照图14,图14为本发明的标签生成装置的第四优选实施例的结构示意图。本优选实施例的标签生成装置1400在第一优选实施例的基础上还包括判断模块1401、存储模块1402以及提示模块1403;判断模块1401用于判断整合标签生成模块84是否生成标签内容的整合标签;存储模块1402用于如整合标签生成模块84生成标签内容的整合标签,则对整合标签进行存储操作;提示模块1403用于如整合标签生成模块84未生成标签内容的整合标签,则生成用户提示信息。
本优选实施例与上述第一优选实施例的区别在于,整合标签生成模块84进行整合标签的生成操作后,判断模块1401判断整合标签生成模块84是否生成标签内容的至少一个整合标签,如生成了标签内容的整合标签,则存储模块1402对生成的整合标签进行存储操作;如未生成标签内容的整合标签,则提示模块1403生成用户提示信息,提示用户未生成相应的整合标签。
这样即完成了本优选实施例的标签生成装置1400的整合标签的生成过程。
本优选实施例的标签生成装置在第一优选实施例的基础上,对整合标签的生成进行自动监控以及提示,便于及时对整合标签进行更新。
下面通过一具体实施例说明本发明的标签生成方法及标签生成装置的具体工作原理。
一、服务器接收用户上传自定义标签以及标签内容列表,如歌曲的自定义标签“2014巴西世界杯”以及相应的歌曲标签内容列表“The life Of Cup、We Are One、Vida、The World is Ours”;以及歌曲的自定义标签“历届世界杯主题曲”以及相应的歌曲标签内容列表“WakaWaka、We Are One、To Be number、OleOleOle”等。
二、服务器展开上述的歌曲标签内容列表,获取所有的歌曲标签内容列表中的所有歌曲内容,然后生成歌曲内容与歌曲自定义标签的对应关系表。如歌曲“we are one”对应的歌曲自定义标签包括“2014巴西世界杯”、“激昂世界杯”、“世界杯金曲”以及“历届世界杯主题曲”等。歌曲“the world is ours”对应的歌曲自定义标签包括“2014巴西世界杯”、“世界杯上的神曲”以及“世界杯金曲”等。这样一个歌曲可对应多个歌曲自定义标签。
三、服务器对某个歌曲对应的所有歌曲自定义标签进行分词操作,生成多个备用整合标签。如歌曲“we are one”对应的备用整合标签可为“世界杯”以及“巴西”等。随后统计每个整合标签的标签特征,如备用整合标签“世界杯”的词频为4次,反文档频率为0.8;备用整合标签“巴西”的词频为1次,范文当频率为0.65。当然这里也可考虑用户通过该自定义标签浏览该歌曲的浏览量、通过该自定义标签点击该歌曲的点击量以及通过该自定义标签收听该歌曲的收听量等标签内容的属性特征。
四、服务器根据上述备用整合标签的标签特征、标签内容的属性特征以及预设公式,计算备用整合标签的标签值。将标签值大于设定值的备用整合标签设定为整合标签。
这样即完成了本具体实施例的整合标签生成过程。当然同样的标签生成方法也可用于电影标签以及书籍标签的生成。也可采用不同的预设公式以及在预设公式中设置不同的参数对备用整合标签进行筛选。
本发明的标签生成方法及标签生成装置通过对应关系表生成整合标签,生成标签的准确度较高且整合标签的更新速度快;解决了现有的标签生成方法及标签生成装置的准确度较低以及标签更新速度较慢的技术问题。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的方法。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (17)

1.一种标签生成方法,其特征在于,包括:
获取多个用户上传自定义标签以及与所述用户上传自定义标签对应的标签内容列表;
展开多个所述标签内容列表,获取多个所述标签内容列表中的所有标签内容,以生成所述标签内容和内容自定义标签的对应关系表,其中一个所述标签内容对应至少一个所述内容自定义标签;其中所述内容自定义标签包括所述用户上传自定义标签;
根据所述对应关系表,生成每个所述标签内容的备用整合标签以及所述备用整合标签的标签特征;以及
根据所述标签内容的备用整合标签以及所述备用整合标签的标签特征,生成所述标签内容的至少一个整合标签,其中所述整合标签为所述备用整合标签中的至少一个。
2.根据权利要求1所述的标签生成方法,其特征在于,所述根据所述对应关系表,生成每个所述标签内容的备用整合标签以及所述备用整合标签的标签特征的步骤包括:
对所述对应关系表中的所述自定义标签进行分词操作,以生成所述标签内容的备用整合标签;
统计所述备用整合标签在所有与所述备用整合标签对应的所述标签内容中的出现次数以及出现频率;以及
根据所述备用整合标签在所述标签内容中的出现次数以及出现频率,生成所述备用整合标签的标签特征。
3.根据权利要求1所述的标签生成方法,其特征在于,所述备用整合标签为名词标签。
4.根据权利要求1所述的标签生成方法,其特征在于,所述生成所述标签内容的至少一个整合标签的步骤之前还包括:
获取所述标签内容的属性特征;其中所述属性特征包括所述标签内容的热度或所述标签内容的浏览量;
所述根据所述标签内容的备用整合标签以及所述备用整合标签的标签特征,生成所述标签内容的至少一个整合标签的步骤具体为:
根据所述标签内容的备用整合标签、所述备用整合标签的标签特征以及所述标签内容的属性特征,生成所述标签内容的至少一个整合标签。
5.根据权利要求4所述的标签生成方法,其特征在于,所述根据所述标签内容的备用整合标签、所述备用整合标签的标签特征以及所述标签内容的属性特征,生成所述标签内容的至少一个整合标签的步骤包括:
根据所述备用整合标签的标签特征、所述标签内容的属性特征以及预设公式,生成所述备用整合标签的标签值;
将所述备用整合标签的标签值与预设阈值进行比较,生成比较结果;以及
根据所述比较结果,获取所述标签内容的至少一个整合标签。
6.根据权利要求4所述的标签生成方法,其特征在于,所述根据所述标签内容的备用整合标签、所述备用整合标签的标签特征以及所述标签内容的属性特征,生成所述标签内容的至少一个整合标签的步骤包括:
根据所述备用整合标签的标签特征、所述标签内容的属性特征以及预设公式,生成所述备用整合标签的标签值;
将所述备用整合标签的标签值按预设规则进行排序,生成排序结果;以及
根据所述排序结果,获取所述标签内容的至少一个整合标签。
7.根据权利要求1所述的标签生成方法,其特征在于,所述生成所述标签内容的至少一个整合标签的步骤之前还包括:
获取所述自定义标签以及对应的所述标签内容列表的制作参数;其中所述制作参数包括所述自定义标签以及对应的所述标签内容的优先级;
所述根据所述标签内容的备用整合标签以及所述备用整合标签的标签特征,生成所述标签内容的至少一个整合标签的步骤具体为:
根据所述标签内容的备用整合标签、所述备用整合标签的标签特征、以及所述自定义标签和对应的所述标签内容的优先级,生成所述标签内容的至少一个整合标签。
8.根据权利要求1所述的标签生成方法,其特征在于,所述标签生成方法还包括步骤:
判断是否生成所述标签内容的所述整合标签;以及
如生成所述标签内容的所述整合标签,则对所述整合标签进行存储操作;如未生成所述标签内容的所述整合标签,则生成用户提示信息。
9.一种标签生成装置,其特征在于,包括:
列表获取模块,用于获取多个用户上传自定义标签以及与所述用户上传自定义标签对应的标签内容列表;
对应关系表生成模块,用于展开多个所述标签内容列表,获取多个所述标签内容列表中的所有标签内容,以生成所述标签内容和内容自定义标签的对应关系表,其中一个所述标签内容对应至少一个所述内容自定义标签;其中所述内容自定义标签包括所述用户上传自定义标签;
备用整合标签生成模块,用于根据所述对应关系表,生成每个所述标签内容的备用整合标签以及备用整合标签的标签特征;以及
整合标签生成模块,用于根据所述标签内容的备用整合标签以及备用整合标签的标签特征,生成所述标签内容的至少一个整合标签,其中所述整合标签为所述备用整合标签中的至少一个。
10.根据权利要求9所述的标签生成装置,其特征在于,所述备用整合标签生成模块包括:
分词单元,用于对所述对应关系表中的所述自定义标签进行分词操作,以生成所述标签内容的备用整合标签;
统计单元,用于统计所述备用整合标签在所有与所述备用整合标签对应的所述标签内容中的出现次数以及出现频率;以及
标签特征生成单元,用于根据所述备用整合标签在所述标签内容中的出现次数以及出现频率,生成所述备用整合标签的标签特征。
11.根据权利要求9所述的标签生成装置,其特征在于,所述备用整合标签为名词标签。
12.根据权利要求9所述的标签生成装置,其特征在于,所述标签生成装置还包括:
标签属性特征获取模块,用于获取所述标签内容的属性特征,其中所述属性特征包括所述标签内容的热度或所述标签内容的浏览量;
所述整合标签生成模块具体用于,根据所述标签内容的备用整合标签、所述备用整合标签的标签特征以及所述标签内容的属性特征,生成所述标签内容的至少一个整合标签。
13.根据权利要求12所述的标签生成装置,其特征在于,所述整合标签生成模块包括:
标签值生成单元,用于根据所述备用整合标签的标签特征、所述标签内容的属性特征以及预设公式,生成所述备用整合标签的标签值;
比较结果生成单元,用于将所述备用整合标签的标签值与预设阈值进行比较,生成比较结果;以及
整合标签生成单元,用于根据所述比较结果,获取所述标签内容的至少一个整合标签。
14.根据权利要求12所述的标签生成装置,其特征在于,所述整合标签生成模块包括:
标签值生成单元,用于根据所述备用整合标签的标签特征、所述标签内容的属性特征以及预设公式,生成所述备用整合标签的标签值;
排序结构生成单元,用于将所述备用整合标签的标签值按预设规则进行排序,生成排序结果;以及
整合标签生成单元,用于根据所述排序结果,获取所述标签内容的至少一个整合标签。
15.根据权利要求9所述的标签生成装置,其特征在于,所述标签生成装置还包括:
标签制作参数获取模块,用于获取所述自定义标签以及对应的所述标签内容列表的制作参数;其中所述制作参数包括所述自定义标签以及对应的所述标签内容的优先级;
所述整合标签生成模块具体用于,根据所述标签内容的备用整合标签、所述备用整合标签的标签特征、以及所述自定义标签和对应的所述标签内容的优先级,生成所述标签内容的至少一个整合标签。
16.根据权利要求9所述的标签生成装置,其特征在于,所述标签生成装置还包括:
判断模块,用于判断是否生成所述标签内容的所述整合标签;
存储模块,用于如生成所述标签内容的所述整合标签,则对所述整合标签进行存储操作;以及
提示模块,用于如未生成所述标签内容的所述整合标签,则生成用户提示信息。
17.一种计算机可读存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求1-8中任一的标签生成方法。
CN201510044990.3A 2015-01-29 2015-01-29 标签生成方法及标签生成装置 Active CN105989018B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510044990.3A CN105989018B (zh) 2015-01-29 2015-01-29 标签生成方法及标签生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510044990.3A CN105989018B (zh) 2015-01-29 2015-01-29 标签生成方法及标签生成装置

Publications (2)

Publication Number Publication Date
CN105989018A CN105989018A (zh) 2016-10-05
CN105989018B true CN105989018B (zh) 2020-04-21

Family

ID=57035045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510044990.3A Active CN105989018B (zh) 2015-01-29 2015-01-29 标签生成方法及标签生成装置

Country Status (1)

Country Link
CN (1) CN105989018B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062986A (zh) * 2018-06-29 2018-12-21 深圳市彬讯科技有限公司 一种标签的分类处理方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958008B (zh) * 2016-10-18 2020-10-27 中国移动通信有限公司研究院 一种统一标签库的更新方法及装置
US10977299B2 (en) * 2018-05-30 2021-04-13 Baidu Usa Llc Systems and methods for consolidating recorded content
CN110647551B (zh) * 2018-06-25 2023-04-07 北京正和岛信息科技有限公司 标签信息处理方法、装置、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2235649A1 (en) * 2007-12-21 2010-10-06 Thomson Reuters Global Resources Entity, event, and relationship extraction
CN101984437A (zh) * 2010-11-23 2011-03-09 亿览在线网络技术(北京)有限公司 音乐资源个性化推荐方法及系统
CN102262653A (zh) * 2011-06-09 2011-11-30 华中科技大学 一种基于用户动机倾向性的标签推荐方法及系统
CN103198057A (zh) * 2012-01-05 2013-07-10 深圳市腾讯计算机系统有限公司 一种自动给文档添加标签的方法和装置
US8819028B2 (en) * 2009-12-14 2014-08-26 Hewlett-Packard Development Company, L.P. System and method for web content extraction

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133877B (zh) * 2014-07-25 2017-09-29 百度在线网络技术(北京)有限公司 软件标签的生成方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2235649A1 (en) * 2007-12-21 2010-10-06 Thomson Reuters Global Resources Entity, event, and relationship extraction
US8819028B2 (en) * 2009-12-14 2014-08-26 Hewlett-Packard Development Company, L.P. System and method for web content extraction
CN101984437A (zh) * 2010-11-23 2011-03-09 亿览在线网络技术(北京)有限公司 音乐资源个性化推荐方法及系统
CN102262653A (zh) * 2011-06-09 2011-11-30 华中科技大学 一种基于用户动机倾向性的标签推荐方法及系统
CN103198057A (zh) * 2012-01-05 2013-07-10 深圳市腾讯计算机系统有限公司 一种自动给文档添加标签的方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062986A (zh) * 2018-06-29 2018-12-21 深圳市彬讯科技有限公司 一种标签的分类处理方法及装置

Also Published As

Publication number Publication date
CN105989018A (zh) 2016-10-05

Similar Documents

Publication Publication Date Title
US20210349926A1 (en) Method of presenting excluded keyword categories in keyword suggestions
JP5984917B2 (ja) 提案される語を提供するための方法および装置
JP4524709B2 (ja) 情報処理装置および方法、並びに、プログラム
JP2015191655A (ja) 推奨ページを生成するための方法及び装置
CN104899220B (zh) 应用程序推荐方法和系统
US10223451B2 (en) Ranking search results based upon content creation trends
CN105989018B (zh) 标签生成方法及标签生成装置
CN111432226B (zh) 直播推荐方法、装置、服务器、终端及存储介质
CN106528588A (zh) 一种为文本信息匹配资源的方法及装置
CN107729578B (zh) 一种音乐推荐方法及装置
US20140379719A1 (en) System and method for tagging and searching documents
CN104504149A (zh) 一种实现应用推荐的方法及装置
CN103605656A (zh) 一种推荐音乐的方法、装置及一种移动终端
CN108958857A (zh) 一种界面生成方法及装置
US20150081690A1 (en) Network sourced enrichment and categorization of media content
US20170046447A1 (en) Information Category Obtaining Method and Apparatus
CN103942328A (zh) 一种视频检索方法及视频装置
CN104850241A (zh) 一种在移动终端中进行文字输入的方法及移动终端
US20100332568A1 (en) Media Playlists
CN111552884A (zh) 用于内容推荐的方法和设备
US20240037134A1 (en) Method and apparatus for searching for clipping template
US20140289213A1 (en) Search Engine With Term Cloud
CN110609991B (zh) 文本生成方法、电子装置及存储介质
CN116881412A (zh) 汉字多维信息匹配训练方法、装置、电子设备和存储介质
US8943525B2 (en) Information processing apparatus, information processing method, and program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant