CN103164471A - 视频文本标签的推荐方法及系统 - Google Patents

视频文本标签的推荐方法及系统 Download PDF

Info

Publication number
CN103164471A
CN103164471A CN 201110422572 CN201110422572A CN103164471A CN 103164471 A CN103164471 A CN 103164471A CN 201110422572 CN201110422572 CN 201110422572 CN 201110422572 A CN201110422572 A CN 201110422572A CN 103164471 A CN103164471 A CN 103164471A
Authority
CN
China
Prior art keywords
candidate keywords
weights
attribute
label
videotext
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110422572
Other languages
English (en)
Inventor
宋海涛
陈运文
刘作涛
纪达麒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengle Information Technolpogy Shanghai Co Ltd
Original Assignee
Shengle Information Technolpogy Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengle Information Technolpogy Shanghai Co Ltd filed Critical Shengle Information Technolpogy Shanghai Co Ltd
Priority to CN 201110422572 priority Critical patent/CN103164471A/zh
Publication of CN103164471A publication Critical patent/CN103164471A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种视频文本标签的推荐方法及系统,所述方法包括:定期从网上获取领域词补充到一领域词典中;根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词;对每个候选关键词的属性种类进行标注;根据每个候选关键词的属性种类获取该候选关键词的综合权值;对所有候选关键词的权值由大到小排序,选取综合权值靠前的若干个候选关键词作为视频文本标签。本发明能够自动地生成视频文本标签表,对视频的内容进行准确概括,有助于视频的检索和相关视频的挖掘等应用。

Description

视频文本标签的推荐方法及系统
技术领域
本发明涉及一种视频文本标签的推荐方法及系统。
背景技术
随着互联网进入Web2.0时代,由用户产生的内容如文本、图片、视频、音乐等,逐渐占据了互联网成为互联网上内容的主体,而且,用户产生的内容形式上趋于多样化,数量上也呈爆炸性的增长。
另外,因为摄影摄像设备的普及,用户录制视频的方式也更为便捷,所以一些视频站点迅速崛起,如何对海量的视频进行描述、组织和查找是一个十分重要的需求。文本标签是对用户所发表内容的最精准、概括的描述,每个标签由一个词或短语组成。传统视频网站或者会提示用户自己输入,或者由编辑进行人工标记,但是,这些输入编辑方式都过于费时费力,因为,首先大部分用户不愿意主动进行标签录入;其次,因为用户手工输入的标签质量参差不齐,存在大量语义重叠,例如个人所得税法上调相关的视频,用户输入的文本标签(tag)五花八门、各不相同,如“个税”、“所得税”、“收税”、“个税起征点”等等,这样会对视频的搜索和推荐带来很多困难;再次,依赖网站编辑对内容进行标记的方法,费事费力,而且录入的标签可能会有很多遗漏。
发明内容
本发明的目的在于提供一种视频文本标签的推荐方法及系统,该方法及系统能够对视频的内容进行准确地概括,有助于视频的检索和相关视频的挖掘等应用。
为解决上述问题,本发明提供一种视频文本标签的推荐方法,包括:
定期从网上获取领域词补充到一领域词典中;
根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词;
对每个候选关键词的属性种类进行标注;
根据每个候选关键词的属性种类获取该候选关键词的综合权值;
对所有候选关键词的权值由大到小排序,选取综合权值靠前的若干个候选关键词作为视频文本标签。
进一步的,在上述方法中,所述文本信息包括视频的标题、描述或用户标签中的一项以及多项信息。
进一步的,在上述方法中,采用CRF方法对每个视频的文本信息进行分词和对候选关键词的属性种类进行标注。
进一步的,在上述方法中,所述领域词包括影视剧名称、明星名字以及热门词中的一种或多种。
进一步的,在上述方法中,所述领域词典包括影视剧名称词典、明星名字词典以及热门词典中的一种或多种。
进一步的,在上述方法中,所述候选关键词的属性种类包括候选关键词的词性种类、出现位置、出现频率、是否为命名实体以及是否为领域词中的一种或多种。
进一步的,在上述方法中,对所有候选关键词的综合权值由大到小进行排序之前,还包括调整有词汇直接嵌套关系或词汇类别关系的候选关键词的综合权值。
进一步的,在上述方法中,当候选关键词之间为词汇直接嵌套关系,则将有词汇直接嵌套关系的大粒度的候选关键词的综合权值增大,相应地将有词汇直接嵌套关系的小粒度的候选关键词的综合权值减小。
进一步的,在上述方法中,当候选关键词之间为词汇类别关系,则将有词汇类别关系的大类别的候选关键词的综合权值增大,相应地将有词汇类别关系的小类别的候选关键词的综合权值减小。
进一步的,在上述方法中,所述根据每个候选关键词在对应的文本信息中出现次数及出现位置、该候选关键词的长度及属性种类获取该候选关键词的综合权值的步骤包括:
根据每个候选关键词的长度设置长度因子,其中,候选关键词长度越长,长度因子越小;
根据每个候选关键词在对应的文本信息中出现次数及出现位置及其长度因子获取该候选关键词的频率权值;
根据每个候选关键词的属性种类获取该候选关键词的属性权值;
将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值。
进一步的,在上述方法中,将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值步骤之前,还包括根据每个候选关键词的长度调整该候选关键词的属性权值。
进一步的,在上述方法中,将每个候选关键词频率权值乘以属性权值得到该候选关键词的权值步骤之前,还包括调整为垃圾词的候选关键词的属性权值。
进一步的,在上述方法中,将每个候选关键词频率权值乘以属性权值得到该候选关键词的权值步骤之前,还包括调整在书名号中出现的候选关键词的属性权值。
根据本发明的另一面,提供一种视频文本标签的推荐系统,包括:
领域词典模块,用于定期从网上获取领域词补充到一领域词典中;
候选关键词模块,用于根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词;
属性标注模块,用于对每个候选关键词进行属性种类标注;
权值获取模块,用于根据每个候选关键词属性种类获取该候选关键词的综合权值;
文本标签模块,用于对所有候选关键词的权值由大到小排序,选取权值靠前的若干个候选关键词作为视频文本标签。
进一步的,在上述系统中,还包括一相关关系模块,用于调整有词汇直接嵌套关系或词汇类别关系的候选关键词的综合权值。
进一步的,在上述系统中,所述权值获取模块包括:
长度因子单元,用于根据每个候选关键词的长度设置长度因子;
频率权值单元,用于根据每个候选关键词在对应的文本信息中出现次数、出现位置及其长度因子获取该候选关键词的频率权值;
属性权值单元,用于根据每个候选关键词的属性种类获取该候选关键词的属性权值;
综合权值单元,用于将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值。
进一步的,在上述系统中,所述权值获取模块还包括一依长度调整单元,用于根据每个候选关键词的长度调整该候选关键词的属性权值。
进一步的,在上述系统中,所述权值获取模块还包括一依垃圾词调整单元,用于调整为垃圾词的候选关键词的属性权值。
进一步的,在上述系统中,所述权值获取模块还包括一依书名号调整单元,用于调整在书名号中出现的候选关键词的属性权值。
与现有技术相比,本发明通过定期从网上获取领域词补充到一领域词典中,再根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词,并对每个候选关键词进行属性种类标注,再根据每个候选关键词在对应的文本信息中出现次数及出现位置、该候选关键词的长度及属性获取该候选关键词的综合权值,最后对所有候选关键词的权值由大到小进行排序,选取综合权值靠前的若干个候选关键词作为视频文本标签,自动地生成视频文本标签表,对视频的内容进行准确概括,有助于视频的检索和相关视频的挖掘等应用。
另外,本发明通过对视频的标题、描述或用户标签中的文本信息进行分词并生成候选关键词,保证候选关键词的来源足够充分,即使标题、描述或用户标签中的文本信息有任一项有所缺失,仍然会有比较准确的视频文本标签的推荐结果。
此外,本发明细分了各种候选关键词属性种类,如对命名实体识别(可以识别人名、地名、机构名等)、视频描述中出现频率很高的影视剧名称、实词、惯用语、形容词、略语、动词、时间词、量词或其它词性,从而可以在文本标签的提取过程中考虑大量的候选关键词的属性种类并赋予不同的权值,以保证自动标签提取的准确性。
附图说明
图1是本发明实施例一的视频文本标签的推荐方法的流程图;
图2是图1中步骤S4和步骤S5的详细流程图;
图3是图2中步骤S42和步骤S43的详细流程图;
图4是本发明实施例二的视频文本标签的推荐系统的模块示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
如图1所示,本发明提供一种视频文本标签的推荐方法,包括:
步骤S1,定期从网上获取领域词补充到一领域词典中;
步骤S2,根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词;
步骤S3,对每个候选关键词进行属性种类标注,具体的,可细分各种候选关键词属性种类,如候选关键词的词性种类、出现位置(是否在标题出现,以及是否在用户标签中出现)、候选关键词的出现频率、候选关键词是否为命名实体、是否为领域词等等,所述词性种类可心包括人名、地名、机构名、实词、惯用语、形容词、略语、动词、时间词、量词或其它词性,这些属性种类信息对后续的综合权值计分非常重要,因此需要在这一步处理,例如,所述候选关键词的词性种类包括影视剧名称、命名实体、实词、惯用语、形容词、略语、动词、时间词、量词或其它词性中的一种或多种,对候选关键词进行命名实体识别、影视剧名称识别,以及词性识别,并输出每个关键词对应的属性种类信息,从而可以在文本标签的提取过程中考虑大量的候选关键词的属性种类并赋予不同的权值,以保证自动标签提取的准确性;
步骤S4,根据每个候选关键词的属性种类获取该候选关键词的综合权值,具体的,可综合考虑候选关键词的出现的位置、出现频率、是否为影视剧名称等因素对候选关键词进行综合权值打分,以确定最终的视频文本标签;
步骤S6,对所有候选关键词的权值由大到小进行排序,选取综合权值靠前的若干个候选关键词作为视频文本标签。
具体的,在步骤S1中,所述领域词包括影视剧名称、明星名字以及热门词中的一种或多种,相应的,所述领域词典包括影视剧名称词典、明星名字词典以及热门词典中的一种或多种,其中,用户上传的视频,大多是跟电影或电视剧相关的,例如电影的片花、电视剧中高效片段集锦等,需要能够识别视频中电影或者电视剧的名称可以定期(如每周)去一些提供影视剧名称的站点抓取相关内容,补充到一个影视剧名称词典之中,如果视频的文本信息中出现了领域词典中短语的情况,例如“我们约会吧”,则直接标记为一个候选关键词,这种候选关键词会被赋予一个相对较高的初始权重。
在步骤S2中,所述文本信息包括视频的标题、描述以及用户标签中的一项或多项信息,具体的,通过对视频的标题、描述或用户标签中的文本信息进行分词并生成候选关键词,可以保证候选关键词的来源足够充分,即使标题、描述或用户标签中的文本信息有任一项有所缺失,仍然会有比较准确的视频文本标签的推荐结果,可以采用CRF(条件随即场)方法对每个视频的文本信息进行分词,CRF方法是一种基于机器学习技术的分词方法,其基本思路是分词时,不仅考虑了词语出现的频率信息,同时考虑词语的上下文语境,CRF方法具备较好的学习能力,因此其对歧义词和未登录词的识别都具有良好的效果分词算法,与分词词典的机械切分(FMM/BMM)方法相比具有不依赖于分词词典、自适应性强的特点,分词的过程中会用到生成好的领域词典,CRF方法在分词时可以对领域词典中的短语进行识别,另外,分词过程中同时还需要对视频的文本信息进行命名实体识别,命名实体的特点是会作为一个整体在文本中多次出现,命名实体识别的目的在于识别诸如人名、地名、机构名等相关短语,这些短语如果使用分词算法来识别,可能会被切散。
在步骤S3中,也可以采用CRF方法对每个候选关键词的属性种类进行标注。
如图2和图3所示所示,步骤S4中,根据每个候选关键词的属性种类获取该候选关键词的综合权值即TF*IDF,这一步根据候选关键词属性种类进行权值的计分累加,关键词权值计分思想跟信息检索中的tf*idf模型类似,但又有很大不同,信息检索中tf指的是关键词出现的频率,idf指的是关键词是否在很少的文档中出现,在越少的文档中出现表示关键词越重要,本实施例中,TF是一种按特征加权的频率获取,IDF的获取也不是以在多少文档中出现为依据,而是根据关键词和视频相关文本的属性信息获取,详细的获取步骤如下:
步骤S41,根据每个候选关键词的长度设置长度因子,其中,标题、描述、用户标签的文本越长,则对应的标题、描述、用户标签长度因子的值越小;
步骤S42,根据每个候选关键词在对应的文本信息中出现次数及出现位置及其长度因子及其长度因子获取该候选关键词的频率权值,包括:
步骤S421,设置初始时TF为1,根据候选关键词出现次数以及在标题、描述、用户标签中的出现位置获取TF的值:
如果候选关键词在标题中出现,则TF=1*候选关键词在标题中出现次数*标题长度因子*3;
如果候选关键词在用户标签中出现,则TF=1*候选关键词在用户标签中出现次数*用户标签长度因子*1;
如果候选关键词在描述中出现,则TF=1*候选关键词在描述中出现次数*描述长度因子*0.3。
步骤S422,在步骤S421获取的TF的值的基础上继续根据该候选关键是否同时在标题和描述中出现获取最终的TF的值:如果候选关键词在标题中和描述中同时出现,则最终的TF=步骤S421的TF的值*5;
如图2和图3所示步骤43,根据每个候选关键词的属性种类、候选关键词长度、是否是垃圾词、是否包含在书名号获取该候选关键词的属性权值,包括:
步骤S431,根据每个候选关键词的属性种类获取该候选关键词的属性权值,设置初始时IDF的值为1,根据候选关键词的属性种类、是否识别为影视剧名称或命名实体等得到新的IDF值,所述词性种类包括实词、人名、机构名、地名、惯用语、形容词、略语、动词、时间词、量词及其它词性:
如果被识别为影视剧名称,则IDF值乘以10得到新的IDF值;
如果被识别为为命名实体,则IDF值乘以2得到新的IDF值;
如果词性为实词,则IDF值乘以4.5得到新的IDF值;
如果词性为人名、机构名,则IDF值乘以2.5得到新的IDF值;
如果词性为地名,则IDF值乘以0.5得到新的IDF值;
如果词性为惯用语、形容词、略语,则IDF值乘以1.5得到新的IDF值;
如果词性为动词、时间词、量词,则IDF值乘以0.5得到新的IDF值;
其它词性,则IDF值乘以0.1得到新的IDF值。
步骤S432,在步骤S431获取的IDF的值的基础上继续根据候选关键词长度获取新IDF的值,关键词长度指中文文本长度,英文或数字文本按字母数除以3以,折算为中文文本长度:
如果关键词长度小于1(中文最短为1,指英文或数字折算过来可能小于1),则IDF值乘以0得到新的IDF值;
如果关键词长度为1,则IDF值乘以0.2得到新的IDF值;
如果长度为2,则IDF值乘以1得到新的IDF值;
如果长度大于2,小于等于5,则IDF值乘以3得到新的IDF值;
如果为大于5,小于等于10,则IDF值乘以1得到新的IDF值;
如果大于10,小于等于20,则IDF值乘以0.2得到新的IDF值;
如果大于20,则IDF值乘以0.01得到新的IDF值。
步骤S433,在步骤S432获取的IDF的值的基础上继续根据候选关键词是否是应该过滤的垃圾词继续获取新的IDF的值:如果候选关键词在提前定义的垃圾词词典,或者黄反词典中,则IDF=0。
步骤S434,在步骤S433获取的IDF的值的基础上继续根据候选关键词是否包含在书名号《》中获新的IDF的值:如果关键词在《》中出现,则IDF值乘以10得到新的IDF值。
如图2所示,步骤S6之前还包括步骤S5,调整有词汇直接嵌套关系或词汇类别关系的候选关键词的综合权值,本步骤的目的是继续获取关键词之间的相关关系,对候选关键词作后处理,考虑处理的相关关系包括两类:
步骤S51,当候选关键词之间为词汇直接嵌套关系时,将有词汇直接嵌套关系的大粒度的候选关键词的综合权值增大,相应地将有词汇直接嵌套关系的小粒度的候选关键词的综合权值减小,例如“上海车展”和“车展”,如出现嵌套关系,则将大粒度候选关键词的权值加上一部分小粒度候选关键词的权值以增大大粒度关键词的权值,相应的减少小粒度候选关键词的权值,具体计算公式如下:
新的“上海车展”权值=“上海车展”权值+“车展”权值*“车展”长度/“上海车展”长度*0.5;
新的“车展”权值=“车展”权值-“车展”权值*“车展”长度/“上海车展”长度*0.5;
步骤S52,当候选关键词之间为词汇类别关系时,将有词汇类别关系的大类别的候选关键词的综合权值增大,相应地将有词汇类别关系的小类别的候选关键词的综合权值减小,例如构建了一个三层的词汇关系表(总类名称->子类名称->实体名称),具体候选关键词分别为“电脑数码”->“软件”->“卡巴斯基”组成一个三层词汇关系,如果候选关键词中同时出现“软件”和“卡巴斯基”,则将“软件”的权值加上一部分“卡巴斯基”的权值以增大“软件”的权值,相应地减小“卡巴斯基”的权值,具体计算公式如下:
新的“软件”权值=“软件”权值+“卡巴斯基”权值*0.3;
新的“卡巴斯基”权值=“卡巴斯基”权值-卡巴斯基”权值*0.3。
根据上述描述可知,本发明能够智能地对互联网的视频的文本信处进行挖掘和学习,根据视频的文本信息如标题、描述、用户标签,利用了中文分词、命名实体识别、影视剧名称识别等技术,同时兼顾了用户输入的标签,以生成候选的关键词,而且从候选关键词到生成最终视频文本标签的过程中,综合考虑关键词的重要程度、出现频率、出现位置、词性种类等多个因素,自动地自动生成最优的文本标签的系统,视频文本标签可以作为很多有价值的应用的基础,例如视频检索系统、相关视频推荐服务、个性化视频推荐服务等,本方法具有很高的准确性和鲁棒性,并且能够很好的支持视频搜索、个性化视频推荐等应用。
实施例二
如图4所示,本发明还提供一种视频文本标签的推荐系统,包括领域词典模块1、候选关键词模块2、属性标注模块3、权值获取模块4、文本标签模块5和相关关系模块6。
领域词典模块1用于定期从网上获取领域词补充到一领域词典中。
候选关键词模块2用于根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词,具体可以通过对视频的标题、描述或用户标签中的文本信息进行分词并生成候选关键词,保证候选关键词的来源足够充分,即使标题、描述或用户标签中的文本信息有任一项有所缺失,仍然会有比较准确的视频文本标签的推荐结果。
属性标注模块3用于对每个候选关键词进行属性种类标注,具体可以细分各种候选关键词属性种类,如对命名实体识别(可以识别人名、地名、机构名等)、视频描述中出现频率很高的影视剧名称、实词、惯用语、形容词、略语、动词、时间词、量词或其它词性,从而可以在文本标签的提取过程中考虑大量的候选关键词的属性种类并赋予不同的权值,以保证自动标签提取的准确性。
权值获取模块4用于根据每个候选关键词属性种类获取该候选关键词的综合权值。
文本标签模块5用于对所有候选关键词的权值由大到小进行排序,选取权值靠前的若干个候选关键词作为视频文本标签,这样便能自动地生成视频文本标签表,对视频的内容进行准确概括,有助于视频的检索和相关视频的挖掘等应用。
相关关系模块6用于调整有词汇直接嵌套关系或词汇类别关系的候选关键词的综合权值。
其中,所述权值获取模块4包括长度因子单元41、频率权值单元42、属性权值单元43、综合权值单元44、依长度调整单元45、依垃圾词调整单元46及依书名号调整模块47。长度因子单元41用于根据每个候选关键词的长度设置长度因子。频率权值单元42用于根据每个候选关键词在对应的文本信息中出现次数、出现位置及其长度因子获取该候选关键词的频率权值。属性权值单元43用于根据每个候选关键词的属性的类别获取该候选关键词的属性权值。综合权值单元44用于将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值。依长度调整单元45用于根据每个候选关键词的长度调整该候选关键词的属性权值。依垃圾词调整单元46用于调整为垃圾词的候选关键词的属性权值。依书名号调整模块47用于调整在书名号中出现的候选关键词的属性权值。
本发明通过先定期从网上获取领域词补充到一领域词典中,再根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词,并对每个候选关键词进行属性种类标注,再根据每个候选关键词在对应的文本信息中出现次数及出现位置、该候选关键词的长度及属性获取该候选关键词的综合权值,最后对所有候选关键词的权值由大到小进行排序,选取综合权值靠前的若干个候选关键词作为视频文本标签,能够自动地生成视频文本标签表,对视频的内容进行准确概括,有助于视频的检索和相关视频的挖掘等应用。
另外,本发明通过对视频的标题、描述或用户标签中的文本信息进行分词并生成候选关键词,保证候选关键词的来源足够充分,即使标题、描述或用户标签中的文本信息有任一项有所缺失,仍然会有比较准确的视频文本标签的推荐结果。
此外,本发明细分了各种候选关键词属性种类,如对命名实体识别(可以识别人名、地名、机构名等)、视频描述中出现频率很高的影视剧名称、实词、惯用语、形容词、略语、动词、时间词、量词或其它词性,从而可以在文本标签的提取过程中考虑大量的候选关键词的属性种类并赋予不同的权值,以保证自动标签提取的准确性。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、获取机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (19)

1.一种视频文本标签的推荐方法,其特征在于,包括:
定期从网上获取领域词补充到一领域词典中;
根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词;
对每个候选关键词的属性种类进行标注;
根据每个候选关键词的属性种类获取该候选关键词的综合权值;
对所有候选关键词的权值由大到小排序,选取综合权值靠前的若干个候选关键词作为视频文本标签。
2.如权利要求1所述的视频文本标签的推荐方法,其特征在于,所述文本信息包括视频的标题、描述以及用户标签中的一项或多项信息。
3.如权利要求1所述的视频文本标签的推荐方法,其特征在于,采用CRF方法对每个视频的文本信息进行分词和对候选关键词的属性种类进行标注。
4.如权利要求1所述的视频文本标签的推荐方法,其特征在于,所述领域词包括影视剧名称、明星名字以及热门词中的一种或多种。
5.如权利要求4所述的视频文本标签的推荐方法,其特征在于,所述领域词典包括影视剧名称词典、明星名字词典或热门词典中的一种以及多种。
6.如权利要求1所述的视频文本标签的推荐方法,其特征在于,所述候选关键词的属性种类包括候选关键词的词性种类、出现位置、出现频率、是否为命名实体以及是否为领域词中的一种或多种。
7.如权利要求1所述的视频文本标签的推荐方法,其特征在于,对所有候选关键词的综合权值由大到小进行排序之前,还包括调整有词汇直接嵌套关系或词汇类别关系的候选关键词的综合权值。
8.如权利要求7所述的视频文本标签的推荐方法,其特征在于,当候选关键词之间为词汇直接嵌套关系时,将有词汇直接嵌套关系的大粒度的候选关键词的综合权值增大,相应地将有词汇直接嵌套关系的小粒度的候选关键词的综合权值减小。
9.如权利要求7所述的视频文本标签的推荐方法,其特征在于,当候选关键词之间为词汇类别关系时,将有词汇类别关系的大类别的候选关键词的综合权值增大,相应地将有词汇类别关系的小类别的候选关键词的综合权值减小。
10.如权利要求2所述的视频文本标签的推荐方法,其特征在于,所述根据每个候选关键词在对应的文本信息中出现次数及出现位置、该候选关键词的长度及属性种类获取该候选关键词的综合权值的步骤包括:
根据每个候选关键词的长度设置长度因子,其中,候选关键词长度越长,长度因子越小;
根据每个候选关键词在对应的文本信息中出现次数及出现位置及其长度因子获取该候选关键词的频率权值;
根据每个候选关键词的属性种类获取该候选关键词的属性权值;
将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值。
11.如权利要求10所述的视频文本标签的推荐方法,其特征在于,将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值步骤之前,还包括根据每个候选关键词的长度调整该候选关键词的属性权值。
12.如权利要求10所述的视频文本标签的推荐方法,其特征在于,将每个候选关键词频率权值乘以属性权值得到该候选关键词的权值步骤之前,还包括调整为垃圾词的候选关键词的属性权值。
13.如权利要求10所述的视频文本标签的推荐方法,其特征在于,将每个候选关键词频率权值乘以属性权值得到该候选关键词的权值步骤之前,还包括调整在书名号中出现的候选关键词的属性权值。
14.一种视频文本标签的推荐系统,其特征在于,包括:
领域词典模块,用于定期从网上获取领域词补充到一领域词典中;
候选关键词模块,用于根据所述领域词典中的领域词对每个视频的文本信息进行分词生成若干候选关键词;
属性标注模块,用于对每个候选关键词进行属性种类标注;
权值获取模块,用于根据每个候选关键词属性种类获取该候选关键词的综合权值;
文本标签模块,用于对所有候选关键词的权值由大到小排序,选取权值靠前的若干个候选关键词作为视频文本标签。
15.如权利要求14所述的视频文本标签的推荐系统,其特征在于,还包括一相关关系模块,用于调整有词汇直接嵌套关系或词汇类别关系的候选关键词的综合权值。
16.如权利要求14所述的视频文本标签的推荐系统,其特征在于,所述权值获取模块包括:
长度因子单元,用于根据每个候选关键词的长度设置长度因子;
频率权值单元,用于根据每个候选关键词在对应的文本信息中出现次数、出现位置及其长度因子获取该候选关键词的频率权值;
属性权值单元,用于根据每个候选关键词的属性种类获取该候选关键词的属性权值;
综合权值单元,用于将每个候选关键词频率权值乘以属性权值得到该候选关键词的综合权值。
17.如权利要求16所述的视频文本标签的推荐系统,其特征在于,所述权值获取模块还包括一依长度调整单元,用于根据每个候选关键词的长度调整该候选关键词的属性权值。
18.如权利要求16所述的视频文本标签的推荐系统,其特征在于,所述权值获取模块还包括一依垃圾词调整单元,用于调整为垃圾词的候选关键词的属性权值。
19.如权利要求16所述的视频文本标签的推荐系统,其特征在于,所述权值获取模块还包括一依书名号调整单元,用于调整在书名号中出现的候选关键词的属性权值。
CN 201110422572 2011-12-15 2011-12-15 视频文本标签的推荐方法及系统 Pending CN103164471A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110422572 CN103164471A (zh) 2011-12-15 2011-12-15 视频文本标签的推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110422572 CN103164471A (zh) 2011-12-15 2011-12-15 视频文本标签的推荐方法及系统

Publications (1)

Publication Number Publication Date
CN103164471A true CN103164471A (zh) 2013-06-19

Family

ID=48587565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110422572 Pending CN103164471A (zh) 2011-12-15 2011-12-15 视频文本标签的推荐方法及系统

Country Status (1)

Country Link
CN (1) CN103164471A (zh)

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324760A (zh) * 2013-07-11 2013-09-25 中国农业大学 使用解说词文档自动生成营养健康教育视频的方法及系统
CN103984740A (zh) * 2014-05-23 2014-08-13 合一网络技术(北京)有限公司 基于组合标签的检索页显示的方法和系统
CN104462360A (zh) * 2014-12-05 2015-03-25 北京奇虎科技有限公司 一种为文本集合生成语义标识的方法和装置
CN104572736A (zh) * 2013-10-23 2015-04-29 北大方正集团有限公司 基于社交网络的关键词提取方法及装置
CN104661056A (zh) * 2013-11-19 2015-05-27 财团法人资讯工业策进会 交互式广告提供方法及系统
CN104933120A (zh) * 2015-06-04 2015-09-23 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN104978402A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN104978401A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN105096933A (zh) * 2015-05-29 2015-11-25 百度在线网络技术(北京)有限公司 分词词典的生成方法和装置及语音合成方法和装置
CN105138670A (zh) * 2015-09-06 2015-12-09 天翼爱音乐文化科技有限公司 音频文件标签生成方法和系统
CN105260359A (zh) * 2015-10-16 2016-01-20 晶赞广告(上海)有限公司 语义关键词提取方法及装置
CN105554519A (zh) * 2015-12-24 2016-05-04 北京酷云互动科技有限公司 Epg信息解析方法及系统
CN105701139A (zh) * 2015-11-26 2016-06-22 中国传媒大学 一种全息视频素材标引方法
CN105718586A (zh) * 2016-01-26 2016-06-29 中国人民解放军国防科学技术大学 分词的方法及装置
CN105868242A (zh) * 2015-12-14 2016-08-17 乐视网信息技术(北京)股份有限公司 网络推荐中标签的排序方法及系统
CN105868176A (zh) * 2016-03-02 2016-08-17 北京同尘世纪科技有限公司 基于文字的视频合成方法及其系统
CN105893436A (zh) * 2015-12-14 2016-08-24 乐视网信息技术(北京)股份有限公司 视频网站单账号多喜好推荐方法和装置
CN105893571A (zh) * 2016-03-31 2016-08-24 乐视控股(北京)有限公司 一种视频内容标签的建立方法和系统
CN105893478A (zh) * 2016-03-29 2016-08-24 广州华多网络科技有限公司 一种标签提取方法及设备
CN106303719A (zh) * 2016-08-02 2017-01-04 合网络技术(北京)有限公司 一种按顺序推荐视频的方法及装置
CN106354867A (zh) * 2016-09-12 2017-01-25 传线网络科技(上海)有限公司 多媒体资源的推荐方法及装置
CN106708932A (zh) * 2016-11-21 2017-05-24 百度在线网络技术(北京)有限公司 问答类网站的回复的摘要提取方法及装置
WO2017097166A1 (zh) * 2015-12-11 2017-06-15 北京国双科技有限公司 识别领域命名实体的方法及装置
CN106980666A (zh) * 2017-03-22 2017-07-25 广州优视网络科技有限公司 一种推荐视频的方法和装置
CN106980667A (zh) * 2017-03-22 2017-07-25 广州优视网络科技有限公司 一种给文章标注标签的方法和装置
CN106997350A (zh) * 2016-01-22 2017-08-01 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN107436922A (zh) * 2017-07-05 2017-12-05 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107480128A (zh) * 2017-07-17 2017-12-15 广州特道信息科技有限公司 中文文本的分词方法及装置
CN107977375A (zh) * 2016-10-25 2018-05-01 央视国际网络无锡有限公司 一种视频标签生成方法及装置
CN108009293A (zh) * 2017-12-26 2018-05-08 北京百度网讯科技有限公司 视频标签生成方法、装置、计算机设备和存储介质
CN108446276A (zh) * 2018-03-21 2018-08-24 腾讯音乐娱乐科技(深圳)有限公司 确定歌单关键词的方法和装置
CN108446695A (zh) * 2018-02-06 2018-08-24 阿里巴巴集团控股有限公司 用于数据标注的方法、装置和电子设备
CN108897871A (zh) * 2018-06-29 2018-11-27 北京百度网讯科技有限公司 文档推荐方法、装置、设备及计算机可读介质
CN108984554A (zh) * 2017-06-01 2018-12-11 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN109213921A (zh) * 2017-06-29 2019-01-15 广州涌智信息科技有限公司 一种商品信息的搜索方法及装置
CN109325148A (zh) * 2018-08-03 2019-02-12 百度在线网络技术(北京)有限公司 生成信息的方法和装置
CN109388714A (zh) * 2018-10-23 2019-02-26 东软集团股份有限公司 文本标注方法、装置、设备和计算机可读存储介质
CN109508406A (zh) * 2018-12-12 2019-03-22 北京奇艺世纪科技有限公司 一种信息处理方法、装置及计算机可读存储介质
CN109754786A (zh) * 2017-11-06 2019-05-14 奥迪股份公司 用于车辆的语音控制装置
CN109816047A (zh) * 2019-02-19 2019-05-28 北京达佳互联信息技术有限公司 提供标签的方法、装置、设备及可读存储介质
US10339146B2 (en) 2014-11-25 2019-07-02 Samsung Electronics Co., Ltd. Device and method for providing media resource
CN110222232A (zh) * 2019-05-10 2019-09-10 北京百度网讯科技有限公司 视频内容处理方法、装置、计算机设备及存储介质
CN110287375A (zh) * 2019-05-30 2019-09-27 北京百度网讯科技有限公司 视频标签的确定方法、装置及服务器
CN110866106A (zh) * 2019-10-10 2020-03-06 重庆金融资产交易所有限责任公司 一种文本推荐方法及相关设备
CN111125435A (zh) * 2019-12-17 2020-05-08 北京百度网讯科技有限公司 视频标签的确定方法、装置和计算机设备
CN111639051A (zh) * 2020-04-09 2020-09-08 中车青岛四方机车车辆股份有限公司 一种轨道车辆的影像文件处理方法
CN111737523A (zh) * 2020-04-22 2020-10-02 聚好看科技股份有限公司 一种视频标签、搜索内容的生成方法及服务器
CN113392637A (zh) * 2021-06-24 2021-09-14 青岛科技大学 基于tf-idf的主题词提取方法、装置、设备及存储介质
CN113709526A (zh) * 2021-08-26 2021-11-26 北京高途云集教育科技有限公司 一种教学视频生成方法、装置、计算机设备及存储介质
CN113722542A (zh) * 2021-08-31 2021-11-30 青岛聚看云科技有限公司 视频推荐方法及显示设备
CN114218452A (zh) * 2021-10-29 2022-03-22 赢火虫信息科技(上海)有限公司 一种基于公开信息推荐律师的方法、装置及电子设备

Cited By (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324760A (zh) * 2013-07-11 2013-09-25 中国农业大学 使用解说词文档自动生成营养健康教育视频的方法及系统
CN103324760B (zh) * 2013-07-11 2016-08-17 中国农业大学 使用解说词文档自动生成营养健康教育视频的方法及系统
CN104572736A (zh) * 2013-10-23 2015-04-29 北大方正集团有限公司 基于社交网络的关键词提取方法及装置
CN104661056A (zh) * 2013-11-19 2015-05-27 财团法人资讯工业策进会 交互式广告提供方法及系统
CN103984740A (zh) * 2014-05-23 2014-08-13 合一网络技术(北京)有限公司 基于组合标签的检索页显示的方法和系统
US10339146B2 (en) 2014-11-25 2019-07-02 Samsung Electronics Co., Ltd. Device and method for providing media resource
CN104462360A (zh) * 2014-12-05 2015-03-25 北京奇虎科技有限公司 一种为文本集合生成语义标识的方法和装置
CN105096933B (zh) * 2015-05-29 2017-06-20 百度在线网络技术(北京)有限公司 分词词典的生成方法和装置及语音合成方法和装置
CN105096933A (zh) * 2015-05-29 2015-11-25 百度在线网络技术(北京)有限公司 分词词典的生成方法和装置及语音合成方法和装置
CN104978402A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN104978401B (zh) * 2015-06-04 2019-07-02 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN104978401A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN104933120A (zh) * 2015-06-04 2015-09-23 无锡天脉聚源传媒科技有限公司 一种视频专辑的关键词设置方法及装置
CN105138670A (zh) * 2015-09-06 2015-12-09 天翼爱音乐文化科技有限公司 音频文件标签生成方法和系统
CN105138670B (zh) * 2015-09-06 2018-12-14 天翼爱音乐文化科技有限公司 音频文件标签生成方法和系统
CN105260359B (zh) * 2015-10-16 2018-10-02 晶赞广告(上海)有限公司 语义关键词提取方法及装置
CN105260359A (zh) * 2015-10-16 2016-01-20 晶赞广告(上海)有限公司 语义关键词提取方法及装置
CN105701139A (zh) * 2015-11-26 2016-06-22 中国传媒大学 一种全息视频素材标引方法
WO2017097166A1 (zh) * 2015-12-11 2017-06-15 北京国双科技有限公司 识别领域命名实体的方法及装置
CN106874256A (zh) * 2015-12-11 2017-06-20 北京国双科技有限公司 识别领域命名实体的方法及装置
CN105893436A (zh) * 2015-12-14 2016-08-24 乐视网信息技术(北京)股份有限公司 视频网站单账号多喜好推荐方法和装置
CN105868242A (zh) * 2015-12-14 2016-08-17 乐视网信息技术(北京)股份有限公司 网络推荐中标签的排序方法及系统
CN105554519B (zh) * 2015-12-24 2019-02-22 北京酷云互动科技有限公司 Epg信息解析方法及系统
CN105554519A (zh) * 2015-12-24 2016-05-04 北京酷云互动科技有限公司 Epg信息解析方法及系统
CN106997350A (zh) * 2016-01-22 2017-08-01 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN105718586A (zh) * 2016-01-26 2016-06-29 中国人民解放军国防科学技术大学 分词的方法及装置
CN105718586B (zh) * 2016-01-26 2018-12-28 中国人民解放军国防科学技术大学 分词的方法及装置
CN105868176A (zh) * 2016-03-02 2016-08-17 北京同尘世纪科技有限公司 基于文字的视频合成方法及其系统
CN105893478B (zh) * 2016-03-29 2019-10-29 广州华多网络科技有限公司 一种标签提取方法及设备
CN105893478A (zh) * 2016-03-29 2016-08-24 广州华多网络科技有限公司 一种标签提取方法及设备
CN105893571A (zh) * 2016-03-31 2016-08-24 乐视控股(北京)有限公司 一种视频内容标签的建立方法和系统
CN106303719B (zh) * 2016-08-02 2019-09-17 优酷网络技术(北京)有限公司 一种按顺序推荐视频的方法及装置
CN106303719A (zh) * 2016-08-02 2017-01-04 合网络技术(北京)有限公司 一种按顺序推荐视频的方法及装置
CN106354867A (zh) * 2016-09-12 2017-01-25 传线网络科技(上海)有限公司 多媒体资源的推荐方法及装置
CN107977375A (zh) * 2016-10-25 2018-05-01 央视国际网络无锡有限公司 一种视频标签生成方法及装置
CN106708932A (zh) * 2016-11-21 2017-05-24 百度在线网络技术(北京)有限公司 问答类网站的回复的摘要提取方法及装置
CN106980666B (zh) * 2017-03-22 2020-08-21 广州优视网络科技有限公司 一种推荐视频的方法和装置
CN106980667A (zh) * 2017-03-22 2017-07-25 广州优视网络科技有限公司 一种给文章标注标签的方法和装置
CN106980666A (zh) * 2017-03-22 2017-07-25 广州优视网络科技有限公司 一种推荐视频的方法和装置
WO2018171295A1 (zh) * 2017-03-22 2018-09-27 广州优视网络科技有限公司 一种给文章标注标签的方法、装置、终端及计算机可读存储介质
CN108984554A (zh) * 2017-06-01 2018-12-11 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN108984554B (zh) * 2017-06-01 2021-06-29 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN109213921A (zh) * 2017-06-29 2019-01-15 广州涌智信息科技有限公司 一种商品信息的搜索方法及装置
CN107436922B (zh) * 2017-07-05 2021-06-08 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107436922A (zh) * 2017-07-05 2017-12-05 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107480128A (zh) * 2017-07-17 2017-12-15 广州特道信息科技有限公司 中文文本的分词方法及装置
CN109754786A (zh) * 2017-11-06 2019-05-14 奥迪股份公司 用于车辆的语音控制装置
CN108009293A (zh) * 2017-12-26 2018-05-08 北京百度网讯科技有限公司 视频标签生成方法、装置、计算机设备和存储介质
CN108446695B (zh) * 2018-02-06 2022-02-11 创新先进技术有限公司 用于数据标注的方法、装置和电子设备
CN108446695A (zh) * 2018-02-06 2018-08-24 阿里巴巴集团控股有限公司 用于数据标注的方法、装置和电子设备
CN108446276B (zh) * 2018-03-21 2022-02-25 腾讯音乐娱乐科技(深圳)有限公司 确定歌单关键词的方法和装置
CN108446276A (zh) * 2018-03-21 2018-08-24 腾讯音乐娱乐科技(深圳)有限公司 确定歌单关键词的方法和装置
CN108897871B (zh) * 2018-06-29 2020-10-30 北京百度网讯科技有限公司 文档推荐方法、装置、设备及计算机可读介质
CN108897871A (zh) * 2018-06-29 2018-11-27 北京百度网讯科技有限公司 文档推荐方法、装置、设备及计算机可读介质
CN109325148A (zh) * 2018-08-03 2019-02-12 百度在线网络技术(北京)有限公司 生成信息的方法和装置
CN109388714B (zh) * 2018-10-23 2020-11-24 东软集团股份有限公司 文本标注方法、装置、设备和计算机可读存储介质
CN109388714A (zh) * 2018-10-23 2019-02-26 东软集团股份有限公司 文本标注方法、装置、设备和计算机可读存储介质
CN109508406A (zh) * 2018-12-12 2019-03-22 北京奇艺世纪科技有限公司 一种信息处理方法、装置及计算机可读存储介质
CN109816047A (zh) * 2019-02-19 2019-05-28 北京达佳互联信息技术有限公司 提供标签的方法、装置、设备及可读存储介质
CN109816047B (zh) * 2019-02-19 2022-05-24 北京达佳互联信息技术有限公司 提供标签的方法、装置、设备及可读存储介质
CN110222232A (zh) * 2019-05-10 2019-09-10 北京百度网讯科技有限公司 视频内容处理方法、装置、计算机设备及存储介质
CN110287375A (zh) * 2019-05-30 2019-09-27 北京百度网讯科技有限公司 视频标签的确定方法、装置及服务器
CN110287375B (zh) * 2019-05-30 2022-02-15 北京百度网讯科技有限公司 视频标签的确定方法、装置及服务器
CN110866106A (zh) * 2019-10-10 2020-03-06 重庆金融资产交易所有限责任公司 一种文本推荐方法及相关设备
CN111125435B (zh) * 2019-12-17 2023-08-11 北京百度网讯科技有限公司 视频标签的确定方法、装置和计算机设备
CN111125435A (zh) * 2019-12-17 2020-05-08 北京百度网讯科技有限公司 视频标签的确定方法、装置和计算机设备
CN111639051A (zh) * 2020-04-09 2020-09-08 中车青岛四方机车车辆股份有限公司 一种轨道车辆的影像文件处理方法
CN111639051B (zh) * 2020-04-09 2023-08-25 中车青岛四方机车车辆股份有限公司 一种轨道车辆的影像文件处理方法
CN111737523A (zh) * 2020-04-22 2020-10-02 聚好看科技股份有限公司 一种视频标签、搜索内容的生成方法及服务器
CN111737523B (zh) * 2020-04-22 2023-11-14 聚好看科技股份有限公司 一种视频标签、搜索内容的生成方法及服务器
CN113392637A (zh) * 2021-06-24 2021-09-14 青岛科技大学 基于tf-idf的主题词提取方法、装置、设备及存储介质
CN113392637B (zh) * 2021-06-24 2023-02-07 青岛科技大学 基于tf-idf的主题词提取方法、装置、设备及存储介质
CN113709526A (zh) * 2021-08-26 2021-11-26 北京高途云集教育科技有限公司 一种教学视频生成方法、装置、计算机设备及存储介质
CN113709526B (zh) * 2021-08-26 2023-10-20 北京高途云集教育科技有限公司 一种教学视频生成方法、装置、计算机设备及存储介质
CN113722542A (zh) * 2021-08-31 2021-11-30 青岛聚看云科技有限公司 视频推荐方法及显示设备
CN114218452A (zh) * 2021-10-29 2022-03-22 赢火虫信息科技(上海)有限公司 一种基于公开信息推荐律师的方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN103164471A (zh) 视频文本标签的推荐方法及系统
Kuzman et al. Automatic genre identification: a survey
US20170235841A1 (en) Enterprise search method and system
CN102207948B (zh) 一种事件陈述句素材库的生成方法
CN106095762A (zh) 一种基于本体模型库的新闻推荐方法及装置
CN103049435A (zh) 文本细粒度情感分析方法及装置
CN114254653A (zh) 一种科技项目文本语义抽取与表示分析方法
Jiang et al. An approach based on tree kernels for opinion mining of online product reviews
CN113886604A (zh) 一种职位知识图谱生成方法和系统
CN113221559B (zh) 利用语义特征的科技创新领域中文关键短语抽取方法及系统
WO2009017464A1 (en) Relation extraction system
CN109086355A (zh) 基于新闻主题词的热点关联关系分析方法及系统
Islam et al. Polarity detection of online news articles based on sentence structure and dynamic dictionary
Qiu et al. Incorporate the syntactic knowledge in opinion mining in user-generated content
Liu et al. Opinion searching in multi-product reviews
Lin et al. Enhanced BERT-based ranking models for spoken document retrieval
Perez-Tellez et al. On the difficulty of clustering microblog texts for online reputation management
CN111737498A (zh) 一种应用于离散制造业生产过程的领域知识库建立方法
Bhat Statistical stemming for Kannada
CN114298058B (zh) 文章替换词推荐方法、系统、计算机可读介质
Chaudhari et al. Feature based approach for review mining using appraisal words
Welch Addressing the challenges of underspecification in web search
CN106844329A (zh) 一种基于邮件列表的开源软件问答信息抽取方法
Tsapatsoulis Web image indexing using WICE and a learning-free language model
Wu et al. TextRank keyword extraction method based on multi-feature fusion

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130619