CN101419614A - 视频资源聚类方法和装置 - Google Patents
视频资源聚类方法和装置 Download PDFInfo
- Publication number
- CN101419614A CN101419614A CNA200810178499XA CN200810178499A CN101419614A CN 101419614 A CN101419614 A CN 101419614A CN A200810178499X A CNA200810178499X A CN A200810178499XA CN 200810178499 A CN200810178499 A CN 200810178499A CN 101419614 A CN101419614 A CN 101419614A
- Authority
- CN
- China
- Prior art keywords
- video
- video resource
- information
- resource
- relevant information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种视频资源聚类方法和装置。该方法包括:建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词;建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息,并且根据视频关键词库提取视频资源标题的关键词;判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
Description
技术领域
本发明涉及计算机网络技术,特别地涉及一种视频资源聚类方法和装置。
背景技术
随着互联网技术的不断发展,互联网上有大量的视频资源可供用户下载,同时也出现了一些资源聚合网站和资源搜索网站。资源聚合网站或资源搜索网站的主要功能是将互联网中大量的零散无序的视频资源整合到一起,便于查找。
资源聚合网站主要通过人工查看的方式将搜集的视频文件进行分类和显示。例如,目前常见的bt类资源网站,电骡资源网站等,它们均采用人工查看的方式将视频资源按照一定规则分类,并按一定顺序展现给用户,以便用户浏览或下载。
由于视频资源网站数量众多,同时资源聚合网站或资源搜索网站也相应获得了大量的视频资源,采用人工查看的方式将如此大量的视频资源进行聚类,将消耗大量时间及人力。
发明内容
本发明实施例的主要目的是提供一种视频资源聚类方法,用以解决以人工查看方式进行视频资源聚类工作效率较低的问题。
为解决上述问题,本发明实施例提供如下的技术方案:
一种视频资源聚类方法,包括如下步骤:
建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词;
建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息,并且根据视频关键词库提取视频资源标题的关键词;
判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
一种视频资源聚类装置,包括:
词库建立模块、视频资源库模块、一级聚类模块,其中:
所述词库建立模块,用于建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词;
所述视频资源库模块,用于建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息;
所述一级聚类模块,用于判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
本发明实施例中提供的技术方案,其通过判断视频资源的相关信息中是否包含有特定视频关键词,从而将视频资源聚类于按照该特定视频关键词分类的类别,其可准确的将视频资源进行聚类。
附图说明
图1为本发明实施例的视频资源聚类方法流程图;
图2为本发明实施例的视频资源聚类装置结构示意图;
图3为本发明第一实施例的完整化模块结构示意图;
图4为本发明第二实施例的完整化模块结构示意图。
具体实施方式
在本发明实施例中,视频资源的相关信息保存在视频资源库中,并且保存提取的视频关键词,再通过查找视频信息中包含的视频关键词,将视频资源按照该视频关键词进行聚类。如图1所示,具体步骤如下:
步骤11:建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词。在本步骤中需要建立视频关键词词库,在本发明实施例中,每个视频关键词可以是电影影片名,也可以是电视剧名,将各种影片的影片名、各种电视剧的剧名录入视频关键词词库。该关键词词库通常由人工录入。或Spider从视频网站抓取,人工辅助编辑。
步骤12:建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息。建立视频资源库的过程就是从互联网获取视频资源的相关信息并保存的过程。通常视频资源的相关信息由资源抓取程序(例如网络蜘蛛spider)获取,资源抓取程序通常采用为网站配置网页模板或通过程序智能分析的方式从网页中获取视频资源的标题、文件格式、导演、演员以及下载链接等相关信息。例如某视频资源网站的视频资源介绍页面中,文本“影片名:”后面的文本为视频资源的名称,文本“导演:”后面的文本为该影片的导演名称等,则可根据该规律配置网页模板,资源抓取程序根据该模板将所述某视频资源网站的视频资源介绍页面中的视频资源相关信息抓取并保存。
在获取到视频资源的相关信息后,可以先判断视频资源库中是否有该视频资源的相关信息,若没有,则将该视频资源的相关信息保存在视频资源库中。较佳地,可获取视频资源的标识信息,该标识信息也可是视频资源的相关信息之一,例如视频资源的名称信息等,还可以是根据预定算法对视频文件进行计算后获得的标识信息,或称为内容签名CID(Content ID),所述预定算法为对不同的视频文件的内容数据进行处理得到不同的处理结果的算法,例如哈希(hash)算法,哈希算法可以采用信息-摘要算法(Message-DigestAlgorithm5,MD5),MD4,安全散列算法(Secure Hash Algorithm,SHA),安全散列算法(Secure Hash Standard,SHS)等算法作为公式。内容标识CID码的获得包括但不限于以下两种方法:第一种,提取文件的部分数据,将提取的部分数据进行哈希(hash)运算,将运算结果作为该文件的CID码的值。比如,可以提取视频文件的前面32k字节、中间32k字节和尾部32k字节的数据,将提取的数据通过哈希运算,如md5计算出一个值,将该值作为视频文件的CID码的值;第二种,将文件的全部数据进行哈希运算,将运算结果作为该视频文件的CID码的值。
若视频资源库中已有与获取的标识信息相同的标识信息,则根据预设的相关信息的来源级别,判断若该已有的标识信息所对应的视频资源的相关信息的来源级别低于获取的视频资源的相关信息的来源级别,则在视频资源库中保存所述获取的相关信息及标识信息。例如,视频资源的相关信息中包含有根据视频资源某些字节计算出来的唯一CID,如果获取的视频信息中的CID已经包含在视频资源库中的某一条视频资源的相关信息中,则根据预设的来源级别进行判断,若该条视频信息的来源级别低于获取的视频信息的来源级别,则可以删除该条视频信息,在视频资源库中保存获取的视频信息。对于上述预设的来源级别,可以是将知名的或大型的视频资源网站名称或其网络地址设为较高的级别,这种做法是基于知名或大型的视频资源网站的视频文件的描述信息一般来说具有较佳的质量。也可以根据其他经验来设置来源级别。
较佳地,所述建立视频资源库进一步包括:删除所述已有的标识信息所对应的视频资源的相关信息;或删除所述已有的标识信息所对应视频资源的除链接信息外的相关信息。即可删除原有来源级别较低的视频资源相关信息,也可保留其链接信息,以作为备用链接。
视频资源库及视频关键词词库的建立可无先后顺序。
步骤13:判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
通过前述步骤,可将包含了相同相关信息的视频资源聚为一类,例如将视频名称中包含了相同关键词的视频资源聚为一类。
可以按照视频资源在视频资源库中的存储位置依次进行视频关键词匹配。例如,视频关键词词库中包含“闯关东、海防最前线、明天”等视频关键词;在视频资源库包含的视频资源的相关信息中,有五条相关信息分别包含如下内容:
[2008-01-11][国产][闯关东下部][国语24集][VCD-RMVB][FY][48];
[影视帝国.海防最前线.The.Guardian.2006.CD2][rm][800/432];
[2008-01-11][国产][闯关东下部][国语24集][VCD-RMVB][FY][46];
[海防最前线][The.Guardian][2006][CD3][rm][800/432];
[海防最前线cd1][RMVB][624/352]。
则依次可以从各个相关信息中匹配出的视频关键词为:闯关东、海防最前线、闯关东、海防最前线、海防最前线。
经过上述的步骤11-13,能够将视频资源库中的视频资源相关信息按视频关键词聚类,得到与视频关键词唯一对应的一级类别,例如,对于视频关键词“海防最前线”,得到的一个一级类别中的视频信息如下:
20085[海防最前线][The.Guardian][2006][CD1][rm][800/432]
20085[影视帝国.海防最前线.The.Guardian.2006.CD1][rm][800/432]
20085[海防最前线cd1][RMVB][624/352]
20085[海防最前线CD1][RMVB][624/352]
20085[海防最前线][The.Guardian][2006][CD2][rm][800/432]
20085[影视帝国.海防最前线.The.Guardian.2006.CD3][rm][800/432]
20085[海防最前线CD2][RMVB][720/384]
20085[海防最前线cd2][RMVB][624/352]
20085[海防最前线][The.Guardian][2006][CD3][rm]800/432]
20085[海防最前线CD1][RMVB][720/384]
20085[影视帝国.海防最前线.The.Guardian.2006.CD2][rm][800/432]
即所有相关信息中包括视频关键词“海防最前线”的视频资源将被聚为一类。每条信息中的“20085”是该一级类别的标识信息。具体方式可以是在各个视频资源的相关信息中添加一级类别的识别信息,例如在“[cd1][RMVB][624/352]”中添加一级类别的编号“20085”,该一级类别是根据第一关键词“海防最前线”聚类而得。
较佳地,在所述将该视频资源聚类于按照该视频关键词分类的一级类别之后,还可包括:
步骤14:判断若所述视频资源库中的相关信息包含有指定的二级视频文件特征,则在所述一级类别之中,分别将各视频资源聚类于按照该二级视频文件特征分类的二级类别。
所述二级视频文件特征可为:标示了该视频资源内容为电影或电视剧的标示信息;标示了多个视频资源之间顺序关系的集数特征;视频资源的拍摄时间;视频资源的格式信息;视频资源的来源;或视频资源的分辨率等。
在以视频关键词作为一级类别分类后的视频资源中,可再进一步进行二级分类。
可根据视频资源的相关信息,例如视频关键词、视频资源格式信息、视频资源的分辨率、视频资源的下载链接等,对视频资源进行二级分类。较佳地,可单独按照视频资源的某一个相关信息进行二级分类,例如,将已被按照一级类别分出的所有“海防最前线”视频资源,再按照视频资源格式信息进行二级分类,其二级分类结果可能为“AVI”格式的视频资源分为一类,“RMVB”格式的视频资源分为一类。
较佳地,还可将视频资源的多个相关信息连接起来做一个散列(如采用hash算法将所述多个相关信息连接起来的内容进行运算得到一个特征值),即采用特征值表示这些信息。当然也可以只采用部分信息求取特征值。如此就可以得到每个视频资源的一个分类特征值,根据该分类特征值就可以在所述一级类别之中对视频资源进行二级分类。当利用所述相关信息中的视频资源的下载链接信息时,可只利用链接中的主要部分,主要部分是指除了链接中的用于标识多个相关联的视频资源顺序的集数信息部分的其他部分。例如,对于链接“http://2.ffdy.cn:7020/电视剧/天龙八部/06.rmvb”其主要部分由“http://2.ffdy.cn:7020/电视剧/天龙八部/”及“rmvb”两部分组成,不包含其集数信息部分“06”。通常情况下在视频资源链接的后缀名之前的数字或字母为所述集数信息,其中具体的集数信息部分可为“01、02、11、CD1、CD2”等文本,可预先设定符合该规律的数字或字母将被认为是集数信息,将此类文本从下载链接中去除,则得到了下载链接的主要部分。
以下是获取分类特征值的实例,下面六条资源信息:
[海防最前线][The.Guardian][2006][CD1][rm][800/432]
http://2.ffdy.cn:7020/电影/海防最前线/cd1.rm、
[海防最前线][The.Guardian][2006][CD2][rm][800/432]
http://2.ffdy.cn:7020/电影/海防最前线/cd2.rm、
[海防最前线][The.Guardian][2006][CD3][rm]800/432]
http://2.ffdy.cn:7020/电影/海防最前线cd3.rm、
[影视帝国.海防最前线.The.Guardian.2006.CD1][rm][800/432]
http://5.abc.cn/海防最前线/1.rm、
[影视帝国.海防最前线.The.Guardian.2006.CD3][rm][800/432]
http://5.abc.cn/海防最前线/2.rm及
[影视帝国.海防最前线.The.Guardian.2006.CD2][rm][800/432]
http://5.abc.cn/海防最前线3.rm
前三个视频资源的相关信息同为“视频名称:海防最前线”、“格式:rm”、“分辨率:800X432”,“链接主要部分:http://2.ffdy.cn:7020/电影/海防最前线rm”,后三个视频资源的相关信息同为“视频名称:海防最前线”、“格式:rm”、“分辨率:800X432”,“链接主要部分:http://5.abc.cn/海防最前线rm”。采用视频名称、格式、分辨率、链接主要部分通过hash计算得到一个值,作为视频资源的二级分类特征值,例如20201、20201、20201、30022、30022及30022,则可以根据这几个特征值将上述六个资源进行准确的二级分类,即前三个视频资源将被分为同类,而后三个视频资源也将被分为同类。
较佳地,所述二级视频文件特征可包括标示了视频内容为电影的标示信息,并且所述相关信息包含电影的影片名,或者所述相关信息包含标示了视频内容为电视剧的标示信息,并且所述视频信息包含电视剧的剧名;并且所述二级类别包括电影类别和电视剧类别。
有很多名称相同的视频对应了不同版本的视频资源,例如电影版本和电视剧版本,通过此步骤可将其进行二级分类加以区分。
通常电影版和电视剧版的同名视频其演员及视频拍摄时间都不同,所以可以根据这两者进行二级分类。
则较佳地,所述二级视频文件特征包括视频拍摄时间和/或演员姓名;
所述将该相关信息聚类于按照该二级视频文件特征分类的二级类别包括:
根据所述相关信息中包括的视频拍摄时间和演员姓名确认视频内容为电影或电视剧;根据确认的视频内容,将所述相关信息聚类于电影类别或电视剧类别。
如果二级分类为将属于同一部连续剧或同一系列的电影分为一类时,则可能需要判断是否已经获取了属于同一部的所有视频资源,则较佳地,所述方法还包括:
判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,则根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列。
判断按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列有不同方法,较佳地,所述判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,包括:
获取按照二级视频资源特征分类的同类视频资源的链接信息,如果各链接信息的不同部分不能组成连续的数字或字母排列,则该同类视频资源未包含完整的视频资源序列。
具体的,分析二级分类中每个视频资源的链接信息,求出各个链接的公共部分及不同部分,然后根据这些不同部分按视频资源的集数规律对资源链接进行遍历,构造新的视频文件链接。
例如:对已经做好二级分类的电视剧天龙八部
http://2.ffdy.cn:7020/电视剧/天龙八部/1.rmvb
http://2.ffdy.cn:7020/电视剧/天龙八部/2.rmvb
http://2.ffdy.cn:7020/电视剧/天龙八部/3.rmvb
http://2.ffdy.cn:7020/电视剧/天龙八部/5.rmvb
链接的不同部分为“1、2、3及5”,其不能组成连续的数字,所以判断该二级分类中未获取完整的视频资源序列。可对其进行补全。通过分析这些链接,提取出公共部分http://2.ffdy.cn:7020/电视剧/天龙八部/.rmvb,以及差异部分1、2、3及5,根据预先制定的集数生成规则,可以生成缺少的集数4,进而生成链接“http://2.ffdy.cn:7020/电视剧/天龙八部/04.rmvb”。根据新构造的视频文件链接,判断该文件链接及相应文件是否真实存在,若存在,则补充到视频资源库中。例如采用一些常用下载程序自动探测该链接的有效性。同样,如果所述集数信息为字母“a、b、d”,也可根据规律获知缺少的集数信息为“c”。
则较佳地,所述根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列,包括:
将所述不能组成连续的数字或字母排列所缺少的数字或字母,替换链接信息中的不同部分形成新的链接,从该新的链接获取视频资源以获取完整的视频资源序列。
如果所述链接信息中的不同部分能组成连续数字或字母排列,则可分析其数字最大或字母排列最后的集数之后是否还有属于同类的视频。则较佳地,所述判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,包括:
从所述同类视频资源的链接信息的不同部分中,获取数值为最大的或英文字母排序为最后的链接信息;
将所获取的数值为最大的链接信息的所述不同部分的数值增加一,或将所获取的英文字母排序为最后的链接信息的所述不同部分,替换为所述排序为最后的英文字母的下一个英文字母,以生成新的链接;
如果能连接至所述新的链接,则所述同类视频资源未包含完整的视频资源序列。
可从所述新的链接获取视频资源以获取完整的视频资源序列。
通过前述方法可将视频资源按照不同级别进行聚类,可将同名的视频文件聚为一类,并可区分不同的格式版本或电视剧电影版本等。聚类后还可向用户分类展示各种视频信息,并且根据完整的视频内容,将需要同时下载的视频文件一并展示,例如分别包含影片的上下集的两个视频文件或者包含电视连续剧的与集数相同数目的视频文件。
在这种聚类方式下,视频信息来源、视频文件格式、视频文件分辨率都考虑在内。具有相同标识信息的类别,构成内容上完整的一套视频文件。
一般情况下,对于视频资源库中的视频信息聚类,可以首先根据电影的影片名或电视剧的剧名进行聚类,得到一级类别,在有些情况下,相同名称的视频作品中既有电影又有电视剧,例如“红楼梦”,此时视频信息中有时也包含有标示了该视频资源内容为电影或电视剧的标示信息,根据该标示信息对一级类别再划分为电影类别和电视剧类别。有些视频题材可能会多次拍摄,得到相同名称的多个不同时期的版本,例如“红楼梦”,所以在电影类别和电视剧类别中可以各自进一步按拍摄时间分类。对于按照拍摄时间所得的各个类别,还可以各自再按视频文件格式划分类别,此时视频信息中需包含视频文件的格式,接下来还可以按视频信息中包含的视频文件来源进一步划分类别,以及再根据视频信息中包含的视频文件分辨率划分类别。这里划分类别也可以根据其他次序例如先按视频文件格式划分,在得到的类别中再按视频文件来源划分。
对视频资源进行聚类有利于向用户有条理地展示视频信息。用户首先通过终端设备例如连接在互联网上的个人电脑,向视频聚合网站或资源搜索网站发送查询指令,查询指令用于选择视频,该查询指令中包含视频关键词,一般来说用户是根据影片名或电视剧名来获取视频文件。视频聚合或视频搜索网站的相关服务器收到查询指令后,根据其中的查询词,服务器按照一级或二级聚类的结果以特定的顺序返回相应的内容呈现给用户。以上面列出内容的二级类别为例,如果用户输入了“海防最前线”,视频聚合网站或搜索网站则会按照二级类别分类结果向用户展示如下内容:
200859[海防最前线][The.Guardian][2006][CD1][rm][800/432]
200859[海防最前线][The.Guardian][2006][CD2][rm][800/432]
200859[海防最前线][The.Guardian][2006][CD3][rm]800/432]
200858[影视帝国.海防最前线.The.Guardian.2006.CD1][rm][800/432]
200858[影视帝国.海防最前线.The.Guardian.2006.CD2][rm][800/432]
200858[影视帝国.海防最前线.The.Guardian.2006.CD3][rm][800/432]
200857[海防最前线CD1][RMVB][720/384]
200857[海防最前线CD2][RMVB][720/384]
200855[海防最前线cd1][RMVB][624/352]
200855[海防最前线cd2][RMVB][624/352]
根据这样的展示内容,用户能够清楚地浏览关于影片《海防最前线》的视频信息,从而进一步选择他需要下载的视频文件。
较佳地,所述将该视频资源聚类于按照该视频关键词分类的一级类别之后可进一步包括:
当接收到包含视频关键词的视频信息查询指令时,输出所述视频资源库中与所述视频关键词关联的视频信息。
如此可将根据一级类别聚类在一起的视频资源集中在一起显示给用户,以便用户进行选择。
较佳地,所述将该视频资源聚类于按照该二级视频文件特征分类的二级类别之后可进一步包括:
当接收到包含视频关键词的视频信息查询指令时,确认所述视频关键词所对应的视频资源的相关信息;
将确认的所述视频资源的相关信息按二级类别排序后输出。
如此可在一级类别聚类的基础上,在各一级类别内部将根据二级类别聚类在一起的视频资源集中在一起显示给用户,以便用户选择所需的视频资源。
基于上述方法,本发明实施例给出一种视频资源聚类装置,如图2所示的视频资源聚类装置20,它包括词库建立模块21、视频资源库模块22及一级聚类模块23。
所述词库建立模块21用于建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词。所述视频资源库模块22用于建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息。所述一级聚类模块23用于判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
一级聚类模块23还可在各个视频信息中添加一级类别的识别信息,属于同一类的一级类别的所述识别信息相同。例如在根据视频关键词“海防最前线”聚类而得的分类中添加一级类别的编号“20085”。
如果需要对一级类别中的视频资源进行进一步分类,则较佳地,所述视频资源聚类装置20还可包括:
二级聚类模块24,用于判断若所述视频资源库中的相关信息包含有指定的二级视频文件特征,则在所述一级类别之中,分别将各视频资源聚类于按照该二级视频文件特征分类的二级类别。
其中,所述二级视频文件特征可为:标示了该视频资源内容为电影或电视剧的标示信息;标示了多个视频资源之间顺序关系的集数特征;视频资源的拍摄时间;视频资源的格式信息;视频资源的来源;或视频资源的分辨率等。
较佳地,还可将视频资源的多个相关信息连接起来做一个散列(如采用hash算法将所述多个相关信息连接起来的内容进行运算得到一个特征值),即采用特征值表示这些信息。则所述视频资源聚类装置20还可包括:
特征值聚类模块40,用于采用预定算法将各视频资源的多个相关信息连接起来的内容进行运算得到一个特征值,并在所述一级类别之中,分别将各视频资源聚类于按照该特征值分类的二级类别。较佳地,当所述多个相关信息中有视频资源的链接信息时,则只使用除了链接中的用于标识多个相关联的视频资源顺序的集数信息部分的其他部分进行所述运算。
该视频资源聚类装置20还可包含有获取模块25和判断模块26。获取模块25用于获取视频资源的相关信息及标识信息,所述相关信息包含所述相关信息来源。判断模块26用于判断若视频资源库中已有与获取的标识信息相同的标识信息,则根据预设的相关信息的来源级别,判断若该已有的标识信息所对应的视频资源的相关信息的来源级别低于获取的视频资源的相关信息的来源级别,则在视频资源库中保存获取的相关信息及标识信息。
较佳地,所述判断模块26还用于删除所述已有的标识信息所对应的视频资源的相关信息;或,所述判断模块26还用于删除所述已有的标识信息所对应视频资源的除链接信息外的相关信息。
较佳地,所述视频资源聚类装置20还可包括:
完整化模块30,用于判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,则根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列。
所述完整化模块30可有不同方式判断按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列。
方式一,参照图3所示,较佳地,所述完整化模块30可包括:第一完整判断模块301,用于获取按照二级视频资源特征分类的同类视频资源的链接信息,如果各链接信息的不同部分不能组成连续的数字或字母排列,则该同类视频资源未包含完整的视频资源序列。
对应于方式一,较佳地,所述完整化模块30还可包括:第一完整获取模块302,用于将所述不能组成连续的数字或字母排列所缺少的数字或字母,替换链接信息中的不同部分形成新的链接,从该新的链接获取视频资源以获取完整的视频资源序列。
方式二,参照图4所示,所述完整化模块30可包括:第二完整判断模块303,用于从所述同类视频资源的链接信息的不同部分中,获取数值为最大的或英文字母排序为最后的链接信息;将所获取的数值为最大的链接信息的所述不同部分的数值增加一,或将所获取的英文字母排序为最后的链接信息的所述不同部分,替换为所述排序为最后的英文字母的下一个英文字母,以生成新的链接;如果能连接至所述新的链接,则所述同类视频资源未包含完整的视频资源序列。
对应于方式二,较佳地,所述完整化模块30还可包括:第二完整获取模块304,用于从所述新的链接获取视频资源以获取完整的视频资源序列。
如此,可判断是否已经获取了属于同一二级分类的完整视频资源,如果未获取完整的视频资源,则可通过生成链接并尝试连接的方式以获取完整的视频资源。
在按照所述一级类别分类后,如果需要具备接收用户查询视频并输出查询结果的功能,则所述视频资源聚类装置20还可包含有第一输出模块27,用于当接收到包含视频关键词的视频信息查询指令时,输出所述视频资源库中与所述视频关键词关联的视频信息。
在按照所述二级视频文件特征分类后,如果需要具备接收用户查询视频并输出查询结果的功能,则所述视频资源聚类装置20还可包含第二输出模块28,用于当接收到包含视频关键词的视频信息查询指令时,确认所述视频关键词所对应的视频资源的相关信息,并将确认的所述视频资源的相关信息按二级类别排序后输出。
在本发明实施例中,其通过判断视频资源的相关信息中是否包含有特定视频关键词,从而将视频资源聚类于按照该特定视频关键词分类的类别,可将视频资源进行聚类,进一步,还可根据视频资源的文件格式、分辨率、链接等相关信息对资源进行二级分类,以及最后根据资源链接对视频资源进行补全。当用户查找某个关键词对应的视频资源时,可以按照资源聚类的顺序输出给用户,使用户能快速准确的查找到自己需要的视频资源。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (32)
1、一种视频资源聚类的方法,其特征在于,包括如下步骤:
建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词;
建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息;
判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
2、根据权利要求1所述的方法,其特征在于,所述视频关键词为电影影片名或电视剧名。
3、根据权利要求1所述的方法,其特征在于,所述将该视频资源聚类于按照该视频关键词分类的一级类别之后,还包括:
判断若所述视频资源库中的相关信息包含有指定的二级视频文件特征,则在所述一级类别之中,分别将各视频资源聚类于按照该二级视频文件特征分类的二级类别。
4、根据权利要求1所述的方法,其特征在于,所述将该视频资源聚类于按照该视频关键词分类的一级类别之后,还包括:
采用预定算法将各视频资源的多个相关信息连接起来的内容进行运算得到一个特征值;
在所述一级类别之中,分别将各视频资源聚类于按照该特征值分类的二级类别。
5、根据权利要求4所述的方法,其特征在于:
当所述多个相关信息中有视频资源的链接信息时,则只使用除了链接中的用于标识多个相关联的视频资源顺序的集数信息部分的其他部分进行所述运算。
6、根据权利要求3或4所述的方法,其特征在于,所述二级视频文件特征为:
标示了该视频资源内容为电影或电视剧的标示信息;
标示了多个视频资源之间顺序关系的集数特征;
视频资源的拍摄时间;
视频资源的格式信息;
视频资源的来源;或
视频资源的分辨率。
7、根据权利要求1所述的方法,其特征在于,所述建立视频资源库包括:
获取视频资源的相关信息及标识信息,所述相关信息包含所述相关信息来源;
若视频资源库中已有与获取的标识信息相同的标识信息,则根据预设的相关信息的来源级别,判断若该已有的标识信息所对应的视频资源的相关信息的来源级别低于获取的视频资源的相关信息的来源级别,则在视频资源库中保存所述获取的相关信息及标识信息。
8、根据权利要求7所述的方法,其特征在于,所述建立视频资源库进一步包括:
删除所述已有的标识信息所对应的视频资源的相关信息;或
删除所述已有的标识信息所对应视频资源的除链接信息外的相关信息。
9、根据权利要求7所述的方法,其特征在于,所述视频文件标识信息是根据预定算法对视频文件进行计算后获得,该预定算法为对不同的视频文件的内容数据进行处理得到不同的处理结果的算法。
10、根据权利要求1所述的方法,其特征在于,所述将该视频资源聚类于按照该视频关键词分类的一级类别之后进一步包括:
当接收到包含视频关键词的视频信息查询指令时,输出所述视频资源库中与所述视频关键词关联的视频信息。
11、根据权利要求3或4所述的方法,其特征在于,还包括:
当接收到包含视频关键词的视频信息查询指令时,确认所述视频关键词所对应的视频资源的相关信息;
将确认的所述视频资源的相关信息按二级类别排序后输出。
12、根据权利要求3所述的方法,其特征在于:
所述二级视频文件特征包括标示了视频内容为电影的标示信息,并且所述相关信息包含电影的影片名,或者所述相关信息包含标示了视频内容为电视剧的标示信息,并且所述视频信息包含电视剧的剧名;
并且所述二级类别包括电影类别和电视剧类别。
13、根据权利要求3所述的方法,其特征在于:
所述二级视频文件特征包括视频拍摄时间和/或演员姓名;
所述将该相关信息聚类于按照该二级视频文件特征分类的二级类别包括:
根据所述相关信息中包括的视频拍摄时间和演员姓名确认视频内容为电影或电视剧;
根据确认的视频内容,将所述相关信息聚类于电影类别或电视剧类别。
14、根据权利要求3所述的方法,其特征在于,还包括:
判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,则根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列。
15、根据权利要求14所述的方法,其特征在于,所述判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,包括:
获取按照二级视频资源特征分类的同类视频资源的链接信息,如果各链接信息的不同部分不能组成连续的数字或字母排列,则该同类视频资源未包含完整的视频资源序列。
16、根据权利要求15所述的方法,其特征在于,所述根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列,包括:
将所述不能组成连续的数字或字母排列所缺少的数字或字母,替换链接信息中的不同部分形成新的链接,从该新的链接获取视频资源以获取完整的视频资源序列。
17、根据权利要求14所述的方法,其特征在于:
所述判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,包括:
从所述同类视频资源的链接信息的不同部分中,获取数值为最大的或英文字母排序为最后的链接信息;
将所获取的数值为最大的链接信息的所述不同部分的数值增加一,或将所获取的英文字母排序为最后的链接信息的所述不同部分,替换为所述排序为最后的英文字母的下一个英文字母,以生成新的链接;
如果能连接至所述新的链接,则所述同类视频资源未包含完整的视频资源序列。
18、根据权利要求17所述的方法,其特征在于,所述根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列,包括:
从所述新的链接获取视频资源以获取完整的视频资源序列。
19、一种视频资源聚类的装置,其特征在于,包括:
词库建立模块、视频资源库模块、一级聚类模块,其中:
所述词库建立模块,用于建立视频关键词词库,该视频关键词词库中包括用于描述视频资源的视频关键词;
所述视频资源库模块,用于建立视频资源库,所述视频资源库中保存获取的视频资源的相关信息;
所述一级聚类模块,用于判断若所述视频资源库中的视频资源的相关信息包含有所述视频关键词,则将该视频资源聚类于按照该视频关键词分类的一级类别。
20、根据权利要求19所述的装置,其特征在于,还包括:
二级聚类模块,用于判断若所述视频资源库中的相关信息包含有指定的二级视频文件特征,则在所述一级类别之中,分别将各视频资源聚类于按照该二级视频文件特征分类的二级类别。
21、根据权利要求19所述的装置,其特征在于,还包括:
特征值聚类模块,用于采用预定算法将各视频资源的多个相关信息连接起来的内容进行运算得到一个特征值,并在所述一级类别之中,分别将各视频资源聚类于按照该特征值分类的二级类别。
22、根据权利要求21所述的装置,其特征在于:
当所述多个相关信息中有视频资源的链接信息时,则只使用除了链接中的用于标识多个相关联的视频资源顺序的集数信息部分的其他部分进行所述运算。
23、根据权利要求20所述的装置,其特征在于,所述二级视频文件特征为:
标示了该视频资源内容为电影或电视剧的标示信息;
标示了多个视频资源之间顺序关系的集数特征;
视频资源的拍摄时间;
视频资源的格式信息;
视频资源的来源;或
视频资源的分辨率。
24、根据权利要求19所述的装置,其特征在于,还包括:
获取模块,用于获取视频资源的相关信息及标识信息,所述相关信息包含所述相关信息来源;
判断模块,用于判断若视频资源库中已有与获取的标识信息相同的标识信息,则根据预设的相关信息的来源级别,判断若该已有的标识信息所对应的视频资源的相关信息的来源级别低于获取的视频资源的相关信息的来源级别,则在视频资源库中保存所述获取的相关信息及标识信息。
25、根据权利要求24所述的装置,其特征在于:
所述判断模块还用于删除所述已有的标识信息所对应的视频资源的相关信息;或,所述判断模块还用于删除所述已有的标识信息所对应视频资源的除链接信息外的相关信息。
26、根据权利要求19所述的装置,其特征在于,还包括:
第一输出模块,用于当接收到包含视频关键词的视频信息查询指令时,输出所述视频资源库中与所述视频关键词关联的视频信息。
27、根据权利要求20所述的装置,其特征在于,还包括:
第二输出模块,用于当接收到包含视频关键词的视频信息查询指令时,确认所述视频关键词所对应的视频资源的相关信息,并将确认的所述视频资源的相关信息按二级类别排序后输出。
28、根据权利要求20所述的装置,其特征在于,还包括:
完整化模块,用于判断如果按照二级视频资源特征分类的同类视频资源未包含完整的视频资源序列,则根据视频资源链接特征进行视频文件遍历,获取完整的视频资源序列。
29、根据权利要求28所述的装置,其特征在于,所述完整化模块包括:
第一完整判断模块,用于获取按照二级视频资源特征分类的同类视频资源的链接信息,如果各链接信息的不同部分不能组成连续的数字或字母排列,则该同类视频资源未包含完整的视频资源序列。
30、根据权利要求29所述的装置,其特征在于,所述完整化模块还包括:
第一完整获取模块,用于将所述不能组成连续的数字或字母排列所缺少的数字或字母,替换链接信息中的不同部分形成新的链接,从该新的链接获取视频资源以获取完整的视频资源序列。
31、根据权利要求28所述的装置,其特征在于,所述完整化模块包括:
第二完整判断模块,用于从所述同类视频资源的链接信息的不同部分中,获取数值为最大的或英文字母排序为最后的链接信息;将所获取的数值为最大的链接信息的所述不同部分的数值增加一,或将所获取的英文字母排序为最后的链接信息的所述不同部分,替换为所述排序为最后的英文字母的下一个英文字母,以生成新的链接;如果能连接至所述新的链接,则所述同类视频资源未包含完整的视频资源序列。
32、根据权利要求31所述的装置,其特征在于,所述完整化模块还包括:
第二完整获取模块,用于从所述新的链接获取视频资源以获取完整的视频资源序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810178499XA CN101419614A (zh) | 2008-12-03 | 2008-12-03 | 视频资源聚类方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810178499XA CN101419614A (zh) | 2008-12-03 | 2008-12-03 | 视频资源聚类方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101419614A true CN101419614A (zh) | 2009-04-29 |
Family
ID=40630403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200810178499XA Pending CN101419614A (zh) | 2008-12-03 | 2008-12-03 | 视频资源聚类方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101419614A (zh) |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117331A (zh) * | 2011-03-07 | 2011-07-06 | 北京百度网讯科技有限公司 | 视频搜索方法及系统 |
CN102289503A (zh) * | 2011-08-24 | 2011-12-21 | 百度在线网络技术(北京)有限公司 | 在线应用搜索方法及系统 |
CN102332031A (zh) * | 2011-10-18 | 2012-01-25 | 中国科学院自动化研究所 | 一种基于视频集合层级主题结构的检索结果聚类方法 |
CN102541435A (zh) * | 2010-12-13 | 2012-07-04 | 索尼公司 | 用于对媒体内容区分优先级的用户界面 |
CN102662570A (zh) * | 2012-03-26 | 2012-09-12 | 腾讯科技(深圳)有限公司 | 信息处理方法和装置 |
CN102750184A (zh) * | 2012-06-25 | 2012-10-24 | 广东轩辕网络科技股份有限公司 | 云资源分类与标识系统及方法 |
CN103389981A (zh) * | 2012-05-08 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 网络标签自动识别方法及其系统 |
CN103425763A (zh) * | 2013-08-05 | 2013-12-04 | 微梦创科网络科技(中国)有限公司 | 基于sns的用户推荐方法及装置 |
CN103428537A (zh) * | 2013-07-30 | 2013-12-04 | 北京小米科技有限责任公司 | 一种视频处理方法和装置 |
CN103559286A (zh) * | 2013-11-08 | 2014-02-05 | 北京奇虎科技有限公司 | 视频搜索结果的处理方法及装置 |
CN103577593A (zh) * | 2013-11-14 | 2014-02-12 | 中国科学院声学研究所 | 一种基于微博热门话题的视频聚合方法及系统 |
CN103634342A (zh) * | 2012-08-22 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 获取下载资源的资源名称的方法及系统 |
CN103699659A (zh) * | 2013-12-26 | 2014-04-02 | 乐视网信息技术(北京)股份有限公司 | 视频资源词库的管理方法及其系统 |
WO2015014260A1 (en) * | 2013-07-29 | 2015-02-05 | Tencent Technology (Shenzhen) Company Limited | Data processing method and server therefor |
CN104484396A (zh) * | 2014-12-12 | 2015-04-01 | 北京国双科技有限公司 | 网页信息的筛选方法和装置 |
CN104765885A (zh) * | 2015-04-29 | 2015-07-08 | 北京奇艺世纪科技有限公司 | 一种ugc内容库扩充方法及装置 |
CN104809117A (zh) * | 2014-01-24 | 2015-07-29 | 深圳市云帆世纪科技有限公司 | 视频数据聚合处理方法、聚合系统及视频搜索平台 |
CN104850626A (zh) * | 2015-05-20 | 2015-08-19 | 天脉聚源(北京)传媒科技有限公司 | 一种专辑作为搜索结果的展示方法及装置 |
CN105631033A (zh) * | 2015-12-31 | 2016-06-01 | 北京奇艺世纪科技有限公司 | 一种视频数据的挖掘方法和装置 |
CN105786857A (zh) * | 2014-12-24 | 2016-07-20 | Tcl集团股份有限公司 | 一种提高视频聚合效率的方法及系统 |
CN105916032A (zh) * | 2015-12-08 | 2016-08-31 | 乐视网信息技术(北京)股份有限公司 | 视频推荐的方法及视频推荐的终端设备 |
CN106202421A (zh) * | 2012-02-02 | 2016-12-07 | 联想(北京)有限公司 | 一种获得视频的方法、装置及播放视频的方法、装置 |
CN102289503B (zh) * | 2011-08-24 | 2016-12-14 | 百度在线网络技术(北京)有限公司 | 在线应用搜索方法及系统 |
CN106303719A (zh) * | 2016-08-02 | 2017-01-04 | 合网络技术(北京)有限公司 | 一种按顺序推荐视频的方法及装置 |
CN106658028A (zh) * | 2016-12-30 | 2017-05-10 | 中广热点云科技有限公司 | 多服务器视频点播资源的聚类处理方法 |
CN107302726A (zh) * | 2017-06-30 | 2017-10-27 | 环球智达科技(北京)有限公司 | 节目信息的标签生成方法 |
CN107402977A (zh) * | 2017-07-03 | 2017-11-28 | 天脉聚源(北京)传媒科技有限公司 | 建立视频资源分类树的方法和装置 |
CN108012192A (zh) * | 2017-12-25 | 2018-05-08 | 北京奇艺世纪科技有限公司 | 一种视频资源的识别和聚合的方法及系统 |
CN108288045A (zh) * | 2018-01-31 | 2018-07-17 | 天讯瑞达通信技术有限公司 | 一种移动视频直播/监控视频采集源特征分类方法 |
CN108446731A (zh) * | 2018-03-16 | 2018-08-24 | 聚好看科技股份有限公司 | 一种内容去重的方法及装置 |
CN108804440A (zh) * | 2017-04-26 | 2018-11-13 | 合信息技术(北京)有限公司 | 提供视频搜索结果的方法和装置 |
CN109889865A (zh) * | 2019-03-12 | 2019-06-14 | 四川长虹电器股份有限公司 | 一种视频播放源推荐方法 |
CN110139171A (zh) * | 2015-04-22 | 2019-08-16 | 小米科技有限责任公司 | 视频聚合方法及装置 |
CN111274437A (zh) * | 2020-01-22 | 2020-06-12 | 天窗智库文化传播(苏州)有限公司 | 一种基于互联网的视频素材资源管理方法及系统 |
CN111552778A (zh) * | 2020-04-26 | 2020-08-18 | 北京达佳互联信息技术有限公司 | 音频资源管理方法、装置、计算机可读存储介质及设备 |
CN112612919A (zh) * | 2020-12-16 | 2021-04-06 | 北京字节跳动网络技术有限公司 | 一种视频资源的关联方法、装置、设备及介质 |
CN113094522A (zh) * | 2021-06-09 | 2021-07-09 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、电子设备及存储介质 |
-
2008
- 2008-12-03 CN CNA200810178499XA patent/CN101419614A/zh active Pending
Cited By (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541435A (zh) * | 2010-12-13 | 2012-07-04 | 索尼公司 | 用于对媒体内容区分优先级的用户界面 |
CN102117331A (zh) * | 2011-03-07 | 2011-07-06 | 北京百度网讯科技有限公司 | 视频搜索方法及系统 |
CN102289503A (zh) * | 2011-08-24 | 2011-12-21 | 百度在线网络技术(北京)有限公司 | 在线应用搜索方法及系统 |
CN102289503B (zh) * | 2011-08-24 | 2016-12-14 | 百度在线网络技术(北京)有限公司 | 在线应用搜索方法及系统 |
CN102332031B (zh) * | 2011-10-18 | 2013-03-27 | 中国科学院自动化研究所 | 一种基于视频集合层级主题结构的检索结果聚类方法 |
CN102332031A (zh) * | 2011-10-18 | 2012-01-25 | 中国科学院自动化研究所 | 一种基于视频集合层级主题结构的检索结果聚类方法 |
CN106202421A (zh) * | 2012-02-02 | 2016-12-07 | 联想(北京)有限公司 | 一种获得视频的方法、装置及播放视频的方法、装置 |
CN106202421B (zh) * | 2012-02-02 | 2020-01-31 | 联想(北京)有限公司 | 一种获得视频的方法、装置及播放视频的方法、装置 |
CN102662570A (zh) * | 2012-03-26 | 2012-09-12 | 腾讯科技(深圳)有限公司 | 信息处理方法和装置 |
CN102662570B (zh) * | 2012-03-26 | 2015-11-18 | 腾讯科技(深圳)有限公司 | 信息处理方法和装置 |
CN103389981A (zh) * | 2012-05-08 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 网络标签自动识别方法及其系统 |
CN103389981B (zh) * | 2012-05-08 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 网络标签自动识别方法及其系统 |
CN102750184A (zh) * | 2012-06-25 | 2012-10-24 | 广东轩辕网络科技股份有限公司 | 云资源分类与标识系统及方法 |
CN103634342B (zh) * | 2012-08-22 | 2018-03-20 | 腾讯科技(深圳)有限公司 | 获取下载资源的资源名称的方法及系统 |
CN103634342A (zh) * | 2012-08-22 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 获取下载资源的资源名称的方法及系统 |
WO2015014260A1 (en) * | 2013-07-29 | 2015-02-05 | Tencent Technology (Shenzhen) Company Limited | Data processing method and server therefor |
CN103428537A (zh) * | 2013-07-30 | 2013-12-04 | 北京小米科技有限责任公司 | 一种视频处理方法和装置 |
CN103425763A (zh) * | 2013-08-05 | 2013-12-04 | 微梦创科网络科技(中国)有限公司 | 基于sns的用户推荐方法及装置 |
CN103559286B (zh) * | 2013-11-08 | 2017-04-26 | 北京奇虎科技有限公司 | 视频搜索结果的处理方法及装置 |
CN103559286A (zh) * | 2013-11-08 | 2014-02-05 | 北京奇虎科技有限公司 | 视频搜索结果的处理方法及装置 |
CN103577593A (zh) * | 2013-11-14 | 2014-02-12 | 中国科学院声学研究所 | 一种基于微博热门话题的视频聚合方法及系统 |
CN103577593B (zh) * | 2013-11-14 | 2017-07-07 | 中国科学院声学研究所 | 一种基于微博热门话题的视频聚合方法及系统 |
CN103699659A (zh) * | 2013-12-26 | 2014-04-02 | 乐视网信息技术(北京)股份有限公司 | 视频资源词库的管理方法及其系统 |
CN104809117B (zh) * | 2014-01-24 | 2018-10-30 | 深圳市云帆世纪科技有限公司 | 视频数据聚合处理方法、聚合系统及视频搜索平台 |
CN104809117A (zh) * | 2014-01-24 | 2015-07-29 | 深圳市云帆世纪科技有限公司 | 视频数据聚合处理方法、聚合系统及视频搜索平台 |
CN104484396A (zh) * | 2014-12-12 | 2015-04-01 | 北京国双科技有限公司 | 网页信息的筛选方法和装置 |
CN105786857A (zh) * | 2014-12-24 | 2016-07-20 | Tcl集团股份有限公司 | 一种提高视频聚合效率的方法及系统 |
CN105786857B (zh) * | 2014-12-24 | 2019-12-10 | Tcl集团股份有限公司 | 一种提高视频聚合效率的方法及系统 |
CN110139171A (zh) * | 2015-04-22 | 2019-08-16 | 小米科技有限责任公司 | 视频聚合方法及装置 |
CN104765885A (zh) * | 2015-04-29 | 2015-07-08 | 北京奇艺世纪科技有限公司 | 一种ugc内容库扩充方法及装置 |
CN104850626A (zh) * | 2015-05-20 | 2015-08-19 | 天脉聚源(北京)传媒科技有限公司 | 一种专辑作为搜索结果的展示方法及装置 |
WO2017096871A1 (zh) * | 2015-12-08 | 2017-06-15 | 乐视控股(北京)有限公司 | 视频推荐的方法及视频推荐的终端设备 |
CN105916032A (zh) * | 2015-12-08 | 2016-08-31 | 乐视网信息技术(北京)股份有限公司 | 视频推荐的方法及视频推荐的终端设备 |
CN105631033B (zh) * | 2015-12-31 | 2020-06-19 | 北京奇艺世纪科技有限公司 | 一种视频数据的挖掘方法和装置 |
CN105631033A (zh) * | 2015-12-31 | 2016-06-01 | 北京奇艺世纪科技有限公司 | 一种视频数据的挖掘方法和装置 |
CN106303719A (zh) * | 2016-08-02 | 2017-01-04 | 合网络技术(北京)有限公司 | 一种按顺序推荐视频的方法及装置 |
CN106303719B (zh) * | 2016-08-02 | 2019-09-17 | 优酷网络技术(北京)有限公司 | 一种按顺序推荐视频的方法及装置 |
CN106658028A (zh) * | 2016-12-30 | 2017-05-10 | 中广热点云科技有限公司 | 多服务器视频点播资源的聚类处理方法 |
CN108804440A (zh) * | 2017-04-26 | 2018-11-13 | 合信息技术(北京)有限公司 | 提供视频搜索结果的方法和装置 |
CN107302726A (zh) * | 2017-06-30 | 2017-10-27 | 环球智达科技(北京)有限公司 | 节目信息的标签生成方法 |
CN107402977A (zh) * | 2017-07-03 | 2017-11-28 | 天脉聚源(北京)传媒科技有限公司 | 建立视频资源分类树的方法和装置 |
CN108012192A (zh) * | 2017-12-25 | 2018-05-08 | 北京奇艺世纪科技有限公司 | 一种视频资源的识别和聚合的方法及系统 |
CN108288045A (zh) * | 2018-01-31 | 2018-07-17 | 天讯瑞达通信技术有限公司 | 一种移动视频直播/监控视频采集源特征分类方法 |
CN108288045B (zh) * | 2018-01-31 | 2020-11-24 | 天讯瑞达通信技术有限公司 | 一种移动视频直播/监控视频采集源特征分类方法 |
CN108446731B (zh) * | 2018-03-16 | 2021-01-08 | 聚好看科技股份有限公司 | 一种内容去重的方法及装置 |
CN108446731A (zh) * | 2018-03-16 | 2018-08-24 | 聚好看科技股份有限公司 | 一种内容去重的方法及装置 |
CN109889865A (zh) * | 2019-03-12 | 2019-06-14 | 四川长虹电器股份有限公司 | 一种视频播放源推荐方法 |
CN111274437A (zh) * | 2020-01-22 | 2020-06-12 | 天窗智库文化传播(苏州)有限公司 | 一种基于互联网的视频素材资源管理方法及系统 |
CN111274437B (zh) * | 2020-01-22 | 2021-11-16 | 天窗智库文化传播(苏州)有限公司 | 基于互联网的视频素材资源管理方法及系统 |
CN111552778A (zh) * | 2020-04-26 | 2020-08-18 | 北京达佳互联信息技术有限公司 | 音频资源管理方法、装置、计算机可读存储介质及设备 |
CN111552778B (zh) * | 2020-04-26 | 2024-05-14 | 北京达佳互联信息技术有限公司 | 音频资源管理方法、装置、计算机可读存储介质及设备 |
CN112612919A (zh) * | 2020-12-16 | 2021-04-06 | 北京字节跳动网络技术有限公司 | 一种视频资源的关联方法、装置、设备及介质 |
CN113094522A (zh) * | 2021-06-09 | 2021-07-09 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101419614A (zh) | 视频资源聚类方法和装置 | |
CN108009228B (zh) | 一种内容标签的设置方法、装置及存储介质 | |
CN102043833B (zh) | 一种基于查询词进行搜索的方法和搜索装置 | |
CN103279513B (zh) | 产生内容标签的方法、提供多媒体内容信息的方法及装置 | |
CN103577478B (zh) | 网页推送方法及系统 | |
CN101876981A (zh) | 一种构建知识库的方法及装置 | |
CN101477527B (zh) | 一种检索多媒体资源的方法及装置 | |
CN101727447A (zh) | 基于url的正则表达式的生成方法和装置 | |
CN108509405A (zh) | 一种演示文稿的生成方法、装置以及设备 | |
CN102184185A (zh) | 一种用于多媒体资源搜索的方法与设备 | |
CN103064880B (zh) | 一种基于搜索信息向用户提供网站选择的方法、装置和系统 | |
CN104423621A (zh) | 拼音字符串处理方法和装置 | |
CN104035993B (zh) | 电子书的存储检索方法、电子书管理系统、阅读系统 | |
CN106407344A (zh) | 一种生成搜索引擎优化标签的方法和系统 | |
CN106354860A (zh) | 基于标签集的信息资源自动贴标签并自动推送的方法 | |
CN101158981A (zh) | 一种对下载资源进行分类的方法、系统和装置 | |
CN102542061A (zh) | 一种产品的智能分类方法 | |
CN104503988A (zh) | 搜索方法及装置 | |
CN103207917A (zh) | 标注多媒体内容的方法、生成推荐内容的方法及系统 | |
CN101630315B (zh) | 一种快速检索方法及系统 | |
RU2568276C2 (ru) | Способ извлечения полезного контента из установочных файлов мобильных приложений для дальнейшей машинной обработки данных, в частности поиска | |
CN103235821A (zh) | 原创内容的搜索方法和搜索服务器 | |
CN105117434A (zh) | 一种网页分类方法和系统 | |
CN101894109A (zh) | 一种数据库建立方法和装置 | |
CN112825089A (zh) | 文章推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20090429 |