发明内容
有鉴于此,本申请所要解决的技术问题是提供了一种基于搜索的UGC推荐的方法及系统,以解决如何通过这些关键词将这些视频上传用户推荐给客户,实现在观看用户希望看到哪些视频时候,还可以得知有哪些上传视频用户上传了相关视频的问题。
为了解决上述技术问题,本申请公开了一种基于搜索的UGC推荐的方法,其特征在于,包括:
获取并保存不同的视频的身份信息、名称信息以及上传该视频的用户身份信息;
统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系;
检索所述关键词时,使检索结果中包括:涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
优选地,统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,进一步为:
统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,根据所述关键词的出现次数从大到小对所述视频的名称信息和上传该视频的用户身份信息分别进行排序。
优选地,检索所述关键词时,检索结果中包括:涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息,进一步为:
检索所述关键词时,检索结果中包括:至少二十个涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
优选地,统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,进一步为:
通过索引技术,将统计后得到的所述视频所涉及的关键词的出现次数,与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,并进行保存。
优选地,所述视频的身份信息进一步为VideoID;
所述视频的名称信息进一步为Title;
所述上传该视频的用户身份信息,进一步为:OwnerID。
为了解决上述技术问题,本申请还公开了一种基于搜索的UGC推荐的系统,其特征在于,该系统包括:获取模块、统计模块和检索模块,其中,
所述获取模块,用于获取并保存不同的视频的身份信息、名称信息以及上传该视频的用户身份信息;
所述统计模块,用于统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系;
所述检索模块,用于在检索所述关键词时,使检索结果中包括:涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
优选地,所述统计模块,进一步还用于统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,根据所述关键词的出现次数从大到小对所述视频的名称信息和上传该视频的用户身份信息分别进行排序。
优选地,所述检索模块,进一步还用于在检索所述关键词时,使检索结果中包括:至少二十个涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
优选地,所述统计模块,进一步用于通过索引技术,将统计后得到的所述视频所涉及的关键词的出现次数,与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,并进行保存。
优选地,所述视频的身份信息进一步为VideoID;
所述视频的名称信息进一步为Title;
所述上传该视频的用户身份信息,进一步为:OwnerID。
与现有技术相比,本申请所述的一种基于搜索的UGC推荐的方法及系统,达到了如下效果:
1)本申请能够通过让搜索用户在搜索视频时,不仅仅只找到部分视频,而是可以通过搜索词找到有哪些优秀用户上传了相关视频,使用户观看的视频不仅仅在推荐或搜索得到的部分视频,而且还可以进入一些优秀上传用户的用户空间,选择感兴趣的视频观看。
2)本申请改变了过去通过检索只能检索到单视频的思路,转而可以提供上传相关优秀视频的优秀用户,提供了观看更多视频的另一种方式。同时,增强了视频网站的社交属性,让搜索用户能够找到更多的上传相关视频的UGC用户,从而可能建立起与用户之间的联系。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
实施例一
如图2所示,为本申请实施例一所述的基于搜索的UGC推荐的方法流程,该方法包括:
步骤101,获取并保存不同的视频的身份信息、名称信息以及上传该视频的用户身份信息;
步骤102,统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系;
步骤103,检索所述关键词时,使检索结果中包括:涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
其中,步骤102进一步为:统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,根据所述关键词的出现次数从大到小对所述视频的名称信息和上传该视频的用户身份信息分别进行排序。
其中,步骤103,具体为:检索所述关键词时,检索结果中包括:至少二十个涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
这里的用户身份信息,主要是指优秀用户身份信息,通过优秀用户身份信息不仅能够找到其上传的视频,而且能够找到其上传的其他优秀视频。后面还可以,通过其他优秀视频还可以找到其他用户,以及其他用户上传的其他视频。
步骤102具体地还可以为:通过索引技术,将统计后得到的所述视频所涉及的关键词的出现次数,与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,并进行保存。
其中,所述视频的身份信息进一步为VideoID;所述视频的名称信息进一步为Title;所述上传该视频的用户身份信息,进一步为:OwnerID。
实施例二
结合图3所示,为本申请实施例二所述的基于搜索的UGC推荐的方法流程,包括:
步骤一,获取并保存不同的视频的身份信息(VideoID)、名称信息(Title)以及上传该视频的用户身份信息(OwnerID);
步骤二,统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系;
步骤三,检索所述关键词时,检索结果中包括:(如图3所示)至少二十个涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
在步骤二中,所述关键词实际上是视频的名称信息(Title)中所涉及的内容,换而言之,视频的名称信息(Title)中可以包括多个关键词。
同时,对于上传该视频的用户身份信息(OwnerID)来说,一个视频只会有一个用户进行上传,而该用户则可以上传多个视频。
由此,就可以建立出步骤二中所述的该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,也就是将关键词和用户之间建立关联关系。
步骤一所要完成的是形成以videoID 为关键字的输出数据即
VideoID Title OwnerID格式的数据。
步骤二所要完成的是:首先,形成以对视频Title 分词可以构建以下的结构:VideoID 词Key OwnerID 出现次数(c) 格式的数据。
其次,形成某个Owner 上传的视频中包含了多少个相关词, 这些词 在这个用户上传的视频中出现多少次,即有:
OwnerID 词Key 出现次数(c) 格式的数据。
在这里用
代表某个用户
上传的视频包含的所有的词,
代表相应的词出现的频数,则可以利用一下公式计算词
对用户
的重要程度
最后,步骤二所做的:通过索引技术,将统计后得到的所述视频所涉及的关键词的出现次数,与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,并进行保存。
具体为:
得到用户上传的视频中都包含了哪些关键词,构建的数据是 Owner-Word的方式,而检索要求的数据则为Word-Owner 的方式,因此需要使用索引技术。在索引构建过程中,将原有的
OwnerID 词Key 出现次数(c) 格式 转变为
词Key OwnerID 出现次数(c)
在这里,用
代表拥有 词
的m个用户,
代表词
相应的 用户中出现的频数,则可以根据下式计算用户
对词
的重要程度:
通过统计计算和索引构建过程中的统计计算可以得到词
和用户
对彼此之间的重要程度,可以计算它们之间的相关程度为:
则在构建索引过程总可以根据
的大小对与此
相关的所有用户进行排序,作为排序的主要因子。也就是前述的:根据所述关键词的出现次数从大到小对所述视频的名称信息和上传该视频的用户身份信息分别进行排序。对于排序方式,这里不作具体限定。
实施例三
如图4所示,为本申请实施例三所述的基于搜索的UGC推荐的系统框图,该系统与本地(可以是客户端,也可以是服务器这里不做限定)相耦接,该系统包括:获取模块401、统计模块402和检索模块403,其中,
所述获取模块401,与所述本地和统计模块402相耦接,用于获取并保存不同的视频的身份信息、名称信息以及上传该视频的用户身份信息。
所述统计模块402,与所述获取模块401和检索模块403相耦接,用于统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系。
该统计模块402,进一步还用于:统计所述视频所涉及的关键词的出现次数,将该关键词的出现次数与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,根据所述关键词的出现次数从大到小对所述视频的名称信息和上传该视频的用户身份信息分别进行排序。
或者是,进一步用于通过索引技术,将统计后得到的所述视频所涉及的关键词的出现次数,与对应的所述视频的名称信息和上传该视频的用户身份信息建立一关联关系,并进行保存。
所述检索模块403,与所述统计模块402和本地相耦接,用于在检索所述关键词时,使检索结果中包括:涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息,最终将检索结果反馈到本地。
其中,检索模块403,进一步还用于:在检索所述关键词时,使检索结果中包括:至少二十个涉及所述视频中包含的身份信息、名称信息以及上传该视频的用户身份信息与所述关键词相同所对应的视频的链接,且该链接中包括有与该关键词相关联的所述视频的名称信息和上传该视频的用户身份信息。
上述系统内容中,所述视频的身份信息进一步为VideoID;所述视频的名称信息进一步为Title;所述上传该视频的用户身份信息,进一步为:OwnerID。
由于方法部分已经对本申请实施例进行了详细描述,这里对实施例中涉及的方法与系统对应部分的展开描述省略,不再赘述。对于系统中具体内容的描述可参考所述方法实施例的内容,这里不再具体限定。
与现有技术相比,本申请所述的一种基于搜索的UGC推荐的方法及系统,达到了如下效果:
1)本申请能够通过让搜索用户在搜索视频时,不仅仅只找到部分视频,而是可以通过搜索词找到有哪些优秀用户上传了相关视频,使用户的观看的视频不仅仅在推荐或搜索得到的部分视频,而是可以进入一些优秀上传用户的用户空间,选择感兴趣的视频观看。
2)本申请改变了过去通过检索只能检索到单视频的思路,转而可以提供上传相关优秀视频的优秀用户,提供了观看更多视频的另一种方式。同时,增强了视频网站的社交属性,让搜索用户能够找到更多的上传相关视频的UGC用户,从而可能建立起与用户之间的联系。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。