CN112836087A - 一种视频属性信息采集方法及装置 - Google Patents

一种视频属性信息采集方法及装置 Download PDF

Info

Publication number
CN112836087A
CN112836087A CN202110103909.XA CN202110103909A CN112836087A CN 112836087 A CN112836087 A CN 112836087A CN 202110103909 A CN202110103909 A CN 202110103909A CN 112836087 A CN112836087 A CN 112836087A
Authority
CN
China
Prior art keywords
information
video
party
matched
party website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110103909.XA
Other languages
English (en)
Inventor
田真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Happly Sunshine Interactive Entertainment Media Co Ltd
Original Assignee
Hunan Happly Sunshine Interactive Entertainment Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Happly Sunshine Interactive Entertainment Media Co Ltd filed Critical Hunan Happly Sunshine Interactive Entertainment Media Co Ltd
Priority to CN202110103909.XA priority Critical patent/CN112836087A/zh
Publication of CN112836087A publication Critical patent/CN112836087A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供了一种视频属性信息采集方法及装置,该方法中,在目标视频绑定有第三方网站的身份信息的情况下,在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,或,在中间表中存在第三方绑定关系时,从第三方绑定关系中获取第三方网站的URL,可以直接基于第三方网站的URL,访问对应的第三方网站,在第三方网站中抓取与第一信息匹配的视频属性信息,实现了自动采集视频属性信息,能够提高视频属性信息采集的效率。并且实现了直接在特定的第三方网站中抓取信息,缩短信息抓取的时间,进一步提高信息采集的效率。

Description

一种视频属性信息采集方法及装置
技术领域
本申请涉及视频处理技术领域,特别涉及一种视频属性信息采集方法及装置。
背景技术
为了保证互联网视频平台提高的视频观看服务性能,需要平台维护人员进行大量的视频编辑工作。其中,进行视频编辑工作,一般需要收集比较详细的视频属性信息(如,视频的名称、导演信息、主演信息、编剧信息和评分等),
但是,目前,大部分视频属性信息由人工采集,效率低。
发明内容
为解决上述技术问题,本申请实施例提供一种视频属性信息采集方法及装置,以达到提高视频属性信息采集效率的目的,技术方案如下:
一种视频属性信息采集方法,包括:
获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息;
若未绑定,则在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息;
若已绑定,则在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
所述方法还包括:
若在中间表中不存在与所述第一信息匹配的第三方绑定关系,则在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,将抓取到的信息的集合作为第一视频信息集合;
在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息;
若查找到,则将包含与所述目标视频的第二信息相匹配的信息的第三方网站的URL及与所述目标视频的第二信息相匹配的信息,作为待使用第三方绑定关系,并利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项。
所述第一信息包括:名称、别名和英文名;
所述在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,包括:
在多个第三方网站中抓取与所述名称相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述别名相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述英文名相匹配的视频属性信息。
所述利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项,包括:
在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息;
若查找到,则根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
所述在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项,包括:
在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息;
若未查找到,则根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
所述根据与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息之后,还包括:
将与所述目标视频的第二信息相匹配的信息,推送给前端。
所述利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息之后,还包括:
将与所述第一信息匹配的视频属性信息,推送给前端。
一种视频属性信息采集装置,包括:
第一判断模块,用于获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息;
第一查找模块,用于若所述目标视频未绑定有第三方网站的身份信息,则在中间表中查找与所述第一信息匹配的第三方绑定关系;
第一抓取模块,用于若在中间表中查找到与所述第一信息匹配的第三方绑定关系,则从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息;
第二抓取模块,用于若所述目标视频已绑定第三方网站的身份信息,则在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息;
第一更新模块,用于用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
所述装置还包括:
第三抓取模块,用于若在中间表中不存在与所述第一信息匹配的第三方绑定关系,则在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,将抓取到的信息的集合作为第一视频信息集合;
第二查找模块,用于在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息;
第二更新模块,用于若查找到与所述目标视频的第二信息相匹配的信息,则将包含与所述目标视频的第二信息相匹配的信息的第三方网站的URL及与所述目标视频的第二信息相匹配的信息,作为待使用第三方绑定关系,并利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项。
所述第一信息包括:名称、别名和英文名;
所述第三抓取模块,具体用于:
在多个第三方网站中抓取与所述名称相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述别名相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述英文名相匹配的视频属性信息。
第二更新模块,具体用于:
在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息;
若查找到,则根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
所述第二抓取模块,具体用于:
在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
若未查找到,则根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
所述第一更新模块,具体用于:利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
所述装置还包括:
第一推送模块,用于将与所述目标视频的第二信息相匹配的信息,推送给前端。
所述装置还包括:
第二推送模块,用于将与所述第一信息匹配的视频属性信息,推送给前端。
与现有技术相比,本申请的有益效果为:
在本申请中,在目标视频绑定有第三方网站的身份信息的情况下,在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,或,在中间表中存在第三方绑定关系时,从第三方绑定关系中获取第三方网站的URL,可以直接基于第三方网站的URL,访问对应的第三方网站,在第三方网站中抓取与第一信息匹配的视频属性信息,实现了自动采集视频属性信息,能够提高视频属性信息采集的效率。并且实现了直接在特定的第三方网站中抓取信息,缩短信息抓取的时间,进一步提高信息采集的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例1提供的一种视频属性信息采集方法的流程图;
图2是本申请实施例2提供的一种视频属性信息采集方法的流程图;
图3是本申请提供的一种视频属性信息采集装置的逻辑结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,为本申请实施例1提供的一种视频属性信息采集方法的流程图,该方法可以包括但并不局限于以下步骤:
步骤S11、获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息。
本实施例中,第一信息可以理解为:表征目标视频身份的信息。第一信息可以包括但不局限于:名称、别名和英文名。
本实施例中,预先建立有两个数据库表,分别为视频合集主表和中间表。其中,视频合集主表,主要用于存储互联网视频平台的视频数据及第三方网站的关键信息(如,第三方网站的身份信息,和/或,第三方网站中视频评分等)。
中间表主要用于存储第三方绑定关系及第三方网站的全部视频的信息。第三方绑定关系,可以理解为:包含视频属性信息及视频属性信息所属第三方网站的信息(如,身份信息或URL(Uniform Resource Locator,统一资源定位器))的绑定关系。
判断所述目标视频是否绑定有第三方网站的身份信息,可以理解为:判断视频合集主表中第三方网站的身份信息的字段是否为空。若为空,则说明目标视频未绑定第三方网站的身份信息;若不为空,则说明目标视频绑定有第三方网站的身份信息。
若未绑定,则执行步骤S12;若已绑定,则执行步骤S14。
步骤S12、在中间表中查找与所述第一信息匹配的第三方绑定关系。
若查找到,则执行步骤S13。
步骤S13、从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息。
在所述第三方网站中抓取与所述第一信息匹配的视频属性信息,可以包括但不局限于:
S131、在第三方网站中抓取与所述名称相匹配的视频属性信息。
若抓取到,则可以利用抓取到的与名称相匹配的视频属性信息,更新数据库中与所述目标视频关联的信息项;若未抓取到,则执行步骤S132。
S132、在第三方网站中抓取与所述别名相匹配的视频属性信息。
若未抓取到,则执行步骤S133;若抓取到,则可以利用抓取到的与别名相匹配的视频属性信息,更新数据库中与所述目标视频关联的信息项。
S133、在第三方网站中抓取与所述英文名相匹配的视频属性信息。
在抓取到与英文名相匹配的视频属性信息的情况下,可以利用与英文名相匹配的视频属性信息,更新数据库中与目标视频关联的信息项。
步骤S14、在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
本实施例中,在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息的详细过程可以参见步骤S131-S133的相关介绍,在此不再赘述。
在本申请中,在目标视频绑定有第三方网站的身份信息的情况下,在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,或,在中间表中存在第三方绑定关系时,从第三方绑定关系中获取第三方网站的URL,可以直接基于第三方网站的URL,访问对应的第三方网站,在第三方网站中抓取与第一信息匹配的视频属性信息,实现了自动采集视频属性信息,能够提高视频属性信息采集的效率。并且实现了直接在特定的第三方网站中抓取信息,缩短信息抓取的时间,进一步提高信息采集的效率。
作为本申请另一可选实施例,参照图2,为本申请实施例2提供的一种视频属性信息采集方法的流程图,本实施例主要是对上述实施例1描述的在直播中投放浮层广告的方法的扩展方案,如图2所示,该方法可以包括但并不局限于以下步骤:
步骤S21、获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息。
若未绑定,则执行步骤S22;若已绑定,则执行步骤S26。
步骤S22、在中间表中查找与所述第一信息匹配的第三方绑定关系。
若查找到,则执行步骤S23;若未查找到,则执行步骤S24。
步骤S23、从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息。
步骤S21-S23的详细过程可以参见实施例1中步骤S11-S13的相关介绍,在此不再赘述。
步骤S24、在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,将抓取到的信息的集合作为第一视频信息集合。
在多个第三方网站中抓取与第一信息相匹配的视频属性信息的详细过程可以参见实施例1中步骤S131-S133的相关介绍,在此不再赘述。
步骤S25、在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息。
若查找到,则执行步骤S26。
在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息,可以包括但不局限于:
S251、在第一视频信息集合中查找与与目标视频的类型相关的信息相匹配的信息;
若查找到,则执行步骤S252;若未查找到,则执行步骤S253。
S252、从第一视频信息集合中获取与与目标视频的类型相关的信息相匹配的信息;
S253、在第一视频信息集合查找与播放属性信息相匹配的信息。
本实施例中,第二信息可以理解为:与目标视频的类型相关的信息(如,若目标视频的类型是综艺,则第二信息可以为主持人信息;若目标视频的类型是电影或电视剧或动漫,则第二信息可以为导演信息或主演信息),或,播放属性信息(如,地域信息或上映时间信息或播放时间信息。)。
若查找到,则从第一视频信息集合中获取与播放属性信息相匹配的信息。
步骤S26、将包含与所述目标视频的第二信息相匹配的信息的第三方网站的URL及与所述目标视频的第二信息相匹配的信息,作为待使用第三方绑定关系,并利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项。
本实施例中,利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项的过程,可以包括:
S2611、在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则执行步骤S2612;若查找到,则执行步骤S2614。
S2612、将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中;
S2613、利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息;
S2614、根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息;
S2615、利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
本实施例中,用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项的过程,也可以包括:
S2621、在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则执行步骤S2622;若查找到,则执行步骤S2625。
S2622、将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中。
S2623、利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
步骤S2624、将与所述目标视频的第二信息相匹配的信息,推送给前端。
本实施例中,将与目标视频的第二信息相匹配的信息,推送给前端,使前端展示的信息更完善、更丰富。
S2625、根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息。
S2626、利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
步骤S2627、将与所述目标视频的第二信息相匹配的信息,推送给前端。
本实施例中,将与目标视频的第二信息相匹配的信息,推送给前端,使前端展示的信息更完善、更丰富。
步骤S27、在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
本实施例中,所述在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项的过程,可以包括:
S2711、在中间表中查找与所述第一信息匹配的第三方绑定关系。
若查找到,则执行步骤S2712;若未查找到,则执行步骤S2714。
S2712、从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息。
S2713、利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
S2714、根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息。
S2715、利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
其中,若在访问到的第三方网站中未抓取到与第一信息匹配的视频属性信息,则将所述中间表中与所述第一信息匹配的第三方绑定关系更新为空值。
本实施例中,所述在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项的另外一种实施方式,可以包括:
S2721、在中间表中查找与所述第一信息匹配的第三方绑定关系。
若查找到,则执行步骤S2722;若未查找到,则执行步骤S2724。
S2722、从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息。
S2723、利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
S2724、将与所述第一信息匹配的视频属性信息,推送给前端。
本实施例中,将与所述第一信息匹配的视频属性信息,推送给前端,使前端展示的信息更完善、更丰富。
S2725、根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息。
S2726、利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
S2727、将与所述第一信息匹配的视频属性信息,推送给前端。
本实施例中,将与所述第一信息匹配的视频属性信息,推送给前端,使前端展示的信息更完善、更丰富。
接下来对本申请提供的一种视频属性信息采集装置进行介绍,下文介绍的视频属性信息采集装置与上文介绍的视频属性信息采集方法可相互对应参照。
请参见图3,视频属性信息采集装置包括:第一判断模块100、第一查找模块200、第一抓取模块300、第二抓取模块400和第一更新模块500。
第一判断模块100,用于获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息。
第一查找模块200,用于若所述目标视频未绑定有第三方网站的身份信息,则在中间表中查找与所述第一信息匹配的第三方绑定关系。
第一抓取模块300,用于若在中间表中查找到与所述第一信息匹配的第三方绑定关系,则从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息。
第二抓取模块400,用于若所述目标视频已绑定第三方网站的身份信息,则在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息。
第一更新模块500,用于用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
本实施例中,上述装置还可以包括:
第三抓取模块,用于若在中间表中不存在与所述第一信息匹配的第三方绑定关系,则在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,将抓取到的信息的集合作为第一视频信息集合;
第二查找模块,用于在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息;
第二更新模块,用于若查找到与所述目标视频的第二信息相匹配的信息,则将包含与所述目标视频的第二信息相匹配的信息的第三方网站的URL及与所述目标视频的第二信息相匹配的信息,作为待使用第三方绑定关系,并利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项。
本实施例中,所述第一信息可以包括:名称、别名和英文名;
所述第三抓取模块,具体可以用于:
在多个第三方网站中抓取与所述名称相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述别名相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述英文名相匹配的视频属性信息。
第二更新模块,具体可以用于:
在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息;
若查找到,则根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
本实施例中,所述第二抓取模块400,具体可以用于:
在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
若未查找到,则根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
所述第一更新模块,具体用于:利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
本实施例中,上述装置还可以包括:
第一推送模块,用于将与所述目标视频的第二信息相匹配的信息,推送给前端。
本实施例中,上述装置还可以包括:
第二推送模块,用于将与所述第一信息匹配的视频属性信息,推送给前端。
需要说明的是,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
以上对本申请所提供的一种视频属性信息采集方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种视频属性信息采集方法,其特征在于,包括:
获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息;
若未绑定,则在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息;
若已绑定,则在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若在中间表中不存在与所述第一信息匹配的第三方绑定关系,则在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,将抓取到的信息的集合作为第一视频信息集合;
在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息;
若查找到,则将包含与所述目标视频的第二信息相匹配的信息的第三方网站的URL及与所述目标视频的第二信息相匹配的信息,作为待使用第三方绑定关系,并利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项。
3.根据权利要求2所述的方法,其特征在于,所述第一信息包括:名称、别名和英文名;
所述在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,包括:
在多个第三方网站中抓取与所述名称相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述别名相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述英文名相匹配的视频属性信息。
4.根据权利要求2所述的方法,其特征在于,所述利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项,包括:
在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息;
若查找到,则根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
5.根据权利要求2所述的方法,其特征在于,所述在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息,并利用抓取到的信息,更新数据库中与所述目标视频关联的信息项,包括:
在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息;
若未查找到,则根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
6.根据权利要求4所述的方法,其特征在于,所述根据与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息之后,还包括:
将与所述目标视频的第二信息相匹配的信息,推送给前端。
7.根据权利要求5所述的方法,其特征在于,所述利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息之后,还包括:
将与所述第一信息匹配的视频属性信息,推送给前端。
8.一种视频属性信息采集装置,其特征在于,包括:
第一判断模块,用于获取目标视频的第一信息,并判断所述目标视频是否绑定有第三方网站的身份信息;
第一查找模块,用于若所述目标视频未绑定有第三方网站的身份信息,则在中间表中查找与所述第一信息匹配的第三方绑定关系;
第一抓取模块,用于若在中间表中查找到与所述第一信息匹配的第三方绑定关系,则从所述第三方绑定关系中获取第三方网站的URL,并基于所述第三方网站的URL,访问对应的第三方网站,并在所述第三方网站中抓取与所述第一信息匹配的视频属性信息;
第二抓取模块,用于若所述目标视频已绑定第三方网站的身份信息,则在所述目标视频绑定的第三方网站的身份信息对应的第三方网站中,抓取与所述第一信息相匹配的视频属性信息;
第一更新模块,用于用抓取到的信息,更新数据库中与所述目标视频关联的信息项。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第三抓取模块,用于若在中间表中不存在与所述第一信息匹配的第三方绑定关系,则在多个第三方网站中抓取与所述第一信息相匹配的视频属性信息,将抓取到的信息的集合作为第一视频信息集合;
第二查找模块,用于在所述第一视频信息集合中查找与所述目标视频的第二信息相匹配的信息;
第二更新模块,用于若查找到与所述目标视频的第二信息相匹配的信息,则将包含与所述目标视频的第二信息相匹配的信息的第三方网站的URL及与所述目标视频的第二信息相匹配的信息,作为待使用第三方绑定关系,并利用所述待使用第三方绑定关系,更新数据库中与所述目标视频关联的信息项。
10.根据权利要求9所述的装置,其特征在于,所述第一信息包括:名称、别名和英文名;
所述第三抓取模块,具体用于:
在多个第三方网站中抓取与所述名称相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述别名相匹配的视频属性信息;
若未抓取到,则在多个第三方网站中抓取与所述英文名相匹配的视频属性信息。
11.根据权利要求9所述的装置,其特征在于,第二更新模块,具体用于:
在所述中间表中查找与所述待使用URL匹配的第三方绑定关系;
若未查找到,则将包含所述待使用URL及与所述目标视频的第二信息相匹配的信息的第三方绑定关系,插入到所述中间表中;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息;
若查找到,则根据所述待使用URL及与所述目标视频的第二信息相匹配的信息,更新所述中间表中对应第三方绑定关系中的视频信息;
利用与所述目标视频的第二信息相匹配的信息,更新视频合集主表中的第三方网站的关键信息。
12.根据权利要求9所述的装置,其特征在于,所述第二抓取模块,具体用于:
在中间表中查找与所述第一信息匹配的第三方绑定关系;
若查找到,则从所述第三方绑定关系中获取第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
若未查找到,则根据所述目标视频绑定的第三方网站的身份信息,构造第三方网站的URL,根据所述第三方网站的URL,访问对应的第三方网站,并在访问到的第三方网站中抓取与所述第一信息匹配的视频属性信息;
所述第一更新模块,具体用于:利用与所述第一信息匹配的视频属性信息,更新所述中间表中与所述第一信息匹配的第三方绑定关系,并更新视频合集主表中的第三方网站的关键信息。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第一推送模块,用于将与所述目标视频的第二信息相匹配的信息,推送给前端。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第二推送模块,用于将与所述第一信息匹配的视频属性信息,推送给前端。
CN202110103909.XA 2021-01-26 2021-01-26 一种视频属性信息采集方法及装置 Pending CN112836087A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110103909.XA CN112836087A (zh) 2021-01-26 2021-01-26 一种视频属性信息采集方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110103909.XA CN112836087A (zh) 2021-01-26 2021-01-26 一种视频属性信息采集方法及装置

Publications (1)

Publication Number Publication Date
CN112836087A true CN112836087A (zh) 2021-05-25

Family

ID=75931779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110103909.XA Pending CN112836087A (zh) 2021-01-26 2021-01-26 一种视频属性信息采集方法及装置

Country Status (1)

Country Link
CN (1) CN112836087A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915807A (zh) * 2022-07-14 2022-08-16 飞狐信息技术(天津)有限公司 一种信息处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130033971A1 (en) * 2011-08-05 2013-02-07 Jeffrey Stier System and Method for Managing and Distributing Audio Recordings
CN103957433A (zh) * 2014-03-31 2014-07-30 深圳市同洲电子股份有限公司 一种视频数据的处理方法、相关设备及系统
CN104765766A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种监测视频更新的方法和装置
CN105245924A (zh) * 2015-09-28 2016-01-13 北京奇艺世纪科技有限公司 视频信息的推送和显示方法及应用该方法的视频播放器
CN107918657A (zh) * 2017-11-20 2018-04-17 腾讯科技(深圳)有限公司 一种数据源的匹配方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130033971A1 (en) * 2011-08-05 2013-02-07 Jeffrey Stier System and Method for Managing and Distributing Audio Recordings
CN103957433A (zh) * 2014-03-31 2014-07-30 深圳市同洲电子股份有限公司 一种视频数据的处理方法、相关设备及系统
CN104765766A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种监测视频更新的方法和装置
CN105245924A (zh) * 2015-09-28 2016-01-13 北京奇艺世纪科技有限公司 视频信息的推送和显示方法及应用该方法的视频播放器
CN107918657A (zh) * 2017-11-20 2018-04-17 腾讯科技(深圳)有限公司 一种数据源的匹配方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姚智颖: "《高等学校新工科人才培养"十三五"规划教材 Python大数》", 31 July 2019 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915807A (zh) * 2022-07-14 2022-08-16 飞狐信息技术(天津)有限公司 一种信息处理方法及装置

Similar Documents

Publication Publication Date Title
CN106331778B (zh) 视频推荐方法和装置
US8972392B2 (en) User interaction based related digital content items
US7620551B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
US8181197B2 (en) System and method for voting on popular video intervals
US8972458B2 (en) Systems and methods for comments aggregation and carryover in word pages
US9088808B1 (en) User interaction based related videos
US20090094189A1 (en) Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content
US20140032562A1 (en) Apparatus and methods for user generated content indexing
CN107885873B (zh) 用于输出信息的方法和装置
US20130226559A1 (en) Apparatus and method for providing internet documents based on subject of interest to user
US20150341771A1 (en) Hotspot aggregation method and device
CN107977678B (zh) 用于输出信息的方法和装置
WO2015096609A1 (zh) 视频资源的倒排索引文件建立方法及其系统
CN110851675B (zh) 一种数据提取方法、装置及介质
CN106484774A (zh) 一种多源视频元数据的关联方法及系统
US20170272793A1 (en) Media content recommendation method and device
KR20130123750A (ko) 이미지에 기반하여 동영상 서비스를 제공하는 시스템 및 방법
US8572073B1 (en) Spam detection for user-generated multimedia items based on appearance in popular queries
CN111104583B (zh) 一种直播间推荐方法、存储介质、电子设备及系统
CN105204806A (zh) 移动终端网页个性化显示方法及装置
KR20200098381A (ko) 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체
CN112836087A (zh) 一种视频属性信息采集方法及装置
CN112307318A (zh) 一种内容发布方法、系统及装置
CN112434250B (zh) 一种基于在线网站的cms识别特征规则提取方法
CN114003799A (zh) 事件推荐方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210525