CN109947980A - 一种视频收视数据的统计方法及装置 - Google Patents

一种视频收视数据的统计方法及装置 Download PDF

Info

Publication number
CN109947980A
CN109947980A CN201711035579.5A CN201711035579A CN109947980A CN 109947980 A CN109947980 A CN 109947980A CN 201711035579 A CN201711035579 A CN 201711035579A CN 109947980 A CN109947980 A CN 109947980A
Authority
CN
China
Prior art keywords
video playing
video
information
querying condition
playing information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711035579.5A
Other languages
English (en)
Inventor
焦张波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201711035579.5A priority Critical patent/CN109947980A/zh
Publication of CN109947980A publication Critical patent/CN109947980A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开了视频收视数据的统计方法及装置,涉及视频收视分析技术领域,能够快速地获取视频播放信息,进而实现快速统计视频收视数据,本发明的主要技术方案为:当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;从列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。本发明应用于统计视频收视数据。

Description

一种视频收视数据的统计方法及装置
技术领域
本发明涉及视频收视分析技术领域,尤其涉及一种视频收视数据的统计方法及装置。
背景技术
随着有线电视以及数字电视技术的不断发展,用户可以观看的电视频道越来越多,电视台一般使用电视频道收视系统采集在各个不同电视频道上由于用户观看视频所产生的视频播放记录数据并对视频播放记录数据进行相关运算来统计用户收视数据,进而分析用户在该电视频道上的收视行为,以便合理调整电视频道上视频播放内容以提高电视频道收视率。
目前,电视频道收视系统采集的视频播放记录数据一般被存储在数据库中,当分析用户的特定收视行为时,需要从大量的视频播放记录数据中筛选出与用户特定收视行为相关的视频播放信息,比如视频主题、视频播放ID等等。
然而,由于在数据库中不同视频播放信息存储在不同的属性列,并且在从数据库中提取视频播放记录数据时会根据存储的视频播放记录数据所包含的播放记录条数,依次读取每条播放记录所包含的多个不同的视频播放信息,再从中筛选出符合提取条件的视频播放信息,据此,数据库中存储了多少条播放记录,则需要在数据库中执行多少次读取操作,当数据库中存储的播放记录的数目是很大时,相应的,执行读取操作的次数的数量也是很大的,导致读取操作占用磁盘的读写资源过多,同时使得从数据库中提取符合条件的视频播放信息的效率会很低,进而利用该提取的视频播放信息统计视频收视数据的效率也会降低。
发明内容
有鉴于此,本发明提供一种视频收视数据的统计方法及装置,主要目的在于在优化视频播放记录数据存储方法的基础上,能够快速地获取视频播放信息,进而实现快速统计收视数据。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明提供了一种视频收视数据的统计方法,该方法包括:
当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;
从列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;
对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
优选的,从所述列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,包括:
根据所述查询条件,确定所述列式存储的数据库中待查询的多个属性列;
利用单次读取操作读取所述属性列中整列存储的视频播放信息;
将所述读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合;
判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息;
若存在,则提取所述视频播放信息。
优选的,所述属性列中存储的视频播放信息至少包括:视频播放开始时间和视频播放结束时间,当所述查询条件是查询预置时间段内视频播放信息时,所述判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息包括:
解析所述查询条件,得到所述查询条件中包含的预置时间段信息,所述预置时间段信息中包含预置开始时间和预置结束时间;
从所述数据集合中包含的多条视频播放信息中提取所述视频播放信息包含的视频播放开始时间和视频播放结束时间;
判断所述数据集合中是否存在视频播放开始时间在所述预置结束时间之前,或,视频播放结束时间在所述预置开始时间之后的视频播放信息;
若存在,则确定所述数据集合中存在与所述查询条件匹配的视频播放信息;
若不存在,则确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
优选的,所述视频播放信息还包括:观看视频的用户ID,当所述查询请求是查询在所述预置时间段内的视频播放次数时,所述对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据包括:
从所述数据集合中提取出与所述查询条件匹配的视频播放信息,所述视频播放信息包括视频播放开始时间和视频播放结束时间;
从所述数据集合中提取出与所述视频播放开始时间和所述视频播放结束时间所组成的时间段信息相对应的观看视频的用户ID;
对所述用户ID进行求和处理,得到在所述预置时间段内的用户ID数目;
根据所述用户ID数目确定在所述预置时间段内的视频播放次数。
优选的,当所述查询请求是查询在所述预置时间段内的收视用户数目时,所述对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据包括:
对所述用户ID进行去重处理,统计所述去重处理后的用户ID数目;
将统计得到的用户ID数目,确定为所述预置时间段内的收视用户数目。
为了实现上述目的,根据本发明的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的视频收视数据的统计方法。
为了实现上述目的,根据本发明的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的视频收视数据的统计方法。
另一方面,本发明还提供了一种视频收视数据的统计装置,该装置包括:
解析单元,用于当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;
提取单元,用于从列式存储的数据库中提取出与所述解析单元所解析的查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;
统计单元,用于对所述提取单元所提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
优选的,所述提取单元包括:
确定模块,用于根据所述查询条件,确定所述列式存储的数据库中待查询的多个属性列;
读取模块,用于利用单次读取操作读取所述确定模块所确定的属性列中整列存储的视频播放信息;
关联模块,用于将所述读取模块所读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合;
判断模块,用于判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息;
提取模块,用于当所述判断模块判断所述数据集合中存在与所述查询条件匹配的视频播放信息时,提取所述视频播放信息。
优选的,所述属性列中存储的视频播放信息至少包括:视频播放开始时间和视频播放结束时间,当所述查询条件是查询预置时间段内视频播放信息时,所述判断模块包括:
解析子模块,用于解析所述查询条件,得到所述查询条件中包含的预置时间段信息,所述预置时间段信息中包含预置开始时间和预置结束时间;
提取子模块,用于从所述数据集合中包含的多条视频播放信息中提取所述视频播放信息包含的视频播放开始时间和视频播放结束时间;
判断子模块,用于判断所述数据集合中是否存在视频播放开始时间在所述预置结束时间之前,或,视频播放结束时间在所述预置开始时间之后的视频播放信息;
第一确定子模块,用于当所述判断子模块判断存在时,确定所述数据集合中存在与所述查询条件匹配的视频播放信息;
第二确定子模块,用于当所述判断子模块判断不存在时,确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
优选的,所述视频播放信息还包括:观看视频的用户ID,当所述查询请求是查询在所述预置时间段内的视频播放次数时,所述统计单元包括:
第一提取模块,用于从所述数据集合中提取出与所述查询条件匹配的视频播放信息,所述视频播放信息包括视频播放开始时间和视频播放结束时间;
第二提取模块,用于从所述数据集合中提取出与所述第一提取模块提取的所述视频播放开始时间和所述视频播放结束时间所组成的时间段信息相对应的观看视频的用户ID;
第一处理模块,用于对所述第二提取模块所提取的用户ID进行求和处理,得到在所述预置时间段内的用户ID数目;
第一确定模块,用于根据所述用户ID数目确定在所述预置时间段内的视频播放次数。
优选的,当所述查询请求是查询在所述预置时间段内的收视用户数目时,所述统计单元还包括:
第二处理模块,用于对所述第二提取模块提取的用户ID进行去重处理;
统计模块,用于统计所述第二处理模块所进行的去重处理后的用户ID数目;
第二确定模块,用于将所述统计模块统计得到的用户ID数目,确定为所述预置时间段内的收视用户数目。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供的一种视频收视数据的统计方法及装置,本发明在采用列式存储的数据库存储视频播放记录数据时根据分析用户特定收视行为的需求,预先将相互关联的多个视频播放信息存储在同一个属性列中,并且在列式存储的数据库中实现这样存储的属性列可以为多个,以便根据查询条件查询该列式存储的数据库时,能够通过单次读取操作读取整列属性列上存储的多个视频播放信息,进而实现快速获取视频播放信息。相比较现有通过多次读取操作读取数据库中存储的每条视频播放记录数据,然后再从读取到的内容信息中提取符合查询条件的视频播放信息。本发明能够实现快速地读取多个视频播放信息,同时也减少了对列式存储的数据库执行读取操作的次数,节约了读写操作所占用的磁盘的读写资源,同时当利用读取的视频播放信息来统计用户的收视数据时,能够快速地统计视频收视数据。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的一种视频收视数据的统计方法流程图;
图2为本发明实施例提供的另一种视频收视数据的统计方法流程图;
图3为本发明实施例提供的一种视频收视数据的统计装置的组成框图;
图4为本发明实施例提供的另一种视频收视数据的统计装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种视频收视数据的统计方法,如图1所示,该方法是在优化视频播放记录数据存储方法的基础上,能够快速地获取视频播放信息,进而实现快速统计收视数据,对此本发明实施例提供以下具体步骤:
101、当接收到视频收视数据的查询请求时,解析查询请求中包含的查询条件。
其中,视频收视数据是指对视频播放信息做相关运算所得到的用于分析用户收视行为的数据,比如收视时长数据可以通过统计视频播放信息中的视频播放开始时间和视频播放结束时间并做相关运算而获得的,其中,相关运算是指不限于对视频播放信息所做出的加、减、乘、除等逻辑运算,其中,视频播放信息是指在电视频道上由于用户观看视频所产生的视频播放记录数据中所包含的视频播放信息,比如视频主题、视频播放ID、视频播放开始时间、视频播放结束时间等等。
在本发明实施例中,当接收到视频收视数据的查询请求时,可以根据查询请求所包含的关键字解析查询请求所包含的查询条件。比如,当查询请求是查询在9:00-10:00之间电视频道上所播放视频的视频播放ID时,则根据该查询请求中所包含的关键字“9:00-10:00”“视频播放ID”解析该查询请求所包含的查询条件是“查询9:00-10:00”“查询视频播放ID”。在本发明实施例中不限于上述利用关键字实现解析查询请求中包含查询条件的方法,本发明实施例对于解析查询请求中所包含的查询条件的方法不作具体限制。
102、从列式存储的数据库中提取出与查询条件匹配的视频播放信息。
其中,列式存储的数据库中包含多个属性列,至少一个属性列中存储有多个视频播放信息。
在本发明实施例中,采用列式存储的数据库存储视频播放记录数据,该数据库中包含多个属性列,每个属性列用于存储视频播放记录数据中所包含的视频播放信息,其中,每个属性列都可以存储一个或者多个视频播放信息,比如视频主题、视频播放ID,可以将视频主题、视频播放ID分别存储在不同的属性列中,也可以将视频主题信息、视频播放ID存储在同一个属性列中。
在本发明实施例中,根据分析用户收视行为的需求,可以预先将多个视频播放信息存储在同一个属性列中,据此,可以通过查询较少的属性列即可能够快速得到更多个视频播放信息,而后从这些视频播放信息中提取出与查询条件相匹配的视频播放信息,以便能够快速统计视频收视数据。
例如,将视频主题信息与视频播放ID存储在同一个属性列中,当接收的查询请求是查询视频主题是电影的视频播放ID时,则通过执行一次读取操作来查询该属性列可以直接得到视频播放记录数据中所包含的两个属性的视频播放信息,再从中统计出视频主题是电影的视频播放ID并提取出符合查询条件的视频播放ID。
103、对提取的视频播放信息进行统计,得到满足查询请求的视频收视数据。
在本发明实施例中,当查询请求中包含相关运算时,则根据查询请求的查询条件提取出的视频播放信息只是中间数据结果,还需要进一步对该中间数据结果进行相关运算,才能得到满足查询请求的视频收视数据。
例如,对上述102的例举做进一步详细描述,当查询请求是查询视频主题是电影的视频播放ID的数目时,则需要进一步对查询到的视频播放ID进行求和运算,得到视频播放ID数目,这才是满足查询请求的视频播放数据。
本发明实施例提供的一种视频收视数据的统计方法及装置,本发明实施例在采用列式存储的数据库存储视频播放记录数据时根据分析用户特定收视行为的需求,预先将相互关联的多个视频播放信息存储在同一个属性列中,并且在列式存储的数据库中实现这样存储的属性列可以为多个,以便根据查询条件查询该列式存储的数据库时,能够通过单次读取操作读取整列属性列上存储的多个视频播放信息,进而实现快速获取视频播放信息。相比较现有通过多次读取操作读取数据库中存储的每条视频播放记录数据,然后再从读取到的内容信息中提取符合查询条件的视频播放信息。本发明实施例能够实现快速地读取多个视频播放信息,同时也减少了对列式存储的数据库执行读取操作的次数,节约了读写操作所占用的磁盘的读写资源,同时当利用读取的视频播放信息来统计用户的收视数据时,能够实现快速统计视频收视数据。
为了对上述实施例做出更加详细的说明,本发明实施例还提供了另一种视频收视数据的统计方法,如图2所示,该方法是根据分析用户特定收视行为需求,将多个视频播放信息存储在同一个属性列,比如将视频播放开始时间和视频播放结束时间存储在同一个属性列,并从中提取符合查询条件的视频播放信息,用于统计视频收视数据,对此本发明实施例提供以下具体步骤:
201、当接收到视频收视数据的查询请求时,解析查询请求中包含的查询条件。
其中,视频收视数据是指对视频播放信息做相关运算所得到的用于分析用户收视行为的数据,其中,相关运算是指不限于对视频播放信息所做出的加、减、乘、除等逻辑运算,其中,视频播放信息是指在电视频道上由于用户观看视频所产生的视频播放记录数据中所包含的视频播放信息,比如视频主题、视频播放ID、视频播放时段等等。
在本发明实施例中,当接收到视频收视数据的查询请求时,解析查询请求中包含的查询条件,其具体描述请求参考步骤101,此处不再赘述。
202、根据查询条件,确定列式存储的数据库中待查询的多个属性列。
在本发明实施例中,根据查询条件,确定待查的多个属性列,其中属性列中可以存储一个或多个视频播放信息。
203、利用单次读取操作读取属性列中整列存储的视频播放信息。
在本发明实施例中,根据列式存储数据库的存储架构,其可以通过单次读取操作实现读取一个属性列中存储的整列数据,由于一个属性列中可以存储一个或多个视频播放信息,相应的,通过单次读取操作所得到的整列数据中可以包含一个或者多个视频播放信息,基于这种读取操作,可以根据分析用户特定收视行为的需求,将多个用于分析该收视行为相关的视频播放信息存储在同一个属性列中,以便通过较少的读取操作,从单一属性列中获取更多视频播放信息,又或者可以通过一次读取操作而直接得到用于分析用户特定收视行为所需要的全部视频播放信息。
204、将读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合。
在本发明实施例中,当读取的视频播放信息是多个时,则根据视频播放信息所归属的不同的视频播放记录数据,将多个视频播放信息进行关联,进而得到由该读取出的视频播放信息所组成的多条新的视频播放记录数据,并且在该新的视频播放记录数据中只包含这几个被读取出的视频播放信息。
205、判断数据集合中是否存在与查询条件匹配的视频播放信息。
在本发明实施例中,当查询条件是查询预置时间段内的视频播放信息时,则根据查询条件所确定的待查询属性列中至少包含视频播放开始时间和视频播放结束时间,并且为了快速从列式存储的数据库中读取到视频播放开始时间和视频播放结束时间,可以将视频播放开始时间和视频播放结束时间存储在同一个属性列中,以便通过单次读取操作就可以直接获得视频播放的时间段信息,并且该时间段信息中包含视频播放开始时间和视频播放结束时间。对于本发明实施例,通过上述步骤204,可以获得从列式存储的数据库中读取出的包含视频播放开始时间、视频播放结束时间以及其他视频播放信息的数据集合。那么,判断数据集合中是否存在与查询条件匹配的视频播放信息的具体步骤,如下:
第一,解析查询条件,得到查询条件中包含的预置时间段信息,该预置时间段信息中包含预置开始时间和预置结束时间。
在本发明实施例中,解析查询条件所包含的预置时间段信息,比如,预置时间段信息是9:00-10:00,相应的,该预置时间段信息中包含的预置开始时间是9:00,预置结束时间是10:00。
第二,从数据集合中包含的多条视频播放信息中提取视频播放信息包含的视频播放开始时间和视频播放结束时间。
在本发明实施例中,如表一所示的包含视频播放信息的数据集合,则提取出每组视频播放开始时间和视频播放结束时间。
表一
第三,判断数据集合中是否存在视频播放开始时间在预置结束时间之前,或,视频播放结束时间在预置开始时间之后的视频播放信息。
通过将表一中每组视频播放开始时间和视频播放结束时间与预置时间段信息所包含的预置开始时间和预置结束时间作比较,并且作比较的条件是在视频播放开始时间在预置结束时间之前,或,视频播放结束时间在预置开始时间,即通过该作比较可以确定在预置时间段内是否存在播放的视频。
第四,若判断数据集合中存在视频播放开始时间在预置结束时间之前,或,视频播放结束时间在预置开始时间之后的视频播放信息,则确定数据集合中存在与查询条件匹配的视频播放信息;若判断数据集合中不存在视频播放开始时间在预置结束时间之前,或,视频播放结束时间在预置开始时间之后的视频播放信息,则确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
206、若数据集合中存在与查询条件匹配的视频播放信息时,则提取视频播放信息。
在本发明实施例中,对上述例举做进一步描述,当数据集合中存在与查询条件匹配的视频播放信息时,则提取视频播放信息,并且该提取的视频播放信息中至少包含视频播放开始时间、视频播放结束时间。
207、对提取的视频播放信息进行统计,得到满足查询请求的视频收视数据。
在本发明实施例中,当接收的视频收视数据查询请求是查询在预置时间段内视频播放次数或者观看用户数目时,通过解析该查询请求可以确定查询条件是“查询视频播放时间段信息”“查询用户ID”,即通过查询这两个属性的视频播放信息,可以实现统计在预置时间段内视频播放次数或者观看用户数目。
对于在本发明实施例,由于每一条视频播放记录数据中都包含视频播放ID和用户ID,所以还可以通过查询视频播放ID和视频播放时间段信息,实现统计在预置时间段内的视频播放次数。据此,根据不同的运算方法,解析查询请求所包含的查询条件可以是不同,所以在本发明实施例中对实现视频收视数据查询请求所采用的查询条件和相关运算,不做限定。
在本发明实施例中,当查询请求是查询在所述预置时间段内的视频播放次数时,则从列式存储的数据库中查询的视频播放信息至少包括视频播放开始时间、视频播放结束时间、观看视频的用户ID,并且该查询到的上述视频播放信息组成视频播放信息的数据集合,则统计预置时间段内的视频播放次数具体步骤,如下:
第一,从数据集合中提取出与查询条件匹配的视频播放信息,视频播放信息包括视频播放开始时间和视频播放结束时间。
在本发明实施例中,根据确定的查询条件所包含的预置时间段信息,从数据集合中提取出与之匹配的多组视频播放开始时间和视频播放结束时间。
第二,从数据集合中提取出与视频播放开始时间和视频播放结束时间所组成的时间段信息相对应的观看视频的用户ID。
在本发明实施例中,当确定与预置时间段信息匹配的多组视频播放开始时间和视频播放结束时间,确定每组视频播放开始时间和视频播放结束时间所对应的用户ID。
第三,对用户ID进行求和处理,得到在预置时间段内的用户ID数目。
在本发明实施例中,通过求和处理,计算用户ID数目。
第四,根据用户ID数目确定在预置时间段内的视频播放次数。
在本发明实施例中,由于每条视频播放记录数据都包含用户ID,则根据求得的用户ID数目,该数目同样也是在在预置时间段内的视频播放次数。
进一步的,当所述查询请求是查询在所述预置时间段内的收视用户数目时,则统计在预置时间段内的观看视频的用户数目具体步骤,还包括:
对用户ID进行去重处理,统计去重处理后的用户ID数目,由于每个用户所拥有的用户ID都是唯一的,所以该去重处理后的用户ID数目,即是预置时间段内观看视频的用户数目。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的视频收视数据的统计方法。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的视频收视数据的统计方法。
进一步的,作为对上述图1、图2所示方法的实现,本发明实施例提供了一种视频收视数据的统计装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置应用于统计视频的收视数据,具体如图3所示,该装置包括:
解析单元31,用于当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;
提取单元32,用于从列式存储的数据库中提取出与所述解析单元31所解析的查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;
统计单元33,用于对所述提取单元32所提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
进一步的,如图4所示,所述提取单元32包括:
确定模块321,用于根据所述查询条件,确定所述列式存储的数据库中待查询的多个属性列;
读取模块322,用于利用单次读取操作读取所述确定模块321所确定的属性列中整列存储的视频播放信息;
关联模块323,用于将所述读取模块322所读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合;
判断模块324,用于判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息;
提取模块325,用于当所述判断模块324判断所述数据集合中存在与所述查询条件匹配的视频播放信息时,提取所述视频播放信息。
进一步的,如图4所示,所述属性列中存储的视频播放信息至少包括:视频播放开始时间和视频播放结束时间,当所述查询条件是查询预置时间段内视频播放信息时,所述判断模块324包括:
解析子模块3241,用于解析所述查询条件,得到所述查询条件中包含的预置时间段信息,所述预置时间段信息中包含预置开始时间和预置结束时间;
提取子模块3242,用于从所述数据集合中包含的多条视频播放信息中提取所述视频播放信息包含的视频播放开始时间和视频播放结束时间;
判断子模块3243,用于判断所述数据集合中是否存在视频播放开始时间在所述预置结束时间之前,或,视频播放结束时间在所述预置开始时间之后的视频播放信息;
第一确定子模块3244,用于当所述判断子模块3243判断存在时,确定所述数据集合中存在与所述查询条件匹配的视频播放信息;
第二确定子模块3245,用于当所述判断子模块3243判断不存在时,确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
进一步的,如图4所示,所述视频播放信息还包括:观看视频的用户ID,当所述查询请求是查询在所述预置时间段内的视频播放次数时,所述统计单元33包括:
第一提取模块331,用于从所述数据集合中提取出与所述查询条件匹配的视频播放信息,所述视频播放信息包括视频播放开始时间和视频播放结束时间;
第二提取模块332,用于从所述数据集合中提取出与所述第一提取模块331提取的所述视频播放开始时间和所述视频播放结束时间所组成的时间段信息相对应的观看视频的用户ID;
第一处理模块333,用于对所述第二提取模块332所提取的用户ID进行求和处理,得到在所述预置时间段内的用户ID数目;
第一确定模块334,用于根据所述用户ID数目确定在所述预置时间段内的视频播放次数。
进一步的,如图4所示,当所述查询请求是查询在所述预置时间段内的收视用户数目时,所述统计单元33还包括:
第二处理模块335,用于对所述第二提取模块332提取的用户ID进行去重处理;
统计模块336,用于统计所述第二处理模块335所进行的去重处理后的用户ID数目;
第二确定模块337,用于将所述统计模块336所统计得到的用户ID数目,确定为在所述预置时间段内的收视用户数目。
综上所述,本发明实施例所采用的一种视频收视数据的统计方法及装置,本发明实施例在采用列式存储的数据库存储视频播放记录数据时根据分析用户特定收视行为的需求,预先将相互关联的多个视频播放信息存储在同一个属性列中,并且在列式存储的数据库中实现这样存储的属性列可以为多个,以便根据查询条件查询该列式存储的数据库时,能够通过单次读取操作读取整列属性列上存储的多个视频播放信息,进而实现快速获取视频播放信息,同时也减少了对列式存储的数据库执行读取操作的次数,节约了读写操作所占用的磁盘的读写资源,同时当利用读取的视频播放信息来统计用户的收视数据时,提高了统计收视数据的工作效率。进一步的,当查询条件是查询预置时间段内视频播放信息时,本发明实施例还提出了优化的查询方法,即查询在视频播放开始时间在预置结束时间之前,或视频播放结束时间在预置开始时间之后的视频播放信息,进一步实现提高查询视频播放信息的速度。
所述视频收视数据的统计装置包括处理器和存储器,上述解析单元、提取单元和统计单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现单次读取操作可以快速地获取更多的视频播放信息,进而减少对数据库执行读取操作的次数,节约了读写操作所占用的磁盘的读写资源,同时当利用读取的视频播放信息来统计用户的收视数据时,能够实现快速统计视频收视数据。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述视频收视数据的统计方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述视频收视数据的统计方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
一种视频收视数据的统计方法,所述方法包括:当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;从列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
进一步的,从所述列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,包括:根据所述查询条件,确定所述列式存储的数据库中待查询的多个属性列;利用单次读取操作读取所述属性列中整列存储的视频播放信息;将所述读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合;判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息;若存在,则提取所述视频播放信息。
进一步的,所述属性列中存储的视频播放信息至少包括:视频播放开始时间和视频播放结束时间,当所述查询条件是查询预置时间段内视频播放信息时,所述判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息包括:解析所述查询条件,得到所述查询条件中包含的预置时间段信息,所述预置时间段信息中包含预置开始时间和预置结束时间;从所述数据集合中包含的多条视频播放信息中提取所述视频播放信息包含的视频播放开始时间和视频播放结束时间;判断所述数据集合中是否存在视频播放开始时间在所述预置结束时间之前,或,视频播放结束时间在所述预置开始时间之后的视频播放信息;若存在,则确定所述数据集合中存在与所述查询条件匹配的视频播放信息;若不存在,则确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
进一步的,所述视频播放信息还包括:观看视频的用户ID,当所述查询请求是查询在所述预置时间段内的视频播放次数时,所述对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据包括:从所述数据集合中提取出与所述查询条件匹配的视频播放信息,所述视频播放信息包括视频播放开始时间和视频播放结束时间;从所述数据集合中提取出与所述视频播放开始时间和所述视频播放结束时间所组成的时间段信息相对应的观看视频的用户ID;对所述用户ID进行求和处理,得到在所述预置时间段内的用户ID数目;根据所述用户ID数目确定在所述预置时间段内的视频播放次数。
进一步的,当所述查询请求是查询在所述预置时间段内的收视用户数目时,所述对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据包括:对所述用户ID进行去重处理,统计所述去重处理后的用户ID数目;将所述统计到的用户ID数目,确定是在所述预置时间段内观看视频的用户数目。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;从列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器
(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种视频收视数据的统计方法,其特征在于,所述方法包括:
当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;
从列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;
对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
2.根据权利要求1所述的方法,其特征在于,从所述列式存储的数据库中提取出与所述查询条件匹配的视频播放信息,包括:
根据所述查询条件,确定所述列式存储的数据库中待查询的多个属性列;
利用单次读取操作读取所述属性列中整列存储的视频播放信息;
将所述读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合;
判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息;
若存在,则提取所述视频播放信息。
3.根据权利要求1或2所述的方法,其特征在于,所述属性列中存储的视频播放信息至少包括:视频播放开始时间和视频播放结束时间,当所述查询条件是查询预置时间段内视频播放信息时,所述判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息包括:
解析所述查询条件,得到所述查询条件中包含的预置时间段信息,所述预置时间段信息中包含预置开始时间和预置结束时间;
从所述数据集合中包含的多条视频播放信息中提取所述视频播放信息包含的视频播放开始时间和视频播放结束时间;
判断所述数据集合中是否存在视频播放开始时间在所述预置结束时间之前,或,视频播放结束时间在所述预置开始时间之后的视频播放信息;
若存在,则确定所述数据集合中存在与所述查询条件匹配的视频播放信息;
若不存在,则确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
4.根据权利要求3所述的方法,其特征在于,所述视频播放信息还包括:观看视频的用户ID,当所述查询请求是查询在所述预置时间段内的视频播放次数时,所述对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据包括:
从所述数据集合中提取出与所述查询条件匹配的视频播放信息,所述视频播放信息包括视频播放开始时间和视频播放结束时间;
从所述数据集合中提取出与所述视频播放开始时间和所述视频播放结束时间所组成的时间段信息相对应的观看视频的用户ID;
对所述用户ID进行求和处理,得到在所述预置时间段内的用户ID数目;
根据所述用户ID数目确定在所述预置时间段内的视频播放次数。
5.根据权利要求4所述的方法,其特征在于,当所述查询请求是查询在所述预置时间段内的收视用户数目时,所述对提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据包括:
对所述用户ID进行去重处理,统计所述去重处理后的用户ID数目;
将统计得到的用户ID数目,确定为在所述预置时间段内的收视用户数目。
6.一种视频收视数据的统计装置,其特征在于,所述装置包括:
解析单元,用于当接收到视频收视数据的查询请求时,解析所述查询请求中包含的查询条件;
提取单元,用于从列式存储的数据库中提取出与所述解析单元所解析的查询条件匹配的视频播放信息,所述列式存储的数据库中包含多个属性列,至少一个所述属性列中存储有多个视频播放信息;
统计单元,用于对所述提取单元所提取的所述视频播放信息进行统计,得到满足所述查询请求的视频收视数据。
7.根据权利要求6所述的装置,其特征在于,所述提取单元包括:
确定模块,用于根据所述查询条件,确定所述列式存储的数据库中待查询的多个属性列;
读取模块,用于利用单次读取操作读取所述确定模块所确定的属性列中整列存储的视频播放信息;
关联模块,用于将所述读取模块所读取到的整列存储的视频播放信息进行关联,得到包含多条视频播放信息的数据集合;
判断模块,用于判断所述数据集合中是否存在与所述查询条件匹配的视频播放信息;
提取模块,用于当所述判断模块判断所述数据集合中存在与所述查询条件匹配的视频播放信息时,提取所述视频播放信息。
8.根据权利要求6或7所述的装置,其特征在于,所述属性列中存储的视频播放信息至少包括:视频播放开始时间和视频播放结束时间,当所述查询条件是查询预置时间段内视频播放信息时,所述判断模块包括:
解析子模块,用于解析所述查询条件,得到所述查询条件中包含的预置时间段信息,所述预置时间段信息中包含预置开始时间和预置结束时间;
提取子模块,用于从所述数据集合中包含的多条视频播放信息中提取所述视频播放信息包含的视频播放开始时间和视频播放结束时间;
判断子模块,用于判断所述数据集合中是否存在视频播放开始时间在所述预置结束时间之前,或,视频播放结束时间在所述预置开始时间之后的视频播放信息;
第一确定子模块,用于当所述判断子模块判断存在时,确定所述数据集合中存在与所述查询条件匹配的视频播放信息;
第二确定子模块,用于当所述判断子模块判断不存在时,确定所述数据集合中不存在与所述查询条件匹配的视频播放信息。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-5中任一项所述的视频收视数据的统计方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中所述程序运行时执行如权利要求1-5中任一项所述的视频收视数据的统计方法。
CN201711035579.5A 2017-10-30 2017-10-30 一种视频收视数据的统计方法及装置 Pending CN109947980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711035579.5A CN109947980A (zh) 2017-10-30 2017-10-30 一种视频收视数据的统计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711035579.5A CN109947980A (zh) 2017-10-30 2017-10-30 一种视频收视数据的统计方法及装置

Publications (1)

Publication Number Publication Date
CN109947980A true CN109947980A (zh) 2019-06-28

Family

ID=67003964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711035579.5A Pending CN109947980A (zh) 2017-10-30 2017-10-30 一种视频收视数据的统计方法及装置

Country Status (1)

Country Link
CN (1) CN109947980A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294702A (zh) * 2012-02-27 2013-09-11 上海淼云文化传播有限公司 一种数据处理方法、装置及系统
CN103678556A (zh) * 2013-12-06 2014-03-26 华为技术有限公司 列式数据库处理的方法和处理设备
CN104133858A (zh) * 2014-07-15 2014-11-05 武汉邮电科学研究院 基于列存储的智能双引擎分析系统及方法
CN104284217A (zh) * 2014-10-24 2015-01-14 北京国双科技有限公司 网络收视统计方法和装置
CN104469424A (zh) * 2014-11-06 2015-03-25 北京国双科技有限公司 用于电视频道的收视时长的统计方法及装置
CN104715039A (zh) * 2015-03-23 2015-06-17 星环信息科技(上海)有限公司 基于硬盘和内存的列式存储和查询方法及设备
US9659050B2 (en) * 2013-08-06 2017-05-23 Sybase, Inc. Delta store giving row-level versioning semantics to a non-row-level versioning underlying store

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294702A (zh) * 2012-02-27 2013-09-11 上海淼云文化传播有限公司 一种数据处理方法、装置及系统
US9659050B2 (en) * 2013-08-06 2017-05-23 Sybase, Inc. Delta store giving row-level versioning semantics to a non-row-level versioning underlying store
CN103678556A (zh) * 2013-12-06 2014-03-26 华为技术有限公司 列式数据库处理的方法和处理设备
CN104133858A (zh) * 2014-07-15 2014-11-05 武汉邮电科学研究院 基于列存储的智能双引擎分析系统及方法
CN104284217A (zh) * 2014-10-24 2015-01-14 北京国双科技有限公司 网络收视统计方法和装置
CN104469424A (zh) * 2014-11-06 2015-03-25 北京国双科技有限公司 用于电视频道的收视时长的统计方法及装置
CN104715039A (zh) * 2015-03-23 2015-06-17 星环信息科技(上海)有限公司 基于硬盘和内存的列式存储和查询方法及设备

Similar Documents

Publication Publication Date Title
US11218755B2 (en) Measuring video viewing
CN110264280A (zh) 一种户外广告监测方法
US11212565B2 (en) Measuring video-content viewing
CN107454442B (zh) 一种推荐视频的方法和装置
US20230283821A1 (en) Data translation for video-viewing activity
CN109828993A (zh) 一种统计数据的查询方法及装置
CN106358047A (zh) 一种播放流媒体视频的方法及装置
CN112507163A (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
CN108259949A (zh) 一种广告推荐方法、装置及电子设备
CN106470344B (zh) 电视节目的录制方法和服务器
EP2846292B1 (en) Measuring video-program viewing
US11553219B2 (en) Event progress detection in media items
CN106658083B (zh) 一种观看频道路径的统计方法及装置
CN106658183B (zh) 弹出视频登陆对话框的方法及装置
CN109561339A (zh) 视频文件的处理方法和装置
US20100088727A1 (en) Computational recommendation engine
US11977592B2 (en) Targeted crawler to develop and/or maintain a searchable database of media content across multiple content providers
CN111447467A (zh) 一种视频内容管理系统
CN109947980A (zh) 一种视频收视数据的统计方法及装置
CN109587565A (zh) 一种收视数据的统计方法及装置
CN109729428A (zh) 电视频道视频收视统计方法及装置
CN109587548B (zh) 视频播放数据的计算方法及装置
US9736431B2 (en) Content subscription package management
CN109561327A (zh) 收视检测方法及装置
CN109587526A (zh) 数据的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190628