具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
在本申请的用于播放内容的识别方法,包括:接收第一内容的第一识别请求;确定所述第一内容的第一播放内容;以及根据所述第一识别请求对所述第一播放内容执行预设内容识别操作。
通过本申请的方法对于节目内容方而言,可以精准的在任何位置和观众进行互动,比如同步答题、投票、抽奖、推送等,也可以实现同时看节目的观众之间的互动,比如聊天、竞猜等。对移动端应用来说,由于可以实时了解用户所观看的内容以及播放进度,可以推送相关性更强的内容或是服务。
如图1所示,该方法包括如下的步骤S102至步骤S106:
步骤S102,接收第一内容的第一识别请求,
第一识别请求用于作为播放内容识别服务的服务请求,播放内容识别服务是指,通过该服务互联网设备能够识别所处的环境播放的音视频内容或是音视频指令信号。
当接收到第一内容的识别请求时,可以是在应用程序的前端或者应用程序的后端。
具体而言,播放内容识别服务是指识别内容并且可选地识别出播放进度的能力。具体的说,播放内容识别服务可以识别用户观看或者收听的是什么即观看内容;以及进一步地观众看或者听到了这个节目的哪里即观看进度。
步骤S104,确定所述第一内容的第一播放内容,
第一播放内容用于作为基于播放内容的服务内容,基于播放内容的服务内容是指,依赖于播放内容识别服务提供的识别能力实现各种应用。比如,可以是收看或者收听内容的信息推送;同时收看或者收听相同内容的观众的互动。
基于播放内容的服务需要基于识别播放内容以及播放进度给移动用户或者第三方提供增值服务,
在一些实施例中,所述第一内容的第一播放内容可以是,同时收看某一节目的所有观众参与的聊天室、弹幕。此时,聊天或者弹幕的进度和节目播放的进程一致。
在一些实施例中,所述第一内容的第一播放内容可以是,答题类节目中出现问题的时候,手机同步推出问题供观众在移动端回答并在选手回答之前关闭答题,选手回答之后在移动端显示正确答案。
在一些实施例中,所述第一内容的第一播放内容可以是,当节目出现某个内容的时候,移动端推送关于这个内容的更详细的内容以及行动链接(Call for Action),比如嘉宾信息,产品购买链接,投票,选择等。
在一些实施例中,所述第一内容的第一播放内容可以是,观看或者收听节目的时候,相关信息自动保存到移动端,起到记事的功能,事后查看。比如开车听广播,下车以后查询相关信息。
在一些实施例中,所述第一内容的第一播放内容可以是,广告牌周围推送该广告的行动链接给在广告牌附近的移动设备。
在一些实施例中,所述第一内容的第一播放内容可以是,商场发送周围商家打折信息、优惠券到商场上的移动设备。
在一些实施例中,所述第一内容的第一播放内容可以是,应用程序根据用户当前观看的内容,通过智能推荐算法推送相关性更强的内容,比如微博把用户当前观看或收听的内容作为一个推荐因素,在信息流里面推荐相关的信息。
在一些实施例中,所述第一内容的第一播放内容可以是,观看游戏直播的时候,小屏配合展现更多的选手的游戏信息。
在一些实施例中,所述第一内容的第一播放内容可以是,增对影视作品添加音频水印。
步骤S106,根据所述第一识别请求对所述第一播放内容执行预设内容识别操作。
根据上述的播放内容识别服务的服务请求对基于播放内容的服务内容执行预设内容识别融合操作,由于不同的内容识别方法可适用于不同的场景,所以需要针对不同的识别请求执行预设内容识别操作。比如,同步答题需要使用水印识别或者和内容播放平台形成合作;又比如,一般性内容推送可以使用指纹识别等。
此外,另外一个方面,根据上述的播放内容识别服务的服务请求对基于播放内容的服务内容执行预设内容识别融合操作可以保证内容服务的有效性和普适性。比如,用户提供某个具体的节目,或者用户行为习惯的分析可以交叉验证水印识别和指纹识别的结果;又比如,指纹识别可以辅助水印识别先进行低精度的识别,从而降低指纹识别码的长度等。针对内容识别服务采用多种技术融合的方法,对于不同的应用场景,才能达到最优的识别效果。
从以上的描述中,可以看出,本申请实现了如下技术效果:
在本申请实施例中,采用接收第一内容的第一识别请求的方式,通过确定所述第一内容的第一播放内容,达到了根据所述第一识别请求对所述第一播放内容执行预设内容识别操作的目的,从而实现了播放内容融合识别,识别结果具有实时性和准确性的技术效果,进而解决了针对播放内容识别效果较差的技术问题。
根据本申请实施例,作为本实施例中的优选,如图2所示,确定所述第一内容的第一播放内容包括:
步骤S202,判断第一内容中的播放内容是否为可收集音视频信息;
判断第一内容中的播放内容是否为可以收集的音视频信息。
具体地,可以收集的音视频信息可以采集的是,通过在视频或者音频中添加水印标签,标签中含有这个视频的唯一识别码以及播放进度的时间戳的信息。
具体地,可以收集的音视频信息也可以采集的是,通过视频或者音频的指纹特征和预先收集的指纹特征数据库做比对,从而识别音视频内容。主要注意的是,针对指纹标签进行指纹识别时所需要的时间随着数据库中包含的内容增加而线性变长。通常来说,对于不超过100条的数据,识别时长也需要十几秒钟。
步骤S204,如果判断第一内容中的播放内容为可收集音视频信息,则确定第一视音频播放内容;
如果是满足上述指纹或者音频条件的播放内容可以作为可收集音视频信息。
需要注意的是,在对第一内容中的播放内容进行水印识别时,需要依赖预处理内容,同时水印识别高精同步为秒级同步,且普适性好。在对第一内容中的播放内容进行指纹识别时,依赖性需要收集所有可能节目指纹特征,同时指纹识别高精同步为至少十几秒,且普适性好。故,通常需要准确性内容识别判断时需要采用水印识别或音频识别。
根据所述第一识别请求对所述第一播放内容执行预设内容识别操作包括:
步骤S206,根据所述第一识别请求识别第一视音频播放内容中的水印标签或者指纹标签;
具体地,水印标签通常可以采用用编码生成器来实现,水印添加通过水印添加的算法来实现。通常水印添加要满足无损即对音视频的效果没有影响。
另外,水印添加不增加文件大小。比如如果显著增加文件大小,会影响根据原文件大小设计的传输系统的性能。对于需要转码的后台处理和传输系统来说还需要满足抗转码,即转码以后水印不会丢失。
优选地,如果是视频水印,移动设备通过摄像头识别视频中的水印标签;如果是声音水印,移动或是非移动设备通过麦克风收音识别视屏中的水印标签。此外,对比视频水印,音频水印不需要用户举着移动设备对准屏幕,因此具有更好的可用性和普适性。识别的时延由标签的长度决定,通常可以做到秒级延时。
音频水印添加的方式有两种。第一种是添加人耳感知的20Hz-20KHz范围之外的次声波或者超声波频段,如果需要将音频进行转码的场景,则可能添加的水印可能被删除。第二种是添加在20Hz-20KHz的频段范围内,不会在转码过程中丢失音频水印;但是需要避免对现有的声音效果产生任何影响。
作为本实施例中的优选,在本申请实施例中采用正交扩频编码的方式,扩散至宽频频段,降低水印的能量密度,大大增强抗窄频干扰能力。
具体地,在添加水印阶段包括:
S1.把音频文件进行实域到频域的转化;
S2.根据种子随机噪声(PN)序列生成PN序列;
S3.需要添加的比特序列和PN序列生成能代表比特序列的PN序列;
S4.在频域添加水印;
S5.将频域的音频文件转化回时域。
在解析水印阶段包括:
S6.将带水印的音频文件进行时域到频域的转化;
S7.使用同样的PN序列通过计算和比对相关值correlation values得到代表比特序列的PN序列并得到原始比特序列。
由于正交扩频编码的方式,对时域采用自适应编码,自动回避饱和或弱音时段的编码。对于饱和或弱音时段,时间戳编码系统会自动回避,并在其他时间段添加编码并增加时间偏移量。
优选地,采用冗余编码,提高容错性并实现抗噪声和编码失真。
优选地,采用层级式的多层编码方式,实现编码复用和大容量。
优选地,在S2和S3采用阶段式编码,提高查询效率,支持部分识别。
步骤S208,根据所述水印标签或者指纹标签确定播放内容以及播放进度。
通过在视频或者音频中添加水印标签,标签中含有这个视频的唯一识别码以及播放进度的时间戳的信息,从而通过水印标签或者指纹标签可以确定播放内容以及播放进度。
先判断播放内容是否为可以收集的音视频信息的,如果可以,再分成两个部分。第一部分检查是否有水印信息,则开始水印识别;第二部分进入指纹识别,如果当前识别请求的实时性要求能够被指纹识别满足,则开始指纹识别。
根据本申请实施例,作为本实施例中的优选,如图3所示,确定所述第一内容的第一播放内容包括:
步骤S302,判断第一内容中的播放内容是否为用户提供音视频信息;
用户提供音视频信息是指,观看或收听影音节目的观众主动通过移动设备提供的音视频内容。对于直播节目,应用可以大概判断出来所播放进度;对于非直播节目,应用只能知道用户所观看或收听的内容。
步骤S304,如果判断第一内容中的播放内容为用户提供音视频信息,则确定第一播放平台播放内容;
如果判断第一内容中的播放内容为用户提供音视频信息,可以确定出播放平台播放的内容。播放平台播放的内容可以是,用户所观看或者收听的节目内容,而通常可以采用移动设备直接的或者间接的获得播放平台的播放内容。比如,互联网视频网站、有点电视的机顶盒、智能电视、OTT盒子等等。
根据所述第一识别请求对所述第一播放内容执行预设内容识别操作包括:
步骤S306,根据所述第一识别请求识别第一播放平台播放内容中的播放内容以及播放进度。
根据不同的识别请求识别第一播放平台播放内容中的具体播放内容以及播放进度。可以识别通过播放平台收集的节目播放情况,例如电视台直播节目的情况。此外,如果和播放平台直接合作,可以获得用户点播节目的情况。通过第一播放平台中平台开发接口能够获得播放内容的播放进度。
根据本申请实施例,作为本实施例中的优选,如图4所示,确定所述第一内容的第一播放内容包括:
步骤S402,判断第一内容中的播放内容是否为用户习惯偏好音视频信息;
分析用户行为可以是根据用户的日常观看或者收听行为习惯,预测用户当前所观看或者收听的内容。
步骤S404,如果判断第一内容中的播放内容为用户习惯偏好音视频信息,则确定第一偏好播放内容;
如果判断第一内容中的播放内容为用户习惯偏好音视频信息,可以确定用户的偏好播放内容,比如,用户每周会在固定时间收看某档综艺直播;又比如,用户每天开车的上下班的时间会收听固定的电台。
根据所述第一识别请求对所述第一播放内容执行预设内容识别操作包括:
步骤S406,根据所述第一识别请求识别第一偏好播放内容中的播放内容。
根据所述第一识别请求识别,得到的播放内容识别结果主要用来做交叉检验。
比如,在实时性要求不高的场景下指纹识别和水印识别可以做交叉验证;当水印识别的结果和用户的常规行为有显著不同的时候,可以让水印识别再做一次识别做确认。
根据本申请实施例,作为本实施例中的优选,如图5所示,根据所述第一识别请求对所述第一播放内容执行预设内容识别操作包括:
步骤S502,根据第一识别请求判断识别要求;
步骤S504,根据所述识别要求配置执行预设内容识别操作;
所述识别要求至少包括:实时识别或精确识别,此外,可以对识别要求进行权重赋值。
实时识别通常采用水印识别或者播放平台播放内容中的播放内容。
精确识别通常采用水印识别和指纹识别以及结合播放平台播放内容中的播放内容。
比如,当水印识别的结果和用户的常规行为有显著不同的时候,可以让水印识别再做一次识别做确认。
又比如,如果平台播放节目的安排可能会临时改变或者指纹识别也有可能会出错,播放平台公布的播放数据和指纹识别有不同,则可以要求指纹识别再做一次识别等。
所述预设内容识别操作至少包括:交叉检验或纠错验证。
交叉检验是指根据所述第一识别请求识别第一偏好播放内容中的播放内容。
纠错验证是指根据所述第一识别请求识别第一视音频播放内容中的水印标签或者指纹标签。
在上述步骤中,根据识别请求的实时性、精确性等要求选择适当的识别方法并实现交叉验证、纠错以后输出识别结果,完成播放内容识别服务的功能。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述用于播放内容的识别方法的用于播放内容的识别装置,如图6所示,该装置包括:
接收模块10,用于接收第一内容的第一识别请求,其中,所述第一识别请求用于作为播放内容识别服务的服务请求;
本实施例的接收模块10中第一识别请求用于作为播放内容识别服务的服务请求,播放内容识别服务是指,通过该服务互联网设备能够识别所处的环境播放的音视频内容或是音视频指令信号。
当接收到第一内容的识别请求时,可以是在应用程序的前端或者应用程序的后端。
具体而言,播放内容识别服务是指识别内容并且可选地识别出播放进度的能力。具体的说,播放内容识别服务可以识别用户观看或者收听的是什么即观看内容;以及进一步地观众看或者听到了这个节目的哪里即观看进度。
确定模块20,用于确定所述第一内容的第一播放内容,其中,所述第一播放内容用于作为基于播放内容的服务内容;以及
本实施例的确定模块20中第一播放内容用于作为基于播放内容的服务内容,基于播放内容的服务内容是指,依赖于播放内容识别服务提供的识别能力实现各种应用。比如,可以是收看或者收听内容的信息推送;同时收看或者收听相同内容的观众的互动。
基于播放内容的服务需要基于识别播放内容以及播放进度给移动用户或者第三方提供增值服务,
在一些实施例中,所述第一内容的第一播放内容可以是,同时收看某一节目的所有观众参与的聊天室、弹幕。此时,聊天或者弹幕的进度和节目播放的进程一致。
在一些实施例中,所述第一内容的第一播放内容可以是,答题类节目中出现问题的时候,手机同步推出问题供观众在移动端回答并在选手回答之前关闭答题,选手回答之后在移动端显示正确答案。
在一些实施例中,所述第一内容的第一播放内容可以是,当节目出现某个内容的时候,移动端推送关于这个内容的更详细的内容以及行动链接(Call for Action),比如嘉宾信息,产品购买链接,投票,选择等。
在一些实施例中,所述第一内容的第一播放内容可以是,观看或者收听节目的时候,相关信息自动保存到移动端,起到记事的功能,事后查看。比如开车听广播,下车以后查询相关信息。
在一些实施例中,所述第一内容的第一播放内容可以是,广告牌周围推送该广告的行动链接给在广告牌附近的移动设备。
在一些实施例中,所述第一内容的第一播放内容可以是,商场发送周围商家打折信息、优惠券到商场上的移动设备。
在一些实施例中,所述第一内容的第一播放内容可以是,应用程序根据用户当前观看的内容,通过智能推荐算法推送相关性更强的内容,比如微博把用户当前观看或收听的内容作为一个推荐因素,在信息流里面推荐相关的信息。
在一些实施例中,所述第一内容的第一播放内容可以是,观看游戏直播的时候,小屏配合展现更多的选手的游戏信息。
在一些实施例中,所述第一内容的第一播放内容可以是,增对影视作品添加音频水印。
融合识别模块30,用于根据所述第一识别请求对所述第一播放内容执行预设内容识别操作。
本实施例的融合识别模块30中根据上述的播放内容识别服务的服务请求对基于播放内容的服务内容执行预设内容识别融合操作,由于不同的内容识别方法可适用于不同的场景,所以需要针对不同的识别请求执行预设内容识别操作。比如,同步答题需要使用水印识别或者和内容播放平台形成合作;又比如,一般性内容推送可以使用指纹识别等。
此外,另外一个方面,根据上述的播放内容识别服务的服务请求对基于播放内容的服务内容执行预设内容识别融合操作可以保证内容服务的有效性和普适性。比如,用户提供某个具体的节目,或者用户行为习惯的分析可以交叉验证水印识别和指纹识别的结果;又比如,指纹识别可以辅助水印识别先进行低精度的识别,从而降低指纹识别码的长度等。针对内容识别服务采用多种技术融合的方法,对于不同的应用场景,才能达到最优的识别效果。
根据本申请实施例,提供了一种用于播放内容的识别装置,如图7所示,所述确定模块20包括:第一判断单元201、第一确定单元202,所述融合识别模块30包括:第一识别单元301、第二确定单元302,
第一判断单元201,用于判断第一内容中的播放内容是否为可收集音视频信息;
本实施例的第一判断单元201中判断第一内容中的播放内容是否为可以收集的音视频信息。
具体地,可以收集的音视频信息可以采集的是,通过在视频或者音频中添加水印标签,标签中含有这个视频的唯一识别码以及播放进度的时间戳的信息。
具体地,可以收集的音视频信息也可以采集的是,通过视频或者音频的指纹特征和预先收集的指纹特征数据库做比对,从而识别音视频内容。主要注意的是,针对指纹标签进行指纹识别时所需要的时间随着数据库中包含的内容增加而线性变长。通常来说,对于不超过100条的数据,识别时长也需要十几秒钟。
第一确定单元202,用于判断第一内容中的播放内容为可收集音视频信息时,确定第一视音频播放内容;
本实施例的第一确定单元202中如果是满足上述指纹或者音频条件的播放内容可以作为可收集音视频信息。
需要注意的是,在对第一内容中的播放内容进行水印识别时,需要依赖预处理内容,同时水印识别高精同步为秒级同步,且普适性好。在对第一内容中的播放内容进行指纹识别时,依赖性需要收集所有可能节目指纹特征,同时指纹识别高精同步为至少十几秒,且普适性好。故,通常需要准确性内容识别判断时需要采用水印识别或音频识别。
第一识别单元301,用于根据所述第一识别请求识别第一视音频播放内容中的水印标签或者指纹标签;
本实施例的第一识别单元301中具体地,水印标签通常可以采用用编码生成器来实现,水印添加通过水印添加的算法来实现。通常水印添加要满足无损即对音视频的效果没有影响。
另外,水印添加不增加文件大小。比如如果显著增加文件大小,会影响根据原文件大小设计的传输系统的性能。对于需要转码的后台处理和传输系统来说还需要满足抗转码,即转码以后水印不会丢失。
优选地,如果是视频水印,移动设备通过摄像头识别视频中的水印标签;如果是声音水印,移动或是非移动设备通过麦克风收音识别视屏中的水印标签。此外,对比视频水印,音频水印不需要用户举着移动设备对准屏幕,因此具有更好的可用性和普适性。识别的时延由标签的长度决定,通常可以做到秒级延时。
音频水印添加的方式有两种。第一种是添加人耳感知的20Hz-20KHz范围之外的次声波或者超声波频段,如果需要将音频进行转码的场景,则可能添加的水印可能被删除。第二种是添加在20Hz-20KHz的频段范围内,不会在转码过程中丢失音频水印;但是需要避免对现有的声音效果产生任何影响。
作为本实施例中的优选,在本申请实施例中采用正交扩频编码的方式,扩散至宽频频段,降低水印的能量密度,大大增强抗窄频干扰能力。
具体地,在添加水印阶段包括:
S1.把音频文件进行实域到频域的转化;
S2.根据种子随机噪声(PN)序列生成PN序列;
S3.需要添加的比特序列和PN序列生成能代表比特序列的PN序列;
S4.在频域添加水印;
S5.将频域的音频文件转化回时域。
在解析水印阶段包括:
S6.将带水印的音频文件进行时域到频域的转化;
S7.使用同样的PN序列通过计算和比对相关值correlation values得到代表比特序列的PN序列并得到原始比特序列。
由于正交扩频编码的方式,对时域采用自适应编码,自动回避饱和或弱音时段的编码。对于饱和或弱音时段,时间戳编码系统会自动回避,并在其他时间段添加编码并增加时间偏移量。
优选地,采用冗余编码,提高容错性并实现抗噪声和编码失真。
优选地,采用层级式的多层编码方式,实现编码复用和大容量。
优选地,在S2和S3采用阶段式编码,提高查询效率,支持部分识别。
第二确定单元302,用于根据所述水印标签或者指纹标签确定播放内容以及播放进度。
本实施例的第二确定单元302中通过在视频或者音频中添加水印标签,标签中含有这个视频的唯一识别码以及播放进度的时间戳的信息,从而通过水印标签或者指纹标签可以确定播放内容以及播放进度。
先判断播放内容是否为可以收集的音视频信息的,如果可以,再分成两个部分。第一部分检查是否有水印信息,则开始水印识别;第二部分进入指纹识别,如果当前识别请求的实时性要求能够被指纹识别满足,则开始指纹识别。
根据本申请实施例,提供了一种用于播放内容的识别装置,如图8所示,所述确定模块20包括:第二确定单元203、第二确定单元204、第三确定单元205,所述融合识别模块30包括:第二识别单元303,
第二判断单元203,用于判断第一内容中的播放内容是否为用户习惯偏好音视频信息;
本实施例的第二判断单元203中用户提供音视频信息是指,观看或收听影音节目的观众主动通过移动设备提供的音视频内容。对于直播节目,应用可以大概判断出来所播放进度;对于非直播节目,应用只能知道用户所观看或收听的内容。
第三确定单元204,用于判断第一内容中的播放内容为用户习惯偏好音视频信息时,则确定第一偏好播放内容;
本实施例的第三确定单元204中如果判断第一内容中的播放内容为用户提供音视频信息,可以确定出播放平台播放的内容。播放平台播放的内容可以是,用户所观看或者收听的节目内容,而通常可以采用移动设备直接的或者间接的获得播放平台的播放内容。比如,互联网视频网站、有点电视的机顶盒、智能电视、OTT盒子等等。
第二识别单元303,用于根据所述第一识别请求识别第一偏好播放内容中的播放内容。
本实施例的第二识别单元303中根据不同的识别请求识别第一播放平台播放内容中的具体播放内容以及播放进度。可以识别通过播放平台收集的节目播放情况,例如电视台直播节目的情况。此外,如果和播放平台直接合作,可以获得用户点播节目的情况。通过第一播放平台中平台开发接口能够获得播放内容的播放进度。
根据本申请实施例,提供了一种用于播放内容的识别装置,如图9所示,所述确定模块20包括:第四确定单元205、第三判断单元206,所述融合识别模块30包括:第五确定单元304、第三识别单元305,
第四确定单元205,用于确定所述第一内容的第一播放内容包括:
本实施例的第四确定单元205中分析用户行为可以是根据用户的日常观看或者收听行为习惯,预测用户当前所观看或者收听的内容。
第三判断单元206,用于判断第一内容中的播放内容是否为用户习惯偏好音视频信息;
本实施例的第三判断单元206中如果判断第一内容中的播放内容为用户习惯偏好音视频信息,可以确定用户的偏好播放内容,比如,用户每周会在固定时间收看某档综艺直播;又比如,用户每天开车的上下班的时间会收听固定的电台。
第五确定单元304,用于判断第一内容中的播放内容为用户习惯偏好音视频信息时,则确定第一偏好播放内容;
本实施例的第五确定单元304中根据所述第一识别请求识别,得到的播放内容识别结果主要用来做交叉检验。
比如,在实时性要求不高的场景下指纹识别和水印识别可以做交叉验证;当水印识别的结果和用户的常规行为有显著不同的时候,可以让水印识别再做一次识别做确认。
第三识别单元305,用于根据所述第一识别请求识别第一偏好播放内容中的播放内容。
根据本申请实施例,提供了一种用于播放内容的识别装置,如图10所示,所述融合识别模块30包括:
识别要求判断单元306,用于根据第一识别请求判断识别要求;
配置融合单元307,用于根据所述识别要求配置执行预设内容识别操作;其中,所述识别要求至少包括:实时识别或精确识别,所述预设内容识别操作至少包括:交叉检验或纠错验证。
本实施例的第三识别单元305、识别要求判断单元306以及配置融合单元307中所述识别要求至少包括:实时识别或精确识别,此外,可以对识别要求进行权重赋值。
实时识别通常采用水印识别或者播放平台播放内容中的播放内容。
精确识别通常采用水印识别和指纹识别以及结合播放平台播放内容中的播放内容。
比如,当水印识别的结果和用户的常规行为有显著不同的时候,可以让水印识别再做一次识别做确认。
又比如,如果平台播放节目的安排可能会临时改变或者指纹识别也有可能会出错,播放平台公布的播放数据和指纹识别有不同,则可以要求指纹识别再做一次识别等。
所述预设内容识别操作至少包括:交叉检验或纠错验证。
交叉检验是指根据所述第一识别请求识别第一偏好播放内容中的播放内容。
纠错验证是指根据所述第一识别请求识别第一视音频播放内容中的水印标签或者指纹标签。
在上述步骤中,根据识别请求的实时性、精确性等要求选择适当的识别方法并实现交叉验证、纠错以后输出识别结果,完成播放内容识别服务的功能。
如表1
|
依赖性 |
高精同步 |
普适性 |
水印识别 |
需要预处理内容 |
秒级同步 |
好 |
指纹识别 |
需要收集所有可能节目指纹特征 |
至少十几秒 |
好 |
播放平台提供 |
需要平台开发接口 |
秒级同步 |
不好 |
用户提供 |
用户提供 |
无法精准同步 |
好 |
分析用户行为习惯 |
用户行为数据 |
无法精准同步 |
好 |
由表1可知这几种实现内容识别的方法适用于不同的场景。比如,同步答题需要使用水印识别或者和平台形成合作,一般性内容推送可以使用指纹识别等。另外一个方面,这些方法的融合技术可以保证内容服务的有效性和普适性。比如用户提供某个具体的节目,或者用户行为习惯的分析可以交叉验证水印识别和指纹识别的结果;指纹识别可以辅助水印识别先进行低精度的识别,从而降低指纹识别码的长度等。因此,内容识别服务采用多种技术融合的方法,对于不同的应用场景,均能达到最优的识别效果。
请参考图11,具体的来说,当一个识别请求过来的时候,三种识别方法同时运作。第一个先检查是否可以收集的音视频信息的,如果可以,在分成两个部分。第一部分检查是否有水印信息,则开始水印识别;第二部分进入指纹识别,如果当前识别请求的实时性要求能够被指纹识别满足,则开始指纹识别。第二个直接进入用户行为习惯分析预测引擎,这个识别结果主要用来做交叉检验。第三个查看用户是否主动提供当前收看或者收听的信息,如果有进入播放平台数据收集引擎,该引擎收集播放平台的节目播放情况,例如电视台直播节目的情况。值得注意的是如果和播放平台直接合作,可以获得用户点播节目的情况。最后不同识别方法得到的结果进入融合识别模块,融合识别模块根据识别请求的实时性、精确性等要求选择适当的识别方法并实现交叉验证、纠错以后输出识别结果,完成基于播放内容识别的功能。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。