CN104023251B - 基于视频的互动方法和系统 - Google Patents

基于视频的互动方法和系统 Download PDF

Info

Publication number
CN104023251B
CN104023251B CN201410265948.XA CN201410265948A CN104023251B CN 104023251 B CN104023251 B CN 104023251B CN 201410265948 A CN201410265948 A CN 201410265948A CN 104023251 B CN104023251 B CN 104023251B
Authority
CN
China
Prior art keywords
medium data
service display
interactive
service
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410265948.XA
Other languages
English (en)
Other versions
CN104023251A (zh
Inventor
刘海龙
谢达东
侯杰
陈波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410265948.XA priority Critical patent/CN104023251B/zh
Publication of CN104023251A publication Critical patent/CN104023251A/zh
Priority to PCT/CN2015/071772 priority patent/WO2015188630A1/en
Priority to EP15805846.1A priority patent/EP3155816B1/en
Priority to JP2016536124A priority patent/JP6479804B2/ja
Application granted granted Critical
Publication of CN104023251B publication Critical patent/CN104023251B/zh
Priority to US15/190,026 priority patent/US10028013B2/en
Priority to US16/007,680 priority patent/US10349124B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/237Communication with additional data server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/611Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for multicast or broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4782Web browsing, e.g. WebTV
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8352Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明提供了一种基于视频的互动方法和系统。所述方法包括:侦听终端中触发的互动命令,根据所述互动命令获取与视频相关的多媒体数据;将所述多媒体数据发送至服务端,以使所述服务端由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;接收所述服务端根据所述业务展示标识下发的互动页面,并通过显示所述互动页面向用户展示与所述业务展示标识相关的互动内容。所述系统包括数据获取模块、发送模块和互动展示模块。采用本发明能随着业务展示内容的出现即时地进行互动,避免了业务展示内容的播出存在着互动滞后的局限性。

Description

基于视频的互动方法和系统
技术领域
本发明涉及计算机应用技术,特别是涉及一种基于视频的互动方法和系统。
背景技术
视频播放已经成为人们生活中必不可少的组成部分,电视观众通过电视观看其播出的各种节目,此外,人们也可通过各种视频网站观看其播放的视频。例如,电视观众通过观看电视中播出的广告来对广告所介绍的商品或服务发生兴趣,进而通过观看广告时记住的一些关键字在搜索引擎中进行搜索,以从搜索结果中得到更多相关的信息;在对视频网站中视频植入的广告感兴趣时,也将通过观看所得到的一些关键字在搜索引擎中进行搜索,以获取更多的信息。
然而,这一事后搜索的方式实际上是相对滞后的,严重影响了转化效果,也无法随着业务展示内容,例如广告的出现即时地进行互动,使得广告的播出存在着互动滞后的局限性。
发明内容
基于此,有必要提供一种能随着业务展示内容的出现即时地进行互动,避免了业务展示内容的播出存在着互动滞后的局限性的基于视频的互动方法。
此外,还有必要提供一种能随着业务展示内容的出现即时地进行互动,避免了业务展示内容的播出存在着互动滞后的局限性的基于视频的互动系统。
一种基于视频的互动方法,包括如下步骤:
侦听终端中触发的互动命令,根据所述互动命令获取与视频相关的多媒体数据;
将所述多媒体数据发送至服务端,以使所述服务端由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
接收所述服务端根据所述业务展示标识下发的互动页面,并通过显示所述互动页面向用户展示与所述业务展示标识相关的互动内容。
一种基于视频的互动方法,包括:
接收由终端根据触发的互动命令获取的与视频相关的多媒体数据;
由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
根据所述业务展示标识向所述终端下发互动页面,以通过所述终端对所述互动页面的显示向用户展示与所述业务展示标识相关的互动内容。
一种基于视频的互动系统,包括:
画面获取模块,用于侦听终端中触发的互动命令,根据所述互动命令获取与视频相关的多媒体数据;
发送模块,用于将所述多媒体数据发送至服务端,以使所述服务端由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
互动展示模块,用于接收所述服务端根据所述业务展示标识下发的互动页面,并通过显示所述互动页面向用户展示与所述业务展示标识相关的互动内容。
一种基于视频的互动系统,包括:
接收模块,用于接收由终端根据触发的互动命令获取的与视频相关的多媒体数据;
业务识别模块,用于由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
页面下发模块,用于根据所述业务展示标识向所述终端下发互动页面,以通过所述终端对所述互动页面的显示向用户展示与所述业务展示标识相关的互动内容。
上述基于视频的互动方法和系统,在侦听得到终端设备中触发的互动命令时,将根据互动命令获取多媒体数据,并发送至服务器中,以使得服务器由多媒体数据识别得到用户当前通过视频观看的业务展示标识,以通过服务器得到业务展示标识所对应的互动页面,并通过互动页面向用户展示相关的互动内容,随着业务展示内容的出现即时地实现了互动,避免了业务展示内容的播出存在着互动滞后的局限性。
附图说明
图1为一个实施例中运行基于视频的互动方法的系统架构图;
图2为一个实施例中基于视频的互动方法的流程图;
图3为图2中侦听终端中触发的互动命令,根据互动命令获取与视频相关的多媒体数据的方法流程图;
图4为一个实施例中通过服务端识别终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识,并根据业务展示标识下发对应的互动页面的方法流程图;
图5为一个实施例中截取业务植入目标中业务展示内容所对应的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识的方法流程图;
图6为一个实施例中基于视频的互动方法的应用示意图;
图7为一个实施例中基于视频的互动系统的结构示意图;
图8为图7中数据获取模块的结构示意图;
图9为另一个实施例中基于视频的互动系统的结构示意图;
图10图9中识别模块的结构示意图;
图11为另一个实施例中基于视频的互动系统的结构示意图;
图12为图11中标记模块的结构示意图;
图13为再一个实施例中基于视频的互动系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,一种基于视频的互动方法,该方法所运行的系统架构如图1所示,该系统架构包括终端50和服务端70,并在电视转播卫星10和视频播放终端30的配合下实现电视观众与业务展示内容的实时互动。
其中,视频播放终端30可为各种进行视频播放的播放器或者电视机等;终端50可为各种智能移动终端、智能电视或者机顶盒提供的智能遥控器等;服务端70与终端50进行交互。
本实施例中,如图2所示,该方法包括如下步骤:
步骤210,侦听终端中触发的互动命令,根据互动命令获取与视频相关的多媒体数据。
本实施例中,互动命令是随着用户对视频播放终端中播出的业务展示内容触发的,在侦听得到终端中触发的互动命令之后,将根据触发的互动命令获取用户当前所观看的与视频相关的多媒体数据。例如,用户可随着视频网站中播出的业务展示内容或者电视中播出的业务展示内容触发互动命令。
其中,所获取的多媒体数据可以是业务展示内容所对应的音频指纹、音频文件或视频画面图像,其具体类型将根据具体实现过程中的需要进行设定。
步骤230,将多媒体数据发送至服务端,以使服务端由多媒体数据识别用户当前进行视频观看所对应的业务展示标识。
本实施例中,终端获取得到多媒体数据之后,将发送至后台的服务器端,以在服务端的作用下识别用户当前通过视频观看的业务展示内容,例如广告所对应的业务展示标识。
其中,每一业务展示内容都唯一对应了一业务展示标识,因此,可通过业务展示标识对业务展示内容进行标记。
步骤250,接收服务端根据业务展示标识下发的互动页面,并通过显示互动页面向用户展示与业务展示标识相关的互动内容。
本实施例中,服务端在识别得到用户当前进行视频观看所对应的业务展示标识之后,将根据业务展示标识读取相应的互动页面,并下发该互动页面,以使得终端或者电视等视频播放终端得以对互动页面进行显示,进而通过互动页面中展示的互动内容引导用户实现业务展示内容所对应的互动。
其中,互动页面中的互动内容将是预先进行设置的,例如,该互动内容可以是汽车广告中的汽车试驾资格申请、饮料广告中的饮料免费抽奖等,这些互动内容将以互动页面的形式预先进行存储,进而根据服务端所识别的业务展示标识实现互动页面的读取和下发。
进一步的,根据具体实现过程的不同,互动页面将被显示于终端或者电视中。
触发互动命令的终端为智能移动终端,例如,智能手机、平板电脑等,则互动页面将被显示于智能移动终端的屏幕中。
触发互动命令的终端为智能电视或者机顶盒提供的智能遥控器,则互动页面将被显示于智能电视的屏幕中。
通过如上所述的基于视频的互动过程,由于并不依赖于特定的设备,因此可根据实际情况进行设置,大为提高了实现的通用性。
如图3所示,在一个实施例中,与视频相关的多媒体数据为音频指纹,上述步骤210包括:
步骤211,侦听得到用户根据当前播出的业务展示内容触发的互动命令。
本实施例中,将侦听终端中触发的各种命令以得到用户针对当前播出的业务展示内容触发的互动命令。
步骤213,通过互动命令触发终端录音,以进行音频流的采集。
本实施例中,通过互动命令触发终端对视频发出的声音进行录音,以得到用户当前观看的业务展示内容所对应的音频流。在优选的实施例中,将以8kHz进行音频流的采样,并以16比特进行量化得到视频当前所对应的音频流。
步骤215,从采集得到的音频流中提取音频指纹。
本实施例中,音频指纹是指可以代表一段音频流重要声学特征的基于内容的紧致数字签名。音频指纹具备了区分性、鲁棒性、粒度、易计算性和数据紧致性,其中,区分性是指不同音频流之间的音频指纹具有较大差异,而同一音频流的原始记录和各失真记录的音频指纹之间差异很小;鲁棒性是指音频流在经受各种音频格式变换、信道噪声干扰之后仍然能够通过音频指纹识别出来;粒度是指即使音频流的长度很短(如5s至10s)也能够通过音频指纹顺利识别;易计算性是指在计算资源受限的终端快速实时的进行音频指纹提取;数据紧致性是指音频指纹通过无线网络传输所需要的数据流量小,可适应于不同的网络环境。
进一步的,从采集得到的音频流中提取音频指纹的具体过程为:
(1)对采集得到的音频流进行时域分帧处理得到多帧音频信号。
具体的,将以窗函数作为分帧的参数,对采集得到的音频流进行时间分帧处理,形成多帧音频。其中,窗函数可以为海明窗函数、汉宁窗函数、高斯窗函数等。
其中,所采用的海明窗w(n)为:
w ( n ) = 0.54 - 0.46 cos ( 2 nπ N - 1 ) , 0 ≤ n ≤ N - 1
(2)对每一帧音频信号进行短时傅立叶变换(Short-Time Fourier Transform,简称STFT)得到每一帧音频信号的频率谱。
具体的,对每一帧音频信号进行短时傅立叶变换所得到的频域表示,即频率谱X(m)为:
X ( m ) = Σ n = 0 N - 1 w ( n ) x ( n ) e - j 2 πmn N
其中,j为窗函数所对应的参数,N为傅立叶变换的点数,可取值为1024。
(3)提取每一帧音频信号的频率谱对应的幅度谱,根据每一帧音频信号的时间、频率谱和幅度谱绘制音频流的二维时频图。
具体的,可按照每一帧音频信号的时间顺序依次绘制每一帧音频信号的频率谱和幅度谱,以形成音频流的二维时频图S(t,f)。
S(t,f)=|X(t,f)|
(4)按照时间取模的方式对音频流的二维时频图进行拆分,得到预设数量的时频子图,预设数量的时频子图中一个时频子图将对应音频流中的一个相位通道。
具体的,预设数量的值可根据实际情况进行设定,本实施例中将采用M表示预设数量,其中,M为正整数。
将得到的音频流的二维时频图按照时间t对M取模的方式进行拆分,生成M个相位通道的时频子图Sk(t,f),其中,k=1,2,……,M。
(5)提取预设数量的相位通道中每个相位通道的至少一个峰值特征点,每个相位通道的至少一个峰值特征点构成每个相位通道的峰值特征点序列。
具体的,M个相位通道中,一个相位通道对应一个时频子图。其中,每个相位通道中峰值特征点的提取过程可以包括:a)每个相位通道对应的时频子图中计算每个特征点的能量值;b)根据每个特征点的能量值,选取一定矩形邻域内能量极大的特征点作为峰值特征点。根据上述a)和b),可提取每个相位通道的至少一个峰值特征点。其中,矩形邻域的尺寸参数可根据实际需要进行设定。
M个相位通道中,每个相位通道可提取至少一个峰值特征点,对该至少一个峰值特征点进行排序即可构成每个相位通道的峰值特征点序列。
在一个实施例中,可先按照时间从先至后的顺序,对该至少一个峰值特征点进行排序,针对相同时间点出现的峰值特征点,再按照频率从高至低的顺序对该至少一个峰值特征点进行排序,进而提取得到M个峰值特征点序列。
(6)对每个相位通道的峰值特征点序列中的每个峰值特征点进行配对,形成每个相位通道的峰值特征点对序列。
具体的,定义Sn(tk,fk)表示任一个相位通道的峰值特征点序列中的任一个峰值特征点。其中,n表示相位通道的序号或时频子图的序号,且0<n≤M;k表示该峰值特征点在峰值特征点序列中的序号,k为正整数;tk表示时频子图n中出现该峰值特征点的时间;fk表示该峰值特征点的频率。
对每个相位通道的峰值特征点序列中的每个峰值特征点进行配对的过程为:a)每个相位通道对应的时频子图中,以每个相位通道的峰值特征点序列中的每个每峰值特征点作锚点选取矩形目标区域,针对任一时频子图中的任一个峰值特征点Sn(tk,fk),矩形目标区域满足如下条件:
tstart≤tk≤tend且fstart≤fk≤fend
其中,tstart表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的起始时间,tend表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的结束时间;fstart表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的最小频率,fend表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的最大频率。
b)在矩形目标区域中选取除锚点之外的一个峰值特征点与锚点配对,锚点及与该锚点配对的峰值特征点将构成峰值特征点对。与锚点配对的峰值特征点的选取原则可以包括:选取出现时间与锚点的出现时间的时间差最小的峰值特征点;或者,选取除锚点之外的能量值最大的峰值特征点。
通过上述a)和b),针对任一峰值特征点Sn(tk,fk)均可获得一个配对的峰值特征点Sn(tb,fb)。其中,n表示相位通道的序号或时频子图的序号,且0<n≤M;b表示该配对的峰值特征点在峰值特征点序列n中的序号,b为正整数;tb表示时频子图n中出现该配对的峰值特征点的时间;fb表示该配对的峰值特征点的频率。
将定义四元组(tk,fk,Δfk,Δtk)n表示任一相位通道的峰值特征点对序列中的任一峰值特征点对,其中,n表示相位通道的序号或时频子图的序号;Δtk表示峰值特征点对中的两个峰值特征点之间的时间差,Δtk=tb-tk;Δfk表示峰值特征点对中的两个峰值特征点之间的频率差,Δfk=fb-fk
(7)对每个相位通道的峰值特征点对序列进行哈希计算,得到每个相位通道对应的指纹序列,预设数量的相位通道对应的指纹序列的集合便构成了采集得到的音频流的音频指纹。
具体的,该四元组的参数可作如下理解:(fk,Δfk,Δtk)代表峰值特征点对的特征部分,tk代表出现(fk,Δfk,Δtk)的时间。
对(fk,Δfk,Δtk)进行哈希计算,将(fk,Δfk,Δtk)采用固定比特倍数的哈希编码进行表示,具体为:hashcodek=H(fk,Δfk,Δtk)。经过这一哈希计算,任一个相位通道的峰值特征点对序列中的任一对峰值特征点对均可表示为(tk,hashcodek)n,n球相位通道的序号或时频子图的序号,tk代表出现hashcodek的时间;该(tk,hashcodek)n为一个指纹项,可表示一对峰值特征点对。
在一个实施例中,上述步骤250之前,如上所述的方法还包括:
通过服务端识别终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识,并根据业务展示标识下发对应的互动页面。
本实施例中,服务端接收到由终端发送的多媒体数据之后,将根据多媒体数据进行查询,与预先存储的多媒体数据进行比对,以识别终端发送的多媒体数据所属的节目流时间线,进而根据触发互动的时间点在节目流时间线上落入的时间区间得到终端发送的多媒体数据对应的业务展示标识,由此业务展示标识读取对应的互动页面,并下发。
其中,识别得到的终端发送的多媒体数据所属的节目流时间线可以是视频网站中视频所对应的节目流时间线,该节目流时间线将记录了播放的视频段以及植入视频中的业务展示内容;也可以是电视播放中各种节目以及业务展示内容所对应的节目流时间线。
如图4所示,在一个实施例中,上述通过服务端识别终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识,并根据业务展示标识下发对应的互动页面的步骤包括:
步骤401,通过服务端接收多媒体数据,根据多媒体数据得到用户当前通过进行业务展示内容观看的业务植入目标和触发互动的时间点。
本实施例中,业务植入目标将包括了各种视频网站中播放的视频和各种电视频道,也就是说,由于业务展示内容可在各种视频网站所提供的视频中播出,也可由各电视频频道播出,因此,无论是视频还是各电视频道都可作为业务展示内容的业务植入目标。由服务端接收终端发送的多媒体数据,将终端发送的多媒体数据与预先存储的多媒体数据进行比对,以得到与终端发送的多媒体数据相匹配的预先存储的多媒体数据和触发互动的时间点。
由于预先存储的多媒体数据对应了所属业务展示内容所播出的业务植入目标,即视频或电视频道,因此,根据与终端发送的多媒体数据相匹配的预先存储的多媒体数据即可得到用户当前通过观看业务展示内容所属的业务植入目标和触发互动的时间点,例如,用户当前通过电视观看的电视频道即为与终端发送的多媒体数据相匹配的预先存储的多媒体数据所属业务展示内容播出的电视频道。
具体的,服务端所接收的多媒体数据可为音频指纹,预先存储的多媒体数据也为音频指纹的形式,则根据音频指纹与预先存储的音频指纹进行比对的过程为:
(1)在预先存储的每个音频指纹中提取与服务端接收的音频指纹具有相同哈希编码hashcode的峰值特征点,以得到预先存储的每一个音频指纹与服务端接收的音频指纹之间具有相同哈希编码的时间戳对。
具体的,定义服务端接收的音频指纹为预先存储的任一音频指纹为其中,τ和t为时间戳,h为哈希编码hashcode。提取FP1和FP2中具有相同哈希编码的时间戳对(t,τ),以得到若干个时间戳对。
(2)统计所有时间戳对之间的时间差,并绘制该时间差所对应的直方图。
具体的,对每一时间戳对计算时间差Δt=t-τ。
(3)计算直方图中的最大峰高,并将计算得到的最大峰高作为两个音频指纹匹配的分值。
(4)判断两个音频指纹匹配的分值是否大于设定阈值,若为是,则判定这两个音频指纹相互匹配,并计算得到触发互动的时间点,若为否,则判定这两个音频指纹不相匹配。
具体的,若两个音频指纹匹配的分值大于设定阈值,则根据线性相关性,其所对应的直方图上将存在着明显峰值,若两个音频指纹不相匹配,则所对应的直方图上将不存在明显峰值。
在两个音频指纹成功匹配的情况下,直方图最大峰高对应的时间差即为匹配的时间偏移量,根据该时间偏移量计算触发互动的时间点。
步骤403,在业务植入目标对应的节目流时间线中根据时间点进行定位,以得到该时间点在节目流时间线中对应的时间区间以及时间区间标记的业务展示标识。
本实施例中,获取用户当前通过观看的电视频道或视频所对应的节目流时间线,每一电视频道或视频的节目流时间线包括了若干个时间区域,其中,每一时间区域都标记了相应的业务展示标识,每一时间区域都是与该电视频道或视频中播出的业务展示内容相对应的。
由此可知,根据触发互动的时间点在节目流时间线中进行定位,得到触发互动的时间点所落入的时间区间,进而由此时间区间得到标记的业务展示标识。
步骤405,根据业务展示标识读取相应的互动页面,并下发互动页面。
本实施例中,每一业务展示内容均预先设置了相应的互动内容,并以互动页面的形式与业务展示标识关联存储,因此,将根据业务展示标识读取相应的互动页面,其中,该互动页面所对应的互动内容将是与用户当前观看的业务展示内容相关的。
服务端将读取得到的互动页面下发至终端或者该终端所关联的电视中,通过终端或者电视对显示互动页面,以引导用户按照展示的互动内容进行业务展示内容的互动。
基于如上所述的过程,使得用户即便在通过视频网站进行业务展示内容的观看也能够实现与之相关的各种互动,大为提高了业务展示内容中互动的实时性。
在另一个实施例中,上述步骤250之前,如上所述的方法还包括:
截取业务植入目标中的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识。
本实施例中,为识别终端发送的多媒体数据所对应的业务展示标识,将截取业务植入目标中业务展示内容所对应的多媒体数据,并由该业务植入目标的节目流时间线定位与该业务展示内容的截取时间相符的时间区间,在定位得到的时间区间中标记业务展示标识,所截取得到的多媒体数据将被预先进行存储,并与相应的业务植入目标相关联。
通过如上所述的步骤,将对每一业务植入目标所播出的业务展示内容进行节目流时间线中对应业务展示标识的标记,以方便快速识别由终端发送的多媒体数据所对应的业务展示标识,有效提高了识别效率。
如图5所示,在一个实施例中,上述截取业务植入目标中业务展示内容所对应的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识的步骤包括:
步骤501,按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取。
本实施例中,截取的多媒体数据可为音频指纹,对于电视所播放的多媒体数据而言,将采用数字卫星接收机装置接收由电视转播卫星发射的各路电视信号,由电视信号分离得到音频流,并按照预设间隔的频率不断提取音频流中的音频指纹,其中,音频指纹的提取过程如上述步骤215所述。
步骤503,将截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到截取的多媒体数据对应的业务展示标识。
本实施例中,预先构建的多媒体索引库中存储了若干多媒体数据,并且每一多媒体数据均与一业务展示内容相对应,唯一对应了一个业务展示标识,所存储的若干多媒体数据均是由相应的业务展示内容提供者事先提供的。
例如,业务展示内容为电视广告,则预先构建的多媒体索引库中存储的若干多媒体数据都将与电视广告相对应,即投放电视广告的广告商提供。对于存储的每一多媒体数据,都将是预先提取电视广告的音频流对应的音频指纹,并将提取得到的音频指纹与业务展示标识关联存储于多媒体索引库中。
将截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对得到比对结果,该比对结果将记录了与截取的多媒体数据相一致的多媒体索引库中存储的多媒体数据,进而得到对应的业务展示标识。
步骤505,在业务植入目标对应的节目流时间线中按照多媒体数据的截取时间将对应时间区间标记为业务展示标识。
本实施例中,截取多媒体数据的业务植入目标所对应的节目流时间线中,按照多媒体数据的截取时间进行时间区间的标记,以方便后续对终端发送的多媒体数据所属业务展示标识的识别。
下面结合一个具体的实施例来详细阐述如上所述的基于视频的互动方法。该实施例中,将以音频指纹为例进行阐述,其中,业务展示内容为广告。
用户通过电视观看电视节目时,若观看到较为感兴趣的广告即可通过智能移动终端触发互动命令,此时,智能移动终端将执行步骤601,根据互动命令触发录音,以进行音频流的采集,并执行步骤602,从采集的音频流中提取音频指纹,将音频指纹上传至服务端。
服务端设置了电视音频指纹数据库603,该电视音频指纹数据库603将用于预先存储各大电视频道中播出的广告所对应的音频指纹。
服务端执行步骤604,将智能移动终端上传的音频指纹与电视音频指纹数据库603中预先存储的音频指纹进行比对,以得到电视音频指纹数据库603中与智能移动终端上传的音频指纹相匹配的音频指纹,进而根据这一音频指纹所对应的电视频道得到用户当前所观看的电视频道和触发互动的时间点。
由用户当前所观看的电视频道获取相应的节目流时间线,并根据触发互动的时间点在节目流时间线中进行定位,以得到触发互动的时间点所落入的时间区间,该时间区间所标记的业务展示标识,即广告标识,该广告标识是与用户当前观看,且感兴趣的广告相对应的。
服务端根据得到的广告标识在广告互动内容数据库606中查找,以读取与广告标识对应的互动页面,并执行步骤607,将互动页面下发至用户所使用的智能移动终端,通过智能移动终端执行步骤608以在智能移动终端的屏幕中进行互动内容的显示,进而引导用户参与广告的互动。
在此之前,还将为各电视频道中播出的广告进行标记。对于各广告提供商提供的广告音频,将执行步骤609进行音频指纹的提取,以将提取得到的音频指纹存储于多媒体索引库,即广告音频指纹数据库610,其中,该音频指纹将是与广告标识关联存储的。
后台的服务端将按照预设间隔对各电视频道中播出的广告进行音频流的截取,如步骤611,并执行步骤612由采集的音频流中提取音频指纹,以将提取的音频指纹和所属电视频道关联存储于电视音频指纹数据库603中。
执行步骤613,对各电视频道播出的广告所提取的音频指纹还将与广告音频指纹数据库610中存储的音频指纹进行比对,以得到这一提取的音频指纹所对应的广告标识,并在节目流时间线中与截取时间相对应的时间区间进行广告标识的标记。
通过如上所述的系统流程准确识别用户正在观看的广告,从而在“第二屏”的智能移动终端上为广告提供实时、内容丰富的互动,引导用户在智能移动终端上完成互动。
另外,还提供了一种基于视频的互动方法,该方法运行于服务端,其包括:
接收由终端根据触发的互动命令获取的与视频相关的多媒体数据;
由多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
根据业务展示标识向终端下发互动页面,以通过终端对互动页面的显示向用户展示与所述业务展示标识相关的互动内容。
具体的,由多媒体数据识别用户当前进行视频观看所对应的业务展示标识的步骤包括:
识别终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识。具体的,识别所述终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识的步骤包括:
根据多媒体数据得到用户当前进行业务展示内容观看所属的业务植入目标和触发互动的时间点;
在业务植入目标对应的节目流时间线中根据时间点进行定位,以得到时间点在节目流时间线中对应的时间区间以及时间区间标记的业务展示标识。
具体的,由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识的步骤之前,该方法还包括:
截取业务植入目标中业务展示内容所对应的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识。
具体的,截取业务植入目标中业务展示内容所对应的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识的步骤包括:
按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取;
将截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到截取的多媒体数据对应的业务展示标识;
在业务植入目标对应的节目流时间线中按照多媒体数据的截取时间将对应时间区间标记为业务展示标识。
如图7所示,在一个实施例中,一种基于视频的互动系统,包括数据获取模块710、发送模块730和互动展示模块750。
数据获取模块710,用于侦听终端中触发的互动命令,根据互动命令获取与视频相关的多媒体数据。
本实施例中,互动命令是随着用户对视频播放终端中播出的业务展示内容触发的,在侦听得到终端中触发的互动命令之后,数据获取模块710将根据触发的互动命令获取用户当前所观看的与视频相关的多媒体数据。例如,用户可随着视频网站中播出的业务展示内容或者电视中播出的业务展示内容触发互动命令。
其中,数据获取模块710所获取的多媒体数据息可以是业务展示内容所对应的音频指纹、音频文件或视频画面图像,其具体类型将根据具体实现过程中的需要进行设定。
发送模块730,用于将多媒体数据发送至服务端,以使服务端由多媒体数据识别用户当前进行视频观看所对应的业务展示标识。
本实施例中,获取得到多媒体数据之后,发送模块730将发送至后台的服务器端,以在服务端的作用下识别用户当前通过视频观看的业务展示内容,例如广告所对应的业务展示标识。
其中,每一业务展示内容都唯一对应了一业务展示标识,因此,可通过业务展示标识对业务展示内容进行标记。
互动展示模块750,用于接收服务端根据业务展示标识下发的互动页面,并通过显示互动页面向用户展示与业务展示标识相关的互动内容。
本实施例中,服务端在识别得到用户当前进行视频观看所对应的业务展示标识之后,将根据业务展示标识读取相应的互动页面,并下发该互动页面,以使得终端或者电视等视频播放终端中的互动展示模块750得以对互动页面进行显示,进而通过互动页面中展示的互动内容引导用户实现业务展示内容所对应的互动。
其中,互动页面中的互动内容将是预先进行设置的,例如,该互动内容可以是汽车广告中的汽车试驾资格申请、饮料广告中的饮料免费抽奖等,这些互动内容将以互动页面的形式预先进行存储,进而根据服务端所识别的业务展示标识实现互动页面的读取和下发。
进一步的,根据具体实现过程的不同,互动页面将被显示于终端或者电视中。
触发互动命令的终端为智能移动终端,例如,智能手机、平板电脑等,则互动页面将被显示于智能移动终端的屏幕中。
触发互动命令的终端为智能电视或者机顶盒提供的智能遥控器,则互动页面将被显示于智能电视的屏幕中。
通过如上所述的基于视频的互动过程,由于并不依赖于特定的设备,因此可根据实际情况进行设置,大为提高了实现的通用性。
如图8所示,在一个实施例中,上述与视频相关的多媒体数据为音频指纹,如上所述的数据获取模块710包括侦听单元711、采集单元713和指纹提取单元715。
侦听单元711,用于侦听得到用户根据当前播出的业务展示内容触发的互动命令。
本实施例中,侦听单元711将侦听终端中触发的各种命令以得到用户针对当前播出的业务展示内容触发的互动命令。
采集单元713,用于通过互动命令触发终端录音,以进行音频流采集。
本实施例中,采集单元713通过互动命令触发终端对视频发出的声音进行录音,以得到用户当前观看的业务展示内容所对应的音频流。在优选的实施例中,将以8kHz进行音频流的采样,并以16比特进行量化得到视频当前所对应的音频流。
指纹提取单元715,用于从采集得到的音频流中提取音频指纹。
本实施例中,音频指纹是指可以代表一段音频流重要声学特征的基于内容的紧致数字签名。音频指纹具备了区分性、鲁棒性、粒度、易计算性和数据紧致性,其中,区分性是指不同音频流之间的音频指纹具有较大差异,而同一音频流的原始记录和各失真记录的音频指纹之间差异很小;鲁棒性是指音频流在经受各种音频格式变换、信道噪声干扰之后仍然能够通过音频指纹识别出来;粒度是指即使音频流的长度很短(如5s至10s)也能够通过音频指纹顺利识别;易计算性是指在计算资源受限的终端快速实时的进行音频指纹提取;数据紧致性是指音频指纹通过无线网络传输所需要的数据流量小,可适应于不同的网络环境。
进一步的,指纹提取单元715从采集得到的音频流中提取音频指纹的具体过程为:
(1)对采集得到的音频流进行时域分帧处理得到多帧音频信号。
具体的,将以窗函数作为分帧的参数,对采集得到的音频流进行时间分帧处理,形成多帧音频。其中,窗函数可以为海明窗函数、汉宁窗函数、高斯窗函数等。
其中,所采用的海明窗w(n)为:
w ( n ) = 0.54 - 0.46 cos ( 2 nπ N - 1 ) , 0 ≤ n ≤ N - 1
(2)对每一帧音频信号进行短时傅立叶变换(Short-Time Fourier Transform,简称STFT)得到每一帧音频信号的频率谱。
具体的,对每一帧音频信号进行短时傅立叶变换所得到的频域表示,即频率谱X(m)为:
X ( m ) = Σ n = 0 N - 1 w ( n ) x ( n ) e - j 2 πmn N
其中,j为窗函数所对应的参数,N为傅立叶变换的点数,可取值为1024。
(3)提取每一帧音频信号的频率谱对应的幅度谱,根据每一帧音频信号的时间、频率谱和幅度谱绘制音频流的二维时频图。
具体的,可按照每一帧音频信号的时间顺序依次绘制每一帧音频信号的频率谱和幅度谱,以形成音频流的二维时频图S(t,f)。
S(t,f)=|X(t,f)|
(4)按照时间取模的方式对音频流的二维时频图进行拆分,得到预设数量的时频子图,预设数量的时频子图中一个时频子图将对应音频流中的一个相位通道。
具体的,预设数量的值可根据实际情况进行设定,本实施例中将采用M表示预设数量,其中,M为正整数。
将得到的音频流的二维时频图按照时间t对M取模的方式进行拆分,生成M个相位通道的时频子图Sk(t,f),其中,k=1,2,……,M。
(5)提取预设数量的相位通道中每个相位通道的至少一个峰值特征点,每个相位通道的至少一个峰值特征点构成每个相位通道的峰值特征点序列。
具体的,M个相位通道中,一个相位通道对应一个时频子图。其中,每个相位通道中峰值特征点的提取过程可以包括:a)每个相位通道对应的时频子图中计算每个特征点的能量值;b)根据每个特征点的能量值,选取一定矩形邻域内能量极大的特征点作为峰值特征点。根据上述a)和b),可提取每个相位通道的至少一个峰值特征点。其中,矩形邻域的尺寸参数可根据实际需要进行设定。
M个相位通道中,每个相位通道可提取至少一个峰值特征点,对该至少一个峰值特征点进行排序即可构成每个相位通道的峰值特征点序列。
在一个实施例中,可先按照时间从先至后的顺序,对该至少一个峰值特征点进行排序,针对相同时间点出现的峰值特征点,再按照频率从高至低的顺序对该至少一个峰值特征点进行排序,进而提取得到M个峰值特征点序列。
(6)对每个相位通道的峰值特征点序列中的每个峰值特征点进行配对,形成每个相位通道的峰值特征点对序列。
具体的,定义Sn(tk,fk)表示任一个相位通道的峰值特征点序列中的任一个峰值特征点。其中,n表示相位通道的序号或时频子图的序号,且0<n≤M;k表示该峰值特征点在峰值特征点序列中的序号,k为正整数;tk表示时频子图n中出现该峰值特征点的时间;fk表示该峰值特征点的频率。
对每个相位通道的峰值特征点序列中的每个峰值特征点进行配对的过程为:a)每个相位通道对应的时频子图中,以每个相位通道的峰值特征点序列中的每个每峰值特征点作锚点选取矩形目标区域,针对任一时频子图中的任一个峰值特征点Sn(tk,fk),矩形目标区域满足如下条件:
tstart≤tk≤tend且fstart≤fk≤fend
其中,tstart表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的起始时间,tend表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的结束时间;fstart表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的最小频率,fend表示以峰值特征点Sn(tk,fk)作为锚点选取的矩形目标区域的最大频率。
b)在矩形目标区域中选取除锚点之外的一个峰值特征点与锚点配对,锚点及与该锚点配对的峰值特征点将构成峰值特征点对。与锚点配对的峰值特征点的选取原则可以包括:选取出现时间与锚点的出现时间的时间差最小的峰值特征点;或者,选取除锚点之外的能量值最大的峰值特征点。
通过上述a)和b),针对任一峰值特征点Sn(tk,fk)均可获得一个配对的峰值特征点Sn(tb,fb)。其中,n表示相位通道的序号或时频子图的序号,且0<n≤M;b表示该配对的峰值特征点在峰值特征点序列n中的序号,b为正整数;tb表示时频子图n中出现该配对的峰值特征点的时间;fb表示该配对的峰值特征点的频率。
将定义四元组(tk,fk,Δfk,Δtk)n表示任一相位通道的峰值特征点对序列中的任一峰值特征点对,其中,n表示相位通道的序号或时频子图的序号;Δtk表示峰值特征点对中的两个峰值特征点之间的时间差,Δtk=tb-tk;Δfk表示峰值特征点对中的两个峰值特征点之间的频率差,Δfk=fb-fk
(7)对每个相位通道的峰值特征点对序列进行哈希计算,得到每个相位通道对应的指纹序列,预设数量的相位通道对应的指纹序列的集合便构成了采集得到的音频流的音频指纹。
具体的,该四元组的参数可作如下理解:(fk,Δfk,Δtk)代表峰值特征点对的特征部分,tk代表出现(fk,Δfk,Δtk)的时间。
对(fk,Δfk,Δtk)进行哈希计算,将(fk,Δfk,Δtk)采用固定比特倍数的哈希编码进行表示,具体为:hashcodek=H(fk,Δfk,Δtk)。经过这一哈希计算,任一个相位通道的峰值特征点对序列中的任一对峰值特征点对均可表示为(tk,hashcodek)n,n球相位通道的序号或时频子图的序号,tk代表出现hashcodek的时间;该(tk,hashcodek)n为一个指纹项,可表示一对峰值特征点对。
如图9所示,在一个实施例中,如上所述的系统还包括了运行于服务端中的识别模块910。
识别模块910用于识别终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识,并根据业务展示标识下发对应的互动页面。
本实施例中,服务端中的识别模块910接收到由终端发送的多媒体数据之后,将根据多媒体数据进行查询,与预先存储的多媒体数据进行比对,以识别终端发送的多媒体数据所属的节目流时间线,进而根据触发互动的时间点在节目流时间线上落入的时间区间得到终端发送的多媒体数据对应的业务展示标识,由此业务展示标识读取对应的互动页面,并下发。
其中,识别得到的终端发送的多媒体数据所属的节目流时间线可以是视频网站中视频所对应的节目流时间线,该节目流时间线将记录了播放的视频段以及植入视频中的业务展示内容;也可以是电视播放中各种节目以及业务展示内容所对应的节目流时间线。
如图10所示,在一个实施例中,上述识别模块910包括接收处理单元911、时间线定位单元913和页面下发单元915。
接收处理单元911,用于接收多媒体数据,根据多媒体数据得到用户当前进行业务展示内容观看的业务植入目标和触发互动的时间点。
本实施例中,业务植入目标将包括了各种视频网站中播放的视频和各种电视频道,也就是说,由于业务展示内容可在各种视频网站所提供的视频中播出,也可由各电视频频道播出,因此,无论是视频还是各电视频道都可作为业务展示内容的业务植入目标。由接收处理单元911接收终端发送的多媒体数据,将终端发送的多媒体数据与预先存储的多媒体数据进行比对,以得到与终端发送的多媒体数据相匹配的预先存储的多媒体数据和触发互动的时间点。
由于预先存储的多媒体数据对应了所属业务展示内容所播出的业务植入目标,即视频或电视频道,因此,接收处理单元911根据与终端发送的多媒体数据相匹配的预先存储的多媒体数据即可得到用户当前通过观看业务展示内容所属的业务植入目标和触发互动的时间点,例如,用户当前通过电视观看的电视频道即为与终端发送的多媒体数据相匹配的预先存储的多媒体数据所属业务展示内容播出的电视频道。
具体的,服务端中接收处理单元911所接收的多媒体数据为音频指纹,预先存储的多媒体数据也为音频指纹的形式,则接收处理单元911根据音频指纹与预先存储的音频指纹进行比对的过程为:
(1)在预先存储的每个音频指纹中提取与服务端接收的音频指纹具有相同哈希编码hashcode的峰值特征点,以得到预先存储的每一个音频指纹与服务端接收的音频指纹之间具有相同哈希编码的时间戳对。
具体的,定义服务端接收的音频指纹为预先存储的任一音频指纹为其中,τ和t为时间戳,h为哈希编码hashcode。提取FP1和FP2中具有相同哈希编码的时间戳对(t,τ),以得到若干个时间戳对。
(2)统计所有时间戳对之间的时间差,并绘制该时间差所对应的直方图。
具体的,对每一时间戳对计算时间差Δt=t-τ。
(3)计算直方图中的最大峰高,并将计算得到的最大峰高作为两个音频指纹匹配的分值。
(4)判断两个音频指纹匹配的分值是否大于设定阈值,若为是,则判定这两个音频指纹相互匹配,并计算得到触发互动的时间点,若为否,则判定这两个音频指纹不相匹配。
具体的,若两个音频指纹匹配的分值大于设定阈值,则根据线性相关性,其所对应的直方图上将存在着明显峰值,若两个音频指纹不相匹配,则所对应的直方图上将不存在明显峰值。
在两个音频指纹成功匹配的情况下,直方图最大峰高对应的时间差即为匹配的时间偏移量,根据该时间偏移量计算触发互动的时间点。
时间线定位单元913,用于在业务植入目标对应的节目流时间线中根据时间点进行定位,以得到时间点在节目流时间线中对应的时间区间以及该时间区间标记的业务展示标识。
本实施例中,时间线定位单元913获取用户当前通过观看的电视频道或视频所对应的节目流时间线,每一电视频道或视频的节目流时间线包括了若干个时间区域,其中,每一时间区域都标记了相应的业务展示标识,每一时间区域都是与该电视频道或视频中播出的业务展示内容相对应的。
由此可知,时间线定位单元913根据触发互动的时间点在节目流时间线中进行定位,得到触发互动的时间点所落入的时间区间,进而由此时间区间得到标记的业务展示标识。
页面下发单元915,用于根据业务展示标识读取相应的互动页面,并下发互动页面。
本实施例中,每一业务展示内容均预先设置了相应的互动内容,并以互动页面的形式与业务展示标识关联存储,因此,页面下发单元915将根据业务展示标识读取相应的互动页面,其中,该互动页面所对应的互动内容将是与用户当前观看的业务展示内容相关的。
服务端中的页面下发单元915将读取得到的互动页面下发至终端或者该终端所关联的电视中,通过终端或者电视对显示互动页面,以引导用户按照展示的互动内容进行业务展示内容的互动。
基于如上所述的过程,使得用户即便在通过视频网站进行业务展示内容的观看也能够实现与之相关的各种互动,大为提高了业务展示内容中互动的实时性。
如图11所示,在一个实施例中,上述系统还包括运行于服务端中的标记模块1110。
标记模块1110,用于截取业务植入目标中业务展示内容所对应的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识。
本实施例中,为识别终端发送的多媒体数据所对应的业务展示标识,标记模块1110将截取业务植入目标中业务展示内容所对应的多媒体数据息,并由该业务植入目标的节目流时间线定位与该业务展示内容的截取时间相符的时间区间,在定位得到的时间区间中标记业务展示标识,所截取得到的多媒体数据将被预先进行存储,并与相应的业务植入目标相关联。
通过如上所述过程,将对每一业务植入目标所播出的业务展示内容进行节目流时间线中对应业务展示标识的标记,以方便快速识别由终端发送的多媒体数据所对应的业务展示标识,有效提高了识别效率。
如图12所示,在一个实施例中,上述标记模块1110包括截取单元1111、比对单元1113和区间标记单元1115。
截取单元1111,用于按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取。
本实施例中,多媒体数据可为音频指纹,对于电视所播放的多媒体数据而言,截取单元1111将采用数字卫星接收机装置接收由电视转播卫星发射的各路电视信号,由电视信号分离得到音频流,并按照预设间隔的频率不断提取音频流中的音频指纹。
比对单元1113,用于将截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到截取的多媒体数据对应的业务展示标识。
本实施例中,预先构建的多媒体索引库中存储了若干多媒体数据,并且每一多媒体数据均与一业务展示内容相对应,唯一对应了一个业务展示标识,所存储的若干多媒体数据均是由相应的业务展示内容提供者事先提供的。
例如,业务展示内容为电视广告,则预先构建的多媒体索引库中存储的若干多媒体数据都将与电视广告相对应,即投放电视广告的广告商提供。对于存储的每一多媒体数据,都将是预先提取电视广告的音频流对应的音频指纹,并将提取得到的音频指纹与业务展示标识关联存储于多媒体索引库中。
比对单元1113将截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对得到比对结果,该比对结果将记录了与截取的多媒体数据相一致的多媒体索引库中存储的多媒体数据,进而得到对应的业务展示标识。
区间标记单元1115,用于在业务植入目标对应的节目流时间线中按照多媒体数据的截取时间将对应时间区间标记为业务展示标识。
本实施例中,截取多媒体数据的业务植入目标所对应的节目流时间线中,区间标记单元1115按照多媒体数据的截取时间进行时间区间的标记,以方便后续对终端发送的多媒体数据所属业务展示标识的识别。
此外,如图13所示,还提供了一种基于视频的互动系统,该系统运行于服务端,包括接收模块1310、业务识别模块1330和页面下发模块1350。
接收模块1310,用于接收由终端根据触发的互动命令获取的与视频相关的多媒体数据。
业务识别模块1330,用于由多媒体数据识别用户当前进行视频观看所对应的业务展示标识。
页面下发模块1350,用于根据业务展示标识向终端下发互动页面,以通过终端对互动页面的显示向用户展示与业务展示标识相关的互动内容。
具体的,业务识别模块1330进一步用于识别终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由节目流时间线得到对应的业务展示标识。
具体的,上述业务识别模块1330包括了接收处理单元和时间线定位单元。
其中,接收处理单元,用于根据多媒体数据得到用户当前进行业务展示内容观看所属的业务植入目标和触发互动的时间点;
时间线定位单元,用于在业务植入目标对应的节目流时间线中根据时间点进行定位,以得到时间点在节目流时间线中对应的时间区间以及时间区间标记的业务展示标识。
另外,如上所述的系统还包括了标记模块。该标记模块用于截取业务植入目标中业务展示内容所对应的多媒体数据,根据多媒体数据在业务植入目标的节目流时间线中对应时间区间标记多媒体数据对应的业务展示标识。
具体的,标记模块包括截取单元、对比单元和区间标记单元。
截取单元,用于按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取;
比对单元,用于将截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到截取的多媒体数据对应的业务展示标识;
区间标记单元,用于在业务植入目标对应的节目流时间线中按照多媒体数据的截取时间将对应时间区间标记为业务展示标识。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述程序可存储于一计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (4)

1.一种基于视频的互动方法,包括如下步骤:
通过服务端按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取;将所述截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到所述截取的多媒体数据对应的业务展示标识;在所述业务植入目标对应的节目流时间线中按照所述多媒体数据的截取时间将对应时间区间标记为所述业务展示标识;
侦听终端中触发的互动命令,根据所述互动命令获取与视频相关的多媒体数据,其中所述多媒体数据为音频指纹,该步骤包括以下步骤:侦听得到用户根据当前播出的业务展示内容触发的互动命令,通过所述互动命令触发终端录音,以进行音频流采集,从所述采集得到的音频流中提取音频指纹;
将所述多媒体数据发送至服务端,以使所述服务端由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
通过所述服务端接收所述多媒体数据,根据所述多媒体数据得到用户当前进行业务展示内容观看所属的业务植入目标和触发互动的时间点;在所述业务植入目标对应的节目流时间线中根据所述时间点进行定位,以得到所述时间点在所述节目流时间线中对应的时间区间以及所述时间区间标记的业务展示标识;根据所述业务展示标识读取相应的互动页面,并下发所述互动页面;
接收所述服务端根据所述业务展示标识下发的互动页面,并通过显示所述互动页面向用户展示与所述业务展示标识相关的互动内容。
2.一种基于视频的互动方法,包括:
按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取;
将所述截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到所述截取的多媒体数据对应的业务展示标识;
在所述业务植入目标对应的节目流时间线中按照所述多媒体数据的截取时间将对应时间区间标记为所述业务展示标识;
接收由终端根据触发的互动命令获取的与视频相关的多媒体数据;
由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识,包括:根据所述多媒体数据得到用户当前进行业务展示内容观看所属的业务植入目标和触发互动的时间点,在所述业务植入目标对应的节目流时间线中根据所述时间点进行定位,以得到所述时间点在所述节目流时间线中对应的时间区间以及所述时间区间标记的业务展示标识;
根据所述业务展示标识向所述终端下发互动页面,以通过所述终端对所述互动页面的显示向用户展示与所述业务展示标识相关的互动内容。
3.一种基于视频的互动系统,其特征在于,包括:
运行于服务端中的标记模块,用于截取业务植入目标中业务展示内容所对应的多媒体数据,根据所述多媒体数据在所述业务植入目标的节目流时间线中对应时间区间标记所述多媒体数据对应的业务展示标识;所述标记模块包括:截取单元,用于按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取;比对单元,用于将所述截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到所述截取的多媒体数据对应的业务展示标识;区间标记单元,用于在所述业务植入目标对应的节目流时间线中按照所述多媒体数据的截取时间将对应时间区间标记为所述业务展示标识;
数据获取模块,用于侦听终端中触发的互动命令,根据所述互动命令获取与视频相关的多媒体数据;所述与视频相关的多媒体数据为音频指纹,所述数据获取模块包括:侦听单元,用于侦听得到用户根据当前播出的业务展示内容触发的互动命令;采集单元,用于通过所述互动命令触发终端录音,以进行音频流采集;指纹提取单元,用于从所述采集得到的音频流中提取音频指纹;
发送模块,用于将所述多媒体数据发送至服务端,以使所述服务端由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;
运行于所述服务端中的识别模块;所述识别模块用于识别所述终端获取的多媒体数据所属的节目流时间线和触发互动的时间点,根据触发互动的时间点由所述节目流时间线得到对应的业务展示标识,并根据所述业务展示标识下发对应的互动页面;所述识别模块包括:接收处理单元,用于接收所述多媒体数据,根据所述多媒体数据得到用户当前进行业务展示内容观看所属的业务植入目标和触发互动的时间点;时间线定位单元,用于在所述业务植入目标对应的节目流时间线中根据所述时间点进行定位,以得到所述时间点在所述节目流时间线中对应的时间区间以及所述时间区间标记的业务展示标识;页面下发单元,用于根据所述业务展示标识读取相应的互动页面,并下发所述互动页面;
互动展示模块,用于接收所述服务端根据所述业务展示标识下发的互动页面,并通过显示所述互动页面向用户展示与所述业务展示标识相关的互动内容。
4.一种基于视频的互动系统,其特征在于,包括:
标记模块,用于截取业务植入目标中业务展示内容所对应的多媒体数据,根据所述多媒体数据在所述业务植入目标的节目流时间线中对应时间区间标记所述多媒体数据对应的业务展示标识;所述标记模块包括:截取单元,用于按照预设间隔对业务植入目标中播出的业务展示内容进行多媒体数据的截取;比对单元,用于将所述截取的多媒体数据与预先构建的多媒体索引库中存储的多媒体数据进行比对,以根据比对结果得到所述截取的多媒体数据对应的业务展示标识;区间标记单元,用于在所述业务植入目标对应的节目流时间线中按照所述多媒体数据的截取时间将对应时间区间标记为所述业务展示标识;
接收模块,用于接收由终端根据触发的互动命令获取的与视频相关的多媒体数据;
业务识别模块,用于由所述多媒体数据识别用户当前进行视频观看所对应的业务展示标识;所述业务识别模块包括:接收处理单元,用于根据所述多媒体数据得到用户当前进行业务展示内容观看所属的业务植入目标和触发互动的时间点;时间线定位单元,用于在所述业务植入目标对应的节目流时间线中根据所述时间点进行定位,以得到所述时间点在所述节目流时间线中对应的时间区间以及所述时间区间标记的业务展示标识;
页面下发模块,用于根据所述业务展示标识向所述终端下发互动页面,以通过所述终端对所述互动页面的显示向用户展示与所述业务展示标识相关的互动内容。
CN201410265948.XA 2014-06-13 2014-06-13 基于视频的互动方法和系统 Active CN104023251B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201410265948.XA CN104023251B (zh) 2014-06-13 2014-06-13 基于视频的互动方法和系统
PCT/CN2015/071772 WO2015188630A1 (en) 2014-06-13 2015-01-28 Method and system for interacting with audience of multimedia content
EP15805846.1A EP3155816B1 (en) 2014-06-13 2015-01-28 Method and system for interacting with audience of multimedia content
JP2016536124A JP6479804B2 (ja) 2014-06-13 2015-01-28 マルチメディアコンテンツの視聴者と対話するための方法およびシステム
US15/190,026 US10028013B2 (en) 2014-06-13 2016-06-22 Method and system for interacting with audience of multimedia content
US16/007,680 US10349124B2 (en) 2014-06-13 2018-06-13 Method and system for interacting with audience of multimedia content

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410265948.XA CN104023251B (zh) 2014-06-13 2014-06-13 基于视频的互动方法和系统

Publications (2)

Publication Number Publication Date
CN104023251A CN104023251A (zh) 2014-09-03
CN104023251B true CN104023251B (zh) 2015-08-19

Family

ID=51439789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410265948.XA Active CN104023251B (zh) 2014-06-13 2014-06-13 基于视频的互动方法和系统

Country Status (5)

Country Link
US (2) US10028013B2 (zh)
EP (1) EP3155816B1 (zh)
JP (1) JP6479804B2 (zh)
CN (1) CN104023251B (zh)
WO (1) WO2015188630A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104159159B (zh) * 2014-05-30 2015-10-07 腾讯科技(深圳)有限公司 基于视频的交互方法、终端、服务器及系统
CN104023251B (zh) 2014-06-13 2015-08-19 腾讯科技(深圳)有限公司 基于视频的互动方法和系统
CN104618816A (zh) * 2015-02-26 2015-05-13 北京奇艺世纪科技有限公司 一种跨屏互动方法、装置及系统
CN104991936B (zh) * 2015-07-03 2018-04-13 广州市动景计算机科技有限公司 一种目标信息获取、推送方法及装置
CN105142018A (zh) * 2015-08-12 2015-12-09 深圳Tcl数字技术有限公司 基于音频指纹的节目识别方法及装置
US9848235B1 (en) * 2016-02-22 2017-12-19 Sorenson Media, Inc Video fingerprinting based on fourier transform of histogram
CN106101795A (zh) * 2016-06-27 2016-11-09 乐视控股(北京)有限公司 一种广告转移方法及装置
US11303951B2 (en) * 2016-10-27 2022-04-12 Evixar Inc. Content reproduction program and content reproduction device
US10306333B2 (en) * 2017-09-13 2019-05-28 The Nielsen Company (Us), Llc Flagging advertisement frames for automatic content recognition
CN107731220B (zh) * 2017-10-18 2019-01-22 北京达佳互联信息技术有限公司 音频识别方法、装置和服务器
CN107750015B (zh) * 2017-11-02 2019-05-07 腾讯科技(深圳)有限公司 视频版权的检测方法、装置、存储介质及设备
US10931390B2 (en) 2018-08-03 2021-02-23 Gracenote, Inc. Vehicle-based media system with audio ad and visual content synchronization feature
US11409980B2 (en) * 2018-12-19 2022-08-09 Acoustic Arc International Limited Audio-effect-activated scent generation method and system
US11166077B2 (en) 2018-12-20 2021-11-02 Rovi Guides, Inc. Systems and methods for displaying subjects of a video portion of content
CN111787418B (zh) * 2020-06-23 2023-09-22 深圳市思友科技有限公司 基于人工智能ai的音视频流的对接处理方法及相关设备
CN112104913B (zh) * 2020-09-11 2023-09-26 腾讯科技(深圳)有限公司 连麦切换方法、装置、计算机设备及存储介质
US11711579B1 (en) * 2021-01-25 2023-07-25 Amazon Technologies, Inc. Navigation integrated content stream
US20230136608A1 (en) * 2021-10-28 2023-05-04 Capped Out Media System and methods for advertisement enhancement
US11895362B2 (en) * 2021-10-29 2024-02-06 Manufacturing Resources International, Inc. Proof of play for images displayed at electronic displays
CN115119041B (zh) * 2022-06-17 2024-07-12 深圳创维-Rgb电子有限公司 跨屏播放的控制方法、装置、设备及计算机存储介质

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2972547B2 (ja) * 1995-05-08 1999-11-08 エス. ウエインブラット リー ラジオ聴取者またはテレビジョン視聴者のサーベイをするための装置および方法
JPH11353325A (ja) * 1998-06-10 1999-12-24 Hitachi Ltd 映像と関連情報の同期表示システム
JP2000224257A (ja) * 1999-01-29 2000-08-11 Jisedai Joho Hoso System Kenkyusho:Kk 送信装置および受信装置
JP4683733B2 (ja) * 2001-01-18 2011-05-18 ヤフー株式会社 番組関連情報提供システムおよび方法、この番組関連情報提供システムから情報提供を受けることが可能な情報通信端末、コンピュータをそのような情報通信端末として機能させるためのプログラム、並びに、このプログラムを記録したコンピュータ読取可能な記録媒体
JP3768823B2 (ja) * 2001-03-01 2006-04-19 日本電信電話株式会社 番組関連情報テーブル構成方法及びシステム
JP2003018575A (ja) * 2001-07-03 2003-01-17 Matsushita Electric Ind Co Ltd テレビ受像器、情報獲得システム、及び情報獲得方法
WO2005011294A1 (ja) * 2003-07-28 2005-02-03 Nec Corporation 視聴調査システム
JP4299714B2 (ja) * 2004-03-31 2009-07-22 株式会社電通 情報提供システム、制御装置、情報提供制御方法及び情報提供制御プログラム
US20070016918A1 (en) * 2005-05-20 2007-01-18 Alcorn Allan E Detecting and tracking advertisements
JP2009182369A (ja) * 2006-05-17 2009-08-13 Panasonic Corp テレビ番組録画再生装置、テレビ番組録画再生方法、及びテレビ番組録画再生装置を動作させるプログラム
US20090037947A1 (en) * 2007-07-30 2009-02-05 Yahoo! Inc. Textual and visual interactive advertisements in videos
US20110069937A1 (en) * 2009-09-18 2011-03-24 Laura Toerner Apparatus, system and method for identifying advertisements from a broadcast source and providing functionality relating to the same
CN102741842A (zh) * 2009-12-04 2012-10-17 Tivo有限公司 多功能多媒体设备
US8627379B2 (en) * 2010-01-07 2014-01-07 Amazon Technologies, Inc. Offering items identified in a media stream
US9264785B2 (en) * 2010-04-01 2016-02-16 Sony Computer Entertainment Inc. Media fingerprinting for content determination and retrieval
US9185458B2 (en) 2010-04-02 2015-11-10 Yahoo! Inc. Signal-driven interactive television
US8694533B2 (en) * 2010-05-19 2014-04-08 Google Inc. Presenting mobile content based on programming context
US8863165B2 (en) * 2010-11-01 2014-10-14 Gracenote, Inc. Method and system for presenting additional content at a media system
CN102572515A (zh) * 2010-12-16 2012-07-11 康佳集团股份有限公司 网络电视节目互动系统及方法
US20120240151A1 (en) * 2011-03-16 2012-09-20 Seth Daniel Tapper Synchronizing Interactive Digital Advertisements displayed on client devices with television commercials
JP2012227631A (ja) * 2011-04-18 2012-11-15 Yamaha Corp 情報提供システムおよび携帯端末装置
JP5948773B2 (ja) * 2011-09-22 2016-07-06 ソニー株式会社 受信装置、受信方法、プログラム、及び情報処理システム
CN103096128B (zh) * 2011-11-07 2016-07-06 中国移动通信集团公司 一种实现视频互动的方法、服务器、终端及系统
US8949872B2 (en) * 2011-12-20 2015-02-03 Yahoo! Inc. Audio fingerprint for content identification
JP5420023B2 (ja) * 2012-06-08 2014-02-19 株式会社Tbsテレビ 映像関連情報送信システム及び方法、これらに用いられる関連情報送信装置
EP2875478A4 (en) * 2012-07-20 2016-01-06 Visible World Inc SYSTEMS, METHODS, AND COMPUTER-READABLE MEDIA FOR DETERMINING RESULTS FOR PROGRAM PROMOTIONS
US9883247B2 (en) * 2012-08-13 2018-01-30 Saturn Licensing Llc Reception apparatus, reception method, transmission apparatus, and transmission method
CN102868922B (zh) * 2012-09-11 2016-08-10 Tcl通力电子(惠州)有限公司 一种播放广告的方法及系统
US9788055B2 (en) 2012-09-19 2017-10-10 Google Inc. Identification and presentation of internet-accessible content associated with currently playing television programs
US9460204B2 (en) * 2012-10-19 2016-10-04 Sony Corporation Apparatus and method for scene change detection-based trigger for audio fingerprinting analysis
US20140136596A1 (en) * 2012-11-09 2014-05-15 Yahoo! Inc. Method and system for capturing audio of a video to display supplemental content associated with the video
US9247309B2 (en) * 2013-03-14 2016-01-26 Google Inc. Methods, systems, and media for presenting mobile content corresponding to media content
CN103475943A (zh) * 2013-09-11 2013-12-25 马清虎 一种电视节目的互动方法和系统
CN103501464A (zh) * 2013-09-24 2014-01-08 深圳市同洲电子股份有限公司 一种推送广告的方法、终端、服务器以及系统
US9456237B2 (en) * 2013-12-31 2016-09-27 Google Inc. Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
CN103763586B (zh) * 2014-01-16 2017-05-10 北京酷云互动科技有限公司 电视节目互动方法、装置和服务器
CN104023251B (zh) * 2014-06-13 2015-08-19 腾讯科技(深圳)有限公司 基于视频的互动方法和系统

Also Published As

Publication number Publication date
EP3155816A4 (en) 2017-05-31
JP6479804B2 (ja) 2019-03-06
WO2015188630A1 (en) 2015-12-17
JP2017511004A (ja) 2017-04-13
US20160301972A1 (en) 2016-10-13
EP3155816A1 (en) 2017-04-19
US10349124B2 (en) 2019-07-09
US20180295412A1 (en) 2018-10-11
US10028013B2 (en) 2018-07-17
CN104023251A (zh) 2014-09-03
EP3155816B1 (en) 2021-07-21

Similar Documents

Publication Publication Date Title
CN104023251B (zh) 基于视频的互动方法和系统
CN104023247B (zh) 获取、推送信息的方法和装置以及信息交互系统
US11368765B2 (en) Systems, methods, and apparatus to identify linear and non-linear media presentations
US11910046B2 (en) Methods and apparatus to verify and/or correct media lineup information
CN100531362C (zh) 标识和分割嵌入在流中的重复媒体对象的方法
CN100409236C (zh) 流式视频书签
CN104429091B (zh) 用于识别媒体的方法和装置
US9451048B2 (en) Methods and systems for identifying information of a broadcast station and information of broadcasted content
CN102625982B (zh) 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品
CN102799605B (zh) 一种广告监播方法和系统
CN112204658B (zh) 基于跨不同音频流和/或不同水印技术的水印识别媒介的方法和装置
US20120191231A1 (en) Methods and Systems for Identifying Content in Data Stream by a Client Device
CN103797482A (zh) 进行接收到的数据的比较并基于比较提供后续服务的方法和系统
CN1820511A (zh) 用于生成并探测多媒体信号中起到触发标记作用的指纹的方法和设备
US10129575B1 (en) Methods and systems for determining a latency between a source and an alternative feed of the source
US20160119672A1 (en) Methods and apparatus to identify media using image recognition
WO2019073420A1 (en) SYSTEMS AND METHODS FOR PERFORMING READING OF MULTIPLE MULTIMEDIA RECORDINGS BASED ON A SEGMENT CORRECTED THROUGH RECORDINGS
CN103945234A (zh) 一种提供视频相关信息的方法与设备
CN103942275A (zh) 一种视频识别方法与设备
CA2827514A1 (en) Methods and systems for identifying content in a data stream by a client device
CN105635841A (zh) 互动播出的控制方法和系统
KR101155465B1 (ko) 방송의 광고를 모니터링하는 방송 광고 모니터링 시스템 및 방송 광고 모니터링 방법
US20230119783A1 (en) Methods and apparatus to monitor a split screen media presentation
CN104202628B (zh) 客户端播放节目的识别系统和方法
CN104349183B (zh) 通过伴音通道实现的采集媒体收视效果反馈的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200826

Address after: 518000 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Co-patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518000 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right