CN106331744A - 一种基于音频水印的视频交互方法 - Google Patents
一种基于音频水印的视频交互方法 Download PDFInfo
- Publication number
- CN106331744A CN106331744A CN201510388788.2A CN201510388788A CN106331744A CN 106331744 A CN106331744 A CN 106331744A CN 201510388788 A CN201510388788 A CN 201510388788A CN 106331744 A CN106331744 A CN 106331744A
- Authority
- CN
- China
- Prior art keywords
- watermark
- video
- content
- section
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 24
- 230000003993 interaction Effects 0.000 claims description 16
- 210000001367 artery Anatomy 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 claims description 2
- 238000003786 synthesis reaction Methods 0.000 claims description 2
- 210000003462 vein Anatomy 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23412—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2347—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving video stream encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4405—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video stream decryption
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明提供了一种基于音频水印的视频交互方法,所述方法包括:步骤1)对每个视频内容进行处理,将该视频内容的每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;然后生成带音频水印信息的视频内容,存入内容管理中心;步骤2)播放所述内容管理中心的带有音频水印信息的视频内容,检测并获取其音频数据中的水印编码值;步骤3)将获取到的水印编码值发送到所述水印管理中心进行查询,获取该水印编码值对应的交互内容;步骤4)对交互内容进行显示,提供交互服务。本发明的方法中的交互内容和规则不受内容制作约束,后期可以灵活改变。
Description
技术领域
本发明涉及视频内容制作方法,特别涉及一种基于音频水印的视频交互方法。
背景技术
随着互联网的普及和多媒体技术的发展,数字音频水印技术越来越成熟,具有广泛的用途和应用前景,包括音频作品的知识产权保护、数字指纹、隐藏标志和篡改提示、隐蔽通信、访问控制、拷贝保护和内容交互等多个领域。
交互式视频技术由于能够使用户获取视频目标外的更多信息,成为近年来的一个热点。为了实现视频交互,一般需要对视频内容进行预处理,如将交互内容转成FLV格式的视频,或者在需要交互的视频帧上插入交互点等。目前这些方法都需要对内容进行复杂处理,导致制作成本高,而且一旦内容制作完成后,后期就无法改变其交互规则,这些都不利于交互式视频技术的发展和普及。
发明内容
本发明目的在于克服目前视频交互方法中存在的上述缺陷,基于数字音频水印技术,提出一种基于音频水印的交互方法,该方法能够有效降低前期视频制作成本,而且无需在内容制作时限制交互内容与规则,交互规则可根据用户需求灵活改变。
为了实现上述目的,本发明提出了一种基于音频水印的视频交互方法,所述方法包括:
步骤1)对每个视频内容进行处理,将该视频内容的每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;然后生成带音频水印信息的视频内容,存入内容管理中心;
步骤2)播放所述内容管理中心的带有音频水印信息的视频内容,检测并获取其音频数据中的水印编码值;
步骤3)将获取到的水印编码值发送到所述水印管理中心进行查询,获取该水印编码值对应的交互内容;
步骤4)对交互内容进行显示,提供交互服务。
上述技术方案中,所述步骤1)具体包括:
步骤101)按照时间间隔对视频内容进行划分,得到若干段视频场景;
步骤102)为每段视频场景分配水印编码值;每个水印编码值是唯一性的;
步骤103)将每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;
步骤104)根据每段视频场景的水印编码值在每段视频场景中嵌入音频水印编码;生成带有音频水印信息的视频内容;
步骤105)将带有音频水印信息的视频内容存入内容管理中心。
上述技术方案中,所述步骤104)具体包括:
步骤104-1)提取每段视频场景的音频数据;
步骤104-2)将每段音频数据解码成原始脉冲编码调制数据;
步骤104-3)利用水印嵌入算法,根据每段视频场景的水印编码值将每段原始脉冲编码调制数据生成原始带水印的音频数据;
步骤104-4)将每段原始带水印的音频数据合成到对应的视频场景中;
步骤104-5)将步骤104-4)中的每段视频场景合成带有音频水印信息的视频内容。
上述技术方案中,所述步骤104-3)的水印嵌入算法为最低有效位算法或利用扩频技术的水印算法。
本发明的优点在于:
1、本发明的方法中的交互内容和规则不受内容制作约束,后期可以灵活改变;
2、本发明的方法采用在音频数据中加入水印的处理方式,对视频内容进行处理时不需要分析复杂的视频数据,只需要对其中的音频数据进行处理,制作成本低;
3、本发明的方法采用音频数据加入水印的方式对视频内容进行处理,易于用户进行后续检测,而且水印数据不易丢失。
附图说明
图1是本发明的基于音频水印的视频交互方法中视频内容制作方法的流程图;
图2是本发明的基于音频水印的视频交互方法中的每段视频场景中嵌入音频水印编码的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细的说明。
一种基于音频水印的视频交互方法,所述方法包括:
步骤1)对每个视频内容进行处理,将该视频内容的每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;然后生成带音频水印信息的视频内容,存入内容管理中心;
如图1所示,所述步骤1)具体包括:
步骤101)按照时间间隔对视频内容进行划分,得到若干段视频场景;
步骤102)为每段视频场景分配水印编码值;每个水印编码值是唯一性的;
所述水印编码值为8位或16位数;
步骤103)将每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;
所述水印管理中心负责维护视频内容的每段视频场景及水印编码值,操作者可以针对每段视频场景制定交互规则及内容,供后期使用。
步骤104)根据每段视频场景的水印编码值在每段视频场景中嵌入音频水印编码;
如图2所示,所述步骤104)具体包括:
步骤104-1)提取每段视频场景的音频数据;
步骤104-2)将每段音频数据解码成原始脉冲编码调制(PCM)数据;
PCM数据格式便于音频数据嵌入水印;
步骤104-3)利用水印嵌入算法,根据每段视频场景的水印编码值将每段原始PCM数据生成原始带水印的音频数据;
所述水印嵌入算法为最低有效位(LSB)算法或利用扩频技术的水印算法;
步骤104-4)将每段原始带水印的音频数据合成到对应的视频场景中;
步骤104-5)将步骤104-4)中的每段视频场景合成整个视频内容;
步骤105)将步骤104-5)的带有音频水印信息的视频内容存入内容管理中心;
步骤2)播放内容管理中心的带有音频水印信息的视频内容,检测并获取其音频数据中的水印编码值;
利用水印检测算法从音频数据中获取水印编码值,同时也能得到原始的音频数据。
步骤3)将获取到的水印编码值在所述水印管理中心进行查询,获取该水印编码值对应的交互内容;
步骤4)对交互内容进行显示,提供交互服务。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (4)
1.一种基于音频水印的视频交互方法,所述方法包括:
步骤1)对每个视频内容进行处理,将该视频内容的每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;然后生成带音频水印信息的视频内容,存入内容管理中心;
步骤2)播放所述内容管理中心的带有音频水印信息的视频内容,检测并获取其音频数据中的水印编码值;
步骤3)将获取到的水印编码值发送到所述水印管理中心进行查询,获取该水印编码值对应的交互内容;
步骤4)对交互内容进行显示,提供交互服务。
2.根据权利要求1所述的基于音频水印的视频交互方法,其特征在于,所述步骤1)具体包括:
步骤101)按照时间间隔对视频内容进行划分,得到若干段视频场景;
步骤102)为每段视频场景分配水印编码值;每个水印编码值是唯一性的;
步骤103)将每段视频场景描述、交互内容及其对应的水印编码值发送到水印管理中心;
步骤104)根据每段视频场景的水印编码值在每段视频场景中嵌入音频水印编码;生成带有音频水印信息的视频内容;
步骤105)将带有音频水印信息的视频内容存入内容管理中心。
3.根据权利要求2所述的基于音频水印的视频交互方法,其特征在于,所述步骤104)具体包括:
步骤104-1)提取每段视频场景的音频数据;
步骤104-2)将每段音频数据解码成原始脉冲编码调制数据;
步骤104-3)利用水印嵌入算法,根据每段视频场景的水印编码值将每段原始脉冲编码调制数据生成原始带水印的音频数据;
步骤104-4)将每段原始带水印的音频数据合成到对应的视频场景中;
步骤104-5)将步骤104-4)中的每段视频场景合成带有音频水印信息的视频内容。
4.根据权利要求3所述的基于音频水印的视频交互方法,其特征在于,所述步骤104-3)的水印嵌入算法为最低有效位算法或利用扩频技术的水印算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510388788.2A CN106331744A (zh) | 2015-07-03 | 2015-07-03 | 一种基于音频水印的视频交互方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510388788.2A CN106331744A (zh) | 2015-07-03 | 2015-07-03 | 一种基于音频水印的视频交互方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106331744A true CN106331744A (zh) | 2017-01-11 |
Family
ID=57727433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510388788.2A Pending CN106331744A (zh) | 2015-07-03 | 2015-07-03 | 一种基于音频水印的视频交互方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106331744A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111669615A (zh) * | 2020-05-13 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 视频流处理方法及装置 |
CN113420242A (zh) * | 2021-08-24 | 2021-09-21 | 阿里巴巴(中国)有限公司 | 导购方法、资源分发方法、内容展示方法及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020188841A1 (en) * | 1995-07-27 | 2002-12-12 | Jones Kevin C. | Digital asset management and linking media signals with related data using watermarks |
CN102222504A (zh) * | 2011-06-10 | 2011-10-19 | 深圳市金光艺科技有限公司 | 数字音频多层水印植入及提取方法 |
CN102307320A (zh) * | 2011-08-11 | 2012-01-04 | 江苏亿通高科技股份有限公司 | 一种适用于流媒体环境的盗版追踪水印方法 |
CN103368898A (zh) * | 2012-03-26 | 2013-10-23 | 中兴通讯股份有限公司 | 一种实现信息推送的方法和系统 |
CN104361847A (zh) * | 2014-11-10 | 2015-02-18 | 江苏梦之音科技有限公司 | 一种通过音频进行互动的广告播放系统以及方法 |
US20150172771A1 (en) * | 2012-07-05 | 2015-06-18 | Lg Electronics Inc. | Method and apparatus for processing digital service signals |
-
2015
- 2015-07-03 CN CN201510388788.2A patent/CN106331744A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020188841A1 (en) * | 1995-07-27 | 2002-12-12 | Jones Kevin C. | Digital asset management and linking media signals with related data using watermarks |
CN102222504A (zh) * | 2011-06-10 | 2011-10-19 | 深圳市金光艺科技有限公司 | 数字音频多层水印植入及提取方法 |
CN102307320A (zh) * | 2011-08-11 | 2012-01-04 | 江苏亿通高科技股份有限公司 | 一种适用于流媒体环境的盗版追踪水印方法 |
CN103368898A (zh) * | 2012-03-26 | 2013-10-23 | 中兴通讯股份有限公司 | 一种实现信息推送的方法和系统 |
US20150172771A1 (en) * | 2012-07-05 | 2015-06-18 | Lg Electronics Inc. | Method and apparatus for processing digital service signals |
CN104361847A (zh) * | 2014-11-10 | 2015-02-18 | 江苏梦之音科技有限公司 | 一种通过音频进行互动的广告播放系统以及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111669615A (zh) * | 2020-05-13 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 视频流处理方法及装置 |
CN111669615B (zh) * | 2020-05-13 | 2022-09-30 | 北京奇艺世纪科技有限公司 | 视频流处理方法及装置 |
CN113420242A (zh) * | 2021-08-24 | 2021-09-21 | 阿里巴巴(中国)有限公司 | 导购方法、资源分发方法、内容展示方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11023618B2 (en) | Systems and methods for detecting modifications in a video clip | |
US9262794B2 (en) | Transactional video marking system | |
US7289643B2 (en) | Method, apparatus and programs for generating and utilizing content signatures | |
IL271502A (en) | Adaptive processing with multiple media processor nodes | |
US8126020B2 (en) | Wireless methods using signature codes | |
PH12020500016A1 (en) | Picture data encoding method and apparatus and picture data decoding method and apparatus | |
US20070174059A1 (en) | Methods, Systems, and Sub-Combinations Useful in Media Identification | |
CN102074240B (zh) | 一种用于版权管理的数字音频水印算法 | |
JP6470751B2 (ja) | デジタルオーディオ或いはオーディオ並びに/又はビデオコンテンツにマークを付ける装置及び方法 | |
JP2011503659A (ja) | 音声透かし、透かし検出、および透かし抽出を実行する方法および装置 | |
US20170316189A1 (en) | Object-based watermarking | |
Mstafa et al. | A new video steganography algorithm based on the multiple object tracking and Hamming codes | |
WO2004015629A3 (en) | Identification of digital data sequences | |
CN106709853A (zh) | 一种图像检索方法及系统 | |
Bazyar et al. | A new method to increase the capacity of audio steganography based on the LSB algorithm | |
Kheddar et al. | Pitch and fourier magnitude based steganography for hiding 2.4 kbps melp bitstream | |
CN102385862A (zh) | 一种面向空气信道传播的音频数字水印方法 | |
CN106331744A (zh) | 一种基于音频水印的视频交互方法 | |
Ke et al. | Robust Video watermarking based on deep neural network and curriculum learning | |
WO2001041065A3 (en) | Method for coding and decoding multimedia data | |
CN102647617B (zh) | 一种前端装置及在前端实现视频指纹预处理的方法 | |
Sharma et al. | Watermark synchronization: Perspectives and a new paradigm | |
Rahmani et al. | A low distortion reversible data hiding scheme for search order coding of VQ indices | |
WO2017178914A1 (en) | Compressing indices in a video stream | |
Wu et al. | Efficient reversible data hiding based on prefix matching and directed LSB embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170111 |