CN101803336A - 允许使用rfid标签修改出现在交互式视频中的项目的音频特性的技术 - Google Patents
允许使用rfid标签修改出现在交互式视频中的项目的音频特性的技术 Download PDFInfo
- Publication number
- CN101803336A CN101803336A CN200880107473A CN200880107473A CN101803336A CN 101803336 A CN101803336 A CN 101803336A CN 200880107473 A CN200880107473 A CN 200880107473A CN 200880107473 A CN200880107473 A CN 200880107473A CN 101803336 A CN101803336 A CN 101803336A
- Authority
- CN
- China
- Prior art keywords
- video
- sound
- producing element
- audio
- zone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000004048 modification Effects 0.000 title claims abstract description 16
- 238000012986 modification Methods 0.000 title claims abstract description 16
- 230000002452 interceptive effect Effects 0.000 title claims description 13
- 230000007246 mechanism Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 6
- 230000001105 regulatory effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000000712 assembly Effects 0.000 description 4
- 238000000429 assembly Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 239000004677 Nylon Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229920001778 nylon Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013481 data capture Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011295 pitch Substances 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- -1 sex etc.Generally Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
- G10H1/0083—Recording/reproducing or transmission of music for electrophonic musical instruments using wireless transmission, e.g. radio, light, infrared
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/368—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems displaying animated or moving pictures synchronized with the music or audio part
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/756—Media network packet handling adapting media to device capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2368—Multiplexing of audio and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
- H04N21/4316—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4341—Demultiplexing of audio and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
- H04N21/4852—End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
- H04N21/8113—Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8126—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
- H04N21/8133—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/091—Info, i.e. juxtaposition of unrelated auxiliary information or commercial messages with or between music files
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/095—Identification code, e.g. ISWC for musical works; Identification dataset
- G10H2240/115—Instrument identification, i.e. recognizing an electrophonic musical instrument, e.g. on a network, by means of a code, e.g. IMEI, serial number, or a profile describing its capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本解决方案可以包括一种用于允许在对包含嵌入数据的视频中的项目进行选择性音频修改的方法。在此方法中,RFID标签可以加载特定于声音产生元素的音频特性。RFID标签继而可以附加到对应于声音产生元素的项目。可以记录包括该项目的区域的视频和音频。可以通过扫描RFID标签自动地获得音频特性。音频特性继而可以嵌入至视频,以便当项目出现在视频中时音频特性是可用的。
Description
技术领域
本发明涉及视频制作领域,尤其涉及允许通过使用射频识别(RFID)标签来修改出现在交互式视频中的项目的音频特性。
背景技术
视频媒体除了视觉线索之外,还包括音频信息的呈现。语音、音乐和各种声音效果增强了观看视频记录的用户体验。视频的音频部分的质量经常依赖于各种因素,诸如记录环境和后期制作处理。例如,在如下具有高级别周围噪音的环境中记录访谈,诸如在热闹的街角,可能降低所记录语音的清晰度。
当收听视频记录的音频时,消费者通常仅能够控制音频部分的总音量。就是说,提高在街角的访谈的音量来试图更好地听该语音,同样也提高了所记录的周围噪音的音量级别。因此,留给消费者的是同样不清楚的音频情况,仅是更大声了。
各种音频信道(其组成视频的音轨)的独立控制目前是为执行诸如数字重灌制(re-mastering)的制作任务的人员而保留的。执行这种修改所需要的设备不以用户友好格式定位于一般消费者。
发明内容
本发明公开了如下解决方案,其用于允许为出现在数据嵌入视频的观看区中的声音产生元素修改音频特性。例如,允许用户调节音乐会视频中钢琴的音量,而不更改任何其它乐器或者声音产生元素(诸如,歌手)的音量级别。这可以通过使用射频识别(RFID)标签将特定音频信道与特定声音产生元素的音频输出相关联,以将可配置音频特性嵌入至视频来达到。
用户可以使用一般与视频观看设备相关联的输入机构来做出这种修改。例如,当在电视上观看视频时,遥控器可以用于调节音频特性。当在计算机上观看视频时,声音产生元素可以通过用屏幕上指针指向它们来进行选择,从而可以使得将可配置选项呈现给用户。
根据第一方面,提供了一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法,包括:识别特定于将出现在视频中的声音产生元素的特性;加载具有该识别特性的RFID标签,其中RFID标签附加到对应于该声音产生元素的物理项目;记录一个区域的视频和音频,所述区域包括所述物理项目;扫描RFID标签来相对于区域中位置自动地追踪声音产生元素;以及将与声音产生元素相关联的可配置音频嵌入至视频,其中终端用户能够通过配置与相应声音产生元素特定关联的嵌入音频,来调节每个声音产生元素的音频特性,而不以相应方式调节该视频的其它音频元素。
识别和加载可以通过计算机程序来完成。
根据第二方面,提供了一种用于将音频数据嵌入至提供了独立可配置音频元素的视频的系统,包括:视频捕获系统,其配置成用于捕获区域并且将该区域变成视频观看区;音频捕获系统,其配置成用于捕获区域中的声音,其中区域中的每个声音产生元素相互独立地进行捕获,以及其中该区域包含对应于每个声音产生元素的物理项目;接近该区域放置的RFID扫描系统,所述RFID扫描系统配置成用于扫描位于该区域中的RFID标签,其中RFID标签与对应于出现在观看区中的每个声音产生元素的每个物理项目相关联;以及合并服务器,其配置成用于自动地将一个或者多个音频特性与捕获的音频和视频同步,以便一个或者多个音频特性与其中关联元素出现在观看区中的视频时段相关联,其中将视频和同步的音频特性输送到多个交互式视频观看设备,该交互式视频观看设备准许用户使用来自与视频观看设备相关联的输入机构的用户提供的输入,来选择性地修改视频中每个声音产生元素的音频特性。
根据第三方面,提供了一种视频播放系统,包括:显示器,其配置成用于视觉上呈现视频,该视频包括多个不同声音产生元素;音频变换器,其配置成用于听觉上呈现该视频的声音;以及输入机构,其配置成用于准许用户选择视频的声音产生元素,所述输入机构还包括音频调节机构,其配置成用于准许用户调节特定于声音产生元素的声音特性,而不调节该视频的任何其它声音特性。
根据第四方面,提供了一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法,包括:识别特定于在视频中出现的声音产生元素的特性;将RFID标签附加到对应于声音产生元素的物理项目;记录区域的视频和音频,所述区域包括所述物理项目;扫描RFID标签来相对于区域中位置自动地追踪声音产生元素;以及将与声音产生元素相关联的可配置音频嵌入至视频,其中终端用户能够通过配置与相应声音产生元素特定关联的嵌入音频,来调节每个声音产生元素的音频特性,而不以相应方式调节该视频的其它音频元素。
本发明可以根据与这里所呈现素材一致的多个方面来实现。例如,本发明可以包括用于允许选择性修改出现在视频中的项目的音频特性的方法。在此方法中,RFID标签继而可以优选地附加到对应于声音产生元素的项目。优选地,可以记录包括该项目的区域的视频和音频。例如,声音产生元素的音频特性可以使用单独麦克风进行记录,并且基于RFID标签的定位在视频中进行追踪。音频特性继而优选地可以嵌入到视频中,以便当项目出现在该视频中时,音频特性是可用的。
本发明的另一方面可以包括一种用于将音频数据嵌入至提供了独立可配置音频元素的视频的系统。这种系统优选地可以包括视频捕获系统、音频捕获系统、RFID扫描系统和合并服务器。视频捕获系统优选地可以配置成用于记录指定区域的视频。音频捕获系统优选地可以配置成用于捕获指定区域中的声音。声音优选地可以相互独立地进行捕获,并且可以由指定区域中的项目来呈现。RFID扫描系统优选地可以接近指定区域放置,并且配置成用于扫描区域中的RFID标签。合并服务器优选地可以配置成用于自动地将与标记的声音产生元素相关联的音频特性与捕获的音频和视频同步,从而制作具有嵌入可修改音频特性的视频。
本发明的另一方面可以包括一种视频播放系统。该系统优选地包括显示器、音频变换器和输入机构。显示器优选地可以视觉上呈现视频,该视频包括不同的声音产生元素。音频变换器优选地可以听觉上呈现视频的声音。输入机构优选地可以准许用户选择视频的声音产生元素。输入机构优选地包括如下音频调节装置,其准许用户调节特定于声音产生元素的声音特性,而不调节视频的任何其它声音特性。
应当注意,本发明的各种方面可以实现为用于控制计算设备来实现这里所述功能的程序,或者实现为用于支持计算设备执行对应于这里所公开步骤的过程的程序。本程序可以通过将程序存储至磁盘、光盘、半导体存储器和任何其它记录介质来提供,或者还可以作为经由载波输送的数字编码信号来提供。所述程序可以是单一程序或者可以作为多个子程序来实现,每个子程序在单一计算设备中交互,或者以跨越网络空间的分布形式交互。
这里详述的方法还可以是至少部分由服务代理和/或由服务代理响应服务请求操作的机器执行的方法。
附图说明
现将仅通过示例的方式描述本发明的优先实施方式,并且参考如下附图:
图1是示出了根据这里公开的发明性布置的实施方式的如下系统的示意图,其将与RFID标签相关联的声音元素所产生的音频特性嵌入至视频;
图2是示出了根据这里公开的发明性布置的实施方式的如下系统的示意图,其将与RFID标签相关联的声音元素产生的音频特性捕获至视频;
图3是根据这里公开的发明性布置的实施方式的如下Web页的示图,其用于用户与嵌入可修改音频特性的视频进行交互;
图4是根据这里公开的发明性布置的实施方式的如下视频监视器接口的示图,其用于用户与嵌入可修改音频特性的视频进行交互;
图5是根据这里公开的发明性布置的实施方式的如下方法的流程图,其捕获与声音产生元素相关联的可修改音频特性并且将其嵌入至视频;以及
图6是根据这里公开的发明性布置的实施方式的如下方法的流程图,其中服务代理可以配置视频系统用于制作嵌入可修改音频特性的视频。
具体实施方式
图1是示出了根据这里公开的发明性布置的实施方式的如下系统100的示意图,其将与RFID标签相关联的声音元素所产生的音频特性嵌入至视频。系统100可以包括如下客户端110,其配置成用于向用户105呈现观看应用112中的数据嵌入视频113。客户端110可以代表各种设备包括但不限于:个人计算机、电视机、媒体播放器或者或者能够呈现视频(诸如,数据嵌入视频113)的任何其它媒体观看设备或设备组。
数据嵌入视频113可以通过网络120从合并服务器125向客户端110传输。在另一预期的实施方式中,中介服务器或者中介设备(未示出)可以存在于合并服务器125与网络120之间,以便存储用于传输的数据嵌入视频113。例如,视频点播数据储存器可以存储来自合并服务器125的、用于在电视机(客户端110)上显示的视频。在另一示例中,连接到客户端110的个人视频记录器可以存储从服务器125获得的、用于在方便的时候为用户105回放的视频。
无论视频是通过网络120被流式传送给客户端110,还是在记录设备中被高速缓存,继而呈现给客户端110,用户105都可以与数据嵌入视频113中的元素交互。可以凭借与客户端110相关联的输入机构115进行交互。例如,当客户端是电视机时,输入机构115可以是遥控器或者电视机本身上的输入板。当客户端110是计算机时,输入机构115可以是鼠标、键盘或者其它这种外围设备。
视频观看应用112可以被构造为使得其能够在客户端110上运行并且从输入机构115接受输入。应用112可以以软件、硬件或者固件来实现。该应用还可以从客户端110内部执行,或者在连接到客户端110的外部设备或者模块中执行。例如,视频观看应用112可以是软件应用或者浏览器插件,其中视频113在计算设备(客户端110)上进行显示。在另一示例中,应用112可以包括在通过接口与电视机(客户端110)连接的机顶盒的固件中。而且,观看应用112可以包括本地执行指令、远程执行指令以及其组合。在一个实施方式中,视频观看应用112可以使用户105能够针对用户所选元素来执行数字信号处理操作。例如,用户105可以选择与乐器特定音频相关联的乐器,并且可以使用作为应用112的一部分所包括的编辑选项来更改乐器的声音特性。
合并服务器125可以是包括用于创建数据嵌入视频113的计算机软件和算法的计算服务器。合并服务器125的软件和算法可以将从RFID服务器130和音频捕获系统140接收到的信息嵌入至从视频捕获系统135接收到的视频,从而得到数据嵌入视频113。合并服务器125可以实时地从视频捕获系统135、音频捕获系统140和RFID服务器130接收数据,或者可以向合并服务器125提供预先记录的数据以进行经延迟的合并。在另一实施方式中,合并服务器125可以包括数据储存器(未示出)来存储接收到的数据以便稍后合并。
合并服务器125可以利用各种音频和视频处理技术中任何一种技术,来将RFID传感器130信息、系统140的音频和系统135的视频进行同步。为此同步所利用的确切技术不是系统100解决方案的中心,并且不在这方面限制解释系统100。
视频捕获系统135可以包括多个用于视频制作的组件,诸如照相机、灯、计算设备及其软件等。视频捕获系统135的组件可以利用各种技术以及混合技术,诸如模拟和数字记录设备。另外,视频捕获系统135创建的原始视频在向合并服务器125发送之前,可以进一步进行处理。例如,电视情景喜剧的原始视频记录在向合并服务器125发送以将数据嵌入该视频记录中之前,可以进行编辑和优化。
音频捕获系统140可以包括多个用于捕获和处理音频信号的组件,诸如麦克风、放大器、混合器等。捕获系统140创建的原始音频在向合并服务器125输送之前,可以进行处理。例如,在被嵌入至相应视频之前,可以从扬声器的音轨排除背景噪音。
网络120可以包括输送载波中编码数据所需的任何硬件/软件/和固件。数据可以包含在模拟或者数字信号中,并且通过数据通道或者语音通道进行输送。网络120可以包括本地组件和用于在计算设备组件之间,以及集成设备组件与外围设备之间通信交换所需的数据路径。网络120还可以包括网络设备,诸如路由器、数据线、集线器和中介服务器,这些一起形成了数据网络,诸如因特网。网络120还可以包括基于电路的通信组件和移动通信组件,诸如电话交换机、调制解调器、蜂窝通信塔等。网络120可以包括有线通信路径和/或无线通信路径。
图2是示出了根据这里公开的发明性布置的实施方式的如下系统200的示意图,其将与RFID标签相关联的声音元素产生的音频特性捕获至视频。系统200可以是对系统100的扩展。然而,系统200不限于此方面,并且可以在任何支持RFID标签使用的系统的上下文中执行,用于捕获音频特性以便将其嵌入视频。
在系统200中,可以设置数据捕获系统230来捕获捕获区域205中的数据。数据捕获系统230可以包括视频捕获系统235和音频捕获系统240。视频捕获系统235可以利用各种组件来产生捕获区域205的视觉记录,从而得到所生成视频237的相应观看区。视频捕获系统235可以通过如下各种装置来做到这一点,包括但不限于,照相机控制软件、手动操作等。视频捕获系统235制作的视频237可以输送到合并服务器245用于数据嵌入。
音频捕获系统240可以利用各种组件来制作捕获区域205的音频记录,该音频记录对应于捕获区域205的视频记录。音频捕获系统240可以通过如下各种装置来做到这一点,包括但不限于:固定麦克风、无线麦克风、定向麦克风等。音频捕获系统240制作的音轨242可以输送到合并服务器245用于数据嵌入。
捕获区域205可以包含一个或者多个声音产生元素210和215。如这里所使用的,声音产生元素定义为一个或者多个指定为产生特定音频流的项目。例如,访谈中的每个谈话者可以指定为一个声音产生元素,以便他们对应的音频流可以独立地进行控制。备选地,所有其它噪音(诸如户外进行访谈情况下的街道噪音)可以集合在一起作为背景噪音。
声音产生元素210和215可以放置在捕获区域205中,以便可以记录下元素的外观和声音。另外,声音产生元素210和215可以包含RFID标签,该RFID标签包含属于特定声音产生元素的音频特性。在此示例中,RFID标签211包含特定于钢琴的音频特性,并且附加到该钢琴;RFID标签216包含特定于歌手的音频特性,并且附加到该歌手。应当理解,RFID标签211和RFID标签216可以以各种独立于总系统200的功能性的方法附加到声音产生元素210和声音产生元素215。另外,RFID标签可以与一组声音产生元素相关联,该组声音产生元素诸如是一起产生环绕音频的元素。因此,RFID标签可以代表用于捕获/产生环绕或者组合声音的焦点,其中焦点可以随着RFID在捕获区域205中移动而动态地改变。
RFID传感器220可以分别检测声音产生元素210和215的RFID标签211和216的信号。另外,RFID传感器220可以接收包含在RFID标签211和216中的数据。在此示例中,RFID传感器225从RFID标签211接收数据项213,以及从RFID标签216接收数据项217。数据项213和217可以包括产品信息(诸如项目细节)和音频特性(诸如,音调)。视频捕获区域205中标签的定位可以通过基于来自多个RFID传感器220的输入对RFID标签的位置进行三角测量来自动地确定。
RFID传感器220可以向RFID服务器225传送数据项213和217。RFID服务器225可以将特定时间参考处所有标签的定位与关联信息进行合并。这可以通过创建特定时间参考处的标签定位和与标签相关联的信息的网格映射227来达到。继而可以向合并服务器245传送网格映射227,用于与视频237和音频242同步。
接收到来自视频捕获系统235的视频237、来自音频捕获系统240的音轨242、RFID定位和数据网格映射227之后,合并服务器245可以开始将这些信息嵌入至视频。对于特定时间参考,接收到的网格映射227可以使相应时间参考处的视频237和音频242覆盖在该映射上,从而得到数据嵌入视频250。
图3是根据这里公开的发明性布置的实施方式的如下Web页305的示图,其用于用户与嵌入可修改音频特性的视频交互。Web页305可以是如下装置,用户通过该装置可以与诸如系统200创建的数据嵌入视频250的数据嵌入视频交互。可以由能够与远程内容交互的任何客户端应用和/或接口替换Web页305,仍然认为是在所公开解决方案的范围中。例如,代替Web页305,图3的接口可以实现为富因特网应用或者富客户端应用。
在图3中,用户可以观看包含在Web页305(或者其它交互式接口)内的视频播放器310中的数据嵌入视频311。数据嵌入视频311可以包括数据指示符312,该数据指示符用于提醒用户视频311中的声音产生元素具有可修改的音频特性。在此示例中,数据指示符312是可视的,并且通过元素周围的有色边框来表示。数据指示符312还可以以各种其它方式来实现,包括但不限于,音频提醒、弹出窗口、飞动(fly-over)窗口等。另外,数据指示符312可以包括多种方法的组合,诸如与产品项目周围颜色变化耦合的特殊音频提醒。
用户可以利用选择符313来选择所指示的声音产生元素。此选择符313可以具有视觉表示,诸如示例中给出的箭头。另外,当放在具有可修改音频特性的声音产生元素上时,选择符313可以触发数据指示符312。
对具有嵌入可修改音频特性的声音产生元素的选择可以在Web页305的一部分中显示音频控制315。备选地,显示音频控制315的Web页305部分可以出现在Web页305外部,诸如在弹出或者飞动窗口或者单独的Web页中。
音频控制315可以包括一组选项320,用户通过该选项可以选择要修改的音频特性。对特定选项320的选择可以使得呈现针对音频特性的相关控制机构325。控制装置325的呈现可以以各种方式完成,包括但不限于,利用Web页305中的空间、外部Web页、弹出窗口、飞动窗口等。如此示例中所给出的,选择了音量控制选项,因此音量控制机构325(滑动条)在Web页305中显示给用户。选择器320和控制机构325可以以与整个系统和Web站点的技术兼容的任何方式来实现。
对特定音频特性的修改可以在控制机构325中完成。这种修改产生所选元素的音频中对应的听觉上的改变。例如,用户可以选择将音量控制的滑动条325滑至零(‘0’)来静音钢琴音乐,导致用户仅听到歌唱部分。
应当注意,一个声音产生元素音频特性的修改不影响相同视频场景中另一声音产生元素的音频特性。如上述示例中,钢琴音量的改变没有改变歌唱部分播放的音量。
应当理解,音频特性的修改不限于音量,而是可以包括能够利用数字信号处理操作执行的任何音频特性修改。例如,装有钢弦的吉它可以出现在视频播放器310接口中,并且可以具有可修改的音频特性。特性之一可以替换吉它不同类型的弦,其得到不同的音频特性。例如,可以向用户提供选项以用尼龙弦来替换钢弦。继而可以重放原始音频旋律,只是吉它产生的声音是具有尼龙弦的吉它的模仿声音。此修改音频特性的概念可以延伸到其它音频领域,诸如改变乐器的拍子、音程等。
在另一示例中,音频控制315可以准予复制一个或者多个所选声音产生对象产生的音频的能力,其中复制的音频与原始音频相比,具有与所选声音产生对象相关联的不同时间滞后。例如,观看管弦乐队演出的用户可能感到复制乐器的声音并且将一些时间滞后添加到该声音,可以改进整个音乐部分的整体质量和效果,因此丰富了他的/她的观看体验。
音频修改不限于乐器。例如,所选角色的语音特性可以类似地被修改以模仿不同的音高、说话速率、口音、语言(例如,在一个实施方式中可以从原始语言动态地翻译成用户所选语言)、头部大小、音高、性别等。总体上,这里所述的解决方案准许针对离散的音频源来执行任何类型的用户可指明的数字信号处理,用于改变从上述音频源生成的音频输出。
进一步,当期望对一个音频源进行广泛修改时,可以有意地过度加载与该音频源相关联的音频信息来保证从用户选择得到清晰的音频。例如,在视频片段中做广告的吉它可以被“过度加载”以包括由吉它的不同变化(例如,钢弦对尼龙弦)产生的真实音轨。因此,为吉它选择不同音频属性320可以产生与来自吉它的模仿声音相对的真实声音。另外,针对不同语言可以包括不同角色特定的音轨,其准许观看者为出现在视频中的一个或者多个角色选择不同的语言。利用接口305改变一个角色的语言不一定改变出现在场景中的其他角色所说的语言。
图4是根据这里公开的发明性布置的实施方式的如下视频监视器接口400的示图,其用于用户与嵌入可修改音频特性的视频交互。此接口400可以是如下装置,用户通过该装置可以与数据嵌入视频交互,该数据嵌入视频诸如是系统200创建的数据嵌入视频250。
监视器405可以在如下环境中显示视频410,该环境模拟系统100的观看应用112。备选地,视频410可以以与其它节目相同的方式在监视器405上观看,诸如电视节目、有线节目、卫星节目、点播电影等。
用户可以利用遥控器450选择视频410中具有可修改的音频特性的声音产生元素。这种选择可以触发音频控制窗口415的显示。音频控制窗口415可以向用户呈现针对与所选声音产生元素相关联的可修改音频特性的选项420。此窗口415可以在设置时间内或者直到用户做出另一选择之前保持为可见的。
附加用户可选择控制425可供用户使用以提供通用功能性。音频选项420和用户可选择控制425都可以对应遥控器450上的可用按钮。在此示例中,用户可选择控制425可以允许用户浏览(navigate)视频410的声音产生元素,选择声音产生元素来修改,并且重新应用默认设置。应当理解,为了保证功能性,所列控制需要对应于与监视器405特定相关联的遥控器450上可用的按钮,或者对应于通常在各种遥控器模块上可用的按钮。
图5是根据这里公开的发明性布置的实施方式的如下方法500的流程图,其捕获与声音产生元素相关联的可修改音频特性并且将其嵌入至视频。方法500可以在系统100和/或系统200的上下文中实现。另外,方法500可以利用接口305和/或接口400。
方法500可以在步骤505开始,其中操作者设置用于音频/视频记录和RFID标签感知的区域。此步骤可以包括系统100的视频捕获系统135和音频捕获系统140,以及系统200的RFID传感器220和RFID服务器225的安装和配置。
在步骤510中,操作者可以加载具有音频特性和项目信息的RFID标签,并且可以将标签附加到其相应的项目。继而,视频制作可以在步骤515开始,其中标记的声音产生元素包括在和/或用于捕获区域中。
当记录标记的项目时,一个或者多个RFID传感器可以接收来自标签的加载信息,以及确定每个标签的定位,如步骤517所指示。在步骤520中,可以向合并服务器传送音频、视频和RFID信息。在步骤525中,合并服务器可以将RFID信息与音频和视频进行同步。应当理解,步骤525可以动态地并且关于标记项目的记录实时发生。
在步骤528中,合并服务器可以将同步的RFID信息嵌入至视频。在步骤530中,可以使数据嵌入视频对于用户可用。步骤532可以选择性发生,其中提供指示符用于提醒用户项目具有与其相关联的可修改音频特性。
在步骤535中,用户可以选择视频中的项目,该项目具有与其相关联的可修改音频特性。在步骤540中,可以向用户提供选项用于提醒所选项目的音频呈现。
图6是根据这里公开的发明性布置的实施方式的如下方法600的流程图,其中服务代理可以配置视频系统用于制作嵌入可修改音频特性的视频。方法600可以利用系统100和/或200,以及接口305和/或400。
方法600可以在步骤605中开始,这时消费者启动服务请求。服务请求可以是针对服务代理的用来建立用于将可修改的音频特性嵌入至视频的新系统的请求。服务请求还可以是利用现有系统解决问题的请求,该现有系统用于将可修改的音频特性嵌入至视频。
在步骤610中,可以选择人工代理响应服务请求。在步骤615中,人工代理可以分析消费者的当前系统,并且可以开发解决方案。该解决方案可以得到系统100和/或200,或者任何配置成用于捕获对象上RFID标签中所包含的可修改音频特性来嵌入至上述对象的视频中的系统,诸如执行方法500步骤的系统。
在步骤620中,人工代理可以将消费者的系统配置成用于捕获对象上的RFID标签中所包含的可修改音频特性来嵌入至上述对象的视频中。这可以包括视频捕获系统、音频捕获系统、RFID传感器、RFID服务器和合并服务器的安装。在步骤625中,人工代理可以选择性地使用计算机设备配置一个或者多个RFID标签来包含有关音频特性。
在步骤630中,人工代理可以选择性地为消费者维护如下现有系统,其配置成用于产生具有嵌入可修改音频特性的视频。在步骤635中,人工代理可以完成该服务活动。
本发明可以在硬件、软件或者硬件和软件的结合中实现。本发明可以在一个计算机系统中按照集中式方式来实现,或者可以按照不同的元件分散在多个互连的计算机系统上的分布式方式来实现。适于执行在此描述的方法的任意类型的计算机系统或者其它装置都是适合的。硬件和软件的典型结合可以是具有计算机程序的通用计算机系统,其中,在加载和执行所述计算机程序时,其控制计算机系统,使得计算机系统执行在此描述的方法。
本发明还可以嵌入在计算机程序产品中,所述程序产品包括支持在此描述的方法的实现的所有特征,并且当所述程序产品被加载到计算机系统中时,其能够执行这些方法。本上下文中的计算机程序表示以任何语言、代码或符号表示的指令集合的任何表达式,其意在直接或在完成以下内容的任一内容或两者之后使具有信息处理能力的系统执行特定的功能:a)转换为其他语言、代码或符号;b)以不同的素材形式重现。
Claims (22)
1.一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法,包括:
识别特定于将出现在视频中的声音产生元素的特性;
加载具有所述识别的特性的RFID标签,其中所述RFID标签附加到对应于所述声音产生元素的物理项目;
记录一个区域的视频和音频,所述区域包括所述物理项目;
扫描所述RFID标签来相对于所述区域中位置自动地追踪声音产生元素;以及
将与所述声音产生元素相关联的可配置音频嵌入至视频,其中终端用户能够通过配置与对应声音产生元素特定关联的嵌入音频,来调节每个声音产生元素的音频特性,而不以相应方式调节该视频的其它音频元素。
2.根据权利要求1所述的方法,其中所述一个或者多个音频特性包括音高、音调、音质和音量中的至少一个。
3.根据权利要求1或2所述的方法,进一步包括:
在设备的显示中视觉上呈现接口;以及
显示一个或者多个选项以响应于经由与所述设备相关联的输入机构提供的输入而修改出现在所述显示中的声音产生元素的一个或者多个音频特性。
4.根据权利要求3所述的方法,其中所述一个或者多个选项包括替换所述声音产生元素的音频输出和为所述声音产生元素调节音频特性强度级别中的至少一个。
5.根据权利要求3或4所述的方法,其中所述设备是电视机,其中所述输入机构是遥控器。
6.根据权利要求3或4所述的方法,其中所述设备是计算机,并且其中所述输入机构是鼠标、触摸板、键盘、追踪球、指示棍和触摸屏中的至少一个。
7.根据权利要求3、4或5所述的方法,其中所述视频包括多个角色,其中至少一个所述角色是声音产生元素,其中所述终端用户能够选择所述角色,并且调节所选角色的声音特性,所述声音特性包括所述角色的音量,其中改变所述角色的音量不改变出现在所述视频中的其它未选角色和其它声音产生元素的音量。
8.根据任何前述权利要求所述的方法,进一步包括:
通过确定所述区域中RFID标签的定位,自动地确定所述区域中物理项目的定位;以及
查明对应于所确定的所述物理项目的定位的所述视频的观看区中的定位,其中所述查明的定位被嵌入在具有所述一个或者多个音频特性的视频中。
9.根据权利要求8所述的方法,其中所述记录、扫描、确定、查明和嵌入步骤在所述视频持续期间自动地发生。
10.根据权利要求8或9所述的方法,其中与RFID标签相关联的多个项目在所述持续期间连续地进入和退出所述区域,其中任何前述权利要求的步骤适用于所述多个项目中的每一个,以及其中所述记录、扫描、确定、查明和嵌入步骤自动地发生。
11.根据权利要求8、9、10或11所述的方法,其中所述记录、扫描、确定、查明和嵌入步骤以实时和接近实时中的至少一种方式发生。
12.根据任何前述权利要求的方法,其中所述任何前述权利要求的步骤是根据至少一个如下计算机程序由至少一个机器自动执行的,所述计算机程序具有多个可由所述至少一个机器执行的代码段,所述至少一个计算机程序存储在机器可读介质中。
13.根据权利要求1到11中任一权利要求所述的方法,其中权利要求1到11中任一权利要求中的所述步骤由服务代理和所述服务代理操作的计算设备中的至少一个来执行,所述步骤是响应于服务请求而执行的。
14.一种用于将音频数据嵌入至提供了独立可配置音频元素的视频的系统,包括:
视频捕获系统,其配置成用于捕获一个区域并且将所述区域变成视频的观看区;
音频捕获系统,其配置成用于捕获所述区域中的声音,其中所述区域中的每个声音产生元素相互独立地进行捕获,以及其中所述区域包含对应于每个声音产生元素的物理项目;
接近该区域放置的RFID扫描系统,所述RFID扫描系统配置成用于扫描位于所述区域中的RFID标签,其中所述RFID标签与对应于出现在观看区中的每个声音产生元素的每个物理项目相关联;以及
合并服务器,其配置成用于自动地将一个或者多个音频特性与所捕获的音频和视频进行同步,以便所述一个或者多个音频特性与其中所关联元素出现在所述观看区中的视频时段相关联,其中向多个交互式视频观看设备输送所述视频和所同步的音频特性,所述交互式视频观看设备准许用户使用来自与所述视频观看设备相关联的输入机构的用户提供的输入,来选择性地修改所述视频中每个声音产生元素的音频特性。
15.根据权利要求14所述的系统,其中所述区域中物理项目的位置基于从所述RFID扫描系统获得的信息自动地确定,其中所述合并服务器基于所确定的项目在所述区域中的位置,来自动并动态地查明所述项目在所述观看区中的位置,以及其中所查明的在所述观看区中的位置被包括作为向所述交互式视频观看设备输送的同步音频和视频信息的一部分。
16.一种视频播放系统,包括:
显示器,配置成用于视觉上呈现视频,所述视频包括多个不同声音产生元素;
音频变换器,配置成用于听觉上呈现所述视频的声音;以及
输入机构,配置成用于准许用户选择所述视频的声音产生元素,所述输入机构还包括如下音频调节机构,所述音频调节机构配置成用于准许用户调节特定于所述声音产生元素的声音特性,而不调节所述视频的任何其它声音特性。
17.根据权利要求16所述的视频播放系统,其中所述可调节声音特性包括音高、音调、音质和音量中的至少一个。
18.根据权利要求16或17所述的视频播放系统,其中在所呈现视频的制作期间,每个声音产生元素都用RFID标签和声音捕获设备进行标记,其用于生成具有多个标记的音频组件的数字视频流,每个标记的音频组件包括用所述RFID标签标记的视频对象。
19.根据权利要求16、17或18所述的视频设备,其中所述视频包括多个角色,其中每个所述角色都是声音产生元素,其中所述输入机构配置成用于选择一个出现在所呈现视频中的角色,以及其中所述音频调节机构配置成用于准许用户调节所选角色的声音特性,所述声音特性包括所述角色的音量,其中改变所述角色的音量不改变出现在所述呈现视频中的其他未选角色的音量。
20.根据权利要求16、17、18或19所述的视频设备,其中所述视频包括多个声音产生音乐对象,其中每个所述声音产生音乐对象是声音产生元素,其中所述输入机构配置成用于选择出现在所呈现视频中的音乐对象中的一个,以及其中所述音频调节机构配置成用于准许用户调节所选音乐对象的声音特性,其中所述音乐对象的至少一个购买选项也呈现在所述显示器中,用户能够利用所述输入机构选择所述选项。
21.一种计算机程序,其包括当所述程序在计算机上执行时,适于执行权利要求1到11中任一权利要求所述方法的程序代码装置。
22.一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法,包括:
识别特定于将出现在视频中的声音产生元素的特性;
将RFID标签附加到对应于所述声音产生元素的物理项目;
记录一个区域的视频和音频,所述区域包括所述物理项目;
扫描所述RFID标签以相对于所述区域中的位置自动地追踪所述声音产生元素;以及
将与所述声音产生元素相关联的可配置音频嵌入至所述视频,其中终端用户能够通过配置与对应声音产生元素特定相关联的嵌入音频,来调节每个声音产生元素的音频特性,而不以相应方式调节所述视频的其它音频元素。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/860,185 | 2007-09-24 | ||
US11/860,185 US8339458B2 (en) | 2007-09-24 | 2007-09-24 | Technique for allowing the modification of the audio characteristics of items appearing in an interactive video using RFID tags |
PCT/EP2008/062760 WO2009040372A1 (en) | 2007-09-24 | 2008-09-24 | Technique for allowing the modification of the audio characteristics of items appearing in an interactive video using rfid tags |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101803336A true CN101803336A (zh) | 2010-08-11 |
CN101803336B CN101803336B (zh) | 2013-03-27 |
Family
ID=40383903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801074734A Expired - Fee Related CN101803336B (zh) | 2007-09-24 | 2008-09-24 | 用于对视频进行选择性音频修改的方法和系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8339458B2 (zh) |
EP (1) | EP2204029A1 (zh) |
KR (1) | KR20100058585A (zh) |
CN (1) | CN101803336B (zh) |
WO (1) | WO2009040372A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102172035A (zh) * | 2011-04-26 | 2011-08-31 | 华为技术有限公司 | 视频专题制作方法和系统 |
CN102831366A (zh) * | 2012-06-01 | 2012-12-19 | 北京物资学院 | 一种测声音强度的rfid系统及其测声音强度的方法 |
CN104285452A (zh) * | 2012-03-14 | 2015-01-14 | 诺基亚公司 | 空间音频信号滤波 |
CN107534420A (zh) * | 2015-03-03 | 2018-01-02 | 欧朋德私人有限公司 | 一种用于分布式现场表演预定音频录制、基于云的音频内容编辑和音频磁道及相关元数据的在线内容分布的系统、内容编辑服务器、音频录制从动设备和内容编辑界面 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8917972B2 (en) * | 2007-09-24 | 2014-12-23 | International Business Machines Corporation | Modifying audio in an interactive video using RFID tags |
US8520000B2 (en) * | 2008-07-02 | 2013-08-27 | Icharts, Inc. | Creation, sharing and embedding of interactive charts |
CN103053157B (zh) * | 2010-07-30 | 2017-05-24 | 诺基亚技术有限公司 | 用于确定和均衡媒体轨道的一个或多个段的方法和装置 |
WO2013098587A1 (en) * | 2011-12-27 | 2013-07-04 | Nokia Corporation | Preventing unintentionally violating privacy when sharing and/or publishing content |
CA2864213A1 (en) * | 2012-02-17 | 2013-08-22 | Frank M. WANCA | Method, system and apparatus for integrated dynamic neural stimulation |
TW201426529A (zh) * | 2012-12-26 | 2014-07-01 | Hon Hai Prec Ind Co Ltd | 通訊設備及其播放方法 |
US10230996B1 (en) | 2013-03-14 | 2019-03-12 | Google Llc | Providing disparate audio broadcasts for a content item of a content sharing platform |
FR3004052A1 (fr) * | 2013-03-29 | 2014-10-03 | France Telecom | Procede et dispositif de transmission d'un contenu video, procede et dispositif de restitution d'un contenu video, flux video et programme d'ordinateur correspondants. |
US9705953B2 (en) * | 2013-06-17 | 2017-07-11 | Adobe Systems Incorporated | Local control of digital signal processing |
CN103607555B (zh) * | 2013-10-25 | 2017-03-29 | 上海骋娱传媒技术有限公司 | 一种用于视频交互的方法与设备 |
US9712761B2 (en) * | 2014-05-28 | 2017-07-18 | Qualcomm Incorporated | Method for embedding product information in video using radio frequencey information |
US9665654B2 (en) | 2015-04-30 | 2017-05-30 | Icharts, Inc. | Secure connections in an interactive analytic visualization infrastructure |
CN106952510B (zh) * | 2016-01-06 | 2020-02-18 | 施政 | 音高校准器 |
CN106952532B (zh) * | 2016-01-06 | 2019-08-23 | 施政 | 节奏感培养器 |
CN106778415A (zh) * | 2016-12-13 | 2017-05-31 | 深圳中科讯联科技股份有限公司 | 一种答题器及答题器的通信方法 |
EP3358852A1 (en) * | 2017-02-03 | 2018-08-08 | Nagravision SA | Interactive media content items |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060233055A1 (en) * | 2005-04-15 | 2006-10-19 | Microsoft Corporation | System and method for dynamic media reproduction |
US20070044137A1 (en) * | 2005-08-22 | 2007-02-22 | Bennett James D | Audio-video systems supporting merged audio streams |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5953485A (en) * | 1992-02-07 | 1999-09-14 | Abecassis; Max | Method and system for maintaining audio during video control |
US5920842A (en) * | 1994-10-12 | 1999-07-06 | Pixel Instruments | Signal synchronization |
US20060129458A1 (en) * | 2000-10-12 | 2006-06-15 | Maggio Frank S | Method and system for interacting with on-demand video content |
US8046688B2 (en) * | 2001-06-15 | 2011-10-25 | Sony Corporation | System for and method of adjusting tempo to match audio events to video events or other audio events in a recorded signal |
US6791603B2 (en) | 2002-12-03 | 2004-09-14 | Sensormatic Electronics Corporation | Event driven video tracking system |
US7512886B1 (en) * | 2004-04-15 | 2009-03-31 | Magix Ag | System and method of automatically aligning video scenes with an audio track |
US7929017B2 (en) | 2004-07-28 | 2011-04-19 | Sri International | Method and apparatus for stereo, multi-camera tracking and RF and video track fusion |
US7295116B2 (en) | 2004-09-01 | 2007-11-13 | Microsoft Corporation | Architecture, programming model and API'S |
US7741965B2 (en) | 2005-05-19 | 2010-06-22 | Chung Nam Electronics Co., Ltd. | Radio frequency identification (RFID) system |
EP1929653A1 (en) | 2005-09-28 | 2008-06-11 | U Bridge Co., Ltd. | Information apparatus with rfid tag and control method thereof |
US7408463B2 (en) | 2005-09-30 | 2008-08-05 | Intel Corporation | Radio frequency identification tag |
KR100733965B1 (ko) | 2005-11-01 | 2007-06-29 | 한국전자통신연구원 | 객체기반 오디오 전송/수신 시스템 및 그 방법 |
US7920158B1 (en) * | 2006-07-21 | 2011-04-05 | Avaya Inc. | Individual participant identification in shared video resources |
US8036703B2 (en) * | 2006-12-29 | 2011-10-11 | Texas Instruments Incorporated | Image capture reporting based on content-associated wireless identification |
US8312492B2 (en) * | 2007-03-19 | 2012-11-13 | At&T Intellectual Property I, L.P. | Systems and methods of providing modified media content |
-
2007
- 2007-09-24 US US11/860,185 patent/US8339458B2/en not_active Expired - Fee Related
-
2008
- 2008-09-24 EP EP08804666A patent/EP2204029A1/en not_active Withdrawn
- 2008-09-24 KR KR1020107006363A patent/KR20100058585A/ko active IP Right Grant
- 2008-09-24 WO PCT/EP2008/062760 patent/WO2009040372A1/en active Application Filing
- 2008-09-24 CN CN2008801074734A patent/CN101803336B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060233055A1 (en) * | 2005-04-15 | 2006-10-19 | Microsoft Corporation | System and method for dynamic media reproduction |
US20070044137A1 (en) * | 2005-08-22 | 2007-02-22 | Bennett James D | Audio-video systems supporting merged audio streams |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102172035A (zh) * | 2011-04-26 | 2011-08-31 | 华为技术有限公司 | 视频专题制作方法和系统 |
WO2011113380A2 (zh) * | 2011-04-26 | 2011-09-22 | 华为技术有限公司 | 视频专题制作方法和系统 |
WO2011113380A3 (zh) * | 2011-04-26 | 2012-03-22 | 华为技术有限公司 | 视频专题制作方法和系统 |
CN104285452A (zh) * | 2012-03-14 | 2015-01-14 | 诺基亚公司 | 空间音频信号滤波 |
US11089405B2 (en) | 2012-03-14 | 2021-08-10 | Nokia Technologies Oy | Spatial audio signaling filtering |
CN102831366A (zh) * | 2012-06-01 | 2012-12-19 | 北京物资学院 | 一种测声音强度的rfid系统及其测声音强度的方法 |
CN107534420A (zh) * | 2015-03-03 | 2018-01-02 | 欧朋德私人有限公司 | 一种用于分布式现场表演预定音频录制、基于云的音频内容编辑和音频磁道及相关元数据的在线内容分布的系统、内容编辑服务器、音频录制从动设备和内容编辑界面 |
Also Published As
Publication number | Publication date |
---|---|
WO2009040372A1 (en) | 2009-04-02 |
US20090079833A1 (en) | 2009-03-26 |
EP2204029A1 (en) | 2010-07-07 |
KR20100058585A (ko) | 2010-06-03 |
CN101803336B (zh) | 2013-03-27 |
US8339458B2 (en) | 2012-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101803336B (zh) | 用于对视频进行选择性音频修改的方法和系统 | |
US8917972B2 (en) | Modifying audio in an interactive video using RFID tags | |
US9712862B2 (en) | Apparatus, systems and methods for a content commentary community | |
Zhang et al. | Stages, platforms, streams: The economies and industries of live music after digitalization | |
CN102696223B (zh) | 多功能多媒体装置 | |
CN100425072C (zh) | 信息处理设备、信息处理方法 | |
US8006189B2 (en) | System and method for web based collaboration using digital media | |
US20160330522A1 (en) | Apparatus, systems and methods for a content commentary community | |
US11669296B2 (en) | Computerized systems and methods for hosting and dynamically generating and providing customized media and media experiences | |
US20100058220A1 (en) | Systems, methods, and computer program products for the creation, monetization, distribution, and consumption of metacontent | |
US20020091658A1 (en) | Multimedia electronic education system and method | |
US20070118801A1 (en) | Generation and playback of multimedia presentations | |
CN103988496A (zh) | 用于从多个源创建合成视频的方法和装置 | |
US10762130B2 (en) | Method and system for creating combined media and user-defined audio selection | |
US20190258670A1 (en) | Playlist preview | |
CN104038774B (zh) | 生成铃声文件的方法及装置 | |
WO2020255767A1 (ja) | 情報処理システム、情報処理方法、及び記録媒体 | |
CN103200451A (zh) | 电子设备和音频输出方法 | |
Tidal | Podcasting: A practical guide for librarians | |
WO2021246104A1 (ja) | 制御方法および制御システム | |
WO2021242325A1 (en) | Interactive remote audience projection system | |
Dahlie | In Concert with…: Concert Audio Engineers and Arena Sound Systems, 1965-2018 | |
KR102630214B1 (ko) | 비대면 리액티브 공연을 위한 공연서버 운영 방법 | |
Margaritiadis | Web-Radio Automation Technologies in the Era of Semantic Web | |
JP4796466B2 (ja) | コンテンツ管理サーバ、コンテンツ提示装置、コンテンツ管理プログラム、及びコンテンツ提示プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130327 Termination date: 20200924 |