CN102119531A - 音频/视频系统 - Google Patents

音频/视频系统 Download PDF

Info

Publication number
CN102119531A
CN102119531A CN2008801306002A CN200880130600A CN102119531A CN 102119531 A CN102119531 A CN 102119531A CN 2008801306002 A CN2008801306002 A CN 2008801306002A CN 200880130600 A CN200880130600 A CN 200880130600A CN 102119531 A CN102119531 A CN 102119531A
Authority
CN
China
Prior art keywords
loud speaker
video
audio signal
audio
video display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2008801306002A
Other languages
English (en)
Inventor
T·J·科尔贝特
D·R·因加尔斯
S·格拉斯利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN102119531A publication Critical patent/CN102119531A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

在一个音频/视频系统的实施例中,音频信号被发送到音频/视频系统的多个扬声器,并且根据从该扬声器到音频/视频系统的视频显示器上的明显的声音起点的距离,调整应用于发送给每个扬声器的音频信号的延迟和/或增益。

Description

音频/视频系统
背景技术
视频会议是位于一个或多个远程环境处的参与者和位于本地环境处的参与者之间的模拟面对面合作的建立的方法。通常,在远程环境和本地环境处设置有一个或多个摄像机、一个或多个麦克风、一个或多个视频显示器和一个或多个扬声器。这允许本地环境处的参与者看见、听到远程环境处的参与者并与之交谈。例如,将远程环境处的视频图像广播到本地环境处的一个或多个视频显示器上,并且将伴随的音频信号(例如,有时被称为音频图像)广播到本地环境处的一个或多个扬声器(例如,有时被称为音频显示器)。
视频会议的目标之一是产生一种优质远程呈现体验,其中本地环境处的参与者感觉他们好像实际上出现在远程环境处并且正与远程环境处的参与者进行交互。然而,创建优质远程呈现体验的问题之一是音频和视频图像之间的方向性不匹配。也就是说,参与者的语音的声音可能好像来自与视频显示器上的参与者图像所在的位置不同的位置。例如,正在发言的参与者可能出现在视频显示器的左边,但是声音可能好像来自视频显示器的右边。
附图说明
图1是示出根据本公开的一个实施例的音频/视频系统的实施例的框图。
图2示出根据本公开的另一个实施例的位于房间中的音频/视频系统的实施例的扬声器和视频显示器装置的实施例。
图3是示出根据本公开的另一个实施例的音频/视频系统的实施例的音频部件的实施例的框图。
发明内容
在随后的对本发明实施例的详细说明中,对附图进行参考,附图构成本发明实施例的一部分,并且在附图中以举例说明的方式示出可以实现的特定实施例。充分详细地描述这些实施例以使得本领域技术人员能够实现所公开的主题,并且应当理解的是,可使用其他的实施例并且在不背离所主张的主题的范围的情况下可以进行过程、电子的或机械的改变。因此随后的详细说明不应当被视为是限制的意思,并且所主张的主题的范围仅仅由所附的权利要求及其等价物来限定。
图1是示出根据一个实施例的音频/视频系统100的框图,该音频/视频系统100可以用在诸如视频会议室的房间中。音频/视频系统100例如通过网络从音频/视频源(诸如一个或多个远程视频会议室的音频/视频系统)接收编码的组合音频/视频信号A/V。例如,可以在信号分割器105处接收编码的组合音频/视频信号A/V,所述信号分割器105诸如传送处理器,其从音频/视频信号A/V提取编码的音频信号A和编码的视频信号V。
编码的视频信号V和编码的音频信号A分别在视频信号解码器110和音频信号解码器115处被解码。解码的视频信号被发送给视频处理器125,在一个实施例中视频处理器125继而将经处理的视频信号发送给投影仪,所述投影仪例如作为前或后投影系统的一部分,从前方或者从后方将包含在视频信号中的图像投影在诸如具有电子装置的有源显示器或无源显示器的视频显示器130上。对于另一个实施例,视频显示器130可以是无投影显示器,诸如液晶显示器或等离子显示器,在这种情况下将视频信号从视频处理器125直接发送给视频显示器130。
解码的音频信号被发送给音频处理器135,音频处理器135继而将经处理的音频信号发送给一个或多个扬声器140。控制器145将信号(例如,被称为命令或指令)发送给音频和视频解码器以及音频和视频处理器,以用于控制音频和视频解码器以及音频和视频处理器。例如,视频处理器125可以响应于来自控制器145的命令而发送视频信号到视频显示器130,并且音频处理器135可以响应于来自控制器145的另一命令而发送音频信号到扬声器140。
对于一个实施例,控制器145包括用于处理计算机/处理器可读指令的处理器150。这些计算机可读指令可以存储在诸如计算机可用介质的存储器155中,并且可以是软件、固件或硬件的形式。在硬件的解决方案中,指令被硬编码为处理器150(例如特定用途集成电路(ASIC)芯片)的一部分。在软件或固件的解决方案中,将指令存储以供处理器150检索。计算机可用介质的一些另外的例子包括永久的或者可移动的静态或动态随机存取存储器(SRAM或DRAM)、只读存储器(ROM)、电可擦除可编程ROM(EEPROM或闪存)、磁介质或光学介质。大多数面向用户的计算机应用是提供给用户的在一些可移除计算机可用介质上的软件解决方案,其中所述可移除计算机可用介质诸如光盘只读存储器(CD-ROM)。计算机可读指令使控制器145执行各种方法,诸如控制音频和视频解码器以及音频和视频处理器。例如,计算机可读指令可使控制器145发送命令到音频处理器135以对在音频处理器135处接收的音频信号应用一定的增益和定时(例如时间延迟),从而使得音频处理器135可以将来自扬声器的声音关联到声音好像源自的视频显示器130的一部分,如下所述。
图2示出根据另一个实施例的位于诸如视频会议室的房间中的示例扬声器和视频显示器装置。例如,视频显示器130可以包括如图2所示的单个视频监视器或多个视频监视器210。距离a1可以将视频监视器2101与视频监视器2102分开,距离a2可以将视频监视器2102与视频监视器2103分开。对于一个实施例,距离a包括视频监视器210的边框215和这些边框之间的间隙。对于另一实施例,间隙可以被去除;边框可以被去除;或者间隙和边框二者都可以被去除。
显示在视频显示器130上的图像可以接收自一个或多个远程视频会议室,例如正如上面结合图1所描述的那样。例如,在视频信号解码器110处可以从单个远程视频会议室内的不同的位置(诸如在单个远程视频会议室内的不同位置处放置的摄像机)接收编码的音频信号V1-VN(图1)。可替换地,在视频信号编码器110处可以分别从不同的远程视频会议室接收编码的视频信号V1-VN。例如,可以从第一视频会议室中的一个或多个摄像机接收编码的视频信号V1,从第二视频会议室中的一个或多个摄像机接收编码的视频信号V2,以及从第N个视频会议室中的一个或多个摄像机接收编码的视频信号VN
对于一个实施例,为每个视频会议室配置预定视频配置。例如,可以预定:将包含在视频信号V1-VN的各个视频信号中的视频显示在具有多个视频监视器的显示器的预定视频监视器的各个视频监视器上。例如,对于如图2所示带有三个视频监视器210的显示器130来说,可以预定:将包含在解码的视频信号V1中的视频显示在监视器2101上,将包含在解码的视频信号V2中的视频显示在监视器2102上,以及将包含在解码的视频信号VN中的视频显示在监视器2103上。也就是说,可以预定特定的视频监视器210显示包含在特定视频信号V中的视频。
对于使用单个视频监视器的实施例,可以预定:将包含在视频信号V1-VN的各个视频信号中的视频显示在单个视频监视器的预定部分的各个部分上。例如,可以预定:将包含在解码的视频信号V1中的视频显示在单个监视器的左边部分中,将包含在解码的视频信号V2中的视频显示在单个监视器的中间部分中,以及将包含在解码的视频信号VN中的视频显示在单个监视器的右边部分中。
对于视频监视器是投影系统的一部分的实施例,在一个或多个投影仪处从视频处理器125接收解码的视频信号V1、V2和VN,并且来自解码的视频信号V1、V2和VN的图像被分别投影到相应的视频监视器2101、2102和2103上,或者被分别投影到单个视频监视器的左边部分上、中间部分上和右边部分上。对于视频监视器2101、2102和2103是无投影视频监视器的实施例,解码的视频信号V1、V2和VN被从视频处理器125分别直接发送给视频监视器2101、2102和2103。对于单个无投影视频监视器,例如,可以将解码的视频信号V1、V2和VN分别直接发送到该监视器的左边部分、中间部分和右边部分。
对于一个实施例,调整包含在视频信号V1-VN中的视频以使得诸如桌子220和参与者230的目标跨越视频监视器210的边界看起来是连续的。对于其他的实施例,可以调整发起端的远程视频会议室处的摄像机以使得目标跨越视频监视器210的边界看起来是连续的。
对于一个实施例,扬声器140可以位于视频显示器130的任何一侧。对于另一个实施例,代替扬声器140或除扬声器140之外,可以在视频监视器210中的一个或多个视频监视器的下方设置扬声器。扬声器也可以位于视频会议室的天花板和/或地板上。在工作期间,当视频图像显示在视频监视器210上时,与该视频图像对应的音频信号(例如有时被称为音频图像)被发送给扬声器140。
图3是示出根据另一个实施例的音频/视频系统100的音频部件的框图,其中音频/视频系统100包括音频信号解码器115、音频处理器135和扬声器140。具体地,图3示出应用于在音频处理器135处接收的音频信号310的增益和定时。对于一个实施例,根据存储在存储器155中的计算机可读指令,响应于来自控制器145的命令而应用增益和定时。
对于一个实施例,编码的视频信号V1-VN分别对应于编码的音频信号A1-AN。也就是说,包含在音频信号A1-AN的各个音频信号中的音频对应于包含在视频信号V1-VN的各个视频信号中的视频。对于一个实施例,可以在音频信号解码器115处从单个远程视频会议室内的不同位置(诸如布置在远程视频会议室内的不同位置处的麦克风)接收编码的音频信号A1-AN(图3),并且可以在视频信号编码器110处从布置在该视频会议室内的不同位置处的摄像机接收各个相应的编码的视频信号V1-VN
可替代地,可以在音频信号编码器115处从不同的远程视频会议室分别接收编码的音频信号A1-AN,并且可以在视频信号编码器110处从那些会议室分别接收各个相应的编码的视频信号V1-VN。例如,可以从第一视频会议室中的一个或多个麦克风接收编码的音频信号A1,以及可以从第一视频会议室中的一个或多个摄像机接收相应的编码的视频信号V1。相似地,可以从第二视频会议室中的一个或多个麦克风接收编码的音频信号A2,以及可以从第二视频会议室的一个或多个摄像机接收相应的编码的视频信号V2。同样地,可以从第N个视频会议室中的一个或多个麦克风接收编码的音频信号AN,以及可以从第N个视频会议室中的一个或多个摄像机接收相应的编码的视频信号VN
音频信号解码器115发送解码的音频信号3101至310N到音频处理器135的输出通道1-M中的每个输出通道,如图3所示,其中通道1-M一对一地耦合到扬声器1401-140M。需要注意的是,解码的音频信号3101-310N是从编码的音频信号A1-AN分别解码出的。这样,从单个远程视频会议室的不同位置或者从不同的远程视频会议室分别接收解码的音频信号3101-310N。也就是说,图3中的远程位置1-N可以是单个远程视频会议室中的不同位置,或者是不同的远程视频会议室,或者是以上两者的结合。例如,图1中的参与者2301和2302可以在单个远程视频会议室内的不同位置(例如分别是远程位置1和N)。可替代地,参与者2301可以是第一远程视频会议室(例如远程位置1)处的一个或多个参与者之一,并且参与者2302可以是第二远程视频会议室(例如远程位置N)处的一个或多个参与者之一。
通道1-M分别输出音频信号3401-340M到扬声器1401-140M。例如,在通道1-M的每个通道处,音频处理器135例如响应于来自控制器145的命令而对在该通道处所接收的信号310应用增益和/或定时。然后,在每个通道处,将其中对其应用了各自的增益和/或定时的音频信号3101-310M分别输出作为音频信号3401-340M。对于一个实施例,定时可以包括将音频信号3401-340M中的一个或多个音频信号相对于其他音频信号进行延迟。
对于另一个实施例,当确定对应于音频信号的声音似乎源自视频显示器130的某一部分(诸如参与者2301正在发言时的视频监视器2101(图2))时,在更远离视频显示器130的那部分的扬声器(例如扬声器140M)处接收的音频信号与离视频显示器130的那部分更近的扬声器(例如扬声器1401)相比可以具有更低的增益,并且/或者可以相对于离视频显示器130的那部分更近的扬声器被延迟。这用于将扬声器的位置以及因此来自该扬声器的声音关联到声音似乎源自的视频显示器上的位置。
对于一个实施例,预定声音似乎源自的视频显示器130的那部分,其中正在制造声音的诸如参与者2301的图像在其上的视频显示器130的该预定部分定义和对应于声音似乎源自的视频显示器130的那部分。对于一些实施例,从每个扬声器140到视频显示器130的不同部分的距离也被预定,从而使得每个扬声器140和声音似乎源自的视频显示器130的每个部分之间的距离被预定。因此,正如刚才描述的,基于声音似乎源自的视频显示器130的预定部分和扬声器140之间的预定距离,可以对与包含产生声音的图像的视频信号相对应的音频信号进行调整。
对于图2的例子,其中扬声器1401位于视频显示器130的左边,扬声器140M位于视频显示器130的右边,当参与者2301(例如在远程位置1处)正在讲话且参与者2302(例如在远程位置N处)没有在讲话时,在音频处理器135的通道1和通道M处接收到与产生参与者2301的图像的视频信号相对应的音频信号3101。需要注意的是,在这个情形下,对应于音频信号3101的声音是从离扬声器1401更近的视频显示器130的那部分(例如视频显示器上的明显的声音起点)发出的,例如从参与者2301发出。进一步需注意的是,视频显示器上的明显的声音起点的位置被预定,其中明显的声音起点的位置对应于视频显示器130上的其中显示有包含在视频信号中的参与者2301的图像的预定位置(例如视频监视器2101),并被其限定。此外,可以预定扬声器1401和140M与视频显示器上的预定的明显的声音起点之间的距离。
为了使来自扬声器的声音听起来似乎源自参与者2301,例如响应于来自控制器145的命令而在通道1处应用到音频信号3101的位置1增益可以大于例如响应于来自控制器145的命令而在通道M处应用到音频信号3101的位置1增益。也就是说,与去往离视频显示器上的明显的声音起点(诸如参与者2301)更远的扬声器140M的音频信号3101相比,对去往离视频显示器上的明显的声音起点更近的扬声器1401的音频信号3101应用更高的增益。例如,由应用到去往扬声器1401的音频信号3101的增益导致的音频信号3401的声音压力水平大于由应用到去往扬声器140M的音频信号3101的增益导致的音频信号340M的声音压力水平。
对于包括另外的扬声器的其他实施例,可以例如响应于来自控制器145的命令,根据从视频显示器上的明显的声音起点(诸如参与者2301)到音频信号310去往的扬声器140的距离,将增益应用于那些音频信号310。例如,当从参与者2301到扬声器的距离增大时,增益可以减小。例如,如果扬声器1402比扬声器140M距离参与者2301更近且比扬声器1401距离参与者2301更远,那么在通道2处应用到去往扬声器1402的音频信号3101的增益可能比应用到去往扬声器1401的音频信号3101的增益更小并且比应用到去往扬声器140M的音频信号3101的增益更大,从而音频信号3402的声音压力水平比音频信号340M的声音压力水平更大,并且比音频信号3401的声音压力水平更小。
继续图2中示出的示例,当参与者2301正在讲话而参与者2302没有在讲话时,为了使来自扬声器的声音显得好像是从参与者2301发出的,可以例如响应于来自控制器145的命令而调整定时,以使得音频信号340M相对于音频信号3401被延迟,从而使得先听到来自扬声器1401的声音,从而给人声音基本上完全来自扬声器1401且因此来自参与者2301的印象。这被称为优先效应。例如,在通道M处对去往扬声器140M的音频信号3101应用延迟。也就是,去往距离视频显示器上的明显的声音起点更远的扬声器140的音频信号3101相对于去往距离视频显示器上的明显的声音起点更近的扬声器140的音频信号3101被延迟。
对于包括另外的扬声器的其他实施例,可以例如响应于来自控制器145的命令,根据从视频显示器上的明显的声音起点(诸如参与者2301)到音频信号310去往的扬声器140的距离,对那些音频信号310应用延迟。例如,延迟可以随着从参与者2301到扬声器的距离的减小而减小,或者反之亦然,例如从对去往距离视频显示器上的明显的声音起点最近的扬声器的信号应用零延迟开始。例如,如果扬声器1402比扬声器140M距离参与者2301更近且比扬声器1401距离参与者2301更远,则在通道2处对去往扬声器1402的音频信号3101应用的延迟可以比对去往扬声器140M的音频信号3101应用的延迟更小且比对去往扬声器1401的音频信号3101应用的延迟(例如零延迟)更大。
对于一个实施例,延迟可以与由各扬声器与所述扬声器所位于的视频会议室内的一定位置(诸如参与者可能位于的视频会议室内的桌子的位置)之间的路径长度的不同而导致的时间延迟近似。例如对去往扬声器140M的音频信号3101应用的延迟可以与由于扬声器1401和140M与一定位置之间的路径长度的不同而导致的延迟近似。对于另一个实施例,例如延迟可以基本上等于或大于由于各扬声器与一定位置之间的的路径长度的不同而导致的延迟。
对于图2中示出的例子,当参与者2301正在讲话而参与者2302没有在讲话时,可以例如响应于来自控制器145的命令而对增益和信号定时二者进行调整。例如,由应用到去往扬声器1401的音频信号3101的增益而产生的音频信号3401的声音压力水平可以比由应用到去往扬声器140M的音频信号3101的增益而产生的音频信号340M的声音压力水平更大。音频信号340M也可以相对于音频信号3401被延迟。也就是说,当对应于音频信号3101的声音发自距离扬声器1401比距离扬声器140M更近的视频显示器的部分时,在扬声器140M处接收的音频信号340M比在扬声器1401处接收的音频信号3401具有更低的增益和声音压力水平且相对于在扬声器1401处接收的的音频信号3401被延迟。
对于包括另外的扬声器的其他实施例,可以例如响应于来自控制器145的命令,根据从视频显示器上的明显的声音起点(诸如参与者2301)到音频信号310去往的扬声器140的距离,对那些音频信号310应用延迟和增益二者。例如,如果扬声器1402比扬声器140M距离参与者2301更近且比扬声器1401距离参与者2301更远,那么在扬声器1402处接收的音频信号3402比在扬声器1401处接收的音频信号3401具有更低的增益和声音压力水平并且相对于在扬声器1401处接收的音频信号3401被延迟,并且在扬声器140M处接收的音频信号340M比在1402处接收的音频信号3402具有更低的增益和声音压力水平并且相对于在扬声器1402处接收的音频信号3402被延迟。
虽然上面的例子是针对来自远程位置1的音频信号3401,但是应当理解的是,可以针对剩余远程位置的剩余音频信号310中的每一个提供相似的例子。例如,参与者2302可以处于远程位置N。对于其中参与者2302在讲话而参与者2301没有在讲话的例子,对应于在视频监视器130上产生参与者2302的图像的视频信号、去往比扬声器140M距离参与者2302更远的扬声器1401的音频信号310N可以具有比在通道M处应用到去往扬声器140M的音频信号310N的增益更低的在通道1处被应用到其的增益,并且/或者去往扬声器1401的音频信号310N相对于去往扬声器140M的音频信号310N被延迟。因此从通道1输出并且在扬声器1401处被接收的音频信号3401将比从通道M输出并且在扬声器140M处被接收的音频信号340M具有更低的声音压力水平,并且/或者音频信号3401相对于音频信号340M将被延迟。因此,声音听起来似乎来自距离正在讲话的参与者2302最近的扬声器140M
对于一个实施例,可以为用于不同类型的视频会议系统(例如不同的视频显示器、不同的扬声器装置等等)和不同类型的视频会议室(例如视频显示器和参与者就坐位置之间的不同距离、扬声器和参与者就坐位置之间的不同距离、不同数量的参与者、扬声器和视频显示器的各个位置之间的不同距离,等等)的每个扬声器确定音频信号增益和/或延迟。例如,对应不同的音频信号增益和/或时间延迟的数值可以存储在控制器145的存储器155中,例如如图3所示的查询表160中。控制器145可以根据视频会议系统的类型和视频会议室的类型,为每一个扬声器的音频信号增益和/或延迟选择数值。例如,控制器145可以进入具有每个扬声器与视频显示器上明显的声音起点之间的距离的查询表160,并且根据从该扬声器到视频显示器上明显的声音起点的距离为每个扬声器的音频信号增益和/或延迟提取数值。
对于另一个实施例,可以为多个视频会议室将表示从每个扬声器到视频显示器上的不同位置之间的距离的数值存储在存储器155中,诸如查询表160中。另外,对于多个视频会议室配置,也可以将来自视频信号的视频位于的视频显示器上的预定位置、以及从而将明显的声音起点的预定位置存储在存储器155中,诸如查询表160中。因此控制器145能够进入具有给定房间配置的查询表160,并使包含在每个视频信号中的视频被显示在视频显示器上的预定位置处。另外,控制器145可以进入具有视频显示器上的明显的声音起点的预定位置的查询表160,并且为给定房间提取表示从每个扬声器到视频显示器上的明显的声音起点的距离的数值,并随后指示音频处理器135根据所确定的距离为每个扬声器调整增益和延迟。
结论
虽然在此示出和描述了特定的实施例,但是显然其目的在于,仅通过随后的权利要求及其等价物来限定请求保护的主题的范围。

Claims (20)

1.一种计算机可用介质,其包括用于使得音频/视频系统执行一种方法的计算机可读指令,所述方法包括:
发送音频信号到音频/视频系统的多个扬声器;以及
调整应用到发送给所述多个扬声器中的每个扬声器的音频信号的延迟和/或增益,所述调整是基于从该扬声器到音频/视频系统的视频显示器上的明显的声音起点的距离,。
2.如权利要求1所述的计算机可用介质,其中该方法还包括:随着从视频显示器上的明显的声音起点到该扬声器的距离的增大而增大应用到发送给所述多个扬声器中的每个扬声器的音频信号的延迟,和/或随着从视频显示器上的明显的声音起点到该扬声器的距离的减小而增大应用到发送给所述多个扬声器中的每个扬声器的音频信号的增益。
3.如权利要求1所述的计算机可用介质,其中该方法还包括:在音频/视频系统的视频显示器上的预定位置处显示与所述音频信号相对应的视频信号中包含的图像,其中该预定位置对应于视频显示器上的明显的声音起点。
4.如权利要求1所述的计算机可用介质,其中该方法还包括:从查询表确定从视频显示器上的明显的声音起点到所述多个扬声器中的每个扬声器的距离。
5.一种音频/视频系统,包括:
视频显示器;
耦合到视频显示器的视频处理器,该视频处理器被配置为将视频信号发送给视频显示器;
多个扬声器;
耦合到所述多个扬声器的音频处理器,该音频处理器被配置为将对应于所述视频信号的音频信号发送给所述多个扬声器;以及
耦合到音频处理器和视频处理器的控制器;
其中所述控制器被配置为根据从该扬声器到对应于所述视频信号的、声音似乎从其发出的视频显示器上的图像的距离,对发送给所述多个扬声器中的每个扬声器的音频信号应用延迟和/或增益。
6.如权利要求5所述的音频/视频系统,还包括存储器,所述存储器被配置为存储与应用到发送给所述多个扬声器中的每个扬声器的音频信号的增益相对应的数值,和/或与应用到发送给所述多个扬声器中的每个扬声器的音频信号的延迟相对应的数值。
7.如权利要求5所述的音频/视频系统,其中应用到发送给所述多个扬声器中的每个扬声器的音频信号的延迟随着从该扬声器到视频显示器上的所述图像的距离的增大而增大,和/或应用到发送给所述多个扬声器中的每个扬声器的音频信号的增益随着从该扬声器到视频显示器上的所述图像的距离的减小而增大。
8.一种计算机可用介质,包括用于使得音频/视频系统执行一种方法的计算机可读指令,所述方法包括:
发送音频信号到音频/视频系统的至少第一和第二扬声器;以及
当第二扬声器比第一扬声器距离音频/视频系统的视频显示器上的明显的声音起点更近时,将发送给第一扬声器的音频信号相对于发送给第二扬声器的音频信号进行延迟,和/或增大发送给第二扬声器的音频信号的增益以使其大于发送给第一扬声器的音频信号的增益。
9.如权利要求8所述的计算机可用介质,其中所述方法还包括:
发送音频信号到音频/视频系统的第三扬声器;以及
当第三扬声器比第一扬声器距离视频显示器上的明显的声音起点更远时,相对于第一扬声器将发送给第三扬声器的音频信号进行延迟,和/或减小发送给第三扬声器的音频信号的增益以使其低于发送给第一扬声器的音频信号的增益。
10.如权利要求8所述的计算机可用介质,其中所述方法还包括:从查询表确定发送给第一和第二扬声器的音频信号的增益,和/或从查询表确定发送给第一扬声器的音频信号相对于发送给第二扬声器的音频信号被延迟的量。
11.如权利要求8所述的计算机可用介质,其中所述明显的声音起点对应于显示在视频显示器的预定位置处的图像。
12.如权利要求8所述的计算机可用介质,其中所述延迟与由于第一和第二扬声器与这些扬声器所位于的房间内的一定位置之间的路径长度的不同而导致的时间延迟近似。
13.如权利要求8所述的计算机可用介质,其中所述方法还包括:从查询表确定第一和第二扬声器与视频显示器上的明显的声音起点之间的距离。
14.一种用于视频会议室的音频/视频系统,包括:
视频显示器;
耦合到视频显示器的视频处理器;
至少第一和第二扬声器;
耦合到至少第一和第二扬声器的音频处理器;和
耦合到音频处理器和视频处理器的控制器;
其中所述视频处理器被配置为发送视频信号到视频显示器;
其中所述音频处理器被配置为发送音频信号到第一扬声器和第二扬声器;以及
其中当第二扬声器距离对应于视频信号的视频显示器上的图像更近时,音频处理器被配置为相对于发送给第二扬声器的音频信号延迟发送给第一扬声器的音频信号,和/或响应于来自控制器的指令而增大发送给第二扬声器的音频信号的增益以使其大于发送给第一扬声器的音频信号的增益。
15.如权利要求14所述的音频/视频系统,其中所述控制器被配置为使得视频显示器上的所述图像被显示在视频显示器上的预定位置处。
16.如权利要求15所述的音频/视频系统,还包括存储器,所述存储器被配置为用于存储所述预定位置。
17.如权利要求16所述的音频/视频系统,其中所述存储器被配置为用于存储视频显示器上的所述预定位置与第一和第二扬声器之间的距离。
18.一种音频/视频系统的操作方法,包括:
发送音频信号到音频/视频系统的多个扬声器;
在音频/视频系统的视频显示器上的预定位置处显示对应于该音频信号的视频,其中所述预定位置位于距离所述多个扬声器中的各扬声器预定距离之处;
基于从视频显示器上的所述预定位置到该扬声器的所述预定距离,调整应用于发送给所述多个扬声器中的每个扬声器的音频信号的延迟,和/或基于从视频显示器上的所述预定位置到该扬声器的所述预定距离,调整应用于发送给所述多个扬声器中的每个扬声器的音频信号的增益。
19.如权利要求18所述的方法,还包括随着从视频显示器上的所述预定位置到该扬声器的距离的增大而增大应用到发送给所述多个扬声器中的每个扬声器的音频信号的延迟,和/或随着从视频显示器上的所述预定位置到该扬声器的距离的减小而增大应用到发送给所述多个扬声器中的每个扬声器的音频信号的增益。
20.如权利要求18所述的方法,其中应用到所述多个扬声器中的每个扬声器的所述延迟和/或增益被存储在音频/视频系统的存储器中。
CN2008801306002A 2008-08-13 2008-08-13 音频/视频系统 Pending CN102119531A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2008/072982 WO2010019140A1 (en) 2008-08-13 2008-08-13 Audio/video system

Publications (1)

Publication Number Publication Date
CN102119531A true CN102119531A (zh) 2011-07-06

Family

ID=41669112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801306002A Pending CN102119531A (zh) 2008-08-13 2008-08-13 音频/视频系统

Country Status (5)

Country Link
US (1) US20110134207A1 (zh)
EP (1) EP2324628A1 (zh)
CN (1) CN102119531A (zh)
BR (1) BRPI0822671A2 (zh)
WO (1) WO2010019140A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104952456A (zh) * 2014-03-24 2015-09-30 联想(北京)有限公司 一种语音处理方法以及一种电子设备
CN106686369A (zh) * 2016-12-28 2017-05-17 努比亚技术有限公司 一种3d显示模式下音频播放的控制方法及移动终端
CN109246545A (zh) * 2018-09-04 2019-01-18 福建星网智慧科技股份有限公司 一种双屏音频输出方法
CN112136331A (zh) * 2017-06-08 2020-12-25 Dts公司 对于扬声器延迟的校正
CN113220517A (zh) * 2021-05-28 2021-08-06 Oppo广东移动通信有限公司 操作耗时测试系统、信号处理设备及信号处理方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102342081B1 (ko) * 2015-04-22 2021-12-23 삼성디스플레이 주식회사 멀티미디어 장치 및 이의 구동 방법
CN112911354B (zh) * 2019-12-03 2022-11-15 海信视像科技股份有限公司 显示设备和声音控制方法
FR3105686A1 (fr) * 2019-12-18 2021-06-25 Sagemcom Broadband Sas Equipement décodeur à double liaison audio

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994016406A1 (en) * 1993-01-11 1994-07-21 Ritchey Kurtis J Improved panoramic image based virtual reality/telepresence audio-visual system and method
KR19990051428A (ko) * 1997-12-19 1999-07-05 구자홍 네트워크상에서의 오디오/비디오 패킷 제어방법
CN1720760A (zh) * 2002-12-10 2006-01-11 索尼株式会社 具有投影屏的阵列扬声器设备
CN1732687A (zh) * 2002-12-30 2006-02-08 摩托罗拉公司 用于远程临场通信的方法、系统和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548346A (en) * 1993-11-05 1996-08-20 Hitachi, Ltd. Apparatus for integrally controlling audio and video signals in real time and multi-site communication control method
US6125343A (en) * 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US7613313B2 (en) * 2004-01-09 2009-11-03 Hewlett-Packard Development Company, L.P. System and method for control of audio field based on position of user
JP4973919B2 (ja) * 2006-10-23 2012-07-11 ソニー株式会社 出力制御システムおよび方法、出力制御装置および方法、並びにプログラム
KR101542233B1 (ko) * 2008-11-04 2015-08-05 삼성전자 주식회사 화면음원 정위장치, 화면음원 정위를 위한 스피커 셋 정보 생성방법 및 정위된 화면음원 재생방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994016406A1 (en) * 1993-01-11 1994-07-21 Ritchey Kurtis J Improved panoramic image based virtual reality/telepresence audio-visual system and method
US5495576A (en) * 1993-01-11 1996-02-27 Ritchey; Kurtis J. Panoramic image based virtual reality/telepresence audio-visual system and method
KR19990051428A (ko) * 1997-12-19 1999-07-05 구자홍 네트워크상에서의 오디오/비디오 패킷 제어방법
CN1720760A (zh) * 2002-12-10 2006-01-11 索尼株式会社 具有投影屏的阵列扬声器设备
CN1732687A (zh) * 2002-12-30 2006-02-08 摩托罗拉公司 用于远程临场通信的方法、系统和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104952456A (zh) * 2014-03-24 2015-09-30 联想(北京)有限公司 一种语音处理方法以及一种电子设备
CN106686369A (zh) * 2016-12-28 2017-05-17 努比亚技术有限公司 一种3d显示模式下音频播放的控制方法及移动终端
CN112136331A (zh) * 2017-06-08 2020-12-25 Dts公司 对于扬声器延迟的校正
CN109246545A (zh) * 2018-09-04 2019-01-18 福建星网智慧科技股份有限公司 一种双屏音频输出方法
CN113220517A (zh) * 2021-05-28 2021-08-06 Oppo广东移动通信有限公司 操作耗时测试系统、信号处理设备及信号处理方法

Also Published As

Publication number Publication date
WO2010019140A1 (en) 2010-02-18
BRPI0822671A2 (pt) 2015-06-30
EP2324628A1 (en) 2011-05-25
US20110134207A1 (en) 2011-06-09

Similar Documents

Publication Publication Date Title
CN102119531A (zh) 音频/视频系统
JP2975687B2 (ja) 第1局・第2局間に音声信号とビデオ信号とを送信する方法、局、テレビ会議システム、第1局・第2局間に音声信号を伝送する方法
US8379076B2 (en) System and method for displaying a multipoint videoconference
US9065973B2 (en) System and method for displaying a videoconference
US8736663B2 (en) Media detection and packet distribution in a multipoint conference
CN1984310B (zh) 再现运动图像的方法和通信装置
US20050213747A1 (en) Hybrid monaural and multichannel audio for conferencing
US20130093837A1 (en) Method and apparatus for processing audio in video communication
JP2006254064A (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
CN102209225B (zh) 视频通信的实现方法及装置
JP2006339869A (ja) 映像信号と音響信号の統合装置
JPH0758859A (ja) 遠隔会議用情報送信装置及び情報受信装置
US20120150542A1 (en) Telephone or other device with speaker-based or location-based sound field processing
JP2001339799A (ja) 仮想会議装置
JP2023043497A (ja) リモート会議システム
Kahle et al. Perceptual relevance of location of reverberation in a concert hall.
JPH03252258A (ja) 指向性再生装置
US11019216B1 (en) System and method for acoustically defined remote audience positions
JPH03141799A (ja) 拡声システム
WO2024116945A1 (ja) 音声信号処理装置、音声装置及び音声信号処理方法
WO2011153926A1 (zh) 会场图像广播方法及多点控制单元
JP2005110103A (ja) テレビ会議における音声の定位方法
EP3917162A1 (en) System and devices for audio-video spatial communication and event sharing
JP4849494B2 (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
JP2023020331A (ja) 遠隔会議方法、及び遠隔会議システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110706

WD01 Invention patent application deemed withdrawn after publication