WO2012000297A1

WO2012000297A1 - 多点混音远景呈现方法、装置及系统

Info

Publication number: WO2012000297A1
Application number: PCT/CN2010/080331
Authority: WO
Inventors: 吴明亮; 孙波
Original assignee: 中兴通讯股份有限公司
Priority date: 2010-06-29
Filing date: 2010-12-27
Publication date: 2012-01-05
Also published as: US20130103393A1; CN101877643A; CN101877643B; EP2590360B1; EP2590360A4; EP2590360A1

Abstract

本发明公开了一种多点混音远景呈现方法、装置及系统。其中，该多点混音远景呈现方法包括：接收来自多个会场的音频码流，其中，每个会场包括一个或多个会议区域，每个会议区域均对应一路音频码流；将各个会场中相应的会议区域的音频码流相混合；将混合后的音频码流输出至各个会场中的相应的会议区域。通过本发明提供的技术方案，能够区分远景呈现会议系统中不同区域的声音。

Description

多点;昆音远景呈现方法、装置及系统技术领域本发明涉及通信领域，具体而言，涉及一种多点混音远景呈现方法、装置及系统。背景技术远景呈现以其真实的临场感深受高端用户的喜爱，听声辩位、真身大小、眼神交流是远景呈现中的关键技术指标。在传统会议系统中，每个会场都只有一路音频或两路音频，每个会场听到的声音是整个会议中三个声音最大会场混音叠加后的声音，每个会场声音的输入源和输出只有一个，无法感受到声音从会场的哪个方位发出。在远景呈现会议系统中，每个会场有单屏或者多个屏，每个屏显示一个与会者图像，相应的每个与会者对应了一路音频输入。要达到听声辩位的效果，那么在多屏的情况下，比如三屏会场，左席发言，那么其他会场的与会人员应该听到声音从左侧发出，右中席发言，其他会场的与会人员应该听到声音从中间发出，席发言，其他会场的与会人员应该听到声音从右侧发出。发言者图像显示在会场哪个屏，声音即从该屏所在方位发出，即声音跟随图像。这种情况下，不同方位的音频输入输出，需要区别对待进行不同的混音，传统的单路音频混音方法显然不能满足这种情况。同时在单屏和多屏会场互通的多点会议中，单展和多展会场如何混音输出，同时不影响两个会场听声辩位的效果，也是需要解决的问题。发明人发现，上述的相关技术中，远景呈现会议系统难以对不同区域的声音进行区分。发明内容本发明的主要目的在于提供一种多点混音远景呈现方法、装置及系统，以至少解决上述的远景呈现会议系统难以对不同区域的声音进行区分的问题。根据本发明的一个方面，提供了一种多点混音远景呈现方法，包括：接收来自多个会场的音频码流，其中，每个会场包括一个或多个会议区域，每个会议区域对应一路音频码流；将各个会场中相应的会议区域的音频码流相混合；将混合后的音频码流输出至各个会场中的相应的会议区域。进一步地，各个会议区域分别对应不同的方位，则上述将各个会场中相应的会议区域的音频码流相混合包括：将各个会场中具有相同方位的会议区域的音频码流相混合；则上述将混合后的音频码流输出至各个会场中的相应的会议区域包括：将混合后的音频码流输出至具有相同方位的会议区域。进一步地，音频码流中包含会议区域的方位信息，则上述将各个会场中具有相同方位的会议区域的音频码流相混合包括：按照方位信息将各个会场中具有相同方位的会议区域的音频码流相混合。进一步地，在多个会场中存在包括一个会议区域的第一会场和包括多个会议区域的第二会场的情况下，则上述将各个会场中相应的会议区域的音频码流相混合包括：将第一会场的会议区域的音频码流和第二会场的会议区域中之一的音频码流相混合。进一步地，上述将混合后的音频码流输出至各个会场中的相应的会议区域包括：将混合后的音频码流输出至第一会场的会议区域和第二会场中与第一会场的会议区域的音频码流相混合的会议区域。进一步地，上述方法还包括：将多个会场中所有会议区域的音频码流相混合，并将混合后的音频码流输出至第一会场。进一步地，多个会场中的一个或任意多个会场包括左、中、右三个会议区域。根据本发明的另一方面，提供了一种多点混音远景呈现装置，包括：接收模块，用于接收来自多个会场的音频码流，其中，每个会场包括一个或多个会议区域，每个会议区域对应一路音频码流；混音模块，用于将各个会场中相应的会议区域的音频码流相混合；输出模块，用于将混合后的音频码流输出至各个会场中的相应的会议区域。才艮据本发明的另一方面，提供了一种多点混音远景呈现系统，包括：多个会场，其中，每个会场包括一个或多个会议区域，每个会议区域均对应一路音频码流，多点混音远景呈现装置，用于将各个会场中相应的会议区域的音频码流相混合，以及将混合后的音频码流输出至各个会场中的相应的会议区域。

的会议区域。通过本发明，釆用接收来自多个会场的音频码流，其中，每个会场包括一个或多个会议区域，每个会议区域对应一路音频码流；将各个会场中相应的会议区域的音频码流相混合；将混合后的音频码流输出至各个会场中的相应的会议区域，解决了远景呈现会议系统难以对不同区域的声音进行区分的问题，进而达到了区分远景呈现会议系统中不同区域的声音的效果。附图说明此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：图 1是居本发明第一实施例的多点混音远景呈现装置的示意图；图 2是居本发明第一实施例的多点混音远景呈现方法的流程图；图 3是居本发明第二实施例的多点混音远景呈现方法的流程图；图 4是居本发明第二实施例的多点混音远景呈现装置的示意图；图 5为本发明实施例的多点混音会议系统的示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。图 1是居本发明第一实施例的多点混音远景呈现装置的示意图。如图 1所示，该多点混音远景呈现装置包括接收模块 102、混音模块 104 和输出模块 106。其中，接收模块 102用于接收来自多个会场的音频码流，其中，每个会场包括一个或多个会议区域，每个会议区域对应一路音频码流；混音模块 104 用于将各个会场中相应的会议区域的音频码流相混合；输出模块 106用于将混合后的音频码流输出至各个会场中的相应的会议区域。图 2是居本发明第一实施例的多点混音远景呈现方法的流程图。该方法可以利用上述的多点混音远景呈现装置来实现，如图 2所示，该方法包括以下步 4聚：步骤 S202, 接收来自多个会场的音频码流，其中，每个会场包括一个或多个会议区域，每个会议区域对应一路音频码流。例如，在上述多个会场中，可以所有的会场都是包括多个会议区域的会场，也可以有一个或者多个会场仅包括一个会议区域。在会场中，可以包含一个或者多个展，每个展对应一个会议区域。每个屏或会议区域中还可以设置一个摄像设备和一个音频设备。步骤 S204, 将各个会场中相应的会议区域的音频码流相混合。例如，可以是相同位置的会议区域，也可以是用于设定的任意相应的区域。例如，可以分为左侧区域和右侧区域。将各个会场中左侧区域的音频码流相混合，以及^ ¹各个会场中右侧区 i或的音频码流相混合。步骤 S206, 将混合后的音频码流输出至各个会场中的相应的会议区域。在将各个会场中左侧区域的音频码流相混合之后，将混合后的音频码流输出至各个会场中的左侧区域，在将各个会场中右侧区域的音频码流相混合之后，将混合后的音频码流输出至各个会场中的右侧区域。在上述实施例中，通过将各个会场中相应会议区域的音频码流相混合以及将混合后的音频码流输入到相应会议区域，能够区分远景呈现会议系统中不同区域的声音，进而能够提高用户的体验度。优选地，各个会议区域分别对应不同的方位，将各个会场中相应的会议区域的音频码流相混合包括：将各个会场中具有相同方位的会议区域的音频码流相混合；将混合后的音频码流输出至各个会场中的相应的会议区域包括：将混合后的音频码流输出至具有相同方位的会议区域。通过该实施例，能够达到听声立的效果。优选地，音频码流中包含会议区域的方位信息，将各个会场中具有相同方位的会议区域的音频码流相混合包括：按照方位信息将各个会场中具有相同方位的会议区域的音频码流相混合。通过该实施例，能够简便地达到听声辩位的效果。优选地，在多个会场中存在包括一个会议区域的第一会场和包括多个会议区域的第二会场的情况下，将各个会场中相应的会议区域的音频码流相混合包括：将第一会场的会议区域的音频码流和第二会场的会议区域中之一的音频码流相混合。图 3为本发明实施例提供的一种多点混音方法音频数据流图。以场景三屏会场和单屏会场混合的多点会议为例，如图 3所示，该方法包括以下步骤：步骤 S302, 会议过程中，每个会场包含多个屏，每个展对应一路音频输入，根据会场中每路音频码流处于左席、中席和右席的方位，区别进行混音。例如，才艮据会场中每路音频码流处于左席、中席和右席的方位，区别进行混音。即所有会场的左席输入声音混合叠加；所有会场的中席输入声音混合叠加；所有会场的右席输入声音混合叠加，单屏会场作为特殊的中席参与所有中席声音混音；同时会场所有输入声音另外混合叠加，共四组混音。例如， 3个三展会场 A, Β , C, 1个单屏会场 D召开多点会议，可以将三展会场 A, Β , C的 3路左席输入声音混合叠加；将三展会场 A, Β , C的 3路中席和单展会场 D的 1路共 4路输入声音混合叠加；将三屏会场 A, Β , C的 3路右席输入声音混合叠加；将 A, Β, C, D所有输入声音共 10路声音输入混合叠加。步骤 S304 , 会议音频处理模块对所有输入码流混音后输出多种混音码流，包含左席，中席，右席，所有坐席混音码流。会议音频处理模块对所有输入码流混音后输出四组混音码流，包含所有左席混音码流，所有中席混音码流，所有右席混音码流，所有坐席混音码流。步骤 S306 , 根据会场情况，选择不同的混音码流编码输出到会场的不同方位，左席音频输入码流混音后输出到左席，中席音频输入码流混音后输出到中席，右席音频输入码流混音后输出到右席，达到听声辩位效果。单屏会场和多屏会场互看时，所有坐席音频输入码流混音后输出到单屏会场，单屏会场音频输入码流参与所有中席混音后，输出到多屏会场中席。根据会场情况，可以选择不同的混音码流编码输出到会场的不同方位，所有左席混音码流编码后输出到左席，所有中席混音码流编码后输出到中席，所有右席混音码流输出到右席，达到听声辩位效果。单屏会场和多屏会场互看时，将所有坐席混音码流编码后输出到单屏会场，单屏会场音频输入参与所有中席混音后，编码输出到多展会场中席。例如，可以将所有左席混音码流编码输出到 A, Β, C左席；将所有中席混音码流编码输出到 A, Β , C中席；将所有右席混音码流编码输出到 Α, Β , C右席；将所有坐席混音码流编码输出到 D单展会场。上述本发明实施例的混音方法，能够支持会议系统中声音跟随图像。并且根据会议中会场情况，单席会场和多席会场都能进行有效的混音，不影响听声辩位的效果。图 4是居本发明第二实施例的多点混音远景呈现装置的示意图。音频处理装置可以包括：音频获取模块 402 , 用于获取会场中每路音频码流；音频处理模块 404 , 用于处理音频码流，将会议中的音频码流混音，以及根据会场中音频输入方位混音编码输出；音频传输模块 406 , 用于将混音编码后音频输出到会场。图 5为本发明实施例的多点混音会议系统的示意图。如图 5所示，多点混音会议系统可以包括多点处理模块 502、接入模块 504、音频处理模块 506、媒体交换模块 508。其中，多点处理模块 502用于控制多点接入，音频处理，媒体交换；接入模块 504用于接入会议中所有会场的多路音频码流；音频处理模块 506用于会场中所有音频码流编解码转换，混音后编码输出；媒体交换模块 508 4巴音频处理模块输出码流交换输出到每个会场。根据本发明实施例，还提供了一种多点混音远景呈现系统，该系统可以包括：多个会场，其中，每个会场包括一个或多个会议区域，每个会议区域均对应一路音频码流；多点混音远景呈现装置，用于将各个会场中相应的会议区域的音频码流相混合，以及将混合后的音频码流输出至各个会场中的相应的会议区 i或。其中，该系统实施例中的多点混音远景呈现装置可以为上述实施例中的任一种多点混音远景呈现装置。

会议区域。从以上的描述中，可以看出，本发明能够解决远景呈现会议系统中多点混音存在的一个或多个问题，达到能够区分来自不同区域的声音，进而能够达到听声立的高临场感效果。显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的^"神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求书

1. 一种多点混音远景呈现方法，其特征在于，包括：

接收来自多个会场的音频码流，其中，每个所述会场包括一个或多个会议区域，每个所述会议区域均对应一路音频码流；

将各个所述会场中相应的会议区域的音频码流相混合；将混合后的音频码流输出至各个所述会场中的所述相应的会议区域。

2. 根据权利要求 1所述的方法，其特征在于，各个所述会议区域分别对应不同的方位，则所述将各个所述会场中相应的会议区域的音频码流相混合包括：

将各个所述会场中具有相同方位的会议区域的音频码流相混合；将混合后的音频码流输出至各个所述会场中的所述相应的会议区域包括：

将混合后的音频码流输出至所述具有相同方位的会议区域。

3. 根据权利要求 2所述的方法，其特征在于，所述音频码流中包含会议区域的方位信息，则将各个所述会场中具有相同方位的会议区域的音频码流相混合包括：

按照所述方位信息将各个所述会场中具有相同方位的会议区域的音频码流相混合。

4. 根据权利要求 1所述的方法，其特征在于，在所述多个会场中存在包括一个会议区域的第一会场和包括多个会议区域的第二会场的情况下，所述将各个所述会场中相应的会议区域的音频码流相混合包括：将所述第一会场的会议区域的音频码流和所述第二会场的会议区 i或中之一的音频码流相混合。

5. 居权利要求 4所述的方法，其特征在于，所述将混合后的音频码流输出至各个所述会场中的所述相应的会议区域包括：将混合后的音频码流输出至所述第一会场的会议区域和所述第二会场中与所述第一会场的会议区域的音频码流相混合的会议区域。

6. 根据权利要求 4所述的方法，其特征在于，所述方法还包括:

将所述多个会场中所有会议区域的音频码流相混合，并将混合后的音频码流输出至所述第一会场。

7. 根据权利要求 1至 6中任一项所述的方法，其特征在于，所述多个会场中的一个或任意多个会场包括左、中、右三个会议区域。

8. —种多点混音远景呈现装置，其特征在于，包括：接收模块，用于接收来自多个会场的音频码流，其中，每个所述会场包括一个或多个会议区域，每个所述会议区域均对应一路音频码流;

混音模块，用于将各个所述会场中相应的会议区域的音频码流相混合；

输出模块，用于将混合后的音频码流输出至各个所述会场中的所述相应的会议区域。

9. 一种多点混音远景呈现系统，其特征在于，包括：多个会场，其中，每个所述会场包括一个或多个会议区域，每个所述会议区域均对应一路音频码流；

多点混音远景呈现装置，用于将各个所述会场中相应的会议区域的音频码流相混合，以及将混合后的音频码流输出至各个所述会场中的所述相应的会议区域。

10. 根据权利要求 9所述的系统，其特征在于，各个所述会场中相应的会议区域为各个所述会场中具有相同方位信息的会议区域。