CN1578542A

CN1578542A - 多点通信的会议单元和方法

Info

Publication number: CN1578542A
Application number: CNA2004100635010A
Authority: CN
Inventors: G·卢茨奥尼
Original assignee: Siemens Corp
Current assignee: Unify GmbH and Co KG
Priority date: 2003-07-08
Filing date: 2004-07-08
Publication date: 2005-02-09
Anticipated expiration: 2024-07-08
Also published as: US20050018039A1; CN1578542B; EP1496680A1; US8699716B2; EP1496680B1; DE10330808B4; DE10330808A1

Abstract

根据本发明的会议单元(EMCU)具有多个分别地分配给一个与会者的单声道HRTF滤波器(HRTF1、...、HRTFN)。缩写HRTF代表英语表达的“头部相关的传递函数”并且表示所调的耳外传递函数。各个HRTF滤波器(HRTF1、...、HRTFN)用作滤波所分别分配的与会者起源的单声道音频信号。对于各个HRTF滤波器的滤波特性，划分给该滤波器的个别的、单声道的HRTF滤波系数组在此起决定性作用。所述的会议单元还有一个连接在HRTF滤波器(HRTF1、...、HRTFN)上的会议中间装置(MP)，用于混合各个滤波的不同与会者的音频信号并且用于向与会者传输这种混合的音频信号。

Description

多点通信的会议单元和方法

技术领域

本发明涉及多点通信的会议单元和方法。

背景技术

当前的通信系统越来越以各种技术、传输方法和传输媒体的交联为特征。在这样混合的通信系统中传输质量，并且特别是语音传输质量在相当程度上由各自所采用的通信网络技术、由网络特定的传输条件(例如在无线电网络)或者由不同的通信网络之间的连接过渡来影响。往往至少运用通过具有比较低带宽和相应低的语音质量的移动无线电网络的部分连接。由于在混合通信系统中的这样的语音传输质量的区别可特别在会议系统中显著地恶化与会者的理解和可区别性。

发明内容

本发明的任务是指出一种用于多点通信的会议单元和一种方法，由此可以在语音重放时改善与会者的理解和可区别性。

所述任务通过具有权利要求1的特征的会议单元以及通过具有权利要求9的特征的方法完成。

本发明的有利的实施方案和扩展方案由从属权利要求指出。

根据本发明的会议单元具有多个分别地分配给与会者的单声道HRTF滤波器。缩写HRTF代表英语表达的“头部相关的传递函数”并且表示所谓的耳外传递函数。各个HRTF滤波器用作滤波所分别分配的与会者起源的单声道音频信号。在此以及下文中音频信号还理解为用于传输音频信号的数据表现的传输信号。对于各个HRTF滤波器的滤波特性，划分给该滤波器的个别的、单声道的HRTF滤波系数组起决定性作用。所述的会议单元还有一个连接在HRTF滤波器上的会议混合装置，用于混合各个滤波的不同与会者的音频信号并且用于向与会者传输这种被混合了的音频信号。

耳外传递函数或者说HRTF代表在声源处的声压p(t)(t：时间座标)和由此在人的内耳处引起的声压x(t)之间的关系。在内耳中的声压特性曲线以特殊的方式不同于声源处的声压特性曲线，因为声信号在其向内耳行进的途中在耳、头和身体上受到大量的反射和/或折射。在声源外的声压和在内耳中的声压的关系可以用冲击响应h(τ)如下表示

x(t)＝∫h(τ)*P(t-τ)dτ

式中的冲击响应h(τ)常常也称为“头部相关的冲击响应”(HRIR)。耳外传递函数或者说HRTF常常通过h(τ)的傅立叶变换代表，也就是通过相应的频谱(域)传输函数代表。

根据本发明的会议单元的HRTF滤波器分别以代表性方式人工模拟声音信号从声源至内耳的信号改变。

借助于不论是对左耳还是对右耳者存在的耳外传递函数可以从单声道的音频信号合成双声道的音频信号，所述的双声道音频信号(在用双耳听时)引起正确的空间收听感觉。用双声道，在此方面，如通俗的概念“立体声”那样，表示左耳和右耳有别，而单声道(“单的”)表示没有这样的差别。

然而音频信号的双声道滤波却要求两个音频通道以及两个每音频信号的适当地摆放的重放扬声器。在通常的通信系统中并且特别地在会议系统中多数不设置双声道的音频传输，从而在此双声道的HRTF多数派不上用场。

在一定的限度内，也可以借助于单声道的HRTF，也就是说在一定的程度上通过音频信号的音色虚拟地模拟一种有方向性的听觉敏感。以此方式可以通过设置有各个HRTF滤波系数组的HRTF滤波器鉴于所滤波的音频信号的收听感觉虚拟地把单声道的音频信号声源沿所谓中间面的不同方向定位。中间面一般地理解为与双耳的连接轴线垂直的平面。

与双声道的HRTF滤波器不同，单声道的HRTF滤波器不需要重大修改就可以用在通常的以单声道为基础的通信系统中。单声道HRTF滤波器也可以以简单的方式合并在常规的单声道会议单元中。

通过虚拟地把与会者布置在中间面的不同方向中，实质上改善与会者的可区别性，尤其是当与会者同时要发言时。此外还可以改善一定情况下选出的与会者的理解力，其中把该与会者虚拟地置于在听者方有较好的语音理解力的方向。这是比如正视的情况下沿中间面的方向。

优选地可以拟定一种滤波器控制装置，用于静态地或者动态地把各个HRTF滤波系数组分配给HRTF滤波器和/或把HRTF滤波器分配给与会者。在此要分配的HRTF滤波系数组可以按不同的标准静态地或者动态地选择、产生或者配置。所述的分配可以依据会议控制或者依据与会者的请求进行。

根据本发明的一种有利的扩展方案，所述的滤波器控制装置可以具有一种音频分析装置用于分析与会者的音频信号，这样地设定所述的分析装置使得所述的分配依据分析结果进行。

通过分析音频信号和进行依据于分析的分配，可以例如是鉴于收听感觉把发言的与会者虚拟地与其它与会者分离开，并且从而在一定的程度上置于注意力的中心，而把其它的与会者置于听众的背景上。

根据本发明的一种有利的实施形式，HRTF滤波系数组特别地调准会议单元的传输带宽和/或参与会议的终端装置的传输带宽。例如可以这样地设置这样的HRTF滤波系数组：使得在有限的传输带宽的条件下鉴于收听感觉引起与整个听力频率范围得出的HRTF滤波系数组相似的收听方向感。

此外还可以拟定不同的用户特定的、终端装置特定的、连接特定的、网络特定的和/或会议情况特定的HRTF滤波系数组。

根据本发明的一个有利的扩展方案，所述的会议单元可以具有一种转换装置用于把双声道的与会者起源的双声道音频信号转换成由单声道的HRTF滤波器滤波的单声道音频信号。借助于这样的转换装置还可以使双声道的与会者，也就是说具有至少两个音频通道的与会者被包括在具有单声道的与会者的会议中。

例如可以实现这样的在单声道和双声道的与会者之间的会议：其中通过会议单元安排两个分开的会议电路，而且一个是单声道的一个是双声道的会议电路。在x名单声道和y名双声道的与会者的情况下，单声道的会议有x+y名单声道输入参与者和x名输出参与者，而双声道的与会者有x+y名双声道的输入参与者和y名输出参与者。在双声道的会议电路中为了得到与双声道的与会者可比较的收听感觉，借助于双声道的HRTF滤波器滤波所述x名单声道与会者的音频信号。相应地在单声道的会议中，分别地借助于所述的转换装置把y名双声道参与者的音频信号转换成单声道的音频信号。

优选地这样安排所述的转换装置：使得由双声道音频信号的收听感觉确定的虚拟的双声道与会者的位置对所涉及的HRTF滤波器转换成单声道的HRTF滤波系数组，通过这种滤波把双声道的与会者虚拟地置于中间面。以此方式可以把通过双声道音频信号指明的在三维空间中的虚拟音频源位置模拟成二维的中间面中的适当的位置。

附图说明

下面参照附图详细说明根据本发明的一个实施例。

附图示意地画出根据本发明的会议单元。

具体实施方式

图中示意地画出了扩充了HRTF滤波器(HRTF：头部相关的传递函数)功能的会议单元EMCU。会议单元EMCU在本实施例中其中用于混合不同的与会者的通信信号，例如，语音信号、音频信号、视频信号和/或多媒体信号，并且用于向与会者分送被混合的通信信号，从而每个与会者接收从其它的与会者发出的通信信号。所述的会议单元EMCU既可以安排成线路交换的会议单元也可以安装成包交换的会议单元。在包交换的安排情况下通信信号也理解为以包为基础的媒体流，譬如语音数据包流、音频数据包流、视频数据包流和/或多媒体数据包流。在下文中为了概要的原因只关注音频信号形式的通信信号，譬如语言信号或者说语音信号。用于传输音频信号的数据表现的传输信号在此(按照通常的语言习惯)同样地称为音频信号。

会议单元EMCU具有N个输入端口IPORT1、...IPORTN-1、IPORTN，各用于接收从一名与会者输出的音频信号或者说音频通道，并且具有N个输出端口OPORT1、...OPORTN-1、OPORTN用于向与会者输出混合的音频信号或者说音频通道。

为了控制所述的会议电路并且为了实现混合功能，所述的会议单元EMCU含有常规的会议单元LMCU，所述的会议单元LMCU优选地根据ITU-T推荐的H.323安排为标准的MCU(MCU：多点控制单元)。会议单元LMCU具有优选地根据H.323推荐实施的多点处理单元MP(多点处理器)，所述的多点处理单元MP用作会议混合装置，用于混合由与会者输出的音频信号或者说音频通道以及用于向与会者传输混合的音频信号或者说音频通道。所述的会议单元LMCU具有会议单元内的输入端口PORT1...、PORTN-1、PORTN，而其输出端口与输出端口OPORT、...、OPORTN-1、OPORTN相同。

所述的端口IPORT1、...、IPORTN、PORT1、...PORTN、OPORT1、...OPORTN分别地分配给一个音频媒体通道。在本实施例中端口IPORT1、...、IPORTN-1、PORT1、...PORTN、OPORT1、...OPORTN分别相应于一个单声道音频信号的单个的单声道“单个”音频通道，而输入端口IPORTN相应于双声道音频信号的一个双声道的“立体声”双音频通道。

根据本发明，会议单元EMCU具有N个单声道的HRTF滤波器HRTF1、...、HRTF N-1、HRTF N，所述的单声道的HRTF滤波器HRTF 1、...、HRTF N-1、HRTF N优选地实现为数字响应滤波器。HRTF滤波器HRTF1、...、HRTF N-1的滤波器输入端分别与会议单元EMCU的输入端口IPORT1、...、IPORTN-1的一个输入端口连接。HRTF滤波器HRTF N的滤波器输入端通过转换装置U与输入端口IPORTN连接。以此对每个与会者通过分配输入端口IPORT1、...、IPORTN分配一个HRTF滤波器HRTF 1、...、HRTF N。

转换装置U用于把通过输入端口IPORTN从双声道与会者接收的双声道音频信号转换成要由单声道HRTF滤波器HRTF N滤波的单声道音频信号。所述的转换装置U使得，双声道的与会者，也就是说具有两个音频通道的与会者也能够被包括在带有单声道与会者的会议中。

HRTF滤波器HRTF 1、...、HRTF N的滤波器输出通过端口PORT1、...、PORTN连接在会议单元LMCU上，用于把被滤波了的与会者的音频信号通过会议单元LMCU的多点处理单元MP混合，并且把所混合音频信号通过输出端口OPORT1、...、OPORTN向与会者分送。

每个HRTF滤波器HRTF 1、...、HRTF N各自具有一个个别的单声道HRTF滤波系数组，所述的滤波系数组确定所涉HRTF滤波器的滤波特性，也就是说确定其频率相关的幅度衰减和相移。各自的单声道HRTF滤波系数组优选地给出为一组离散的冲击响应系数或者说冲击响应参数。为了滤波单声道音频信号，借助于一种数字信号处理器把冲击响应系数在数学卷积的意义上连续地与音频信号的抽样值相乘，并且求乘积的和，优选地使用递归的数字滤波器，即所谓的IIR滤波器(IIR：无限冲击响应)。

优选地这样选择或者产生这样的HRTF滤波系数组，使之特定的调准会议单元EMCU的有限的传输带宽和/或调准与会者的终端装置的有限的传输带宽。可以这样地构成或者产生这样的HRTF滤波系数组：使得其与音频信号的抽样值的卷积相应于音频信号的一或多个延时的，在一定的情况下设有音色的拷贝的叠加。通过这样地时间推移叠加，可以人工地模拟音频信号从音源通过外耳进入内耳的途中所受到的反射。以此方式可以在一定的程度上从各个反射综合或者汇集各自的HRTF滤波系数组，所述的反射可以按照物理的和/或心理的情况选择。可以优选地这样地构成HRTF滤波系数组并且向HRTF滤波器HRTF 1、...、HRTF N分配并且从而向与会者分配：使得与会者鉴于滤波的音频信号的收听感觉虚拟地置于中间面的不同方面上，以使各自的听众可以尽可能良好的理解。

实际研究表明，为了得到良好的与会者可区分性，以及为了主观上改善与会者的理解性，带有相较地少数量的10至40个常规的电信系统的带宽范围内的系数的人工构成的HRTF系数组就已经足够了。通过要求较少数量的HRTF滤波系数可以显著地降低数字滤波所要求的计算费用。一般地不是构成的，而是从声学测量中推导出的HRTF滤波系数一般地含有显著地多的(约128-512个)滤波系数。

会议单元EMCU此外还具有一个滤波控制装置CTL用于对各自HRTF滤波器HRTF 1、...、HRTF N分配个别的HRTN滤波系数组和/或对各个与会者分配各自的HRTF滤波器HRTF 1、...、HRTF N。所述的滤波器控制装置CTL可以向HRTF滤波器HRTF 1、...、HRTF N分配预定的HRTF滤波系数组和/或动态地产生的HRTF滤波系数组。为了对HRTF滤波器HRTF 1、...、HRTF N静态地分配HRTF滤波系数，滤波控制装置CTL具有静态的控制装置SCTL，并且为了动态地分配HRTF滤波系数，具有动态的控制装置DCTL。

滤波控制装置CTL还有一个连接在动态控制装置DCTL上的音频分析装置AA，所述的音频分析装置AA连接在输入端口IPORT1、...、IPORTN上。音频分析装置AA起分析与会者的音频信号的作用，以依据分析结果通过动态控制装置DCTL控制向HRTF滤波器HRTF 1、...、HRTF N分配HRTF滤波系数组。以此方式，滤波控制装置CTL可以向HRTF滤波器HRTF 1、...、HRTF N存储器特定地、发言特定地和/或与会者特定地，分配动态地变化的HRTF滤波系数。借助于连接在动态控制装置DCTL上的静态控制装置SCTL可以静态地配置和预先设定HRTF滤波系数和/或HRTF滤波器HRTF 1、...、HRTF N。为此目的，所述的静态控制装置SCTL具有一个外部的配置输入CONF。

Claims

1.会议单元(EMCU)，

带有多个分别被分配给一个与会者的单声道HRTF滤波器(HRTF1、...HRTFN)(HRTF：＝头部相关的传递函数＝耳外传递函数)，所述HRTF滤波器分别用作滤波所分别分配的与会者起源的单声道音频信号，其中，对于各个HRTF滤波器(HRTF1、...、HRTFN)，划分给该滤波器一个个别的并对其滤波特性起决定性作用的单声道的HRTF滤波系数组，并且

带有一个连接在所述HRTF滤波器(HRTF1、...HRTFN)上的会议混合装置(MP)，用于混合各个所滤波的不同与会者的音频信号并且用于向与会者传输所混合的音频信号。

2.如权利要求1所述的会议单元，

其特征在于，

这样地选择各个HRTF滤波系数组：使鉴于被滤波的音频信号的收听感觉把与会者虚拟地置于中间面的不同方向中。

3.如权利要求1或2所述的会议单元，

其特征在于，

一种滤波控制装置(CTL)，用于把各个HRTF滤波系数组分配给一个HRTF滤波器(HRTF1、...、HRTFN)和/或把一个HRTF滤波器(HRTF1、...、HRTFN)分配给一个与会者。

4.如权利要求3所述的会议单元，

其特征在于，

所述的滤波控制装置(CTL)具有一种音频分析装置(AA)用于分析与会者的音频信号，这样地设定所述的分析装置：使得所述的分配依据分析结果进行。

5.如以上权利要求之一所述的会议单元，

其特征在于，

所述HRTF滤波系数组被特定地调准所述会议单元(EMCU)的传输带宽和/或参与会议的终端装置的传输带宽。

6.如以上权利要求之一所述的会议单元，

其特征在于，

拟定不同的用户特定的、终端装置特定的、连接特定的、网络特定的和/或会议情况特定的HRTF滤波系数组。

7.如以上权利要求之一所述的会议单元，

其特征在于，

所述的会议单元具有一种转换装置(U)，用于把双声道的与会者起源的双声道音频信号转换成由单声道的HRTF滤波器(HRTF1、...、HRTFN)之一滤波的单声道音频信号。

8.如权利要求7所述的会议单元，

其特征在于，

这样安排所述的转换装置(1)：使得由双声道音频信号的收听感觉确定的虚拟的双声道与会者的位置对所涉及的HRTF滤波器(HRTFN)转换成单声道的HRTF滤波系数组，通过这种滤波把双声道的与会者虚拟地置于中间面。

9.一种多点通信方法，其中

分别地分配给多个与会者一个单声道HRTF滤波器(HRTF1、...HRTFN)，所述各个HRTF滤波器带有而单独的对其滤波特性起决定性作用的HRTF滤波系数组，

通过分配给与会者的单声道HRTF滤波器(HRTF1、...、HRTFN)滤波从各个与会者起源的单声道音频信号，

混合不同与会者的各个被滤波的音频信号，并且

向与会者传输所混合的音频信号。

10.如权利要求9所示的方法，

其特征在于，

识别分别发言的与会者，和

向识别出的与会者分配一个单声道的HRTF滤波器(HRTF1、...HRTFN)和/或一个单声道的HRTF滤波系数组，由此鉴于滤波的音频信号的收听感觉把所述识别出的与会者虚拟地与其它的与会者分开。