CN1620197A

CN1620197A - 通信设备和电视会议设备

Info

Publication number: CN1620197A
Application number: CN200410102326.1A
Authority: CN
Inventors: 阿部义孝; 藤山英春; 增田彰
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2003-09-05
Filing date: 2004-09-06
Publication date: 2005-05-25
Also published as: US7227566B2; JP2005086365A; EP1513345A1; US20050093970A1

Abstract

提供的通信设备和电视会议设备能自动并正确地为发言者拍摄图像。声音分析器正确地选择发言者。声波纹鉴别部分鉴别发言者的声波纹是否被登记。当发言者的选择和声波纹的鉴别相一致时，成像方向调整部分基于预先登记的条件驱动电视摄像机。

Description

通信设备和电视会议设备

技术领域

本发明涉及集成的麦克风和扬声器结构类型的通信设备，该通信设备适于，比如多个会议参与者在两个会议室中通过发言举行会议时使用。本发明尤其涉及通信设备、会议设备和成像条件调整方法，其中使用扬声器的麦克风被正确地选择，优选地，进一步进行话音鉴别，接着能够对正确选择的麦克风的、以及话音鉴别的定位区域(部位或空间)进行成像。

背景技术

使用电视会议系统可使相距较远的两个会议室中的会议参与者能够举行会议。电视会议系统通过成像装置捕捉会议室中的会议参与者的图像，通过麦克风拾取他们的话音，将成像装置捕捉的图像和麦克风拾取的话音通过通信通道通道发送出去，在另一方的会议室的电视接收机的显示单元上显示捕捉的图像，并从扬声器输出拾取的话音。

在这样的电视会议系统中，会碰到这样的缺点，即在每个会议室中，难于拾取远离成像装置和麦克风的发言方的话音。作为用于解决这个问题的手段，有时候为每个会议参与者准备一个麦克风。另外，还遇到这样的缺点，即电视接收机的扬声器输出的话音难于被远离扬声器的会议参与者听到。

公开号为No.2003-87887的日本未审专利申请和公开号为No.2003-87890的日本未审专利申请公开了：除了为在相距较远位置的会议室中的电视会议提供音频和视频的常规的电视会议系统之外，由麦克风和扬声器集成地构成的话音输入/输出系统具有这样的优点，即可以从扬声器清楚地听到在另一方会议室中的会议参与者的话音，并且在各自的会议室中存在较小的噪声影响，或者回波消除器的负载较轻。

在上述出版物公开中的话音输入/输出系统用作提供视频和音频的电视会议系统的辅助设备。

发明内容

本发明的目的是提供改进的通信设备和会议设备，这些装置作为使用双向通信的装置，在性能、成本、尺寸、对使用环境(周围环境)兼容性和操作方面作了改进，并提供了成像条件调整方法。

特别地，本发明的目的在于提供一种通信设备、会议设备和成像条件调整方法，其中发言者使用的麦克风被正确选择，优选地，进一步执行话音鉴别，接着，对正确选择的和经过话音鉴别的麦克风的定位区域(空间或地区)可以成像。

根据本发明，提供一种通信设备包括：多个麦克风；用于在由多个麦克风拾取的多个信号中选择信号的麦克风信号选择装置；和用于响应于与拾取了麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件的成像方向调整装置。

成像条件信息可包括指示成像装置的成像方向的信息，并且成像方向调整装置可响应于指示成像方向的信息控制成像装置的成像方向。

成像条件信息可包括用于改变成像装置的焦距的信息，并且成像方向调整装置可响应于改变成像装置的焦距的信息，来控制成像装置的焦距改变。

成像条件信息可包括指示位于成像装置拍摄图像的位置的发言者的信息，并且成像方向调整装置可将指示发言者的信息加到由成像装置拍摄的图像上。

通信设备可包括声波纹鉴别装置，用于执行声波纹的鉴别，即鉴别所选麦克风拾取的信号与以前登记的声波纹是否一致。

成像方向调整装置可响应与拾取了由麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息，控制成像装置的成像条件。

当声波纹鉴别装置未鉴别所选麦克风拾取的信号时，成像方向调整装置可将成像装置的状态设置为默认状态。

当设置为默认状态时，成像方向调整装置可不改变成像装置的成像条件。

当设置为默认状态时，成像方向调整装置可将成像装置的成像条件设置为初始成像条件。

成像方向调整装置可将成像装置的成像条件设置为给预先登记的主席拍摄图像的成像条件，作为初始成像条件。

通信设备可包括用于放大由麦克风拾取的信号并具有可变的增益的增益可变型放大装置，和放大器增益调整装置。当声波纹鉴别装置鉴别所选的麦克风拾取信号时，该放大器增益调整装置可将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有较大值的第一增益。

当声波纹鉴别装置未鉴别所选择的麦克风拾取信号时，该放大器增益调整装置可将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有较小值的第二增益。

当检测到麦克风信号选择装置的麦克风选择中止时，放大器增益调整装置可将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有平均值或等于其它增益可变型放大装置的增益的第三增益。

优选地，多个麦克风以等角径向设置。通信设备可包括与多个麦克风等距离设置并接近于多个麦克风的声音输出装置。

麦克风信号选择装置可根据麦克风检测到的信号来检测声音源的方向。

根据本发明，还提供一种会议设备，包括：多个麦克风；可调整成像条件的成像装置；用于在多个麦克风拾取的多个信号中选择信号的麦克风信号选择装置；以及用于响应于与拾取了麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件的成像方向调整装置。

根据本发明，还提供一种调整成像条件的方法，包括：在多个麦克风拾取的多个信号中选择信号的步骤；以及响应于与拾取了选择步骤选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件的步骤。

该方法可包括声波纹鉴别步骤，用于执行声波纹的鉴别，即鉴别所选麦克风拾取的信号与以前登记的声波纹是否一致。在成像方向调整步骤中，响应于与拾取了麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件。

附图说明

通过下列结合附图对优选实施例的描述，本发明的这些和其它的目的和特征将变得更加清楚，其中：

图1A为概略图，例示出了在其中运用了本发明的整体的麦克风和扬声器结构类型的通信设备(通信设备)的会议系统；图1B为状态图，其中放置了图1A的通信设备；以及图1C为置于桌上的通信设备和会议参与者的布置图；

图2为本发明的实施例的通信设备的透视图；

图3为示于图2的通信设备的内部的横截面图；

图4为麦克风电子电路壳体的平面图，该外壳具有与示于图2的通信设备分开的上盖。

图5为麦克风电子电路壳体的原理电路的连接结构图，并示出了第一数字信号处理器和第二数字信号处理器的连接结构；

图6为示于图4的麦克风的特性图；

图7A至7D为示出了具有图6示出的特性的麦克风的方向性分析结果图；

图8为本发明的通信设备的变型的局部结构图；

图9为流程图，概略地示出了在第一数字信号处理器中的全部处理内容；

图10为在本发明通信设备中的滤波器处理图；

图11为图10的处理结果的频率特性图；

图12为本发明带通滤波器处理过程和电平转换处理过程的方框图；

图13为图12的处理流程图；

图14为在本发明通信设备中判断发言开始和结束的处理的图；

图15为在本发明通信设备中的正常处理过程流程图；

图16为在本发明通信设备中的正常处理过程流程图；

图17为方框图，图示了在本发明的通信设备中的麦克风切换处理过程。

图18为方框图，图示了在本发明的通信设备中的麦克风切换处理过程的方法；

图19为方框图，图示了本发明的第二实施例的通信设备；

图20示出了图19所示的声波纹鉴别部分的处理过程图；

图21至24为流程图，示出了图19所示的声波纹鉴别部分的处理过程；

图25为方框图，图示了本发明的第三实施例的会议设备；以及

图26为方框图，图示了第三实施例的会议设备的变型。

具体实施方式

首先，将说明运用本发明整体的麦克风和扬声器结构类型通信设备(此后称为“通信设备”)的示例。

图1A至1C为结构图，示出了其中运用了本发明的通信设备的示例。

如图1A所示，通信设备1A和1B设置在距离较远的两个会议室901和902中。这些通信设备1A和1B通过电话线920连接。

如图1B所示，在两个会议室901和902中，通信设备1A和1B置于桌子911和912上。注意，在图1B中，为了简化图示，只有会议室901中的通信设备1A被图示出。但是会议室902中的通信设备1B和它是一样的。通信设备1A和1B的外形的透视图示于图2中。

如图1C中所示，多个(在本实施例中是6个)会议参与者A1至A6位于每个通信设备1A和1B的周围。注意，在图1C中，为了简化图示，只有围绕会议室901的通信设备1A的会议参与者被图示出。然而，围绕另一会议室902的通信设备1B的会议参与者的布置也是同样的。

本发明的通信设备能够经由电话线920通过比如在两个会议室901和902之间的话音进行通信(问和答)。

通常，经由电话线920的交谈在一个发言者和另一个发言者之间进行，即，一对一的，但是在本发明的通信设备中，多个会议参与者A1至A6可以通过使用一条电话线920互相交谈。注意，虽然下面将说明细节，为了避免音频拥塞，在同一时间(同一时段)发言的各方的会议发言者在每一方限制为一个人。

本发明的通信设备只解决了音频(话音)，因此只经由电话线920传送音频。换言之，大量的图像数据没有像在电视会议系统中一样被传送。另外，本发明的通信设备将会议参与者的语声压缩以进行传输，因此电话线920的传输负载较轻。

第一实施例

首先将参照图2到图4来说明根据本发明的第一实施例的通信设备的结构。

图2为根据本发明实施例的通信设备的透视图。图3为图2所示的通信设备的横截面图。图4为示于图1的通信设备的麦克风电子电路壳体的平面图，以及沿着图3的线X-X-Y的平面图。

如图2所示，通信设备1具有上盖11、声音反射盘12、连接构件13、扬声器壳体14和操作单元15。

如图3所示，扬声器壳体14具有声音反射表面14a、下表面14b和上部声音输出开口14c。一个接收和再现扬声器16位于在由声音反射表面14a和下表面14b围成的空间中，即在内部谐振腔14d中。声音反射盘12设置在扬声器壳体14上。扬声器壳体14和声音反射盘12由连接构件13连接。

限制构件17穿过连接构件13。限制构件17限制了扬声器壳体14的下表面14b的限制构件底部固定部分14e和声音反射盘12的限制构件固定部分12b之间的空间。注意，限制构件17只穿过扬声器壳体14的限制构件通道14f。限制构件17穿过限制构件通道14f并且不限制它的原因是，扬声器壳体14通过扬声器16的工作而振动，并且其中的振动不被限制在上部声音输出开口14c的周围。

扬声器

另一会议室中的发言方(speaking party)的语音通过接收和再现扬声器16和上部声音输出开口14c并沿着由声音反射盘12的声音反射表面12a和扬声器壳体14的声音反射表面14a限定的空间弥散到围绕C-C轴的全部360度的方向。声音反射盘12的声音反射表面12a的横截面表示为图示的松散喇叭型弧形。声音反射表面12a的横截面在围绕C-C轴的360度(全方向)构成图示的横截面形状。相似地，扬声器外壳14的声音反射表面14a的横截面表示为图示的松散凸面形状。声音反射表面14a的横截面在围绕C-C轴的360度(全方向)构成图示的横截面形状。

从接收和再现扬声器16输出的声音S穿过上声音输出开口14c，穿过由声音反射表面12a和声音反射表面14a限定并具有喇叭形横截面的声音输出空间，沿着其上放置通信设备1的桌子911的表面、并围绕轴C-C全部360度方向扩散，并以相等的音量为所有的会议参与者A1至A6听到。在本实施例中，桌子911的表面是作为声音传播装置的一部分使用的。从接收和再现扬声器16输出的声音S的传播由箭头表示。

声音反射盘12支撑印刷电路板21。印刷电路板21，如在图4中平面所示，安装了麦克风电子电路壳体2的麦克风MC1至MC6、发光二极管LED1至6、微处理器23、编解码器24、第一数字信号处理器(DSP)25、第二数据信号处理器(DSP)26、A/D转换块27、D/A转换块28、放大器块29、以及其它各种类型的电子电路。声音反射盘12也作为用于支撑麦克风电子电路壳体2的构件。

印刷电路板21配备了阻尼器18，用于吸收来自接收和再现扬声器16的振动以防止来自接收和再现扬声器16的振动通过声音反射盘12被发射出去而进入麦克风MC1至MC6等等、从而变成噪声。每个阻尼器18由螺丝和减震材料组成，减震材料比如是在螺丝和印刷电路板21之间的吸收振动橡胶。减震材料由螺丝固定到印刷电路板21。即，自接收和再现扬声器16发射到印刷电路板21的振动被减震材料吸收。结果，麦克风MC1至MC6不受到来自扬声器16的声音的影响。

麦克风的布置

如图4所示，在该实施例中六个麦克风MC1至MC6从印刷电路板21的中心轴C以等角60度的间隔径向地定位(布置)。每个麦克风具有单向性。其特征将在下面说明。每个麦克风MC1至MC6由第一麦克风支撑构件22a和第二麦克风支撑构件22b支撑，两个支撑构件都具有柔性或弹性，以便于每个麦克风可以自由地摆动(为了简化图示，只示出了麦克风MC1的第一和第二麦克风支撑构件22a和22b)。除了通过使用上面的减震材料的阻尼器18，来防止接收和再现扬声器16的振动影响量之外，还通过具有柔性或弹性的第一和第二麦克风支撑构件22a和22b，吸收由来自接收和再现扬声器16的振动引起的印刷电路板21的振动，来防止接收和再现扬声器16的振动影响，避免了接收和再现扬声器16的噪声。

如图3所示，接收和再现扬声器16与该盘的中心轴C-C垂直地定向，在该盘中放置了麦克风MC1至MC6(在该实施例中定向(方向)向上)。通过接收和再现扬声器16与六个麦克风MC1至MC6这样的布置，接收和再现扬声器16与六个麦克风MC1至MC6之间的距离变成相等的，并且来自接收和再现扬声器16的音频几乎以相同音量和相同相位到达麦克风MC1至MC6。然而，由于声音反射盘12的声音反射表面12a和扬声器壳体14的声音反射表面14a的结构，防止了接收和再现扬声器16的声音直接输入到麦克风MC1至MC6。另外，如上所述，通过采用使用了减震材料以及具有柔性或弹性的第一和第二麦克风支撑构件22a和22b的阻尼器18，接收和再现扬声器16的振动影响被减小。会议参与者A1至A6，如图1C所示，通常位于通信设备1的360度方向中的几乎等间隔的位置上，通信设备1设置在以60度间隔布置的麦克风MC1至MC6的附近。

发光二极管

作为下文说明的用于通报确定发言方的装置在(麦克风选择结果显示装置30)的例子，发光二极管LED1至LED6放置在麦克风MC1至MC6的附近。必须提供发光二极管LED1至LED6以便使其在即使附着上盖11的状态中也能够被所有的会议参与者A1至A6看到。因此，上盖11配备了一个透明窗，以便于可以看到发光二极管LED1至LED6的发光状态。当然，开口以也可以配备在上盖11中的发光二极管LED1至LED6的部分，但是出于防止灰尘进入麦克风电子电路壳体2的观点，透明窗的使用是首选的。

为了执行下列说明的各种类型的信号处理，印刷电路板21配备了第一数字信号处理器(DSP)25、第二数字信号处理器(DSP)26、以及各种类型的电子电路27至29安排在放置麦克风MC1至MC6以外的其它空间中。在该实施例中，DSP 25用作信号处理装置，以和其各种类型的电子电路27至29一起执行比如滤波处理和麦克风选择处理之类的处理，并且DSP 26用作回音消除器。

图5概略图示出了微处理器23、编解码器24、DSP 25、DSP 26、A/D转换器块27、D/A转换器块28、放大器块29和其它各种类型的电子电路的结构。微处理器23执行麦克风电子电路壳体2的全部控制处理。编解码器24压缩并编码音频以将其发送到另一方的会议室。DSP 25执行下述的各种类型的信号处理，例如，滤波处理和麦克风选择处理。DSP 26行使回音消除器的功能并具有回音消除发射器261和回音消除接收器262。在图5中，作为A/D转换器块27的例子，示出了四个A/D转换器271至274；作为D/A转换器块28的例子，示出了二个D/A转换器281和282；作为放大器块29的例子，示出了二个放大器291和292。另外，在麦克风电子电路壳体2，各种类型的电路，比如电源电路被安装在印刷电路板21上。

在图4中，每一对都安排在关于印刷电路板21的中心轴C对称(或相对)的直线位置中的麦克风对MC1-MC4、MC2-MC5和MC3-MC6输入双通道模拟信号到A/D转换器271到273以将模拟信号转换成数字信号。在该实施例中，一个A/D转换器将两通道模拟输入信号转换成数字信号。因此，位于跨在中心轴C的直线上的两个(一对)麦克风(例如，麦克风MC1和MC4)的检测信号被输入到一个A/D转换器并转换成数字信号。另外，在该实施例中，为了识别传到另一方会议室的音频的发言方，位于一条直线上的两个麦克风的音频的差、音频的幅度等都被涉及到。因此当位于直线上的两个麦克风的信号被输入到同一A/D转换器时，转换定时几乎是相同的。因此存在优点，即当找到两个麦克风的音频输出差时，定时误差较小，信号处理变得容易等。注意，A/D转换器271至274可以被配置成如同A/D转换器271至274也配备了可变增益类型放大功能。在A/D转换器271至273转换的麦克风MC1至MC6的声音拾取信号音频输入到DSP 25，在DSP 25执行如下所述各种类型的信号处理。作为DSP 25的一个处理结果，选择麦克风MC1至MC6中的一个的结果被输出到作为例子的麦克风选择结果显示装置30上的二极管LED1至LED6中相应的发光二极管。

DSP 25的处理结果输出到执行回音消除处理的DSP 26。DSP 26具有比如回音消除发射器261和回音消除接收器262。DSP 26的处理结果在D/A转换器281和282被转换成模拟信号。D/A转换器281的输出在编解码器24根据需要而编码，经由放大器291输出到电话线920的线路输出端(图1A)，并作为声音经由布置在另一方会议室中的通信设备1的接收和再现扬声器16输出。来自布置在另一方会议室中的通信设备1的音频，经由电话线920的线路输入端(图1A)输入，在A/D转换器274被转换成数字信号，并输入至DSP 26，它在此用于回音消除处理。另外，来自布置在另一方会议室中的通信设备1的音频通过未示出的路由施加到扬声器16并作为声音输出。自D/A转换器282的输出作为声音经由放大器292从通信设备1的接收和再现扬声器16输出。即，除了能如上所述从接收和再现扬声器16听到另一方会议室中选择的发言方的音频外，会议参与者A1至A6，也能经由接收和再现扬声器16听到由该会议室中的发言方发出的音频。

麦克风MC1至MC6

图6示出了麦克风MC1至MC6的方向性的特性图。在每个具有单向特性的麦克风中，如图6所示，频率特征和电平特征根据从发言方到麦克风的音频到达角度而改变。多条曲线表示当声音拾取信号的频率为100Hz、150Hz、200Hz、300Hz、400Hz、500Hz、700Hz、1000Hz、1500Hz、2000Hz、3000Hz、4000Hz、5000Hz和7000Hz时的方向性。注意为了简化图示，图6举例说明了150Hz，、500Hz，、1500Hz，、3000Hz和7000Hz的方向性作为代表性的例子。

图7A至7D示出了声音源的位置的频谱分析结果和麦克风的声音拾取电平，并且作为分析的例子，表示出了通过将发言者定位于距通信设备1预定的距离(比如1.5米远的距离)、并将快速傅立叶变换(FFT)应用到由麦克风在恒定的时间间隔中拾取的音频而获得的结果。X-轴表示频率，Y-轴表示信号电平，Z-轴表示时间。当使用具有图6的方向性的麦克风时，强的方向性呈现在麦克风的前表面。在该实施例中，通过很好地利用这样的特征，DSP25执行麦克风选择处理过程。

当不具有如本发明的具有方向性的麦克风，而使用不具有方向性的麦克风时，所有围绕麦克风的话音被拾取，因此发言方的音频S/N与环境噪声混合，因此好的声音不能很好地拾取。为了避免这样，在本发明中，通过由一个定向麦克风拾取声音，带有环境噪声的S/N被增强了。作为获得麦克风定向的方法，可使用多个不定向麦克风的麦克风阵列。然而以此方法，要求复杂的处理过程来匹配多个信号的时间轴(相位)，因此要占用较长的时间，响应比较低，并且硬件结构变得复杂。即，对于DSP的信号处理系统也要求复杂的信号处理。本发明通过使用具有示例于图6中的具有方向性的麦克风来解决这样的难题。为了组合麦克风阵列信号以将麦克风用作为定向声音拾取麦克风，这碰到这样的缺点，即外形受通过频率特性限制，并且外形变大。本发明也克服了这个缺点。

通信设备的硬件结构的效果

具有上述结构的通信设备具有下列优点。

(1)以等角等间隔径向安置的麦克风MC1至MC6的偶数号的麦克风与接收和再现扬声器16之间的距离关系是恒定的，并且它们的距离还非常近，因此从接收和再现扬声器16发出的声音直接返回的电平绝对大于从接收和再现扬声器16发出的声音通过会议室环境并返回到麦克风MC1至MC6的电平，并占优势。由此，声音从接收和再现扬声器16到达麦克风MC1至MC6的特征(信号电平(强度)，频率特征(f特征)和相位)总是一样的。即，在本发明的实施例中的通信设备1具有传输功能总是相同的优点。

(2)因此，存在这样的优点，即当发言方改变而在将麦克风的输出切换到另一方的会议室时，传输功能不会改变，并且无论什么时间切换麦克风麦克风系统的增益都不用调整。换言之，这里存在这样的优点，即一旦通信设备在制造时完成调整，就不必重作调整。

(3)即使当发言方由于同上述相同的原因改变而切换麦克风时，提供单个回音消除器(DSP)26也是足够的。DSP是比较昂贵的。另外，不必在安装了各种构件且具有较少空余空间的印刷电路板21上安置多个DSP。另外，用于在印刷电路板21上安置DSP的空间会比较小。结果，从而印刷电路板21和本发明的通信设备也可以做成小尺寸的。

(4)如上所述，由于在接收和再现扬声器16与麦克风MC1至MC6之间的传输功能是恒定的，这存在这样的优点，比如，麦克风的±3dB的敏度差的调整可以通信设备的麦克风单元单独地完成。调整敏度差的细节将在后面说明。

(5)作为在其上安装通信设备1的桌子，通常做成圆桌或多边形桌子。用于通过通信设备1中的一个接收和再现扬声器16，在关于C轴360度全方向上均等地分散(散开)的具有相同质量的声音的扬声器系统成为可能。

(6)存在这样的优点，即从接收和再现扬声器16输出的声音通过边界效应通过圆桌的桌面传播，并且高质量的声音有效地均等地到达会议参与者从而有好的效率，相对侧的声音和相位在会议室的天花板方向被抵消并变小，只有来自于在会议参与者的天花板方向的一点反射声音，结果传送给会议参与者清楚的声音。

(7)从接收和再现扬声器16输出的声音以相同的音量同时到达以等间隔和等角径向安置的麦克风MC1至MC6，因此声音是发言方的音频还是接收的音频的判断变得容易了。结果，减少了在麦克风选择处理中的误判断。它的细节将在后面说明。

(8)通过以等间隔和等角径向安置偶数个麦克风，例如，6个麦克风，以便于将面对的一对麦克风安置在一条直线上，用于检测声音源的电平比较，比如，发言方的方向，可以容易地完成。

(9)通过阻尼器18，麦克风支撑构件22等，由于接收和再现扬声器16的声音施加到麦克风MC1至MC6的声音拾取所导致的的振动影响可以减小。

(10)如图3所示，在结构上，接收和再现扬声器16的声音直接传播到麦克风MC1至MC6的程度较小。因此，在通信设备1中，来自于接收和再现扬声器16的噪声影响很小。

变型

在参照图2到图3说明的通信设备1中，接收和再现扬声器16安置在较低的部分，麦克风MC1至MC6(以及涉及的电子电路)安置在较高的部分，但也可能如图8所示地垂直地翻转接收和再现扬声器16以及麦克风MC1至MC6(以及涉及的电子电路)位置。即使在这样的情况下，上述的效果也展现出来。

麦克风的数目不限于6个。任意数目的麦克风，比如4个或8个，可以关于C轴以等间隔等角径向安置，以便于多对麦克风位于一条直线上(在相同方向)，例如，像麦克风MC1和MC4。比如MC1和MC4两个麦克风互相面对地安置在一条直线上的原因是为了容易并正确地识别发言方。

信号处理的内容

下面，将说明主要由第一数字信号处理器(DSP)25执行的处理的内容。

图9为一个概略图，示出了由DSP 25执行的处理。下面，将给出简要说明。

(1)环境噪声的测量

作为最初的操作，优选地，测量在其中布置了双向的通信设备1的环境的噪声。通信设备1可用于各种环境(会议室)。为了正确地选择麦克风并提高通信设备1的性能，在本发明中，在初始阶段，在其中布置了通信设备1的环境噪声被测量，以能消除从麦克风拾取的信号的噪声的影响。当然，在通信设备1在同一会议室中重复使用时，噪声预先被测量，从而这种处理过程在噪声没有改变的状态下可以省略。注意噪声在正常状态下也可以被测量。噪声测量的细节在后面说明。

(2)主席的选择

例如，当使用通信设备1进行双向会议时，如果有在会议室中主持进程的主席时是有利的。因此，作为本发明的一方面，在使用通信设备1的初始阶段，从通信设备1的操作单元15设定主席。作为设定主席的一种方法，例如位于操作单元15的附近的第一麦克风MC1用作主席的麦克风。当然，主席的麦克风可以是任一个麦克风。注意当重复使用通信设备1的主席相同时，该处理可省略。可选择地，在主席就座的位置的麦克风也可以预先确定。在此情况下，选择主席的操作不是每次必需的。当然，主席的选择不限于初始状态而可以在任意时间完成。选择主席的细节将在下面说明。

(3)麦克风的灵敏度差调整

作为初始操作，优选地，用于放大麦克风MC1至MC6的信号的放大单元的增益或衰减单元的衰减值被自动地调整，从而耦接在接收和再现扬声器16与麦克风MC1至MC6之间的原声变为相等。灵敏度差的调整将在后面说明。

作为常规的处理，执行下列示范的各种类型的处理。

(1)麦克风选择和切换的处理过程

当多个会议参与者同时在一个会议室中发言时，音频被混合并难于被在另一方的会议室中的会议参与者A1至A6理解。因此，在本发明中，原则上，只允许一个人在某一时段中发言。为此，DSP 25执行识别发言方的处理，接着选择并切换被允许发言的麦克风。结果，只有来自于所选择的麦克风的语音经由电话线920发送到另一方会议室的通信设备1，并从扬声器输出。当然，如参照图5所述，在所选择的发言方的麦克风附近的LED接通。所选发言方的音频也可以从那个房间的通信设备1的扬声器听到，从而它可以被识别为允许的发言方。由于该处理，面对发言者单向麦克风的信号被选择，因此具有好的S/N的信号能作为传输信号发送到另一方。

(2)所选麦克风的显示

通过接通相应的麦克风选择结果显示装置30，比如发光二极管LED1至LED6，发言方的麦克风是否被选择并且哪个会议参与者的麦克风是允许发言的麦克风，很容易地被全体会议参与者A1至A6识别。

(3)信号处理

作为上面的麦克风选择处理背景技术，或为了正确地执行麦克风选择处理过程，执行下面示范的各种类型的信号处理。

(a)对麦克风声音拾取信号的频带分离和电平转换处理

(b)对判断发言开始和结束的处理

用作开始判断触发器，选择面对发言方的麦克风的信号

(c)对发言方方向的麦克风检测的处理

用于分析麦克风的声音拾取信号并判断发言方使用的麦克风

(d)对发言方的方向中的麦克风切换定时判断处理，和面对所检测的发言方的麦克风信号选择的切换处理

用于对从上面的处理结果中选定的麦克风进行命令切换

(e)常规操作时基准(floor)噪声的测量

基准(环境)噪声测量

在接通双向通信设备的电源之后，紧接着，该处理被分成初始处理和常规处理。注意该处理过程是在下列典型前提下完成的。

(1)条件：测量时间和临时阈值：

1.测试音声压声压：-40dB(就麦克风信号电平而言)

2.噪声测量单位时间：10秒

3.常规状态下的噪声测量：

将10秒的测量结果重复10次来计算平均值以找出认作是噪声电平的平均值。

(2)通过基噪声和发言开始参考电平之间的差得到有效距离的标准和阈值

1.26dB或更多：3米或大于3米

发言开始的检测电平阈值：基噪声电平+9dB

发言结束的检测电平阈值：基噪声电平+6dB

2.20至26dB：不大于3米

发言开始的检测电平阈值：基噪声电平+9dB

发言结束的检测电平阈值：基噪声电平+6dB

3.14至20dB：不大于1.5米

发言开始的检测电平阈值：基噪声电平+9dB

发言结束的检测电平阈值：基噪声电平+6dB

4.9至14dB：不大于1米

基噪声电平和发言开始基准电平之间的差÷2+2dB

发言结束的检测电平阈值：发言开始阈值-3dB

5.9dB或更小：略困难(hard)，几十个厘米

发言开始的检测电平阈值：-3dB

6.基噪声电平和发言开始参考电平之间的差÷2

发言结束的检测电平阈值：-3dB

7.相同或负的：不能判定，选择被禁止

(3)常规处理过程的噪声测量开始阈值是在当接通电源时获得基噪声电平+3dB之时开始的。

通过滤波处理的各种类型的频率分量信号的产生

图10为结构图，示出了在DSP 25用由麦克风拾取的声音信号执行的滤波处理作为处理之前的处理。图10表示了一个麦克风(通道(一个声音拾取信号))的处理过程。

麦克风的声音拾取信号在具有比如100Hz截止频率的模拟低截止滤波器101中进行处理，从中移去了100Hz频率或更小频率信号的滤波后的话音信号输出到A/D转换器102，在A/D转换器102转换成数字信号的声音拾取信号在数字高截止(high cut)滤波器103a至103e(通称为103)中去除了它们的高频分量，数字高截止滤波器截止频率为7.5kHz、4kHz、1.5kHz、600Hz、和250Hz(高截止处理)。数字高截止滤波器103a至103e的结果进一步地在减法器104a至104d(通称为104)中被减去相邻数字高截止滤波器103a至103e的滤波器信号。在本发明的实施例中，数字高截止滤波器103a至103e和减法器104a至104e实际上由DSP 25DSP 25的处理过程实现。A/D转换器102可以作为A/D转换块27的一部分实现。

图11为频率特性图，表示了参照图10说明的滤波器处理结果。这样，具有各种类型的频率分量的多个信号从具有单向性的麦克风拾取的信号中产生。

带通滤波器处理过程和麦克风信号电平转换处理过程

作为用来启动麦克风选择处理的一个触发器，判断发言的开始和结束。用于此的信号是通过示于图12在DSP 25执行的带通滤波器处理和电平转换处理而获得。图12只示出了在麦克风MC1至MC6拾取的六个通道通道(CH)输入信号的处理中的一个通道通道。对于麦克风的声音拾取信号通道通道，DSP 25中的带通滤波器处理和电平转换处理单元具有带通滤波器201a至210e(通称为“带通滤波器块201”)和电平转换器202a至202g(通称为“电平转换块202”)，带通滤波器具有100-600Hz、200-250Hz、250-600Hz、600-1500Hz、1500-4000Hz、以及4000-7500Hz带通特性，电平转换器202a至202g用于转换原始麦克风声音拾取信号的电平和带通处理的声音拾取信号。

每个电平转换器单元202a至202g具有信号绝对值处理单元203和峰值保持处理单元204。因此，由波形所示，当作为输入接收由虚线指示的负信号时，信号绝对值处理单元203将该符号取反，以将该负信号转换成正信号。峰值保持处理单元204保持信号绝对值处理单元203输出信号的最大值。注意在该实施例中，保持的最大值随时间流逝下降一点。当然，也可能改进峰值保持处理单元204以减少下降量并使最大值能长时间地保持。

带通滤波器将在下面说明。用于通信设备1中的带通滤波器是比如正好包括麦克风信号输入级的二阶IIR高截止滤波器和低截止滤波器。该实施例利用了这样的事实，即如果从具有平的频率特性的信号中减去通过高截止滤波器的信号时，余量变得基本上等于通过低截止滤波器的信号。为了匹配频率电平特性，全通带的带通滤波器的一个额外的频带成为必要的。所需的通频带是通过带通滤波器的频带的数目+1滤波器系数以及频带数目得到的。此时麦克风信号的每个通道(CH)所需的带通滤波器的频带是带通滤波器的下列六个频带：

BP特性带通滤波器

BPF1＝[100Hz-250Hz]...................201b

BPF2＝[250Hz-600Hz]...................201c

BPF3＝[600Hz-1.5kHz]...................201d

BPF4＝[1.5kHz-4kHz]...................201e

BPF5＝[4kHz-7.5kHz]...................201f

BPF6＝[100Hz-600Hz]...................201a

在该方法中，在DSP 25中的IIR滤波器的计算程序中仅仅为6CH(通道)×5＝30。将它和常规的带通滤波器结构相比。，如果如同本发明一样使用二阶IIR滤波器配置带通滤波器并为六个麦克风信号准备带通滤波器的六个频带，则在常规方法中，6×6×2＝72个电路的的IIR滤波器处理是必需的。该处理过程甚至由最新的极好的DSP进行也需要相当大的程序处理，并对其它的处理产生影响。在本发明的该实施例中，100Hz低截止滤波器处理是由输入级的模拟滤波器实现的。这里备有二阶(secondary)IIR高截滤波器的5个截止频率：250Hz、600Hz、1.5kHz、4kHz和7.5kHz。其中具有截止频率7.5kHz的高截止滤波器实际上具有16kHz的采样频率，因此是不需要的，但是减去的数目的相位有意旋转(rotate)，以减少带通滤波器的输出电平由于在减去处理步骤中IIR滤波器的相位旋转而减小的现象。

图13为图12所示的结构在DSP 25DSP 25的处理流程图。

示于图13的DSP 25DSP 25的滤波器处理中，高通滤波器处理作为第一级处理完成，而执行从高通滤波器处理的第一级的结果减去处理过程作为第二级处理，图14为信号处理结果的粗略的频率特性图。在下列说明中，[1]到[5]表示了在图11中的处理情况。

第一级

[1]对于全带通滤波器，输入信号通过7.5kHz高截止滤波器。该滤波器输出信号通过和模拟低截止滤波器组合而成为[100Hz-7.5kHz]的带通滤波器输出。

[2]输入信号通过4kHz高截止滤波器。该滤波器输出信号通过和输入模拟低截止滤波器组合而成为[100Hz-4kHz]的带通滤波器输出。

[3]输入信号通过1.5kHz高截止滤波器。该滤波器输出信号通过和输入模拟低截止滤波器组合而成为[100Hz-1.5kHz]的带通滤波器输出。

[4]输入信号通过600kHz高截止滤波器。该滤波器输出信号通过和输入模拟低截止滤波器组合而成为[100Hz-600kHz]的带通滤波器输出。

[5]输入信号通过250kHz高截止滤波器。该滤波器输出信号通过和输入模拟低截止滤波器组合而成为[100Hz-250kHz]的带通滤波器输出。

第二级

[1]当带通滤波器(BPF5＝[4kHz到7.5kHz])执行滤波器输出处理[1]-[2]([100Hz到7.5kHz]-[100Hz到4kHz])时，获得上面的信号输出[4kHz到7.5kHz]。

[2]当带通滤波器(BPF4＝[1.5kHz到4kHz])执行滤波器输出处理[2]-[3]([100Hz到4kHz]-[100Hz到1.5kHz])时，获得上面的信号输出[1.5kHz到4kHz]。

[3]当带通滤波器(BPF3＝[60kHz到1.5kHz])执行滤波器输出处理[3]-[4]([100Hz到1.5kHz]-[100Hz到600Hz])时，获得上面的信号输出[600Hz到1.5kHz]。

[4]当带通滤波器(BPF2＝[250Hz到600Hz])执行滤波器输出处理[4]-[5]([100Hz到600Hz]-[100Hz到250Hz])时，获得上面的信号输出[250Hz到600Hz]。

[5]带通滤波器(BPF1＝[100Hz到250Hz])定义上文的信号[5]为上文的输出信号[5]。

[6]带通滤波器(BPF6＝[100Hz到600Hz])定义上文的信号[5]为上文的输出信号[5]。

通过在DSP 25DSP 25中的上述的处理获得所需的带通滤波器输出。

麦克风MC1到MC6的输入声音拾取信号声音拾取信号被不断地更新如表1中的整个频带的声压声压电平和通过带通滤波器的六个频带的声压声压电平。

表1信号电平的转换结果

	BPF1	BPF2	BPF3	BPF4	BPF5	BPF6	ALL
	BPF1	BPF2	BPF3	BPF4	BPF5	BPF6	ALL	MIC1	L1-1	L1-2	L1-3	L1-4	L1-5	L1-6	L1-A
MIC2	L2-1	L2-2	L2-3	L2-4	L2-5	L2-6	L2-A	MIC1	L1-1	L1-2	L1-3	L1-4	L1-5	L1-6	L1-A
MIC2	L2-1	L2-2	L2-3	L2-4	L2-5	L2-6	L2-A	MIC3	L3-1	L3-2	L3-3	L3-4	L3-5	L3-6	L3-A
MIC4	L4-1	L4-2	L4-3	L4-4	L4-5	L4-6	L4-A	MIC3	L3-1	L3-2	L3-3	L3-4	L3-5	L3-6	L3-A
MIC4	L4-1	L4-2	L4-3	L4-4	L4-5	L4-6	L4-A	MIC5	L5-1	L5-2	L5-3	L5-4	L5-5	L5-6	L5-A
MIC6	L6-1	L6-2	L6-3	L6-4	L6-4	L6-6	L6-A	MIC5	L5-1	L5-2	L5-3	L5-4	L5-5	L5-6	L5-A

在表1中，例如，L1-1表示当麦克风MC1的声音拾取信号通过第一带通滤波器201a时的峰值电平。在判断发言的开始和结束中，利用麦克风声音拾取信号通过示于图12的100Hz到600Hz的带通滤波器201a并在电平转换单元202b中转换为声压电平。

常规的带通滤波器是通过为带通滤波器的每一级组合高通滤波器和低通滤波器而构成。因此如果基于该实施例中使用的参数来构造带通滤波器的36个电路，则可能需要72个电路的滤波器处理。与此相反，如上所说明的，本发明的实施例的滤波器结构变得简单。

判断发言开始和结束的处理过程

基于从声压电平检测单元输出的值，如图14所示，当麦克风声音拾取信号电平上升到基噪声之上并超过发言开始电平的阈值时，第一数字信号处理器(DSP1)25判断发言开始，当电平高于开始电平阈值并此后持续时，判断发言在进行中，当电平下降到结束发言的阈值时判断有基噪声，并且当电平持续了发言结束判断时间，比如0.5秒时，判断发言结束。

发言的开始和结束判断根据通过100Hz到600Hz带通滤波器并在示于图12中的麦克风信号转换处理单元202b转换成声压电平的声压电平数据(麦克风信号电平(1))变得高于示于图14中的阈值电平的时间，来判断发言的开始。

在检测发言开始之后，为了避免伴随频繁地切换麦克风的误操作，DSP25DSP 25被设计成在发言结束判断时间期间，例如0.5秒时间，不检测下一个发言的开始。

麦克风选择

DSP 25DSP 25在彼此进行发言的系统中检测发言方的方向，并基于所谓的“记分卡方法”自动选择面对发言方的麦克风的信号。图15图示了通信设备1的操作类型。图16为表示通信设备1的常规处理的流程图。

通信设备1，如图15中所示，根据来自麦克风MC1到MC6的声音拾取信号声音拾取信号执行监视音频信号的处理，判断发言开始/结束，判断发言方向，并选择麦克风，而且在麦克风选择结果显示装置30上显示结果，显示装置比如为发光二极管LED1到LED6。下面，将参照流程图16给出在通信设备1中主要使用DSP 25DSP 25的操作的说明。注意麦克风电子电路壳体2的全部的控制由微处理器23来完成，但是将集中描述在DSP 25DSP 25的处理过程。

步骤1：监视电平转换信号

参照图11到图13，特别是图12的说明，在麦克风MC1到MC6拾取的信号被转换为带通滤波块201和电平转换块202中的7种类型的电平数据，因此DSP 25连续监视麦克风声音拾取信号的7种类型的信号。基于监视结果，DSP 25DSP 25切换到发言方方向检测处理1的处理、或发言方方向检测处理2的处理或者发言开始结束判断处理。

步骤2：发言开始/结束判断处理过程

DSP 25DSP 25通过参照图13并进一步根据下面将详细说明的方法判断发言的开始和结束。当检测发言开始时，DSP 25DSP 25向步骤4的发言方方向判断处理通报发言开始的检测。注意在步骤2的判断发言开始和结束的处理过程中，当语音电平变得小于发言结束电平时，发言结束判断时间(比如0.5秒)的计时器被激活。当在发言结束判断期间语音电平小于发言结束电平时，则判断发言已经结束。当在发言结束判断期间，语音电平变得大于发言结束电平时，进入等待处理过程直到它重新变得小于发言结束电平。

步骤3：检测发言方方向的处理过程

在DSP 25DSP 25中检测发言方方向的处理过程通过不断继续搜索发言方的方向来完成。此后，数据供给步骤4的判断发言方方向的处理。

步骤4：发言方方向麦克风的切换处理过程当步骤2的处理和步骤3的处理结果为：在那时发言方检测方向与此时选择的发言方方向不一致时，判断在DSP 25切换发言方方向的麦克风的处理过程中的定时的处理过程向步骤4切换麦克风信号的处理过程指示选择新的发言方方向的麦克风。注意，当已经从操作单元15中设置了主席的麦克风，而且主席的麦克风和其它会议参加者同时发言时，则将优先权给予主席的发言。此时，所选麦克风信息在麦克风选择结果显示装置30，例如发光二极管LED1至LED6上显示出来。

步骤5：麦克风声音拾取信号的传输

切换麦克风信号的处理过程仅发送通过步骤4的处理、从六个麦克风信号中选择的麦克风信号，并且作为经过电话线920从通信设备1向其他方通信设备的发送信号，因此将它输出至如图5所示的电话线920的线路输出端。

发言开始电平阈值和发言结束电平阈值的设置

处理过程1：每个麦克风接通电源之后，马上测量预定时间的性能，例如，一秒的基噪声。DSP 25在恒定时间间隔(例如本实施例的10秒间隔)中读出声压电平检测单元的峰值保持电平值，计算预定时间(例如，一秒)的平均值，并将其定义为基噪声。DSP 25根据所测量的基噪声电平，确定发言开始检测电平的阈值(基噪声+9dB)，和发言结束检测电平的阈值(基噪声+6dB)。即使在此之后，DSP 25也在恒定时间间隔读出声压电平检测器的峰值保持电平值。在DSP 25判断发言结束时，它进行基噪声测量，检测发言开始，并更新发言结束的检测电平阈值。

根据本方法，由于在麦克风放置位置的基噪声电平彼此不同，该阈值的设定可为每个麦克风设置每个阈值，而且可防止由于噪声源导致对麦克风选择的错误判断。

处理过程2：对于具有环境噪声(具有较大基噪声)的房间

当基噪声较大，而且在处理过程1中自动更新阈值电平时，针对发言开始或结束检测困难时，过程2执行下列对策。根据预测的基噪声电平，DSP 25确定发言开始和结束的检测电平的阈值。DSP 25设置发言开始阈值电平高于发言结束阈值电平(例如相差3dB或更高)。通过声压电平检测器，DSP 25以恒定时间间隔读出峰值保持电平值。

根据本方法，由于阈值对于所有扬声器是相同的，该阈值能够设置成通过个人的话音幅度而识别发言开始，这些人背对噪声源而其他人的话音具有相同音量。

发言开始的判断

处理过程1：对应于六个扬声器的声压电平检测器的输出电平与发言开始电平的阈值进行比较。当输出电平超过发言开始电平的阈值时，就判断发言开始。当对应于所有扬声器的声压电平检测器的输出电平都超过发言开始电平的阈值时，DSP 25判断该信号是来自于接收和再现扬声器16，从而不判断此发言已经开始。这是因为接收和再现扬声器16与所有麦克风MC1至MC6之间的距离相同，来自接收和再现扬声器16的声音几乎等量地到达所有麦克风MC1至MC6。

处理过程2：通过如图4所示以60度等角等间隔径向排列的六个麦克风，准备了三组麦克风，每个组包括两个单方向性麦克风(麦克风MC1和MC4、麦克风MC2和MC5、以及麦克风MC3和MC6)，该三组麦克风具有以相反方向移动180度的定向轴，并利用两个麦克风信号的电平差值。即，执行下列操作：

(麦克风1信号电平-麦克风4信号电平)的绝对值...[1]

(麦克风2信号电平-麦克风5信号电平)的绝对值...[2]

(麦克风3信号电平-麦克风6信号电平)的绝对值...[3]

DSP 25将以上绝对值[1]、[2]和[3]与发言开始电平的阈值进行比较，当该绝对值超过发言开始电平的阈值时，就判断发言开始。在所有绝对值都没有变得大于发言开始电平的阈值的这种处理过程情况下，不同于处理过程1(因为来自于接收和再现扬声器16的声音等量地到达所有麦克风)，从而声音是否来自于接收和再现扬声器16，或者音频是否来自发言方的判断变得不必要了。

发言方方向的检测过程

对于发言方方向的检测，利用在图6中示例的单方向性麦克风的特性。在单方向性特征麦克风中，如图6所示例，频率特性和电平特性根据从发言方到达麦克风的音频角度而变化。其结果在图7A至图7C示出。图7A至图7C示出了通过将扬声器放置到距离通信设备1预定距离，例如，1.5米的距离，对麦克风在恒定时间间隔拾取的音频进行快速傅立叶变换(FFT)的结果。X轴代表频率，Y轴代表信号电平，Z轴代表时间。横向曲线代表带通滤波器的截止(cut-off)频率。被这些线夹在中间的频带电平成为这样的数据，该数据通过带通滤波器的五个频带经麦克风信号电平转换处理，并被转换为参照图10至图13所示的声压电平。

接着，将描述根据本发明实施例的作为用于检测通信设备1中发言方方向的实际处理过程的判断方法。对于带通滤波器的每个频带的输出电平，执行适当的加权处理(在1dB满量程(full span)(1dBFs)步骤中的0dBFs时为0，而在-3dBFs时为3，反之亦然)。处理结果通过该加权步骤来确定。对每个采样时钟执行上述加权处理，加入每个麦克风的加权分，为数量恒定的采样平均该结果，具有小(大)总点数的麦克风信号被判断为朝向发言方的麦克风。下列表2指示大致结果。

表2，由点数表示信号电平的情况

	BPF1	BPF2	BPF3	BPF4	BPF5	和
	BPF1	BPF2	BPF3	BPF4	BPF5	和	MIC1	20	20	20	20	20	100
MIC2	25	25	25	25	25	125	MIC1	20	20	20	20	20	100
MIC2	25	25	25	25	25	125	MIC3	30	30	30	30	30	150
MIC4	40	40	40	40	40	200	MIC3	30	30	30	30	30	150
MIC4	40	40	40	40	40	200	MIC5	30	30	30	30	30	150
MIC6	25	25	25	25	25	125	MIC5	30	30	30	30	30	150

在表2所示的示例中，第一麦克风MC1具有最小的总点数，因此DSP 25判断在第一麦克风MC1方向上存在声音源(存在发言方)。DSP 25以声音源方向麦克风号的形式保持该结果。如上所述，DSP 25加权每个麦克风的频带带通滤波器的输出电平，从具有最小(最大)点数的麦克风信号往上序列排列带通滤波器频带的输出，并判断具有三个或更多频带的第一次序的麦克风信号作为来自面对发言方的麦克风信号。然后，DSP 25准备如下列表3所示的分数卡，指示在第一麦克风MC1的方向上存在声音源(存在发言方)。

表3.通过带通滤波器以电平序列排列的信号情况

	BPF1	BPF2	BPF3	BPF4	BPF5	和
	BPF1	BPF2	BPF3	BPF4	BPF5	和	MIC1	1	1	1	1	1	5
MIC2	2	2	2	2	2	10	MIC1	1	1	1	1	1	5
MIC2	2	2	2	2	2	10	MIC3	3	3	3	3	3	15
MIC4	4	4	4	4	4	20	MIC3	3	3	3	3	3	15
MIC4	4	4	4	4	4	20	MIC5	3	3	3	3	3	15
MIC6	2	2	2	2	2	10	MIC5	3	3	3	3	3	15

实际上，由于根据房间的特征的声音反射以及驻波(standing wave)的影响，第一麦克风MC1的结果不总是成为所有带通滤波器输出之中的顶点(top)，但是如果第一麦克风排列在主要五个频带中，就可判断在第一麦克风MC1方向上存在声源(存在发言方)。DSP 25以声源方向的麦克风号形式保持此结果。

以如下所示形式，DSP 25汇总麦克风带通滤波器的频带的输出电平数据，判断具有作为来自面对发言方的麦克风的高电平的麦克风信号，并以声源方向麦克风号的形式保持该结果。

MIC1电平＝L1-1+L1-2+L1-1+L1-4+L1-5

MIC2电平＝L2-1+L2-2+L2-1+L2-4+L2-5

MIC3电平＝L3-1+L3-2+L3-1+L3-4+L3-5

MIC4电平＝L4-1+L4-2+L4-1+L4-4+L4-5

MIC5电平＝L5-1+L51-2+L5-1+L5-4+L5-5

MIC6电平＝L6-1+L6-2+L6-1+L6-4+L6-5

发言方方向麦克风的切换定时的判断过程

当通过图16步骤2的发言开始判断结果激活的，并且从步骤3发言方方向的检测过程结果和过去选择信息中，检测新的发言方麦克风时，DSP 25向用于切换步骤5麦克风信号选择的处理过程，发布切换麦克风信号的命令，向麦克风选择结果显示装置30(发光二极管LED1至6)报告切换了发言方麦克风，从而通知发言方通信设备1已响应其发言。

为消除具有大回声房间中反射声音和驻波的影响，DSP 25禁止发布新的麦克风选择命令，除非在切换麦克风之后超过了发言结束判断时间(例如0.5秒)。根据图16步骤1的麦克风信号电平转换处理结果和本实施例步骤3的发言方方向的检测处理结果，准备两个麦克风选择切换时间。

第一种方法：可以清楚判断发言开始的时间

在所选麦克风方向上发言结束，而新的发言出现在另一方向的情况。

在这种情况下，在所有麦克风信号电平(1)和麦克风信号电平(2)成为或低于发言结束阈值电平之后，并且当任何一个麦克风信号电平(1)成为或高于发言开始阈值电平时，在超过了发言结束判断时间(例如，0.5秒)或过去了更长时间之后DSP 25判定发言开始，根据声源方向麦克风号的信息，确定面向发言方方向的麦克风为合理的声音拾取麦克风，并开始步骤5的麦克风信号选择切换处理过程。

第二种方法：在持续发言期间，从其它方向传来新的高声发言的情况。

这种情况下，DSP 25在从发言开始(当麦克风信号电平(1)成为或高于阈值电平时)经过或超过发言结束判断时间(例如0.5秒)之后，开始判断处理。当它判断在检测发言结束之前，来自处理过程3的声源方向麦克风号已经改变且已稳定，DSP 25就判定在对应于声音源方向麦克风号的麦克风处存在一个话音高于目前所选的发言方的发言方，确定该声源方向麦克风作为合理的声音拾取麦克风，并激活步骤5的麦克风信号选择切换处理过程。

用于对面向所检测的发言方麦克风信号的切换选择处理过程

DSP 25通过可选择的判断的命令来激活，通过来自图16步骤4发言方方向麦克风的切换定时判断处理过程的命令来进行所述判断。用于切换DSP25的麦克风信号的选择过程，通过如图17所示的六个乘法器和一个六输入加法器来实现。为了选择麦克风信号，DSP 25产生已连接所选择麦克风信号的乘法器的通道增益(CH增益)[1]，并产生其它乘法器的CH增益[0]，其中加法器相加(麦克风信号x[1])的所选择的信号和(麦克风信号x[0]的)的处理结果，并在输出端给出所需的麦克风选择信号。

当通道增益被切换至如上所述[1]或[0]时，可能由于切换麦克风信号的电平差值导致产生咯嚓声。因此，在双向通信设备1中，如图23所示，从[1]至[0]和从[0]至[1]的CH增益的改变对于切换过渡时间期间(例如，10秒时间)设置成连续的，从而避免了由于麦克风信号的电平差值导致的咯嚓声。

进一步，通过设置不同于[1]的最大通道增益，例如[0.5]，可以调整在DSP25中的以后的回声消除处理操作。

如上所述，本发明第一实施例的通信设备可有效地应用于诸如无噪声影响会议的双向会议中。当然，本发明的通信设备不局限于会议应用，也可被应用于各种其它目的。即，当不需要强调通带的群延迟特性时，本发明第一实施例的通信设备也适用于通带的电压电平测量。因此，例如也可应用于简单的频谱分析仪中，应用快速傅立叶变换(FFT)处理过程(类似FFT仪表)的电平仪中，用于证实图形均衡器的均衡器处理结果的电平检测处理器中等，用于小汽车立体声、无线盒式录音机等的电平仪等等。

本发明第一实施例的通信设备从结构来看具有下列优点：

(1)具有单向性的多个麦克风与接收和再现扬声器之间的位置关系是恒定的，并且它们之间的距离很近，因此从接收和再现扬声器直接返回的声音输出电平绝对大于并优于从接收和再现扬声器通过会议室环境并返回多个麦克风的输出声音电平。因此，从接收和再现扬声器到达多个麦克风(信号电平(强度)、频率特性和相位)的声音特征总是相同的。即本发明的通信设备具有发送功能总是相同的优点。

(2)因此，当切换麦克风时，具有发送功能不改变的优点，从而无论何时切换麦克风，都不必调整麦克风系统的增益。换言之，具有一旦通信设备制造时完成调整，就不必重新调整的优点。

(3)甚至如果麦克风因上述相同原因被切换，由数字信号处理器(DSP)配置回音消除器的数量可保持为一个。DSP是昂贵的，在由于固定各种元件而具有小空间的印刷板上，用于放置DSP的空间可保持较小。

(4)在接收和再现扬声器与多个麦克风之间的转换功能是恒定的，从而具有优点，即麦克风自身的±3dB的灵敏度差值调整可仅由该单元执行。

(5)作为在其上固定通信设备的桌子，通常使用的是由圆形工作台制成。则作为在全方向上等量分配具有均匀质量的音频的扬声器系统可以通过通信设备中的一个接收和再现扬声器，利用这一点来实现。

(6)从接收和再现扬声器输出的声音通过边界效应和有效优质音响，有效地经过桌面传播，等量地到达会议参与者。在会议室中的天花板方向相对侧的声音被同相(in phase)抵消而变成小声音，从天花板方向向会议参与者会有一点反射声，结果清晰声音传向与会者。

(7)从接收和再现扬声器输出的声音以相同音量同时到达全部多个麦克风，因此，变得容易决判定声音是发言方的音频还是接收的音频。结果，减少了麦克风选择处理过程的误判定。

(8)通过以等角度径向地、等间隔地排列偶数个麦克风，可容易地执行用于检测方向的电平比较。

(9)通过采用缓冲材料的阻尼器，麦克风支撑构件具有柔性或弹性等，由于经过安装麦克风于其上的印刷电路板，接收和再现扬声器发出的声音振动导致对麦克风声音拾取信号的影响将会降低。

(10)接收和再现扬声器的声音不直接输入麦克风。因此，在该通信设备中，来自接收和再现扬声器的噪声的影响很小。

从信号处理观点来看，本发明第一实施例的通信设备具有下列优点：

(a)以在等间隔径向地排列多个单方向性麦克风，以能够进行声源方向的检测，切换麦克风信号至具有良好S/N而且清晰声音的拾取声音，并将其向其他方发送。

(b)能够从具有良好S/N的周围发言方拾取声音，并自动选择面向发言方的麦克风。

(c)本发明中，作为麦克风选择处理方法，划分通过音频的频带，将在所划分的频带的倍数上的电平进行比较由此简化信号分析。

(d)通过DSP的信号处理实现本发明的麦克风信号切换处理。当切换时，全部多个信号被交叉衰弱，以防止发出“咯嚓”声。

(e)可向诸如发光二极管的麦克风选择结果显示装置或外部通知麦克风选择结果。从而，对于电视摄影机，使其较好地用作发言方位置信息也是可能的。

第二实施例

将参照图19至24描述根据本发明的第二实施例的通信设备。

直到现在，电话机、对讲机、电视电话机或类似设备用于向远离声源的另一人或其他人传送人们开会发言的内容。这种情况下，经常存在噪声，诸如周围人的话音、从电视机传来的声音，从而发言者清晰的声音可能不会传送到另一人。那么，有时需要例如将麦克风移动并接近发言人、大声讲话、或稍微降低从电视机传来的声音之类烦琐的工作。

如上所述，第一实施例的通信设备可消除通信设周围的这些噪声，而正确区分发言者，然而，需要进一步改善通信设备。

通信设备的第二实施例，作为相对通信设备的第一实施例改善的通信设备，采用通过只清晰选择预先登记的发言者声音的声波纹鉴别，降低可能是噪声的其它声音的电平，从而获得良好通信。

图19是示出第二实施例的通信设备结构图。图19所示的通信设备1A具有与图5所示的通信设备1相类似的结构，相同的组件具有相同的参考数字。不同之处如下。

第二实施例的通信设备1A中，增益可变型放大器301至306被放置在麦克风MC1至MC6以及A/D转换器271至273之间，添加了声波纹鉴别部分32，并添加了放大器增益调节部分34，放大器291的输出信号提供给线路输出端和声波纹鉴别部分32。注意，如第一实施例所述，A/D转换器271至273可被配置成具有增益调节和放大(增益可变及放大型A/D转换器)的功能，然后，增益可变型放大器301至306的功能可被包括在A/D转换器271至273中。在第二实施例中，将描述提供有A/D转换器271至273和独立增益可变型放大器301至306的情况。

第二实施例中，进一步添加了第三放大器293，以形成这样的电路结构，即：来自线路输入的输入信号或来自放大器293的信号可输出到声音记录输出端REC OUT。

六个麦克风MC1至MC6具有如图6所示的方向性(定向特征)，以等角且等距离径向放置。

与第一实施例相同，A/D转换器271至273的每个都是双通道A/D转换器，并输入双通道的输入信号。

第一DSP(数字信号处理器)25执行图9所列并在第一实施例中所述的各种处理，例如，麦克风选择和切换的处理。

第二DSP 26执行如第一实施例所述的回音消除处理。

声波纹鉴别部分32包括：声波纹鉴别处理处理器P，用于执行声波纹鉴别；字典存储器M，用于执行声波纹处理；以及声波纹登记存储器M2，用于登记声波纹。声波纹登记存储器M2预先登记发言者的声波纹，以试图通过声波纹登记设备32A进行声波纹鉴别。在第二实施例中，经过声波纹鉴别的人是使用通信设备1A的会议参加者(与会者)。将详细描述声波纹鉴别部分32的处理过程。

与第一实施例的过程相类似，DSP 21选择麦克风MC1至MC6中的一个，并输出麦克风选择信号S251，向麦克风23指示所选定麦克风号。微处理器23向放大器增益调节部分34输出麦克风选择信号S251。

由DSP 25选择的麦克风拾取信号被提供给DSP 26，DSP 26执行回音消除处理，并向D/A转换器282和放大器292输出相同的信号，以输出来自接收和再现扬声器16的放大的声音。结果，使用通信设备1A的会议参与者可通过接收和再现扬声器16听到利用所选择的麦克风的发言者的话音。

从DSP 26向D/A转换器282输出的所选话音信号S26，通过放大器291向线路输出端输出，也可向参照图1所示的其它通信设备传送。而且，从DSP25向D/A转换器282输出的所选话音信号S26通过放大器293被输出至RECOUT端，并可以被记录下来。进一步，从DSP 26向D/A转换器282输出的所选话音信号S26输出至声波纹鉴别部分32，声波纹鉴别部分32对所选话音信号S26执行声波纹鉴别。将在稍后详细描述声波纹鉴别。声波纹鉴别32对所选话音信号S26执行声波纹鉴别，并向放大器增益调节部分34输出鉴别通过信号S32，当所选话音信号S26与声波纹登记存储器M2登记的声波纹一致时，S32为“1”，即，鉴别通过(成功)，或者当鉴别没有通过(失败)时，S32为“0”。

麦克风选择信号S25从DSP 25通过微处理器23输入至放大器增益调节部分34。这种情况下，来自声波纹鉴别部分32的鉴别通过信号S32，向放大器增益调节部分34指示已通过(成功)鉴别，然后，对施加了由麦克风选择信号S251指示的麦克风输出信号的增益可变型放大器，放大器增益调节部分34提高其增益；或者当增益已经提高到此高电平时，维持该增益；或者设置预定的高电平；否则，降低其它增益可变型放大器的增益，或当增益已经降低到此低电平时，维持该增益，或设置预定低电平。

具体地，放大器增益调节部分34包括微计算机，对于麦克风选择信号S251指示的所选麦克风输出信号所对应的增益可变型放大器，该微计算机将增益设置值设置在高电平，并将该增益输出到那个增益可变型放大器。否则，将其它增益可变型放大器的增益设置值设置在低电平，并将该增益输出到那些增益可变型放大器。结果，增益可变型放大器301至306的增益被改变成输入增益设置值。

例如，当第一麦克风仅拾取来自电视机的声音时，并且该声音电平高，则DSP 25选择第一麦克风。结果，DSP 25通过微处理器23向放大器增益调节部分34输出指示选择第一麦克风的麦克风选择信号S251。从电视机输出并被DSP 25选择的声音信号，作为所选的话音信号S26，通过放大器291被输入至声波纹鉴别部分32。由于声波纹登记存储器M2没有登记从电视机输出的声音，声波纹鉴别部分32确定该声音没有通过鉴别(失败)的状态，并向放大器增益调节部分34输出为“0”的鉴别通过信号S32。放大器增益调节部分34已经输入了指示选择第一麦克风MC1的麦克风选择信号S251，然而，如果输入的鉴别通过信号S32为“0”，那么放大器增益调节部分34为增益可变放大器301在低电平设置增益设置值，该增益可变放大器301连接到通过选择信号S251指示的第一麦克风MC1，并向放大器301输出该增益设置值，以降低放大器301的增益。结果，第一麦克风拾取的声音在低电平上减小，并向A/D转换器271输出，其后，电视机的声音被合适地当作禁止选择(out-of-selection)。

相反，当使用第三麦克风MC3的发言者的声波纹已经向声波纹鉴别部分32的声波纹登记存储器M2预先登记，并且第三麦克风MC3被DSP 25选择，通过微处理器23，DSP 25向放大器增益调节部分34输出指示选择第三麦克风MC3的麦克风选择信号S251，由第三麦克风MC3拾取的话音作为所选话音信号S26，被输入至声波纹鉴别部分32，并试图进行声波纹鉴别。这种情况下，由于使用第三麦克风MC3的发言者的声波纹被登记在声波纹登记存储器M2中，将通过声波纹鉴别，从而发布为“1”的鉴别通过信号S32。

当放大器增益调节部分34输入为“1”的鉴别通过信号S32时，放大器增益调节部分34参考此刻指示选择第三麦克风MC3的麦克风选择信号S251，将施加有第三麦克风MC3的输出信号的增益可变型放大器305的增益设置值设置在高电平，并向放大器305输出该增益设置值，以将放大器305的增益设置在高电平。结果，第三麦克风MC3拾取的声音信号在增益可变型放大器305中提高其电平，并被输入至A/D转换器273，话音信号S26高电平话音输出从DSP 25输出，作为所选的话音信号S26。当然，该所选的话音信号S26在D/A转换器282中被转换为模拟信号，并且该转换的模拟信号在放大器292中被放大，放大后的话音被输出到声音接收和再现扬声器16中。放大器291放大的信号通过线路输出端向另一通信设备传送，并被输入到另一通信设备中的声波纹鉴别部分并可试图进行声波纹鉴别。

如果被第一麦克风MC1拾取的电视机的声音和第三麦克风MC3拾取的话音同时存在，首先，DSP 25选择具有高于其他声音电平的声音，所选声音作为所选话音信号S26被输入到声波纹鉴别部分32中。如果第一麦克风MC1拾取的电视机的声音高于第三麦克风MC3拾取的话音，DSP 25选择电视机的声音，并作为所选话音信号S26从DSP 25输出。然而，如上所述，这种所选话音信号S26不被声波纹鉴别部分32所鉴别。连接至第一麦克风MC1的增益可变型放大器301的增益设置在低电平上。此后，在DSP 25的麦克风选择处理中不选择第一麦克风MC1拾取的声音信号，依次地，可在DSP 25中选择第三麦克风MC3拾取的话音信号。这种由第三麦克风MC3拾取的话音信号作为所选的话音信号S26，从DSP 25输入到声波纹鉴别部分32，然后，该所选话音信号S26将可能通过声波纹鉴别。结果，放大器增益调节部分34将连接到第三麦克风MC3的增益可变型放大器305的增益设置在高电平，第三麦克风MC3拾取的话音音信号电平变高，并且该处理过的清晰话音从声音接收和再现扬声器16中输出，而且通过线路输出还被输出给另一通信设备，并可输入给其中的声波纹鉴别部分。

通过这种方法，其声波纹已在声波纹鉴别部分32中的声波纹登记存储器M2登记的发言者所发出的话音将被最终选择，然后该话音以清晰的话音被输出到线路输出端，并接着输出至另一通信设备的声波纹鉴别部分32，以及声音接收和再现扬声器16。

因此，如图1所示，通过利用第二实施例的通信设备1A，在彼此远离的人们之间可容易地实现清晰话音会话。

甚至如果通信设备1A被安装在诸如电视机嘈杂声的喧闹环境下，在第二实施例中的通信设备1A中，不需要发言者移动去接近麦克风，和/或大声说话或呼喊。

而且，在麦克风使用期间不需要降低电视机的声音电平，不需要烦琐的工作。相反，DSP 25降低电视机的这种声音，而该降低的电视机声音被传送给另一通信设备，因此使用另一通信设备的会议参与者可仅听到发言者的清晰话音，从而获得良好并流畅的会议效果。在这点上，第二实施例的通信设备1A用作噪声抑制器，用于抑制(消除)不必要的噪声。

当然，当其声波纹没有在声波纹鉴别部分32的声波纹登记存储器M2中登记的第三方或个人在通信设备1A周围发言时，这种话音最终不被选择，而且不会被输出到另一通信设备。即，第二实施例的通信设备1A忽略了这种没有登记的声波纹的声音。

如图14所示，当麦克风的输出信号降低，并且这种状态持续预定时段时，DSP 25确定麦克风选择终止。此时，优选地，放大器增益调节部分34将相应于发言终止的麦克风的增益可变型放大器的增益设置值复位为正常增益值。当然，这种终止的选择包括在麦克风选择S251中，并通过微处理器23从DSP 25传送给放大器增益调节部分34。通过复位相应于刚刚终止其使用(选择)的麦克风的增益可变型放大器的增益设置值，对于所有麦克风MC1至MC6，下次麦克风的选择条件成为相同的。

以上描述中，作为本发明的增益可变型放大装置，描述增益可变型放大器301至306，然而，如上所述，增益可变型A/D转换器271至273可用于替代A/D转换器271至273。然后，增益可变放大器301至306被增益固定型放大器所替代，而放大器增益调节部分34可调节(设置)增益可变型A/D转换器271至273的增益。

作为本发明的麦克风优选排列，描述了以等角径向排列的麦克风MC1至MC6，但是，在第二实施例中，不局限于麦克风MC1至MC6的这种优选排列方式。具体地，如图4所示，不必要以相对方向排列第一和第四麦克风MC1和MC4成一线。甚至麦克风的排列是不规律的，第二实施例的通信设备1A的DSP 25检测具有最大电平的话音信号，选择相应的麦克风，并输出指示该麦克风的麦克风选择信号S251。当然，话音鉴别部分32执行上文论述的声波纹鉴别。将参照图20至24详细描述声波纹鉴别部分32的处理过程。

在第二实施例中，每个会议参与者依次朝向相应麦克风发言，将每个话音输入到声波纹鉴别设备32A。声波纹登记设备32A向声波纹鉴别部分32输出伴随有麦克风号的输入话音。该示例中，每个会议参与者的话音是指示通信设备1A的操作的短命令，例如2到3秒说“打开文件”、“下一个”等。

声波纹鉴别部分32中的声波纹鉴别处理器P将从声波纹登记设备32A输入的话音信号转换为数字信号，参考记录在字典存储器M1的字典，执行话音识别处理，将数字信号转换(翻译)为字符串数据，并将其与麦克风号一起存储在声波纹登记存储器M2中。即，声波纹鉴别处理器P比较输入话音信号与相应字典存储器M1的话音命令的字符串数据，并选择匹配数据，其中字符串数据相应于预先存储的输入话音命令。

图20A至20D是说明在话音识别处理部分32中执行的控制操作的时序图。图20A是麦克风切换信号MC_SEL的时序图，而且示出例如，当指示#4时，此时选择第四麦克风MC4。图20B是麦克风输出信号的时序图。麦克风输出信号是相应于麦克风号的话音信号，该麦克风号由如图20A所示的麦克风切换信号MC_SEL所指示，该信号在话音鉴别处理器P中被A/D转换器转换成数字信号，而且该数字信号被输入。在这种示例中，话音信号是指示诸如“打开文件”“下一个”的麦克风输出信号的命令的话音信号。图20C是示出在声波纹鉴别处理处理器P中通过参考图20A和20B获得的信息而执行处理过程的时序图。该处理过程由每个话音数据的缓冲和缓冲之后的话音识别处理构成。图20D是如图20C所示的话音识别处理结果所连续输出的字符串数据的时序图。

如图20A所述，#4是第一选择的麦克风号，麦克风输出信号“打开文件”从第四麦克风被输入到话音识别处理处理器P中。话音识别处理处理器P输入经A/D转换器转换为数字信号的麦克风输出信号，开始如图20C所示的缓冲，在缓冲器中保持相应于麦克风号#4的话音数据。

此后，麦克风号从#4变为#1，然后麦克风切换信号MC_SEL变为“1”。如图20B所示，麦克风号#1的话音数据是相应于“下一个”的话音数据，然后，声波纹鉴别处理处理器P终止麦克风号#4的缓冲，重新对麦克风#1开始缓冲，同时，声波纹鉴别处理处理器P在保持在缓冲器中的麦克风号#4的话音数据基础上，并行地执行话音识别。

在话音识别处理过程中，麦克风号#4的话音数据被进行话音识别处理，并与存储在字典存储器M1的字符串数据的命令组进行比较，如果匹配就被选择，从而输出如图20D所示的“打开文件”的字符串数据。

此后，当麦克风号从#1变为#2时，执行上述处理。

将参照流程图概括描述上文的控制操作。

图21是示出声波纹鉴别处理器P中执行的控制主要流程图。例如，2kHz的T1定时器启动，如同22所示，操作转向T1定时器每50毫秒的中断处理过程。存在超过预定电平的话音输入(步骤ST11)，则操作转向步骤ST12。当然，上述预定电平的阈值可根据应用需要任意设定。由于提供有麦克风切换信号MC_SEL，在步骤ST11，声波纹鉴别处理处理器P保持电平超过预定电平的话音的麦克风号。因此，在步骤ST12，开始输入话音数据的采样，然后采样的话音数据在相应于麦克风号的缓冲器中保持。如果没有超过预定电平的输入话音，在步骤ST12，处理器P不执行任何操作。

图24是示出当麦克风选择信号在主要流程的控制中发生改变时的中断流程图。即，处在正常控制操作的主要流程中有一个中断处理流程(操作)出现，DSP 25将选择的麦克风号被改变，该改变信息包括在麦克风切换信号MC_SEL中并被予以通知。在图20的示例中，该过程示出了在规律中断之前，当麦克风号4的话音数据，即麦克风切换信号MC_SEL＝4时的话音数据，被采样并向麦克风号4的缓冲器缓冲时，麦克风切换信号MC_SEL的内容从“4”改变为“1”。

在图24的步骤ST40，当声波纹鉴别处理处理器P执行话音数据的采样时，声波纹鉴别处理处理器P没有再存储话音数据到缓冲器。这种情况下，处理器P判断为此时执行的从麦克风号“4”输入的发言终止，并终止采样(步骤ST41)

被终止采样的麦克风号“4”的话音数据在声波纹鉴别处理处理器P中进一步执行话音识别处理(步骤ST42)。在该采样中，麦克风号“4”的话音数据当作“打开文件”而在声波纹识别处理器P中被识别，该字符串数据输出到通信设备1A的外部。

在图21的步骤ST10中，T1定时器启动，而T1定时器中断操作每50毫秒(20kMz)就启动，如图22所示。T1定时器中断操作监视每50毫秒是否就有话音输入，该话音输入是否超过预定电平，并执行适当的处理过程。

在步骤ST20中，检查是否已经执行了话音采样。如果已执行了话音采样，则声波纹鉴别处理处理器P进一步检查话音输入是否超过了预定电平(步骤ST21)，当话音输入超过了预定电平时，停止稍后描述的T2定时器。T2定时器被用于监控没有发言的状态，以及当在预定时间没有发言时，作为下一阶段，将操作模式自动转换到话音识别。当存在发言时，换言之，话音输入超过了预定电平，就认为发言继续并且T2定时器在步骤ST22被复位。

在步骤ST20执行话音采样，但是如果不存在超过预定电平的话音输入，假定当前发言可能是被终止，则T2定时器被触发启动，用于监控没有发言的持续时间(步骤ST23)。

在步骤ST21，甚至在没有话音超过预定电平的情况下，由于可能重新开始发言，所以话音采样将被继续(步骤ST24)。

在步骤ST20不执行话音采样，接着，声波纹鉴别处理处理器P检查是否有超过预定电平的话音输入。结果，检查发言是否开始的状态，如果有话音输入超过预定电平，声波纹鉴别处理处理器P识别发言开始，并开始对相应于新近所选择的麦克风的缓冲器采样话音。在步骤ST25，如果不存在超过预定电平的输入话音，那么声波纹鉴别处理处理器P不执行任何动作，等待直到输入下一个有效发言。

图22的步骤ST23中，例如2Hz的T2定时器启动，并过去了预定时间，即声波纹鉴别处理处理器P执行话音采样(步骤ST20，但不存在超过预定电平的输入话音，而预定时间持续这种情况下)，持续话音采样是无用的，因此，该操作将转向如图23所示的定时器T2中断操作。即，此时执行的话音采样被终止(步骤ST30)，此操作将转向话音识别处理(步骤ST31)。在步骤ST32，转向话音识别处理后。为下一个发言过程复位定时器T2。

根据声波纹鉴别部分32，甚至如果多个会议参与者同时使用麦克风，并通过重叠状态下话音向通信设备1A发布命令，DSP 25对每个话音的每个频带的声压电平进行分析，以指定主要发言者，并选择其话音信号。因此，如果同时输入多个话音命令，可避免无用和错误的识别处理，而且声波纹鉴别部分32可稳定执行其对主要发言话音命令的鉴别。

声波纹鉴别部分32的声波纹鉴别处理处理器P执行传送话音命令信号的缓冲、缓冲的话音信号的话音识别过程，将缓冲的话音信号与存储在字典存储器M1中的命令字符数据进行比较，选择匹配字符串数据。

每次选择时，声波纹鉴别部分32中的声波纹鉴别处理处理器P从声波纹鉴别设备32A接收所选择的麦克风号。从而，如果所选麦克风号改变，处理器P停止缓冲，并对缓冲的话音信号执行话音识别处理，以及对所改变的麦克风号的话音信号开始缓冲。所以，提高了话音识别的准确性。

第三实施例

参照图25和26，将描述根据本发明第三实施例的会议设备。

第三实施例将描述使用第一和第二实施例的通信设备1和1A并对通信设备添加了成像装置而构成电视(TV)会议系统的情形。

具有电视摄影机的常规会议系统中，电视摄影机的方向由为电视会议系统的每个发言者或主席(或管理者)所提供的麦克风号所控制。为实现该方法，需要为发言者准备各自麦克风，不可避免导致了昂贵系统。同时不可避免存在这样烦琐工作，例如当发言者改变时，通过电视会议系统的主席改变电视摄影机的成像方向，以拍摄发言者的图像。进一步，当发言者的姓名也随着其图像显示时，通常，麦克风与发言者的姓名相关联，那么，如果与会者的座位改变，则必需重新设置这种姓名和麦克风的关系。

已知存在一种用于针对声音改变电视摄像机方向的简单系统，然而，这种简单的系统具有下面的缺点，电视摄像机的方向有时响应于周围环绕噪声，例如，响应会议所使用的投影仪风扇的声音等而朝向不合理的方向，即，电视摄像机可能经常拍下投影仪的图像。

如第一实施例和第二实施例所述的通信设备具有优点：选择正确；不需要将麦克风定位于接近会议参与者；噪声和/或不需要的声音可被消除等。

例如，在第一实施例的通信设备1中，如图4所示，多个麦克风MC1至MC6排列指向(使朝向)所有方向，第一数字信号处理器(DSP 25)选择朝向当前正在发言的发言者的麦克风拾取的话音信号。即，通信设备1选择正确的发言者或其麦克风。

进一步，向第一实施例的通信设备1添加了声波纹鉴别部分39的通信设备1A，可靠地选择正确的发言者或其麦克风。

因此，第三实施例中，介绍了图25和26所示的会议设备1B和1C，每个会议设备具有：添加到如图19所示通信设备1A的如本发明成像装置一个实施例的电视摄像机设备40；和如本发明成像方向调节装置的一个实施例的成像方向调节部分36。

图25和26是示出了本发明第三实施例的会议设备1B和1C的结构图。图26是示出会议设备1C的结构图，其中的成像方向调节部分36和电视摄像机设备40被添加到如图19所示通信设备1A中，图25是示出会议设备1B的结构图，其中增益可变型放大器301至306和放大器增益调节部分34从如同26所示的会议设备1C中删除。

第三实施例具有下列三种模式。

(1)第一模式中，如第一实施例所述，由DSP 25进行的麦克风选择处理不是必徐的，而成像方向调节部分36根据麦克风选择处理结果控制电视摄像机设备的成像条件。

(2)在优于第一模式的第二模式中，以示于图25的结构，(构造)，如第一实施例所述，DSP 25执行麦克风选择处理过程，并进一步如图19第二实施例所述，在麦克风选择处理结果与声波纹鉴别匹配的情况下，通过声波纹鉴别部分32执行声波纹鉴别，接着成像方向调节部分36控制电视摄像机设备40的成像条件。

(3)在优于第二模式的第三模式中，以示于图26的结构，DSP 25如第一实施例所述执行麦克风选择处理过程，如图19第二实施例所述，在麦克风选择处理结果与声波纹鉴别匹配的情况下，通过声波纹鉴别部分32执行声波纹鉴别，然后成像方向调节部分控制电视摄像机设备40的成像条件，并进一步通过放大器增益调节部分34执行增益可变型放大器301至306的增益控制。

参照图25和26将详细描述本发明的第三实施例。

成像方向调节部分36包括计算机，其可调节成像方向、变焦条件、以及照明条件等，成像方向调节部分36的计算机的存储器部分预先设置(存储)用于拍摄图像的第一成像信息(例如，第一麦克风的方向和第一区域(范围)MC1区域)、用于拍摄图像的第二成像信息(例如，第二麦克风的方向和，第二区域(范围)MC2区域)等。优选地，这种成像条件信息可包括会议参与者的姓名、工作名(他的职业名)、他的职务头衔等。

当成像方向调节部分36为电视摄像机设备40给出成像条件时，例如诸如向上或向下、左侧或右侧、变焦条件(移动摄像机镜头的条件)、是否执行了变焦、变焦的程度等之类的成像条件，基于所给的成像条件，电视摄像机设备40能够拍摄的图像。电视摄像机设备40拍摄的图像(视频)信号在显示设备(装置)上显示，该显示设备没有在图中示出，且位于安装了通信设备1A的房间内，通过一条没有示出的信号发送路径，图像信号将在安装了另一通信设备的另一远程房间内安装的电视接收机上显示。

放大器增益调节部分34和成像方向调节部分36通过微处理器23输入指示所选麦克风号的麦克风选择信号S251。同时，当所选话音信号S26在声波纹鉴别部分32进行声波纹鉴别之后，与预先登记的声波纹相一致时，放大器增益调节部分34和成像方向调节部分36输入已被输出的识别通过信号S32“1”，该所选话音信号S26是由DSP 25选择并由DSP 26进行回音消除处理和输出的拾取话音信号。

放大器增益调节部分34设置相应于如第二实施例所述的在第一大值(高电平)上麦克风选择信号S251指定的麦克风的增益可变型放大器的增益，其结果与第二实施例的结果相同。

成像方向调节部分36读出预先设置到成像方向调节部分36的成像条件信息，相应于麦克风选择信号S251所指示的麦克风，并根据(响应于)读取的成像条件信息，调节电视摄像机设备40的成像条件。例如，当麦克风选择信号S251指示第一麦克风时，响应于拍摄朝向第一麦克风和区域MC1_AREA的图像的的第一成像条件信息，成像方向调节部分36控制电视摄像机设备40的方向可向上或向下，也可左侧或右侧，以拍摄区域MC1_AREA和第一麦克风方向的图像。如果第一成像条件信息包括有关变焦的信息，成像方向调节部分36对电视摄像机设备40指示变焦操作。

电视摄像机设备40在由成像方向调节部分36指令的条件下拍摄图像。结果图像(画面)经过没有示出的传输通道被发往另一房间安装的电视接收机，在另一房间里装配有另一通信(会议)设备。电视摄像机设备40的结果图像也可在安装有电视摄像机设备40和通信(会议)设备的房间中的显示设备上显示。

通过这种方法，在远端房间的电视接收机和/或该侧房间中的显示设备上，通过麦克风发布发言的会议参与者的图像，由DSP 25来选择，并可选择地显示出来，与会者的话音是以声波纹鉴别部分32的声波纹鉴别方式鉴别。

成像方向调节部分36可添加诸如姓名、职业等信息，该信息包括在通过电视摄像机设备40拍摄的图像信号上的成像条件信息中。

结果，在安装通信设备1B的房间中的显示设备上以及远端房间的电视接收机上，姓名、职业等以添加的形式被显示在由电视摄像机设备40拍摄的图像上。

在会议设备1B和1C的初始状态中，例如，在接通会议设备电源之后的瞬间时刻，成像方向调节部分36指令电视摄像机设备40，从而电视摄像机设备40在主席前方的麦克风位置上拍摄图像，(例如，主席就座的区域，通常包括第一麦克风位置的区域)，或拍摄所有会议参与者和通信设备1A的图像。

如果不适当地执行了麦克风的选择，或者如果不适当地执行了麦克风的选择，但是声波纹鉴别没有通过(失败)，这些状态被称为默认情况(条件或状态)，成像方向调节部分36执行默认处理。成像方向调节部分36向电视摄像机设备40给出成像条件，作为错误处理，从而在主席就座的前方麦克风的位置，或所有会议参与者和通信设备1A的位置都可被拍摄，或者可以维持当前成像的条件。

在默认情况下，放大器增益调节部分34不调节增益可变型放大器301至306的增益。

将具体描述成像方向调节部分36和电视摄像机设备40。在第二实施例中已描述了放大器增益调节部分34的处理过程，因而忽略其描述。

假设，坐在第一麦克风方向并在区域MIC1_AREA的会议参与者A1，面对第一麦克风MC1发言。由第一麦克风MC1拾取的声音信号通过A/D转换器271转换为数字信号，并被输入给DSP 25，而DSP 25通过上述方法选择麦克风MC1。DSP 25向微处理器23输出指示选择第一麦克风MC1的麦克风选择信号S251。麦克风选择信号S251通过微处理器23被提供给成像方向调节部分36。第一麦克风MC1拾取并由DSP 25选择的话音信号被输出至DSP 26，以在那里执行回音消除，而结果信号作为所选的话音信号S26，通过D/A转换器282和放大器291被输入至话音鉴别部分32。声波纹鉴别部分32鉴别所选话音信号S26与声波纹鉴别部分32中预先登记在声波纹存储器M2中的声波纹是否匹配。如果会议参与者A1的声波纹与预先登记在声波纹鉴别部分32的声波纹登记存储器M2中的声波纹匹配，则声波纹鉴别部分32发布为“1”的鉴别通过信号S32，该信号向放大器增益调节部分34和成像方向调节部分36指示鉴别通过(成功)。另一方面，如果会议参与者A1的声波纹没有登记在声波纹鉴别部分32的声波纹登记存储器M2中，则声波纹鉴别部分发布为“0”的鉴别通过信号S32，该信号向成像方向调节部分36指示鉴别失败。

成像方向调节部分36在为“1”的鉴别通过信号S32输入其中时，根据第一麦克风MC1的第一成像调节信息控制电视摄像机设备40，该信息由麦克风选择信号S251所指示。结果，电视摄像机设备40拍摄第一麦克风方向和区域MIC1_AREA的图像，以获得会议参与者的图像。响应于会议参与者A1朝向第一麦克风MC1发言期间的第一成像条件信息，成像方向调节部分36使电视摄像机设备40持续拍摄第一麦克风方向和区域MIC1_AREA的图像。

接着，假设会议参与者A3朝向第三麦克风MC3发言，DSP 25选择该发言，但是第三会议参与者的声波纹没有登记到声波纹登记存储器M2中。DSP 25通过微处理器23向成像方向调节部分36发布麦克风选择信号S25指示选择第三麦克风MC3。当然，第三麦克风MC3拾取的话音信号被提供给DSP 26，以执行回音消除，回声消除后的话音信号被提供给声波纹鉴别部分32。如上所述，第三会议参与者A3的声波纹没有登记到声波纹登记存储器M2，因此，声波纹鉴别部分32输出为“0”的鉴别通过信号S32，该信号向成像方向调节部分36指示鉴别的失败。一旦接收到为“0”的鉴别通过信号S32，成像方向调节部分36判断为默认，并执行误默认处理，例如，根据相同成像条件，通过电视摄像机设备40持续拍摄图像；根据作为会议设备的初始状态的用于拍摄主席图像的成像条件，来拍摄主席图像等。当然，在这种情况下，会议参与者A3的图像没有被电视摄像机设备40所拍摄。

如果多个会议参与者同时发言，DSP 25选择最高电平声音，所选话音通过声波纹鉴别来检查，成像方向调节部分36在声波纹鉴别结果基础上，控制电视摄像机设备40拍摄图像。

上述操作和处理过程同样应用于远端另一会议设备。甚至如果远端另一会议设备不具有声波纹鉴别功能等，那么，通过经传输通道接收必要信息，在会议设备1A侧可执行这种功能，该侧会议设备的成像方向调节部分36可控制在远端会议室中的电视摄像机设备。

通过第三实施例的会议设备1B和1C，向远端会议室传送清晰的话音，会议参与者的声波纹被鉴别，电视摄像机设备40得到会议参与者声波纹鉴别的图片。

第三实施例中，不需要以1∶1相应方式为会议参与者提供麦克风，也不需要通过例如主席的系统管理者控制电视摄像机40的成像条件。

如果会议参与者在会议期间移动其位置，DSP 25通过上述麦克风选择处理过程选择有效的麦克风，然后声波纹鉴别部分32执行正确的声波纹鉴别，因此，成像方向调节部分36控制电视摄像机设备40结合会议拍摄有效图像。

系统管理者、或主席在会议期间不进行会议设备方操作。

除显示会议参与者图像外，显示设备和/或电视接收机可自动显示他的姓名和职业。

参照图25和26，作为第三实施例的优选示例，对通过DSP 25选择麦克风、通过声波纹鉴别部分32进行声波纹鉴别、以及通过成像方向调节部分36控制电视摄像机设备40的拍摄条件进行描述，然而，主要地，成像方向调节部分36对电视摄像机设备40的成像条件的控制，可通过仅仅使用由DSP 25的麦克风选择结果来获得，即，不需要声波纹鉴别。

在实现第三实施例时，不需要象第一实施例那样(即以等角径向排列)排列麦克风。甚至如果麦克风没有以等角径向排列，DSP 25可选择输出巨大(最大)幅度话音(声音)的麦克风，并且声波纹鉴别部分32鉴别所选话音与预先登记的声波纹的匹配。麦克风选择和声波纹鉴别的组合使得能够自由排列麦克风。这种情况下，电视摄像机设备40可根据成像方向条件部分36所确定的成像条件，拍摄适宜的图像。

为实现本发明，上述实施例可适当结合，以满足需要和要求。

本发明工作中，不需要特别设备。只需要使用整体的麦克风和扬声器结构型通信设备。因此，在配置整体的麦克风和扬声器结构型通信设备的状态下，可执行上述调节。

尽管参照基于说明目的选择的特定实施例已经描述本发明，显然，可由本领域技术人员做出许多修改而不脱离本发明的基本概念和范围。

Claims

1.一种通信设备包括：

多个麦克风；

用于在由多个麦克风拾取的多个信号中选择信号的麦克风信号选择装置；和

用于响应于与拾取了麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件的成像方向调整装置。

2.根据权利要求1的通信设备，其中

成像条件信息包括指示成像装置的成像方向的信息，并且

成像方向调整装置，响应于指示成像方向的信息控制成像装置的成像方向。

3.根据权利要求2的通信设备，其中

成像条件信息包括用于改变成像装置的焦距的信息，

并且成像方向调整装置响应于改变成像装置的焦距的信息，来控制成像装置的焦距改变。

4.根据权利要求2的通信设备，其中

成像条件信息包括指示位于成像装置拍摄图像的位置的发言者的信息，并且

成像方向调整装置将指示发言者的信息加到由成像装置拍摄的图像上。

5.根据权利要求1的通信设备，进一步包括声波纹鉴别装置，用于执行声波纹的鉴别，即鉴别所选麦克风拾取的信号与以前登记的声波纹是否一致。

6.根据权利要求5的通信设备，其中成像方向调整装置响应与拾取了由麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息，控制成像装置的成像条件。

7.根据权利要求6的通信设备，其中，当声波纹鉴别装置未鉴别所选麦克风拾取的信号时，成像方向调整装置将成像装置的状态设置为默认状态。

8.根据权利要求7的通信设备，其中，当设置为默认状态时，成像方向调整装置不会改变成像装置的成像条件。

9.根据权利要求7的通信设备，其中，当设置为默认状态时，成像方向调整装置将成像装置的成像条件设置为初始成像条件。

10.根据权利要求9的通信设备，其中成像方向调整装置将成像装置的成像条件设置为给预先登记的主席拍摄图像的成像条件，作为初始成像条件。

11.根据权利要求5的通信设备，进一步包括用于放大由麦克风拾取的信号并具有可变的增益的增益可变型放大装置，和放大器增益调整装置，

当声波纹鉴别装置鉴别所选的麦克风拾取信号时，该放大器增益调整装置将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有较大值的第一增益。

12.根据权利要求11的通信设备，其中，当声波纹鉴别装置未鉴别所选择的麦克风拾取信号时，该放大器增益调整装置将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有较小值的第二增益。

13.根据权利要求11的通信设备，其中，当检测到麦克风信号选择装置的麦克风选择中止时，放大器增益调整装置将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有平均值或等于其它增益可变型放大装置的增益的第三增益。

14.根据权利要求12的通信设备，其中，当检测到麦克风信号选择装置的麦克风选择中止时，放大器增益调整装置将与指示所选择信号的麦克风相对应的增益可变型放大装置的增益设置到具有平均值或等于其它增益可变型放大装置的增益的第三增益。

15.根据权利要求1的通信设备，其中多个麦克风以等角径向设置，

通信设备进一步包括与多个麦克风等距离设置并接近于多个麦克风的声音输出装置。

16.根据权利要求1的通信设备，其中麦克风信号选择装置根据麦克风检测到的信号来检测声音源的方向。

17.根据权利要求2的通信设备，进一步包括声波纹鉴别装置，用于执行声波纹的鉴别，即鉴别所选麦克风拾取的信号与以前登记的声波纹是否一致。

18.根据权利要求2的通信设备，其中多个麦克风以等度径向设置，

19.根据权利要求2的通信设备，其中麦克风信号选择装置根据麦克风检测到的信号来检测声音源的方向。

20.根据权利要求17的通信设备，其中多个麦克风以等度径向设置，

21.根据权利要求17的通信设备，其中麦克风信号选择装置根据麦克风检测到的信号来检测声音源的方向。

22.一种会议设备，包括：

多个麦克风；

可调整成像条件的成像装置；

用于在多个麦克风拾取的多个信号中选择信号的麦克风信号选择装置；以及

23.一种调整成像条件的方法，包括：

在多个麦克风拾取的多个信号中选择信号的步骤；以及

响应于与拾取了选择步骤选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件的步骤。

24.根据权利要求23的调整成像条件的方法，还包括声波纹鉴别步骤，用于执行声波纹的鉴别，即鉴别所选麦克风拾取的信号与以前登记的声波纹是否一致，

其中在成像方向调整步骤中，响应于与拾取了麦克风信号选择装置选择的信号的麦克风相对应的成像条件信息控制成像装置的成像条件。