CN1190775C - 具有公共回声消除措施的多装置声频-视频系统 - Google Patents
具有公共回声消除措施的多装置声频-视频系统 Download PDFInfo
- Publication number
- CN1190775C CN1190775C CNB018024017A CN01802401A CN1190775C CN 1190775 C CN1190775 C CN 1190775C CN B018024017 A CNB018024017 A CN B018024017A CN 01802401 A CN01802401 A CN 01802401A CN 1190775 C CN1190775 C CN 1190775C
- Authority
- CN
- China
- Prior art keywords
- facility
- echo
- speech recognition
- eliminated
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 17
- 230000008030 elimination Effects 0.000 claims description 12
- 238000003379 elimination reaction Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 11
- 239000002131 composite material Substances 0.000 claims description 7
- 238000002592 echocardiography Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 239000012141 concentrate Substances 0.000 claims 3
- 238000005516 engineering process Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
一种多装置声频-视频系统,其包括有用户语音识别设施和回声消除设施。尤其是,存在多个且功能分离的这样的语音识别设施和回声消除设施。现在,回声消除设施组合它们的力量,用于通过它们中的一个或多个来消除一个或多个互为唯一的可消除语音实体,且组合这些被消除的实体作为不为系统识别的整体。
Description
技术领域
本发明涉及一种用于操作多装置声频-视频系统的方法,所述系统包括有语音识别和回声消除的设施。
背景技术
目前,语音识别技术已经得到广泛应用,包括应用在一般市场的消费系统中。回声消除在这方面还处于这样一种工作水平:个别的装置不能识别那些不断复制自身的语音。可是人或其他的外部使用者不得不接收该装置产生的全频谱的声音。因此,将回声消除措施内部作用在该装置上,藉此由该装置自身发出的声音就会有效地得到阻隔而不予考虑。目前,系统由各种各样的装置组成,其中每一种装置都必须识别使用者发出的一些语音条目,但是,无法预先确定哪些条目不能识别的。尤其,当组成特定系统的各种各样的装置来自不同的制造商时使该问题更加恶化而难以解决。换言之,组合到一起的装置就别想能作为一个组合整体工作。来源于同一制造商的装置或来源于不同制造商的装置可能包含不同的声音源。
发明内容
因此,除了其他许多目的之外,本发明的一个目的是提供一种用于操作多装置系统的方法,其中设计的回声消除基于各种各样的装置,但却能够使其作为一个综合系统工作。
因此,依照本发明的一个方面,本发明涉及一种用于操作包括多个装置的声频-视频系统的方法,所述系统包含与用户进行交互作用的用户语音识别设施和用于避免对作为用户语音由系统输出的话音进行识别的回声消除设施,其特征在于,利用从功能上分开的语音识别设施和回声消除设施,并且,存在多个语音识别设施和/或回声消除设施,利用一个或多个所述的回声消除设施来消除由所述系统输出的一个或多个各自的可消除声频信号,组合这些已进行消除处理的声频信号并馈送一个组合的已进行消除处理的声频信号至所述的语音识别设施,以便从总体上不识别所述系统的所述可消除声频信号。
本发明还涉及一种声频-视频系统,它包括多个装置,所述系统包括语音识别设施和用于避免对作为用户语音由系统输出的语音进行识别的回声消除设施,其特征在于,系统包括从功能上分开的语音识别设施和回声消除设施,并且,存在多个这样的语音识别设施和/或回声消除设施,回声消除设施被配置用来消除由所述系统输出的一个或多个各自的可消除声频信号,以及组合装置,用来组合这些已进行消除处理的声频信号并馈送一个组合的已进行消除处理的声频信号至所述语音识别设施,以便从总体上不识别所述系统的所述可消除声频信号。
本发明还涉及一种语音增强装置,用于根据本发明的声频-视频系统中,所述语音增强装置具有语音识别设施和用于避免对作为用户语音由系统输出的语音进行识别的回声消除设施,其特征在于,所述语音增强装置在所述相互连接的语音识别与回声消除设施之间具有语音输入/输出部件,用来与另外一台这样的语音增强装置相连接。
附图说明
在下文中将参照结合优选实施例的描述更具体地论述本发明的各种技术特征和优点,且尤其参照结合下述附图:
图1,与本发明一起使用的一种通用的语音增强装置;
图2,多装置语音增强系统,其具有分布式的自动语音识别(ASR)和分布式的自动回声消除(AEC);
图3,同上,其具有分布式的ASR和一个星形配置的集中式的AEC;
图4,同上,其具有分布式的ASR和集中式的AEC;
图5,同上,其具有集中式的ASR和集中式的AEC;
图6,同上,其具有集中式的ASR和分布式的AEC;
图7,同上,其在一个改进的结构中具有分布式的ASR和分布式AEC。
具体实施方式
图1描述了与本发明一起使用的一种通用的语音增强装置20。为了简明,已经减少了原有的用户控制功能。没有任何明确的或暗含的限制,这样的功能指声频的或声频视颜的调谐器、声频播放器、声频的或声频视频的记录器或者声频的或声频视频的编辑器。相反,该附图的细节已经限制于控制功能。通常,使用者控制输入直接用双向线对46中的输入线表示,且这样的控制可机械地通过用户键盘之类的设备、或者通过红外线(IR)信号传输等实现远程控制。通过灯或其它视觉显示指示器、通过文本显示、蜂鸣器以及其它方式输出控制信号通知。而且,控制信号通知可通过线对46与其它连接的声频-视频装置进行交换。
附图标记30表示通用的语音增强装置的用户功能,该装置接收来自线46的外部控制,且随意地产生在输出56上的声频信号和在线38上的声频信号,输出56上的声频信号用于通常用途诸如广播声频信号,线38上的声频信号用于其它目的,将在下文进行论述。后者通过附加机构32发送到扬声器48。部件22表示一个声音控制的用户接口,其可产生反馈信号通过线34到达附加机构32,通过附加机构32从输出到扬声器48的信号中减去反馈声音信号。另外,部件22可产生非声频输出信号到接口46,用于外部使用,或者用于控制装置30。
操作者的对该装置的语音输入可用麦克风(mic)28实现。以这种方式接收的语音信号可以通过线对42中的输出线输出。作为一种方案,还可使线对42中的输入线接收的语音信号与自动回声抵消器部件26进行通讯。后者将沿着双向通道40的输出通道输出一个语音信号。这个语音信号与麦克风28接收的语音信号高度一致,但是,该装置来自麦克风28任何语音信号经由图1中所示的部件48输出在很大程度上都削弱了。这样的语音信号通过图中所示的专用通道60接收。如此这样对该装置自身语音输出进行过校正的语音信号既可以通过双向语音通道40的输出通道输出,也可以发送到语音识别部件24的输入端。后者还可以选择接收沿着双向语音通道40的输入通道接收的外部传输语音信号。部件24对这样接收到的语音信号的识别没有限制可以因循。识别结果可作为文本沿着双向通道对44的输出通道输出,或者传送到声音控制的用户接口(VCUI)模块22。后者还可选择接收沿着双向通道对44的输入通道而来的外部输入文本。VCUI模块可产生进一步的控制信号,如前面所论述过的那样,或者产生声频信号输出馈送给扬声器音箱48,或者输出视频显示(为简洁在前面还没有论述过)。而且,VCUI模块可生成可选择的禁止信号,通过线36送达任意的或全部的模块24、26、28、48,以级联体系结构形式应用。其应用将在下面论述。
在不同的实施例中,图1装置中的一些部件可以省却。特别是,线对44是随意的,线对42中的线输出可以省却,同时一些其它的部件在下文所示的实施例中不是必需的。但是,在线对42中线上的麦克风在图6、7中(尤其与连线100比较)用处非常重要。
图2显示了一种多装置语音增强系统,其具有分布式自动语音识别(ASR)和分布式自动回声消除(AEC)。该系统显示为声频装置(Audio set)和电视机(TV)的组合,但是包括使用两个以上装置的多装置系统可以配置成各种其它形式。在后面所有的附图中,使用了诸如立体声声频装置的双通道平行设备或者诸如用于环绕声以及其它复杂再现技术的多通道设备,不再对附图中的各个通道进行分别标示。现在,每个装置将都需要用于声音控制的用户接口VCUI的其自身的软件层。但是,由于这样的功能隶属在各个独立装置中,当所有的装置同时运作时语音控制实际上是失败的。对立体声应用的强力补救方法是总共具有四个通道、每个装置有两个通道,且在每个装置中分别执行回声消除。假设还需要一个麦克风通道,则在该装置内部需要至少五个通道。如果进一步增加通道数目,则问题会按指数级数地增加。而且,该装置必须具有足够的处理能力以执行至少四倍的回声消除。而且不同的装置必须彼此连接。显然,这样陈述的解决方案需要集中硬件和软件,因此昂贵和容易出错和出故障。
在这方面,图3显示了增加带有星形结构互连模式的图2构造。所需条件是网络互连、声频输出、以及多通道自动回声消除。注意,假如多于两个装置组成该系统则所需条件将按指数规律增加,或者假如声频通道数目增加则将提高声音表达效果,例如音效超过高保真品质。人们公认在许多情况下这样的技术设施证明是多余的。
现在,有一个更加简单的解决方案,它只使用单个的扬声器,只使用单个装置来输出所有的系统中任意装置产生的声音。
另外的附图描述了依照本发明的系统的各种不同的非限制性的实施例。在这方面,图4显示了具有分布式的ASR和集中式的AEC的这样一种系统。现在,只需要对单个的n-通道声频信号进行回声消除,其中n为任意有实际意义的整数值。连线十分简单,例如将TV声频输出连接到声频装置中常见的辅助声频输入。此外无论如何,经过AEC之后声频信号必须传送到其他装置的“线输入”以识别出纯净信号。实际上在每个装置中都有语音接口(UI)。另外,还有另外的输入通道可用于需要复式传声器的将来波束形成技术以及关联的额外输入通道。该附图中描述的系统是将盒式磁带录像机(VCR)接通到电视机的情形。这种方法的所需条件是:在回声消除之后的声频输出,在自动语音识别之前的声频输入,禁用AEC,禁用麦克风,双通道声频输出。注意在VCR框中的子系统AEC、mic、以及扬声器s是不可使用的,通过图1装置中选择的组块结合在VCR中,并且它们用浅印刷体表示。
图5描述了具有集中式的ASR和集中式的AEC的系统,其可以简化为利用语音控制块。可用顶置盒方式实现。该构造具有图4结构所有的优点。而且,只需要单个的语音识别器机构。用户环境中最明显的优点是,在单个房间中固有地缺少复式识别器,还有,提高对各种不同装置控制的可能性以及可能扩充为更强大有效的系统。为了简便,该图限定为只有两个装置,每个都带有2-通道AEC。其所需条件是:每个装置都有双向控制链路,这有助于通过诸如HAVi网络这样的网络来有效使用;声频输出;且可能的话,要有给另一个声频装置用的另外的声频输入。声频装置和电视装置中,在图1中描述过的所有部件除了声频装置的扬声器之外,都将禁止使用,如所示将它们从图中删除了。
现在,在图5所示的装置结构中,连接装置中的一个仍然通过双通道输出播放声频信号,其通常依赖于声频装置自身来实现。这将迫使用户将其它所有的装置直接连接到单个的声频输出装置。对于分布式的AEC,这种选择可认为是仅对语音控制块(SCB)做较小的修改,其将允许不同的语音增强声频装置各自都能播放它们各自的声频信号。以分布式的方式对所有的装置进行声音回声消除处理,且因此,对每一个单独装置顺次地进行声音回声消除处理。
技术上,现在我们利用两个或多个各自带有两个通道的ASR-AEC装置就可以实现两个或多个声频通道消除回声的目的。例如,语音增强声频装置和语音增强电视装置各自都可以有它们自己的声频输出,但是各种不同的立体声通道将依次进行回声消除。在中心语音控制块(SCB)使用最终的与纯净的语音信号以控制各种不同的装置。现在,各种不同的语音信号存在失真的问题。而且,由顺次执行各个步骤导致的延迟也会引起一些问题。
在这方面,图6显示了另一个系统实施例,其包括声频装置、电视机、及语音控制块,具有集中式的ASR和分布式的AEC,因此减少了上述的各种缺点。特定所需条件现在包括有:在回声消除之后的声频输出;禁用ASR;禁用AEC;禁用麦克风;线输入;以及对各个装置的双向控制链路,其也可以通过网络实现。如图所示,在声频装置中ASR已经被选为禁用。而且,在电视机中,ASR与麦克风已经被选为禁用。还有,在语音控制块装置中,麦克风与AEC已经被选为禁用。如图所示,在这个装置构造中,声频装置和电视机装置两者都可以使用它们的扬声器。
特别是,语音控制块只可以用一些连接的装置替代,在那里将纯净语音信号向后传送到其它所有的装置。这实际上导致产生了类似于图2选择的系统,尽管可能不是显而易见的选择,然而却会是非常实用的。从装配的观点来看,关键思路是引入稳固耐用的自动语音识别技术,而不需要直接连接所有的装置,且不必使用专门的声频装置用于输出声音。这实际上导致产生了图7的方案,其在一个改进的结构中的具有分布式的ASR和分布式AEC。这个方案具有下述功能需求:在自动回声消除之后的声频输出,禁用麦克风和线输入。如图所示,电视机其自身的麦克风选为禁用。
Claims (17)
1.一种用于操作包括多个装置的声频-视频系统的方法,所述系统包含与用户进行交互作用的用户语音识别设施和用于避免对作为用户语音由系统输出的语音进行识别的回声消除设施,
其特征在于,利用从功能上分开的语音识别设施和回声消除设施,并且,存在多个语音识别设施和/或回声消除设施,利用一个或多个所述的回声消除设施来消除由所述系统输出的一个或多个各自的可消除声频信号,组合这些已进行消除处理的声频信号并馈送一个组合的已进行消除处理的声频信号至所述的语音识别设施,以便从总体上不识别所述系统的所述可消除声频信号。
2.一种如权利要求1所述的方法,其中通过串联排列不同的回声消除设施来进行这种组合。
3.一种如权利要求2所述的方法,且以集中方式从串联装置馈送所述组合的已进行消除处理的信号。
4.一种如权利要求2所述的方法,且以分布的方式从串联装置馈送所述组合的已进行消除处理的信号。
5.一种如权利要求1所述的方法,其中通过集中所述系统中的所述回声消除设施并且以分布的方式从所述回声消除设施向不同的语音识别设施进行所述馈送来执行所述组合操作。
6.一种如权利要求1所述的方法,其中通过将所述回声消除设施和语音识别设施集中在一个共同的控制设施中来执行所述组合操作。
7.一种如权利要求1所述的方法,其中通过将不同的回声消除设施配置在一个集中的控制装置中并且并行地从所述回声消除设施向不同的语音识别设施进行所述馈送来执行所述组合操作。
8.一种声频-视频系统,它包括多个装置,所述系统包括语音识别设施和用于避免对作为用户语音由系统输出的语音进行识别的回声消除设施,其特征在于,系统包括从功能上分开的语音识别设施和回声消除设施,并且,存在多个这样的语音识别设施和/或回声消除设施,回声消除设施被配置用来消除由所述系统输出的一个或多个各自的可消除声频信号,以及组合装置,用来组合这些已进行消除处理的声频信号并馈送一个组合的已进行消除处理的声频信号至所述语音识别设施,以便从总体上不识别所述系统的所述可消除声频信号。
9.一种如权利要求8所述的系统,其特征在于,所述组合装置包括一个串联装置,用于串行地配置不同的回声消除设施。
10.一种如权利要求9所述的系统,其特征在于,所述系统配置用来以集中方式从所述串联装置馈送所述组合的已进行消除处理的信号到语音识别设施。
11.一种如权利要求9所述的系统,其特征在于,所述系统配置用来以分布的方式从所述串联装置馈送所述组合的已进行消除处理的信号到不同的语音识别设施。
12.一种如权利要求8所述的系统,其特征在于,所述组合装置将所述回声消除设施集中在一个控制装置中且被配置用来以分布的方式馈送所述组合的已进行消除处理的信号给不同的的语音识别设施。
13.一种如权利要求8所述的系统,其特征在于,所述组合装置被配置用来将所述回声消除设施与语音识别设施集中在一个共同的控制设施中。
14.一种如权利要求8所述的系统,其特征在于,所述组合装置被配置用来集中不同的回声消除设施且并行地从回声消除设施馈送所述组合的已进行消除处理的信号给不同的的语音识别设施。
15.一种语音增强装置,用于权利要求8所述的系统,所述语音增强装置具有语音识别设施和用于避免对作为用户语音由系统输出的语音进行识别的回声消除设施,其特征在于,所述语音增强装置在所述相互连接的语音识别与回声消除设施之间具有语音输入/输出部件,用来与另外一台这样的语音增强装置相连接。
16.一种如权利要求15所述的语音增强装置,其特征在于,所述装置具有控制装置,用于选择性地禁用一个或多个所述语音识别设施、所述回声消除设施以及语音增强装置的声频输出设施。
17.一种如权利要求15所述的语音增强装置,其特征在于,所述装置具有麦克风输出部件和另一控制部件,该另一控制部件用于选择性地控制一个或多个所述语音识别设施、所述回声消除设施以及所述麦克风输出部件。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00202856 | 2000-08-15 | ||
EP00202856.1 | 2000-08-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1388956A CN1388956A (zh) | 2003-01-01 |
CN1190775C true CN1190775C (zh) | 2005-02-23 |
Family
ID=8171920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB018024017A Expired - Fee Related CN1190775C (zh) | 2000-08-15 | 2001-08-02 | 具有公共回声消除措施的多装置声频-视频系统 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20020021799A1 (zh) |
EP (1) | EP1312078A1 (zh) |
JP (1) | JP2004506944A (zh) |
KR (1) | KR20020040850A (zh) |
CN (1) | CN1190775C (zh) |
WO (1) | WO2002015169A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100556365B1 (ko) * | 2003-07-07 | 2006-03-03 | 엘지전자 주식회사 | 음성 인식장치 및 방법 |
CN1314000C (zh) * | 2004-10-12 | 2007-05-02 | 上海大学 | 基于盲信号分离的语音增强装置 |
US8223959B2 (en) * | 2007-07-31 | 2012-07-17 | Hewlett-Packard Development Company, L.P. | Echo cancellation in which sound source signals are spatially distributed to all speaker devices |
US8433058B2 (en) * | 2008-08-08 | 2013-04-30 | Avaya Inc. | Method and system for distributed speakerphone echo cancellation |
CN102131014A (zh) * | 2010-01-13 | 2011-07-20 | 歌尔声学股份有限公司 | 时频域联合回声消除装置及方法 |
US8811638B2 (en) * | 2011-12-01 | 2014-08-19 | Elwha Llc | Audible assistance |
US9159236B2 (en) | 2011-12-01 | 2015-10-13 | Elwha Llc | Presentation of shared threat information in a transportation-related context |
US9245254B2 (en) | 2011-12-01 | 2016-01-26 | Elwha Llc | Enhanced voice conferencing with history, language translation and identification |
US10875525B2 (en) | 2011-12-01 | 2020-12-29 | Microsoft Technology Licensing Llc | Ability enhancement |
US9064152B2 (en) | 2011-12-01 | 2015-06-23 | Elwha Llc | Vehicular threat detection based on image analysis |
US9368028B2 (en) | 2011-12-01 | 2016-06-14 | Microsoft Technology Licensing, Llc | Determining threats based on information from road-based devices in a transportation-related context |
US8934652B2 (en) | 2011-12-01 | 2015-01-13 | Elwha Llc | Visual presentation of speaker-related information |
US9107012B2 (en) | 2011-12-01 | 2015-08-11 | Elwha Llc | Vehicular threat detection based on audio signals |
US9053096B2 (en) | 2011-12-01 | 2015-06-09 | Elwha Llc | Language translation based on speaker-related information |
CN107396158A (zh) * | 2017-08-21 | 2017-11-24 | 深圳创维-Rgb电子有限公司 | 一种声控交互装置、声控交互方法和电视机 |
US11849291B2 (en) * | 2021-05-17 | 2023-12-19 | Apple Inc. | Spatially informed acoustic echo cancelation |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5548681A (en) * | 1991-08-13 | 1996-08-20 | Kabushiki Kaisha Toshiba | Speech dialogue system for realizing improved communication between user and system |
US5657425A (en) * | 1993-11-15 | 1997-08-12 | International Business Machines Corporation | Location dependent verbal command execution in a computer based control system |
US5583965A (en) * | 1994-09-12 | 1996-12-10 | Sony Corporation | Methods and apparatus for training and operating voice recognition systems |
US5761638A (en) * | 1995-03-17 | 1998-06-02 | Us West Inc | Telephone network apparatus and method using echo delay and attenuation |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
US6006108A (en) * | 1996-01-31 | 1999-12-21 | Qualcomm Incorporated | Digital audio processing in a dual-mode telephone |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US5867495A (en) * | 1996-11-18 | 1999-02-02 | Mci Communications Corporations | System, method and article of manufacture for communications utilizing calling, plans in a hybrid network |
JPH10257583A (ja) * | 1997-03-06 | 1998-09-25 | Asahi Chem Ind Co Ltd | 音声処理装置およびその音声処理方法 |
WO1998055992A1 (de) * | 1997-06-06 | 1998-12-10 | BSH Bosch und Siemens Hausgeräte GmbH | Haushaltsgerät, insbesondere elektrisch betriebenes haushaltsgerät |
US6505057B1 (en) * | 1998-01-23 | 2003-01-07 | Digisonix Llc | Integrated vehicle voice enhancement system and hands-free cellular telephone system |
US6061653A (en) * | 1998-07-14 | 2000-05-09 | Alcatel Usa Sourcing, L.P. | Speech recognition system using shared speech models for multiple recognition processes |
US6587822B2 (en) * | 1998-10-06 | 2003-07-01 | Lucent Technologies Inc. | Web-based platform for interactive voice response (IVR) |
US6665645B1 (en) * | 1999-07-28 | 2003-12-16 | Matsushita Electric Industrial Co., Ltd. | Speech recognition apparatus for AV equipment |
US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
-
2001
- 2001-08-02 JP JP2002520213A patent/JP2004506944A/ja active Pending
- 2001-08-02 KR KR1020027004598A patent/KR20020040850A/ko not_active Application Discontinuation
- 2001-08-02 WO PCT/EP2001/008929 patent/WO2002015169A1/en active Application Filing
- 2001-08-02 EP EP01967231A patent/EP1312078A1/en not_active Withdrawn
- 2001-08-02 CN CNB018024017A patent/CN1190775C/zh not_active Expired - Fee Related
- 2001-08-13 US US09/928,553 patent/US20020021799A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2004506944A (ja) | 2004-03-04 |
EP1312078A1 (en) | 2003-05-21 |
KR20020040850A (ko) | 2002-05-30 |
CN1388956A (zh) | 2003-01-01 |
US20020021799A1 (en) | 2002-02-21 |
WO2002015169A1 (en) | 2002-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1190775C (zh) | 具有公共回声消除措施的多装置声频-视频系统 | |
CN1108058C (zh) | 同时传输模拟视频信号和数字数据信号的方法和系统 | |
CA2153171C (en) | Sound localization system for teleconferencing using self-steering microphone arrays | |
US6931123B1 (en) | Echo cancellation | |
JP2005192227A (ja) | マルチメディアが可能とされたネットワーク | |
CN1902901A (zh) | 用于增强主观立体声音频的系统和方法 | |
CN201919110U (zh) | 一种用于数字法庭系统的庭审主机 | |
DE10153188C2 (de) | Vorrichtung und Verfahren zur mehrkanaligen akustischen Echokompensation mit variabler Kanalzahl | |
CN106603957A (zh) | 协同会议一体机及协同会议方法 | |
JP2006254064A (ja) | 遠隔会議システム、音像位置割当方法および音質設定方法 | |
US5495473A (en) | Method and apparatus for implementing hardware independent echo cancellation in a full-duplex audio stream in a computer system | |
CN202818483U (zh) | 一种电视会议系统 | |
CN1636423A (zh) | 利用有源音频矩阵系数的多声道回声抵消器系统 | |
JP2920449B2 (ja) | 遠隔技術支援システム | |
KR101106681B1 (ko) | 양방향 디지털 변환 오디오 전송 시스템 | |
CN105208319B (zh) | 会议终端装置和系统 | |
KR100193684B1 (ko) | 화상회의 또는 멀티미디어 네트웍에 있어서 영상 및 음성의 전송과 다자간 원격통화망 구성 방법 및 그 장치 | |
JPH0758859A (ja) | 遠隔会議用情報送信装置及び情報受信装置 | |
JPS6276958A (ja) | 音声伝送方式 | |
JP2523258B2 (ja) | 多地点間エコ―キャンセラ | |
CN218734483U (zh) | 一种基于Dante接口的视频会议终端 | |
JPH07105984B2 (ja) | 多入力エコーキャンセラ | |
WO2019103382A1 (ko) | 전자장치 및 그 제어방법 | |
CN112584299A (zh) | 一种基于多激励平板扬声器的沉浸式会议系统 | |
CN118158320A (zh) | 一种线下会议系统以及线上会议系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20050223 Termination date: 20090802 |