CN1202064A - 提高话音识别呼叫装置开始呼叫时话音识别的方法 - Google Patents
提高话音识别呼叫装置开始呼叫时话音识别的方法 Download PDFInfo
- Publication number
- CN1202064A CN1202064A CN98106170A CN98106170A CN1202064A CN 1202064 A CN1202064 A CN 1202064A CN 98106170 A CN98106170 A CN 98106170A CN 98106170 A CN98106170 A CN 98106170A CN 1202064 A CN1202064 A CN 1202064A
- Authority
- CN
- China
- Prior art keywords
- speech
- tinkle
- bells
- intercommunication telephone
- calling device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000003672 processing method Methods 0.000 claims description 9
- 230000007423 decrease Effects 0.000 abstract description 4
- 238000004904 shortening Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 238000002266 amputation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
话音识别装置中处理话音的一种方法,旨在提高开始呼叫时话音的识别率。这种方法通过将铃声频率和话音带宽频率分开来或缩短铃声避免了通过对讲电话通话时收到的话音在识别率方面的下降。
Description
本发明涉及话音识别呼叫装置,具体地讲,涉及一种提高开始呼叫时话音识别率的方法。
通常,象无需手持式随身用具之类的呼叫装置备有识别通过对讲电话收到的话音、处理话音和通过对讲电话输出话音的功能。因此,这种呼叫装置需要有一个装有扬声器和话筒的对讲电话、一个供识别通过话筒收到的话音的话音识别处理器和一个将通过话筒收到的话音输出给扬声器的对讲电话处理器。
图1是这类呼叫装置、即识别话音和能够呼叫的装置的方框图。这类话音识别呼叫装置基本上识别例如象“呼叫”、“通话”、“收到”等之类的话语。多数的话音识别呼叫装置是无需手持式的随身用具的。另外一种话音识别呼叫装置是稍后即将上市的自动回话电话机。
话音识别呼叫装置通常是这样接收来自开关的铃声的:首先,铃声从开关发送时,话音识别呼叫装置只要收到铃声就发出铃声。这里,当用户说话输入象“呼叫”、“通话”或“收到”之类的指令时,话音识别呼叫装置就识别该话音,切换到对讲电话工作状态,并接收铃声。这样,用户就可以通过对讲电话通话。
另一方面,用户要通过对讲电话通话时,如果在呼叫装置在响铃的同时输入话音指令,则铃声和话音指令就混杂在一起,而一般话音识别呼叫装置捕捉不到铃声与话音指令混杂音中话音指令的可能性是极大的,这是因为图1所示一般话音识别呼叫装置中产生的铃声的频率一般是与话音处在同一频率范围的500赫和1千赫组成的双重频率的缘故,也是因为响铃是以两秒停响、一秒响铃的方式循环进行的缘故。
本发明的目的是提供一种能提高话音识别率从而可以通过话音识别呼叫装置中的对讲电话收到铃声的话音处理方法。
本发明的另一个目的是提供一种即使用户偶然往话音识别呼叫装置输入话音指令也能通过对讲电话进行通话的话音处理方法。
为达到上述目的,本发明提供了一种可以通过话音识别呼叫装置中的对讲电话进行通话的话音处理方法。这种方法通过将铃声的频率与话音带宽的频率分开或缩短铃声避免了用对讲电话通话时收到的话音在识别率方面的下降。
参看附图详细说明本发明的一些最佳实施例可以更清楚理解本发明的上述目的和优点。附图中:
图1是应用本发明的话音识别呼叫装置的方框图;
图2A和2B是用以说明本发明一个实施例通过对讲电话进行通话时输入话音处理方法的示意图;
图3A和3B是用以说明本发明另一个实施例通过对讲电话进行通话时输入话音处理方法的示意图。
现在参看附图详细说明本发明的一些最佳实施例。那些认为使本发明的主题变得模糊的周知功能和结构,这里就不再详述了。此外,说明书中使用的术语是在考虑到本发明的作用的基础上采用的,因此应该指出的是,鉴于这些术语可按用户、芯片设计人员或习惯用途加以改变,因而其定义应根据本发明的整个公开内容确定。
图2A和2B是用以说明本发明一个实施例通过对讲电话开始通话时输入话音的处理方法的示意图。
本发明的方法按下列步骤进行。图1的铃声发生器22产生铃声,通过对讲电话的扬声器SPK和话筒MIC传送给话音识别处理器14。在本方法中,为最大限度地减少进入铃声中的话音量,改良了经带通滤波器12滤波的话音的带宽。就是说,经带通滤波器12滤波的话音,其带宽取300赫至1.5千赫。一般带通滤波器12滤除的话音带宽截止频率为3.4千赫。从实际话音的频率分析可知,大部分声能是分布在400~900赫的范围的,如图2A中所示。因此,可以截除话音频率带宽大约1.5千赫或更高的频率分量而不致产生任何不利的后果。
此外,在本方法中,铃声取与话音带宽不同的频率,从而阻止了再发出的铃声通过话筒MIC再进入话音识别处理器14中。就是说,铃声频率采用超过带通滤波器12截止频率带宽范围的1.8千赫和2.2千赫组成的双频使铃声频率与话音带宽频率不同。
这样,铃声即使再从扬声器SPK加到话筒MIC上也只通过对讲电话处理器18和扬声器SPK输出出去而无需加到话音识别处理器14上。就是说,即使通过话筒同时输入通过对讲电知通话的话音和铃声也只有对讲电话的话音加到话音识别处理器14上。因此,控制器24只接收在话音识别处理器中处理的对讲电话的话音,确认该话音,并控制对讲电话处理器18给扬声器电话发送铃声。这样就可以通过对讲电话通话。
图3A和3B是说明本发明另一个实施例通过扬声器开始通话时处理所输入话音的方法的示意图。
在本方法中,即使铃声以一秒钟响铃、两秒钟停响的循环方式(如图3A中所示)从一个开关引入的情况下,控制器24也以0.5秒响铃、5.5秒停响的循环方式(如图3B中所示)发出铃声。通过产生短于开关输出的铃声,即缩短响铃周期,可以消除输入的话音与铃声混杂在一起因而妨碍输入话音的识别的领域,从而可以避免铃声引起的话音识别率的下降。
综上所述,本发明通过将铃声的频率与话音带宽的频率分开或缩短铃声有利地避免了通过对讲电话通话时所输入话音识别率的下降。
虽然上面是就一些具体实施例来说明本发明的,但显然不言而喻,在不脱离本发明的范围和精神实质的前提下,本技术领域的行家们是可以对上述实施例进行种种修改的。因此,所述适当的范围必然符合下面提出的权利要求书的要求的。
Claims (7)
1.通过具对讲电话的话音识别呼叫装置中的对讲电话进行通话时处理话音的一种方法,包括下列步骤:
对根据话音识别呼叫装置中从一个开关收到的铃声产生的铃声取与话音不同的频率带宽;
输入通过对讲电话通话的话音时通过对讲电话接收铃声。
2.如权利要求1所述的话音处理方法,其特征在于,铃声频率取18~22千赫。
3.如权利要求1所述的语音处理方法,其特征在于,铃声是在输入通过对讲电话通话的、频率为300赫至1.5千赫的话音时通过对讲电话接收下来的。
4.通过具对讲电话的话音识别呼叫装置中的对讲电话进行通话时处理话音的一种方法,包括下列步骤:
在话音识别呼叫装置中从一个开关收到铃声时产生0.5秒钟响铃、5.5秒钟停响循环进行的铃声;和
输入通过对讲电话通话的话音时通过对讲电话接收所产生的铃声。
5.通过具对讲电话的话音识别呼叫装置中的对讲电话进行通过话时处理话音的一种方法,包括下列步骤:
对根据话音识别呼叫装置中从一个开关收到的铃声产生的铃声取与话音不同的频率带宽;
产生以0.5秒钟响铃、5.5秒钟停响方式循环进行的铃声;
输入通过对讲电话通话的话音时通过对讲电话接收所产生的铃声。
6.如权利要求5所述的话音处理方法,其特征在于,铃声频率取18~22千赫。
7.如权利要求5所述的话音处理方法,其特征在于,所产生的铃声是在输入通过对讲电话通话、频率为300赫至15.千赫的话音时通过对讲电话接收下来的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR23552/1997 | 1997-06-09 | ||
KR23552/97 | 1997-06-09 | ||
KR1019970023552A KR100229874B1 (ko) | 1997-06-09 | 1997-06-09 | 음성인식 통화장치의 통화개시시 음성인식율 향상 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1202064A true CN1202064A (zh) | 1998-12-16 |
CN1149815C CN1149815C (zh) | 2004-05-12 |
Family
ID=19508891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB981061702A Expired - Fee Related CN1149815C (zh) | 1997-06-09 | 1998-03-30 | 提高话音识别呼叫装置开始呼叫时话音识别的方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6131044A (zh) |
JP (1) | JPH1117779A (zh) |
KR (1) | KR100229874B1 (zh) |
CN (1) | CN1149815C (zh) |
FR (1) | FR2764458B1 (zh) |
GB (1) | GB2327010B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101399874B (zh) * | 2007-09-28 | 2011-08-31 | 深圳富泰宏精密工业有限公司 | 手机铃声音量加强装置及方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2823045A1 (fr) * | 2001-03-27 | 2002-10-04 | Koninkl Philips Electronics Nv | Telephone comportant un clavier de commande perfectionne |
US7801283B2 (en) * | 2003-12-22 | 2010-09-21 | Lear Corporation | Method of operating vehicular, hands-free telephone system |
US20050134504A1 (en) * | 2003-12-22 | 2005-06-23 | Lear Corporation | Vehicle appliance having hands-free telephone, global positioning system, and satellite communications modules combined in a common architecture for providing complete telematics functions |
US7050834B2 (en) * | 2003-12-30 | 2006-05-23 | Lear Corporation | Vehicular, hands-free telephone system |
US7197278B2 (en) * | 2004-01-30 | 2007-03-27 | Lear Corporation | Method and system for communicating information between a vehicular hands-free telephone system and an external device using a garage door opener as a communications gateway |
US7778604B2 (en) * | 2004-01-30 | 2010-08-17 | Lear Corporation | Garage door opener communications gateway module for enabling communications among vehicles, house devices, and telecommunications networks |
JP4557919B2 (ja) * | 2006-03-29 | 2010-10-06 | 株式会社東芝 | 音声処理装置、音声処理方法および音声処理プログラム |
GB2455853B (en) * | 2007-10-16 | 2012-04-25 | Psygnificant Services Ltd | Communication system and method |
CN103383594B (zh) * | 2012-05-04 | 2018-01-05 | 富泰华工业(深圳)有限公司 | 电子设备及其控制方法 |
US8731912B1 (en) | 2013-01-16 | 2014-05-20 | Google Inc. | Delaying audio notifications |
US9169684B2 (en) | 2013-04-26 | 2015-10-27 | GM Global Technology Operations LLC | Methods, program products, and systems relating to vehicular garage door control systems |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4578540A (en) * | 1982-12-20 | 1986-03-25 | At&T Bell Laboratories | Telecommunications systems |
US4521647A (en) * | 1984-02-17 | 1985-06-04 | Octel Communications, Inc. | Tone detection system and method |
DE3425789A1 (de) * | 1984-07-13 | 1986-01-16 | Standard Elektrik Lorenz Ag, 7000 Stuttgart | Schaltungsanordnung zum anschalten einer einer fernsprechstelle zugeordneten sprachgesteuerten zusatzeinrichtung an eine fernsprechleitung |
DE3629596A1 (de) * | 1986-08-30 | 1988-03-03 | Standard Elektrik Lorenz Ag | Schaltungsanordnung zur entkopplung der uebertragungszweige einer freisprecheinrichtung |
JP2945676B2 (ja) * | 1989-01-31 | 1999-09-06 | 株式会社東芝 | 電話機 |
JPH02209055A (ja) * | 1989-02-09 | 1990-08-20 | Toshiba Corp | 電話装置 |
JP2855805B2 (ja) * | 1990-07-09 | 1999-02-10 | 沖電気工業株式会社 | 音声認識電話機における誤動作防止方式 |
JPH0548702A (ja) * | 1991-08-19 | 1993-02-26 | Clarion Co Ltd | 音声着呼機能付音声ダイヤル装置 |
GB2260878A (en) * | 1991-10-21 | 1993-04-28 | Ericsson Ge Mobile Communicat | Hands-free call answering system |
US5483579A (en) * | 1993-02-25 | 1996-01-09 | Digital Acoustics, Inc. | Voice recognition dialing system |
US5729602A (en) * | 1995-04-11 | 1998-03-17 | Comex Systems, Inc. | Programmable multi-tone voice message starting system |
JPH11331328A (ja) * | 1998-05-15 | 1999-11-30 | Anden | ハンズフリー電話装置 |
-
1997
- 1997-06-09 KR KR1019970023552A patent/KR100229874B1/ko not_active IP Right Cessation
-
1998
- 1998-03-30 CN CNB981061702A patent/CN1149815C/zh not_active Expired - Fee Related
- 1998-03-30 FR FR9803899A patent/FR2764458B1/fr not_active Expired - Fee Related
- 1998-04-08 GB GB9807500A patent/GB2327010B/en not_active Expired - Fee Related
- 1998-04-22 US US09/064,282 patent/US6131044A/en not_active Expired - Lifetime
- 1998-06-09 JP JP10160153A patent/JPH1117779A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101399874B (zh) * | 2007-09-28 | 2011-08-31 | 深圳富泰宏精密工业有限公司 | 手机铃声音量加强装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
FR2764458A1 (fr) | 1998-12-11 |
CN1149815C (zh) | 2004-05-12 |
JPH1117779A (ja) | 1999-01-22 |
GB9807500D0 (en) | 1998-06-10 |
US6131044A (en) | 2000-10-10 |
FR2764458B1 (fr) | 2005-01-28 |
KR100229874B1 (ko) | 1999-11-15 |
GB2327010A (en) | 1999-01-06 |
GB2327010B (en) | 1999-08-18 |
KR19990000564A (ko) | 1999-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5594784A (en) | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls | |
CN1220176C (zh) | 用于一种语音识别设备的训练或适配方法 | |
JP3154725B2 (ja) | 音声情報を伝送するための方法 | |
CN1149815C (zh) | 提高话音识别呼叫装置开始呼叫时话音识别的方法 | |
WO1999011045A1 (en) | Telephone handset noise suppression | |
CN1187271A (zh) | 数字移动通信系统中的回声消除 | |
CN101179635B (zh) | 对免提电话进行回声控制的装置、方法和系统 | |
CN100576865C (zh) | 适用于宽带通信的语音通信系统及其电话机 | |
JP2002009894A (ja) | 保留中の音楽を抑制する方法および装置 | |
JPH08163227A (ja) | 受話音量自動可変回路 | |
US5428604A (en) | Training method for an echo canceller for use in a voice conference system | |
CN1462539A (zh) | 具有通话保持功能的电话机 | |
CN86101885A (zh) | 具有低增益状态的对讲装置控制电路及控制对讲装置增益的方法 | |
CN117544727A (zh) | 一种家用智能音箱内置话机系统及实现方法 | |
CN108540680A (zh) | 讲话状态的切换方法及装置、通话系统 | |
WO1998008324A2 (en) | Microprocessor-controlled full-duplex speakerphone using automatic gain control | |
CN100407739C (zh) | 基于互联网语音网关的免打扰业务的实现方法 | |
JPS58115539A (ja) | 音声処理装置 | |
CN108495803B (zh) | 语音通话装置 | |
JPH1032804A (ja) | テレビ会議装置 | |
CN1085458C (zh) | 一种电话答录机装置及其答录方法 | |
CN1271881C (zh) | 可替换移动通讯装置其待通话铃声的方法 | |
EP1128645B1 (en) | Intelligent incoming call management during cordless intercom mode | |
CN109243434A (zh) | 一种双语音输入装置及系统 | |
JPS63236451A (ja) | 音声ダイアル制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040512 |