CN1202064A - 提高话音识别呼叫装置开始呼叫时话音识别的方法 - Google Patents

提高话音识别呼叫装置开始呼叫时话音识别的方法 Download PDF

Info

Publication number
CN1202064A
CN1202064A CN98106170A CN98106170A CN1202064A CN 1202064 A CN1202064 A CN 1202064A CN 98106170 A CN98106170 A CN 98106170A CN 98106170 A CN98106170 A CN 98106170A CN 1202064 A CN1202064 A CN 1202064A
Authority
CN
China
Prior art keywords
speech
tinkle
bells
intercommunication telephone
calling device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98106170A
Other languages
English (en)
Other versions
CN1149815C (zh
Inventor
柳荣茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1202064A publication Critical patent/CN1202064A/zh
Application granted granted Critical
Publication of CN1149815C publication Critical patent/CN1149815C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

话音识别装置中处理话音的一种方法,旨在提高开始呼叫时话音的识别率。这种方法通过将铃声频率和话音带宽频率分开来或缩短铃声避免了通过对讲电话通话时收到的话音在识别率方面的下降。

Description

提高话音识别呼叫装置 开始呼叫时话音识别的方法
本发明涉及话音识别呼叫装置,具体地讲,涉及一种提高开始呼叫时话音识别率的方法。
通常,象无需手持式随身用具之类的呼叫装置备有识别通过对讲电话收到的话音、处理话音和通过对讲电话输出话音的功能。因此,这种呼叫装置需要有一个装有扬声器和话筒的对讲电话、一个供识别通过话筒收到的话音的话音识别处理器和一个将通过话筒收到的话音输出给扬声器的对讲电话处理器。
图1是这类呼叫装置、即识别话音和能够呼叫的装置的方框图。这类话音识别呼叫装置基本上识别例如象“呼叫”、“通话”、“收到”等之类的话语。多数的话音识别呼叫装置是无需手持式的随身用具的。另外一种话音识别呼叫装置是稍后即将上市的自动回话电话机。
话音识别呼叫装置通常是这样接收来自开关的铃声的:首先,铃声从开关发送时,话音识别呼叫装置只要收到铃声就发出铃声。这里,当用户说话输入象“呼叫”、“通话”或“收到”之类的指令时,话音识别呼叫装置就识别该话音,切换到对讲电话工作状态,并接收铃声。这样,用户就可以通过对讲电话通话。
另一方面,用户要通过对讲电话通话时,如果在呼叫装置在响铃的同时输入话音指令,则铃声和话音指令就混杂在一起,而一般话音识别呼叫装置捕捉不到铃声与话音指令混杂音中话音指令的可能性是极大的,这是因为图1所示一般话音识别呼叫装置中产生的铃声的频率一般是与话音处在同一频率范围的500赫和1千赫组成的双重频率的缘故,也是因为响铃是以两秒停响、一秒响铃的方式循环进行的缘故。
本发明的目的是提供一种能提高话音识别率从而可以通过话音识别呼叫装置中的对讲电话收到铃声的话音处理方法。
本发明的另一个目的是提供一种即使用户偶然往话音识别呼叫装置输入话音指令也能通过对讲电话进行通话的话音处理方法。
为达到上述目的,本发明提供了一种可以通过话音识别呼叫装置中的对讲电话进行通话的话音处理方法。这种方法通过将铃声的频率与话音带宽的频率分开或缩短铃声避免了用对讲电话通话时收到的话音在识别率方面的下降。
参看附图详细说明本发明的一些最佳实施例可以更清楚理解本发明的上述目的和优点。附图中:
图1是应用本发明的话音识别呼叫装置的方框图;
图2A和2B是用以说明本发明一个实施例通过对讲电话进行通话时输入话音处理方法的示意图;
图3A和3B是用以说明本发明另一个实施例通过对讲电话进行通话时输入话音处理方法的示意图。
现在参看附图详细说明本发明的一些最佳实施例。那些认为使本发明的主题变得模糊的周知功能和结构,这里就不再详述了。此外,说明书中使用的术语是在考虑到本发明的作用的基础上采用的,因此应该指出的是,鉴于这些术语可按用户、芯片设计人员或习惯用途加以改变,因而其定义应根据本发明的整个公开内容确定。
图2A和2B是用以说明本发明一个实施例通过对讲电话开始通话时输入话音的处理方法的示意图。
本发明的方法按下列步骤进行。图1的铃声发生器22产生铃声,通过对讲电话的扬声器SPK和话筒MIC传送给话音识别处理器14。在本方法中,为最大限度地减少进入铃声中的话音量,改良了经带通滤波器12滤波的话音的带宽。就是说,经带通滤波器12滤波的话音,其带宽取300赫至1.5千赫。一般带通滤波器12滤除的话音带宽截止频率为3.4千赫。从实际话音的频率分析可知,大部分声能是分布在400~900赫的范围的,如图2A中所示。因此,可以截除话音频率带宽大约1.5千赫或更高的频率分量而不致产生任何不利的后果。
此外,在本方法中,铃声取与话音带宽不同的频率,从而阻止了再发出的铃声通过话筒MIC再进入话音识别处理器14中。就是说,铃声频率采用超过带通滤波器12截止频率带宽范围的1.8千赫和2.2千赫组成的双频使铃声频率与话音带宽频率不同。
这样,铃声即使再从扬声器SPK加到话筒MIC上也只通过对讲电话处理器18和扬声器SPK输出出去而无需加到话音识别处理器14上。就是说,即使通过话筒同时输入通过对讲电知通话的话音和铃声也只有对讲电话的话音加到话音识别处理器14上。因此,控制器24只接收在话音识别处理器中处理的对讲电话的话音,确认该话音,并控制对讲电话处理器18给扬声器电话发送铃声。这样就可以通过对讲电话通话。
图3A和3B是说明本发明另一个实施例通过扬声器开始通话时处理所输入话音的方法的示意图。
在本方法中,即使铃声以一秒钟响铃、两秒钟停响的循环方式(如图3A中所示)从一个开关引入的情况下,控制器24也以0.5秒响铃、5.5秒停响的循环方式(如图3B中所示)发出铃声。通过产生短于开关输出的铃声,即缩短响铃周期,可以消除输入的话音与铃声混杂在一起因而妨碍输入话音的识别的领域,从而可以避免铃声引起的话音识别率的下降。
综上所述,本发明通过将铃声的频率与话音带宽的频率分开或缩短铃声有利地避免了通过对讲电话通话时所输入话音识别率的下降。
虽然上面是就一些具体实施例来说明本发明的,但显然不言而喻,在不脱离本发明的范围和精神实质的前提下,本技术领域的行家们是可以对上述实施例进行种种修改的。因此,所述适当的范围必然符合下面提出的权利要求书的要求的。

Claims (7)

1.通过具对讲电话的话音识别呼叫装置中的对讲电话进行通话时处理话音的一种方法,包括下列步骤:
对根据话音识别呼叫装置中从一个开关收到的铃声产生的铃声取与话音不同的频率带宽;
输入通过对讲电话通话的话音时通过对讲电话接收铃声。
2.如权利要求1所述的话音处理方法,其特征在于,铃声频率取18~22千赫。
3.如权利要求1所述的语音处理方法,其特征在于,铃声是在输入通过对讲电话通话的、频率为300赫至1.5千赫的话音时通过对讲电话接收下来的。
4.通过具对讲电话的话音识别呼叫装置中的对讲电话进行通话时处理话音的一种方法,包括下列步骤:
在话音识别呼叫装置中从一个开关收到铃声时产生0.5秒钟响铃、5.5秒钟停响循环进行的铃声;和
输入通过对讲电话通话的话音时通过对讲电话接收所产生的铃声。
5.通过具对讲电话的话音识别呼叫装置中的对讲电话进行通过话时处理话音的一种方法,包括下列步骤:
对根据话音识别呼叫装置中从一个开关收到的铃声产生的铃声取与话音不同的频率带宽;
产生以0.5秒钟响铃、5.5秒钟停响方式循环进行的铃声;
输入通过对讲电话通话的话音时通过对讲电话接收所产生的铃声。
6.如权利要求5所述的话音处理方法,其特征在于,铃声频率取18~22千赫。
7.如权利要求5所述的话音处理方法,其特征在于,所产生的铃声是在输入通过对讲电话通话、频率为300赫至15.千赫的话音时通过对讲电话接收下来的。
CNB981061702A 1997-06-09 1998-03-30 提高话音识别呼叫装置开始呼叫时话音识别的方法 Expired - Fee Related CN1149815C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR23552/1997 1997-06-09
KR23552/97 1997-06-09
KR1019970023552A KR100229874B1 (ko) 1997-06-09 1997-06-09 음성인식 통화장치의 통화개시시 음성인식율 향상 방법

Publications (2)

Publication Number Publication Date
CN1202064A true CN1202064A (zh) 1998-12-16
CN1149815C CN1149815C (zh) 2004-05-12

Family

ID=19508891

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB981061702A Expired - Fee Related CN1149815C (zh) 1997-06-09 1998-03-30 提高话音识别呼叫装置开始呼叫时话音识别的方法

Country Status (6)

Country Link
US (1) US6131044A (zh)
JP (1) JPH1117779A (zh)
KR (1) KR100229874B1 (zh)
CN (1) CN1149815C (zh)
FR (1) FR2764458B1 (zh)
GB (1) GB2327010B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101399874B (zh) * 2007-09-28 2011-08-31 深圳富泰宏精密工业有限公司 手机铃声音量加强装置及方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2823045A1 (fr) * 2001-03-27 2002-10-04 Koninkl Philips Electronics Nv Telephone comportant un clavier de commande perfectionne
US7801283B2 (en) * 2003-12-22 2010-09-21 Lear Corporation Method of operating vehicular, hands-free telephone system
US20050134504A1 (en) * 2003-12-22 2005-06-23 Lear Corporation Vehicle appliance having hands-free telephone, global positioning system, and satellite communications modules combined in a common architecture for providing complete telematics functions
US7050834B2 (en) * 2003-12-30 2006-05-23 Lear Corporation Vehicular, hands-free telephone system
US7197278B2 (en) * 2004-01-30 2007-03-27 Lear Corporation Method and system for communicating information between a vehicular hands-free telephone system and an external device using a garage door opener as a communications gateway
US7778604B2 (en) * 2004-01-30 2010-08-17 Lear Corporation Garage door opener communications gateway module for enabling communications among vehicles, house devices, and telecommunications networks
JP4557919B2 (ja) * 2006-03-29 2010-10-06 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム
GB2455853B (en) * 2007-10-16 2012-04-25 Psygnificant Services Ltd Communication system and method
CN103383594B (zh) * 2012-05-04 2018-01-05 富泰华工业(深圳)有限公司 电子设备及其控制方法
US8731912B1 (en) 2013-01-16 2014-05-20 Google Inc. Delaying audio notifications
US9169684B2 (en) 2013-04-26 2015-10-27 GM Global Technology Operations LLC Methods, program products, and systems relating to vehicular garage door control systems

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4578540A (en) * 1982-12-20 1986-03-25 At&T Bell Laboratories Telecommunications systems
US4521647A (en) * 1984-02-17 1985-06-04 Octel Communications, Inc. Tone detection system and method
DE3425789A1 (de) * 1984-07-13 1986-01-16 Standard Elektrik Lorenz Ag, 7000 Stuttgart Schaltungsanordnung zum anschalten einer einer fernsprechstelle zugeordneten sprachgesteuerten zusatzeinrichtung an eine fernsprechleitung
DE3629596A1 (de) * 1986-08-30 1988-03-03 Standard Elektrik Lorenz Ag Schaltungsanordnung zur entkopplung der uebertragungszweige einer freisprecheinrichtung
JP2945676B2 (ja) * 1989-01-31 1999-09-06 株式会社東芝 電話機
JPH02209055A (ja) * 1989-02-09 1990-08-20 Toshiba Corp 電話装置
JP2855805B2 (ja) * 1990-07-09 1999-02-10 沖電気工業株式会社 音声認識電話機における誤動作防止方式
JPH0548702A (ja) * 1991-08-19 1993-02-26 Clarion Co Ltd 音声着呼機能付音声ダイヤル装置
GB2260878A (en) * 1991-10-21 1993-04-28 Ericsson Ge Mobile Communicat Hands-free call answering system
US5483579A (en) * 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
US5729602A (en) * 1995-04-11 1998-03-17 Comex Systems, Inc. Programmable multi-tone voice message starting system
JPH11331328A (ja) * 1998-05-15 1999-11-30 Anden ハンズフリー電話装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101399874B (zh) * 2007-09-28 2011-08-31 深圳富泰宏精密工业有限公司 手机铃声音量加强装置及方法

Also Published As

Publication number Publication date
FR2764458A1 (fr) 1998-12-11
CN1149815C (zh) 2004-05-12
JPH1117779A (ja) 1999-01-22
GB9807500D0 (en) 1998-06-10
US6131044A (en) 2000-10-10
FR2764458B1 (fr) 2005-01-28
KR100229874B1 (ko) 1999-11-15
GB2327010A (en) 1999-01-06
GB2327010B (en) 1999-08-18
KR19990000564A (ko) 1999-01-15

Similar Documents

Publication Publication Date Title
US5594784A (en) Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
CN1220176C (zh) 用于一种语音识别设备的训练或适配方法
JP3154725B2 (ja) 音声情報を伝送するための方法
CN1149815C (zh) 提高话音识别呼叫装置开始呼叫时话音识别的方法
WO1999011045A1 (en) Telephone handset noise suppression
CN1187271A (zh) 数字移动通信系统中的回声消除
CN101179635B (zh) 对免提电话进行回声控制的装置、方法和系统
CN100576865C (zh) 适用于宽带通信的语音通信系统及其电话机
JP2002009894A (ja) 保留中の音楽を抑制する方法および装置
JPH08163227A (ja) 受話音量自動可変回路
US5428604A (en) Training method for an echo canceller for use in a voice conference system
CN1462539A (zh) 具有通话保持功能的电话机
CN86101885A (zh) 具有低增益状态的对讲装置控制电路及控制对讲装置增益的方法
CN117544727A (zh) 一种家用智能音箱内置话机系统及实现方法
CN108540680A (zh) 讲话状态的切换方法及装置、通话系统
WO1998008324A2 (en) Microprocessor-controlled full-duplex speakerphone using automatic gain control
CN100407739C (zh) 基于互联网语音网关的免打扰业务的实现方法
JPS58115539A (ja) 音声処理装置
CN108495803B (zh) 语音通话装置
JPH1032804A (ja) テレビ会議装置
CN1085458C (zh) 一种电话答录机装置及其答录方法
CN1271881C (zh) 可替换移动通讯装置其待通话铃声的方法
EP1128645B1 (en) Intelligent incoming call management during cordless intercom mode
CN109243434A (zh) 一种双语音输入装置及系统
JPS63236451A (ja) 音声ダイアル制御装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040512