CN1125434C - 移动终端设备的话音识别方法 - Google Patents

移动终端设备的话音识别方法 Download PDF

Info

Publication number
CN1125434C
CN1125434C CN99103624A CN99103624A CN1125434C CN 1125434 C CN1125434 C CN 1125434C CN 99103624 A CN99103624 A CN 99103624A CN 99103624 A CN99103624 A CN 99103624A CN 1125434 C CN1125434 C CN 1125434C
Authority
CN
China
Prior art keywords
speech recognition
notice
speech
mobile terminal
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN99103624A
Other languages
English (en)
Other versions
CN1235333A (zh
Inventor
中野文男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Innovations Co ltd Hong Kong
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1235333A publication Critical patent/CN1235333A/zh
Application granted granted Critical
Publication of CN1125434C publication Critical patent/CN1125434C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Abstract

蜂窝系电话机用户按压按键、控制器23检测出按键处于按压状态时,控制器23输出“话音识别开始”音响,同时促使计时电路23A开始测定预定时间t1。产生“话音识别开始”音响之后预定时间t1过了时,控制器23启动话音识别操作,并检测用户的话音。这时,控制器23促使计时电路23A开始测定预定的时间t2。预定时间t2过了时,控制器23使音响停下来。这之后,当话音识别部分25检测出话音时,控制器23控制话音识别部分25使其进行话音识别处理,并确定检测出的话音是什么。

Description

移动终端设备的话音识别方法
技术领域
本发明涉及一种移动终端设备,更具体地说,涉及一种具话音识别功能的移动终端设备。
背景技术
通常,象蜂窝系电话机之类具话音识别功能的移动终端设备履行各种控制功能和操作:例如,识别说出口的话音,将其从一种语言翻译成另一种语言,或输出拨号信号。
这类蜂窝电话机只有当用户按电话机上的一个按键时才能在预定时间内识别话音。在此情况下,在开始识别话音之前,需要通知用户“开始识别话音”。更具体地说,这项操作进行的过程如下:当用户按压话音识别启动键时,电话机发出启动音,历时预定的时间,通知用户电话要开始进行话音识别。预定的时间过去之后,电话机停止发出启动音,并开始进行话音识别操作。接着,检测出用户的话音时,电话机按既定的方法对其进行识别。
但用户熟悉这种话音识别启动操作之后有时会在话音识别启动音停下来之前就开始说话。这样会妨碍电话机正确识别说出的话音的开头这个话音识别最重要的部分,有时甚至不能正确识别出整个话音。
另一方面,在非移动的设备上,话筒附近配备有一个接近程度传感器,检测着说话者的脸与话筒之间的距离。这一种传感器日本公开专利申请平治2-131300中公开过。检测出说话者的脸距话筒够近时,设备就开始进行话音识别,然后显示出字幕,表明可以接收话音。
发明内容
本发明的目的是提供在一般移动终端设备的基础上经过改进的移动终端设备。
本发明的另一个目的是提供一种能正确检测话音这个话音识别的重要部分、从而避免错误识别话音的移动终端设备。
为达到上述目的,本发明的移动终端设备包括一个通知部分、一个话音识别部分和一个启动控制部分,通知部分通知用户“开始进行话音识别”,历时预定的时间,话音识别部分识别话音,启动控制部分在通知过程停下来之前开始按话音识别部分识别话音。本发明的移动终端设备还包括一个存储部分、一个提取部分和一个自动呼叫部分,存储部分存储对方姓名与电话号码之间的对应关系,提取部分在话音识别部分识别对方姓名时提取存储在存储部分中对应于对方姓名的电话号码,自动呼叫部分自动各叫提取部分所提取的电话号码。启动控制部分最好在开始通知和结束通知的过程中开始根据话音识别部分进行话音识别。本发明的移动终端设备最好还包括第一测定部分,供在开始通知之后测定第一预定的时间,且在第一预定时间过去之后控制部分开始根据话音识别部分识别话音。本发明的移动终端设备最好还包括第二测定部分和一个停止控制部分,第二测定部分供在开始识别话音之后测定第二预定时间,停止控制部分供在第二预定时间过去之后使通知操作停下来。通知操作最好由用户操作启动。而且这个操作是按键操作,且通知部分通过音响通知话音识别的开始。通知部分可以通过音响、振动器和LED(发光二极管)三者的起码其中之一通知话音识别的开始。
本发明在移动终端设备上使用的话音识别方法包括下列步骤:通知在预定时间内“终端设备将开始进行话音识别”;在通知步骤停止之前开始进行话音识别。本发明在移动终端设备上使用的话音识别方法还包括下列步骤:存储对方姓名与电话号码之间的对应关系;通过话音识别对方的姓名;提取对方姓名相应的电话号码,对方姓名和在存储步骤存入的电话号码;和对提取步骤提取的电话号码进行自动呼叫。话音识别启动步骤最好在通知开始和结束的过程中启动所述话音识别操作。移动终端设备上使用的话音识别方法最好还包括这样的步骤:在开始通知之后测定第一预定时间,在第一预定时间过了之后由话音识别步骤开始进行话音识别。本发明在移动终端设备上使用的话音识别方法还包括下列步骤:在开始进行话音识别之后测定第二预定时间;在第二预定时间过了之后停止进行通知。通知最好通过用户的操作启动,用户的该操作最好是按键操作,且通知步骤最好通过音响通知话音识别的开始。通知步骤可以通过音响、振动器和LED三者的起码其中之一方式通知话音识别的开始。
这样,本发明的终端设备或方法在“话音识别开始”音响仍在响的时候开始话音识别操作(话音检测)。这样做可以使话音识别功能即使在“话音识别开始”音响停止之前就开始进行也能正确检测用户的话音。
附图说明
结合附图阅读下面的详细说明可以更全面地清楚理解本发明的上述和其它目的、特点和优点。
图1a-1d是电话机在用户的指示下开始进行话音识别的话音识别操作时序图。
图2是电话机在用户的指示下开始进行话音识别的话音识别操作流程图。
图3是本发明蜂窝电话机一个实施例值得推荐的电路结构示意图。
图4是图3中所示的蜂窝电话机实施例值得推荐的操作流程图。
图5a-5d是图3中所示的蜂窝电话机实施例话音识别操作值得推荐的时序图。
图6是图3中所示实施例的RAM(随机存取存储器)内部结构值得推荐的示意图。
具体实施方式
为更全面地理解本发明,现在参看图1a-1d和图2在下面说明移动终端设备在用户的指示下开始进行话音识别的话音识别功能。
用户如图1a中所示的那样按压话音识别启动按键时(图2中的步骤51),终端设备发出开始识别话音音,通知用户“开始进行话音识别”,如图1c中所示(图2中的步骤52和53)。T秒之后,终端设备停止发出“话音识别开始”音响,且如图1d中所示,开始进行话音识别操作(图2中的步骤54)。检测出用户的话音时(图2中的步骤55),终端设备按图1b所示预定的方法识别检测出的话音(图2中的步骤56)。
但用户随着对移动终端设备的话音识别启动操作变得熟悉之后有时就会在启动音响停下来之前就开始说话。在此情况下,用户在话音识别开始之前说出的话就检测不出来。这就妨碍了电话机正确识别出话音的开头这个话音识别最重要的部分,有时甚至不能正确识别出整个说话的内容。
为避免识别出错,本发明的终端设备在“话音识别开始”音响仍在发出时就开始进行话音识别操作(话音检测)。这样就可以使话音识别功能即使在“话音识别开始”音响停下来之前就进行也能正确检测出用户的话音。
参看图3至图6,下面更详细地说明本发明。图3是本发明移动终端设备(例如蜂窝电话机)一个最佳实施例的电路原理图。
图3中所示的无线电部分22对经天线21收到的无线电波变频并解调。无线电部分22还调制并对收自控制器23的传输信号变频。显示部分24显示蜂窝电话机的功能或通信状况。话音识别部分25检测并识别用户发出的从话筒27进来的话音。按键输入部分26是在用户操动蜂窝电话机上的按键时使用的。扬声器28在通信过程中输出对方通过控制器23产生的话音或音响。控制器23控制无线电部分22使其处理发送/接收的数据,控制话音识别部分25进行话音识别操作,控制显示部分24显示话音识别部分25产生的话音识别结果,并控制按键输入部分26根据受操动的按键进行处理。控制器23中装有计时电路23A。电路23A控制着“话音识别开始”音响产生的时间或从话音识别操作开始到音响停下来的持续时间。RAM29存储着对方的姓名及其相应的使用电话薄功能时显示在显示部分24上的电话号码。
当用户经按键输入部分26进行操作(例如按压发送按钮)并对着话筒27说话时,话音识别部分25识别说出来的话音(例如,对方的姓名)。话音识别部分25将结果发送给控制器23分析。根据分析的结果,控制器23进行相应的操作,例如核对存储在RAM29中的数据并自动拨出对方姓名相应的电话号码。
图4是实施例中使用的蜂窝电话机中话音识别部分的操作流程图。图5a至5d是实施例中使用的蜂窝电话中话音识别部分的话音识别操作的时序图。
如图5a中所示,当蜂窝电话机的用户按压按键,且控制器23检测出按键处于按压状态时(图4中的步骤31),控制器23就如图5c所示的那样输出“话音识别开始”音响,通知用户将开始进行话音识别(图4中的步骤32)。图4步骤31的按键操作触发话音的输入。这项操作可以采用任何按钮(发送按钮,拨号按钮或特定的触发按钮),只要此操作不影响正常的按键操作即可。接着,控制器23促使计时电路23A开始测定预定时间t1,例如,200毫秒(图4中的步骤33)。在“话音识别开始”音响产生之后预定的时间t1过了时(图4中的步骤34),控制器23如图5d中所示那样启动话音识别操作,并如图5b中所示的那样检测用户的话音。这时,控制器23还促使计时电路23A开始测定预定的时间t2,例如100毫秒(图4中的步骤35)。预定的时间t2过了时(图4中的步骤36),控制器23使音响停下来(图4中的步骤37)。这之后,当话音识别部分25检测出话音时(图4中的步骤38),控制器23控制话音识别部分25使其进行话音识别处理并确定检测出的话音(图4中的步骤39)。控制器23处理话音识别结果并按既定的程序控制蜂窝电话机,例如在显示部分24上显示话音识别结果或从扬声器28发出音响。
图6是图3中所示最佳实施例使用的RAM 29的内部结构图。如图6中所示,RAM29存储对方姓名及其相应的电话号码。举例说,控制器23检测出的图4中步骤39的话音识别结果为“玛利”时,就提取“玛利”相应的电话号码“010-123-4567”。这之后,就对电话号码“101-123-4567”进行自动呼叫。
预定的时间t1在“话音识别开始”音响产生之后过了时,实施例中使用的蜂窝电话机就开始进行话音识别操作(话音检测)。而从开始话音识别操作计起的预定时间t2过了之后,“话音识别开始”音响就停下来。就是说,蜂窝系电话机在“话音识别开始”音响停下来之前开始进行话音识别操作(话音检测)。因此,即使用户甚至在“话音识别开始”音响停下来之前就开始说话,蜂窝电话机也能在预定的时间t2期间进行话音识别操作(话音检测)。
上面已就本发明的最佳实施例进行说明。但本发明的移动终端设备并不局限于上述实施例。举例说,上述实施例中使用蜂窝电话机输出“话音识别开始”音响,通知用户“话音识别操作开始”。不用这个“话音识别开始”音响,也可以用其它任何通知用户“蜂窝电话机开始进行话音识别操作”的信号。举例说,可以采用发光二极管的光、振动器的振动、显示部分上的字符或图像或合成音响等。此外,“话音识别开始”音响不仅可以在用户按压按键时输出,也可以在特定字幕显示之后输出。
在上述实施例中,蜂窝系电话机用作本发明流动终端设备的实例。这个流动终端设备可以是任何具话音识别功能的设备。举例说,象传呼机、有线通信设备、或个人计算机之类的流动数据终端设备,只要具备话音识别功能,都可以采用。
综上所述,本发明的话音识别部分在“话音识别开始”音响停下来之前开始进行话音识别操作(话音检测)。因此,即使用户在“话音识别开始”音响停下来之前就开始说话,话音识别部分也能检测话音的开头这个话音识别最重要的部分,从而避免错误识别话音。
显然,根据上述教导还可以举出本发明的许多其它修改方案和更改方案。因此,不言而喻,在不脱离所附权利要求书所述的范围的前提下,本发明是可按这里详述的以外的方案实施的。

Claims (10)

1.一种移动终端设备,其特征在于,它包括:
通知装置,供在预定的时间内通知用户“话音识别开始”;
话音识别装置,供识别话音用;
启动控制装置;
存储装置,供存储对方姓名与电话号码之间的对应关系;
提取装置,用于根据所存储的对应关系来提取相应的电话号码;
自动呼叫装置;
其中,所述启动控制装置在所述通知开始和结束时根据所述话音识别装置启动话音识别;
所述启动控制装置根据所述话音识别装置在通知停下来之前启动话音识别;
所述提取装置在所述话音识别装置识别出所述对方姓名时提取对应于所述存储在所述存储装置中的对方姓名的电话号码;
所述自动呼叫装置自动呼叫所述提取装置提取的电话号码;
该设备还包括:
第一测定装置,供在所述通知开始之后测定第一预定时间,其中所述启动控制装置在所述第一预定时间过了之后根据所述话音识别装置启动话音识别;
第二测定装置,用于测定第二预定时间;以及停止控制装置,用于停止所述通知;
其中,所述第二测定装置在所述语音识别开始后进行测定;
所述停止控制装置供在所述第二预定时间过了之后停止所述通知。
2.如权利要求1所述的移动终端设备,其特征在于,所述通知通过用户的操作启动。
3.如权利要求2所述的移动终端设备,其特征在于,所述操作为按键操作。
4.如权利要求1所述的移动终端设备,其特征在于,所述通知设备通过音响通知“话音识别开始”。
5.如权利要求1所述的移动终端设备,其特征在于,所述通知装置通过音响、振动器和发光二极管三者的起码其中之一通知“话音识别开始”。
6.移动终端设备上使用的一种话音识别方法,其特征在于,它包括下列步骤:
以预定时间通知“所述终端设备将开始进行话音识别”;
在所述通知开始和结束过程中的一个时间点启动所述话音识别;
存储对方姓名与电话号码之间的对应关系;
通过所述话音识别识别所述对方的姓名;
提取所述对方姓名相应的电话号码,对方姓名和在所述存储步骤存储起来电话号码;和
自动呼叫所述提取步骤提取的电话号码;
其中,该方法还包括下列步骤:
在所述通知开始之后测定第一预定的时间,在所述第一预定的时间过了之后,所述话音识别启动步骤启动识别话音;
在所述话音识别开始之后测定第二预定时间;和
在所述第二预定时间过了之后停止所述通知。
7.如权利要求6所述的移动终端设备上使用的一种话音识别方法,其特征在于,所述通知通过用户的操作启动。
8.如权利要求7所述的移动终端设备上使用的一种话音识别方法,其特征在于,所述操作为按键操作。
9.如权利要求6所述的移动终端设备上使用的一种话音识别方法,其特征在于,所述通知步骤通过音响通知“话音识别开始”。
10.如权利要求6所述的移动终端设备上使用的一种话音识别方法,其特征在于,所述通知步骤通过音响、振动器和发光二极管三者的起码其中之一通知“话音识别开始”。
CN99103624A 1998-02-27 1999-02-27 移动终端设备的话音识别方法 Expired - Lifetime CN1125434C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP48055/1998 1998-02-27
JP10048055A JPH11249692A (ja) 1998-02-27 1998-02-27 音声認識装置
JP48055/98 1998-02-27

Publications (2)

Publication Number Publication Date
CN1235333A CN1235333A (zh) 1999-11-17
CN1125434C true CN1125434C (zh) 2003-10-22

Family

ID=12792665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99103624A Expired - Lifetime CN1125434C (zh) 1998-02-27 1999-02-27 移动终端设备的话音识别方法

Country Status (4)

Country Link
EP (1) EP0939534A1 (zh)
JP (1) JPH11249692A (zh)
CN (1) CN1125434C (zh)
AU (1) AU747198B2 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6675027B1 (en) * 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
JP4694017B2 (ja) * 2001-03-27 2011-06-01 クラリオン株式会社 車載用音声認識装置
CN1271595C (zh) * 2001-12-17 2006-08-23 旭化成株式会社 语音识别方法
DE10163214A1 (de) * 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren und Steuersystem zur Sprachsteuerung eines Gerätes
US7383181B2 (en) 2003-07-29 2008-06-03 Microsoft Corporation Multi-sensory speech detection system
US7447630B2 (en) 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7499686B2 (en) 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US7574008B2 (en) 2004-09-17 2009-08-11 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7283850B2 (en) 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US7346504B2 (en) 2005-06-20 2008-03-18 Microsoft Corporation Multi-sensory speech enhancement using a clean speech prior
US7680656B2 (en) 2005-06-28 2010-03-16 Microsoft Corporation Multi-sensory speech enhancement using a speech-state model
US7406303B2 (en) 2005-07-05 2008-07-29 Microsoft Corporation Multi-sensory speech enhancement using synthesized sensor signal
US7930178B2 (en) 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
JP2007232865A (ja) * 2006-02-28 2007-09-13 Toshiba Tec Corp 音声認識装置及び音声認識プログラム
DE102008051757A1 (de) * 2007-11-12 2009-05-14 Volkswagen Ag Multimodale Benutzerschnittstelle eines Fahrerassistenzsystems zur Eingabe und Präsentation von Informationen
JP2021039260A (ja) * 2019-09-04 2021-03-11 株式会社東海理化電機製作所 提示装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63299555A (ja) * 1987-05-29 1988-12-07 Toshiba Corp 無線電話装置
JP2807241B2 (ja) * 1988-11-11 1998-10-08 株式会社東芝 音声認識装置
JP2927891B2 (ja) * 1989-06-19 1999-07-28 日本電気株式会社 音声ダイヤル装置
US5148471A (en) * 1989-11-20 1992-09-15 Motorola, Inc. Communications device with voice recognition and movable element control interface

Also Published As

Publication number Publication date
AU747198B2 (en) 2002-05-09
EP0939534A1 (en) 1999-09-01
JPH11249692A (ja) 1999-09-17
CN1235333A (zh) 1999-11-17
AU1845899A (en) 1999-09-09

Similar Documents

Publication Publication Date Title
CN1125434C (zh) 移动终端设备的话音识别方法
CN1882146B (zh) 用于发送和接收语音呼叫内容的设备和方法
CN1291621C (zh) 移动通信终端和用于将其低压状态告知用户的方法
CN1211951C (zh) 具有话音识别功能和话音识别系统的数据终端
CN1764266A (zh) 用于在移动通信终端中自动改变通信模式的设备和方法
CN1379947A (zh) 运用本地语音识别传输dtmf信号的方法及装置
EP0757342A2 (en) User selectable multiple threshold criteria for voice recognition
CN1685744A (zh) 用于操作丢失的移动通信设备的方法和装置
WO2002030097A1 (fr) Dispositif telephonique et dispositif telephonique de traduction
US6690954B2 (en) Portable telephone
CN1402516A (zh) 移动终端设备及记录和处理电话呼叫的方法
CN1713660A (zh) 用于在移动终端启动语音识别模式的方法
CN104702789A (zh) 具有语音控制功能的智能手机及其语音控制方法
CN1131364A (zh) 通信终端装置及始发呼叫方法
CN106791210A (zh) 一种手机来电接听装置及来电接听方法
US20040121812A1 (en) Method of performing speech recognition in a mobile title line communication device
CN1175397C (zh) 具有语音识别功能的数字蜂窝式电话及其控制方法
CN1578355A (zh) 具有记录功能的移动终端
CN1631045A (zh) 用于基于生成应答呼叫消息的音频信号的方法和装置
KR100273642B1 (ko) 안내 음성 디스플레이 기능을 갖는 전화 단말 장치 및 그 제어방법
CN1571564A (zh) 移动电话处理来电通知的方法
CN102752442A (zh) 手持通信装置及其通信方法
KR100217734B1 (ko) 음성인식 전화기에서 잡음에 따른 음성 인식 레벨 조절장치 및 방법
KR100312229B1 (ko) 전화기의 이어 마이크 구동 장치 및 방법
KR101002905B1 (ko) 음성 인식을 이용한 유·무선 단말기 제어 방법 및 그유·무선 단말기

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LENOVO INNOVATION CO., LTD. (HONGKONG)

Free format text: FORMER OWNER: NEC CORP.

Effective date: 20141212

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: HONG KONG, CHINA

TR01 Transfer of patent right

Effective date of registration: 20141212

Address after: Hongkong, China

Patentee after: LENOVO INNOVATIONS Co.,Ltd.(HONG KONG)

Address before: Tokyo, Japan

Patentee before: NEC Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20031022