JPH11249692A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH11249692A
JPH11249692A JP10048055A JP4805598A JPH11249692A JP H11249692 A JPH11249692 A JP H11249692A JP 10048055 A JP10048055 A JP 10048055A JP 4805598 A JP4805598 A JP 4805598A JP H11249692 A JPH11249692 A JP H11249692A
Authority
JP
Japan
Prior art keywords
voice recognition
voice
predetermined time
recognition
notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10048055A
Other languages
English (en)
Inventor
Fumio Nakano
文男 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Saitama Ltd
Original Assignee
NEC Saitama Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Saitama Ltd filed Critical NEC Saitama Ltd
Priority to JP10048055A priority Critical patent/JPH11249692A/ja
Priority to EP99103550A priority patent/EP0939534A1/en
Priority to AU18458/99A priority patent/AU747198B2/en
Priority to CN99103624A priority patent/CN1125434C/zh
Publication of JPH11249692A publication Critical patent/JPH11249692A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】音声認識の重要な要素である音声検出を確実に
行うことによって、誤った音声認識を防止する音声認識
装置を提供する。 【解決手段】携帯電話の使用者がキー入力11を行い、
制御部23がキー押下を検出すると、制御部23は音声
認識の開始トーン13を出力し、音声認識を開始する旨
を使用者に知らせる。また、制御部23は、タイマ回路
23Aにおいて予め定められた時間t1のカウントをス
タートする。音声認識の開始トーン13が出力された後
予め定められた時間t1が経過すると、制御部23は、
音声認識動作14を開始し、音声の検出を行う。また、
制御部23は、タイマ回路23Aにおいて予め定められ
た時間t2のカウントをスタートする。予め定められた
時間t2が経過すると、制御部23は、トーンの出力を
停止する。その後、音声認識部25で音声が検出される
と、制御部23は音声認識部25を制御して、検出され
た音声が何であったかを判定する音声認識処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置に関
する。
【0002】
【従来の技術】人が話す音声を認識し、認識した音声に
応じて、他国の言語への変換、ダイヤル発信等各種の制
御または動作を行う音声認識機能がある。この種の音声
認識機能を用いた電話装置では、常時音声認識を行って
いるのではなく、キー操作が行われることによって、音
声認識機能を働かせている。また、電話装置の使用者に
音声認識機能をスタートさせることを報知している。こ
のような電話装置における音声認識機能の開始につい
て、図4および5を参照して説明する。
【0003】まず、図4(a)に示すように、音声認識
を開始するキー操作があると(図5、ステップ51)、
図4(c)に示すように、音声認識の開始を使用者に報
知する音声認識の開始トーンがT秒間報知される(図
5、ステップ52、53)。T秒間の報知が終了する
と、音声認識の開始トーンが停止し、図4(d)に示す
ように、音声認識動作が開始される(図5、ステップ5
4)。図4(b)に示すように、使用者が発した音声が
検出されると(図5、ステップ55)、所定の方法に基
づいて検出された音声の認識処理が行われる(図5、ス
テップ56)。
【0004】
【発明が解決しようとする課題】しかしながら、この種
の電話装置では、使用者が操作に慣れて習熟すると、音
声認識の開始トーン43の停止前に使用者が発声してし
まう場合がある。この場合には、音声認識の重要な要素
である音声検出(話頭検出)を確実に行うことができな
いため、使用者の発した音声を誤って認識してしまうと
いう問題がある。
【0005】本発明の目的は、上記問題点に鑑み、音声
認識の重要な要素である音声検出を確実に行うことによ
って、誤った音声認識を防止する音声認識装置を提供す
ることにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明の音声認識装置は、音声認識を開始する旨を
予め定められた時間報知する報知手段と、音声を認識す
る音声認識手段と、を有し、前記報知が終了する前に前
記音声認識手段による音声認識を開始する。また、音声
認識を開始する旨を報知する報知手段と、音声を認識す
る音声認識手段と、を有し、前記報知手段によって音声
認識を開始する旨を報知している間に前記音声認識手段
による音声認識を開始する。前記報知手段は、鳴音、バ
イブレータ、LEDのうち少なくとも一つであることが
好ましい。また、前記報知は、使用者のキー入力によっ
て開始されることが好ましい。さらに、前記報知の開始
後、第1の所定時間をカウントする第1のカウント手段
と、前記第1の所定時間が経過した後に前記音声認識手
段による音声の認識を開始させる手段と、前記音声認識
の開始後、第2の所定時間をカウントする第2のカウン
ト手段と、前記第2の所定時間が経過した後に前記報知
を停止する手段と、を有することが好ましい。
【0007】また、本発明の音声認識装置は、使用者に
よるキー入力を検出する検出手段と、音声を入力するマ
イクロフォンと、音声を出力するスピーカと、前記検出
手段によってキー入力が検出された後、音声認識を開始
する旨を前記スピーカから報知する報知手段と、前記報
知手段の開始後、第1の所定時間をカウントする第1の
カウント手段と、前記第1の所定時間が経過した後に前
記マイクロフォンから入力される音声の認識を開始する
音声認識手段と、前記音声認識の開始後、第2の所定時
間をカウントする第2のカウント手段と、前記第2の所
定時間が経過した後に前記報知を停止する手段と、を有
する。
【0008】また、本発明の音声認識装置は、音声認識
を開始する旨の報知を開始するステップと、前記報知の
終了前に、音声の認識を開始するステップと、音声認識
開始後に、前記報知を停止するステップと、を有する。
前記報知の開始ステップは、使用者のキー入力によって
開始することが好ましい。
【0009】さらに、本発明の音声認識装置は、使用者
によるキー入力を検出するステップと、キー入力の検出
に応じて音声認識を開始する旨の報知を開始するステッ
プと、前記報知の開始後、第1の所定時間をカウントす
るステップと、第1の所定時間が経過したか否かを判断
するステップと、前記第1の所定時間が経過した時に音
声の認識を開始するステップと、音声認識の開始後、第
2の所定時間をカウントするステップと、第2の所定時
間が経過したか否かを判断するステップと、前記第2の
所定時間が経過した時に音声認識を開始する旨の報知を
停止するステップと、前記第1の所定時間が経過した後
に入力された音声を認識して処理するステップと、を有
する。
【0010】このように、本発明では、音声認識の開始
トーンが終了する前に音声認識動作を行うため、使用者
が操作に慣れて、音声認識の開始トーン43の停止前に
使用者が発声したとしても、使用者の発した音声を確実
に認識することができる。
【0011】
【発明の実施の形態】以下、本発明の音声認識装置の一
実施の形態について、図面を参照して説明する。
【0012】図1は、本実施の形態に係る音声認識装
置、好ましくは携帯電話機における音声認識装置の内部
回路構成を示すブロック図である。
【0013】図1において、無線部22は、アンテナ2
1で受信した電波を周波数変換および復調し、また、制
御部23からの送信信号を変調して無線周波数に周波数
変換する。表示部24は、各種機能や携帯電話の通信状
態等を表示する。音声認識部25は、マイク27から入
力される使用者が発した音声を検出し、音声認識を行
う。キー入力部26は、使用者が携帯電話を操作する際
に使用する。スピーカ28は、通話時に相手の音声を出
力したり、制御部23で生成したトーンを出力する。制
御部23は、無線部22を制御して送受信データを処理
したり、音声認識部25で音声認識動作を行う制御や、
音声認識部25で得られた音声認識の結果を表示部24
に表示する制御や、キー入力部26から入力されたキー
操作に基づく各種処理を制御する。制御部23にはタイ
マ回路23Aが含まれており、音声認識を開始する際に
使用者に音声認識動作の開始を知らせるトーンの鳴動時
間の制御や、音声認識を開始してからトーンを停止する
までの時間の制御に使用される。
【0014】使用者がキー入力部26、例えば発信ボタ
ンを操作した後、マイク27から音声を入力すると、入
力された音声、例えば呼び出したい人の名前が、音声認
識部25で音声認識され、音声認識された結果が、制御
部23で分析される。制御部23では、分析した結果に
基づいて、各種処理、例えば人の名前に対応するダイヤ
ル番号で自動的に発呼を行う。
【0015】図2および3を用いて、本実施の形態に係
る携帯電話機における音声認識装置の動作を説明する。
図2は、本実施の形態に係る携帯電話機における音声認
識装置の動作を示すフローチャートであり、図3は、本
実施の形態に係る携帯電話機における音声認識装置の音
声認識動作を行うタイミングを示すタイムチャートであ
る。
【0016】図2および3において、携帯電話機の使用
者がキー入力11を行い、制御部23がキー押下を検出
すると(S31)、制御部23は音声認識の開始トーン
13を出力し(S32)、音声認識を開始する旨を使用
者に知らせる。S31におけるキー入力は、音声入力の
開始のトリガとなるもので、通常のボタン操作を妨げな
い範囲で発信ボタン、ダイヤルボタン、専用のトリガボ
タン等何でもよい。また、制御部23は、タイマ回路2
3Aにおいて予め定められた時間t1、例えば200m
sのカウントをスタートする(S33)。音声認識の開
始トーン13が出力された後予め定められた時間t1が
経過すると(S34)、制御部23は、音声認識動作1
4を開始し、音声の検出を行う。また、制御部23は、
タイマ回路23Aにおいて予め定められた時間t2、例
えば100msのカウントをスタートする(S35)。
予め定められた時間t2が経過すると(S36)、制御
部23は、トーンの出力を停止する(S37)。その
後、音声認識部25で音声が検出されると(S38)、
制御部23は音声認識部25を制御して、検出された音
声が何であったかを判定する音声認識処理を行う(S3
9)。音声認識処理の結果は、制御部23で処理され、
制御部23は予め定められている手順に従って携帯電話
機を制御する。例えば、音声認識処理の結果を表示部2
4に表示したり、スピーカ28から音やトーンを出力す
る。
【0017】このように、本実施の形態に係る携帯電話
機によれば、音声認識の開始トーン13の出力後予め定
められた時間t1が経過すると、音声認識動作(音声検
出)14が開始される。その後、さらに予め定められた
時間t2が経過すると、音声認識の開始トーン13が停
止される。すなわち、音声認識の開始トーン13が終了
する前に音声認識動作(音声検出)14が開始される。
したがって、音声認識の開始トーン13が停止する前に
使用者が音声入力12したとしても、予め定められた時
間t2の間は音声認識動作(音声検出)14が可能にな
る。
【0018】以上、本発明について好適な実施の形態を
参照して説明したが、本発明の音声認識装置は、上記実
施の形態に限定されるものではない。例えば、本実施の
形態の携帯電話機では、使用者に音声認識を開始する旨
を伝えるために、音声認識の開始トーン13を出力して
いるが、音声認識の開始トーン13は、発光ダイオード
などの光、バイブレータ、表示装置の文字や絵の表示、
合成音声など、使用者にその終了後に音声認識を開始す
ることを知らせるものであれば何でもよい。
【0019】また、音声認識の開始トーンの出力は、使
用者によるキー入力で開始するだけでなく、表示部に特
定の表示を行った後などにしてもよい。
【0020】さらに、本発明の音声認識装置は、携帯電
話機を一例として説明したが、ページャー等一般の携帯
無線装置や、電話帳機能を有する携帯情報端末、有線通
信装置、パーソナルコンピュータ等音声認識機能を有す
るものであれば何ら問題はない。
【0021】
【発明の効果】以上、説明したように本発明の音声認識
装置によれば、音声認識の開始トーン13が終了する前
に音声認識動作(音声検出)14が開始されるため、使
用者が音声認識の開始トーン13の終了タイミングより
も早く発声した場合でも、音声認識の重要な要素である
音声検出を確実に行い、誤って音声が認識されることを
防止することができる。
【図面の簡単な説明】
【図1】本発明による携帯電話機における音声認識装置
の内部回路構成を示すブロック図である。
【図2】図1に示した携帯電話機における音声認識装置
の動作を示すフローチャートである。
【図3】図1に示した携帯電話機における音声認識装置
の音声認識動作を行うタイミングを示すタイムチャート
である。
【図4】従来の電話機の音声認識動作を行うタイミング
を示すタイムチャートである。
【図5】従来の電話機の動作を示すフローチャートであ
る。
【符号の説明】
21 アンテナ 22 無線部 23 制御部 23A タイマ回路 24 表示部 25 音声認識部 26 キー入力部 27 マイク 28 スピーカ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音声認識を開始する旨を予め定められた
    時間報知する報知手段と、音声を認識する音声認識手段
    と、を有し、前記報知が終了する前に前記音声認識手段
    による音声認識を開始することを特徴とする音声認識装
    置。
  2. 【請求項2】 音声認識を開始する旨を報知する報知手
    段と、音声を認識する音声認識手段と、を有し、前記報
    知手段によって音声認識を開始する旨を報知している間
    に前記音声認識手段による音声認識を開始することを特
    徴とする音声認識装置。
  3. 【請求項3】 前記報知手段は、鳴音、バイブレータ、
    LEDのうち少なくとも一つであることを特徴とする請
    求項1または2記載の音声認識装置。
  4. 【請求項4】 前記報知は、使用者のキー入力によって
    開始されることを特徴とする請求項3記載の音声認識装
    置。
  5. 【請求項5】 前記報知の開始後、第1の所定時間をカ
    ウントする第1のカウント手段と、前記第1の所定時間
    が経過した後に前記音声認識手段による音声の認識を開
    始させる手段と、前記音声認識の開始後、第2の所定時
    間をカウントする第2のカウント手段と、前記第2の所
    定時間が経過した後に前記報知を停止する手段と、を有
    することを特徴とする請求項2記載の音声認識装置。
  6. 【請求項6】 使用者によるキー入力を検出する検出手
    段と、音声を入力するマイクロフォンと、音声を出力す
    るスピーカと、前記検出手段によってキー入力が検出さ
    れた後、音声認識を開始する旨を前記スピーカから報知
    する報知手段と、前記報知手段の開始後、第1の所定時
    間をカウントする第1のカウント手段と、前記第1の所
    定時間が経過した後に前記マイクロフォンから入力され
    る音声の認識を開始する音声認識手段と、前記音声認識
    の開始後、第2の所定時間をカウントする第2のカウン
    ト手段と、前記第2の所定時間が経過した後に前記報知
    を停止する手段と、を有することを特徴とする音声認識
    装置。
  7. 【請求項7】 音声認識を開始する旨の報知を開始する
    ステップと、前記報知の終了前に、音声の認識を開始す
    るステップと、音声認識開始後に、前記報知を停止する
    ステップと、を有することを特徴とする音声認識装置の
    音声認識方法。
  8. 【請求項8】 前記報知の開始ステップは、使用者のキ
    ー入力によって開始することを特徴とする請求項7記載
    の音声認識装置の音声認識方法。
  9. 【請求項9】 使用者によるキー入力を検出するステッ
    プと、キー入力の検出に応じて音声認識を開始する旨の
    報知を開始するステップと、前記報知の開始後、第1の
    所定時間をカウントするステップと、第1の所定時間が
    経過したか否かを判断するステップと、前記第1の所定
    時間が経過した時に音声の認識を開始するステップと、
    音声認識の開始後、第2の所定時間をカウントするステ
    ップと、第2の所定時間が経過したか否かを判断するス
    テップと、前記第2の所定時間が経過した時に音声認識
    を開始する旨の報知を停止するステップと、前記第1の
    所定時間が経過した後に入力された音声を認識して処理
    するステップと、を有することを特徴とする音声認識装
    置の音声認識方法。
JP10048055A 1998-02-27 1998-02-27 音声認識装置 Pending JPH11249692A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP10048055A JPH11249692A (ja) 1998-02-27 1998-02-27 音声認識装置
EP99103550A EP0939534A1 (en) 1998-02-27 1999-02-24 Method for recognizing speech on a mobile terminal
AU18458/99A AU747198B2 (en) 1998-02-27 1999-02-26 Method for recognizing speech on a mobile terminal
CN99103624A CN1125434C (zh) 1998-02-27 1999-02-27 移动终端设备的话音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10048055A JPH11249692A (ja) 1998-02-27 1998-02-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH11249692A true JPH11249692A (ja) 1999-09-17

Family

ID=12792665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10048055A Pending JPH11249692A (ja) 1998-02-27 1998-02-27 音声認識装置

Country Status (4)

Country Link
EP (1) EP0939534A1 (ja)
JP (1) JPH11249692A (ja)
CN (1) CN1125434C (ja)
AU (1) AU747198B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002287795A (ja) * 2001-03-27 2002-10-04 Clarion Co Ltd 車載用音声認識装置
JP2007232865A (ja) * 2006-02-28 2007-09-13 Toshiba Tec Corp 音声認識装置及び音声認識プログラム
JP2009104156A (ja) * 2001-12-17 2009-05-14 Asahi Kasei Homes Kk 電話通信端末
WO2021044676A1 (ja) * 2019-09-04 2021-03-11 株式会社東海理化電機製作所 提示装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6675027B1 (en) 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
DE10163214A1 (de) * 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren und Steuersystem zur Sprachsteuerung eines Gerätes
US7383181B2 (en) 2003-07-29 2008-06-03 Microsoft Corporation Multi-sensory speech detection system
US7447630B2 (en) 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7499686B2 (en) 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US7574008B2 (en) 2004-09-17 2009-08-11 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7283850B2 (en) 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US7346504B2 (en) 2005-06-20 2008-03-18 Microsoft Corporation Multi-sensory speech enhancement using a clean speech prior
US7680656B2 (en) 2005-06-28 2010-03-16 Microsoft Corporation Multi-sensory speech enhancement using a speech-state model
US7406303B2 (en) 2005-07-05 2008-07-29 Microsoft Corporation Multi-sensory speech enhancement using synthesized sensor signal
US7930178B2 (en) 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
DE102008051756A1 (de) 2007-11-12 2009-05-14 Volkswagen Ag Multimodale Benutzerschnittstelle eines Fahrerassistenzsystems zur Eingabe und Präsentation von Informationen

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63299555A (ja) * 1987-05-29 1988-12-07 Toshiba Corp 無線電話装置
JP2807241B2 (ja) * 1988-11-11 1998-10-08 株式会社東芝 音声認識装置
JP2927891B2 (ja) * 1989-06-19 1999-07-28 日本電気株式会社 音声ダイヤル装置
US5148471A (en) * 1989-11-20 1992-09-15 Motorola, Inc. Communications device with voice recognition and movable element control interface

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002287795A (ja) * 2001-03-27 2002-10-04 Clarion Co Ltd 車載用音声認識装置
JP4694017B2 (ja) * 2001-03-27 2011-06-01 クラリオン株式会社 車載用音声認識装置
JP2009104156A (ja) * 2001-12-17 2009-05-14 Asahi Kasei Homes Kk 電話通信端末
JP2007232865A (ja) * 2006-02-28 2007-09-13 Toshiba Tec Corp 音声認識装置及び音声認識プログラム
WO2021044676A1 (ja) * 2019-09-04 2021-03-11 株式会社東海理化電機製作所 提示装置
JP2021039260A (ja) * 2019-09-04 2021-03-11 株式会社東海理化電機製作所 提示装置

Also Published As

Publication number Publication date
AU1845899A (en) 1999-09-09
AU747198B2 (en) 2002-05-09
EP0939534A1 (en) 1999-09-01
CN1235333A (zh) 1999-11-17
CN1125434C (zh) 2003-10-22

Similar Documents

Publication Publication Date Title
JPH11249692A (ja) 音声認識装置
US8290543B2 (en) System and methods for adaptively switching a mobile device's mode of operation
EP2092721B1 (en) Method and device for changing to a speakerphone mode
JP2001352365A (ja) 移動通信端末装置及びそれに用いる着信識別方法
JP2001308970A (ja) 携帯電話の音声認識操作方法及びシステム
JP3157788B2 (ja) 携帯型情報端末
JP4334094B2 (ja) 通信端末装置
JP2000341376A (ja) 携帯電話機
US6748075B2 (en) Telephone and cordless telephone
US6625474B1 (en) Method and apparatus for audio signal based answer call message generation
JP2978942B2 (ja) 移動体通信端末装置
JPH1168891A (ja) 携帯電話機
JP2000197128A (ja) 無線通信機
JP2002271474A (ja) 携帯電話機
KR100622212B1 (ko) 음성인식을 이용한 화자 확인 장치 및 방법
JP2004356678A (ja) 電話装置
JP2000244633A (ja) 無線通信装置
KR100573481B1 (ko) 벨 모드 자동 전환을 통한 이동통신 단말기의 위치 알림방법
JP2000278388A (ja) 音声認識機能を有する携帯可能な通信装置
JP2001345889A (ja) 携帯端末
JP2005033719A (ja) 識別表示機能ボタンを装備した電話機
JPH11112633A (ja) 携帯電話
JPH11205863A (ja) 通話状態報知機能付き移動無線装置
KR20000019618A (ko) 휴대폰에서 음성메세지에 의한 링착신 알림방법
KR20060033479A (ko) 진동패턴에 의한 발신자 구분 서비스 기능을 가지는무선통신 단말기 및 그 방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000208