JP2001184085A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2001184085A
JP2001184085A JP36409199A JP36409199A JP2001184085A JP 2001184085 A JP2001184085 A JP 2001184085A JP 36409199 A JP36409199 A JP 36409199A JP 36409199 A JP36409199 A JP 36409199A JP 2001184085 A JP2001184085 A JP 2001184085A
Authority
JP
Japan
Prior art keywords
word
registered
recognition
misrecognition
countermeasure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP36409199A
Other languages
English (en)
Inventor
Katsumi Shiono
勝美 塩野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Saitama Ltd
Original Assignee
NEC Saitama Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Saitama Ltd filed Critical NEC Saitama Ltd
Priority to JP36409199A priority Critical patent/JP2001184085A/ja
Publication of JP2001184085A publication Critical patent/JP2001184085A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 【課題】登録されていない単語の発声、騒音による誤認
識をより低減させる。 【解決手段】登録された登録単語に基づいて誤認識対策
単語を作成し、登録単語と誤認識対策単語との中で、発
声され入力された発声単語に類似度が最も高い単語を認
識結果とする音声認識を行い、認識結果が、誤認識対策
単語である場合、誤認識とする。登録単語を誤認識対策
単語で希釈することにより、登録単語でない単語の発
声、騒音の中での登録単語の発声は、誤認識となる確率
が高くなる。誤認識対策単語のn文字目の音節の母音
は、登録単語のn文字目の音節において出現頻度の低い
母音であることが好ましい。このような誤認識対策単語
は、登録単語との類似度が低く、使用者が登録単語を発
声した場合、誤認識対策単語が認識結果となる確率は低
くなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置に関
し、特に、登録されていない単語の発声、騒音による誤
認識をより低減させる音声認識装置に関する。
【0002】
【従来の技術】マイクから入力された音声を認識し、認
識した単語に対応した処理を行う携帯電話機が提案され
ている。音声認識処理は、単語音声を母音と子音の組み
合わせからなる最小単位の音節に分け、各音節単位で認
識を行う処理が理想である。しかし、実際に発声された
単語音声を音節単位に区切ることは、非常に困難であ
る。そこで、認識させる単語を予め登録しておき、発声
された音声と全ての登録単語との間で比較処理を行い、
登録単語の中で最も類似度の高い単語を認識結果とする
方法が採用されている。この場合、使用者が誤って登録
されていない単語を発声したり、周囲に騒音がある所で
発声したりすると、意図しない登録単語に誤認識されて
しまうことがある。
【0003】
【発明が解決しようとする課題】本発明の課題は、登録
されていない単語の発声、騒音による誤認識をより低減
させる音声認識装置を提供することにある。
【0004】
【課題を解決するための手段】その課題を解決するため
の手段が、下記のように表現される。その表現中に現れ
る技術的事項には、括弧()付きで、番号、記号等が添
記されている。その番号、記号等は、本発明の実施の複
数・形態又は複数の実施例のうちの少なくとも1つの実
施の形態又は複数の実施例を構成する技術的事項、特
に、その実施の形態又は実施例に対応する図面に表現さ
れている技術的事項に付せられている参照番号、参照記
号等に一致している。このような参照番号、参照記号
は、請求項記載の技術的事項と実施の形態又は実施例の
技術的事項との対応・橋渡しを明確にしている。このよ
うな対応・橋渡しは、請求項記載の技術的事項が実施の
形態又は実施例の技術的事項に限定されて解釈すること
を意味しない。
【0005】本発明による音声認識装置は、登録された
登録単語に基づいて誤認識対策単語を作成する作成手段
と、登録単語と誤認識対策単語との中で、入力された発
声単語に類似度が最も高い単語を認識結果とする音声認
識手段とを含み、認識結果が、誤認識対策単語である場
合、誤認識とする。登録単語を誤認識対策単語で希釈す
ることにより、登録単語でない単語の発声、騒音の中で
の登録単語の発声は、誤認識対策単語が認識結果となる
確率が高くなる。
【0006】誤認識対策単語のn文字目の音節の母音
は、登録単語のn文字目の音節において出現頻度の低い
母音であることが好ましい。このような誤認識対策単語
は、類似度が低く、使用者が登録単語を発声した場合、
誤認識対策単語が認識結果となる確率は低くなる。誤認
識対策単語のn文字目の音節の子音は、登録単語のn文
字目の音節において出現頻度の低い子音である。このよ
うな誤認識対策単語は、母音のみによって作成された単
語よりも、より類似度が低くなる。
【0007】更に、スピーカを含み、スピーカは、誤認
識を使用者に通知する。更に、表示部を含み、表示部
は、誤認識を使用者に通知する。または、誤認識は、音
声認識を再起動させる。このような機能は、使い勝手の
向上の点で好ましい。
【0008】誤認識対策単語は、登録単語が、新たに登
録される場合に作成され、誤認識対策単語の音節数は、
登録単語の中の1つの音節数と等しいことが好ましい。
【0009】音声認識装置は、携帯電話機である。登録
単語と携帯電話機の機能とを対応づけることにより、携
帯電話の使い勝手が良くなる。
【0010】
【発明の実施の形態】図に一致対応して、本発明による
音声認識装置の実施の形態は、携帯電話機である。図1
に示されるように、携帯電話機10は、無線部1、操作
部2、表示部3、メインCPU4、音声認識部5、A/
Dコンバータ6、マイク7及びスピーカ8からなる。無
線部1には、アンテナが付属している。無線部1は、メ
インCPU4と接続している。操作部2は、メインCP
U4と接続している。操作部2は、図示されていない音
声認識開始キーを有している。メインCPU4は、表示
部3、音声認識部5及び、A/Dコンバータ6と接続し
ている。音声認識部5は、A/Dコンバータ6を接続し
ている。マイク7は、A/Dコンバータ6と接続してい
る。A/Dコンバータ6は、スピーカ8と接続してい
る。
【0011】無線部1は、図示されていない基地局との
無線信号の送受信を行う。操作部2は、使用者により携
帯電話機の操作、登録する単語の入力、音声認識の開始
の指示が行われる。表示部3は、メインCPU4の指示
により、数字、文字などを表示する。マイク7は、音声
が入力される。A/Dコンバータ6は、音声データのア
ナログデジタル変換を行う。音声認識部5は、デジタル
変換された音声データにより、音声認識処理を行う。ス
ピーカ8は、音声認識時の開始音と、認識結果に対応す
る音声とを出力する。メインCPU4は、携帯電話全体
の制御を行う。
【0012】図2は、使用者が新たな単語を登録すると
きの処理フローを示している。フローは、ステップ21
〜24からなる。ステップ21では、使用者により単語
の登録が行われたかどうかが判定される。使用者により
単語と、その単語に対応する処理とが操作部2に入力さ
れる。操作部2は、単語と、その単語に対応する処理と
をメインCPU4に出力する。メインCPU4は、操作
部2から出力された単語と処理とを登録する。登録が行
われた場合、ステップ22に移行する。登録が行われな
かった場合、再度フローはステップ21に戻る。
【0013】ステップ22では、既に登録済みの単語に
新たに登録された単語を加えて、登録済み単語の統計処
理を行う。例えば、登録済みの単語として、図3の表に
示されるように、イシイ、カトウ、ナカムラ、オノ、ヤ
マグチの5単語があるとする。各単語のn文字目の音節
の母音について整理する。登録単語1のイシイの場合、
母音は、1文字目がi、2文字目がi、3文字目がiと
なる。図4の表に示されるように、全ての単語のn文字
目の母音の累計を計算する。本例では、1文字目の母音
の累計は、aが3個、iが1個,u,eが0個、oが1
個のようになる。2文字目から4文字目までについても
同様に母音の累計を計算する。
【0014】ステップ23では、登録された全単語のn
文字目の母音の累計結果を用いて、誤認識対策単語を作
成する。誤認識対策単語は、登録済みの単語と同じ長さ
の単語を、2種類ずつ作成される。類似度が低い単語と
なる母音は、累計が少ない母音である。1文字目の母音
の累計が0個であるu,eが作成する単語の1文字目の
母音となる。同様にして、2文字目の母音は、u,e、
3文字目の母音は、a,e,o、4文字目の母音は、
u,e,oとなる。2文字の単語を作成する場合、母音
は1文字目が、u,e、2文字目がu,eとなり、例え
ば、「ウエ」、「エウ」が作成される。登録済みの単語
は2,3,4文字の単語が存在している。3、4文字の
単語についても、2文字の単語と同様に作成される。
【0015】ステップ24では、メインCPU4により
作成された単語を登録する。本例では、作成された単語
の長さを登録済みの単語と同じ長さとしたが、誤認回避
のため、単語の長さを変更してもよい。作成する単語の
個数は、2個としたが、個数を変更してもよい。
【0016】図5は、本発明による音声認識装置の音声
認識のフローを示している。フローはステップ31〜3
5からなる。操作部2が有する音声認識開始キーが押下
されると、フローは起動する。ステップ31では、メイ
ンCPU4が、音声認識開始キーの押下を検出し、A/
Dコンバータ6を介して、スピーカ8に、音声認識の開
始音の鳴動を指示する。スピーカ8は、開始音を出力す
る。その後、メインCPU4は、音声認識の開始を音声
認識部5に命令する。
【0017】ステップ32では、入力された音声の認識
処理が行われる。音声認識部5は、音声認識の開始を命
令されると、音声データ入力待ちの状態になる。マイク
7は、入力された音声を、A/Dコンバータ6に出力す
る。A/Dコンバータ6は、マイク7の出力をデジタル
データである音声データに変換し、音声認識部5に音声
データを出力する。音声データを受け取った音声認識部
5は、認識結果を登録済みの単語と比較する。認識結果
が登録済みの単語の中にあれば、音声認識部5は、認識
結果をメインCPU4に出力し、フローは、ステップ3
3に移行する。認識結果が登録済みの単語の中になけれ
ば、フローは、再度、ステップ32に移行し、音声認識
部5は、音声データ入力待ちの状態になる。
【0018】ステップ33では、認識結果がどのように
登録された単語かを判定する。認識結果を受け取ったメ
インCPU4は、認識結果がメインCPU4により登録
された単語か、使用者により登録された単語かを判別す
る。認識結果が、メインCPU4により登録された単語
である場合、ステップ34に移行する。認識結果が使用
者により登録された単語である場合、ステップ35に移
行する。
【0019】ステップ34では、音声を誤認識したこと
を使用者に通知する。認識結果がメインCPU4により
作成された単語であることは、使用者が誤って登録して
いない単語を発声し、または、周囲の騒音により誤認識
したと解釈される。メインCPU4は、誤認識した旨の
表示を表示部3に指示する。表示部3は、メインCPU
4の指示により、誤認識した旨を通知するメッセージを
表示する。メインCPU4は、誤認識した旨の音声の出
力をスピーカ8に指示する。スピーカ8は、メインCP
U4の指示により、誤認識した旨の音声を出力する。
【0020】ステップ35では、使用者により登録され
た単語に対応した処理が行われる。メインCPU4は、
使用者により登録された単語に対応するメッセージを表
示部3に表示させ、対応する音声をスピーカ8に出力さ
せる。
【0021】従来の音声認識装置では、騒音がある所で
発声したり、使用者が誤って未登録の単語を発声したり
すると、意図しない登録単語に誤認識されやすい。本発
明による音声認識装置によれば、騒音がある所で発声さ
れた登録単語や、未登録の単語は、誤認識対策単語と認
識されて誤認識を回避できる。
【0022】使用者自らが誤動作を防止するために単語
を登録しておくことで、誤認識の低減を図ることもでき
る。登録単語数が多くなると、使用者が誤って登録した
単語との類似性が高い単語を作成してしまうことがあ
る。この場合、使用者が登録済みの単語を発声したにも
かかわらず、誤動作対策用の単語に認識される恐れがあ
る。本発明による音声認識装置によれば、誤動作を防止
するための誤認識対策単語を使用者自らが作成する必要
がない。
【0023】本発明による音声認識装置の実施の他の形
態は、先の実施の形態における音声認識処理方法が改め
られている。
【0024】図6は、本発明による音声認識装置の音声
認識のフローを示している。フローはステップ41〜4
4からなる。操作部2が有する音声認識開始キーが押下
されると、フローは起動する。ステップ41では、メイ
ンCPU4が、音声認識開始キーの押下を検出し、A/
Dコンバータ6を介して、スピーカ8に、音声認識の開
始音の鳴動を指示する。スピーカ8は、開始音を出力す
る。その後、メインCPU4は、音声認識の開始を音声
認識部5に命令する。
【0025】ステップ42では、入力された音声の認識
処理が行われる。音声認識部5は、音声認識の開始を指
示されると、音声データ入力待ちの状態になる。マイク
7は、入力された音声を、A/Dコンバータ6に出力す
る。A/Dコンバータ6は、マイク7の出力をデジタル
データである音声データに変換し、音声認識部5に音声
データを出力する。音声データを受け取った音声認識部
5は、認識結果を登録済みの単語と比較する。認識結果
が登録済みの単語の中にあれば、音声認識部5は、認識
結果をメインCPU4に出力し、フローは、ステップ4
3に移行する。認識結果が登録済みの単語の中になけれ
ば、フローは、再度、ステップ42に移行し、音声認識
部5は、音声データ入力待ちの状態になる。
【0026】ステップ43では、認識結果がどのように
登録された単語かを判定する。認識結果を受け取ったメ
インCPU4は、認識結果がメインCPU4により作成
された単語か、使用者により登録された単語かを判別す
る。認識結果が、メインCPU4により登録された単語
である場合、フローは、再度、ステップ42に移行し、
音声認識部5は、音声データ入力待ちの状態になる。認
識結果が使用者により登録された単語である場合、ステ
ップ44に移行する。
【0027】ステップ44では、使用者により登録され
た単語に対応した処理が行われる。メインCPU4は、
使用者により登録された単語に対応するメッセージを表
示部3に表示させ、対応する音声をスピーカ8に出力さ
せる。
【0028】本発明による音声認識装置の本実施の形態
によれば、誤動作が発生した場合、再度、使用者は音声
認識を開始させる必要がなく使い勝手が良い。
【0029】本発明による音声認識装置の実施の更に他
の形態は、先の実施の形態における類似度が低い単語の
作成方法が改められている。メインCPU4は、登録済
みの単語の母音情報に加えて、子音情報の統計処理を行
い、類似度が低い単語を作成する。こうすることによ
り、類似度がより低い単語を作成することができる。
【0030】
【発明の効果】本発明による音声認識装置は、登録され
ていない単語を使用者が誤って発声したり、音声認識中
に周囲の騒音があったりする場合の誤認識を、より低減
させることができる。
【図面の簡単な説明】
【図1】図1は、本発明による音声認識装置の実施の形
態を示すブロック図である。
【図2】図2は、本発明による音声入力方法の実施の形
態における誤認識対策単語の作成方法を示すフローチャ
ートである。
【図3】図3は、本発明による音声入力方法の実施の形
態における認識辞書の構成例を示す表である。
【図4】図4は、本発明による音声入力方法の実施の形
態における登録単語のn文字目の母音の累計を示す表で
ある。
【図5】図5は、本発明による音声入力方法の実施の形
態における音声認識処理を示すフローチャートである。
【図6】図6は、本発明による音声入力方法の実施の他
の形態における音声認識処理を示すフローチャートであ
る。
【符号の説明】 1…無線部 2…操作部 3…表示部 4…メインCPU 5…音声認識部 6…A/Dコンバータ 7…マイク 8…スピーカ 10…携帯電話機

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】登録された登録単語に基づいて誤認識対策
    単語を作成する作成手段と、 前記登録単語と前記誤認識対策単語との中で、入力され
    た発声単語に類似度が最も高い単語を認識結果とする音
    声認識手段とを含み、 前記認識結果が、前記誤認識対策単語である場合、誤認
    識とする音声認識装置。
  2. 【請求項2】請求項1において、 前記誤認識対策単語のn文字目の音節の母音は、前記登
    録単語のn文字目の音節では出現頻度の低い母音であ
    り、 音声認識装置。
  3. 【請求項3】請求項2において、 前記誤認識対策単語のn文字目の音節の子音は、前記登
    録単語のn文字目の音節では出現頻度の低い子音である
    音声認識装置。
  4. 【請求項4】請求項2において、更に、 スピーカを含み、 前記スピーカは、前記誤認識を使用者に通知する音声認
    識装置。
  5. 【請求項5】請求項2において、更に、 表示部を含み、 前記表示部は、前記誤認識を使用者に通知する音声認識
    装置。
  6. 【請求項6】請求項2において、 前記誤認識は、再度、前記音声認識手段を起動させる音
    声認識装置。
  7. 【請求項7】請求項2において、 前記誤認識対策単語は、前記登録単語が、新たに登録さ
    れる場合に作成され、 前記誤認識対策単語の音節数は、前記登録単語の中の1
    単語の音節数と等しく、 前記誤認識対策単語は、音節数毎に複数が作成される音
    声認識装置。
  8. 【請求項8】請求項2において、 前記音声認識装置は、携帯電話機である音声認識装置。
JP36409199A 1999-12-22 1999-12-22 音声認識装置 Pending JP2001184085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36409199A JP2001184085A (ja) 1999-12-22 1999-12-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36409199A JP2001184085A (ja) 1999-12-22 1999-12-22 音声認識装置

Publications (1)

Publication Number Publication Date
JP2001184085A true JP2001184085A (ja) 2001-07-06

Family

ID=18480955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36409199A Pending JP2001184085A (ja) 1999-12-22 1999-12-22 音声認識装置

Country Status (1)

Country Link
JP (1) JP2001184085A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005045807A1 (ja) * 2003-11-05 2007-05-24 三洋電機株式会社 電子機器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005045807A1 (ja) * 2003-11-05 2007-05-24 三洋電機株式会社 電子機器
US7924324B2 (en) 2003-11-05 2011-04-12 Sanyo Electric Co., Ltd. Sound-controlled electronic apparatus

Similar Documents

Publication Publication Date Title
US7010490B2 (en) Method, system, and apparatus for limiting available selections in a speech recognition system
US8571862B2 (en) Multimodal interface for input of text
US9786273B2 (en) Multimodal disambiguation of speech recognition
US8355915B2 (en) Multimodal speech recognition system
US8244540B2 (en) System and method for providing a textual representation of an audio message to a mobile device
US9830912B2 (en) Speak and touch auto correction interface
KR20050071334A (ko) 텍스트 입력 방법
US20050283364A1 (en) Multimodal disambiguation of speech recognition
KR20060050277A (ko) 다중 언어의 이름들의 음성 인식을 위한 방법 및 시스템
JP2007538278A (ja) 音声認識システム
US8374872B2 (en) Dynamic update of grammar for interactive voice response
US11295732B2 (en) Dynamic interpolation for hybrid language models
US8463609B2 (en) Voice input system and voice input method
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
JP5510069B2 (ja) 翻訳装置
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
KR19990082854A (ko) 음성 인식 잡음 제거 장치 및 음성 인식 잡음 제거 방법
JP2001184085A (ja) 音声認識装置
US20130225240A1 (en) Speech-assisted keypad entry
KR20080043035A (ko) 음성 인식 기능을 갖는 이동 통신 단말 및 이를 이용한검색 방법
JP2005283797A (ja) 音声認識装置および音声認識方法
JPH1195792A (ja) 音声処理装置および文字入力方法
JP3415500B2 (ja) 携帯電話装置の音声認識システム
WO2007052281A1 (en) Method and system for selection of text for editing
JPS58186836A (ja) 音声入力デ−タ処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030527