JPH07210188A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH07210188A
JPH07210188A JP6006969A JP696994A JPH07210188A JP H07210188 A JPH07210188 A JP H07210188A JP 6006969 A JP6006969 A JP 6006969A JP 696994 A JP696994 A JP 696994A JP H07210188 A JPH07210188 A JP H07210188A
Authority
JP
Japan
Prior art keywords
pattern
voice
phrase
similar
frequency spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6006969A
Other languages
English (en)
Inventor
Hiroyuki Fujimoto
博之 藤本
Kazuya Sako
和也 佐古
Shoji Fujimoto
昇治 藤本
Ikue Takahashi
育恵 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP6006969A priority Critical patent/JPH07210188A/ja
Publication of JPH07210188A publication Critical patent/JPH07210188A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 認識率の向上を図ることにより、操作性・機
能性・信頼性を更に向上せしめた音声認識装置を提供す
る。 【構成】 音声辞書部41には、所定の語句の周波数ス
ペクトルの標準パターンに加え音韻的に類似した語句が
存在するものについて音韻類似語句が登録される。音韻
類似語句の存在する語句が入力されたと処理選択部45
が判定すると、追加処理部46は、該語句の類似部分を
消去し非類似部分についての周波数スペクトルパターン
のみ認識部43に送出する。そして、認識部43は、そ
の非類似部分に着目して音韻類似語句内の識別を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声入力方式を採用す
る入力装置等において、入力された音声を文字コードに
変換するための装置である音声認識装置に係り、より詳
細には、かかる音声認識装置における認識率の向上に関
する。
【0002】
【従来の技術】図4は、従来の音声認識装置の構成の一
例を示すブロック図である。この図において、符号1は
マイク、符号2はアンプ、符号3はアナログ/ディジタ
ル(A/D)変換器、符号4はディジタル信号プロセッ
サ(DSP)、符号5はディジタル/アナログ(D/
A)変換器、符号6はスピーカ、をそれぞれ示す。そし
て、その動作は以下の通りである。まず、音声がマイク
1により電気的なアナログ信号に変換され、次いで、ア
ンプ2により増幅される。そして、その増幅されたアナ
ログ信号が、A/D変換器3によりディジタル信号に変
換されて、DSP4に入力される。DSP4では、ま
ず、音声分析により入力された信号から周波数スペクト
ルが抽出される(音声分析部42)。そして、所定のア
ルゴリズムに従って、あらかじめ辞書部41に格納され
ている標準パターンとその周波数スペクトルのパターン
とを照合し、最も類似した(距離の近い)標準パターン
を見つけ出すことにより、その語句を認識する(認識部
43)。それから、結果出力部44がその語句を示すデ
ィジタル信号を出力し、その出力がD/A変換器5によ
り音声アナログ信号に変換されて、最後にスピーカ6に
よりその認識された音声が出力される。または、スピー
カによる音声出力の代わりに、ディスプレイにその認識
された語句が表示されてもよいし、音声出力と表示を同
時に行ってもよい。
【0003】
【発明が解決しようとする課題】このように、従来の音
声認識装置においては、入力される全ての音声語句に対
して、音声辞書を参照しつつ同一の音声認識アルゴリズ
ムにより単純に類似度(距離)を算出して認識結果を得
ているのみであるため、辞書内に類似したパターンの語
句が存在する場合、ある一定の確率で誤認識を生じてい
た。
【0004】かかる実情に鑑み、本発明の目的は、認識
率の向上を図ることにより、操作性・機能性・信頼性を
更に向上せしめた音声認識装置を提供することにある。
【0005】
【課題を解決するための手段】本発明は、類似するパタ
ーンが存在する語句又は経験上誤認識が発生し易いこと
が判明している語句をあらかじめ登録しておき、そのよ
うな語句が音声入力されたときに、あらかじめ類似語句
を識別するための特別な処理を追加することで、誤認識
を防止することにより、上記目的を達成するものであ
る。
【0006】すなわち、本発明に係る第1の音声認識装
置は、所定の語句の周波数スペクトルの標準パターンが
登録されている音声辞書部と、入力された音声信号から
周波数スペクトルパターンを抽出する音声分析手段と、
前記周波数スペクトルパターンと前記標準パターンとを
照合し最も類似した標準パターンを見つけ出すことによ
り前記音声信号の示す語句を認識する認識手段と、を備
えた音声認識装置において、前記音声辞書部には、さら
に前記所定の語句のうち音韻的に類似した語句が存在す
るものについて音韻類似語句が登録されており、前記音
声認識装置は、さらに、前記周波数スペクトルパターン
が前記音韻類似語句の存在する語句を示すものであるか
を判定する音韻類似判定手段と、前記音韻類似判定手段
により、前記音韻類似語句の存在する語句であると判定
された場合に、該語句の類似部分を消去し非類似部分に
ついての周波数スペクトルパターンのみ前記認識手段に
送出することにより、前記認識手段に、前記非類似部分
に着目した前記音韻類似語句内の識別を行わしめる音韻
類似語句処理手段と、を具備することを特徴とする音声
認識装置である。
【0007】また、本発明に係る第2の音声認識装置
は、所定の語句の周波数スペクトルの標準パターンが登
録されている音声辞書部と、入力された音声信号から周
波数スペクトルパターンを抽出する音声分析手段と、前
記周波数スペクトルパターンと前記標準パターンとを照
合し最も類似した標準パターンを見つけ出すことにより
前記音声信号の示す語句を認識する認識手段と、を備え
た音声認識装置において、前記音声辞書部には、さらに
前記所定の語句のうち標準パターンの類似した語句が存
在するものについてパターン類似語句が登録されてお
り、前記音声認識装置は、さらに、前記周波数スペクト
ルパターンが前記パターン類似語句の存在する語句を示
すものであるかを判定するパターン類似判定手段と、前
記パターン類似判定手段により、前記パターン類似語句
の存在する語句であると判定された場合に、該語句の周
波数スペクトルパターンのうち最も差異が顕著に現れる
帯域のみを前記認識手段に送出することにより、前記認
識手段に、前記差異に着目した前記パターン類似語句内
の識別を行わしめる帯域制限手段と、を具備することを
特徴とする音声認識装置である。
【0008】また、本発明に係る第3の音声認識装置
は、所定の語句の周波数スペクトルの標準パターンが登
録されている音声辞書部と、入力された音声信号から周
波数スペクトルパターンを抽出する音声分析手段と、前
記周波数スペクトルパターンと前記標準パターンとを照
合し最も類似した標準パターンを見つけ出すことにより
前記音声信号の示す語句を認識する認識手段と、を備え
た音声認識装置において、前記音声辞書部には、さらに
前記所定の語句のうち標準パターンの類似した語句が存
在するものについてパターン類似語句が登録されてお
り、前記音声認識装置は、さらに、前記周波数スペクト
ルパターンが前記パターン類似語句の存在する語句を示
すものであるかを判定するパターン類似判定手段と、前
記パターン類似判定手段により、前記パターン類似語句
の存在する語句であると判定された場合に、該語句の全
音声パワーを算出して前記認識手段に送出することによ
り、前記認識手段に、前記周波数スペクトルパターンに
加えて前記全音声パワーに着目した前記パターン類似語
句内の識別を行わしめる全音声パワー算出手段と、を具
備することを特徴とする音声認識装置である。
【0009】また、本発明に係る第4の音声認識装置
は、所定の語句の周波数スペクトルの標準パターンが登
録されている音声辞書部と、入力された音声信号から周
波数スペクトルパターンを抽出する音声分析手段と、前
記周波数スペクトルパターンと前記標準パターンとを照
合し最も類似した標準パターンを見つけ出すことにより
前記音声信号の示す語句を認識する認識手段と、を備え
た音声認識装置において、前記音声辞書部には、さらに
前記所定の語句のうち標準パターンの類似した語句が存
在するものについてパターン類似語句が登録されてお
り、前記音声認識装置は、さらに、前記周波数スペクト
ルパターンが前記パターン類似語句の存在する語句を示
すものであるかを判定するパターン類似判定手段と、前
記パターン類似判定手段により、前記パターン類似語句
の存在する語句であると判定された場合に、該語句の所
定の複数の各帯域ごとの音声パワーを算出して前記認識
手段に送出することにより、前記認識手段に、前記周波
数スペクトルパターンに加えて前記各帯域ごとの音声パ
ワーに着目した前記パターン類似語句内の識別を行わし
める帯域別音声パワー算出手段と、を具備することを特
徴とする音声認識装置である。
【0010】
【作用】前記第1の音声認識装置においては、音韻的に
類似した語句が存在する場合に、その類似音韻部分以外
に着目した、より詳細な音声認識処理が特に実行され
る。また、前記第2の音声認識装置においては、類似し
た周波数スペクトルパターンを有する語句が存在する場
合に、差異が最も顕著に現れる周波数部分に着目した、
より詳細な音声認識処理が特に実行される。さらに、第
3又は第4の音声認識装置においては、類似した周波数
スペクトルパターンを有する語句が存在する場合に、従
来からの周波数スペクトルパターンによる類似度に加
え、全音声パワー又は各帯域ごとの音声パワーの類似度
による音声認識処理が特に実行される。
【0011】
【実施例】以下、添付図面を参照して本発明の実施例を
説明する。
【0012】図1は、本発明の一実施例に係る音声認識
装置の構成を示すブロック図である。図4に示すブロッ
ク図と類似した部分については、同一の符号が付されて
おり、相違する部分について説明すれば、DSP4にて
ソフトウェア的に実行される処理部分である、処理選択
部45及び追加処理部46が設けられている点にある。
そして、辞書部41には、本発明に係る第1の音声認識
装置の場合、音韻的に類似した語句が存在する語句につ
いてその音韻類似語句がさらに登録されており、また、
本発明に係る第2、第3又は第4の音声認識装置の場
合、標準パターンの類似した語句が存在する語句につい
てそのパターン類似語句が登録されている。そして、処
理選択部45は、辞書41中の類似語句登録部分を参照
して、そのような類似語句を有する語句が音声分析部4
2から入力されたと判定したときに、追加処理部46に
よる特別な処理を実行させる。また、類似語句を持たな
い語句に対しては、認識部43による、従来通りの照合
処理を実行させる。そして、追加処理部46の処理内容
は、第1、第2、第3又は第4の音声認識装置ごとに異
なっており、以下、その内容の具体例について説明す
る。
【0013】本発明に係る第1の音声認識装置の場合、
例えば、「Okayama」、「Wakayama」、
「Nakayama」、「Takayama」等の、互
いに音韻の類似した語句群のうちのいずれかの語句が入
力されたと、処理選択部45が認識したときに、追加処
理部46による処理が実行される。その追加処理は、共
通の音である「kayama」以外の「O」、「W
a」、「Na」、「Ta」の部分のみ抽出するものであ
り、次の認識部43は、その抽出された部分に着目し
て、従来の照合処理を実行し、類似語句群のうちのどの
語句かを認識する。
【0014】本発明に係る第2の音声認識装置の場合、
例えば、図2(a),(b)に示すような、互いに周波
数スペクトル標準パターンの類似した語句群のうちのい
ずれかの語句が入力されたと、処理選択部45が認識し
たときに、追加処理部46による処理が実行される。そ
して、その追加処理は、その類似したパターンの中で差
異が最も顕著に現れる周波数部分だけを、帯域通過フィ
ルタにより抽出するものであり、次の認識部43は、そ
の抽出された部分に着目して、従来の照合処理を実行
し、類似語句群のうちのどの語句かを認識する。
【0015】本発明に係る第3の音声認識装置の場合
も、同様に、互いに周波数スペクトル標準パターンの類
似した語句群のうちのいずれかの語句が入力されたと、
処理選択部45が認識したときに、追加処理部46によ
る処理が実行される。そして、その追加処理は、入力さ
れた周波数スペクトルパターンの全帯域についての積分
により、その全音声パワーを算出するものであり、次の
認識部43は、周波数スペクトルパターンによる従来の
照合処理に加え、その全音声パワーにも着目して、類似
語句群のうちのどの語句かを認識する。
【0016】本発明に係る第4の音声認識装置の場合
も、同様に、互いに周波数スペクトル標準パターンの類
似した語句群のうちのいずれかの語句が入力されたと、
処理選択部45が認識したときに、追加処理部46によ
る処理が実行される。そして、その追加処理は、中心周
波数の異なる複数の帯域通過フィルタを用いて、入力さ
れた周波数スペクトルパターンを分割し、図3に例示す
る各帯域ごとの音声パワーを算出するものである。次の
認識部43は、周波数スペクトルパターンによる従来の
照合処理に加え、その各帯域ごとの音声パワーにも着目
して、類似語句群のうちのどの語句かを認識する。
【0017】以上、本発明の実施例について述べてきた
が、もちろん本発明はこれに限定されるものではなく、
様々な実施例を案出することは当業者にとって容易なこ
とであろう。例えば、第1の音声認識装置と、第2、第
3又は第4の音声認識装置とを組み合わせることによ
り、さらに認識率の向上を図った実施例とすることも当
然可能である。
【0018】
【発明の効果】以上説明したように、本発明によれば、
従来、誤認識を生ずる可能性を極めて高くする要因とな
っていた、音韻的に類似した語句又は周波数スペクトル
パターンの類似した語句に対し、特別に追加した認識処
理が実行されるので、誤認識が防止され、音声認識率が
飛躍的に向上する、という効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声認識装置の構成を
示すブロック図である。
【図2】類似した周波数スペクトルパターンを例示する
グラフである。
【図3】周波数スペクトルパターンの各帯域ごとの音声
パワーを例示するグラフである。
【図4】従来の音声認識装置の構成の一例を示すブロッ
ク図である。
【符号の説明】
1…マイク 2…アンプ 3…A/D変換器 4…DSP 41…辞書部 42…音声分析部 43…認識部 44…結果出力部 45…処理選択部 46…追加処理部 5…D/A変換器 6…スピーカ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高橋 育恵 兵庫県神戸市兵庫区御所通1丁目2番28号 富士通テン株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 所定の語句の周波数スペクトルの標準パ
    ターンが登録されている音声辞書部と、入力された音声
    信号から周波数スペクトルパターンを抽出する音声分析
    手段と、前記周波数スペクトルパターンと前記標準パタ
    ーンとを照合し最も類似した標準パターンを見つけ出す
    ことにより前記音声信号の示す語句を認識する認識手段
    と、を備えた音声認識装置において、 前記音声辞書部には、さらに前記所定の語句のうち音韻
    的に類似した語句が存在するものについて音韻類似語句
    が登録されており、 前記音声認識装置は、さらに、 前記周波数スペクトルパターンが前記音韻類似語句の存
    在する語句を示すものであるかを判定する音韻類似判定
    手段と、 前記音韻類似判定手段により、前記音韻類似語句の存在
    する語句であると判定された場合に、該語句の類似部分
    を消去し非類似部分についての周波数スペクトルパター
    ンのみ前記認識手段に送出することにより、前記認識手
    段に、前記非類似部分に着目した前記音韻類似語句内の
    識別を行わしめる音韻類似語句処理手段と、 を具備することを特徴とする音声認識装置。
  2. 【請求項2】 所定の語句の周波数スペクトルの標準パ
    ターンが登録されている音声辞書部と、入力された音声
    信号から周波数スペクトルパターンを抽出する音声分析
    手段と、前記周波数スペクトルパターンと前記標準パタ
    ーンとを照合し最も類似した標準パターンを見つけ出す
    ことにより前記音声信号の示す語句を認識する認識手段
    と、を備えた音声認識装置において、 前記音声辞書部には、さらに前記所定の語句のうち標準
    パターンの類似した語句が存在するものについてパター
    ン類似語句が登録されており、 前記音声認識装置は、さらに、 前記周波数スペクトルパターンが前記パターン類似語句
    の存在する語句を示すものであるかを判定するパターン
    類似判定手段と、 前記パターン類似判定手段により、前記パターン類似語
    句の存在する語句であると判定された場合に、該語句の
    周波数スペクトルパターンのうち最も差異が顕著に現れ
    る帯域のみを前記認識手段に送出することにより、前記
    認識手段に、前記差異に着目した前記パターン類似語句
    内の識別を行わしめる帯域制限手段と、を具備すること
    を特徴とする音声認識装置。
  3. 【請求項3】 所定の語句の周波数スペクトルの標準パ
    ターンが登録されている音声辞書部と、入力された音声
    信号から周波数スペクトルパターンを抽出する音声分析
    手段と、前記周波数スペクトルパターンと前記標準パタ
    ーンとを照合し最も類似した標準パターンを見つけ出す
    ことにより前記音声信号の示す語句を認識する認識手段
    と、を備えた音声認識装置において、 前記音声辞書部には、さらに前記所定の語句のうち標準
    パターンの類似した語句が存在するものについてパター
    ン類似語句が登録されており、 前記音声認識装置は、さらに、 前記周波数スペクトルパターンが前記パターン類似語句
    の存在する語句を示すものであるかを判定するパターン
    類似判定手段と、 前記パターン類似判定手段により、前記パターン類似語
    句の存在する語句であると判定された場合に、該語句の
    全音声パワーを算出して前記認識手段に送出することに
    より、前記認識手段に、前記周波数スペクトルパターン
    に加えて前記全音声パワーに着目した前記パターン類似
    語句内の識別を行わしめる全音声パワー算出手段と、 を具備することを特徴とする音声認識装置。
  4. 【請求項4】 所定の語句の周波数スペクトルの標準パ
    ターンが登録されている音声辞書部と、入力された音声
    信号から周波数スペクトルパターンを抽出する音声分析
    手段と、前記周波数スペクトルパターンと前記標準パタ
    ーンとを照合し最も類似した標準パターンを見つけ出す
    ことにより前記音声信号の示す語句を認識する認識手段
    と、を備えた音声認識装置において、 前記音声辞書部には、さらに前記所定の語句のうち標準
    パターンの類似した語句が存在するものについてパター
    ン類似語句が登録されており、 前記音声認識装置は、さらに、 前記周波数スペクトルパターンが前記パターン類似語句
    の存在する語句を示すものであるかを判定するパターン
    類似判定手段と、 前記パターン類似判定手段により、前記パターン類似語
    句の存在する語句であると判定された場合に、該語句の
    所定の複数の各帯域ごとの音声パワーを算出して前記認
    識手段に送出することにより、前記認識手段に、前記周
    波数スペクトルパターンに加えて前記各帯域ごとの音声
    パワーに着目した前記パターン類似語句内の識別を行わ
    しめる帯域別音声パワー算出手段と、 を具備することを特徴とする音声認識装置。
JP6006969A 1994-01-26 1994-01-26 音声認識装置 Pending JPH07210188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6006969A JPH07210188A (ja) 1994-01-26 1994-01-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6006969A JPH07210188A (ja) 1994-01-26 1994-01-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPH07210188A true JPH07210188A (ja) 1995-08-11

Family

ID=11653035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6006969A Pending JPH07210188A (ja) 1994-01-26 1994-01-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPH07210188A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083165A (ja) * 2006-09-26 2008-04-10 Xanavi Informatics Corp 音声認識処理プログラム及び音声認識処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083165A (ja) * 2006-09-26 2008-04-10 Xanavi Informatics Corp 音声認識処理プログラム及び音声認識処理方法

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JP2815579B2 (ja) 音声認識における単語候補削減装置
JPH0876788A (ja) 音声認識における混同しやすい語の検出方法
JPS62232691A (ja) 音声認識装置
JPH07210188A (ja) 音声認識装置
JP3588929B2 (ja) 音声認識装置
JPH07230293A (ja) 音声認識装置
JPH06161488A (ja) 音声認識装置
KR100931790B1 (ko) 음성인식 시스템에서 발음명칭목록을 이용한 인식사전 생성 방법 및 그를 이용한 유사발음명칭 처리 방법
KR20180087038A (ko) 화자 특성을 고려하는 음성합성 기능의 보청기 및 그 보청 방법
JP3020999B2 (ja) パターン登録方法
JP3808732B2 (ja) 音声認識方法及びそのシステム
JP2664785B2 (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JP3110025B2 (ja) 発声変形検出装置
JP3357752B2 (ja) パターンマッチング装置
JP2658426B2 (ja) 音声認識方法
JPS58176699A (ja) 音声標準パタ−ン登録方式
JPH06337700A (ja) 音声合成装置
JPS59195300A (ja) 音声認識装置
JP2718662B2 (ja) 音声タイプライタ装置
CN115132169A (zh) 一种语音转换方法、装置及终端设备
JP2006039383A (ja) 音声認識装置
JPS59147397A (ja) 音声認識制御方式
JPH06318098A (ja) 話者認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021008