JPH0233199A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0233199A
JPH0233199A JP63183134A JP18313488A JPH0233199A JP H0233199 A JPH0233199 A JP H0233199A JP 63183134 A JP63183134 A JP 63183134A JP 18313488 A JP18313488 A JP 18313488A JP H0233199 A JPH0233199 A JP H0233199A
Authority
JP
Japan
Prior art keywords
voice
similarity
pattern
registered
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63183134A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63183134A priority Critical patent/JPH0233199A/ja
Publication of JPH0233199A publication Critical patent/JPH0233199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 枝先分立 本発明は、音声認識装置に関する。
丈東扱権 音声認識の研究は盛んであるが、音声認識には使用者が
自分の声を登録してから使う特定話者方式と、何の準備
もなく使える不特定話者方式が牟る。多くの単語を使用
する場合、特定話者方式では音声を登録することが利用
者の負担となり、不特定話者方式では特定話者方式に比
べて認識率が低いという各々欠点を持、っている、そこ
で、特定話者方式と不特定話者方式の両方の音声用辞書
を持ち、 、100単語程度の共通単語を不特定話者方
式、各人が必要な部分を特定話者方式とすることで両方
の欠点を補うことができる。しかし、不特定話者方式の
認識率90数%というのは不特定話者用の辞書のみを使
っての結果であってここに特定話者用の辞書が存在すれ
ばこの認識率は達成できない、なぜならば、同じ単語が
不特定話者用と特定話者用の間辞書にあれば、当然自分
の音声で登録した特定話者用との類似度が高くなるよう
に、不特定話者用の辞書の中では正認識単語の標準パタ
ーンの得る類似度は他の単語に比べて大きくはなるが、
特定話者方式の辞書に比べれば小さい。
そのため、不特定話者方式の辞書の中に「改行」という
単語が登録されており、特定話者方式の方に[解除」と
いう単語があったとし、「改行」という音声を入力した
とすると、lKaigjol*1KaizjolのIg
lと121の違イニよる類似度差より他の部分が特定話
者力の標準パターンとの方が大きな類似性を示し、単語
全体で累積すると「解除」に誤り、これはいくら再発声
を繰り返しても正しい認識にならないという欠点があっ
たー 且−−」在 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、特定話者方式用と不特定話者方式用の辞書が同等
の扱いができるような音声認識装置を提供することを目
的としてなされたものである。
碧−一」又 本発明は、上記目的を達成するために、音声を電気信号
に変換する手段と、この信号から特徴を抽出する特徴抽
出部と、該特徴量を記憶する第1の記憶部とあらかじめ
作られたパターンを記憶する第2の記憶部と特徴量を比
較する比較部を有し、第1(又は第2)の記憶部の標準
パターンとの類似性には第2(又は第1)の記憶部に格
納された標準パターンとの類似性により類似性が小さく
(大きく)なるような操作をして認識する音声認識装置
において、登録する音声ごとに操作の重みを記憶してお
くことを特徴としたものである。以下。
本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための構成図で
、図中、1はマイクロフォン、2はマイクアンプ、3は
バンドパスフィルタ、4はスイッチ、5,6はレジスタ
、7は比較部、8はテーブル、9は乗算器、10は最大
類似度判定部、11は認識結果出力部で、電気音響変換
器としてマイクロフォン1を用い、この電気信号をマイ
クアンプ2によって増幅する。この増幅された信号をバ
ンドパスフィルタ群3に入れて特徴分析し、特徴パター
ンを作る0図には示されていないが、実際には電気信号
の中から音声に係る部分だけを抜き出す音声検出部を設
ける。又、時にはプリエンファシス回路を挿入して音声
の高周波数減衰を防ぐこともある。特徴抽出はフィルタ
ーバンクに限定するものではなく、LPCやFFT、ケ
プストラムなど知られたどのようなものを用いても良い
フィルタバンクの場合、フィルタの数は8〜30程度用
いて、帯域は100Hz〜10kHzを分析すれば十分
である。レジスタ5は不特定話者方式の辞書が格納され
ており5メーカーで作って登録しておく、一方、レジス
タ6は特定話者方式の辞書の格納部で、この登録は使用
者が必要な単語を発声して登録する。この時、スイッチ
をB側に倒し、音声の特徴パターンをストアする。認識
時はスイッチをA側に倒し、レジスタ5又は6に登録さ
れている音声のどれかを発声する。この未知の音声は特
徴パターンに変換され、比較部7においてレジスタ5.
6の標準パターンと照合する。比較は音声パターンの時
間長を一致させて類似性を計算するが、時間長の一致さ
せ方は動的計画法を利用する方法や線形伸縮を利用する
方法等が知られており、どのような方法を採用しても良
い、比較した結果、類似度又は距離を各音声毎に比較部
から出力すると共に、レジスタ5,6の中のどの単語パ
ターンと比較したかによってテーブル8から数値をとり
出し、それを前記類似度又は距離に掛け、これを最終的
な類似度とする。こうして、未知の音声パターンは登録
された全てのパターンと比較し、最大の類似度を得た標
準パターンについたラベルを認識結果として出力する。
こうすることによって特定話者方式の標準パターンと不
特定話者方式の標準パターンを等価に扱うことができ、
なおかつ、単語毎の細かい差異を類似度に反映すること
ができる。更に、認識させた音声を言い直した時、又は
、認識結果が誤っていた時に前記テーブルの値を変更す
るようにした。このような例を第2図に示す。
第2図は、前記テーブルの値を変更するようにした実施
例を説明するための図であるが、第1図と同様の作用を
する部には第1図の場合と同一の参照番号を付し、その
説明を割愛する。第2図の実施例においても、第1図の
例と同様に認識し。
認識結果をデイスプレー12に表示する。この結果を見
て利用者が正、誤りをスイッチ14で入力する。誤認識
した場合、音声名称なりそれを表わす記号なりを記憶部
13に記憶しておく。次の音声が認識された時には記憶
部13の内容をクリアし、誤認識スイッチが押された時
にはその音声基又は音声を表わす記号が記憶部の内容と
一致するかどうかを調べる。一致すればテーブル8の中
の今誤って出力された音声の数値を変更する。変更のし
かたは類似度を利用している場合は誤り先の音声の数値
が小さくなるように修正する。又、距離を利用している
時は類似度の逆数に近い概念であるのでこの場合の誤り
先の音声の数値が大きくなるように修正する。又、修正
に際し、その音声が特定話者用の標準パターンであるか
、不特定話者用であるかを調べ、両辞書の間に対になる
ような言葉があるかどうか(例えば、従来技術で説明し
たr解除」と「改行」)を調べた上、対がなければ特定
話者用の方の数値を類似度利用時には小さく、距離の時
に逆になるようにすれば良い。
効−一一釆一 以上の説明から明らかなように、本発明によると、特定
話者方式と不特定話者方式の標準パターンが混在しても
同等の取扱いができる。
【図面の簡単な説明】
第1図及び第2図は、それぞれ本発明の詳細な説明する
ための構成図である。 1・・・マイクロフォン、2・・・マイクアンプ、3・
・・バンドパスフィルタ、4・・・スイッチ、5,6・
・・レジスタ、7・・・比較部、8・・・テーブル、9
・・・乗算器、10・・・最大類似度判定部、11・・
・認識結果出力部、12・・・デイスプレィ、13・・
・記憶部、14・・・スイッチ。

Claims (1)

    【特許請求の範囲】
  1. 1、音声を電気信号に変換する手段と、この信号から特
    徴を抽出する特徴抽出部と、該特徴量を記憶する第1の
    記憶部とあらかじめ作られたパターンを記憶する第2の
    記憶部と特徴量を比較する比較部を有し、第1(又は第
    2)の記憶部の標準パターンとの類似性には第2(又は
    第1)の記憶部に格納された標準パターンとの類似性に
    より類似性が小さく(大きく)なるような操作をして認
    識する音声認識装置において、登録する音声ごとに操作
    の重みを記憶しておくことを特徴とする音声認識装置。
JP63183134A 1988-07-22 1988-07-22 音声認識装置 Pending JPH0233199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63183134A JPH0233199A (ja) 1988-07-22 1988-07-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63183134A JPH0233199A (ja) 1988-07-22 1988-07-22 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0233199A true JPH0233199A (ja) 1990-02-02

Family

ID=16130394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63183134A Pending JPH0233199A (ja) 1988-07-22 1988-07-22 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0233199A (ja)

Similar Documents

Publication Publication Date Title
Wu et al. Incorporating information from syllable-length time scales into automatic speech recognition
US4802231A (en) Pattern recognition error reduction system
JPS58130393A (ja) 音声認識装置
JP4408490B2 (ja) データベース照会を実行する方法及びその装置
Wu et al. Performance improvements through combining phone-and syllable-scale information in automatic speech recognition.
JPH11231895A (ja) 音声認識方法及びその装置
JPH0225517B2 (ja)
JPH0233199A (ja) 音声認識装置
JP2000122678A (ja) 音声認識機器制御装置
JPH04369698A (ja) 音声認識方式
WO1994002936A1 (en) Voice recognition apparatus and method
JPH0481898A (ja) 音声認識装置
JPS61180297A (ja) 話者照合装置
JPH0316038B2 (ja)
JPS645320B2 (ja)
JPH0194398A (ja) 音声標準パターンの作成方法
JPS6126678B2 (ja)
JPH02103599A (ja) 音声認識装置
JP2975808B2 (ja) 音声認識装置
JP2864511B2 (ja) 話者識別方式と装置
JP3357752B2 (ja) パターンマッチング装置
JPH0534679B2 (ja)
JPS61281300A (ja) 音声認識装置
JPH0416899A (ja) 音声認識装置
JPH0222699A (ja) 音声認識装置