JPS61129700A - 音声認識装置の辞書作成方法 - Google Patents

音声認識装置の辞書作成方法

Info

Publication number
JPS61129700A
JPS61129700A JP59252526A JP25252684A JPS61129700A JP S61129700 A JPS61129700 A JP S61129700A JP 59252526 A JP59252526 A JP 59252526A JP 25252684 A JP25252684 A JP 25252684A JP S61129700 A JPS61129700 A JP S61129700A
Authority
JP
Japan
Prior art keywords
frames
dictionary
compressed
compression
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59252526A
Other languages
English (en)
Inventor
中谷 奉文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59252526A priority Critical patent/JPS61129700A/ja
Publication of JPS61129700A publication Critical patent/JPS61129700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 及丘分丘 本発明は、音声認識装置の辞書作成方法、より詳細には
、音声認識装置における辞書容量の圧縮方法に関する。
丈米艮玉 単語音声認識装置においては、単語辞書の構成を如何に
するかで辞書容量と認識処理時間が左右される。辞書容
量は製造コストにも関わるので該容量を減らす提案は種
々なされている。その一つに前後する隣接フレームの対
応するデータの差がある閾値以下ならば前のデータで代
表して圧縮する方法がある。
第2図は、従来の圧縮法の一例を説明するためのパター
ンで、このパターンは15チヤンネルのスペクトルを2
ビツトで10m5おきにサンプルしたT S P (T
ime−Spectrum Pattern )を示し
ており、隣接フレームとの差の得点を(a)図の右欄に
記し、得点差2以下のものを省略して圧縮した例を(b
)図に示す。なお、(a)図の右欄の数字Aは前フレー
ムとの差の得点、Bは省略フレー□ム、Cは省略したフ
レームを代表するフレームを示し、(、b)図の右欄の
数字りは圧縮して省略したフレームの数を示し、図示例
の場合、37フレームの単語が20フレームに圧縮され
ている。大体通常の日本単語のフレーム数は20〜20
0程度であり、上記圧縮法によれば短フレーム単語も長
フレーム単語も同一の基準で圧縮され、短フレームのも
のは情報量を失いすぎ誤認識の原因となる。また、長フ
レームのものは冗長性を残すことになり不都合であった
甘み 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置において、標準パターンを辞書に登
録する際に、大カバクーンのフレー−ム数を計測し、そ
のフレーム数により標準パターンの圧縮閾値を変化させ
て長い入力パターン程圧縮されるようにし、もって、短
フレーム単語はなるべく情報量の欠落を防止し、長フレ
ーム単語は最大限に情報量を圧縮するようにし、効率的
な辞書作成方法を提供することを目的としてなさn。
たちのである。
1威 本発明は、上記目的を達成するために、入力パターンの
フレーム数を計測し、隣接フレームのパラメータ同志の
差が閾値より小さい場合に前のフレームパラメータで代
表し、圧縮したフレーム数を記録して圧縮辞書を作成し
、照合時に圧縮したフレーム数を用いて圧縮前のフレー
ムデータに戻して標準パターンとして入力パターンと照
合する音声認識装置において、前記入力フレーム数に応
じて前記閾値を変えて辞書を圧縮することを特徴とした
ものである。以下、本発明の実施例に基づいて説明する
第1図は、本発明の実施例に使用する電気的ブロック線
図の一例を示す図で、図中、1はマイクロフォン、2は
バンドパスフィルタ(B、P、F)群、3は区間検出部
、4はフレーム数検出部、5はレジスタ、6は辞書、7
は本発明による処理装置部で、マイクロフォン1からの
音声入力はB。
P、F、群2により特徴量が抽出され、その特徴量の変
化から区間検出され、区間のフレーム数が検出部4で検
出され、本発明の処理部7にてフレーム数に応じた閾値
が設定され、レジスタ5に一時記憶された入力パターン
を閾値に基づいて辞書6に格納するものである。
すなわち、第2図(a)に示されるように、TSPは既
に振幅情報が圧縮されており、このようなTSPを用い
たマツチングにおいては単語の種類にもよるが安定した
認識率を得るためには、最低8〜10種の異なるフレー
ムパターンを必要とする。経験的に隣接フレームとの差
の得点を2にすると20フレ一ム程度の短い単語で8〜
10フレームに圧縮される。これがB T S P (
BinaryTime Specfrum PafLe
rm )を用いたシステム固有の必要最低情報量である
。従来はこの必要最低情報量を得るために一定の2を閾
値として圧縮していたが長い単語に対しては情報量が大
きくなりすぎ経済的でない。そこで、第3図に曲線、(
1)で示す如く入力フレーム数に応じて例えば50フレ
ームまでの単語に対しては2を閾値とし、100フレー
ムまでは3,140フレームまでは4.それ以上を5と
設定すれば第3図(■)に示すような圧縮されたフレー
ム数が得られる。これは明らかに閾値が変化するに応じ
て圧縮率が変化してフレーム数の大きい単語はど圧縮さ
れていることを示している。
・  立来 以上の説明から明らかなように、本発明によれば、従来
技術のように長い単語も短い単語も均一の圧縮率で圧縮
されるのではなく、長い単語程圧縮率を太き(できるの
で効率的な圧縮辞書を得ることができる。
【図面の簡単な説明】 第1図は、本発明の実施例に使用される電気的ブロック
線図の一例を示す図、第2図は、圧縮前のパターンと圧
縮後のパターンの関係を示す図、第3図は、入力フレー
ムと圧縮フレームとの関係を示すグラフである。 1・・・マイクロフォン、2・・・バンドパスフィルタ
(B、P、F)群、3・・・区間検出部、4・・・フレ
ーム数検出部、5・・・レジスタ、6・・・辞書、7・
・・処理装置部。 1!1図 第3図 第2図 (a)

Claims (3)

    【特許請求の範囲】
  1. (1)、入力パターンのフレーム数を計測し、隣接フレ
    ームのパラメータ同志の差が閾値より小さい場合に前の
    フレームパラメータで代表し、圧縮したフレーム数を記
    録して圧縮辞書を作成し、照合時に圧縮したフレーム数
    を用いて圧縮前のフレームデータに戻して標準パターン
    として入力パターンと照合する音声認識装置において、
    前記入力フレーム数に応じて前記閾値を変えて辞書を圧
    縮することを特徴とする音声認識装置の辞書作成方法。
  2. (2)、最低の圧縮されたフレーム数を8〜10フレー
    ムとすることを特徴とする特許請求の範囲第(1)項に
    記載の辞書作成方法。
  3. (3)、入力フレーム数が長い入力パターン程圧縮比が
    大きくなるよう前記閾値を設定することを特徴とする特
    許請求の範囲第(1)項に記載の辞書作成方法。
JP59252526A 1984-11-29 1984-11-29 音声認識装置の辞書作成方法 Pending JPS61129700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59252526A JPS61129700A (ja) 1984-11-29 1984-11-29 音声認識装置の辞書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59252526A JPS61129700A (ja) 1984-11-29 1984-11-29 音声認識装置の辞書作成方法

Publications (1)

Publication Number Publication Date
JPS61129700A true JPS61129700A (ja) 1986-06-17

Family

ID=17238594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59252526A Pending JPS61129700A (ja) 1984-11-29 1984-11-29 音声認識装置の辞書作成方法

Country Status (1)

Country Link
JP (1) JPS61129700A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102482A (ja) * 2006-10-20 2008-05-01 Toshiba Tec Corp パターンマッチング装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102482A (ja) * 2006-10-20 2008-05-01 Toshiba Tec Corp パターンマッチング装置及び方法
JP2011022621A (ja) * 2006-10-20 2011-02-03 Toshiba Tec Corp パターンマッチング装置及び方法

Similar Documents

Publication Publication Date Title
CA2019527A1 (en) Signature verification data compression for storage on an identification card
US5095508A (en) Identification of voice pattern
JPS61129700A (ja) 音声認識装置の辞書作成方法
JPS63232626A (ja) デ−タ圧縮復元方式
JP3058569B2 (ja) 話者照合方法及び装置
JPS5977498A (ja) 音声特徴パラメータの圧縮装置
JP3033122B2 (ja) パターン抽出装置
JPH05108304A (ja) データ圧縮方式
JPS6070496A (ja) 音声認識処理方式
JP2901976B2 (ja) パターン照合予備選択方式
JPH04212998A (ja) 音声信号圧縮方法及びその装置
JPS59211100A (ja) 登録型音声認識方法
JPH11249681A (ja) 音響特徴抽出方法及び同方法を適用した音声認識装置
JPS63175895A (ja) 無音圧縮音声録音装置
JPS6151196A (ja) 音声認識装置
JPS60146300A (ja) パタ−ン作成方式
JPS61183696A (ja) 特定話者音声認識装置
JPS5882300A (ja) 音声認識方式
JPS6214700A (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
EP0165604A3 (en) Recording/reproducing apparatus including a digital memory device
JPS6078489A (ja) 辞書更新方式
JPS59107400A (ja) 音声認識方法
JPS6078490A (ja) 辞書更新方式
JPS61137200A (ja) 音声認識方式