JPS60146300A - パタ−ン作成方式 - Google Patents
パタ−ン作成方式Info
- Publication number
- JPS60146300A JPS60146300A JP59002399A JP239984A JPS60146300A JP S60146300 A JPS60146300 A JP S60146300A JP 59002399 A JP59002399 A JP 59002399A JP 239984 A JP239984 A JP 239984A JP S60146300 A JPS60146300 A JP S60146300A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- data
- difference
- register
- patterns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
良亙血1
本発明は、音声パターンの作成方法に関する。
従IJL扁
DP(動的計画法)を用いない音声パターン照合法とし
て、音声の時間−周波数パターン上でブロードなパター
″ンと細いパターンを作り、これらを重ね合わせる方法
が考えられている(音声学会秋季講論集3−1−8 (
1983)。
て、音声の時間−周波数パターン上でブロードなパター
″ンと細いパターンを作り、これらを重ね合わせる方法
が考えられている(音声学会秋季講論集3−1−8 (
1983)。
第1図は、上記従来の音声パターン照合方法の一例を説
明するための図で、図中、lはマイク、2はフィルタ群
、3は音声区間検出部、4は辞書登録判定部、5は2値
化部(閾値l)、6も2値化部(閾値2)、7はレジス
タ部、8は加算部、9は辞書部、ioは類似度算出部、
11i結果表示部で、まず、辞書登録に際しては登録す
べき単語を順に発声し、各単1語を複数回発声する。こ
のようにしてマイクlから入力された音声は時間−周波
数パターンに変換され、ある閾値(閾値2)によって0
,1に2値化されてレジスタ7に収納される。次に同じ
単語の2回目の発声が行われ、同様の2値化パターンが
作られ、すでにレジスタ7に収納されているパターンと
加算され、再びしジスタフに収納される。こうして1つ
の単語について複数回発声されたパターンは加算され、
単語数だけ登録される。次に認識に際しては音声が区間
検出された後辞書作成時と異なる閾値(閾値l)で2値
化される。仮に閾値l〉閾値2とすると、辞書パターン
に比べ入カバターンの方が2値化後の「1」の幅が狭い
ことになる。このようなパターンを辞書の各単語のパタ
ーン上に重ねる操作をし、その重なりの度合から類似度
を計算し、最大類似度を持つ単語を認識結果とする。し
かし、この方式の場合、パターンは0.1の1ビツトで
あるが、発声回数分加算することによってデータ量が増
えてしまうという欠点がある。
明するための図で、図中、lはマイク、2はフィルタ群
、3は音声区間検出部、4は辞書登録判定部、5は2値
化部(閾値l)、6も2値化部(閾値2)、7はレジス
タ部、8は加算部、9は辞書部、ioは類似度算出部、
11i結果表示部で、まず、辞書登録に際しては登録す
べき単語を順に発声し、各単1語を複数回発声する。こ
のようにしてマイクlから入力された音声は時間−周波
数パターンに変換され、ある閾値(閾値2)によって0
,1に2値化されてレジスタ7に収納される。次に同じ
単語の2回目の発声が行われ、同様の2値化パターンが
作られ、すでにレジスタ7に収納されているパターンと
加算され、再びしジスタフに収納される。こうして1つ
の単語について複数回発声されたパターンは加算され、
単語数だけ登録される。次に認識に際しては音声が区間
検出された後辞書作成時と異なる閾値(閾値l)で2値
化される。仮に閾値l〉閾値2とすると、辞書パターン
に比べ入カバターンの方が2値化後の「1」の幅が狭い
ことになる。このようなパターンを辞書の各単語のパタ
ーン上に重ねる操作をし、その重なりの度合から類似度
を計算し、最大類似度を持つ単語を認識結果とする。し
かし、この方式の場合、パターンは0.1の1ビツトで
あるが、発声回数分加算することによってデータ量が増
えてしまうという欠点がある。
」−一1
本発明は、上述のごとき従来技術の欠点を解決するため
になされたもので、特に、データ数を減らし、かつ、減
らす前のデータとほぼ等しい情報を保存することのでき
るパターン作成方式を提供することを目的としてなされ
たものである。
になされたもので、特に、データ数を減らし、かつ、減
らす前のデータとほぼ等しい情報を保存することのでき
るパターン作成方式を提供することを目的としてなされ
たものである。
1−−1
本発明の構成について、以下、実施例に基づいて説明す
る。
る。
、本発明は、基本的には、2次元平面で表わされるパタ
ーンの一列と、それに隣接するパターンの対応する要素
間の差をとり、それを−外分加算し、その値が一定値よ
り小なる時、特定のレジスタの値を変化させて一列分の
データを消去するようにし、或いは、同様のパターンの
一列分のデータとこれに隣接する列パターンの対応要素
間の差をとり、この−外分の和が一定値よりも小なる時
、パターンの一部にこれを明示し、一方のパターンを消
去してパターンを作るようにしてものある。
ーンの一列と、それに隣接するパターンの対応する要素
間の差をとり、それを−外分加算し、その値が一定値よ
り小なる時、特定のレジスタの値を変化させて一列分の
データを消去するようにし、或いは、同様のパターンの
一列分のデータとこれに隣接する列パターンの対応要素
間の差をとり、この−外分の和が一定値よりも小なる時
、パターンの一部にこれを明示し、一方のパターンを消
去してパターンを作るようにしてものある。
第2図は、本発明の一実施例を説明するための図である
が、これは第1図に示したブロックに従って「上/ue
/」という単語を3回発声し、それを加算して作った辞
書で、10 m sごとにサンプルしてフレーム化しで
ある。また、2値化した3つのパター−が加算されてい
るため、0〜3の4値となる。また、周波数方向に15
サンプル時間方向に30サンプルあるから900ビツト
のデータとなる。仮に、時間方向にサンプル数を減らす
ことを考えると、周波数方向にデータは操作せず、周波
数方向への第1列と第2列の対応する各要素の差を取る
と周波数の第1サンプル同士の差は1 o−o 1.第
2サンプルはl 3−3 lでいずれもO1第3サンプ
ルと第9サンプルが各々11−21,1l−Olで差は
lであるから第1列と第2列の差はこれらの合計で2で
ある。この差が3以下の場合は両方の列は同じものであ
るとみなすとすると、第1列と第2列は同じデータの列
と考えられる。そこで、第1列を残し、第2列を消去す
ると共に別に設ける第1列に対応するカウンタを1だけ
増す。同様に第1列と第3列の差をとると5となり5〉
3であるから同じデータ列とはみなせない0次に第3列
を基準にして第3列と第4列を比べる。これも差が4と
なり、3より大きいから第4列へ基準を移す、これをく
り返すと第3図のようなカウンタの内容と消去列が出来
、30サンプルあった時間方向のデータは11サンプル
減らすことが出来る。つまりデータは11/30に減り
、4ビット程度のレジスタ11個をカウンタとして追加
すれば良く、合計374ビツトあれば良いことになる。
が、これは第1図に示したブロックに従って「上/ue
/」という単語を3回発声し、それを加算して作った辞
書で、10 m sごとにサンプルしてフレーム化しで
ある。また、2値化した3つのパター−が加算されてい
るため、0〜3の4値となる。また、周波数方向に15
サンプル時間方向に30サンプルあるから900ビツト
のデータとなる。仮に、時間方向にサンプル数を減らす
ことを考えると、周波数方向にデータは操作せず、周波
数方向への第1列と第2列の対応する各要素の差を取る
と周波数の第1サンプル同士の差は1 o−o 1.第
2サンプルはl 3−3 lでいずれもO1第3サンプ
ルと第9サンプルが各々11−21,1l−Olで差は
lであるから第1列と第2列の差はこれらの合計で2で
ある。この差が3以下の場合は両方の列は同じものであ
るとみなすとすると、第1列と第2列は同じデータの列
と考えられる。そこで、第1列を残し、第2列を消去す
ると共に別に設ける第1列に対応するカウンタを1だけ
増す。同様に第1列と第3列の差をとると5となり5〉
3であるから同じデータ列とはみなせない0次に第3列
を基準にして第3列と第4列を比べる。これも差が4と
なり、3より大きいから第4列へ基準を移す、これをく
り返すと第3図のようなカウンタの内容と消去列が出来
、30サンプルあった時間方向のデータは11サンプル
減らすことが出来る。つまりデータは11/30に減り
、4ビット程度のレジスタ11個をカウンタとして追加
すれば良く、合計374ビツトあれば良いことになる。
これは元の41.5%になっている。
第4図は、上記本発明によるパターン作成例を実行する
ための電気的ブロック線図で、図中、1はマイク、2は
バンドパスフィルタ群、21〜23はレジスタ、24は
レジスタ22とレジスタ23の内容を比較する比較部、
25は比較結果判定部、26はカウンタ、27はメモリ
で、最初、レジスタ23に第1番のフレームが、レジス
タ22に第2番目のフレームが入力されており、これら
レジスタ22と23の内容を比較部24で比較し、その
結果、レジスタ22と23の内容の差が所定値以下の時
は、レジスタ22の内容を消去し、カウンタ26を+1
して次のフレームに移動する。すなわち、レジスタ22
に第3番目のフレームを入力する。また、比較結果が所
定値より大きい時は、レジスタ23とカウンタ26の内
容をメモリ27に記憶し、レジスタ22の内容をレジス
タ23へ移す0以上の動作を音声フレーム数だけ繰り返
し行う。
ための電気的ブロック線図で、図中、1はマイク、2は
バンドパスフィルタ群、21〜23はレジスタ、24は
レジスタ22とレジスタ23の内容を比較する比較部、
25は比較結果判定部、26はカウンタ、27はメモリ
で、最初、レジスタ23に第1番のフレームが、レジス
タ22に第2番目のフレームが入力されており、これら
レジスタ22と23の内容を比較部24で比較し、その
結果、レジスタ22と23の内容の差が所定値以下の時
は、レジスタ22の内容を消去し、カウンタ26を+1
して次のフレームに移動する。すなわち、レジスタ22
に第3番目のフレームを入力する。また、比較結果が所
定値より大きい時は、レジスタ23とカウンタ26の内
容をメモリ27に記憶し、レジスタ22の内容をレジス
タ23へ移す0以上の動作を音声フレーム数だけ繰り返
し行う。
第5図は、本発明の他の実施例を説明するための図で、
基本的には前記第2図及び第3図に示した実施例と同じ
であるが、この実施例はカウンタをパターンの中へ組み
込んだもので、周波数方向へ並ぶ15サンプルの隣、つ
まり第16サンプル目にカウンタをつけた。しかも他の
データが全て2ビツトで表わされているため、これも2
ビツト表示とし、第16サンプルの数値+1がカウンタ
となるよう工夫されている。又カウンタが4以上になる
ような場合は4毎に分離して2ビツト表示している0例
えば、カウンタがlOになるような場合、lOを4+4
+2と分解して4フレーム毎のデータを残しているため
、第2図の場合のようにllフレームトハならず、14
フレームになっている。全体で448ビツトで初期のデ
ータ量を1/2にすることができた。
基本的には前記第2図及び第3図に示した実施例と同じ
であるが、この実施例はカウンタをパターンの中へ組み
込んだもので、周波数方向へ並ぶ15サンプルの隣、つ
まり第16サンプル目にカウンタをつけた。しかも他の
データが全て2ビツトで表わされているため、これも2
ビツト表示とし、第16サンプルの数値+1がカウンタ
となるよう工夫されている。又カウンタが4以上になる
ような場合は4毎に分離して2ビツト表示している0例
えば、カウンタがlOになるような場合、lOを4+4
+2と分解して4フレーム毎のデータを残しているため
、第2図の場合のようにllフレームトハならず、14
フレームになっている。全体で448ビツトで初期のデ
ータ量を1/2にすることができた。
−−1
以上の説明から明らかなように、本発明によると、デー
タ数を減らすことができ、しかも減らす前とほぼ等しい
パターンを作成することが可能となる。
タ数を減らすことができ、しかも減らす前とほぼ等しい
パターンを作成することが可能となる。
第1図は、従来のパターン作成方式の一例を説明するた
、めのブロック線図、第2図及び第3図は、、本発明に
よるパターン作成方式の一実施例を説明するための図、
第4図は、第2図及びwS3図に示したパターン作成方
式の実施に使用して好適なブロック線図の一例を示す図
、第5図は、本発明の他の実施例を説明するための図で
ある。 l・・・マイク、2・・・バンドパスフィルター群、2
1〜23・・・レジスタ、24・・・比較部、25・・
・判定部、28・・・メモリ、29・・・カウンタ。 特許出願人 株式会社リコー 第 1 図 第2図 第3図 第4図 第5図 手続補正書C′jf幻 昭和59年5月8日 特許庁長官 若 杉 和 夫 殿 住所 東京都大田区中馬込1丁目3番6号7、補正の内
容 (1)、明細書第5頁第19行目に記載の「第3図の」
を「第2図の右端に示す」に補正する。 (2)、同第6頁第6行目及び第8頁第9行目に記載の
「第4図」を「第3図」に補正する。 (3)、同第7頁第4行目及び第8頁第11行目に記載
の「第5図」を「第4図」に補正する。 (4)、同第7頁第5行目、第8頁第7行目、同第9行
目に記載の「第2図及び第3図」をr第2図」に補正す
る。 (5)、第2図乃至第5図を別紙の通り補正をして第2
図乃至第4図とする。 Mh 2 伽 1&3 属 第 4 図
、めのブロック線図、第2図及び第3図は、、本発明に
よるパターン作成方式の一実施例を説明するための図、
第4図は、第2図及びwS3図に示したパターン作成方
式の実施に使用して好適なブロック線図の一例を示す図
、第5図は、本発明の他の実施例を説明するための図で
ある。 l・・・マイク、2・・・バンドパスフィルター群、2
1〜23・・・レジスタ、24・・・比較部、25・・
・判定部、28・・・メモリ、29・・・カウンタ。 特許出願人 株式会社リコー 第 1 図 第2図 第3図 第4図 第5図 手続補正書C′jf幻 昭和59年5月8日 特許庁長官 若 杉 和 夫 殿 住所 東京都大田区中馬込1丁目3番6号7、補正の内
容 (1)、明細書第5頁第19行目に記載の「第3図の」
を「第2図の右端に示す」に補正する。 (2)、同第6頁第6行目及び第8頁第9行目に記載の
「第4図」を「第3図」に補正する。 (3)、同第7頁第4行目及び第8頁第11行目に記載
の「第5図」を「第4図」に補正する。 (4)、同第7頁第5行目、第8頁第7行目、同第9行
目に記載の「第2図及び第3図」をr第2図」に補正す
る。 (5)、第2図乃至第5図を別紙の通り補正をして第2
図乃至第4図とする。 Mh 2 伽 1&3 属 第 4 図
Claims (2)
- (1)、 2次元平面で表わされるパターンの一列分の
パターンと隣接するパターンの対応する要素間の差をめ
これを一列分加算し、その値が一定値よりも小なる時、
特定のレジスタの値を変化させて一列分のデータを消去
して作るパターン作成方式。 - (2)、2次元平面で表わされるパターンの一列分のパ
ターンとこれに隣接するパターンの対応する要素間の差
をめこれを一列分加算し、その値が一定値よりも小なる
時、パターンの一部に明示し、一方のパターンを略し、
再度隣接するパターンの差をとってこれを全パターンに
対してくり返して作るパターン作成方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59002399A JPS60146300A (ja) | 1984-01-10 | 1984-01-10 | パタ−ン作成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59002399A JPS60146300A (ja) | 1984-01-10 | 1984-01-10 | パタ−ン作成方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60146300A true JPS60146300A (ja) | 1985-08-01 |
Family
ID=11528160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59002399A Pending JPS60146300A (ja) | 1984-01-10 | 1984-01-10 | パタ−ン作成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60146300A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008102482A (ja) * | 2006-10-20 | 2008-05-01 | Toshiba Tec Corp | パターンマッチング装置及び方法 |
-
1984
- 1984-01-10 JP JP59002399A patent/JPS60146300A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008102482A (ja) * | 2006-10-20 | 2008-05-01 | Toshiba Tec Corp | パターンマッチング装置及び方法 |
JP2011022621A (ja) * | 2006-10-20 | 2011-02-03 | Toshiba Tec Corp | パターンマッチング装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS60158498A (ja) | パターン照合装置 | |
JPS60146300A (ja) | パタ−ン作成方式 | |
CN108198560A (zh) | 基于声纹识别的录音优化方法及其录音优化系统 | |
JPS60150096A (ja) | パタ−ン作成方法 | |
JPS63269200A (ja) | 音声認識装置 | |
JPS61138296A (ja) | 音声認識装置 | |
JPS59162599A (ja) | 不特定話者音声認識方式 | |
JPS6287998A (ja) | 音声認識装置 | |
JPS6287994A (ja) | 音声認識辞書更新方式 | |
JPS5968793A (ja) | 音声合成装置 | |
JPS5882300A (ja) | 音声認識方式 | |
JPS60198598A (ja) | 音声認識方式 | |
JP3002200B2 (ja) | 音声認識 | |
JPS6078489A (ja) | 辞書更新方式 | |
JPS58167950U (ja) | 話者照合装置 | |
JPS58116595A (ja) | 単語音声認識装置 | |
JPS6078490A (ja) | 辞書更新方式 | |
JPS6078491A (ja) | 辞書更新方式 | |
JPS58195895A (ja) | 単語音声認識装置 | |
JPH0219899A (ja) | 音声蓄積再生装置 | |
JPS6078496A (ja) | 辞書更新方式 | |
JPS60118899A (ja) | 音声分析合成方法 | |
JPS6148899A (ja) | 音声認識装置 | |
Dean | BEYOND A THEATRE OF CRUELTY: THE HORSEMEN & OWEN SOUND | |
JPH01156798A (ja) | パターン類似度演算方式 |