JPS61219100A - 特定話者用音声入力装置 - Google Patents
特定話者用音声入力装置Info
- Publication number
- JPS61219100A JPS61219100A JP60060372A JP6037285A JPS61219100A JP S61219100 A JPS61219100 A JP S61219100A JP 60060372 A JP60060372 A JP 60060372A JP 6037285 A JP6037285 A JP 6037285A JP S61219100 A JPS61219100 A JP S61219100A
- Authority
- JP
- Japan
- Prior art keywords
- section
- input
- pattern
- standard pattern
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、あらかじめ音声パターンを登録した特定の話
者の音声について、音声認識を行う装置に利用する。特
に数字の高速入力回路に関する。
者の音声について、音声認識を行う装置に利用する。特
に数字の高速入力回路に関する。
本発明は、あらかじめ音声の標準パターンを登録してお
き、入力す4音声とこの標準パターンとの相違が最小の
ものをその入力音声のパターンとして認識する装置にお
いて、 演算パスが繰返し同一パスにならないように、判定回路
の前段で動的計画パスに制限を付加することにより、 簡単な構成で、判定時間を長くすることなく、音声認識
率を向上するものである。
き、入力す4音声とこの標準パターンとの相違が最小の
ものをその入力音声のパターンとして認識する装置にお
いて、 演算パスが繰返し同一パスにならないように、判定回路
の前段で動的計画パスに制限を付加することにより、 簡単な構成で、判定時間を長くすることなく、音声認識
率を向上するものである。
従来、特定話者用音声入力装置において、数字を高速に
入力することは、単語入力の場合に比べ調音結合の影響
を強く受けるので、通常の離散単語入力の場合に用いら
れる漸化式としてg (i、j)=a (iS i)+ ・−−m−−−・(1) となる。
入力することは、単語入力の場合に比べ調音結合の影響
を強く受けるので、通常の離散単語入力の場合に用いら
れる漸化式としてg (i、j)=a (iS i)+ ・−−m−−−・(1) となる。
(1)式では数字の桁落ちや桁増えが生じて認識率が著
しく低下してしまう、この現象は今、“2”12”3”
という3桁の数字が高速入力された場合を考えると、第
3図に示すように動的計画パスとして第2図の(イ)の
パスが入力パターンの“2”2”の区間選ばれ続けられ
ると、“2”“2“は1桁の“2′″と判定されてしま
い、桁落ちすることになる。かかる認識率低下に対しく
i) 1個の数字入力に対し標準パターンを数個持
たせること、 (ii ) 動的計画(D P)マツチングにおいて
、いわゆる傾斜制限につきDPマツチングを採用するこ
と 等が用いられている。
しく低下してしまう、この現象は今、“2”12”3”
という3桁の数字が高速入力された場合を考えると、第
3図に示すように動的計画パスとして第2図の(イ)の
パスが入力パターンの“2”2”の区間選ばれ続けられ
ると、“2”“2“は1桁の“2′″と判定されてしま
い、桁落ちすることになる。かかる認識率低下に対しく
i) 1個の数字入力に対し標準パターンを数個持
たせること、 (ii ) 動的計画(D P)マツチングにおいて
、いわゆる傾斜制限につきDPマツチングを採用するこ
と 等が用いられている。
しかしながらかかる従来技術においては、例えば上記(
i)では標準パターンメモリが増加する上にマツチング
対象が増加するために認識処理時間も増大してしまう、
また( ii )では次式(2)の演算を行うため漸化
式g (i、j)の演算時間が増えて認識時間が増大す
るという欠点があった。
i)では標準パターンメモリが増加する上にマツチング
対象が増加するために認識処理時間も増大してしまう、
また( ii )では次式(2)の演算を行うため漸化
式g (i、j)の演算時間が増えて認識時間が増大す
るという欠点があった。
g (i、J)=d (at 、bJ) +・−
−−・(2) ここに入力パターン、標準パターンの特徴ベクトルの時
系列を各々 A ” a 1 s a t ’−−−−−−−’a
i ’−’−−−−−’a IB ” b l % b
z −−−−−−−bj−−−−−−−・b。
−−・(2) ここに入力パターン、標準パターンの特徴ベクトルの時
系列を各々 A ” a 1 s a t ’−−−−−−−’a
i ’−’−−−−−’a IB ” b l % b
z −−−−−−−bj−−−−−−−・b。
としており、d(at、bj)はaiとbJのベクトル
距離を示す。
距離を示す。
本発明ではまず標準パターンとしては1数字、1種類と
するが、数字の連続入力に対しては調音結合の影響を加
味するため半単語対の標準パターン等があるが、標準パ
ターンメモリおよび処理時間の点で小型化を指向する装
置には不向きである。
するが、数字の連続入力に対しては調音結合の影響を加
味するため半単語対の標準パターン等があるが、標準パ
ターンメモリおよび処理時間の点で小型化を指向する装
置には不向きである。
また漸化式として前記(1)式を採用すれば、高速数字
入力に対する認識率の向上は期待できるが、認識時間の
関係で専用の漸化式演算回路が必要となり、装置が大型
化してしまう欠点がある。
入力に対する認識率の向上は期待できるが、認識時間の
関係で専用の漸化式演算回路が必要となり、装置が大型
化してしまう欠点がある。
本発明は上記従来技術の欠点を除去するものであり、ハ
ード規模や認識処理時間の増加を伴うことなしに高速数
字入力の認識率を高めた装置を提供することを目的とす
る。
ード規模や認識処理時間の増加を伴うことなしに高速数
字入力の認識率を高めた装置を提供することを目的とす
る。
本発明はマイクロホンより入力される音声を分析する音
声分析部と、標準パターンを記憶する標準パターンメモ
リ部と、音声分析部からの入力パターンと標準パターン
メモリ部からの標準パターンとのベクトル距離(d (
i、、j))を求めるd(i、j)演算部と、漸化式(
g (i、j))を求めるg (i、j)演算部と、g
(i、j)演算部出力を保持するg (i、j)保持
部と、g(i、j)保持部のうちの最小値を判定する判
定回路と、入力パターンと標準パターンとの正規化時間
距離D (ISJ)を求めるD(I、J)演算部と、マ
ツチング結果のうち最も入力パターンに顕像した標準パ
ターンを選別するソーティング部と、装置全体を制御す
る制御部とを有する特定話者用音声入力装置において、
前記g (i、j)保持部と前記判定回路との間に、動
的計画バスに制限を付加するペナルティ演算部を有する
ことを特徴とする。
声分析部と、標準パターンを記憶する標準パターンメモ
リ部と、音声分析部からの入力パターンと標準パターン
メモリ部からの標準パターンとのベクトル距離(d (
i、、j))を求めるd(i、j)演算部と、漸化式(
g (i、j))を求めるg (i、j)演算部と、g
(i、j)演算部出力を保持するg (i、j)保持
部と、g(i、j)保持部のうちの最小値を判定する判
定回路と、入力パターンと標準パターンとの正規化時間
距離D (ISJ)を求めるD(I、J)演算部と、マ
ツチング結果のうち最も入力パターンに顕像した標準パ
ターンを選別するソーティング部と、装置全体を制御す
る制御部とを有する特定話者用音声入力装置において、
前記g (i、j)保持部と前記判定回路との間に、動
的計画バスに制限を付加するペナルティ演算部を有する
ことを特徴とする。
ここで本発明では漸化式として
g (tS j)−d (il j)
・−(3)
を採用することが望ましい。
ここにα、βは定数であり
(3)式は入力パターンの全フレームに対して定数α、
βの効果を期待するものであることを特徴とする。
βの効果を期待するものであることを特徴とする。
入力音声は音声分析部で周波数分析され、特徴ベクトル
の時系列(A)が得られ、標準パターン(B)のベクト
ル距離が求められる。ペナルティ演算部、最小値判定回
路部は漸化式を計算する。
の時系列(A)が得られ、標準パターン(B)のベクト
ル距離が求められる。ペナルティ演算部、最小値判定回
路部は漸化式を計算する。
漸化式におけるα、β定数を求め、ペナルティ演算部は
動的計画パスに応じてペナルティを付加して何フレーム
にもわたって同一バスが選ばれることによる「桁落ち」
や「桁増え」を防止することにより、特に数字の高速入
力化を可能にする。
動的計画パスに応じてペナルティを付加して何フレーム
にもわたって同一バスが選ばれることによる「桁落ち」
や「桁増え」を防止することにより、特に数字の高速入
力化を可能にする。
次に本発明の実施例装置を添付図面第1図を参照して説
明する。
明する。
図面符号10はマイクロホン、20は音声分析部、30
は装置全体を制御する制°御部、40はd (i、j)
演算部、50は標準パターンメモリ部、60は漸化式g
(i、j)演算部、70はg (i、j)保持部、8
0は動的計画パスに応じてペナルティを付加するペナル
ティ演算部、90は(3)式第二項によってwin()
値を求める最小値判定回路部、100は入力パターンと
標準パターンの「正規化」時間距離を求めるD(I、J
)演算部、200はソーティング部を示す。装置各部分
間の接続は、10−20−40−60−100−200
.20−30−100.30−50−40.30−70
−80−90−60・70 [13g、)よう、4,7
い、。
は装置全体を制御する制°御部、40はd (i、j)
演算部、50は標準パターンメモリ部、60は漸化式g
(i、j)演算部、70はg (i、j)保持部、8
0は動的計画パスに応じてペナルティを付加するペナル
ティ演算部、90は(3)式第二項によってwin()
値を求める最小値判定回路部、100は入力パターンと
標準パターンの「正規化」時間距離を求めるD(I、J
)演算部、200はソーティング部を示す。装置各部分
間の接続は、10−20−40−60−100−200
.20−30−100.30−50−40.30−70
−80−90−60・70 [13g、)よう、4,7
い、。
マイクロホン10からされた音声は音声分析部20で周
波数分析され入力パターンとしての特徴ベクトルの時系
列A= (a長) (i=1〜l)が得られる。d
(i、j)演算部40では入力パターンAと標準パター
ンBの各時系列におけるベクトル距離が求められる。
波数分析され入力パターンとしての特徴ベクトルの時系
列A= (a長) (i=1〜l)が得られる。d
(i、j)演算部40では入力パターンAと標準パター
ンBの各時系列におけるベクトル距離が求められる。
g (t、j)演算部60、g (t、j)保持部70
、ペナルティ演算部80および最小値判定回路部90は
(3)式の漸化式を計算するe g (is j)演算
部60は、演算部40と演算部60の出力を受けて漸化
的にg (i、j)を演算し、この演算結果は次の時系
列におけるg(i+1、j+1)を求めるために保持部
70で保持される。演算部80は(3)式において定数
α、βなる「ペナルティ」を付加し何フレームにもわた
って同一のバスが選ばれ続けることを防止し、先に説明
した数字入力に対する「桁落ち」や「桁増え」現象を取
り除くものである。
、ペナルティ演算部80および最小値判定回路部90は
(3)式の漸化式を計算するe g (is j)演算
部60は、演算部40と演算部60の出力を受けて漸化
的にg (i、j)を演算し、この演算結果は次の時系
列におけるg(i+1、j+1)を求めるために保持部
70で保持される。演算部80は(3)式において定数
α、βなる「ペナルティ」を付加し何フレームにもわた
って同一のバスが選ばれ続けることを防止し、先に説明
した数字入力に対する「桁落ち」や「桁増え」現象を取
り除くものである。
判定回路部90は(3)式における
を判定する。
D (I、 J)演算部100は入力パターンAと標準
パターンとの正規化時間距離 を求め、フレームの長さの影響を取り除く。
パターンとの正規化時間距離 を求め、フレームの長さの影響を取り除く。
以上述べたように本発明は通常の離散単語入力装置に新
たにペナルティ演算部を付加するのみで、数字の高速入
力化を可能にし認識率を向上する特定話者用音声入力を
提供できる効果がある。本発明は特に数字識別において
認識率が向上する効果がある。
たにペナルティ演算部を付加するのみで、数字の高速入
力化を可能にし認識率を向上する特定話者用音声入力を
提供できる効果がある。本発明は特に数字識別において
認識率が向上する効果がある。
第1図は本発明の実施例装置のブロック構成図。
第2図は動的計画パスの一例を示す図。
第3図は数字の高速入力の場合に生ずる桁落ち現象の例
を示す図。 ゛ 10・・・マイクロホン、20・・・音声分析部、30
・・・制御部、40・・・d (i、j)演算部、50
・・・標準パターンメモリ部、60・・・g (i、j
)演算部、70・・・g(i、j)保持部、80・・・
ペナルティ演算部、90・・・判定回路部、100・・
・D (1,J)演算部、200・・・ソーティング部
。
を示す図。 ゛ 10・・・マイクロホン、20・・・音声分析部、30
・・・制御部、40・・・d (i、j)演算部、50
・・・標準パターンメモリ部、60・・・g (i、j
)演算部、70・・・g(i、j)保持部、80・・・
ペナルティ演算部、90・・・判定回路部、100・・
・D (1,J)演算部、200・・・ソーティング部
。
Claims (1)
- (1)マイクロホンより入力される音声を分析する音声
分析部と、 標準パターンを記憶する標準パターンメモリ部と、 上記音声分析部からの入力パターンと上記標準パターン
メモリ部からの標準パターンとのベクトル距離{d(i
、j)}を求めるd(i、j)演算部と、 漸化式{g(i、j)}を求めるg(i、j)演算部と
、 上記g(i、j)演算部出力を保持するg(i、j)保
持部と、 上記g(i、j)保持部のうちの最小値を判定する判定
回路と、 入力パターンと標準パターンとの正規化時間距離D(I
、J)を求めるD(I、J)演算部と、マッチング結果
のうち最も入力パターンに類似した標準パターンを選別
するソーティング部と、装置全体を制御する制御部と を備えた 特定話者用音声入力装置において、 前記g(i、j)保持部と前記判定回路との間に、動的
計画パスに制限を付加するペナルティ演算部を設けた ことを特徴とする特定話者用音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60060372A JPS61219100A (ja) | 1985-03-25 | 1985-03-25 | 特定話者用音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60060372A JPS61219100A (ja) | 1985-03-25 | 1985-03-25 | 特定話者用音声入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61219100A true JPS61219100A (ja) | 1986-09-29 |
Family
ID=13140235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60060372A Pending JPS61219100A (ja) | 1985-03-25 | 1985-03-25 | 特定話者用音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61219100A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63158600A (ja) * | 1986-12-22 | 1988-07-01 | 日本電気株式会社 | 単語検出装置 |
JPS63158599A (ja) * | 1986-12-22 | 1988-07-01 | 日本電気株式会社 | 単語検出方式 |
-
1985
- 1985-03-25 JP JP60060372A patent/JPS61219100A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63158600A (ja) * | 1986-12-22 | 1988-07-01 | 日本電気株式会社 | 単語検出装置 |
JPS63158599A (ja) * | 1986-12-22 | 1988-07-01 | 日本電気株式会社 | 単語検出方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0361959B2 (ja) | ||
JPS60211498A (ja) | 連続音声認識装置 | |
JPS61219100A (ja) | 特定話者用音声入力装置 | |
JPH0346839B2 (ja) | ||
Kitazume et al. | LSI implementation of a pattern matching algorithm for speech recognition | |
Lowy et al. | An architecture for a speech recognition system | |
JPS59172696A (ja) | 音声パタン類似度演算方式 | |
JPS60208800A (ja) | 単語音声認識装置 | |
JPS63188199A (ja) | パタンマッチング装置 | |
JPS59124387A (ja) | 連続単語音声認識方法 | |
JPS5898794A (ja) | パタンマツチング装置 | |
JPS61281298A (ja) | 音声認識装置 | |
JPS61235899A (ja) | 音声認識装置 | |
JPS58176698A (ja) | パターンマッチング装置 | |
JPS60164800A (ja) | 音声認識装置 | |
JPS6083093A (ja) | 単語音声認識装置 | |
JPS59211100A (ja) | 登録型音声認識方法 | |
JPS59200A (ja) | パタ−ンマツチング装置 | |
JPS58195893A (ja) | 音声認識装置における前処理方法 | |
JPS6154240B2 (ja) | ||
JPS63192098A (ja) | 音声認識における標準パタ−ン作成装置 | |
JPH0223876B2 (ja) | ||
JPS6010299A (ja) | 音声メツセ−ジ長予測装置 | |
JPS62161200A (ja) | 連続音声認識装置 | |
JPS63236094A (ja) | 音声認識方法 |