JPS58123598A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS58123598A JPS58123598A JP57007064A JP706482A JPS58123598A JP S58123598 A JPS58123598 A JP S58123598A JP 57007064 A JP57007064 A JP 57007064A JP 706482 A JP706482 A JP 706482A JP S58123598 A JPS58123598 A JP S58123598A
- Authority
- JP
- Japan
- Prior art keywords
- result
- input
- pattern
- standard pattern
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は標準音声パターンとパターン照合を行なった結
果の判定を行なう特定話者のだめの音声認識装置に関す
るものであり、その目的とするところは、使用者による
標準パターンの再登録を不要にし、同一話者での発話パ
ターンの長時間変動による認循率の低下を防ぎ、同時に
短時間変動による認識率の変動を安定化することができ
る音声認識装置を提供することにある。
果の判定を行なう特定話者のだめの音声認識装置に関す
るものであり、その目的とするところは、使用者による
標準パターンの再登録を不要にし、同一話者での発話パ
ターンの長時間変動による認循率の低下を防ぎ、同時に
短時間変動による認識率の変動を安定化することができ
る音声認識装置を提供することにある。
一般に、音声の!特徴を一定時間毎に抽出し、この入力
特徴ベクトルの時系列パターンと、既に記憶されている
標準パターンとを比較して認識を行う音声認識装置にお
いては音声パターンが発話の毎に変動し、このため認識
率を完全に100%にすることは困難とされていること
iJ周知の11実で37 ある。この変動の太きさは話者によっても、又、同一話
者でも日ごとに変化する。す々わち、第1図に示すよう
に短時間の範囲(1日〜1週間程度)で見ると、その認
識率はランダムに」−下し、長時間(1〜2ケ月以」=
)の範囲で見ると、全体的に単調に下降する曲線を描く
のが常である。そのだめ、従来の音声認識装置では、前
者の短時間変動に対しては数回以上の回数の発話を使用
者に行なわせ、そilらのパターンを全て標準パターン
として記憶するか又はそれらの平均パターンを1つの標
準パターンとして記憶することによシ対処していた。又
、長時間変動に対しては標準パターンの再登録を行うか
或いはそのわずられしさを除くために新入カバターンと
置換することが行なわれてきた。しかし、上記の様な短
時間変動の対策では長時間変動に対処できず、標準パタ
ーンの再登録以外に方法はなく、又、上記の様な長時間
変動の対策では標準パターンを新入カバターンと全く置
換してしまうため、短時間変動には十分対処でき、
亭 ず、さらに、認識結果を標準ハターン置換してしまう危
険があった。
特徴ベクトルの時系列パターンと、既に記憶されている
標準パターンとを比較して認識を行う音声認識装置にお
いては音声パターンが発話の毎に変動し、このため認識
率を完全に100%にすることは困難とされていること
iJ周知の11実で37 ある。この変動の太きさは話者によっても、又、同一話
者でも日ごとに変化する。す々わち、第1図に示すよう
に短時間の範囲(1日〜1週間程度)で見ると、その認
識率はランダムに」−下し、長時間(1〜2ケ月以」=
)の範囲で見ると、全体的に単調に下降する曲線を描く
のが常である。そのだめ、従来の音声認識装置では、前
者の短時間変動に対しては数回以上の回数の発話を使用
者に行なわせ、そilらのパターンを全て標準パターン
として記憶するか又はそれらの平均パターンを1つの標
準パターンとして記憶することによシ対処していた。又
、長時間変動に対しては標準パターンの再登録を行うか
或いはそのわずられしさを除くために新入カバターンと
置換することが行なわれてきた。しかし、上記の様な短
時間変動の対策では長時間変動に対処できず、標準パタ
ーンの再登録以外に方法はなく、又、上記の様な長時間
変動の対策では標準パターンを新入カバターンと全く置
換してしまうため、短時間変動には十分対処でき、
亭 ず、さらに、認識結果を標準ハターン置換してしまう危
険があった。
本発明はかカーる従来の欠点にかんがみてなされたもの
で、認識結果又は認識結果に対する話者の判定によって
標準パターンと入カバターンを加重平均し、常に近い過
去の影響を標準パターン残すことにより、短時間変動と
長時間変動の両方の悪影響に対処することができるよう
に構成したものである。
で、認識結果又は認識結果に対する話者の判定によって
標準パターンと入カバターンを加重平均し、常に近い過
去の影響を標準パターン残すことにより、短時間変動と
長時間変動の両方の悪影響に対処することができるよう
に構成したものである。
以下、本発明の音声認識装置について実施例の図面と共
に説明する。第2図は本発明の一実施例を示すブロック
図である。第2図で、1はマイクロホン、2は増幅器、
31〜36はスペクトル分析用(特徴抽出用)のバンド
パスフィルタ群、41〜46は両波整流器群、51〜5
6は平滑回路群、6はマルチプレクサ、7HA/Dコン
バータ、8゜9はランダムアクセスメモリ(RAM)、
10は距離割算器で、2つの入力、A −(al +
a2・・・… 、a )B=(bl、b2.……、b
n)に対して5、、。
に説明する。第2図は本発明の一実施例を示すブロック
図である。第2図で、1はマイクロホン、2は増幅器、
31〜36はスペクトル分析用(特徴抽出用)のバンド
パスフィルタ群、41〜46は両波整流器群、51〜5
6は平滑回路群、6はマルチプレクサ、7HA/Dコン
バータ、8゜9はランダムアクセスメモリ(RAM)、
10は距離割算器で、2つの入力、A −(al +
a2・・・… 、a )B=(bl、b2.……、b
n)に対して5、、。
る。11は最少距離判定器で、順次入力してきた距離値
の最少値を判定し、その登録順番の番数を出力する。1
2は出力表示器、13は重み係数発生器、14は乗算器
、15は加算器、16はランダムアクセスメモリ(RA
M)、17は入力用キーボード、19はAND回路、1
8は定数(定文字)発生器、2oは遅延器である。又、
Sl−は手動式バイ1.チで、a、bはそれぞれ接点を
示す。
の最少値を判定し、その登録順番の番数を出力する。1
2は出力表示器、13は重み係数発生器、14は乗算器
、15は加算器、16はランダムアクセスメモリ(RA
M)、17は入力用キーボード、19はAND回路、1
8は定数(定文字)発生器、2oは遅延器である。又、
Sl−は手動式バイ1.チで、a、bはそれぞれ接点を
示す。
82′はリレースイッチである。
このような構成の音声認識装置の動作は先ずスイッチ8
1′を接点aに倒すことによって開始される。スイッチ
S4・が接点aに倒されると音声登録モードとなる。こ
の後に標準パターン登録のための所定の発話を行々う。
1′を接点aに倒すことによって開始される。スイッチ
S4・が接点aに倒されると音声登録モードとなる。こ
の後に標準パターン登録のための所定の発話を行々う。
この発話による音声はマイクロホン1を通して電気信号
に変換され、増幅器2で増幅されてバンドパスフィルタ
31〜36の群に分配され、音声の特徴が帯域パワース
ペクトルの形で抽出される。それぞれのバンドパスフィ
ルタ31〜36の出力は両波整流器41〜46で整流さ
れ、平滑回路61〜66で平滑され、直流に変換される
。従って、それらの出力は音声の振幅(包絡)とともに
ゆるやかに変化する直流となる。
に変換され、増幅器2で増幅されてバンドパスフィルタ
31〜36の群に分配され、音声の特徴が帯域パワース
ペクトルの形で抽出される。それぞれのバンドパスフィ
ルタ31〜36の出力は両波整流器41〜46で整流さ
れ、平滑回路61〜66で平滑され、直流に変換される
。従って、それらの出力は音声の振幅(包絡)とともに
ゆるやかに変化する直流となる。
これらの6個のパラレル出力はA/Dコンバータ節約の
ため、マルチプレクサ6によってシリアル出力に変換さ
れ、A/Dコンバータ7でディジタル計に変便される。
ため、マルチプレクサ6によってシリアル出力に変換さ
れ、A/Dコンバータ7でディジタル計に変便される。
ここでマルチプレクサによるシリアル変換は、平滑の時
定数より十分速い速度で20 m Secごとに行なわ
れる。A/Dコンバータ7の出力はさらにスイッチs1
の接点aを通してRAM8に入力され標準パターンとし
て記憶される。必要に応じてこれらの操作をくり返すこ
とにより、数個〜士数個の単語が登録できる。登録した
単語はその順番に番号が割り当てられる。これらの登録
は使用者によっても可能であるが、メーカーによる平均
的話者の登録により、使用者の登録が不要とすることが
できる。ただし当初の認識率は多少落ち、又、不揮発性
RAMを使用する必要がある。次にスイッチS1 は使
用者の手によって接点すに倒され、認識モードとなる。
定数より十分速い速度で20 m Secごとに行なわ
れる。A/Dコンバータ7の出力はさらにスイッチs1
の接点aを通してRAM8に入力され標準パターンとし
て記憶される。必要に応じてこれらの操作をくり返すこ
とにより、数個〜士数個の単語が登録できる。登録した
単語はその順番に番号が割り当てられる。これらの登録
は使用者によっても可能であるが、メーカーによる平均
的話者の登録により、使用者の登録が不要とすることが
できる。ただし当初の認識率は多少落ち、又、不揮発性
RAMを使用する必要がある。次にスイッチS1 は使
用者の手によって接点すに倒され、認識モードとなる。
認識のだめに登録した単語のいずれがか発話されると、
7ベー〕゛ 登録の場合と同様に、マイクロホン1、増幅器2、バン
ドパスフィルター31〜36、両波整流器41〜46、
平滑回路61〜66、マルチプレクサ6、A/Dコンバ
ータ7を順次通ることにより、音声の特徴パラメータは
シリアルのディジタル値となね、スイッチS1 に達す
る。特徴パラメータはさらにスイッチS1 の接点すを
通じてRAM9に記憶される。RAM9の内容はさらに
距離計算器1゜に送られ、同時に入力したRAM8の内
容すなわち標準パターンとの距離を計算する。標準パタ
ーンはRAM8の中に登録の順番に入っており、RAM
9からの入カバターンとの距離はその順番に従うて計算
され、順次最少距離判定器11に送られ、最少距離を判
定する。その判定結果は登録番数として出力表示器12
に出力し、その番数及び正誤入力要求を使用者に表示す
る。又、これと同時にRAM8の出力は乗算器14に送
られ、重み係数発生器13で発止した重み係数を乗ぜら
れる。
7ベー〕゛ 登録の場合と同様に、マイクロホン1、増幅器2、バン
ドパスフィルター31〜36、両波整流器41〜46、
平滑回路61〜66、マルチプレクサ6、A/Dコンバ
ータ7を順次通ることにより、音声の特徴パラメータは
シリアルのディジタル値となね、スイッチS1 に達す
る。特徴パラメータはさらにスイッチS1 の接点すを
通じてRAM9に記憶される。RAM9の内容はさらに
距離計算器1゜に送られ、同時に入力したRAM8の内
容すなわち標準パターンとの距離を計算する。標準パタ
ーンはRAM8の中に登録の順番に入っており、RAM
9からの入カバターンとの距離はその順番に従うて計算
され、順次最少距離判定器11に送られ、最少距離を判
定する。その判定結果は登録番数として出力表示器12
に出力し、その番数及び正誤入力要求を使用者に表示す
る。又、これと同時にRAM8の出力は乗算器14に送
られ、重み係数発生器13で発止した重み係数を乗ぜら
れる。
重み係数WはO<W<1なる実数で通常は0.5程度に
設定する。この乗算器14の出力はRAM9の出力とと
もに加算器15に入力して加重平均し、その加重平均結
果をRAM16に記憶する。つまり、RAM’8.9の
出力をそれぞれA−(al。
設定する。この乗算器14の出力はRAM9の出力とと
もに加算器15に入力して加重平均し、その加重平均結
果をRAM16に記憶する。つまり、RAM’8.9の
出力をそれぞれA−(al。
a2+””” 、an)B= (bl 、b2.+1
1111111111 、bn)と1.5
1.5 表示器12の表示の結果において、使用者が正しくない
認識結果と判断した場合はrNOJを5秒以内にキーボ
ード17を通じて入力する。キーボード17は出力表示
器12の表示出力がら5秒以内に応答(キー人力)が無
い場合、自動的にrYESJを送出するものとする。こ
の動作は最少距離判定器11の出力の分配が遅延器20
を通り5秒後にキーボード17に入力することにより行
なわれる。
1111111111 、bn)と1.5
1.5 表示器12の表示の結果において、使用者が正しくない
認識結果と判断した場合はrNOJを5秒以内にキーボ
ード17を通じて入力する。キーボード17は出力表示
器12の表示出力がら5秒以内に応答(キー人力)が無
い場合、自動的にrYESJを送出するものとする。こ
の動作は最少距離判定器11の出力の分配が遅延器20
を通り5秒後にキーボード17に入力することにより行
なわれる。
キーボード17の出力はAND回路19に入力し、定数
発生器18の内容rYEsJと比較される。すなわち、
rYEsJならAND回路19は1を出力し、リレース
イッチS2をONにする。rYESJ9ページ 以外なら0を出力し、リレースイ・フチS2は駆動され
ない。rYESJの応答によってリレースイッチS2が
ONになった場合は、前述のRAM16に記憶された加
重平均値がRAM8にロードされ、新しい標準パターン
として登録される。この様にして標準パターンは、前回
の発話の影響を多少残しながら遂次更新されて行き、短
期間の発話変動と、長期間の発話変動の影響を同時に除
去し、常に安定した認識を行うことが可能となる。
発生器18の内容rYEsJと比較される。すなわち、
rYEsJならAND回路19は1を出力し、リレース
イッチS2をONにする。rYESJ9ページ 以外なら0を出力し、リレースイ・フチS2は駆動され
ない。rYESJの応答によってリレースイッチS2が
ONになった場合は、前述のRAM16に記憶された加
重平均値がRAM8にロードされ、新しい標準パターン
として登録される。この様にして標準パターンは、前回
の発話の影響を多少残しながら遂次更新されて行き、短
期間の発話変動と、長期間の発話変動の影響を同時に除
去し、常に安定した認識を行うことが可能となる。
なお、上記実施例では、特徴抽出部として6チヤンネル
フイルタノぐンクを用いたが、6チヤンネル以上とする
とさらに認識率は向」ニし、又、平滑部の後にサンプル
ホールドを用いると、スペクトルの同時性が厳密となり
マルチプレクサ6の速度も遅くすることができる。そし
て、これらの場合でも本発明の効果には何ら影響しない
。又、フィルタバンク以外の特徴パラメータであるLP
G 。
フイルタノぐンクを用いたが、6チヤンネル以上とする
とさらに認識率は向」ニし、又、平滑部の後にサンプル
ホールドを用いると、スペクトルの同時性が厳密となり
マルチプレクサ6の速度も遅くすることができる。そし
て、これらの場合でも本発明の効果には何ら影響しない
。又、フィルタバンク以外の特徴パラメータであるLP
G 。
フーリエ変換、ケプストラム等を用いても本発明の効果
に影響を与えないことは言うまでもない。
に影響を与えないことは言うまでもない。
1゜
なる、いわゆるユークリッド距離を用いたが、他ノイず
れの距離を用いても良い。
れの距離を用いても良い。
以上、詳述したように本発明によれば、認識結果又は認
識結果に対する話者の判定により標準パターンと入カバ
ターンを加重平均し、この加重平均したパターンを新だ
々標準パターンとして記憶させるようにしたので、常に
近い過去の影響を標準パターンに残すことができるため
、使用者による標準パターンの登録を不要にすることも
可能と率が得られる。そして、話者の長時間(年単位)
での発話変動の影響を除くことができる利点を有するも
のである。
識結果に対する話者の判定により標準パターンと入カバ
ターンを加重平均し、この加重平均したパターンを新だ
々標準パターンとして記憶させるようにしたので、常に
近い過去の影響を標準パターンに残すことができるため
、使用者による標準パターンの登録を不要にすることも
可能と率が得られる。そして、話者の長時間(年単位)
での発話変動の影響を除くことができる利点を有するも
のである。
第1図は発話の短期間変動と長期間変動の説明のだめの
特性図、第2図は本発明の音声認識装置の一実施例を示
すブロック図である。 1・・1111@・マイクロホン、2・・・拳・・増幅
器、31〜36@・・・・−バントハスフィルタ、41
〜46・・・11/、−ン ・・・両波整流器、51〜66・・・・・・平滑回路、
6・・・・・・、マルチプレクー+j、7 拳・・・・
・A/Dコンバータ、8,9.16・・・・・・ランダ
ムアクセスメモリ(RAM)、10・・・・・・距餅1
泪算器、11・・・・・・最少距離判定器、12・・・
・・・出力表示器、13・・・・・・重み係数発生器、
14・・・・・・乗算器、15・・・・・・加算器、1
7・・・・・・キーボード、18・・・・・・定数発生
器、19・・・・・・A N D回路、2o・・・・・
・遅延器、Sl、S2・・・・・・スイッチ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 認識率
特性図、第2図は本発明の音声認識装置の一実施例を示
すブロック図である。 1・・1111@・マイクロホン、2・・・拳・・増幅
器、31〜36@・・・・−バントハスフィルタ、41
〜46・・・11/、−ン ・・・両波整流器、51〜66・・・・・・平滑回路、
6・・・・・・、マルチプレクー+j、7 拳・・・・
・A/Dコンバータ、8,9.16・・・・・・ランダ
ムアクセスメモリ(RAM)、10・・・・・・距餅1
泪算器、11・・・・・・最少距離判定器、12・・・
・・・出力表示器、13・・・・・・重み係数発生器、
14・・・・・・乗算器、15・・・・・・加算器、1
7・・・・・・キーボード、18・・・・・・定数発生
器、19・・・・・・A N D回路、2o・・・・・
・遅延器、Sl、S2・・・・・・スイッチ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 認識率
Claims (3)
- (1)音声を取り込む手段と、一定時間毎に音声の特徴
を抽出する手段と、この抽出された特徴の時系列パター
ンと標準パターンとを比較演算する手段と、この演算の
結果によって音声の判定を行う手段と、上記演算結果に
よって前記標準パターンと入力時系列パターンとの加重
平均を行う手段と、この加重平均の結果を前記標準パタ
ーンと置換する手段を具備してなる音声認識装置。 - (2)認識結果を出力する手段と、該出力された結果に
対して使用者が正誤を判定し、この判定結果を入力する
手段を具備し、この入力結果に応じて加重平均を行うこ
とを特徴とする特許請求の範囲第1項記載の音声認識装
置。 - (3)使用者による正誤の判定の結果の誤の場合のみ入
力を行う手段と、使用者に入力を要求する手段と、入力
を要求する手段の出力後の経過時間を測定する手段ど、
一定時間経過する寸での間に入力を行う手段からの出力
が無い場合のみ正の判定第1項記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57007064A JPS58123598A (ja) | 1982-01-19 | 1982-01-19 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57007064A JPS58123598A (ja) | 1982-01-19 | 1982-01-19 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58123598A true JPS58123598A (ja) | 1983-07-22 |
Family
ID=11655631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57007064A Pending JPS58123598A (ja) | 1982-01-19 | 1982-01-19 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58123598A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6053998A (ja) * | 1983-09-05 | 1985-03-28 | 松下電器産業株式会社 | 音声認識装置 |
JPS6250799A (ja) * | 1985-08-30 | 1987-03-05 | 株式会社日立製作所 | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5377402A (en) * | 1976-12-21 | 1978-07-08 | Fujitsu Ltd | Voice input device |
JPS5520539A (en) * | 1978-07-28 | 1980-02-14 | Casio Comput Co Ltd | Automatic arithmetic process system |
JPS564832A (en) * | 1979-06-22 | 1981-01-19 | Sharp Corp | Input system for word processor |
JPS5681899A (en) * | 1979-12-07 | 1981-07-04 | Sanyo Electric Co | Voice indentifier |
-
1982
- 1982-01-19 JP JP57007064A patent/JPS58123598A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5377402A (en) * | 1976-12-21 | 1978-07-08 | Fujitsu Ltd | Voice input device |
JPS5520539A (en) * | 1978-07-28 | 1980-02-14 | Casio Comput Co Ltd | Automatic arithmetic process system |
JPS564832A (en) * | 1979-06-22 | 1981-01-19 | Sharp Corp | Input system for word processor |
JPS5681899A (en) * | 1979-12-07 | 1981-07-04 | Sanyo Electric Co | Voice indentifier |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6053998A (ja) * | 1983-09-05 | 1985-03-28 | 松下電器産業株式会社 | 音声認識装置 |
JPH042197B2 (ja) * | 1983-09-05 | 1992-01-16 | ||
JPS6250799A (ja) * | 1985-08-30 | 1987-03-05 | 株式会社日立製作所 | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Naik | Speaker verification: A tutorial | |
JPH1083194A (ja) | 話し手照合システムのための2段階群選択方法 | |
JPS6217240B2 (ja) | ||
CN110570870A (zh) | 一种文本无关的声纹识别方法、装置及设备 | |
EP0424071A2 (en) | Speaker recognition | |
Kaneko et al. | A hierarchical decision approach to large-vocabulary discrete utterance recognition | |
Karthikeyan et al. | Hybrid machine learning classification scheme for speaker identification | |
Wildermoth et al. | Use of voicing and pitch information for speaker recognition | |
US6823305B2 (en) | Apparatus and method for speaker normalization based on biometrics | |
JPS58123598A (ja) | 音声認識装置 | |
JPH0225517B2 (ja) | ||
CN110853674A (zh) | 文本核对方法、设备以及计算机可读存储介质 | |
WO2014155652A1 (ja) | 話者検索システム、プログラム | |
WO2006027844A1 (ja) | 話者照合装置 | |
Saha et al. | Modified mel-frequency cepstral coefficient | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
JP4236502B2 (ja) | 音声認識装置 | |
CN112151070B (zh) | 一种语音检测的方法、装置及电子设备 | |
CN113763930B (zh) | 语音分析方法、装置、电子设备以及计算机可读存储介质 | |
JP2658104B2 (ja) | 音声認識装置 | |
JP3020999B2 (ja) | パターン登録方法 | |
Mut et al. | Improved Weighted Matching for Speaker Recognition. | |
JPH0221598B2 (ja) | ||
JPH05265482A (ja) | 情報処理装置 | |
CN118713881A (zh) | 身份认证和声学环境检测方法、系统、电子设备及介质 |