JPS61278899A - 話者照合用フイルタ - Google Patents
話者照合用フイルタInfo
- Publication number
- JPS61278899A JPS61278899A JP60121720A JP12172085A JPS61278899A JP S61278899 A JPS61278899 A JP S61278899A JP 60121720 A JP60121720 A JP 60121720A JP 12172085 A JP12172085 A JP 12172085A JP S61278899 A JPS61278899 A JP S61278899A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- channel
- speaker
- frequency
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は音声の個人性に関する特徴を抽出するに好適な
話者照合用フィルタに関する。
話者照合用フィルタに関する。
音声による個人照合処理の1つに、入力音声の個人性を
示す特徴を抽出してその話者が予め登録された特定個人
であるか否かを判定する処理がある。
示す特徴を抽出してその話者が予め登録された特定個人
であるか否かを判定する処理がある。
このような個人照合処理を行う場合、入力音声・から話
者の個人性を示す特徴を如何にして抽出す4かが大きな
課題となる。
者の個人性を示す特徴を如何にして抽出す4かが大きな
課題となる。
しかして従来の一般的な不特定話者に対する音声認識で
は、フィルタバンクの複数のチャンネルの各帯域幅を、
音声周波数帯域を等間隔または対数関数的に分割して設
定し、このフィルタバンクの出力として入力音声の特徴
(音韻特徴)を抽出している。
は、フィルタバンクの複数のチャンネルの各帯域幅を、
音声周波数帯域を等間隔または対数関数的に分割して設
定し、このフィルタバンクの出力として入力音声の特徴
(音韻特徴)を抽出している。
しかしこの特徴抽出は、音声の個人性に拘りなく、その
音韻を高精度に認識することを目的として行われる。こ
の為、上記フィルタバンクを介し゛て抽出された音声の
特徴情報には個人性を示す特徴が少ない。従ってこの特
徴情報を用いて話者の個人性を識別しようとしても、そ
の認識精度の向上を期待することができなかった。
音韻を高精度に認識することを目的として行われる。こ
の為、上記フィルタバンクを介し゛て抽出された音声の
特徴情報には個人性を示す特徴が少ない。従ってこの特
徴情報を用いて話者の個人性を識別しようとしても、そ
の認識精度の向上を期待することができなかった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声の個人性に関する特徴を効
果的に抽出して話者認識精度の向上を図ることのできる
話者照合用フィルタを提供することにある。
の目的とするところは、音声の個人性に関する特徴を効
果的に抽出して話者認識精度の向上を図ることのできる
話者照合用フィルタを提供することにある。
本発明は、話者が発声入力した音声の個人性に関する特
徴を抽出するフィルタバンクにおける複数チャンネルの
各帯域幅を、低域側チャンネルから高域側チャンネルに
かけて指数関数的に広げて設定してなることを特徴とす
るものである。
徴を抽出するフィルタバンクにおける複数チャンネルの
各帯域幅を、低域側チャンネルから高域側チャンネルに
かけて指数関数的に広げて設定してなることを特徴とす
るものである。
つまり音声の低域側に多くのチャンネルを割当ててその
音声情報を細かく抽出し、高域側では大雑把にその音声
特徴を抽出し、これを話者照合用の特徴情報として求め
るようにしたものである。
音声情報を細かく抽出し、高域側では大雑把にその音声
特徴を抽出し、これを話者照合用の特徴情報として求め
るようにしたものである。
かくして本発明によれば、各チャンネルの帯域幅を等間
隔または対数関数的に分割設定したフィルタバンクの出
力に比較して、フィルタバンクの多くのチャンネル出力
から入力音声の個人性を示す特徴を抽出することが可能
となる。従って、個人識別に利用可能なチャンネル出力
の層相を図り、個人照合の認識精度の向上を図ることが
可能となる。
隔または対数関数的に分割設定したフィルタバンクの出
力に比較して、フィルタバンクの多くのチャンネル出力
から入力音声の個人性を示す特徴を抽出することが可能
となる。従って、個人識別に利用可能なチャンネル出力
の層相を図り、個人照合の認識精度の向上を図ることが
可能となる。
(発明の実施例〕
以下、図面を参照して本発明の実施例につき説明する。
第1図は話者照合装置の要部概略構成図であり、1は音
声入力部である。特徴抽出フィルタ2は複数のチャンネ
ル(バンドパスフィルタ:BPF)を備えたフィルタバ
ンクからなり、上記音声入力部1から入力された音声の
特徴情報を抽出している。この特徴抽出フィルタ2にて
抽出された入力音声の特徴情報と、認識辞書3に予め登
録された特徴情報とが照合部4にて照合され、その音声
を入力した話者が上記認識辞I3に予め登録された特定
個人であるか否かが識別されている。
声入力部である。特徴抽出フィルタ2は複数のチャンネ
ル(バンドパスフィルタ:BPF)を備えたフィルタバ
ンクからなり、上記音声入力部1から入力された音声の
特徴情報を抽出している。この特徴抽出フィルタ2にて
抽出された入力音声の特徴情報と、認識辞書3に予め登
録された特徴情報とが照合部4にて照合され、その音声
を入力した話者が上記認識辞I3に予め登録された特定
個人であるか否かが識別されている。
さて、この話者照合装置で用いられる特徴抽出フィルタ
2のフィルタ特性は次のように設定されている。
2のフィルタ特性は次のように設定されている。
即ち、不特定話者用の音声認識に供される音韻特徴抽出
フィルタは、一般にその複数チャンネルの各帯域幅を、
例えば音声周波数帯域を等間隔または対数関数的に分割
して設定されている。この音声特徴情報フィルタによっ
て入力音声の音韻特徴を示す特徴パラメータが効果的に
抽出されるようになっている。
フィルタは、一般にその複数チャンネルの各帯域幅を、
例えば音声周波数帯域を等間隔または対数関数的に分割
して設定されている。この音声特徴情報フィルタによっ
て入力音声の音韻特徴を示す特徴パラメータが効果的に
抽出されるようになっている。
これに対して個人識別用の前記特徴抽出フィルタ2は、
低域側チャンネルから高域側チャンネルにかけて、各チ
ャンネルの帯域幅を指数関数的に広げ、入力音声の高域
成分に比較してその低域側成分に対して多くのチャンネ
ルを削り与えている。
低域側チャンネルから高域側チャンネルにかけて、各チ
ャンネルの帯域幅を指数関数的に広げ、入力音声の高域
成分に比較してその低域側成分に対して多くのチャンネ
ルを削り与えている。
そして入力音声の高域側成分からは大雑把に特徴抽出し
、低域成分からは細かく特徴抽出するものとなっている
。
、低域成分からは細かく特徴抽出するものとなっている
。
具体的には、例えば第2図に示すように低域側チャンネ
ルでは入力音声のパワースペクトル成分を2本づつ抽出
して各チャンネルの出力とし、中域のチャンネルでは該
入力音声のパワースペクトル成分を4本づつ抽出してそ
のチャンネルの出力としている。そして高域側チャンネ
ルでは入力音声の8本のパワースペクトル成分を一纏め
として抽出し、これをチャンネル出力としている。尚、
各チャンネルにおけるパワースペクトル成分の本数は、
そのチャンネルの帯域幅を示すことになる。
ルでは入力音声のパワースペクトル成分を2本づつ抽出
して各チャンネルの出力とし、中域のチャンネルでは該
入力音声のパワースペクトル成分を4本づつ抽出してそ
のチャンネルの出力としている。そして高域側チャンネ
ルでは入力音声の8本のパワースペクトル成分を一纏め
として抽出し、これをチャンネル出力としている。尚、
各チャンネルにおけるパワースペクトル成分の本数は、
そのチャンネルの帯域幅を示すことになる。
このようなフィルタ特性を備えた特徴抽出フィルタ2に
よって入力音声の個人性に関する特徴パラメータが効果
的に求められるようになっている。
よって入力音声の個人性に関する特徴パラメータが効果
的に求められるようになっている。
即ち、前記特徴抽出フィルタ2のフィルタ特性について
説明すると、音声の個人性の識別性は、例えばF比によ
り評価することができる。
説明すると、音声の個人性の識別性は、例えばF比によ
り評価することができる。
F比−(rm人間分散)/(個人的分散)ここで今、音
声周波数帯域を等間隔に分割した音韻認識用のフィルタ
バンクにおける各チャンネル出力のF比について検討す
ると、第3図中実線で示すように、exp関数形の傾向
を示す。この為、このフィルタバンクを介して抽出され
た音声の特徴情報を用いて個人識別するには、専ら高域
側チャンネルの音声特徴情報を利用するしかない。
声周波数帯域を等間隔に分割した音韻認識用のフィルタ
バンクにおける各チャンネル出力のF比について検討す
ると、第3図中実線で示すように、exp関数形の傾向
を示す。この為、このフィルタバンクを介して抽出され
た音声の特徴情報を用いて個人識別するには、専ら高域
側チャンネルの音声特徴情報を利用するしかない。
しかし全てのチャンネル(全周波数帯域)においてその
F比の値が゛11ff以上、つまり個人間分散が個人的
分散を上回るとすれば、その話者照合精度が更に向上す
ると考えられる。
F比の値が゛11ff以上、つまり個人間分散が個人的
分散を上回るとすれば、その話者照合精度が更に向上す
ると考えられる。
そこで、前述したように高域側での音声の個入性特徴が
顕著であることからこれを大雑把に特徴抽出し、低m側
に対するチャンネルの割当て数を増やして低域側での音
声特徴を更に細かく抽出することを考えた。具体的には
、各チャンネルのF比の変化がexp関数に似た傾向を
示すことから、このexp関数に沿って低域側チャンネ
ルの帯域幅に比較して高域側チャンネルの帯域幅を指数
関数的に増大させたフィルタバンクを構成した。そして
このフィルタの各チャンネルのF比について検討したと
ころ、第3図中破線で示すような結果を得た。
顕著であることからこれを大雑把に特徴抽出し、低m側
に対するチャンネルの割当て数を増やして低域側での音
声特徴を更に細かく抽出することを考えた。具体的には
、各チャンネルのF比の変化がexp関数に似た傾向を
示すことから、このexp関数に沿って低域側チャンネ
ルの帯域幅に比較して高域側チャンネルの帯域幅を指数
関数的に増大させたフィルタバンクを構成した。そして
このフィルタの各チャンネルのF比について検討したと
ころ、第3図中破線で示すような結果を得た。
このF比特性に示されるように、フィルタの各チャンネ
ルの帯域幅をexp関数形に設定した場合、低域側チャ
ンネルおよび中域チャンネルのF比が向上し、また高域
側チャンネルのF比には殆んど変化のないことが確認さ
れた。
ルの帯域幅をexp関数形に設定した場合、低域側チャ
ンネルおよび中域チャンネルのF比が向上し、また高域
側チャンネルのF比には殆んど変化のないことが確認さ
れた。
このことは、フィルタ特性を上述したように各チャンネ
ルの帯域を周波数に対して指数関数的に増大させること
により、F比が“1パ以上となって個人照合に利用でき
るフィルタ出力の数が増加することを意味している。つ
まり各チャンネルのフィルタ出力に、特に中域チャンネ
ルの出力に多くの個人性特徴を含ませることができるこ
とを示している。
ルの帯域を周波数に対して指数関数的に増大させること
により、F比が“1パ以上となって個人照合に利用でき
るフィルタ出力の数が増加することを意味している。つ
まり各チャンネルのフィルタ出力に、特に中域チャンネ
ルの出力に多くの個人性特徴を含ませることができるこ
とを示している。
従って各チャンネルの帯域幅をexp関数形に設定した
フィルタバンクを前記特徴抽出フィルタ2とした実施例
装置では、中域から高域にかけての多くのチャンネル出
力から入力音声の個人性に関する特徴を抽出することが
可能となる。故に、多くのチャンネル出力の情報を有効
に利用して個人性の識別(話者認識)を高精度に行うこ
とが可能となる。
フィルタバンクを前記特徴抽出フィルタ2とした実施例
装置では、中域から高域にかけての多くのチャンネル出
力から入力音声の個人性に関する特徴を抽出することが
可能となる。故に、多くのチャンネル出力の情報を有効
に利用して個人性の識別(話者認識)を高精度に行うこ
とが可能となる。
ちなみに本発明者等の実験によれば、上記exp関数形
に帯wt段設定た構成のフィルタを介して抽出された入
力音声の特徴情報を用いて複合類似度法により個人照合
処理を行ったところ、帯域を等間隔または対数関数的に
分割した構成のフィルタを用いて特徴抽出した場合に比
較して、個人照合率が向上することが確認された。
に帯wt段設定た構成のフィルタを介して抽出された入
力音声の特徴情報を用いて複合類似度法により個人照合
処理を行ったところ、帯域を等間隔または対数関数的に
分割した構成のフィルタを用いて特徴抽出した場合に比
較して、個人照合率が向上することが確認された。
尚、本発明は上述した実施例に限定されるものではない
。例えばフィルタバンクのチャンネル数や各チャンネル
の帯域幅等は、話者照合に要求される仕様に応じて定め
れば良いものであり、要するに本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。
。例えばフィルタバンクのチャンネル数や各チャンネル
の帯域幅等は、話者照合に要求される仕様に応じて定め
れば良いものであり、要するに本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。
第1図は話者照合装置の要部概略構成図、第2図は本発
明の一実施例に係るフィルタの周波数(パワースペクト
ル)に対するチャンネル割当て(フィルタ特性)を示す
図、第3図はフィルタ特性の異なりによるF比の変化を
示す図である。 1・・・音声入力部、2・・・特徴抽出フィルタ、3・
・・認識辞書、4・・・照合部。 出願人代理人 弁理士 鈴江武彦 III 図
明の一実施例に係るフィルタの周波数(パワースペクト
ル)に対するチャンネル割当て(フィルタ特性)を示す
図、第3図はフィルタ特性の異なりによるF比の変化を
示す図である。 1・・・音声入力部、2・・・特徴抽出フィルタ、3・
・・認識辞書、4・・・照合部。 出願人代理人 弁理士 鈴江武彦 III 図
Claims (1)
- 話者が発声入力した音声の個人性に関する特徴を抽出す
る複数チャンネルのフィルタバンクからなり、各チャン
ネルの帯域幅を低域側チャンネルから高域側チャンネル
にかけて指数関数的に広げて設定してなることを特徴と
する話者照合用フィルタ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60121720A JPS61278899A (ja) | 1985-06-05 | 1985-06-05 | 話者照合用フイルタ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60121720A JPS61278899A (ja) | 1985-06-05 | 1985-06-05 | 話者照合用フイルタ |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61278899A true JPS61278899A (ja) | 1986-12-09 |
Family
ID=14818209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60121720A Pending JPS61278899A (ja) | 1985-06-05 | 1985-06-05 | 話者照合用フイルタ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61278899A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007279743A (ja) * | 2006-04-06 | 2007-10-25 | Toshiba Corp | 話者認証登録及び確認方法並びに装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59123897A (ja) * | 1982-12-29 | 1984-07-17 | 富士通株式会社 | 音声認識装置 |
JPS61278896A (ja) * | 1985-06-05 | 1986-12-09 | 株式会社東芝 | 話者照合装置 |
-
1985
- 1985-06-05 JP JP60121720A patent/JPS61278899A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59123897A (ja) * | 1982-12-29 | 1984-07-17 | 富士通株式会社 | 音声認識装置 |
JPS61278896A (ja) * | 1985-06-05 | 1986-12-09 | 株式会社東芝 | 話者照合装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007279743A (ja) * | 2006-04-06 | 2007-10-25 | Toshiba Corp | 話者認証登録及び確認方法並びに装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5972496A (ja) | 単音識別装置 | |
JPS62232691A (ja) | 音声認識装置 | |
JPS61278899A (ja) | 話者照合用フイルタ | |
JPS61278896A (ja) | 話者照合装置 | |
JPS61180297A (ja) | 話者照合装置 | |
JPS62254199A (ja) | 話者照合装置 | |
Kameny | Comparison of the formant spaces of retroflexed and nonretroflexed vowels | |
JPS5936759B2 (ja) | 音声認識方法 | |
SU518791A1 (ru) | Способ идентификации личности по голосу | |
JPS60115996A (ja) | 音声認識装置 | |
JPS5936299A (ja) | 音声認識装置 | |
JPS5934595A (ja) | 音声認識処理方式 | |
JPS63798B2 (ja) | ||
JPS60260096A (ja) | 音声認識装置 | |
JPH0323920B2 (ja) | ||
JPS6257000A (ja) | 音声認識装置 | |
JPS59192296A (ja) | 音声認識装置 | |
JPS60217397A (ja) | 音声認識装置 | |
JPS61203498A (ja) | 音声認識装置の予備選択方式 | |
JPS59124390A (ja) | 候補削減音声認識方式 | |
Zhou et al. | An investigation of the Chinese rolling tongue consonants by time-frequency analysis | |
JPS5934597A (ja) | 音声認識処理装置 | |
JPS6147996A (ja) | 音声認識方式 | |
JPS62172400A (ja) | 音声認識装置 | |
JPS62106500A (ja) | 子音位置決定方式 |