JPS61278899A

JPS61278899A - 話者照合用フイルタ

Info

Publication number: JPS61278899A
Application number: JP60121720A
Authority: JP
Inventors: 千本　浩之
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1985-06-05
Filing date: 1985-06-05
Publication date: 1986-12-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は音声の個人性に関する特徴を抽出するに好適な
話者照合用フィルタに関する。

〔発明の技術的背景とその問題点〕

音声による個人照合処理の１つに、入力音声の個人性を
示す特徴を抽出してその話者が予め登録された特定個人
であるか否かを判定する処理がある。

このような個人照合処理を行う場合、入力音声・から話
者の個人性を示す特徴を如何にして抽出す４かが大きな
課題となる。

しかして従来の一般的な不特定話者に対する音声認識で
は、フィルタバンクの複数のチャンネルの各帯域幅を、
音声周波数帯域を等間隔または対数関数的に分割して設
定し、このフィルタバンクの出力として入力音声の特徴
（音韻特徴）を抽出している。

しかしこの特徴抽出は、音声の個人性に拘りなく、その
音韻を高精度に認識することを目的として行われる。こ
の為、上記フィルタバンクを介し゛て抽出された音声の
特徴情報には個人性を示す特徴が少ない。従ってこの特
徴情報を用いて話者の個人性を識別しようとしても、そ
の認識精度の向上を期待することができなかった。

〔発明の目的〕

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声の個人性に関する特徴を効
果的に抽出して話者認識精度の向上を図ることのできる
話者照合用フィルタを提供することにある。

〔発明の概要〕

本発明は、話者が発声入力した音声の個人性に関する特
徴を抽出するフィルタバンクにおける複数チャンネルの
各帯域幅を、低域側チャンネルから高域側チャンネルに
かけて指数関数的に広げて設定してなることを特徴とす
るものである。

つまり音声の低域側に多くのチャンネルを割当ててその
音声情報を細かく抽出し、高域側では大雑把にその音声
特徴を抽出し、これを話者照合用の特徴情報として求め
るようにしたものである。

〔発明の効果〕

かくして本発明によれば、各チャンネルの帯域幅を等間
隔または対数関数的に分割設定したフィルタバンクの出
力に比較して、フィルタバンクの多くのチャンネル出力
から入力音声の個人性を示す特徴を抽出することが可能
となる。従って、個人識別に利用可能なチャンネル出力
の層相を図り、個人照合の認識精度の向上を図ることが
可能となる。

（発明の実施例〕以下、図面を参照して本発明の実施例につき説明する。

第１図は話者照合装置の要部概略構成図であり、１は音
声入力部である。特徴抽出フィルタ２は複数のチャンネ
ル（バンドパスフィルタ：ＢＰＦ）を備えたフィルタバ
ンクからなり、上記音声入力部１から入力された音声の
特徴情報を抽出している。この特徴抽出フィルタ２にて
抽出された入力音声の特徴情報と、認識辞書３に予め登
録された特徴情報とが照合部４にて照合され、その音声
を入力した話者が上記認識辞Ｉ３に予め登録された特定
個人であるか否かが識別されている。

さて、この話者照合装置で用いられる特徴抽出フィルタ
２のフィルタ特性は次のように設定されている。

即ち、不特定話者用の音声認識に供される音韻特徴抽出
フィルタは、一般にその複数チャンネルの各帯域幅を、
例えば音声周波数帯域を等間隔または対数関数的に分割
して設定されている。この音声特徴情報フィルタによっ
て入力音声の音韻特徴を示す特徴パラメータが効果的に
抽出されるようになっている。

これに対して個人識別用の前記特徴抽出フィルタ２は、
低域側チャンネルから高域側チャンネルにかけて、各チ
ャンネルの帯域幅を指数関数的に広げ、入力音声の高域
成分に比較してその低域側成分に対して多くのチャンネ
ルを削り与えている。

そして入力音声の高域側成分からは大雑把に特徴抽出し
、低域成分からは細かく特徴抽出するものとなっている
。

具体的には、例えば第２図に示すように低域側チャンネ
ルでは入力音声のパワースペクトル成分を２本づつ抽出
して各チャンネルの出力とし、中域のチャンネルでは該
入力音声のパワースペクトル成分を４本づつ抽出してそ
のチャンネルの出力としている。そして高域側チャンネ
ルでは入力音声の８本のパワースペクトル成分を一纏め
として抽出し、これをチャンネル出力としている。尚、
各チャンネルにおけるパワースペクトル成分の本数は、
そのチャンネルの帯域幅を示すことになる。

このようなフィルタ特性を備えた特徴抽出フィルタ２に
よって入力音声の個人性に関する特徴パラメータが効果
的に求められるようになっている。

即ち、前記特徴抽出フィルタ２のフィルタ特性について
説明すると、音声の個人性の識別性は、例えばＦ比によ
り評価することができる。

Ｆ比−（ｒｍ人間分散）／（個人的分散）ここで今、音
声周波数帯域を等間隔に分割した音韻認識用のフィルタ
バンクにおける各チャンネル出力のＦ比について検討す
ると、第３図中実線で示すように、ｅｘｐ関数形の傾向
を示す。この為、このフィルタバンクを介して抽出され
た音声の特徴情報を用いて個人識別するには、専ら高域
側チャンネルの音声特徴情報を利用するしかない。

しかし全てのチャンネル（全周波数帯域）においてその
Ｆ比の値が゛１１ｆｆ以上、つまり個人間分散が個人的
分散を上回るとすれば、その話者照合精度が更に向上す
ると考えられる。

そこで、前述したように高域側での音声の個入性特徴が
顕著であることからこれを大雑把に特徴抽出し、低ｍ側
に対するチャンネルの割当て数を増やして低域側での音
声特徴を更に細かく抽出することを考えた。具体的には
、各チャンネルのＦ比の変化がｅｘｐ関数に似た傾向を
示すことから、このｅｘｐ関数に沿って低域側チャンネ
ルの帯域幅に比較して高域側チャンネルの帯域幅を指数
関数的に増大させたフィルタバンクを構成した。そして
このフィルタの各チャンネルのＦ比について検討したと
ころ、第３図中破線で示すような結果を得た。

このＦ比特性に示されるように、フィルタの各チャンネ
ルの帯域幅をｅｘｐ関数形に設定した場合、低域側チャ
ンネルおよび中域チャンネルのＦ比が向上し、また高域
側チャンネルのＦ比には殆んど変化のないことが確認さ
れた。

このことは、フィルタ特性を上述したように各チャンネ
ルの帯域を周波数に対して指数関数的に増大させること
により、Ｆ比が“１パ以上となって個人照合に利用でき
るフィルタ出力の数が増加することを意味している。つ
まり各チャンネルのフィルタ出力に、特に中域チャンネ
ルの出力に多くの個人性特徴を含ませることができるこ
とを示している。

従って各チャンネルの帯域幅をｅｘｐ関数形に設定した
フィルタバンクを前記特徴抽出フィルタ２とした実施例
装置では、中域から高域にかけての多くのチャンネル出
力から入力音声の個人性に関する特徴を抽出することが
可能となる。故に、多くのチャンネル出力の情報を有効
に利用して個人性の識別（話者認識）を高精度に行うこ
とが可能となる。

ちなみに本発明者等の実験によれば、上記ｅｘｐ関数形
に帯ｗｔ段設定た構成のフィルタを介して抽出された入
力音声の特徴情報を用いて複合類似度法により個人照合
処理を行ったところ、帯域を等間隔または対数関数的に
分割した構成のフィルタを用いて特徴抽出した場合に比
較して、個人照合率が向上することが確認された。

尚、本発明は上述した実施例に限定されるものではない
。例えばフィルタバンクのチャンネル数や各チャンネル
の帯域幅等は、話者照合に要求される仕様に応じて定め
れば良いものであり、要するに本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。

【図面の簡単な説明】

第１図は話者照合装置の要部概略構成図、第２図は本発
明の一実施例に係るフィルタの周波数（パワースペクト
ル）に対するチャンネル割当て（フィルタ特性）を示す
図、第３図はフィルタ特性の異なりによるＦ比の変化を
示す図である。１・・・音声入力部、２・・・特徴抽出フィルタ、３・
・・認識辞書、４・・・照合部。出願人代理人　弁理士　鈴江武彦ＩＩＩ　　図

Claims

【特許請求の範囲】

話者が発声入力した音声の個人性に関する特徴を抽出す
る複数チャンネルのフィルタバンクからなり、各チャン
ネルの帯域幅を低域側チャンネルから高域側チャンネル
にかけて指数関数的に広げて設定してなることを特徴と
する話者照合用フィルタ。