JPS61278899A - 話者照合用フイルタ - Google Patents

話者照合用フイルタ

Info

Publication number
JPS61278899A
JPS61278899A JP60121720A JP12172085A JPS61278899A JP S61278899 A JPS61278899 A JP S61278899A JP 60121720 A JP60121720 A JP 60121720A JP 12172085 A JP12172085 A JP 12172085A JP S61278899 A JPS61278899 A JP S61278899A
Authority
JP
Japan
Prior art keywords
filter
channel
speaker
frequency
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60121720A
Other languages
English (en)
Inventor
千本 浩之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60121720A priority Critical patent/JPS61278899A/ja
Publication of JPS61278899A publication Critical patent/JPS61278899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声の個人性に関する特徴を抽出するに好適な
話者照合用フィルタに関する。
〔発明の技術的背景とその問題点〕
音声による個人照合処理の1つに、入力音声の個人性を
示す特徴を抽出してその話者が予め登録された特定個人
であるか否かを判定する処理がある。
このような個人照合処理を行う場合、入力音声・から話
者の個人性を示す特徴を如何にして抽出す4かが大きな
課題となる。
しかして従来の一般的な不特定話者に対する音声認識で
は、フィルタバンクの複数のチャンネルの各帯域幅を、
音声周波数帯域を等間隔または対数関数的に分割して設
定し、このフィルタバンクの出力として入力音声の特徴
(音韻特徴)を抽出している。
しかしこの特徴抽出は、音声の個人性に拘りなく、その
音韻を高精度に認識することを目的として行われる。こ
の為、上記フィルタバンクを介し゛て抽出された音声の
特徴情報には個人性を示す特徴が少ない。従ってこの特
徴情報を用いて話者の個人性を識別しようとしても、そ
の認識精度の向上を期待することができなかった。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声の個人性に関する特徴を効
果的に抽出して話者認識精度の向上を図ることのできる
話者照合用フィルタを提供することにある。
〔発明の概要〕
本発明は、話者が発声入力した音声の個人性に関する特
徴を抽出するフィルタバンクにおける複数チャンネルの
各帯域幅を、低域側チャンネルから高域側チャンネルに
かけて指数関数的に広げて設定してなることを特徴とす
るものである。
つまり音声の低域側に多くのチャンネルを割当ててその
音声情報を細かく抽出し、高域側では大雑把にその音声
特徴を抽出し、これを話者照合用の特徴情報として求め
るようにしたものである。
〔発明の効果〕
かくして本発明によれば、各チャンネルの帯域幅を等間
隔または対数関数的に分割設定したフィルタバンクの出
力に比較して、フィルタバンクの多くのチャンネル出力
から入力音声の個人性を示す特徴を抽出することが可能
となる。従って、個人識別に利用可能なチャンネル出力
の層相を図り、個人照合の認識精度の向上を図ることが
可能となる。
(発明の実施例〕 以下、図面を参照して本発明の実施例につき説明する。
第1図は話者照合装置の要部概略構成図であり、1は音
声入力部である。特徴抽出フィルタ2は複数のチャンネ
ル(バンドパスフィルタ:BPF)を備えたフィルタバ
ンクからなり、上記音声入力部1から入力された音声の
特徴情報を抽出している。この特徴抽出フィルタ2にて
抽出された入力音声の特徴情報と、認識辞書3に予め登
録された特徴情報とが照合部4にて照合され、その音声
を入力した話者が上記認識辞I3に予め登録された特定
個人であるか否かが識別されている。
さて、この話者照合装置で用いられる特徴抽出フィルタ
2のフィルタ特性は次のように設定されている。
即ち、不特定話者用の音声認識に供される音韻特徴抽出
フィルタは、一般にその複数チャンネルの各帯域幅を、
例えば音声周波数帯域を等間隔または対数関数的に分割
して設定されている。この音声特徴情報フィルタによっ
て入力音声の音韻特徴を示す特徴パラメータが効果的に
抽出されるようになっている。
これに対して個人識別用の前記特徴抽出フィルタ2は、
低域側チャンネルから高域側チャンネルにかけて、各チ
ャンネルの帯域幅を指数関数的に広げ、入力音声の高域
成分に比較してその低域側成分に対して多くのチャンネ
ルを削り与えている。
そして入力音声の高域側成分からは大雑把に特徴抽出し
、低域成分からは細かく特徴抽出するものとなっている
具体的には、例えば第2図に示すように低域側チャンネ
ルでは入力音声のパワースペクトル成分を2本づつ抽出
して各チャンネルの出力とし、中域のチャンネルでは該
入力音声のパワースペクトル成分を4本づつ抽出してそ
のチャンネルの出力としている。そして高域側チャンネ
ルでは入力音声の8本のパワースペクトル成分を一纏め
として抽出し、これをチャンネル出力としている。尚、
各チャンネルにおけるパワースペクトル成分の本数は、
そのチャンネルの帯域幅を示すことになる。
このようなフィルタ特性を備えた特徴抽出フィルタ2に
よって入力音声の個人性に関する特徴パラメータが効果
的に求められるようになっている。
即ち、前記特徴抽出フィルタ2のフィルタ特性について
説明すると、音声の個人性の識別性は、例えばF比によ
り評価することができる。
F比−(rm人間分散)/(個人的分散)ここで今、音
声周波数帯域を等間隔に分割した音韻認識用のフィルタ
バンクにおける各チャンネル出力のF比について検討す
ると、第3図中実線で示すように、exp関数形の傾向
を示す。この為、このフィルタバンクを介して抽出され
た音声の特徴情報を用いて個人識別するには、専ら高域
側チャンネルの音声特徴情報を利用するしかない。
しかし全てのチャンネル(全周波数帯域)においてその
F比の値が゛11ff以上、つまり個人間分散が個人的
分散を上回るとすれば、その話者照合精度が更に向上す
ると考えられる。
そこで、前述したように高域側での音声の個入性特徴が
顕著であることからこれを大雑把に特徴抽出し、低m側
に対するチャンネルの割当て数を増やして低域側での音
声特徴を更に細かく抽出することを考えた。具体的には
、各チャンネルのF比の変化がexp関数に似た傾向を
示すことから、このexp関数に沿って低域側チャンネ
ルの帯域幅に比較して高域側チャンネルの帯域幅を指数
関数的に増大させたフィルタバンクを構成した。そして
このフィルタの各チャンネルのF比について検討したと
ころ、第3図中破線で示すような結果を得た。
このF比特性に示されるように、フィルタの各チャンネ
ルの帯域幅をexp関数形に設定した場合、低域側チャ
ンネルおよび中域チャンネルのF比が向上し、また高域
側チャンネルのF比には殆んど変化のないことが確認さ
れた。
このことは、フィルタ特性を上述したように各チャンネ
ルの帯域を周波数に対して指数関数的に増大させること
により、F比が“1パ以上となって個人照合に利用でき
るフィルタ出力の数が増加することを意味している。つ
まり各チャンネルのフィルタ出力に、特に中域チャンネ
ルの出力に多くの個人性特徴を含ませることができるこ
とを示している。
従って各チャンネルの帯域幅をexp関数形に設定した
フィルタバンクを前記特徴抽出フィルタ2とした実施例
装置では、中域から高域にかけての多くのチャンネル出
力から入力音声の個人性に関する特徴を抽出することが
可能となる。故に、多くのチャンネル出力の情報を有効
に利用して個人性の識別(話者認識)を高精度に行うこ
とが可能となる。
ちなみに本発明者等の実験によれば、上記exp関数形
に帯wt段設定た構成のフィルタを介して抽出された入
力音声の特徴情報を用いて複合類似度法により個人照合
処理を行ったところ、帯域を等間隔または対数関数的に
分割した構成のフィルタを用いて特徴抽出した場合に比
較して、個人照合率が向上することが確認された。
尚、本発明は上述した実施例に限定されるものではない
。例えばフィルタバンクのチャンネル数や各チャンネル
の帯域幅等は、話者照合に要求される仕様に応じて定め
れば良いものであり、要するに本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。
【図面の簡単な説明】
第1図は話者照合装置の要部概略構成図、第2図は本発
明の一実施例に係るフィルタの周波数(パワースペクト
ル)に対するチャンネル割当て(フィルタ特性)を示す
図、第3図はフィルタ特性の異なりによるF比の変化を
示す図である。 1・・・音声入力部、2・・・特徴抽出フィルタ、3・
・・認識辞書、4・・・照合部。 出願人代理人 弁理士 鈴江武彦 III  図

Claims (1)

    【特許請求の範囲】
  1. 話者が発声入力した音声の個人性に関する特徴を抽出す
    る複数チャンネルのフィルタバンクからなり、各チャン
    ネルの帯域幅を低域側チャンネルから高域側チャンネル
    にかけて指数関数的に広げて設定してなることを特徴と
    する話者照合用フィルタ。
JP60121720A 1985-06-05 1985-06-05 話者照合用フイルタ Pending JPS61278899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60121720A JPS61278899A (ja) 1985-06-05 1985-06-05 話者照合用フイルタ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60121720A JPS61278899A (ja) 1985-06-05 1985-06-05 話者照合用フイルタ

Publications (1)

Publication Number Publication Date
JPS61278899A true JPS61278899A (ja) 1986-12-09

Family

ID=14818209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60121720A Pending JPS61278899A (ja) 1985-06-05 1985-06-05 話者照合用フイルタ

Country Status (1)

Country Link
JP (1) JPS61278899A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279743A (ja) * 2006-04-06 2007-10-25 Toshiba Corp 話者認証登録及び確認方法並びに装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59123897A (ja) * 1982-12-29 1984-07-17 富士通株式会社 音声認識装置
JPS61278896A (ja) * 1985-06-05 1986-12-09 株式会社東芝 話者照合装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59123897A (ja) * 1982-12-29 1984-07-17 富士通株式会社 音声認識装置
JPS61278896A (ja) * 1985-06-05 1986-12-09 株式会社東芝 話者照合装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279743A (ja) * 2006-04-06 2007-10-25 Toshiba Corp 話者認証登録及び確認方法並びに装置

Similar Documents

Publication Publication Date Title
JPS5972496A (ja) 単音識別装置
JPS62232691A (ja) 音声認識装置
JPS61278899A (ja) 話者照合用フイルタ
JPS61278896A (ja) 話者照合装置
JPS61180297A (ja) 話者照合装置
JPS62254199A (ja) 話者照合装置
Kameny Comparison of the formant spaces of retroflexed and nonretroflexed vowels
JPS5936759B2 (ja) 音声認識方法
SU518791A1 (ru) Способ идентификации личности по голосу
JPS60115996A (ja) 音声認識装置
JPS5936299A (ja) 音声認識装置
JPS5934595A (ja) 音声認識処理方式
JPS63798B2 (ja)
JPS60260096A (ja) 音声認識装置
JPH0323920B2 (ja)
JPS6257000A (ja) 音声認識装置
JPS59192296A (ja) 音声認識装置
JPS60217397A (ja) 音声認識装置
JPS61203498A (ja) 音声認識装置の予備選択方式
JPS59124390A (ja) 候補削減音声認識方式
Zhou et al. An investigation of the Chinese rolling tongue consonants by time-frequency analysis
JPS5934597A (ja) 音声認識処理装置
JPS6147996A (ja) 音声認識方式
JPS62172400A (ja) 音声認識装置
JPS62106500A (ja) 子音位置決定方式