JPH03280099A - 話者照合方式 - Google Patents

話者照合方式

Info

Publication number
JPH03280099A
JPH03280099A JP2081757A JP8175790A JPH03280099A JP H03280099 A JPH03280099 A JP H03280099A JP 2081757 A JP2081757 A JP 2081757A JP 8175790 A JP8175790 A JP 8175790A JP H03280099 A JPH03280099 A JP H03280099A
Authority
JP
Japan
Prior art keywords
speaker
vowel
vowels
distance
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2081757A
Other languages
English (en)
Other versions
JPH0632007B2 (ja
Inventor
Shoji Miki
三木 章司
Toshiko Nishikawa
西川 逸子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2081757A priority Critical patent/JPH0632007B2/ja
Publication of JPH03280099A publication Critical patent/JPH03280099A/ja
Publication of JPH0632007B2 publication Critical patent/JPH0632007B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の目的: (産業上の利用分野) この発明は、予め登録しておいた音声特徴パターンと人
力された音声特徴パターンとを比較することによって話
者を確実に照合するための話者照合方式に関する。
(従来の技術) 話者照合の研究は古くから行なわれており、様々な方式
か提案されている。代表的な方式としてはBPF(Ba
nd Pa5s Filter)分析による音声パター
ンのパターン間の類似度をDPマツチング等の処理によ
って求め、この類似度に基ついて判定を行なうものがあ
る。BPF分析は音声を通過周波数帯域の異なる複数個
のBPFに並列に通し、各出力を全波整流後にLPFに
よって平滑化し、ある時間間隔でA/D変換することに
よってそのパターンを得る。DPマツチングは2つのパ
ターン間の距離がてきるだけ小さくなるように、非線形
にパターン長を合せるための効率的な方法である。BP
F分析、 DPマツチングについては、例えば新美康末
著共立出版発行の「音声開織」に詳しく説明されている
(発明が解決しようとする課題) 上述の方式では、特徴としてBPF分析パターンそのも
のを用いているため、データ量が非常に多くなる欠点か
ある。たとえばBPF数1数個5個A/D周期10ms
で1秒長の音声を分析すると、そのデータ量は1000
/10 X15−1500個にもなってしまう。
この発明は上述のような事情より成されたものであり、
この発明の目的は、5母音との距離パターンに関する特
徴量から有効性を考慮して選択したものを利用すること
によって全体のデータ量を少なくしており、少ないデー
タ量でも話者を確実に照合するための話者照合方式を提
供することにある。
発明の構成: (課題を解決するための手段) この発明は話者照合方式に関するものて、この発明の上
記目的は、話者に予め5母音を発声させて5母音パター
ンを一旦作成すると共に、前記5母音以外の言葉を発声
させて前記5母音パターンとの距離を求め、特徴量の中
から有効なものを選択し、前記選択された特徴量を前記
話者の標準パターンとして登録しておき、照合時には前
記登録時と同一の5母音以外の言葉を発声させて、前記
登録された標準パターンとの類似度により話者を照合す
るようにすることによって達成される。
(作用) この発明は、より少ないデータで高い話者照合能力を得
るために開発されたもので、より個人性を持つ特徴量を
選択して使用することにより、従来方式に比べ1/10
以下のデータ量で照合可能となっている。この発明では
、特に特定の話者に予め5母音と5母音以外の言葉を発
声させて特徴量を計算し、有効性を考慮した上て特徴量
を選択し、それを標準パターンとして登録しておき、照
合時に5母音以外の言葉を発声させて特徴量を計算し、
この特徴量から得られるパターンと標準パターンとを比
較して話者照合を行なうようにしている。
(実施例)第1図はこの発明の動作例を示しており、最
初に登録モートか照合モートかを判断するが(ステップ
51) 、先ず登録モートについて説明する。
先ず5母音の音声を人力する回数を数えるパラメータm
を°゛0”としくステップS2)、その後に話者が5母
音” a  〜“°0”を孤立発声しくステップS3)
、発声された5母音の音声について各母音毎に音響分析
を行なう(ステップ54)。この音響分析は音声信号を
A/D変換した音声データをLPC(Linear P
lanning Coefficient)分析するも
のであり、LPG分析に関しては中田和男著 総合電子
出版発行の「音声の合成と認識」に詳細に説明されてお
り、この手法を用いるものである。
すなわち、第2図に示すように音声波形を適当なサンプ
リング時間でA/D変換し、音声区間を切り圧し、たと
えばフレームシフト10m5.  フレーム長30m5
でフレーム単位に分割し、各フレーム内データに対して
ハミング窓をかけ合せてフレーム両端の部分の周波数の
歪をなくし、その後に適応1次長段逆フィルタ(演算し
て求めたもの)を通して音源特性によるものを除去し、
声道特性のみとした後にLPG分析を行なう。
データパターンは第3図のような形となる。但し、ここ
ては、al、は第1フレーム、第j次LPG係数を、n
は分析次数をそれぞれ示す。第4図(A) はハミング
窓をかけ合せた後の特性を示し、同図(B)  は同図
(A)を逆フィルタを通した後の特性を示している。逆
フィルタすることによりスペクトルか平坦化される。さ
らに、定常部(初めと終りの部分を除いた部分)のLP
G時系列を第3図に示す如く平均し、先す°゛a”の母
音パターンを作成する。“i′°〜“o ”についても
同様にLPG分析を行ない、5母音のパターンを作成す
る。
この音響分析の後、パラメータmが所定数Mになってい
るか否かを判断しくステップ55)m=Mとなるまでパ
ラメータmをカウントアツプして(ステップS6)、上
記ステップS3にリターンして上記動作を繰り返す。そ
して、m=Mとなった場合にはM回のパターンを平均し
、5母音パターンとしてメモリに記憶しくステップS7
)音声人力の回数を数えるためのパラメータρを“0゛
としくステップS8)、所定の文章、卑語等を発声する
(ステップ510)。なお、後述する平均ピッチ、平均
逆フイルタ係数は5母音パターンとしてはメモリに記憶
しない。
この発声された音声に対して、先ず上述したと同様な音
響分析を行ない(ステップ5ll)、逆フイルタ係数を
求め、その逆フィルタを通した後にLPG係数の時系列
を求め、更にピッチの時系列を求める。ピッチ(声の高
さ)は元のデータそのものから直接求めるよりも、LP
Gで予測したものと実際のデータとの差を一旦求め、こ
の残差からピッチの時系列を求めた方が簡単である。そ
して、音響分析のデータを基に特!!!!量の計算を行
なう(ステップ512)。この特微量の計算は、平均ピ
ッチ(声の高さ)、平均LPG係数(声道の平均的な特
性)、平均逆フイルタ係数(音源の平均的な特性)及び
LPGパターンでの5母音との距離に関する各種特it
を求めるものである。LPG係数、ピッチ及び逆フイル
タ係数のフレーム毎の値と、平均LPG係数、平均ピッ
チ及び平均逆フイルタ係数との関係は第5図に示されて
おり、また、LPGパターンでの5母音との距離は第6
図で示されるようなマトリクスデータとなる。母音“°
i°。
との距離はブロックSCIで表わされるか、例えは母音
” a ” との距離パターンdaJは下式で計算され
る。
α□、第Jフレーム第に次のLPC係数α、:母音“a
”の第に次LPC係数 dad:第Jフレーム母音“a”とのパターン距離 また、5母音との距離に関する特微量の項目内容は第7
図に示されており、次に第7図の上段(各母音毎)につ
いては母音”a”について、下段(各母音間)について
は母音”a”及び°lの場合について、 その計算式を以下に示す。
名句 音毎の音声区間全体の分散値buntは、第iフレーム
の との足巨離 正ト Σ dat/n の平均 フレーム数 である。
また、 各母音間の音声区間全体の相関係 数rは、 :  dai とdll の共分散 である。
そして、 距離和distは、 である。更に、第jセグメントについて各母音毎の分散
値bunsj、平均値avesj 、各母音間の距離の
分散値dis−bunj、距離の平均値dis−ave
jは次のように計算する。
bunsj−Σ (d、1 avesj) 2/(m −n++1) ・・・(5) VeSJ− Σ da+/(m m+1) ・・・・・・(6) (第Jセグメントに第m〜第m フ レームか含まれる場合) os bunj=、I:、 (co−disi−disave
j) 2/ (m’−m+1) COJISJ−(dai−dli)2 a とd ・・・・・・(7) 1の距離 1s avej−、X:、co−disi/ (m−m+1) ・・・・・・(8) 第8図は’namae ”を発声した場合について、L
PGパターンでの5母音パターンとの距離を示している
。特性DSLは母音”a”との距離を、特性DS2は母
音゛1゛°との距離を、特性DS3は母音U”との距離
を、特性DS4は母音”e”との距離を、特性DS5は
母音“0”との距離をそれぞれ示しており、母音部で該
当母音との距離か小さく5木がバラバラの場合は発声が
明瞭てあり、5木とも比較的大きく同しような値を有す
る場合には発声が不明瞭であると言える。
第7図の各特徴について関係を示したのか第9図(A)
 、 (B)であり、同図(A)は第8図の中から2木
の特性を取り出したものである。また、第9図(A) 
、 (B)の縦の実線はセグメントの境界を示している
。フレーム(時間)に対して母音“a ”との距離は第
9図iA)の特性Aで示され、母音°“どの距離は特性
Bで示されるとすると、母音a”と母音“1°゛との母
音間の距離和(dist)は斜線部Cで示される。距1
liBの起伏は距1llAのそれより急峻であるため、
音声区間全体での分散値(bunt)か大きくなる。図
中X印は各母音毎の音声区間全体での最小値(mint
)を、・印はセグメントでの最小値(mins)を、横
線はセグメントでの平均(i(aves)をそれぞれ示
している。そして、母音a”との距離及び母音゛i”と
の距離の間の距離は第9図(B)のように表わされ、各
セグメントでの平均値(dis−ave)は横線のよう
に、最小値(dis−min)は*印となる。
但し、セグメントは母音定常部とその間及び始端、終端
とし、5母音との距離パターンを利用し、発声内容を考
慮してトップダウンで行なう。
たとえば”namae ”を発声した場合、最初のa”
のセグメントを見付けるには、先ず存在候補区間(“n
amae ”の場合は全長の1/3より前)で“a”と
の距離の最小値を見付け、しきい値をその最小値×定数
とし、しきい値以下の区間の長さがセグメント長の範囲
内(発声する言葉により予め決められている範囲、たと
えば10〜20フレーム)になるように定数の値を調整
してセグメントを求める。
このような特徴量の計算を行なった後、パラメータρか
所定数りどなるまで上記ステップ510にリターンして
同様な動作を繰返しくステップ513.514)、u=
Lとなった時に特徴量の選択を行なう(ステップ515
)。すなわち、話者1発声音毎に第7図の中から有効な
ものを10個選択する。有効性の評価は、次式で示され
るF比の大小で判断する。
・・・・・・・・・(9) 但し、 μi:話者iの分布の中心 μm−ΣX+r/L lj 、話者lの第j番目のデータ ■ 二話者数 り 、データ数 本人分布の広がりか小さく各話者分布か離れているほと
分離状態が良く、話者間分散か大きく話者的分散が小さ
いほどF比は大きくて有効となる。
さらに、話者発声音によらない共通のものとして、平均
ピッチ、平均LPG係数(3〜8次)、平均逆フイルタ
係数(1〜3次)の計10個を採用する。すなわち、照
合のための特徴量の数は本実施例では20個である。な
お、第7図に示すような5母音パターンとの距離に関す
る各種特徴量の中からF比の大きいものから少なくとも
10個とれは、話者照合に非常に有効となることか実験
により確かめられたので10個選択しているか、照合演
算処理時間によってはもう少し選択数を増加させても良
い。
このような特徴量の選択の後に選択した特徴量のL個平
均をとり、標準パターンとしてメモリに登録する(ステ
ップ516)。ただし、上述したF比の計算には本人以
外ので一夕か必要であるため、この登録の前には、比較
すべき登録者以外のデータをある程度収集する必要があ
る。
上述のような登録モートの後に、話者の照合を行なう場
合は次のように行なう。すなわち、先ず登録時に用いた
所定の文章を言葉で発声しくステップ520)、この入
力された音声に対して上述したような音響分析(ステッ
プ521)及び登録時に選択した特徴量の計算(ステッ
プ522)を行ない、その後に平均ピッチによる判定を
行なう(ステップ523)、平均ピッチによる判定は、
標準パターンでの平均ピッチに対しである範囲内にある
かどうかで判定する。すなわち、この判定で forer  X (1−α)≦foin≦fOr、、
f  X (1◆ α)・・・−・・(lO) foref:標準パターンの平均ピッチfoi。二人力
音声の平均ピッチ の場合にはOKとなる。平均ピッチによる判定の後に、
重み付き距離による判定を行なう(ステップ524)。
この重み付き距離による判定は、平均ピッチ以外の19
種の特徴量の有効性に応した重み付き距離と、 しきい値との大小比較を下式に従って行なう。
dis・Σ 賀 (a −b+)2   (1−19) ・・・・・・(11) wl  第i特徴の重み(=F比) al、標準パターンの第i特徴の値 b1  人カバターンの第1特徴の値 dls≦dts。中OK d + 、 > d 、 sO=> N G上述のよう
な平均ピッチによる判定か0にであり、重み付き距離に
よる判定かOKの場合には、話者が’Jl &t=者と
同一であるとしてアクセプトしくステップ525)、い
ずれかがNGの場合にはりジェツトとなる(ステップ5
26)。
発明の効果: 以上のようにこの発明の話者照合方式によれば、5母音
パターンとの距離パターンに関する特徴量から有効なも
のを選択して使用しているため、ψないデータ量でしか
も話者の照合を確実に行なうことか可能となる。
【図面の簡単な説明】
第1図はこの発明の動作例を示すフローチャート、第2
図及び第3図はLPG分析を説明するための図、第4図
(八) 、 CB) は逆フィルタの関係を説明するた
めの図、第5図は特徴量の内容を示す図、第6図及び第
8図は5母音との距離パターンを示す図、第7図は特徴
量の内容を示す図、第9図(A) 、 (B)は特徴量
を説明するための図である。

Claims (1)

    【特許請求の範囲】
  1. 1、話者に予め5母音を発声させて5母音パターンを一
    旦作成すると共に、前記5母音以外の言葉を発声させて
    前記5母音パターンとの距離を求め、特徴量の中から有
    効なものを選択し、前記選択された特徴量を前記話者の
    標準パターンとして登録しておき、照合時には前記登録
    時と同一の5母音以外の言葉を発声させ、前記登録され
    た標準パターンとの類似度により話者を照合するように
    したことを特徴とする話者照合方式。
JP2081757A 1990-03-29 1990-03-29 話者照合方式 Expired - Lifetime JPH0632007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2081757A JPH0632007B2 (ja) 1990-03-29 1990-03-29 話者照合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2081757A JPH0632007B2 (ja) 1990-03-29 1990-03-29 話者照合方式

Publications (2)

Publication Number Publication Date
JPH03280099A true JPH03280099A (ja) 1991-12-11
JPH0632007B2 JPH0632007B2 (ja) 1994-04-27

Family

ID=13755318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2081757A Expired - Lifetime JPH0632007B2 (ja) 1990-03-29 1990-03-29 話者照合方式

Country Status (1)

Country Link
JP (1) JPH0632007B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112007001703T5 (de) 2006-07-18 2009-06-04 AUTONETWORKS Technologies, LTD., Yokkaichi Isolierte Leitung und Kabelbaum
DE112008003070T5 (de) 2007-11-16 2010-09-16 AUTONETWORKS Technologies, LTD., Yokkaichi Polymer mit integrierter Säureanhydridstruktur, Polymerzusammensetzung, umhüllter elektrischer Draht und Kabelstrang
DE112009001532T5 (de) 2008-06-27 2011-04-14 AUTONETWORKS Technologies, LTD., Yokkaichi Flammhemmende Zusammensetzung, umhüllte elektrische Leitung und Kabelstrang

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112007001703T5 (de) 2006-07-18 2009-06-04 AUTONETWORKS Technologies, LTD., Yokkaichi Isolierte Leitung und Kabelbaum
DE112008003070T5 (de) 2007-11-16 2010-09-16 AUTONETWORKS Technologies, LTD., Yokkaichi Polymer mit integrierter Säureanhydridstruktur, Polymerzusammensetzung, umhüllter elektrischer Draht und Kabelstrang
DE112009001532T5 (de) 2008-06-27 2011-04-14 AUTONETWORKS Technologies, LTD., Yokkaichi Flammhemmende Zusammensetzung, umhüllte elektrische Leitung und Kabelstrang
DE112009001532T9 (de) 2008-06-27 2012-06-06 Autonetworks Technologies, Ltd. Flammhemmende Zusammensetzung, umhüllte elektrische Leitung und Kabelstrang

Also Published As

Publication number Publication date
JPH0632007B2 (ja) 1994-04-27

Similar Documents

Publication Publication Date Title
EP0411290A2 (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
JPH01296299A (ja) 音声認識装置
Nwe et al. Classification of stress in speech using linear and nonlinear features
Unnibhavi et al. LPC based speech recognition for Kannada vowels
JPH03280099A (ja) 話者照合方式
JPH0222960B2 (ja)
Hasija et al. Recognition of children Punjabi speech using tonal non-tonal classifier
Sae-Tang et al. Feature windowing-based Thai text-dependent speaker identification using MLP with backpropagation algorithm
Kumar et al. Text dependent speaker identification in noisy environment
JPS60114900A (ja) 有音・無音判定法
US7454337B1 (en) Method of modeling single data class from multi-class data
Phyu et al. Building Speaker Identification Dataset for Noisy Conditions
Wutiwiwatchai et al. Text-dependent speaker identification using LPC and DTW for Thai language
Tanprasert et al. Comparative study of GMM, DTW, and ANN on Thai speaker identification system
JP2008224911A (ja) 話者認識システム
Revathi et al. Text independent composite speaker identification/verification using multiple features
Wilpon et al. Connected digit recognition based on improved acoustic resolution
Seman et al. Hybrid methods of Brandt’s generalised likelihood ratio and short-term energy for Malay word speech segmentation
JPH0695690A (ja) 話者認識方法
Higgins et al. A multi-spectral data-fusion approach to speaker recognition
Lee et al. An NN based tone classifier for Cantonese
De La Torre et al. On-line garbage modeling for word and utterance verification in natural numbers recognition
Saha et al. An F-ratio based optimization technique for automatic speaker recognition system
Shahnawazuddin et al. Speaking-Rate Adaptation of Automatic Speech Recognition System through Fuzzy Classification based Time-Scale Modification
JPH03269499A (ja) 話者照合方式