JP2991148B2 - 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置 - Google Patents

話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置

Info

Publication number
JP2991148B2
JP2991148B2 JP9040102A JP4010297A JP2991148B2 JP 2991148 B2 JP2991148 B2 JP 2991148B2 JP 9040102 A JP9040102 A JP 9040102A JP 4010297 A JP4010297 A JP 4010297A JP 2991148 B2 JP2991148 B2 JP 2991148B2
Authority
JP
Japan
Prior art keywords
feature vector
standard pattern
speaker
suppressed
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9040102A
Other languages
English (en)
Other versions
JPH10222189A (ja
Inventor
栄子 山田
浩明 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9040102A priority Critical patent/JP2991148B2/ja
Priority to CA002229113A priority patent/CA2229113C/en
Priority to EP98102205A priority patent/EP0858068A3/en
Publication of JPH10222189A publication Critical patent/JPH10222189A/ja
Application granted granted Critical
Publication of JP2991148B2 publication Critical patent/JP2991148B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、話者照合装置内で
用いられる抑制標準パターン(コホート)作成方法に関
する。
【0002】
【従来の技術】話者認識においては、登録時と照合時の
周囲雑音差、回線特性差などが認識性能を低下させるこ
とが問題となっている。この問題を解決する手段として
は、迫江らが提案している抑制標準パターンを用いた方
法が挙げられる(例えば特開昭58−76893号公報
(「文献1」という)、あるいは特開昭59−1785
87号公報(「文献2」という)参照)。この従来方法
は、本人の標準パターンと入力音声間の距離の値を用
い、予め定められた閾値によって本人判定する際に、そ
の前段階として、抑制標準パターンと入力音声間の距離
の値を閾値とした判定を行う話者照合方法である。
【0003】登録時と照合時の様々な環境差は、本人の
標準パターンと入力音声間の距離と、抑制標準パターン
と入力音声間の距離に同様に影響しているため、抑制標
準パターンと入力音声間の距離の値を閾値とした判定を
前段階に行うことによって、登録時と照合時の環境差を
取り除いた照合を行うことができ、高性能の照合率が得
られると記載されている。また、上記提案法と同じ考え
方に基づいた方法として、抑制標準パターンによる尤度
正規化法が、Higgins、Rosenbergらに
よって提案されている(A.Higgins,L.Ba
hler,and J.Porter、“Speake
r Verification Using Rand
omized Phrase Prompting”、
Digital Signal Processin
g、1、pp89−106、(1991)参照)(「文
献3」という)、(Aaron E.Rosenber
g,Joel DeLong,Chin−Hui Le
e,Biing−HwangJuang,Frank
K.Soong、“The Use of Cohor
t Normalized Scores for S
peaker Verification”、ICSL
P92、pp599−602(1992)参照)(「文
献4」という)。
【0004】以下、抑制標準パターンによる尤度正規化
について説明する。
【0005】抑制標準パターンによる尤度正規化とは、
本人の音声に近い音声を持つ上位N名を抑制話者として
選択し、照合時の距離計算の際に、本人の尤度から抑制
話者の尤度を差し引くことによって、尤度の正規化を行
う手法である。差し引かれる抑制話者の尤度としては、
抑制話者中の最大尤度、平均値など様々な方法が考えら
れる。登録時と照合時の様々な環境差は、本人の尤度と
抑制話者の尤度に同様に影響しているため、本人の尤度
から抑制話者の尤度を差し引くことによって、登録時と
照合時の環境差を取り除くことができると考えられてい
る。
【0006】
【発明が解決しようとする課題】図10は、従来の抑制
標準パターン作成方法を説明するためのブロック図であ
る。従来の抑制標準パターン(コホート)作成方法の流
れは、入力された本人の音声データが分析部1010で
特徴ベクトルに変換され、変換された特徴ベクトルと抑
制話者標準パターン記憶部1020に記憶されている抑
制話者の標準パターンとの類似度を計算し、本人の音声
に近い順に抑制話者を抑制話者選択部1030で選択す
るというものであった。
【0007】この従来方法の場合、予め用意された抑制
話者の中から本人の登録時の音声と類似した抑制話者が
選択されるが、本人の登録時の環境と選択された抑制話
者の環境には差があり、その差を埋めるために、多くの
抑制話者を用意しなくてはならない、という問題点があ
る。
【0008】また、本人と抑制話者が異なる単語を発声
した場合、従来の方法では、本人の内容未知音声を連続
音素認識し、認識した結果を用いて音素パターンを連鎖
させ、未知発声に相当する抑制標準パターンを作成して
いた。
【0009】しかし、従来方法では、抑制標準パターン
の質が連続音素認識の性能に左右される、という問題点
がある。
【0010】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、上記問題点を解
消する方法として、適応化を用いた抑制標準パターン作
成方法及び装置を提供することにある。
【0011】
【課題を解決するための手段】前記目的を達成する本願
第1発明に係る抑制標準パターン(コホート)作成方式
は、入力された本人の音声データを特徴ベクトルに変換
する分析部と、前記分析部で変換された特徴ベクトルを
記憶する特徴ベクトル記憶部と、1つ以上の抑制話者の
標準パターンが記憶されている抑制話者標準パターン記
憶部と、前記分析部で変換された特徴ベクトルと前記抑
制話者標準パターン記憶部に記憶されている各話者の標
準パターンとの類似度を計算し、少なくとも1人の抑制
話者を選択する抑制話者選択部と、前記抑制話者選択部
で選択された抑制話者の標準パターンと、前記特徴ベク
トル記憶部に記憶されている本人の特徴ベクトルを用
い、抑制話者の特徴ベクトル空間から本人の特徴ベクト
ル空間への写像関数を求める推定部と、前記推定部で求
めた写像関数を基に、前記抑制話者標準パターン記憶部
に記憶されている抑制話者の標準パターンを適応化する
適応部とを有して構成される。
【0012】また本願第2発明に係る抑制標準パターン
(コホート)作成方式は、入力された本人の音声データ
を特徴ベクトルに変換する分析部と、前記分析部で変換
された特徴ベクトルを記憶する特徴ベクトル記憶部と、
1つ以上の抑制話者標準パターンが記憶されている抑制
話者標準パターン記憶部と、前記分析部で変換された特
徴ベクトルと前記抑制話者標準パターン記憶部に記憶さ
れている各話者の標準パターンとの類似度を計算し、少
なくとも1人の抑制話者を選択する抑制話者選択部と、
前記抑制話者選択部で選択された抑制話者の標準パター
ンと、前記特徴ベクトル記憶部に記憶されている本人の
第1の発声(内容既知)から求められた特徴ベクトルを
用い、抑制話者の特徴ベクトル空間から本人の特徴ベク
トル空間への写像関数を求める推定部と、前記推定部で
求められた写像関数を基に、前記抑制話者標準パターン
記憶部に記憶されている抑制話者の標準パターンを適応
化する適応部と、前記適応部で求められた適応化後の抑
制話者標準パターンを用い、前記特徴ベクトル記憶部に
記憶されている本人の第2の発声(内容未知)から求め
られた特徴ベクトルのアライメントを推定し、推定され
たアライメントを基に第2の発声に相当する抑制標準パ
ターンを作成するアライメント推定部とを有して構成さ
れる。
【0013】本願第3発明に係る抑制標準パターン(コ
ホート)作成方式は、入力された本人の音声データを特
徴ベクトルに変換する分析部と、前記分析部で変換され
た特徴ベクトルを記憶する特徴ベクトル記憶部と、1つ
以上の抑制話者標準パターンが記憶されている抑制話者
標準パターン記憶部と、前記分析部で変換された特徴ベ
クトルと前記抑制話者標準パターン記憶部に記憶されて
いる各話者の標準パターンとの類似度を計算し、少なく
とも1人の抑制話者を選択する抑制話者選択部と、前記
抑制話者選択部で選択された抑制話者の標準パターン
と、前記特徴ベクトル記憶部に記憶されている本人の第
1の発声(内容既知)から求められた特徴ベクトルを用
い、抑制話者の特徴ベクトル空間から本人の特徴ベクト
ル空間への写像関数を求める推定部と、前記抑制話者選
択部で選択された抑制話者の標準パターンを用い、前記
特徴ベクトル記憶部に記憶されている本人の第2の発声
(内容未知)から求められた特徴ベクトルのアライメン
トを推定し、推定されたアライメントを基に第2の発声
に相当する抑制標準パターンを作成するアライメント推
定部と、前記推定部で推定された写像関数を用い、前記
アライメント推定部で作成された抑制標準パターンを適
応化する適応部とを有して構成される。
【0014】本願第4発明に係る抑制標準パターン(コ
ホート)作成方式は、入力された本人の音声データを特
徴ベクトルに変換する分析部と、前記分析部で変換され
た特徴ベクトルを記憶する特徴ベクトル記憶部と、1つ
以上の抑制話者の標準パターンが記憶されている抑制話
者標準パターン記憶部と、前記分析部で変換された特徴
ベクトルと前記抑制話者標準パターン記憶部に記憶され
ている各話者の標準パターンとの類似度を計算し、少な
くとも1人の抑制話者を選択する抑制話者選択部と、前
記抑制話者選択部で選択された抑制話者の標準パターン
と、前記特徴ベクトル記憶部に記憶されている本人の特
徴ベクトルを用い、本人の特徴ベクトル空間から抑制話
者の特徴ベクトル空間への写像関数を求める推定部と、
前記特徴ベクトル記憶部に記憶されている本人の特徴ベ
クトルを用い、本人が標準パターンを作成する標準パタ
ーン作成部と、前記推定部で求めた写像関数を基に、前
記標準パターン作成部で求められた本人の標準パターン
を適応化する適応部とを有して構成される。
【0015】本願第5発明に係る抑制標準パターン(コ
ホート)作成方式は、第1、2、3、4発明の抑制話者
標準パターン記憶部において、1つ以上の話者標準パタ
ーンの各話者標準パターンとして、2人以上の話者の特
徴を備えた標準パターンを記憶することを特徴とする。
【0016】本願第6発明に係る抑制標準パターン(コ
ホート)作成方式は、入力された本人の音声データを特
徴ベクトルに変換する分析部と、前記分析部で変換され
た特徴ベクトルを記憶する特徴ベクトル記憶部と、1つ
以上の抑制話者の標準パターンが記憶されている抑制話
者標準パターン記憶部と、前記分析部で変換された特徴
ベクトルと、前記抑制話者標準パターン記憶部に記憶さ
れている話者の標準パターンとを用い、抑制話者の特徴
ベクトル空間から本人の特徴ベクトル空間への写像関数
を求める推定部と、前記推定部で求めた写像関数を基
に、前記抑制話者標準パターン記憶部に記憶されている
抑制話者の標準パターンを適応化する適応部と、前記適
応部で適応化された標準パターンと前記特徴ベクトル記
憶部に記憶されている本人の特徴ベクトルから、類似度
を計算し、少なくとも1人の抑制話者を選択する抑制話
者選択部とを有して構成される。
【0017】本願第7発明に係る抑制標準パターン(コ
ホート)作成方式は、入力された本人の音声データを特
徴ベクトルに変換する分析部と、前記分析部で変換され
た特徴ベクトルを記憶する特徴ベクトル記憶部と、1つ
以上の抑制話者標準パターンが記憶されている抑制話者
標準パターン記憶部と、前記分析部で変換された本人の
第1の発声(内容既知)に対する特徴ベクトルと、前記
抑制話者標準パターン記憶部に記憶されている話者の標
準パターンとを用い、各抑制話者の特徴ベクトル空間か
ら本人の特徴ベクトル空間への写像関数を求める推定部
と、前記推定部で求められた写像関数を基に、前記抑制
話者標準パターン記憶部に記憶されている抑制話者の標
準パターンを適応化する適応部と、前記適応部で適応化
された標準パターンを用い、前記特徴ベクトル記憶部に
記憶されている本人の第2の発声(内容未知)から求め
られた特徴ベクトルのアライメントを推定し、推定され
たアライメントを基に、第2の発声に相当する抑制標準
パターンを作成するアライメント推定部と、前記アライ
メント推定部で求められた抑制標準パターンと、前記特
徴ベクトル記憶部に記憶されている本人の第2の発声の
特徴ベクトルから類似度を計算し、少なくとも1人の抑
制話者を選択する抑制話者選択部とを有して構成され
る。
【0018】本願第8発明に係る抑制標準パターン(コ
ホート)作成方式は、入力された本人の音声データを特
徴ベクトルに変換する分析部と、前記分析部で変換され
た特徴ベクトルを記憶する特徴ベクトル記憶部と、1つ
以上の抑制話者標準パターンが記憶されている抑制話者
標準パターン記憶部と、前記分析部で変換された本人の
第1の発声(内容既知)に対する特徴ベクトルと、前記
抑制話者標準パターン記憶部に記憶されている話者の標
準パターンとを用い、各抑制話者の特徴ベクトル空間か
ら本人の特徴ベクトル空間への写像関数を求める推定部
と、前記抑制話者標準パターン記憶部に記憶されている
抑制話者の標準パターンを用い、前記特徴ベクトル記憶
部に記憶されている本人の第2の発声から求められた特
徴ベクトルのアライメントを推定し、推定されたアライ
メントを基に、第2の発声(内容未知)に相当する抑制
標準パターンを作成するアライメント推定部と、前記推
定部で推定された写像関数を用い、前記アライメント推
定部で求められた抑制標準パターンを適応化する適応部
と、前記適応部で適応化された抑制標準パターンと、前
記特徴ベクトル記憶部に記憶されている本人の第2の発
声の特徴ベクトルから、類似度を計算し、少なくとも1
人の抑制話者を選択する抑制話者選択部とを有して構成
される。
【0019】本願第9発明に係る抑制標準パターン(コ
ホート)作成方式は、入力された本人の音声データを特
徴ベクトルに変換する分析部と、前記分析部で変換され
た特徴ベクトルを記憶する特徴ベクトル記憶部と、抑制
話者の標準パターンが記憶されている抑制話者標準パタ
ーン記憶部と、前記分析部で変換された特徴ベクトル
と、前記抑制話者標準パターン記憶部に記憶されている
話者の標準パターンとを用い、本人の特徴ベクトル空間
から抑制話者の特徴ベクトル空間への写像関数を求める
推定部と、前記特徴ベクトル記憶部に記憶されている本
人の特徴ベクトルを用い、本人の標準パターンを作成す
る標準パターン作成部と、前記推定部で求めた写像関数
を基に、前記標準パターン作成部で求められた本人の標
準パターンを適応化する適応部と、前記適応部で適応化
された標準パターンと前記特徴ベクトル記憶部に記憶さ
れている本人の特徴ベクトルから、類似度を計算し、少
なくとも1人の抑制話者を選択する抑制話者選択部とを
有して構成される。
【0020】本願第10発明に係る抑制標準パターン
(コホート)作成方式は、第6、7、8、9発明の抑制
話者標準パターン記憶部において、1つ以上の話者標準
パターンの各標準パターンにおいて、2人以上の話者の
特徴を備えた標準パターンを記憶することを特徴とす
る。
【0021】本願第11発明に係る抑制標準パターン
(コホート)作成方式は、入力された本人の入力音声デ
ータを特徴ベクトルに変換する分析部と、抑制標準パタ
ーン作成部と、話者の標準パターンが記憶されている話
者標準パターン記憶部と、前記分析部で変換された本人
の特徴ベクトルと、前記抑制標準パターン作成部で作成
された抑制標準パターンと、前記話者標準パターン記憶
部に記憶されている本人の標準パターンを用い、特徴ベ
クトルと本人の標準パターンとの距離の値から、特徴ベ
クトルと抑制標準パターンとの距離の値を差し引くこと
で正規化を行う距離計算部と、前記距離計算部で計算さ
れた距離を基に本人判定を行う判定部とを有して構成さ
れる。
【0022】
【発明の実施の形態】本発明の好ましい実施の形態につ
いて以下に説明する。最初に、抑制標準パターンによる
距離正規化について、距離尺度を尤度とした場合の説明
を行う。以下の説明は、尤度を標準パターン間の距離に
置き換えても同様に成り立つ。
【0023】抑制標準パターンによる尤度正規化とは、
本人の音声に近い音声を持つ話者を抑制話者として選択
し、照合時の距離計算の際に、本人の尤度から抑制話者
の尤度を差し引くことによって正規化を行う手法であ
る。差し引かれる抑制話者の尤度としては、抑制話者中
の最大尤度、平均値など様々な方法が考えられる。抑制
標準パターンによる尤度正規化は次式(1)の通りであ
る。
【0024】
【数1】
【0025】log(p(O/I))は、本人Iのモデ
ルに対して観測ベクトルOが観測される確率の尤度であ
り、log(p(O/ck(I)))は、本人Iの抑制
話者セットであるC(I)中のk番目の抑制話者の標準
パターンに対して観測ベクトルOが観測される確率の尤
度である。
【0026】statは抑制話者の中の最大尤度をとる
か、又は平均値をとるかなどの種々の統計的な計算方法
を表す。また、Scoreは、正規化された尤度であ
る。登録時と照合時の様々な環境差は、本人の尤度と抑
制話者の尤度に同様に影響しているため、本人の尤度か
ら抑制話者の尤度を差し引くことによって、登録時と照
合時の環境差を取り除くことができると考えられてい
る。
【0027】上記したように、従来の方法は、様々な回
線特性に対応するため、多くの抑制標準パターンを用意
しなくてはならないという問題点や、本人と抑制話者が
異なる単語を発声した場合、精度の良い抑制標準パター
ンを作成できないという問題点があった。
【0028】本発明は、これらの問題点を解決する方法
として、適応化を用いた抑制標準パターン作成方法、お
よびその方法を含む話者照合装置を提供する。適応化と
しては、高速環境適応(RIALISE法)(高木、
“スペクトル写像による環境適応機能を有する音声認
識”、音響講論、pp173−174(1994.
3))(「文献5」という)、木構造話者適応(ACT
S)(篠田、“木構造化された確率分布を用いた話者適
応化”、音響講論、pp49−50(1995.3))
(「文献6」という)、スペクトル内挿話者適応(篠
田、“半音節HMMによる音声認識のための話者適
応”、音響講論、pp23−24(1991.9))
「文献7」という)などを用いることができる。
【0029】ここでは、高速環境適応について説明す
る。高速環境適応は、認識時の発声自身を用いて、回線
歪み、付加雑音に関するスペクトル上での発生と標準パ
ターンとの差異を取りだし、この差を用いて標準パター
ンを発生環境に適応化する方法である。
【0030】適応化の式は、適応前の標準パターンのス
ペクトル時系列をW(t)、適応後の標準パターンのス
ペクトル時系列をW^(t)とすると次式で与えられ
る。
【0031】
【数2】
【0032】このうち上式(2)は標準パターンの雑音
部分に関する適応化であり、上式(3)は標準パターン
の音声部分に関する適応化である。ここで、Swは標準
パターンの音声モデルの平均スペクトル、Nwは標準パ
ターンの雑音モデルの平均スペクトル、Svは音声区間
と対応付けられた入力音声の平均スペクトル、Nvは雑
音区間と対応付けられた入力音声の平均スペクトルであ
る。
【0033】この方法を抑制標準パターン(コホート)
作成に用いる場合、種々の使い方が考えられる。
【0034】まず第1の方法として、抑制話者選択後、
抑制話者の特徴ベクトル空間から本人の特徴ベクトル空
間への写像関数を求め、その写像関数を用いて抑制話者
の標準パターンを適応する方法がある。
【0035】この方法は、登録時の本人の音声を用いて
適応するため、登録時の環境を含んだ新たな抑制標準パ
ターンを作成することができる。このため、本人の標準
パターンと抑制標準パターンとの環境差(周囲雑音、回
線特性など)を取り除くことができ、少数の抑制標準パ
ターンでより良い話者照合率を得ることができる。
【0036】第2の方法として、抑制話者選択後、本人
の第1発声(内容既知)を用い、抑制話者の特徴ベクト
ル空間から本人の特徴ベクトル空間への写像関数を求
め、その写像関数を用いて抑制話者の標準パターンを適
応化し、適応化した標準パターンを用いて本人の第2発
声(内容未知)に対する抑制標準パターンを作成する方
法がある。
【0037】この第2の方法を用いると、本人と抑制話
者が異なる単語を発声した場合にも抑制標準パターンが
作成できる。これについては、本人の内容未知の発声を
連続音素認識し、認識された発声内容をもとに写像関数
の推定し、適応化を行うことは可能だが、写像関数の推
定精度が低い。この方法を用いると、内容既知の発声を
用いて写像関数の推定を行うことができるため、精度良
い抑制標準パターンを作成できるという利点がある。
【0038】第3の方法として、抑制話者を選択した
後、本人の第1発声(内容既知)を用い、抑制話者の特
徴ベクトル空間から本人の特徴ベクトル空間への写像関
数を求め、抑制話者の標準パターンを用いて作成された
本人の第2発声(内容未知)に対する抑制標準パターン
を、求められた写像関数を用いて適応化し、新たな抑制
標準パターンを作成する方法がある。
【0039】この第3の方法の利点は第2の方法の利点
とほぼ同じであるが、登録時に低SNR(信号対雑音
比)であり、写像関数がうまく推定されない場合、第2
の方法よりも第3の方法の方が精度良い抑制標準パター
ンを作成することができる。
【0040】第4の方法として、本人の特徴ベクトル空
間から抑制話者の特徴ベクトル空間への写像関数を求
め、その写像関数を用いて本人の標準パターンを適応化
する方法がある。
【0041】この第4の方法は、本人の登録時の標準パ
ターンの時間構造などの特徴を抑制標準パターンに反映
させることができるという利点を持つ。またこの第4の
方法は、本人と抑制話者が異なる単語を発声した場合に
も同様の効果を有する。
【0042】第5の方法として、上記第1、2、3、4
の方法の抑制標準パターン作成方法において、写像関数
の推定に用いる抑制標準パターンとして、2人以上の話
者の特徴を備えた標準パターンを用いる方法がある。
【0043】この第5の方法は、写像関数の推定用の標
準パターンとして2人以上の話者の特徴を備えた標準パ
ターンを用いるため、1つの標準パターンで複数話者の
標準パターンを表現することができ、少ない抑制標準パ
ターン数で安定した写像関数を得ることができる。この
ため、少ない計算量でより良い話者照合率を得ることが
できる。
【0044】第6の方法として、第1〜5の各方法中の
抑制話者を選択する部分と適応化する部分の順番を変え
た方法、すなわち、全ての抑制話者の標準パターンを用
い、本人の標準パターンを適応し、その後、本人の標準
パターンと距離の近い順に適応化後の標準パターンから
抑制標準パターンを選択する方法がある。
【0045】この第6の方法は、原理的には、第1〜5
の方法と同じであるが、適応化時の精度を考慮できるた
め、より精度の良い抑制標準パターンを作成できるとい
う利点を持つ。
【0046】上記した本発明の実施の形態の抑制標準パ
ターン(コホート)作成方法を用いることによって、少
数の抑制標準パターンで、高い話者照合率を得ることが
できる。また、抑制話者選択、推定に用いた発声と適応
に用いる発声内容が異なる場合でも、簡単に精度良い抑
制標準パターンを作成することができる。
【0047】
【実施例】上記した本発明の実施の形態について更に詳
細に説明すべく本発明の実施例について図面を参照して
説明する。
【0048】図1は、本発明の一実施例の構成を示すブ
ロック図である。本実施例においては、抑制話者を選択
した後、抑制話者の特徴ベクトル空間から本人の特徴ベ
クトル空間への写像関数を求め、その写像関数を用いて
抑制話者の標準パターンを適応化する。
【0049】図1を参照すると、入力された本人の音声
は分析部10に送られる。分析部10に送られた入力音
声は、特徴ベクトルに変換され、特徴ベクトル記憶部3
0と抑制話者選択部40に送られる。特徴ベクトルの例
としては、ケプストラム、Δケプストラムなどを用い
る。ケプストラム、Δケプストラムについては、古井、
「ディジタル音声処理」、東海大学出版会、pp44−
47、1985年(「文献8」という)等が参照され
る。
【0050】抑制話者選択部40では、分析部10から
送られた本人の特徴ベクトルと、抑制話者標準パターン
記憶部20から送られた各話者の標準パターンとの間で
距離計算が行われ、距離の小さい順に、話者標準パター
ンを抑制標準パターンとして選択する。この距離計算方
法については、DPマッチングや(例えば文献(9)
(迫江、千葉、“動的計画法を利用した時間正規化に基
づく連続音声認識”、音響誌、27、9、pp483−
490、昭和49年9月)が参照される)やViter
biアルゴリズム(例えば文献(10)(L.R.Ra
biner and M.M.Sondhi:“On
the application ofvector
quantization and hidden m
arkov models to speaker−i
ndependent,isolated word
recognition”,ibid,pp1075−
1105)が参照される)などを用いる。
【0051】また、抑制話者標準パターン記憶部20
は、各話者の特徴を備えた標準パターンや2人以上の話
者の特徴を備えた標準パターンなど、様々な標準パター
ンが記憶されている。選択された抑制標準パターンは、
推定部50に送られる。
【0052】推定部50では、抑制話者選択部40から
送られた抑制標準パターンと、特徴ベクトル記憶部30
から送られた本人の特徴ベクトルと、から、抑制話者の
特徴ベクトル空間から本人の特徴ベクトル空間への写像
関数を求める。
【0053】求めるべき写像関数は、用いる適応化方式
に依存するが、例えば、高速環境適応の場合、上式
(3)の、Sw(標準パターンの音声モデルの平均スペ
クトル)、Nw(標準パターンの無音部分の平均スペク
トル)、Sv(音声区間と対応付けられた入力音声の平
均スペクトル)、Nv(雑音区間と対応付けられた入力
音声の平均スペクトル)である(その詳細については上
記文献5が参照される)。
【0054】木構造話者適応を用いた場合には、抑制話
者と本人の標準パターンの構成要素である各ノード間の
マッピングを表す関数であり、スペクトル内挿話者適応
を用いた場合には、抑制話者の特徴ベクトル空間から本
人の特徴ベクトル空間へのスペクトル写像関数である。
木構造話者適応の各ノード間のマッピングを表す関数の
詳細については、例えば上記文献6の記載が参照される
(すなわち関数の詳細は本願明細書では示さないが、そ
の詳細は上記文献6に記載の式(1)が参照される)。
スペクトル内挿話者適応のスペクトル写像関数について
は、例えば上記文献7が記載が参照される(すなわち関
数の詳細は本願明細書では示さないが、その詳細は上記
文献7に記載の式(1)が参照される)。そして、推定
部50で求められた写像関数は、適応部60に送られ
る。
【0055】適応部60では、推定部50から送られた
写像関数を基に、抑制話者選択部40で選択された抑制
標準パターンの適応化を行う。高速環境適応を用いた場
合には、上式(2)、及び上式(3)に従い、適応化を
行う。また木構造話者適応を用いた場合には、上記文献
6に方法に従い、適応化を行う(本願明細書では関数式
は明示しないが、その詳細は上記文献6に記載の第4式
が参照される)。さらにスペクトル内挿話者適応を用い
た場合には、上記文献7の方法に従い適応化を行う(本
願明細書では関数式は明示しないが、その詳細は上記文
献7に記載の式(2)が参照される)。適応部60で適
応化された新たな抑制標準パターンが出力となる。
【0056】図2は、本発明の第2の実施例の構成を示
すブロック図である、本実施例では、抑制話者選択後、
本人の第1発声(内容既知)を用いて抑制話者の特徴ベ
クトル空間から本人の特徴ベクトル空間への写像関数を
求め、その写像関数を用い抑制話者の標準パターンを適
応化し、適応化後の抑制標準パターンを用いて本人の第
2発声(内容未知)に相当する抑制標準パターンを作成
する。
【0057】入力された本人の第1発声(内容既知)、
第2発声(内容未知)は、分析部110に送られる。分
析部110に送られた入力音声は、特徴ベクトルに変換
され、特徴ベクトル記憶部130に送られる。また、第
1の発声から求められた特徴ベクトルは抑制話者選択部
140に送られる。
【0058】抑制話者選択部140では、分析部110
から送られた本人の特徴ベクトルと、抑制話者標準パタ
ーン記憶部120から送られた各話者の標準パターンと
の間で距離計算が行われ、距離の小さい順に、話者標準
パターンを抑制標準パターンとして選択する。選択され
た抑制標準パターンは、推定部150に送られる。
【0059】推定部150は、抑制話者選択部140か
ら送られた抑制標準パターンと、特徴ベクトル記憶部1
30から送られた本人の第1発声の特徴ベクトルから、
抑制話者の特徴ベクトル空間から本人の特徴ベクトル空
間への写像関数を求める。ここで求められた写像関数
は、適応部160に送られる。
【0060】適応部160では、推定部150から送ら
れた写像関数を基に、抑制話者選択部140で選択され
た抑制標準パターンの適応化を行う。ここで適応化され
た標準パターンはアライメント推定部170に送られ
る。
【0061】アライメント推定部170では、適応部1
60から送られた標準パターンと特徴ベクトル記憶部1
30から送られた本人の第2発声の特徴ベクトルとの間
のアライメントを推定する。推定には、DPマッチング
(上記文献9に詳しい)やViterbiアルゴリズム
(上記文献10に詳しい)を用いる。
【0062】ここで推定されたアライメントに相当する
音素の順に、適応部160から送られた標準パターンを
連鎖し、本人の第2発声に相当する抑制標準パターンを
作成する。ここで作成された抑制標準パターンを出力す
る。
【0063】図3は、本発明の第3の実施例の構成を示
すブロック図である。本実施例では、抑制話者選択後、
本人の第1発声(内容既知)を用いて抑制話者の特徴ベ
クトル空間から本人の特徴ベクトル空間への写像関数を
求め、適応化前の抑制話者の標準パターンを用いて本人
の第2発声(内容未知)に相当する標準パターンを作成
し、作成した標準パターンを推定した写像関数を用いて
適応化する。
【0064】入力された本人の第1発声(内容既知)、
第2発声(内容未知)は、分析部210に送られる。分
析部210に送られた入力音声は、特徴ベクトルに変換
され、特徴ベクトル記憶部230に送られる。また、第
1の発声から求められた特徴ベクトルは抑制話者選択部
240に送られる。
【0065】抑制話者選択部240では、分析部210
から送られた本人の特徴ベクトルと、抑制話者標準パタ
ーン記憶部220から送られた各話者の標準パターンと
の間で距離計算が行われ、距離の小さい順に、話者標準
パターンを抑制標準パターンとして選択する。選択され
た抑制標準パターンは、推定部250に送られる。
【0066】推定部250では、抑制話者選択部240
から送られた抑制標準パターンと、特徴ベクトル記憶部
230から送られた本人の第1発声の特徴ベクトルか
ら、抑制話者の特徴ベクトル空間から本人の特徴ベクト
ル空間への写像関数を求める。ここで求められた写像関
数は、適応部260に送られる。
【0067】アライメント推定部270では、抑制話者
標準パターン記憶部220から送られた標準パターンと
特徴ベクトル記憶部から送られた本人の第2発声の特徴
ベクトルとの間のアライメントを推定する。ここで推定
されたアライメントに相当する音素の順に、抑制話者標
準パターン記憶部220から送られた標準パターンを連
鎖し、本人の第2発声に相当する抑制標準パターンを作
成する。作成された抑制標準パターンは適応部260に
送られる。
【0068】適応部260では、推定部250から送ら
れた写像関数を基に、アライメント推定部270で作成
された抑制標準パターンの適応化を行う。ここで適応化
された抑制標準パターンが出力となる。
【0069】図4は、本発明の第4の実施例の構成を示
す図である。本実施例では、抑制話者選択後、本人の特
徴ベクトル空間から抑制話者の特徴ベクトル空間への写
像関数を求め、その写像関数を用い本人の標準パターン
を適応化する。
【0070】入力された本人の音声は、分析部310に
送られる。分析部310に送られた入力音声は、特徴ベ
クトルに変換され、特徴ベクトル記憶部330と抑制話
者選択部340に送られる。
【0071】抑制話者選択部340では、分析部310
から送られた本人の特徴ベクトルと、抑制話者標準パタ
ーン記憶部320から送られた各話者の標準パターンと
の間で距離計算が行われ、距離の小さい順に、話者標準
パターンを抑制標準パターンとして選択する。選択され
た抑制標準パターンは、推定部350に送られる。
【0072】推定部350では、抑制話者選択部340
から送られた抑制標準パターンと、特徴ベクトル記憶部
330から送られた本人の特徴ベクトルから、本人の特
徴ベクトル空間から抑制話者の特徴ベクトル空間への写
像関数を求める。ここで求められた写像関数は、適応部
370に送られる。
【0073】標準パターン作成部360では、特徴ベク
トル記憶部330から送られた本人の特徴ベクトルを用
い、本人の標準パターンを作成する。作成方法として
は、標準パターンがHMM(隠れマルコフモデル)
(S.E.Levinsin,L.R.Rabina
r,and M.M.Sondhi:“An Intr
oduction to the Applicati
on of the Theory of Proba
bilistic Functions of Mar
kov Process to Automatic
Speech Recognition”,The B
ell System Technical Jour
nal Vol.62,No.4,1983,pp10
35−1074)(「文献11」という)の場合、本人
の特徴ベクトルを学習データ、標準パターン作成部36
0に記憶されているHMMを初期HMMとして、HMM
の学習を行う。学習アルゴリズムは、前向きパスアルゴ
リズム(例えば、中川、「確率モデルによる音声認
識」、電子情報通信学会編、p.40−44、1988
年)(「文献12」という)や、スペクトル内挿話者適
応(上記文献7に詳しい)を用いる。
【0074】学習後のHMMが作成された標準パターン
となる。また、標準パターンがテンプレートの場合、特
徴ベクトルそのものが標準パターンとなる。作成された
標準パターンは、適応部370に送られる。
【0075】適応部370では、推定部350から送ら
れた写像関数を基に、標準パターン作成部360から送
られる本人の標準パターンの適応化を行う。ここで適応
化された新たな抑制標準パターンが出力となる。この手
法は、写像関数推定時と適応時の発声内容が異なる場合
でも成り立つ。
【0076】図5は、本発明の第5の実施例の構成を示
す図である。本実施例では、抑制話者の特徴ベクトル空
間から本人の特徴ベクトル空間への写像関数を求め、そ
の写像関数を用い抑制話者標準パターンを適応化し、適
応化後に抑制話者の選択を行う。
【0077】入力された本人の音声は、分析部410に
送られる。分析部410に送られた入力音声は、特徴ベ
クトルに変換され、特徴ベクトル記憶部430と、推定
部440に送られる。
【0078】推定部440では、抑制話者標準パターン
記憶部420から送られた各話者の標準パターンと、分
析部410から送られた本人の特徴ベクトルとを用い、
各抑制話者の特徴ベクトル空間から本人の特徴ベクトル
空間への写像関数を求める。ここで求められた写像関数
は、適応部450に送られる。
【0079】適応部450では、推定部440から送ら
れた写像関数を基に、抑制話者標準パターン記憶部42
0から送られる各話者の標準パターンの適応化を行う。
ここで適応化された標準パターンは、抑制話者選択部4
60に送られる。
【0080】抑制話者選択部460では、適応部450
から送られた適応化後の標準パターンと、特徴ベクトル
記憶部430から送られた本人の特徴ベクトルとの間で
距離計算が行われ、距離の小さい順に、適応化後の話者
標準パターンを抑制標準パターンとして選択する。ここ
で選択された標準パターンが出力となる。
【0081】図6は、本発明の第6の実施例の構成を示
す図である。本実施例では、本人の第1発声(内容既
知)を用いて抑制話者の特徴ベクトル空間から本人の特
徴ベクトル空間への写像関数を求め、その写像関数を用
い抑制話者の標準パターンを適応化し、適応化後の抑制
標準パターンから抑制話者を選択する。
【0082】入力された本人の第1発声(内容既知)、
第2発声(内容未知)は、分析部510に送られる。分
析部510に送られた入力音声は、特徴ベクトルに変換
され、特徴ベクトル記憶部530に送られる。また、第
1の発声から求められた特徴ベクトルは推定部540に
送られる。
【0083】推定部540では、抑制話者標準パターン
記憶部520から送られた標準パターンと、特徴ベクト
ル記憶部530から送られた本人の第1発声の特徴ベク
トルから、抑制話者の特徴ベクトル空間から本人の特徴
ベクトル空間への写像関数を求める。ここで求められた
写像関数は、適応部550に送られる。
【0084】適応部550では、推定部540から送ら
れた写像関数を基に、抑制話者標準パターン記憶部52
0から送られた標準パターンの適応化を行う。ここで適
応化された標準パターンはアライメント推定部560に
送られる。
【0085】アライメント推定部560では、適応部5
50から送られた標準パターンと特徴ベクトル記憶部5
30から送られた本人の第2発声の特徴ベクトルとの間
のアライメントを推定する。ここで推定されたアライメ
ントに相当する音素の順に、適応部550から送られた
標準パターンを連鎖し、本人の第2発声に相当する抑制
標準パターンを作成する。ここで作成された抑制標準パ
ターンは、抑制話者選択部570に送られる。
【0086】抑制話者選択部570では、特徴ベクトル
記憶部530から送られた本人の第2発声の特徴ベクト
ルと、アライメント推定部560から送られた標準パタ
ーンとの間で距離計算が行われ、距離の小さい順に、抑
制標準パターンとして選択する。選択された抑制標準パ
ターンが出力となる。
【0087】図7は、本発明の第7の実施例の構成を示
す図である。本実施例では、本人の第1発声(内容既
知)を用いて抑制話者の特徴ベクトル空間から本人の特
徴ベクトル空間への写像関数を求め、抑制話者の標準パ
ターンを用いて本人の第2発声(内容未知)に相当する
抑制標準パターンを作成し、作成した標準パターンを適
応し、適応化後に抑制話者を選択する。
【0088】入力された本人の第1発声(内容既知)、
第2発声(内容未知)は、分析部610に送られる。分
析部610に送られた入力音声は、特徴ベクトルに変換
され、特徴ベクトル記憶部630に送られる。また、第
1の発声から求められた特徴ベクトルは推定部640に
送られる。
【0089】推定部640では、話者標準パターン記憶
部620から送られた標準パターンと分析部610から
送られた本人の第1発声の特徴ベクトルから、抑制話者
の特徴ベクトル空間から本人の特徴ベクトル空間への写
像関数を求める。ここで求められた写像関数は、適応部
650に送られる。
【0090】アライメント推定部660では、抑制話者
標準パターン記憶部620から送られた標準パターン
と、特徴ベクトル記憶部630から送られた本人の第2
発声の特徴ベクトルとの間のアライメントを推定する。
ここで推定されたアライメントに相当する音素の順に、
抑制話者標準パターン記憶部620から送られた標準パ
ターンを連鎖し、本人の第2発声に相当する抑制標準パ
ターンを作成する。作成された抑制標準パターンは適応
部650に送られる。
【0091】適応部650では、推定部640から送ら
れた写像関数を基に、アライメント推定部660で作成
された抑制標準パターンの適応化を行う。ここで適応化
された標準パターンは、抑制話者選択部670に送られ
る。
【0092】抑制話者選択部670では、特徴ベクトル
記憶部630から送られた本人の第2発声の特徴ベクト
ルとの間で距離計算が行われ、距離の小さい順に、話者
標準パターンを抑制標準パターンとして選択する。選択
された抑制標準パターンが出力となる。
【0093】図8は、本発明の第8の実施例の構成を示
す図である。本実施例では、本人の特徴ベクトル空間か
ら抑制話者の特徴ベクトルへの写像関数を求め、その写
像関数を用い本人の標準パターンを適応化し、適応化後
に抑制話者の選択を行う。
【0094】入力された本人の音声は、分析部710に
送られる。分析部710に送られた入力音声は、特徴ベ
クトルに変換され、特徴ベクトル記憶部730と、推定
部740に送られる。
【0095】推定部740では、抑制話者標準パターン
記憶部730から送られた各話者の標準パターンと、分
析部710から送られた本人の特徴ベクトルとを用い、
本人の特徴ベクトル空間から各抑制話者の特徴ベクトル
空間への写像関数を求める。ここで求められた写像関数
は、適応部750に送られる。
【0096】標準パターン作成部750では、特徴ベク
トル記憶部730に記憶されている本人の特徴ベクトル
を用い、本人の標準パターンを作成する。作成された標
準パターンは適応部760に送られる。
【0097】適応部760では、推定部740から送ら
れた写像関数を基に、標準パターン作成部750から送
られる本人の標準パターンの適応化を行う。ここで適応
化された標準パターンは、抑制話者選択部770に送ら
れる。
【0098】抑制話者選択部770では、適応部760
から送られた適応化後の標準パターンと、特徴ベクトル
記憶部730から送られた本人の特徴ベクトルとの間で
距離計算が行われ、距離の小さい順に、適応化後の話者
標準パターンを抑制標準パターンとして選択する。ここ
で選択された抑制標準パターンが出力となる。この手法
は、写像関数推定時と適応時の発生内容が異なる場合で
も成り立つ。
【0099】図9は、図1〜図8を参照して説明した上
記各実施例の抑制標準パターン作成方法を搭載した話者
照合装置の構成を示す図である。
【0100】入力された本人の入力音声は、分析部81
0に送られる。分析部810に送られた入力音声は、特
徴ベクトルに変換され、距離計算部840に送られる。
【0101】抑制標準パターン作成部820では、上記
実施例の各方法を用い、抑制標準パターンが作成され
る。作成された抑制標準パターンは、距離計算部840
に送られる。
【0102】距離計算部840では、最初に、話者標準
パターン記憶部830から送られた本人の標準パターン
と、分析部810から送られた本人の特徴ベクトルとの
間の距離計算を行う。この結果を距離1とする。次に、
抑制標準パターン作成部820から送られた抑制標準パ
ターンと本人の特徴ベクトルとの間の距離計算を行う。
この結果を距離2とする。次に、距離1から距離2を差
し引くことで、抑制標準パターンによる距離(尤度)の
正規化を行う。正規化後の距離(尤度)の値が判定部8
50に送られる。
【0103】判定部850では、予め定められている閾
値と、距離計算部840から送られた距離(尤度)の値
とを用い、閾値よりも求めた距離が小さければ(尤度が
大きければ)本人であると判定し、距離が大きければ
(尤度が小さければ)本人ではないという判定を行う。
【0104】
【発明の効果】以上説明したように、本発明によれば、
話者照合において、登録時と照合時の環境が大きく異な
る場合でも、少数の抑制標準パターンで、高い話者照合
時を得ることができる。また、本人と抑制話者が異なる
単語を発声した場合でも、精度の良い抑制標準パターン
を作成することができる。
【図面の簡単な説明】
【図1】本発明の抑制標準パターン(コホート)作成方
法の第1の実施例を説明するためのブロック図である。
【図2】本発明の抑制標準パターン(コホート)作成方
法の第2の実施例を説明するためのブロック図である。
【図3】本発明の抑制標準パターン(コホート)作成方
法の第3の実施例を説明するためのブロック図である。
【図4】本発明の抑制標準パターン(コホート)作成方
法の第4の実施例を説明するためのブロック図である。
【図5】本発明の抑制標準パターン(コホート)作成方
法の第5の実施例を説明するためのブロック図である。
【図6】本発明の抑制標準パターン(コホート)作成方
法の第6の実施例を説明するためのブロック図である。
【図7】本発明の抑制標準パターン(コホート)作成方
法の第7の実施例を説明するためのブロック図である。
【図8】本発明の抑制標準パターン(コホート)作成方
法の第8の実施例を説明するためのブロック図である。
【図9】本発明の話者照合装置の一実施例を示すブロッ
ク図である。
【図10】従来の構成を示すブロック図である。
【符号の説明】
10 分析部 20 抑制話者標準パターン記憶部 30 特徴ベクトル記憶部 40 抑制話者選択部 50 推定部 60 適応部 110 分析部 120 抑制話者標準パターン記憶部 130 特徴ベクトル記憶部 140 抑制話者選択部 150 推定部 160 適応部 170 アライメント推定部 210 分析部 220 抑制話者標準パターン記憶部 230 特徴ベクトル記憶部 240 抑制話者選択部 250 推定部 260 適応部 270 アライメント推定部 310 分析部 320 抑制話者標準パターン記憶部 330 特徴ベクトル記憶部 340 抑制話者選択部 350 推定部 360 標準パターン作成部 370 適応部 410 分析部 420 抑制話者標準パターン記憶部 430 特徴ベクトル記憶部 440 推定部 450 適応部 460 抑制話者選択部 510 分析部 520 抑制話者標準パターン記憶部 530 特徴ベクトル記憶部 540 推定部 550 適応部 560 アライメント推定部 570 抑制話者選択部 610 分析部 620 抑制話者標準パターン記憶部 630 特徴ベクトル記憶部 640 推定部 650 適応部 660 アライメント推定部 670 抑制話者選択部 710 分析部 720 抑制話者標準パターン記憶部 730 特徴ベクトル記憶部 740 推定部 750 標準パターン作成部 760 適応部 770 抑制話者選択部 810 分析部 820 抑制標準パターン作成部 830 話者標準パターン記憶部 840 距離計算部 850 判定部 1010 分析部 1020 抑制話者標準パターン記憶部 1030 抑制話者選択部
フロントページの続き (56)参考文献 特開 昭62−260195(JP,A) 特開 昭62−249199(JP,A) 特開 昭59−178587(JP,A) 特開 昭58−76893(JP,A) 特公 平5−82957(JP,B2) 特公 平5−82956(JP,B2) 欧州特許出願公開858068(EP,A 2) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 545 G10L 3/00 521 G10L 3/00 531 WPI(DIALOG)

Claims (29)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された特徴ベクトルと、前記抑制話者
    標準パターン記憶部に記憶されている各話者の標準パタ
    ーンと、の類似度を計算し、少なくとも1人の抑制話者
    を選択する抑制話者選択部と、 前記抑制話者選択部で選択された抑制話者の標準パター
    ンと、前記特徴ベクトル記憶部に記憶されている本人の
    特徴ベクトルと、を用いて、抑制話者の特徴ベクトル空
    間から本人の特徴ベクトル空間への写像関数を求める推
    定部と、 前記推定部で求められた写像関数を基に、前記抑制話者
    標準パターン記憶部に記憶されている抑制話者の標準パ
    ターンを適応化する適応部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  2. 【請求項2】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された特徴ベクトルと、前記抑制話者
    標準パターン記憶部に記憶されている各話者の標準パタ
    ーンと、の類似度を計算し、少なくとも1人の抑制話者
    を選択する抑制話者選択部と、 前記抑制話者選択部で選択された抑制話者の標準パター
    ンと、前記特徴ベクトル記憶部に記憶されている本人の
    第1の発声(但し、内容が既知)から求められた特徴ベ
    クトルと、を用いて、抑制話者の特徴ベクトル空間から
    本人の特徴ベクトル空間への写像関数を求める推定部
    と、 前記推定部で求められた写像関数を基に、前記抑制話者
    標準パターン記憶部に記憶されている抑制話者の標準パ
    ターンを適応化する適応部と、 前記適応部で求められた適応化後の抑制話者標準パター
    ンを用いて、前記特徴ベクトル記憶部に記憶されている
    本人の第2の発声(但し、内容は未知)から求められた
    特徴ベクトルのアライメントを推定し、該推定されたア
    ライメントを基に第2の発声に相当する抑制標準パター
    ンを作成するアライメント推定部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  3. 【請求項3】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された特徴ベクトルと、前記抑制話者
    標準パターン記憶部に記憶されている各話者の標準パタ
    ーンと、の類似度を計算し、少なくとも1人の抑制話者
    を選択する抑制話者選択部と、 前記抑制話者選択部で選択された抑制話者の標準パター
    ンと、前記特徴ベクトル記憶部に記憶されている本人の
    第1の発声(但し、内容は既知)から求められた特徴ベ
    クトルと、を用いて、抑制話者の特徴ベクトル空間から
    本人の特徴ベクトル空間への写像関数を求める推定部
    と、 前記抑制話者選択部で選択された抑制話者の標準パター
    ンを用いて、前記特徴ベクトル記憶部に記憶されている
    本人の第2の発声(但し、内容は未知)から求められた
    特徴ベクトルのアライメントを推定し、該推定されたア
    ライメントを基に前記第2の発声に相当する抑制標準パ
    ターンを作成するアライメント推定部と、 前記推定部で推定された写像関数を用いて、前記アライ
    メント推定部で作成された抑制標準パターンを適応化す
    る適応部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  4. 【請求項4】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された特徴ベクトルと、前記抑制話者
    標準パターン記憶部に記憶されている各話者の標準パタ
    ーンと、の類似度を計算し、少なくとも1人の抑制話者
    を選択する抑制話者選択部と、 前記抑制話者選択部で選択された抑制話者の標準パター
    ンと、前記特徴ベクトル記憶部に記憶されている本人の
    特徴ベクトルと、を用いて、本人の特徴ベクトル空間か
    ら抑制話者の特徴ベクトル空間への写像関数を求める推
    定部と、 前記特徴ベクトル記憶部に記憶されている本人の特徴ベ
    クトルを用いて、本人の標準パターンを作成する標準パ
    ターン作成部と、 前記推定部で求めた写像関数を基に、前記標準パターン
    作成部で求められた本人の標準パターンを適応化する適
    応部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  5. 【請求項5】前記抑制話者標準パターン記憶部におい
    て、1つ以上の話者標準パターンの各話者標準パターン
    として、2人以上の話者の特徴を備えた標準パターンを
    記憶することを特徴とする請求項1〜4のいずれか一に
    記載の抑制標準パターン作成システム。
  6. 【請求項6】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された特徴ベクトルと、前記抑制話者
    標準パターン記憶部に記憶されている話者の標準パター
    ンと、を用いて、各抑制話者の特徴ベクトル空間から本
    人の特徴ベクトル空間への写像関数を求める推定部と、 前記推定部で求められた写像関数を基に、前記抑制話者
    標準パターン記憶部に記憶されている抑制話者の標準パ
    ターンを適応化する適応部と、 前記適応部で適応化された標準パターンと、前記特徴ベ
    クトル記憶部に記憶されている本人の特徴ベクトルと、
    から、類似度を計算し、少なくとも1人の抑制話者を選
    択する抑制話者選択部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  7. 【請求項7】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された本人の第1の発声(但し、内容
    は既知)に対する特徴ベクトルと、前記抑制話者標準パ
    ターン記憶部に記憶されている話者の標準パターンと、
    を用いて、各抑制話者の特徴ベクトル空間から本人の特
    徴ベクトル空間への写像関数を求める推定部と、 前記推定部で求められた写像関数を基に、前記抑制話者
    標準パターン記憶部に記憶されている抑制話者の標準パ
    ターンを適応化する適応部と、 前記適応部で適応化された標準パターンを用いて、前記
    特徴ベクトル記憶部に記憶されている本人の第2の発声
    (但し、内容は未知)から求められた特徴ベクトルのア
    ライメントを推定し、該推定されたアライメントを基
    に、前記第2の発声に相当する抑制標準パターンを作成
    するアライメント推定部と、 前記アライメント推定部で求められた抑制標準パターン
    と、前記特徴ベクトル記憶部に記憶されている本人の第
    2の発声の特徴ベクトルと、から類似度を計算し、少な
    くとも1人の抑制話者を選択する抑制話者選択部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  8. 【請求項8】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された本人の第1の発声(但し、内容
    は既知)に対する特徴ベクトルと、前記抑制話者標準パ
    ターン記憶部に記憶されている話者の標準パターンと、
    を用いて、各抑制話者の特徴ベクトル空間から本人の特
    徴ベクトル空間への写像関数を求める推定部と、 前記抑制話者標準パターン記憶部に記憶されている抑制
    話者の標準パターンを用いて、前記特徴ベクトル記憶部
    に記憶されている本人の第2の発声(但し、内容は未
    知)から求められた特徴ベクトルのアライメントを推定
    し、該推定されたアライメントを基に、前記第2の発声
    に相当する抑制標準パターンを作成するアライメント推
    定部と、 前記推定部で推定された写像関数を用いて、前記アライ
    メント推定部で求められた抑制標準パターンを適応化す
    る適応部と、 前記適応部で適応化された抑制標準パターンと、前記特
    徴ベクトル記憶部に記憶されている本人の第2の発声の
    特徴ベクトルと、から類似度を計算し、少なくとも1人
    の抑制話者を選択する抑制話者選択部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  9. 【請求項9】入力された本人の音声データを特徴ベクト
    ルに変換する分析部と、 前記分析部で変換された特徴ベクトルを記憶する特徴ベ
    クトル記憶部と、 1又は複数の抑制話者標準パターンが記憶されている抑
    制話者標準パターン記憶部と、 前記分析部で変換された特徴ベクトルと、前記抑制話者
    標準パターン記憶部に記憶されている話者の標準パター
    ンと、を用いて、本人の特徴ベクトル空間から各抑制話
    者の特徴ベクトル空間への写像関数を求める推定部と、 前記特徴ベクトル記憶部に記憶されている本人の特徴ベ
    クトルを用いて、本人の標準パターンを作成する標準パ
    ターン作成部と、 前記推定部で求めた写像関数を基に、前記標準パターン
    作成部で求められた本人の標準パターンを適応化する適
    応部と、 前記適応部で適応化された標準パターンと、前記特徴ベ
    クトル記憶部に記憶されている本人の特徴ベクトルと、
    から類似度を計算し、少なくとも1人の抑制話者を選択
    する抑制話者選択部と、 を備えたことを特徴とする抑制標準パターン(コホー
    ト)作成システム。
  10. 【請求項10】前記抑制話者標準パターン記憶部におい
    て、1つ以上の話者標準パターンの各標準パターンにお
    いて、2人以上の話者の特徴を備えた標準パターンを記
    憶することを特徴とする請求項6、7、8、9のいずれ
    か一に記載の抑制標準パターン(コホート)作成システ
    ム。
  11. 【請求項11】入力された本人の入力音声データを特徴
    ベクトルに変換する分析部と、 請求項1〜10のいずれか一に記載の抑制標準パターン
    (コホート)作成システムにおける特徴ベクトル記憶
    部、抑制話者標準パターン記憶部、抑制話者選択部、推
    定部、又は標準パターン作成部を備えた抑制標準パター
    ン作成部と、 1又は複数の話者標準パターンが記憶されている話者標
    準パターン記憶部と、 前記分析部で変換された本人の特徴ベクトルと、前記抑
    制標準パターン作成部で作成された抑制標準パターン
    と、前記話者標準パターン記憶部に記憶されている本人
    の標準パターンと、を用いて、特徴ベクトルと本人の標
    準パターンとの距離の値から、特徴ベクトルと抑制標準
    パターンとの距離の値を差し引くことにより正規化を行
    う距離計算部と、 前記距離計算部で計算された距離を基に、本人判定を行
    う判定部と、 を備えたことを特徴とする話者照合装置。
  12. 【請求項12】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の特徴ベクト
    ルと、を用いて、抑制話者の特徴ベクトル空間から本人
    の特徴ベクトル空間への写像関数を推定し、 (e)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンの適応化を行う、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  13. 【請求項13】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の第1の発声
    (但し、内容が既知)から求められた特徴ベクトルと、
    を用いて、抑制話者の特徴ベクトル空間から本人の特徴
    ベクトル空間への写像関数を推定し、 (e)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンを適応化し、 (f)前記適応化後の抑制話者標準パターンを用いて、
    前記特徴ベクトル記憶部に記憶されている本人の第2の
    発声(但し、内容は未知)から求められた特徴ベクトル
    のアライメントを推定し、該推定されたアライメントを
    基に、前記第2の発声に相当する抑制標準パターンを作
    成する、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  14. 【請求項14】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の第1の発声
    (但し、内容が既知)から求められた特徴ベクトルと、
    を用いて、抑制話者の特徴ベクトル空間から本人の特徴
    ベクトル空間への写像関数を推定し、 (e)前記選択された抑制話者の標準パターンを用い
    て、前記特徴ベクトル記憶部に記憶されている本人の第
    2の発声(但し、内容は未知)から求められた特徴ベク
    トルのアライメントを推定し、該推定されたアライメン
    トを基に、前記第2の発声に相当する抑制標準パターン
    を作成し、 (f)前記推定された写像関数を用いて、前記推定され
    たアライメントを基に、作成された抑制標準パターンの
    適応化を行う、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  15. 【請求項15】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の特徴ベクト
    ルと、を用いて、本人の特徴ベクトル空間から抑制話者
    の特徴ベクトル空間への写像関数を推定し、 (e)前記特徴ベクトル記憶部に記憶されている本人の
    特徴ベクトルを用いて、本人の標準パターンを作成し、 (f)前記推定された写像関数を基に、前記工程(e)
    で求められた本人の標準パターンの適応化を行う、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  16. 【請求項16】前記抑制話者標準パターン記憶部におい
    て、1つ以上の話者標準パターンの各話者標準パターン
    として、2人以上の話者の特徴を備えた標準パターンを
    記憶することを特徴とする請求項12〜15のいずれか
    一に記載の抑制標準パターン作成方法。
  17. 【請求項17】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている話者の標準パターンと、
    を用いて、各抑制話者の特徴ベクトル空間から本人の特
    徴ベクトル空間への写像関数を推定し、 (d)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンを適応化し、 (e)前記適応化された標準パターンと、前記特徴ベク
    トル記憶部に記憶されている本人の特徴ベクトルと、か
    ら、類似度を計算し、少なくとも1人の抑制話者を選択
    する、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  18. 【請求項18】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された本人の第1の発声(但し、内容は
    既知)に対する特徴ベクトルと、抑制話者標準パターン
    記憶部に記憶されている話者の標準パターンと、を用い
    て、各抑制話者の特徴ベクトル空間から本人の特徴ベク
    トル空間への写像関数を推定し、 (d)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンを適応化し、 (e)前記適応化された標準パターンを用いて、前記特
    徴ベクトル記憶部に記憶されている本人の第2の発声
    (但し、内容は未知)から求められた特徴ベクトルのア
    ライメントを推定し、該推定されたアライメントを基
    に、前記第2の発声に相当する抑制標準パターンを作成
    し、 (f)前記工程(e)で求めた前記抑制標準パターン
    と、前記特徴ベクトル記憶部に記憶されている本人の第
    2の発声の特徴ベクトルと、から類似度を計算し、少な
    くとも1人の抑制話者を選択する、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  19. 【請求項19】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された本人の第1の発声(但し、内容は
    既知)に対する特徴ベクトルと、抑制話者標準パターン
    記憶部に記憶されている話者の標準パターンとを用い
    て、各抑制話者の特徴ベクトル空間から本人の特徴ベク
    トル空間への写像関数を求め、 (d)前記抑制話者標準パターン記憶部に記憶されてい
    る抑制話者の標準パターンを用いて、前記特徴ベクトル
    記憶部に記憶されている本人の第2の発声から求められ
    た特徴ベクトルのアライメントを推定し、該推定された
    アライメントを基に、第2の発声(但し、内容は未知)
    に相当する抑制標準パターンを作成し、 (e)前記推定された写像関数を用いて、前記工程
    (d)で求められた抑制標準パターンを適応化し、 (f)前記適応化された抑制標準パターンと、前記特徴
    ベクトル記憶部に記憶されている本人の第2の発声の特
    徴ベクトルと、から類似度を計算し、少なくとも1人の
    抑制話者を選択する、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  20. 【請求項20】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている話者の標準パターンとを
    用いて、本人の特徴ベクトル空間から各抑制話者の特徴
    ベクトル空間への写像関数を求め、 (d)前記特徴ベクトル記憶部に記憶されている本人の
    特徴ベクトルを用いて、本人の標準パターンを作成し、 (e)前記写像関数を基に、前記標準パターン作成部で
    求められた本人の標準パターンを適応化し、 (f)前記適応化された標準パターンと、前記特徴ベク
    トル記憶部に記憶されている本人の特徴ベクトルと、か
    ら類似度を計算し、少なくとも1人の抑制話者を選択す
    る、 ことを特徴とする抑制標準パターン(コホート)作成方
    法。
  21. 【請求項21】前記抑制話者標準パターン記憶部におい
    て、1つ以上の話者標準パターンの各標準パターンにお
    いて、2人以上の話者の特徴を備えた標準パターンを記
    憶することを特徴とする請求項17、18、19、20
    のいずれか一に記載の抑制標準パターン(コホート)作
    成方法。
  22. 【請求項22】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の特徴ベクト
    ルと、を用いて、抑制話者の特徴ベクトル空間から本人
    の特徴ベクトル空間への写像関数を推定し、 (e)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンの適応化を行う、 上記(a)〜(e)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  23. 【請求項23】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の第1の発声
    (但し、内容が既知)から求められた特徴ベクトルと、
    を用いて、抑制話者の特徴ベクトル空間から本人の特徴
    ベクトル空間への写像関数を推定し、 (e)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンを適応化し、 (f)前記適応化後の抑制話者標準パターンを用いて、
    前記特徴ベクトル記憶部に記憶されている本人の第2の
    発声(但し、内容は未知)から求められた特徴ベクトル
    のアライメントを推定し、該推定されたアライメントを
    基に、前記第2の発声に相当する抑制標準パターンを作
    成する、 上記(a)〜(f)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  24. 【請求項24】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の第1の発声
    (但し、内容が既知)から求められた特徴ベクトルと、
    を用いて、抑制話者の特徴ベクトル空間から本人の特徴
    ベクトル空間への写像関数を推定し、 (e)前記選択された抑制話者の標準パターンを用い
    て、前記特徴ベクトル記憶部に記憶されている本人の第
    2の発声(但し、内容は未知)から求められた特徴ベク
    トルのアライメントを推定し、該推定されたアライメン
    トを基に、前記第2の発声に相当する抑制標準パターン
    を作成し、 (f)前記推定された写像関数を用いて、前記推定され
    たアライメントを基に、作成された抑制標準パターンの
    適応化を行う、 上記(a)〜(f)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  25. 【請求項25】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている各話者の標準パターンと
    の類似度を計算し、少なくとも1人の抑制話者を選択
    し、 (d)前記選択された抑制話者の標準パターンと、前記
    特徴ベクトル記憶部に記憶されている本人の特徴ベクト
    ルと、を用いて、本人の特徴ベクトル空間から抑制話者
    の特徴ベクトル空間への写像関数を推定し、 (e)前記特徴ベクトル記憶部に記憶されている本人の
    特徴ベクトルを用いて、本人の標準パターンを作成し、 (f)前記写像関数を基に、前記処理(e)で求められ
    た本人の標準パターンの適応化を行う、 上記(a)〜(f)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  26. 【請求項26】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている話者の標準パターンとを
    用いて、各抑制話者の特徴ベクトル空間から本人の特徴
    ベクトル空間への写像関数を推定し、 (d)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンを適応化し、 (e)前記適応化された標準パターンと、前記特徴ベク
    トル記憶部に記憶されている本人の特徴ベクトルと、か
    ら、類似度を計算し、少なくとも1人の抑制話者を選択
    する、 上記(a)〜(e)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  27. 【請求項27】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された本人の第1の発声(但し、内容は
    既知)に対する特徴ベクトルと、抑制話者標準パターン
    記憶部に記憶されている話者の標準パターンとを用い
    て、各抑制話者の特徴ベクトル空間から本人の特徴ベク
    トル空間への写像関数を推定し、 (d)前記推定された写像関数を基に、前記抑制話者標
    準パターン記憶部に記憶されている抑制話者の標準パタ
    ーンを適応化し、 (e)前記適応化された標準パターンを用いて、前記特
    徴ベクトル記憶部に記憶されている本人の第2の発声
    (但し、内容は未知)から求められた特徴ベクトルのア
    ライメントを推定し、該推定されたアライメントを基
    に、前記第2の発声に相当する抑制標準パターンを作成
    し、 (f)上記処理(e)で求めた前記抑制標準パターン
    と、前記特徴ベクトル記憶部に記憶されている本人の第
    2の発声の特徴ベクトルと、から類似度を計算し、少な
    くとも1人の抑制話者を選択する、 上記(a)〜(f)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  28. 【請求項28】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された本人の第1の発声(但し、内容は
    既知)に対する特徴ベクトルと、抑制話者標準パターン
    記憶部に記憶されている話者の標準パターンと、を用い
    て、各抑制話者の特徴ベクトル空間から本人の特徴ベク
    トル空間への写像関数を求め、 (d)前記抑制話者標準パターン記憶部に記憶されてい
    る抑制話者の標準パターンを用いて、前記特徴ベクトル
    記憶部に記憶されている本人の第2の発声から求められ
    た特徴ベクトルのアライメントを推定し、該推定された
    アライメントを基に、第2の発声(但し、内容は未知)
    に相当する抑制標準パターンを作成し、 (e)前記推定された写像関数を用いて、上記処理
    (d)で求められた抑制標準パターンを適応化し、 (f)前記適応化された抑制標準パターンと、前記特徴
    ベクトル記憶部に記憶されている本人の第2の発声の特
    徴ベクトルと、から類似度を計算し、少なくとも1人の
    抑制話者を選択する、 上記(a)〜(f)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
  29. 【請求項29】(a)入力された本人の音声データを分
    析して特徴ベクトルに変換し、 (b)前記変換された特徴ベクトルを特徴ベクトル記憶
    部に記憶し、 (c)前記変換された特徴ベクトルと、抑制話者標準パ
    ターン記憶部に記憶されている話者の標準パターンとを
    用いて、本人の特徴ベクトル空間から各抑制話者の特徴
    ベクトル空間への写像関数を求め、 (d)前記特徴ベクトル記憶部に記憶されている本人の
    特徴ベクトルを用いて、本人の標準パターンを作成し、 (e)前記写像関数を基に、前記標準パターン作成部で
    求められた本人の標準パターンを適応化し、 (f)前記適応化された標準パターンと、前記特徴ベク
    トル記憶部に記憶されている本人の特徴ベクトルと、か
    ら類似度を計算し、少なくとも1人の抑制話者を選択す
    る、 上記(a)〜(f)の各処理を情報処理装置で実行させ
    て抑制標準パターン(コホート)を作成するプログラム
    を記録した記録媒体。
JP9040102A 1997-02-07 1997-02-07 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置 Expired - Lifetime JP2991148B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP9040102A JP2991148B2 (ja) 1997-02-07 1997-02-07 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置
CA002229113A CA2229113C (en) 1997-02-07 1998-02-09 Inhibiting reference pattern generating method
EP98102205A EP0858068A3 (en) 1997-02-07 1998-02-09 Inhibitting reference pattern generating method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9040102A JP2991148B2 (ja) 1997-02-07 1997-02-07 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置

Publications (2)

Publication Number Publication Date
JPH10222189A JPH10222189A (ja) 1998-08-21
JP2991148B2 true JP2991148B2 (ja) 1999-12-20

Family

ID=12571509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9040102A Expired - Lifetime JP2991148B2 (ja) 1997-02-07 1997-02-07 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置

Country Status (3)

Country Link
EP (1) EP0858068A3 (ja)
JP (1) JP2991148B2 (ja)
CA (1) CA2229113C (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110613A1 (ja) * 2008-03-07 2009-09-11 日本電気株式会社 個人照合装置及び話者登録装置と方法並びにプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5876893A (ja) * 1981-10-30 1983-05-10 日本電気株式会社 音声認識装置
CA2105034C (en) * 1992-10-09 1997-12-30 Biing-Hwang Juang Speaker verification with cohort normalized scoring
AUPM983094A0 (en) * 1994-12-02 1995-01-05 Australian National University, The Method for forming a cohort for use in identification of an individual

Also Published As

Publication number Publication date
EP0858068A3 (en) 1999-03-10
CA2229113C (en) 2002-05-28
CA2229113A1 (en) 1998-08-07
JPH10222189A (ja) 1998-08-21
EP0858068A2 (en) 1998-08-12

Similar Documents

Publication Publication Date Title
US9536525B2 (en) Speaker indexing device and speaker indexing method
CA2652302C (en) Intersession variability compensation for automatic extraction of information from voice
JP5229219B2 (ja) 話者選択装置、話者適応モデル作成装置、話者選択方法、話者選択用プログラムおよび話者適応モデル作成プログラム
JP3584458B2 (ja) パターン認識装置およびパターン認識方法
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
JP5949553B2 (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP3001037B2 (ja) 音声認識装置
WO2014025682A2 (en) Method and system for acoustic data selection for training the parameters of an acoustic model
JPH075892A (ja) 音声認識方法
US20040006470A1 (en) Word-spotting apparatus, word-spotting method, and word-spotting program
JP3130524B2 (ja) 音声信号認識方法およびその方法を実施する装置
JP2007240589A (ja) 音声認識信頼度推定装置、その方法、およびプログラム
JP4858663B2 (ja) 音声認識方法及び音声認識装置
JP4960845B2 (ja) 音声パラメータ学習装置とその方法、それらを用いた音声認識装置と音声認識方法、それらのプログラムと記録媒体
JP3039623B2 (ja) 音声認識装置
JP2991148B2 (ja) 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置
JPH06289891A (ja) 音声認識装置
JP3090119B2 (ja) 話者照合装置、方法及び記憶媒体
KR100551953B1 (ko) 피치와 엠.에프.씨.씨를 이용한 성별식별 장치 및 방법
Sanchis et al. Improving utterance verification using a smoothed naive bayes model
JP2004133477A (ja) 音声認識方法、音声認識方法のためのコンピュータプログラム、及びそのコンピュータプログラムが記録された記憶媒体
KR100586045B1 (ko) 고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법
JP2000259198A (ja) パターン認識装置および方法、並びに提供媒体
JP4749990B2 (ja) 音声認識装置
JP3036509B2 (ja) 話者照合における閾値決定方法及び装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990914