JP2002221991A

JP2002221991A - データ照合システム及び方法

Info

Publication number: JP2002221991A
Application number: JP2001019575A
Authority: JP
Inventors: Akihiro Kimura; 晋太木村
Original assignee: Animo Ltd
Current assignee: Animo Ltd
Priority date: 2001-01-29
Filing date: 2001-01-29
Publication date: 2002-08-09
Anticipated expiration: 2021-01-29
Also published as: JP4738606B2

Abstract

(57)【要約】【課題】より高速な話者識別処理技術を提供すること。【解決手段】本データ照合システムは、入力音声のLPC
ケプストラム係数の系列から照合用モデル・データを作
成するモデル作成部5と、照合の元となる複数の登録モ
デル・データを格納する登録モデル格納部11と、照合用
モデル・データと登録モデル・データとを用いて照合処
理を実施するモデル間照合部9と、モデル間照合部9によ
る照合用モデル・データと登録モデル・データとの照合
結果を用いて、例えば上位一つ又は複数の登録モデル・
データに対応する登録モデルを特定する照合結果判定部
13とを有する。また、登録モデルを多段クラスタ化する
ことにより照合対象の数を減らしたり、モデル間照合の
結果を用いてさらに詳細な照合処理を実施することによ
り識別精度を向上させる場合もある。

Description

【発明の詳細な説明】

【０００１】

【発明が属する技術分野】本発明は、データ照合技術に
関し、より詳しくは話者認識技術に関する。

【０００２】

【従来の技術】図１に従来技術の一例を示す。話者の音
声は、マイクロフォン等である音声入力部１００により
入力される。音声入力部１００では、空気の振動である
音声波を電気信号に変換する。音声分析部１０２は、音
声の電気信号をディジタル化し、１５ｍｓから３０ｍｓ
程度の分析窓（フレームとも言う）で、５ｍｓから３０
ｍｓ程度の分析周期（フレーム周期とも言う）毎に分析
処理を実施し、例えばＬＰＣ（Linear Predictive Codi
ng）ケプストラム係数の系列を生成する。音声分析部１
０２における処理の概要を図２を用いて説明する。図２
に示すように、音声波に対して分析窓を分析周期ずつず
らして設定し、分析窓毎に所定の分析処理を施し、その
分析窓に対応するケプストラム係数Ｃ_ijを出力する。例
えば、１回の分析処理により、１０から２０（次元）程
度のＬＰＣケプストラム係数が計算される。ここでｉは
フレーム番号であり、ｉ＝１〜Ｎで、Ｎはフレーム総数
である。ｊはＬＰＣケプストラム係数の次元番号であ
り、ｊ＝１〜Ｍで、Ｍは次元数である。このように、音
声波からＬＰＣケプストラム係数を出力する分析処理に
ついては周知であり、例えば社団法人電子情報通信学会
出版中山聖一著「確率モデルによる音声認識」の７乃至
１２頁に記載されている。

【０００３】切替部１０４は、現在の処理が話者照合で
ある場合には音声分析部１０２の分析結果を照合部１０
８に出力し、一方現在の処理が話者登録である場合には
音声分析部１０２の分析結果をモデル作成部１０６に出
力する。モデル作成部１０６は、音声分析部１０２の分
析結果であるＬＰＣケプストラム係数の系列のモデル化
を実施する。モデルの第１の例は平均モデルであり、以
下の式にて計算される。なお、上付きのＴは転置を意味
する。 μ＝（μ₁，μ₂，．．．μ_M）^T （１）

【数１】（１）式で計算されるモデルは、登録モデル格納部１１
０に登録される。

【０００４】そして、第１のモデル例の場合に、照合部
１０８で行なわれる計算は、以下の式で表される。

【数２】ｙ_i＝（Ｃ_i1，Ｃ_i2，．．．Ｃ_iM）^T （４） μ_rは（１）式で計算され登録モデル格納部１１０に登
録された登録モデルであり、全てのμ_rについて距離Ｄ
を計算する。そして、照合結果判定部１１２は、例えば
最も距離Ｄが短い登録モデル、又は距離Ｄが短い上位所
定数の登録モデルを特定する。そして、例えば登録モデ
ルに対応する属性値（例えば顧客名、顧客番号等）が出
力される。

【０００５】また、モデルの第２の例は多次元正規分布
モデルであって、モデル作成部１０６は（１）式のμと
以下の式にて計算される共分散行列Σとを計算し、登録
モデル格納部１１０に格納する。

【数３】なお、μ_inは（１）式で計算される（inは入力の意
味）。そして、照合部１０８で行なわれる計算は、以下
の式で表される。

【数４】 μ_rは（１）式で計算され登録モデル格納部１１０に登
録された登録平均ベクトルであり、Σ_rは（５）式で計
算され登録モデル格納部１１０に登録された登録共分散
行列である。そして、照合結果判定部１１２は、例えば
尤度λが最も大きい登録モデル、又は尤度λが大きい上
位所定数の登録モデルを特定する。そして、例えば登録
モデルに対応する属性値（例えば顧客名、顧客番号等）
が出力される。

【０００６】

【発明が解決しようとする課題】図１に示したように従
来技術では、（３）式又は（７）式の計算が一つの登録
モデルに対してフレーム数回照合部１０８で必要とな
り、さらに登録モデルの数が多い場合、処理量が膨大に
なる。例えば（７）式の計算が０．１秒で終了したとし
ても、登録モデルが１０万個あれば、０．１秒×１００
０００個＝１００００秒＝２．７時間かかり、とても実
用に耐えない。

【０００７】よって本発明の目的は、より高速なデータ
照合処理技術を提供することである。より詳しくは、よ
り高速な話者認識処理技術を提供することである。

【０００８】

【課題を解決するための手段】本発明の第１の態様に係
るデータ照合システムは、照合対象に関する時系列分析
データ（例えば実施の形態におけるＬＰＣケプストラム
係数の系列）から当該照合対象の照合用モデル・データ
（例えば実施の形態における平均ベクトルμ_in及び共分
散行列Σ_in）を作成するモデル作成手段（例えば実施の
形態におけるモデル作成部５）と、照合の元となる複数
の登録照合用モデル・データ（例えば実施の形態におけ
る平均ベクトルμ_r及び共分散行列Σ_r）を格納するモデ
ル・データ格納装置（例えば実施の形態における登録モ
デル格納部１１）と、照合対象の照合用モデル・データ
と登録照合用モデル・データとを用いて照合処理を実施
するモデル間照合処理手段（例えば実施の形態における
モデル間照合部９）と、モデル間照合処理手段による照
合対象の照合用モデル・データと登録照合用モデル・デ
ータとの照合結果を用いて、所定の条件（例えば実施の
形態のように尤度λが最も大きい又は例えば尤度λの値
上位所定数）に合致する登録照合用モデル・データに対
応する登録モデルを特定するモデル特定手段（例えば実
施の形態における照合結果判定部１３）とを有する。

【０００９】このようにすれば、データ登録（より詳し
くは話者登録）時のみならず照合処理時でもモデル作成
処理が必要となるが、（３）式又は（７）式のようなフ
レーム数回の計算は不要となり、結果としてデータ照合
（より詳しくは話者照合）処理が高速化される。

【００１０】なお、照合対象が話者の音声である場合に
は、照合対象者の音声データを分析して、時系列分析デ
ータである時系列の音声分析データを生成する手段をさ
らに有するような構成であってもよい。

【００１１】また、本発明の第１の態様において、モデ
ル・データ格納装置に格納された各登録照合用モデル・
データを、複数のクラスタのいずれかに分類し、いずれ
のクラスタに含まれるか判断するために用いられる各ク
ラスタの代表登録照合用モデル・データを決定するクラ
スタ構成手段をさらに有し、上で述べたモデル間照合処
理手段を、照合対象の照合用モデル・データと各クラス
タの代表登録照合用モデル・データとを用いて照合処理
を実施することにより、当該照合対象の照合用モデル・
データがいずれのクラスタに含まれるのか判断し、当該
照合対象の照合用モデル・データが含まれると判断され
たクラスタ内の各登録照合用モデル・データと照合対象
の照合用モデル・データとを用いて照合処理を実施する
ような構成とすることも可能である。代表登録照合用モ
デルによりクラスタが絞り込まれるので、照合処理の総
実施回数を減少させることができ、結果として照合処理
が高速化される。

【００１２】さらに、本発明の第１の態様において、モ
デル・データ格納装置に格納された複数の登録照合用モ
デル・データを多段クラスタ化し、当該多段クラスタの
各段においていずれのクラスタに含まれるか判断するた
めに用いられる代表登録照合用モデル・データが当該各
段のノードに対応して規定されているクラスタ探索ツリ
ーを構成する多段クラスタ構成手段（例えば実施の形態
における多段クラスタ構成部１７）をさらに有し、上で
述べたモデル間照合処理手段は、照合対象の照合用モデ
ル・データと多段クラスタ探索ツリーの各段のノードに
規定されている代表登録照合用モデル・データとを用い
て照合処理を実施することによりクラスタ探索ツリーの
探索を行い、照合対象の照合用モデル・データが含まれ
る最下層のクラスタが特定された場合には、当該最下層
のクラスタに含まれる各登録照合用モデル・データと照
合対象の照合用モデル・データとを用いて照合処理を実
施するような構成とすることも可能である。このように
多段クラスタ化することにより、より効率的にクラスタ
を絞り込むことができ、結果として照合処理がより高速
化される。

【００１３】さらに、本発明の第１の態様において、モ
デル特定手段により特定された登録モデルに対応する登
録照合用モデル・データをモデル・データ格納装置から
取り出す特定モデル・データ取得手段（例えば実施の形
態におけるモデル取得部１９）と、特定モデル・データ
取得手段により取り出された登録照合用モデル・データ
と、時系列分析データとを用いて第２の照合処理を実施
する第２照合処理手段（例えば実施の形態における照合
部２１）とをさらに有するような構成であってもよい。
このようにモデル間照合処理を実施した後に、時系列分
析データを用いて第２の照合処理を実施することによ
り、データ照合（より詳しくは話者認識）の精度を上げ
ることができるようになる。

【００１４】本発明の第２の態様におけるデータ照合方
法は照合対象に関する時系列分析データから当該照合
対象の照合用モデル・データを作成するステップと、照
合対象の照合用モデル・データと、モデル・データ格納
装置に格納された照合の元となる複数の登録照合用モデ
ル・データとを用いて照合処理を実施するモデル間照合
処理ステップと、モデル間照合処理ステップにおける照
合対象の照合用モデル・データと登録照合用モデル・デ
ータとの照合結果を用いて、所定の条件に合致する登録
照合用モデル・データに対応する登録モデルを特定する
ステップとを含む。

【００１５】本発明の第１の態様に係る変形は、本発明
の第２の態様に適用可能である。

【００１６】なお、本発明の第２の態様に係るデータ照
合方法をプログラムとコンピュータの組み合せにて実現
することができ、この場合、当該プログラムは、例えば
フロッピー（登録商標）・ディスク、ＣＤ−ＲＯＭ、光
磁気ディスク、半導体メモリ、ハードディスク等の記憶
媒体又は記憶装置に格納される。また、処理途中のデー
タについては、コンピュータのメモリに一時保管され
る。

【００１７】

【発明の実施の形態】［実施の形態１］本発明の第１の
実施の形態のシステム概要図を図３に示す。なお、以下
ではデータ照合を話者照合の例を用いて説明する。音声
入力部１の出力は音声分析部３に入力される。音声分析
部３の出力は、モデル作成部５に入力される。モデル作
成部５の出力は切替部７に入力される。切替部７の出力
は、話者照合処理時にはモデル間照合部９に入力され、
話者登録処理時には登録モデル格納部１１に格納され
る。モデル間照合部９は、登録モデル格納部１１を参照
できるようになっており、その出力は照合結果判定部１
３に入力される。照合結果判定部１３から照合結果が出
力される。処理目的が話者照合であるから、照合結果は
入力音声の話者が登録話者のうち誰であるかを示す情報
である。

【００１８】このシステムの動作を図４を用いて説明す
る。話者の音声は、マイクロフォン等である音声入力部
１００により入力される（ステップＳ１）。音声入力部
１００では、空気の振動である音声波を電気信号に変換
する。次に、音声分析部１０２は、音声の電気信号をデ
ィジタル化し、１５ｍｓから３０ｍｓ程度の分析窓で、
５ｍｓから３０ｍｓ程度のフレーム毎に音声分析を実施
し、時系列分析データ（例えばＬＰＣケプストラム係数
の系列Ｃ_ij）を生成する（ステップＳ３）。ここでｉは
フレーム番号であり、ｉ＝１〜Ｎで、Ｎはフレーム総数
である。ｊはＬＰＣケプストラム係数の次元番号であ
り、ｊ＝１〜Ｍで、Ｍは次元数である。

【００１９】次に、本実施の形態では、話者認識の場合
も話者登録の場合も、モデル作成部５が入力音声に対す
るモデル・データを生成する（ステップＳ５）。従来技
術の欄でも説明したモデルの第１の例（平均モデル）の
場合、（１）式で計算される平均ベクトルμ_inがモデル
・データである。すなわち、以下の計算がなされ、結果
が記憶装置に格納される。 μ_in＝（μ₁，μ₂，．．．μ_M）^T （８）

【数５】

【００２０】従来技術の欄でも説明したモデルの第２の
例（多次元正規分布モデル）の場合、モデル・データ
は、（１）式で計算される平均ベクトルμ_inと（５）式
で計算される共分散行列Σ_inである。共分散行列Σ_inを
計算する（９）式及び（９）式の計算に必要な（４）式
を再度示しておく。これらの計算結果も記憶装置に格納
される。

【数６】ｙ_i＝（Ｃ_i1，Ｃ_i2，．．．Ｃ_iM）^T （４）

【００２１】このようにモデル作成部５がモデル・デー
タを生成した後、音声入力前又は音声入力後に設定され
たモードに従って、話者照合か話者登録かを切替部１０
４が判断する（ステップＳ７）。もし、話者照合でなく
話者登録時であると判断された場合には、モデル作成部
５により生成されたモデル・データを、切替部７は登録
モデル格納部１１に登録する（ステップＳ１３）。な
お、この際にはモデル・データに対応して話者の識別情
報等も登録される。

【００２２】登録されたモデル・データを、第１の例の
場合平均ベクトルμ_rと表し、第２の例の場合平均ベク
トルμ_r及び共分散行列Σ_rと表すものとする。

【００２３】一方、設定モードが話者照合となっている
と判断された場合には、登録モデル格納部１１に格納さ
れる各登録モデル・データと、入力音声に対するモデル
・データとの照合処理をモデル間照合部９が実行する
（ステップＳ９）。

【００２４】第１の例（平均モデル）の場合の照合処理
は、以下のような計算を行うことにより実施される。Ｄ＝｜μ_in−μ_r｜² （１０）この計算を全ての登録モデル・データ（μ_r）に対して
実施し、距離Ｄを記憶装置に格納する。

【００２５】第２の例（多次元正規分布モデル）の場
合、以下のような計算を行う。

【数７】この計算を全ての登録モデル・データ（μ_r及びΣ_r）に
対して実施し、尤度λ _prodを記憶装置に格納する。

【００２６】このようにモデル間照合部９により記憶装
置に格納された照合結果を用いて、照合結果判定部１３
は、可能性が高い１又は複数の登録モデルを特定し、当
該登録モデルの属性を照合結果として出力する（ステッ
プＳ１１）。より具体的には、第１の例（平均モデル）
の場合には、照合結果の距離Ｄが短い１又は複数の登録
モデルを特定する。距離が短い登録モデルということ
は、入力音声の話者に該当する可能性が高い登録モデル
ということである。第２の例（多次元正規分布モデル）
の場合には、尤度λ_prodが高い１又は複数の登録モデル
を特定する。最も可能性の高い１つの登録モデルを特定
するようにしてもよいし、上位５つ等上位所定数の登録
モデルを特定するような構成であってもよい。

【００２７】以上をまとめると最初に、話者の音声入
力データに関する時系列分析データ（例えばＬＰＣケプ
ストラム係数の系列）から当該照合対象の照合用モデル
・データ（例えば平均ベクトル、又は平均ベクトル及び
共分散行列）を生成する。そして、照合対象の照合用モ
デル・データと、登録モデル格納部１１に格納された照
合の元となる複数の登録モデル・データとを用いて照合
処理を実施する。最後に、照合結果を用いて、所定の条
件（例えば最も可能性の高いもの又は可能性の高い上位
所定数など）に合致する登録モデル・データに対応する
登録モデルを特定する。

【００２８】以上述べたようにモデル作成部５の動作段
階を変更し、モデル間照合部９を導入することにより、
計算量が減少し、結果として処理速度の高速化が実現さ
れる。すなわち、照合処理のための（１０）式や（１
１）式では、フレーム数には依存しなくなっている。よ
って、例えば入力音声が２０００フレームに分けられる
ような場合、モデル・データ作成で必要となる処理量を
考慮しても演算回数は約１０００分の１になる。

【００２９】［実施の形態２］実施の形態２では、照合
処理を実施する回数をさらに減らすための工夫について
説明する。実施の形態２のシステム概要を図５に示す。
図３と図５とを比較すると、図３におけるモデル間照合
部９の代わりに高速モデル間照合部１５が設けられ、図
３には無い多段クラスタ構成部１７が設けられる。多段
クラスタ構成部１７は、登録モデル格納部１１に格納さ
れた登録モデル・データを複数のクラスタに分類し、各
クラスタを代表する代表登録モデル・データを決定す
る。そして、高速モデル間照合部１５は、当該代表登録
モデル・データと入力音声に対するモデル・データとの
照合処理を最初に行って、照合結果に基づき当該入力音
声に対するモデル・データが含まれるクラスタを特定す
る。その後、特定されたクラスタに含まれる登録モデル
・データと入力音声に対するモデル・データとの照合処
理を実施する。このようにすれば、クラスタの数にもよ
るが、照合処理の回数は減少する。例えば、登録モデル
の数をＬとし、クラスタの数が２とすると、実施の形態
１ではＬ回行なわれる照合処理が、（Ｌ／２＋２）回に
減少する。

【００３０】図６（ａ）及び（ｂ）を用いてクラスタが
２つの場合における処理の概要を説明する。図６（ａ）
に示すように、登録モデルの空間６００が存在するもの
とする。例えば、上で述べた第１の例（平均モデル）の
場合には平均ベクトルの空間である。また、第２の例
（多次元正規分布モデル）の場合には、モデル間尤度に
より構成されるノルム空間である。以下では分かり易い
ように平均ベクトルの例で説明する。そして、多段クラ
スタ構成部１７は、所定のアルゴリズムにてクラスタＡ
（６１０）の代表モデル及びクラスタＢ（６２０）の代
表モデルと、クラスタＡに含まれる登録モデル及びクラ
スタＢに含まれる登録モデルとを決定する。例えば、１
０００個の登録モデルが存在する場合には、５００個ず
つ各クラスタに含まれる登録モデルが決定される。

【００３１】そして、多段クラスタ構成部１７は、図６
（ｂ）に示すようにクラスタ探索ツリーを作成する。２
つのクラスタのみが存在する場合には、クラスタ探索ツ
リーは、ノード６３０と、クラスタＡへのリンクと、ク
ラスタＢへのリンクとを含む。例えばクラスタＡには登
録モデル１乃至５００が含まれ、クラスタＢには登録モ
デル５０１乃至１０００が含まれる。

【００３２】クラスタ探索ツリーを探索する場合には、
高速モデル間照合部１５は、ノード６３０に対応して規
定されるクラスタＡの代表モデル・データと入力音声に
対するモデル・データとの照合処理と、クラスタＢの代
表モデル・データと入力音声に対するモデル・データと
の照合処理とを行う。クラスタＡの代表モデル・データ
との照合処理結果が、クラスタＢの代表モデル・データ
との照合処理結果より可能性が高い（距離が短い又は尤
度が高い）場合には、入力音声に対するモデル・データ
はクラスタＡに含まれると判断し、クラスタＡに含まれ
る登録モデル１乃至５００のモデル・データと入力音声
に対するモデル・データとの照合処理を実施する。一
方、クラスタＢの代表モデル・データとの照合処理結果
が、クラスタＡの代表モデル・データとの照合処理結果
より可能性が高い（距離が短い又は尤度が高い）場合に
は、入力音声に対するモデル・データはクラスタＢに含
まれると判断し、クラスタＢに含まれる登録モデル５０
１乃至１０００のモデル・データと入力音声に対するモ
デル・データとの照合処理を実施する。ここまで実行す
れば、実施の形態１と同じで、照合結果判定部１３が可
能性の高い１又は複数の登録モデル・データを特定す
る。

【００３３】単純に複数のクラスタに登録モデル・デー
タを分類し、各クラスタについて代表モデル・データを
決定するようにしてもよいが、登録モデルの空間を多段
クラスタに分割することも可能である。例えば、図７に
示すように、登録モデルの空間６００をクラスタＡ（６
１０）及びクラスタＢ（６２０）に分け、それぞれの代
表モデルを決定した後、クラスタＡを２つのクラスタ６
１１及び６１２に分け、さらにクラスタＢを２つのクラ
スタ６２１及び６２２に分け、それぞれについて代表モ
デルを決定する。さらに、クラスタ６１１を２つのクラ
スタ６１３及び６１４に分け、それぞれについて代表モ
デルを決定する。また、クラスタ６１２を２つのクラス
タ６１５及び６１６に分け、それぞれについて代表モデ
ルを決定する。同様に、クラスタ６２１を２つのクラス
タ６２３及び６２４に分け、それぞれについて代表モデ
ルを決定する。また、クラスタ６２２を２つのクラスタ
６２５及び６２６に分け、それぞれについて代表モデル
を決定する。

【００３４】このような登録モデルの空間を多段クラス
タ化すると、図８（ａ）のようなクラスタ探索ツリーが
構成される。ノード６３０は、入力音声に対するモデル
・データがクラスタＡ（６１０）とクラスタＢ（６２
０）のいずれかに含まれるか判断するためのノードであ
り、（６１０，６２０）と表す。ノード６３２は、ノー
ド６３０でクラスタＡ（６１０）に含まれると判断され
た場合に、入力音声に対するモデル・データがクラスタ
６１１とクラスタ６１２のいずれかに含まれるか判断す
るためのノードであり、（６１１，６１２）と表す。一
方、ノード６３４は、ノード６３０でクラスタＢ（６２
０）に含まれると判断された場合に、入力音声に対する
モデル・データがクラスタ６２１とクラスタ６２２のい
ずれかに含まれるか判断するためのノードであり、（６
２１，６２２）と表す。

【００３５】ノード６３６は、ノード６３２でクラスタ
６１１に含まれると判断された場合に、入力音声に対す
るモデル・データがクラスタ６１３とクラスタ６１４の
いずれかに含まれるか判断するためのノードであり、
（６１３，６１４）と表す。また、ノード６３８は、ノ
ード６３２でクラスタ６１２に含まれると判断された場
合に、入力音声に対するモデル・データがクラスタ６１
５とクラスタ６１６のいずれかに含まれるか判断するた
めのノードであり、（６１５，６１６）と表す。

【００３６】ノード６４０は、ノード６３４でクラスタ
６２１に含まれると判断された場合に、入力音声に対す
るモデル・データがクラスタ６２３とクラスタ６２４の
いずれかに含まれるか判断するためのノードであり、
（６２３，６２４）と表す。また、ノード６４２は、ノ
ード６３４でクラスタ６２２に含まれると判断された場
合に、入力音声に対するモデル・データがクラスタ６２
５とクラスタ６２６のいずれかに含まれるか判断するた
めのノードであり、（６２５，６２６）と表す。

【００３７】図８（ａ）のように３段階で最下層のクラ
スタを特定すると８個のクラスタに分けられ、１０００
個の登録モデルが均等に分けられるとすると、クラスタ
６１３には登録モデル１乃至１２５、クラスタ６１４に
は登録モデル１２６乃至２５０、クラスタ６１５には登
録モデル２５１乃至３７５、クラスタ６１６には登録モ
デル３７６乃至５００、クラスタ６２３には登録モデル
５０１乃至６２５、クラスタ６２４には登録モデル６２
６乃至登録モデル７５０、クラスタ６２５には登録モデ
ル７５１乃至８７５、クラスタ６２６には登録モデル８
７６乃至１０００が含まれる。

【００３８】クラスタ探索ツリーを探索する場合には、
図８（ｂ）に示すように、最初のノード６３０でクラス
タＡ（６１０）とクラスタＢ（６２０）のいずれに含ま
れるか判断される。そして、もしクラスタＡ（６１０）
に含まれると判断されると、さらにクラスタ６１１又は
クラスタ６１２に含まれるかが判断される。そして、ク
ラスタ６１２に含まれると判断された場合には、クラス
タ６１５又はクラスタ６１６のいずれに含まれるかが判
断される。このよう探索が行なわれると、最下層のクラ
スタ６１５に含まれることが分かるため、最下層のクラ
スタに含まれる各登録モデル・データとの照合処理が実
施される。図８（ａ）のような探索ツリーの場合、３ノ
ード×２個＝６個の代表モデル・データと入力音声に対
するモデル・データとの照合処理を実施し、最下層のク
ラスタ６１５に含まれる登録モデル・データ１２５個と
の照合処理が実施される。

【００３９】図９を用いて、高速モデル間照合部１５が
実施する照合処理のフローを説明する。なお、図９の処
理は、図４の処理フローのステップＳ９の代わりに実施
するものである。最初に、クラスタ探索ツリーのノード
に規定された２つの代表モデルのモデル・データと、入
力音声に対するモデル・データとの照合処理を実施する
（ステップＳ２１）。そして、２つの照合結果により、
可能性の高い（例えば距離が短い又は尤度が高い）代表
モデルを特定する（ステップＳ２３）。そして、ステッ
プＳ２１で処理したノードがクラスタ探索ツリーで最下
層ノードであるかを判断する（ステップＳ２５）。も
し、最下層ノードでなければ、可能性の高い代表モデル
のリンクに分岐して、次のノードの処理に移行する（ス
テップＳ２７）。一方、最下層ノードであると判断され
た場合には、可能性の高い代表モデルに対応するクラス
タに含まれる登録モデルのモデル・データと入力音声に
対するモデル・データとの照合処理を実施する（ステッ
プＳ２９）。そして、図４のステップＳ１１に戻る。

【００４０】次に、図１０及び図１１を用いて、多段ク
ラスタ構成部１７が実施するクラスタリングの処理フロ
ーの一例を説明しておく。ここでは周知のＬＢＧアルゴ
リズムとＬＢＧアルゴリズムを用いた２分割繰り返しア
ルゴリズムを説明しておく。図１０はＬＢＧアルゴリズ
ムを表したフローであり、最初に初期化処理を実施する
（ステップＳ３１）。ここでは、ｎ個の登録モデルの平
均ベクトルを｛μ_j；ｊ＝０，．．．ｎ−１｝とする。
また、代表モデル（クラスタ）の数をＮ個とする。ま
た、代表モデルの初期集合をＡ₀ ^(N)＝｛ｚ₀ ⁽⁰⁾，．．．
ｚ_N-1 ⁽⁰⁾｝、繰り返しカウンタｍ＝０、ε＝ひずみ閾
値、ひずみＤ_-1＝∞を設定する。

【００４１】次に、登録モデル｛μ_j｝を代表モデルＡ_m
^(N)によってＮ個のクラスタ｛Ｓ_i；ｉ＝１，．．Ｎ｝に
分割する（ステップＳ３３）。すなわち、全てのｔにつ
いてｄ（μ_j，ｚ_i ^(m)）＜ｄ（μ_j，ｚ_t ^(m)）であれば、
μ_j∈Ｓ_iとする。なお、ｄ（ｘ，ｙ）はｘとｙの距離で
ある。また、ｚ_i ^(m)はｍ回繰り返した場合のｉ番目の代
表モデル（但しｔ番目の代表モデルを除く）である。

【００４２】そして、平均ひずみＤ_mを計算する（ステ
ップＳ３５）。Ｄ_mは以下の式で計算される。

【数８】

【００４３】そして、（Ｄ_m-1−Ｄ_m）／Ｄ_m＜εである
かを判断する（ステップＳ３７）。もし、この条件が成
り立つ場合には、ひずみの小さいクラスタリングが行わ
れたことになり、処理を終了する。一方、この条件が成
り立たない場合には、新たな代表モデルＡ_m+1 ^(N)＝｛ｚ
₀ ^(m+1)，．．．ｚ_N-1 ^(m+1)｝を決定し、繰り返しカウン
タｍを１インクリメントする（ステップＳ３９）。そし
てステップＳ３３に戻って、処理を繰り返す。なお、新
たな代表モデルＡ_m+1 ^(N)は以下の式で計算される。

【数９】なお、（１５）式はｋ個の登録モデルを含むクラスタＳ
_iに含まれる他の登録モデルμ_jとの距離ｄの総和をｋで
除した値が最も小さくなるようなクラスタＳ_iに含まれ
る登録モデルμを求めるということである。

【００４４】図１０のような処理を実施すると、多段で
ない複数のクラスタＳ_iが構成される。（なお、後処理
にて多段にすることも可能である。）一方図１１と図１
０を組み合せると多段クラスタが構成できる。図１１で
は最初に、初期化を実施する。ここでは、Δを大きさの
小さい適当なベクトルとし、Ｍ＝１とし、Ａ_0,1＝Ｃ
（μ₁，μ₂，．．μ_n）を設定する。なお、Ｃ（μ₁，μ
₂，．．μ_n）はセントロイドベクトルであって、以下の
ような式で計算される。

【数１０】これはμ₁，μ₂，．．μ_nのいずれかの登録モデルμで
あって、他の登録モデルμ_jとの距離の総和をｎで除し
た値が最も小さくないような登録モデルμを求めるとい
うものである。

【００４５】初期化後、Ａ_0,M＝｛ｚ₀，ｚ₁，．．．ｚ
_M-1｝に対して、各ｚ_iを近接した２つのベクトルｚ_i＋
Δとｚ_i−Δに分け、｛ｚ₀-Δ，ｚ₀+Δ，ｚ₁-Δ，ｚ₁+
Δ，．．．ｚ_M-1-Δ，ｚ_M-1+Δ｝をＡ_0,2M＝｛ｚ₀，
ｚ₁，．．．ｚ_2M-1｝とする（ステップＳ４３）。これ
は、１個の代表モデルを２個に、２個の代表モデルを４
個に、．．、ｎ個の代表モデルを２ｎ個にするための処
理である。

【００４６】そして、Ａ_0,2Mを初期値として、図１０の
ＬＢＧアルゴリズムを実行する。そうすると各クラスタ
に含まれる登録モデルと、準最適な代表モデルとが決定
される。また、処理後の代表モデルＡ_0,2Mを登録する
（ステップＳ４５）。その後、２Ｍ＝Ｎ（クラスタ数）
となっているかを判断する（ステップＳ４７）。一方、
２Ｍ＝Ｎとなっていない場合には、Ｍ＝２Ｍとしてステ
ップＳ４３に戻り、さらに代表モデルを２倍に増やして
処理を繰り返す。

【００４７】このようにすれば、１回ステップＳ４５を
実行する毎に図８（ａ）の各ノードに規定されるべき代
表ノードが決定されてゆき、２Ｍ＝Ｎとなっていれば、
最下層の各クラスタＳ_iに対応してそのクラスタに含ま
れる登録モデルも確定される。なお、多段クラスタ構成
部１７は、あるタイミングで登録モデル格納部１１に格
納されている登録モデルについて上のような処理を実施
する。時々追加される新規な登録モデルについては、一
度クラスタ探索ツリーの探索を実施してみて、いずれの
クラスタに属するかを判定することにより、分類を行
う。

【００４８】以上本実施の形態をまとめると、登録モデ
ル格納部１１に格納された複数の登録モデル・データを
多段クラスタ化し、当該多段クラスタの各段においてい
ずれのクラスタに含まれるか判断するために用いられる
代表モデル・データが当該各段のノードに対応して規定
されているクラスタ探索ツリーを構成する多段クラスタ
構成部１７を実施の形態１のシステムに加え、モデル間
照合部９の代わりの高速モデル間照合部１５は、照合対
象の照合用モデル・データと多段クラスタ探索ツリーの
各段のノードに規定されている代表モデル・データとを
用いて照合処理を実施することによりクラスタ探索ツリ
ーの探索を行い、照合対象の照合用モデル・データが含
まれる最下層のクラスタが特定された場合には、当該最
下層のクラスタに含まれる各登録モデル・データと照合
対象の照合用モデル・データとを用いて照合処理を実施
する。この後、照合結果を用いて、所定の条件（例えば
最も可能性の高いもの又は可能性の高い上位所定数な
ど）に合致する登録モデル・データに対応する登録モデ
ルを特定する。

【００４９】このようにすれば、演算回数を約クラスタ
数分の１に減少させることができるようになり、結果と
して処理速度が向上する。

【００５０】［実施の形態３］実施の形態１及び２で
は、演算回数を減らすための工夫を示していたが、モデ
ル間の照合では第１及び第２の例とも平均ベクトルμを
用いて計算するため認識精度は若干落ちる場合がある。
そこで実施の形態３では、処理速度を向上させ且つ認識
精度を向上させる。

【００５１】実施の形態３におけるシステム概要を図１
２に示す。図３と図１２を比較すると、照合結果判定部
１３の出力が、新たに設けられたモデル取得部１９に入
力され、モデル取得部１９は登録モデル格納部１１を参
照するようにもなっている。そして、モデル取得部１９
の出力は新たに設けられた照合部２１に出力される。ま
た、照合部２１には、音声分析部３が生成する時系列分
析データも入力されるようになっている。最終的な照合
結果は、照合部２１から出力されるようになっている。

【００５２】この図１２に示したシステムの処理フロー
を図１３に示す。話者の音声は、マイクロフォン等であ
る音声入力部１００により入力される（ステップＳ５
１）。音声入力部１００では、空気の振動である音声波
を電気信号に変換する。次に、音声分析部１０２は、音
声の電気信号をディジタル化し、所定の分析窓で、所定
のフレーム周期毎に音声分析を実施し、時系列分析デー
タ（例えばＬＰＣケプストラム係数の系列Ｃ_ij）を生成
する（ステップＳ５３）。

【００５３】次に、話者認識の場合も話者登録の場合
も、モデル作成部５が入力音声に対するモデル・データ
を生成する（ステップＳ５５）。従来技術の欄でも説明
したモデルの第１の例（平均モデル）の場合、（８）式
で計算される平均ベクトルμ_inがモデル・データであ
る。モデルの第２の例（多次元正規分布モデル）の場
合、モデル・データは、（８）式で計算される平均ベク
トルμ_inと（９）式で計算される共分散行列Σ_inであ
る。

【００５４】このようにモデル作成部５がモデル・デー
タを生成した後、音声入力前又は音声入力後に設定され
たモードに従って、話者照合か話者登録かを切替部７が
判断する（ステップＳ５７）。もし、話者照合でなく話
者登録時であると判断された場合には、モデル作成部５
により生成されたモデル・データを、切替部７は登録モ
デル格納部１１に登録する（ステップＳ６９）。なお、
この際にはモデル・データに対応して話者の識別情報等
も登録される。

【００５５】登録されたモデル・データを、第１の例の
場合平均ベクトルμ_rと表し、第２の例の場合平均ベク
トルμ_r及び共分散行列Σ_rと表すものとする。

【００５６】一方、設定モードが話者照合となっている
と判断された場合には、登録モデル格納部１１に格納さ
れる各登録モデル・データと、入力音声に対するモデル
・データとの照合処理をモデル間照合部９が実行する
（ステップＳ５９）。第１の例（平均モデル）の場合の
照合処理は（１０）式により計算される。この計算を全
ての登録モデル・データ（μ_r）に対して実施し、距離
Ｄを記憶装置に格納する。

【００５７】第２の例（多次元正規分布モデル）の場
合、（１１）（１２）及び（１３）式の計算を行う。こ
の計算を全ての登録モデル・データ（μ_r及びΣ_r）に対
して実施し、尤度λ_prodを記憶装置に格納する。

【００５８】このようにモデル間照合部９により記憶装
置に格納された照合結果を用いて、照合結果判定部１３
は、可能性が高い１又は複数の登録モデルを特定し、当
該登録モデルの属性を照合結果として出力する（ステッ
プＳ６１）。より具体的には、第１の例（平均モデル）
の場合には、照合結果の距離Ｄが短い１又は複数の登録
モデルを特定する。距離が短い登録モデルということ
は、入力音声の話者が該当する可能性が高い登録モデル
ということである。第２の例（多次元正規分布モデル）
の場合には、尤度λ_prodが高い１又は複数の登録モデル
を特定する。ここまでは図４の処理とほぼ同じである。

【００５９】次に、照合結果判定部１３の出力はモデル
取得部１９に出力される。そして、モデル取得部１９
は、特定された登録モデルのモデル・データを再度登録
モデル格納部１１から取得する（ステップＳ６３）。こ
のモデル・データは、第１の例の場合平均ベクトルμ_r
であり、第２の例の場合平均ベクトルμ_r及び共分散行
列Σ_rである。この取得された登録モデルのモデル・デ
ータは照合部２１に出力される。

【００６０】照合部２１は、音声分析部３の出力である
時系列分析データと、特定された登録モデルのモデル・
データとを用いて詳細照合処理を実施する（ステップＳ
６５）。この詳細照合処理は、例えば従来技術の欄で説
明した照合処理であって、ここに再度示しておく。第１
の例（平均モデル）の場合には、以下の式となる。

【数１１】ｙ_i＝（Ｃ_i1，Ｃ_i2，．．．Ｃ_iM）^T （４）

【００６１】このように各フレームにおけるケプストラ
ム係数のベクトルｙ_iと登録モデルμ_rとの距離の総和Ｄ
を計算する。そして、ステップＳ６１で特定された各登
録モデルの距離Ｄ（詳細照合処理結果）を比較して、最
も短い（最も可能性の大きい）登録モデルを最も可能性
の高い登録モデルとして特定し、当該登録モデルの属性
（例えば顧客識別情報等）を出力する（ステップＳ６
７）。

【００６２】また、第２の例（多次元正規分布モデル）
の場合、（６）及び（７）式にて計算される。ここに再
度示すと以下のとおりである。

【数１２】

【００６３】そして、尤度λが最も高い登録モデルを特
定し、当該登録モデルに対応する属性値（例えば顧客識
別情報等）を出力する（ステップＳ６７）。

【００６４】以上をまとめると最初に、話者の音声入
力データに関する時系列分析データ（例えばＬＰＣケプ
ストラム係数の系列）から当該照合対象の照合用モデル
・データ（例えば平均ベクトル、又は平均ベクトル及び
共分散行列）を生成する。そして、照合対象の照合用モ
デル・データと、登録モデル格納部１１に格納された照
合の元となる複数の登録モデル・データとを用いて照合
処理を実施する。この照合結果を用いて、所定の条件
（例えば最も可能性の高いもの又は可能性の高い上位所
定数など）に合致する登録モデル・データに対応する登
録モデルを特定する。そして、第１の照合処理により特
定された登録モデルに対応する登録モデル・データを登
録データ格納部１１から取り出すデータ取得部１９と、
データ取得部１９により取り出された登録モデル・デー
タと、入力音声に対する時系列分析データ（例えばＬＰ
Ｃケプストラム係数の系列）とを用いて第２の照合処理
を実施する。

【００６５】これにより、モデル間照合部９にて第２の
照合処理を実施する照合部２１で詳細照合処理を実施す
る対象を絞り込むため、たとえ詳細照合処理にて演算回
数が増加しても全体としては高速化される。一方、詳細
照合処理を実施するので認識精度は従来と変わらない。

【００６６】［実施の形態４］本実施の形態は、実施の
形態２及び実施の形態３の組み合せである。すなわち、
音声入力部１の出力は音声分析部３に入力され、音声分
析部３の出力はモデル作成部５及び照合部２１に入力さ
れる。モデル作成部５の出力は切替部７に入力され、切
替部７は話者照合処理時には高速モデル間照合部１５に
モデル作成部５の出力を切り替え、話者登録時には登録
モデル格納部１１にモデル作成部５の出力を格納するよ
うな構成となっている。高速モデル間照合部１５は、登
録モデル格納部１１に格納された登録モデル・データを
参照し、処理結果を照合結果判定部１３に出力する。照
合結果判定部１３の出力はモデル取得部１９に入力さ
れ、モデル取得部１９は登録モデル格納部１１を参照で
きるようになっている。モデル取得部１９の出力は、照
合部２１に入力され、照合部２１は音声分析部３及びモ
デル取得部１９の出力を用いて処理を行い、最終的な照
合結果を出力する。なお、多段クラスタ構成部１７は、
登録モデル格納部１１を参照して、処理を実施するよう
な構成となっている。

【００６７】図１４に示したシステムの処理フローは図
１３に示したものとほぼ同じである。但し、ステップＳ
５９の処理は、実施の形態２と同じように図９の処理フ
ローに置き換えられる。また、多段クラスタ構成部１７
の処理は、例えば実施の形態２で説明した図１０及び図
１１の処理を実施する。

【００６８】このような構成により実施の形態２におけ
る処理速度の向上と、実施の形態３における認識精度の
向上の両方を達成することができるようになる。

【００６９】本発明の４つの実施の形態を説明したが、
本発明はこれらの実施の形態に限定されるものではな
い。例えば、時系列分析データの例として、ＬＰＣケプ
ストラム係数の系列を例にして説明したが、照合対象に
関する他の時系列分析データであってもよい。さらに、
モデルについては平均モデルと、多次元正規分布モデル
とを用いて説明したが、時系列分析データを用いて生成
される他のモデルを採用することも可能である。また、
照合結果が上位所定数の登録モデルとなる例を示した
が、具体的な閾値を設定してそれを超える距離又は尤度
を有する登録モデルを特定するような構成であってもよ
い。なお、音声についての処理例を示したが、例えば動
画像などの他のデータに適用することも可能である。

【００７０】各実施の形態のシステムは、１台のコンピ
ュータにて実現することも可能であるし、複数台のコン
ピュータにて実現することも可能である。さらに、音声
入力は、インターネット等のネットワークや、公衆回線
網を介しての入力であってもよい。話者識別の結果は様
々な用途に用いることができる。

【００７１】上で述べたような処理は、コンピュータ・
ハードウエアとコンピュータ・プログラムの組み合せで
実現することも可能であるし、一部又は全部を専用の電
子回路で実現することも可能である。コンピュータ・プ
ログラムは、例えばフロッピー・ディスク、ＣＤ−ＲＯ
Ｍ、光磁気ディスク、半導体メモリ、ハードディスク等
の記憶媒体又は記憶装置に格納される。また、当該コン
ピュータ・プログラムはネットワークを介して送信され
ることもある。なお、処理途中のデータについては、コ
ンピュータのメモリに一時保管される。

【００７２】

【発明の効果】以上述べたように本発明によって、より
高速なデータ照合処理技術、より詳しくは高速な話者認
識処理技術を提供することができた。

【図面の簡単な説明】

【図１】従来技術に係るシステム概要図である。

【図２】音声分析部の処理の概要を示す図である。

【図３】実施の形態１に係るシステム概要図である。

【図４】実施の形態１における処理フローを示す図であ
る。

【図５】実施の形態２における処理フローを示す図であ
る。

【図６】（ａ）は登録モデル空間の概念図である。
（ｂ）はクラスタリングにより生成されるクラスタ探索
ツリーの例を説明をするための図である。

【図７】多段クラスタを説明するための図である。

【図８】（ａ）は多段クラスタリングにより生成される
クラスタ探索ツリーの例を示す図である。（ｂ）はツリ
ーの探索を説明するための図である。

【図９】高速モデル間照合部の処理フローを示す図であ
る。

【図１０】ＬＰＧアルゴリズムを示す図である。

【図１１】二分割繰り返しアルゴリズムを示す図であ
る。

【図１２】実施の形態３におけるシステム概要図であ
る。

【図１３】実施の形態３における処理フローを示す図で
ある。

【図１４】実施の形態４におけるシステム概要図であ
る。

【符号の説明】

１音声入力部３音声分析部５モデル作成
部７切替部９モデル間照合部１１登録モデル格納部１
３照合結果判定部１５高速モデル間照合部１７多段クラスタ構成
部１９モデル取得部２１照合部

Claims

【特許請求の範囲】

【請求項１】データ照合システムであって、照合対象に関する時系列分析データから当該照合対象の
照合用モデル・データを作成するモデル作成手段と、照合の元となる複数の登録照合用モデル・データを格納
するモデル・データ格納装置と、前記照合対象の照合用モデル・データと前記登録照合用
モデル・データとを用いて照合処理を実施するモデル間
照合処理手段と、前記モデル間照合処理手段による前記照合対象の照合用
モデル・データと前記登録照合用モデル・データとの照
合結果を用いて、所定の条件に合致する登録照合用モデ
ル・データに対応する登録モデルを特定するモデル特定
手段と、を有するデータ照合システム。
【請求項２】照合対象者の音声データを分析して、前記
時系列分析データである時系列の音声分析データを生成
する手段をさらに有する請求項１記載のデータ照合シス
テム。
【請求項３】前記モデル・データ格納装置に格納された
各前記登録照合用モデル・データを、複数のクラスタの
いずれかに分類し、いずれのクラスタに含まれるか判断
するために用いられる各クラスタの代表登録照合用モデ
ル・データを決定するクラスタ構成手段、をさらに有し、前記モデル間照合処理手段は、前記照合対象の照合用モ
デル・データと前記各クラスタの代表登録照合用モデル
・データとを用いて照合処理を実施することにより、当
該照合対象の照合用モデル・データがいずれのクラスタ
に含まれるのか判断し、当該照合対象の照合用モデル・
データが含まれると判断されたクラスタ内の各登録照合
用モデル・データと前記照合対象の照合用モデル・デー
タとを用いて照合処理を実施することを特徴とする請求
項１又は２記載のデータ照合システム。
【請求項４】前記モデル・データ格納装置に格納された
前記複数の登録照合用モデル・データを多段クラスタ化
し、当該多段クラスタの各段においていずれのクラスタ
に含まれるか判断するために用いられる代表登録照合用
モデル・データが当該各段のノードに対応して規定され
ているクラスタ探索ツリーを構成する多段クラスタ構成
手段、をさらに有し、前記モデル間照合処理手段は、前記照合対象の照合用モ
デル・データと前記多段クラスタ探索ツリーの各段のノ
ードに規定されている前記代表登録照合用モデル・デー
タとを用いて照合処理を実施することにより前記クラス
タ探索ツリーの探索を行い、前記照合対象の照合用モデ
ル・データが含まれる最下層のクラスタが特定された場
合には、当該最下層のクラスタに含まれる各登録照合用
モデル・データと前記照合対象の照合用モデル・データ
とを用いて照合処理を実施することを特徴とする請求項
１又は２記載のデータ照合システム。
【請求項５】前記モデル特定手段により特定された登録
モデルに対応する登録照合用モデル・データを前記モデ
ル・データ格納装置から取り出す特定モデル・データ取
得手段と、前記特定モデル・データ取得手段により取り出された前
記登録照合用モデル・データと、前記時系列分析データ
とを用いて第２の照合処理を実施する第２照合処理手段
と、をさらに有する請求項１乃至４のいずれか記載のデータ
照合システム。
【請求項６】データ照合方法であって、照合対象に関する時系列分析データから当該照合対象の
照合用モデル・データを作成するステップと、前記照合対象の照合用モデル・データと、モデル・デー
タ格納装置に格納された照合の元となる複数の登録照合
用モデル・データとを用いて照合処理を実施するモデル
間照合処理ステップと、前記モデル間照合処理ステップにおける前記照合対象の
照合用モデル・データと前記登録照合用モデル・データ
との照合結果を用いて、所定の条件に合致する登録照合
用モデル・データに対応する登録モデルを特定するステ
ップと、を含むデータ照合方法。
【請求項７】データ照合プログラムであって、コンピュータに、照合対象に関する時系列分析データから当該照合対象の
照合用モデル・データを作成するステップと、前記照合対象の照合用モデル・データと、モデル・デー
タ格納装置に格納された照合の元となる複数の登録照合
用モデル・データとを用いて照合処理を実施するモデル
間照合処理ステップと、前記モデル間照合処理ステップにおける前記照合対象の
照合用モデル・データと前記登録照合用モデル・データ
との照合結果を用いて、所定の条件に合致する登録照合
用モデル・データに対応する登録モデルを特定するモデ
ル特定ステップと、を実行させるためのデータ照合プログラム。
【請求項８】照合対象者の音声データを分析して、前記
時系列分析データである時系列の音声分析データを生成
するステップをコンピュータにさらに実行させるための
請求項７記載のデータ照合プログラム。
【請求項９】前記モデル・データ格納装置に格納された
各前記登録照合用モデル・データを、複数のクラスタの
いずれかに分類し、いずれのクラスタに含まれるか判断
するために用いられる各クラスタの代表登録照合用モデ
ル・データを決定するステップ、をコンピュータにさらに実行させ、前記モデル間照合処理ステップにおいて、前記照合対象
の照合用モデル・データと前記各クラスタの代表登録照
合用モデル・データとを用いて照合処理を実施すること
により、当該照合対象の照合用モデル・データがいずれ
のクラスタに含まれるのか判断し、当該照合対象の照合
用モデル・データが含まれると判断されたクラスタ内の
各登録照合用モデル・データと前記照合対象の照合用モ
デル・データとを用いて照合処理を実施することを特徴
とする請求項７又は８記載のデータ照合プログラム。
【請求項１０】前記モデル・データ格納装置に格納され
た前記複数の登録照合用モデル・データを多段クラスタ
化し、当該多段クラスタの各段においていずれのクラス
タに含まれるか判断するために用いられる代表登録照合
用モデル・データが当該各段のノードに対応して規定さ
れているクラスタ探索ツリーを構成するステップ、をコンピュータにさらに実行させ、前記モデル間照合処理ステップにおいて、前記照合対象
の照合用モデル・データと前記多段クラスタ探索ツリー
の各段のノードに規定されている前記代表登録照合用モ
デル・データとを用いて照合処理を実施することにより
前記クラスタ探索ツリーの探索を行い、前記照合対象の
照合用モデル・データが含まれる最下層のクラスタが特
定された場合には、当該最下層のクラスタに含まれる各
登録照合用モデル・データと前記照合対象の照合用モデ
ル・データとを用いて照合処理を実施することを特徴と
する請求項７又は８記載のデータ照合プログラム。
【請求項１１】前記モデル特定ステップにおいて特定さ
れた登録モデルに対応する登録照合用モデル・データを
前記モデル・データ格納装置から取り出す特定モデル・
データ取得ステップと、前記特定モデル・データ取得ステップにおいて取り出さ
れた前記登録照合用モデル・データと、前記時系列分析
データとを用いて第２の照合処理を実施するステップ
と、をコンピュータにさらに実行させるための請求項７乃至
１０のいずれか記載のデータ照合プログラム。
【請求項１２】データ照合プログラムを格納した記録媒
体であって、前記データ照合プログラムは、コンピュータに、照合対象に関する時系列分析データから当該照合対象の
照合用モデル・データを作成するステップと、前記照合対象の照合用モデル・データと、モデル・デー
タ格納装置に格納された照合の元となる複数の登録照合
用モデル・データとを用いて照合処理を実施するモデル
間照合処理ステップと、前記モデル間照合処理ステップにおける前記照合対象の
照合用モデル・データと前記登録照合用モデル・データ
との照合結果を用いて、所定の条件に合致する登録照合
用モデル・データに対応する登録モデルを特定するモデ
ル特定ステップと、を実行させるためのプログラムである、記録媒体。