JP2002196784A - 時系列信号の識別方法及び装置 - Google Patents

時系列信号の識別方法及び装置

Info

Publication number
JP2002196784A
JP2002196784A JP2000398599A JP2000398599A JP2002196784A JP 2002196784 A JP2002196784 A JP 2002196784A JP 2000398599 A JP2000398599 A JP 2000398599A JP 2000398599 A JP2000398599 A JP 2000398599A JP 2002196784 A JP2002196784 A JP 2002196784A
Authority
JP
Japan
Prior art keywords
data
power spectrum
histogram
reference data
mutual information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000398599A
Other languages
English (en)
Inventor
Hiroyasu Kumaki
弘泰 熊木
Naoya Miyano
尚哉 宮野
Muneo Harada
宗生 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Sumitomo Metal Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Metal Industries Ltd filed Critical Sumitomo Metal Industries Ltd
Priority to JP2000398599A priority Critical patent/JP2002196784A/ja
Publication of JP2002196784A publication Critical patent/JP2002196784A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 コストを抑えつつ、信号の識別精度を向上さ
せることが可能な信号処理方法及び装置を提供するこ
と。 【解決手段】 基準となる参照データと識別対象となる
観測データとの因果的な相関度合いを示す平均相互情報
量を求め、この平均相互情報量に基づいて、参照データ
と観測データの類似度を判定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音響信号や画像信号等
のように時系列的に変化する信号の処理方法及び処理装
置に関する。更に詳しくは、音響信号や画像信号の特徴
量からこれらを識別するための方法及び装置に関する。
【0002】
【従来の技術】時系列的にレベルが変化する信号として
は、音響信号や画像(動画)信号がある。現在よく知ら
れている音声自動認識、話者自動認識、装置の作動音を
用いた故障診断、異常検出などの音響信号処理は、音響
信号の周波数スペクトルの特徴を何らかの方法で数値化
し、参照データと照合して、どの登録カテゴリーに近い
かを判定するものである。そして、信号の特徴抽出の際
には、例えば、パワースペクトル推定後に線形予測法等
に基づく処理を行っていた。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
たような従来技術では、信号の特徴を抽出するのに多大
な計算コストを要する。また、特徴を抽出するプロセス
で除去されたスペクトル成分中に重要な特徴が残ってい
る可能性があり、抽出された特徴量と登録された信号の
特徴量との類似度を推定する際の判定誤差を緩和できな
いという間題点がある。
【0004】従って、本発明の目的は、コストを抑えつ
つ、信号の識別精度を向上させることが可能な信号処理
方法及び装置を提供することにある。
【0005】
【課題を解決するための手段】本発明の第1の態様に係
る方法においては、基準となる参照データと識別対象と
なる観測データとの因果的な相関度合いを示す平均相互
情報量を求め、この平均相互情報量に基づいて、参照デ
ータと観測データの類似度を判定する。
【0006】また、本発明の第2の態様に係るシステム
は、基準となる参照データと識別対象となる観測データ
との因果的な相関度合いを示す平均相互情報量を求める
演算装置と;演算回路によって算出された平均相互情報
量に基づいて、参照データと観測データの類似度を判定
する判定装置とを含む。
【0007】更に、本発明の第3の態様はコンピュータ
読みとり可能な記録媒体であり、基準となる参照データ
と識別対象となる観測データとの因果的な相関度合いを
示す平均相互情報量を求める手順と;求められた平均相
互情報量に基づいて、参照データと観測データの類似度
を判定する手順とをコンピュータに実行させるためのプ
ログラムを記録している。
【0008】ここで、平均相互情報量とは、二つの事象
系の確率分布関数から求められ、事象系間の因果的相関
関係を表すものである。平均相互情報量を用いて音響信
号処理を行う場合、予め登録された音響信号と新たに観
測された音響信号を事象系とし、それぞれの確率分布関
数から平均相互情報量を算出して二つの音響信号の因果
的相関関係を表す。平均相互情報量に基づいた音響信号
処理においては、音響信号から推定した周波数パワース
ペクトルから度数分布(ヒストグラム)を作成し、これ
を確率分布関数として音響信号の特徴とする。このた
め、音響信号から得られるパワースペクトルについて、
パワースペクトルの特徴を再抽出する必要がない。全周
波数領域のパワースペクトルから音響信号の特徴を抽出
することができ、スペクトル成分中の重要な音響信号の
特徴を正確に抽出することが可能となる。
【0009】本発明の各態様において、例えば、参照デ
ータ及び観測データのパワースペクトルに基づいて各々
のヒストグラムを生成する。そして、参照データのヒス
トグラムと観測データのヒストグラムとに基づいて、参
照データと観測データの平均相互情報量を求める。好ま
しくは、参照データ及び観測データを各々事象系X,事
象系Yとし、周波数およびパワースペクトルを軸とする
2次元のヒストグラムを二分法によって各々生成する。
【0010】相互情報量を計算するには、本来x,yの
分布関数を知る必要があるが、数学的に無限個のデータ
が無いとこの分布関数はできない。そこで、本発明にお
いては、この分布関数を有限個のデータのヒストグラム
で近似する。これにより、各区間ごとに確率を近似で
き、各区間ごとの相互情報量を求めることが可能とな
る。これを全区間に拡大するために、全区間にわたり、
各区間の相互情報量の平均をとった値として平均相互情
報量を求める。
【0011】更に、本発明の各態様において、複数の異
なる共振周波数を有するカンチレバーによって構成され
る共振子アレイセンサをデータ入力デバイスとして使用
し、参照データ及び観測データのパワースペクトルを直
接求めることが好ましい。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て、音声入力用デバイスとして音声入力用マイクロフォ
ンと、共振子アレイセンサを用いた2つの場合を例にと
って説明する。なお、本発明の対象となる信号として
は、音響信号のほかに、画像信号などの時系列的に変化
する各種の信号がある。そして、本発明は、音声認識、
話者認識、故障診断、異常検出などに応用できるもので
ある。故障診断としては、例えば、機械、自動車、飛行
機などの大型機械のほかに、CD−ROM又はCD−R
/RWドライブやハードディスクドライブなどの精密機
械がある。また、本発明の形態(カテゴリー)として
は、信号処理方法;装置;ソフトウエアそのもの;ソフ
トウエアをコンピュータによって読みとり可能な状態で
記憶した記録媒体;通信回線などによって伝送されるプ
ログラムデータ等のあらゆる形態を含むものである。
【0013】最初に、音声識別の対象となる人物の音声
信号を音声入力用マイクロフォンから入力する場合につ
いて説明する。音声入力用マイクロフォンを用いる場
合、入力された音声信号をA/D(アナログ/ディジタ
ル)変換し、適当な標本化間隔で検出された標本点N個
の音声信号h(k)、k=0,1,2,・・・、N−1
からパワースペクトルを推定する。パワースペクトル推
定を行った後、所定の範囲の周波数領域でのパワースペ
クトルからヒストグラムを生成し、登録する。その後、
新たに計測した音声信号においても上記と同様にして入
力、変換を行い、周波数領域のパワースペクトルからヒ
ストグラムを生成する。音声入力用マイクロフォンから
のパワースペクトルの推定は、例えば、高速フーリエ変
換アルゴリズム(FFT)などを基に実行可能である。
【0014】次に、(1)音声識別の対象となる人物に
ついて予め登録しておいたヒストグラムと、(2)新た
に計測した人物のパワースペクトルから作成したヒスト
グラムと、から平均相互情報量を求める。そして、この
平均相互情報量から因果的相関関係を求め、「予め登録
しておいた人物と新たに計測した人物とは同一人物であ
る」または、「予め登録しておいた人物と新たに計測し
た人物は一致しない」という判定をする。
【0015】音声入力デバイスとして音声入力用マイク
ロフォンを用いた場合の平均相互情報量を求めるアルゴ
リズムは以下の通りである。予め登録しておいた周波数
パワースペクトルデータを X{f(n), Z(n)} とし、新た
に計測した周波数パワースペクトルデータを Y{f’(n),
Z’(n)} とする。ここで、f(n) は周波数成分、Z(n)は
f(n)におけるパワースペクトル密度を示す。また、f'
(n)は周波数成分、Z'(n)はf'(n)におけるパワースペク
トル密度を示す。次に、予め登録しておいた周波数パワ
ースペクトルデータを事象系X X{f(0),Z(0)},X{f(1),Z(1)1},X{f(2),Z(2)},…,X{f(N-
1),Z(N-1)}とし、新たに計測した周波数パワースペクト
ルデータを事象系Y Y{f'(0),Z'(0)},Y{f'(1),Z'(1)},Y{f'(2),Z'(2)},...,Y
{f'(N-1),Z'(N-1)}とする。
【0016】それぞれの事象系(X,Y)について、周
波数およびパワースペクトルを軸とする2次元のヒスト
グラムを二分法によって生成する。生成するヒストグラ
ムは周波数情報を含まず、パワースペクトルのみから成
るmeasure space histogramと呼ばれる。
【0017】二分法のアルゴリズムは、以下の通りであ
る。通常、ある1つのデータを2次元の度数分布にプロ
ットするときグリッド数をNとすると、当てはまるグリ
ッドを求めるためには約(N/2)の計算を行わなけ
ればならない。二分法を用いて度数分布のグリッドを2
進数表示すると計算回数を大幅に減らすことができ、処
理速度を向上させることができる。実際のアルゴリズム
は、まず、N=2個のグリッドを持つ度数分布におい
てデータの値をmビットの2進数表示する。次に、デー
タの最大値+θ、最小値−θをグリッドの右端と左端に
とる。θは非常に小さい値にし、最大値及び最小値とも
に格納できるようにする。このときグリッドの右端と左
端の中点よりもデータの値が大きいとき、最上位ビット
に1を代入して、グリッドの左端を中点で置き換える。
逆にグリッドの右端と左端の中点よりもデータの値が小
さいときは、最上位ビットに0を代入して、グリッドの
右端を中点で置き換える。新たに右端と左端が決まった
後、同じ処理を最下位ビットに値が格納されるまで行
う。このようにしてm回の計算でデータの値をグリッド
に格納することが可能となる。2次元の度数分布におい
ては、2log2N回の計算回数となる。図6に3ビットの
二分法の例を示す。
【0018】次に、これらのヒストグラムから2つの事
象系(X,Y)の周波数およびパワースペクトルの4つ
の軸を有する4次元の結合ヒストグラムを生成し、これ
ら3つのヒストグラムからそれぞれの事象の出現確率を
求める。この出現確率から以下の式に従って、事象系
(X,Y)の情報エントロピーH(X),H(Y)を求
める。
【0019】
【数1】
【0020】
【数2】
【0021】また、4次元の結合ヒストグラムから結合
情報エントロピーH(X,Y)を、以下の式に従って求
める。ここで、P{X(i), Y(i)}は、事象X{f(i), Z(i)}と
事象Y{f'(j), Z'(j)}との結合確率である。
【0022】
【数3】
【0023】これらの値を用いて事象系Yが事象系Xにつ
いての情報をどれだけ含んでいるか、観測された事象系
Yが登録された事象系Xのうちのどの事象系と因果的な相
関が強いかを示す平均相互情報量 I(X:Y) を、以下の式
に従って求める。
【0024】
【0025】平均相互情報量とは、二つの事象系の確率
分布関数から求められ、事象系間の因果的相関関係を表
すものである。相互情報量を計算するには、本来x,y
の分布関数を知る必要があるが、数学的に無限個のデー
タが無いとこの分布関数はできない。そこで、本発明に
おいては、この分布関数を有限個のデータのヒストグラ
ムで近似する。これにより、各区間ごとに確率を近似で
き、各区間ごとの相互情報量を求めることが可能とな
る。これを全区間に拡大するために、全区間にわたり、
各区間の相互情報量の平均をとった値として平均相互情
報量をもとめる。
【0026】平均相互情報量を用いて音響信号処理を行
う場合、予め登録された音響信号と新たに観測された音
響信号を事象系とし、それぞれの確率分布関数から平均
相互情報量を算出して二つの音響信号の因果的相関関係
を表す。平均相互情報量に基づいた音響信号処理におい
ては、音響信号から推定した周波数パワースペクトルか
ら度数分布(ヒストグラム)を作成し、これを確率分布
関数として音響信号の特徴とする。このため、音響信号
から得られるパワースペクトルについて、パワースペク
トルの特徴を再抽出する必要がない。全周波数領域のパ
ワースペクトルから音響信号の特徴を抽出することがで
き、スペクトル成分中の重要な音響信号の特徴を正確に
抽出することが可能となる。
【0027】なお、パワースペクトル密度を1ビットで
表現する、すなわち、2値化すると、パワースペクトル
密度が、Z(n)=1となる周波数成分だけが重要な音声特徴
を形成することになる。この場合には、2次元ヒストグ
ラムは1次元に、4次元ヒストグラムは2次元に低次元
化される。
【0028】上述したように、予め登録しておいた人物
の音声信号と新たに計測した人物の音声信号との照合
は、計測した音声信号が登録された音声信号の情報をど
の程度含んでいるか平均相互情報量により評価すること
で容易に行える。
【0029】平均相互情報量の閾値を定め、登録された
パワースペクトルと計測されたパワースペクトルとの平
均相互情報量が閾値を超えるならば二人は同一人物とみ
なす。閾値を超えないならば二人は異なった人物である
と判定する。
【0030】次に、共振子アレイセンサを音声入力デバ
イスとして用いた場合について説明する。共振子アレイ
センサは、複数の異なる共振周波数を有するカンチレバ
ーを集合したものであり、同時に複数の周波数に参照信
号をセンシングできる。そして、共振子アレイセンサの
出力は直接パワースペクトルを表すアナログ信号とな
る。このアナログ出力にA/D変換を施す。その後、マ
イクロフォンを用いた場合と同様に、量子化されたパワ
ースペクトルからヒストグラムを作成する。共振子アレ
イセンサを用いることにより、DSP(ディジタル・シ
グナル・プロセッサ)を介さずに音声信号の特徴量(パ
ワースペクトル)を直接抽出することができる。
【0031】さらに、平均相互情報量を求めるアルゴリ
ズムは以下のとおり。音声入力用マイクロフォンを用い
た時と同様に、音声入力デバイスとして予め登録してお
いた周波数パワースペクトルデータをX{f(n),Z(n)}、新
たに計測した周波数パワースペクトルデータをY{f'(n),
Z'(n)}とみなす。予め記憶しておいた周波数パワースペ
クトルデータを事象系X X{f(0),Z(0)},X{f(1),Z(1)},X{f(2),Z(2)},….,X{f(N-
1),Z(N-1)} 新たに計測した周波数パワースペクトルデータを事象系
Y Y{f'(0),Z'(0)},Y{f'(1),Z'(1)},Y{f'(2),Z'(2)},...,Y
{f'(N-1),Z'(N-1)}とおく。以降の判定処理について
は、マイクロフォンを用いた場合と同様である。
【0032】共振子アレイセンサを音響信号入力デバイ
スとして用いることにより、音響信号から直接パワース
ペクトルの推定が行え、また推定されたパワースペクト
ルからヒストグラムを作成することで処理速度の向上を
図ることができる。
【0033】
【具体的な形態】以下、本発明の音声入力デバイスとし
て音声入力用マイクロフォンと共振子アレイセンサを用
いた2つの実施の形態を具体的に説明する。
【0034】図1は、本発明の話者認識システムの構成
を示すブロック図である。第1の形態に係る話者認識シ
ステムは、音声測定器1として、音声入力用マイクロフ
ォンを使用する。測定器1に人物の音声信号を入力す
る。測定器1の出力は、アナログ/ディジタル(A/
D)変換器2においてディジタル信号に変換される。こ
のディジタル信号は、コンピュータ3に備えられたメモ
リ32に、時系列データとして記憶される。
【0035】メモリ32に記憶された時系列データは、
中央処理装置31によって演算部33に送られる。演算
部33は、後述するように平均相互情報量を算出し、そ
れを判断部34に供給する。判断部34には、予め閾値
が設定してあり、演算部33から与えられた平均相互情
報量とその閾値を比較する。そして、平均相互情報量が
閾値以上であった場合は二つの音声信号は同じで二人は
同一人物であると判断して、出力部35から外部装置4
へ認識された話者のコードを出力する。
【0036】図2及び図3は、図1に示したコンピュー
タ3による話者認識の手順を示すフロ一チャートであ
る。コンピュータ3の演算部33にはデータ数N、標本
化間隔△、ヒストグラムのグリッド数等が設定してあ
る。また、判断部34には平均相互情報量の閾値が設定
してある(ステップS1)。コンピュ一タ3のメモリ3
2は、A/D変換器2から与えられたディジタル信号を
時系列データとして記憶する(ステップS2、S3)。メ
モリ32に記憶された時系列データは、中央処理装置3
1によって演算部33に与えられる。
【0037】上記の動作をまとめると、音声識別の対象
となる人物の音声信号を入力し、A/D変換を行った
後、標本化間隔が△、標本点N個の音声時系列データと
してh(k),k=0,1,2,…,N-1をメモリ32に記憶する(ステ
ップS1,S2,S3)。
【0038】演算部33は、データの特徴を表すものと
して、データを周波数領域におけるパワースペクトルに
変換する。パワースペクトルの推定方法としては、音声
時系列データに高速フーリエ変換を施し、データを周波
数スペクトル特性H(n)に変換した後、パワースペクトル
密度Z(n)=|H(n)|2を求める方法がある。ただし、パ
ワースペクトルの推定方法は、フーリエ変換に限定され
るものではない。次に、音声時系列データの周波数及び
パワースペクトルを変数とするX{f(n),Z(n)}の集合 X{f(0),Z(0)},X{f(1),Z(1)},X{f(2),Z(2)},….,X{f(N-
1),Z(N-1)} を1つの事象系(X)と考え、この事象系
Xから得られる周波数f(n)及びパワースペクトル密度Z
(n)を軸とする2次元ヒストグラムを生成し、参照デー
タとして登録する(ステップS4,S5)。
【0039】次に、演算部33は、計測された音声時系
列データについて上記と同様に入力、高速フーリエ変換
を施し、周波数f'(n)及びパワースペクトルZ'(n)を変数
とするY{f'(n),Z'(n)}の集合 Y{f'(0),Z'(0)},Y{f'(1),Z'(1)},Y{f'(2),Z'(2)},…,Y
{f'(N-1),Z'(N-1)}を1つの、事象系(Y)と考え、こ
の事象系Yから得られる周波数及びパワースペクトルを
軸とする2次元ヒストグラムを生成する。(ステップS
6,S7,S8,S9)。
【0040】次に、予め参照データとして登録してある
ヒストグラムにおいて周波数及びパワースペクトルを変
数とするX{f(n),Z(n)}を確率変数として出現確率p[X{f
(n),Z(n)}]から、事象系Xの情報エントロピーH(X)を求
める。その後、計測データから得られたヒストグラムに
おいてY{f'(n),Z'(n)}を確率変数として出現確率p[X{f'
(n),Z'(n)}]から事象系Yの情報エントロピーH(Y)を求
める。次に、登録された事象系Xと計測された事象系Yと
の間における結合エントロピーH(X,Y)を、登録された
事象系Xと計測された事象系Yのヒストグラムから求め
る。そして、これら3つの情報エントロピーに基づき、
計測された音声が登録された音声のうちのどの音声と因
果的相関関係が強いかを示す平均相互情報量を求める
(ステップS10,S11)。
【0041】演算部33は、求めた平均相互情報量を判
断部34に与える。判断部34は、演算部33から与え
られた平均相互情報量と予め設定された閾値とを比較す
る(ステップS12)。そして、平均相互情報量が閾値
を超えるならば2つの音声は同一である(この二人は同
一人物である)と判断し(ステップS13)、出力部3
5から外部装置4へ認識された話者のコードを出力させ
る(ステップS14)。
【0042】次に、本発明の第2の実施形態について説
明する。図4及び図5は、コンピュータ3における第2
の実施形態よる話者認識の手順を示す。本実施形態にお
いては、音声測定器1として、共振子アレイセンサを使
用する。共振子アレイセンサに人物の音声信号を入力す
る。共振子アレイセンサを用いることにより、その出力
として直接パワースペクトルの推定を行う。出力として
のパワースペクトルは、アナログ/ディジタル(A/
D)変換器2においてディジタル化され、コンピュータ
3に備えられたメモリ32に保持される。
【0043】メモリ32に記憶されたパワースペクトル
データは、中央処理装置31によって演算部33に与え
られる。演算部33は、第1の実施形態(音声入力デバ
イスとして音声入力用マイクロフォンを用いた場合)と
同様に、参照する音声信号のパワースペクトルからヒス
トグラムを生成、登録する。そして、計測された音声信
号のパワースペクトルから同じくヒストグラムを生成す
る。得られたヒストグラムから、第1の実施形態と同様
に、平均相互情報量を算出する。求めた平均相互情報量
と予め設定しておいた閾値と比較し、平均相互情報量が
閾値以上であった場合は二つの音声は同じで二人は同一
人物であると判定し、出力部35から外部装置4へ認識
された話者のコードを出力する。
【0044】本実施形態においては、A/D変換器で離
散化を行った音声信号にDSPを介してパワースペクト
ルを推定するのではなく、共振子アレイセンサを用いる
ことにより、アナログ音声信号から直接にパワースペク
トルを推定できる。さらにパワースペクトル密度を1ビ
ットで表現する、すなわち、2値化することでパワース
ペクトルをヒストグラムと見做せる。アナログ音声信号
から直接パワースペクトルを推定し、パワースペクトル
を直接ヒストグラムとすることにより処理速度の向上が
可能となる。
【0045】
【実施例】次に、本発明による話者認識の2つの実施例
(実験例)について説明する。第1の実施例は、一人の
女性F及び二人の男性A,Bの三人の母音をマイクロフ
ォンに入力して話者認識を行う事例である。音声入力
後、A/D変換によりデータをディジタル化し、周波数
領域150Hz〜4000Hzにおけるパワースペクト
ルに変換する。サンプリング周波数は20KHz、ディ
ジタル化精度は5ビットである。
【0046】こうしてディジタル化された信号をコンピ
ュータに送信し、高速フーリエ変換によりパワースペク
トルを推定する。女性F、男性A,Bについて予め計測
された母音音声信号から周波数及びパワースペクトル密
度を軸とする2次元ヒストグラムを生成し、参照データ
としてこのヒストグラムを登録する。
【0047】このパワースペクトルを求める過程におい
て、音声信号の急激な立ち上がり及び立ち下がりを防止
するために、適切な窓関数を用いる。これにより、パワ
ースペクトルの算出誤差が低滅できる。また、データを
より広いレンジで得るために、パワースペクトル及び周
波数について対数変換を行なう。ただし、パワースペク
トルの推定方法及び窓関数の使用は、これらに限定され
るものではない。
【0048】女性F、男性A,Bのそれぞれの母音の周
波数及びパワースペクトルを変数とするX{f(n),Z(n)}の
集合を1つの事象系と考え、音声時系列データから得ら
れたX{f(n),Z(n)}を確率変数とする。そして、参照デー
タとして登録したヒストグラムから出現確率p[X{f(n),Z
(n)}]を求め、さらにこの事象系の情報エントロピーH
(X)を求める。
【0049】次に、計測された女性F、男性A,Bの母
音における音声時系列データについて、上記と同様にし
て周波数及びパワースペクトル密度を軸とする2次元ヒ
ストグラムを生成する。さらに生成したヒストグラムか
らp[Y{f'(n),Z'(n)}]を計算し、情報エントロピーH(Y)
を求める。また、登録された事象系X{f(n),Z(n)}と計測
された事象系Y{f'(n),Z'(n)}との間における結合エント
ロピーH(X,Y)を求める。これら三つの情報エントロピー
に基づき、計測された事象系Y{f'(n),Z'(n)}と登録され
た事象系X{f(n),Z(n)}との因果的な相関関係を示す平均
相互情報量を求める。
【0050】このように、計測された音声信号が登録さ
れたどの音声信号と因果的な相関が強いかを調べる。こ
の実施例では、計測された音声信号と登録された音声信
号が同一であると判別する閾値を6ビット以上と定め
る。
【0051】判定例を表1,表2,表3に示す。表1は
同一人物の同一音声における平均相互情報量、表2は女
性Fと男性Aの音声における平均相互情報量、表3は男
性AとBの音声における平均相互情報量である。
【0052】
【表1】
【0053】
【表2】
【0054】
【表3】
【0055】表1,表2,表3から、同一人物の同一音
声における平均相互情報量はすべて6ビットを越え、話
者の識別が可能である。
【0056】第2の実施例は、女性F、男性A,Bの母
音における音声信号の入力として共振子アレイセンサを
用いる話者認識である。音声信号のセンシング及びパワ
ースペクトルヘの変換のプロセスを同時に行うものとし
て、Fish bone構造を利用した共振子アレイセンサを用
いる。
【0057】共振子アレイセンサの出力は、アナログ信
号のパワースペクトルであるため、出力信号にA/D変
換を行い離散化する。この実施例では、パワースペクト
ルを2値化してヒストグラムを作成し、参照データとし
て登録する。同様にして計測された音声信号からヒスト
グラムを生成する。前記の実施例と同様にして、登録さ
れた音声と計測データとの因果的相関の程度を平均相互
情報量で評価する。求められた平均相互情報量を予め設
定しておいた閾値と比較し、話者認識を実施する。
【0058】以上、本発明の実施例(実施形態、実施態
様)について説明したが、本発明はこれらの実施例に何
ら限定されるものではなく、特許請求の範囲に示された
技術的思想の範疇において変更可能なものである。
【0059】
【発明の効果】本発明は、パワースペクトル間の因果的
相関を相互情報量で直接評価する手法を採用しているた
めに、推定精度が向上するという格別の効果がある。ま
た、音声入力デバイスとして共振子アレイセンサを用い
た場含には、機械的共振現象の利用により音声計測の実
時間性及び高感度性の向上を図ることが可能となる。
【図面の簡単な説明】
【図1】図1は、本発明にかかる話者認識システムの構
成を示すブロック図である。
【図2】図2は、音声入力デバイスとして音声入力用マ
イクロフォンを用いたケースでの、図1に示したコンピ
ュータによる話者認識手順を示すフローチャートであ
る。
【図3】図3は、音声入力デバイスとして音声入力用マ
イクロフォンを用いたケースで、図1に示したコンピュ
ータによる話者認識手順を示すフローチャートである。
【図4】図4は、音声入力デバイスとして共振子アレイ
センサを用いたケースで、図1に示したコンピュータに
よる話者認識手順を示すフローチャートである。
【図5】図5は、音声入力デバイスとして共振子アレイ
センサを用いたケースで、図1に示したコンピュータに
よる話者認識手順を示すフローチャートである。
【図6】図6は、音響信号の2次元のヒストグラムを生
成するのに用いられる二分法のアルゴリズムを示す説明
図である。
【符号の説明】
1 測定器(音声入力用マイクロフォン、共振子ア
レイセンサ) 3 コンピュータ 31 中央処理装置 32 メモリ 33 演算部 34 判断部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 原田 宗生 兵庫県尼崎市扶桑町1番8号 住友金属工 業株式会社内 Fターム(参考) 5D015 HH04

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】時系列的に変化する信号を識別する方法に
    おいて、 基準となる参照データと識別対象となる観測データとの
    因果的な相関度合いを示す平均相互情報量を求める工程
    と;前記平均相互情報量に基づいて、前記参照データと
    観測データの類似度を判定する工程とを含むことを特徴
    とする信号識別方法。
  2. 【請求項2】前記平均相互情報量を求める工程は、前記
    参照データのパワースペクトルを生成する手順と;前記
    参照データのパワースペクトルに基づいて当該参照デー
    タのヒストグラムを生成する手順と;前記観測データの
    パワースペクトルを生成する手順と;前記観測データの
    パワースペクトルに基づいて当該観測データのヒストグ
    ラムを生成する手順と;前記参照データのヒストグラム
    と観測データのヒストグラムとに基づいて、前記参照デ
    ータと観測データの平均相互情報量を求める手順とを含
    み、 前記平均相互情報量を所定の基準値と比較することによ
    って、前記参照データと観測データとの類似度を判定す
    ることを特徴とする請求項1に記載の信号識別方法。
  3. 【請求項3】前記参照データ及び観測データを各々事象
    系X,事象系Yとし、周波数およびパワースペクトルを
    軸とする2次元のヒストグラムを二分法によって各々生
    成することを特徴とする請求項2に記載の信号識別方
    法。
  4. 【請求項4】複数の異なる共振周波数を有するカンチレ
    バーによって構成される共振子アレイセンサを用い、当
    該センサによって前記参照データ及び観測データのパワ
    ースペクトルを直接求めることを特徴とする請求項1,
    2又は3に記載の信号識別方法。
  5. 【請求項5】前記参照データ及び観測データは、音響デ
    ータ又は画像データであることを特徴とする請求項1,
    2,3又は4に記載の信号識別方法。
  6. 【請求項6】時系列的に変化する信号を識別するシステ
    ムにおいて、 基準となる参照データと識別対象となる観測データとの
    因果的な相関度合いを示す平均相互情報量を求める演算
    装置と;前記演算回路によって算出された平均相互情報
    量に基づいて、前記参照データと観測データの類似度を
    判定する装置とを含むことを特徴とする信号識別装置。
  7. 【請求項7】前記演算装置は、前記参照データ及び観測
    データのパワースペクトルを生成する測定器と;前記参
    照データ及び観測データのパワースペクトルに基づいて
    各データのヒストグラムを生成し、前記参照データのヒ
    ストグラムと観測データのヒストグラムとに基づいて、
    前記参照データと観測データの平均相互情報量を求める
    演算部とを備え、 前記判定装置は、前記平均相互情報量を所定の基準値と
    比較することによって、前記参照データと観測データと
    の類似度を判定することを特徴とする請求項6に記載の
    システム。
  8. 【請求項8】前記測定器は、複数の異なる共振周波数を
    有するカンチレバーによって構成される共振子アレイセ
    ンサであり、当該センサによって前記参照データ及び観
    測データのパワースペクトルを直接求めることを特徴と
    する請求項7に記載のシステム。
  9. 【請求項9】前記演算装置は、前記参照データ及び観測
    データを各々事象系X,事象系Yとし、周波数およびパ
    ワースペクトルを軸とする2次元のヒストグラムを二分
    法によって各々生成することを特徴とする請求項7又は
    8に記載のシステム。
  10. 【請求項10】前記参照データ及び観測データは、音響
    データ又は画像データであることを特徴とする請求項
    6,7,8又は9に記載のシステム。
  11. 【請求項11】コンピュータに時系列的に変化する信号
    を識別する手順を実行させるプログラムを記録したコン
    ピュータ読みとり可能な記録媒体において、 基準となる参照データと識別対象となる観測データとの
    因果的な相関度合いを示す平均相互情報量を求める手順
    と;前記平均相互情報量に基づいて、前記参照データと
    観測データの類似度を判定する手順とを実行させるため
    のプログラムを記録したコンピュータ読みとり可能な記
    録媒体。
  12. 【請求項12】前記平均相互情報量を求める手順は、前
    記参照データのパワースペクトルを生成する手順と;前
    記参照データのパワースペクトルに基づいて当該参照デ
    ータのヒストグラムを生成する手順と;前記観測データ
    のパワースペクトルを生成する手順と;前記観測データ
    のパワースペクトルに基づいて当該観測データのヒスト
    グラムを生成する手順と;前記参照データのヒストグラ
    ムと観測データのヒストグラムとに基づいて、前記参照
    データと観測データの平均相互情報量を求める手順とを
    含み、 前記類似度を判定する手順は、前記平均相互情報量を所
    定の基準値と比較することによって実行されることを特
    徴とする請求項11に記載の記録媒体。
  13. 【請求項13】前記参照データ及び観測データのパワー
    スペクトルを、複数の異なる共振周波数を有するカンチ
    レバーによって構成される共振子アレイセンサによって
    直接求めることを特徴とする請求項12に記載の記録媒
    体。
  14. 【請求項14】前記参照データ及び観測データを各々事
    象系X,事象系Yとし、周波数およびパワースペクトル
    を軸とする2次元のヒストグラムを二分法によって各々
    生成することを特徴とする請求項12又は13に記載の
    記録媒体。
  15. 【請求項15】前記参照データ及び観測データは、音響
    データ又は画像データであることを特徴とする請求項1
    1,12,13又は14に記載の記録媒体。
JP2000398599A 2000-12-27 2000-12-27 時系列信号の識別方法及び装置 Pending JP2002196784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000398599A JP2002196784A (ja) 2000-12-27 2000-12-27 時系列信号の識別方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000398599A JP2002196784A (ja) 2000-12-27 2000-12-27 時系列信号の識別方法及び装置

Publications (1)

Publication Number Publication Date
JP2002196784A true JP2002196784A (ja) 2002-07-12

Family

ID=18863529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000398599A Pending JP2002196784A (ja) 2000-12-27 2000-12-27 時系列信号の識別方法及び装置

Country Status (1)

Country Link
JP (1) JP2002196784A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065393A (ja) * 2006-09-04 2008-03-21 Research Organization Of Information & Systems グループ判別装置及びグループ判別方法
WO2019038573A1 (en) * 2017-08-25 2019-02-28 Leong David Tuk Wai APPARATUS FOR RECOGNIZING SOUNDS
CN110121633A (zh) * 2016-12-29 2019-08-13 三星电子株式会社 用于通过使用谐振器来识别说话者的方法及设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065393A (ja) * 2006-09-04 2008-03-21 Research Organization Of Information & Systems グループ判別装置及びグループ判別方法
CN110121633A (zh) * 2016-12-29 2019-08-13 三星电子株式会社 用于通过使用谐振器来识别说话者的方法及设备
JP2020504329A (ja) * 2016-12-29 2020-02-06 サムスン エレクトロニクス カンパニー リミテッド 共振器を利用した話者認識方法及びその装置
EP3598086A4 (en) * 2016-12-29 2020-08-26 Samsung Electronics Co., Ltd. METHOD AND DEVICE FOR RECOGNIZING A SPEAKER USING A RESONATOR
JP7048619B2 (ja) 2016-12-29 2022-04-05 サムスン エレクトロニクス カンパニー リミテッド 共振器を利用した話者認識方法及びその装置
US11341973B2 (en) 2016-12-29 2022-05-24 Samsung Electronics Co., Ltd. Method and apparatus for recognizing speaker by using a resonator
US11887606B2 (en) 2016-12-29 2024-01-30 Samsung Electronics Co., Ltd. Method and apparatus for recognizing speaker by using a resonator
WO2019038573A1 (en) * 2017-08-25 2019-02-28 Leong David Tuk Wai APPARATUS FOR RECOGNIZING SOUNDS
US11120817B2 (en) 2017-08-25 2021-09-14 David Tuk Wai LEONG Sound recognition apparatus
AU2017428304B2 (en) * 2017-08-25 2022-12-22 David Tuk Wai LEONG Sound recognition apparatus

Similar Documents

Publication Publication Date Title
US5938594A (en) Method and apparatus for detecting nonlinearity and chaos in a dynamical system
JP3484665B2 (ja) 異常判定方法および装置
KR100580643B1 (ko) 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법
JP6848546B2 (ja) 変化点検出装置および変化点検出方法
CN110717472B (zh) 基于改进的小波阈值去噪的故障诊断方法及系统
KR102314824B1 (ko) 딥러닝 기반 감지상황에서의 음향 사건 탐지 방법
US20220155258A1 (en) Stamping quality inspection system and stamping quality inspection method
KR101677137B1 (ko) 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
JP6822294B2 (ja) 評価プログラム、情報処理装置、及び評価方法
CN117116290B (zh) 基于多维特征的数控机床部件缺陷定位方法和相关设备
JP2002196783A (ja) 時系列信号の識別方法及び装置
JP2002196784A (ja) 時系列信号の識別方法及び装置
CN112033656A (zh) 一种基于宽带谱处理的机械系统故障检测方法
CN116741200A (zh) 一种机车风机故障检测方法及装置
JP2021071586A (ja) 音抽出システム及び音抽出方法
JP2002323371A (ja) 音響診断装置及び音響診断方法
EP1001352A1 (en) Data conversion method, data converter, and program storage medium
Entezami et al. Feature extraction in time domain for stationary data
JP2000046893A (ja) 異常診断装置および異常診断方法
CN116596709B (zh) 一种辅助审判方法、装置、设备及存储介质
JP7272631B2 (ja) 音響又は振動の判定方法及び判定のための情報処理システム
KR102443221B1 (ko) 수면 음성 분석 장치 및 방법
JP6257537B2 (ja) 顕著度推定方法、顕著度推定装置、プログラム
Khatun et al. Classification of gas bubble in a Doppler ultrasound signal using synchrosqueezing transform
JP6036242B2 (ja) 心音情報処理装置、心音情報処理方法およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20040312