JP2000504857A - 信号処理機構 - Google Patents

信号処理機構

Info

Publication number
JP2000504857A
JP2000504857A JP9529885A JP52988597A JP2000504857A JP 2000504857 A JP2000504857 A JP 2000504857A JP 9529885 A JP9529885 A JP 9529885A JP 52988597 A JP52988597 A JP 52988597A JP 2000504857 A JP2000504857 A JP 2000504857A
Authority
JP
Japan
Prior art keywords
matrix
input signal
prototype
matrices
exclusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP9529885A
Other languages
English (en)
Inventor
キング、レジナルド、アルフレッド
Original Assignee
ドメイン・ダイナミクス・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドメイン・ダイナミクス・リミテッド filed Critical ドメイン・ダイナミクス・リミテッド
Publication of JP2000504857A publication Critical patent/JP2000504857A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Abstract

(57)【要約】 時間変動する帯域限定入力信号の信号処理機構において、入力信号を標示する固定サイズの行列を導出するべく入力信号に対して操作可能な手段と、処理される異なる入力信号に対応する複数の原型行列を記憶する記憶手段と、対応する除外行列を得るために前記入力信号行列及び前記原型行列からそれらの特徴、例えば実質的に共通である等の特徴を除外するべく前記入力信号行列及び各前記原型行列に対して操作可能な手段と、入力信号を標示する出力を得るために入力除外行列と各前記原型除外行列を比較する手段とを有する。

Description

【発明の詳細な説明】 信号処理機構 本発明は、信号処理機構に関し、特に、音声等の時間的に変動する帯域限定入 力信号に用いるに適した機構に関する。 長年にわたって、音声及び他の時間変動帯域限定信号の時間コード化(Time En coding)は、時間的に変動する信号を複数の時間コード化音声すなわち時間コー ド化信号(TES)の記述子すなわち記号へコード化することにより、TES記号 ストリームを得る低コストの手段として知られている。また、この時間コード化 は、このような記号ストリームから固定次元で固定サイズのデータ行列を作成す るための手段としても知られている。この行列の次元及びサイズは、認知すべき 入力音声やその他のイベントの長さとは無関係に、設計により予め固定されてい る。これについては、例えば、以下を参照されたい。 1. 英国特許No.2145864及び対応する欧州特許No.0141497 2. J.Holbeche、R.D.Hughes、及びR.A.Kingによる文献「Time Encoded Sp eech(TES)descriptors as a symbol feature set for voice recognition syste ms(音声認識システム用の記号機能セットとしての時間コード化音声記述子)」(1 986年3月にロンドンにてIEE Int.Conf.Speech Input/Output刊行の”Techniqu es and Applications”の310-315頁) 3. Martin Georgeによる文献「A New Approach to Speaker Verification(話 者確認に対する新手法)」(1995年10月刊行の”VOICE+”Vol.2,No.8) 4. 英国特許No.2268609及び対応する国際出願No.PCT/GB92/00285(WO92/00285 )5. Martin Gerogeによる文献「Time for TESPAR(TESPARにおける時間) 」(1995年9月刊行の”CONDITION MONITOR”No.105) 上記の参考文献に記載された音声及びその他の信号の時間コード化は、簡略的 に「TESPAR」と称されている。TESPARとは、時間コード化信号の処 理及び認識(Time Encoded Signal Processing and Recognition)のことである。 ここで挙げた時間コード化音声、時間コード化信号、すなわちTESに対する 参考文献は、単にこれらの文献に記載された時間コード化の概念及びプロセスを 示すことが目的であることを理解されたい。 前述の英国特許No.2145864及び他のいくつかの文献には、通常個々の単語また は単語群である音声波形を、時間コード化音声(TES)によりTES記号ストリ ームの形態でコード化する方法が詳細に開示されている。また、これらの記号ス トリームを、音声波形の長さに関係なく固定サイズの、例えば「A」行列の形態 でコード化する方法も開示されている。 前述の通り、また、他の参考文献にも記載の通り、TESコード化の原理が、 任意の時間変動する帯域限定された信号に適用できることは認められている。こ のような信号は、1Hz以下の周波数と帯域幅をもつ地震波信号から、GHz及びそ れ以上の高周波信号まで広範囲にわたっている。 参考文献においては、時間変動する入力信号をTESPAR行列形態で表現で きる。通常、この行列は1次元または2次元である。開示のために、2次元行列 すなわち「A」行列を用いているが、このプロセスは、N次元の行列についても 同様である。ここで「N」は、1より大きい任意の整数であり、通常1〜3であ る。さらに、特定の単語、人物または条件を表すことを目的とする多数の「A」 行列を、原型を作成するために簡単に互いにグループ化する方法も示されている 。原型とは、いわゆる原型行列のことである。これにより、そのセット内におけ る一致性のあるイベントが増強され、一致性のない変化のあるイベントの重みが 低減される。その後、検査対象である入力信号から導出された「A」行列を原型 行列と比較することにより、その入力信号の識別または確認の指標を得ることが できる。これに関しては、英国特許No.2268609(参考文献4)を参照されたい。 当該特許では、入力行列と原型行列の比較が、高速人工神経ネットワーク(FA NN:Fast Artificial Neural Networks)を用いて実行される。従来技術におい て説明した通り、特に時間変動波形に関しては、汎用的な手順及び周波数ドメイ ンのデータ・セットを用いて考えられた同様のプロセスよりも、このプロセスの 方が数段簡単でありかつより効果的であることは理解できるであろう。 しかしながら、本願では、TESPAR及びTESPAR/FANN認識並び に分類及び判別システムの性能を、さらに大きく改良することができると考えた 。 本発明は、時間変動する帯域限定入力信号のための信号処理機構を提供する。 この信号処理機構は、入力信号を標示する固定サイズの行列を導出するべく前記 入力信号に対して操作可能なコード化手段と、処理される異なる入力信号に対応 する複数の原型行列を記憶する手段と、前記入力信号行列及び各前記原型行列に 対応する除外行列を得るために前記入力信号行列及び各前記原型行列からそれら の選択された特徴を除外するべく前記入力信号行列及び各前記原型行列に対して 操作可能な手段と、前記入力信号を標示する出力を得るために前記入力信号除外 行列と各前記原型除外行列を比較する手段とを有する。 本発明を実施する一態様においては、入力信号行列と各原型行列に対して操作 可能な前記手段が、前記対応する除外行列を得るために実質的に共通であるそれ らの特徴をそれらから除外するために有効であるように設けられている。 本発明を実施する別の態様においては、入力信号行列及び各原型行列に対して 操作可能な前記手段が、前記対応する除外行列を得るために非類似であるそれら の特徴をそれらから除外するために有効であるように設けられている。 本発明の実施する好適態様においては、前記コード化手段が、時間コード化信 号記号ストリームを得るべく入力信号に対して操作可能な手段と、前記固定サイ ズの行列を導出するべく前記記号ストリームに対して操作可能な手段とを有する 。そして、対応する入力信号をそれぞれ時間コード化信号記号ストリームへコー ド化した後に、各記号ストリームをそれぞれ個々の原型行列へコード化すること により、各前記原型行列が得られる。 以下、本発明の実施例を、添付の図面を参照して説明する。 図1は、数宇「シックス」における全イベント原型行列の外観図である。 図2は、図1の行列をデジタル的に表した表である。 図3は、数字「セブン」における全イベント原型行列の外観図である。 図4は、図3の行列をデジタル的に表した表である。 図5は、数字「シックス」における上位60イベント原型行列の外観図である 。 図6は、図5の行列をデジタル的に表した表である。 図7は、数字「セブン」における上位60イベント原型行列の外観図である。 図8は、図7の行列をデジタル的に表した表である。 図9は、本発明による除外原型構造の概略構成図である。 図10a、図10b及び図10c(図10b及び図10cは縮小尺度)は、並 べて置かれたとき、数字「シックス」の共通イベントを表す棒グラフを構成する 。 図11a、図11b及び図11c(図11b及び図11cは縮小尺度)は、並 べて置かれたとき、数字「セブン」の共通イベントを表す棒グラフを構成する。 図12a、図12b及び図12c(図12b及び図12cは縮小尺度)は、並 べて置かれたとき、イベントが分類された図10a、図10及び図10cのそれ に対応する棒グラフを構成する。 図13a、図13b及び図13c(図13b及び図13cは縮小尺度)は、並 べて置かれたとき、イベントが分類された図11a、図11及び図11cのそれ に対応する棒グラフを構成する。 図14は、大きさ(ウィンドウサイズ=5)で分類された数字「シックス」の 類似イベントを表す棒グラフである。 図15は、大きさ(ウィンドウサイズ=5)で分類された数字「セブン」の類 似イベントを表す棒グラフである。 図16は、大きさ(ウィンドウサイズ=10)で分類された数字「シックス」 の類似イベントを表す棒グラフである。 図17は、大きさ(ウィンドウサイズ=10)で分類された数字「セブン」の 類似イベントを表す棒グラフである。 図18は、数字「シックス」(ウィンドウサイズ=5)における上位60イベ ント除外原型行列の外観図である。 図19は、図18の行列をデジタル的に表した表である。 図20は、数字「セブン」(ウィンドウサイズ=5)における上位60イベン ト除外原型行列の外観図である。 図21は、図20の行列をデジタル的に表した表である。 図22は、数字「シックス」(ウィンドウサイズ=5)における原型行列から 除外された「類似イベント」の外観図である。 図23は、図22の行列をデジタル的に表した表である。 図24は、数字「セブン」(ウィンドウサイズ=5)における上位60イベン ト除外原型行列の外観図である。 図25は、図24の行列をデジタル的に表した表である。 図26は、数字「シックス」(ウィンドウサイズ=10)における上位60イ ベント除外原型行列の外観図である。 図27は、図26の行列をデジタル的に表した表である。 図28は、数字「セブン」(ウィンドウサイズ=10)における上位60イベ ント除外原型行列の外観図である。 図29は、図28の行列をデジタル的に表した表である。 図30は、数字「シックス」(ウィンドウサイズ=10)における原型行列か ら除外された「類似イベント」の外観図である。 図31は、図30の行列をデジタル的に表した表である。 図32は、数字「セブン」(ウィンドウサイズ=10)における原型行列から 除外された「類似イベント」の外観図である。 図33は、図32の行列をデジタル的に表した表である。 図34は、本発明による除外原型問合せアーキテクチャの概略構成図である。 本発明によるプロセスの一例として、一人の男性により発声された0〜9の数 字を認識するように設計されたシステムを用いることにより本発明のプロセスを 説明することとする。 図を参照すると、図1は、男性の話者が「シックス(six)」という単語を10 回発声したものから作成された「A」行列の原型を示す。これは、全イベント原 型行列と称されるものである。なぜなら、TESPARコード化プロセスにおい て発生する「全ての」イベントが、この行列に含まれるからである。 分かり易くするために、図1では、TESPARイベントの分布を描画形式で 示している。数値的に正確にするために、図2では、29×29の表上のイベン トとしてこの分布を示している。 図3は、同じ男性の話者による数字「セブン(seven)」について作成された同 様の全イベント原型行列を示す。そして、図4は、29×29の表上のイベント の分布を示している。 図1及び3の行列から、双方の行列が短い記号領域(左角)において比較的大 きなピークを有し、この領域から離れたところに比較的小さなピークの組が分布 していることが解る。 この記号分布は、「シックス」及び「セブン」という双方の単語が優勢な歯擦 音「S」を含んでいる事実によることは、当業者には自明であろう。この事実に より、これらの単語の残りの「有声の」部分に比べて多くの短い(高周波数の) 「事象」を生じさせることになり、従って、多数のこれらの記号を生成する。さ らに、これらの単語「シックス」と「セブン」の歯擦音特性は、実質的に双方の 行列に共通であるので、2つの単語の間の差異に関する情報をほとんど与えない ことも自明であろう。 TESPARに関する前述の文献によると、判別力の高い比較を行うために原 型における全てのイベントを用いる必要はなく、各原型における上位の、例えば 60個のイベントがあれば、引き続き分類を行うために有効な記述的パターンを 作成できることが、一般に知られている。図5及び図6、並びに、図7及び図8 は、単語「シックス」及び「セブン」についての上位60個のイベントの行列内 での分布を示している。 原型は、その原型を作成するために用いられた全ての個々の音響性トークンの 特徴的形態をある程度まで表現するので、これらの原型の比較により、双方に一 貫する類似点及び一貫する相違点を有利に識別できることが判っている。音声の ように時間変動する信号については、TESPAR形式によりこのような判別を 固有に行うことができる。 前述の文献に記載された手段により実行される判別は、さらに格段に効率的か つ効果的に行うことができ、従って、音響性イベント及び他の振動性イベントを さらに簡単に分類しかつ分離することができることが判明した。もし、本手段を 用いない場合はそれらはずっと困難となるであろう。 図9は、本発明におけるいわゆる「除外原型」すなわち「除外行列」を用いて 実施されるプロセスを示す。先ず、音響性入力トークン「A」行列のセットから 、異なる音響イベントについての複数の原型行列が作成される。この説明のため に、単語「シックス」の原型行列(図1)を、単語「セブン」の原型行列(図3 )と比較することとする。図9から明らかなように、多数の(2より多い)原型 をこの手段により比較できる。本プロセスの第1のステップは、数字「シックス 」と数字「セブン」についての原型行列の間に共通するイベントを識別すること である。図10a、図10b及び図10cは、互いに並べられたとき、数字「シ ックス」についての図1の原型行列における共通イベントの分布を示す。そして 、図11a、図11b及び図11cは、互いに並べられたとき、数字「セブン」 についての原型行列における共通イベントの分布を示す。このプロセスは、これ らの行列要素を識別するが、これらは実質的に同一であるので、2つの単語間の 判別プロセスにはほとんど寄与しない。 しかしながら、これらのイベントがそれらの場所において同一であっても、こ れらの共通行列場所におけるランク付けが異なる場合は、これらは尚、古典統計 学的相関ルーチンを用いた比較に大きく寄与することになるであろう。このこと から、本プロセスでは第2のステップが必要となる。 図9に示す第2のステップでは、全ての共通の(同一の)イベントが大きさに 従ってランク付けされる。別の環境では、大きさ以外のランク付けが有利な場合 があるであろうが、本発明の説明のため、大きさに基づいてイベントをランク付 けすることとする。このプロセスの結果は、数字「シックス」については、互い に並べられた図12a、図12b及び図12cに示され、数字「セブン」につい ては、互いに並べられた図13a、図13b及び図13cに示されている。 図12a、図12b及び図12c並びに図13a、図13b及び図13cに示 した手順に引き続き、次のステップでは、設定ウィンドウサイズに基づいて「類 似する」とランク付けされたイベントを識別する。例えば、ウィンドウサイズと して「5」を用いる場合、そのランク付けにおける5個の連続的要素が検査され 、そのウィンドウ内に入るそれらの共通イベントが、「類似するとランク付けさ れた」イベントとして含められる。このプロセスは、最上位イベントを始まりと して、最上位イベントから最下位イベントまで「5」のウィンドウを連続的に移 動させながら進められる。この手段により、ウィンドウサイズ(大きさ5)に基 づいて類似するとランク付けされた共通イベントが識別される。 図14及び図15は、上記のようにウィンドウサイズ「5」に基づいてランク 付けされた共通イベントを示す。そして、図16及び図17は、説明のために、 ウィンドウサイズ「10」に基づいてランク付けされた、同じ原型の共通イベン トを示す。 最後の検査として、双方の行列に共通なサブセットが相関付けられる。この相 関付けは、どのような統計的尺度でシステム仕様の一部が構成されていた場合で も行える。そして、これらの数値が共通しておりかつ類似するとランク付けされ たことにより、強く相関付けられたならば、これらは判別プロセスには大きく寄 与しないこととなる。そして、多くの場合、まさに分類誤りの要因となる。次の 「比較」の表は、これらの「共通な....イベント」についてのウィンドウサイズ 「5」及び「10」の双方に基づく相関スコアを示す。これらのイベントが99.3 6%の相関を有していることは、これらが非常に近似していることを示すことを 表している。 除外原型行列を作成する最後のステップでは、数字「シックス」と数字「セブ ン」についての原型行列から、この事例に関して原型行列中で上記の通り識別さ れたイベントを除外する。それにより、行列内には、2つの単語の間の判別に大 きく寄与するイベントのみが残される。 図18及び図19は、数字「シックス」についてのウィンドウサイズ「5」に おける上位60イベント除外原型行列を表している。図20及び図21は、数字 「セブン」についてのウィンドウサイズ「5」における上位60イベント除外原 型行列を表している。図18と図20の除外行列を比較すると、これらが非常に 異なっており、これら2つの単語間の判別に大きく寄与するイベントのみを示し ていることがわかる。因みに、図22及び図23は、数字「シックス」について ウィンドウサイズ「5」としたときの、原型行列から除外された「類似イベント 」を示す行列を表している。同様に、図24及び図25は、数字「セブン」につ いてウィンドウサイズ「5」としたときの、原型行列から除外された「類似イベ ント」を示す行列を表している。 図26〜図33は、既に説明した図18〜25に実質的に対応するが、ウィン ドウサイズが「5」ではなく「10」とした場合を示している。 図18及び図20並びに図26及び図28のような除外原型行列が作成された ならば、次に、これらを、図34に示す入力発声と比較するための原型行列とし て用いる。 この手段により、例えば数字「シックス」や数字「セブン」等の入力発声から 導出された通常の未修整行列が、順次処理される。この処理においては、入力行 列と除外原型行列1〜N等との論理「AND」関数が実行される。次に、このよ うにして作成された修整行列が、前述のように作成された除外原型行列と相関付 けられる。この事例では、数字「シックス」と数字「セブン」の原型行列から作 成された除外原型行列である。この手段により得られた相関スコアが、所与の形 式の決定論理により問合せされる。図34に示された事例では、「最高スコア」 が、勝者(該当数字)として選択される。従って、図34は、問合せ時の決定動作 に含まれる処理を示す。 以上に説明した手順の実用的利点を具体的に示すために、同じ男性話者により 発声された単語「シックス」の10回の独立した発声と、単語「セブン」の10 回の独立した発声に対する比較において、前述の図式で示した原型行列を用いた 。この男性話者は、原型用として別途発声されたデータを作成した。完全な全入 力行列が、上位60イベントに限定した行列とともに検査された。個々の発声に 関して、以下の表に示す。 <表1> 入力行列対全イベント原型行列の相関スコア <表2> 入力行列対上位60イベント原型行列の相関スコア 上記の表では、決定され分類された相関スコアの方に「*」を付して示してい る。このことから、本明細書で開示した特別な手順無しの場合、単語「シックス 」の相関スコアと単語「セブン」の相関スコアは互いに非常に近く、未修整の原 型行列を用いた通常の手順では、多数のエラーが生じたことがわかる。すなわち 、表1に示した未修整の全イベント原型行列を用いた場合は、単語「シックス」 の発声1、2及び8が「セブン」として誤分類され、単語「セブンの」の発声2 及び3が「シックス」として誤分類されている。表2に示した上位60イベント のみを含む原型行列を用いた場合は、単語「シックス」の発声1、2、8及び9 が誤分類され、単語「セブン」の発声2及び3が誤分類されている。 これらの結果を、以下の表3に示すものと比較する。表3では、本発明の開示 によるルーチンが用いられている。 <表3> マスクされた入力行列対上位60イベント除外原型行列 の相関スコア(ウィンドウサイズ=10) 表3から、本発明の手順を用いると、従来よりはるかに良好に判別され、この データにおいて誤分類が全くないことがわかる。 さらに理解を支援するために、以下に、所与の様々な例において用いられるス コア付与システムを示す。 ・分離スコアは、0.00≦スコア≦1.00の有効範囲を有する。 ・分離スコアが1.00であることは、2つの行列が同一であることを意味する 。 ・分離スコアが0.00であることは、2つの行列が直交することを意味する。 ・分離スコア付与の一方法は、相関である。 さらに、2つのTES行列間の相関スコアを計算するために用いられる手順は 、次の通りである。 <摘要> s=score(x,y) <説明> s=score(x,y)は、2つの行列xとyの間の相関スコアを返す。ここ で、x及びyは同じ次元をもつ。 原型行列と発声TES行列間の類似性、または、2つのTES行列間の類似性 の尺度は、相関スコアにより与えられる。返されるスコアは、相関性無し(直交 性)を示す0から同一を示す1までの範囲内である。 <例> score(a,a) 返値=1 score(a,abs(sign(a)−1) 返値=0 <アルゴリズム> A及びBが2つの行列の場合、これらの相関スコアは次のように計算される。 2つのベクトルA及びBについて、これらの内積が、 A・B=|A||B|cosθ で示され、θは2つのベクトルのなす角度である。 上式を変形すると、 となる。ここで、 である。従って、n×m行列を1×nmベクトルとして扱う場合、 となる。 このように、相関スコアは単純に、2つの行列AとBの間の角度のコサインの 2乗となる。 以上に開示された手順が、TESPAR行列を人工神経ネットワーク(ANN )へ適用する際に非常に有効な予備処理方式となることは、当業者であれば自明 であろう。 説明された手順においては、信号行列及び原型行列の中で起きる「共通イベン ト」が、入力信号識別を支援するために除外される。 また、「共通イベント」ではなく「非共通イベント」を除外するように同様の 原理を用いることができることも明らかである。これにより、同じ発生源から、 例えば同じ話者から発せられた行列から導出された「共通イベント」を、通常A NNを用いることにより信号確認や他の目的のために比較することができる。
【手続補正書】特許法第184条の8第1項 【提出日】1998年3月17日(1998.3.17) 【補正内容】 しかしながら、本願では、TESPAR及びTESPAR/FANN認識並び に分類及び判別システムの性能を、さらに大きく改良することができると考えた 。 本発明は、時間変動する帯域限定入力信号のための信号処理機構を提供する。 この信号処理機構は、時間コード化信号記号ストリームを得るために前記入力信 号に対して操作可能なコード化手段と、前記入力信号を標示する固定サイズの行 列を導出するべく前記記号ストリームに対して操作可能な手段と、処理される異 なる入力信号に対応する複数の原型行列を記億する手段と、前記原型行列の複数 の特徴を選択するために全ての前記原型行列に対して操作可能な手段と、対応す る除外原型行列を得るために前記選択された特徴を前記原型行列から除外するべ く各前記原型行列に対して操作可能な手段と、入力信号除外行列を得るために前 記入力信号行列及び各前記原型除外行列に対して操作可能な手段と、前記入力信 号を標示する出力を得るために前記入力信号除外行列と各前記原型除外行列を比 較する手段とを有し、上記の各原型行列は、前記異なる入力信号のうち対応する ものを個々の時間コード化信号記号ストリームへコード化した後、各前記個々の 記号ストリームを個々の原型行列へコード化することにより得られる。 本発明を実施する一態様においては、各前記原型行列に対して操作可能な前記 手段が、前記対応する除外行列を得るために実質的に共通するそれらの特徴をそ れらから除外するために有効であるように設けられている。 本発明を実施する別の態様においては、各前記原型行列に対して操作可能な前 記手段が、前記対応する除外行列を得るために非類似であるそれらの特徴をそれ らから除外するために有効であるように設けられている。 以下、本発明の実施例を、添付の図面を参照して説明する。 請求の範囲 1. 時間変動する帯域限定入力信号のための信号処理機構において、 時間コード化信号記号ストリームを得るために前記入力信号に対して操作可能 な手段と、 前記入力信号を標示する固定サイズの行列を導出するべく前記記号ストリーム に対して操作可能な手段と、 処理される異なる入力信号に対応する複数の原型行列を記憶する手段と、 前記原型行列の複数の特徴を選択するために全ての前記原型行列に対して操作 可能な手段と、 対応する除外原型行列を得るために前記選択された特徴を前記原型行列から除 外するべく各前記原型行列に対して操作可能な手段と、 入力信号除外行列を得るために前記入力信号行列及び各前記原型除外行列に対 して操作可能な手段と、 前記入力信号を標示する出力を得るために前記入力信号除外行列と各前記原型 除外行列を比較する手段とを有し、 上記の各原型行列は、前記異なる入力信号のうち対応するものを個々の時間コ ード化信号記号ストリームへコード化した後、各前記個々の記号ストリームを個 々の原型行列へコード化することにより得られる、 信号処理機構。 2. 各前記原型行列に対して操作可能な前記手段が、前記対応する除外行列を 得るべく、実質的に共通するそれらの特徴をそれらから除外するために有効であ るように設けられている請求項1に記載の信号処理機構。 3. 各前記原型行列に対して操作可能な前記手段が、前記対応する除外行列を 得るべく、非類似であるそれらの特徴をそれらから除外するために有効であるよ うに設けられている請求項1に記載の信号処理機構。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(KE,LS,MW,SD,S Z,UG),UA(AM,AZ,BY,KG,KZ,MD ,RU,TJ,TM),AL,AM,AT,AU,AZ ,BA,BB,BG,BR,BY,CA,CH,CN, CU,CZ,DE,DK,EE,ES,FI,GB,G E,HU,IL,IS,JP,KE,KG,KP,KR ,KZ,LC,LK,LR,LS,LT,LU,LV, MD,MG,MK,MN,MW,MX,NO,NZ,P L,PT,RO,RU,SD,SE,SG,SI,SK ,TJ,TM,TR,TT,UA,UG,US,UZ, VN

Claims (1)

  1. 【特許請求の範囲】 1. 時間変動する帯域限定入力信号用の信号処理機構において、 前記入力信号を示す固定サイズの行列を導出するべく前記入力信号に対して操 作可能なコード化手段と、 処理される異なる入力信号に対応する複数の原型行列を記憶する手段と、 前記入力信号行列及び各前記原型行列に対応する除外行列を得るために、前記 入力信号行列及び各前記原型行列からそれらの選択された特徴を除外するべく、 該入力信号行列及び各該原型行列の各々に対して操作可能な手段と、 前記入力信号を標示する出力を得るために前記入力信号除外行列と各前記原型 除外行列を比較する手段とを有する 信号処理機構。 2. 前記入力信号行列及び各前記原型行列に対して操作可能な手段が、前記対 応する除外行列を得るために、実質的に共通であるそれらの特徴をそれらから除 外するために有効である請求項1に記載の機構。 3. 前記入力信号行列及び各前記原型行列に対して操作可能な手段が、前記対 応する除外行列を得るために、非類似であるそれらの特徴をそれらから除外する ために有効である請求項1に記載の機構。 4. 前記コード化手段が、時間コード化信号記号ストリームを得るために前記 入力信号に対して操作可能な手段と、前記固定サイズの行列を導出するために前 記記号ストリームに対して操作可能な手段とを有し、各前記原型行列が、対応す る入力信号をそれぞれの時間コード化信号記号ストリームへコード化した後、そ 各記号ストリームをそれぞれ原型行列へコード化することにより得られる、請求 項1〜3のいずれかに記載の機構。 5. 実質的に、添付の図面に関連して上記の通り説明された信号処理機構。
JP9529885A 1996-02-20 1997-02-19 信号処理機構 Ceased JP2000504857A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB9603553.0A GB9603553D0 (en) 1996-02-20 1996-02-20 Signal processing arrangments
GB9603553.0 1996-02-20
PCT/GB1997/000453 WO1997031368A1 (en) 1996-02-20 1997-02-19 Signal processing arrangements

Publications (1)

Publication Number Publication Date
JP2000504857A true JP2000504857A (ja) 2000-04-18

Family

ID=10789082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9529885A Ceased JP2000504857A (ja) 1996-02-20 1997-02-19 信号処理機構

Country Status (8)

Country Link
US (1) US6101462A (ja)
EP (1) EP0882288B1 (ja)
JP (1) JP2000504857A (ja)
AT (1) ATE188063T1 (ja)
AU (1) AU1804797A (ja)
DE (1) DE69700987T2 (ja)
GB (1) GB9603553D0 (ja)
WO (1) WO1997031368A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9817500D0 (en) * 1998-08-12 1998-10-07 Domain Dynamics Ltd Advantageous time encoded (TESPAR) signal processing arrangements
GB9908462D0 (en) * 1999-04-14 1999-06-09 New Transducers Ltd Handwriting coding and recognition
US6301562B1 (en) * 1999-04-27 2001-10-09 New Transducers Limited Speech recognition using both time encoding and HMM in parallel
US7849934B2 (en) * 2005-06-07 2010-12-14 Baker Hughes Incorporated Method and apparatus for collecting drill bit performance data
US8100196B2 (en) * 2005-06-07 2012-01-24 Baker Hughes Incorporated Method and apparatus for collecting drill bit performance data

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987004836A1 (en) * 1986-02-06 1987-08-13 Reginald Alfred King Improvements in or relating to acoustic recognition
SE465146B (sv) * 1989-03-03 1991-07-29 Televerket Metod foer foerdelning av ett givet antal radiokanaler i ett radiosystem
GB9103349D0 (en) * 1991-02-18 1991-04-03 King Reginald A Artificial neural network systems
US5507007A (en) * 1991-09-27 1996-04-09 Televerket Method of distributing capacity in a radio cell system

Also Published As

Publication number Publication date
EP0882288A1 (en) 1998-12-09
EP0882288B1 (en) 1999-12-22
GB9603553D0 (en) 1996-04-17
AU1804797A (en) 1997-09-10
WO1997031368A1 (en) 1997-08-28
ATE188063T1 (de) 2000-01-15
DE69700987T2 (de) 2000-08-10
DE69700987D1 (de) 2000-01-27
US6101462A (en) 2000-08-08

Similar Documents

Publication Publication Date Title
CN108091326B (zh) 一种基于线性回归的声纹识别方法及系统
JP2002533789A (ja) 自動音声認識システムにおけるnベストリストに用いる知識ベース戦略
WO2002071317A1 (en) Method of recognizing human iris using daubechies wavelet transform
JPH03144875A (ja) 文字の認識方法及び音素の認識方法
US5794190A (en) Speech pattern recognition using pattern recognizers and classifiers
US5864807A (en) Method and apparatus for training a speaker recognition system
CN113436646B (zh) 一种采用联合特征与随机森林的伪装语音检测方法
JP2000504857A (ja) 信号処理機構
Marques et al. Additional evidence that common low-level features of individual audio frames are not representative of music genres
EP0901678B1 (en) Signal processing arrangements
CN112967734B (zh) 基于多声部的音乐数据识别方法、装置、设备及存储介质
Hamadene et al. Off-line handwritten signature verification using contourlet transform and co-occurrence matrix
Barde et al. Person Identification Using Face, Ear and Foot Modalities.
Chee et al. Two-dimensional winner-takes-all hashing in template protection based on fingerprint and voice feature level fusion
Mulimani et al. Robust Acoustic Event Classification Using Bag-of-Visual-Words.
JP2989231B2 (ja) 音声認識装置
Timms et al. Speaker verification utilising artificial neural networks and biometric functions derived from time encoded speech (TES) data
EP0526515B1 (en) Pattern recognition
Wintarti et al. A Comparative Study of PCA, FFT and Wavelet as Feature Extraction for Gamelan Tones Recognition
Rahinj et al. Active Learning Based Audio Tampering Detection
Lukasik Classification of voiceless plosives using wavelet packet based approaches
Rani et al. Comparison between PCA and GA for Emotion Recognition from Speech
Dincer et al. Robust Audio Forgery Detection Method Based on Capsule Network
Chan et al. A preliminary study on the static representation of short-timed speech dynamics.
Changjun et al. Notice of Retraction: The real time classification of vehicle by combination of GA, PCA and Improved SVM

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20040628

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040914