JP2002517175A

JP2002517175A - 人間の音源を識別するための手段および装置

Info

Publication number: JP2002517175A
Application number: JP50704692A
Authority: JP
Inventors: ジョージエムパーラ
Original assignee: シーウェイテクノロジーズインコーポレイテッド
Priority date: 1991-02-22
Filing date: 1992-02-21
Publication date: 2002-06-11
Also published as: AU1436792A; EP0572531A1; CA2104393A1; WO1992015090A1; US5313556A; EP0572531A4

Abstract

(57)【要約】口から鼻の通路を通って発せられる音声の音響プロフィルにより、個人の識別を行うことができる。入力音声はテープレコーダ（１２）やマイクロホン（１１）により受信され、その後アナログからディジタルの形式に変換される（１３）。その信号はその後それを分析し周波数情報を得るコンピュータへ送られる。その音声情報はビデオ端末（１６Ｄ）、プリンタ（１６Ｐ）上に表示され、そしてメモリー（１６Ｍ）に蓄積される。

Description

【発明の詳細な説明】人間の音源を識別するための手段および装置発明の背景と簡単な説明本発明は人間の音源を識別する改良された手段と装置を対象としている。人間の口（口腔・鼻腔）を通って発せられる音声の実質的に確実な識別を行うことが望ましい多くの状況がある。銀行業務およびクレジットカードの場合には、カードを提示している人間とカードの所有者の識別の相関は、ある種の難しい識別方法を必要とする。その他の例として、警察業務では脅迫、妨害、および猥褻電話に対し、容疑者を逮捕する前に他の証拠との関連で発信者の実質的に確実な識別を必要とする。それ以外にも、電話によるクレジット販売では、販売者はクレジットカード番号の検証に加えて、発信者に音声の証拠と蓄積されている証拠との相関を要求することがある。特にある品物が注文されたかどうかに疑問がある時である。本発明は、話された言葉を機械により識別し、機械翻訳や識別のみを行おうとする音声認識とは別のものである。事実本発明の応用においては、（容疑者が偽装するかもしれない）識別できる通話を構成する、識別可能な母音、子音、および音節等は廃棄され、不可聴部分（一般的には、可聴下周波（超低周波）あるいは可聴の下の帯域）、あるいは音声として人間の口を通して発せられた音響のみが、容疑者の実質的に正確な認識あるいは識別を行うのに使用される。音声を偽装することができても、容疑者の音声器官の定まった物理的な構造は、全ての実用的な目的に対して、人間により制御することができないこと、また空気の最初の吐き出しは通常音声帯域の可聴下周波領域の不可聴音を作り出すこと、およびこのような音響は（可聴周波数範囲より低く）不可聴音であるけれども、各個人に固有であるという事実に、本発明は基づいている。このようにして、人間の口、口腔から発せられる音の可聴部分も、識別の目的に使用することができるけれども、本発明は口腔を通して発せられる通話あるいは他の音響において、人間の発した音響の低エネルギーレベルの部分に関係するものである。本発明によれば、録音された音声は最初にディジタル化される（例えば、アナログ波の継続的なサンプルは２進語に変換され、（この好ましい実施例では）その後の操作で先ず録音された音声の可聴部分を消去する）。その後残りの部分は時間的に、周波数的に、振幅的に（３つの領域で）分析され、そして電子的な表示装置、および必要ならば、印刷する表示装置の両方に表示される。表示の元の信号は、同様に発せられた容疑者の音声に対する記録された翻訳データと、電子的に比較し相関点を見いだすことができ、あるいは目視で比較し相関点を見いだすこともできる。電話回線がその音声の音響パターンを取るのに使用した媒体の経路の一部になっている場合は、電話の帯域の制限の為にスペクトルが急峻に切られてしまうので、認識すべき音波は、本発明の比較処理の前に基本的に同一なあるいは同様な経路を通さなければならない。通話の「音響」に影響を与える、口の形状、舌、唇、および他の物理的な構造は、種々の筋肉の訓練により音声を偽装するように制御することができる。しかしながら、可聴の通話の波の前、即ち立ち上がりあるいは立ち下がり部分における不可聴音を構成するのに寄与する環境は、一般に上記のような制御には従わず、意図的には変えられない。従ってこの不可聴音はある人に対し同一、且つ固有のものである。大略500Hzより下の周波数帯域は通話スペクトルの全体に渡り見ることができ、通話スペクトルの下の帯域の音、即ち不可聴部分は特に本発明にとって有用である。一般には、大多数のデープレコーダは口腔を通し音声で発せられる不可聴音の録音は比較的良好であり、高い周波数範囲ではあまり良好ではない。従って、本発明の応用では高品質の録音装置が使用されるけれども、本発明の利点と特徴の一つは、高価でない磁気テープレコーダ（VAR）と低価格の音響処理装置を、本発明の実施の為に使用できることである。更に、盗難防止のための事業用施設（銀行、コンビニエンスストア、ガスステーション等）の音響監視には、自動反転テープカセット、エンドレスループ等を持つ、通常の業務の時間中連続して動作する、低価格の音声起動レコーダ、あるいは大規模のFIFOメモリアレイを持つディジタルレコーダが、低域音響の捕捉に使用される。希望により、時間を限って、あるいは日にちを決めて、永久メモリーに記録する録音方法が重要となろう。また、ビデオカメラのような写真の証拠が事件を記録するのに使用され、あるいは容疑者の正確な識別を行うために本発明とともに使用できることが評価されるであろう。ここに述べたように準備された、（例えば）カード所有者の名前のディジタル化された部分の音声サンプルは、クレジット銀行のあるいはチャージカードの磁気ストリップに記録される。使用時点でカードを所持している人は、その人の名前を話すように要求され、本発明の原理を使用して、それは電気信号に変換され、ディジタル化され、そして蓄積されたディジタルの翻訳データと比較される。本発明の一面によれば、音響あるいは音声により起動されるレコーダは、銀行の金銭出納係の窓口に置かれ、例えば、銀行強盗から発せられた低周波の音響を録音する。そしてその録音は後日銀行強盗の正確な識別を助けるのに使用される。各金銭出納係は人目に付かない場所に置かれた、音声で起動するレコーダ（VA R）あるいはVARのマイクロフォンを持っている。各VARは1/2ないし１時間連続に録音する。録音は１５分のエンドレステープあるいは自動テープ反転装置を使用し、繰り返し使用する。それはまたディジタル録音器即ちアナログ−ディジタル変換器およびFIFOメモリを含んだ固体メモリとすることもできる。また銀行強盗の場合、VARは銀行強盗の発言、例えば「俺は強盗だ。有り金全部袋に詰めろ。」、「爆弾を持っているぞ。」等により起動される。このような銀行強盗の使用する短い共通的な用語は、強盗の場合に録音、保存され、容疑の可能性のある人を識別する目的で、本発明による分析のために警察に渡される。本発明のその他の使用法として、誠実な電話加入者により作成された不可聴音の予め録音されたサンプルはその加入者による追加の電話注文を検証するのに使用することができる。本発明はまた銀行へ入る人の識別、あるいは保護あるいは制限されている地域へ入る許可を与える為に使用することができる。本発明のシステムは先ずディジタル音声のサンプルを入手し、蓄積することから成っている。これは被検者がアナログ・ディジタル（AD）変換回路に接続されたマイクロホンに向かって話すことにより行われる。このようなAD回路はマイクロホンからのアナログ入力を毎秒約5,500サンプルの速度で（あるいは少なくとも必要な最高周波数の２倍の速さで）サンプルすることが可能でなければならず、またサンプリング速度の正確な選択が可能な扱い者制御の手段を備えなければならない。AD回路はコンピュータのデータバスに接続され、コンピュータは蓄積のためにディジタル値の出力を取り出すことができる。このように変換された音声サンプルは、音声ファイルと呼ばれる磁気ディスクに蓄積される。上記の方法で作成された音声ファイル内のデータは、その後それは画面上のビデオ表示の二つのタイプに変換することができるコンピュータソフトウェアに入れられる。第１の表示タイプは時間（x）と振幅（y）を表す二つの軸のグラフである。ソフトウェアはコンピュータのマウスのような指示装置を使用して、画像として表されたデータの一部を選択すること（「マーキング」）が可能でなければならない。ソフトウェアはその後ビデオ表示の選択（「マーキング」）された部分ににより表されるデータの部分を釘面上の表示の第２のタイプに変換する。第２の表示タイプは時間（x）、周波数（y）、および振幅（z）で表される３軸のグラフである。この選択されたデータの部分は、元の音声サンプルデータの複数サンプルあるいは「スライス」としてグラフに作られる。グラフに作られるスライスの数は、等時間間隔で区分された複数のスライスの表示のグループを作成する音声ファイルデータの、選択された部分からn番目の各サンプルの値を選択するソフトウェアにより制御される。各スライスの間隔を前と次のスライスから等間隔にすることにより、従属したパターンが表示装置上に作成され、それは完成すると３次元の映像の配列となる。我々の目的からこの表示をディジタルホログラムとなる「ディジタル音響ホログラム」と呼ぶこととする。任意の一つのスライスの線と曲線をその隣のスライスのそれと並置してみると、音響ホログラムの従属パターンにより判明するように、本発明の音声の比較の基礎となる処理された音声のサンプルの骨組みを構成する。ホログラムで明かな輪郭と傾向は、音声サンプルを識別できる「マーク」である。警察の使用の為の本発明の音声識別システムは、被検者から電話あるいはマイクロフォンのいづれかにより得られた、磁気テープ上に記録された音声サンプルの比較を意図している。ディジタル化されたサンプルは、テープ録音されたサンブルが再生され、そしてこのようにして作成されたアナログ信号がアナログ・ディジタル（AD）変換回路に接続された時に取得され蓄積される。このAD回路はテープから得られたアナログ入力を少なくとも毎秒約5,500サンプルの速度で（あるいは必要な最高周波数の２倍の速さで）サンプルすることが可能でなければならず、またサンプリング速度の正確な選択が可能な扱い者制御の手段を備えなければならない。AD回路はコンピュータのデータバスに接続され、コンピュータは蓄積装置からディジタル値の出力を取り出すことができる。このように変換された音声サンプルは、音声ファイルと呼ばれる磁気ディスクに蓄積される。上記の方法で作成された音声ファイル内のデータは、その後それは画面上の図形表示に変換することができるコンピュータソフトウェアに入れられる。コンピュータのソフトウェアにより作成された表示は時間（x）と振幅（y）を表す二つの軸のグラフである。ソフトウェアはまた第１のグラフの他に第２の２軸のグラフを同時に提供する。第２のグラフは、既知の人間の音声サンプルからのディジタル化された値を含む第２の音声ファイルからソフトウェアにより作成される。このようにして並べて表示された２つの音声サンプルは、担当者により視覚で比較することができ、その担当者は２つの音声サンプルが暫定的に一致していると考える程充分に似ているかどうかを判断する。比較可能なデータサンプルを持つ２つのグラフを得るために、ソフトウェアは各サンプルを編集し、表示されたグラフから関係のない雑音、過剰に長く話された意味のない文句、および沈黙の期間あるいは間隙を除くことが可能でなければならない。このような編集に含まれるけれども、各サンプルは、せき、くしゃみ、息づかい、等の全ての無関係の音響を除き、それが単に被検者の声帯から作られたと分かる音響を表すように削減することができ、且つ他のサンプルと大略同じ時間長になるように削減することができる。サンプルの編集は、「マーキング」およびそれに続くデータの削除ができるコンピュータのマウスのような指示装置を使用することにより最もよく遂行することができる。ソフトウェアはその後残りのデータを示す表示を見直す。本発明の音声識別システムは、刑事訴訟において証拠として使用するために警察当局に音声分析を提供することを意図していないことに留意すべきである。音声分析が将来証拠として受け入れられる可能性はあるけれども、ここに開示するシステムの目的は警察の使用の為のツールを提供することである。例えば、音声分析の使用により、捜査官が、数十人の容疑者を除いて、数人の容疑者にのみ捜査の努力を集中することができれば、成功と考えることができるであろう。上記のように、本発明は録音された通話の可聴部分を識別のために使用する必要はないが、それは他の通話識別手段および装置に関連して使用されることが明確に理解されるべきである。特許4,837,804に述べたシステムは、電話により受信されたアナログ音声信号を、数値情報がアナログ音声の特徴を指定する処理手段へ送られる。その特許の説明の中に「ディジタル化」の用語を含んでいるけれども、それは波形の特徴の差を指定する演算的な値であって、音声サンプルそれ自身のディジタル化は含んでいない。本発明は、音声サンプルが比較に先だってディジタル化される点で特許4,837, 804のモデルとは異なっている。これは波形の特徴のより正確な測定、磁気媒体へのディジタル化されたサンプルの蓄積、およびサンプルの取扱いを比較の処理に適するようにすることを可能にする。また特許4,837,804のシステムは500Hzから下の周波数成分を削除して電話回線からの音声のサンプルを取得するので、本特許の比較方法で最も重要な波形を含む周波数スペクトルの下の部分を無視している。特許4,827,518により開示された方法は音声サンプルのディジタル化とはっきり発音された句から音声の性質の特徴を抽出する方法を含んでいる。しかしながら、一つの音声サンプルから次のサンプル間の変動があることを考慮すると、複数のサンプルから取得した「複数のケプストラム（会話のパワースペクトルの対数のフーリエ変換）の係数セット」の蓄積を必要とする。本発明の方法は複数のサンプルから「近似の韻律」を計算し、この韻律に基づいて「決定」を行う点で、本発明のシステムは上記の方法とは異なっている。本発明のシステムは周波数スペクトルの下の帯域の部分のみを分析するので、複数のサンプルを参照する必要はない。これはこの下の周波数における作用は同じ被検者から取得した多くのサンプル間で一つの音声サンプルと次のサンプルの間に実質的に変化がないという認識に基づいている。特許4,827,518のシステムは、本特許のシステムと同様に、音声サンプルのディジタル化を使用しているけれども、ディジタル化されるサンプルの最高周波数はサンプル速度の半分に制限されるというナイキスト効果により課せられる制約を認識していない。聴覚のスペクトル範囲（測定するという意味において）の少なくとも全ての周波数を再生するのに充分なサンプル速度でサンプルを取得しなければならないこと、および比較すべき二つのサンプルの各々は同じサンプル速度で取得しなければならないことを規定しないことにより、上記のシステムは実用的な利益が決して得られない性能のレベルまでそのシステムを低下させている。特許4,827,518のシステムの他の特徴は音声の特徴がカードに蓄積されることである。しかしながら、本発明のシステムはディジタル化されたデータの蓄積をクレジットカードと同じ大きさのカードに搭載された磁気ストリップ上に蓄積することを提案しており、ところが特許4,827,518のカードは実際はユーザインタフェース端末と相互動作する印刷配線板を含んでいる。米国特許4,833,713のシステムは、特許4,837,518のシステムと同様に、比較のためにアナログ音声信号を提案している。話された語あるいは句を構成する波形は一つのサンプルと次のサンプルでは正確には同じでないことを装置は認識している。それは、複数のサンブルを蓄積することではなく、「複数の音声パターン」の重畳から作られる統合音声パターンを蓄積することにより、これに対して保証することを意味している。本発明は複数のサンプルの重畳により蓄積された音声サンプルを無視するものでも軽視するものでもない。要約本発明は比較に先だって音声サンプルをディジタル化し、公知の技術で必要とされるような特定の区間の時間の枠内に切りとられた、はっきり発音されたサンプルに適合するように制約されない点で、本発明は従来の方法とは異なっている。本発明は音響のサンプルの非常に薄いスライスにも含まれるデータを比較する。この時間間隔は１秒の1/100ほどの短い時間とすることができる。更に、本発明のシステムはいかなる二つの発音されたサンプルにも適合するように、比較を行うことができる。サンプルは発言された同じ語あるいは句を比較する必要はなく、あるいはまた話された語が全然無くとも構わない。声帯を使用した発音があれば充分である。本発明のシステムと見直している従来技術の最も重要な一つの相違点は、音響サンプルの可聴部分において一つの音声サンプルと次のサンプルとの違いに関係なく、スペクトルの低い、下位帯域部分の振動が同じ人間の一つの音声サンプルと次のサンプルと比較した時に実質的に同一であるという本発明の明確な認識方法である。従って、話された語あるいは句の全体をサンプルする必要はなく、声帯の振動を含む音響をサンプルすれば充分である。本発明の上記のおよびその他の目的、利点および特徴は次の明細書およびそれに付随した図面を使用して考察した時に、より明確になるであろう。ここで、図1aは本発明の記録処理のブロック図であり、図1bは本発明を実施したシステムのブロック図であり、図1cは図1aに示したシステムの図式表現である。図2aは分析のために不可聴部分のサンプリングに示された音声プリントの表現であり、図2bはソフトウェアによりディジタル音声サンプルから作成された音声プリントである。図３は、時間（x軸）、周波数（y軸）、および振幅（z軸）を示し、且つ本発明に使用される谷／ピークの特徴点を図示する３次元の波形である。図４は、カード所有者の音響プリントの翻訳データを入れた磁気ストリップを持つクレジットカードを図示する。図５は、図４のカードを使用して検証するシステムのブロック図である。図６は、音声で起動するレコーダを備えた銀行の金銭出納係の窓口である。そして図７は、音声で起動するレコーダの従来の回路と本発明の目的にそれを適合させる状態を図示する。発明の詳細な説明図1aおよび1cを参照して、ある人間１０がテープレコーダ１２のマイクロホン１１に対して話をする。このレコーダは発生した音波をディジタル信号に変換する。テープレコーダ１２とマイクロホン１１は別々に示されている。これはテープ録音は明らかにマイクロホンとは分離することが可能でありそのテープは再生テーププレーヤ１４（図1c）により再生することができることを示すためである。これらのアナログ信号はアナログ・ディジタル変換ユニット１３に送られる。（前に注記したように、犯罪行為が追跡されているところでは、基本的に同じチャネルが準備された録音を行うのに使用され、またアナログ信号をコンピュータのアナログ・ディジタル変換器に送るのに使用することが望ましい）。図1cは、アナログ信号を商用のPCコンピュータ１４へ送る従来のテーププレーヤの図式表示である。このコンピュータでは、タンディ社（レディオ・シャック）の商業的に入手可能な音声を取り込むコンピュータソフトウェアにより、アナログのサンプルはディジタルのサンプルに変換される。アナログ音声信号のディジタル版（図2c）は表示画面15DSに送られ、そこで扱い者は（例えば、マウスにより）小さなサンプルあるいは部分を、好ましくは分析のために可聴の下の帯域部分を、選択することができる。選ばれたディジタル化された部分あるいはサンプルは磁気ディスクに録音され、ディスクドライブ15DDより取り出され、ハードディスクドライブに商用コンピュータの音響分析ソフトウェア（例えば、GEM社の登録商号のサンプルビジョン）を搭載したPC 16のディスクドライブに挿入される。そのコンピュータの音響分析ソフトウェアは扱い者により抽出されたディジタル音響信号の小さな部分を処理し、時間（x軸）、周波数（y軸）、および振幅（z軸）を示す図３の３次元ディスプレイ76Pのグラフを作成する。時間軸は各周波数によるスライスあるいはサンプルである。音声の様相は音声ファイルメモリ16Mに蓄積され、プリンタ16Pで印刷することができる。ここで図1bを参照すると、本発明を実施する一般化されたブロック図は音源２０を示しており、それはアナログ・ディジタル変換器２１によりディジタル化された入力とそれから表示ユニット２２へ供給される出力を持っている。その表示ユニットは蓄積とより詳細な分析のためにデータの一部を選択することができる。選択装置２３は鍵盤、マウス等で構成することができ、図1cに関連して述べた選択動作に関連して動作することができる。入力音波の選択された部分の３次元表示はPC比較器２４により準備される。光CD、磁気メモリ等で構成することができる蓄積ユニット２５は、図３の３次元のディスプレイに対応して、個人（銀行の顧客、クレジットカードのユーザ、その他の公知の個人も）に対する音響プロフィルのライブラリを蓄積しており、音源２２からの音響プロフィルあるいは署名に対して比較するために比較器２４に供給される。図３は、不可聴音（ここで使用されるような、周波数および・あるいはエネルギーレベルが可聴範囲以下である音響）ビーク点Ppと谷の点Pvを持つことを示しており、それらは相互に関連して区別できるパターンを持っており、指紋の細かな相違点（縁の終端部、フォーク状の部分、等）と同様に、各個人に固有のパターンである。しかも指紋と異なって、個人の通話パターンの全部に渡って見いだすことができる。各周波数に対して、短い時間間隔に渡る隣接の周波数と関連したエネルギーのピークと谷が、隣接の周波数のピークと谷と関連を持ち、そして各個人に固有なコードパターンを構成している。この識別コードは１秒の1/10以下の短い時間の周波数・時間・振幅の図において検出することができる。図３において、大略240のサンプルが示されており、ここでサンプリング速度は毎秒5,5 00サンプルである。時間サンプルTs11を考察すると、ここで各周波数ラインF1、 F2、F3．．．FNは時間のサンプルと交差する。エネルギーレベルは任意であるが、ピークと谷の正規化されたレベル間にある。使用するのは、ピークと谷（あるいは谷とピーク）の間の比であるから、振輻には依存しない。例えば、点F1 Pv1 1谷であり、一方F2 Pp11はピークであり、そしてFN Pp11もその周囲の点との関連で、ピークである。音波の１秒以下の小さい部分のこれらの特徴の分布は各個人に固有なコードを構成し、これは個人の通話を通して繰り返される。上記のように、毎秒5,500のサンプリング速度は１秒の小さな部分内で識別を行うために充分な点のデータを得るのに使用することができる。図４と５を参照すると、一般にプラスチックで作られているカード３０はその一面（裏面）３２に磁気ストリップ３１、署名ブロック即ちフィールド３３、およびカード番号、カード所有者、有効期限、等を表示するためのセクション３４を備えている。本発明によれば、上記のように作成されたディジタルの音響プロフィルは、カード所有者のそれに対応して磁気ストリップ３０に記録される。カードの携帯者がカードの所有者でもあることが要求されるような、前述の作業のためにそのカードが提示された場合は、その携帯者はマイクロフォン３５の前でほんの数語話すことが要求され、その電気アナログ信号は増幅器３６により増幅され、そしてアナログ・ディジタル変換器３７によりディジタル信号に変換され、そしてそのディジタル信号は図３に図示した音響プロフィルに対応したディジタル信号を作成するために音響プロフィルの柚出回路３８に送られる。その音響プロフィルはマイクロプロセッサ３９に供給される。カード３０はカード読み取り器４０の溝40Sを通過し、そのカード読み取り器はディジタルに符号化された磁気ストリップの音響プロフィルを読みだし、それを比較のためにマイクロプロセッサ３９に供給し、比較結果によりユーティリゼーション装置４１を起動する。そのユーティリゼーション装置は相関の有無と音響プロフィルを持つ音声ファイルに蓄積された識別結果を表示する信号装置とすることができる。カード３０の代わりに、16Mの中に作られたライブラリ即ち音声ファイルを主メモリ４２に蓄積することが可能で、話した人の識別を検証するためにアクセスすることができる。また図６と７を参照して、例えば（金融業務を行っている他の場所も同じであるが）音声で起動するレコーダ（VAR）５０は、銀行の係員の窓口に置かれたマイクロホン５１を持っており、例えば強盗の音声がテープ、あるいは固体メモリに録音される。盗難あるいは強盗の場合、口腔（口から鼻への通路）から発せられた音響は録音され、前に説明したように、分析され、後で比較するために強盗の音響プロフィルを作成し、被告の識別に使用される。図７に示すようにVAR ５０はディジタル・アナログ変換器を含むことができ、その出力を固体メモリ５３あるいはエンドレスのディジタルオーディオテープ（DAT）５４のいづれか使用されているものに供給する。永久記録も必要ならば行うことができる。本発明の好ましい実施例を示し説明してきたが、本発明の種々の変形と適応は当業者には容易に明白であることは理解できるであろう。そして、このような変形あるいは適応はここに述べる請求範囲に取り込まれることが意図されている。

【手続補正書】特許法第１８４条の７第１項【提出日】平成４年８月３日（１９９２．８．３）【補正内容】請求の範囲 1. 未知の個人を識別する手段において、人間の口腔・鼻腔より作られた音響を第１のディジタル電気信号に変換し、そして前記音響の可聴部分に対応する電気信号をそれより削除して、前記音響の不可聴部分に対応する第２のディジタル電気信号を作成し、前記第２のディジタル電気信号を、周波数、振幅および時間サンプルの３つの領域の様式に変換して、前記個人の未知の音響プロフィルを構成するピークおよび谷の配列を作成し、既知の個人の同じ様式の音響プロフィルの元ファイルを備え、前記既知の個人の前記音響プロフィルの前記のピークおよび谷の関係位置を含む相互関係を前記未知の個人の音響プロフィルと比較し、そして前記音響プロフィル間の相関を検出するあるいは検出しない有用な信号を提供することから成る未知の個人を識別するの手段。 2. 各音響プロフィルの前記ディジタル電気信号の１秒以下の部分のみで前記比較を行うことを特徴とする請求項１に記載の手段。 3. 未知の個人を識別する装置において、人間の口腔・鼻腔より作られた音響を第１のディジタル電気信号に変換し、そして前記音響の可聴部分に対応する電気信号をそれより検出して、前記音響の不可聴部分に対応する第２のディジタル電気信号を作成するための手段、前記第２のディジタル電気信号を、周波数、振幅および時間サンプルの３つの領域の様式に変換して、前記個人の未知の音響プロフィルを構成するピークおよび谷の配列を作成するための手段、既知の個人の同じ様式の音響プロフィルの元ファイルを備えるための手段、前記既知の個人の前記音響プロフィルの前記のピークおよび谷の関係位置を含む相互関係を前記未知の個人の音響プロフィルと比較し、そして前記音響プロフィル間の相関を検出するあるいは検出しない有用な信号を提供する手段から成る未知の個人を識別するための装置。 4. 各音響プロフィルの前記ディジタル電気信号の１秒以下の部分のみで前記比較を行うことを特徴とする請求項３に規定した装置。 5. 前記時間サンプルが話された語全部よりも少ないことを特徴とする請求項１に規定の発明。 6. 前記時間サンプルが１秒の1/100のように短いことを特徴とする請求項５に規定の発明。 7. 変換される前記音響が可聴の下の帯域範囲であることを特徴とする請求項１に規定の発明。 8. 前記音響が可聴下周波（超低周波）の範囲であることを特徴とする請求項１に規定の発明。 9. 前記時間サンプルが話された語全部よりも少ないことを特徴とする請求項３に規定の発明。 10．前記時間サンプルが１秒の1/100のように短いことを特徴とする請求項３に規定の発明。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＤＥ，ＤＫ，ＥＳ，ＦＲ，ＧＢ，ＧＲ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＳＥ)，ＡＵ，ＣＡ，ＪＰ，ＫＲ【要約の続き】

Claims

【特許請求の範囲】 1. 未知の個人を識別する手段において、人間の口腔・鼻孔よりつくられた音響をのディジタル電気信号に変換し、前記ディジタル電気信号を、周波数、振幅および時間サンプルの３つの領域の様式に変換して、前記個人の未知の音響プロフィルを構成するピークおよび谷の配列を作成し、既知の個人の同じ様式の音響プロフィルの元のファイルを与え、前記既知の個人の前記音響プロフィルの前記ピークおよび谷の関係位置を含む相互関係を前記未知の個人のものと比較し、そして前記音響プロフィル間の相関を検出するあるいは検出しない有用な信号を提供することから成る未知の個人を識別する手段。 2. 各音響プロフィルの前記ディジタル電気信号の１秒部分のみが前記比較を行うことに必要とさえることを特徴とする請求項１に記載の手段。 3. 前記時間サンプルが少なくとも毎秒５，５００サンプルであることを特徴とする請求項１に記載の手段。 4. 未知の個人を識別する装置において、人間の口腔・鼻孔よりつくられた音響をのディジタル電気信号に変換するための手段前記ディジタル電気信号を、周波数、振幅および時間サンプルの３つの領域の様式に変換して、前記個人の未知の音響プロフィルを構成するピークおよび谷の配列を作成するための手段、既知の個人の同じ様式の音響プロフィルの元ソースを与えるための手段、前記既知の個人の前記音響プロフィルの前記ピークおよび谷の関係位置を含む相互関係を前記未知の個人の音響プロフィルものと比較し、そして前記音響プロフィル間の相関を検出するあるいは検出しない有用な信号を提供するための手段から成る未知の個人を識別する装置。 5. 各音響プロフィルの前記ディジタル電気信号の１秒の部分のみが前記比較を行うことに必要とされることを特徴とする請求項３に規定した装置。 6. 前記時間サンプルが少なくとも毎秒５，５００サンプルであることを特徴とする請求項４に規定した装置。 7. 前記時間サンプルが話された語全部よりも少ないことを特徴とする請求項１に規定の発明。 8. 前記時間サンプルが１秒の1/100のように短いことを特徴とする請求項７に規定の発明。 9. 変換される前記音響が可聴の下の帯域範囲であることを特徴とする請求項１に規定の発明。 10．前記音響が可聴下周波（超低周波）の範囲であることを特徴とする請求項１に規定の発明。 11．前記時間サンプルが話された語全部よりも少ないことを特徴とする請求項4 に規定の発明。 12．前記時間サンプルが１秒の1/100のように短いことを特徴とする請求項４に規定の発明。 13．変換される前記音響が可聴の下の帯域範囲であることを特徴とする請求項４に規定の発明。 14．前記音響が可聴下周波（超低周波）の範囲であることを特徴とする請求項４に規定の発明。