JP2719561B2 - スペクトル同定方法 - Google Patents

スペクトル同定方法

Info

Publication number
JP2719561B2
JP2719561B2 JP22729589A JP22729589A JP2719561B2 JP 2719561 B2 JP2719561 B2 JP 2719561B2 JP 22729589 A JP22729589 A JP 22729589A JP 22729589 A JP22729589 A JP 22729589A JP 2719561 B2 JP2719561 B2 JP 2719561B2
Authority
JP
Japan
Prior art keywords
vector
vectors
spectrum
unknown
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22729589A
Other languages
English (en)
Other versions
JPH02269951A (ja
Inventor
ロメオ・ホセ・ハブナー
Original Assignee
デイド・ケミストリー・システムズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by デイド・ケミストリー・システムズ・インコーポレイテッド filed Critical デイド・ケミストリー・システムズ・インコーポレイテッド
Publication of JPH02269951A publication Critical patent/JPH02269951A/ja
Application granted granted Critical
Publication of JP2719561B2 publication Critical patent/JP2719561B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Theoretical Computer Science (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Image Analysis (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Radio Relay Systems (AREA)
  • Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
  • Prostheses (AREA)
  • Telephonic Communication Services (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】 本発明はスペクトルを分類し、その分類を使用して未
知物質のスペクトルから未知物質の同定を行う方法に関
するものである。
更に詳しくは、本発明はそのDNAに由来するスペクト
ルパターンから微生物の既知サンプルを分類して微生物
の未知サンプルの同定を行うためにその分類を使用する
方法に関するものである。
[発明の背景] 微生物は今まで、いくつかの観察できる特性にもとづ
いて、多少便宜的に分類されていた。一般にその分類で
満足され、歴史的には今日まで用いられてきたが、単細
胞生物については、それでは難しくなってきた。これら
のそして他の分類システムは、伝染性の生物、ウィルス
等の正確な分類をするという医学上の現代の要求に対し
ては、大ざっぱで効果がないことが判明している。
これらの問題点を解決するために、ウェブスター(We
bster)は米国特許第4,717,683号(1988年1月5日)
で、消化DNAが、プローブ生物の又はそれに由来するリ
ボゾームRNA情報を含む核酸とハイブリダイズあるいは
再結合した、生物の制限エンドヌクレアーゼ消化DNAの
クロマトグラフィーパターンを、少なくとも2つの異な
った既知の生物の同等のクロマトグラフィーパターンと
を比較することで、生物を同定し特徴づけをする方法に
ついて述べている。
DNA分子は螺旋階段状のポリマーで、軌道はフォスフ
ェートとシュガー基の繰り返しからなり、4つの塩基だ
けがある:アデニン及びチミン(A及びT)それらはい
つも互いに対をなしている;グアニン及びシトシン(G
及びC)も同様に対をなしている。生物のいくつかの特
性を決定する遺伝子は単にDNAの数百あるいは数千塩基
の長さである。
これらの塩基が細胞機能を支配するようにみえる配列
である。多くのDNA配列手法においては、DNAにおけるす
べての塩基配列の決定が試みられていた。一方ウェブス
ターの方法は一定の保持された特性を有する配列の存在
を求めるものである。DNA分析の第1歩はDNA分子をセグ
メント化することである。これには、DNAを特定位置で
切断する制限酵素−蛋白質に基づくいくつかの標準的な
方法である。
フラグメントはゲル電気泳動によってサイズ別に分類
される。この方法では、フラグメントを含んだ混合物は
サイズ別に分けられゲル中(例えばアガロースゲル)に
置かれ、負に荷電したDNAフラグメントを正極へ誘導す
る。粒子がゆっくりとゲル中を移動するにつれて、最も
小さいフラグメントはより速く移動し、真っ先にゲルの
反対点に到達する。あらかじめ決められた時間の経過
後、典型的には数時間後、電場は除かれる。
ウェブスターは、適切に選択した標識されたプローブ
物質は、フラグメントを一本鎖にした後、これらのDNA
フラグメントとハイブリダイズし得ることを発見してい
る。プローブ物質は、あたかもジグソーパズルの小片が
適合するように、あるDNAの半フラグメントに適合す
る。プローブ物質は、適した標識、典型的にはリン32で
標識される。するとプローブ物質の位置は、標識された
フラグメントのラジオアイソトープが写真フィルム上の
部分を露光する方法である、オートラジオグラフィーで
検知される。
最終結果は、アガロースゲルの一端からもう一方の一
端までの間に、フラグメントのサイズが大きいものから
小さいものへ順に配置された像である。サイズにより分
類された放射標識フラグメントのパターンは微生物を独
自に特徴づけるものである。この技術はバクテリアにつ
いて示され、他の生命形態に拡張された。そして、バク
テリア、他の生命形態は、外部認識できる特性よりはDN
Aで同定できる。
この写真の像は、ゲル電気泳動の列に対応する平行の
直線通路に沿って幅及び鮮明度の異なる一連のバンドを
含んでいる。このシートは標準的なCCDビデオカメラで
スキャンされ、ラジオグラムの電気的像を得る。この像
は、電気泳動ゲルに沿って距離の関数として変化する山
や谷を含んでいるクロマトグラムと非常によく似てい
る。この山と谷の一連の像は微生物にとり独自で、個々
の微生物を同定する。ウェブスターがこの特許第15欄24
行目で示唆しているように、ユーザーは得られたバンド
パターンを目視的に比較しても良いしあるいはパターン
を認識するために用いた一次元のコンピューターを使用
するデジタルスキャナープログラムを用いても良い。コ
ンピューターメモリーには、複数の既知の生物の異なっ
たバンドパターンのライブラリーあるいはカタログを含
んでいる。
今では個々の微生物を同定することは、未知の生物又
はパターンを既知のパターンのカタログとを単に比較す
ることである。
シルマン(Silman)の米国特許第4,753,878号(1988
年6月28日)に示された関連技術は、微生物の代謝産物
と活発的に結合する標識を微生物に付加する方法を記載
している。代謝産物はゲルから分離され、標識は典型的
にオートラジオグラフィーで検知される。その波形ある
いはスペクトルが微生物の同定を表示する電気的信号を
与えるために発光パターンが検知される。この波形はコ
ンピューターで、そのなかに保持されている既知の微生
物の収集パターンと比べられる。
微生物の特徴的なDNAパターンの同定に加えて、個々
のスペクトルまたはパターンを同定するのが好ましいあ
るいは必要である他の多くの例がある。例えば米国特許
第4,651,289号(1987年3月17日)で、マエダ(Maeda)
らが、声紋認識方法で明らかにしている。パターン認識
の必要性は、天文学、質量分析計等を含む多くの分野に
広がっている。マエダらは特性認識の分野で広く用いら
れる、類似方法あるいはパターン合わせ方法を記載して
いる。彼等は、類似同定方法で生じる問題は、多くの参
照パターンの保存が必要とされること及びコンピュータ
ーが種々の保存された参照パターンとインプットした未
知のパターンを分析、比較するのに多くのマトリックス
計算をしなければならず、過剰の時間がかかることを指
摘している。大メモリーでコンピューター計算に時間が
かかるため、これらの操作のために高価なコンピュータ
ーが必要となる。
マエダらは類似の測定法として、コサインを使用した
データーベース機構と調査方法を記載している。この方
法を使用すればアクセス時間は、データーベースエント
リーの一部に比例し、未知のものを全データベースのそ
れぞれの要素と比較する従来の方法を幾分改善した。し
かしマエダらは強力なコンピューターとより多くのデー
ターベース保存能力を依然として必要としている。
これら従来の、参照パターンあるいはスペクトルを同
定するための類似性比較システムの多くの欠点は、エン
トリーの全数の対数に比例して同定時間を減少させた本
発明により解決された。本発明は、一点一点既知サンプ
ルの特徴を示す像に基づきスペクトルの階層的ライブラ
リー(hierarchial library)を確立する方法であっ
て、それぞれのスペクトルは、既知サンプルの特性一点
一点ごとに対応し、それぞれのスペクトルは他のすべて
のスペクトルと異なるものであり、次の工程を包含する
方法である。
(a)それぞれのスペクトルを異なる既知サンプルの
一点一点ごとの表示に対応するベクトル(vector)に変
換する;(b)すべてのベクトルの間で、類似性を定め
るものとして数学的な角度を決定する;(c)平均のベ
クトルに最も近く、従ってベクトル集団の中心を代表す
る第1のベクトルを選択する;(d)第1のベクトルに
最も似ていない局部の集団の中心を代表する第2のベク
トルを選択する;(e)ベクトルをそれぞれの選定した
ベクトルに最も似ている第1のベクトルグループと第2
のベクトルグループに分ける;(f)それぞれのベクト
ルグループについて、集団の中心を代表している予め選
択されたベクトルを除いて、集団の局部中心を代表する
新しいベクトル及び最もそのベクトルに似ていないベク
トル集団の局部中心を代表する他のベクトルを選択す
る;(g)各グループのベクトルを工程(f)のベクト
ルの集団の中心値への類似性によってサブグループの対
に分離する;(h)各ベクトルグループのベクトルの集
団の各ベクトル中心をサブグループのベクトル集団の中
心と結合させる;(i)続いて工程(f)(g)(h)
を次の各サブグループにも繰返してすべてのベクトルが
集団の中心値として選ばれるまで行なう。
ここで、“スペクトルの階層的ライブラリー”なる用
語は、既知のスペクトルの集合、即ちライブラリーを意
味します。この集合(ライブラリー)は、ある特性に基
づいて2つの一次(高次)グループに分割されていて、
各1次(高次)グループは2つの2次(次に低いオーダ
ー)サブグループに分割されており、また各2次サブグ
ループは更に2つの3次サブグループに分割されてお
り、このような分割を繰り返して、最も低いオーダーの
各サブグループがたった1つの物質を含むまでサブグル
ープに分割されています。この様な組織は、物理的な観
察可能な特性に基づいている必要はありません、数学的
クラスタリング法によって決定できる通常行っているグ
ループ化に基づいています。
好ましい態様においては、工程(g)の分離におい
て、工程(f)の集団ベクトルのそれぞれの中心値のあ
らかじめ決定された数学的な角度の範囲内のすべてのベ
クトルは、それぞれのサブグループに含まれるが両方の
サブグループに含まれるようなベクトルもある。情報は
関係するベクトルに結合してライブラリーに保存される
のが好ましい。共通の選択されたベクトルへの連結を有
する選択されたベクトルによって代表されるサブグルー
プは統合する。結局、工程(c)のベクトル(C)の平
均値は以下によって決定される。
C=(c1、c2、c3、……cn) ここで、 ci=SUM(pij/|Vj|) ここで、i=1,2,3,4……N j=1,3,3,4……M ここでNはサンプリング点の数であり、pijは各点に
おけるサンプルスペクトルの値である。Mはライブラリ
ーのベクトルの数である。|Vj|は座標値pijの平方の
和の平方根に等しいベクトルの大きさである。
階層的ライブラリーを利用して、未知のサンプルのス
ペクトルを、未知のサンプルを一点一点ごとの代表に対
応する未知のベクトルに未知サンプルのスペクトルを変
換し、未知のベクトルと第1及び第2のベクトルとの間
の類似性を決定し;未知のベクトルと、第1及び第2の
ベクトルとより似ているものと結合したサブグループの
集団ベクトルの中心との間の類似性を決定し;それぞれ
さらに結合するサブグループがなくなるまで、未知のベ
クトルと、更に類似する高位のサブグループに結合して
いる、続くサブグループの対との類似性を決定する各工
程によって同定され、未知のスペクトルは比較される最
も類似のベクトルによって定められる。
従来のスペクトルデーター機構において、調査時間の
要件はデーターベースに保存されているエントリーの全
数と典型的に比例する。本発明の構成方法は、データー
ベース調査時間はデーターベースエントリーの全数の対
数に比例する数に引き下げるものである。この方法は巨
大なデーターベースに、仕事両の比較的少ないマイクロ
コンピューターで迅速にアクセスすることを狙いとす
る。
データーベースの構築プロセスは、定期的ではある
が、ユーザーによるものではなく、計算の費用について
は考慮せずに行われるオフライン方式での操作が考えら
れる。末端ユーザーは迅速なアクセスができるか、すな
わちデーターベースからのアクセスコストについて案じ
ている。商業上のシステムをはっきり目にみえる形にす
るため、データーベースをシステム製造業者が製造し、
ディスクのようなコンピューター媒体として顧客に供給
することができる。データーベースの新しい因子が追加
されると、この追加データーは顧客に配布され、予約も
可能である。
端的に言えば、本発明は未知項目をそのスペクトルか
ら同定する方法と言いうる。
未知項目は声紋であることもあろうし、質量分析計か
らのデーター、あるいは天体物体からの放射パターン等
でもあろうし、プローブ物質とハイブリダイズした未知
バクテリアのDNAフラグメントの分配のゲル電気泳動で
得られるスペクトルを含んでいる。このDNAフラグメン
トのスペクトルデーターは既知バクテリアのライブラリ
ーのDNAフラグメントのスペクトルと比較される。スペ
クトルのライブラリーは、最小の比較で未知のものが同
定できるような階層に組織される。階層に基づくライブ
ラリー組織は、ライブラリー要素の間を連結し、最小の
コンピューター手段での迅速、正確な未知の同定を促進
するものである。この方法は、従来に比べて比較を少な
くしコンピューター処理が少なくて済むので、低コスト
のコンピューターの使用を促進する。このタイプのスペ
クトルデーターのライブラリーは、商業上有益にしよう
とすると非常に大きくなるので、上記のことは顕著な利
点である。
本発明の方法は本質的な2つの主な工程を含んでい
る。これらの工程の第1はスペクトルライブラリーの構
築であり、第2はライブラリーを使用した未知項目のス
ペクトルの同定である。上述したように、スペクトルは
声紋パターンでも、バーコードパターンであっても、天
体物体からの放射スペクトルデーター等のようないかな
るパターンでも同定し得る。本発明はウェブスター特許
に記載されたあるいはそれを利用したスペクトル分解同
定方法に主導されているので、それについてこの章で説
明する。本発明はそれに限定されるものでなく、いかな
るスペクトルも同定し得る。
方法は特に第1A図及び第1B図に記載されている。この
ように同定される、あるいは階層的ライブラリーの使用
のために同定又は処理されるバクテリアのDNAは、ウェ
ブスターが示したように特定位置でDNAを切断してDNAフ
ラグメントを製造する制限酵素を利用して、セグメント
化される。次いで、これらのフラグメントは、通常のゲ
ル電気泳動によりサイズ別に分類される。この場合は、
アガロースゲルを使用し、負に荷電されたフラグメント
が正極に誘導されるような電場にフラグメントを置く。
フラグメントはアガロースゲル中にゆっくり移動し、最
も小さいフラグメントが最も速く移動し、真っ先にアガ
ロースゲルの反対点に到達する。
そしてゲルをよく知られた方法で着色し、既知サイズ
のフラグメントで構成される標準曲線を使用してフラグ
メントのサイズを標準化した。分離されたフラグメント
はその後、サザンブロット法によりニトロセルロースペ
ーパーに転写され、加熱によってそれに共有結合する。
rRNA遺伝子配列を含んだフラグメントは、rRNA情報を含
んだ核酸プローブとハイブリダイズする能力により位置
づけられる。核酸プローブは放射性でない標識でも、好
ましい放射性の標識でもどちらでもされ得る。放射性の
標識がされたときはプローブはリボゾームRNA(rRNA)
あるいは、リボゾームRNA(rRNAcDNA)と相補的であ
る、放射性の標識をされたDNAであり得る、どちらも逆
転写により合成されまたはクローンフラグメントに含ま
れ、例えばニックトランスレーションにより標識され
る。
次ぎに、放射性の標識をされたrRNA遺伝子配列を持っ
たフラグメントを含んだニトロセルロースフィルムは、
周知の技術であるオートラジオグラフィーで、放射性の
標識のパターンがX線フィルム上で現像されるようにX
線フィルムと重ねられることにより目で確かめられるよ
うになる。
この技術の最終生産物は、特定位置での異なる強度の
明暗区間を有する、クロマトグラフのバンドパターンま
たはスペクトルである。これらの位置は、λバクテリオ
ファージDNAを消化するEcoRIのようなマーカーの分離技
術を導入することによって、迅速に特定フラグメントサ
イズ(キロ塩基対)と合致する。この手法では、各バン
ドの絶対サイズと同様お互いのバンドの相対位置は容易
に確かめられる。そして後述するように、未知のバンド
パターンはコンピューターライブラリーに存在するバン
ドパターンと比較される。このバンドパターンは第2図
に最も明確に表れている。そこでは異なったマーカーを
もった4つの異なったサンプルが示され、電気泳動図で
表されている。
バクテリアDNAフラグメントの1つまたはそれ以上の
サンプルよりの像を有する生成ラジオグラムは、画像の
数値化のためのCCDラインスキャンカメラの視界に置か
れる。オペレーターは、ラジオグラフを、カメラによっ
てスキャンされるべきラインが、サンプルの第1電気泳
動レーンの軸に沿って集中されるように置く。
ラインがスキャンされ、あるいはカメラの画素(ピク
セル、pixel)又は各点の強度レベルが数値化される。
画像強度あるいはラジオグラム密度は典型的に4096レベ
ル(12ビット)の解像度で測定される。各レーンに沿っ
た測定は典型的に1024ピクセルである。
数値化データーは適したメモリーに保存され、その
後、背景の除去や大きさの測定等のような周知の画像処
理技術を使用して処理される。
近接したピクセルの対はいっしょに平均化され、これ
らの平均値は、各レーンに沿った位置の関数としてのラ
ジオグラムの密度を表わす。画像密度はフラグメント集
団の関数であるので、この数のセットは、DNAフラグメ
ント長さの基準化していないスペクトルである。この数
のセットは、典型的に512値からなっている。これらの
工程をラジオグラム上のサンプルの第2そして続く電気
泳動レーンについて繰り返した。
オリジンの位置とフラグメント長さディメンジョン目
盛りは、各レーンで近接レーンのマーカーフラグメント
の位置を測定することにより決定される。既知の長さの
数個のDNAフラグメントマーカーを含むこれらに続くレ
ーンは、第1レーンの測定を定規として使用する。既知
の数値のマーカー間の距離を測定することによって、フ
ラグメント長さに対する目盛り要素と第1レーンのオリ
ジンとの両者の位置が計算される。
第1レーンの数値は、それらをフラグメント長さに較
正するために目盛られる。フラグメント長さに対する画
像密度を表わす数値の較正されたセットは、較正された
スペクトルであるが、単にそのサンプルの「スペクト
ル」として引用される。
スペクトルのライブラリーは、工程A−Iを使用して
多くのタイプの既知バクテリアサンプルの処理により造
られる。このスペクトルのライブラリーは、適したメモ
リーに保存される。各既知のスペクトルを表わす数値の
セットは、ライブラリーの要素と呼ばれる。未知のもの
をライブラリーの要素と比較することにより、効果的に
同定するためには、最小数の比較で正しい同定となるよ
うな、ライブラリーの組織化が成されなければならな
い。組織化の方法は工程J−Nで述べる。
既知サンプルの各スペクトルは数学的にベクトルとし
て扱われる。スペクトルの各フラグメント長さのための
数値は多次元のベクトル空間において1つの座標値とし
て考えられる。各ベクトルは他のすべてのベクトルと比
較され、ベクトルの対の間の数学的角度が計算される。
もしこの角度が小さければ、2つのベクトルは類似とい
い、この角度が大きいときには非類似という。数学的規
則よりこの角度は90度を越えることができない。
既知サンプルの集団の中心を表わしている平均ベクト
ルが計算される。この平均ベクトルに近い集団内のベク
トルは中心ベクトルと考えられ、比較のためのスタート
点として使用される。後の工程で、比較がなされると
き、集団の局部中心が決定される。集団の局部中心はそ
のグループの平均ベクトルに最も近いグループ(サブグ
ループ)のなかの一つのベクトルである。又既知サンプ
ルのベクトルは他との非類似性によりランク付けされ
る。
分析の各工程において、2つの「参照」ベクトルが選
ばれる。1つのベクトルは集団の局部中心に最も類似し
ているもので、他のベクトルはその中心に最も類似して
いないものである。これらの参照ベクトルのそれぞれ
は、それに組み合わされる類似ベクトルのサブグループ
を有している。参照ベクトルの1つと明らかに似ていな
い、いくつかの要素は、両方の参照ベクトルと組み合わ
される。ベクトルは参照として選ばれた後、横に置か
れ、以後の比較から除かれる。1の工程の参照ベクトル
は、次ぎの工程の比較のための集団の局部中心となる。
サブグループは再び処理される。いつも新しい2つの
参照が選ばれる。2つの新しい参照と前工程の参照との
間に「連結」がなされる。このプロセスは、ライブラリ
ーのすべての要素が参照として選ばれ、連結されるまで
行われる。連結は、後に未知のものが同定される時に比
較が行われるような秩序を確立する。
すべての実験室での方法は、実験誤差が入ることが知
られている。ゲル電気泳動と画像数値化から生じるこの
実験誤差は、ライブラリーにおける各要素の真のベクト
ル位置を少し不確実にする。もしこれらの誤差が考慮さ
れなければ、これらの誤差は、誤った参照の連結を導く
こととなる。この事は、次ぎに未知のものの同定を誤る
こととなる。実験誤差による悪影響を克服するため、参
照のあらかじめ決められた角度距離内のすべての要素
は、その参照と連結したサブグループに含まれる。これ
らのサブグループへの「近接」要素の包含は、実験誤差
の悪影響を除くような余裕を提供する。このプロセスは
「復元」と呼ばれる。
結局多数の連結を有するいくつかの要素は要素の2又
はそれ以上のサブグループのための参照として選ばれる
であろう。このような状況下、これらのサブグループは
統合され、以後は1つのサブグループとして処理され
る。
すべての要素が参照として選ばれ、他の参照と連結さ
れる時、このライブラリー組織化手順は終了する。
同定すべき未知のものは、上記の方法を使用して処理
される。得られたスペクトルはすべてのベクトルの集団
の局部中心のベクトルと比較される。未知のものは、最
初の2つの参照ベクトルの1つとより類似していること
が見出だされるだろう。この参照ベクトルの連結は、比
較として、次ぎにどの参照が使用されるべきかを決定す
る。この方法は更に比較するための参照連結が残らなく
なるまで続ける。最も類似しているスペクトルの最小ス
クエア適合方法を使用することにより、未知のもの決定
される。
第2図に図示されている数個のサンプルのスペクトル
は、そのマーカーフラグメントと同時に第4図乃至第10
図にそれぞれ描かれている。塩基対のフラグメントのサ
イズは、ゲル電気泳動による距離によって、キロ塩基対
でプロットされ、大きさは、種々の塩基対の位置に対応
する各フラグメントの量と強度を表している。
本発明の方法を実施するために使用されるハードウェ
アは、第3図のブロツク図に示されている。このハード
ウェアは、典型的には、マッキントッシュII型コンピュ
ーター10のようなマイクロコンピューターを具備してい
る。このマッキントッシュII型コンピューター10は、標
準のCCDラインスキャンカメラ又はスペクトルイメージ
センサー14とインターフェースするセンサーインターフ
ェース12を具備している。マイクロコンピューターは
又、本発明により提供される分類ライブラリー18及び同
定ソフトウェア20と相互作用するためのランダムアクセ
スメモリーを具備している。コンピューター10は又、CR
Tカラーディスプレイ24と相互作用するディスプレーメ
モリー及びインターフェース22と、キーボード28と相互
作用するキーボードインターフェースエレメント26と、
プリンターインターフェースモジュールにより相互作用
するプリンター30とを具備している。コンピューターは
最終的には、標準ウインチェスターディスクのようなハ
ードドライブ34を具備するであろう。
処理されたフィルム又はラジオグラムは、透過型の配
置において照明され、スペクトルイメージセンサー14の
視野に置かれる。オペレーターは、処理のためデジタル
化され、コンピューターのRAMメモリー16に送られるイ
メージを得るために、コンピューターにサンプルの同定
番号を入力し、指令し、命令を与える。デジタル化され
たイメージは、同時にCRTに表示される。オペレーター
は、ディスプレイ上の適当なポイントに電子的にカーソ
ルを位置決めすることにより、処理されるイメージの適
当な名前を選択し、かつ、イメージのその部分を処理す
るようにコンピューターに指令する。特定のサンプルに
対応する特定のスペクトルを処理する前に、幾つかの公
知のイメージ処理操作が行われる。このように、イメー
ジデータからランダムノイズを除去するために、データ
平滑操作が行われる。得られた画素の連続対は、次いで
データエレメントの数を減少させるために平均化され
る。
全体フィルム密度とカメラ照明レベルとの差異から生
ずる強度の変化を除去するために、バックグランド除去
操作が用いられる。分子量当たりのスペクトル配列は、
マーカーフラグメントの強度のピークを同定し、次い
で、これらの知られた点から分子量スケールを外挿する
ことにより得られる。スケーリング後、これらのマーカ
ーフラグメントはイメージデータから減算される。
或いは、CCDカメラの替わりにエリア(area)カメラ
を用いて、特定のスペクトルに対するデジタルイメージ
データが得られる。エリアカメラを用いて、電気泳動レ
ーンを同定し、センターライン又はそれらのラインの軸
を位置決めし、それぞれのサンプルに対応するそれぞれ
のレーンの幅を測定するために、イメージデータが処理
される。
レーン軸に沿って、全レーン幅の3分の1からなる、
それぞれのレーンの中央領域が同定される。この中央領
域内の画素は、レーン軸に沿ったそれぞれの位置に対す
る単一の密度値を得るために、平均化される。これは、
レーン軸の対角線に沿って存在する中央領域内の画素に
ついての平均値を計算することによりなされる。これら
の平均値は、レーン軸に沿ったそれぞれの位置について
のイメージの密度値を表わすために蓄積される。
本発明の方法を基礎づける数学的原理は、それぞれの
スペクトルは1組の数であり、そのそれぞれはオートラ
ジオグラム上の画素の光学的密度を表わすという事実に
基づく。着目点は、フラグメントの移動方向におけるラ
インA−A(第2図)に沿っている。オートラジオグラ
ムは、サイズ分離されたDNAフラグメントが付された膜
の接触X線イメージである。X線イメージの感光領域
は、DNAフラグメントの幾つかの選択的に交雑するプロ
ーブに付された放射性ラベルの存在を示す。従って、デ
ジタル化された光学的密度は、サイズ分離された交雑DN
Aフラグメントの固体群密度の尺度を示す。
スペクトルは、ベクトルとしての数学的思考であり、
それぞれのポイントの密度値は、多次元空間におけるそ
れぞれの軸に沿ったベクトルの座標値を示す。多次元空
間は、物理的に表わすことが出来ないため、超空間(hy
perspace)と呼ばれる。ポイントの数は、超空間におけ
る次元の数を決定する。密度値は、1組の数としてコン
ピューターに蓄積される。
ベクトルは文字「V」、及び数字を伴う小文字「p」
によるポイントで表わされる。
V=(p1,p2,p3,…,pN) 式中、Nはサンプリングポイントの数であり、pは光
学的密度値である。
計算を行う場合、それぞれのベクトル「V」は、次の
ように、単位ベクトル「v」に標準化される。
v=(p1/V,p2/V,p3/V,…,pN/V) 式中、「V」はベクトルの大きさは長さであり、すべ
ての座標値「p」の2乗の合計の平方根に等しい。
V=SQRT(合計(2乗(pi))) 式中、i=1,2,3,…、Nであり、j=1,2,3,…,であ
り、Mはデータベースにおけるベクトル(又はスペクト
ル)の数である。
2つのベクトルの類似性、又はベクトル空間における
近接性は、次の式を用いて、ベクトルの内積として定義
される。
(C,V)=SUM((pi/N)*(c1/C)) 式中、i=1,2,3,…,Nである。
この類似性値は、正の光学的密度の拘束により負では
なく、定義によると単位ベクトルのみが比較されるの
で、1.0の上限を有する。
より普通の概念において、内積は、2つのベクトル間
の角度のコサインであり、これは方向コサインとも呼ば
れる。2つのベクトル間の90°の角度は、cos(90)=
0.0の類似性値を生じ、これらのベクトルは直角の又は
最大の非類似性であると言われている。
内積は、本発明の展開に用いられている唯一の類似性
の概念であり、それぞれのアルゴリズムの決定がそれに
基づくものである。
多成分の知られていないスペクトルにおいて、知られ
ていないUは、その成分Vの線形結合であると見なされ
る。単位ベクトルは、次の式により関係づけられる。
u=SUM(ak*vk) 式中、k=1,2,…K(成分の数)である。
係数「a」は計算され、正規化された未知の「u」に
対する正規化されたスペクトル「v」の相対的寄与を表
わす。計算の手順は、行列の変換に還元され、そこでは
要素は次の類似性値である。
ij=(Vi,Vj)及びMi=(vi,U) 式中、i,j=1,2,・・・K(成分の数)である。
これらの数学的概念の実行は、恐らく第11、12及び13
図のフローチャートを考慮することにより容易に理解さ
れるであろう。これらのフローチャートは、最初に分類
ライブラリーを編成し、次にそこに含まれるデータスペ
クトルを記憶し、最後に未知のスペクトルを同定するた
めにデータベースをサーチするために用いられた方法を
記載している。
データベース構成 第11図はデータベースの構成手順の主工程を示す。ス
タート時に、幾つかの数の記憶されたスペクトルを持つ
データベースが提供若しくは知られていたとする。各ス
ペクトルはN(1スペクトルあたりのデータポイント
数)次元空間のベクトルとしてみなされる。上記ベクト
ルは操作の実施に先立って単位ベクトルに標準化され
る。従って、各スペクトルはN次元空間内の単位半径の
超球の表面上のポイントを表す。
工程1において、全スペクトルのベクトル和は計算さ
れ、単位ベクトルに標準化される。これは本手順の為の
出発スペクトルを提供すると共に、処理されるべきスペ
クトルの合計数を数える。
工程2及び3は処理ルーチンテストである。工程5に
おいて、参照スペクトルが選択される。この参照はベク
トル空間における母集団化された領域を代表することが
望ましい。領域的母集団密度は、出発スペクトルとし
て、中心ベクトル、平均単位ベクトルを使用することに
より保証される。上記中心ベクトルは工程1若しくは先
行の参照選択により工程5に提供される。
2つのスペクトルはそれらのベクトル間の角度を測定
することにより比較される。この角度は、正の光学密度
という所与の条件から、常に90°未満である。上記角度
のコサインは、類似性の計量値となり、値1.0は同一の
スペクトルを示し、値0.0は完全な非類似性若しくは直
交性を示す。
中心ベクトルでスタートすると、所与の参照に対する
全ベクトルの類似性は、参照に最も近いベクトル即ち、
類似性の最も大きい測定値のベクトルを見出すように計
算される。この結果はインプットとして使用され、スペ
クトルの最も類似するサブグループについて、見出され
たスペクトルがその最直近近傍の最直近近傍となるまで
計算が繰返される。
2つのスペクトルは、より大きな類似性の計量値をも
って、それらが周囲(超球表面上の近隣)の他のいかな
るベクトルよりも互いに類似すると、最直近近傍と名付
けられる。アルゴリズムの結果は超球の母集団化された
領域を代表する参照スペクトルとしてセーブされる。
第2の参照スペクトルが、原データベースの一時的部
分集合に対して同じ選択手順を適用することにより見出
される。第1の参照に比較すると低類似性計量値のスペ
クトルからなるこの部分集合は、工程6において見出さ
れる。工程7における操作は、工程1で用いられたアル
ゴリズムを用い、上記スペクトルの部分集合について繰
返して、平均単位ベクトルを計算する。上記第2の参照
は、工程5で用いられたアルゴリズムを繰返し、2つの
ほぼ直交するベクトルの為のサーチを完了する工程8で
見出される。これらのベクトル若しくはスペクトルは、
低類似性計量値を共有し、超球内の離れたポイントであ
る。
一旦2つの代表的参照が見出されると、第1の参照ス
ペクトル若しくは第2の参照スペクトルのいずれかに対
するそれらの最大類似性に従い、工程9において、全ス
ペクトルを2グループの一方に再割当てするようにアル
ゴリズムが進行する。出発データベースは従って、夫々
が参照スペクトルに関連する2つのサブグループに分割
される。これらのサブグループは、追加の参照を見出だ
す次の反復法の為の(サブ)データベースとして提供さ
れる。
超空間のフラクションの数は、最終的には、スペクト
ルの誤った若しくは過誤割当ての可能性を誘発するであ
ろうことは明らかである。近隣復元アルゴリズムは工程
9における細分機構と共に実行され、全参照がまさしく
それらの近隣を代表するようにする。
しかる後、復元されたスペクトルは1を越える細分に
おいて出現するであろう。幾つかの反復法の後、復元さ
れたスペクトルは原データベースの一つ若しくは複数の
サブグループを率いる参照となり、原データベースは工
程10の為にテストされる。上記参照が複数のサブグルー
プに割当てられる場合、これらの細分は上記参照の近隣
の異なる面(facet)を代表し、また工程1に併合され
る。
工程10及び11の後、上記プロセスは各サブグループ若
しくはスペクトルの(サブ)データベースの為に繰返さ
れる。細分数は指数的(2乗)に成長し、また記憶され
た参照も指数的に成長する。参照はそれらが代表する
(サブ)データベースから排除される為、反復法は原デ
ータベースの全スペクトルが参照として記憶されると停
止する。3エントリー未満に伴って工程3に達する全サ
ブグループは工程4に落ち、ここで、存在するエントリ
ーが関連の部分集合なしに参照として単に記憶される。
復元アルゴリズム 第12図は工程9の拡張である復元アルゴリズムのフロ
ーチャートを示す。第12図において、復元パラメータが
計算される。復元の目的の為、近傍は、参照パターンに
より形成される角度の半分に等しい角度開口の超空間に
おける立体角内に横たわるものとして限定される。より
以上のスペクトルの有用性は工程13においてテストさ
れ、次のスペクトルが工程14においてメモリから読取ら
れる。もしこのスペクトルがすでに参照として記憶され
ていると、これは工程15において無視され、そうでなけ
れば、現行参照(current reference)に対する類似性
が工程16において見出だされる。もしベクトルが現行領
域(工程17)若しくは復元領域(工程18)内にあると、
スペクトルは工程19において最も類似の現行参照に割当
てられる。この手順の最後において、データベースの各
エントリー若しくは各メンバーは割当てられてしまう
か、または1つの「プレデセッサー(predecessor)」
及び2つの「サクセッサー(successors)」とリンクさ
れる。上記後者において、第1のサクセッサーは上記エ
ントリーに対する高い類似性をもった近傍部であり、第
2のサクセッサーは上記エントリーに対する低い類似性
をもった遠隣部である。この情報はデータベース機構の
リンク機構を構成し、未知のスペクトル同定手順におい
て後で使用されるであろう。
データベースサーチ 未知のスペクトルが与えられると、ぴったりと適合す
るスペクトルの為のサーチが第13図図示の如く実施され
る。第1の2つの参照スペクトルに対する未知のスペク
トルの類似性は工程20において計算される。これらの参
照は、ベクトル空間における離間し且つ高密度母集合さ
れた(サブ)ふたつの領域から選択されるから、これら
の比較によって、上記未知のスペクトルが帰属する超空
間の領域を見出だす為の経路が統計的に決定される。未
知のスペクトルに最も類似する参照は、最終同定プロセ
スの為にセーブされる。比較される次の2つの参照は、
工程21において未知のスペクトルに最も類似するものと
して見出だされる参照に関連するデータベースの(サ
ブ)セクションから採取される。
各反復法において、このプロセスは、工程22において
テストされるように、上記経路の最後の参照、即ち、こ
れに関連するスペクトルを有しない参照に至るまで繰返
される。
同定及び組成 上記同定プロセスの最終工程において、蓄えられた最
も類似するスペクトルは、反復最小2乗法仕上げ手順
(23)を受ける。各反復の最後に、未知のスペクトルに
最も少なく寄与するスペクトルは廃棄される(24)。計
算は、工程25においてテストされるように、全スペクト
ル(サーチ反復数を差引く)が廃棄されるまで繰返され
る。
データベースサーチ及び同定プロセスは、工程26にお
いて、予め設定された信頼水準が達成されるまで繰返さ
れる。各反復法について、追加の構成要素が見出ださ
れ、工程28において未知のスペクトルから引かれる。残
部は工程20のデータベースサーチに提出されるが、完全
に未知のスペクトルは同定プロセスに再提出される。
工程23及び26におけるエラー分析は、工程27において
必要な反復の数及び未知のスペクトル中の構成要素の数
(もし複数であれば)を決定する為に必要な信頼情報を
提供する。
全条件が満足されると、判定に関するレポートが工程
29において使用者に提供される統計的情報と一緒に作成
される。
以上、スペクトルデータの分類体系的なライブラリー
を確立する為の比較的単純な方法が記述され、これは本
発明の方法に従って構成された確立されたライブラリー
による類似性参照に基づいてパターンを同定する為に用
いることが可能である。各ベクトルは1つの前ベクトル
と2つの後ベクトルにより特定のスペクトルを代表し、
これは未知のベクトルの同定が確定するまで、該未知の
ベクトルが分類体系を辿ることを速やかに可能とする。
この方法は、マイクロコンピュータの使用を可能とし、
また比較的小さな記憶容量しか必要としない。
【図面の簡単な説明】
第1A図と第1B図はブロックダイヤグラムであり、スペク
トルデーターの階層的ライブラリーの構築及び未知スペ
クトルの同定のために必要とされるDNAのスペクトルを
得るためのバクテリアDNAの処理の種々の工程を示して
いる。 第2図は本発明方法においてウェブスタープロセスを使
用して得られた典型的ゲル電気泳動図である。 第3図は本発明方法に使用し得るマイクロコンピュータ
ーのブロックダイヤグラムである。 第4図乃至第10図は、第2図で示すサンプルの種々の要
素のスペクトルグラムである。縦軸に電気泳動図の大き
さ及び密度を示し、横軸に塩基対の数をとっている。 第11図は本発明のデーターベース構築法のフローチャー
トである。 第12図は本発明方法で使用する復元アルゴリズムのフロ
ーチャートである。 第13図は本発明方法で使用する調査アルゴリズムであ
る。
フロントページの続き (56)参考文献 特開 昭59−172084(JP,A) 特開 昭59−173883(JP,A) 特開 昭60−126784(JP,A) 特開 昭49−1283(JP,A) 特開 昭63−124097(JP,A)

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】各々が既知のあるサンプルの特性を表す画
    素表示に対応していて、しかも相互に異なる複数のスペ
    クトルからなる階層ライブラリを確立して、コンピュー
    タデータベースに含まれているスペクトルを同定する方
    法であり、 (a) 各スペクトルを別の既知のサンプルの画素表示
    に対応するスペクトル・ベクトルに変換する工程と、 (b) 変換により得られたスペクトル・ベクトル総て
    に基づいてベクトルの平均値を決定する工程とを具備し
    た方法において、 各スペクトルをスペクトル・ベクトルに変換する工程
    (a)の前に分光学的手段を用いてサンプルからスペク
    トルを取り出し、 ベクトルの平均値を決定する工程(b)の後に以下の工
    程(c)ないし工程(j)を順次実施すること、即ち、 (c) スペクトル・ベクトル総てと平均ベクトルとの
    間の数学的角度を類似性の決定因として決定する工程
    と、 (d) 平均ベクトルに最も近くて、スペクトル・ベク
    トルの集団の中心を表す第1のスペクトル・ベクトルを
    選択する工程と、 (e) この第1のスペクトル・ベクトルと最も相違し
    ていて、集団の局部の中心を表す第2のスペクトル・ベ
    クトルを選択する工程と、 (f) 選択した第1のスペクトル・ベクトルに最も類
    似している第1のベクトルグループ、及び選択した第2
    のスペクトル・ベクトルに最も類似している第2のベク
    トルグループの二つのグループにスペクトル・ベクトル
    を分類する工程と、 (g) それぞれのベクトルグループについて、集団の
    中心を表すものとして以前に選択したスペクトル・ベク
    トルを除去して、集団の局部の中心を表す第1の新しい
    スペクトル・ベクトル、及びこの第1の新しいスペクト
    ル・ベクトルと最も相違していて、スペクトル・ベクト
    ルの集団の局部の中心を表す第2の新しいスペクトル・
    ベクトルを選択する工程と、 (h) 工程(g)の集団ベクトルの中心との類似性に
    従って各グループのスペクトル・ベクトルをサブグルー
    プの対に分類する工程と、 (i) 各ベクトルグループの集団ベクトルの中心と各
    ベクトルサブグループの集団ベクトルの中心とを関連付
    ける工程と、 (j) 総てのベクトルが集団の中心として選択される
    まで工程(g)、工程(h)、工程(i)を各サブグル
    ープについて順に繰り返す工程とを順次実施することを
    特徴とするスペクトル同定方法。
  2. 【請求項2】分類する工程(h)では、工程(g)の各
    集団ベクトルの中心の所定の数学的角度内のベクトル
    は、総てが個々のサブグループ内に別々に含まれている
    ので、ベクトルの中には両サブグループに関連している
    ものがある請求項1に記載のスペクトル同定方法。
  3. 【請求項3】関連したベクトル総てを連結する情報をラ
    イブラリに格納する工程を具備した請求項1又は2に記
    載のスペクトル同定方法。
  4. 【請求項4】選択したベクトルが別のベクトルに連結さ
    れている場合に、これらのベクトルにより表されるサブ
    グループを相互に融合する工程を具備した請求項3に記
    載のスペクトル同定方法。
  5. 【請求項5】工程(g)で選択した第1の新しいスペク
    トル・ベクトルは残りのベクトルの平均に最も近く、工
    程(g)で選択した第2の新しいスペクトル・ベクトル
    は第1のベクトルの集団の中心と最も相違している請求
    項1〜3のいずれか1項に記載のスペクトル同定方法。
  6. 【請求項6】共通の選択されたベクトルへの連結を有す
    る選択されたベクトルによって代表されるサブグループ
    を結合する工程を包含し、ベクトルの類似性はベクトル
    間の内部生産物により決定される請求項5記載の方法に
    より確立された階層状ライブラリーを利用して、未知の
    サンプルのスペクトルを同定する方法であって、 (a) 未知サンプルのスペクトルを、未知のサンプル
    の一点一点ごとの代表に対応する未知のベクトルに変換
    する工程と、 (b) 未知のベクトルと第1及び第2のベクトルとの
    間の類似性を決定する工程と、 (c) 未知のベクトルと、第1及び第2のベクトルの
    一方とより類似しているものと結合したサブグループの
    ベクトル集団の中心との間の類似性を決定する工程と、 (d) それぞれさらに結合するサブグループがなくな
    るまで、更に類似する高位のサブグループに結合してい
    る、サブグループのベクトルのそれぞれの続く対と未知
    のベクトルとの類似性を決定する工程であって、未知の
    スペクトルは比較される最も類似のベクトルによって定
    められる工程と、 を包含するスペクトル同定方法。
  7. 【請求項7】工程(c)の平均ベクトル(C)が次の式
    によって決定される請求項1記載のスペクトルの階層状
    ライブラリーを確立する方法。 C=(c1、c2、c3、……cN) ここで、 ci=SUM(pij/|Vj|) i=1,2,3,4……N j=1,2,3,4……M、 更に、Nはサンプリング点の数であり、pijは各点にお
    けるサンプルスペクトルの値であり、Mはライブラリー
    のベクトルの数であり、|Vj|は座標値pijの平方の和
    の平方根に等しいベクトルの大きさである。
  8. 【請求項8】工程(c)の平均ベクトル(C)が次の式
    によって決定される請求項2記載のスペクトルの階層状
    ライブラリーを確立する方法。 C=(c1、c2、c3、……cN) ここで、 ci=SUM(pij/|Vj|) i=1,2,3,4……N j=1,2,3,4……M、 更に、Nはサンプリング点の数であり、pijは各点にお
    けるサンプルスペクトルの値であり、Mはライブラリー
    のベクトルの数であり、|Vj|は座標値pijの平方の和
    の平方根に等しいベクトルの大きさである。
  9. 【請求項9】請求項1の方法により確立された階層的ラ
    イブラリーを利用して、未知のサンプルのスペクトルを
    同定する方法であって、 (a) 未知サンプルのスペクトルを、未知のサンプル
    の一点一点ごとの代表に対応する未知のベクトルに変換
    する工程と、 (b) 未知のベクトルと第1及び第2のベクトルとの
    間の類似性を決定する工程と、 (c) 未知のベクトルと、第1及び第2のベクトルの
    1つとより類似しているものと結合したサブグループの
    ベクトル集団の中心との間の類似性を決定する工程と、 (d) それぞれさらに結合するサブグループがなくな
    るまで、更に類似する高位のサブグループに結合してい
    る、サブグループのベクトルのそれぞれの続く対と未知
    のベクトルとの類似性を決定する工程であって、未知の
    スペクトルは比較される最も類似のベクトルによって定
    められる工程と、 を包含するスペクトル同定方法。
  10. 【請求項10】請求項3記載の階層的ライブラリーを利
    用して、未知のサンプルのスペクトルを同定する方法で
    あって、 (a) 未知サンプルのスペクトルを、未知のサンプル
    の一点一点ごとの代表に対応する未知のベクトルに変換
    する工程と、 (b) 未知のベクトルと第1及び第2のベクトルとの
    間の類似性を決定する工程と、 (c) 未知のベクトルと、第1及び第2のベクトルの
    1つとより類似しているものと結合したサブグループの
    集団ベクトルの中心との間の類似性を決定する工程と、 (d) それぞれさらに結合するサブグループがなくな
    るまで、更に類似する高位のサブグループに結合してい
    る、サブグループのベクトルのそれぞれの続く対と未知
    のベクトルとの類似性を決定する工程であって、未知の
    スペクトルは比較される最も類似のベクトルによって定
    められる工程と、 を包含するスペクトル同定方法。
  11. 【請求項11】ベクトルの類似性はベクトル間の内部生
    産物により決定され、工程(c)の平均ベクトル(C)
    は次の式によって決定される請求項1記載の方法により
    確率されたスペクトルの階層状ライブラリーを利用し
    て、未知のサンプルのスペクトルを同定する方法であっ
    て、次の式が C=(c1、c2、c3、……cN) ここで、 ci=SUM(pij/|Vj|) i=1,2,3,4……N j=1,2,3,4……M、 更に、Nはサンプリング点の数であり、pijは各点にお
    けるサンプルスペクトルの値であり、Mはライブラリー
    のベクトルの数であり、|Vj|は座標値pijの平方の和
    の平方根に等しいベクトルの大きさであり、 (a) 未知サンプルのスペクトルを、未知のサンプル
    の一点一点ごとの代表に対応する未知のベクトルに変換
    する工程と、 (b) 未知のベクトルと第1及び第2のベクトルとの
    間の類似性を決定する工程と、 (c) 未知のベクトルと、第1及び第2のベクトルの
    1つとより類似しているものと結合したサブグループの
    集団ベクトルの中心との間の類似性を決定する工程と、 (d) それぞれさらに結合するサブグループがなくな
    るまで、更に類似する高位のサブグループに結合してい
    る、サブグループのベクトルのそれぞれの続く対と未知
    のベクトルとの類似性を決定する工程であって、未知の
    スペクトルは比較される最も類似のベクトルによって定
    められる工程と、 を包含するスペクトル同定方法。
  12. 【請求項12】請求項1乃至5のいずれか1項に記載の
    方法によりコンピュータデータベース内に構成したスペ
    クトルの階層ライブラリを用いてサンプルのスペクトル
    を同定する方法において、 コンピュータプログラムの制御の下にプログラム可能な
    デジタルコンピュータで実施される以下の工程、即ち、 (a) 同定すべきサンプルのスペクトルを当該サンプ
    ルの画素表示に相当する表示ベクトルに変換する工程
    と、 (b) 表示ベクトルと第1のスペクトル・ベクトルと
    の類似度及び表示ベクトルと第2のスペクトル・ベクト
    ルとの類似性を判定する工程と、 (c) 第1のスペクトル・ベクトル又は第2のスペク
    トル・ベクトルのいずれか一方のより類似していスペク
    トル・ベクトルに関連しているサブグループの集団ベク
    トルの中心と表示ベクトルとの類似度を判定する工程
    と、 (d) 類似している側の高位のサブグループに関連し
    ている下位のサブグループのベクトル対と表示ベクトル
    との類似度の判定を次々に実施していって、関連したサ
    ブグループがなくなった時に得られる最も類似している
    スペクトル・ベクトルをサンプルのスペクトルと決定す
    る工程とを具備したスペクトル同定方法。
JP22729589A 1988-09-01 1989-09-01 スペクトル同定方法 Expired - Fee Related JP2719561B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/240,356 US4885697A (en) 1988-09-01 1988-09-01 Method of identifying spectra
US240.356 1988-09-01

Publications (2)

Publication Number Publication Date
JPH02269951A JPH02269951A (ja) 1990-11-05
JP2719561B2 true JP2719561B2 (ja) 1998-02-25

Family

ID=22906206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22729589A Expired - Fee Related JP2719561B2 (ja) 1988-09-01 1989-09-01 スペクトル同定方法

Country Status (11)

Country Link
US (1) US4885697A (ja)
EP (1) EP0357010B1 (ja)
JP (1) JP2719561B2 (ja)
AT (1) ATE145075T1 (ja)
AU (1) AU613236B2 (ja)
CA (1) CA1329850C (ja)
DE (1) DE68927428T2 (ja)
DK (1) DK431889A (ja)
GR (1) GR3022266T3 (ja)
IL (1) IL91483A0 (ja)
MX (1) MX165640B (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5614361A (en) * 1981-09-25 1997-03-25 Webster, Jr.; John A. Method for identifying and characterizing organisms
IL103935A0 (en) * 1991-12-04 1993-05-13 Du Pont Method for the identification of microorganisms by the utilization of directed and arbitrary dna amplification
US5400249A (en) * 1992-03-27 1995-03-21 University Of Iowa Research Foundation Apparatus for assessing relatedness from autoradiograms
US5311131A (en) * 1992-05-15 1994-05-10 Board Of Regents Of The University Of Washington Magnetic resonance imaging using pattern recognition
US5474663A (en) * 1993-08-27 1995-12-12 E. I. Du Pont De Nemours And Company Bowed framed membrane, processes for the preparation thereof, and uses therefor
US5433837A (en) * 1993-08-27 1995-07-18 E. I. Du Pont De Nemours And Company Gel cassette for enhanced electrophoretic separation and processes for the preparation thereof
JPH07218491A (ja) * 1994-01-31 1995-08-18 Shimadzu Corp クロマトグラフ用検出装置
US5625798A (en) * 1994-02-24 1997-04-29 Knc, Inc. Method and system extracting attribute information corresponding to components included in a computer aided design system drawing such as a process and instrumentation diagram
US5822219A (en) * 1996-05-13 1998-10-13 Foss Nirsystems, Inc. System for identifying materials by NIR spectrometry
DE69729733D1 (de) * 1996-09-16 2004-08-05 Syddansk Uni Odense M Verfahren und rechnerprogramm zur bildanalyse
US6085153A (en) * 1996-11-06 2000-07-04 Henry M. Jackson Foundation Differential spectral topographic analysis (DISTA)
US5798526A (en) * 1997-01-24 1998-08-25 Infrasoft International Llc Calibration system for spectrographic analyzing instruments
CN1289365A (zh) * 1998-02-03 2001-03-28 株式会社白寿生科学研究所 微生物检查方法和设备
US6131072A (en) * 1998-02-03 2000-10-10 Pe Applied Biosystems, A Division Of Perkin-Elmer Lane tracking system and method
US6356646B1 (en) 1999-02-19 2002-03-12 Clyde H. Spencer Method for creating thematic maps using segmentation of ternary diagrams
EP1191459A1 (en) * 2000-09-22 2002-03-27 Nightingale Technologies Ltd. Data clustering methods and applications
JP4020640B2 (ja) * 2000-12-28 2007-12-12 三洋電機株式会社 微生物識別方法および微生物識別装置
US7408636B2 (en) * 2002-10-31 2008-08-05 Chemimage Corporation Method and apparatus for dark field chemical imaging
US7214528B1 (en) * 2002-12-31 2007-05-08 Oregon Health & Sciences University Device for direct electrical detection of molecules and molecule-molecule interactions
US8269174B2 (en) * 2003-07-18 2012-09-18 Chemimage Corporation Method and apparatus for compact spectrometer for multipoint sampling of an object
US7440096B2 (en) * 2003-07-18 2008-10-21 Chemimage Corporation Method and apparatus for compact spectrometer for fiber array spectral translator
US7548310B2 (en) * 2003-07-18 2009-06-16 Chemimage Corporation Method and apparatus for compact spectrometer for multipoint sampling of an object
US7542138B2 (en) * 2003-07-18 2009-06-02 Chemimage Corporation Sample container and system for a handheld spectrometer and method for using therefor
US7286222B2 (en) * 2003-07-18 2007-10-23 Chemimage Corporation Sample container and system for a handheld spectrometer and method for using therefor
US7084972B2 (en) * 2003-07-18 2006-08-01 Chemimage Corporation Method and apparatus for compact dispersive imaging spectrometer
US7738095B2 (en) * 2003-07-18 2010-06-15 Chemimage Corporation Method and apparatus for compact spectrometer for detecting hazardous agents
JP2007523323A (ja) * 2004-01-30 2007-08-16 サイファージェン バイオシステムズ インコーポレイテッド スペクトルにおけるシグナルをクラスタにする方法
US7072770B1 (en) 2004-03-29 2006-07-04 Chemimage Corporation Method for identifying components of a mixture via spectral analysis
US20060023217A1 (en) * 2004-05-28 2006-02-02 Chemimage Corporation Method and apparatus for producing a mosaic image
US7394542B2 (en) 2004-08-18 2008-07-01 Chemimage Corporation Method and apparatus for chemical imaging in a microfluidic circuit
US7239383B2 (en) * 2004-06-30 2007-07-03 Chemimage Corporation Method and apparatus for spectral modulation compensation
US7286231B2 (en) * 2004-06-30 2007-10-23 Chemimage Corp. Method and apparatus for peak compensation in an optical filter
US20060170916A1 (en) * 2005-01-31 2006-08-03 Voigt Thomas C Method and apparatus for variable-field illumination
US7933430B2 (en) * 2005-04-15 2011-04-26 Chemimage Corporation Method and apparatus for spectral mixture resolution
US7330746B2 (en) * 2005-06-07 2008-02-12 Chem Image Corporation Non-invasive biochemical analysis
US7330747B2 (en) * 2005-06-07 2008-02-12 Chemimage Corporation Invasive chemometry
US8164061B2 (en) * 2006-09-13 2012-04-24 Delphi Technologies, Inc. Method and apparatus for a universal infrared analyzer
US7626696B2 (en) * 2007-08-07 2009-12-01 Chemimage Corporation Method and apparatus for reconfigurable field of view in a FAST-based imaging system
WO2009023857A1 (en) * 2007-08-15 2009-02-19 State Of Oregon By & Through The State Board Of Higher Education On Behalf Of Portland State Unv. Impedance spectroscopy of biomolecules using functionalized nanoparticles
KR100963797B1 (ko) * 2008-02-27 2010-06-17 아주대학교산학협력단 복잡성이 감소된 고분광 프로세싱에 기반을 둔 실시간 타겟검출 방법
DE102010006450B4 (de) * 2010-02-01 2019-03-28 Bruker Daltonik Gmbh Gestufte Suche nach Mikrobenspektren in Referenzbibiliotheken
CN103115884B (zh) * 2013-01-29 2014-12-17 广西工学院 一种化妆品中对羟基苯甲酸酯的测定方法
CN105023025B (zh) * 2015-08-03 2018-09-25 大连海事大学 一种开集痕迹图像分类方法及系统
JP7124648B2 (ja) * 2018-11-06 2022-08-24 株式会社島津製作所 データ処理装置及びデータ処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4318184A (en) * 1978-09-05 1982-03-02 Millett Ronald P Information storage and retrieval system and method
US4365303A (en) * 1980-02-07 1982-12-21 The Perkin-Elmer Corporation Method and apparatus for determining the nature of an unknown chemical substance
US4717653A (en) * 1981-09-25 1988-01-05 Webster John A Jr Method for identifying and characterizing organisms
US4753878A (en) * 1981-10-01 1988-06-28 Amb Systems Corp. Microorganism identification technique
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
JPS59173883A (ja) * 1983-03-22 1984-10-02 Matsushita Electric Ind Co Ltd パタ−ン比較装置
JPS59172084A (ja) * 1983-03-22 1984-09-28 Toshiba Corp パタ−ン認識装置
JPS60107554A (ja) * 1983-11-16 1985-06-13 Ube Ind Ltd 未知物質の化学構造を決定する方法および装置
US4642778A (en) * 1984-03-02 1987-02-10 Indiana University Foundation Method and device for spectral reconstruction
US4766551A (en) * 1986-09-22 1988-08-23 Pacific Scientific Company Method of comparing spectra to identify similar materials
JPH01140229A (ja) * 1987-11-26 1989-06-01 Fujitsu Ltd 複数配列同時比較方法

Also Published As

Publication number Publication date
ATE145075T1 (de) 1996-11-15
DE68927428T2 (de) 1997-03-06
MX165640B (es) 1992-11-25
IL91483A0 (en) 1990-04-29
EP0357010B1 (en) 1996-11-06
JPH02269951A (ja) 1990-11-05
AU4097289A (en) 1990-03-08
EP0357010A3 (en) 1991-09-18
EP0357010A2 (en) 1990-03-07
DE68927428D1 (de) 1996-12-12
GR3022266T3 (en) 1997-04-30
DK431889A (da) 1990-03-02
US4885697A (en) 1989-12-05
DK431889D0 (da) 1989-08-31
AU613236B2 (en) 1991-07-25
CA1329850C (en) 1994-05-24

Similar Documents

Publication Publication Date Title
JP2719561B2 (ja) スペクトル同定方法
US5365455A (en) Method and apparatus for automatic nucleic acid sequence determination
US5853979A (en) Method and system for DNA sequence determination and mutation detection with reference to a standard
EP1012749B1 (en) Alignment-based similarity scoring methods for quantifying the differences between related biopolymer sequences
US6681186B1 (en) System and method for improving the accuracy of DNA sequencing and error probability estimation through application of a mathematical model to the analysis of electropherograms
US5073963A (en) Computerized method of matching two-dimensional (2-d) patterns
AU6346100A (en) Method and system for organizing data
Heersma et al. Computer analysis of IS 6110 RFLP patterns of Mycobacterium tuberculosis
US20030143554A1 (en) Method of genotyping by determination of allele copy number
JP2003500663A (ja) 実験データの正規化のための方法
US5400249A (en) Apparatus for assessing relatedness from autoradiograms
CN108710784A (zh) 一种基因转录变异几率及变异方向的算法
Rodwell The Protein Fingerprints of Mycoplasmas. The Emmy Klieneberger-Nobel Award Lecture
CN108182348B (zh) 基于种子序列信息的dna甲基化数据检测方法及其装置
Vauterin et al. Integrated databasing and analysis
JP4461240B2 (ja) 遺伝子発現プロファイル検索装置、遺伝子発現プロファイル検索方法およびプログラム
JPH1040257A (ja) 文字配列比較方法、およびそれを用いたアセンブル方法
EP1131765B1 (en) Dna marker profile data analysis
CN118116459A (zh) 基于模糊查找与精确匹配相结合的二代测序数据分析装置、方法及计算机可读存储介质
Craine et al. A Digital Optically Multiplexed Charge Coupled Device (CCD) Based Deoxyribonucleic Acid (DNA) Sequence Reader
JPS6118876A (ja) オ−トラジオグラフイ−における信号処理法
Xu et al. Automatic interpretation of digital autoradiograph of DNA sequencing gels
JP2005250615A (ja) 遺伝子解析支援システム
Schomer The application of polynomial spatial warping to effect global image rectification for the direct comparison of 165 rRNA oligonucleotide signatures
Cantor et al. The future of DNA sequencing: methods and applications

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees