JPH10272000A - コンピュータを利用した生物学的配列の解析技術 - Google Patents
コンピュータを利用した生物学的配列の解析技術Info
- Publication number
- JPH10272000A JPH10272000A JP9369833A JP36983397A JPH10272000A JP H10272000 A JPH10272000 A JP H10272000A JP 9369833 A JP9369833 A JP 9369833A JP 36983397 A JP36983397 A JP 36983397A JP H10272000 A JPH10272000 A JP H10272000A
- Authority
- JP
- Japan
- Prior art keywords
- base
- probe
- nucleic acid
- acid sequence
- hybridization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 123
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 62
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 52
- 239000000523 sample Substances 0.000 claims description 287
- 238000009396 hybridization Methods 0.000 claims description 150
- 230000014509 gene expression Effects 0.000 claims description 116
- 108090000623 proteins and genes Proteins 0.000 claims description 114
- 230000008859 change Effects 0.000 claims description 33
- 230000000295 complement effect Effects 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 23
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 18
- 239000002853 nucleic acid probe Substances 0.000 claims description 18
- 239000012491 analyte Substances 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 12
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims 2
- 238000013461 design Methods 0.000 abstract description 10
- 108020004707 nucleic acids Proteins 0.000 abstract description 10
- 102000039446 nucleic acids Human genes 0.000 abstract description 10
- 210000004027 cell Anatomy 0.000 description 52
- 238000002474 experimental method Methods 0.000 description 41
- 230000035772 mutation Effects 0.000 description 28
- 238000012545 processing Methods 0.000 description 28
- 239000000758 substrate Substances 0.000 description 21
- 230000015572 biosynthetic process Effects 0.000 description 16
- 239000002773 nucleotide Substances 0.000 description 14
- 125000003729 nucleotide group Chemical group 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 11
- 239000002131 composite material Substances 0.000 description 9
- 239000013074 reference sample Substances 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000011835 investigation Methods 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 239000003298 DNA probe Substances 0.000 description 2
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 210000003771 C cell Anatomy 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 206010011831 Cytomegalovirus infection Diseases 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 206010015108 Epstein-Barr virus infection Diseases 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 208000009608 Papillomavirus Infections Diseases 0.000 description 1
- 208000008071 Parvoviridae Infections Diseases 0.000 description 1
- 206010057343 Parvovirus infection Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108020005093 RNA Precursors Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 241001158692 Sonoma Species 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 208000021145 human papilloma virus infection Diseases 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 201000006747 infectious mononucleosis Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000003223 protective agent Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1429—Signal processing
- G01N15/1433—Signal processing using image recognition
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
コンピュータ支援技術を提供する。 【解決手段】 コンピュータシステムは、核酸プローブ
と検体核酸配列との間のハイブリッド形成親和性を示す
ハイブリッド形成強度を解析して、検体配列における塩
基を呼び出す(塩基コールを行う)。複数の塩基コール
を組み合わせることにより、単一の塩基コールを形成す
る。また、コンピュータシステムは、ハイブリッド形成
強度を解析することによって、遺伝子発現を監視した
り、あるいは、基準からの遺伝子発現の変化を監視した
りする。
Description
テムの分野に関する。更に詳しくは、本発明は、核酸配
列等の生物学的配列を解析するためのコンピュータシス
テムに関する。
し、利用するための装置やコンピュータシステムが知ら
れている。例えば、本明細書に組み込まれるPCT出願
WO92/10588には、核酸等の物質の配列を決定
し、あるいは、その配列をチェックする手法が述べられ
ている。このような操作を実行するための配列(アレ
イ)は、本明細書に組み込まれる米国特許第5,14
3,854号および米国特許出願第08/249,18
8号に開示されているパイオニア的手法等の方法に従っ
て形成される。
て、核酸プローブの配列(アレイ)を、基質あるいはチ
ップ上の既知の位置に形成する。次に、蛍光標識された
核酸をチップに接触させて、標識された核酸がチップに
結合している位置を示すイメージファイル(イメージフ
ァイルは処理されてセルファイルになる)をスキャナー
で生成する。このセルファイルと所定の位置におけるプ
ローブの強度とに基づいて、DNAあるいはRNAのモ
ノマー配列のような情報を得ることが可能になる。この
ようなシステムを用いることにより、例えば、膵嚢胞性
線維症に関係する突然変異、(所定の癌に関係する)P
53遺伝子、HIV等の遺伝子特性の研究および検出に
利用可能なDNAの配列(アレイ)が形成される。
る米国特許出願第08/531,137号(代理人事件
番号16528X−008210)、第08/528,
656号(代理人事件番号16528X−01760
0)、および、第08/618,834号(代理人事件
番号16528−016400)に、塩基呼び出しを行
うための革新的なコンピュータ利用技術が開示されてい
る。しかし、これらのパイオニア的手法によって現在利
用され、また、利用可能になっている膨大な量の情報を
評価・解析処理するためには、更に、コンピュータシス
テムおよび方法を改良することが必要となる。
ュータ利用技術の改良も必要である。多くの病態は、遺
伝子DNAの複製回数の変化あるいは所定の遺伝子の
(例えば、開始、RNA前駆体の供給、RNAプロセッ
シング等の制御による)転写レベルの変化に起因する種
々の遺伝子の発現レベルにおける相違によって特徴づけ
ることができる。例えば、遺伝物質の損失および獲得
は、悪性の形態変換及び進行に重要な役割を果たす。ま
た、(例えば、腫瘍遺伝子あるいは腫瘍抑制遺伝子等
の)所定の遺伝子の発現(転写)レベルの変化は、種々
の癌の存在および進行を示す指標として働く。
定の遺伝子の転写レベルの変化によって特徴づけられ
る。例えば、ウィルス感染は、所定のウィルスの遺伝子
の発現増強によって特徴づけられることが多い。例え
ば、単純ヘルペスウィルス感染、(伝染性単核症等の)
エプスタイン−バールウィルス感染、サイトメガロウィ
ルス感染、水痘−帯状ヘルペスウィルス感染、パルボウ
ィルス感染、ヒトパピローマウィルス感染等の発生は、
すべて、それぞれのウィルスに存在する種々の遺伝子の
発現増強によって特徴づけられる。特徴的なウィルス遺
伝子の増強発現レベルを検出することによって、その病
態を効果的に診断することが可能になる。特に、単純ヘ
ルペスウィルス等のウィルスは、長い潜伏期間を経て、
突然、短い時間で、爆発的に複製される。特徴的なウィ
ルス遺伝子の発現レベルを検出することによって、この
ような活動的な増殖(おそらくは、その結果としての感
染)状態を検出することが可能になる。
発明は、核酸配列等の生物学的配列(生体配列)を解析
するための革新的なシステムおよび方法を提供する。コ
ンピュータシステムは、検体配列における塩基を呼び出
すために、核酸プローブと検体の核酸配列とのハイブリ
ッド形成親和性を示すハイブリッド形成強度を解析する
ことができる。複数の塩基コールは、単一の塩基コール
を形成するために組み合わせるようにしてもよい。更
に、コンピュータシステムは、遺伝子発現、あるいは、
基準(基線)と比較された遺伝子発現の変化を監視する
ために、ハイブリッド形成強度を解析するようにしても
よい。
における未知の塩基を呼び出すためのコンピュータによ
る方法は、複数組の核酸プローブに関するハイブリッド
形成強度であって、それぞれ核酸プローブと前記検体の
核酸配列との間のハイブリッド形成親和性を示すハイブ
リッド形成強度を受け取る工程と、各組のプローブに関
して前記未知の塩基に対する塩基コールを演算する工程
と、前記複数組のプローブに関して最も発生頻度の高い
前記未知の塩基に対する塩基コールに従って、前記複数
組のプローブに関する単一の塩基コールを演算する工程
と、を備える。典型的には、この単一塩基コールがスク
リーンディスプレイ上に表示され、ユーザは、この単一
塩基コールの由来である複数の塩基コールを表示するか
あるいは表示しないかを選択できる。
による塩基呼び出し処理に関するパラメータを動的に変
更する方法は、ユーザによって変更可能なパラメータを
含む前記塩基呼び出し処理を利用して、検体の核酸配列
の少なくとも一部に関する複数の塩基コールを生成する
工程と、前記検体の核酸配列の少なくとも一部に関する
前記複数の塩基コールを表示する工程と、前記塩基呼び
出し処理のパラメータを表示する工程と、前記塩基呼び
出し処理のパラメータに対する新しい値を特定する入力
をユーザーから受け取る工程と、前記塩基呼び出し処理
と前記パラメータに対する新しい値とを用いて、前記検
体の核酸配列の少なくとも一部に対する更新された塩基
コールを生成する工程と、前記検体の核酸配列の少なく
とも一部に対する前記更新された塩基コールを表示する
工程と、を備える。典型的には、ユーザーによって変更
可能なパラメータは、定数、閾値、または、範囲であ
る。
酸配列において遺伝子の発現を監視するコンピュータに
よる方法は、前記遺伝子に対して完全に相補的である完
全対合プローブ(パーフェクトマッチプローブ)と前記
遺伝子に対して不対合な塩基を少なくとも一つ備える不
対合プローブ(ミスマッチプローブ)との複数のプロー
ブ対に関する複数のハイブリッド形成強度であって、前
記完全対合および不対合プローブと前記検体の核酸配列
との間のハイブリッド形成親和性を示すハイブリッド形
成強度を入力する工程と、各対の完全対合プローブと不
対合プローブのハイブリッド形成強度を比較する工程
と、前記検体の核酸配列の遺伝子発現コールを生成する
工程と、を備える。好ましい実施例においては、発現コ
ールは、発現している、どちらともいえない、または、
発現していない、として示される。
列において遺伝子の発現変化を監視するコンピュータに
よる方法は、前記遺伝子に対して完全に相補的である完
全対合プローブと前記遺伝子に対して不対合な塩基を少
なくとも一つ備える不対合プローブとの複数のプローブ
対に関する複数のハイブリッド形成強度であって、前記
完全対合および不対合プローブと前記検体の核酸配列と
の間のハイブリッド形成親和性を示すハイブリッド形成
強度を入力する工程と、前記検体の核酸配列の遺伝子発
現レベルを生成するために、各対の完全対合プローブと
不対合プローブのハイブリッド形成強度を比較する工程
と、前記遺伝子発現レベルを、基準の遺伝子発現レベル
と比較することにより発現変化を決定する工程と、を備
える。発現の変化を、ディスプレイスクリーン上にグラ
フとして表示するようにしてもよい。
に、以下に、図面に基づいて、本発明を詳細に説明す
る。
し(即ち、塩基を呼び出し)、遺伝子発現を監視するた
めの革新的な方法を提供する。以下に、本発明の好適な
実施例を説明する。但し、以下の実施例は、例示に過ぎ
ず、発明の範囲を限定するものではない。
ために用いられるコンピュータシステムの例を示す。図
1に示すコンピュータシステム1は、モニタ3、スクリ
ーン5、キャビネット7、キーボード9、および、マウ
ス11を備える。マウス11は、マウスボタン13等の
一つあるいは複数のボタンを有する。キャビネット7に
は、本発明のコンピュータコードを含むソフトウェアプ
ログラムを記憶して検索するために用いられるCD−R
OMドライブ15及び(図示しない)ハードドライブが
収容されている。この実施例では、CD−ROM17が
コンピュータ読み取り可能な媒体として示されている
が、フロッピーディスク、DRAM、ハードドライブ、
フラッシュメモリ、テープ等、他のコンピュータ読み取
り可能な媒体を用いることもできる。キャビネット7に
は、更に、プロセッサ、メモリ等の(図示しない)周知
のコンピュータ構成部品が収容されている。
ために用いられるコンピュータシステム1を示すシステ
ムブロック図である。図1に示すように、コンピュータ
システム1は、モニタ3とキーボード9を備える。コン
ピュータシステム1は、更に、中央処理装置50、シス
テムメモリ52、入出力制御装置54、ディスプレイア
ダプタ56、リムーバブルディスク58、固定ディスク
60、ネットワークインターフェース62、スピーカ6
4等のサブシステムを備える。リムーバブルディスク5
8は、フロッピー、テープ、CD−ROM、可動ハード
ドライブ、フラッシュメモリ等の取り外し可能なコンピ
ュータ読み取り可能な媒体を示す。また、固定ディスク
60は、内蔵ハードドライブ等を示す。更に、コンピュ
ータシステムに、本発明の実現に適した他のサブシステ
ムを備えるようにしてもよい。例えば、コンピュータシ
ステムに2つ以上の処理装置50を備えるようにしても
よいし(即ち、マルチプロセッサシステム)、メモリキ
ャッシュを備えるようにしてもよい。
のシステムバス・アーキテクチャを示す。但し、この矢
印は、サブシステムを連結するあらゆる結合スキームを
示すものである。例えば、ディスプレイアダプタ56が
ローカルバスを介して中央処理装置50に接続されるよ
うにすることもできるし、あるいは、システムがメモリ
キャッシュを備えるようにすることもできる。図2に示
されるコンピュータシステム1は、本発明の実現に適し
たコンピュータシステムの一例に過ぎず、当業者に周知
のように、サブシステムの他の構成において本発明を実
現することも可能である。コンピュータシステムの一例
として、サン・マイクロシステムズ社のワークステーシ
ョンを用いることもできる。
なチップ上に、非常に大きなオリゴヌクレオチドプロー
ブの配列(アレイ)を形成するための方法である。詳細
は、本明細書に組み込まれる米国特許第5,143,8
54号およびPCT特許公報WO90/15070およ
び92/10092を参照のこと。チップ上のオリゴヌ
クレオチドプローブを用いて、対象となる検体核酸(以
下、「標的」核酸)の相補的核酸配列を検出する。
ローブを含むチップに関してハイブリッド形成強度ファ
イルを解析する方法を提供する。本実施例において、こ
のファイルは、生物学的配列から得られる蛍光データを
表しているが、放射性強度データ等の他のデータを表す
ようにしてもよい。即ち、本発明は、ハイブリッド形成
の蛍光測定値の解析に限定されるものではなく、ハイブ
リッド形成の他の測定値の解析にも容易に適用可能であ
る。
上でプローブを合成し、核酸を標識して、ハイブリッド
形成された核酸プローブを走査するコンピュータシステ
ムの一部として説明する。このようなシステムは、本明
細書に組み込まれる米国特許出願第08/249,18
8号に詳細に説明されている。但し、本発明は、例えば
遠隔位置に置かれたシステムによって生成されるデータ
を解析するために、全体システムとは独立に利用するこ
とも可能である。
列(アレイ)を形成し、解析するコンピュータ化された
システムを示す。コンピュータ100は、RNAあるい
はDNA等の生体高分子の配列(アレイ)を設計するた
めに用いられる。ここで、コンピュータ100は、図1
及び図2に示すように、例えば、適当なメモリとCPU
を備え、ウィンドウズNT環境下にある適当にプログラ
ムされたIBMパーソナルコンピュータ互換機である。
コンピュータシステム100には、対象となる遺伝子の
特性に関するユーザーからの情報、および、その配列
(アレイ)の所望の特性に関する情報が入力される。あ
るいは、GenBank等の外部あるいは内部データベ
ース102から、対象となる所定の遺伝子配列に関する
情報を入力するようにしてもよい。コンピュータシステ
ム100は、PCT出願WO92/10092に記載さ
れているような転換行列の形で一組のチップ設計コンピ
ュータファイル104および他の関連コンピュータファ
イルを出力する。
列の形成に用いられるリソグラフィックマスクを設計す
るためのシステム106に与えられる。システムあるい
はプロセス106が、マスク110の製造に必要なハー
ドウェア、および、効率よくマスク上にマスクパターン
を配置するために必要なコンピュータハードウェア並び
にソフトウェア108を備えるようにしてもよい。図3
の他の特性と同様に、このような構成要素を物理的に同
一の位置に配置させてもさせなくてもよいが、図示の便
宜上、図3では同じところに表示している。システム1
06は、マスク110、あるいは、クロム−ガラスマス
ク等、高分子配列(アレイ)の形成に用いられる他の合
成パターンを生成する。
よびシステム100から入力されるチップ設計に関する
所定の情報が用いられる。合成システム112は、基質
あるいはチップ114上に高分子配列(アレイ)を形成
するために必要なハードウェアおよびソフトウェアを備
える。例えば、合成装置112は、光源116および基
質あるいはチップ114が載置される化学フローセル1
18を備える。マスク110を光源と基質/チップとの
間に置いて、チップの所定領域から保護剤を除去するた
めに、適当な回数、基質とマスクとの間を相対的に並進
させる。所定の薬剤をフローセル118から流して、保
護除去された領域への結合、および、洗浄等の操作を行
う。このような操作は、全て、適当にプログラムされた
コンピュータ119によって実行される構成が望まし
い。ここで、コンピュータ119は、マスク設計及びマ
スク形成に用いられたコンピュータと同じコンピュータ
でも違うものでもよい。
質をより小さなチップに分割して、マークされた標的に
曝すようにしてもよい。ここで、標的は、基質上の一つ
あるいは複数の分子に対して相補的であってもよく、あ
るいはそうでなくてもよい。また、標的は、(図3に*
印で示す)蛍光標識等の標識でマークされ、走査システ
ム120内に配置される。走査システム120は、適当
にプログラムされたデジタルコンピュータ122によっ
て制御される。このデジタルコンピュータ122も、合
成、マスク形成、およびマスク設計に用いられたコンピ
ュータと同じコンピュータでも違うものでもよい。スキ
ャナ120は、標識された標的(*)が基質に結合した
位置を検出するために用いられる共焦顕微鏡あるいはC
CD(電荷結合素子)等の検出装置124を備える。ス
キャナ120は、蛍光標識された標的の場合には、基質
上の位置の関数として蛍光強度(フォトン数あるいは電
圧のような他の関係する測定値)を示すイメージファイ
ル124を出力する。標識された標的が高分子配列(ア
レイ)とより強固に結合している部分ではフォトン数が
大きくなり、また、基質上の高分子中のモノマー配列は
位置の関数として既知であるため、標的と相補的な基質
上の高分子の配列を決定することができる。
化および解析方法を組み込んだ解析システム126に入
力される。この解析システムも種々のコンピュータシス
テムのいずれでもよい。本発明は、チップ設計ファイル
およびイメージファイルを解析して、適当な出力128
を与える様々な方法を提供する。また、本発明を用い
て、DNAあるいはRNA等の標的における所定の突然
変異を同定するようにしてもよい。
体的なソフトウェアシステムの概要を示す。図4に示さ
れるように、システムは、まず、ステップ202で、所
定の解析の対象となる遺伝子配列、即ち、標的を同定す
る。対象となる配列は、例えば、遺伝子の正常部分ある
いは突然変異部分、遺伝を決定づけるあるいは修辞的情
報を与える遺伝子等である。テキストファイルの手動入
力によって配列を選択してもよいし、あるいは、Gen
Bank等の外部資源から選択するようにしてもよい。
ステップ204では、システムが遺伝子の評価を行うこ
とにより、チップ上でどのプローブが望ましいかを決定
し、あるいは、ユーザーが決定するための情報を与え、
チップ上でのプローブの適当な「レイアウト」を求め
る。
核酸配列に対して相補的なプローブを備える。野生型プ
ローブは、参照配列(標準配列)と理想的にハイブリッ
ド形成するプローブであり、野生型遺伝子(チップ野生
型とも称される)は、従って、チップ上の野生型プロー
ブと理想的にハイブリッド形成する。標的配列は、突然
変異、挿入、欠失等の存在を除いては、参照配列とほぼ
同じである。このレイアウトは、遺伝配列の「読み込
み」及び/あるいは周縁効果の最小化、合成の容易さ等
を可能にするチップ上の構成を含む所望の特性を実現す
るものである。
す。チップ114は、複数のユニットから成り、各ユニ
ットには、一つの野生型配列あるいは複数の野生型配列
が様々な配置で並べられている。図にはユニット1の詳
細を示してあるが、このように、各ユニットは、プロー
ブを含むチップ上の領域である複数のセルから形成され
ている。各ユニットは、複数組の関連するセルを含む。
ここで、セルは、一つあるいは複数の分子(例えば、核
酸プローブ)の多くの複製を含む基質上の領域を意味す
る。
配置された複数のセルから成る。例えば、5つの関連セ
ルから成る組には、野生型セル220、「突然変異」セ
ル222、「ブランク」セル224が含まれる。セル2
20は、野生型配列の一部の補体である野生型プローブ
を含む。セル222は、野生型配列に対する「突然変
異」プローブを含む。例えば、野生型プローブが3'−
ACGT である場合、3'−ACAT 、3'−ACCT
、3'−ACGT 、および、3'−ACTT は「突然
変異」プローブである。セル224は、プローブを含ま
ない「ブランク」セルである(「ブランク」プローブと
も称される)。ブランクセルにはプローブが含まれない
ため、標識された標的はこの領域でチップに結合しな
い。このため、ブランクセルの領域を用いて、バックグ
ラウンド強度の測定が行われる。
のマスクが設計される。ステップ208では、ソフトウ
ェアがマスク設計およびレイアウト情報を利用すること
により、DNA等の高分子チップが形成される。このソ
フトウェア208は、基質とマスクとの相対的な並進、
所望の薬剤のフローセル内における流れ、フローセル内
の合成温度等のパラメータを制御する。ステップ210
では、他のソフトウェアを用いて、以上のようにして合
成され、標識された標的に曝されたチップを走査する。
ソフトウェアは、チップの走査を制御して、後に配列情
報を得るために用いられるファイルに得られたデータを
格納する。
は、レイアウト情報と蛍光情報とを用いて、チップ上で
ハイブリッド形成された核酸プローブの評価を行う。D
NAチップから得られる重要な情報としては、突然変異
標的の同定、及び、特定の標的の遺伝子配列の決定が挙
げられる。
ブ114の配列(アレイ)に結合している状態を示す。
この簡単な例に示されるように、配列中に以下のプロー
ブが形成される(野生型プローブに関しては一つのプロ
ーブだけが示されている)。
塩基のみが異なっている。即ち、調査位置において単一
の塩基不対合が存在する。従って、核酸配列中のこの調
査位置における塩基を同定するように、プローブが設計
される。即ち、ここでは、1つのユニットとは、複数組
の関連するプローブのことを言い、各組には、調査位置
における単一の塩基不対合が異なる複数のプローブが含
まれる。
標識された(あるいは別の方法でマークされた)標的を
DNAプローブの配列(アレイ)に曝した場合、これ
は、3'−AGAACGT プローブのみに相補的であ
り、フルオレセインは、 3'−AGAACGTが位置す
るチップ表面上で主に観察される。一つの塩基のみがそ
れぞれ異なる各組のプローブに関するイメージファイル
には、各々プローブに対応する4つの蛍光強度が含まれ
る。即ち、蛍光強度は、各々、他のプローブとは異なる
各プローブのヌクレオチドあるいは塩基に結びつけられ
る。更に、イメージファイルには、バックグラウンドの
蛍光強度として用いられる「ブランク」セルが含まれ
る。特定の塩基位置に関する5つの蛍光強度を解析する
ことにより、ここに開示される本発明の方法を用いて、
このような配列(アレイ)から配列(シーケンス)情報
を得ることができる。
ブを示す。参照配列(即ち野生型チップの配列)を下つ
きの数字で示された5つの調査位置と共に示す。調査位
置は、多くの場合、標的配列が突然変異を含む、即ち、
標的配列が参照配列と異なっているような、参照配列中
の塩基位置である。チップには、それぞれの調査位置に
対応する5つのプローブセルが含まれる。プローブセル
には、各々、調査位置に共通の塩基を有するプローブの
組が含まれる。例えば、参照配列は、第一の調査位置I
1 に塩基Tを有する。この調査位置に関する野生型のプ
ローブは、 3'−TGACであり、プローブ中の塩基A
は、参照配列における調査位置の塩基に対して相補的で
ある。
の「突然変異」プローブセルが存在する。4つの突然変
異プローブは、それぞれ、3'−TGAC 、3'−TG
CC、3'−TGGC 、3'−TGTC である。4つの
突然変異プローブは、それぞれ調査位置において一つの
塩基のみが異なっている。図示するように、野生型のプ
ローブと突然変異プローブはチップ上に列配置されてい
る。突然変異プローブのうちの一つ(この場合には、
3'−TGAC )は、野生型のプローブと等しいため、
突然変異を証明するものとはならない。但し、図8に示
すように、冗長性により突然変異を視覚的に示すことが
できる。
置I2 −I5 の各々に関しても、野生型プローブと突然
変異プローブを有している。それぞれの場合において、
野生型プローブは突然変異プローブの一つと等価であ
る。
とのハイブリッド形成パターンを示している。比較のた
めに、チップの一番上に参照配列を示している。チップ
には、WT列(野生型)、A列、C列、G列、T(また
はU)列が含まれる。各列は、プローブを含むセル列で
ある。WT列のセルは、参照配列に相補的なプローブを
含む。A列、C列、G列、T列のセルは、それぞれ、列
の名称となっている塩基が調査位置に存在することを除
けば参照配列に対して相補的であるプローブを含んでい
る。
ハイブリッド形成は、標識された標的配列の結合に起因
するセルの蛍光強度(例えば、フォトン数)によって決
定される。蛍光強度はセルによって大きく異なる。単純
化するために、図8では、領域を塗りつぶすことによっ
て、セルが高度のハイブリッド形成をしていることを示
す。WT列を観察すると、調査位置I4 において野生型
セルの領域が塗りつぶされていないため、この位置I4
に突然変異が存在することが容易にわかる。C列のセル
は塗りつぶされているため、TからGへの突然変異であ
ることがわかる(突然変異プローブは相補的であるた
め、CセルはG突然変異を示す)。好ましい実施例で
は、WT列は利用されず、調査位置の塩基を呼び出すた
めに、(「ブランク」セルを含まない)4つのセルが使
用される。
傍のセルの蛍光強度は相対的に低く、突然変異の周囲は
「暗い領域」となる。このように蛍光強度が低くなるの
は、突然変異近辺の調査位置のセルは、標的配列と完全
に相補的なプローブを含んでおらず、その結果、これら
のプローブと標的配列とのハイブリッド形成率が低いか
らである。例えば、調査位置I3 及びI5 において、そ
れらの位置に存在するプローブはどれも標的配列に相補
的でないため、セルの相対的強度が比較的低くなる。蛍
光強度が低いとデータの解像度も低くなるが、本発明の
方法を用いることによって、突然変異周囲の暗い領域で
も精度よく塩基を呼び出すことができ、暗い領域内に存
在する他の突然変異を同定することができる。
及び代替タイル構造を示す。図示するように、チップに
は12のユニット(ユニット1-12)が含まれている。ユ
ニット1-4 は、同一の参照配列に相補的なプローブを含
むようにタイル状に構成されている(即ち、チップ上で
設計され、合成されている)。以下、このユニットグル
ープを標準グループと称する。本発明では、他に明記し
ない限り、標的配列に関する塩基コールには標準グルー
プが用いられる。
とは異なった同一の参照配列に相補的であるプローブを
含むようにタイル状に構成される。以下、このユニット
グループを代替グループと称する。ユニット9-12は、標
準グループ及び第一の代替グループの参照配列とは異な
った参照配列に基づく別の代替グループを構成してい
る。これらの参照配列は、互いに異なってはいるが、多
くの場合、かなり似ている。例えば、参照配列を、少し
ずつ異なったHIVの突然変異としてもよい。本発明の
実施例は、標的配列の塩基コールには通常用いられない
ような参照配列に基づくタイル構成からの情報を評価
し、利用する。
プローブを備えるようにしてもよいし、異なった構造の
プローブを備えるようにしてもよいし、あるいは、一つ
または複数の別のチップに由来するプローブを備えるよ
うにしてもよい。例えば、1つのユニットが、プローブ
の第三位置に調査位置を有する5量体プローブを備える
ようにしてもよい。また、別のユニットが、第六位置に
調査位置を有する10量体プローブを備えるようにして
もよい。更に、これらのユニットを同一のチップ上に配
置してもよいし、異なったチップ上に配置してもよい。
の各ブロックには、通常、A、C、G、Tで示される4
つのセルが含まれる。セル内の各プローブの調査位置に
どの塩基があるかを、この塩基表示によって示してい
る。各セルには、普通、何百、何千という同一の核酸プ
ローブが存在する。
って、順番に互いに隣接して配置されているが、チップ
上での位置さえ確定されている限り、特定の位置にセル
を配置しなければならないという決まりはない。更に、
実験を首尾一貫したものにするためには、単一のチップ
上で異なったグループを合成することが望ましいが、本
発明の方法を、異なったチップ上の異なった構成から得
られるデータに適用することもできる。
表示する画面である。解析が行われる場合、システムに
は、ハイブリッド形成されたチップを走査した画像を含
むイメージファイルが入力される。ここで、イメージフ
ァイルが、蛍光強度と、標識された標的核酸配列あるい
はその切片がチップに結合する位置を示すようにする構
成も望ましい。
0には、周知のウィンドウ用GUI(グラフィカルユー
ザーインターフェース)が用いられている。ユーザーの
選択に従って、イメージファイルが表示される。ユーザ
ーがイメージファイルの表示を選択すると、イメージフ
ァイルを含むウィンドウ262が表示される。図示され
ているイメージファイルには、A列、C列、G列、T列
の複数の列が含まれる。
ル上にカーソルを動かすと、ステータスバー264に、
カーソルのX、Y座標の位置とその位置における蛍光強
度が示される。また、ポインティング・デバイスを用い
て、イメージファイルの矩形の領域を選択することによ
り、サブイメージを処理することも可能である。例え
ば、サブイメージを拡大して、個々のセルがもっとはっ
きりと見えるようにすることもできる。更に、強度のコ
ントラストを調整することによって、現在のコントラス
トの設定でははっきりしないハイブリッド形成強度の差
異を明確にすることもできる。
ド形成強度に基づいて塩基呼び出し処理を行う方法を示
すフローチャートである。ここで、「関連するプロー
ブ」とは、調査位置におけるヌクレオチド塩基が異なる
プローブを示す。通常、これらのプローブは調査位置を
除いて同一の構成をしているが、更に、別の塩基位置で
も異なる構成にしてもよい。即ち、関連するプローブで
は、少なくとも一つの塩基が異なっている。
度、即ち「ブランク」セル強度を差し引くことによっ
て、4つの関連するプローブのハイブリッド形成強度を
調整する。引き算の結果ハイブリッド形成強度がゼロ以
下になる場合には、小さな正の数をハイブリッド形成強
度に設定することが望ましい。このように設定すること
により、以降の計算で、ゼロあるいは負の数での割り算
を避けることができる。
度を強度順に並べる。次に、ステップ306で、最大強
度を、所定のバックグラウンド差分限界値と比較する。
バックグラウンド差分限界値は、未知の塩基を正しく呼
び出すために、最高強度を有するプローブが超えなけれ
ばならないハイブリッド形成強度を示す数値である。即
ち、バックグラウンド調整後の塩基強度は、バックグラ
ウンド差分限界値より大きくなければならない。そうで
ない場合には、未知の塩基を正確に呼び出すことができ
なくなる可能性がある。
形成強度がバックグラウンド差分限界値以下の場合に
は、ステップ308で、(不十分な強度を示す)コード
Nを未知の塩基に割り当てる。そうでない場合には、ス
テップ310で、最高のハイブリッド形成強度と二番目
に高いハイブリッド形成強度との比を計算する。
で計算した比を、所定の比限界値と比較する。比限界値
は、未知の塩基を同定するために必要な比を示す数値で
ある。好ましい実施例においては、比限界値は1.2で
ある。計算された比が比限界値より大きければ、最高の
ハイブリッド形成強度を有するプローブに従って、未知
の塩基が呼び出される。具体的には、ステップ314
で、最高強度のプローブ内の調査位置における塩基の補
体を未知の塩基として呼び出す。一方、計算された比が
比限界値以下である場合には、ステップ316で、二番
目に高いハイブリッド形成強度と三番目に高いハイブリ
ッド形成強度との比を計算する。
で計算した比を比限界値と比較する。計算された比が比
限界値より大きい場合には、ステップ320で、一番目
と二番目に高いハイブリッド形成強度を有するプローブ
の調査位置における塩基の補体を規定する不確定コード
を、未知の塩基として呼び出す。一方、計算された比が
比限界値以下である場合には、ステップ322で、三番
目に高いハイブリッド形成強度と四番目に高いハイブリ
ッド形成強度との比を計算する。
で計算した比を比限界値と比較する。計算された比が比
限界値より大きい場合には、ステップ326で、一番目
ないし三番目に高いハイブリッド形成強度を有するプロ
ーブの調査位置における塩基の補体を規定する不確定コ
ードを、未知の塩基として呼び出す。一方、計算された
比が比限界値以下である場合には、ステップ328で、
(不十分な区別を示す)コードXを未知の塩基に割り当
てる。
ド形成強度に基づいて塩基呼び出し処理を行う他の方法
を示すフローチャートである。このフローチャートで
は、関連するプローブが示すハイブリッド形成強度に基
づいて処理が行われる。即ち、塩基コール処理により、
調査位置における一つの塩基の不対合だけが互いに異な
る複数のプローブ内の調査位置に対応するような、標的
内の塩基が呼び出される。ステップ402で、システム
は、標的配列に対して最高のハイブリッド形成強度を有
するプローブが一つだけ存在するかどうかを判定する。
存在しない場合には、不確定を意味するNを塩基に割り
当てる。例えば、2つのプローブが同じ最高強度を有し
ている場合(即ち、同強度である場合)、その塩基にN
を割り当てる。
を有するプローブが一つだけ存在する場合には、ステッ
プ406で、そのプローブに従って塩基の呼び出しが行
われる。プローブは標的配列に相補的であるため、プロ
ーブの調査位置における塩基に相補的な塩基(C/G、
A/T)を呼び出すようにしてもよい。
基コール(呼び出された塩基)が突然変異であるかどう
かを判定する。即ち、参照配列の塩基と異なっているか
どうかを判定する。塩基コールが突然変異塩基コールで
ない場合には、塩基コールを確定する。一方、塩基コー
ルが突然変異塩基コールの場合には、システムは、ステ
ップ410で所定の「突然変異」条件を満たしているか
どうかを判定し、満たしていない場合には、ステップ4
12で、Nを塩基に割り当てる。
明をわかりやすくするために、関連するプローブのハイ
ブリッド形成強度を次のようにラベルする。HighInt は
最高のハイブリッド形成強度を、SecondInt は二番目に
高いハイブリッド形成強度を、ThirdIntは三番目に高い
ハイブリッド形成強度を、LowIntは最も低いハイブリッ
ド形成強度をそれぞれ示す。
ると規定する突然変異条件は、以下の3つのテスト全て
を満足させるものでなければならない。第一のテスト
は、HighInt とSecondInt との差が差分限界値より大き
いかどうかを判定するものである。即ち、システムは、
(HighInt−SecondInt)が所定の値より大きいかどうか
を判定する。この所定の値は、最高のハイブリッド形成
強度が次に高いハイブリッド形成強度よりも所望の量だ
け大きい場合にのみ、呼び出された塩基が突然変異塩基
の可能性があると認めるように選択されたものである。
値未満であるかどうかを判定するものである。第一の比
は以下のように規定される。
Int-√(ThirdInt*LowInt)}
であるかどうかを判定する。この所定の値は、2つのよ
り低いハイブリッド形成強度を差し引いた後でも、最高
のハイブリッド形成強度が、次に高いハイブリッド形成
強度に対して所望の比より大きい場合にのみ、呼び出さ
れた塩基が突然変異塩基の可能性があると認めるように
選択されたものである。
り大きいかどうかを判定するものである。隣接比は以下
のように規定される。
ghIntn-1)}
対象の塩基位置における値を示す。また、n+1及びn
−1は、隣接する塩基位置における値を示す。システム
は、この隣接比が所定の値より大きいかどうかを判定す
る。この所定の値は、最高のハイブリッド形成強度が、
隣接する最高のハイブリッド形成強度を引いた後の最高
ハイブリッド形成強度に対して所望の比より大きい場合
にのみ、呼び出された塩基が突然変異塩基の可能性があ
ると認めるように選択されたものである。
れた場合にのみ、呼び出された塩基が突然変異塩基と規
定される。突然変異はかなりまれであるため、突然変異
が存在する可能性が高い場合にのみ突然変異塩基を呼び
出すようにする。突然変異条件が満たされない場合に
は、呼び出された塩基は不確定であるか、あるいは、標
準塩基と同一である(統計的に、正しい塩基コールの可
能性がある)。
いたが、突然変異条件を一つのみ(例えば、上述の条件
のどれが一つ)とすることもできる。また、参照文献と
して先に挙げた米国特許出願に記載されているような塩
基呼び出し方法を利用することもできる。
て塩基呼び出し処理を行う方法を示すフローチャートで
ある。上述したように、一つのユニットには、複数組の
関連セルが含まれ、関連セルは、調査位置における一つ
の塩基がそれぞれ異なっているプローブを含む。システ
ムは、まず、(例えば、ハイブリッド形成されたチップ
を走査するスキャナによって生成されたイメージデータ
ファイルから)ハイブリッド形成強度を入力し、更に、
このハイブリッド形成強度に対応するプローブの構造を
入力する。次に、バックグラウンド強度(例えば、「ブ
ランク」セルの強度、あるいは、プローブを含まないチ
ップの別の領域において測定された強度)を入力された
ハイブリッド形成強度から引く。ここで、バックグラウ
ンド引き算後のハイブリッド形成強度の最低値を1(フ
ォトン数1)に設定しておいてもよい。
いはプローブの複数の複製)と標的配列との間で測定さ
れるハイブリッド形成の度合いを意味する。例えば、測
定されたセルのフォトン数の平均をハイブリッド形成強
度としてもよい。ここで、フォトン数は、セル内のプロ
ーブに結合し、フルオレセインで標識された標的配列に
由来する。
理の対象となる標的配列の塩基位置を入力する。次に、
ステップ454で、グループの各ユニットに関してその
塩基位置における塩基コール処理を実行する。具体的に
は、その塩基位置における各ユニットの関連セルのハイ
ブリッド形成強度を解析する。この解析を行うことによ
り(解析処理の詳細に関しては、図11及び図12で既
に説明した)、システムは、各ユニットに関する塩基コ
ールを求める。例えば、グループ内に5つのユニットが
存在する場合には、5つの塩基コールが生成される。
ープのユニットに関する複数の塩基コールを解析して、
そのグループの塩基コールを一つ決定する。具体的に
は、そのグループのユニットから呼び出される頻度が一
番高かった塩基を、そのグループの塩基として呼び出す
ように構成してもよい。例えば、5つのユニットが存在
し、各ユニットが次のような塩基コールがなされたとす
る。
トが呼び出しているTが、塩基として呼び出される。同
じ頻度で呼び出された塩基が複数ある場合には、塩基を
呼び出すユニットの最高平均ハイブリッド形成強度等の
他のファクターを考慮する。本発明の実施例において
は、図15に示される方法が用いられる。
塩基位置が存在するかどうかを判定する。本発明の方法
を適用して、標的核酸配列の全ての塩基位置に関して塩
基コール処理を実行することもできるし、不必要な塩基
位置をスキップして、所定の塩基位置においてのみ塩基
コール処理を実行することもできる。
て塩基呼び出し処理を行う方法を示すフローチャートで
ある。図9に示したように、解析対象となる一つあるい
は複数のチップ上に複数のグループが存在する場合があ
る。複数のグループは、異なった参照配列に従って配置
されていてもよい。但し、これは、複数のグループのハ
イブリッド形成に関する情報が利用されない可能性を示
すものではない。通常、標準グループの参照配列が標的
配列と一致する可能性が最も高いが、代替グループの一
つの方が一致の可能性が高い場合には(即ち、塩基コー
ル処理により適している場合には)、そのグループを用
いて塩基処理を行う。
ープ及び代替グループのユニットに関して塩基コール処
理を実行する。塩基コール処理は、例えば、先に図13
で説明したように行われる。
ープに関して塩基コールを一つ求める。ここで、ユニッ
トからの呼び出し頻度が最も高かった塩基を塩基コール
としてもよいし、あるいは、図15に従って後に詳細を
説明する方法で、各グループの塩基コールを決定するよ
うにしてもよい。
と代替グループ)に関して一つの塩基コールをもとめた
後、ステップ506で、塩基位置が入力される。次に、
入力された塩基位置に関して塩基コールを実行するため
に最適のユニットグループを選択する。具体的には、例
えば、調査位置近傍、即ち、調査位置周囲のウィンドウ
において、標的配列に対する不対合が最も少ないグルー
プの参照配列を求めることにより、最適グループの選択
が行われる。調査位置近傍において不対合が最も少ない
ユニットグループは、最も精度の高い塩基コールを生成
する可能性が高い。最適グループを選択する処理に関す
る詳細は、図16を参照して後述する。
グループに従って、入力された塩基位置における塩基の
呼び出し処理を行う(即ち、ステップ504で決定され
たそのグループの最適コールを用いる)。塩基コールが
決定されると、処理は次のステップに移り、塩基コール
処理を実行すべき次の塩基位置が存在するかどうかの判
定が行われる。次の塩基位置が存在する場合には、ステ
ップ506に戻り、次の塩基位置に関して塩基コール処
理を実行する。
て塩基呼び出し処理を行う方法を示すフローチャートで
ある。ステップ602で、システムは、所定の塩基位置
において大部分のユニットが同じ塩基を呼び出している
かどうかを判定する。この場合、(不確定を示すコード
Nが割り当てられたものを除き)塩基を呼び出すユニッ
トのみが判定の対象となる。例えば、7つのユニットが
存在し、各ユニットが次のような塩基コールを実行した
とする。
ち3つがGを呼び出しているため、まず、そのユニット
グループに関してGを塩基として呼び出す。例外規則が
適用される場合を除いて、ステップ604で、この塩基
が多数塩基として呼び出される。
てどの塩基を呼び出すかを決める条件を規定したもので
ある。この例外規則は、多数塩基コールを変える条件
や、大多数のユニットによって呼び出される塩基が存在
しないような状況に対処する条件を規定する。例外規則
の一例として、(一つのユニットがある塩基を呼び出
し、他のユニットが別の塩基を呼び出すような場合に適
用される)隣接するプローブのハイブリッド形成強度を
解析するタイブレーク規則が挙げられる。また、別の例
として、3つのユニットがそれぞれ別の塩基を呼び出
し、そのうちの一つが標準塩基を呼び出すものである場
合、標準塩基をそのユニットグループの塩基コールとす
る例外規則が挙げられる。他の例外規則に関しては、補
遺に示す。
かどうかの判定がなされる。例外規則が適用されると判
定された場合には、ステップ608で例外規則が適用さ
れる。
に最適のユニットグループを選択する方法を示すフロー
チャートである。上述したように、調査位置近傍におい
て、標的配列に対する不対合が最も少ないグループの参
照配列を求めることにより、最適グループの選択が行わ
れる。調査位置近傍において不対合が最も少ないユニッ
トグループは、最も精度の高い塩基コールを生成する可
能性が高い。解析の対象となる調査位置近傍のウィンド
ウは、所定の値に設定してもよく、あるいは、プローブ
構造に従って設定してもよい。例えば、全てのグループ
のプローブに関して、調査位置からの最大距離が、調査
位置の一方の側に対しては8塩基位置、また、もう一方
の側に対しては10塩基位置である場合、この範囲の塩
基位置を含むようにウィンドウを設定してもよい。
ットグループおよび代替ユニットグループに関して不対
合得点を計算する。不対合得点は、標的配列に対する参
照配列の不対合の数を示すものである。不対合得点を求
めるために、参照配列のうち少なくとも2つが異なって
いる塩基位置のみを解析するようにしてもよい。全ての
参照配列が或る塩基位置において同一である場合には、
この塩基配列をスキップすることができる。
各塩基位置において、あるグループに関して呼び出され
た塩基(標的配列における有望な塩基を示す塩基コー
ル)が参照配列の対応する塩基と異なっているかどうか
を判定する。ここで、塩基コールと参照配列の対応する
塩基とが異なっている場合には、不対合得点に1が加え
られる。各グループに関する不対合得点は、最初にゼロ
に設定される。
照配列部分の塩基位置の数を示すものだと考えることが
できる(全ての参照配列において同一である塩基位置を
除くようにしてもよい)。この概念をさらに説明するた
めに、以下に簡単な例を挙げる。この例では、以下のよ
うな1つの標準グループと2つの代替グループが存在す
る。
位置に対応する。また、太字の塩基位置は、少なくとも
2つの参照配列において異なっている塩基位置を示す。
これら太字の塩基位置の中で、(塩基コールで示され
る)標的配列と参照配列とが異なっている塩基位置は、
標準グループでは1つ存在する。このため、不対合得点
は1となる。同様にして、第一の代替グループでは不対
合得点が0に、第二の代替グループでは不対合得点が1
になる。
で、解析されている塩基位置における塩基の呼び出し
に、このグループが用いられる。上記の簡単な例は、最
適グループの選択方法を説明するためのものなので、塩
基コールは全てのグループで同一である。しかし、ここ
で、重要なことは、塩基位置近傍での不対合が多くなれ
ばなるほど塩基コールの精度が下がるということであ
る。参照配列と標的配列との間の不対合により、塩基位
置近傍においてプローブが単一の塩基不対合を含む結果
となる。単一の塩基不対合はハイブリッド形成強度を低
下させ、この結果、精度を下げる可能性がある。
得点が代替グループの不対合得点以下であるかどうかが
判定される。標準グループの不対合得点の方が低いかあ
るいは等しければ、標準グループに従って塩基コール処
理が実行される。
かの不対合得点が最低であるかどうかの判定がなされ
る。最低である場合には、ステップ710で、その代替
グループを用いて、塩基コール処理が実行される。そう
でなければ、2以上の代替グループが同じ不対合得点を
持つことになる。このような場合には、ステップ712
で、ある塩基を最も首尾一貫して呼び出したユニットを
含む代替グループを選択する。例えば、2つの代替グル
ープが同じ最低の不対合得点を有し、一つのグループの
ユニットが全て同じ塩基を呼び出す一方、もう一つのグ
ループのユニットの塩基コールが分散している場合に
は、同じ塩基を呼び出す代替グループを用いて処理が行
われる。不対合得点が同じ場合に最適のグループを選択
する方法はこれに限定されるものではなく、他の方法を
適用することもできる。
ける実験に基づきヌクレオチドを解析するためのスクリ
ーンディスプレイを示す。スクリーンディスプレイ80
2は、ユーザーに様々な情報を表示する複数のスクリー
ン領域を備える。スクリーン領域804には、参照配列
名が表示される。この例では、PRT440Aで、これ
は、HIVウィルスのアンチセンス領域(プロテアーゼ
逆転写酵素)である。参照配列は、通常、検体配列と比
較される基準(基線)として用いられる。スクリーンに
表示されている参照配列は、野生株のチップ配列である
が、これに限定されるものではない。
(アレイ)における標準のヌクレオチド配列が表示され
る。各ヌクレオチドの塩基位置がスクリーン領域806
上に示されている。スクリーン領域806には、さら
に、ユーザーインターフェースで「拡大された」各ユニ
ットの参照配列も表示される。
チップファイルおよび複合ファイルが表示される。チッ
プファイル(例えば、.CHPの拡張子で示される)に
は、一つのチップから入力されるデータが含まれ、複合
ファイルには(例えば、.CMPの拡張子で示される)
には、複数のチップから入力されたデータが含まれる。
ユーザーが解析を行うためにチップファイルまたは複合
ファイルを開くと、そのファイルのパスネームがスクリ
ーン領域808に表示される。
力された情報をスクリーン領域810及び812に表示
するようにしてもよい。スクリーン領域810には、チ
ップファイルあるいは複合ファイルから得られた、現在
解析中の検体配列の名称が表示される。通常、ユーザー
が簡単に検体配列を認識できるようなものが、検体配列
の名称として選択される。スクリーン領域812には、
検体のヌクレオチド配列が表示される。スクリーン領域
812における各ヌクレオチドの塩基位置は、スクリー
ン領域806上に表示されたものと同様である。従っ
て、簡単に解析を行うことができるように、参照配列と
検体配列とが自動的に並べられる。
を簡単に示すものであるが、図18に示すように、チッ
プファイル及び複合ファイルから入力された情報を出さ
ないようにしたり(非表示にしたり)、まとめたりする
こともできる。例えば、ユーザーが、スクリーン領域8
08において、複合ファイルのファイル名の前につけら
れているスクリーンアイコンの+マークを「クリックす
る」、即ち起動した場合には、その複合ファイルに関す
る詳細な情報が表示される。図示されるように、チップ
ファイルから入力された情報を組み合わせるために用い
られた方法を、個々のチップファイルと共に表示するよ
うにしてもよい。
において、チップファイルのファイル名の前につけられ
ているスクリーンアイコンの+マークを起動した場合に
は、塩基の呼び出しに用いられた工程あるいは方法を含
むチップファイルに関する詳細な情報が表示される。図
18の例では、図10に基づいて説明した「比に基づく
アルゴリズム」が塩基呼び出し処理に用いられている。
さらに、ユーザーは、スクリーン上に表示されている塩
基コールに直ちに反映される塩基呼び出し処理パラメー
タを変更することもできる。例えば、この例では、比の
限界値(「Ratio 」)が1.2に設定されているが、ユ
ーザーがこの比の限界値を1.4に増加させた場合に
は、そのチップに関する塩基コールを再演算して、新し
い塩基コールをスクリーン領域812に表示する。塩基
コール処理パラメータは、定数、閾値、範囲等のいずれ
の値でもよい。
すいように、(様々な構成を含む)複数の実験から得ら
れたデータを組み合わせることができる。図17に示さ
れる検体配列440−2Aは、図18では拡大されて、
この塩基コールが複数の実験から得られたものであるこ
とがわかる。ここで、複数の実験から得られたデータ
は、一つのチップに関するものでも、あるいは、複数の
チップに関するものでもよい。言いかえると、図17お
よび図18で検体配列440−2Aとして示されるヌク
レオチド配列は、一つの実験結果を示すものではなく、
複数の実験結果を組み合わせた、あるいは、まとめたも
のである。図18に示すように、ユーザーは、それぞれ
の実験から得られたデータをまとめることができる。図
18の例では、それぞれの塩基に関するハイブリッド形
成強度が表示されている。塩基位置100に示すよう
に、解析中の塩基位置を反転表示することもできる。
Aの名称の前にもスクリーンアイコンの+マークが表示
されている。このスクリーンアイコンを起動することに
より、複合塩基コールを構成する個々の塩基コールを表
示することができる。また、図18に示すように、複合
塩基コールは、複数の塩基コールから誘導されている。
この複数の塩基コールは、塩基位置に従って、複合塩基
コールと並べられる。本発明の構成により、ユーザー
は、配列を解析する際に、必要に応じて、データを表示
したり、非表示にしたり、あるいは、まとめたりするこ
とができる。
のハイブリッド形成強度を比較することにより遺伝子の
発現を監視する方法を示すフローチャートである。「完
全対合プローブ」は、所定の標的配列に完全に相補的な
配列を有するプローブを意味する。テストプローブは、
通常、標的配列の一部(サブ配列)に完全に相補的であ
る。また、「不対合対照」あるいは「不対合プローブ」
は、所定の標的配列に完全に相補的でないように故意的
に選択された配列を有するプローブを意味する。高密度
配列(アレイ)における不対合(MM)対照には、それ
ぞれ、同じ所定の標的配列に対して完全に相補的な対応
する完全対合(PM)プローブが存在する。
共有結合的に結合されている、複数対の完全対合プロー
ブ及び不対合プローブのハイブリッド形成強度が比較さ
れる。核酸プローブの密度としては、基質1cm2 当た
りに約60個以上の 異なった核酸プローブが含まれる構
成が最も望ましい。図19のフローチャートでは、各ス
テップが順に示されているが、必ずしも、これらのステ
ップをこの順番で実行しなくてもよい。当業者に周知の
ように、本発明の範囲から逸脱することなく、これらの
ステップの順番を変えたり、組み合わせたり、あるいは
いくつかのステップを除くこともできる。
に相補的な核酸プローブを選択する。これらのプローブ
は完全対合プローブである。次に、標的配列に対して完
全に相補的でないように構成されたプローブを選択す
る。これらのプローブは不対合プローブであり、不対合
プローブには、それぞれ、完全対合プローブに対して少
なくとも一つのヌクレオチド不対合が含まれる。従っ
て、不対合プローブおよびそれに対応する完全対合プロ
ーブにより、一対のプローブが形成される。上述したよ
うに、不対合プローブの中心付近にヌクレオチド不対合
が存在するような構成が望ましい。
列に対する高いハイブリッド形成親和性を示すように選
択される。例えば、核酸配列を全て20量体としてもよ
い。また、不確定さを排除する等様々な理由により、基
質上で、異なった長さのプローブを合成するようにして
もよい。
標識されて、核酸プローブを含む基質に曝される。核酸
プローブのハイブリッド形成強度を測定して、コンピュ
ータシステムに入力する。ここで用いられるコンピュー
タシステムは、基質のハイブリッド形成を指示するシス
テムと同じものでも異なったものでもよい。いずれのコ
ンピュータシステムを用いるにしても、遺伝子名、遺伝
子配列、プローブ配列、基質上でのプローブ位置等、他
の実験の詳細もシステムに入力される。
後、ステップ902で、コンピュータシステムに、複数
対の完全対合プローブと不対合プローブのハイブリッド
形成強度が入力される。ハイブリッド形成強度は、核酸
プローブと(遺伝子に対応する)標的核酸との間のハイ
ブリッド形成親和性を示すものである。各対には、標的
核酸の一部に完全に相補的な完全対合プローブと、少な
くとも一つのヌクレオチドが完全対合プローブと異なっ
ている不対合プローブとが含まれる。
が、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する。遺伝子が発現している場合
には、完全対合プローブのハイブリッド形成強度(即ち
親和性)は、対応する不対合プローブの強度よりも有意
に高い。一般に、対のプローブのハイブリッド形成強度
がほとんど同じであれば、遺伝子が発現されていないと
考えられる。但し、一対のプローブに基づいて判定を行
うわけではなく、多数対のプローブの解析に基づいて、
遺伝子が発現しているかどうかの判定が行われる。複数
対のプローブのハイブリッド形成強度を比較する具体的
な方法の詳細に関しては、図20を参照して説明する。
ブリッド形成強度を比較した後、ステップ906で、遺
伝子の発現状態を表示する。例えば、遺伝子が存在して
いる(発現している)、どちらともいえない、あるい
は、存在していない(発現していない)ことを示す発現
コールをユーザーに表示するようにしてもよい。
しているかどうかを判定する方法を示すフローチャート
である。ステップ952で、コンピュータシステムに、
N対の完全対合プローブと不対合プローブに関する生の
走査データを入力する。好適な実施例において、ハイブ
リッド形成強度は、基質上でプローブにハイブリッド結
合されるフルオレセイン標識標的から得られるフォトン
数である。以下、完全対合プローブのハイブリッド形成
強度をIpmで示し、不対合プローブ のハイブリッド形成
強度をImmで示す。
ブリッド形成強度を検索する。次のステップ956で、
バックグラウンド信号強度を、その対の各ハイブリッド
形成強度から差し引く。全ての生走査データから同時に
バックグラウンドを差し引くようにしてもよい。
ッド形成強度を差分閾値(D)および比の閾値(R)と
比較する。即ち、プローブ対のハイブリッド形成強度の
差(Ipm−Imm)が差分閾値以上 である かどうか、且
つ、プローブ対のハイブリッド形成強度の比(Ipm/I
mm)が比の閾値以上 である かどうかが判定される。これ
らの閾値は、通常、一つあるいは複数の遺伝子の発現状
態を精度よく監視できるようにユーザーが定義した値で
ある。例えば、差分閾値を20に比の閾値を1.2に設
定するようにしてもよい。
Rの場合には 、ステ ップ960でNPOSを1増加させ
る。NPOSは、遺伝子が発現する可能性が高いことを
示すハイブリッド形成強度を有するプローブ対の数を示
す値である。即ち、遺伝子の発現状態の決定に、NPO
Sが用いられる。
びImm/ Ipm> =Rが成立する かどう かの判定がなされ
る。この式が成り立つ場合には、ステップ964でNN
EGを1増加させる。NNEGは、遺伝子が発現しない
可能性が高いことを示すハイブリッド形成強度を有する
プローブ対の数を示す値である。NPOSと同様に、N
NEGも遺伝子の発現状態の決定に用いられる。
は、発現していないことを示すハイブリッド形成強度を
有する各プローブ対に関して、ステップ966で、比の
対数値(LR)と強度差値(IDIF)を計算する。L
Rは、プローブ対のハイブリッド形成強度の比(Ipm/
Imm)の対数をとるこ とによ り求められる。また、ID
IFは、プローブ対のハイブリッド形成強度の差(Ipm
−Imm)をとることによ り求め られる。ステップ968
で次のプローブ対のハイブリッド形成強度が存在すると
判定されれば、処理をステップ954に戻して、検索を
行う。
伝子が発現しているかどうかを判定する。決定行列で
は、N、NPOS、NNEG、LR(複数のLR)の値
が用いられ、次の計算が行われる。
NEG)
いるかどうかを判定する。
割する。P1が2.1以上であれば、Aが真である。P
1が2.1未満で1.8以上であれば、Bが真である。
それ以外の場合には、Cが真である。即ち、P1は、
A、B、Cの3つの範囲に分割される。これは、発明の
理解を深めることを目的としてなされるものである。こ
のようにして、全てのP値を以下のようにいくつかの範
囲に分割する。
に分割した後、遺伝子発現の判定を行う。
現)、どちらともいえない、不存在(発現しない)のい
ずれかで示される。式「A and (X or Y) and (Q or R)
」が成り立つ場合には、遺伝子が発現していると見な
される。言いかえると、P1>=2.1、P2>=0.
20、P3>=1.1が成り立つ場合には、遺伝子が発
現していると考えられる。また、式「B and X and Q 」
が成り立つ場合にも、遺伝子が発現していると見なされ
る。
を以下にまとめる。
される。例えば、存在をP、どちらともいえないをM、
不存在をAのように出力するようにしてもよい。
現状態を表示した後、ステップ975で、LRを10倍
した値の平均値を計算する。さらに、NPOS及びNN
EGを増加させたプローブに関するIDIF値の平均を
計算する。この平均値を、発現レベルを示す値として用
いることもできる。また、これらの値を用いて、この実
験と他の実験の定量的な比較を行うようにしてもよい。
例として、現在の実験データを前の実験データと比較す
る(この場合、例えば、ステップ970で計算された値
を用いる)。別の例として、生物検体中に存在する(バ
クテリア由来等の)既知量のRNAのハイブリッド形成
強度と実験データを比較することもできる。このように
して、遺伝子発現状態の表示即ちコールが正しいかどう
かを証明することもできるし、閾値を修正することもで
きるし、さらに、先に行われた実験の修正を行うことも
可能である。
の遺伝子に関する処理だけを説明したが、生物検体に含
まれる複数の遺伝子の処理にこの方法を適用することも
できる。従って、一つの遺伝子の解析に関する説明は、
その方法を複数の遺伝子の処理に拡張できないことを示
すものではない。
画面表示(スクリーンディスプレイ)のレイアウト(構
成)を示す。スクリーンディスプレイ1000は、グラ
フィックス表示領域1002とデータ表示領域1004
の2つの部分に分割される。グラフィックス表示領域に
は、ユーザーがデータを解釈する助けとなるグラフが表
示される。また、データ表示領域には、ユーザーが遺伝
子発現に関する基礎データを評価できるように、基礎デ
ータが表示される。
ように、データ表示領域を縦欄と横列で表示される表形
式にすることが望ましい。各縦欄には、その欄に含まれ
るデータを示す見出しがつけられる。また、各横列に
は、ある遺伝子に関する一つの実験あるいは実験の組み
合わせから得られたデータが表示される。本明細書にお
いて、「実験」は、データを生成する工程を意味する。
例えば、ハイブリッド結合されたチップの一つのイメー
ジファイルから、多くの遺伝子に関する多くの「実験」
データが生成される。また、実験は、異なったチップか
らデータを生成するものでもよい。
示すスクリーンディスプレイである。スクリーンディス
プレイ1030のグラフィックス表示領域には、選択さ
れた遺伝子の各塩基位置における完全対合プローブと不
対合プローブのハイブリッド形成強度が棒グラフの形で
示されている。選択された遺伝子は、データ表示領域1
034に反転表示されている。
が表示されている。「Experiment Name 」は、その実験
に関してユーザーが定義した名称を意味する。「Gene N
ame」は、その遺伝子の名称を意味する。「Positive」
及び「Negative」の数は、図20で説明したNPOS及
びNNEGの値を示す。「Pairs 」は、その遺伝子の解
析に用いられた完全符号プローブと不対合プローブのプ
ローブ対の数を示す。また、「Pos Fraction」は、遺伝
子発現がポジティブであると判定されたプローブ対の割
合(即ち、Positive/Pairs )を示す。
プローブに関するIpm/Immの平均を示す。「Log A
vg 」欄は、log(Ipm/Imm)の平均を示す。 「PM
Excess」欄は、ユーザーが規定した閾値より大きなハイ
ブリッド形成強度を示す完全対合プローブの数を示す。
「MM Excess 」欄は、ユーザーが規定した閾値より大き
なハイブリッド形成強度を示す不対合プローブの数を示
す。図23に示される「Pos/Neg 」欄は、「Positive」
欄と「Negative」欄の比を示す(「Negative」欄がゼロ
を含む場合には、「Inf」と表示される)。「Avg Dif
f」欄は、その遺伝子に関する平均強度差を示す。平均
強度差は、図20のステップ975で計算された値であ
る(即ち、(IDIF)平均)。
子発現コールを示す。この欄の値P、M、Aは、それぞ
れ、存在、どちらともいえない、不存在を表す。好適な
実施例の遺伝子発現コールに関する詳細は、図20のス
テップ974を参照して既に説明した。
クス表示領域にユーザーがデータを解釈する助けとなる
グラフが表示される。ユーザーは、ボタンバー1034
を用いて、グラフィックス表示領域に表示されるべき一
つあるいは複数のグラフを選択できる。さらに、所定の
欄における値に従って、データ表示領域でデータを並べ
変えることができる。
表す別のスクリーンディスプレイを示す。スクリーンデ
ィスプレイ1060のグラフィックス表示領域1062
には、各塩基位置における完全対合プローブと不対合プ
ローブのハイブリッド形成強度の比のグラフが表示され
ている。x軸は塩基位置を、y軸は、ハイブリッド形成
強度の比を表す。また、グラフには統計学的な比の閾値
がプロットされているが、この例では、閾値は1.2で
ある。ユーザーは、このグラフを用いて、閾値より上及
び下のプローブ対の数(Ipm/Imm)を解析すること が
でき る。このグラフには、さらに遺伝子名と実験名が表
示されている。
る実験結果の比較を表すスクリーンディスプレイを示
す。スクリーンディスプレイ1160には、グラフィッ
クス表示領域1062とデータ表示領域1164が含ま
れる。グラフィックス表示領域には、データ表示領域で
選択された実験/遺伝子の各々に関して、各塩基位置に
おける完全対合プローブと不対合プローブのハイブリッ
ド形成強度の比のグラフが表示されている。好適な実施
例では、選択された複数の遺伝子間の差異がはっきりと
わかるように、実験名、遺伝子名及びデータプロットを
遺伝子ごとに異なった色で示す。
る実験結果の比較を表す別のスクリーンディスプレイを
示す。スクリーンディスプレイ1200のグラフィック
ス表示領域1202には、データ表示領域1204で選
択された遺伝子の発現レベルが表示されている。選択さ
れた遺伝子の発現レベルは、棒グラフの形で示されてい
る。好適な実施例では、発現レベルは、平均強度差とし
て表される(図20の(IDIF)平均を参照)。この
グラフには、さらに遺伝子名と実験名が表示されてい
る。
る実験結果の比較を、グラフィックス表示領域に、いく
つかのグラフの形で表示する、さらに別のスクリーンデ
ィスプレイを示す。スクリーンディスプレイ1230の
グラフィックス表示領域1232には、データ表示領域
1234で選択された遺伝子を解析した結果のグラフが
いくつか示されている。この例では、選択された遺伝子
に関する発現レベルグラフ1236、平均強度差グラフ
1238、及び、ハイブリッド形成強度グラフ1240
が表示されている。
験走査データとを比較することにより、遺伝子の発現状
態を判定する工程を示すフローチャートである。例え
ば、遺伝子が発現していることがわかっている生物検体
から基準走査データをとるようにしてもよい。即ち、こ
の走査データを別の生物検体と比較することにより、そ
の遺伝子が発現しているかどうかを判定する。また、有
機生命体において遺伝子の発現が時間とともにどのよう
に変化するかを判定することもできる。ここで、「基準
(基線)」は、標準点として用いられるものであること
を意味する。
ムに、基準から得られたN対の完全対合プローブと不対
合プローブの生の走査データが入力される。基準から得
られた完全対合プローブのハイブリッド形成強度をIpm
で表し、同じく基準から 得られた不対合プローブのハイ
ブリッド形成強度をImmで表す。ステップ130 4で、
バックグラウンドの信号強度を各対の基準走査データの
ハイブリッド形成強度から差し引く。
システムに、実験の標的である生物検体から得られたN
対の完全対合プローブと不対合プローブの生の走査デー
タが入力される。実験検体から得られた完全対合プロー
ブのハイブリッド形成強度をJpmで表し、同じく実験検
体 から得られた不対合プローブのハイブリッド形成強度
をJmmで表す。ステップ130 8で、バックグラウンド
の信号強度を各対の実験走査データのハイブリッド形成
強度から差し引く。
イブリッド形成強度を正規化する。例えば、I−J対の
ハイブリッド形成強度を、対照プローブのハイブリッド
形成強度で割るようにしてもよい。
のハイブリッド形成強度を差分閾値(DDIF)および
比の閾値(RDIF)と比較する。具体的には、ある対
(Jpm−Jmm)のハイブリッド 形成強 度と別の対(Ipm
−Imm)のハイブリッド 形成強 度の差が差分閾値以上で
あるかどうか、また、ある対(Jpm−Jmm)のハイブリ
ッド 形成強 度と別の対(Ipm−Imm)のハイブリッド 形
成強 度の比が比の閾値以上であるかどうかの判定がなさ
れる。これらの閾値は、通常、一つあるいは複数の遺伝
子の発現監視を精度よく行えるようにユーザーが規定し
た値である。
IF、 且つ、 (Jpm−Jmm)/(Ipm−Imm )>= RD
IFが 成立す る場合には、ステップ1314でNINC
を1増加させる。一般に、NINCは、実験検体のプロ
ーブ対の遺伝子発現が基準検体の遺伝子発現よりも大き
い(即ち、増加している)可能性が高いことを示す値で
ある。NINCを用いて、基準検体と比較して実験検体
の遺伝子発現が大きい(即ち、増加している)か、小さ
い(即ち、減少している)か、あるいは、変化なしかの
判定がなされる。
(Ipm−Imm )>= DDIF、 且つ、(Jpm−Jmm)/
(Ipm−Imm )>= RDIFが 成立す るかどうかの判定
がなされる。この式が成り立つ場合には、NDECを1
増加させる。一般に、NDECは、実験検体のプローブ
対の遺伝子発現が基準検体の遺伝子発現よりも小さい
(即ち、減少している)可能性が高いことを示す値であ
る。NDECを用いて、基準検体と比較して実験検体の
遺伝子発現が大きい(即ち、増加している)か、小さい
(即ち、減少している)か、あるいは、変化なしかの判
定がなされる。
は、小さいかを示すハイブリッド形成強度を有する各対
のプローブに関して、NPOS、NNEG、及びLR値
を計算する。これらの値の計算に関しては、図20を参
照して前述した。それぞれの値の後ろにBあるいはEを
つけて、その値が基準検体のものか実験検体のものかを
示す。ステップ1322でハイブリッド形成強度を有す
る別のプローブ対が存在すると判定された場合には、上
述と同様の方法で処理を行う。
324で、基準検体と実験検体の両方に関して、絶対決
定演算を実行する。絶対決定演算は、基準検体と実験検
体の各々に関して、遺伝子が発現しているか、どちらと
もいえないか、あるいは、発現していないか、を示すも
のである。従って、好適な実施例では、各検体に関して
図20のステップ972と974を実行することによ
り、このステップの処理が実現される。この処理を行う
ことによって、各検体の遺伝子発現状態が示される。
いて、2つの検体間の遺伝子発現の差を求める。この決
定行列では、上記のように計算された値N、NPOS
B、NPOSE、NNEGB、NNEGE、NINC、
NDEC、LRB、LREが用いられる。決定行列の計
算は、NINCがNDEC以上であるかどうかによって
変わる。即ち、以下のような計算が行われる。
つのP値が求められる。
NNEGB))/N P4=10*SUM(LRE−LRB)/N
伝子発現の差を求める。
の範囲に分割する。P値は、全て、以下のような範囲に
分割される。
に分割した後、2つの検体間の遺伝子発現の差を求め
る。
め、遺伝子発現の変化は、増加、増加傾向、あるいは、
変化なしで表される。以下に、遺伝子発現状態をまとめ
て示す。
をMI、変化なしをNCのように示してもよい。
のP値が求められる。
NPOSB))/N P4=10*SUM(LRE−LRB)/N
伝子発現の差を求める。
ECの場合と同じいくつかの範囲に分割する。P値は上
述と同じ範囲に分割されるので、ここでは簡略化のため
に説明を繰り返さない。但し、以下に説明するように、
これらの範囲は、通常、2つの検体間の遺伝子発現の異
なった変化状態を示す。
め、遺伝子発現の変化は、減少、減少傾向、あるいは、
変化なしで表される。以下に、遺伝子発現状態をまとめ
て示す。
をDI、変化なしをNCのように示してもよい。
間の遺伝子発現の相対的な差を求めることができる。
(例えば、ステップ1324で)両方の検体において遺
伝子が発現状態であると表示され、且つ、以下の式が全
て成立する場合には、追加試験を行って、I、MI、D
M、D(即ちNC以外の)コールをNCに変更するよう
に構成してもよい。
の平均}>=0.7
に、各検体の平均強度差が比較的大きいか、あるいは、
両方の検体の平均強度差がほとんど同じであれば、増加
あるいは減少のコールは(それが傾向に留まっているか
どうかに係わらず)変化なしコールに変更される。ID
IFB及びIDIFEは、各検体に関するIDIFの総
和をNで割ることにより計算される。
評価を行うための値を計算する。各対に関して、((J
pm−Jmm)−(Ipm−Imm ))の 平均を計算 する。 ま
た、Jpm−Jmmの平均とIpm−Immの平 均の比を計算 す
る。 ステップ1330で、これらの値を用いて、他の実
験結果との比較を行うことができる。
の変化を表すスクリーンディスプレイを示す。スクリー
ンディスプレイ1400には、グラフィックス表示領域
1402とデータ表示領域1404が含まれる。ユーザ
ーがある所定の遺伝子に関して2つの実験を選択するこ
とにより、その実験結果の比較が行われる。ここでは、
説明をわかりやすくするために、基準データと実験デー
タの2つを呼び出して、それらのデータの比較を行う場
合を考える。例えば、ユーザーは、「g182506」
と名付けられた遺伝子に関して2つの実験を選択する。
2つの実験結果の比較自体が実験であるため、ユーザー
は、図30のデータ表示領域に「foo 」と表示されてい
るように、実験名を入力することができる。図31は、
2つの実験における遺伝子発現の変化を表す別のスクリ
ーンディスプレイを示す。
て、選択された2つの実験における遺伝子発現の変化を
求める。データ表示領域には、この比較によって生成さ
れたデータが表形式で示されている。「Experiment Nam
e 」は、比較実験に対してユーザーが規定した名称を示
す。「Gene Name 」は、遺伝子の名称を示す。「Inc」
及び「Dec 」の数値は、図28を参照して説明したよう
に、NINCおよびNDECの値を示す。具体的には、
「Inc 」は、完全対合プローブと不対合プローブのハイ
ブリッド形成強度の差及び比が実験データにおいて有意
に大きいような遺伝子における塩基位置の数を示す。
度が増加した塩基位置の数を解析対象の遺伝子における
全ての塩基位置の数で割った値を示す。「Dec Ratio 」
欄は、ハイブリッド形成強度が減少した塩基位置の数を
解析対象の遺伝子における全ての塩基位置の数で割った
値を示す。「Pos Change」欄は、実験データと基準デー
タにおいて正の得点を有するプローブ対の数の差を示
す。「Neg Change」欄は、実験データと基準データにお
いて負の得点を有するプローブ対(完全対合プローブと
不対合プローブ)の数の差を示す。
イブリッド形成強度が増加したプローブ対の数とハイブ
リッド形成強度が減少したプローブ対の数の比を示す。
「Avg Diff」欄は、実験データにおける平均強度差を示
す。
は、所定の遺伝子に関する2つの実験における発現レベ
ルの変化を示す。この欄において、Iは遺伝子発現の増
加を、MIは遺伝子発現の増加傾向を、Dは遺伝子発現
の減少を、MDは遺伝子発現の減少傾向を、NCは変化
なしを、?は未知であることを、それぞれ示す。好適な
実施例において、発現レベルの変化は、図29のステッ
プ1326を参照して説明したように計算される。
ーは、データ解析のためにグラフを選択することもでき
る。グラフィックス表示領域1402には、基準データ
と実験データを示す3つのグラフが表示されている。
の変化を3次元棒グラフの形で示したスクリーンディス
プレイを示す。スクリーンディスプレイ1440のグラ
フィックス表示領域1442には、データ表示領域14
44で選択された遺伝子の発現レベルを示す3次元棒グ
ラフが表示されている。ユーザーは、一つあるいは複数
の遺伝子をデータ表示領域で選択して、これら遺伝子の
発現レベルを示す3次元棒グラフを作成するようにシス
テムに命令する。好適な実施例において、発現レベル
は、平均強度差(即ち、(IDIF)の平均)として与
えられる。3次元棒グラフにより、ユーザーは、簡単
に、複数の遺伝子の発現レベルを調べることができる。
また、複数の実験結果から選択された、同じ遺伝子に関
するデータを同時に示して回転させることにより、発現
レベルの差を表示するようにすることもできる。
するものではない。当業者に明らかなように、この開示
に基づき、本発明を様々に変更することができる。例え
ば、本発明では、(天然のものも人工のものも含めて)
DNAの評価に関して説明しているが、本発明の方法
を、RNAのような他の物質が合成されたチップの解析
に適用することも可能である。従って、本発明の範囲
は、先の説明によって決まるものではなく、特許請求の
範囲およびそれと等価と考えられる全範囲によって決定
される。
れるコンピュータシステムの例を示す図。
ブロック図。
を形成し、解析するための全体的なシステムをを示す
図。
例を示す図。
な構成を示す図。
合する様子を概念的に示す図。
図。
のハイブリッド形成パターンを示す図。
表すスクリーンディスプレイを示す図。
ら塩基コールを演算する方法を示すフローチャート。
ら塩基コールを演算する別の方法を示すフローチャー
ト。
処理を行う方法を示すフローチャート。
処理を行う方法を示すフローチャート。
を呼び出す方法を示すフローチャート。
ットグループを選択する方法を示すフローチャート。
データに基づきヌクレオチドを解析するためのスクリー
ンディスプレイを示す図。
データに基づきヌクレオチドを解析するためのスクリー
ンディスプレイを示す図。
ブリッド形成強度を比較することにより、ある遺伝子の
発現状態を監視する方法を示すフローチャート。
うかを判定する方法を示すフローチャート。
ーンディスプレイの配置を示す図。
ンディスプレイを示す図。
ンディスプレイを示す図。
リーンディスプレイを示す図。
比較を表すスクリーンディスプレイを示す図。
比較を表す別のスクリーンディスプレイを示す図。
比較をグラフィックス表示領域における複数のグラフを
用いて表す別のスクリーンディスプレイを示す図。
ることにより、ある遺伝子の発現状態を決定する方法を
示すフローチャート。
ることにより、ある遺伝子の発現状態を決定する方法を
示すフローチャート。
スクリーンディスプレイを示す図。
スクリーンディスプレイを示す図。
元棒グラフの形で表すスクリーンディスプレイを示す
図。
Claims (35)
- 【請求項1】 コンピュータシステムにおいて、検体の
核酸配列を解析するための方法であって、 前記検体の核酸配列の少なくとも一部分に沿った各塩基
位置に対して、複数の塩基コールを入力する工程と、 各塩基位置に対して、前記複数の塩基コールを解析して
単一塩基コールを生成する工程と、 前記検体の核酸配列の少なくとも一部分に沿った複数の
塩基位置に対する複数の単一塩基コールであって、前記
検体の核酸配列における特定の塩基位置に対する前記複
数の塩基コールからそれぞれ導かれた単一塩基コールを
表示する工程と、を備える方法。 - 【請求項2】 請求項1記載の方法であって、 前記解析工程は、 各塩基位置に対して、前記複数の塩基コールの中から最
も発生頻度の高い塩基コールを求める工程と、 前記単一塩基コールを、前記塩基位置において最も発生
頻度の高い塩基コールとして生成する工程と、を備える
方法。 - 【請求項3】 請求項1記載の方法であって、更に、 ユーザーによる起動に応じて各塩基位置に前記複数の塩
基コールを表示させるためのスクリーンアイコンを表示
する工程、を備える方法。 - 【請求項4】 請求項1記載の方法であって、更に、 ユーザーによる起動に応じて各塩基位置に前記複数の塩
基コールを表示させないためのスクリーンアイコンを表
示する工程、を備える方法。 - 【請求項5】 請求項1記載の方法であって、更に、 塩基位置に従って、前記単一塩基コールと並べて各塩基
における前記複数の塩基コールを表示する工程、を備え
る方法。 - 【請求項6】 請求項5記載の方法であって、更に、 前記複数の塩基コールの各々と共に、プローブと前記検
体の核酸配列とのハイブリッド形成親和性を示すハイブ
リッド形成強度を表示する工程を備え、 各塩基コールは前記ハイブリッド形成強度の解析により
求められる、方法。 - 【請求項7】 コンピュータシステムにおいて、検体の
核酸配列における未知の塩基を呼び出すための方法であ
って、 複数組の核酸プローブに関するハイブリッド形成強度で
あって、それぞれ核酸プローブと前記検体の核酸配列と
の間のハイブリッド形成親和性を示すハイブリッド形成
強度を入力する工程と、 各組のプローブに関して前記未知の塩基に対する塩基コ
ールを演算する工程と、 前記複数組のプローブに関して最も発生頻度の高い前記
未知の塩基に対する塩基コールに従って、前記複数組の
プローブに対する単一塩基コールを演算する工程と、を
備える方法。 - 【請求項8】 請求項7記載の方法であって、 各組のプローブが同一の参照配列に従って生成されたも
のである、方法。 - 【請求項9】 請求項7記載の方法であって、更に、 所定の条件下で、前記複数組の核酸プローブに関する前
記単一塩基コールを特定する例外規則をチェックする工
程、を備える方法。 - 【請求項10】 コンピュータシステムにおいて、コン
ピュータによる塩基呼び出し処理に関するパラメータを
動的に変更する方法であって、 ユーザによって変更可能なパラメータを含む前記塩基呼
び出し処理を利用して、検体の核酸配列の少なくとも一
部に関する塩基コールを生成する工程と、 前記検体の核酸配列の少なくとも一部に関する複数の塩
基コールを表示する工程と、 前記塩基呼び出し処理のパラメータを表示する工程と、 前記塩基呼び出し処理のパラメータに対する新しい値を
規定する入力をユーザーから受け取る工程と、 前記塩基呼び出し処理と前記パラメータに関する新しい
値とを用いて、前記検体の核酸配列の少なくとも一部に
関して更新された塩基コールを生成する工程と、 前記検体の核酸配列の少なくとも一部に関して前記更新
された塩基コールを表示する工程と、を備える方法。 - 【請求項11】 請求項10記載の方法であって、更
に、 前記塩基呼び出し処理のための、複数のユーザ変更可能
なパラメータを表示する工程、を備える方法。 - 【請求項12】 請求項10記載の方法であって、 前記パラメータが、定数、閾値、および、範囲から成る
グループから選択される、方法。 - 【請求項13】 コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現を監視する方法であっ
て、 前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、 前記検体の核酸配列の遺伝子発現コールを生成するため
に、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する工程と、 前記遺伝子発現コールを表示する工程と、を備える方
法。 - 【請求項14】 請求項13記載の方法であって、更
に、 或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の差分を、差分の閾値と比較
する工程、を備える方法。 - 【請求項15】 請求項13記載の方法であって、更
に、 或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の比を、比の閾値と比較する
工程、を備える方法。 - 【請求項16】 請求項13記載の方法であって、更
に、 決定行列を用いて前記遺伝子発現コールを決定する工
程、を備える方法。 - 【請求項17】 請求項13記載の方法であって、 前記遺伝子発現コールが、発現している、どちらともい
えない、発現していない、から成るグループから選択さ
れる、方法。 - 【請求項18】 コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現を監視する方法であっ
て、 前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、 各対の完全対合プローブと不対合プローブのハイブリッ
ド形成強度を比較する工程と、 前記検体の核酸配列の遺伝子発現コールを生成する工程
と、を備える方法。 - 【請求項19】 請求項18記載の方法であって、更
に、 或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の差分を、差分の閾値と比較
する工程、を備える方法。 - 【請求項20】 請求項18記載の方法であって、更
に、 或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の比を、比の閾値と比較する
工程、を備える方法。 - 【請求項21】 請求項18記載の方法であって、更
に、 決定行列を用いて前記遺伝子発現コールを求める工程、
を備える方法。 - 【請求項22】 請求項18記載の方法であって、 前記遺伝子発現コールが、発現している、どちらともい
えない、発現していない、から成るグループから選択さ
れる、方法。 - 【請求項23】 コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現変化を監視する方法で
あって、 前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、 前記検体の核酸配列の遺伝子発現レベルを生成するため
に、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する工程と、 前記遺伝子発現レベルを、基準の遺伝子発現レベルと比
較することにより発現変化を求める工程と、 前記検体の核酸配列における前記遺伝子の発現変化を表
示する工程と、を備える方法。 - 【請求項24】 請求項23記載の方法であって、 前記発現変化がグラフで表示される、方法。
- 【請求項25】 請求項23記載の方法であって、更
に、 請求項23の前記入力工程と前記比較工程に従って、前
記基準の遺伝子発現レベルを生成する工程、を備える方
法。 - 【請求項26】 請求項23記載の方法であって、更
に、 前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、差分の閾値に対し
て比較する工程、を備える方法。 - 【請求項27】 請求項23記載の方法であって、更
に、 前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、比の閾値に対して
比較する工程、を備える方法。 - 【請求項28】 請求項23記載の方法であって、更
に、 決定行列を用いて前記検体の核酸配列における前記遺伝
子の発現変化を決定する工程、を備える方法。 - 【請求項29】 請求項23記載の方法であって、 前記検体の核酸配列における前記遺伝子の発現変化が、
増加、増加傾向、減少、減少傾向、変化なし、から成る
グループから選択される、方法。 - 【請求項30】 コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現変化を監視する方法で
あって、 前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、 前記検体の核酸配列の遺伝子発現レベルを生成するため
に、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する工程と、 前記遺伝子発現レベルを、基準の遺伝子発現レベルと比
較することにより発現変化を求める工程と、を備える方
法。 - 【請求項31】 請求項30記載の方法であって、更
に、 請求項30の前記入力工程と前記比較工程に従って、前
記基準の遺伝子発現レベルを生成する工程、を備える方
法。 - 【請求項32】 請求項30記載の方法であって、更
に、 前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、差分の閾値に対し
て比較する工程、を備える方法。 - 【請求項33】 請求項30記載の方法であって、更
に、 前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、比の閾値に対して
比較する工程、を備える方法。 - 【請求項34】 請求項30記載の方法であって、更
に、 決定行列を用いて、前記検体の核酸配列における前記遺
伝子の発現変化を決定する工程、を備える方法。 - 【請求項35】 請求項30記載の方法であって、 前記検体の核酸配列における前記遺伝子の発現変化が、
増加、増加傾向、減少、減少傾向、変化なし、から成る
グループから選択される、方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3305396P | 1996-12-12 | 1996-12-12 | |
US08/828,952 | 1997-03-28 | ||
US08/828,952 US6600996B2 (en) | 1994-10-21 | 1997-03-28 | Computer-aided techniques for analyzing biological sequences |
US60/033,053 | 1997-03-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10272000A true JPH10272000A (ja) | 1998-10-13 |
Family
ID=26709224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9369833A Pending JPH10272000A (ja) | 1996-12-12 | 1997-12-11 | コンピュータを利用した生物学的配列の解析技術 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6600996B2 (ja) |
EP (1) | EP0848067A3 (ja) |
JP (1) | JPH10272000A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7254488B2 (en) | 2001-02-28 | 2007-08-07 | Canon Kabushiki Kaisha | Probe designing method and information processing apparatus |
US7283912B2 (en) | 2003-04-02 | 2007-10-16 | Canon Kabushiki Kaisha | DNA probe design device and information processing method for DNA probe design |
US7445899B2 (en) | 2000-08-31 | 2008-11-04 | Canon Kabushiki Kaisha | Screening method for gene variation |
Families Citing this family (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5795716A (en) * | 1994-10-21 | 1998-08-18 | Chee; Mark S. | Computer-aided visualization and analysis system for sequence evaluation |
US20030220748A1 (en) * | 1994-10-21 | 2003-11-27 | Affymetrix, Inc., A California Corporation | Computer-aided techniques for analyzing biological sequences |
US20040175718A1 (en) * | 1995-10-16 | 2004-09-09 | Affymetrix, Inc. | Computer-aided visualization and analysis system for sequence evaluation |
US6519583B1 (en) * | 1997-05-15 | 2003-02-11 | Incyte Pharmaceuticals, Inc. | Graphical viewer for biomolecular sequence data |
US6420108B2 (en) * | 1998-02-09 | 2002-07-16 | Affymetrix, Inc. | Computer-aided display for comparative gene expression |
WO1999005574A1 (en) | 1997-07-25 | 1999-02-04 | Affymetrix, Inc. | Method and system for providing a probe array chip design database |
US20040199544A1 (en) * | 2000-11-02 | 2004-10-07 | Affymetrix, Inc. | Method and apparatus for providing an expression data mining database |
US6185561B1 (en) | 1998-09-17 | 2001-02-06 | Affymetrix, Inc. | Method and apparatus for providing and expression data mining database |
US6489096B1 (en) | 1998-10-15 | 2002-12-03 | Princeton University | Quantitative analysis of hybridization patterns and intensities in oligonucleotide arrays |
US6263287B1 (en) | 1998-11-12 | 2001-07-17 | Scios Inc. | Systems for the analysis of gene expression data |
US6653151B2 (en) | 1999-07-30 | 2003-11-25 | Large Scale Proteomics Corporation | Dry deposition of materials for microarrays using matrix displacement |
US6713309B1 (en) | 1999-07-30 | 2004-03-30 | Large Scale Proteomics Corporation | Microarrays and their manufacture |
US6505125B1 (en) * | 1999-09-28 | 2003-01-07 | Affymetrix, Inc. | Methods and computer software products for multiple probe gene expression analysis |
CA2406402A1 (en) * | 2000-04-25 | 2001-11-01 | Affymetrix, Inc. | Methods for monitoring the expression of alternatively spliced genes |
US7363165B2 (en) | 2000-05-04 | 2008-04-22 | The Board Of Trustees Of The Leland Stanford Junior University | Significance analysis of microarrays |
US7062092B2 (en) * | 2000-08-22 | 2006-06-13 | Affymetrix, Inc. | System, method, and computer software product for gain adjustment in biological microarray scanner |
JP2002357606A (ja) * | 2000-11-21 | 2002-12-13 | Affymetrix Inc | 核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品 |
US20020183936A1 (en) * | 2001-01-24 | 2002-12-05 | Affymetrix, Inc. | Method, system, and computer software for providing a genomic web portal |
US20030104410A1 (en) * | 2001-03-16 | 2003-06-05 | Affymetrix, Inc. | Human microarray |
EP1390526A4 (en) * | 2001-04-18 | 2005-02-02 | Perlegen Sciences Inc | METHOD FOR IDENTIFYING THE EVOLUTIONARY PRESERVED SEQUENCES |
US20040210400A1 (en) * | 2003-01-27 | 2004-10-21 | Perlegen Sciences, Inc. | Analysis methods for individual genotyping |
US20050019787A1 (en) * | 2003-04-03 | 2005-01-27 | Perlegen Sciences, Inc., A Delaware Corporation | Apparatus and methods for analyzing and characterizing nucleic acid sequences |
GB0406800D0 (en) * | 2004-03-26 | 2004-04-28 | Univ Nottingham | Microarray method |
US7962291B2 (en) | 2005-09-30 | 2011-06-14 | Affymetrix, Inc. | Methods and computer software for detecting splice variants |
US11001881B2 (en) | 2006-08-24 | 2021-05-11 | California Institute Of Technology | Methods for detecting analytes |
JP2009540299A (ja) * | 2006-06-05 | 2009-11-19 | カリフォルニア インスティテュート オブ テクノロジー | リアルタイムマイクロアレイ |
WO2008014485A2 (en) | 2006-07-28 | 2008-01-31 | California Institute Of Technology | Multiplex q-pcr arrays |
US11525156B2 (en) | 2006-07-28 | 2022-12-13 | California Institute Of Technology | Multiplex Q-PCR arrays |
US11560588B2 (en) | 2006-08-24 | 2023-01-24 | California Institute Of Technology | Multiplex Q-PCR arrays |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
EP2472470A3 (en) * | 2010-09-15 | 2014-01-15 | MBT Technology LLC | System, method & computer program for presenting an automated assessment of a sample's response to external influences |
ES2523140T3 (es) | 2010-09-21 | 2014-11-21 | Population Genetics Technologies Ltd. | Aumento de la confianza en las identificaciones de alelos con el recuento molecular |
ES2776673T3 (es) | 2012-02-27 | 2020-07-31 | Univ North Carolina Chapel Hill | Métodos y usos para etiquetas moleculares |
AU2013226081B2 (en) | 2012-02-27 | 2018-06-14 | Becton, Dickinson And Company | Compositions and kits for molecular counting |
WO2013128281A1 (en) | 2012-02-28 | 2013-09-06 | Population Genetics Technologies Ltd | Method for attaching a counter sequence to a nucleic acid sample |
US10876152B2 (en) | 2012-09-04 | 2020-12-29 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US11913065B2 (en) | 2012-09-04 | 2024-02-27 | Guardent Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
SG11201501662TA (en) | 2012-09-04 | 2015-05-28 | Guardant Health Inc | Systems and methods to detect rare mutations and copy number variation |
US20140089328A1 (en) * | 2012-09-27 | 2014-03-27 | International Business Machines Corporation | Association of data to a biological sequence |
WO2015031691A1 (en) | 2013-08-28 | 2015-03-05 | Cellular Research, Inc. | Massively parallel single cell analysis |
CN105745528A (zh) | 2013-10-07 | 2016-07-06 | 赛卢拉研究公司 | 用于以数字方式对阵列上的特征进行计数的方法和系统 |
EP3524694B1 (en) | 2013-12-28 | 2020-07-15 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
EP3766988B1 (en) | 2015-02-19 | 2024-02-14 | Becton, Dickinson and Company | High-throughput single-cell analysis combining proteomic and genomic information |
ES2836802T3 (es) | 2015-02-27 | 2021-06-28 | Becton Dickinson Co | Códigos de barras moleculares espacialmente direccionables |
US9708647B2 (en) | 2015-03-23 | 2017-07-18 | Insilixa, Inc. | Multiplexed analysis of nucleic acid hybridization thermodynamics using integrated arrays |
ES2934982T3 (es) | 2015-03-30 | 2023-02-28 | Becton Dickinson Co | Métodos para la codificación con códigos de barras combinatorios |
WO2016172373A1 (en) | 2015-04-23 | 2016-10-27 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
WO2016196229A1 (en) | 2015-06-01 | 2016-12-08 | Cellular Research, Inc. | Methods for rna quantification |
US9499861B1 (en) | 2015-09-10 | 2016-11-22 | Insilixa, Inc. | Methods and systems for multiplex quantitative nucleic acid amplification |
JP6940484B2 (ja) | 2015-09-11 | 2021-09-29 | セルラー リサーチ, インコーポレイテッド | ライブラリー正規化のための方法および組成物 |
EP3390668A4 (en) | 2015-12-17 | 2020-04-01 | Guardant Health, Inc. | METHODS OF DETERMINING THE NUMBER OF TUMOR GENE COPIES BY ACELLULAR DNA ANALYSIS |
WO2017155858A1 (en) | 2016-03-07 | 2017-09-14 | Insilixa, Inc. | Nucleic acid sequence identification using solid-phase cyclic single base extension |
JP7129343B2 (ja) | 2016-05-02 | 2022-09-01 | ベクトン・ディキンソン・アンド・カンパニー | 正確な分子バーコーディング |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
JP7046007B2 (ja) | 2016-05-26 | 2022-04-01 | ベクトン・ディキンソン・アンド・カンパニー | 分子標識カウントの調節方法 |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
SG11201901733PA (en) | 2016-09-26 | 2019-04-29 | Cellular Res Inc | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
CN109952612B (zh) | 2016-11-08 | 2023-12-01 | 贝克顿迪金森公司 | 用于表达谱分类的方法 |
US11608497B2 (en) | 2016-11-08 | 2023-03-21 | Becton, Dickinson And Company | Methods for cell label classification |
ES2961580T3 (es) | 2017-01-13 | 2024-03-12 | Cellular Res Inc | Revestimiento hidrófilo de canales de fluidos |
CN110382708A (zh) | 2017-02-01 | 2019-10-25 | 赛卢拉研究公司 | 使用阻断性寡核苷酸进行选择性扩增 |
US10676779B2 (en) | 2017-06-05 | 2020-06-09 | Becton, Dickinson And Company | Sample indexing for single cells |
US11946095B2 (en) | 2017-12-19 | 2024-04-02 | Becton, Dickinson And Company | Particles associated with oligonucleotides |
EP3788171B1 (en) | 2018-05-03 | 2023-04-05 | Becton, Dickinson and Company | High throughput multiomics sample analysis |
US11365409B2 (en) | 2018-05-03 | 2022-06-21 | Becton, Dickinson And Company | Molecular barcoding on opposite transcript ends |
US11639517B2 (en) | 2018-10-01 | 2023-05-02 | Becton, Dickinson And Company | Determining 5′ transcript sequences |
WO2020097315A1 (en) | 2018-11-08 | 2020-05-14 | Cellular Research, Inc. | Whole transcriptome analysis of single cells using random priming |
WO2020123384A1 (en) | 2018-12-13 | 2020-06-18 | Cellular Research, Inc. | Selective extension in single cell whole transcriptome analysis |
US11371076B2 (en) | 2019-01-16 | 2022-06-28 | Becton, Dickinson And Company | Polymerase chain reaction normalization through primer titration |
ES2945227T3 (es) | 2019-01-23 | 2023-06-29 | Becton Dickinson Co | Oligonucleótidos asociados con anticuerpos |
EP3937780A4 (en) | 2019-03-14 | 2022-12-07 | InSilixa, Inc. | METHODS AND SYSTEMS FOR TIMED FLUORESCENCE-BASED DETECTION |
US11965208B2 (en) | 2019-04-19 | 2024-04-23 | Becton, Dickinson And Company | Methods of associating phenotypical data and single cell sequencing data |
EP4004231A1 (en) | 2019-07-22 | 2022-06-01 | Becton, Dickinson and Company | Single cell chromatin immunoprecipitation sequencing assay |
EP4055160B1 (en) | 2019-11-08 | 2024-04-10 | Becton Dickinson and Company | Using random priming to obtain full-length v(d)j information for immune repertoire sequencing |
CN115244184A (zh) | 2020-01-13 | 2022-10-25 | 贝克顿迪金森公司 | 用于定量蛋白和rna的方法和组合物 |
EP4150118A1 (en) | 2020-05-14 | 2023-03-22 | Becton Dickinson and Company | Primers for immune repertoire profiling |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
EP4247967A1 (en) | 2020-11-20 | 2023-09-27 | Becton, Dickinson and Company | Profiling of highly expressed and lowly expressed proteins |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4741043B1 (en) | 1985-11-04 | 1994-08-09 | Cell Analysis Systems Inc | Method of and apparatus for image analyses of biological specimens |
US4981783A (en) * | 1986-04-16 | 1991-01-01 | Montefiore Medical Center | Method for detecting pathological conditions |
US5525464A (en) | 1987-04-01 | 1996-06-11 | Hyseq, Inc. | Method of sequencing by hybridization of oligonucleotide probes |
US5202231A (en) | 1987-04-01 | 1993-04-13 | Drmanac Radoje T | Method of sequencing of genomes by hybridization of oligonucleotide probes |
GB8810400D0 (en) | 1988-05-03 | 1988-06-08 | Southern E | Analysing polynucleotide sequences |
US4965725B1 (en) | 1988-04-08 | 1996-05-07 | Neuromedical Systems Inc | Neural network based automated cytological specimen classification system and method |
US5002867A (en) | 1988-04-25 | 1991-03-26 | Macevicz Stephen C | Nucleic acid sequence determination by multiple mixed oligonucleotide probes |
US5527681A (en) | 1989-06-07 | 1996-06-18 | Affymax Technologies N.V. | Immobilized molecular synthesis of systematically substituted compounds |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US6040138A (en) * | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
EP1231282A3 (en) | 1990-12-06 | 2005-05-18 | Affymetrix, Inc. | Methods and compositions for identification of polymers |
JPH06504997A (ja) | 1990-12-06 | 1994-06-09 | アフィメトリックス, インコーポレイテッド | 非常に大きい規模の固定化されたポリマーの合成 |
US5460908A (en) | 1991-08-02 | 1995-10-24 | Micron Technology, Inc. | Phase shifting retical fabrication method |
US5502773A (en) | 1991-09-20 | 1996-03-26 | Vanderbilt University | Method and apparatus for automated processing of DNA sequence data |
US5235626A (en) | 1991-10-22 | 1993-08-10 | International Business Machines Corporation | Segmented mask and exposure system for x-ray lithography |
US5384261A (en) | 1991-11-22 | 1995-01-24 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis using mechanically directed flow paths |
US6114114A (en) | 1992-07-17 | 2000-09-05 | Incyte Pharmaceuticals, Inc. | Comparative gene transcript analysis |
US5288514A (en) | 1992-09-14 | 1994-02-22 | The Regents Of The University Of California | Solid phase and combinatorial synthesis of benzodiazepine compounds on a solid support |
US5273632A (en) | 1992-11-19 | 1993-12-28 | University Of Utah Research Foundation | Methods and apparatus for analysis of chromatographic migration patterns |
WO1995011995A1 (en) | 1993-10-26 | 1995-05-04 | Affymax Technologies N.V. | Arrays of nucleic acid probes on biological chips |
US5470710A (en) | 1993-10-22 | 1995-11-28 | University Of Utah | Automated hybridization/imaging device for fluorescent multiplex DNA sequencing |
US5795716A (en) * | 1994-10-21 | 1998-08-18 | Chee; Mark S. | Computer-aided visualization and analysis system for sequence evaluation |
US6974666B1 (en) | 1994-10-21 | 2005-12-13 | Appymetric, Inc. | Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA |
US5733729A (en) * | 1995-09-14 | 1998-03-31 | Affymetrix, Inc. | Computer-aided probability base calling for arrays of nucleic acid probes on chips |
EP0880598A4 (en) * | 1996-01-23 | 2005-02-23 | Affymetrix Inc | RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM |
US5994076A (en) * | 1997-05-21 | 1999-11-30 | Clontech Laboratories, Inc. | Methods of assaying differential expression |
US6268147B1 (en) * | 1998-11-02 | 2001-07-31 | Kenneth Loren Beattie | Nucleic acid analysis using sequence-targeted tandem hybridization |
US6232068B1 (en) * | 1999-01-22 | 2001-05-15 | Rosetta Inpharmatics, Inc. | Monitoring of gene expression by detecting hybridization to nucleic acid arrays using anti-heteronucleic acid antibodies |
-
1997
- 1997-03-28 US US08/828,952 patent/US6600996B2/en not_active Expired - Fee Related
- 1997-12-11 JP JP9369833A patent/JPH10272000A/ja active Pending
- 1997-12-11 EP EP97310019A patent/EP0848067A3/en not_active Ceased
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7445899B2 (en) | 2000-08-31 | 2008-11-04 | Canon Kabushiki Kaisha | Screening method for gene variation |
US7254488B2 (en) | 2001-02-28 | 2007-08-07 | Canon Kabushiki Kaisha | Probe designing method and information processing apparatus |
US7283912B2 (en) | 2003-04-02 | 2007-10-16 | Canon Kabushiki Kaisha | DNA probe design device and information processing method for DNA probe design |
Also Published As
Publication number | Publication date |
---|---|
EP0848067A2 (en) | 1998-06-17 |
US6600996B2 (en) | 2003-07-29 |
US20020183933A1 (en) | 2002-12-05 |
EP0848067A3 (en) | 2002-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10272000A (ja) | コンピュータを利用した生物学的配列の解析技術 | |
US6066454A (en) | Computer-aided probability base calling for arrays of nucleic acid probes on chips | |
US6242180B1 (en) | Computer-aided visualization and analysis system for sequence evaluation | |
US7280922B2 (en) | System, method, and computer software for genotyping analysis and identification of allelic imbalance | |
Steinmetz et al. | Maximizing the potential of functional genomics | |
US7991560B2 (en) | System, method, and computer software for the presentation and storage of analysis results | |
EP0923050B1 (en) | Scanned image alignment systems and methods | |
US8204695B2 (en) | Techniques for identifying, confirming, mapping, and categorizing polymers | |
US11188778B1 (en) | Equalization-based image processing and spatial crosstalk attenuator | |
JP2020524499A (ja) | 配列バリアントコールのためのバリデーションの方法及びシステム | |
US6850846B2 (en) | Computer software for genotyping analysis using pattern recognition | |
JP2002357606A (ja) | 核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品 | |
EP1019538B1 (en) | Techniques for identifying, confirming, mapping and categorizing polymers | |
US20040175718A1 (en) | Computer-aided visualization and analysis system for sequence evaluation | |
WO2002004676A2 (en) | Composite and averaged hybridizations | |
US20030220748A1 (en) | Computer-aided techniques for analyzing biological sequences | |
EP1632579A2 (en) | Computer-aided techniques for analyzing biological sequences | |
Shah et al. | Genomic FISHing: data analysis for chromosomal imbalances using DNA arrays | |
US20080090236A1 (en) | Methods and systems for identifying tumor progression in comparative genomic hybridization data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070515 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071016 |