JP2003534551A - Method and computer software product for transcription annotation - Google Patents

Method and computer software product for transcription annotation

Info

Publication number
JP2003534551A
JP2003534551A JP2001586461A JP2001586461A JP2003534551A JP 2003534551 A JP2003534551 A JP 2003534551A JP 2001586461 A JP2001586461 A JP 2001586461A JP 2001586461 A JP2001586461 A JP 2001586461A JP 2003534551 A JP2003534551 A JP 2003534551A
Authority
JP
Japan
Prior art keywords
probe
region
probes
nucleic acid
hybridization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001586461A
Other languages
Japanese (ja)
Inventor
カーステン ローズナウ,
トーマス ジンゲラス,
Original Assignee
アフィメトリックス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アフィメトリックス インコーポレイテッド filed Critical アフィメトリックス インコーポレイテッド
Publication of JP2003534551A publication Critical patent/JP2003534551A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 方法およびコンピュータソフトウエアプロダクトが、転写の注釈のために提供される。本発明の1つの実施形態において、全てのプローブのハイブリダイゼーションの強度が閾値(通常、非特異的ハイブリダイゼーションのレベル)より上であるゲノムの領域が同定される。この領域は、ゲノムに対してプローブを整列させ、全ての連続的なプローブが閾値レベルより上の強度を有する領域を見つけ出すためにゲノムにわたってウォーキングすることによって同定され得る。   (57) [Summary] Methods and computer software products are provided for transcript annotation. In one embodiment of the invention, regions of the genome where the intensity of hybridization of all probes is above a threshold (usually the level of non-specific hybridization). This region can be identified by aligning the probes to the genome and walking across the genome to find a region where all successive probes have an intensity above a threshold level.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】 (関連出願) 本出願は、2000年8月16日に出願されたUSSN09/641,081
;2000年5月19日に出願されたUSSN60/205,432;および2
000年5月24日に出願されたUSSN60/206,866の優先権を主張
し、これらは、すべての目的についてそれら全体で参考として援用される。
(Related Application) This application is related to USSN 09 / 641,081 filed on August 16, 2000.
USSN 60 / 205,432, filed May 19, 2000; and 2;
Claimed priority of USSN 60 / 206,866, filed May 24, 000, which are incorporated by reference in their entirety for all purposes.

【0002】 (発明の分野) 本発明は、遺伝学的分析およびバイオインフォマティクスに関する。[0002]   (Field of the invention)   The present invention relates to genetic analysis and bioinformatics.

【0003】 (発明の背景) 多くの生物学的機能は、遺伝子DNAのコピー数の変化を介して、特定の遺伝
子の転写のレベルの変化を介して(例えば、開始の制御、RNA前駆体の準備、
RNAプロセシングなどによる)、またはタンパク質合成における変化を介して
のいずれかによって、種々の遺伝子の発現レベルを制御することによって実行さ
れる。例えば、細胞サイクルおよび細胞分化の制御、ならびに疾患は、遺伝子の
グループの転写レベルにおける変化によって特徴付けられる。
BACKGROUND OF THE INVENTION Many biological functions are mediated by alterations in the copy number of gene DNA, through alterations in the level of transcription of a particular gene (eg, initiation control, RNA precursors). Preparation,
By controlling the expression levels of various genes, either by (such as by RNA processing) or through changes in protein synthesis. For example, control of cell cycle and cell differentiation, and disease are characterized by alterations in the transcriptional levels of groups of genes.

【0004】 20種の細菌ゲノムより多い完全なゲノム配列がすでに公に入手可能である。
しかし、ゲノムの転写される領域は、ほとんど知られていない。転写される領域
およびそれらの機能的重要性を発見するための方法が必要とされる。
Complete genomic sequences of more than 20 bacterial genomes are already publicly available.
However, little is known about the transcribed region of the genome. Methods for discovering transcribed regions and their functional significance are needed.

【0005】 (発明の要旨) 本発明は、転写物を同定するための方法およびコンピュータプログラムプロダ
クトを提供する。この方法およびコンピュータプログラムプロダクトは、遺伝学
的研究、薬物発見、診断および薬理遺伝学における適用を有する。
SUMMARY OF THE INVENTION The present invention provides methods and computer program products for identifying transcripts. This method and computer program product has applications in genetic research, drug discovery, diagnostics and pharmacogenetics.

【0006】 いくつかの実施形態において、ゲノムの領域に対する核酸プローブは、そのゲ
ノムを有する種から誘導される生物学的サンプルとハイブリダイズされる。ハイ
ブリダイゼーションシグナルは、潜在的な転写物を決定するために分析される。
すべてのプローブのハイブリダイゼーションの強度が閾値(通常、非特異的なハ
イブリダイゼーションのレベル)よりも上であるゲノムの領域が同定される。こ
の領域は、ゲノムに対してプローブを整列させること;すべての連続的なプロー
ブが閾値より上の強度を有する領域を見つけ出すためにゲノムにわたってウォー
キング(walking)することによって同定される。いくつかの実施形態に
おいて、閾値は、対応するミスマッチプローブの強度であり得る。
In some embodiments, a nucleic acid probe for a region of the genome is hybridized with a biological sample derived from a species bearing that genome. Hybridization signals are analyzed to determine potential transcripts.
Regions of the genome where the intensity of hybridization of all probes is above a threshold (usually the level of non-specific hybridization) are identified. This region is identified by aligning the probe to the genome; walking all over the genome to find regions where all consecutive probes have intensities above a threshold. In some embodiments, the threshold can be the strength of the corresponding mismatch probe.

【0007】 同定される領域は、潜在的に一つの転写物に対応する。いくつかの実施形態に
おいて、同定された領域にそれぞれにおけるプローブのハイブリダイゼーション
の強度は、さらに大きさにおける変化を検出するために分析される。例えば、4
0プローブによってカバーされる同定された領域において、第1の20のプロー
ブの強度が同じ強度を有し、最後の20のプローブもまた、同じ強度を有し;そ
して第1の20のプローブの強度が最後の20のプローブの強度の2倍である場
合、この領域は、少なくとも2つの別の転写領域を含み得る:第1は第2の20
のプローブによってカバーされ、第2は最後の20のプローブによってカバーさ
れる。
The identified region potentially corresponds to one transcript. In some embodiments, the intensity of probe hybridization in each of the identified regions is further analyzed to detect changes in size. For example, 4
In the identified region covered by 0 probe, the intensities of the first 20 probes have the same intensity, and the last 20 probes also have the same intensity; and the intensities of the first 20 probes Is twice the intensity of the last 20 probes, this region may contain at least two additional transcribed regions: the first and the second 20.
, The second is covered by the last 20 probes.

【0008】 いくつかの実施形態において、プローブ強度は、コンピュータの注釈に関して
転写物の位置を同定するために使用される。複数のプローブが同じ強度を有する
と、1つの転写物である可能性がより高い。
In some embodiments, probe intensity is used to identify the location of transcripts with respect to computer annotation. If multiple probes have the same intensity, it is more likely to be one transcript.

【0009】 いくつかの他の実施形態において、非コード領域のプローブの強度は、以前に
は同定されていない転写物を同定するために使用される。複数のプローブが同じ
強度を有すると、1つの転写物である可能性がより高い。
In some other embodiments, the strength of the probe in the non-coding region is used to identify previously unidentified transcripts. If multiple probes have the same intensity, it is more likely to be one transcript.

【0010】 いくつかのさらなる実施形態において、コード領域の5’および3’末端にお
けるプローブ強度は、未知の機能を有する潜在的な制御配列、終止配列または終
止領域を同定するために使用される。
In some further embodiments, probe strength at the 5 ′ and 3 ′ ends of the coding region is used to identify potential control sequences, termination sequences or regions with unknown function.

【0011】 いくつかのさらなる実施形態において、同じプローブ強度を有するコード領域
および非コード領域を含む複数の隣接転写物は、1つのオペロンの可能性が高い
In some further embodiments, multiple contiguous transcripts containing coding and non-coding regions with the same probe strength are likely one operon.

【0012】 本発明の別の局面において、転写の注釈についてのコンピュータソフトウエア
プロダクトを提供する。いくつかの実施形態において、コンピュータソフトウエ
アプロダクトは、プローブ強度を入力するためのコンピュータプログラムコード
、プローブの強度が閾値を越えるゲノム領域を同定するためのコンピュータプロ
グラムコード、およびプローブ強度が同じ領域を同定するためにゲノム領域のプ
ローブの強度を比較するためのコードを含む。これらの領域のそれぞれは、潜在
的な転写物として示され得る。これらのコードは、CD−ROMまたはハードド
ライブを含む任意のコンピュータ読み取り可能な媒体に保存され得る。
In another aspect of the invention, a computer software product for transcription annotations is provided. In some embodiments, the computer software product has computer program code for entering probe intensity, computer program code for identifying genomic regions where the intensity of the probe exceeds a threshold, and regions of the same probe intensity. Includes code to compare the intensities of the probes in the genomic region to Each of these regions can be designated as a potential transcript. These codes may be stored on any computer readable medium, including CD-ROM or hard drive.

【0013】 (好ましい実施形態の詳細な説明) ここで、本発明の好ましい実施形態に対する詳細な参照を行う。本発明は好ま
しい実施形態とともに記載されるが、これらは、本発明をこれらの実施形態に限
定することを意図しない。これに対して、本発明は、本発明の精神および範囲内
に含まれ得る代替物、改変物および等価物をカバーすることを意図される。
Detailed Description of the Preferred Embodiments A detailed reference will now be made to the preferred embodiments of the present invention. Although the present invention is described in connection with the preferred embodiments, they are not intended to limit the invention to these embodiments. On the contrary, the invention is intended to cover alternatives, modifications and equivalents, which may be included within the spirit and scope of the invention.

【0014】 当業者によって理解されるように、本発明は、方法、データ処理システムまた
はプログラムプロダクトとして具体化され得る。従って、本発明は、データ分析
システム、方法、分析ソフトウエアなどの形態をとり得る。本発明に従って書か
れたソフトウエアは、メモリー、ハードドライブ、DVD ROMまたはCD
ROMのようなコンピュータ読み取り可能な媒体のいくつかの形態で保存される
かまたはネットワークで伝達され、プロセッサによって実行される。
As will be appreciated by one of skill in the art, the present invention may be embodied as a method, data processing system or program product. Accordingly, the present invention may take the form of a data analysis system, method, analysis software, or the like. Software written in accordance with the present invention may be a memory, hard drive, DVD ROM or CD.
It is stored in some form of computer readable medium, such as a ROM, or is transmitted over a network and executed by a processor.

【0015】 図1は、本発明の実施形態のソフトウエアを実行するために使用され得るコン
ピュータシステムを例示する。図1は、ディスプレイ3、スクリーン5、キャビ
ネット7、キーボード9、およびマウス11を備えるコンピュータシステム1を
示す。マウス11は、グラフィックユーザーインターフェースと相互作用するた
めの1つ以上のボタンを有し得る。キャビネット7は、好ましくは、CD−RO
MまたはDVD−ROMドライブ13、システムメモリーおよびハードドライブ
(例えば、図2)を保存し、これらは、本発明を実行するコンピュータコードを
組み込むソフトウエアプログラム、本発明とともに使用するためのデータなどを
保存し、そして検索するための使用され得る。CD15が例示的なコンピュータ
読み取り可能媒体として示されるが、他のコンピュータ読み取り可能ストレージ
媒体(フロッピー(登録商標)ディスク、テープ、フラッシュメモリー、システ
ムメモリー、およびハードドライブ)が利用され得る。さらに、搬送波で(例え
ば、インターネットを含むネットワークで)具体化されるデータ信号が、コンピ
ュータ読み取り可能なストレージ媒体であり得る。
FIG. 1 illustrates a computer system that may be used to execute the software of an embodiment of the invention. FIG. 1 shows a computer system 1 comprising a display 3, a screen 5, a cabinet 7, a keyboard 9 and a mouse 11. Mouse 11 may have one or more buttons for interacting with the graphic user interface. The cabinet 7 is preferably a CD-RO
M or DVD-ROM drive 13, saves system memory and hard drive (eg, FIG. 2), which stores software programs incorporating computer code for implementing the present invention, data for use with the present invention, etc. And can be used for searching. Although CD15 is shown as an exemplary computer-readable medium, other computer-readable storage media (floppy disk, tape, flash memory, system memory, and hard drive) may be utilized. Further, a data signal embodied in a carrier wave (eg, in a network including the Internet) can be a computer-readable storage medium.

【0016】 図2は、本発明の実施形態のソフトウエアを実行するために使用されるコンピ
ュータシステム1のシステムブロックダイアグラムを示す。図1にあるように、
コンピュータシステム1は、モニター3、およびキーボード9、およびマウス1
1を備える。コンピュータシステム1はさらに、中央処理装置51、システムメ
モリー53、固定ストレージ55(例えば、ハードドライブ)、取り外し可能ス
トレージ57(例えば、CD−ROM)、ディスプレイアダプター59、サウン
ドカード61、スピーカー63、およびネットワークインターフェース65のよ
うなサブシステムを備える。本発明とともに使用するのに適した他のコンピュー
タシステムは、さらなるサブシステムまたはより少ないサブシステムを備え得る
。例えば、別のコンピュータシステムは、1つよりも多いプロセッサ51または
キャッシュメモリーを備え得る。本発明とともに使用するのに適したコンピュー
タシステムはまた、測定装置に組み込まれ得る。この組み込まれたシステムは、
例えば、例えば、GeneChip(登録商標)Probeアレイスキャナの操
作ならびに本発明のコンピュータコードの実行を制御し得る。
FIG. 2 shows a system block diagram of a computer system 1 used to execute the software of an embodiment of the present invention. As shown in Figure 1,
The computer system 1 includes a monitor 3, a keyboard 9, and a mouse 1.
1 is provided. Computer system 1 further includes central processing unit 51, system memory 53, fixed storage 55 (eg, hard drive), removable storage 57 (eg, CD-ROM), display adapter 59, sound card 61, speaker 63, and network. A subsystem such as the interface 65 is provided. Other computer systems suitable for use with the present invention may include additional subsystems or fewer subsystems. For example, another computer system may include more than one processor 51 or cache memory. A computer system suitable for use with the present invention may also be incorporated into the measuring device. This embedded system
For example, it may control, for example, the operation of the GeneChip® Probe Array Scanner as well as the execution of the computer code of the present invention.

【0017】 本発明の1つの局面において、方法、コンピュータソフトウエアプロダクトは
、転写パターン(転写物の形式および定量)に従ってゲノムの転写物を注釈する
ために提供される。本方法は、転写物の検出および転写のパターンの分析を含む
In one aspect of the invention, methods, computer software products are provided for annotating genomic transcripts according to transcription patterns (transcript format and quantification). The method involves detection of transcripts and analysis of patterns of transcription.

【0018】 (I.転写検出) (A.核酸サンプル) 転写パターン(転写物の形態および定量性)は、転写物を含むサンプルを試験
することにより決定され得る。いくつかの好ましい実施形態では、目的の種(そ
のゲノムが注釈される種、例えば、E.coli、酵母、イヌ、またはヒト)の
細胞由来の生物学的サンプルを得て、そして核酸サンプルを調製する。
I. Transcription Detection A. Nucleic Acid Samples Transcription patterns (transcript morphology and quantification) can be determined by examining samples containing transcripts. In some preferred embodiments, a biological sample is obtained from cells of the species of interest (the species whose genome is annotated, eg, E. coli, yeast, dog, or human) and the nucleic acid sample is prepared. To do.

【0019】 当業者は、目的の細胞の転写物を反映する標的核酸配列を含む核酸サンプルを
有することが望ましいことを理解する。従って、適切な核酸サンプルは、目的の
転写物を含み得る。しかし、適切な核酸サンプルは、目的の転写物由来の核酸を
含み得る。本明細書中で用いられる場合、転写物由来の核酸は、核酸の合成につ
いて、mRNA転写物またはその引き続くものが、最終的にテンプレートとして
の役割を果たす核酸をいう。従って、転写物から逆転写されたcDNA、このc
DNAから転写されたRNA、このcDNAから増幅されたDNA、この増幅さ
れたDNAから転写されたRNAなどは、転写物に全て由来し、そしてこのよう
な誘導された生成物の検出は、サンプルにおける本来の転写物の存在および/ま
たは存在比を示す。従って、適切なサンプルとしては、以下が挙げられるが、こ
れらに限定されない:遺伝子の転写物、この転写物から逆転写されたcDNA、
このcDNAから転写されたcRNA、この遺伝子から増幅されたDNA、増幅
されたDNAから転写されたRNAなど。本明細書中で用いられる場合、転写物
としては、以下が挙げられるが、これらに限定されない:プレmRNA初期転写
物、転写プロセシング中間体、成熟RNAおよび分解生成物。
Those skilled in the art will appreciate that it is desirable to have a nucleic acid sample that contains a target nucleic acid sequence that reflects the transcript of the cell of interest. Thus, a suitable nucleic acid sample may contain the transcript of interest. However, a suitable nucleic acid sample may contain nucleic acids from the transcript of interest. As used herein, transcript-derived nucleic acid refers to a nucleic acid to which the mRNA transcript or its successor ultimately serves as a template for nucleic acid synthesis. Therefore, the cDNA reverse transcribed from the transcript, this c
RNA transcribed from DNA, DNA amplified from this cDNA, RNA transcribed from this amplified DNA, etc. are all derived from the transcript, and the detection of such derived products can be detected in a sample. The presence and / or abundance ratio of the original transcript is indicated. Thus, suitable samples include, but are not limited to: a transcript of a gene, a cDNA reverse transcribed from this transcript,
CRNA transcribed from this cDNA, DNA amplified from this gene, RNA transcribed from the amplified DNA, etc. Transcripts, as used herein, include, but are not limited to: pre-mRNA early transcripts, transcription processing intermediates, mature RNAs and degradation products.

【0020】 1つの実施形態では、このようなサンプルは、細胞または組織または他の生物
学的サンプルのホモジネートである。好ましくは、このようなサンプルは、生物
学的サンプルの総RNA調製物である。より好ましくは、いくつかの実施形態に
おいて、このような核酸サンプルは、生物学的サンプルから単離された総mRN
Aである。当業者は、ほとんどの方法を用いて調製される総mRNAが、成熟m
RNAのみならず、RNAプロセシング中間体および初期プレmRNA転写物を
含むことを理解する。例えば、ポリ(T)カラムを用いて精製された総mRNA
は、ポリ(A)テールを有するRNA分子を含む。これらのポリA+RNA分子
は、成熟mRNA、RNAプロセシング中間体、初期転写物、または分解中間体
であり得る。
In one embodiment, such a sample is a homogenate of cells or tissues or other biological samples. Preferably such sample is a total RNA preparation of a biological sample. More preferably, in some embodiments, such nucleic acid sample is a total mRN isolated from the biological sample.
It is A. Those skilled in the art will appreciate that the total mRNA prepared using most methods will
It is understood to include not only RNA, but also RNA processing intermediates and early pre-mRNA transcripts. For example, total mRNA purified using a poly (T) column
Comprises an RNA molecule with a poly (A) tail. These poly A + RNA molecules can be mature mRNA, RNA processing intermediates, early transcripts, or degradation intermediates.

【0021】 生物学的サンプルは、任意の生物学的な組織または液体または細胞のサンプル
であり得る。代表的なサンプルとしては、以下が挙げられるが、これらに限定さ
れない:痰、血液、血球(例えば、白血球)、組織または細針生検サンプル、尿
、腹腔液、および胸膜液、またはこれら由来の細胞。生物学的サンプルはまた、
組織学的目的のために得られた凍結切片のような組織の切片を含み得る。
The biological sample can be any biological tissue or fluid or cell sample. Representative samples include, but are not limited to, sputum, blood, blood cells (eg, white blood cells), tissue or fine needle biopsy samples, urine, peritoneal fluid, and pleural fluid, or cells derived therefrom. . The biological sample also
It may include sections of tissue such as frozen sections obtained for histological purposes.

【0022】 生物学的サンプルの別の代表的な供給源は、遺伝子発現状態を操作して、遺伝
子間の相関関係を探索し得る、細胞培養物である。
Another representative source of biological samples is cell cultures, which can manipulate gene expression status to explore correlations between genes.

【0023】 当業者は、ホモジネートに存在するRNaseを阻害または破壊することが望
ましく、その後、ホモジネートをハイブリダイゼーションに用い得ることを理解
する。ヌクレアーゼを阻害または破壊する方法は、当該分野で周知である。いく
つかの好ましい実施形態では、細胞または組織を、カオトロピック剤の存在下で
ホモジナイズして、ヌクレアーゼを阻害する。いくつかの好ましい実施形態では
、RNaseを、熱処理により阻害または破壊した後、タンパク質分解酵素処理
をする。
Those skilled in the art will appreciate that it is desirable to inhibit or destroy RNase present in the homogenate, after which the homogenate can be used for hybridization. Methods of inhibiting or destroying nucleases are well known in the art. In some preferred embodiments, cells or tissues are homogenized in the presence of chaotropic agents to inhibit nucleases. In some preferred embodiments, RNase is inhibited or destroyed by heat treatment followed by proteolytic enzyme treatment.

【0024】 総RNAを単離する方法は、当業者に周知である。例えば、核酸の単離法およ
び分離法は、以下に詳細に記載される:Laboratory Techniq
ues in Biochemistry and Molecular Bi
ologyの第3章:Hybridization With Nucleic
Acid Probes,Part I,Theory and Nucle
ic Acid Preparation,P.Tijssen編、Elsev
ier,N.Y.(1993)およびLaboratory Techniqu
es in Biochemistry and Molecular Bio
logyの第3章:Hybridization With Nucleic
Acid Probes,Part I,Theory and Nuclei
c Acid Preparation,P.Tijssen編、Elsevi
er,N.Y.(1993)。
Methods of isolating total RNA are well known to those of skill in the art. For example, methods for isolating and separating nucleic acids are described in detail below: Laboratory Technology.
ues in Biochemistry and Molecular Bi
Chapter 3: Hybridization With Nucleic
Acid Probes, Part I, Theory and Nucle
ic Acid Preparation, P.I. Edited by Tijssen, Elsev
ier, N.M. Y. (1993) and Laboratory Technology.
es in Biochemistry and Molecular Bio
Chapter 3 of the Logic: Hybridization With Nucleic
Acid Probes, Part I, Theory and Nuclei
c Acid Preparation, P.C. Edited by Tijssen, Elsevi
er, N.N. Y. (1993).

【0025】 好ましい実施形態では、総RNAは、例えば、酸グアニジニウム−フェノール
−クロロホルム抽出法を用いて、所定のサンプルから単離され、そしてpoly
+mRNAは、オリゴdTカラムクロマトグラフィーまたは(dT)n磁性ビ
ーズを用いることにより、単離される(例えば、Sambrookら、Mole
cular Cloning:A Laboratory Manual(第2
版)、第1−3巻、Cold Spring Harbor Laborato
ry(1989)、またはCurrent Protocol in Mole
cular Biology,F.Ausubelら編、Green Publ
ishing and Wiley−Interscience,New Yo
rk,1987を参照のこと)。
In a preferred embodiment, total RNA is isolated from a given sample using, for example, the acid guanidinium-phenol-chloroform extraction method, and poly.
A + mRNA is isolated by using oligo dT column chromatography or (dT) n magnetic beads (eg Sambrook et al., Mole.
color Cloning: A Laboratory Manual (2nd
Edition), Volumes 1-3, Cold Spring Harbor Laborato
ry (1989), or Current Protocol in Mole
circular Biology, F.M. Edited by Ausubel et al., Green Publ
Ishing and Wiley-Interscience, New Yo
rk, 1987).

【0026】 1つの好ましい実施形態では、総RNAは、RNeasy Total RN
A単離キット(QIAGEN)を用いて哺乳動物細胞から単離される。哺乳動組
織が、RNAの供給源として用いられる場合、TRIzol Reagent(
GIBCOL Life Technologies)のような市販の試薬を用
いる。RNeasy総RNA単離キットを用いる、TRIzol抽出のエタノー
ル沈殿後の第2の清浄化は、有益であり得る。
In one preferred embodiment, the total RNA is RNeasy Total RN.
It is isolated from mammalian cells using the A isolation kit (QIAGEN). When mammalian tissue is used as a source of RNA, TRIzol Reagent (
Commercially available reagents such as GIBCOL Life Technologies) are used. A second cleaning after ethanol precipitation of TRIzol extraction with the RNeasy total RNA isolation kit may be beneficial.

【0027】 Schmittら(1990)Nucleic Acid Res.,18:
3091−3092に記載される温フェノールプロトコルは、酵母細胞の総RN
Aを単離するのに有用である。
Schmitt et al. (1990) Nucleic Acid Res. , 18:
3091-3092 describes the warm phenol protocol for total RN of yeast cells.
Useful for isolating A.

【0028】 質の良いmRNAは、例えば、始めに、総RNAを単離し、次いでOligo
tex mRNAキット(QIAGEN)を用いて総RNAからmRNAを単離
することにより得られ得る。
High quality mRNA can be obtained, for example, by first isolating total RNA and then Oligo.
It can be obtained by isolating mRNA from total RNA using the tex mRNA kit (QIAGEN).

【0029】 原核生物(例えば、E.coli.細胞)由来の総RNAは、Epicent
re Technologies(Madison,WI)製のMasterP
ureコンプリートDNA/RNA精製キットのプロトコルに従って得られ得る
Total RNA from prokaryotes (eg, E. coli. Cells) is available from Epicent
MasterP from re Technologies (Madison, WI)
ure complete DNA / RNA purification kit protocol.

【0030】 頻繁に、核酸サンプルを増幅した後に、ハイブリダイゼーションすることが望
ましい。当業者は、どのような増幅方法が用いられても、定量的な結果が望まし
い場合、増幅された核酸の相対的頻度を維持または制御して、定量的増幅を達成
する方法を用いる際に気をつけなければならないことを理解する。
Frequently, it is desirable to hybridize after amplifying the nucleic acid sample. Those of skill in the art will be familiar with using methods that maintain or control the relative frequency of amplified nucleic acids to achieve quantitative amplification when quantitative results are desired, whatever the amplification method used. Understand that you must turn on.

【0031】 「定量的」増幅の方法は、当業者に周知である。例えば、定量的PCRは、既
知量のコントロール配列を同じプライマーを用いて同時共増幅することを包含す
る。これは、PCR反応を較正するために用いられ得る内部標準を提供する。次
いで、高密度アレイは、増幅した核酸の定量のための内部標準に特定的なプロー
ブを含み得る。
Methods of “quantitative” amplification are well known to those of skill in the art. For example, quantitative PCR involves co-amplifying known amounts of control sequences with the same primers. This provides an internal standard that can be used to calibrate the PCR reaction. The high density array can then include probes specific to an internal standard for quantification of amplified nucleic acids.

【0032】 他の適切な増幅方法は、以下を含むが、これらに限定されない:ポリメラーゼ
連鎖反応(PCR)(Innisら、PCR Protocols.Augui
de to Methods and Application,Academ
ic Press,Inc.San Diego,(1990))、リガーゼ連
鎖反応(LCR)(WuおよびWallace.Genomics,4:560
(1989),Landegrenら、Science,241:1077(1
988)およびBarringerら、Gene,89:117(1990)を
参照のこと)、転写増幅(trascription amplificati
on)(Kwohら、Proc.Natl.Acad.Sci.USA,86:
1173(1989))、および自己持続性配列複製(self−sustai
ned sequence replication)(GuatelliらP
roc.Natl.Acad.Sci.USA,87:1874(1990))
Other suitable amplification methods include, but are not limited to, the polymerase chain reaction (PCR) (Innis et al., PCR Protocols. Augui).
de to Methods and Application, Academ
ic Press, Inc. San Diego, (1990)), ligase chain reaction (LCR) (Wu and Wallace. Genomics, 4: 560.
(1989), Landegren et al., Science, 241: 1077 (1.
988) and Barringer et al., Gene, 89: 117 (1990)), transcription amplification.
on) (Kwoh et al., Proc. Natl. Acad. Sci. USA, 86:
1173 (1989)), and self-sustaining sequence replication (self-sustai).
Ned sequence replication) (Guatelli et al. P)
roc. Natl. Acad. Sci. USA, 87: 1874 (1990)).
.

【0033】 細胞溶解物または組織ホモジネートは、頻繁に、多数のポリメラーゼ活性のイ
ンヒビターを含む。従って、RT−PCRは、代表的には、増幅テンプレートと
して引き続き用いるために総RNAまたはmRNAを単離する工程を始めに組み
入れる。1チューブmRNA捕捉法(one tube mRNA captu
re method)を用いて、同一チューブにおける迅速なRT−PCR(B
oehringer Mannheim)に適したpoly(A)+RNAサン
プルを調製し得る。捕捉されたmRNAは、逆転写混合物(reverse t
ranscription mix)ついでPCR混合物(PCR mix)を
添加することにより、RT−PCRに直接供され得る。
Cell lysates or tissue homogenates often contain numerous inhibitors of polymerase activity. Therefore, RT-PCR typically first incorporates a step of isolating total RNA or mRNA for subsequent use as an amplification template. 1-tube mRNA capture method (one tube mRNA captu
re-method) for rapid RT-PCR (B
A poly (A) + RNA sample suitable for Oehringer Mannheim can be prepared. The captured mRNA is then transferred to the reverse transcription mixture (reverse t
It can be directly subjected to RT-PCR by adding a transcription mixture and then a PCR mixture (PCR mix).

【0034】 特に好ましい実施形態では、サンプルmRNAは、逆転写酵素ならびにオリゴ
dTおよびファージT7プロモーターをコードする配列からなるプライマーを用
いて逆転写され、一本鎖DNAテンプレートを提供する。第2のDNA鎖は、プ
ライマーの有り無しでDNAポリメラーゼを用いて重合される。(米国特許出願
番号09/102,167、および米国仮特許出願番号60/172,340を
参照のこと、共に、すべての目的について、本明細書中で参考として援用される
)。二本鎖cDNAの合成の後、T7RNAポリメラーゼを添加し、そしてRN
AをcDNAテンプレートから転写する。各単一cDNAテンプレートからの連
続した回の転写は、増幅されたRNAを生じる。インビトロでの重合化の方法は
、当業者に周知である。(例えば、Sambrook、前出)、そしてこの特定
の方法は、Van Gelderら、Proc.Natl.Acad.Sci.
USA,87:1663−1667,1990に詳細に記載される。さらに、E
berwineら、Proc.Natl.Acad.Sci.USA,89:3
010−3014は、インビトロでの転写を介する2回の増幅を用いて、本来の
出発物質の106倍を超える増幅を達成し、これにより生物学的サンプルが制限
される場合でさえ、発現のモニタリングを可能にするプロトコルを提供する。1
つの好ましい実施形態では、インビトロでの転写反応は、Bioarray高収
率RNA転写標識キット(Enzo P/N900182)を使用する、得られ
たcRNAのビオチンでの標識と組合され得る。
In a particularly preferred embodiment, the sample mRNA is reverse transcribed with a reverse transcriptase and a primer consisting of oligo dT and a sequence encoding the phage T7 promoter to provide a single-stranded DNA template. The second DNA strand is polymerized using a DNA polymerase with or without a primer. (See US patent application Ser. No. 09 / 102,167 and US provisional patent application Ser. No. 60 / 172,340, both incorporated herein by reference for all purposes). After synthesis of double-stranded cDNA, T7 RNA polymerase was added and RN
Transcribe A from the cDNA template. Successive rounds of transcription from each single cDNA template yields amplified RNA. Methods of in vitro polymerization are well known to those of skill in the art. (Eg Sambrook, supra), and this particular method is described by Van Gelder et al., Proc. Natl. Acad. Sci.
USA, 87: 1663-1667, 1990. Furthermore, E
Berwine et al., Proc. Natl. Acad. Sci. USA, 89: 3
010-3014 achieves> 10 6 -fold amplification of the original starting material using two rounds of amplification via transcription in vitro, which results in expression of expression even when the biological sample is limited. Provides a protocol that allows monitoring. 1
In one preferred embodiment, the in vitro transcription reaction can be combined with labeling of the resulting cRNA with biotin using the Bioarray High Yield RNA Transcription Labeling Kit (Enzo P / N900182).

【0035】 ハイブリダイゼーションの前に、得られたcRNAをフラグメント化し得る。
フラグメント化のための1つの好ましい方法は、Rnaseを含まないRNAフ
ラグメント化緩衝液(200mMトリス酢酸、pH8.1、500mM酢酸カリ
ウム、150mM酢酸マグネシウム)を用いる。約20μgのcRNAは、8μ
Lのフラグメント化緩衝液と混合される。Rnaseを含まない水を添加し、容
積を40μLにする。この混合物を94℃にて35分間インキュベートし、そし
て氷中で冷却する。
The resulting cRNA can be fragmented prior to hybridization.
One preferred method for fragmentation uses Rnase-free RNA fragmentation buffer (200 mM Tris-acetate, pH 8.1, 500 mM potassium acetate, 150 mM magnesium acetate). About 20 μg of cRNA is 8 μ
Mix with L fragmentation buffer. Water without Rnase is added to bring the volume to 40 μL. This mixture is incubated at 94 ° C for 35 minutes and cooled in ice.

【0036】 上記の直接的な転写方法は、アンチセンス(aRNA)プールを提供すること
は当業者により理解される。アンチセンスRNAは、標的核酸としてもちいられ
る場合、アレイにおいて提供されるオリゴヌクレオチドプローブは、アンチセン
ス核酸の部分配列に相補的であるように選択される。対照的に、標的核酸プール
が、センス核酸のプールである場合、オリゴヌクレオチドプローブは、センス核
酸の部分配列に相補的であるように選択される。最終的には、核酸プールが二本
鎖である場合、プローブは、標的核酸がセンス鎖およびアンチセンス鎖の両方を
含むように、いずれかのセンスのプローブであり得る。
It will be appreciated by those skilled in the art that the direct transcription method described above provides an antisense (aRNA) pool. When antisense RNA is used as the target nucleic acid, the oligonucleotide probes provided in the array are chosen to be complementary to a subsequence of the antisense nucleic acid. In contrast, if the target nucleic acid pool is a pool of sense nucleic acids, then the oligonucleotide probe is selected to be complementary to a subsequence of the sense nucleic acid. Finally, if the nucleic acid pool is double-stranded, the probe can be a probe of either sense, such that the target nucleic acid contains both the sense and antisense strands.

【0037】 上記のプロトコルは、センス核酸かまたはアンチセンス核酸のいずれかのプー
ルを生成させる方法を包含する。実際には、1つのアプローチを用いて、所望さ
れるようなセンス核酸かまたはアンチセンス核酸のいずれかを生成し得る。例え
ば、cDNAは、ベクター(例えば、Stratageneのp Bluscr
ipt II KS(+)ファージミド)に方向付けられてクローン化され、そ
の結果、cDNAは、T3プロモーターおよびT7プロモーターに隣接される。
T3ポリメラーゼを用いるインビトロでの転写は、1つのセンスのRNA(セン
スは挿入物の方向に依存する)を生成するが、T7ポリメラーゼを用いるインビ
トロでの転写は、反対のセンスを有するRNAを生成する。他の適切なクローニ
ング系は、Cre−loxPプラスミドサブクローニングのために設計されたフ
ァージλベクターを含む(例えば、Palazzoloら、Gene,88:2
5−36,1990を参照のこと)。
The above protocol includes methods for generating pools of either sense or antisense nucleic acids. In fact, one approach may be used to produce either the sense or antisense nucleic acids as desired. For example, the cDNA may be a vector (eg, Stratagene's p Bluscr
was cloned in the direction of ipt II KS (+) phagemid, so that the cDNA is flanked by the T3 and T7 promoters.
In vitro transcription with T3 polymerase produces one sense of RNA, where the sense depends on the orientation of the insert, whereas in vitro transcription with T7 polymerase produces RNA with the opposite sense. . Other suitable cloning systems include phage lambda vectors designed for Cre-loxP plasmid subcloning (eg, Palazzolo et al., Gene, 88: 2).
5-36, 1990).

【0038】 生物学的サンプルは、目的の細胞、組織または器官に存在する転写物の少なく
ともいくつかのレベルを反映する核酸を含むべきである。いくつかの実施形態で
は、生物学的サンプルは、特定の状態の細胞、組織または器官から調製され得る
。例えば、妊娠中のイヌである場合、イヌの下垂体から総RNAを調製する。別
の例では、サンプルは、細胞をIPTGで処理した後にE.coli細胞から調
製され得る。特定の遺伝子は、特定の条件下でのみ発現されるので、種々の条件
下で誘導される生物学的サンプルは、全ての転写物を観察するために必要とされ
得る。いくつかの例では、転写の注釈は、特的の生理学的状態、薬理学的状態ま
たは毒物学的状態に特異的であり得る。例えば、遺伝子の特定の領域は、特定の
生理学的条件下でのみ転写される。生物学的サンプルを用いて特定の生理学的条
件から得られた転写の注釈は、他の生理学的条件に適用可能でなくてもよい。
The biological sample should contain nucleic acids that reflect at least some levels of the transcript present in the cell, tissue or organ of interest. In some embodiments, biological samples can be prepared from cells, tissues or organs in a particular condition. For example, if the dog is pregnant, total RNA is prepared from the pituitary gland of the dog. In another example, the sample is E. coli after treating the cells with IPTG. E. coli cells. Since certain genes are only expressed under certain conditions, biological samples induced under various conditions may be needed to observe all transcripts. In some examples, transcriptional annotation may be specific to a particular physiological, pharmacological or toxicological condition. For example, certain regions of the gene are transcribed only under certain physiological conditions. Transcriptional annotations obtained from a particular physiological condition using a biological sample may not be applicable to other physiological conditions.

【0039】 (B.核酸プローブアッセイ設計) 転写物の検出のための1つの好ましい方法は、高密度オリゴヌクレオチドプロ
ーブアレイを使用する。高密度オリゴヌクレオチドプローブアレイおよび転写検
出のためのその用途は、例えば、米国特許第5,800,992号、同第6,0
40,193号および同第5,831,070号に記載される。
B. Nucleic Acid Probe Assay Design One preferred method for transcript detection uses a high density oligonucleotide probe array. High density oligonucleotide probe arrays and their uses for transcription detection are described, for example, in US Pat. Nos. 5,800,992 and 6,0.
40,193 and 5,831,070.

【0040】 当業者は、莫大な数のアレイ設計が、本発明の実施に適していることを理解す
る。高密度アレイは、代表的には、潜在的および推定の転写物を含む目的の配列
に特異的にハイブリダイズする多数のプローブを含む。さらに、好ましい実施形
態では、このアレイは、1つ以上のコントロールプローブを含む。
Those skilled in the art will appreciate that a vast number of array designs are suitable for practicing the present invention. High density arrays typically include multiple probes that specifically hybridize to sequences of interest, including potential and putative transcripts. Moreover, in a preferred embodiment, the array comprises one or more control probes.

【0041】 高密度アレイチップは、試験プローブを含む。プローブは、約5〜約45また
は約5〜約500ヌクレオチドの長さ、より好ましくは、約10〜約40ヌクレ
オチドの長さ、および最も好ましくは、約15〜約40ヌクレオチドの長さの範
囲のオリゴヌクレオチドで有り得る。他の特に好ましい実施形態では、このプロ
ーブは、20または25ヌクレオチドの長さである。別の好ましい実施形態では
、試験プローブは、二本鎖または一本鎖のDNA配列である。DNA配列は、天
然の供給源から単離またはクローニングされるか、あるいはテンプレートとして
天然の核酸を用いて、天然の供給源から増幅される。これらのプローブは、遺伝
子(この遺伝子の発現をこれらのプローブが検出するように設計される)の特定
の部分配列に相補的な配列を有する。従って、試験プローブは、標的核酸(試験
プローブが検出するための標的核酸)に特異的にハイブリダイズし得る。
The high density array chip contains test probes. The probe ranges from about 5 to about 45 or about 5 to about 500 nucleotides in length, more preferably about 10 to about 40 nucleotides in length, and most preferably about 15 to about 40 nucleotides in length. It can be an oligonucleotide. In another particularly preferred embodiment, the probe is 20 or 25 nucleotides in length. In another preferred embodiment, the test probe is a double-stranded or single-stranded DNA sequence. DNA sequences are isolated or cloned from natural sources, or amplified from natural sources using natural nucleic acids as templates. These probes have a sequence that is complementary to a particular subsequence of the gene, which is designed for these probes to detect the expression of this gene. Thus, the test probe may specifically hybridize to the target nucleic acid (the target nucleic acid for the test probe to detect).

【0042】 目的の標的核酸に結合する試験プローブに加えて、高密度アレイは、多数のコ
ントロールプローブを含み得る。コントロールプローブは、3つのカテゴリーに
分類され、この3つのカテゴリーは本明細書中で、1)正規化コントロール;2
)発現レベルコントロール;および3)ミスマッチコントロールといわれる。こ
れらのコントロールは、標的核酸の塩基とは異なる少なくとも1つの塩基を含む
ように設計される。正規化コントロールは、核酸サンプルに添加される、標識さ
れた参照オリゴヌクレオチドまたは他の核酸配列に相補的である、オリゴヌクレ
オチドもしくは他の核酸プローブである。ハイブリダイゼーション後に正規化コ
ントロールから得られるシグナルは、ハイブリダイゼーション条件、標識強度、
「読み取り(reading)」効果、および完全なハイブリダイゼーションの
シグナルがアレイ間で変化得る他の因子におけるバリエーションについてのコン
トロールを提供する。好ましい実施形態では、アレイにおける他のプローブ全て
から読み取られるシグナル(例えば、蛍光強度)は、コントロールプローブから
のシグナル(例えば、蛍光強度)により分割され、これにより測定を正規化する
In addition to a test probe that binds to the target nucleic acid of interest, the high density array can include multiple control probes. Control probes are divided into three categories, which are referred to herein as 1) normalized controls; 2
) Expression level control; and 3) mismatch control. These controls are designed to contain at least one base different from the base of the target nucleic acid. A normalization control is an oligonucleotide or other nucleic acid probe that is complementary to a labeled reference oligonucleotide or other nucleic acid sequence that is added to a nucleic acid sample. The signals obtained from the normalization control after hybridization are hybridization conditions, label strength,
It provides controls for "reading" effects, and variations in other factors where the signal of complete hybridization can vary between arrays. In a preferred embodiment, the signal read from all other probes in the array (eg fluorescence intensity) is divided by the signal from the control probe (eg fluorescence intensity), thereby normalizing the measurement.

【0043】 実際に、任意のプローブは、正規化プローブとしての役割を果たし得る。しか
し、ハイブリダイゼーション効果は、塩基組成およびプローブ長により変化する
ことが認識される。好ましい正規化プローブは、アレイに存在する他のプローブ
の平均長を反映するように選択されるが、これらは長さの範囲を補うに選択され
得る。正規化コントロールはまた、アレイの他のプローブの(平均)塩基組成を
反映するように選択され得るが、好ましい実施形態では、1つのみまたは数個の
正規化プローブが用いられ、そしてこれらのプローブは、これらが十分にハイブ
リダイズし(すなわち、二次構造を含まない)かつ任意の標的特異的プローブに
一致しないように選択される。
In fact, any probe can serve as a normalization probe. However, it is recognized that hybridization effects vary with base composition and probe length. Preferred normalized probes are chosen to reflect the average length of the other probes present in the array, although they can be chosen to cover a range of lengths. Normalized controls may also be selected to reflect the (average) base composition of the other probes in the array, but in a preferred embodiment only one or several normalized probes are used and these probes Are selected such that they hybridize well (ie, do not contain secondary structure) and do not match any target-specific probe.

【0044】 発現レベルコントロールは、生物学的サンプルにおいて構成的に発現される遺
伝子と特異的にハイブリダイズするプローブである。実際に、任意の構成的に発
現された遺伝子は、発現レベルコントロールについての適切な標的を提供する。
代表的な発現レベルコントロールプローブは、β−アクチン遺伝子、トランスフ
ェリンレセプター遺伝子、GAPDH遺伝子などを含むが、これらに限定されな
い、構成的に発現された「ハウスキーピング遺伝子」の部分配列に相補的な配列
を有する。
Expression level controls are probes that specifically hybridize to genes that are constitutively expressed in the biological sample. Indeed, any constitutively expressed gene provides a suitable target for expression level control.
Representative expression level control probes include, but are not limited to, β-actin gene, transferrin receptor gene, GAPDH gene, and the like, and have a sequence complementary to a partial sequence of a constitutively expressed “housekeeping gene”. Have.

【0045】 ミスマッチコントロールはまた、標的遺伝子に対するプローブ、発現レベルコ
ントロール、または正規化コントロールについて提供され得る。ミスマッチコン
トロールは、1つ以上のミスマッチ塩基の存在以外、これらの対応する試験プロ
ーブ、標的プローブ、またはコントロールプローブと一致するように設計された
、オリゴヌクレオチドプローブまたは他の核酸プローブである。ミスマッチ塩基
は、標的配列中の対応する塩基に相補的ではない(その他の点では、プローブは
、特異的にハイブリダイズする)ように選択された塩基である。1つ以上のミス
マッチが、適切なハイブリダイゼーション条件(例えば、ストリンジェントな条
件)下で、試験プローブまたはコントロールプローブは、その標的配列とハイブ
リダイズすることが予想されるが、ミスマッチプローブは、ハイブリダイズしな
い(または有意により少ない程度でハイブリダイズする)ように選択される。好
ましいミスマッチプローブは、中心ミスマッチを含む。従って、例えば、プロー
ブが20マーである場合、対応するミスマッチプローブは、6〜14の任意の位
置での単一塩基ミスマッチ(例えば、G、C、またはTをAに置換する)を除い
て同一配列(中心ミスマッチ)を有する。
Mismatch controls can also be provided for probes to target genes, expression level controls, or normalization controls. Mismatch controls are oligonucleotide probes or other nucleic acid probes designed to match their corresponding test, target, or control probe except for the presence of one or more mismatched bases. A mismatched base is a base selected so that it is not complementary to the corresponding base in the target sequence (otherwise the probe hybridizes specifically). The test probe or control probe is expected to hybridize to its target sequence under one or more mismatches under appropriate hybridization conditions (eg, stringent conditions), while the mismatch probe will hybridize. Not selected (or hybridized to a significantly lesser extent). Preferred mismatch probes contain a central mismatch. Thus, for example, where the probe is a 20-mer, the corresponding mismatch probe is identical except for a single base mismatch at any of positions 6-14 (eg, replacing G, C, or T with A). Has a sequence (central mismatch).

【0046】 従って、ミスマッチプローブは、プローブが指向される標的以外のサンプル中
の核酸に対する非特異的結合または交叉ハイブリダイゼーションについてのコン
トロールを提供する。
Mismatch probes thus provide controls for non-specific binding or cross-hybridization to nucleic acids in the sample other than the target to which the probe is directed.

【0047】 完全一致プローブとミスマッチプローブとの間(I(PM)−I(MM))の
強度における差異は、ハイブリダイズした物質の濃度の優れた基準を提供する。
The difference in intensity of (I (PM) -I (MM)) between the perfectly matched and mismatched probes provides a good measure of the concentration of hybridized material.

【0048】 高密度アレイはまた、サンプル調製/増幅コントロールプローブを含み得る。
これらは、選択されたコントロール遺伝子の部分配列に相補的であるプローブで
ある。なぜならば、これらは、アッセイされる特定の生物学的サンプルの核酸に
おいて通常生じないからである。適切なサンプル調製/増幅コントロールプロー
ブは、該当のサンプルが真核生物由来の生物製剤である場合、例えば、細菌遺伝
子(例えば、Bio B)に対するプローブを含む。
The high density array may also include sample preparation / amplification control probes.
These are probes that are complementary to partial sequences of selected control genes. Because they usually do not occur in the nucleic acid of the particular biological sample being assayed. Suitable sample preparation / amplification control probes include, for example, a probe for a bacterial gene (eg, Bio B) when the sample of interest is a biologic of eukaryotic origin.

【0049】 次いで、RNAサンプルは、処理の前に、サンプルの調製/増幅の制御プロー
ブが指向される既知量の核酸が添加される。次いで、サンプルの調製/増幅の制
御プローブのハイブリダイゼーションの定量は、処理工程(例えば、PCR、逆
転写、インビトロ転写など)により引き起こされる大量の核酸における変更の測
定を提供する。
The RNA sample is then, prior to processing, a known amount of nucleic acid directed against a control probe for sample preparation / amplification. Quantitation of control probe hybridization for sample preparation / amplification then provides a measure of the alteration in large amounts of nucleic acid caused by processing steps (eg, PCR, reverse transcription, in vitro transcription, etc.).

【0050】 好ましい実施形態では、高密度アレイにおけるオリゴヌクレオチドプローブが
選択され、使用される特定のハイブリダイゼーション条件下での最小の非特異的
結合または交差ハイブリダイゼーションで指向される核酸標的に特異的に結合さ
れる。本発明の高密度アレイは、1,000,000を超える異なるプローブを
含み得るので、特定の核酸配列に結合する特徴的な長さのあらゆるプローブを提
供することが可能である。従って、例えば、高密度アレイは、IL−2 mRN
Aに相補的なあらゆる可能な20マーの配列を含み得る。
In a preferred embodiment, oligonucleotide probes in a high density array are selected to specifically target nucleic acid targets directed with minimal non-specific binding or cross-hybridization under the particular hybridization conditions used. Be combined. The high-density arrays of the invention can include over 1,000,000 different probes, making it possible to provide any probe of a characteristic length that binds to a particular nucleic acid sequence. Thus, for example, a high density array can be used for IL-2 mRN
It may include any possible 20-mer sequence complementary to A.

【0051】 しかし、IL−2 mRNAに独特ではない20マーの部分配列が存在し得る
。これらの部分配列に指向されたプローブは、サンプルゲノムの他の領域におけ
るそれらの相補配列の出現によって交差ハイブリダイズすることが予想される。
同様に、他のプローブは、単純に、(例えば、二次構造、または基質もしくは他
のプローブとの相互作用に起因して)ハイブリダイゼーション条件下で効率的に
はハイブリダイズしないかもしれない。従って、好ましい実施形態では、このよ
うな乏しい特異性またはハイブリダイゼーション効率を示すプローブが同定され
、そして(例えば、アレイの作製の間に)高密度アレイ自体中またはハイブリダ
イゼーション後のデータ分析中のいずれかに含まれ得る。
However, there may be 20-mer subsequences that are not unique to IL-2 mRNA. Probes directed to these subsequences are expected to cross-hybridize by the appearance of their complementary sequences in other regions of the sample genome.
Similarly, other probes may simply not hybridize efficiently under hybridization conditions (due to, for example, secondary structure, or interaction with substrates or other probes). Therefore, in a preferred embodiment, probes exhibiting such poor specificity or hybridization efficiency are identified and either in the high density array itself (eg, during array production) or during post-hybridization data analysis. Can be included in

【0052】 15、20または25ヌクレオチド程度に短いプローブは、遺伝子の部分配列
にハイブリダイズするに十分であり、そしてほとんどの遺伝子について、広範な
標的核酸濃縮物に渡って良好に機能するプローブのセットが存在する。好ましい
実施形態では、高密度アレイを合成する前に、各遺伝子についてのプローブの好
ましいかまたは「最適な」サブセットを選択することが所望される。
Probes as short as 15, 20 or 25 nucleotides are sufficient to hybridize to a subsequence of a gene, and for most genes a set of probes that perform well over a wide range of target nucleic acid concentrates. Exists. In a preferred embodiment, it is desirable to select a preferred or "optimal" subset of probes for each gene before synthesizing the high density array.

【0053】 本発明の1つの局面では、転写の注釈について、プローブアレイは、ゲノムの
目的の領域を指向するように選択されたプローブを含み得る。このプローブは、
目的の領域全体または目的の領域の選択された領域をタイリングし得る。図3は
、1つのこのようなプローブアレイの設計を示す。複数のプローブが、重複する
ことなく目的の遺伝子配列をタイリングするために選択される。タイリングの方
法およびストラテジーは、公開されたPCT出願番号95/11995(この全
体的な開示は、本明細書中で全ての目的のためにその全体が参考として援用され
る)に相当詳細に議論される。しかし、いくつかの実施形態では、重複している
プローブが好ましくあり得る。
In one aspect of the invention, for transcriptional annotation, the probe array can include probes selected to direct regions of interest in the genome. This probe
The entire region of interest or a selected region of the region of interest may be tiled. Figure 3 shows one such probe array design. Multiple probes are selected to tile the gene sequence of interest without duplication. The method and strategy of tiling is discussed in considerable detail in published PCT Application No. 95/11995, the entire disclosure of which is incorporated herein by reference in its entirety for all purposes. To be done. However, in some embodiments overlapping probes may be preferred.

【0054】 (C.核酸プローブアレイの形成) 最少数の合成工程を伴う、オリゴヌクレオチド、ペプチドおよび他のポリマー
配列の高密度アレイを形成する方法は、例えば、5,143,854、5,25
2,743、5,384,261、5,405,783、5,424,186、
5,429,807、5,445,946、5,510,270、5,677,
195、5,571,639、6,040,138(全て、本明細書中で全ての
目的のために参考として援用される)に開示される。オリゴヌクレオチドアナロ
グアレイは、種々の方法(光指向性化学的カップリング、および機械的に指向さ
れるカップリングが挙げられるがこれらに限定されない)により固体基板上で合
成され得る。(Pirrungら、米国特許第5,143,854号を参照のこ
と)。(PCT出願番号WO90/15070、ならびに、例えば、光指向性合
成技術を使用して、ペプチド、オリゴヌクレオチドおよび他の分子の膨大なアレ
イを形成する方法を開示する、Fodorら、PCT公開番号WO92/100
92およびWO93/09668ならびに米国特許第5,677,195号をも
、参照のこと)。(Fodorら、Science,251,767−77,1
991をも、参照のこと)。ポリマーアレイの合成についてのこれらの手順は、
ここでVLSIPSTM手順としていわれる。VLSIPSTMアプローチを使用し
て、ポリマーの1つの不均一アレイは、多くの反応部位での同時カップリングを
介して、異なる不均一アレイへ変換される。(米国特許第5,384,261号
および同第5,677,195号を参照のこと)。
C. Formation of Nucleic Acid Probe Arrays Methods for forming high density arrays of oligonucleotides, peptides and other polymer sequences with a minimal number of synthetic steps are described in, for example, 5,143,854, 5,25.
2,743,5,384,261,5,405,783,5,424,186,
5,429,807, 5,445,946, 5,510,270, 5,677,
195, 5,571, 639, 6,040, 138, all incorporated herein by reference for all purposes. Oligonucleotide analog arrays can be synthesized on a solid substrate by a variety of methods including, but not limited to, photodirected chemical coupling, and mechanically directed coupling. (See Pirrung et al., US Pat. No. 5,143,854). (PCT Application No. WO 90/15070, and disclose methods of forming vast arrays of peptides, oligonucleotides and other molecules using, for example, photodirected synthetic techniques, Fodor et al., PCT Publication No. WO 92 / 100
92 and WO 93/09668 and US Pat. No. 5,677,195). (Fodor et al., Science, 251, 767-77, 1
See also 991). These steps for the synthesis of polymer arrays are
This is referred to as the VLSIPS procedure. Using the VLSIPS approach, one heterogeneous array of polymers is converted to a different heterogeneous array via simultaneous coupling at many reaction sites. (See US Pat. Nos. 5,384,261 and 5,677,195).

【0055】 上記の米国特許第5,143,854号およびPCT特許公開番号WO90/
15070および92/10092に記載されるように、VLSIPSTM技術の
開発は、コンビナトリアル合成およびコンビナトリアルライブラリーのスクリー
ニングの分野における先端技術とみなされる。
US Pat. No. 5,143,854 and PCT Patent Publication No. WO 90 /
As described in 15070 and 92/10092, the development of VLSIPS technology is considered to be a state of the art in the field of combinatorial synthesis and screening of combinatorial libraries.

【0056】 簡潔には、ガラス表面上でのオリゴヌクレオチドアレイの光指向性コンビナト
リアル合成は、自動ホスホラミダイト化学およびチップ作成技術を使用して進行
する。ある特定の実施では、ガラス表面は、官能基(例えば、感光性保護基によ
りブロックされたヒドロキシル基またはアミン基)を含むシラン試薬で誘導体化
される。写真平板マスクを介する光分解は、官能基を曝露するために選択的に使
用され、次いでこれは、入ってくる5’を光保護したヌクレオシドホスホラミダ
イトと容易に反応する。このホスホラミダイトは、照射されたこれらの部位との
み反応する(従って、感光性ブロック基の除去により曝露される)。従って、ホ
スホラミダイトは、先行工程から選択的に曝露されたこれらの領域にのみ添加さ
れる。これらの工程は、所望のアレイの配列が固体表面上で合成されるまで繰り
返される。アレイ上の異なる位置での異なるオリゴヌクレオチドアナログのコン
ビナトリアル合成は、合成の間の照射のパターンおよびカップリング試薬の添加
の順序により決定される。
Briefly, the photo-directed combinatorial synthesis of oligonucleotide arrays on glass surfaces proceeds using automated phosphoramidite chemistry and chip making techniques. In one particular implementation, the glass surface is derivatized with a silane reagent containing functional groups (eg, hydroxyl or amine groups blocked by photolabile protecting groups). Photolysis via a photolithographic mask was selectively used to expose the functional groups, which then readily reacted with the incoming 5'photoprotected nucleoside phosphoramidite. This phosphoramidite reacts only with these irradiated sites (and is therefore exposed by removal of the photolabile blocking group). Therefore, phosphoramidites are added only to those regions that were selectively exposed from the previous step. These steps are repeated until the desired array of arrays is synthesized on the solid surface. Combinatorial synthesis of different oligonucleotide analogs at different positions on the array is determined by the pattern of irradiation during synthesis and the order of addition of coupling reagents.

【0057】 ポリアミド骨格を有するオリゴヌクレオチドアナログがVLSIPSTM手順に
おいて使用される場合、合成工程を実施するためにホスホラミダイト化学を使用
することは、一般に不適切である。なぜなら、モノマーは、ホスフェート結合を
介して互いに結合しないからである。その代わり、ペプチド合成法が代用される
。(例えば、Pirrungら、米国特許第5,143,854号を参照のこと
)。
When oligonucleotide analogues with a polyamide backbone are used in the VLSIPS procedure, it is generally inadequate to use phosphoramidite chemistry to carry out the synthetic steps. This is because the monomers do not bond to each other via a phosphate bond. Instead, peptide synthesis methods are substituted. (See, eg, Pirrung et al., US Pat. No. 5,143,854).

【0058】 ペプチド核酸は、例えば、Biosearch,Inc.(Bedford,
MA)から市販されており、これらは、ポリアミド骨格および天然に存在するヌ
クレオチドに見出される塩基を含む。ペプチド核酸は、高い特異性で核酸に結合
し得、そして本開示の目的のために「オリゴヌクレオチドアナログ」とみなされ
る。
Peptide nucleic acids are described, for example, in Biosearch, Inc. (Bedford,
MA), which contain a polyamide backbone and the bases found in naturally occurring nucleotides. Peptide nucleic acids can bind nucleic acids with high specificity and are considered “oligonucleotide analogs” for the purposes of this disclosure.

【0059】 前述の方法に加えて、1つの基材上のオリゴヌクレオチドのアレイを作製する
ために使用され得るさらなる方法がPCT公開番号WO93/09668に記載
される。その出願に開示される方法においては、試薬は、以下のいずれかにより
基材に送達される:(1)所定の領域の規定されたチャネル内を流動することに
よるかまたは(2)所定領域上に「集中(spotting)」ことによるかま
たは(3)フォトレジストの使用を介する。しかし、他のアプローチならびに集
中および流動の組み合わせが使用され得る。各々の場合、基材の特定の活性化さ
れた領域は、モノマー溶液が種々の反応部位に送達される場合に、他の領域から
機械的に離される。
In addition to the methods described above, a further method that can be used to make an array of oligonucleotides on one substrate is described in PCT Publication No. WO93 / 09668. In the method disclosed in that application, the reagents are delivered to the substrate by either: (1) by flowing within defined channels in defined areas or (2) on defined areas. By "spotting" or (3) through the use of photoresist. However, other approaches and combinations of concentration and flow can be used. In each case, certain activated areas of the substrate are mechanically separated from other areas when the monomer solution is delivered to the various reaction sites.

【0060】 本発明の化合物およびライブラリーに適用される代表的な「流動チャネル」方
法は、以下に概して記載され得る。多様なポリマー配列が、それを介して適切な
試薬が流動するか、またはその中に適切な試薬が配置される、基材の表面上の流
動チャネルを形成することにより、基材または固体支持体の選択された領域で合
成される。例えば、モノマー「A」が、第1の群の選択された領域の基材に結合
すると仮定する。必要ならば、選択された領域の全てまたは一部における基材の
表面の全てまたは一部が、例えば、チャネルの全てまたはいくつかを介して適切
な試薬を流動することによるか、または適切な試薬で基材全体を洗浄することに
より、結合に対して活性化される。基材の表面上のチャネルブロックの配置後、
モノマーAを有する試薬が、チャネルの全てまたはいくつかを通って流動するか
、またはそこに置かれる。このチャネルは、第1の選択された領域に接触する流
体を提供し、これにより、モノマーAを第1の選択された領域中の基材上に、直
接的かまたは間接的に(スペーサーを介して)結合する。
Representative “flow channel” methods applied to the compounds and libraries of the invention can be generally described below. A variety of polymer sequences form flow channels on the surface of a substrate through which suitable reagents flow or into which suitable reagents are placed to form a substrate or solid support. Are combined in the selected area of. For example, assume that monomer "A" binds to a substrate in a selected area of the first group. If necessary, all or part of the surface of the substrate in all or part of the selected area is, for example, by flowing the appropriate reagent through all or some of the channels, or It is activated for binding by washing the entire substrate with. After placing the channel block on the surface of the substrate,
A reagent with monomer A flows or is placed there through all or some of the channels. This channel provides the fluid in contact with the first selected area, thereby allowing the monomer A to be directly or indirectly (via the spacer) on the substrate in the first selected area. Join).

【0061】 その後、モノマーBが、第2の選択された領域に結合され、そのいくつかは、
第1の選択された領域間に含まれ得る。第2の選択された領域は、基材の表面上
のチャネルブロックの並行移動、回転または置換を介するか;選択されたバルブ
の解放もしくは閉鎖を介するか;または化学薬品もしくはフォトレジストの層の
沈着を介して、第2の流動チャネルと接触する流体中に存在する。必要ならば、
工程は、少なくとも第2の領域を活性化するために行われる。その後、モノマー
Bは、第2の流動チャネルを介して流動されるかその中に配置され、モノマーB
を第2の選択された位置に結合する。この特定の例では、処理のこの段階で基材
に結合した、得られた配列は、例えば、A、BまたはABである。このプロセス
は繰り返され、基材上の既知の位置で、所望の長さの配列の莫大なアレイを形成
する。
Thereafter, the monomer B is attached to the second selected region, some of which are
It may be included between the first selected regions. The second selected area is via translation, rotation or displacement of the channel block on the surface of the substrate; via opening or closing of the selected valve; or deposition of a layer of chemical or photoresist. Is in fluid contacting the second flow channel via. If necessary,
The steps are performed to activate at least the second region. Thereafter, the monomer B is flowed through or placed in the second flow channel, the monomer B
To the second selected position. In this particular example, the resulting sequence bound to the substrate at this stage of processing is, for example, A, B or AB. This process is repeated to form a huge array of arrays of desired length at known locations on the substrate.

【0062】 この基材が活性化された後、モノマーAは、チャネルのいくつかを通って流動
され得、モノマーBは、他のチャネルを通って流動され得、モノマーCは、なお
別のチャネルを通って流動され得る、など。この様式では、反応領域の多くまた
は全ては、チャネルブロックが取り除かれるか、または基材が洗浄および/もし
くは再活性化される前に、モノマーと反応される。利用可能な反応領域のいくつ
かまたは全てを同時に使用することにより、洗浄および活性化工程の回数を最少
化し得る。
After the substrate is activated, monomer A can be flowed through some of the channels, monomer B can be flowed through the other channels, and monomer C can be flowed through another channel. Can be flowed through, and so on. In this manner, many or all of the reaction regions are reacted with the monomer before the channel block is removed or the substrate is washed and / or reactivated. The number of wash and activation steps can be minimized by using some or all of the available reaction zones simultaneously.

【0063】 当業者は、チャネルを形成するか、さもなければ基材の表面の部分を保護する
、代替的な方法が存在することを認識する。例えば、いくつかの実施形態に従っ
て、保護コーティング(例えば、(溶媒の性質に依存して)親水的または疎水的
コーティング)が、他の領域中の反応溶液により濡れを促進する物質と時々組み
合わせて、保護される基材の部分上で使用される。この様式では、流動溶液がこ
れらの所望の流路の外側を通過することを、さらに防止する。
One of ordinary skill in the art will recognize that there are alternative methods of forming channels or otherwise protecting portions of the surface of the substrate. For example, according to some embodiments, a protective coating (eg, a hydrophilic or hydrophobic coating (depending on the nature of the solvent)), sometimes in combination with a substance that promotes wetting by the reaction solution in other regions, Used on the part of the substrate to be protected. In this manner, the flowing solution is further prevented from passing outside these desired channels.

【0064】 高密度核酸アレイは、所定の部分、予め合成された核酸または天然の核酸を付
着させることにより作製され得る。米国特許第5,040,138号および全て
の目的のために参考として前に援用されたその特許出願に開示されるように、合
成された核酸または天然の核酸が、光指向性標的化およびオリゴヌクレオチド指
向性標的化により基材の特定の位置に付着される。核酸はまた、流動チャネル方
法とほぼ同じ様式で特定の位置に指向され得る。例えば、核酸Aは、第1群の適
切に活性化された反応領域に送達されそしてそれらと結合され得る。その後、核
酸Bが、第2群の活性化された反応領域に送達されそしてそれらと反応する。核
酸は、選択された領域に付着される。別の実施形態は、特定のスポットに核酸を
付着するために、領域ごとに取り除かれるディスペンサーを使用する。代表的な
ディスペンサーとしては、基材に核酸を送達するためのマイクロピペットまたは
キャピラリーピン、および基材に関するマイクロピペットの位置を制御するため
のロボットシステムを含む。他の実施形態では、ディスペンサーは、チューブ、
マニホルド、ピペットまたはキャピラリーピンのアレイなどを含み、その結果、
種々の試薬が、反応領域に同時に送達され得る。
High density nucleic acid arrays can be made by attaching moieties, pre-synthesized nucleic acids or naturally occurring nucleic acids. Synthetic or natural nucleic acids can be used for light-directed targeting and oligonucleic acids as disclosed in US Pat. No. 5,040,138 and its patent application, previously incorporated by reference for all purposes. It is attached to a specific location on the substrate by nucleotide-directed targeting. Nucleic acids can also be directed to specific locations in much the same way as flow channel methods. For example, nucleic acid A may be delivered to and associated with a suitably activated reaction zone of the first group. Nucleic acid B is then delivered to and reacts with the activated reaction zones of the second group. The nucleic acid is attached to the selected area. Another embodiment uses a dispenser that is removed region by region to attach nucleic acids to specific spots. Typical dispensers include micropipettes or capillary pins for delivering nucleic acids to a substrate, and robotic systems for controlling the position of the micropipette with respect to the substrate. In other embodiments, the dispenser is a tube,
Including manifolds, pipettes or arrays of capillary pins, etc., so that
Various reagents can be delivered to the reaction zone simultaneously.

【0065】 (D.核酸サンプルのプローブアレイへのハイブリダイゼーション) 核酸ハイブリダイゼーションは、プローブおよびその相補標的が相補的な塩基
対を介して安定なハイブリッド二重鎖を形成し得る条件下でプローブと標的核酸
とを接触させる工程を単純に包含する。次いで、ハイブリッド二重鎖を形成しな
い核酸が洗い流され、代表的には付着した検出可能な標識の検出を介して検出さ
れるハイブリダイズした核酸を残す。核酸が、温度を上昇させるか、または核酸
を含む緩衝液の塩濃度を減少させることにより変性されることが、一般に認識さ
れる。アニーリングされた配列が完璧に相補的ではない場合でさえも、低ストリ
ンジェンシー条件下(例えば、低温および/または高い塩)で、ハイブリッド二
重鎖(例えば、DNA:DNA、RNA:RNAまたはRNA:DNA)が形成
される。従って、ハイブリダイゼーションの特異性は、より低いストリンジェン
シーで減少される。逆に、高ストリンジェンシー(例えば、より高温またはより
低い塩)では、成功したハイブリダイゼーションは、僅かなミスマッチを必要と
する。
(D. Hybridization of Nucleic Acid Sample to Probe Array) Nucleic acid hybridization is performed under the condition that the probe and its complementary target can form a stable hybrid duplex through complementary base pairs. It simply comprises the step of contacting with the target nucleic acid. Nucleic acids that do not form hybrid duplexes are then washed away, leaving hybridized nucleic acids that are typically detected through detection of the attached detectable label. It is generally recognized that nucleic acids are denatured by increasing the temperature or decreasing the salt concentration of the buffer containing the nucleic acids. Under low stringency conditions (eg, low temperature and / or high salt), hybrid duplexes (eg, DNA: DNA, RNA: RNA or RNA :) even if the annealed sequences are not perfectly complementary. DNA) is formed. Therefore, the specificity of hybridization is reduced at lower stringency. Conversely, at high stringency (eg, higher temperature or lower salt) successful hybridization requires slight mismatches.

【0066】 当業者は、ハイブリダイゼーション条件が任意の程度のストリンジェンシーを
提供するために選択され得ることを理解する。好ましい実施形態では、この場合
、ハイブリダイゼーションは、ハイブリダイゼーションを確実にするために、低
ストリンジェンシー(6×SSPE−T(37C)(0.005%Triton
X−100)中)で行われ、次いでミスマッチのハイブリッド二重鎖を除去する
ために、それに続く洗浄が高ストリンジェンシー(例えば、1×SSPE−T(
37C))で行われる。所望のレベルのハイブリダイゼーション特異性が得られ
るまで、逐次的な洗浄が、漸増的な高ストリンジェンシー(例えば、0.25×
SSPE−T(37Cから50C)の程度に減少するまで)で行われ得る。スト
リンジェンシーはまた、薬剤(例えば、ホルムアミド)の添加により増加され得
る。ハイブリダイゼーション特異性は、試験プローブへのハイブリダイゼーショ
ンと存在し得る種々のコントロール(例えば、発現レベルコントロール、正規化
コントロール、ミスマッチコントロールなど)へのハイブリダイゼーションとの
比較により評価され得る。
One of ordinary skill in the art will appreciate that hybridization conditions may be selected to provide any degree of stringency. In a preferred embodiment, in this case the hybridization is performed with low stringency (6 × SSPE-T (37C) (0.005% Triton) to ensure hybridization.
X-100)) and then subsequent washes to remove mismatched hybrid duplexes at high stringency (eg 1 × SSPE-T ().
37C)). Sequential washes will be of increasing high stringency (eg, 0.25 ×) until the desired level of hybridization specificity is obtained.
SSPE-T (until reduced to 37 C to 50 C). Stringency can also be increased by the addition of agents such as formamide. Hybridization specificity can be assessed by comparison of hybridization to a test probe with hybridization to various controls that may be present (eg, expression level control, normalization control, mismatch control, etc.).

【0067】 一般に、ハイブリダイゼーション特異性(ストリンジェンシー)とシグナル強
度との間に関係が存在する。従って、好ましい実施形態では、一致する結果を生
じかつバックグラウンドの強度の約10%を超えるシグナル強度を提供する最も
高いストリンジェンシーで、洗浄が行われ得る。従って、好ましい実施形態では
、ハイブリダイズしたアレイは、逐次的なより高いストリンジェンシー溶液で洗
浄され得、そして各洗浄との間に読み取られ得る。このように生じたデータセッ
トの分析は、ハイブリダイゼーションパターンがそれほど変更されずそして目的
の特定のオリゴヌクレオチドプローブについての適切なシグナルを提供する上記
の洗浄ストリンジェンシーを明らかにする。
In general, there is a relationship between hybridization specificity (stringency) and signal strength. Thus, in a preferred embodiment, washes can be performed at the highest stringency that produces consistent results and provides a signal intensity greater than about 10% of the background intensity. Thus, in a preferred embodiment, the hybridized array may be washed with successive higher stringency solutions and read between each wash. Analysis of the data set thus generated reveals the above wash stringency with which the hybridization pattern is not significantly altered and which provides the appropriate signal for the particular oligonucleotide probe of interest.

【0068】 好ましい実施形態では、バックグラウンドのシグナルは、非特異的結合を減少
させるためのハイブリダイゼーションの間の界面活性剤(例えば、C−TAB)
またはブロッキング剤(たとえば、精子DNA、cot−1 DNAなど)の使
用により減少される。特に好ましい実施形態では、このハイブリダイゼーション
は、約0.5mg/mlのDNA(例えば、ニシン精子DNA)の存在下で行わ
れる。ハイブリダイゼーションにおけるブロッキング剤の使用は、当業者に周知
である(例えば、P.Tijssen(前出)の第8章を参照のこと)。
In a preferred embodiment, the background signal is a detergent (eg C-TAB) during hybridization to reduce non-specific binding.
Or it is reduced by the use of blocking agents (eg sperm DNA, cot-1 DNA, etc.). In a particularly preferred embodiment, this hybridization is performed in the presence of about 0.5 mg / ml DNA (eg herring sperm DNA). The use of blocking agents in hybridization is well known to those of skill in the art (see, eg, P. Tijssen, supra, Chapter 8).

【0069】 RNAまたはDNA間で形成される二重鎖の安定性は、溶液中では一般に、R
NA:RNA>RNA:DNA>DNA:DNAの順である。長いプローブは、
標的とのより良い二重鎖安定性を有するが、より短いプローブよりも乏しいミス
マッチ識別(ミスマッチ識別は、完璧に一致したプローブと1つの塩基がミスマ
ッチしたプローブとの間の実測のハイブリダイゼーションシグナル比をいう)し
か有さない。より短いプローブ(例えば、8マー)は、非常に良くミスマッチを
識別するが、全体的な二重鎖安定性は低い。
The stability of duplexes formed between RNA or DNA is generally determined in solution by R
The order is NA: RNA> RNA: DNA> DNA: DNA. Long probes
Mismatch discrimination with better duplex stability with the target but less than shorter probes (mismatch discrimination is the observed hybridization signal ratio between a perfectly matched probe and a probe with one base mismatch). Only). Shorter probes (e.g. 8-mer) discriminate mismatches very well, but have poor overall duplex stability.

【0070】 例えば、公知のオリゴヌクレオチドアナログを使用して、標的とプローブとの
間で形成された二本鎖の熱的安定性(Tm)を変更することは、二重鎖安定性お
よびミスマッチ識別の最適化を可能にする。Tmを変更することの1つの有用な
局面は、アデニン−チミン(A−T)二重鎖がグアニン−シトシン(G−C)二
重鎖より低いTmを有するという事実から生じる。これは、A−T二重鎖が1塩
基対につき2つの水素結合を有し、一方G−C二重鎖は1塩基対につき3つの水
素結合を有するという事実に一部基づく。塩基の不均一な分布が存在する不均一
オリゴヌクレオチドアレイにおいては、同時に各オリゴヌクレオチドプローブに
ついてのハイブリダイゼーションを最適化することは一般に可能ではない。従っ
て、いくつかの実施形態では、G−Cに重鎖を選択的に不安定化しそして/また
はA−T二重鎖の安定性を増加させることが所望され得る。これは、例えば、G
−C二重鎖を形成するアレイのプローブ中のグアニン残基をヒポキサンチンで置
換することによるか、もしくはA−T二重鎖を形成するプローブ中のアデニン残
基を2,6ジアミノプリンで置換することによるか、またはNaClの代わりに
テトラメチル塩化アンモニウム(TMACl)塩を使用することにより達成され
得る。
Altering the thermal stability (T m ) of a duplex formed between a target and a probe, for example using known oligonucleotide analogs, can improve duplex stability and mismatches. Allows optimization of identification. One useful aspect of altering the T m is adenine - results from the fact that it has a cytosine (G-C) lower than the duplex T m - thymine (A-T) duplexes guanine. This is partly due to the fact that AT duplexes have two hydrogen bonds per base pair, while GC duplexes have three hydrogen bonds per base pair. In heterogeneous oligonucleotide arrays where there is a heterogeneous distribution of bases, it is generally not possible to optimize the hybridization for each oligonucleotide probe at the same time. Thus, in some embodiments it may be desirable to selectively destabilize the heavy chain at GC and / or increase the stability of the AT duplex. This is, for example, G
By substituting hypoxanthine for the guanine residue in the probe of the array forming the -C duplex, or by replacing the adenine residue in the probe forming the AT duplex with 2,6 diaminopurine Or by using tetramethyl ammonium chloride (TMAC1) salt in place of NaCl.

【0071】 オリゴヌクレオチドアナログプローブを使用して確認された、変更された二本
鎖安定性は、例えば、標的オリゴヌクレオチドとハイブリダイズしたオリゴヌク
レオチドアナログアレイの蛍光シグナル強度を時間が経った後に追随することに
より確認され得る。このデータは、特定のハイブリダイゼーション条件(例えば
、室温での)最適化を可能にする(以後の単純化された診断適用のために)。
The altered double-stranded stability confirmed using the oligonucleotide analog probe follows, for example, the fluorescence signal intensity of the oligonucleotide analog array hybridized with the target oligonucleotide over time. Can be confirmed. This data allows optimization of specific hybridization conditions (eg at room temperature) (for subsequent simplified diagnostic applications).

【0072】 変更された二重鎖安定性を評価する他の方法は、ハイブリダイゼーションの際
に生成されるシグナル強度を経時的に追随することによる。DNA標的およびD
NAチップを使用する以前の実験は、シグナル強度が経時的に増加することおよ
びより安定な二重鎖がほとんど安定でない二重鎖よりも早く、より高いシグナル
強度を生じることを示した。これらのシグナルは、占有されつつある全ての結合
部位に起因して、特定の時間後に、プラトーすなわち「飽和」に達する。これら
のデータは、ハイブリダイゼーションの最適化、および特定の温度での最良の条
件の決定を可能にする。
Another method of assessing altered duplex stability is by following the signal intensity generated during hybridization over time. DNA target and D
Previous experiments using NA chips showed that the signal intensity increased over time and that the more stable duplex produced faster and higher signal intensity than the less stable duplex. These signals reach a plateau or "saturation" after a certain time due to all the binding sites being occupied. These data allow optimization of hybridization and determination of the best conditions at a particular temperature.

【0073】 ハイブリダイゼーション条件を最適化する方法は、当業者に周知である(例え
ば、Laboratory Techniques in Biochemis
try and Molecular Biology、第24巻:Hybri
dization With Nucleic Acid Probes,P.
Tijssen,Elsevier編,N.Y.,1993)。
Methods for optimizing hybridization conditions are well known to those of skill in the art (eg, Laboratory Technologies in Biochemis.
try and Molecular Biology, Volume 24: Hybri
dization With Nucleic Acid Probes, P.M.
Tijssen, Elsevier eds. Y. , 1993).

【0074】 (E.シグナル検出) 好ましい実施形態において、ハイブリダイズした核酸は、そのサンプル核酸に
結合した1つ以上の標識を検出することによって、検出される。この標識は、当
業者に周知の多数の手段のうちのいずれかによって組込まれ得る。しかし、好ま
しい実施形態において、この標識は、このサンプル核酸の調製における増幅工程
の間に、同時に組込まれる。従って、例えば、標識プライマーまたは標識ヌクレ
オチドを用いたポリメラーゼ連鎖反応(PCR)は、標識された増幅生成物を提
供する。好ましい実施形態において、上記のように標識ヌクレオチド(例えば、
フルオレセイン標識UTPおよび/またはCTP)を用いた転写増幅は、標識を
転写された核酸に組込む。あるいは、cDNAは、RNAサンプルを鋳型として
使用して合成され、cRNAは、インビトロ転写(IVT)を用いてcDNAを
鋳型として使用して合成される。ビオチン標識は、IVT反応(Enzo Bi
oarray高収率標識キット)の間に組込まれ得る。
E. Signal Detection In a preferred embodiment, hybridized nucleic acid is detected by detecting one or more labels bound to the sample nucleic acid. The label can be incorporated by any of numerous means well known to those of skill in the art. However, in a preferred embodiment, the label is co-incorporated during the amplification step in the preparation of the sample nucleic acid. Thus, for example, polymerase chain reaction (PCR) with labeled primers or labeled nucleotides will provide labeled amplification products. In a preferred embodiment, labeled nucleotides as described above (e.g.,
Transcription amplification with fluorescein-labeled UTP and / or CTP) incorporates a label into the transcribed nucleic acid. Alternatively, cDNA is synthesized using an RNA sample as a template and cRNA is synthesized using in vitro transcription (IVT) using cDNA as a template. Biotin labeling was performed using IVT reaction (Enzo Bi
oarray high yield labeling kit).

【0075】 あるいは、標識は、本来の核酸サンプル(例えば、mRNA、ポリA mRN
A、cDNAなど)、または増幅が完了した後に増幅生成物に直接添加され得る
。核酸に標識を結合させる手段は、当業者に周知であり、そして例えば、ニック
トランスレーション、または核酸のキナーゼ処理、続いてサンプル核酸を標識(
例えば、発蛍光団)に連結させる核酸リンカーの結合(ライゲーション)による
末端標識(例えば、標識RNAを用いる)が挙げられる。
Alternatively, the label may be labeled from the original nucleic acid sample (eg, mRNA, polyAmRN).
A, cDNA, etc.) or directly to the amplification product after amplification is complete. Means of attaching labels to nucleic acids are well known to those of skill in the art and include, for example, nick translation, or kinase treatment of nucleic acids, followed by labeling of sample nucleic acid
For example, end labeling (for example, using labeled RNA) by binding (ligation) of a nucleic acid linker to be linked to a fluorophore is mentioned.

【0076】 本発明の使用に適した検出可能な標識は、分光手段、光化学手段、生化学手段
、免疫化学手段、電気的手段、光学手段、または化学手段によって検出可能な任
意の組成物を含む。本発明において有用な標識としては、標識ストレプトアビジ
ン結合体を用いた染色のためのビオチン、磁気ビーズ(例えば、Dynabea
dsTM)、蛍光色素(例えば、フルオレセイン、テキサスレッド(texas
red)、ローダミン、緑色蛍光タンパク質など)、放射性標識(例えば、3
125I、35S、14C、または32P)、酵素(例えば、西洋ワサビペルオキシダ
ーゼ、アルカリホスファターゼおよびELISAに通常使用される他のもの)、
およびコロイド金または色のついたガラスビーズもしくはプラスチックビーズ(
例えば、ポリスチレン、ポリプロピレン、ラテックスなど)のような比色標識が
挙げられる。このような標識の使用を教示する特許としては、米国特許第3,8
17,837号;同第3,850,752号;同第3,939,350号;同第
3,996,345号;同第4,277,437号;同第4,275,149号
;および同第4,366,241号が挙げられる。
Detectable labels suitable for use in the present invention include any composition detectable by spectroscopic, photochemical, biochemical, immunochemical, electrical, optical or chemical means. . Labels useful in the present invention include biotin for staining with a labeled streptavidin conjugate, magnetic beads (eg, Dynabea).
ds ), fluorescent dyes (eg, fluorescein, Texas Red (texas
red), rhodamine, green fluorescent protein, etc.), radiolabel (eg, 3 H)
, 125 I, 35 S, 14 C, or 32 P), enzymes (eg horseradish peroxidase, alkaline phosphatase and others commonly used in ELISA),
And colloidal gold or colored glass or plastic beads (
Colorimetric labels such as polystyrene, polypropylene, latex, etc.). Patents teaching the use of such labels include US Pat.
No. 17,837; No. 3,850,752; No. 3,939,350; No. 3,996,345; No. 4,277,437; No. 4,275,149; And No. 4,366,241.

【0077】 このような標識を検出するための手段は、当業者に周知である。従って、例え
ば、放射性標識は、写真のフィルムまたはシンチレーションカウンターを用いて
検出され得、蛍光マーカーは、放射光を検出するために光検出器を用いて検出さ
れ得る。酵素標識は、代表的には、酵素に基質を提供し、その基質上の酵素の作
用によって生成される反応生成物を検出することによって検出され、そして比色
標識は、その色のついた標識を単に可視化することによって検出される。1つの
特に好ましい方法は、散乱光を測定することによって検出され得るコロイド金を
使用する。
Means for detecting such labels are well known to those of skill in the art. Thus, for example, radiolabels can be detected using photographic film or scintillation counters and fluorescent markers can be detected using photodetectors to detect emitted light. Enzyme labels are typically detected by providing a substrate for the enzyme and detecting the reaction product produced by the action of the enzyme on the substrate, and the colorimetric label is the colored label. Is detected by simply visualizing. One particularly preferred method uses colloidal gold which can be detected by measuring scattered light.

【0078】 標識は、ハイブリダイゼーションの前、または後に、標的(サンプル)核酸に
添加され得る。いわゆる「直接的な標識」は、ハイブリダイゼーションの前に標
的(サンプル)核酸に直接付着されるかまたは組込まれる、検出可能な標識であ
る。対照的に、いわゆる「間接的な標識」は、ハイブリダイゼーションの後にハ
イブリッド二重鎖に結合される。しばしば、間接的な標識は、ハイブリダイゼー
ションの前に標的核酸に付着された結合部分に付着される。従って、例えば、標
的核酸は、ハイブリダイゼーションの前にビオチン化され得る。ハイブリダイゼ
ーション後、アビジン結合された発蛍光団は、ビオチン保有ハイブリッド二重鎖
に結合して、容易に検出される標識を提供する。核酸を標識し、標識されたハイ
ブリダイズした核酸を検出する方法の詳細な総説について。(Laborato
ry Techniques in Biochemistry and Mo
lecular Biology,第24巻:Hybridization W
ith Nucleic Acid Probes,P.Tijssen編、E
lsevier、N.Y.、1993を参照のこと)。
The label may be added to the target (sample) nucleic acid before or after hybridization. So-called "direct labels" are detectable labels that are directly attached to or incorporated into the target (sample) nucleic acid prior to hybridization. In contrast, so-called "indirect labels" are attached to the hybrid duplex after hybridization. Often, the indirect label is attached to the binding moiety attached to the target nucleic acid prior to hybridization. Thus, for example, the target nucleic acid can be biotinylated prior to hybridization. After hybridization, the avidin-conjugated fluorophore binds to the biotin-bearing hybrid duplex, providing a label that is easily detected. For a detailed review of methods for labeling nucleic acids and detecting labeled hybridized nucleic acids. (Laborato
ry Technologies in Biochemistry and Mo
Lecture Biology, Volume 24: Hybridization W
it Nucleic Acid Probes, P.I. Edited by Tijssen, E
Isevier, N.M. Y. , 1993).

【0079】 蛍光標識は好ましく、インビトロ転写反応の間に容易に添加される。好ましい
実施形態において、フルオレセイン標識のUTPおよびCTPは、上記のような
インビトロ転写反応中に生成されるRNAに組込まれる。
Fluorescent labels are preferred and are easily added during the in vitro transcription reaction. In a preferred embodiment, fluorescein-labeled UTP and CTP are incorporated into the RNA produced during the in vitro transcription reaction as described above.

【0080】 高密度アレイのプローブにハイブリダイズした、標識された標的(サンプル)
核酸を検出する手段は、当業者に公知である。従って、例えば、比色標識が使用
される場合、標識の単純な可視化が十分である。放射性標識プローブが使用され
る場合、照射線の検出(例えば、写真フィルムまたはソリッドステート検出器を
用いて)が十分である。
Labeled targets (samples) hybridized to the probes of the high density array
Means of detecting nucleic acids are known to those of skill in the art. Thus, for example, if a colorimetric label is used, simple visualization of the label is sufficient. When radiolabeled probes are used, detection of radiation (eg, with photographic film or solid state detectors) is sufficient.

【0081】 しかし、好ましい実施形態において、標的核酸は、蛍光標識で標識され、そし
て、プローブアレイ上のこの標識の局在は、蛍光顕微鏡によって達成される。ハ
イブリダイズしたアレイは、特定の蛍光標識の励起光で光源により励起され、生
じる発光波長での蛍光が、検出される。特に好ましい実施形態において、励起光
源は、蛍光標識の励起に適したレーザーである。
However, in a preferred embodiment, the target nucleic acid is labeled with a fluorescent label and the localization of this label on the probe array is achieved by fluorescence microscopy. The hybridized array is excited by a light source with excitation light of a specific fluorescent label, and the fluorescence at the emission wavelength generated is detected. In a particularly preferred embodiment, the excitation light source is a laser suitable for exciting fluorescent labels.

【0082】 共焦点顕微鏡は、コンピューター制御されたステージで自動化され得、高密度
アレイの全体を自動でスキャンする。同様に、この顕微鏡は、光変換機(光電子
増倍器、ソリッドステートアレイ、CCDカメラなど)を備え得、これらは、自
動化されたデータ収集システムに接続され、アレイ上の各オリゴヌクレオチドプ
ローブに対するハイブリダイゼーションによって生成された蛍光シグナルを自動
で記録する。そのような自動化システムは、米国特許第5,143,854号、
PCT出願20 92/10092、および米国出願シリアル番号08/195
,889(1994年、2月10日出願)に詳細に記載される。シグナル検出の
ための自動化共焦点顕微鏡と連結したレーザー照射の使用は、約100μmより
も上、より好ましくは50μmより上、そして最も好ましくは25μmより上の
解像度における検出を可能にする。
A confocal microscope can be automated with a computer controlled stage to automatically scan through a high density array. Similarly, the microscope may be equipped with a photo-converter (photomultiplier, solid-state array, CCD camera, etc.), which is connected to an automated data collection system and is equipped with a high The fluorescent signal generated by the hybridization is automatically recorded. Such an automated system is described in US Pat. No. 5,143,854,
PCT application 20 92/10092 and US application serial number 08/195
, 889 (filed Feb. 10, 1994). The use of laser irradiation coupled with an automated confocal microscope for signal detection allows detection at resolutions above about 100 μm, more preferably above 50 μm, and most preferably above 25 μm.

【0083】 当業者は、ハイブリダイゼーションの結果を評価するための方法が、使用され
る特定のプローブ核酸および提供されるコントロールの性質に伴って変化をもた
らすことを理解する。最も単純な実施形態において、各プローブについての蛍光
強度の単純な定量が、決定される。これは、高密度アレイ上の各位置(異なるプ
ローブを示す)におけるプローブのシグナル強度を測定する(例えば、標識が蛍
光標識の場合、蛍光(強度)の量の検出は、そのアレイ上の各位置における固定
された励起照射によって生成される)ことによって、簡単に達成される。「試験
」サンプル由来の核酸にハイブリダイズしたアレイの絶対的な強度を、「コント
ロール」サンプルによって生成された強度と比較することは、そのプローブの各
々にハイブリダイズした核酸の相対的な発現の測定を提供する。
Those skilled in the art will appreciate that the methods for assessing hybridization results will vary with the nature of the particular probe nucleic acid used and the controls provided. In the simplest embodiment, a simple quantification of fluorescence intensity for each probe is determined. It measures the signal intensity of the probe at each position on the high density array (indicating a different probe) (eg, if the label is a fluorescent label, detection of the amount of fluorescence (intensity) is at each position on the array). Generated by a fixed excitation irradiation in). Comparing the absolute intensity of an array hybridized to nucleic acid from a "test" sample with the intensity produced by a "control" sample is a measure of the relative expression of nucleic acid hybridized to each of its probes. I will provide a.

【0084】 しかし、当業者は、ハイブリダイゼーションシグナルが、ハイブリダイゼーシ
ョン効率の強さ、サンプル核酸上の標識の量、およびそのサンプル中の特定の核
酸の量で変化することを理解する。非常に低いレベル(例えば、<1pM)で存
在する代表的な核酸は、非常に弱いシグナルを示す。いくらか低いレベルの濃度
において、このシグナルは、バックグラウンドから実質的に識別不可能になる。
ハイブリダイゼーションデータを評価する際、閾の強度値は、バックグラウンド
から基本的に識別不可能であるとしてカウントされないシグナルより下に選択さ
れ得る。
However, one skilled in the art will understand that the hybridization signal will vary with the strength of hybridization efficiency, the amount of label on the sample nucleic acid, and the amount of the particular nucleic acid in the sample. Representative nucleic acids present at very low levels (eg <1 pM) give very weak signals. At somewhat lower levels of concentration, this signal becomes virtually indistinguishable from the background.
In assessing hybridization data, threshold intensity values can be selected below the signals that do not count as essentially indistinguishable from the background.

【0085】 (F.転写の注釈(transcriptional annotation
)) いくつかの実施形態において、ゲノムのある領域に相補的であるように設計さ
れた核酸プローブは、そのゲノムを有する種由来の核酸サンプルとハイブリダイ
ズする。ハイブリダイゼーションシグナルは、分析されて、潜在的な転写物を決
定する。全てのプローブのハイブリダイゼーション強度が閾値(通常、非特異的
ハイブリダイゼーションのレベル)より上である、ゲノムのある領域が、同定さ
れる。この領域は、このプローブをそのゲノムに対して整列させ;全ての連続し
たプローブが閾値を超えた強度を有する領域を見つけ出すために、そのゲノムを
ざっと読取る(walking through)ことによって同定され得る。
いくつかの実施形態において、閾値は、ミスマッチを含むように設計された対応
するプローブの強度であり得る。
(F. Transcriptional annotation
)) In some embodiments, a nucleic acid probe designed to be complementary to a region of the genome hybridizes to a nucleic acid sample from a species having that genome. Hybridization signals are analyzed to determine potential transcripts. Certain regions of the genome in which the hybridization intensities of all probes are above a threshold (usually the level of non-specific hybridization) are identified. This region can be identified by aligning the probe to the genome; walking through the genome to find regions where all consecutive probes have intensities above the threshold.
In some embodiments, the threshold may be the intensity of the corresponding probe designed to include the mismatch.

【0086】 この領域は、1つ以上の転写物に潜在的に一致することが同定された。いくつ
かの実施形態において、プローブと同定された領域の各々とのハイブリダイゼー
ション強度は、さらに分析されて、大きさでの変化を検出する。例えば、40個
のプローブによってカバーされた同定された領域は、最初の20個のプローブの
強度が同様の強度を有する場合、残りの20個のプローブもまた、同様の強度の
強度を有し;そして最初の20個のプローブの強度が残りの20個のプローブの
2倍である場合、この領域は少なくとも2つの別々に転写された領域を含み得:
最初の領域は、最初の20個のプローブによってカバーされ、そして第2の領域
は、残りの20個のプローブによってカバーされる。
This region was identified as potentially matching one or more transcripts. In some embodiments, the hybridization intensities of the probe and each of the identified regions are further analyzed to detect changes in size. For example, in the identified region covered by 40 probes, if the intensities of the first 20 probes have similar intensities, the remaining 20 probes also have similar intensities; And if the intensity of the first 20 probes is twice that of the remaining 20 probes, this region may contain at least two separately transcribed regions:
The first region is covered by the first 20 probes and the second region is covered by the remaining 20 probes.

【0087】 いくつかの実施形態において、プローブの強度は、コンピューターの注釈に関
して、転写物の位置を同定するために使用される。類似した強度を有する複数の
プローブは、単一転写物である高い可能性を与える。
In some embodiments, probe intensity is used to identify the location of the transcript with respect to computer annotation. Multiple probes with similar intensities offer a high probability of being a single transcript.

【0088】 いくつかの他の実施形態において、非コード領域のプローブ強度は、前に同定
されていない転写物を同定するために使用される。類似した強度を有する複数の
プローブは、1つの転写物である高い可能性を与える。
In some other embodiments, probe strength in the non-coding region is used to identify previously unidentified transcripts. Multiple probes with similar intensities give a high probability of being a transcript.

【0089】 いくつかのさらなる実施形態において、コード領域の5’末端および3’末端
におけるプローブ強度は、潜在的な調節領域、終結配列、または未知の機能を有
する領域を同定するために使用される。
In some further embodiments, probe strength at the 5 ′ and 3 ′ ends of the coding region is used to identify potential regulatory regions, termination sequences, or regions with unknown function. .

【0090】 いくつかのさらなる実施形態において、類似したプローブ強度を有する複数の
隣接した転写物(コード領域および非コード領域を含む)は、オペロンである高
い可能性を与える。
In some further embodiments, multiple contiguous transcripts (including coding and non-coding regions) with similar probe strengths provide a high likelihood of being an operon.

【0091】 本発明の別の局面において、転写の注釈のためのコンピューターソフトウェア
プロダクトが、提供される。いくつかの実施形態において、コンピューターソフ
トウェアプロダクトは、プローブ強度を入力するためのコンピュータープログラ
ムコード、ゲノム領域を同定するためのコンピュータープログラムコード(ここ
で、プローブの強度は閾値より上である)、およびこのプローブの強度をゲノム
領域と比較してプローブ強度が類似である領域を同定するためのコードを含む。
各々の領域は、潜在的な転写物として示され得る。このコードは、任意のコンピ
ューターで読取り可能な媒体(CD−ROMまたはハードドライブを含む)に保
存され得る。
In another aspect of the invention, a computer software product for transcription annotation is provided. In some embodiments, the computer software product comprises a computer program code for entering probe intensity, a computer program code for identifying a genomic region, where the intensity of the probe is above a threshold, and A code is included to compare the intensity of the probe to the genomic region to identify regions of similar probe intensity.
Each region can be designated as a potential transcript. The code may be stored on any computer readable medium, including CD-ROM or hard drive.

【0092】 (II.実施例) 本実施例は、E.coliのいくつかのオペロンの転写の注釈を示す。[0092]   (II. Example)   This embodiment is based on E. 3 shows transcriptional annotation of several operons of E. coli.

【0093】 A)RNAの単離およびcDNA合成 単一コロニーのE.coli K−12(MG1655)を、5mlのLur
ia−Bertini(LB)ブロス中に接種し、そして、一晩37℃で増殖さ
せた。翌日、20mlのLBブロスを、0.2mlの一晩培養した培養物で接種
し、そして、0.8の光学密度(OD600)まで絶えず換気させながら37℃
で増殖させた。IPTGを、細菌を収集する30分前に添加して、lacオペロ
ンを誘導した。
A) RNA Isolation and cDNA Synthesis Single colony E. coli K-12 (MG1655) with 5 ml of Lur
Inoculated into ia-Bertini (LB) broth and grown overnight at 37 ° C. The next day, 20 ml of LB broth was inoculated with 0.2 ml of overnight culture and incubated at 37 ° C. with constant ventilation to an optical density (OD600) of 0.8.
Were grown in. IPTG was added 30 minutes before harvesting the bacteria to induce the lac operon.

【0094】 総RNAを、Epicentre Technologies(Madiso
n,WI)からのMasterPure完全DNA/RNA精製キットを用いて
、この細胞から単離した。培養物を、5000×gで簡単に遠心分離し、溶解緩
衝液中で再懸濁し、RNAの単離を製造者らのプロトコールに従って進めた。単
離されたRNAを、ピロ炭酸ジエチル(DEPC)処理水中で再懸濁し、260
nmでの吸光度に基づいて定量し、そしてさらなる使用まで−20℃でアリコー
トで保存した。
Total RNA was collected from Epicentre Technologies (Madiso).
n, WI) was used to isolate from these cells using a MasterPure complete DNA / RNA purification kit. Cultures were briefly centrifuged at 5000 xg, resuspended in lysis buffer and RNA isolation proceeded according to the manufacturer's protocol. The isolated RNA was resuspended in diethyl pyrocarbonate (DEPC) treated water and
Quantification based on absorbance at nm and stored in aliquots at -20 ° C until further use.

【0095】 cDNAは、全長総RNAを用いて合成した。9mgの総RNAを、ランダム
六量体をプライマーとして用いて逆転写した。RNAを、RNAseHおよびR
NAseAのカクテルを用いて除去した。cDNAの精製後(50%収率)、部
分的なDNAseI消化を、実施した。cDNAフラグメントを、Biotin
−ddATPを基質として用いて、ターミナルトランスフェラーゼでビオチン標
識する。2μgの標識cDNAを、プローブアレイにハイブリダイズさせた。7
0ngの全長cDNAを、RT−PCRによるオペロン検査のために使用した。
標準的なPCRを、各遺伝子由来の正方向プライマーおよび逆方向プライマーの
異なる組み合わせを用いて実施した。プライマーの位置を、図に示す。逆転写酵
素無しで作製された鋳型を、コントロールとして使用した。
CDNA was synthesized using full length total RNA. 9 mg of total RNA was reverse transcribed using random hexamers as primers. RNA to RNAse H and R
It was removed using a cocktail of NAseA. After purification of the cDNA (50% yield), a partial DNAseI digestion was performed. The cDNA fragment was labeled with Biotin.
-Biotin labeling with terminal transferase using ddATP as substrate. 2 μg of labeled cDNA was hybridized to the probe array. 7
0 ng of full length cDNA was used for operon testing by RT-PCR.
Standard PCR was performed with different combinations of forward and reverse primers from each gene. The positions of the primers are shown in the figure. A template made without reverse transcriptase was used as a control.

【0096】 (A.転写開始および転写物伸長の同定) 図4は、遺伝子metA、aceB、aceAおよびaceKを含むゲノム領
域を示す(1番上のボックス)。これらの遺伝子は、以前、Blattnerら
、F.R.Blattnerら、1997.The complete Gen
ome sequence of Escherichia coli K−1
2.Science:277;1453−1462によって同定された。ゲノム
領域を示す模式図下の垂直の棒線は、プローブの強度を示す。尺度を、左に提供
する。このプローブの強度は、metAとaceBとの間の領域において100
〜10,000辺りで変化し、これは、遺伝子metAが、遺伝子aceBの転
写物内とは異なる転写物内であることを示す。遺伝子metAおよび遺伝子ac
eBが1つのユニットとして転写されないことを確認するために、RT−PCR
を実施する。遺伝子metAおよび遺伝子aceBが、1つのユニットとして転
写される場合、RT−PCRの生成物は、1.5kbのフラグメントである。図
4の下の部分に示されるように、推定された1.5kbのフラグメントは見出さ
れず、これは、遺伝子metAおよび遺伝子aceBが、1つのユニットとして
転写されないという知見と一致する。
A. Identification of Transcription Initiation and Transcript Elongation FIG. 4 shows the genomic region containing the genes metA, aceB, aceA and aceK (top box). These genes have been previously described by Blattner et al. R. Blattner et al., 1997. The complete Gen
ome sequence of Escherichia coli K-1
2. Science: 277; 1453-1462. The vertical bar below the schematic showing the genomic region shows the intensity of the probe. The scale is provided on the left. The intensity of this probe is 100 in the region between metA and aceB.
It varies around ˜10,000, indicating that the gene metA is in a transcript different from that of the gene aceB. Gene metA and gene ac
To confirm that eB is not transcribed as a unit, RT-PCR
Carry out. When the gene metA and the gene aceB are transcribed as a unit, the product of RT-PCR is a 1.5 kb fragment. As shown in the lower part of FIG. 4, no putative 1.5 kb fragment was found, which is consistent with the finding that the genes metA and aceB are not transcribed as a unit.

【0097】 metAとaceBとの間の遺伝子間領域をタイリング(tiling)する
プローブはまた、それぞれ、metAおよびaceBをタイリングするプローブ
に類似した強度でハイブリダイズされ、これは、いくつかの遺伝子間領域もまた
、転写されることを示す。従って、この転写物は、Blattner遺伝子の5
’または3’を超えて伸張し得る。
The probe that tiles the intergenic region between metA and aceB was also hybridized with similar strength to the probe that tiles metA and aceB, respectively, which contained several genes. Interregions are also shown to be transcribed. Therefore, this transcript is 5 of the Blattner gene.
May extend beyond'or 3 '.

【0098】 同様に、図5において、yadQ遺伝子とyadR遺伝子との間の遺伝子間領
域に伸長する転写物が、検出された。
Similarly, in FIG. 5, a transcript extending in the intergenic region between the yadQ gene and the yadR gene was detected.

【0099】 図6は、少なくとも遺伝子ribF、ileS、lspA、slpAおよびl
ytBを含むオペロンの同定を示す。ribFとileSとの間の遺伝子間領域
を標的化するプローブの強度は、ribF遺伝子とileS遺伝子とを標的化す
るプローブの強度と同様であった。同様に、遺伝子lspAとsipAとの間の
遺伝子間領域を標的化するプローブは、この遺伝子を標的化するプローブと類似
した強度を有した。この結果は、5つの隣接する遺伝子が、1つのオペロンとし
て転写され得ることを示す。この結果を確認するために、これらの遺伝子間領域
にわたる推定された生成物でRT−PCRを実施した。図6の下の部分に、RT
−PCR実験の結果を示す。ribF遺伝子とileS遺伝子との間に遺伝子間
領域を含む転写物(0.94kbのフラグメント)が、同定された。lspAと
sipAとの間に遺伝子間領域を含む転写物(0.94kbと1.84kbのフ
ラグメント)がまた、見出された。これらの転写物によって、遺伝子間領域がプ
ローブアレイ実験が示すように転写されることが、確認された。
FIG. 6 shows that at least the genes ribF, ileS, lspA, slpA and l.
3 shows the identification of an operon containing ytB. The strength of the probe targeting the intergenic region between ribF and ileS was similar to the strength of the probe targeting the ribF gene and ileS gene. Similarly, a probe targeting the intergenic region between the genes lspA and sipA had similar strength to the probe targeting this gene. This result indicates that 5 adjacent genes can be transcribed as one operon. To confirm this result, RT-PCR was performed on the putative product over these intergenic regions. At the bottom of Figure 6, RT
-Shows the results of PCR experiments. A transcript (0.94 kb fragment) containing an intergenic region between the ribF and ileS genes was identified. A transcript (0.94 kb and 1.84 kb fragment) containing an intergenic region between lspA and sipA was also found. It was confirmed that these transcripts transcribed the intergenic region as shown by probe array experiments.

【0100】 同様に、図7〜11は、オリゴヌクレオチドプローブアレイを用いたさらなる
オペロンの同定を示す。いくつかの結果は、図6に示されたオペロンについて記
載されたように、RT−PCR実験によって確認された。
Similarly, FIGS. 7-11 show identification of additional operons using oligonucleotide probe arrays. Some results were confirmed by RT-PCR experiments as described for the operon shown in Figure 6.

【0101】 図12は、tnaC、tnaAおよびtnaBを含むゲノム領域を示す。tn
aAの上流領域は、小さな翻訳される調節タンパク質tnaCを含む、転写調節
領域(tnaL)である。
FIG. 12 shows the genomic region containing tnaC, tnaA and tnaB. tn
The upstream region of aA is the transcriptional regulatory region (tnaL), which contains a small translated regulatory protein tnaC.

【0102】 図13は、転写領域の同定を示す(矢印で示す)。この領域は、転写領域とし
て以前に知られていなかった。
FIG. 13 shows the identification of the transcribed region (indicated by the arrow). This region was not previously known as the transcribed region.

【0103】 (結論) 本発明は、転写の注釈についての非常に改善された方法を提供する。上記の説
明が、例示することを意図し、制限することを意図しないことが理解される。本
発明の多くの変化は、上記の説明を再検討して当業者に明らかである。例示目的
として、本発明は、高密度オリゴヌクレオチドアレイの使用に関して主に記載し
てきたが、他の核酸アレイ、転写レベルおよび遺伝子発現を測定してタンパク質
レベルをモニタリングする他の方法が使用され得ることは、当業者に容易に認識
される。
CONCLUSION The present invention provides a greatly improved method for transcriptional annotation. It is understood that the above description is intended to be illustrative and not limiting. Many variations of the invention will be apparent to those of skill in the art upon reviewing the above description. For purposes of illustration, the present invention has been described primarily with respect to the use of high density oligonucleotide arrays, although other nucleic acid arrays, other methods of measuring transcription levels and gene expression to monitor protein levels may be used. Are easily recognized by those skilled in the art.

【0104】 添付の図面(これらは、本明細書に組み込まれ、その一部を形成する)は、本
発明の実施形態を例示し、記述とともに、本発明の原理を説明するのに役立つ。
The accompanying drawings, which are incorporated in and form a part of this specification, illustrate embodiments of the invention and, together with the description, serve to explain the principles of the invention.

【図面の簡単な説明】[Brief description of drawings]

【図1】 図1は、本発明の実施形態のソフトウエアを実行するために使用され得るコン
ピュータシステムの一つの例を示す。
FIG. 1 illustrates one example of a computer system that may be used to execute the software of an embodiment of the present invention.

【図2】 図2は、図1のコンピュータシステムのシステムブロックダイアグラムを示す
FIG. 2 shows a system block diagram of the computer system of FIG.

【図3】 図3は、本発明の実施形態に有用な発現アレイの一つの設計を示す。[Figure 3]   FIG. 3 shows one design of expression arrays useful in embodiments of the invention.

【図4】 図4は、転写の開始および転写伸長の同定を示す。[Figure 4]   Figure 4 shows initiation of transcription and identification of transcription elongation.

【図5】 図5は、転写伸長を示す。[Figure 5]   FIG. 5 shows transcription elongation.

【図6】 図6は、オペロンの同定を示す。[Figure 6]   FIG. 6 shows the identification of operons.

【図7】 図7は、オペロンの同定を示す。[Figure 7]   FIG. 7 shows the identification of operons.

【図8】 図8は、オペロンの同定を示す。[Figure 8]   FIG. 8 shows the identification of operons.

【図9】 図9は、オペロンの同定を示す。[Figure 9]   FIG. 9 shows the identification of operons.

【図10】 図10は、オペロンの同定を示す。[Figure 10]   FIG. 10 shows the identification of operons.

【図11】 図11は、オペロンの同定を示す。FIG. 11   FIG. 11 shows the identification of operons.

【図12】 図12は、制御エレメントの同定を示す。[Fig. 12]   FIG. 12 shows the identification of control elements.

【図13】 図13は、以前に知られていない転写物の同定を示す。[Fig. 13]   FIG. 13 shows the identification of previously unknown transcripts.

───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 09/641,081 (32)優先日 平成12年8月16日(2000.8.16) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CO,CR,CU,CZ,DE ,DK,DM,DZ,EE,ES,FI,GB,GD, GE,GH,GM,HR,HU,ID,IL,IN,I S,JP,KE,KG,KP,KR,KZ,LC,LK ,LR,LS,LT,LU,LV,MA,MD,MG, MK,MN,MW,MX,MZ,NO,NZ,PL,P T,RO,RU,SD,SE,SG,SI,SK,SL ,TJ,TM,TR,TT,TZ,UA,UG,US, UZ,VN,YU,ZA,ZW (72)発明者 ジンゲラス, トーマス アメリカ合衆国 カリフォルニア 92024, エンシニタス, クレスト ドライブ 1541 Fターム(参考) 4B063 QA01 QA18 QQ42 QQ52 QR08 QR42 QR55 QR62 QR82 QS25 QS34 QX02 ─────────────────────────────────────────────────── ─── Continued front page    (31) Priority claim number 09 / 641,081 (32) Priority date August 16, 2000 (August 16, 2000) (33) Priority claiming countries United States (US) (81) Designated countries EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, I T, LU, MC, NL, PT, SE, TR), OA (BF , BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, G M, KE, LS, MW, MZ, SD, SL, SZ, TZ , UG, ZW), EA (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, B Z, CA, CH, CN, CO, CR, CU, CZ, DE , DK, DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, I S, JP, KE, KG, KP, KR, KZ, LC, LK , LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, PL, P T, RO, RU, SD, SE, SG, SI, SK, SL , TJ, TM, TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZW (72) Inventor Zingeras, Thomas             United States California 92024,               Encinitas, Crest drive             1541 F-term (reference) 4B063 QA01 QA18 QQ42 QQ52 QR08                       QR42 QR55 QR62 QR82 QS25                       QS34 QX02

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 ゲノムの潜在的に転写される領域を同定するための方法であ
って、以下: 複数の核酸プローブを核酸サンプルとハイブリダイズする工程であって、ここ
で、該核酸サンプルが該ゲノム由来の転写物を含み、該プローブが該ゲノムのあ
る領域を標的とする、工程;および 該転写された領域を、該領域を標的とする全ての連続的なプローブのハイブリ
ダイゼーションが閾値より上である該ゲノムのある領域として同定する、工程、
を包含する、方法。
1. A method for identifying potentially transcribed regions of a genome, the method comprising: hybridizing a plurality of nucleic acid probes with a nucleic acid sample, wherein the nucleic acid sample is Including a transcript from the genome, wherein the probe targets a region of the genome; and the transcribed region is above the threshold for hybridization of all consecutive probes targeting the region. Identifying a region of the genome that is
Including the method.
【請求項2】 前記プローブがオリゴヌクレオチドである、請求項1に記載
の方法。
2. The method of claim 1, wherein the probe is an oligonucleotide.
【請求項3】 前記オリゴヌクレオチドが基板に固定される、請求項2に記
載の方法。
3. The method of claim 2, wherein the oligonucleotide is immobilized on a substrate.
【請求項4】 前記閾値が非特異的結合である、請求項1に記載の方法。4. The method of claim 1, wherein the threshold is non-specific binding. 【請求項5】 前記非特異的結合が、少なくとも1つのミスマッチ塩基を含
むように設計されるプローブを使用して測定される、請求項4に記載の方法。
5. The method of claim 4, wherein the non-specific binding is measured using a probe designed to contain at least one mismatched base.
【請求項6】 請求項1に記載の方法であって、さらに、部分領域を標的と
する前記プローブのハイブリダイゼーションが類似しており、そして該部分領域
を前記転写される領域として示している部分領域を同定する工程を包含する、方
法。
6. The method of claim 1, wherein the hybridization of the probe targeting a partial region is similar and the partial region is designated as the transcribed region. A method comprising identifying a region.
【請求項7】 前記ゲノムが原核生物由来である、請求項6に記載の方法。7. The method of claim 6, wherein the genome is of prokaryotic origin. 【請求項8】 前記転写される領域がオペロンである、請求項7に記載の方
法。
8. The method of claim 7, wherein the transcribed region is an operon.
【請求項9】 前記原核生物が細菌である、請求項8に記載の方法。9. The method of claim 8, wherein the prokaryote is a bacterium. 【請求項10】 コンピュータソフトウエアプロダクトであって、以下: a)複数のハイブリダイゼーション強度を受け取るコンピュータプログラムコ
ードであって、ここで、該強度のそれぞれが、核酸サンプルへの複数のプローブ
のうちの1つのハイブリダイゼーションを反映し、そして該プローブがゲノムを
標的としている、コンピュータプログラムコード; b)該ゲノムの領域を同定するコンピュータプログラムコードであって、該領
域に対する該プローブの強度が閾値より上である、コンピュータプログラムコー
ド;および c)該コードを保存するためのコンピュータ読み取り可能媒体、 を備える、コンピュータソフトウエアプロダクト。
10. A computer software product, comprising: a) computer program code for receiving a plurality of hybridization intensities, each of said intensities being among a plurality of probes to a nucleic acid sample. Computer program code reflecting one hybridization and wherein the probe targets the genome; b) a computer program code for identifying a region of the genome, wherein the intensity of the probe for the region is above a threshold value. A computer software product comprising: a computer program code; and c) a computer-readable medium for storing the code.
【請求項11】 請求項10に記載のコンピュータソフトウエアプロダクト
であって、さらに、前記領域の範囲を同定するコンピュータプログラムコードを
備え、ここで、該範囲に対する前記プローブの強度が類似している、コンピュー
タソフトウエアプロダクト。
11. The computer software product of claim 10, further comprising computer program code identifying a range of the region, wherein the intensities of the probe for the range are similar. Computer software product.
【請求項12】 請求項11に記載のコンピュータソフトウエアプロダクト
であって、ここで、前記範囲に対する前記プローブの前記強度の差が2倍以内で
ある、コンピュータソフトウエアプロダクト。
12. The computer software product of claim 11, wherein the difference in the intensity of the probe with respect to the range is within a factor of two.
【請求項13】 前記差が150%以内である、請求項12に記載のコンピ
ュータソフトウエアプロダクト。
13. The computer software product of claim 12, wherein the difference is within 150%.
【請求項14】 請求項11に記載のコンピュータソフトウエアプロダクト
であって、さらに、前記範囲を転写される範囲として示すためのコンピュータプ
ログラムコードを備える、コンピュータソフトウエアプロダクト。
14. The computer software product of claim 11, further comprising computer program code for indicating the range as a transcribed range.
JP2001586461A 2000-05-19 2001-04-24 Method and computer software product for transcription annotation Withdrawn JP2003534551A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US20543200P 2000-05-19 2000-05-19
US60/205,432 2000-05-19
US20686600P 2000-05-24 2000-05-24
US60/206,866 2000-05-24
US64108100A 2000-08-16 2000-08-16
US09/641,081 2000-08-16
PCT/US2001/013215 WO2001090746A1 (en) 2000-05-19 2001-04-24 Methods and computer software products for transcriptional annotation

Publications (1)

Publication Number Publication Date
JP2003534551A true JP2003534551A (en) 2003-11-18

Family

ID=27394789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001586461A Withdrawn JP2003534551A (en) 2000-05-19 2001-04-24 Method and computer software product for transcription annotation

Country Status (5)

Country Link
EP (1) EP1272841A4 (en)
JP (1) JP2003534551A (en)
AU (1) AU2001255635A1 (en)
CA (1) CA2378854A1 (en)
WO (1) WO2001090746A1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6045996A (en) * 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
CA2330731A1 (en) * 1998-06-24 1999-12-29 Smithkline Beecham Corporation Method for detecting, analyzing, and mapping rna transcripts

Also Published As

Publication number Publication date
EP1272841A4 (en) 2006-07-26
AU2001255635A1 (en) 2001-12-03
WO2001090746A1 (en) 2001-11-29
EP1272841A1 (en) 2003-01-08
CA2378854A1 (en) 2001-11-29

Similar Documents

Publication Publication Date Title
US6410229B1 (en) Expression monitoring by hybridization to high density nucleic acid arrays
US7552013B2 (en) Ratio-based oligonucleotide probe selection
US20060141506A1 (en) Methods for monitoring the expression of alternatively spliced genes
US6340565B1 (en) Determining signal transduction pathways
WO2001023614A1 (en) Methods and computer software products for multiple probe gene expression analysis
JP2000308500A (en) Downstream gene of tumor suppressor gene wt1
US20060281126A1 (en) Methods for monitoring the expression of alternatively spliced genes
US20020081589A1 (en) Gene expression monitoring using universal arrays
JP2001054400A (en) Genotype determining two allele marker
US20020055112A1 (en) Methods for reducing complexity of nucleic acid samples
US6670122B2 (en) Method for detecting transcription templates
US20020106644A1 (en) Methods for transcription detection and analysis
US20110250602A1 (en) Methods and Computer Software Products for Identifying Transcribed Regions of a Genome
JP2003534551A (en) Method and computer software product for transcription annotation
EP1549765A1 (en) Method to analyze polymeric nucleic acid sequence variations

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080701