WO2005038026A1 - Method of typing mutation - Google Patents

Method of typing mutation Download PDF

Info

Publication number
WO2005038026A1
WO2005038026A1 PCT/JP2004/015214 JP2004015214W WO2005038026A1 WO 2005038026 A1 WO2005038026 A1 WO 2005038026A1 JP 2004015214 W JP2004015214 W JP 2004015214W WO 2005038026 A1 WO2005038026 A1 WO 2005038026A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
sequence
target dna
mutation
identification code
Prior art date
Application number
PCT/JP2004/015214
Other languages
French (fr)
Japanese (ja)
Inventor
Nobuto Koyama
Junichi Mineno
Shusaku Yamashita
Nao Yamanaka
Masahiro Sato
Hiroyuki Izu
Masanori Takayama
Kiyozo Asada
Ikunoshin Kato
Original Assignee
Takara Bio Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Takara Bio Inc. filed Critical Takara Bio Inc.
Publication of WO2005038026A1 publication Critical patent/WO2005038026A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism

Definitions

  • RFLP is analyzed by performing Southern hybridization using a probe at that site. be able to.
  • polymorphisms that can be detected as RFLP are not so frequently present in the genome, so they are not suitable for comprehensive analysis of detailed polymorphisms.
  • SNP is the most frequently found polymorphism, and exists in human at about 1 kb. SNP analysis is useful for understanding the relationship between the efficacy and side effects of diseases and pharmaceuticals and individual differences, and conducting more effective and safe medical treatment.SNP screening and typing are performed on a large scale worldwide. ing.
  • Mutation detection methods utilize a method for determining a DNA base sequence, a method based on hybridization, a method based on primer extension, a method based on ligation, and an enzyme recognizing a special DNA structure. It is roughly divided into methods.
  • Patent Document 3 US Pat. No. 5,660,988
  • Patent Document 4 U.S. Pat.No. 5210015
  • step (g) ligating the encoding adapter complementary to the protruding end generated in step (f) with the target DNA on the microbead
  • step (i) A step of removing the decoder probe from the microbeads in step (h) and using the resulting microbeads in step (f) and subsequent steps.
  • the adapters in each group are a mixture of 4 N_1 B-terminal adapters, and the entire adapter is 4 XN.
  • NX 4 consists of N types of arrays.
  • Preferred examples of the type lis restriction enzyme used in the “step of determining the base sequence of the target DNA fragment” include Bbvl. As described below, this enzyme recognizes the GCAGC sequence and generates a 5'-terminal with a 4-base overhang.
  • mutant includes various forms of mutation such as “base substitution”, “deletion mutation”, “insertion mutation” and the like.
  • a target DNA is prepared.
  • the method for preparing the target DNA is not particularly limited, for example, genomic DNA, cDNA, DNA amplified by nucleic acid amplification methods such as these PCR, ICAN, etc., and these DNAs as vectors, for example, plasmid vectors or Batatelio phage vectors, DNA, a mixture of cloned DNA, cloned DNA from which the vector portion has been removed by restriction enzyme digestion, etc., nucleases such as restriction enzymes, chemical treatment such as acid treatment, or Those subjected to physical treatment, for example, ultrasonic treatment, may be mentioned.
  • the method for preparing the target DNA which is not particularly limited to the chain length of the target DNA, the method for determining the sample identification code and the nucleotide sequence of the region containing the mutation site, the nucleotide sequence around the mutation site, etc. Just select.
  • the molecular weight of the target DNA can be 10 to 10,000 bases, preferably 15 to 5000 bases, and more preferably 20 to 1000 bases.
  • the range of the target DNA is set so that the mutation site to be typed is located in the target DNA.
  • the method may be appropriately determined by a method for determining the base sequence of the region including the sample identification code and the mutation site. Just choose!
  • the nucleotide sequence length that can be determined by this method is about 20 bases, and thus the sample identification code and the mutation to be typed It must be included in the range of 20 bases or less.
  • SAGE method a polymerization method similar to the Serial Analysis of Gene Expression method (hereinafter, referred to as SAGE method) can be used.
  • the SAGE method is a method in which a large amount of gene expression information can be obtained by one sequence determination by polymerizing DNA fragmented with a type lis restriction enzyme and determining its base sequence (U.S. Pat. Book, Vel culescu VE, and 3 others, Science, Vol. 270, 484-487, 1995.
  • type lis restriction enzymes that cleave sites that are 20 bases or more apart from the recognition sequence are known, so the sample identification code and the mutation site are included in the region of 20 bases or less. Need to be. Therefore, the mutation site may be located within 19 bases, preferably within 15 bases, more preferably within 10 bases, from the end of the target DNA to which the sample identification code is added.
  • the relationship between the primer sequence and the mutation site is not particularly limited.
  • it is desirable to design the primer so that the primer sequence does not include the mutation site for the following reasons. That is, when the primer sequence contains a mutation site, it is necessary to prepare a primer having a plurality of sequences corresponding to the type of mutation, and when the mutation site is located other than near the 3 ′ end of the primer, Since there is a possibility that amplification will occur with primers containing bases that are not complementary to type II, there is a risk that DNA that does not accurately reflect the type II base sequence will be amplified.
  • the start adapter has a type lis restriction enzyme recognition sequence, and is designed such that digestion with this enzyme makes the end of the target DNA a protruding end.
  • a type lis restriction enzyme recognition sequence By flowing a type lis restriction enzyme through a flow cell filled with beads and reacting with the DNA on the beads, the four bases at the end of the target DNA are made to be protruding ends.
  • the type lis restriction enzyme is not particularly limited as long as it generates a protruding end, but an enzyme generating a 4-base protruding end, for example, Bbvl can be suitably used.
  • Preferable examples of the encoder adapter and decoder probe used in the present invention include those described in Non-patent Document 4.
  • An annealed oligonucleotide shown, adapter GAC is an annealed oligonucleotide shown by SEQ ID NO: 7 in the sequence list and an oligonucleotide shown by SEQ ID NO: 8 in the sequence list, and an adapter CCC Sequence listing
  • the oligonucleotides represented by SEQ ID NO: 9 and the oligonucleotides represented by SEQ ID NO: 10 in the Sequence Listing are annealed.
  • the oligonucleotides represented by SEQ ID NOs: 2, 4, 6, 8, and 10 are phosphorylated at the 5 'end.
  • the tag library pool was subjected to PCR using a type I, FAM-labeled PCR-R primer (SEQ ID NO: 12) and a biotinylated PCR-F primer (SEQ ID NO: 13).
  • the part containing the tag was amplified. Operations are performed for each pool from this PCR to the first sorting, and in this example, one pool is described. After digesting the PCR product with Pad (manufactured by NEB), T4 DNA polymerase (manufactured by Takara Bio Inc.) was allowed to act in the presence of dGTP to convert the tag portion to single-stranded.

Abstract

A method of typing a mutation characterized by comprising the step of preparing target DNA containing a mutation site to be typed, the step of attaching a sample identification code to the target DNA, and the step of determining the base sequence of a region containing the sample identification code and the mutation site in the target DNA having the sample identification code attached thereto.

Description

明 細 書  Specification
変異のタイピング方法  Mutation typing method
技術分野  Technical field
[0001] 本発明は、分子生物学、医学分野において有用な変異のタイピング方法に関する 背景技術  The present invention relates to a method for typing a mutation useful in the fields of molecular biology and medicine.
[0002] 同種の生物であってもゲノム DNA塩基配列は個体間で異なっており、この現象お よび異なっている部位を遺伝子多型と呼ぶ。通常、集団の中で 1%以上の頻度で現 れるものを遺伝子多型と定義する。遺伝子多型のマーカーとしては、主として次の 3 種類が使用されている。すなわち、制限酵素切断片長多型 (restriction fragment length polymorphism^ RFLP)、単 ¾酉己列 ¾多型 (simple sequence lengt h polymorphism^ SSLP)および一;^ 多型 (single nucleotide polymorphi sm、 SNP)である。  [0002] Even in the same species of organisms, the genomic DNA base sequence differs between individuals, and this phenomenon and the sites where the differences occur are called genetic polymorphisms. Usually, those that occur at a frequency of 1% or more in a population are defined as polymorphisms. The following three types of polymorphism markers are mainly used. That is, restriction fragment length polymorphism ^ RFLP, simple sequence length polymorphism ^ SSLP and one; ^ polymorphism (single nucleotide polymorphi sm, SNP). .
[0003] 特定のゲノム領域にある程度大きな挿入、欠失または制限酵素認識部位の変異が 存在する場合、その部位のプローブを使用してサザンノヽイブリダィゼーシヨンを行うこ とにより RFLPを解析することができる。しかし、 RFLPとして検出可能な多型はゲノム 中にそれほど頻繁に存在するわけではないので細かな多型の網羅的な解析には向 いていない。ゲノム中には 1一 6塩基の反復配列が多く存在し、これをマイクロサテラ イトと呼ぶ。マイクロサテライトの反復回数は個体により異なっていることがあり、これを SSLPと呼ぶ。マイクロサテライトの周辺の配列は反復配列ごとに異なっているので、 特異的なプライマーを使用してポリメラーゼ連鎖反応 (PCR)により増幅したのちに、 ゲル電気泳動により増幅産物の鎖長を分析することにより反復回数を容易に知ること ができる。しかしながら、詳細な多型解析を行うためには SSLPよりもさらに高密度な 多型マーカーが必要である。 SNPは最も頻繁に見られる遺伝子多型であり、ヒトでは 約 lkbに 1ケ所の割合で存在する。疾患や医薬品の薬効'副作用と個体差の関係を 理解し、より効果的かつ安全な医療を行うためには SNPの解析が有用であり、 SNP のスクリーニングやタイピングが世界的に大規模に行われている。 [0004] 変異の検出手段は、 DNA塩基配列を決定する方法、ハイブリダィゼーシヨンに基 づく方法、プライマー伸長に基づく方法、ライゲーシヨンに基づく方法および特殊な D NA構造を認識する酵素を利用する方法に大別される。 [0003] If a certain genomic region has a relatively large insertion, deletion, or mutation in a restriction enzyme recognition site, RFLP is analyzed by performing Southern hybridization using a probe at that site. be able to. However, polymorphisms that can be detected as RFLP are not so frequently present in the genome, so they are not suitable for comprehensive analysis of detailed polymorphisms. There are many repetitive sequences of 16 bases in the genome, which are called microsatellite. The number of microsatellite repetitions may vary from individual to individual and is referred to as SSLP. Since the sequence around the microsatellite is different for each repetitive sequence, amplification by polymerase chain reaction (PCR) using specific primers and analysis of the chain length of the amplified product by gel electrophoresis The number of repetitions can be easily known. However, more detailed polymorphism analysis requires polymorphic markers with higher density than SSLP. SNP is the most frequently found polymorphism, and exists in human at about 1 kb. SNP analysis is useful for understanding the relationship between the efficacy and side effects of diseases and pharmaceuticals and individual differences, and conducting more effective and safe medical treatment.SNP screening and typing are performed on a large scale worldwide. ing. [0004] Mutation detection methods utilize a method for determining a DNA base sequence, a method based on hybridization, a method based on primer extension, a method based on ligation, and an enzyme recognizing a special DNA structure. It is roughly divided into methods.
[0005] 複数個体のゲノム DNA塩基配列を比較する方法が最も直接的な変異の検出方法 である。 DNAの塩基配列決定方法は化学分解法 (例えば、非特許文献 1参照)、酵 素合成法 (例えば、非特許文献 2参照)に大別される。前者はマクサム ギルバート法 、後者はジデォキシ法またはサンガー法と呼ばれており、特に後者はその原理を応 用した自動シークェンサ一が広く普及して DNA塩基配列決定方法の主流となって いる。また、マツシブリー ノ ラレル シグネチャー シークェンシング法(Massively Parallel Signature Sequencing、以下、 MPSS法と称す;例えば、非特許文献 3 、特許文献 1参照)は上記の塩基配列決定法とは全く異なった原理により塩基配列を 決定する技術である。試料となる DNAをマイクロビーズに結合させ、マイクロビーズ をフローセルに 2次元的に充填し、ここで一連の反応、検出を行うことにより、約 20塩 基の配列を、一度に約 100万個決定することができる。 MPSS法に適用される試料 の処理に関する DNAマイクロビーズアレイ技術は、特許文献 2や非特許文献 4等に 開示されている。  [0005] The method of comparing the genomic DNA base sequences of multiple individuals is the most direct mutation detection method. Methods for determining the nucleotide sequence of DNA are broadly classified into a chemical decomposition method (for example, see Non-Patent Document 1) and an enzyme synthesis method (for example, see Non-Patent Document 2). The former is called the Maxam-Gilbert method, and the latter is called the dideoxy method or the Sanger method. In the latter, in particular, an automatic sequencer based on the principle has become widespread and has become the mainstream DNA sequencing method. In addition, Matsushiburi No Larel Signature Sequencing (Massively Parallel Signature Sequencing; hereinafter, referred to as MPSS); This is a technique for determining the sequence. The sample DNA is bound to the microbeads, the microbeads are two-dimensionally packed in a flow cell, and a series of reactions and detections are performed to determine the sequence of about 20 bases at a time. can do. DNA microbead array technology relating to sample processing applied to the MPSS method is disclosed in Patent Document 2, Non-patent Document 4, and the like.
[0006] ノ、イブリダィゼーシヨンに基づく方法は、変異の有無を核酸試料とプローブとのハイ ブリダィゼーシヨンによって検出するものである。該方法は一塩基の違いによってハイ ブリダィゼーシヨンが左右されるようなプローブ、ならびにハイブリダィゼーシヨン条件 を見出す必要があり、高い再現性を有する検出系の構築が困難である。  [0006] (h) The method based on hybridization detects the presence or absence of a mutation by hybridization between a nucleic acid sample and a probe. In this method, it is necessary to find out a probe whose hybridization is influenced by a difference of one base and hybridization conditions, and it is difficult to construct a detection system having high reproducibility.
例えば、特許文献 3記載のサイクルプローブ反応(cycle probe reaction)を用 いた変異検出方法が挙げられる。該方法においては、特殊な構造を有する核酸プロ ーブを目的とする核酸分子にハイブリダィズさせる。ここに切断試薬を加えると、 目的 とする核酸分子とプローブカ 、イブリダィズした場合には当該プローブが切断され、 ハイブリダィズしない場合には、当該プローブは切断されない。その後、切断された プローブ由来の遊離断片を検出、定量することにより変異を検出することを特徴とす る。し力しながら、該方法では標的核酸が微量の場合、該プローブの遊離断片の量 が検出できるレベルに到達するまでに相当のタイムラグがある。 [0007] 別法として、 TaqMan法を用いた変異検出方法が挙げられる(例えば、特許文献 4 、 5参照)。該方法では、蛍光色素及びクェンチヤ一が結合した TaqManプローブを 使用する。該プローブは、変異を含むものと、変異を含まないものの 2種類を使用す る。該プローブを目的とする核酸分子にハイブリダィズさせ、その上流からプライマー が伸長してくると、目的とする核酸分子と該プローブがハイブリダィズした場合にのみ 、 DNAポリメラーゼの 5'→3 'ェキソヌクレアーゼ活性により当該プローブが分解され 、発生する蛍光を検出することにより変異を検出することを特徴とする。しかしながら、 該方法において、 5 '→3 'ェキソヌクレアーゼ活性を有するポリメラーゼ、ならびに 3' 末端がブロックされた標識ヌクレオチドを用いて PCRを行う必要があり、厳密な温度 調整が必要であるという問題がある。 For example, a mutation detection method using a cycle probe reaction described in Patent Document 3 can be mentioned. In this method, a nucleic acid probe having a special structure is hybridized to a nucleic acid molecule of interest. When a cleavage reagent is added thereto, the target nucleic acid molecule and the probe are cleaved when they are hybridized, and the probe is not cleaved when they are not hybridized. Thereafter, the mutation is detected by detecting and quantifying the free fragment derived from the cleaved probe. However, in the method, when the amount of the target nucleic acid is very small, there is a considerable time lag until the amount of the free fragment of the probe reaches a detectable level. As another method, there is a mutation detection method using the TaqMan method (for example, see Patent Documents 4 and 5). In this method, a TaqMan probe to which a fluorescent dye and a quencher are bound is used. As the probe, two types, one containing a mutation and one containing no mutation, are used. When the probe is hybridized to the target nucleic acid molecule and the primer is extended from the upstream of the probe, the 5 ′ → 3 ′ exonuclease activity of the DNA polymerase is increased only when the target nucleic acid molecule and the probe are hybridized. And the mutation is detected by detecting the generated fluorescence. However, in this method, it is necessary to perform PCR using a polymerase having 5 ′ → 3 ′ exonuclease activity and a labeled nucleotide having a blocked 3 ′ end, and thus a problem that strict temperature control is required. is there.
[0008] プライマー伸長に基づく方法は、(1)変異を検出しょうとする塩基部分に 3'末端が アニーリングするプライマーを使用し、プライマー伸長反応の有無力 変異を検出す る方法 (例えば、特許文献 6参照)、(2) 3'末端力 2番目のヌクレオチドに検出しょう とする変異部位が位置するプライマーを使用し、プライマー伸長反応の有無力 変 異を検出する方法 (例えば、特許文献 7参照)、(3)変異を検出しょうとする塩基の 3' 側に隣接する塩基に 3'末端がアニーリングするプライマーを使用し、当該プライマー に取り込まれる塩基の種類から目的部分の塩基を決定し、変異を検出する方法 (例 えば、特許文献 8参照)、の 3つに分類される。  [0008] The method based on primer extension is based on (1) a method for detecting a mutation in the presence or absence of a primer extension reaction by using a primer whose 3 'end anneals to a base portion to be detected for mutation (for example, (6), (2) 3 'terminal force A method for detecting the presence or absence of a primer extension reaction using a primer in which the mutation site to be detected is located at the second nucleotide (for example, see Patent Document 7) (3) Use a primer whose 3 'end anneals to the base adjacent to the 3' side of the base for which mutation is to be detected, determine the base of the target portion from the type of base incorporated into the primer, and determine the mutation. Detection method (for example, see Patent Document 8).
[0009] 次に、ライゲーシヨンに基づく方法がある。これは、変異を含む部分を突出末端とし てもつ DNAと、この部分に相補的な配列を持つプローブに DNAリガーゼを作用さ せ、ライゲーシヨンの有無力も変異を検出する方法である。  Next, there is a method based on ligation. In this method, DNA ligase is applied to a DNA having a portion containing a mutation as a protruding end and a probe having a sequence complementary to this portion, and the mutation is detected based on the presence or absence of ligation.
[0010] DNAポリメラーゼ、 DNAリガーゼを使用する方法は、変異に基づくプライマーもし くはプローブと標的核酸の間のミスマッチを正確に検出できな 、可能性がある。すな わち、これらの酵素はミスマッチを有するプライマー、プローブの場合でも酵素反応を 開始し、誤った結果を与えることがある。  [0010] A method using a DNA polymerase or a DNA ligase may not be able to accurately detect a mismatch between a primer or a probe based on mutation and a target nucleic acid. In other words, these enzymes may initiate the enzymatic reaction even in the case of mismatched primers and probes, and may give incorrect results.
すなわち、標的核酸と当該プライマーとのアニーリングエラー及び使用するリガ一 ゼあるいはポリメラーゼのエラーに起因する擬陽性の場合があり、反応条件、特に反 応温度等を非常に厳密にコントロールする必要があり、再現性に問題がある。 [0011] 最後に、インベーダー (Invader)法のように、二本鎖核酸の特殊な構造を認識して 切断する活性を有する酵素を利用する方法 (例えば、特許文献 9参照)が挙げられる 。このような酵素としては cleavaseが知られており、変異が存在する(あるいは存在し ない)場合に当該酵素に認識されるような構造を形成するプローブを設計し、当該プ ローブの切断の有無を調べることによって変異を検出することが可能である。しかしな がら、二本鎖核酸の特殊な構造を認識して切断する活性を有する酵素を使用する方 法はその感度に問題を有する。すなわち、当該方法は 1分子の標的核酸から 1分子 の蛍光シグナルが生成する方法であり、微量の核酸試料力 では変異の検出に十 分なシグナルを得られな ヽ。もちろんプローブ切断反応を反復してシグナルを増強 することも可能であるが、強いシグナルを得るためには前もって標的核酸を増幅する 必要がある。すなわち、該方法では標的核酸が微量の場合、該プローブの切断物の 量が少ないため該切断物量が検出できるレベルに到達するまでに相当のタイムラグ がある。また、検出したい変異部位周辺の配列によっては cleavaseが作用しにくい 場合があり、本法によって多数の SNPタイピングを行った場合、タイピング可能な SN Pは 60— 70%であると言われている。 In other words, there may be false positives due to an annealing error between the target nucleic acid and the primer and an error in the ligase or polymerase used, and it is necessary to control the reaction conditions, especially the reaction temperature, etc. very strictly, and the There is a problem with sex. Finally, there is a method using an enzyme having an activity of recognizing and cleaving a special structure of a double-stranded nucleic acid, such as the Invader method (for example, see Patent Document 9). As such an enzyme, cleavase is known. When a mutation is present (or not present), a probe is designed to form a structure recognized by the enzyme, and the presence or absence of cleavage of the probe is determined. By examining it, it is possible to detect the mutation. However, the method using an enzyme having an activity of recognizing and cleaving a special structure of a double-stranded nucleic acid has a problem in its sensitivity. That is, this method is a method in which one molecule of a target nucleic acid generates one molecule of a fluorescent signal, and a small amount of a nucleic acid sample cannot provide a signal sufficient for detecting a mutation. Of course, it is possible to enhance the signal by repeating the probe cleavage reaction, but it is necessary to amplify the target nucleic acid in advance to obtain a strong signal. That is, in the method, when the amount of the target nucleic acid is very small, there is a considerable time lag until the amount of the cleaved product reaches a detectable level because the amount of the cleaved product of the probe is small. In addition, depending on the sequence around the mutation site to be detected, cleavase may be difficult to act. When a large number of SNPs are typed by this method, it is said that the typeable SNP is 60-70%.
[0012] 以上のように、上記の方法はいくつかの問題点を有しており、多数の変異を同時に 、正確に検出できる方法が求められていた。  As described above, the above method has several problems, and a method capable of simultaneously and accurately detecting a large number of mutations has been required.
[0013] 特許文献 1 :特表 2000— 515006号公報  [0013] Patent Document 1: Japanese Patent Publication No. 2000-515006
特許文献 2:特表平 11-507528号公報  Patent Document 2: Japanese Patent Publication No. 11-507528
特許文献 3:米国特許第 5660988号明細書  Patent Document 3: US Pat. No. 5,660,988
特許文献 4 :米国特許第 5210015号明細書  Patent Document 4: U.S. Pat.No. 5210015
特許文献 5:米国特許第 5487972号明細書  Patent Document 5: US Patent No. 5487972
特許文献 6:米国特許第 5137806号明細書  Patent Document 6: US Pat. No. 5,137,806
特許文献 7 :国際公開第 01Z42498号パンフレット  Patent Document 7: International Publication No. 01Z42498 pamphlet
特許文献 8 :米国特許第 6210891号明細書  Patent Document 8: U.S. Patent No. 6210891
特許文献 9 :米国特許第 5846717号明細書  Patent Document 9: U.S. Pat.No. 5,846,717
非特許文献 l : Maxam A. M.、 Gilert W.、米国科学アカデミー紀要(Procee dings of National Academy of Sciences of the USA)、第 74卷、弟 2 号、第 560— 564頁、 1977年 Non-patent literature l: Maxam AM, Gilert W., Proceedings of National Academy of Sciences of the USA, Vol. 74, Brother 2 Issue 560-564, 1977
非特許文献 2 : Sanger F.、他 2名、米国科学アカデミー紀要、第 74卷、第 12号、 第 5463— 5467頁、 1977年 Non-Patent Document 2 : Sanger F., et al., Bulletin of the National Academy of Sciences, Vol. 74, No. 12, pp. 5463-5467, 1977
非特許文献 3 : Brenner S.、他 23名、ネイチヤー バイオテクノロジー(Nature Bi otechnology)、第 18卷、第 6号、第 630— 634頁、 2000年  Non-Patent Document 3: Brenner S., 23 others, Nature Biotechnology, Vol. 18, No. 6, 630-634, 2000
非特許文献 4: Brenner S.、他 12名、米国科学アカデミー紀要、第 97卷、第 4号、 第 1665— 1670頁、 2000年  Non-Patent Document 4: Brenner S., 12 others, Bulletin of the National Academy of Sciences, Vol. 97, No. 4, pp. 1665-1670, 2000
発明の開示  Disclosure of the invention
発明が解決しょうとする課題  Problems to be solved by the invention
[0014] 本発明の目的は、多数の試料について、安価かつ高精度に変異を検出する方法 を提供することにある。 [0014] An object of the present invention is to provide a method for inexpensively and accurately detecting a mutation in a large number of samples.
課題を解決するための手段  Means for solving the problem
[0015] 本発明者らは鋭意研究の結果、変異を検出しょうとする標的 DNAに試料識別コー ドを付加し、得られた DNAの塩基配列を決定することにより変異の検出と試料の同 定を同時に行えることを見出し、本発明を完成した。 [0015] The inventors of the present invention have conducted intensive studies and, as a result, added a sample identification code to the target DNA for which mutation is to be detected, and determined the nucleotide sequence of the obtained DNA to detect mutation and identify the sample. And found that the present invention can be performed simultaneously, and completed the present invention.
[0016] すなわち、本発明を概説すれば、本発明の第 1の発明は変異のタイピング方法で あって、以下の工程を含むことを特徴とする。 That is, to outline the present invention, the first invention of the present invention is a mutation typing method, which includes the following steps.
(1)タイピング対象の変異部位を含む標的 DNAを調製する工程、  (1) a step of preparing a target DNA containing a mutation site to be typed,
(2)標的 DNAに試料識別コードを付加する工程、および  (2) adding a sample identification code to the target DNA, and
(3)試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を 含む領域の塩基配列を決定する工程。  (3) A step of determining the base sequence of a region containing the sample identification code and the mutation site in the target DNA to which the sample identification code has been added.
[0017] 本発明の第 1の発明の方法において、塩基配列を決定する工程としては以下のェ 程を含む方法が例示される。  [0017] In the method of the first invention of the present invention, examples of the step of determining a base sequence include a method including the following steps.
(a)試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を 含む領域をタグベクターに連結し、タグライブラリーを作製する工程、  (a) ligating the region containing the sample identification code and the mutation site in the target DNA to which the sample identification code has been added to a tag vector to produce a tag library;
(b)試料識別コードおよび変異部位を含む DNAに、タグ配列が連結された DNAを 、タグライブラリ一力 調製する工程、  (b) a step of preparing a tag library with DNA in which a tag sequence is linked to DNA containing a sample identification code and a mutation site,
(c)試料識別コードおよび変異部位を含む DNAをマイクロビーズに結合させる工程 (d)必要に応じて、マイクロビーズ上の標的 DNAの末端に開始アダプターを連結す る工程、 (c) Step of binding DNA containing the sample identification code and the mutation site to the microbeads (d) if necessary, linking an initiation adapter to the end of the target DNA on the microbeads,
(e)マイクロビーズをフローセルに 2次元的に充填し、各ビーズの位置を記録するェ 程、  (e) Two-dimensionally filling the microbeads into the flow cell and recording the position of each bead,
(f)マイクロビーズ上の DNAを制限酵素消化し、標的 DNAの末端を突出末端とする 工程、  (f) a step of digesting the DNA on the microbeads with a restriction enzyme to make the end of the target DNA a protruding end,
(g)工程 (f)で生成した突出末端に相補的なェンコ一デッド アダプターをマイクロビ ーズ上の標的 DNAとライゲーシヨンさせる工程、  (g) ligating the encoding adapter complementary to the protruding end generated in step (f) with the target DNA on the microbead,
(h)工程(g)で得られたマイクロビーズとデコーダー プローブとのハイブリダィゼー シヨンを行い、標的 DNAとライゲーシヨンされたェンコ一デッド アダプターを確認す る工程、  (h) hybridizing the microbeads obtained in step (g) with a decoder probe to confirm the encoded adapter ligated with the target DNA;
(i)工程 (h)のマイクロビーズよりデコーダー プローブを除去し、得られたマイクロビ ーズを工程 (f)以下の工程に使用する工程。  (i) A step of removing the decoder probe from the microbeads in step (h) and using the resulting microbeads in step (f) and subsequent steps.
[0018] 本発明の第 1の発明の別の態様としては、試料識別コードを付加した標的 DNAの うち、試料識別コードおよび変異部位を含む領域の 2個以上を重合させる工程を含 む変異のタイピング方法が例示される。  [0018] In another embodiment of the first invention of the present invention, a mutation including a step of polymerizing two or more regions including the sample identification code and the mutation site in the target DNA to which the sample identification code has been added is provided. A typing method is exemplified.
発明の効果  The invention's effect
[0019] 本発明によって、変異のタイピング方法が提供される。  According to the present invention, a method for typing a mutation is provided.
発明を実施するための最良の形態  BEST MODE FOR CARRYING OUT THE INVENTION
[0020] 以下、本発明を具体的に説明する。 Hereinafter, the present invention will be described specifically.
本明細書で使用する用語の定義と説明は以下の通りである。特に定義するもの以 外は分子生物学、分子遺伝学等の当業者の間で一般的に理解されている意味で用 語を用いている。  The definitions and explanations of the terms used in this specification are as follows. Terms other than those specifically defined are used in a meaning generally understood by those skilled in the art such as molecular biology and molecular genetics.
[0021] 「DNAマイクロビーズアレイ技術」とは、前記特許文献 2および前記非特許文献 4に 開示された技術およびこれを応用して遺伝子発現や遺伝子構造を解析する技術を 意味する。すなわち、タグと呼ぶオリゴヌクレオチドを結合した DNAと、タグに相補的 なオリゴヌクレオチドであるアンチタグを結合したマイクロビーズとを、タグとアンチタグ の間のハイブリダィゼーシヨンにより結合させる技術である。その結果、マイクロビーズ 上に固定ィ匕された DNAのライブラリーを作製することができ、 1個のマイクロビーズに は 1種類の DNAが結合して!/、る。 [0021] The "DNA microbead array technology" means the technology disclosed in Patent Document 2 and Non-patent Document 4 and a technology for analyzing gene expression and gene structure using the technology. In other words, a DNA to which an oligonucleotide called a tag is bound and microbeads to which an anti-tag which is an oligonucleotide complementary to the tag are bound are used as a tag and an anti-tag. This is a technique of bonding by hybridization between the two. As a result, a library of DNA immobilized on microbeads can be prepared, and one type of DNA is bound to one microbead!
[0022] 「タグライブラリー」とは、 DNAマイクロビーズアレイ技術にお!、てマイクロビーズに 結合させる DNAのライブラリーを意味する。タグライブラリーの各クローンはマイクロ ビーズに結合させる DNAとタグ配列を同一分子内に含む DNAであり、これらのクロ ーンの集合がタグライブラリーである。  [0022] The term "tag library" refers to a library of DNA to be bound to microbeads in DNA microbead array technology. Each clone in the tag library is a DNA containing the tag sequence and the DNA to be bound to the microbeads in the same molecule, and a collection of these clones is the tag library.
[0023] 「タグ」とは、 DNAマイクロビーズアレイ技術にお!、てマイクロビーズに結合させる D NAと共有結合により結合しているオリゴヌクレオチドであり、各マイクロビーズに単一 配列の DNAを配置するために使用する。タグのレパートリーはタグライブラリーのクロ ーン数よりも十分に大き 、ことが必要である。  [0023] A "tag" is an oligonucleotide that is covalently bound to DNA to be bound to microbeads in DNA microbead array technology. A single-sequence DNA is placed on each microbead. Use to The repertoire of tags must be sufficiently larger than the number of clones in the tag library.
[0024] 「アンチタグ」とは、 DNAマイクロビーズアレイ技術にお!、てマイクロビーズと共有結 合により結合したオリゴヌクレオチドであり、前記のタグと相補的な配列を持つ。 1個の マイクロビーズには単一配列のアンチタグが結合しており、アンチタグのレパートリー はタグのレパートリーと実質的に同じ大きさである。  [0024] An "anti-tag" is an oligonucleotide that is covalently bound to microbeads in DNA microbead array technology and has a sequence that is complementary to the tag. One microbead has a single-sequence antitag attached to it, and the repertoire of the antitag is substantially the same size as the tag repertoire.
[0025] 「MPSS法」とは、前記特許文献 1および前記非特許文献 3に開示された技術を意 味する。すなわち、 DNAマイクロビーズアレイ技術により作製した、 DNAが結合した マイクロビーズをフローセルに 2次元的に充填し、タイプ lis制限酵素による消化、そ れにより生成した突出末端へのアダプターの連結、連結されたアダプターの蛍光プ ローブによる識別をフローセル中で行う技術である。本来、 MPSS法は cDNAの最 下流の特定の制限酵素認識配列から下流側に約 20塩基の配列を決定する技術で ある力 本明細書においては該方法の塩基配列決定の工程のみを指して MPSS法 と呼ぶ場合がある。  [0025] The "MPSS method" means the technology disclosed in Patent Document 1 and Non-Patent Document 3. In other words, microbeads to which DNA was bound, prepared by DNA microbead array technology, were two-dimensionally filled in a flow cell, digested with type lis restriction enzyme, and an adapter was connected to the protruding end generated by the restriction, and then ligated. This is a technology that identifies the adapter using a fluorescent probe in the flow cell. Originally, the MPSS method is a technique for determining a sequence of about 20 bases downstream from a specific restriction enzyme recognition sequence at the most downstream side of a cDNA.In this specification, the MPSS method refers to only the base sequence determination step of the method. Sometimes called the law.
「ェンコーデッド アダプター」とは MPSS法において、標的 DNAの突出末端への ライゲーシヨンに使用する一部 2本鎖のオリゴヌクレオチドの混合物を意味する。 ェンコ一デッド アダプターの一方の末端 (以下、 A末端という)は、後述のデコーダ 一 プローブがハイブリダィズしうる配列を有する突出末端であればよ 、。  The term "encoded adapter" refers to a mixture of partially double-stranded oligonucleotides used for ligation to a protruding end of a target DNA in the MPSS method. One end of the adapter (hereinafter referred to as the A-terminal) may be a protruding end having a sequence to which a decoder-probe described below can hybridize.
他方の末端 (以下、 B末端という)は、次の条件を備えた突出末端であればよい。 i)本発明における「標的 DNA断片の塩基配列を決定する工程」で使用するタイプ I Is制限酵素により生成する標的 DNAの末端にライゲーシヨンしうる 5'—または 3'—突 出末端である。すなわち、前記の制限酵素が N塩基突出した 5 '— (または 3'—)末端 を生成する場合、 A末端も N塩基突出した 5 (または 3 '—)末端である。 The other end (hereinafter, referred to as B end) may be a protruding end satisfying the following conditions. i) A 5′- or 3′-protruding end that can be ligated to the end of the target DNA generated by the type I Is restriction enzyme used in the “step of determining the base sequence of the target DNA fragment” in the present invention. That is, when the above-mentioned restriction enzyme generates a 5 '-(or 3'-) end that protrudes N bases, the A-terminal is also a 5 (or 3'-) end that protrudes N bases.
ii)同一の配列の A末端を有するェンコ一デッド アダプターにおいて、 B末端の n 番目の塩基(l≤n≤N)は A、 G、 Cまたは Tのいずれかであり、他の位置については 4種類の塩基の混合物である。  ii) In an encoded adapter having the A-terminus of the same sequence, the n-th base (l≤n≤N) at the B-terminus is any of A, G, C or T, and 4 at other positions. It is a mixture of different bases.
iii)前記の制限酵素によって生成する、すべての考えられる突出末端の配列に相 補的な配列を網羅して 、る。  iii) Cover all sequences complementary to all possible protruding end sequences generated by the above restriction enzymes.
一方、ェンコ一デッド アダプターの中央の 2本鎖部分は前記のタイプ lis制限酵素 認識配列を有している。この制限酵素認識配列は、標的 DNA断片にェンコ一デッド アダプターをライゲーシヨンして得られる DNAを前記制限酵素により消化した場合 に、ライゲーシヨンに使用された突出末端の配列に隣接する標的 DNAの配列が突 出末端として生成するように設計されて ヽればよ!/ヽ。  On the other hand, the double-stranded portion at the center of the enzyme adapter has the type lis restriction enzyme recognition sequence described above. When the restriction enzyme recognition sequence is digested with the restriction enzyme to obtain a DNA obtained by ligating an encoding adapter to a target DNA fragment, the sequence of the target DNA adjacent to the sequence of the protruding end used in the ligation is abrupt. It is designed to be generated as a terminal end! / ヽ.
同一の A末端を有するェンコ一デッド アダプターを 1個のグループとした場合、各 グループのェンコ一デッド アダプタ一は 4N_1個の B末端を持つものの混合物であり 、ェンコ一デッド アダプター全体は 4 X N個のグループ、 N X 4N種類の配列からな る。 Assuming that the adapters with the same A-terminal are grouped into one group, the adapters in each group are a mixture of 4 N_1 B-terminal adapters, and the entire adapter is 4 XN. NX 4 consists of N types of arrays.
好適に使用できるェンコ一デッド アダプターの例として、米国科学アカデミー紀要 、第 97卷、第 1665— 1670頁、 2000年に記載されているものが挙げられる。当該ェ ンコーデッド アダプタ一はタイプ lis制限酵素として Bbvlを使用する場合に適用可 能であり、 A末端は 10塩基の 3'—突出、 B末端は 4塩基の 5 '—突出構造を有している  Examples of preferably used adapters include those described in the Bulletin of the National Academy of Sciences, Vol. 97, pp. 165-1670, 2000. This encoded adapter is applicable when Bbvl is used as a type lis restriction enzyme, and the A-terminal has a 10 base 3'-overhang and the B-terminal has 4 bases 5'-overhang.
「デコーダー プローブ」とは MPSS法にお!、てどのグループに属するェンコーデッ ド アダプターがライゲーシヨンされたかを検出するために使用する蛍光標識オリゴヌ クレオチドであり、ェンコ一デッド アダプターの A末端の配列に相補的な配列を有し ていればよい。デコーダー プローブに使用される蛍光色素に特に限定はなぐフィ コエリスリンのようなタンパク質、フルォレセインのような低分子化合物及び量子ドット 等が使用可能である。 A "decoder probe" is a fluorescently labeled oligonucleotide that is used to detect which group of encoded adapters in the MPSS method have been ligated, and is complementary to the A-terminal sequence of the encoded adapter. What is necessary is just to have a proper arrangement. Proteins such as phycoerythrin, low molecular weight compounds such as fluorescein, and quantum dots are not particularly limited to the fluorescent dyes used in the decoder probe. Etc. can be used.
「タイプ lis制限酵素」とは非対称な配列を認識して認識配列と異なる部位を切断す る制限酵素である。本発明における「標的 DNA断片の塩基配列を決定する工程」に 使用されるタイプ lis制限酵素は次の条件を備えて 、ればよ 、。  “Type lis restriction enzyme” is a restriction enzyme that recognizes an asymmetric sequence and cuts a site different from the recognition sequence. The type lis restriction enzyme used in the “step of determining the base sequence of the target DNA fragment” in the present invention should have the following conditions.
i) 5 '一または 3 '—突出末端を生成する。  i) 5 'one or 3'—generates overhanging ends.
ii)生成する末端の突出塩基長を Nとしたとき、切断部位と認識配列の間の距離が N塩基以上である。  ii) The distance between the cleavage site and the recognition sequence is N bases or more, where N is the protruding base length of the generated terminal.
「標的 DNA断片の塩基配列を決定する工程」に使用するタイプ lis制限酵素の好 適な例として、 Bbvlが挙げられる。下記のように、本酵素は GCAGC配列を認識して 4塩基が突出した 5'—末端を生成する。  Preferred examples of the type lis restriction enzyme used in the “step of determining the base sequence of the target DNA fragment” include Bbvl. As described below, this enzyme recognizes the GCAGC sequence and generates a 5'-terminal with a 4-base overhang.
5, . . . GCAGCNNNNNNNN-3 '  5,... GCAGCNNNNNNNN-3 '
3, . . . CGTCGNNNNNNNNNNNN-5 '  3,... CGTCGNNNNNNNNNNNN-5 '
[0026] 「標的 DNA」とは、塩基配列を決定する対象となる DNAを意味する。また、変異を 検出またはタイピングする対象となる DNAをも意味する。標的 DNAは、生物由来試 料から調製されたもの、これを人為的に加工したもの、人為的に合成されたもののい ずれであってもよい。 [0026] "Target DNA" refers to a DNA whose nucleotide sequence is to be determined. It also refers to the DNA for which mutations are to be detected or typed. The target DNA may be prepared from a biological sample, processed artificially, or synthesized artificially.
[0027] 「変異」とは、個体間、同一個体のアレル間、細胞間または同一細胞のアレル間で ゲノム DNA配列が異なって 、ることおよび異なって 、る部位を意味する。すなわち、 遺伝子多型、突然変異、変異剤や電磁波による変異、人為的な遺伝子組換えによる 変異、ウィルス等の感染によるゲノム DNA配列の変化等を含む。  [0027] The term "mutation" refers to a site where genomic DNA sequences differ between individuals, between alleles of the same individual, between cells or between alleles of the same cell, and at different sites. That is, it includes polymorphisms, mutations, mutations caused by mutagenic agents or electromagnetic waves, mutations caused by artificial gene recombination, and changes in genomic DNA sequences caused by infection with viruses and the like.
上記の「変異」には、「塩基置換」、「欠失変異」、「挿入変異」、等の種々の形態の 変異が包含される。  The above “mutation” includes various forms of mutation such as “base substitution”, “deletion mutation”, “insertion mutation” and the like.
[0028] 「塩基置換」とは、核酸上の特定の部位にお!、て、その一部の塩基が他の塩基に 置換されて 、ることを指す。本明細書に記載の「塩基置換」にお 、て置換されて!、る 塩基の数には特に限定はなく、 1塩基もしくはそれ以上の塩基に置換が存在してもよ V、。塩基配列中の一個の塩基に見られる置換は「一塩基多型(SNP)」と呼ばれて 、 る。また、核酸に人為的に導入された塩基置換も本明細書における「塩基置換」に含 まれる。 [0029] 「欠失変異」とは、核酸上の特定の部位にぉ 、て、その一部の塩基配列が欠失して いることを意味する。欠失した塩基配列は、 1塩基でもよいし複数の塩基であってもよ い。またこれらの塩基配列の欠失は、核酸上の特定の部位において複数箇所生じて いるものも含まれる。さらに、遺伝子の特定の領域、特に限定はされないが例えばェ キソン及び Z又はイントロンの領域、さらには当該遺伝子の全長が欠損した場合も「 欠失変異」に含まれる。また、核酸に人為的に導入された塩基配列の欠失も本明細 書における「欠失変異」に含まれる。 [0028] The term "base substitution" means that a particular base on a nucleic acid is partially replaced with another base. In the “base substitution” described in the present specification, the number of bases substituted is not particularly limited, and one or more bases may be substituted. Substitutions found at one base in the base sequence are called "single nucleotide polymorphisms (SNPs)". In addition, a base substitution artificially introduced into a nucleic acid is also included in the “base substitution” in the present specification. [0029] The term "deletion mutation" means that a specific nucleotide sequence is deleted at a specific site on a nucleic acid. The deleted base sequence may be a single base or a plurality of bases. In addition, the deletion of these nucleotide sequences includes those occurring at a plurality of specific sites on the nucleic acid. Furthermore, “deletion mutation” includes a specific region of a gene, for example, but not limited to, exon and Z or an intron region, and a case where the full length of the gene is deleted. In addition, deletion of a nucleotide sequence artificially introduced into a nucleic acid is also included in the “deletion mutation” in the present specification.
[0030] 「挿入変異」とは、核酸上の特定の部位にぉ 、て、塩基配列が挿入されて 、ること を意味する。挿入された塩基配列は、 1塩基でもよいし複数の塩基であってもよいし、 任意の鎖長であってもよい。また、これらの塩基配列の挿入は、核酸上の特定の部 位において複数箇所生じているものも含まれる。また、核酸に人為的に導入された塩 基配列の挿入も本明細書における「挿入変異」に含まれる。  [0030] "Insertion mutation" means insertion of a base sequence at a specific site on a nucleic acid. The inserted base sequence may be a single base, a plurality of bases, or an arbitrary chain length. In addition, insertion of these nucleotide sequences may include those occurring at a plurality of specific positions on the nucleic acid. In addition, insertion of a base sequence artificially introduced into a nucleic acid is also included in the “insertion mutation” in the present specification.
[0031] 本発明は、ゲノム多型やバリエーションの検出、特に、遺伝子上の 1一数塩基の置 換、例えば SNP、 1一数塩基の欠失および 1一数塩基の挿入の検出、スクリーニング 、タイピングに好適である。なお、以下の説明において「タイピング」と記載された操作 は、その存在がすでに検出されている変異について塩基配列を明らかにすることの みを指すのではなく、変異の存在の検出と同時にその塩基配列を決定する操作を包 含する。  [0031] The present invention relates to the detection and screening of genomic polymorphisms and variations, in particular, the detection and screening of substitution of one or more nucleotides on a gene, for example, SNP, deletion of one or more nucleotides and insertion of one or more nucleotides. Suitable for typing. In the following description, the operation described as “typing” does not only refer to clarifying the nucleotide sequence of a mutation whose presence has already been detected, but also detects the mutation at the same time as the detection of the presence of the mutation. Includes operations to determine sequences.
[0032] 本発明における変異のタイピングについて、以下に詳細に説明する。  [0032] The mutation typing in the present invention is described in detail below.
(1)タイピング対象の変異部位を含む標的 DNAを調製する工程  (1) Step of preparing target DNA containing the mutation site to be typed
本発明を実施するに当たっては、まず標的 DNAを調製する。標的 DNAの調製方 法に特に限定はなぐ例えばゲノム DNA、 cDNA、これら力 PCR、 ICAN法等の 核酸増幅方法により増幅した DNA、これらの DNAをベクター、例えばプラスミドべク ターまたはバタテリオファージベクター、にクローン化した DNA、クローン化した DN Aの混合物、クローンィ匕した DNAから制限酵素消化等によりベクター部分を除去し たもの、上記 DNAにヌクレアーゼ、例えば制限酵素、化学的処理、例えば酸処理、 または物理的処理、例えば超音波処理、を施したものが挙げられる。  In practicing the present invention, first, a target DNA is prepared. The method for preparing the target DNA is not particularly limited, for example, genomic DNA, cDNA, DNA amplified by nucleic acid amplification methods such as these PCR, ICAN, etc., and these DNAs as vectors, for example, plasmid vectors or Batatelio phage vectors, DNA, a mixture of cloned DNA, cloned DNA from which the vector portion has been removed by restriction enzyme digestion, etc., nucleases such as restriction enzymes, chemical treatment such as acid treatment, or Those subjected to physical treatment, for example, ultrasonic treatment, may be mentioned.
[0033] ゲノム DNAを铸型として PCRにより増幅する方法、全 RNAまたはポリ A RNAか ら RT— PCRにより増幅する方法(以下、 PCR法と総称する)、およびこれらの DNAを 制限酵素で消化する方法は、操作の簡便性、コストの低さ、一度に処理できる試料 数の多さ、以後の工程への適用の容易さ等の観点から好適に使用することができる。 [0033] A method of amplifying by PCR using genomic DNA as type I, whether total RNA or poly A RNA The method of amplification by RT-PCR (hereinafter collectively referred to as PCR method) and the method of digesting these DNAs with restriction enzymes are simple, low in cost, and large in the number of samples that can be processed at one time. It can be suitably used from the viewpoint of easiness of application to the subsequent steps.
[0034] 標的 DNAの鎖長に特に限定はなぐ標的 DNAの調製方法、試料識別コードおよ び変異部位を含む領域の塩基配列を決定する方法、変異部位周辺の塩基配列等を 考慮して適宜選択すればよい。上記の PCR法により標的 DNAを調製する場合、標 的 DNAの分子量は 10— 10, 000塩基、好ましくは 15— 5000塩基、さらに好ましく は 20— 1000塩基とすることができる。  [0034] The method for preparing the target DNA, which is not particularly limited to the chain length of the target DNA, the method for determining the sample identification code and the nucleotide sequence of the region containing the mutation site, the nucleotide sequence around the mutation site, etc. Just select. When the target DNA is prepared by the above PCR method, the molecular weight of the target DNA can be 10 to 10,000 bases, preferably 15 to 5000 bases, and more preferably 20 to 1000 bases.
[0035] タイピング対象の変異部位が標的 DNAのどこに位置するように標的 DNAの範囲 を設定するかには特に限定はなぐ試料識別コードおよび変異部位を含む領域の塩 基配列を決定する方法によって適宜選択すればよ!、。例えば前記特許文献 6および 前記非特許文献 3の MPSS法と同様の方法で塩基配列を決定する場合、本法により 決定できる塩基配列長は約 20塩基なので、試料識別コードとタイピング対象の変異 が約 20塩基以下の範囲に含まれる必要がある。従って、塩基配列の解読に MPSS 法を用いる場合、変異部位は標的 DNAの試料識別コードが付加される側の末端か ら 20塩基以内、好ましくは 15塩基以内、さらに好ましくは 10塩基以内に位置してい ればよい。また、例えば試料識別コードおよび変異部位を含む領域の 2個以上を重 合させて力 配列を決定する場合には、重合単位の分子量が小さければ小さいほど 1回の配列解析あたりに得られる情報量が大きくなるので、変異部位は標的 DNAの 試料識別コードが付加される側の末端から 500塩基以内、好ましくは 100塩基以内、 さらに好ましくは 20塩基以内に位置して 、ればよ 、。  There is no particular limitation on where the range of the target DNA is set so that the mutation site to be typed is located in the target DNA. The method may be appropriately determined by a method for determining the base sequence of the region including the sample identification code and the mutation site. Just choose! For example, when the nucleotide sequence is determined by the same method as the MPSS method of Patent Document 6 and Non-patent Document 3, the nucleotide sequence length that can be determined by this method is about 20 bases, and thus the sample identification code and the mutation to be typed It must be included in the range of 20 bases or less. Therefore, when the MPSS method is used to decode the nucleotide sequence, the mutation site is located within 20 bases, preferably within 15 bases, more preferably within 10 bases, from the end of the target DNA to which the sample identification code is added. It just needs to be. In addition, for example, when determining the force sequence by combining two or more regions including the sample identification code and the mutation site, the smaller the molecular weight of the polymerized unit, the smaller the amount of information obtained per sequence analysis Therefore, the mutation site should be located within 500 bases, preferably within 100 bases, more preferably within 20 bases, from the end of the target DNA to which the sample identification code is added.
[0036] 本法を実施するに当たって、 Serial Analysis of Gene Expression法(以下、 SAGE法と称す)と同様の重合方法が使用できる。 SAGE法はタイプ lis制限酵素に より断片化した DNAを重合させ、その塩基配列を決定することにより、 1回の配列決 定で多くの遺伝子発現情報を得る方法である (米国特許第 5695937号明細書、 Vel culescu V. E.、他 3名、サイエンス(Science)、第 270卷、第 484— 487頁、 19 95年)。現在、認識配列カゝら 20塩基以上離れた部位を切断するタイプ lis制限酵素 は知られて 、な 、ので、試料識別コードと変異部位は 20塩基以下の領域に含まれ ている必要がある。従って、変異部位は標的 DNAの試料識別コードが付加される側 の末端から 19塩基以内、好ましくは 15塩基以内、さらに好ましくは 10塩基以内に位 置していればよい。 [0036] In carrying out the present method, a polymerization method similar to the Serial Analysis of Gene Expression method (hereinafter, referred to as SAGE method) can be used. The SAGE method is a method in which a large amount of gene expression information can be obtained by one sequence determination by polymerizing DNA fragmented with a type lis restriction enzyme and determining its base sequence (U.S. Pat. Book, Vel culescu VE, and 3 others, Science, Vol. 270, 484-487, 1995. At present, type lis restriction enzymes that cleave sites that are 20 bases or more apart from the recognition sequence are known, so the sample identification code and the mutation site are included in the region of 20 bases or less. Need to be. Therefore, the mutation site may be located within 19 bases, preferably within 15 bases, more preferably within 10 bases, from the end of the target DNA to which the sample identification code is added.
[0037] 上記のように、本発明では末端付近に変異部位を持つ標的 DNAを調製することが 望ま 、。 PCR法により標的 DNAを調製する場合にはプライマー配列と変異部位の 関係に特に限定はないが、以下の理由からプライマー配列が変異部位を含まないよ うにプライマーを設計することが望ましい。すなわち、プライマー配列が変異部位を含 む場合には変異の種類に応じた複数配列のプライマーを調製する必要があるうえに 、変異部位がプライマーの 3 '末端付近以外に位置している場合には铸型との間に 非相補的な塩基を含むプライマーによる増幅が起きる可能性があるので、铸型の塩 基配列を正確には反映しない DNAが増幅する危険がある力 である。  As described above, in the present invention, it is desirable to prepare a target DNA having a mutation site near the end. When the target DNA is prepared by the PCR method, the relationship between the primer sequence and the mutation site is not particularly limited. However, it is desirable to design the primer so that the primer sequence does not include the mutation site for the following reasons. That is, when the primer sequence contains a mutation site, it is necessary to prepare a primer having a plurality of sequences corresponding to the type of mutation, and when the mutation site is located other than near the 3 ′ end of the primer, Since there is a possibility that amplification will occur with primers containing bases that are not complementary to type II, there is a risk that DNA that does not accurately reflect the type II base sequence will be amplified.
[0038] 例えば哺乳類のゲノム DNAまたは RNAを铸型として PCRまたは RT— PCRを行う 場合には、特異的に増幅させるために 15塩基以上、好ましくは 17塩基以上、さらに 好ましくは 20塩基以上のプライマーを使用する。従って、変異部位を含まないプライ マーを用いて増幅した PCR産物または RT— PCR産物(以下、 PCR産物と総称する) をそのまま標的 DNAとして使用しょうとすると、標的 DNAの末端力も変異部位まで は約 15塩基以上離れることになる。 PCR産物の末端配列を適切に除去することによ つて、変異部位を末端力も約 15塩基未満の位置に持つ標的 DNAを調製することが できる。末端配列を除去する方法に特に限定はなぐ酵素を用いる方法、超音波処 理ゃシァリング等の物理的方法、酸処理等の化学的方法、またはこれらの方法を糸且 み合わせた方法を使用することができる。酵素としてはデォキシリボヌクレアーゼ (D Nase)が使用でき、制限酵素、 DNasel等のエンドヌクレアーゼ、 BAL31ェキソヌク レアーゼ、ェキソヌクレアーゼ ΠΙ、 λェキソヌクレアーゼ、 Τ4 DNAポリメラーゼ等の ェキソヌクレアーゼが例示される。  [0038] For example, when PCR or RT-PCR is performed using mammalian genomic DNA or RNA as type I, primers of 15 bases or more, preferably 17 bases or more, more preferably 20 bases or more to specifically amplify Use Therefore, if a PCR product or an RT-PCR product (hereinafter collectively referred to as a PCR product) amplified using a primer that does not contain a mutation site is used as it is as the target DNA, the terminal power of the target DNA is also approximately up to the mutation site. They will be more than 15 bases apart. By appropriately removing the terminal sequence of the PCR product, it is possible to prepare a target DNA having a mutation site at a position having a terminal force of less than about 15 bases. The method for removing the terminal sequence is not particularly limited. A method using an enzyme, a physical method such as ultrasonic treatment and shearing, a chemical method such as acid treatment, or a method combining these methods is used. be able to. As the enzyme, deoxyribonuclease (D Nase) can be used, and examples thereof include restriction enzymes, endonucleases such as DNasel, exonucleases such as BAL31 exonuclease, exonuclease ΠΙ, λ exonuclease, and DNA4 DNA polymerase. .
[0039] 制限酵素は特異性が高いために、 PCR産物の適切な位置に認識配列が存在すれ ば、変異部位を末端付近に持つ所望の標的 DNAを調製することができる。このよう な標的 DNAを調製するためには、プライマー配列の内部、またはプライマー配列の 3'—末端と変異部位の間を切断することが望ましい。ゲノム DNAまたは cDNA上の 変異部位近傍に制限酵素部位が存在する場合には制限酵素を使用することが有力 な手段となる。 [0039] Since the restriction enzyme has high specificity, a desired target DNA having a mutation site near the end can be prepared if a recognition sequence is present at an appropriate position in the PCR product. To prepare such a target DNA, it is desirable to cleave the inside of the primer sequence or between the 3'-end of the primer sequence and the mutation site. On genomic DNA or cDNA If a restriction enzyme site exists near the mutation site, the use of a restriction enzyme is an effective means.
[0040] 制限酵素の大半は認識配列の内部を切断する。このような制限酵素を使用して PC R産物末端の配列を除去するためには、適当な制限酵素認識配列が変異部位近傍 に存在していなければならない。しかし、適当な制限酵素認識配列がない場合には このような制限酵素は使用できない。  [0040] Most of the restriction enzymes cut inside the recognition sequence. In order to use such a restriction enzyme to remove the sequence at the end of the PCR product, an appropriate restriction enzyme recognition sequence must be present near the mutation site. However, if there is no appropriate restriction enzyme recognition sequence, such a restriction enzyme cannot be used.
[0041] タイプ lis制限酵素は認識配列力も一定の距離を置いた部位を切断する制限酵素 であり、このような酵素を用いれば、ゲノム DNAまたは cDNA上の変異部位近傍の 配列に関係なく PCR産物の末端配列を除去して標的 DNAを調製できる。すなわち 、 PCRプライマーの 5'側にタイプ lis制限酵素認識配列を付カ卩しておけば、 PCR産 物をタイプ lis制限酵素で消化することにより末端配列を除去することができる。複数 の変異部位を同時にタイピングした 、場合にも、各変異部位周辺を増幅するための プライマーに共通のタイプ lis制限酵素認識配列を付加することにより、 1種類のタイ プ lis制限酵素を使用するだけですベての変異部位付近の末端配列を除去すること ができる。使用するタイプ lis制限酵素の種類に特に限定はなぐ除去したい末端配 列のサイズ、標的 DNAの配列、メチルイ匕 DNAに対する反応性等を考慮して適宜選 択すればよい。哺乳類のゲノム DNAまたは RNAを使用する場合、上記のように 15 塩基以上、好ましくは 17塩基以上さらに好ましくは 20塩基以上のプライマーを使用 し、変異部位はプライマー配列に含まれないことが好ましいので、認識配列から 5塩 基以上、好ましくは 10塩基以上、さらに好ましくは 15塩基以上離れた位置を切断す るタイプ lis制限酵素を使用すればよい。このような性質を持ち、好適に使用できるタ ィプ lis制限酵素として、例えば Mmelが挙げられる。  [0041] The type lis restriction enzyme is a restriction enzyme that cleaves a site at a certain distance also in recognition sequence power. If such an enzyme is used, the PCR product is irrespective of the sequence near the mutation site on the genomic DNA or cDNA. The terminal sequence can be removed to prepare the target DNA. That is, if a type lis restriction enzyme recognition sequence is added to the 5 ′ side of the PCR primer, the terminal sequence can be removed by digesting the PCR product with the type lis restriction enzyme. Even if multiple mutation sites are typed simultaneously, only one type of lis restriction enzyme can be used by adding a common type lis restriction enzyme recognition sequence to the primer for amplifying the vicinity of each mutation site. Thus, terminal sequences near all mutation sites can be removed. The type of type lis restriction enzyme to be used is not particularly limited and may be appropriately selected in consideration of the size of the terminal sequence to be removed, the sequence of the target DNA, the reactivity with methylated DNA, and the like. When using mammalian genomic DNA or RNA, a primer having 15 bases or more, preferably 17 bases or more, more preferably 20 bases or more is used as described above, and it is preferable that the mutation site is not included in the primer sequence. A type lis restriction enzyme that cleaves at a position separated from the recognition sequence by 5 bases or more, preferably 10 bases or more, more preferably 15 bases or more may be used. As a type lis restriction enzyme having such properties and suitable for use, for example, Mmel can be mentioned.
[0042] 標的 DNA内のタイプ lis制限酵素認識配列による切断が以後の工程に悪影響を 及ぼす場合がある。このような場合、標的 DNA内部に認識配列を持たないタイプ lis 制限酵素を使用すればよい。あるいは、一方の鎖カ チルイ匕されている(へミメチル) DNAは切断する力 両方の鎖カ チルイ匕された DNAは切断しな ヽようなタイプ lis 制限酵素を使用することもできる。 PCR時に適切なメチルイ匕ヌクレオシド三リン酸を使 用することにより、プライマーに付加した認識配列はへミメチルとなるのに対して標的 DNA内部の認識配列は両鎖カメチル化されるので、上記のような性質を持つ制限 酵素はプライマーに付加した認識部位のみを認識する。 [0042] Cleavage by the type lis restriction enzyme recognition sequence in the target DNA may adversely affect subsequent steps. In such a case, a type lis restriction enzyme having no recognition sequence in the target DNA may be used. Alternatively, it is also possible to use a type lis restriction enzyme that does not cleave both strands of DNA that has been ligated (hemimethyl). By using the appropriate methylidaninucleoside triphosphate during PCR, the recognition sequence added to the primer becomes hemimethyl, Since the recognition sequence inside the DNA is both methylated, the restriction enzyme having the above properties recognizes only the recognition site added to the primer.
[0043] 工程 (2)にお 、て標的 DNAに試料識別コードを効率よく付加するために、標的 D NAの試料識別コードを付加する側の 5 '末端はリン酸基または OH基、 3 '末端は O H基となって 、ることが望ま 、。制限酵素等のエンドヌクレアーゼ処理により当該末 端を精製させた場合には、通常 5'リン酸基 Z3' OH基となっているので特別な処理 を要しない。標的 DNA力 PCR産物であり、その末端に後述する工程(2)のアダプタ 一をライゲーシヨンさせる場合には、アダプターまたは標的 DNAの少なくともいずれ かの当該 5'末端をリン酸化する必要がある。 PCR産物の 5'末端をリン酸化するには 公知の方法によればよぐ例えば合成時に化学的にリン酸ィ匕したプライマーを使用 する、合成後に酵素的にリン酸ィ匕したプライマーを使用する、 PCR後に酵素的にリン 酸化する等の方法が使用可能である。  In step (2), in order to efficiently add a sample identification code to the target DNA, the 5 ′ end of the target DNA to which the sample identification code is added is a phosphate group or an OH group, and the 3 ′ It is desirable that the terminal be an OH group. When the terminal is purified by endonuclease treatment with a restriction enzyme or the like, no special treatment is required since the terminal is usually a 5 ′ phosphate group or a Z3 ′ OH group. When the target DNA is a PCR product and its end is ligated to an adapter in step (2) described later, it is necessary to phosphorylate at least one of the 5 ′ end of the adapter and the target DNA. To phosphorylate the 5 'end of the PCR product, a known method is used, for example, using a primer chemically phosphorylated during synthesis, or using a primer enzymatically phosphorylated after synthesis. A method such as enzymatic phosphorylation after PCR can be used.
[0044] 標的 DNAの、試料識別コードを付加する側の形状は工程 (2)にお ヽてアダプター をライゲーシヨンできれば特に限定はないが、効率よくライゲーシヨンされるアダプタ 一が容易に設計可能な形状が望ましい。すなわち、特に複数の変異部位を一度にタ ィビングする場合には、 1種類のアダプターまたはアダプターのプールがすべての変 異部位に対応する標的 DNAにライゲーシヨンされることが望ま 、。その例としては 、平滑末端、共通配列を持つ 5'突出末端または 3'突出末端、突出塩基数が共通な 5'突出末端または 3 '突出末端が挙げられ、公知の方法によりこれらの末端を生成さ せればよい。平滑末端を生成させるためには、断端の形状が平滑末端となる制限酵 素を使用する、 DNAポリメラーゼ、例えば T4 DNAポリメラーゼ、大腸菌 DNAポリメ ラーゼ I、タレノウ酵素等により末端を平滑ィ匕する当の方法が使用できる。共通配列を 持つ突出末端を生成させるためには認識部位内部を切断する制限酵素を使用すれ ばよい。突出塩基数が共通な突出末端を生成させるためにはタイプ lis制限酵素を 使用すればよい。  [0044] The shape of the target DNA on the side to which the sample identification code is added is not particularly limited as long as the adapter can be ligated in step (2), but a shape that can easily design an adapter to be efficiently ligated is used. desirable. In other words, particularly when multiple mutation sites are to be probed at once, it is desirable that one type of adapter or a pool of adapters be ligated to target DNAs corresponding to all mutation sites. Examples include blunt ends, 5 'overhangs or 3' overhangs with a common sequence, 5 'overhangs or 3' overhangs with a common number of bases, and these ends are generated by known methods. Let me do it. In order to generate blunt ends, a restriction enzyme having a blunt end is used, and the ends are blunted with a DNA polymerase such as T4 DNA polymerase, Escherichia coli DNA polymerase I, and tarenow enzyme. Can be used. In order to generate a protruding end having a common sequence, a restriction enzyme that cleaves inside the recognition site may be used. In order to generate overhanging ends having the same number of overhanging bases, a type lis restriction enzyme may be used.
[0045] (2)標的 DNAに試料識別コードを付加する工程  (2) Step of adding sample identification code to target DNA
上記工程で調製した標的 DNAに試料識別コード、すなわち標的 DNAの由来を特 定することができる塩基配列を有する DNAを付加する。試料識別コードは、その用 途を特に限定するものではないが、前期の標的 DNAが由来する試料、例えば生物 個体、臓器、組織、細胞、遺伝子等を特定するために使用することができる。 A sample identification code, that is, a DNA having a base sequence capable of identifying the origin of the target DNA, is added to the target DNA prepared in the above step. The sample identification code is Although the method of use is not particularly limited, it can be used to specify a sample from which the target DNA of the first stage is derived, for example, an individual organism, an organ, a tissue, a cell, a gene, and the like.
試料識別コードは 1塩基以上の DNA配列からなり、その塩基数は変異を同時にタ ィビングしたい試料の数によって適宜設定すればよい。すなわち、 n個の塩基力もな る試料識別コードは 4n個の試料を識別できるので、例えば、試料数が 4以下のときは n= l、 16以下のときは n= 2、 64以下のときは n= 3、 256以下のときは n=4、 1024 以下のときは n= 5、 4096以下のときは n= 6とすればよい。試料数に対して最小個 数の塩基力もなる試料識別コードを使用することは必ずしも必要ではなぐ例えば 10 個の試料に対して 3塩基力もなる試料識別コードを使用することももちろん可能であ る。使用する試料識別コードのうち、どの 2個をとつても 2塩基以上が異なるような試料 識別コードの組み合わせを使用すれば、得られた配列カゝらより正確に試料を識別す ることができる。例えば n= 3、試料数 = 10の場合、試料識別コードとして AAA、 GG G、 CCCゝ TTT、 AGC、 ACTゝ ATG、 GACゝ GTA、 CAG、 CGTゝ TCAの 12個の 中から任意の 10個を選択することにより、より正確に試料を識別することができる。 試料識別コードを標的 DNA付加するためには、試料識別コード配列を含むァダプ ターをライゲーシヨンすればょ 、。アダプタ一は試料識別コード配列を含む核酸であ ればよく、 1本鎖 RNA、 2本鎖 RNA、 1本鎖 DNA、 2本鎖 DNA等があげられるが、 中でも 2本鎖 DNAからなるアダプタ一はライゲーシヨン効率の高さ、クロー-ングの 容易さ等の点力も最も好適に使用できる。アダプターには試料識別コードのほかに 制限酵素認識配列、プライマー結合配列等を付加してもよぐ適切なこれらの配列を 付加することにより試料識別コードと変異部位とを含む DNA断片の増幅、ベクター へのクロー-ング、塩基配列の決定等が効率よく行える。ライゲーシヨンされる標的 D NAとアダプターの末端の形状は、双方が平滑末端である力、または互いに相補的 な突出末端を持っていることが望ましぐそれにより高いライゲーシヨン効率が期待で きる。 PCR産物をタイプ lis制限酵素で消化して変異部位近傍で切断することにより 標的 DNAを調製した場合には、標的 DNAの試料識別コードが付加される側の末端 配列は変異部位によって異なっており、突出塩基数が共通である。そこで、このような 標的 DNAを使用する場合、各標的 DNAの末端に相補的な末端を持つアダプター の混合物を使用すれば、試料ごと、変異部位ごとのライゲーシヨン反応は不要となり、The sample identification code is composed of a DNA sequence of one or more bases, and the number of bases may be appropriately set according to the number of samples for which mutations are desired to be simultaneously tested. In other words, a sample identification code that has n bases can identify 4 n samples.For example, when the number of samples is 4 or less, n = l, when the number of samples is 16 or less, n = 2, and when the number of samples is 64 or less, Is n = 3, n = 4 for 256 or less, n = 5 for 1024 or less, and n = 6 for 4096 or less. It is not always necessary to use a sample identification code that also has a minimum number of bases for the number of samples. For example, it is possible to use a sample identification code that also has three bases for 10 samples. By using a combination of sample identification codes that differ by at least 2 bases in any two of the sample identification codes used, samples can be more accurately identified from the obtained sequence data. . For example, if n = 3 and number of samples = 10, any 10 of the 12 sample identification codes AAA, GG G, CCC 、 TTT, AGC, ACT ゝ ATG, GAC ゝ GTA, CAG, CGTCA TCA By selecting, the sample can be identified more accurately. In order to add the sample identification code to the target DNA, an adapter containing the sample identification code sequence must be ligated. The adapter may be a nucleic acid containing a sample identification coding sequence, such as single-stranded RNA, double-stranded RNA, single-stranded DNA, or double-stranded DNA. The most suitable point force can be used such as high ligation efficiency and easy cloning. To the adapter, in addition to the sample identification code, a restriction enzyme recognition sequence, a primer binding sequence, etc. may be added, and these appropriate sequences may be added to amplify a DNA fragment containing the sample identification code and the mutated site. Cloning into DNA, determination of base sequence, etc. can be performed efficiently. The shape of the ends of the ligated target DNA and the adapter can be expected to increase the ligation efficiency by desiring that both are blunt ends or that they have protruding ends that are complementary to each other. When target DNA is prepared by digesting a PCR product with a type lis restriction enzyme and cleaving near the mutation site, the terminal sequence of the target DNA to which the sample identification code is added differs depending on the mutation site. The number of protruding bases is common. Therefore, when using such target DNA, an adapter having a complementary end to the end of each target DNA If a mixture of the above is used, the ligation reaction for each sample and each mutation site becomes unnecessary,
1試料あたり 1個のライゲーシヨン反応を行えばょ 、ことになる。 If one ligation reaction is performed per sample, that means that.
[0047] また、これらの末端のうち、少なくとも一方の 5'末端がリン酸ィ匕されている必要があ るので、ライゲーシヨンさせたいアダプターの 5'末端をリン酸ィ匕しておぐおよび Zま たはライゲーシヨンさせたい側の標的 DNAの末端を 5'リン酸基としておく必要がある 。標的 DNAの 5'リン酸末端を得る方法は、本発明の第 3の実施形態の工程(1)の 説明に記載の通りである。アダプターの 5 '末端をリン酸ィ匕するには公知の方法によ ればよいが、例えば合成時に化学的にリン酸ィ匕しておく方法、または合成後に酵素、 例えば T4ポリヌクレオチドキナーゼによってリン酸ィ匕する方法が好適に使用できる。  [0047] In addition, since at least one of the 5 'ends must be phosphorylated, the 5' end of the adapter to be ligated is phosphorylated. Alternatively, the end of the target DNA to be ligated must be a 5 'phosphate group. The method for obtaining the 5 ′ phosphate end of the target DNA is as described in the description of step (1) of the third embodiment of the present invention. The 5 ′ end of the adapter can be phosphorylated by a known method, for example, a method of chemically phosphorylating at the time of synthesis, or an enzyme such as T4 polynucleotide kinase after synthesis. A method of acidifying can be suitably used.
[0048] ライゲーシヨン方法はアダプターの種類によって適宜選択すればよぐアダプター が RNAまたは 1本鎖 DNAである場合には RNAリガーゼ、例えば T4 RNAリガーゼ 力 2本鎖 DNAである場合には DNAリガーゼ、例えば T4 DNAリガーゼまたは大 腸菌 DNAリガーゼが好適に使用できる。  [0048] The ligation method may be appropriately selected depending on the type of the adapter. When the adapter is RNA or single-stranded DNA, RNA ligase, for example, T4 RNA ligase, and when it is double-stranded DNA, DNA ligase, for example, T4 DNA ligase or E. coli DNA ligase can be suitably used.
[0049] 試料識別コードの、アダプター内での位置に特に限定はない。 MPSS法と同様の 原理に従って配列を決定する場合や、 SAGE法と同様の方法により低分子化した D NAを重合させて力も配列を決定する場合には、試料識別コードと変異部位が約 20 塩基以下の範囲内に含まれる必要がある。従って、試料識別コードはアダプター内 の、標的 DNAにライゲーシヨンされる末端付近に位置していることが望ましい。試料 識別コードは連続した塩基であってもよいし、試料識別コードを構成する塩基の間に 他の塩基が挿入されていてもよい。ただし、上記のように MPSS法や SAGE法と同様 の方法により配列を決定する場合には、試料識別コードと変異部位を合わせた配列 が約 20塩基以下になるように試料識別コードを構成する塩基の間に挿入される他の 塩基の数を設定する必要がある。  [0049] The position of the sample identification code in the adapter is not particularly limited. When the sequence is determined according to the same principle as the MPSS method, or when the sequence is determined by polymerizing low-molecular-weight DNA by the same method as the SAGE method, the sample identification code and the mutation site have approximately 20 bases. It must be included in the following range. Therefore, the sample identification code is desirably located near the end ligated to the target DNA in the adapter. The sample identification code may be a continuous base, or another base may be inserted between the bases constituting the sample identification code. However, when the sequence is determined by the same method as the MPSS method or SAGE method as described above, the bases constituting the sample identification code are set so that the combined sequence of the sample identification code and the mutation site is about 20 bases or less. It is necessary to set the number of other bases inserted between.
[0050] (3)試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を 含む領域の塩基配列を決定する工程  (3) Step of determining the base sequence of a region containing the sample identification code and the mutation site in the target DNA to which the sample identification code has been added
試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を含 む領域の塩基配列は、公知の方法により決定すればよい。複数試料の、複数の変異 部位を同時にタイピングするためには、前記特許文献 6と前記非特許文献 3に記載 の MPSS法の原理による方法、および前記の SAGE法の原理による方法が特に好 適に使用できる。 The base sequence of the region containing the sample identification code and the mutation site in the target DNA to which the sample identification code has been added may be determined by a known method. In order to simultaneously type a plurality of mutation sites in a plurality of samples, it is described in Patent Document 6 and Non-patent Document 3 described above. The method based on the principle of the MPSS method and the method based on the principle of the SAGE method can be particularly preferably used.
[0051] (A) MPSS法の原理による方法 (A) Method based on the principle of MPSS method
(A— 1)断片化した標的 DNAをタグベクターに連結し、タグライブラリーを作製するェ 程  (A-1) Step of ligating fragmented target DNA to tag vector and preparing tag library
工程(2)で作製された、断片化した標的 DNAをタグベクターに連結する。タグべク ターに含まれるタグ配列としては、前記特許文献 2に開示されたものが使用でき、そ の中でも、前記非特許文献 4に述べられたものが特に好適に使用できる。また、タグ ベクターは薬剤耐性等の選択マーカーを含んでいることが望ましい。大腸菌を宿主と して使用する場合、マーカーとしてはアンピシリン耐性、クロラムフエ-コール耐性、力 ナマイシン耐性、ストレプトマイシン耐性等の遺伝子が使用できる。  The fragmented target DNA prepared in step (2) is ligated to a tag vector. As the tag sequence contained in the tag vector, those disclosed in Patent Document 2 can be used, and among them, those described in Non-Patent Document 4 can be particularly preferably used. It is desirable that the tag vector contains a selection marker such as drug resistance. When Escherichia coli is used as a host, genes such as ampicillin resistance, chloramuecole resistance, kinamicin resistance, and streptomycin resistance can be used as markers.
[0052] タグベクターに連結する DNA断片の末端は酵素処理、例えば BAL31ェキソヌクレ ァーゼ、 T4 DNAポリメラーゼ、タレノウ(Klenow)酵素またはこれらの酵素の組み 合わせによる処理によって平滑ィ匕してもよ!、。このようにして調製した DNA断片は、 平滑末端を生成する制限酵素処理により直鎖状化したタグベクターと効率よく連結 できる。物理的または化学的処理によって断片化した DNAの末端形状は不揃 ヽで 、通常は 5,— OH、 5しリン酸、 3,-OH、 3しリン酸のものが混在している。このうち T 4 DNAリガーゼ等の DNA連結酵素の基質になるのは 5,一リン酸基と 3 '— OH基を 持つ DNAだけなので、アルカリホスファターゼ等の酵素により末端のリン酸基を除去 したのちに T4ポリヌクレオチドキナーゼ等の酵素により 5 '—末端を選択的にリン酸ィ匕 すれば、効率よくベクターに連結可能な DNA断片となる。断片化 DNAの平滑化し た末端にリンカ一を連結してリンカ一の配列を認識する制限酵素で消化する、または アダプターを連結する、ことによって突出末端とすることができる。この DNA断片は、 相補的な末端を有する直鎖状のタグベクターとさらに効率よく連結することができる。  [0052] The ends of the DNA fragments linked to the tag vector may be blunted by enzymatic treatment, for example, treatment with BAL31 exonuclease, T4 DNA polymerase, Klenow enzyme, or a combination of these enzymes !. The DNA fragment thus prepared can be efficiently ligated to a tag vector that has been linearized by treatment with a restriction enzyme that generates blunt ends. The terminal shape of DNA fragmented by physical or chemical treatment is irregular, and usually contains 5, -OH, 5-phosphoric acid, 3, -OH, and 3-phosphoric acid. Of these, only DNA having 5, monophosphate and 3'-OH groups can be used as substrates for DNA ligases such as T4 DNA ligase, so after removing terminal phosphate groups with an enzyme such as alkaline phosphatase, When the 5'-end is selectively phosphorylated with an enzyme such as T4 polynucleotide kinase, a DNA fragment that can be efficiently ligated to a vector is obtained. A protruding end can be obtained by ligating a linker to the blunted end of the fragmented DNA and digesting with a restriction enzyme that recognizes the sequence of the linker, or ligating an adapter. This DNA fragment can be more efficiently ligated to a linear tag vector having complementary ends.
[0053] 断片化 DNAが連結されたタグベクターを適当な宿主、好ましくは大腸菌に導入す る。 DNAの宿主への導入は公知の方法によって行うことができ、特に限定はないが 、大腸菌を宿主として形質転換を行う場合にはエレクト口ポレーシヨン法やコンビテン トセルを用 、た方法が使用できる。タグベクターのマーカー遺伝子に対応する選択 圧のもと、形質転換体を培養し、その細胞カゝら断片化 DNAとタグベクターが連結さ れた DNAの混合物であるタグライブラリーを調製する。タグライブラリーを調製にお いては、公知の方法で DNAの調製を実施すればよぐタグベクターがプラスミドべク ターである場合には例えばアルカリ—SDS法が使用できる。形質転換を行った宿主 細胞の一部を固形選択培地に接種し、出現するコロニー数を計数することにより、タ グライブラリーに含まれる独立したクローン数を測定することが望ましい。独立したクロ 一ン数は目的により適宜設定すればよいが、 MPSSの配列決定能力を考慮すれば 104以上、好ましくは 105以上、さらに好ましくは 106以上に設定すればよい。タグライ ブラリーを複数個のプールとして作製しておき、使用するプールの個数を選択するこ とにより目的のクローン数を得る方法が有効である。この場合、プール 1個あたりのク ローン数を 1万一数十万、作製するプール数を 2個から 100個とすることにより目的の クローン数を有するタグライブラリーを簡便に調製できる。 [0053] The tag vector to which the fragmented DNA has been linked is introduced into an appropriate host, preferably Escherichia coli. DNA can be introduced into a host by a known method, and there is no particular limitation. When transformation is performed using Escherichia coli as a host, an electoporation method or a method using a competent cell can be used. Selection corresponding to marker gene of tag vector The transformant is cultured under pressure to prepare a tag library, which is a mixture of the DNA fragmented with the fragmented DNA and the tag vector. In preparing a tag library, DNA can be prepared by a known method. If the tag vector is a plasmid vector, for example, the alkali-SDS method can be used. It is desirable to measure the number of independent clones contained in the tag library by inoculating a portion of the transformed host cells into a solid selection medium and counting the number of colonies that appear. Independent black Ichin number may be set as appropriate depending on the purpose but, considering the sequencing capabilities of MPSS 10 4 or more, preferably 10 5 or more, more preferably be set to 10 6 or more. It is effective to prepare the tag library as a plurality of pools and obtain the desired number of clones by selecting the number of pools to be used. In this case, the tag library having the desired number of clones can be easily prepared by setting the number of clones per pool to 11,100,000 and the number of pools to be prepared from 2 to 100.
[0054] 前記特許文献 2のタグベクターは、タグ部分の配列が異なる約 1700万種類のブラ スミドの混合物である。 MPSS法により配列解析を行うためには 1個のマイクロビーズ には 1種類の配列の DNAを結合させる必要があり、そのためには 1種類のタグ配列 には 1種類の標的 DNA配列を対応させることが必要である。タグライブラリーの各プ ールに含まれるクローン数を 17万一 100万に設定し、標的 DNAのマイクロビーズへ の結合をプールごとに行うことにより、 2種類以上の標的 DNAが結合したタグの割合 を 0. 5—数%と 、う低 、値に抑えることができる。  [0054] The tag vector of Patent Document 2 is a mixture of about 17 million types of plasmids having different tag portion sequences. In order to perform sequence analysis by the MPSS method, it is necessary to bind one type of DNA to one microbead, and therefore, one type of target DNA must correspond to one type of tag sequence. is necessary. By setting the number of clones contained in each pool of the tag library to 170,000 and 1 million, and binding target DNA to microbeads for each pool, the number of tags to which two or more types of The ratio can be as low as 0.5-several%.
[0055] (A— 2)標的 DNAの断片とタグ配列が連結された DNAを、タグライブラリ一力も調製 する工程  [0055] (A-2) A step of preparing a DNA in which a fragment of a target DNA and a tag sequence are linked to one another by a tag library
標的 DNAの断片とタグを含む DNAをタグライブラリ一力 調製する。この方法に特 に限定はないが、例えば 1種類または複数種類の適当な制限酵素で消化した後にゲ ル電気泳動やゲルろ過等による分子量分画で前記 DNAからベクター部分を除去す る方法、および PCRによる方法が挙げられる。特に、 PCRによる方法は標的 DNAと タグを含む DNAを大量に調製する場合に簡便であること、 目的の部分だけを増幅で きるのでベクターを除去する必要がないこと等の利点がある。この場合、標的 DNA 側のプライマーを蛍光基、タグ側のプライマーをピオチン等の特異的選別が可能な 基で標識しておくことにより以後の操作を効率的かつ簡便に行うことができる。 Prepare a tag library and DNA containing the target DNA fragment and tag. The method is not particularly limited, for example, a method in which the vector portion is removed from the DNA by digestion with one or more appropriate restriction enzymes, followed by molecular weight fractionation by gel electrophoresis or gel filtration. Examples include a method using PCR. In particular, the PCR method has advantages such as simplicity when preparing a large amount of DNA containing a target DNA and a tag, and because it can amplify only the desired portion, there is no need to remove the vector. In this case, the primer on the target DNA side can be specifically selected with a fluorescent group, and the primer on the tag side with a specific selection such as biotin. By labeling with a group, subsequent operations can be performed efficiently and easily.
[0056] (A— 3)標的 DNAの断片をマイクロビーズに結合させる工程  (A-3) Step of Binding Target DNA Fragment to Microbeads
この DNAのタグ部分を例えば次の方法により 1本鎖化する。前記非特許文献 4のタ グは A、 T、 G塩基力 なり、タグの相補鎖は T、 A、 Cからなる。前記 DNAについて、 必要に応じてタグとタグ側の末端の間を切断する制限酵素で消化、末端断片を除去 したのち、 dGTP存在下 T4 DNAポリメラーゼを作用させることによりタグ部分だけを 1本鎖化できる。  The tag portion of this DNA is made single-stranded by, for example, the following method. The tag of Non-patent Document 4 has A, T, and G base forces, and the complementary strand of the tag includes T, A, and C. If necessary, digest the DNA with a restriction enzyme that cuts between the tag and the end on the tag side, remove the terminal fragments, and then make T4 DNA polymerase act in the presence of dGTP to convert only the tag into a single strand. it can.
[0057] こうして得られた 1本鎖タグつき標的 DNA断片を、アンチタグが結合したマイクロビ ーズ (以下、マイクロビーズと略す)に結合させる。マイクロビーズは、例えば前記特許 文献 2と前記非特許文献 4に記載された方法で調製することができる。 1本鎖タグつき 標的 DNAとマイクロビーズを混合し、インキュベーションする。インキュベーション液 の組成、温度等の条件は、マイクロビーズ上のアンチタグと断片化標的 DNAに結合 した 1本鎖タグが特異的にハイブリダィズする条件、すなわち完全に相補的なアンチ タグと一本鎖タグのみがハイブリダィズする条件であれば特に限定はな 、が、前記非 特許文献 4に記載の条件、すなわち 500mM NaCl、 10mM リン酸 Na、 0. 01% Tween20、 3% デキストラン硫酸中で 72°C、 3日間ハイブリダィズさせる条件は好 適に使用できる。マイクロビーズを洗浄したのち、 1本鎖タグつき標的 DNAがハイブ リダィゼーシヨンにより結合したマイクロビーズを選別する。標的 DNA側の PCRブラ イマ一を蛍光標識しておけば、当該標識を指標にセルソーターを用いて選別できる ので、操作の容易性、得られるマイクロビーズの純度等の点で有利である。  [0057] The thus obtained target DNA fragment with a single-stranded tag is bound to a microbead to which an anti-tag is bound (hereinafter abbreviated as microbead). Microbeads can be prepared, for example, by the methods described in Patent Document 2 and Non-patent Document 4. Mix single-stranded tagged target DNA and microbeads and incubate. Conditions such as the composition and temperature of the incubation solution are such that the anti-tag on the microbeads and the single-stranded tag bound to the fragmented target DNA specifically hybridize, that is, only the completely complementary anti-tag and single-stranded tag are used. Is not particularly limited as long as the hybridization conditions are satisfied, but the conditions described in Non-Patent Document 4 described above, namely, 500 mM NaCl, 10 mM Na phosphate, 0.01% Tween 20, 3% dextran sulfate at 72 ° C., 3 ° C. Conditions for hybridizing for a day can be used favorably. After washing the microbeads, the microbeads to which the target DNA with a single-stranded tag is bound by hybridization are selected. If the PCR primer on the target DNA side is fluorescently labeled, the label can be used as a marker by using a cell sorter, which is advantageous in terms of operability, purity of the obtained microbeads, and the like.
[0058] DNAリガーゼによってマイクロビーズに結合した標的 DNA断片とアンチタグとの間 に共有結合を形成させる。使用する DNAリガーゼに特に限定はないが、例えば T4 DNAリガーゼおよび大腸菌 DNAリガーゼが好適に使用できる。 DNAリガーゼに よる反応に先立って、 dATP、 dGTP, dCTP、 dTTP存在下、 DNAポリメラーゼを作 用させると DNAリガーゼ反応の効率が向上する場合があるので、必要に応じてこの 反応を行えばよい。使用する DNAポリメラーゼに特に限定はないが、例えば T4 D NAポリメラーゼが好適に使用できる。  [0058] A covalent bond is formed between the anti-tag and the target DNA fragment bound to the microbeads by DNA ligase. The DNA ligase to be used is not particularly limited. For example, T4 DNA ligase and E. coli DNA ligase can be suitably used. If the DNA polymerase is allowed to act in the presence of dATP, dGTP, dCTP, and dTTP prior to the reaction with DNA ligase, the efficiency of the DNA ligase reaction may be improved. Therefore, this reaction may be performed if necessary. The DNA polymerase to be used is not particularly limited, but for example, T4 DNA polymerase can be suitably used.
[0059] (A— 4)標的 DNA断片の塩基配列を決定する工程 上記 (A— 3)の工程にお!、て調製された、マイクロビーズに固定化された DNAの塩 基配列を以下に示した操作にしたがって決定することができる。 (A-4) Step of Determining Base Sequence of Target DNA Fragment The base sequence of the DNA immobilized on the microbeads prepared in the above step (A-3) can be determined according to the following operation.
[0060] (a)マイクロビーズ上の標的 DNAの末端の、蛍光基を含む DNA断片を制限酵素で 除去し、開始アダプターを連結する。この目的のために、適当な制限酵素認識配列 をタグベクターに挿入しておくことが望ましい。このあとの一連の反応を行って DNA 塩基配列を決定することができれば開始アダプターの配列に特に限定はない。すな わち、次の工程で使用するタイプ lis制限酵素の認識配列を、正しい位置にもってい ればよい。例えば、前記非特許文献 3に述べられているように、標的 DNAの末端か ら 4塩基ずつ解析するための開始アダプター(開始アダプター 1)と、標的配列の末 端から 2塩基離れた部位力 4塩基ずつ解析するための開始アダプター(開始ァダプ ター 2)の 2種類のアダプターを使用してもよいし、 1種類の開始アダプターだけを使 用してちょい。 (A) A DNA fragment containing a fluorescent group at the end of the target DNA on the microbead is removed with a restriction enzyme, and an initiation adapter is ligated. For this purpose, it is desirable to insert an appropriate restriction enzyme recognition sequence into the tag vector. The sequence of the initiation adapter is not particularly limited as long as the DNA base sequence can be determined by performing a series of subsequent reactions. In other words, the recognition sequence for the type lis restriction enzyme used in the next step may be at the correct position. For example, as described in Non-patent Document 3, an initiating adapter (initiating adapter 1) for analyzing four bases at a time from the end of the target DNA, and a site force 2 bases away from the end of the target sequence 4 You can use two types of adapters, starting adapters (starting adapter 2) for analyzing each base, or use only one type of starting adapter.
あるいは、工程 (A— 1)で使用するタグベクター中の、標的 DNAをクローユングする 部位付近に次の工程で使用するタイプ lis制限酵素の認識配列をあらかじめ挿入し ておくことにより、上記の蛍光基を含む DNA断片の除去と開始アダプターの連結を 省略することができる。  Alternatively, the above-mentioned fluorescent group can be obtained by inserting a recognition sequence for the type lis restriction enzyme used in the next step in the tag vector used in the step (A-1) near the site where the target DNA is to be closed. Removal of the DNA fragment containing and ligation of the initiation adapter can be omitted.
[0061] (b)こうして調製したマイクロビーズをフローセルに 2次元的に充填する。フローセル はマイクロビーズの直径よりもやや広い間隔で重ね合わされたガラス板力 成ってお り、出口付近にはビーズの流出を防ぐダムがある。フローセル中で以下の反応を行つ て標的 DNAの塩基配列を決定する。  (B) The microbeads thus prepared are two-dimensionally filled in a flow cell. The flow cell is made up of glass plates stacked at intervals slightly larger than the diameter of the microbeads, and there is a dam near the outlet to prevent the beads from flowing out. Perform the following reaction in the flow cell to determine the base sequence of the target DNA.
[0062] (c)まず、数十万個一百数十万個のビーズをフローセルに充填し、ビーズが発する 蛍光を CCDカメラで撮影して各ビーズの位置を記録する。  (C) First, hundreds of thousands to hundreds of thousands of beads are filled in a flow cell, and fluorescence emitted from the beads is photographed with a CCD camera to record the position of each bead.
[0063] (d)開始アダプタ一はタイプ lis制限酵素認識配列を持ち、この酵素で消化すると標 的 DNAの末端が突出末端となるようにデザインされて 、る。ビーズが充填されたフロ 一セルにタイプ lis制限酵素を流してビーズ上の DNAと反応させることによって標的 DNAの末端の 4塩基を突出末端とする。タイプ lis制限酵素は突出末端を生成する ものであれば特に限定はないが、 4塩基突出末端を生成する酵素、例えば Bbvlが好 適に使用できる。 [0064] (e)本発明で使用するェンコ一デッド アダプター及びデコーダー プローブの好適 な例として、前記非特許文献 4に記載されているものが挙げられる。当該文献に開示 されたェンコ一デッド アダプタ一はタイプ lis制限酵素として Bbvlを使用する場合に 合わせて設計されている。当該アダプタ一は一方の末端に 4塩基の 5'突出、他方の 末端に 10塩基の 3 '突出を持つ、一部が 2本鎖の合成 DNAである。ェンコ一デッド アダプターの 2本鎖部分の配列は共通であり、突出末端の配列によって 16グループ に分かれている。同一のグループに属するェンコ一デッド アダプタ一は、 5'突出末 端のうち 1塩基と 3'突出末端配列のすべてが共通であり、 5'突出末端の残り 3塩基 は 4種類の塩基の混合物である。 16グループのェンコ一デッド アダプター混合物( 64 X 16 = 1, 024種類の配列)と T4 DNAリガーゼを反応させることにより、標的 D NAの突出末端の配列に相補的な配列を持ったェンコ一デッド アダプターだけがラ ィゲーシヨンされる。 (D) The start adapter has a type lis restriction enzyme recognition sequence, and is designed such that digestion with this enzyme makes the end of the target DNA a protruding end. By flowing a type lis restriction enzyme through a flow cell filled with beads and reacting with the DNA on the beads, the four bases at the end of the target DNA are made to be protruding ends. The type lis restriction enzyme is not particularly limited as long as it generates a protruding end, but an enzyme generating a 4-base protruding end, for example, Bbvl can be suitably used. (E) Preferable examples of the encoder adapter and decoder probe used in the present invention include those described in Non-patent Document 4. The dead adapter disclosed in this document is designed for use with Bbvl as a type lis restriction enzyme. The adapter is a partially double-stranded synthetic DNA having a 5 ′ overhang of 4 bases at one end and a 3 ′ overhang of 10 bases at the other end. The sequence of the double-stranded portion of the dead adapter is common, and is divided into 16 groups according to the sequence of the protruding end. Encoad adapters belonging to the same group have one base and all 3 'protruding end sequences common to the 5' overhanging end, and the remaining 3 bases at the 5 'overhanging end are a mixture of four bases. is there. By reacting T4 DNA ligase with a mixture of 16 groups of adapter adapters (64 x 16 = 1,024 types of sequences), an adapter with a sequence complementary to the sequence of the protruding end of the target DNA Only Licensing.
[0065] (f)どのェンコ一デッド アダプターがライゲーシヨンされたかを検出するために 16種 類のデコーダー プローブをフローセルに流してハイブリダィゼーシヨンを行う。デコ ーダー プローブは蛍光標識された合成 DNAであり、その配列はェンコ一デッド ァ ダプターの 3'突出末端の配列のいずれかに相補的である。 1種類のデコーダー プ ローブをノヽイブリダィズさせるたびに CCDカメラで蛍光を記録して画像データをコン ピューターに取り込んだあと、温度を上げてデコーダー プローブを除去する。  (F) In order to detect which encoding adapter has been ligated, 16 kinds of decoder probes are passed through the flow cell to perform hybridization. The decoder probe is a fluorescently labeled synthetic DNA, the sequence of which is complementary to any of the sequences at the 3 'protruding end of the enzyme adapter. Each time one type of decoder probe is noisy, fluorescence is recorded with a CCD camera and the image data is imported to a computer. Then, the temperature is raised and the decoder probe is removed.
ェンコ一デッド アダプターの構造は、 MPSSを行うことができるものであれば特に 限定はない。すなわち、標的 DNAの突出末端に連結される 1本鎖部分と、タイプ lis 制限酵素認識配列を持つ 2本鎖部分と、デコーダー プローブをハイブリダィズさせ るための 1本鎖部分を有していればよい。タイプ lis制限酵素認識配列とその位置は 、ここで使用するタイプ lis制限酵素により認識され、次に決定したい塩基が突出する 末端を生成させうるものであればよい。デコーダー プローブはェンコ一デッド ァダ プターのデコーダー プローブ結合配列に相補的な配列と蛍光基を有して!/、ればよ ぐ蛍光基としては例えばフィコエリスリンが好適に使用できる。  The structure of the encoder adapter is not particularly limited as long as it can perform MPSS. That is, it is only necessary to have a single-stranded portion linked to the protruding end of the target DNA, a double-stranded portion having a type lis restriction enzyme recognition sequence, and a single-stranded portion for hybridizing a decoder probe. . The type lis restriction enzyme recognition sequence and its position may be any as long as they can be recognized by the type lis restriction enzyme used here and generate an end from which a base to be determined next protrudes. The decoder probe has a sequence and a fluorescent group complementary to the decoder probe binding sequence of the encoder adapter! /, And as the fluorescent group, for example, phycoerythrin can be suitably used.
[0066] (g)ェンコ一デッド アダプターがライゲーシヨンされた標的 DNAについて、ェンコ一 デッド アダプターの 2本鎖部分を認識するタイプ lis制限酵素で消化すると、以上で 決定した塩基配列に隣接する塩基が突出末端となる。ここ力 はェンコ一デッド ァ ダプターのライゲーシヨン(e)、デコーダー プローブによるハイブリダィゼーシヨンと CCDカメラによる記録及びデコーダー プローブの除去 (f)のサイクルを繰り返すこと によってこの塩基の配列が決定できる。 (G) Digestion of the target DNA ligated with the enzyme dead adapter with a type lis restriction enzyme that recognizes the double-stranded portion of the enzyme dead adapter yielded the above results. A base adjacent to the determined base sequence becomes a protruding end. The base sequence can be determined by repeating the cycle of ligation of the adapter (e), hybridization with the decoder probe, recording with the CCD camera, and removal of the decoder probe (f).
[0067] 以上のようにして、数十万個から 100万個の、約 20塩基力もなる DNA配列が得ら れる。 As described above, several hundred thousand to one million DNA sequences having about 20 bases can be obtained.
[0068] (B)試料識別コードと変異部位を含む領域を重合させて力 配列を決定する方法 本発明の方法では試料識別コードと変異部位周辺の配列を決定すればよいので、 1試料、 1変異部位あたり数塩基一 20塩基の配列を決定すれば変異をタイピングで きる。現在の DN A塩基配列決定法の主流である、ジデォキシ法の原理に基づく自 動シークェンサ一を使用する方法では 1解析あたり数百塩基の配列を決定すること ができる。従って、試料識別コードと変異部位周辺の配列を複数個重合させて力も配 列を決定することにより、 1個の配列解析あたり複数の変異をタイピングすることが可 能となる。  (B) Method of Determining a Force Sequence by Polymerizing a Region Containing a Sample Identification Code and a Mutation Site In the method of the present invention, it is sufficient to determine the sequence around the sample identification code and the mutation site. Mutation can be typed by determining the sequence of several bases to 20 bases per mutation site. A method using an automatic sequencer based on the principle of the dideoxy method, which is the mainstream of the current DNA sequencing method, can determine a sequence of several hundred bases per analysis. Therefore, by polymerizing a plurality of sample identification codes and sequences around the mutation site and determining the force sequence, it becomes possible to type a plurality of mutations per sequence analysis.
[0069] (B— 1)モノマーの調製  (B-1) Preparation of Monomer
試料識別コードを付加した標的 DNAは工程 (2)で調製したものが使用できる。この DNAをそのまま、試料識別コードおよび変異部位を含む、配列を決定しょうとする領 域 (以下、配列決定領域と呼ぶ)として使用してもよいし、この DNA力も配列決定領 域を切り出して使用してもよい。前者には操作が簡単であるという利点があり、後者に は 1解析あたり得られる情報量が多 、と 、う利点がある。  The target DNA added with the sample identification code can be the one prepared in step (2). This DNA may be used as it is as a region for which a sequence is to be determined, including the sample identification code and the mutation site (hereinafter, referred to as a sequencing region). May be. The former has the advantage of easy operation, and the latter has the advantage of obtaining more information per analysis.
[0070] 後者の方法の、配列決定領域を切り出す方法について以下、詳細に説明する。  [0070] The method of cutting out the sequence determination region in the latter method will be described in detail below.
試料識別コードと変異部位を含んでいる限り、配列決定領域の範囲に限定はない 。但し、複数の変異部位を同時にタイピングしたい場合には、これらに加えて変異部 位を同定するために必要な変異部位周辺の配列を含んで 、る必要がある。この領域 を切り出す方法に特に限定はなぐ酵素を用いる方法、超音波処理ゃシァリング等の 物理的方法、酸処理等の化学的方法、またはこれらの方法を組み合わせた方法を 使用することができる。酵素としてはデォキシリボヌクレアーゼ(DNase)が使用でき、 制限酵素、 DNasel等のエンドヌクレアーゼ、 BAL31ェキソヌクレアーゼ、ェキソヌク レアーゼ III、 λェキソヌクレアーゼ、 Τ4 DNAポリメラーゼ等のェキソヌクレアーゼ、 が例示される。制限酵素は特異性が高いために、適切な位置に認識配列が存在す る場合には有効である。とりわけ、タイプ lis制限酵素は認識配列力も一定塩基離れ た部位を切断するので、試料識別コードを有するアダプターに適当なタイプ lis制限 酵素の認識配列を付加しておくことにより所望の分子量の配列決定領域を切り出せ る。配列決定領域を切り出すことができればタイプ lis制限酵素の種類に特に制限は なぐ例えば Mmel、 BsmFIが使用できる。 The range of the sequencing region is not limited as long as it includes the sample identification code and the mutation site. However, when it is desired to type a plurality of mutation sites at the same time, it is necessary to include, in addition to these, sequences around the mutation site necessary for identifying the mutation site. The method of cutting out this region is not particularly limited, and a method using an enzyme, a physical method such as sonication shearing, a chemical method such as acid treatment, or a method combining these methods can be used. Deoxyribonuclease (DNase) can be used as the enzyme; restriction enzymes, endonucleases such as DNasel, BAL31 exonuclease, exonuclease Exonucleases such as Rease III, λ exonuclease, and Τ4 DNA polymerase. Since restriction enzymes have high specificity, they are effective when a recognition sequence is present at an appropriate position. In particular, since the type lis restriction enzyme also cleaves sites at a certain distance apart from the recognition sequence, the addition of an appropriate type lis restriction enzyme recognition sequence to the adapter having the sample identification code allows the sequencing region with the desired molecular weight to be added. Can be cut out. There is no particular restriction on the type of type lis restriction enzyme as long as the sequencing region can be cut out. For example, Mmel and BsmFI can be used.
[0071] (B— 2)コンカテマ一の調製とクローユング (B-2) Preparation and Conjugation of Concatemer
このようにして調製した配列決定領域を DNAリガーゼ、例えば T4 DNAリガーゼ または大腸菌 DNAリガーゼを使用して重合させ、ベクターにクローユングする。重合 を行う前に配列決定領域の末端の形状を、例えば次のようにして重合反応に適した ものに変換すれば重合効率を向上させることができる。 5 '突出末端または 3 '突出末 端を生成するタイプ lis制限酵素により配列決定領域を切り出した場合、該酵素によ る切断末端の突出塩基配列は変異部位ごとに異なっており、相補的な末端を持つ配 列決定領域が存在しない場合が一般的である。該末端を平滑化することにより、突出 末端の塩基配列に関わらず 2量体を調製することができる。さらに、試料識別コード を有するアダプターに適当な制限酵素認識配列を付加しておき、 2量体をこの制限 酵素で消化することにより、その両末端の突出塩基配列は相補的となり、さらなる重 合に適した形状となる。重合度は 2以上であれば特に限定はなぐプラスミドベクター にクローン化する場合には lOkb以下、好ましくは 300bp以上 5kb以下さらに好ましく は lkb以上 3kb以下である。重合度を厳密に制御することは困難な場合が多いので 、重合反応のあと例えばァガロースゲル電気泳動やゲルろ過による分子量分画を行 つて目的の重合度の画分を精製し、ベクターにクローユングしてもよい。ベクターの種 類に特に限定はなぐプラスミドベクター、ファージベクター等が好適に使用できる。 クローニング時の宿主にも特に限定はないが、大腸菌が好適に使用できる。  The sequencing region thus prepared is polymerized using DNA ligase, for example T4 DNA ligase or E. coli DNA ligase, and is cloned into a vector. The polymerization efficiency can be improved by converting the shape of the end of the sequencing region to a shape suitable for the polymerization reaction as follows, for example, before performing the polymerization. When the sequencing region is cut out with a type lis restriction enzyme that generates a 5 'overhanging end or a 3' overhanging end, the protruding nucleotide sequence at the cleavage end of the enzyme differs for each mutation site, and In general, there is no arrangement determination area having. By blunting the terminal, a dimer can be prepared regardless of the nucleotide sequence of the protruding terminal. In addition, an appropriate restriction enzyme recognition sequence is added to the adapter having the sample identification code, and the dimer is digested with this restriction enzyme. It becomes a suitable shape. The degree of polymerization is not particularly limited as long as it is 2 or more. When cloned into a plasmid vector, it is 10 kb or less, preferably 300 bp or more and 5 kb or less, more preferably 1 kb or more and 3 kb or less. Since it is often difficult to strictly control the degree of polymerization, the fraction having the desired degree of polymerization is purified by a molecular weight fractionation, for example, by agarose gel electrophoresis or gel filtration after the polymerization reaction, and the resulting fraction is cloned into a vector. Is also good. Plasmid vectors, phage vectors, and the like, which are not particularly limited by the type of vector, can be suitably used. The host at the time of cloning is not particularly limited, but Escherichia coli can be suitably used.
[0072] (B— 3)配列決定  [0072] (B-3) Sequencing
このようにして得られた形質転換体から配列決定領域重合体を含むベクターを抽 出し、塩基配列を決定する。塩基配列決定方法に特に限定はないが、前記非特許 文献 1に記載のマクサム ギルバート法、前記非特許文献 2に記載のジデォキシ法、 前記非特許文献 3と前記特許文献 6に記載の MPSS法の原理に基づく方法が使用 できる。中でも、ジデォキシ法による自動シークェンサ一を使用すれば多くの配列情 報を得ることができる。試料識別コードの配列力も試料を、変異部位周辺の配列から 変異部位を同定し、変異部位の配列力 当該試料の変異をタイピングすることができ る。 From the thus obtained transformant, a vector containing the polymer for the sequencing region is extracted, and the nucleotide sequence is determined. Although there is no particular limitation on the nucleotide sequence determination method, The Maxam Gilbert method described in Document 1, the dideoxy method described in Non-Patent Document 2, and the method based on the principle of the MPSS method described in Non-Patent Document 3 and Patent Document 6 can be used. Above all, if an automatic sequencer using the dideoxy method is used, much sequence information can be obtained. The sequence power of the sample identification code can identify the sample, the mutation site from the sequence around the mutation site, and the sequence power of the mutation site. The mutation of the sample can be typed.
実施例  Example
[0073] 以下に実施例を挙げて本発明をさらに具体的に説明する力 本発明は以下の実施 例のみに限定されるものではない。  [0073] Power for explaining the present invention more specifically with reference to the following examples The present invention is not limited to only the following examples.
また、本明細書に記載の操作のうち、プラスミド DNAの調製、制限酵素消化などの 基本的な操作にてついてはサムブルック(Sambrook)ら、モレキユラ一'クローユング :ァ 'ラボラトリー 'マ二ユアノレ第 2版 (Molecular Cloning —A Laboratory Man ual-, 2nd. Ed. )、コールド スプリング ハーバー ラボラトリー プレス(Cold Spring Harbor Laboratory Press)、 1989年に記載の方法によった。さらに、 以下に示す大腸菌を用いたプラスミドの構築には、特に記載のない限り大腸菌 TOP 10を宿主として使用した。また、形質転換された大腸菌は 30 gZmlのクロラムフエ ニコールを含む LB培地(トリプトン 1%、酵母エキス 0. 5%、NaCl 0. 5%、 pH7 . 0)、あるいは上記培地に 1. 5%の寒天をカ卩ぇ固化させた LB クロラムフエ-コール プレートを用いて 37°Cで好気的に培養した。  Among the operations described in this specification, the basic operations such as plasmid DNA preparation and restriction enzyme digestion are described in Sambrook et al., "Molecular Development", "Lab", "Laboratory", "Mayuanore No. 2". Edition (Molecular Cloning—A Laboratory Manual, 2nd Ed.), Cold Spring Harbor Laboratory Press, 1989. Furthermore, Escherichia coli TOP10 was used as a host for the construction of plasmids using Escherichia coli shown below unless otherwise specified. The transformed Escherichia coli was cultured in LB medium (1% tryptone, 0.5% yeast extract, 0.5% NaCl, pH 7.0) containing 30 gZml of chloramphenicol, or 1.5% agar in the above medium. Was cultured aerobically at 37 ° C. using an LB chloramphene-coal plate on which the coconut was solidified.
[0074] 実施例 1  Example 1
(1)試料の調製  (1) Sample preparation
K— 562細胞 (ATCC CCL-243)、 T. T細胞 (JCRB0262)、 SKBR— 3細胞(H TB-30)、 Lu— 65細胞 (JCRB0079)および ΚΑΤΟΠΙ細胞 (JCRB0611)からゲノ ム DNAを調製した。これらのゲノム DNAを铸型とし、表 1—1一表 1 8記載のプライ マーの組み合わせを用いて PCRを行 、、 SNPの存在が知られて!/、る部位の周辺を 増幅した。但し、プライマー 2の 5'末端はピオチン標識されている。  Genomic DNA was prepared from K-562 cells (ATCC CCL-243), T.T cells (JCRB0262), SKBR-3 cells (H TB-30), Lu-65 cells (JCRB0079) and ΚΑΤΟΠΙ cells (JCRB0611). . Using these genomic DNAs as type III, PCR was carried out using the combinations of primers shown in Table 1-1 and Table 18 to amplify the area around the site where the presence of SNP was known! /. However, the 5 'end of primer 2 is labeled with biotin.
[0075] [表 1-1] [0075] [Table 1-1]
Figure imgf000026_0001
Figure imgf000026_0001
Figure imgf000026_0002
Figure imgf000026_0002
請 oozdf/ェ:) d 93 9Z08C0/S00Z OAV Oozdf / e :) d 93 9Z08C0 / S00Z OAV
Figure imgf000027_0001
。。。。
Figure imgf000027_0001
. . . .
〜, O ~, O
Figure imgf000028_0001
Figure imgf000028_0001
プライマ Primer
一対の名 プライマー 1 プライマー 2 Pair of names Primer 1 Primer 2
Name
CAGAGTTCTACAGTCCGACAACTGGA ATGCTGCATTCGTCTCTGGCCATGCTCT CAGAGTTCTACAGTCCGACAACTGGA ATGCTGCATTCGTCTCTGGCCATGCTCT
SLC26A8 SLC26A8
TCCCGAAGCATCC CAAAATGTGAGCA TCCCGAAGCATCC CAAAATGTGAGCA
CAGAGTTCTACAGTCCGACGAGCAGG ATGCTGCATTCGTCTCTGGCCAGCAACTCAGAGTTCTACAGTCCGACGAGCAGG ATGCTGCATTCGTCTCTGGCCAGCAACT
SLC28A 1_ 1 SLC28A 1_ 1
CAAAGAGGAGAGC GGTGTCCTTCGCA CAAAGAGGAGAGC GGTGTCCTTCGCA
CAGAGTTCTACAGTCCGACCGTAACC ATGCTGCATTCGTCTCTGGCCCCCTACTCAGAGTTCTACAGTCCGACCGTAACC ATGCTGCATTCGTCTCTGGCCCCCTACT
SLC28A 1_2 SLC28A 1_2
TCCGGTCATGACA TGGCAGACATGAC TCCGGTCATGACA TGGCAGACATGAC
CAGAGTTCTACAGTCCGACTCCTCGG ATGCTGCATTCGTCTCTGGCCTTGTGGCCAGAGTTCTACAGTCCGACTCCTCGG ATGCTGCATTCGTCTCTGGCCTTGTGGC
SLC28A 1— 3 SLC28A 1— 3
CCCCTGCCAGGCG CTATCAAGACCTC CCCCTGCCAGGCG CTATCAAGACCTC
CAGAGTTCTACAGTCCGACCACGGAG ATGCTGCATTCGTCTCTGGCCACGCCGCCAGAGTTCTACAGTCCGACCACGGAG ATGCTGCATTCGTCTCTGGCCACGCCGC
SLC28A 1— 4 SLC28A 1— 4
ATCCACTGCTTCC CTGGCAGGGGCCG ATCCACTGCTTCC CTGGCAGGGGCCG
CAGAGTTCTACAGTCCGACCCTTTGG ATGCTGCATTCGTCTCTGGCCTGCAGGACAGAGTTCTACAGTCCGACCCTTTGG ATGCTGCATTCGTCTCTGGCCTGCAGGA
SLC28A2 SLC28A2
GCTGTGTCTAAAG GTCTCCTTGGTTG GCTGTGTCTAAAG GTCTCCTTGGTTG
CAGAGTTCTACAGTCCGACGTGGGGT ATGCTGCATTCGTCTCTGGCCCAAGCTTCAGAGTTCTACAGTCCGACGTGGGGT ATGCTGCATTCGTCTCTGGCCCAAGCTT
SLC29A 1 SLC29A 1
TGTCTTTCACTCC ACTTGGTGGAGTG TGTCTTTCACTCC ACTTGGTGGAGTG
CAGAGTTCTACAGTCCGACGGAACTT ATGCTGCATTCGTCTCTGGCCTTTTCCTCAGAGTTCTACAGTCCGACGGAACTT ATGCTGCATTCGTCTCTGGCCTTTTCCT
SLC2A2— 1 SLC2A2— 1
TAAAAAATGTAAA CTTTGCTGGAGTG TAAAAAATGTAAA CTTTGCTGGAGTG
CAGAGTTCTACAGTCCGACCAGCTTT ATGCTGCATTCGTCTCTGGCCTGTGTCCCAGAGTTCTACAGTCCGACCAGCTTT ATGCTGCATTCGTCTCTGGCCTGTGTCC
SLC2A2_2 SLC2A2_2
GCAGTTGGTGGAA CCAAGCCACCCAC GCAGTTGGTGGAA CCAAGCCACCCAC
CAGAGTTCTACAGTCCGACCACGGAG ATGCTGCATTCGTCTCTGGCCTGAGGGACAGAGTTCTACAGTCCGACCACGGAG ATGCTGCATTCGTCTCTGGCCTGAGGGA
SLC2A4_2 SLC2A4_2
AGGGCCCAGAGGG CCCAGCTCCATCC AGGGCCCAGAGGG CCCAGCTCCATCC
CAGAGTTCTACAGTCCGACTTTGGAA ATGCTGCATTCGTCTCTGGCCCCCCTGTCAGAGTTCTACAGTCCGACTTTGGAA ATGCTGCATTCGTCTCTGGCCCCCCTGT
SLC2A9— 1 SLC2A9— 1
AAGCTGGGATCCC ACTCAAGGTGACG AAGCTGGGATCCC ACTCAAGGTGACG
CAGAGTTCTACAGTCCGACTAGAGGA ATGCTGCATTCGTCTCTGGCCAGCACGGCAGAGTTCTACAGTCCGACTAGAGGA ATGCTGCATTCGTCTCTGGCCAGCACGG
SLC2A9— 2 SLC2A9— 2
GGTCCTGGCTGAG ACACCAGGCGGAT GGTCCTGGCTGAG ACACCAGGCGGAT
CAGAGTTCTACAGTCCGACTGCCCAT ATGCTGCATTCGTCTCTGGCCTGCTCGCCAGAGTTCTACAGTCCGACTGCCCAT ATGCTGCATTCGTCTCTGGCCTGCTCGC
SLC2A9— 3 SLC2A9— 3
GATGAAGCGTCCC TCCAGGCAGGAGC GATGAAGCGTCCC TCCAGGCAGGAGC
CAGAGTTCTACAGTCCGACCACAGAT ATGCTGCATTCGTCTCTGGCCACACTCCCAGAGTTCTACAGTCCGACCACAGAT ATGCTGCATTCGTCTCTGGCCACACTCC
SLC2A9_4 SLC2A9_4
GACACCAGCCACG AGCAGTGCCCTCC GACACCAGCCACG AGCAGTGCCCTCC
CAGAGTTCTACAGTCCGACCGTTTGC ATGCTGCATTCGTCTCTGGCCACGCCACCAGAGTTCTACAGTCCGACCGTTTGC ATGCTGCATTCGTCTCTGGCCACGCCAC
SLC33A 1 SLC33A 1
TTGGGAATACCGA AGTGAGAGCAATC 1-5] TTGGGAATACCGA AGTGAGAGCAATC 1-5]
Figure imgf000030_0001
Figure imgf000030_0001
AGTGGCATCCTT AGTGGCATCCTT
TGCTGCATTCGTCTCTGCTGCATTCGTCTC
TGGTGGCCTCAATGGTGGCCTCAA
CAG TGCTGCATTCGTCTCTGGCC-CAG TGCTGCATTCGTCTCTGGCC-
GGTGGCATTGGC GGTGGCATTGGC
c¾ TGCTGCATTCGTCTCTGGCCATTCT  c¾ TGCTGCATTCGTCTCTGGCCATTCT
GAAGATGCTTTC GAAGATGCTTTC
TGCTGCATTCGTCTCTGGCCTGCTGCATTCGTCTCTGGCC
AGAAAATAATGCAGAAAATAATGC
TTT TGCTGCATTCGTCTCTGGCC 2〜,
Figure imgf000031_0001
TTT TGCTGCATTCGTCTCTGGCC 2 ~,
Figure imgf000031_0001
GGTTCCTACACC GGTTCCTACACC
TGCTGCATTCGTCTCTGCTGCATTCGTCTC
TCCTCCTGCTCGTCCTCCTGCTCG
TGCTGCATTCGTCTCTGGCC-TGCTGCATTCGTCTCTGGCC-
TGGTAGTCTGTGTGGTAGTCTGTG
TGCTGCATTCGTCTCTGGCCATGTGTGCTGCATTCGTCTCTGGCCATGTG
GAACGGAGGAGGGAACGGAGGAGG
TGCTGCATTCGTCTCTGGCCTGCTGCATTCGTCTCTGGCC
TCATGGCCGGTATCATGGCCGGTA
TTC TGCTGCATTCGTCTCTGGCCCCTTG 2,
Figure imgf000032_0001
TTC TGCTGCATTCGTCTCTGGCCCCTTG 2,
Figure imgf000032_0001
プライマ Primer
一対の名 プライマー 1 プライマー 2  Pair of names Primer 1 Primer 2
 Name
CAGAGTTC TACAGTCCGACAGGCGGA ATGCTGCATTCGTC TCTGGCCCCCGCAC CAGAGTTC TACAGTCCGACAGGCGGA ATGCTGCATTCGTC TCTGGCCCCCGCAC
SLC9A3 SLC9A3
AGGGCATCAGGCG GCAGATTCCCTAC AGGGCATCAGGCG GCAGATTCCCTAC
CAGAGTTC TACAGTCCGACCCACTAC ATGCTGCATTCGTC TCTGGCCCAGGTACCAGAGTTC TACAGTCCGACCCACTAC ATGCTGCATTCGTC TCTGGCCCAGGTAC
SLC9A8 SLC9A8
ATCAGGCGGCAGG TTGGCGTCCAGCC ATCAGGCGGCAGG TTGGCGTCCAGCC
CAGAGTTC TACAGTCCGACGAGGAAA ATGCTGCATTCGTC TCTGGCCATCTGTA CAGAGTTC TACAGTCCGACGAGGAAA ATGCTGCATTCGTC TCTGGCCATCTGTA
2C 19— 99  2C 19—99
ACTCCCTC CTGGC GGATATTTCCAAT ACTCCCTC CTGGC GGATATTTCCAAT
CAGAGTTC TACAGTCCGACATCAGGA ATGCTGCATTCGTC TCTGGCCTTTCCCA CAGAGTTC TACAGTCCGACATCAGGA ATGCTGCATTCGTC TCTGGCCTTTCCCA
2C 19—636  2C 19—636
TTGTAAGCACCCC GAAAAAAAGACTG TTGTAAGCACCCC GAAAAAAAGACTG
CAGAGTTC TACAGTCCGACCCACTAT ATGCTGCATTCGTC TCTGGCCAAAGCAA CAGAGTTC TACAGTCCGACCCACTAT ATGCTGCATTCGTC TCTGGCCAAAGCAA
2C 19_681  2C 19_681
CATTGATTATTTC GGTTTTTAAGTAA CATTGATTATTTC GGTTTTTAAGTAA
CAGAGTTC TACAGTCCGACGTCCAGG ATGCTGCATTCGTC TCTGGCCCCTGTCC CAGAGTTC TACAGTCCGACGTCCAGG ATGCTGCATTCGTC TCTGGCCCCTGTCC
2C 19_990  2C 19_990
AAGAGATT GAACG TGCATGCAGGGGC AAGAGATT GAACG TGCATGCAGGGGC
CAGAGTTC TACAGTCCGACCGTCACT ATGCTGCATTCGTC TCTGGCCAGAAAGG CAGAGTTC TACAGTCCGACCGTCACT ATGCTGCATTCGTC TCTGGCCAGAAAGG
2C 19_ 125 1  2C 19_ 125 1
TTCTGGAT GAAGG CATGAAGTAGTTA TTCTGGAT GAAGG CATGAAGTAGTTA
CAGAGTTC TACAGTCCGACGCGGAAG ATGCTGCATTCGTC TCTGGCCGATAGCC CAGAGTTC TACAGTCCGACGCGGAAG ATGCTGCATTCGTC TCTGGCCGATAGCC
1A 1— 1384  1A 1— 1384
TGTATCGGTGAGA AGGAAGAGAAAGA TGTATCGGTGAGA AGGAAGAGAAAGA
CAGAGTTC TACAGTCCGACGTTTCAC ATGCTGCATTCGTC TCTGGCCCTCAGAG CAGAGTTC TACAGTCCGACGTTTCAC ATGCTGCATTCGTC TCTGGCCCTCAGAG
1Α 1_3 '  1Α 1_3 '
TGTAACCT CCACC GCTGAGGTGGGAG TGTAACCT CCACC GCTGAGGTGGGAG
ALDH2— 145 CAGAGTTC TACAGTCCGACGTACGGG ATGCTGCATTCGTC TCTGGCCGCCCCCA 9 CTGCAGGCATACA GCAGGTCCCACAC (2)タグライブラリーの作製 ALDH2— 145 CAGAGTTC TACAGTCCGACGTACGGG ATGCTGCATTCGTC TCTGGCCGCCCCCA 9 CTGCAGGCATACA GCAGGTCCCACAC (2) Preparation of tag library
PCR産物を由来する細胞ごとに混合し、 Mmel (NEB社製)で消化した (標的 DN A)。 K 562細胞、 T. T細胞、 SKBR— 3細胞、 Lu— 65細胞ぉょひ 丁0111細胞由 来の上記 DNAに、試料識別コードを有するアダプターである、アダプター CAG、ァ ダプター GCA、アダプター GGG、アダプター ACGおよびアダプター AGCを、 T4 DNAリガーゼを用いてそれぞれライゲーシヨンした。なお、アダプター CAGは配列 表の配列番号: 1で示されるオリゴヌクレオチドと配列表の配列番号: 2で示されるオリ ゴヌクレオチドをァニールさせたもの、アダプター GCAは配列表の配列番号: 3で示 されるオリゴヌクレオチドと配列表の配列番号: 4で示されるオリゴヌクレオチドをァニ ールさせたもの、アダプター GGGは配列表の配列番号: 5で示されるオリゴヌクレオ チドと配列表の配列番号: 6で示されるオリゴヌクレオチドをァニールさせたもの、ァダ プター GACは配列表の配列番号: 7で示されるオリゴヌクレオチドと配列表の配列番 号: 8で示されるオリゴヌクレオチドをァニールさせたもの、アダプター CCCは配列表 の配列番号: 9で示されるオリゴヌクレオチドと配列表の配列番号: 10で示されるオリ ゴヌクレオチドをァニールさせたものである。なお、配列番号 2、 4、 6、 8、 10で示され るオリゴヌクレオチドはその 5'末端がリン酸ィ匕されている。 The PCR product was mixed for each cell of origin and digested with Mmel (NEB) (target DNA). The above-mentioned DNA derived from K562 cells, T.T cells, SKBR-3 cells, Lu-65 cells, and 0111 cells are used as adapters having sample identification codes, such as adapter CAG, adapter GCA, and adapter GGG. Adapter ACG and adapter AGC were each ligated using T4 DNA ligase. The adapter CAG is obtained by annealing the oligonucleotide represented by SEQ ID NO: 1 in the sequence table and the oligonucleotide represented by SEQ ID NO: 2 in the sequence table, and the adapter GCA is represented by SEQ ID NO: 3 in the sequence table. An adapter GGG is obtained by annealing the oligonucleotide shown in SEQ ID NO: 4 and the oligonucleotide shown in SEQ ID NO: 4 in the Sequence Listing, and the oligonucleotide shown in SEQ ID NO: 5 in the Sequence Listing and SEQ ID NO: 6 in the Sequence Listing. An annealed oligonucleotide shown, adapter GAC is an annealed oligonucleotide shown by SEQ ID NO: 7 in the sequence list and an oligonucleotide shown by SEQ ID NO: 8 in the sequence list, and an adapter CCC Sequence listing The oligonucleotides represented by SEQ ID NO: 9 and the oligonucleotides represented by SEQ ID NO: 10 in the Sequence Listing are annealed. The oligonucleotides represented by SEQ ID NOs: 2, 4, 6, 8, and 10 are phosphorylated at the 5 'end.
[0084] アダプターをライゲーシヨンした DNAを等量ずつ混合し、 95°Cで 2分間処理して 1 本鎖化したあと、ストレプトアビジンが結合した磁気ビーズであるダイナビーズ M— 28 0ストレプトアビジン (ダイナル社製)をカ卩えてピオチン標識された DNAを磁気ビーズ に結合させた。非結合画分を十分に洗ったのちに磁気ビーズに配列表の配列番号: 11で示されるプライマー Tをカ卩えてァニールさせ、 dATP、 dGTP、 dCTP、 dTTP存 在下、タレノウ酵素(タカラバイオ社製)を作用させて DNAを 2本鎖化した。これに Sa u3AI (タカラバイオ社製)を作用させたあと磁気ビーズを洗 、、次 、で BsmBI (NEB 社製)とゥシ小腸アルカリホスファターゼ (CIAP、タカラバィォ社製)を作用させて磁 気ビーズから DN Aを遊離させるとともにその 5 '—リン酸基を除去し、この DNAを回収 した。 [0084] Equal amounts of the DNA ligated to the adapter were mixed and treated at 95 ° C for 2 minutes to form a single strand, and then Dynabeads M-280 Streptavidin (Dinal Beads), which is magnetic beads to which streptavidin was bound. (Manufactured by K.K.) and the biotin-labeled DNA was bound to the magnetic beads. After thoroughly washing the unbound fraction, primer T shown in SEQ ID NO: 11 is added to the magnetic beads and annealed, and then, in the presence of dATP, dGTP, dCTP, and dTTP, a tarenow enzyme (manufactured by Takara Bio Inc.) ) To make the DNA double-stranded. The magnetic beads were washed with Sau3AI (Takara Bio), washed with BsmBI (NEB), and then inactivated with small intestinal alkaline phosphatase (CIAP, Takara Bay). DNA was recovered from the DNA and its 5'-phosphate group was removed, and the DNA was recovered.
[0085] 非特許文献 4に記載の方法に従ってタグベクター pLCV2を構築した。 pLCV2を B amHI (NEB社製)、 Bpul20I (フアーメンタス社製)により消化したあと、 CIAP (タカ ラバイオ社製)により脱リン酸処理を行い、 DNA Blunting Kit (タカラバイオ社製) を用いて末端を平滑化した。この pLCV2と上記の磁気ビーズから回収された DNAと をライゲーションした。これを用いてエレクト口ポレーシヨンにより大腸菌 TOP 10を形 質転換した。形質転換体の一部を LB—クロラムフエ-コールプレートに接種して生じ たコロニー数力も独立したクローン数を算出するとともに、別の一部を 6本の 50mlの クロラムフエ-コール含有 LB培地に接種して培養し、 QIAGEN Plasmid Midi K it (キアゲン社製)を用いて培養物からプラスミド DNAを精製した。 50mlのクロラムフ 工-コール含有 LB培地 1本あたりの独立したクローン数は約 16万であった。各々の 培養力 得られたプラスミド DNAをタグライブラリープールとし、 6個のプールからな るタグライブラリーを得た。  [0085] A tag vector pLCV2 was constructed according to the method described in Non-Patent Document 4. After digesting pLCV2 with BamHI (manufactured by NEB) and Bpul20I (manufactured by Famentas), dephosphorylate with CIAP (manufactured by Takara Bio), and terminate the ends using DNA Blunting Kit (manufactured by Takara Bio). Smoothed. This pLCV2 was ligated to the DNA recovered from the above magnetic beads. Using this, E.coli TOP10 was transformed by electoporation. The number of colonies generated by inoculating a part of the transformant on an LB-chloramphene-coal plate was calculated independently, and another part was inoculated on six 50 ml LB medium containing chloramphene-coal. The plasmid DNA was purified from the culture using QIAGEN Plasmid Midi Kit (Qiagen). The number of independent clones per LB medium containing 50 ml of chloramphine-chol was approximately 160,000. Each culture power The obtained plasmid DNA was used as a tag library pool, and a tag library consisting of six pools was obtained.
[0086] (3)マイクロビーズの調製  [0086] (3) Preparation of microbeads
タグライブラリープールを铸型、 FAM標識 PCR— Rプライマー(配列番号 12)とピオ チン化 PCR— Fプライマー(配列番号 13)を用いて PCRを行 、、標的 DNAの断片と タグを含む部分を増幅した。この PCRから第 1回目のソーティングまではプールごと に操作を行い、本実施例ではその中の 1プールについて記載している。 PCR産物を Pad (NEB社製)で消化後、 dGTP存在下 T4 DNAポリメラーゼ(タカラバイオ社製 )を作用させてタグ部分を 1本鎖化した。 The tag library pool was subjected to PCR using a type I, FAM-labeled PCR-R primer (SEQ ID NO: 12) and a biotinylated PCR-F primer (SEQ ID NO: 13). The part containing the tag was amplified. Operations are performed for each pool from this PCR to the first sorting, and in this example, one pool is described. After digesting the PCR product with Pad (manufactured by NEB), T4 DNA polymerase (manufactured by Takara Bio Inc.) was allowed to act in the presence of dGTP to convert the tag portion to single-stranded.
こうして調製した 1本鎖タグつき標的 DNA断片 50 IX gと、前記非特許文献 4に記 載の方法により調製したアンチタグが結合したマイクロビーズ 1. 67 X 107個を混合 し、 100 /z lの 500mM NaCl、 10mM リン酸ナトリウム、 0. 01% Tween20、 3% デキストラン硫酸中で 72°C、 3日間ハイブリダィズさせた。マイクロビーズを 50mM Tris— HCl(pH8)、 50mM NaCl、 3mM MgClに続いて lOmM Tris— HCl (p The thus-prepared 50 IX g of the single-stranded tagged target DNA fragment and 1.67 × 10 7 micro-beads to which the anti-tag prepared by the method described in Non-patent Document 4 were mixed were mixed at 100 / zl. The cells were hybridized in 500 mM NaCl, 10 mM sodium phosphate, 0.01% Tween20, and 3% dextran sulfate at 72 ° C. for 3 days. Microbeads were added to 50 mM Tris-HCl (pH 8), 50 mM NaCl, 3 mM MgCl, followed by lOmM Tris-HCl (p
2  2
H8)、 lmM EDTA、0. 01% Tween20で洗浄したのち、 MoFloサイトメーター( ダコ サイトメーシヨン社製)を用いて FAMによる蛍光強度が上位 1%であるマイクロ ビーズをソーティングした (第 1回目ソーティング)。  After washing with H8), lmM EDTA and 0.01% Tween20, the microbeads with the highest 1% fluorescence intensity by FAM were sorted using a MoFlo cytometer (manufactured by Dako Cytometry) (first sorting). ).
[0087] ソーティングしたマイクロビーズに T4 DNAリガーゼを作用させることによって標的 DNA断片とアンチタグの間に共有結合を形成させ、次いで BamHIで消化した。さら に dGTP存在下 T4 DNAポリメラーゼをマイクロビーズに作用させたあと、開始ァダ プターを T4 DNAリガーゼを用いて連結した。なお、開始アダプタ一は配列表の配 列番号 14で示されるオリゴヌクレオチドと配列表の配列番号 15で示されるオリゴヌク レオチドをァニールさせたものである。 MoFloサイトメーターを用いて FAMによる蛍 光を持つマイクロビーズをソーティングした(2回目ソーティング)。  [0087] T4 DNA ligase was allowed to act on the sorted microbeads to form a covalent bond between the target DNA fragment and the anti-tag, and then digested with BamHI. Furthermore, after T4 DNA polymerase was allowed to act on the microbeads in the presence of dGTP, the starting adapter was ligated using T4 DNA ligase. The starting adapter was obtained by annealing an oligonucleotide represented by SEQ ID NO: 14 in the sequence listing and an oligonucleotide represented by SEQ ID NO: 15 in the sequence listing. Microbeads with fluorescence by FAM were sorted using a MoFlo cytometer (second sorting).
[0088] (4)マイクロビーズ上の DNAの塩基配列の決定  (4) Determination of DNA base sequence on microbeads
開始アダプターを連結したマイクロビーズをフローセルに充填し、前記非特許文献 3に記載の MPSS法の操作に準じてマイクロビーズ上の試料識別コードと SNP部位 周辺の配列を決定した。その結果、 3塩基の試料識別コードと 9塩基の SNP部位周 辺配列を含む、約 100万個の配列が得られた。  The flow cell was filled with microbeads to which an initiation adapter was connected, and the sample identification code on the microbeads and the sequence around the SNP site were determined according to the MPSS method described in Non-patent Document 3. As a result, about 1 million sequences were obtained, including a sample identification code of 3 bases and a sequence around the SNP site of 9 bases.
これらの配列を試料識別コード別および SNP部位別に分類した。その結果、各細 胞株の SNPをタイピングできた。  These sequences were classified by sample identification code and SNP site. As a result, SNPs of each cell line could be typed.
産業上の利用可能性  Industrial applicability
[0089] 本発明によって、変異のタイピング方法が提供される。本発明の方法を使用すれば 、多数の検体について変異のタイピングを実施することが容易になるので、頻度の低 い変異を低コストで発見することができる。それによつて、 SNPをはじめとする多型の タイピングを応用した効果的かつ安全な医療が可能となる。 [0089] The present invention provides a method for typing a mutation. Using the method of the present invention In addition, it is easy to perform mutation typing on a large number of samples, so that infrequent mutations can be found at low cost. As a result, effective and safe medical treatment using SNP and other polymorphism typing will be possible.
配列表フリーテキスト Sequence listing free text
SEQ ID NO:l; Oligonucleotide constituting adapter CAG. SEQ ID NO: l; Oligonucleotide fine adapter CAG.
SEQ ID NO:2; Oligonucleotide constituting adapter CAG. SEQ ID NO: 2; Oligonucleotide fine adapter CAG.
SEQ ID N〇:3; Oligonucleotide constituting adapter GCA. SEQ ID N〇: 3; Oligonucleotide mass adapter GCA.
SEQ ID NO:4; Oligonucleotide constituting adapter GCA. SEQ ID NO: 4; Oligonucleotide fine adapter GCA.
SEQ ID NO:5; Oligonucleotide constituting adapter GGG. SEQ ID NO: 5; Oligonucleotide fine adapter GGG.
SEQ ID NO :6; Oligonucleotide constituting adapter GGG. SEQ ID NO: 6; Oligonucleotide fine adapter GGG.
SEQ ID NO :7; Oligonucleotide constituting adapter GAC. SEQ ID NO: 7; Oligonucleotide fine adapter GAC.
SEQ ID N〇:8; Oligonucleotide constituting adapter GAC. SEQ ID N〇: 8; Oligonucleotide mass adapter GAC.
SEQ ID NO:9; Oligonucleotide constituting adapter CCC. SEQ ID NO: 9; Oligonucleotide fine adapter CCC.
SEQ ID NO: 10; Oligonucleotide constituting adapter CCC. SEQ ID NO: 10; Oligonucleotide fine adapter CCC.
SEQ ID N〇:l l; Primer T to synthesize double-strand DNA. SEQ ID N〇: l l; Primer T to synthesize double-strand DNA.
SEQ ID NO:12; PCR primer PCR-R to amplify a DNA fragment in tag library pool. SEQ ID N〇:13; PCR primer PCR-F to amplify a DNA fragment in tag library pool. SEQ ID NO: 14; Oligonucleotide constituting initiating adapter. SEQ ID NO: 12; PCR primer PCR-R to amplify a DNA fragment in tag library pool.SEQ ID N〇: 13; PCR primer PCR-F to amplify a DNA fragment in tag library pool.SEQ ID NO: 14; Oligonucleotide lower initiating adapter.
SEQ ID N〇:15; Oligonucleotide constituting initiating adapter. SEQ ID N〇: 15; Oligonucleotide mass initiating adapter.

Claims

請求の範囲 [1] 以下の工程を含むことを特徴とする変異のタイピング方法: Claims [1] A mutation typing method comprising the following steps:
(1)タイピング対象の変異部位を含む標的 DNAを調製する工程、  (1) a step of preparing a target DNA containing a mutation site to be typed,
(2)標的 DNAに試料識別コードを付加する工程、  (2) adding a sample identification code to the target DNA,
(3)試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を 含む領域の塩基配列を決定する工程。  (3) A step of determining the base sequence of a region containing the sample identification code and the mutation site in the target DNA to which the sample identification code has been added.
[2] 塩基配列を決定する工程に以下の工程を含む、請求項 1に記載の変異のタイピン グ方法:  [2] The method of typing a mutation according to claim 1, wherein the step of determining a nucleotide sequence comprises the following steps:
(a)試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を 含む領域をタグベクターに連結し、タグライブラリーを作製する工程、  (a) ligating the region containing the sample identification code and the mutation site in the target DNA to which the sample identification code has been added to a tag vector to produce a tag library;
(b)試料識別コードおよび変異部位を含む DNAに、タグ配列が連結された DNAを 、タグライブラリ一力 調製する工程、  (b) a step of preparing a tag library with DNA in which a tag sequence is linked to DNA containing a sample identification code and a mutation site,
(c)試料識別コードおよび変異部位を含む DNAをマイクロビーズに結合させる工程  (c) a step of binding DNA containing the sample identification code and the mutation site to the microbeads
(d)必要に応じて、マイクロビーズ上の標的 DNAの末端に開始アダプターを連結す る工程、 (d) if necessary, linking an initiation adapter to the end of the target DNA on the microbeads,
(e)マイクロビーズをフローセルに 2次元的に充填し、各ビーズの位置を記録するェ 程、  (e) Two-dimensionally filling the microbeads into the flow cell and recording the position of each bead,
(f)マイクロビーズ上の DNAを制限酵素消化し、標的 DNAの末端を突出末端とする 工程、  (f) a step of digesting the DNA on the microbeads with a restriction enzyme to make the end of the target DNA a protruding end,
(g)工程 (f)で生成した突出末端に相補的なェンコ一デッド アダプターをマイクロビ ーズ上の標的 DNAとライゲーシヨンさせる工程、  (g) ligating the encoding adapter complementary to the protruding end generated in step (f) with the target DNA on the microbead,
(h)工程(g)で得られたマイクロビーズとデコーダー プローブとのハイブリダィゼー シヨンを行い、標的 DNAとライゲーシヨンされたェンコ一デッド アダプターを確認す る工程、  (h) hybridizing the microbeads obtained in step (g) with a decoder probe to confirm the encoded adapter ligated with the target DNA;
(i)工程 (h)のマイクロビーズよりデコーダー プローブを除去し、得られたマイクロビ ーズを工程 (f)以下の工程に使用する工程。  (i) A step of removing the decoder probe from the microbeads in step (h) and using the resulting microbeads in step (f) and subsequent steps.
[3] 試料識別コードを付加した標的 DNAのうち、試料識別コードおよび変異部位を 含む領域の 2個以上を重合させる工程を含む、請求項 1に記載の変異のタイピング 方法。 [3] Of the target DNA to which the sample identification code has been added, 2. The method for typing a mutation according to claim 1, comprising a step of polymerizing two or more of the included regions.
PCT/JP2004/015214 2003-10-16 2004-10-15 Method of typing mutation WO2005038026A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003-356850 2003-10-16
JP2003356850 2003-10-16

Publications (1)

Publication Number Publication Date
WO2005038026A1 true WO2005038026A1 (en) 2005-04-28

Family

ID=34463226

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/015214 WO2005038026A1 (en) 2003-10-16 2004-10-15 Method of typing mutation

Country Status (1)

Country Link
WO (1) WO2005038026A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097443A1 (en) * 2006-02-20 2007-08-30 National University Corporation Hokkaido University Method of determining base sequence of dna

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002500050A (en) * 1998-01-09 2002-01-08 リンクス セラピューティクス, インコーポレイテッド Solid phase selection of differentially expressed genes
WO2003002709A2 (en) * 2001-06-21 2003-01-09 K.U. Leuven Research & Development Novel technology for genetic mapping

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002500050A (en) * 1998-01-09 2002-01-08 リンクス セラピューティクス, インコーポレイテッド Solid phase selection of differentially expressed genes
WO2003002709A2 (en) * 2001-06-21 2003-01-09 K.U. Leuven Research & Development Novel technology for genetic mapping

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KADERALI L. ET AL.: "Primer-design for multiplexed genotyping", NUCLEIC ACID RESEARCH, vol. 31, no. 6, 15 March 2003 (2003-03-15), pages 1796 - 1802, XP002996256 *
OYAMA N.: "DNA micro beads array gijutsu o mochiita idenshi hatsugen kaiseki", NIPPON NOGEI KAGAKU KAISHI, vol. 76, no. 5, 2002, pages 474 - 479, XP002996255 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097443A1 (en) * 2006-02-20 2007-08-30 National University Corporation Hokkaido University Method of determining base sequence of dna
US7951536B2 (en) 2006-02-20 2011-05-31 National University Corporation Hokkaido University Method for determining base sequence of DNA

Similar Documents

Publication Publication Date Title
US11708607B2 (en) Compositions containing identifier sequences on solid supports for nucleic acid sequence analysis
AU2021282536B2 (en) Polynucleotide enrichment using CRISPR-Cas systems
US20210363570A1 (en) Method for increasing throughput of single molecule sequencing by concatenating short dna fragments
JP7033602B2 (en) Barcoded DNA for long range sequencing
EP2248914A1 (en) The use of class IIB restriction endonucleases in 2nd generation sequencing applications
JP7332733B2 (en) High molecular weight DNA sample tracking tags for next generation sequencing
WO2013106737A1 (en) Genotyping by next-generation sequencing
JP2003009890A (en) Polymorphic screening having high performance
CN102165073A (en) Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids
WO2013192292A1 (en) Massively-parallel multiplex locus-specific nucleic acid sequence analysis
US20070178482A1 (en) Method for preparing single-stranded dna
JP4669614B2 (en) Polymorphic DNA fragments and uses thereof
WO2005038026A1 (en) Method of typing mutation
WO2024033411A1 (en) Methods for determining the location of a target sequence and uses
WO2005010184A1 (en) Method of detecting mutation
JP2005117943A (en) Method for analyzing gene expression

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP