JP3845416B2 - 遺伝子タグの取得方法 - Google Patents

遺伝子タグの取得方法 Download PDF

Info

Publication number
JP3845416B2
JP3845416B2 JP2004006630A JP2004006630A JP3845416B2 JP 3845416 B2 JP3845416 B2 JP 3845416B2 JP 2004006630 A JP2004006630 A JP 2004006630A JP 2004006630 A JP2004006630 A JP 2004006630A JP 3845416 B2 JP3845416 B2 JP 3845416B2
Authority
JP
Japan
Prior art keywords
cdna
gene
base sequence
tag
primer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004006630A
Other languages
English (en)
Other versions
JP2005185269A (ja
Inventor
真一 橋本
綱治 松島
純夫 菅野
Original Assignee
株式会社ポストゲノム研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2004006630A priority Critical patent/JP3845416B2/ja
Application filed by 株式会社ポストゲノム研究所 filed Critical 株式会社ポストゲノム研究所
Priority to AU2004295532A priority patent/AU2004295532A1/en
Priority to EP04736143A priority patent/EP1698694A4/en
Priority to CA002547885A priority patent/CA2547885A1/en
Priority to KR1020067012895A priority patent/KR20060130599A/ko
Priority to US10/581,211 priority patent/US20090117538A1/en
Priority to RU2006123468/13A priority patent/RU2006123468A/ru
Priority to PCT/JP2004/008174 priority patent/WO2005054465A1/ja
Publication of JP2005185269A publication Critical patent/JP2005185269A/ja
Priority to IL175709A priority patent/IL175709A0/en
Priority to NO20063063A priority patent/NO20063063L/no
Application granted granted Critical
Publication of JP3845416B2 publication Critical patent/JP3845416B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides

Description

本発明は、遺伝子タグの取得方法、並びに遺伝子タグの解析方法に関する。
さまざまな細胞の遺伝子発現状態の比較によって、細胞を特徴付けることができる。つまり、細胞の状態を遺伝子の発現パターンで表現した細胞のカタログを得ることができる。このカタログを利用して、遺伝子の発現状態から細胞を特定することができる。逆に、細胞間で遺伝子の発現パターンを比較すると、各細胞に特徴的な遺伝子を拾い出すこともできる。たとえば、正常な細胞と、人為的な処理を加えた細胞の間で遺伝子の発現状態を比較すると、人為的な処理を加えたときに発現レベルが変化する遺伝子が見出される。この遺伝子は、人為的な処理の結果として発現レベルが変化した遺伝子である。同様に、患者の細胞と健常者の細胞の間で遺伝子の発現状態を比較することによって、疾患に関連する遺伝子を見出すこともできる。
このようにして、遺伝子の発現状態の比較によって、ある状態にある細胞で発現している遺伝子を網羅的に解析し、その種類や発現レベルを細胞間で比較することを、遺伝子の発現解析(expression analysis)と呼んでいる。遺伝子の発現解析のための手法には、さまざまな方法が用いられている。
たとえば、以下に示す方法は、cDNAライブラリー間で発現レベルが変化している遺伝子を単離するために開発された方法である。
ディファレンシャルディスプレイ法(differencial display)
サブトラクションライブラリー法(subtraction library)
これらの方法は比較的古くから実用化されている方法である。いずれも由来の異なるcDNAライブラリーの間で、発現レベルの異なっている遺伝子を見出すための解析手法である。膨大な遺伝子の塩基配列情報が蓄積された近年においては、その塩基配列情報を利用した更に効率的な遺伝子発現解析が実現されている。すなわち、DNAアレイ法である。DNAアレイには、数万におよぶ遺伝子のプローブが高密度に配置されている。1つのDNAアレイを用いることで、一度の実験操作で数万の遺伝子の発現状態を知ることができる。ヒトの遺伝子の種類が3万〜4万と推測されていることから、DNAアレイは、ヒトの遺伝子発現解析を強力に推進するツールとして広く普及しつつある。更にDNAアレイは、治療標的の探索や、薬剤候補化合物の開発に有用であると評価されている(Nature Genetics volume 32 supplement pp 547 - 552, 2002)。
しかし、一般にDNAアレイを構成するプローブは、既知の塩基配列情報に基づいてデザインされている。したがって、未知の遺伝子の取得には不向きなデバイスである。更に、現在商業的に供給されているDNAアレイは、遺伝子配列情報が十分に蓄積された生物種に限られる。たとえばAffymetrics社は、次のような生物種についてDNAアレイを提供している。
シロイヌナズナ(Arabidopsis ATH1 Genome Array)
線虫(C. elegans Genome Array)
ショウジョウバエ(Drosophila Genome Array)
大腸菌(E. coli Antisense Genome Array)
ヒト(Human Genome Focus Array、他)
マウス(Mouse Expression Set 430、他)
緑膿菌(P. aeruginosa Genome Array)
ラット(Rat Expression Set 230、他)
酵母(Yeast Genome S98 Array)
DNAアレイによるその他の生物種の遺伝子発現解析のためには、スポッターなどを利用して利用者がDNAアレイを調製しなければならない。あるいは、カスタムアレイの作成サービスを利用する必要がある。それでも、遺伝子配列表の蓄積が不十分な生物種については、遺伝子配列情報に基づくDNAアレイを用意することは難しい。
未知の遺伝子の取得を可能とし、しかも高度に効率的な遺伝子発現解析を可能とする手法として、SAGE(Serial analysis of gene expression)が提案された(SCIENCE, Vol.270, 484-487, Oct. 20, 1995)。SAGEは、遺伝子に固有のタグを取得し、タグの塩基配列の塩基配列を網羅的に解析する解析手法である。遺伝子タグとは、その遺伝子の名札として利用することができる遺伝子の断片を言う。通常、10〜20塩基程度の連続する塩基配列が、異なる遺伝子の間で完全に一致する可能性はそれほど高くない。たとえば9塩基からなる断片で、理論的には262144種類(4)の遺伝子の識別が可能である。したがって、この程度の長さの断片は、遺伝子タグとして有用である。
更にヒトゲノム配列において、18〜21塩基からなるタグ配列の出現頻度と、そのタグ配列が遺伝子に固有の塩基配列である可能性は次のように計算される。
18 268,435,456塩基に1回 89.43%
19 1,073,741,824塩基に1回 97.24%
20 4,294,967,296塩基に1回 99.3%
21 17,179,869,184塩基に1回 99.83%
つまり、理論的には、18塩基のタグ配列では約90%以上、20塩基のタグ配列では約99%以上の確率で、遺伝子に固有の塩基配列であると考えることができる。ある遺伝子に固有の塩基配列は、遺伝子にユニークな塩基配列と呼ばれる。またゲノムにおいて、その出現頻度が1と見なされる塩基配列は、ゲノムにおいてユニークな塩基配列と呼ばれる。
SAGEにおいては、IIs型制限酵素(Type IIs Endonuclease)の作用を利用して、遺伝子タグが生成される。SAGEにおいてタグを生成するIIs型制限酵素は、タギング酵素と呼ばれる。II型の制限酵素がDNAの認識配列の中を切断するのに対して、IIs型制限酵素は、認識配列から離れた位置を切断する。認識配列と切断位置の間の距離は、酵素によってほぼ一定である。たとえば、Bsm FIあるいはFokIは認識配列から9〜10塩基の位置でDNAを切断し、粘着末端(sticky end)を残す。その他にも同様の作用を有するIIs型の制限酵素として、次のような酵素が知られている(Szybalski, Gene 40:169, 1985)。
BbvI, BbvII, BinI, FokI, HgaI, HphI
MboII, MnlI, SfaNI, TaqII, TthlllII
更に、Mme Iと呼ばれるIIs型制限酵素は、認識配列(5'-TCCRAC-3')から20塩基離れた位置を切断する(Tucholski et al, Gene Vol.157, pp.87-92, 1995)。MmeIをタギング酵素として利用し、20塩基長のタグを得ることができる発現解析方法も公知である(US Patent 6498013)。MmeIを利用するSAGEは、特にlong SAGEとも呼ばれる。以下に一般的なSAGEの原理を簡単にまとめた。
まず、cDNAをII型制限酵素で切断し、その断片を回収する。II型制限酵素の認識配列が4塩基の場合、理論的には256塩基(4)の断片に切断される。たとえばNla IIIの認識配列は4塩基である。cDNAの5'末端あるいは3'末端を固相に捕捉しておけば、切断されたcDNAの5'側、あるいは3'側の断片を、それぞれ容易に回収することができる。回収されたcDNAは2つの反応系に分割され、各反応系についてそれぞれ以下の操作が行われる。
回収されたcDNAの切断箇所には、アダプターがライゲーションされる。アダプターは、末端にPCR増幅用のプライマーの塩基配列、中間にアンカーリング酵素の認識配列、そしてcDNAにライゲーションされる末端にIIs型の制限酵素(タギング酵素)の認識配列が配置されている。2つの別のプールに分割されたcDNAには、それぞれに異なる塩基配列のプライマーの塩基配列を含むアダプターがライゲーションされる。アダプターのライゲーションの後にIIs型の制限酵素を作用させると、IIs型制限酵素はcDNAの末端を認識し、そこから離れた位置を切断する。こうして、II型制限酵素によって切断された部分から、IIs型制限酵素に切断された部分までの断片からなるタグが生成される。生成されたタグは、ライゲーションされたアダプターを有している。
IIs型制限酵素の切断によって形成されたタグの粘着末端(sticky end)は、T4 DNAポリメラーゼによって平滑末端とされる。その後、前記の2つに分割された反応系のタグは、それぞれ平滑末端においてライゲーションされる。この結果、異なるプライマー配列を末端に配置して2つのタグが向かい合わせに連結される。2つのタグが連結されたものをダイタグと言う。ダイタグはPCRによって増幅され、アンカーリング酵素で切断される。その結果、PCRの増幅産物から、その両端のプライマー配列が除去される。更にプライマー配列を除かれたダイタグは、互いに連結されてダイタグのコンカテマーとする。こうして得られたコンカテマーがシーケンシングベクターに組み込まれる。
コンカテマーの塩基配列を解析すれば、複数の遺伝子に由来する遺伝子タグの塩基配列を同時に明らかにすることができる。あるcDNAライブラリーから得られたコンカテマーの塩基配列情報を集積すると、理論的には、そのライブラリーを構成するcDNAの全ての遺伝子のタグ情報を得ることができる。こうして得られたタグ情報を、細胞間で比較すれば、容易に発現解析を行うことができる。
DNAアレイによる発現解析には、塩基配列情報の蓄積が不可欠である。そのため、現在商業的に入手可能なDNAアレイは、ヒト、マウス、あるいは酵母などの一部の生物種に限られている。つまり、その他の多くの生物種において、DNAアレイを用いた遺伝子発現解析を行うためには、DNAアレイを新たに作成しなければならない。またDNAアレイは、既知の塩基配列情報に基づいて合成されたプローブ、あるいはクローニングされたcDNAをプローブとして用いる。その結果、一般的には、未知の遺伝子を見出すことは難しい。これに対してSAGEは、遺伝子の塩基配列情報の蓄積が不十分なことは、解析の障害とならない。更にプローブを必要としないSAGEは、未知の遺伝子の単離に有用な技術であると言える。
しかし現在実用化されているSAGEのプロトコルにおいては、cDNAを制限酵素で切断し、得られた切断箇所にIIs型制限酵素の認識配列を含むリンカーを連結している。したがって、SAGEに用いられる制限酵素には、認識配列が短いことが要求される。認識配列が長い制限酵素(rare cutter)では、切断されないcDNAが多くなってしまう。既知のSAGEにおいては、制限酵素で切断できないcDNAについては、タグが生成されない。
たとえば4塩基を認識する制限酵素であるNlaIIIなどの制限酵素は、SAGEに好適であるとされている。理論的には、cDNAが4(=256)以上の長さを有していれば、NlaIIIの認識配列を少なくとも一つ含んでいると言うことができる。確かに、256塩基以下の転写産物が存在する可能性は低いかもしれない。しかしライブラリーを構成する全てのcDNAが、常にNlaIIIの認識配列を含むとは限らない。つまり、256塩基以上の長さを有するcDNAであっても、タグが生成されない可能性はある。実際に、線虫の遺伝子をモデルとしたSAGEの評価において、NlaIII認識配列を持たないために、タグが生成されない遺伝子が存在することが報告されている(Genome Res. 2003 Jun.13/6A:1203-15)。
加えてこの工程を経て取得することができるタグは、cDNAを構成する塩基配列の中の制限酵素認識部位に隣接する塩基配列である。未知の遺伝子においては、cDNAの中のどこに制限酵素認識配列が存在するのかを予め予測することはできない。つまり、公知のSAGEによって取得されたタグの配列情報は、cDNAのどの場所に由来しているのかを予測することができないのである。
US Patent 6498013は、cDNAの5'側、あるいは3'側を捕捉することによって、それぞれ、5'側あるいは3'側のタグが得られることを開示している。しかしこの工程によって生成されるタグは、cDNAの5'側あるいは3'側に位置する制限酵素(NlaIII)に隣接する塩基配列からなっている。言い換えれば、それは、cDNAに含まれるある制限酵素認識サイトのうち、もっとも5'側あるいは3'側にある制限酵素(NlaIII)に隣接する塩基配列である。つまり、cDNAの塩基配列のどこを占める塩基配列であるのかは、明らかでない。
遺伝子発現解析においては、タグを構成する塩基配列がcDNAの中のどこに由来しているのかは大きな問題とはならない。しかし、もしもタグの塩基配列がcDNAのどの部分を構成する塩基配列なのかを明らかにすることができれば、タグの有用性は更に高まる。
Nature Genetics volume 32 supplement pp 547 - 552, 2002 SCIENCE, Vol.270, 484-487, Oct. 20, 1995 Szybalski, Gene 40:169, 1985 Tucholski et al, Gene Vol.157, pp.87-92, 1995 Genome Res. 2003 Jun.13/6A:1203-15 US Patent 6498013
本発明は、新規な原理に基づく遺伝子タグの取得方法、並びに遺伝子タグの解析方法の提供を課題とする。
先に述べたように、現在実用化されているSAGEにおいては、制限酵素の認識配列に隣接する塩基配列がタグとして生成される。このことが、タグの塩基配列と、cDNAの全長配列との関係をわかりにくくさせていた。また、制限酵素の認識配列を含まないcDNAについては、タグが生成されないという課題を残していた。
本発明者は、制限酵素の認識配列に依存しないでタグを生成することができれば、これらの課題を解消できると考えた。たとえば、mRNAの5'末端を利用してタグを生成すれば、タグの塩基配列は様々な有用性を期待できるはずである。そこで、cDNAの合成方法として利用されていたCAP構造に着目し、遺伝子タグの取得への応用を試みた。その結果、mRNAの5'末端の塩基配列情報をタグとして取得できることを見出し、本発明を完成した。すなわち本発明は、以下のタグの取得方法、ならびにこの方法によって取得されたタグの用途に関する。
〔1〕次の工程を含む真核細胞の遺伝子タグの製造方法。
(1) RNAのCAP部位にIIs型制限酵素の認識配列を含むRNAリンカーを連結する工程、
(2)(1)のRNAを鋳型としてcDNAを合成する工程、
(3)(2)のcDNAにRNAリンカーに含まれる認識配列を認識するIIs型制限酵素を作用させ、遺伝子タグを生成する工程
〔2〕次の工程によってcDNAを合成する〔1〕に記載の方法。
i)RNAの任意の領域にアニールするプライマーによってcDNAの第1鎖を合成する工程、および
ii)第1鎖のRNAリンカーを鋳型として合成された領域にアニールするプライマーによって、cDNAの第2鎖を合成して2本鎖cDNAとする工程
〔3〕第1鎖のRNAリンカーを鋳型として合成された領域にアニールするプライマーが、固相に結合することができる標識を有するか、または固相に固定化されており、前記固相の回収によって2本鎖cDNAを回収する工程を含む〔2〕に記載の方法。
〔4〕IIs型制限酵素を作用させる前、または後に固相を回収する〔3〕に記載の方法。
〔5〕RNAリンカーがII型制限酵素の認識配列を含む〔1〕に記載の方法。
〔6〕遺伝子タグのIIs型制限酵素の切断部位を、他の遺伝子タグのIIs型制限酵素の切断部位と連結させて、ダイタグを生成する工程を含む、〔1〕に記載の方法。
〔7〕RNAリンカーにアニールするプライマーによって、ダイタグを増幅する工程を含む〔6〕に記載の方法。
〔8〕遺伝子タグのIIs型制限酵素の切断部位に任意の塩基配列を有するアダプターを連結し、RNAリンカーと、前記アダプターにアニールするプライマーによって、遺伝子タグを増幅する工程を含む、〔1〕に記載の方法。
〔9〕〔1〕に記載の方法によって生成された遺伝子タグの複数を連結する工程を含む、遺伝子タグのコンカテマーの製造方法。
〔10〕〔6〕に記載の方法によって生成されたダイタグの複数を連結する工程を含む、遺伝子タグのコンカテマーの製造方法。
〔11〕〔9〕または〔10〕に記載のコンカテマーの塩基配列を決定する工程を含む、遺伝子タグの塩基配列の決定方法。
〔12〕次の要素を含む、遺伝子タグの製造用試薬キット。
(a)IIs型制限酵素の認識配列を含むオリゴヌクレオチドからなるRNAリンカー
(b)RNAリンカーをRNAのCAP部位に連結するための試薬
(c)RNAリンカーを鋳型として合成されたcDNAにアニールするオリゴヌクレオチドからなるcDNA第2鎖合成用のプライマー
(d)cDNA第1鎖合成用プライマー
〔13〕cDNA第1鎖合成用プライマーが、以下のi)-iii)からなる群から選択されるいずれかのプライマーである〔12〕に記載のキット。
i)ランダムプライマー、
ii)オリゴdTプライマー、および
iii)特定のmRNAに相補的な塩基配列を含むプライマー
〔14〕次の工程を含む、真核細胞における遺伝子の発現プロファイルの取得方法。
(1)〔1〕に記載の方法によって遺伝子タグを製造する工程、
(2)(1)の遺伝子タグの塩基配列を決定する工程、および
(3)決定された塩基配列とその出現頻度を対応付けることによって発現プロファイルを得る工程
〔15〕〔14〕に記載の方法によって取得された遺伝子発現プロファイル情報を蓄積した、遺伝子発現プロファイルのデータベース。
〔16〕〔14〕に記載の方法によって異なる種類の細胞の遺伝子発現プロファイルを取得し、遺伝子発現プロファイルを比較して細胞間で発現頻度の異なる遺伝子タグを選択する工程を含む、遺伝子発現プロファイルの解析方法。
〔17〕次の工程を含む、遺伝子の転写開始点の決定方法。
(1)〔1〕に記載の方法によって遺伝子タグを製造する工程、
(2)(1)の遺伝子タグの塩基配列を決定する工程、および
(3)決定された塩基配列をゲノムの塩基配列上にマッピングし、塩基配列が一致した領域を当該遺伝子の転写開始点として同定する工程
〔18〕cDNAの第1鎖の合成のためのプライマーが特定の遺伝子の塩基配列から選択された塩基配列からなり、当該遺伝子の転写開始点を決定することを特徴とする〔17〕に記載の方法。
〔19〕次の工程によって決定された塩基配列またはその相補配列を含むcDNAを合成するための5'側のプライマーと、cDNAの任意の部位にアニールする3'側のプライマーを含む、cDNA合成用プライマーセット。
(1)〔1〕に記載の方法によって遺伝子タグを製造する工程、および
(2)(1)の遺伝子タグの塩基配列を決定する工程
〔20〕3'側プライマーが下記の群から選択されたいずれかのプライマーである〔19〕に記載のプライマーセット。
i)オリゴdTプライマー
ii)cDNAの断片配列情報、および
iii)cDNAのII型制限酵素認識に隣接する遺伝子タグの塩基配列またはその相補配列からなるプライマー
〔21〕次の工程を含む、全長cDNAの合成方法。
a)次の工程によって決定された塩基配列またはその相補配列を含むcDNAを合成するための5'側のプライマーと、オリゴdTプライマーからなる3'側のプライマーを用い、RNAまたはcDNAを鋳型として相補鎖合成反応を行う工程、および
(1)〔1〕に記載の方法によって遺伝子タグを製造する工程、および
(2)(1)の遺伝子タグの塩基配列を決定する工程
b)合成されたDNAを全長cDNAとして回収する工程
〔22〕〔21〕に記載の方法によって得ることができる全長cDNA。
〔23〕〔22〕に記載の全長cDNAによってコードされるアミノ酸配列を含むポリペプチド。
〔24〕〔23〕に記載のポリペプチドを認識する抗体。
〔25〕〔22〕に記載の全長cDNAのコード領域を発現可能に保持するベクター。
〔26〕〔25〕に記載のベクターを発現可能に保持する形質転換体。
〔27〕〔26〕に記載の形質転換体を培養し、発現産物を回収する工程を含む、〔23〕に記載のポリペプチドの製造方法。
〔28〕以下の工程を含む、〔23〕に記載のポリペプチドの製造方法。
i)プロモーターに機能的に連結された〔22〕に記載の全長cDNAのコード領域を含むDNAコンストラクトを、生体外翻訳を支持する要素と接触させる工程、および
ii)発現産物を回収する工程
〔29〕次の工程を含む、mRNAの5'末端の塩基配列を含むcDNAの合成方法。
a)次の工程(1)-(2)によって決定された塩基配列またはその相補配列を含むcDNAを合成するための5'側のプライマーと、目的とするmRNAの任意の領域に対して相補的な塩基配列からなる3'側のプライマーを用い、RNAまたはcDNAを鋳型として相補鎖合成反応を行う工程、および
(1)〔1〕に記載の方法によって遺伝子タグを製造する工程、および
(2)(1)の遺伝子タグの塩基配列を決定する工程
b)合成されたDNAをmRNAの5'末端の塩基配列を含むcDNAとして回収する工程
〔30〕〔29〕に記載の方法によって回収されたcDNAの塩基配列を決定する工程を含む、mRNAの5'側の塩基配列を決定する方法。
本発明は、mRNAの5'末端の塩基配列を遺伝子タグとして取得する方法を提供した。mRNAの5'末端は、真核細胞のmRNAの全てが有する構造である。したがって、mRNAの塩基配列にかかわらず、原理的に全ての遺伝子からタグを取得することができる。一方、公知の原理に基づくSAGEは、制限酵素認識サイトに隣接する領域をタグとして生成する。その結果、もしもmRNAを構成する塩基配列に制限酵素認識サイトが含まれなければ、その遺伝子のタグを取得することはできない。したがって、全ての遺伝子のタグを取得できる原理を提供した点において、本発明の意義は大きい。
また本発明のタグの方法によれば、mRNAの断片からも遺伝子のタグを取得できる可能性がある。生体試料に含まれるRNAは、様々な原因によって、常に分解の危険にさらされている。したがって、cDNAの取得、あるいは得られたcDNAに基づく種々の解析結果は、mRNAの保存条件に大きく左右される。SAGE法も、mRNAの構造が完全に維持されていない場合には、遺伝子タグを取得できなかったり、あるいはタグの再現性が失われる可能性がある。
しかし本発明の方法によれば、mRNAの5'末端をタグとして取得することにより、たとえmRNAが断片化されていても、5'末端の構造さえ維持されていれば、正しくタグを取得することができる。したがって、mRNAの保存状態の影響を受けにくい。この特徴は、遺伝子の発現解析の信頼性を高める。
更に、本発明によって得ることができるタグの塩基配列は、mRNAの5'末端の塩基配列からなっている。その結果、本発明によって得られるタグの塩基配列情報は、さまざまな分野に応用することができる。たとえば以下のような用途は、本発明のタグによって始めて実現された用途である。
ゲノムにおける転写開始点の同定
全長cDNAの合成用プライマーの提供
cDNAライブラリーの全長率の評価
既知の原理に基づくSAGEによって得られたタグは、mRNAのどの領域の塩基配列なのかが明らかでない。したがって、このような用途に用いることはできない。
本発明は、次の工程を含む真核細胞の遺伝子タグの製造方法に関する。
(1) RNAのCAP部位にIIs型制限酵素の認識配列を含むRNAリンカーを連結する工程、
(2)(1)のRNAを鋳型としてcDNAを合成する工程、
(3)(2)のcDNAにRNAリンカーに含まれる認識配列を認識するIIs型制限酵素を作用させ、RNAの5'末端配列からなる遺伝子タグを生成する工程
CAP構造は、真核細胞あるいは真核細胞に感染するウイルスのmRNAの5'末端に存在する構造である。具体的には、7−メチルグアノシンが5'-5'-3リン酸架橋を介してmRNAの5'末端のヌクレオチドに結合してCAP構造を構成している。mRNAはCAP構造によって5'-3'エクソヌクレアーゼ活性による分解から保護されている。細胞内では、役割を終えたmRNAのCAP構造は、デキャッピング酵素(decapping enzyme)によって除去される。その結果、CAP構造を失ったmRNAは、5'-3'エクソヌクレアーゼによって分解される(LaGradeur et al., EMBO J,17:1487-1496, 1998)。CAP構造は、RNAポリメラーゼIIによる転写反応の初期の段階でRNAの5'末端に付加されていると考えられている。
本発明の方法は、このRNAのCAP構造にRNAリンカーを連結する工程を含む。本発明において、RNAは、真核細胞に由来するあらゆるRNAを用いることができる。より具体的には、polyA(+) RNAやtotal RNAを用いることができる。具体的には、動物、植物、酵母、あるいは粘菌などの、mRNAにCAP構造を有するあらゆる生物種に由来する細胞を利用することができる。
更に、これらの真核細胞に感染するウイルス由来のRNAも、CAP構造を有している。したがって本発明においては、真核細胞に由来する、真核細胞に感染、あるいは導入された遺伝子情報を転写したRNAも、真核細胞に由来するRNAに含まれる。真核細胞に感染した遺伝子の情報とは、たとえば、ウイルス、ウイロイド、あるいはマイコプラズマのような細胞内寄生体の遺伝子情報が含まれる。これらの遺伝子情報は天然のものであってもよいし、人為的に構成されたものであっても良い。一方、真核細胞に導入された遺伝子の情報とは、ベクターなどによって、人為的に導入された遺伝子情報を言う。たとえば、本来CAP構造を持たないとされている原核細胞の遺伝子であっても、転写可能な形で真核細胞に導入することによって、CAP構造を与えることができる。こうして転写されたRNAも、本発明における真核細胞に由来するRNAに含まれる。
これらの細胞からRNAを抽出し、本発明の方法に利用する。RNAの抽出方法は公知である。市販のRNA抽出用のキットを利用すると便利である。たとえばRNAeasy(QIAGEN)などの市販のキットを利用して、高純度のRNAを容易に得ることができる。RNAの抽出にあたり、細胞の破壊が必要な場合には、公知の方法によって破壊することができる。
本発明において、CAP構造に連結するRNAリンカーは、少なくともIIs型制限酵素の認識配列を含むオリゴヌクレオチドからなる。RNAリンカーとして用いるオリゴヌクレオチドは、DNAであってもRNAであっても良い。好ましいRNAリンカーはRNAである。RNAリンカーを構成する塩基配列は、IIs型制限酵素の認識配列を含む任意の塩基配列であってよい。ただしIIs型制限酵素の認識配列は、RNAリンカーの3'末端に配置することが望ましい。
IIs型制限酵素は、その認識配列を基準として一定の塩基数だけ離れた位置を切断する。本発明は、mRNAの5'末端をタグとして取得することを目的としている。したがって、mRNAの5'末端にできるだけ近くに認識配列を配置することが望ましい。RNAリンカーを構成するIIs型制限酵素の認識配列は、解析に用いるIIs型制限酵素に合わせてデザインすることができる。たとえばMmeIの認識配列は5'-TCCRAC-3'(R=G or A)であることは既に述べた。したがってRNAリンカーは、その3'末端に、この塩基配列を配置するのが望ましい。なおIIs型制限酵素の認識配列は、IIs型制限酵素がその3'側を切断するように配置する。
本発明のRNAリンカーとして有用な塩基配列を以下に示す。この塩基配列は、3'末端に配置されたIIs型制限酵素(MmeI)の認識配列(TCCRAC;大文字)に加え、II型制限酵素であるXhoIの認識配列(cucgag;アンダーライン)も含んでいる。
5’-oligo 1(配列番号:1):
5'-uuuggauuugcuggugcaguacaacuaggcuuaauacucgagUCCGAC-3'
5’-oligo 2(配列番号:2):
5'-uuucugcucgaauucaagcuucuaacgauguacgcucgagUCCGAC-3'
付加されたXhoIサイトは、タグの連結、そしてベクターへの組み込みに利用することができる。更に、RNAリンカーを構成する塩基配列は、タグの増幅のためのプライマーがアニールするための領域として利用することもできる。プライマーがアニールするためには、アニーリングのための領域が、少なくとも15塩基、通常20−50塩基、たとえば20−30塩基で構成されるのが好ましい。またその構成塩基は、プライマーの融解温度(Tm)が、通常60−80℃、たとえば65−75℃程度を有するようにデザインすることができる。プライマーがアニールするための塩基配列は任意である。したがって、たとえば、前記Tmを与えることができる任意の塩基配列を利用することができる。
プライマーがアニールするための塩基配列は任意である。更に、各種の制限酵素の認識配列を構成する領域と、プライマーをアニールさせるための領域は、RNAリンカーの中で重複させることもできる。ただし、2種類のRNAリンカーに対して異なるプライマーをアニールさせる場合には、重複しないようにデザインすることによって、アニーリングの特異性の向上が期待できる。
本発明において、RNAリンカーは、RNAのCAP構造に連結される。CAP構造にオリゴヌクレオチドを連結するための方法は任意である。たとえばオリゴキャップ法は、本発明におけるRNAリンカーの結合のための好ましい方法である。オリゴキャッピング法は、mRNAの5'側の塩基配列を保持したcDNAを合成するためにによって開発された方法である(Maruyama, K and Sugano, S.:Gene 138: 171-174, 1994)。オリゴキャッピング法においては、mRNAの3'末端poly(A)配列と、5'末端のCAP構造に連結されたRNAリンカーの塩基配列を利用して、全長cDNAの取得が実現されている。5'側の塩基配列が不完全なmRNAはCAP構造を保持していないので、RNAリンカーが連結されない。そのため、オリゴキャッピング法においては、全長cDNAを特異的に取得することができた。
以下にオリゴキャッピング法の反応原理を簡単に述べる。まずmRNAをバクテリアアルカリ性フォスファターゼ(BAP)で処理して、CAP構造を持たないRNAの5'末端のリン酸基を加水分解する。この過程でCAP構造を備えていないRNAは、5'末端のリン酸基を失う。すなわち、断片化したRNA、あるいはミトコンドリア由来のRNAなどの5'末端に突出しているリン酸基が除去される。次いでタバコ酸性ピロフォスファターゼ(TAP)を作用させる。TAPはCAP構造のトリリン酸結合を加水分解する。その結果、CAP構造を有するRNAに特異的に5'末端のリン酸基を与えることができる。
BAPおよびTAP処理したRNAには、RNAリンカーが連結される。RNAリンカーの結合は、たとえばT4 RNAリガーゼを利用することができる。T4 RNAリガーゼによるライゲーションは5'末端のリン酸基を要求する。したがって、TAPによって5'末端リン酸基を得たRNAに対して特異的にRNAリンカーが連結される。こうして、CAP構造特異的にRNAリンカーを結合することができる。なおRNAを取り扱う反応においては、全ての工程をRNaseを排除された環境で行うことが望ましい。
オリゴキャッピング法には、いくつかのバリエーションが報告されている。たとえばCAP結合蛋白質カラムを利用して、CAP構造を有するRNAを精製する方法が知られている(Edery, L. et al., Mol. Cell Biol. 15: 3363-3371, 1995)。この方法を利用すれば、CAP構造を有するRNAを固相上に捕捉することができる。固相を洗浄してCAP構造を有しないRNAを除去後にTAPで処理すれば、CAP構造を有しているRNAを回収することができる。こうして回収されたRNAは、5'末端にリン酸基を有するので、そのままRNAリンカーを連結することができる。すなわちCAP結合蛋白質を利用する方法は、BAP処理を必要としない。
次いで、RNAリンカーを連結したRNAを鋳型としてcDNAが合成される。cDNAを合成するための方法は任意である。以下に、cDNAを合成するための方法について、代表的な方法を記載する。
一般にcDNAの合成は、第1鎖の合成と、第2鎖の合成の二つのステップで構成される。第1鎖の合成は、RNAを鋳型として利用する逆転写反応である。これに対して第2鎖は、先に合成された第1鎖DNAを鋳型とする相補鎖合成反応によって合成される。それぞれ、反応を開始するプライマーによって特徴付けられるいくつかの反応が知られている。
本発明において、cDNAの第1鎖は、RNAの任意の領域にアニールするプライマーによって合成することができる。RNAを鋳型として逆転写酵素活性を利用してDNAを合成する方法は公知である。具体的にはMMLV由来の逆転写酵素(Reversetranscriptase;RT)やその変異体などを利用し、プライマーの伸長反応によって第1鎖を合成する方法が公知である。逆転写酵素の変異体としては、逆転写酵素が有するRNaseH活性を失わせた変異体 (Superscript II, Gibco BRL)などが市販されている。またTth DNAポリメラーゼのように、DNA合成酵素でありながら、RNAを鋳型とする相補鎖合成反応を触媒する酵素も知られている。このような酵素を利用すれば、第1鎖(RNA template)の第2鎖(DNA template)を単一の酵素で合成することもできる。続いてcDNAの合成のためのプライマーについて記載する。
先に述べたオリゴキャッピング法においては、通常、第1鎖の合成にはオリゴdTプライマーが利用される。cDNAの全長を合成するためには、第1鎖の3'末端から合成しなければならないため、mRNAの3'末端を占めるpoly(A)に相補的な塩基配列を有するオリゴdTプライマーが利用される。本発明においても同様に、オリゴdTプライマーを利用することによって、全長cDNAの5'末端をタグ配列として取得することができる。
これに対して本発明においては、RNAの全長は必ずしも必要ではない。本発明においては、タグはRNAの5'末端を含むわずかの領域から取得される。したがってRNAの5'末端を含む領域がcDNAとして合成できれば、本発明に必要なcDNAを得ることができる。したがって、たとえばRNAの任意の部分から相補鎖を開始できるランダムプライマーを利用して第1鎖を合成することができる。ランダムプライマーの利用によって、3'側の塩基配列が不完全な断片であっても、CAP構造を有するRNAであればタグを取得することができる。ランダムプライマーは、より幅広いRNAからタグを取得できる点で、特に遺伝子発現解析においては有用なプライマーである。
更に、第1鎖の合成にあたって、特定の遺伝子の塩基配列に相補的な塩基配列を有するプライマーを利用することによって、特定の遺伝子のタグを選択的に取得することもできる。たとえば、部分的な塩基配列のみが明らかにされ、5'側の塩基配列が不明な遺伝子について、本発明を利用して5'末端のタグ配列を取得することができる。そのためには、第1鎖の合成に当たって、明らかにされている塩基配列からプライマーとする塩基配列を選択する。このプライマーは、mRNAの明らかにされている領域から5'末端にかけての領域をcDNAの第1鎖として生成する。プライマーは特定の遺伝子の塩基配列から選択されているので、目的とする遺伝子以外のRNAからは第1鎖が生成されない。その結果、タグも生成されない。
特定の遺伝子を対象として、本発明の方法によって取得された遺伝子タグには、たとえば次のような有用性が期待できる。まず得られた遺伝子タグの塩基配列情報に基づいて、その遺伝子の転写開始点を明らかにすることができる。転写開始点は、全長cDNAの取得、あるいはプロモーターの探索において重要な情報である。たとえば5'側の塩基配列が明らかでないcDNAについて、本発明の方法を利用して、5'側のcDNAを取得することができる。あるいはすでに翻訳開始点が同定されている遺伝子であっても、その5'側の非翻訳領域(5'UTR)が完全なのかどうかを、遺伝子タグの情報によって評価することができる。
更に、同一のアミノ酸配列をコードしながら、転写開始点の異なる複数の転写産物を与える遺伝子が明らかにされている。ある遺伝子を対象に、さまざまなmRNAソースについて、本発明の遺伝子タグを取得すれば、当該遺伝子のあらゆる転写産物の転写開始点の情報を容易に集めることができる。もしも複数種類の遺伝子タグが得られれば、当該遺伝子には、転写開始点の異なる複数の転写産物が存在している可能性がある。すなわち本発明は、次の工程を含む転写開始点の異なる複数の転写産物の検出方法を提供する。
(1)本発明に基づいて遺伝子タグを取得する工程であって、cDNAの第1鎖の合成用のプライマーとして、解析すべき遺伝子に特異的なプライマーを用いる工程、
(2)(1)で得られた遺伝子タグの塩基配列を比較する工程、および
(3)複数種の遺伝子タグが検出されたときに転写開始点の異なる複数の転写産物が検出される工程
本発明において検出された複数種の遺伝子タグと、前記遺伝子特異的プライマーの情報を利用して、各転写産物の転写開始点の塩基配列を決定することができる。更に、本発明に基づいて、各転写産物の発現レベルを比較することもできる。すなわち本発明は、次の工程を含む転写開始点の異なる複数の転写産物の発現レベルを比較する方法を提供する。
(1)本発明に基づいて遺伝子タグを取得する工程であって、cDNAの第1鎖の合成用のプライマーとして、解析すべき遺伝子に特異的なプライマーを用いる工程、
(2)(1)で得られた遺伝子タグの塩基配列を比較する工程、および
(3)各遺伝子タグの出現頻度に基づいて、転写開始点の異なる複数の転写産物の発現レベルとして取得する工程
このほか、共通の塩基配列を有するRNAを意図的にcDNAとして合成することもできる。たとえば、保存性の高い蛋白質の機能ドメインを構成するアミノ酸配列に対して、それをコードすると予測される塩基配列をもとに第1鎖合成用のプライマーをデザインすることができる。このプライマーを用いて合成されるcDNAは、特定の機能ドメインをコードする遺伝子のcDNAである可能性が高い。その結果、特定の機能ドメインを含む遺伝子のタグを意図的に集めることができる。こうして取得された遺伝子タグの発現レベルを比較することによって、特定の機能を有する遺伝子群の発現レベルを比較することができる。
いずれにせよ、本発明において合成されるcDNAの第1鎖は、その3'末端に、RNAリンカーに相補的な塩基配列を有している。したがって、この領域にアニールすることができるオリゴヌクレオチドを利用すれば、容易にcDNAの第2鎖を合成することができる。第2鎖の合成に先立って、第1鎖の鋳型としたRNAは、アルカリ加水分解によって除去することができる。本発明においては、第2鎖は、少なくとも、RNAリンカーに含まれるIIs型の制限酵素の認識配列を含むように合成されるべきである。そのためには、たとえば、RNAリンカーの3'末端に配置されたIIs型制限酵素の認識配列に相当する領域よりも、3'側において相補鎖合成を開始することができるプライマーを利用することができる。あるいは、IIs型制限酵素の認識配列を含むプライマーを利用することもできる。
DNAを鋳型としてプライマー伸長反応によって相補鎖を合成する方法は公知である。すなわち、鋳型依存性のDNAポリメラーゼを利用して、相補鎖を合成する方法が知られている。DNAポリメラーゼとしては、T4 DNAポリメラーゼ、あるいはTaqポリメラーゼなどを用いることができる。
cDNAの合成に用いるプライマーは、任意の塩基配列を含むことができる。たとえばその5'末端側に、制限酵素の認識配列を付加したプライマーを利用することができる。プライマーの5'末端に、クローニングサイトを付与するための塩基配列を付加することは、広く行われている。
本発明において、cDNAの第2鎖は、固相に結合することができる標識を有するか、または固相に固定化されたプライマーによって合成することができる。プライマーを固相に結合することで、cDNAの第2鎖を固相に捕捉することができる。固相に捕捉されたcDNAは容易に回収することができる。
プライマーとして用いるオリゴヌクレオチドを固相に結合するための方法は任意である。たとえば、クロスリンカーを使ってオリゴヌクレオチドの5'末端をプレートに共有結合させる方法等が公知である(米国特許5656462)。あるいは、オリゴヌクレオチドを構成する塩基にビオチンのような結合親和性を持つ分子を導入することができる。ビオチンを、固相化したアビジンに結合させることによって、オリゴヌクレオチドは間接的に固相に捕捉される。オリゴヌクレオチドにおける、結合親和性分子の導入位置は制限されない。
第2鎖の合成によって2本鎖となったcDNAはIIs型制限酵素で処理され、本発明における遺伝子タグが生成される。この段階で遺伝子タグは、RNAリンカーとして付加した塩基配列に連結された状態で回収することができる。遺伝子タグの回収のために、第2鎖合成用のプライマーが結合する固相が利用される。すなわち、遺伝子タグを結合した固相として回収される。固相は、IIs型制限酵素を作用させる後、あるいは前に回収することができる。
さて、本発明における遺伝子タグの塩基配列を決定することによって、RNAの5'末端の塩基配列情報を得ることができる。遺伝子タグの塩基配列を決定する方法は任意である。しかし大量の遺伝子タグの塩基配列を効率的に決定するためには、SAGEの原理が有用である。すなわち、複数の遺伝子タグを連結させてコンカテマーとし、コンカテマーをクローニングして、複数のタグの塩基配列を一挙に決定することができる。
各遺伝子タグの長さは、タグの生成に用いたIIs型制限酵素の作用によって一定であると見なされる。したがって、コンカテマーは、一定の長さの遺伝子タグの塩基配列の繰り返しで構成されていると考えられる。そのため、コンカテマーの塩基配列から、各タグの塩基配列情報を得ることができる。
タグを連結してコンカテマーを得るための方法として、いくつかのバリエーションを示すことができる。以下のその例を述べる。まず広く知られているSAGEの原理を応用した方法について説明する。この方法においては、まず2つの遺伝子タグを向かい合わせに連結させてダイタグ(di-tag)を得る。このとき、もしもIIs型制限酵素による切断部分が粘着末端(sticky end)であるときは、予め平滑化しておく。平滑末端を形成するためには、T4 DNAポリメラーゼを作用させればよい。
次に、複数のダイタグを連結してコンカテマーを生成する。ダイタグを得るためには、同じcDNAライブラリーを2つのプールにわけて、それぞれのプールに対して同じ操作で遺伝子タグを生成する。次に、2つのプール由来の遺伝子タグ同士を互いに連結してダイタグとする。このとき、遺伝子タグは、IIs型制限酵素で切断された切断部分で連結される。遺伝子タグは、T4DNAライガーゼなどによって酵素的に連結することができる。
ここで得られるダイタグは、以下の構造を有する。
PCR→
(固相)−[RNAリンカー]-[タグ]-[タグ]-[RNAリンカー]−(固相)
←PCR
この段階で、ダイタグは、PCRなどの増幅方法によって増幅することができる。2つのプールの間でRNAリンカーの塩基配列が相違するようにしておけば、プールの異なるタグ間で連結されたダイタグが特異的に増幅されるので、タグ間の数的なバランスの崩れを防ぐことができる。本発明において、ダイタグの増幅は任意である。
続いて複数のダイタグを連結してコンカテマーを得る。そのためには、たとえば予めRNAリンカー内に制限酵素の認識配列を配置してくことができる。ダイタグを制限酵素で消化後に、制限酵素の切断部位をライゲーションすれば、複数のダイタグを連結することができる。こうして得られるコンカテマーの構造は、次のように示すことができる。
..../[Tag][Tag]/[Tag][Tag]/[Tag][Tag]/[Tag][Tag]/....
すなわち、2つのタグを連結したダイタグ"[Tag][Tag]"を1単位として、制限酵素(アンカーリング酵素)による切断部位"/"を挟んでダイタグが連続した構造である。
更に、クローニング用ベクターの同じ制限酵素サイトに、コンカテマーをインサートすることができる。こうしてコンカテマーをインサートとして有するクローニングベクターを得ることができる。クローニングベクターのインサートの塩基配列を決定することによって、その中に含まれるタグの塩基配列が明らかになる。なおコンカテマーの長さは、1度のシーケンス反応で塩基配列を決定できる程度の長さであることが好ましい。たとえば、500bp以下、たとえば20〜400bp、通常50〜300bpの範囲のコンカテマーを例示することができる。
ダイタグではなく、タグ単位で連結したコンカテマーを得ることもできる。たとえば、IIs型制限酵素を作用させた後に、その切断部位にアダプターを結合することができる。このとき、タグは以下のような構造を有する。
PCR→
(固相)−[RNAリンカー]-[タグ]-[アダプター]
←PCR
アダプターに制限酵素認識配列を配置しておけば、ダイタグのRNAリンカーを消化するのと同様にして、タグの両端を制限酵素で切断することができる。もしもタグを増幅する場合には、RNAリンカーとアダプターの塩基配列を利用してPCRによって増幅することもできる。いずれにしても、制限酵素で処理したタグを連結してコンカテマーとすることができる。コンカテマーは、更にクローニングベクターに組み込み、その塩基配列を明らかにすることができる。
IIs型制限酵素によって切り出されるタグの長さは、ほぼ一定とされている。しかし、万が一、その長さにばらつきがあると、ダイタグを構成したときに、正しいタグの塩基配列を同定することができない場合がある。ダイタグを経由しないでコンカテマーを構成すれば、万が一タグの長さが不均一であっても、タグの塩基配列を正確に決定することができる。
本発明の遺伝子タグの取得方法、更に取得されたタグの塩基配列の決定方法に必要な各種の試薬類は、予め組み合わせてキットとして供給することができる。すなわち本発明は、以下の要素を含む、遺伝子タグの製造用試薬キットに関する。
(a)IIs型制限酵素の認識配列を含むオリゴヌクレオチドからなるRNAリンカー
(b)RNAリンカーをRNAのCAP部位に連結するための試薬
(c)RNAリンカーを鋳型として合成されたcDNAにアニールするオリゴヌクレオチドからなるcDNA第2鎖合成用のプライマー
(d)cDNA第1鎖合成用プライマー
本発明のキットは、ダイタグやコンカテマーの調製に必要な試薬類を付加的に含むことができる。なお、これらの構成要素の具体的な構成は既に述べたとおりである。
本発明のキットにおいて、(d)cDNA第1鎖合成用プライマーとしては、たとえば以下のi)-iii)のいずれかに記載のプライマーを利用することができる。
i)ランダムプライマー、
ii)オリゴdTプライマー、および
iii)特定のmRNAに相補的な塩基配列を含むプライマー
試料に含まれる全てのmRNAを対象として遺伝子タグを製造する場合には、ランダムプライマー、あるいはオリゴdTプライマーが利用される。特にランダムプライマーは本発明における望ましいプライマーである。ランダムプライマーとは数十塩基の長さを有する不特定の塩基配列からなるオリゴヌクレオチドの集合体である。たとえば5〜20、通常8〜15塩基程度の長さのオリゴヌクレオチドが利用される。4種類の塩基の混合物を必要な長さに順次連結することにより、合成される。ランダムプライマーは、理論的には、あらゆる塩基配列に対して相補的な塩基配列を含んでいると考えることができる。
あるいは、特定のmRNAに相補的な塩基配列を含むプライマーによって本発明のキットを構成することもできる。特定のmRNAに特異的なプライマーを利用することによって、ある遺伝子の5'タグを特異的に製造することができる。こうして得られるタグの塩基配列情報を比較して、もしもその塩基配列にバリエーションが検出された場合には、当該遺伝子の転写産物には、5'末端の長さの異なる複数のバリアントが存在することが明らかにされる。したがって、特定のmRNAに相補的な塩基配列含むプライマーによって構成される本発明のキットは、特定の遺伝子の転写産物のバリアントを検出するためのキットとして有用である。
たとえば、以下のような要素によって、本発明の方法を実施するためのキットを構成することができる。各要素には、それぞれの要素を用いた反応に好適な緩衝液を添付することもできる。更に、本発明のキットには、遺伝子タグの塩基配列の解析のためのソフトウエアを組み合わせることもできる。
RNAリンカーを連結するための要素:
・BAP
・TAP
・T4 RNAリガーゼ
・RNAリンカー
cDNAの合成と分離のための要素:
・逆転写酵素
・DNAポリメラーゼ
・dXTP
・cDNA第1鎖合成用ランダムプライマー
・cDNA第2鎖合成用5'ビオチン化cDNA合成用プライマー
・アビジン結合磁気ビーズ
遺伝子タグを生成するための要素:
・IIs型制限酵素
ダイタグの生成と解析のための要素:
・T4 DNA リガーゼ
・遺伝子タグ増幅用プライマー
・DNAポリメラーゼ
・II型制限酵素
・シーケンシング用ベクター
・ベクターを形質転換するための宿主
・宿主を培養するための培地
本発明によって生成されるコンカテマーの塩基配列情報の解析には、コンピューターソフトウエアを利用するのが有利である。たとえば以下のステップを実行することができるソフトウエアを、コンカテマーの塩基配列情報の解析に利用することができる。
シーケンサーの解析データを読み込むステップ
読み込まれた塩基配列データのタグ以外の塩基配列情報を識別するステップ
タグの塩基配列情報を蓄積するステップ
ここで、タグ以外の塩基配列情報としては、タグの形成過程で連結されたRNAリンカーやアダプターなどの塩基配列情報を示すことができる。あるいは、クローニングベクターに由来する塩基配列が読み取られる場合もあるかもしれない。いずれにせよ、これらの塩基配列情報は予め明らかな情報である。更に、これらの付加的な塩基配列情報とタグの塩基配列情報は規則的にコンカテマー上に配置されている。したがって、これらの塩基配列とタグの塩基配列とは、機械的に識別することができる。
次にタグの塩基配列と認識された塩基配列情報が蓄積される。ダイタグを形成した場合には、アンチセンス鎖の塩基配列が読み取られる場合もあるので、相補配列の情報も合わせて記録する。アダプターを使ってダイタグを経由しないでコンカテマーを作成する場合には、アダプターとRNAリンカーのクローニングサイトを異なる配列となるようにデザインすれば、単一方向にクローニングすることができる。この場合には、相補配列の蓄積が必要でない。
このプログラムには更に付加的な機能を持たせることができる。たとえば、得られたタグの塩基配列を比較し、同じ塩基配列を1つにまとめて、その出現頻度を記録するステップを実行させることができる。更に、異なるRNAソースのタグ情報を比較して、出現頻度の異なるタグを抽出するステップを実行させることもできる。
タグ情報の比較対象としては、予め集積されたデータベースの情報を利用することもできる。たとえば、標準的な組織や細胞株について、予め本発明の方法に基づいて遺伝子タグの情報を集積しておく。この情報を、コンピューターネットワーク上で共有することができる。あるいは、前記試薬キットに添付して商業的に流通させることもできる。こうして入手された遺伝子タグ情報と、自身が実験して取得した遺伝子タグ情報を比較することもできる。
本発明によって、転写産物であるmRNAの5'末端の塩基配列情報を得ることができる。5'末端の塩基配列情報は、遺伝子解析において、特に重要な意味を有する。たとえば、本発明によって得ることができる5'末端の塩基配列情報を、以下のような用途に利用することができる。
まず本発明は、遺伝子の発現プロファイルの取得に利用することができる。すなわち本発明は、次の工程を含む、真核細胞における遺伝子の発現プロファイルの取得方法に関する。
(1)本発明に基づいて遺伝子タグを製造する工程、
(2)(1)の遺伝子タグの塩基配列を決定する工程、および
(3)決定された塩基配列とその出現頻度を対応付けることによって発現プロファイルを得る工程
本発明において、(1)遺伝子タグを製造する工程は、以下の工程を含むことができる。特に断らない場合には、以降の記載においても同様に、「本発明に基づいて遺伝子タグを製造する工程」とは、以下の工程を含む。
(A) RNAのCAP部位にIIs型制限酵素の認識配列を含むRNAリンカーを連結する工程、
(B)(A)のRNAを鋳型としてcDNAを合成する工程、
(C)(B)のcDNAにRNAリンカーに含まれる認識配列を認識するIIs型制限酵素を作用させ、遺伝子タグを生成する工程
一般に、発現プロファイルとは、発現情報を伴った遺伝子情報のリストを指す。発現情報とは、発現のレベルを示す量的なパラメーターである。遺伝子情報とは、通常、遺伝子を特定するための情報を言う。具体的には、遺伝子の塩基配列、遺伝子の名称、遺伝子のID番号などが遺伝子情報を構成する。リストを構成する遺伝子の数は、任意である。またその対象も、限定されない。解析の目的に応じて、必要な遺伝子の情報を集積して発現プロファイルが構成される。
本発明によれば、CAP構造を有するRNAから、その5'末端の塩基配列情報をタグ情報として取得することができる。またその塩基配列情報を照合し、同じ塩基配列の数をカウントすることによって、塩基配列情報とその出現頻度とが対応付けられる。こうして発現プロファイルを得ることができる。
RNAとして全てのRNAを対象とすれば、全遺伝子を対象とする発現プロファイルを得ることができる。本発明においては、特定の遺伝子、あるいは構造的な共通性を有する一群の遺伝子を対象に、遺伝子タグを生成することもできる。このようなケースでは、特定の遺伝子、あるいは一群の遺伝子の発現プロファイルが生成される。
CAP構造を有するmRNAとは、細胞中で発現しているmRNAの全てであると仮定すると、本発明によって得ることができる発現プロファイルは、細胞内の遺伝子の発現状況をより正確に反映していると言うことができる。本発明において、塩基配列の出現頻度をカウントするとき、解析対象となる塩基配列情報の総数に占めるある配列の出現頻度の相対的な数を蓄積するのが好ましい。特にPCRなどで増幅された後の出現頻度情報は、定量的な意味は小さい。総数に対する比として比較すれば、より客観的な評価を期待できる。
本発明によって得られた発現プロファイルは、データベースとすることができる。データベースとは、発現プロファイルを構成する情報を機械可読式のデータとして蓄積した電子データを言う。本発明のデータベースは、少なくとも、タグの塩基配列情報と、それに関連付けられた出現頻度情報を含む。更に本発明のデータベースは、各塩基配列情報のID番号、塩基配列情報が得られたRNAの由来を合わせて記録することができる。更に、既知の遺伝子の塩基配列情報との関係、ゲノム上へのマッピングの結果などの情報を付加することもできる。
本発明の発現プロファイルのデータベースは、電子媒体に保存することができる。電子媒体としては、各種のディスク装置、テープ媒体、あるいはフラッシュメモリーなどを示すことができる。これらの電子媒体は、ネットワーク上で共有することができる。たとえば、インターネット上で本発明のデータベースを共有することができる。更に、前記タグ配列の解析のためのソフトウエアに、インターネットを介して、本発明のデータベースの情報を参照するための機能を追加することもできる。あるいは逆に、本発明に基づいて生成された新たな発現プロファイル情報を、インターネットを介して、データベースに追加することもできる。
本発明の発現プロファイルを利用して、発現プロファイル解析を実施することができる。すなわち本発明は、本発明に基づいて異なる種類の細胞の遺伝子発現プロファイルを取得し、遺伝子発現プロファイルを比較して細胞間で発現頻度の異なる遺伝子タグを選択する工程を含む、遺伝子発現プロファイルの解析方法に関する。異なる細胞間で発現レベルの異なる遺伝子を取得する解析方法は、発現プロファイル解析と呼ばれている。このような解析によって、たとえば、疾患などに関連する遺伝子が数多く取得されてきた。本発明の発現プロファイルも、このような発現プロファイル解析に利用することができる。
本発明の発現プロファイル解析において、解析の対象とする異なる細胞とは、その由来が異なるあらゆる細胞を言う。同じ組織に由来する細胞であっても、疾患の有無、人種、年齢、性別などのなんらかの条件の相違がある場合には、由来が異なる細胞である。解析の目的の応じて、考慮すべき条件が相違すれば、由来が異なる細胞である。一方、解析の目的に対して無視しうる条件の相違しか見出せない場合には、同一の細胞と見なされる。たとえば、異なる臓器、異なる組織、あるいは由来や培養条件などが異なる細胞の間で発現プロファイルを比較することによって、臓器、組織、あるいは細胞間において、発現レベルの高い(または低い)遺伝子を選択することができる。本発明を応用することができる、解析対象の組み合わせを以下に例示する。
異なる組織
成人の組織と胎児の組織
患者の組織と健常者の組織
男性の組織と女性の組織
人種の異なるヒトの組織
生育環境の異なる同じ生物種の組織
異なる細胞
同じ細胞で培養条件の異なる細胞
同じ培養条件で培養時間の異なる細胞
特定の処理を与えた細胞と与えない細胞
より具体的には、癌組織と、正常な組織の間で発現プロファイルを比較することによって、癌に特徴的な遺伝子タグを取得することができる。あるいは、特に悪性度の高い癌と、低い癌との比較によって、悪性度に関連する遺伝子タグを特定することができる。
本発明によって得られる遺伝子タグは、mRNAの5'末端の塩基配列情報を含んでいる。したがって、同じ蛋白質をコードする遺伝子であって、5'UTRの構造が異なるバリアントを、異なる転写産物として発現プロファイルに反映させることができる。この特徴は、公知のSAGEによって得ることができるタグと比較して、本発明のタグが有している大きなメリットの一つである。また本発明の遺伝子タグは、タグの塩基配列情報そのものが全長cDNAの5'側のプライマーの塩基配列情報として有用である。したがって、発現プロファイル解析によってピックアップしたタグの塩基配列情報に基づいてデザインしたプライマーと、オリゴdTプライマーを利用すれば、直ちに全長cDNAを合成することができる。あるいは、mRNAの任意の領域に相補的な塩基配列を有するプライマーを組み合わせれば、mRNAの5'側の塩基配列を含むcDNAを取得することができる。このことも本発明の大きな特徴である。
本発明によって得ることができる遺伝子タグは転写産物であるmRNAの5'末端の塩基配列を含んでいる。したがって、この塩基配列をゲノムの塩基配列上にマッピングすることによって、遺伝子の転写開始点を同定することができる。すなわち本発明は、次の工程を含む、遺伝子の転写開始点の決定方法に関する。
(1)本発明の方法に基づいて遺伝子タグを製造する工程、
(2)(1)の遺伝子タグの塩基配列を決定する工程、および
(3)決定された塩基配列をゲノムの塩基配列上にマッピングし、塩基配列が一致した領域を当該遺伝子の転写開始点として同定する工程
2003年4月、ヒトゲノムシークエンス国際コンソーシアムは、ヒトゲノムの解読完了を発表した。この結果、全ゲノムの 99%(28億3000万塩基対)を99.99%の精度でカバーするヒトゲノム精密配列を手にすることができた。一方、本発明は細胞内で転写されているあらゆるmRNAの5'末端をタグとして生成する。したがって、原理的には、ある細胞において転写されている遺伝子の、ほぼ全ての転写開始点をゲノム上にマッピングすることができる。ゲノム上にマッピングされた転写開始点は、転写調節領域の取得において重要な情報である。
たとえば、転写開始点の上流の1〜2kbの範囲をクローニングし、転写調節因子のスクリーニングに利用することができる。あるいは、この領域の塩基配列を解析することによって、転写調節領域を予測することもできる。より具体的には、既知の転写因子の認識配列が保存されている領域を探索することによって、転写因子の結合領域の予測が可能である。
また転写開始点のマッピングは、遺伝子そのもののマッピングに他ならない。つまり、本発明におけるタグの塩基配列情報のマッピングの結果に基づいて、遺伝子のゲノム上における物理的な位置関係を把握することができる。現状では、遺伝子の転写開始点は、質の高い全長cDNAの塩基配列情報に頼らなければマッピングすることはできなかった。ところが本発明によって得ることができるタグ情報を利用すれば、容易に転写開始点をマッピングすることができる。このように、本発明によって得ることができるタグ情報は、全長cDNAの成果に匹敵する価値を有していると言うことができる。
加えて本発明によって得ることができる遺伝子タグの塩基配列情報は、cDNAの全長率の評価に利用することができる。ゲノムの塩基配列が明らかにされる一方で、細胞の働きを蛋白質レベルで明らかにするための様々な試みが続けられている。そのための手法の一つとして、全長cDNAの網羅的な解析がある。全長cDNAの網羅的な解析においては、ある細胞で発現している遺伝子の全長が網羅的に取得され、その構造が決定される。このときに、取得されたcDNAの全長性が高いことが重要な条件となる。
まず第1に、少なくともORFを特定するために、mRNAの5'側の塩基配列が明らかにされている必要がある。更に、転写開始点を同定するためには、5'末端まで取得されていることが重要である。これらの条件を満たしていることを確認するために、しばしば得られたcDNAの全長性が評価される。cDNAの全長性とは、mRNAの5'末端の塩基配列を含むcDNAが、取得されたcDNA全体のどの程度を占めているかを表すパラメーターである。
本発明の遺伝子タグは、mRNAの5'末端の塩基配列情報を提供する。したがって、網羅的に取得されたcDNAの塩基配列と、同じライブラリーから得られた本発明の遺伝子タグの塩基配列を照合することによって、各cDNAの5'末端がmRNAの5'末端の塩基い配列を含むかどうかを明らかにすることができる。もしも遺伝子タグの塩基配列の多くが、cDNAの塩基配列上にマッピングできる場合には、取得されたcDNAの多くが全長である可能性が高い。逆に、遺伝子タグと一致する塩基配列が取得されたcDNA中に見出せない場合には、cDNAの全長性は低いと予測される。
本発明における遺伝子タグの塩基配列情報は、mRNAの5'末端の塩基配列を含むcDNAの取得に利用することができる。すなわち本発明は、次の工程によって決定された塩基配列またはその相補配列を含むcDNAを合成するための5'側のプライマーと、cDNAの任意の部位にアニールする3'側のプライマーを含む、cDNA合成用プライマーセットに関する。
(1)本発明に基づいて遺伝子タグを製造する工程、および
(2)(1)の遺伝子タグの塩基配列を決定する工程
本発明のプライマーセットを構成する5'側プライマーの塩基配列は、タグとして取得された塩基配列、またはその相補配列を含む。タグは、mRNAのセンス配列、あるいはアンチセンス配列として得られる。したがって、その相補配列あるいは、タグの塩基配列そのものが、cDNA合成用の5'側のプライマーの塩基配列として利用される。5'側のプライマーが5'末端において相補鎖合成を開始することから、本発明のプライマーセットによって合成されるcDNAが常に5'末端の塩基配列を含む。なおタグ配列はDNAから得られるので、塩基tを含む。これに対してRNAの5'末端配列は、tに相当する塩基がuであることは言うまでもない。
一方本発明のプライマーセットを構成する3'側のプライマーには、cDNAにアニールすることができる任意のプライマーを利用することができる。3'側のプライマーの選択によって、様々なcDNAを合成することができる。本発明プライマーセットに利用することができる3'側のプライマーとしてたとえば次のようなプライマーを示すことができる。
i)オリゴdTプライマー
ii)cDNAの断片配列情報、および
iii)cDNAのII型制限酵素認識に隣接する遺伝子タグの塩基配列またはその相補配列からなるプライマー
まずオリゴdTプライマーとの組み合わせは、全長cDNAの合成に有用である。次に、cDNAの断片配列情報に基づいてデザインされた3'側プライマーは、当該cDNAの5'側の領域を取得するためのプライマーとして利用される。このような目的のためには、できるだけ当該cDNAの5'側の塩基配列に基づいて、3'側プライマーをデザインすればよい。cDNAの断片情報にはESTが含まれる。また様々な遺伝子解析によって、cDNAの断片情報が取得される。そして、しばしば断片情報に基づいて全長の塩基配列を決定することが試みられる。たとえば、DNAアレイのプローブとして使われているESTの5'側の塩基配列の取得が必要なとき、本発明のプライマーセットを利用して、目的とする領域を合成することができる。あるいは、PCRクローニングなどによって取得されたcDNAの断片から、その全長の取得を試みる場合もある。本発明において、cDNAの断片配列情報とは、特定のmRNAに相補的な塩基配列を含むプライマーと定義することができる。
更に、cDNAのII型制限酵素認識に隣接する遺伝子タグの塩基配列またはその相補配列からなるプライマーを3'側プライマーとして利用することもできる。現在実用化されているSAGEは、cDNA中に含まれる特定の制限酵素サイトに隣接する領域を遺伝子タグとして生成する。このタグの塩基配列情報に基づいて、遺伝子発現プロファイルを解析することができる。同じ解析対象について、既知の解析方法に基づいて選択された遺伝子タグの塩基配列情報を3'側のプライマーとして利用すれば、着目する遺伝子のかなりの部分を含むcDNAを合成できる可能性がある。
これらのプライマーセットのうち、オリゴdTプライマーとの組み合わせは、全長cDNAを合成するためのプライマーセットとして特に好ましい。全長cDNAは、転写開始点のマッピングに有用である。また5'UTRの構造が異なる転写産物の同定のためには、少なくとも5'末端を含む領域の塩基配列の決定が必須である。更に、全長cDNAは、通常は取得が難しいとされている。こうした背景から、本発明に基づいて得られた遺伝子タグ情報を利用して、全長cDNAを合成することは、特に有用性が大きい。すなわち本発明は、次の工程を含む、全長cDNAの合成方法に関する。
a)次の工程によって決定された塩基配列またはその相補配列を含むcDNAを合成するための5'側のプライマーと、オリゴdTプライマーからなる3'側のプライマーを用い、RNAあるいはcDNAを鋳型として相補鎖合成反応を行う工程、および
(1)本発明の方法に基づいて遺伝子タグを製造する工程、および
(2)(1)の遺伝子タグの塩基配列を決定する工程
b)合成されたDNAを全長cDNAとして回収する工程
目的とするmRNAを含む可能性の高い細胞から取得されたRNAを鋳型として、前記の本発明のプライマーセットを用いてcDNAが合成される。あるいは当該細胞から得られたcDNAライブラリーを鋳型として利用することもできる。当業者は、与えられたプライマーの塩基配列情報に基づいて、cDNAを合成することができる。具体的には、RT-PCRなどの公知の方法を利用して、RNAから目的とするcDNAを合成することができる。RNAはmRNAを用いるのが好ましい。あるいはcDNAライブラリーを鋳型とするときは、PCRによって目的とするcDNAを合成することができる。cDNAライブラリーには市販のライブラリーを用いることもできる。
本発明は、こうして合成された全長cDNAに関する。本発明において、全長cDNAとは、mRNAのCAP構造を有する部分の塩基配列情報と、poly(A)を含むcDNAを言う。本発明はまた、本発明に基づいて合成された全長cDNAによってコードされるポリペプチドに関する。全長cDNAの塩基配列を解析し、ORFを同定することができる。同定されたORFに基づいて、コード領域を発現ベクターに導入することができる。本発明は、このようにして得ることができる発現ベクターを含む。当該発現ベクターを適当な発現系に導入して、cDNAによってコードされるポリペプチドを組み換え体として発現させ、更に回収することができる。
また本発明の全長cDNAのコード領域がコードするポリペプチドは、生体外翻訳(in vitro translation)によって組み換え体として発現させ、回収することができる。生体外翻訳の方法は公知である。生体外翻訳は無細胞タンパク質翻訳とも呼ばれている。すなわち、目的とするアミノ酸配列をコードするDNAをプロモーターに機能的に連結したコンストラクトを、生体外翻訳を支持する要素と接触させることにより、アミノ酸配列に翻訳することができる。コンストラクトには、ターミネーターなどの転写調節領域を配置することもできる。生体外翻訳を支持する要素は、RNAポリメラーゼ、リボヌクレオチド基質、アミノ酸、リボソーム、およびtRNAなどを含む混合物である。これらのタンパク質翻訳に必要な成分が存在すれば、細胞機能を利用することなく、DNAをタンパク質に翻訳することができる。RNAポリメラーゼは、前記プロモーターを認識してその制御下のDNAを鋳型としてmRNAに転写する。転写にはリボヌクレオチド基質ATP、GTP、CTP、およびUTPが用いられる。転写されたmRNAはリボソームにおいてポリペプチドに翻訳される。
生体外翻訳を支持する要素として、市販のin vitro translation用のキットを用いることができる。ウサギ網状赤血球のライセート(Rabbit Reticulocyte Lysate ;RRL)、小麦胚芽抽出物(Wheat Germ Extract ;WGE)、あるいは大腸菌のライセートなどを利用した無細胞タンパク質翻訳のためのキットが市販されている。あるいは転写、翻訳およびエネルギー再生に必要な約 30 の酵素類をそれぞれ高純度で 精製後、再構成したin vitro 転写・翻訳システムも実現され(Shimizu et al. (2001) Nature Biotechnology. vol.19, p.751-755) 、キットとして商業的に供給されている。
加えて本発明は、当該ポリペプチドを認識する抗体に関する。抗体は、たとえば前記組み換え体、あるいは翻訳アミノ酸配列から選択されたアミノ酸配列からなるドメインペプチドで免疫動物を免疫することによって得ることができる。免疫動物からはポリクローナル抗体を回収することができる。更に、免疫動物の抗体産生細胞をクローニングして、モノクローナル抗体を得ることができる。抗体産生細胞をミエローマのような細胞株と融合させて、ハイブリドーマとし、目的とする反応性を有する抗体を産生するクローンをスクリーニングするための方法が公知である。
以下に、実施例に基づいて、本発明を更に具体的に説明する。
本発明に基づいて、mRNAの5'末端の塩基配列を含む遺伝子タグを取得できることを以下の実験によって確認した。以下の操作の概略を図1に示した。
オリゴキャップ法
オリゴキャップ法は、Maruyama および Sugano (1994)の方法を改変して行った(Maruyama, K., Sugano, S., 1994. Oligo-capping: a simple method to replace the cap structure of eucaryotic mRNAs with oligoribo-nucleotides. Gene 138, 171-174.)。5-10μgのポリ(A)+ RNAを、100ユニットのRNasin (Promega) を添加した総液量100μlの100 mM Tris-HCl(pH 8.0)および5 mM 2-メルカプトエタノール混合液中で、1.2ユニットのバクテリア由来アルカリフォスファターゼ(BAP;TaKaRa)により37℃、40分間処理した。フェノール:クロロフォルム(1:1)抽出処理を2回行い、エタノール沈殿処理した。得られた該ポリ(A)+ RNAを100ユニットのRNasinを添加した総液量100μlの50 mM 酢酸ナトリウム(pH 5.5)、1 mM EDTA、5 mM 2-メルカプトエタノール混合液中で、20ユニットのタバコ酸性ピロホスファターゼ(TAP) により37℃、45分間処理した。
フェノール:クロロホルム抽出処理およびエタノール沈澱処理の後、2-4 μgのBAP- TAP処理ポリ(A)+ RNAを2つのプールに分けて、各プールをRNAリンカー(5'-oligo 1および5'-oligo 2)とそれぞれライゲーションさせた。5'-oligo 1および5'-oligo 2は、それぞれ次の塩基配列を有するRNAである。いずれのRNAリンカーも、XhoIおよびMmeI認識配列を含む。
5'-oligo 1/配列番号:1
5'-UUU GGA UUU GCU GGU GCA GUA CAA CUA GGC UUA AUA CUC GAG UCC GAC -3'
5'-oligo 2/配列番号:2
5'-UUU CUG CUC GAA UUC AAG CUU CUA ACG AUG UAC GCU CGA GUC CGA C -3'
250 ユニット RNA ligase (TaKaRa)、および100ユニット Rnasinを、下記組成の反応混合液で総液量100μLとし、20℃、3-16時間反応させ、RNAリンカーをライゲーションした。
50 mM Tris-HCl (pH 7.5)
5 mM MgCl2
5 mM 2-メルカプトエタノール
0.5 mM ATP
25% PEG8000
cDNA合成
cDNAの合成にあたり、完全長cDNA富化ライブラリーと5'末端cDNA富化ライブラリーの2種類のライブラリーを合成した。完全長cDNA富化ライブラリーは、オリゴdTアダプタープライマーを使ってpoly(A)+mRNAを鋳型として合成されたcDNAからなる、完全長cDNAに富むライブラリーである。一方、5'末端cDNA富化ライブラリーは、cDNAの合成にランダムアダプタープライマーを使って合成されたcDNAからなっている。ランダムアダプタープライマーの使用によって、poly(A)を伴わない断片からも、cDNAが合成されている。これら2種類のcDNAのそれぞれについて、遺伝子タグの取得を試みた。
ライゲーションされなかったRNAリンカーを取り除いた後、RNaseH フリーの逆転写酵素(Superscript II, Gibco BRL)によりcDNAを合成した。完全長cDNA富化ライブラリーを得るために、10 pmolのdTアダプタープライマー(配列番号:3)を、2-4μgのオリゴキャップポリ(A)+ RNAを含む50 μlに加えてcDNAを合成した。
dTアダプタープライマー(配列番号:3)
5'-GCG GCT GAA GAC GGC CTA TGT GGC CTT TTT TTT TTT TTT TTT-3'
反応条件はメーカー推奨の方法に従った(42℃、1時間インキュベート)。
更に5'末端cDNA富化ライブラリーを得るために、10 pmolのランダムアダプタープライマー(配列番号:4)を用いて12℃、1時間のインキュベーションを行い、更に42℃、1時間インキュベーションを行った。
ランダムアダプタープライマー(配列番号:4)
5'-GCG GCT GAA GAC GGC CTA TGT GGC CNN NNN NC-3'
cDNAの増幅
第1鎖cDNAを合成した後、RNAを15 mM NaOHで65℃、1時間処理することにより分解した。1μgのオリゴキャップポリ(A)+ RNAを鋳型として合成されたcDNAを、100 μl中に16 pmolの5'PCRプライマーおよび3'PCRプライマー (5'-GCG GCT GAA GAC GGC CTA TGT-3'/配列番号:7)を含むXL PCRキット(Perkin-Elmer)を用いて増幅した。5'PCRプライマーは、RNAリンカーとして5'oligo-1をライゲーションしたプールについては配列番号:5の、また5'oligo-2のプールには配列番号:6のプライマーをそれぞれ用いた。
5'oligo 1用5'PCRプライマー/配列番号:5
5'ビオチン- GGA TTT GCT GGT GCA GTA CAA CTA GGC TTA ATA-3'
5'oligo 2用5'PCRプライマー/配列番号:6
5'ビオチン- CTG CTC GAA TTC AAG CTT CTA ACG ATG TAC G-3'
3'PCRプライマー(配列番号:7)
5'-GCG GCT GAA GAC GGC CTA TGT-3'
第1鎖の合成にdT-アダプタープライマーをプライマーとして用いた場合、94℃ 1分間、58℃ 1分間および72℃ 10分間のサイクルを5〜10回繰り返してcDNAの増幅を行った。また第1鎖の合成にランダムアダプタープライマーをプライマーとして用いた場合には、94℃ 1分間、58℃ 1分間および72℃ 2分間のサイクルを10回繰り返してcDNAの増幅を行った。
PCR産物は、1回のフェノール:クロロフォルム(1:1)処理の後、エタノール沈澱処理を経て、MmeI型IIs 制限酵素 (University of Gdansk Center for Technology Transfer, Gdansk, Poland)により処理した。 制限酵素処理は、総液量300μlの10mM HEPES、pH8.0、2.5mM 酢酸カリウム、5mM 酢酸マグネシウム、2 mM DTTおよび 40μM S-アデノシルメチオニン混合液中で40ユニットのMmeIを用いて37℃、2.5時間行った。制限酵素処理された5'末端cDNA断片はストレプトアビジンでコートされたマグネティックビーズ(Dynal, Oslo, Norway)に結合させた。4ユニットのT4 DNAリガーゼを添加した供給バッファーを含む16μlの反応溶液中で16℃、2.5時間反応させて、ビーズに結合しているcDNA断片を互いに直接結合させてダイタグを得た。
生成したダイタグはプライマー5’-GGA TTT GCT GGT GCA GTA CAA CTA GGC- 3’(配列番号:8)および5’-CTG CTC GAA TTC AAG CTT CTA ACG ATG-3’(配列番号:9)を用いて、PCRにより増幅した。PCR産物をポリアクリルアミドゲル電気泳動(PAGE)により確認し、XhoIにより処理した。ダイタグを含むバンドを切り出し、セルフライゲーションさせて長いコンカテマーを形成させた。このコンカテマーをpZero 1.0 (Invitrogen)のXhoI部位に組み込んだ。
M13 フォワードプライマーおよびM13リバースプライマーを使用したPCRによりコロニーのスクリーニングを行った。600 bp以上のインサートを含むPCR産物は、Big Dye terminator ver.3を用いて、3730 ABI自動DNAシークエンサー(Applied Biosystems, CA)により配列を決定した。全ての電気泳動図に対して、不明瞭な塩基の有無を確認するため、およびミスリーディングを修正するために目視による再解析を行った。
各タグの出現頻度を、そのために作製したソフトウエアで測定した。解析の結果得られたタグの塩基配列をqueryとして、BLASTサーチ (http://www.ncbi.nlm.nih.gov/BLAST/)およびthe human genome database (http://www.ncbi.nlm.nih.gov/genome/guide/human/)のデータを検索した。
ランダムアダプタープライマーによって合成された5'末端cDNA富化ライブラリーから得られた3000以上の遺伝子タグの塩基配列を解析した結果の一部を以下にまとめた。以下の結果においては、遺伝子タグの塩基配列を記載した配列番号に続けて、次の情報を/で区切って記載した。またこれらの情報の後に行を改めてヒットした既知遺伝子の情報(GenBank Accession No.とアノーテーション)を記載した。
遺伝子タグの塩基配列
得られた遺伝子タグの総数における当該遺伝子タグの出現頻度
遺伝子タグの塩基配列がヒットした既知配列の位置(○:5'末端にヒットしたと考えられるもの、×:5'末端の塩基配列でないと考えられたもの)
(配列番号:10) / ACATCTGACCTCATGGAG / 27 / ○
gi|33694637|tpg|BK000408.1| TPA: Human adenovirus type 5, complete genome
(配列番号:11) / CTCTTTCCTTGCCTAACG / 22 / ○
gi|17981705|ref|NM_001007.2| Homo sapiens ribosomal protein S4, X-linked (RPS4X), mRNA
(配列番号:12) / TACCTGGTTGATCCTGCC / 21 / ×

(配列番号:13) / CTTTTCCTGTGGCAGCAG / 20 / ○
<gi|16579884|ref|NM_000968.2| Homo sapiens ribosomal protein L4 (RPL4), mRNA
(配列番号:14) / CTCTTCCGCCGTCGTCGC / 16 / ○
Homo sapiens eukaryotic translation elongation factor 2 (EEF2), mRNAの上流
(配列番号:15) / CTCATTGAACTCGCCTGC / 11 / ○
gi|28338|emb|X04098.1|HSACTCGR Homo sapiens mRNA for cytoskeletal gamma-actin (ACTG1 gene)
(配列番号:16) / CTGGTTGATCCTGCCAGT / 11 / ×

(配列番号:17) / CTCAGTCGCCGCTGCCAG / 10 / ○
gi|28338|emb|X04098.1|HSACTCGR Homo sapiens mRNA for cytoskeletal gamma-actin (ACTG1 gene)
(配列番号:18) / CTTTCACTGCAAGGCGGC / 10 / ○
gi|18314626|gb|BC021993.1| guanine nucleotide binding protein (G protein), beta polypeptide 2-like 1
(配列番号:19) / ACGCTGTGACAGCCACAC / 9 / ○
NM_005382の上流
(配列番号:20) / GTGACAGCCACACGCCCC / 9 / ×
gi|35045|emb|Y00067.1|HSNFM Human gene for neurofilament subunit M (NF-M)
(配列番号:21) / AACGGCTAGCCTGAGGAG / 8 / ×
gi|188487|gb|M59828.1|HUMMHHSP Human MHC class III HSP70-1 gene (HLA), complete cds
(配列番号:22) / AGTAGCAGCAGCGCCGGG / 8 / ○
gi|14043071|ref|NM_031243.1| Homo sapiens heterogeneous nuclear ribonucleoprotein A2/B1
(配列番号:23) / ATTCCTAGTTAAGGCGGC / 8 / ○
gi|5020073|gb|AF146651.1|AF146651 Homo sapiens glyoxalase-I gene, complete cds
(配列番号:24) / AATTGTGTTCGCAGCCGC / 7 / ○
gi|22027640|ref|NM_002107.2| Homo sapiens H3 histone, family 3A (H3F3A), mRNA
(配列番号:25) / ATATTTCTTACTCTCTCG / 7 / ×
gi|37704377|ref|NR_001564.1| Homo sapiens X (inactive)-specific transcript (XIST) on chromosome X
(配列番号:26) / CTCAGTCGCCGCTGCCAA / 7 / ○
gi|28338|emb|X04098.1|HSACTCGR Homo sapiens mRNA for cytoskeletal gamma-actin
(配列番号:27) / AAAACGGCCAGCCTGAGG / 6 / ×
gi|188489|gb|M59830.1|HUMMHHSP2 Human MHC class III HSP70-2 gene (HLA), complete cds
(配列番号:28) / CTCTCTTTCACTGCAAGG / 6 / ○
gi|12652914|gb|BC000214.1| guanine nucleotide binding protein (G protein), beta polypeptide 2-like 1
(配列番号:29) / AATTTCTACGCGCACCGG / 5 / ○
gi|402305|gb|L24369.1|HUMRPS4A Homo sapiens ribosomal protein S4 gene
(配列番号:30) / ACCGCCGAGACCGCGTCC / 5 / ○
gi|10437878|dbj|AK025375.1| Homo sapiens ACTB mRNA for mutant beta-actin
(配列番号:31) / AGACGCAGAGTAGATTGT / 5 / ○
gi|2315183|emb|Z82216.1|HS75N13 Human DNA sequence from clone RP1-75N13 on chromosome Xq21.1,
(配列番号:32) / AGTTCGATCGGTAGCGGG / 5 / ×
gi|37540535|ref|XM_294582.2| Homo sapiens similar to DNA-binding protein B (LOC347295), mRNA
(配列番号:33) / AGTTCTCGGGCGTACGGC / 5 / ○
gi|30581134|ref|NM_006306.2| Homo sapiens SMC1 structural maintenance of chromosomes 1-like 1
(配列番号:34) / AGTTGCTTCAGCGTCCCG / 5 / ○
gi|32487|emb|X15183.1|HSHSP90R Human mRNA for 90-kDa heat-shock protein
(配列番号:35) / ATTAAACGGTTGCAGGCG / 5 / ×
gi|33239450|ref|NM_182649.1| Homo sapiens proliferating cell nuclear antigen (PCNA)transcript variant 2, mRNA
(配列番号:36) / CCGGCCGGGGGGCGGGCG / 5 / ○
gi|555853|gb|U13369.1|HSU13369 Human ribosomal DNA complete repeating unit
(配列番号:37) / CCTTTTGGCTCTCTGACC / 5 / ○
gi|15718688|ref|NM_001006.2| Homo sapiens ribosomal protein S3A (RPS3A), mRNA
(配列番号:38) / CTCAGTACAGCTCCGGCC / 5 / ○
gi|21217408|gb|AC015849.5| Homo sapiens chromosome 17, clone RP11-362K1, complete sequence
(配列番号:39) / CTCTTTCGGCCGCGCTGG / 5 / ○
gi|461248|dbj|D28421.1|HUMRPL80 Homo sapiens mRNA for ribosomal protein L8 homologue, 5'UTR
得られたタグのうち30の塩基配列の解析の結果、73%以上(22/30)のタグは、実際にcDNAの5'末端の塩基配列であった。本発明に基づいて、高い確率でmRNAの5'末端の塩基配列をタグとして取得できることが裏付けられた。
本発明に基づく、mRNAの5'末端の塩基配列を含む遺伝子タグを利用した遺伝子発現解析(以下、5'SAGEと記載する)の結果を公知のSAGE法(以下3'SAGEと記載する)と比較した。
材料および方法
3'-Long SAGEライブラリーの作製
HEK293から全RNAを単離し、前述のようにmRNAを選択した(Hashimoto, S.-i., Suzuki, T., Dong, H.-Y., Yamazaki, N. & Matsushima, K. Serial analysis of gene expression in human monocytes and macrophages. Blood 94, 837-844, 1999)。標準のSAGE手順を以下のように変更して使用し、mRNA 3μgでLong SAGE法(Saha, S. et al. Using the transcriptome to annotate the genome. Nat Biotechnol 20, 508-512, 2002)を行った。
すなわち、NlaIII切断後に、リンカー1A(5'-TTT GGA TTT GCT GGT GCA GTA CAA CTA GGC TTA ATA TCC GAC ATG-3'/配列番号:40)とリンカー1B(5'-TCG GAT ATT AAG CCT AGT TGT ACT GCA CCA GCA AAT CC C7アミノ修飾-3'/配列番号:41)を互いにアニーリングし全cDNAの半分に連結し、リンカー2A(5'-TTT CTG CTC GAA TTC AAG CTT CTA ACG ATG TAC GTC CGA CAT G-3'/配列番号:42)とリンカー2B(5'-TCG GAC GTA CAT CGT TAG AAG CTT GAA TTC GAG CAG C7アミノ修飾-3'/配列番号:43)を互いにアニーリングしcDNAの残り半分に連結し、MmeI認識部位を含むリンカーを3'cDNA末端に連結した。MmeIタイプIIs制限酵素(グダニスク大学技術移転センター(University of Gdansk Center for Technology Transfer)、ポーランド、グダニスク)を用いて、cDNAからリンカータグ分子を遊離させた。切断は、300μlの10 mM HEPES、pH 8.0、2.5 mM酢酸カリウム、5 mM酢酸マグネシウム、2 mM DTT、および40μM S-アデノシルメチオニン中でMmeI 40ユニットを使用し、37℃で2.5時間行った。供給緩衝液中にT4 DNAリガーゼ4ユニットを含む反応液16μl中で、リンカー1タグ分子とリンカータグ2分子を16℃で2.5時間、互いに直接連結させた。
遊離したタグを互いに連結し、連鎖させ、pZero 1.0(インビトロジェン(Invitrogen))のSphI部位にクローニングした。M13フォワードおよびM13リバースプライマーを用いて、ポリメラーゼ連鎖反応法(PCR)によりコロニーをスクリーニングした。600 bpを超える挿入断片を含むPCR産物を、Big Dyeターミネーターver.2でシークエンシングし、3730 ABI自動DNAシークエンサー(アプライドバイオシステムズ(Applied Biosystems)、カリフォルニア州)を用いて解析した。電気泳動図はすべて目視検査により再度解析し、あいまいな塩基を調べ誤読を訂正した。SAGE 2000ソフトウェア(バージョン4.12)を用いて、各タグの存在量を定量した。リンカー配列、他の可能性のある人工産物、および反復したダイタグを除去した後、各タグを解析した。
5'- SAGEライブラリーの作製
いくつかの変更点(Suzuki, Y., Yoshitomo-Nakagawa, K., Maruyama, K., Suyama, A. & Sugano, S. Construction and characterization of a full length-enriched and a 5'-end-enriched cDNA library. Gene 200, 149-156, 1997)を加え、MaruyamaおよびSugano(Maruyama, K. & Sugano, S. Oligo-capping: a simple method to replace the cap structure of eukaryotic mRNAs with oligoribonucleotides. Gene 138, 171-174, 1994)に記載されるように、オリゴキャップ法を行った。
つまり、RNasin(プロメガ(Promega))100ユニットを含む100μlの100 mM Tris-HCl(pH 8.0)、5 mM 2-メルカプトエタノール中で、ポリ(A)+ RNA 5〜10μgを細菌由来アルカリホスファターゼ(BAP;タカラ(TaKaRa))1.2ユニットを用いて37℃で40分間処理した。フェノール:クロロホルム(1:1)で2回抽出しエタノール沈殿した後、RNasin 100ユニットを含む100μlの50 mM酢酸ナトリウム(pH 5.5)、1 mM EDTA、5 mM 2-メルカプトエタノール中で、ポリ(A)+ RNAをタバコ酸性ピロホスファターゼ(TAP)20ユニットを用いて37℃で45分間処理した。フェノール:クロロホルム抽出しエタノール沈殿した後、BAP-TAP処理したポリ(A)+ RNA 2〜4μg を2つのプールに分け、XhoI / MmeI認識部位を含む以下のRNAリンカーの1つを各プールに連結した:RNasin 100ユニットを含む100 mlの50 mM Tris-HCl(pH 7.5)、5 mM MgCl2、5 mM 2-メルカプトエタノール、0.5 m M ATP、25% PEG8000中で、RNAリガーゼ(タカラ)250ユニット用いて、5'-oligo 1(5'-UUU GGA UUU GCU GGU GCA GUA CAA CUA GGC UUA AUA CUC GAG UCC GAC -3'/配列番号:1)、5'-oligo 2(5'-UUU CUG CUC GAA UUC AAG CUU CUA ACG AUG UAC GCU CGA GUC CGA C -3'/配列番号:2)を20℃で3〜16時間連結させた。
未連結の5'-オリゴを除去した後、RNaseHフリー逆転写酵素(Superscript II、ギブコBRL(Gibco BRL))でcDNAを合成した。5'末端濃縮cDNAライブラリーを作製するため、ランダムアダプタープライマー(5'-GCG GCT GAA GAC GGC CTA TGT GGC CNN NNN NC-3'/配列番号:4)10 pmolを用いて12℃で1時間インキュベートし、42℃でさらにもう1時間インキュベートした。
第1鎖を合成した後、15 mM NaOH中で65℃にて1時間インキュベートすることにより、RNAを分解した。オリゴキャップポリ(A)+ RNA 1 mgから作製したcDNAは、XL PCRキット(パーキンエルマー(Perkin-Elmer))を使用し、16 pmolの5'(5'ビオチン-GGA TTT GCT GGT GCA GTA CAA CTA GGC TTA ATA-3'/配列番号:5、または5'ビオチン-CTG CTC GAA TTC AAG CTT CTA ACG ATG TAC G-3'/配列番号:6)および3'(5'-GCG GCT GAA GAC GGC CTA TGT-3'/配列番号:7)PCRプライマーにより100μl量で増幅した。ランダムアダプタープライマーで伸張したcDNAについては、増幅サイクルを、94℃で1分間、58℃で1分間、72℃で2分間の10サイクルとした。PCR産物をフェノール:クロロホルム(1:1)で1度抽出してエタノール沈殿し、MmeIタイプIIS制限酵素(グダニスク大学技術移転センター、ポーランド、グダニスク)で切断した。切断は、300μlの10 mM HEPES、pH 8.0、2.5 mM酢酸カリウム、5 mM酢酸マグネシウム、2 mM DTT、および40μM S-アデノシルメチオニン中でMmeI 40ユニットを使用し、37℃で2.5時間行った。
切断した5'-末端cDNA断片を、ストレプトアビジンコーティングした磁気ビーズ(ダイナル(Dynal)、ノルウェー、オスロ)に結合させた。ビーズに結合したcDNA断片を、供給緩衝液中にT4 DNAリガーゼ4ユニットを含む反応液16μl中で、16℃で2.5時間、互いに直接連結させた。プライマー5'-GGA TTT GCT GGT GCA GTA CAA CTA GGC -3'/配列番号:8および5'-CTG CTC GAA TTC AAG CTT CTA ACG ATG-3'/配列番号:9を用いてPCRし、ダイタグを増幅した。PCR産物はポリアクリルアミドゲル電気泳動(PAGE)で解析し、XhoIで切断した。ダイタグを含むバンドを切り出して自己連結させ、長いコンカテマーを作製した。pZero 1.0(インビトロジェン)のXhoI部位に、このコンカテマーをクローニングした。M13フォワードおよびM13リバースプライマーを用いて、PCRによりコロニーをスクリーニングした。600 bpを超える挿入断片を含むPCR産物を、Big Dyeターミネーターver.3でシークエンシングし、3730 ABI自動DNAシークエンサー(アプライドバイオシステムズ、カリフォルニア州)を用いて解析した。電気泳動図はすべて目視検査により再度解析し、あいまいな塩基を調べ誤読を訂正した。SAGE 2000ソフトウェア(バージョン4.12)を用いて、各タグの存在量を定量した。
5'SAGEタグの対応遺伝子との関連性
転写開始点の同定における5'SAGEタグの有効性を評価するため、5'SAGEタグを現行のcDNA/ESTデータベースとアラインすることを避けた。その配列が常に転写開始点から読まれているとは限らないからである。代わりに、http://alps.gi.k.u-tokyo.ac.jp/で公開されているアライメントプログラムALPSを用いて、我々の5'-タグをhttp://genome.ucsc.edu/で利用可能なヒトゲノム配列、NCBI build 34とアラインすることを試みた。センス方向で一致したタグのみをこの解析で考慮した。
次に、Gene Resource Locatorデータベース(Honkura, T., Ogasawara, J., Yamada, T. & Morishita, S. The Gene Resource Locator: gene locus maps for transcriptome analysis. Nucleic Acids Res. 30, 221-225, 2002 URL http://grl.gi.k.u-tokyo.ac.jp/)、UniGene(Build 162)(Wheeler, D.L. Database Resources of the National Center for Biotechnology. Nucleic Acids Res. 31, 28-33, 2003 URL ftp://ftp.ncbi.nih.gov/repository/UniGene/)等の様々なリソースにおける配列のアライメントのデータベースを利用し、各5'-タグのアライメント位置の近傍を検索して、対応する転写物を見い出した。主だった問題点は、レトロトランスポジションおよびゲノム重複が原因で、1つの5'-タグが、その多くが非コード領域である複数の位置とアラインされてしまうことであった。この問題は、UniGeneデータベースで注釈づけられている遺伝子コード部位を選択することにより解決した。3'-タグは3'-末端エクソンに集まることが多いが、5'-タグは第1エクソンに当たる必要はない。したがって、各5'-タグのアライメント位置から500 bpの距離の範囲内で検索を行った。
既知の5'転写開始点との一致
各5'SAGEタグがアラインする位置とその対応する遺伝子間の距離が短いことから、5'-タグは既知の5'転写開始点とほぼ一致することが示唆された。しかし、距離を算出するためには、5'-タグの近傍では、選択的スプライシングが原因で複数のcDNA/EST配列アラインメントが頻繁に見られることに留意しなければならない。この状況を解決し距離に固有の値を割り当てるため、5'-タグに最も近いアライメントを選択した。5'-タグが対応するcDNAの上流領域に位置する場合は、距離はマイナスであると定義した。そうでなければ、値はプラスまたはゼロである。特に、距離ゼロとは完全な一致を示す。全体的な距離の分布を見るため、mRNA開始点の-500〜+200 ntの5'SAGEタグ出現率の総数を算出した。RefSeq、UniGene(GRL)およびDBTSSデータベースを別々に使用し、転写開始点をカバーする範囲の相違を見た。
結果
5' SAGE法
転写開始部位に関して包括的な情報を得るために、本発明者らは、オリゴキャッピング法を用いて5' SAGEを開発した。5' SAGE法は転写物の5'末端に由来する19〜20 bpのタグを生成し、これを迅速に分析してゲノム配列データにマッチさせることができる。図1は、5' SAGE法の戦略を示す。
ゲノムのマッピング
この方法を用いて、本発明者らは、試験細胞株としてHEK293細胞において発現された転写物25,684個の特徴を調べ、これらをヒトゲノム配列と比較した。全体でタグ19,893個が、異なるタグ13,404個を表すゲノム配列と完全にマッチした(表1)。
異なるタグ13,404個の80%(タグ10,706個)が唯一の位置にマップされた。ゲノムにおいて多数の部位にマッチしたタグは、2つの遺伝子座(loci)にマップされたタグが11.1%(タグ1483個)、3〜99の遺伝子座(loci)にマップされたタグが8.1%(タグ1090個)、そして100以上の遺伝子座(loci)にマップされたタグは0.9%(タグ125個)であった。多数のゲノム座にマッピングされたタグは、ほとんどがレトロトランスポゾンエレメント、反復配列、または偽遺伝子に対応する。
Figure 0003845416
表1.SAGEタグとゲノムとの実験的な照合
5'-end SAGE tag to genome:ゲノムにマップされた5'SAGEのタグの数
3'-end SAGE tag to genome:ゲノムにマップされた3'SAGEのタグの数
Tags mapped to genome(%):ゲノムにマップされたタグの数(%)
Unique Tags mapped to genome(%):ゲノムにマップされたユニークなタグの数(%)
Relative expression level:相対発現レベル
#:18 bp 5' SAGEタグを用いてゲノムにヒットしたタグの数。マッピングは材料と方法の章に記述したとおりに実施した。ゲノムにヒットしなかったタグは、シークエンシングしたタグ25,684個中5,791個であった。相対的発現レベルは、ライブラリにおいて認められた転写物タグの総数を異なるタグの数によって除することによって決定した。
##:20 bp 3' SAGEタグを用いてゲノムにヒットしたタグの数。マッピングは材料と方法の章に記述したとおりに実施した。ゲノムにヒットしなかったタグは、シークエンシングしたタグ81,211個中27,162個であった。
mRNA開始部位へのマッピング
次に、本発明者らは、5' SAGEタグがmRNA開始部位にマッチするか否かを推定した。本発明者らは、参考配列データベース(RefSeq)、調節領域におけるシス要素およびオルタナティブスプライシング転写物に関する情報を含む遺伝子マップを構築するGene Resource Locator(GRL)、およびヒト完全長cDNAsの系統的な5'末端配列を含むDataBase of Transcriptional Start Site (DBTSS)(Suzuki, Y. et al. DBTSS: DataBase of human Transcriptional Start Sites and full-length cDNAs. Nucleic Acids Res 30, 328-331, 2002)を含む三つのデータベースを用いた。図2は、距離の分布を示し、表2は、距離が短いタグの発生比率を示し、本発明者らの5' SAGEタグがそれぞれのデータベースの開始部位情報と十分に一致することを示している。それぞれのデータベースにマッピングされたタグの85.8%〜98.2%が、mRNA開始部位の−500ヌクレオチド〜+200ヌクレオチドにマップされた。
特に、5' SAGEタグの23.5〜49.3%が、これらのデータベースにおいて定義された転写開始部位(TSS)の上流の領域にヒットする。その上、本発明者らは、5' SAGEタグによるTSSでのヌクレオチド選択性(nucleotide preference)を調べた。TSSのヌクレオチドは、ヒト遺伝子276個におけるmRNA 5880個を用いて、A(47%)、G(28%)、C(14%)、およびT(12%)であると報告されている(Suzuki, Y. et al. Diverse transcriptional initiation revealed by fine, large-scale mapping of mRNA start sites. EMBO Rep 2, 388-393, 2001)。本発明者らのデータはまた、最初のヌクレオチドの使用に関して非常に類似の百分率を示した:A(41%)、G(32%)、C(17%)、およびT(10%)。併せて考慮すると、本発明者らの5' SAGEタグ法は、TSSを正確に同定することができる。データは本発明者らに、正確な転写開始部位情報を提供するのみならず、プロモーターの利用を分析するためのリソースを提供する。興味深いことに、ゲノムにマッチしないタグは、本研究において5' SAGEにおける全シークエンシングタグの33%を占めた。それらの中で、ゲノムにマッチしない5' SAGEタグの第一のヌクレオチドの39%もまたAであった。ゲノムにマッチしなかったタグのいくつかは、ゲノムにおける単一のヌクレオチド変異または欠失を有する領域にヒットすると見なすことができる。
Figure 0003845416
表2.各データベースにおけるmRNAの開始部位と対応する5'SAGEタグとの距離
Distance from start site of each databese(nt):各データベースの開始点からの距離(ヌクレオチド)
各データベースにおける遺伝子の5'末端へのマッピングにおいて一致するタグを図2に示したように分析した。
新規遺伝子またはアノテーションされていない遺伝子の同定
特徴がわかっていない遺伝子を同定するために、5' SAGEタグをゲノム配列、RefSeq、およびESTデータベースと比較した。ゲノムにおいて単一の座を有するユニークなタグ10,706個のうち、タグ9,376個を、その対応するUniGene ESTに関連させることができる(表3)。さらに、5'SAGEのユニークなタグ6,418個は、DBTSSにおける既知の遺伝子に関連していた。残りのタグ(12.4%)は、既知の遺伝子のイントロン内の領域(5.4%)または特徴がわかっていない領域(6.6%)にマッチした。特徴がわかっていない領域にマッチしたタグは、主に二つの部位にヒットした;
(1)全く特徴がわかっていない領域、
(2)特徴がわかっていないESTの領域
そのような遺伝子の発現に関する証拠があれば、3' SAGEを参考にすることによって完全長の形の新規遺伝子を発見するために役立つはずである。
Figure 0003845416
表3:特徴づけされていない候補遺伝子とエキソンの同定
gene/exoncategory:遺伝子/エキソンの分類
Unique tags mapped to genome(tags occurrences):ゲノムにマッピングされたユニークなタグ(タグの出現頻度)
Previously annotated:既にアノテーション済み
Known gene:既知遺伝子
Previously unannotated:未だアノテーションされていない
Internal exon(Intron):内部エキソン(イントロン)
genome:ゲノム
total:総数
10,706個がユニークな位置にマップされ、9,376個が対応するUniGene ESTに関連付けられる。
SAGEは、転写物の量に基づく定量的情報を得るために用いることができる非常に強力な方法である。表4は、HEK 293細胞における転写物プロフィールの5'末端を示す。最も発現量の多い遺伝子は、neurofilament 3(NEF3)として同定され、その発現頻度は1.43%であり、これに次いで複数座にヒットした遺伝子、および elongation factor 2であった。NEF3、heat shock 70kDa protein 1A(熱ショック70 kDa蛋白質1A)、calreticulin(カルレチキュリン)、およびheterogeneous nuclear ribonucleoprotein H1(異種核リボ核蛋白質H1)のようないくつかの遺伝子は、異なるタグを示した。いくつかの遺伝子は、異なるTSSから転写されたことが示唆される。例えば、heat shock 70kDa protein 1Aは、異なる転写開始部位8個から転写される。calreticulinは、異なる転写開始部位7個から転写される。これらの結果は、個々の転写開始部位が遺伝子発現に関連するであろうことを示唆している。
Figure 0003845416
表4.HEK293細胞における転写プロファイルの5'末端
Tag sequence:タグ配列
Tag count:タグの計数値
Related Unigene cluster:関連Unigeneクラスター
Related refseq:関連 refseq
Gene:遺伝子
HEK293細胞において発現していた上位50の5'末端転写物をリストした。タグ配列は18-bpのSAGEタグを示す。タグとそれに対応するUnigene/ESTを示した。
5'と3' SAGEタグ発現の一致
本発明者らはまた、5' SAGEの精度を確認するために、同じ細胞においてmRNAの3'-Long SAGEを試みた。3'-Long SAGEにおいて、本発明者らは、HEK293細胞株において発現された転写物タグ81,212個の特徴を調べた。全体でタグ54,050個が、異なるタグ15,423個を表すゲノム配列にマッチした(表1)。異なるタグ15,423個の75%(タグ11,613個)がゲノムにおいて一つの部位にマッチした。さらに、3' SAGEタグ8,359個がUniGene ESTにおける既知の遺伝子に関連した(表3)。ゲノムにおいて多数の部位にマッチしたタグは、2つの座にマッチしたタグが9%(タグ1395個)、3〜99の座にマッチしたタグが13.2%(タグ2,039個)、および100以上の座にマッチしたタグが2.4%(タグ376個)であった。ゲノムにおいて多数の部位にマッチしたタグの割合は、5' SAGEと3' SAGEのあいだでよく似ていた(表2)。一方、5' SAGEタグは、3' SAGEタグと比較して非常に不均一であった。
Sehaらも同様に、ゲノム1個あたり10個より多いコピーを示すタグは、ゲノム1個あたりコピー1個のみを示すタグより、平均して高度に発現されることを示した(Saha, S. et al. Nat Biotechnol 20, 508-512, 2002)。本発明者らのデータはまた、3〜99座/ゲノムでは、5' SAGEおよび3' SAGEライブラリにおける他の分画より相対的な発現レベルが高いことを証明した。これはレトロトランスポジターを通しての遺伝子発現と遺伝子複製との相関のメカニズムによる。二つのライブラリのあいだの類似性の程度を推定するために、5' SAGEと3'-Long SAGEのあいだで発現された遺伝子を比較した。
5'および3'タグは5'末端および3'末端から個々に無作為に採取するため、5'タグが特定の完全長のcDNA配列に関連する確率は、3'タグがcDNAにマッチする確率と一致すると予想される。しかし、完全長のcDNA配列またはオルタナティブスプライシング転写物のコレクションが不完全であるために、たとえこれらのタグが同じコード領域に由来するとしても、5'タグと3'タグのあいだに正確な一致を決定することは簡単ではない。一つの有望なアプローチは、エキソンを共有するESTアラインメントをまとめて遺伝子コード座のようなクラスターとして扱い、5'および3' SAGEタグをこれらのクラスターおよびその上流の領域にマッピングして、5'および3' SAGEタグ発現のあいだの一致を発見することであろう。このようにして、本発明者らはそれぞれの遺伝子コード領域に関する3'および5'タグの対の発生数を計数し、そして図3の二次元平面に全ての対を表した。発現パターンの比較によって、ほとんどの遺伝子が双方のライブラリで類似のレベルで発現されることが判明した。しかし、いくつかの転写物は、有意に異なるレベルで発現され、5' SAGEと3' SAGEライブラリのピアソン相関係数は0.36で、中等度の類似性を示した。
相関が中等度であった理由は、5' SAGEと3' SAGEライブラリからの頻度の分散による。以下に由来する配列のように、これらのタグの出現に関していくつかの可能性がある。
(1)5' SAGEおよび3' SAGEにおけるPCR増幅の誤差
(2)3' SAGEにおいてNlaIII制限部位を占有すると予想されるであろう少数の遺伝子
(3)5' SAGEにおいてXhoI制限部位を占有すると予想されるであろう少数の遺伝子
(4)5' SAGEおよび3' SAGEにおけるmRNAの未知のスプライシング変種
(5)多数のゲノム座に対するタグのヒットに関する注釈誤差、またはゲノムへのEST注釈誤差
本研究は、例としてHEK 293細胞において発現された遺伝子の分画のみを同定した。発現された遺伝子の大要を詳細に記述するためには、多様な異なる細胞タイプおよび環境条件からのかなり多数のタグが必要であろう。データが蓄積されれば、5'と3' SAGEタグの発現の一致に関する問題が解決される可能性がある。
考察
mRNA開始部位(Suzuki, Y. et al. Diverse transcriptional initiation revealed by fine, large-scale mapping of mRNA start sites. EMBO Rep 2, 388-393,2001)とポリアデニル化切断部位(Pauws, E., van Kampen, A.H., van de Graaf, S.A., de Vijlder, J.J. & Ris-Stalpers, C. Heterogeneity in polyadenylation cleavage sites in mammalian mRNA sequences: implications for SAGE analysis. Nucleic Acids Res 29, 1690-1694,2001)が不均一性を示すことは、いくつかの研究グループによって報告された。Shirakiらは構築の際の特定の遺伝子のTSSの差を報告したが(Shiraki, T. et al. Cap analysis gene expression for high-throughput analysis of transcriptional starting point and identification of promoter usage. Proc Natl Acad Sci U S A 100, 15776-15781, 2003)、本発明者らのデータは、TSSの多様性が細胞に既に存在することを示している。その上、本発明者らのデータは、5' SAGEおよび3' SAGE法によってTSSと3'末端領域の不均一性に関する直接の証拠を提供する。
例えば、PPAR結合蛋白質はTSS 1個と3' SAGEタグ部位2個とを有し、リボソーム蛋白質S4はTSS 16個と3' SAGEタグ部位1個とを有し、カルレチキュリンはTSS 7個と3' SAGEタグ部位1個とを有する。さらに、オルタナティブmRNAスプライシングは、ヒトプロテオームの複雑性に極めて重要に関与している。最近のゲノム研究から、ヒト遺伝子の40〜60%がオルタナティブスプライシングされていることが証明されている(Modrek, B. & Lee, C. A genomic view of alternative splicing. Nature Genetics 30, 13-19, 2002)。点突然変異の15%がmRNAスプライシング欠損によってヒト遺伝疾患を引き起こすと推定されている(Krawczak, M., Reiss, J. & Cooper, D.N. The mutational spectrum of single base-pair substitutions in mRNA splice junctions of human genes: causes and consequences. Hum Genet 90, 41-54, 1992)。
Zavolanらは、多数のスプライス型を有する転写ユニットは、その49%が、オルタナティブ転写開始の使用が最初のエキソンのオルタナティブスプライシングを伴う転写物を含むことを報告した(Zavolan, M. et al. Impact of alternative initiation, splicing, and termination on the diversity of the mRNA transcripts encoded by the mouse transcriptome. Genome Res 13, 1290-1300, 2003)。本発明者らはまた、ペルオキシレドキシン4(NM_006406)のようないくつかの遺伝子のそれぞれのmRNA開始部位が、mRNAの異なるスプライシングバリアントを表すのみならず、遺伝子発現の異なる量を表すことを発見した。このことは、オルタナティブトランスクリプションがオルタナティブスプライシングをしばしば誘導する可能性があることを意味する。
最近、キャップトラッパーシステムを用いて転写開始点を同定する新規方法が報告されている(Shiraki, T. et al. Proc Natl Acad Sci U S A 100, 15776-15781, 2003)。しかし、mRNA開始部位のマッピングの同定効率は、それらの方法では顕著ではない。本発明者らの研究において記述された5' SAGE法によって、TSSを正確にマッピングでき、同様に遺伝子発現の頻度を確立することができる。
結論すると、5' SAGE法を利用すれば、ゲノムの注釈がかなり促進される可能性がある。5' SAGEは、遺伝子配列のアプリオリ知識に依存しない少ない高スループット発見アプローチの一つであるため、そのようなデータによって、in silico遺伝子予測の独立した確認および未注釈領域の同定が即時に可能となるであろう。さらに、5' SAGE法は、5' UTR/プロモーター領域においてSNPを発見するために有用であろう。異なるタイプの特異的mRNA開始部位から転写された遺伝子を包括的に同定すれば、ヒトゲノムの機能的複雑性に対する説明のみならず、癌、免疫、および神経疾患のような様々な障害の診断の基礎に対して新しい洞察が得られる。
最後に、5'末端の多様性を考慮に入れると、遺伝子発現の頻度を決定するためには、3' SAGEより5' SAGEを行うことがより適当であろう。
本発明は、遺伝子タグの取得に有用である。遺伝子タグは、遺伝子に固有の塩基配列情報である。したがって、ある遺伝子ライブラリーにおけるタグの出現頻度は、そのライブラリーを構成する全ての遺伝子の発現状態を反映していると考えられる。そのため、遺伝子タグは、遺伝子発現解析に有用である。特に本発明によって得ることができる遺伝子タグは、全てのmRNAが有している5'末端の構造に基づいて生成される。したがって、本発明によって生成されるタグに基づく遺伝子発現解析の結果は、より信頼性が高い。
また本発明のタグは、mRNAの5'末端領域の塩基配列情報を含んでいる。したがって、本発明によって生成されるタグの塩基配列情報に基づいて、ゲノムにおける転写開始点を同定することができる。また本発明のタグの塩基配列情報に基づいてデザインされたオリゴヌクレオチドは、全長cDNAの合成用プライマーとして利用することができる。
本発明に基づく、遺伝子タグの取得方法の例を示す図。mRNAを半分に分けて、mRNAのCap構造を、IIs型制限エンドヌクレアーゼであるMmeIおよびXhoI制限酵素部位を含む二つのタイプの合成オリゴヌクレオチドに酵素的に置換した。次に、オリゴキャッピングmRNAをdTアダプタープライマーによってcDNAの第1鎖に変換した。第2鎖を、PCRを用いて、ビオチン結合5'プライマーおよびdTアダプタープライマーによって合成した。二本鎖cDNAを、その認識部位から20 bp離れたところで切断するMmeIによって切断した。ストレプトアビジンビーズに結合させることによって5' cDNAを単離した後、タグの二つのプールを互いにライゲーションした。 UniGeneおよびDBTSS配列におけるmRNA開始部位と比較した5' SAGEタグの距離。距離は、上流(−)および下流(+)のヌクレオチド(x-軸)の数として示す。UniGeneにおけるmRNA開始部位を0として示す。5' SAGEタグの頻度をy-軸に示す。それぞれの5' SAGEタグとその対応する遺伝子とを配置した位置の距離が短ければ、5'タグが既知の5'転写開始部位とほぼ一致することを意味している。本発明者らは、転写開始部位のその範囲の差を調べるために、UniGeneおよびDBTSSデータベースを別々に用いた。 5' SAGEタグと3' SAGEタグの頻度のスキャッタープロット。5' SAGEおよび3' SAGEからゲノムにおける一つの座にヒットしたタグを、実施例2の材料と方法の章に記載するように分析した。この図において、双方の軸は対数で表記した。

Claims (22)

  1. 次の工程を含む真核細胞の遺伝子タグの製造方法。
    (1) RNAのCAP部位にIIs型制限酵素の認識配列を含むRNAリンカーを連結する工程、
    (2) (1)のRNAを鋳型としてcDNAを合成する工程、
    (3) (2)のcDNAにRNAリンカーに含まれる認識配列を認識するIIs型制限酵素を作用させ、遺伝子タグを生成する工程
  2. 次の工程によってcDNAを合成する請求項1に記載の方法。
    i)RNAの任意の領域にアニールするプライマーによってcDNAの第1鎖を合成する工程、および
    ii)第1鎖のRNAリンカーを鋳型として合成された領域にアニールするプライマーによって、cDNAの第2鎖を合成して2本鎖cDNAとする工程
  3. 第1鎖のRNAリンカーを鋳型として合成された領域にアニールするプライマーが、固相に結合することができる標識を有するか、または固相に固定化されており、前記固相の回収によって2本鎖cDNAを回収する工程を含む請求項2に記載の方法。
  4. IIs型制限酵素を作用させる前、または後に固相を回収する請求項3に記載の方法。
  5. RNAリンカーがII型制限酵素の認識配列を含む請求項1に記載の方法。
  6. 遺伝子タグのIIs型制限酵素の切断部位を、他の遺伝子タグのIIs型制限酵素の切断部位と連結させて、ダイタグを生成する工程を含む、請求項1に記載の方法。
  7. RNAリンカーにアニールするプライマーによって、ダイタグを増幅する工程を含む請求項6に記載の方法。
  8. 遺伝子タグのIIs型制限酵素の切断部位に任意の塩基配列を有するアダプターを連結し、RNAリンカーと、前記アダプターにアニールするプライマーによって、遺伝子タグを増幅する工程を含む、請求項1に記載の方法。
  9. 請求項1に記載の方法によって生成された遺伝子タグの複数を連結する工程を含む、遺伝子タグのコンカテマーの製造方法。
  10. 請求項6に記載の方法によって生成されたダイタグの複数を連結する工程を含む、遺伝子タグのコンカテマーの製造方法。
  11. 請求項9または請求項10に記載のコンカテマーの塩基配列を決定する工程を含む、遺伝子タグの塩基配列の決定方法。
  12. 次の要素を含む遺伝子タグの製造用試薬キット。
    (a)IIs型制限酵素の認識配列を含むオリゴヌクレオチドからなるRNAリンカー
    (b)RNAリンカーをRNAのCAP部位に連結するための試薬
    (c)RNAリンカーを鋳型として合成されたcDNAにアニールするオリゴヌクレオチドからなるcDNA第2鎖合成用のプライマー
    (d)cDNA第1鎖合成用プライマー
  13. cDNA第1鎖合成用プライマーが、以下のi)-iii)からなる群から選択されるいずれかのプライマーである請求項12に記載のキット。
    i)ランダムプライマー
    ii)オリゴdTプライマー、および
    iii)特定のmRNAに相補的な塩基配列を含むプライマー
  14. 次の工程を含む、真核細胞における遺伝子の発現プロファイルの取得方法。
    (1) 請求項1に記載の方法によって遺伝子タグを製造する工程、
    (2) (1)の遺伝子タグの塩基配列を決定する工程、および
    (3) 決定された塩基配列とその出現頻度を対応付けることによって発現プロファイルを得る工程
  15. 請求項14に記載の方法によって異なる種類の細胞の遺伝子発現プロファイルを取得し、遺伝子発現プロファイルを比較して細胞間で発現頻度の異なる遺伝子タグを選択する工程を含む、遺伝子発現プロファイルの解析方法。
  16. 次の工程を含む、遺伝子の転写開始点の決定方法。
    (1) 請求項1に記載の方法によって遺伝子タグを製造する工程、
    (2) (1)の遺伝子タグの塩基配列を決定する工程、および
    (3) 決定された塩基配列をゲノムの塩基配列上にマッピングし、塩基配列が一致した領域を当該遺伝子の転写開始点として同定する工程
  17. cDNAの第1鎖の合成のためのプライマーが特定の遺伝子の塩基配列から選択された塩基配列からなり、当該遺伝子の転写開始点を決定することを特徴とする請求項16に記載の方法。
  18. 次の工程を含む、全長cDNAの合成方法。
    a)次の工程によってcDNAの塩基配列を決定する工程
    (1) 請求項1に記載の方法によって遺伝子タグを製造する工程、および
    (2) (1)の遺伝子タグの塩基配列を決定する工程
    b)決定されたcDNAの塩基配列またはその相補配列を含むcDNAを合成するための5’側のプライマーと、オリゴdTプライマーからなる3’側のプライマーを用い、RNAまたはcDNAを鋳型として相補鎖合成反応を行う工程、および
    c)合成されたDNAを全長cDNAとして回収する工程
  19. 以下の工程を含むポリペプチドの製造方法。
    a) 請求項18に記載の方法により全長cDNAを合成する工程
    b) a)で得られたcDNAを発現可能に発現ベクターに挿入する工程
    c) b)で得られた発現ベクターを用いて宿主細胞を形質転換する工程、および
    d) c)で得られる形質転換体を培養し、発現産物をポリペプチドとして回収する工程
  20. 以下の工程を含む、ポリペプチドの製造方法。
    i) 請求項18に記載の方法により全長cDNAを合成する工程
    ii) i)で得られた全長cDNAのコード領域を、プロモーターに機能的に連結し、DNAコンストラクトを構築する工程、
    iii) ii)で構築されたDNAコンストラクトを、生体外翻訳を支持する要素と接触させる工程、および
    iv) 発現産物を回収する工程
  21. 次の工程を含む、mRNAの5’末端の塩基配列を含むcDNAの合成方法。
    a)次の工程によってcDNAの塩基配列を決定する工程
    (1) 請求項1に記載の方法によって遺伝子タグを製造する工程、および
    (2) (1)の遺伝子タグの塩基配列を決定する工程
    b) 決定されたcDNAの塩基配列またはその相補配列を含むcDNAを合成するための5’側のプライマーと、目的とするmRNAの任意の領域に対して相補的な塩基配列からなる3’側のプライマーを用い、RNAまたはcDNAを鋳型として相補鎖合成反応を行う工程、および
    c)合成されたDNAをmRNAの5’末端の塩基配列を含むcDNAとして回収する工程
  22. 請求項21に記載の方法によって回収されたcDNAの塩基配列を決定する工程を含む、mRNAの5’側の塩基配列を決定する方法。
JP2004006630A 2003-12-01 2004-01-14 遺伝子タグの取得方法 Expired - Fee Related JP3845416B2 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP2004006630A JP3845416B2 (ja) 2003-12-01 2004-01-14 遺伝子タグの取得方法
PCT/JP2004/008174 WO2005054465A1 (ja) 2003-12-01 2004-06-04 遺伝子タグの取得方法
CA002547885A CA2547885A1 (en) 2003-12-01 2004-06-04 Methods for obtaining gene tags
KR1020067012895A KR20060130599A (ko) 2003-12-01 2004-06-04 유전자 태그의 수득 방법
US10/581,211 US20090117538A1 (en) 2003-12-01 2004-06-04 Methods for Obtaining Gene Tags
RU2006123468/13A RU2006123468A (ru) 2003-12-01 2004-06-04 Способы получения тагов генов
AU2004295532A AU2004295532A1 (en) 2003-12-01 2004-06-04 Method of obtaining gene tag
EP04736143A EP1698694A4 (en) 2003-12-01 2004-06-04 METHOD FOR MAINTAINING A GENE DAY
IL175709A IL175709A0 (en) 2003-12-01 2006-05-17 Methods for obtaining gene tags
NO20063063A NO20063063L (no) 2003-12-01 2006-06-30 Fremgangsmate for a fremskaffe genmerke

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003402306 2003-12-01
JP2004006630A JP3845416B2 (ja) 2003-12-01 2004-01-14 遺伝子タグの取得方法

Publications (2)

Publication Number Publication Date
JP2005185269A JP2005185269A (ja) 2005-07-14
JP3845416B2 true JP3845416B2 (ja) 2006-11-15

Family

ID=34656193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004006630A Expired - Fee Related JP3845416B2 (ja) 2003-12-01 2004-01-14 遺伝子タグの取得方法

Country Status (10)

Country Link
US (1) US20090117538A1 (ja)
EP (1) EP1698694A4 (ja)
JP (1) JP3845416B2 (ja)
KR (1) KR20060130599A (ja)
AU (1) AU2004295532A1 (ja)
CA (1) CA2547885A1 (ja)
IL (1) IL175709A0 (ja)
NO (1) NO20063063L (ja)
RU (1) RU2006123468A (ja)
WO (1) WO2005054465A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007028923A (ja) * 2005-07-22 2007-02-08 Post Genome Institute Co Ltd 転写開始部位を含む1本鎖遺伝子タグ群の製造方法
CN101153336B (zh) 2006-09-27 2011-09-07 香港中文大学 检测dna甲基化程度的方法和试剂盒
EP2952589B1 (en) * 2008-09-20 2018-02-14 The Board of Trustees of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
WO2011053864A2 (en) * 2009-10-30 2011-05-05 The Regents Of The University Of California Bacterial metastructure and methods of use
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5866330A (en) * 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
AU2001280875A1 (en) * 2000-07-28 2002-02-13 The Johns Hopkins University Serial analysis of transcript expression using long tags
EP1523554A2 (en) * 2002-06-12 2005-04-20 Riken Method of utilizing the 5' end of transcribed nucleic acid regions for cloning and analysis
GB0228289D0 (en) * 2002-12-04 2003-01-08 Genome Inst Of Singapore Nat U Method

Also Published As

Publication number Publication date
AU2004295532A1 (en) 2005-06-16
CA2547885A1 (en) 2005-06-16
KR20060130599A (ko) 2006-12-19
NO20063063L (no) 2006-08-31
EP1698694A1 (en) 2006-09-06
WO2005054465A1 (ja) 2005-06-16
EP1698694A4 (en) 2007-04-04
JP2005185269A (ja) 2005-07-14
US20090117538A1 (en) 2009-05-07
IL175709A0 (en) 2006-09-05
RU2006123468A (ru) 2008-01-10

Similar Documents

Publication Publication Date Title
US11814678B2 (en) Universal short adapters for indexing of polynucleotide samples
US11788139B2 (en) Optimal index sequences for multiplex massively parallel sequencing
EP3495498B1 (en) Gene expression analysis in single cells
US20120214157A1 (en) Method to generate or determine nucleic acid tags corresponding to the terminal ends of dna molecules using sequences analysis of gene expression (terminal sage)
US20030008290A1 (en) Serial analysis of transcript expression using long tags
Bundschuh et al. Complete characterization of the edited transcriptome of the mitochondrion of Physarum polycephalum using deep sequencing of RNA
Abdelsamad et al. Pollen-specific activation of Arabidopsis retrogenes is associated with global transcriptional reprogramming
US20050250100A1 (en) Method of utilizing the 5&#39;end of transcribed nucleic acid regions for cloning and analysis
JP3845416B2 (ja) 遺伝子タグの取得方法
Grünberger et al. Insights into rRNA processing and modification mapping in archaea using nanopore-based RNA sequencing
Salama The complexity of the mammalian transcriptome
Fair Identification of Splicing Pathway Mutations via Targeted Sequencing
WO2023212580A1 (en) Profiling rna at chromatin targets in situ by antibody-targeted tagmentation
US20030215839A1 (en) Methods and means for identification of gene features
WO2004053160A2 (en) Method to analyze polymeric nucleic acid sequence variations

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090825

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110825

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110825

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120825

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120825

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120825

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130825

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees