JP2004313112A - Method for preparing dna design information and method for synthesizing dna - Google Patents

Method for preparing dna design information and method for synthesizing dna Download PDF

Info

Publication number
JP2004313112A
JP2004313112A JP2003113900A JP2003113900A JP2004313112A JP 2004313112 A JP2004313112 A JP 2004313112A JP 2003113900 A JP2003113900 A JP 2003113900A JP 2003113900 A JP2003113900 A JP 2003113900A JP 2004313112 A JP2004313112 A JP 2004313112A
Authority
JP
Japan
Prior art keywords
dna
database
sequence
partial
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003113900A
Other languages
Japanese (ja)
Inventor
Tatsuya Ikeda
達哉 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2003113900A priority Critical patent/JP2004313112A/en
Publication of JP2004313112A publication Critical patent/JP2004313112A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method capable of obtaining a DNA without preparing a conventional gene library and readily synthesizing the DNA from data comprising DNA sequence information. <P>SOLUTION: The subject method for preparing DNA design information on DNA synthesis comprises (1) a step for comparing a partial sequence of a DNA desired to synthesize with an object DNA registered in object DNA database and extracting identical partial sequences (p1-2 and v3-4) and (2) a step for alternately arranging total even number of chains in the order of a sense chain and an antisense chain, starting from a sense chain on 5' end side by using base sequences of template single strands of the extracted partial sequences (p1, p2, v3 and v4) and non-extracted partial sequences (p3-p8), and arranging these chains so that adjacent sense chains and antisense chains and 5' ends and 3' ends have mutually complementary binding regions. The method for synthesizing DNA comprises using the resultant DNA design information. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、DNA合成のためのDNA設計情報の作製方法、および得られた設計情報を用いたDNA合成方法に関し、詳細にはDNAの塩基配列情報に基づいて遺伝子ライブラリーを用いることなくDNAを合成する方法に関する。
【0002】
【従来技術の説明】
研究者や技術者が個々のDNAやタンパク質の構造・機能の解析を試みる際の基本的な技術として、遺伝子クローニング技術がある。該技術は、宿主細胞内で自律複製可能なクローニングベクターに、特定の遺伝子区分を挿入し(挿入されたものを「キメラベクター」という)、このキメラベクターを宿主細胞内に導入することで、特定の遺伝子区分を多量に複製する技術である。遺伝子クローニング技術は、複製する遺伝子区分の周辺にRNA・タンパク質合成ためのプロモーターを配置することにより、挿入DNAが指令するRNA・タンパク質の合成を宿主細胞に多量に行なわせることが可能である。そして、ベクターに挿入された特定遺伝子の発現を観察することによって、細胞内での遺伝子の機能を解析することができる。
【0003】
遺伝子クローニングを行なうには、目的のDNAを含む遺伝子ライブラリーを作製する必要がある。遺伝子ライブラリーとは、対象生物のゲノムDNAまたはcDNAをベクターに連結してできたクローニングベクターの集団である。この遺伝子ライブラリーとポリメラーゼ連鎖反応(以下、「PCR法」という)とを用いて、目的のDNAを増幅させる。PCR法は、増幅したいDNA配列の両端を相補的なプライマーで挟んで、TaqDNAポリメラーゼなどの耐熱性ポリメラーゼを用いて、相補鎖の乖離→アニール→伸張を繰り返すことで、両プライマーに挟まれた遺伝子区分を多量に増幅させる技術である。最大200塩基程度のプライマーは、通常、オリゴDNA合成機で自作するか、またはオリゴDNA合成メーカーにオーダーメイド発注し、合成したものを購入するのが一般的である。
【0004】
【発明が解決しようとする課題】
多くの生物のゲノムや遺伝子の塩基配列が解読され、ポストゲノム時代と呼ばれる現状では、いろいろな遺伝子データベースから遺伝子の塩基配列情報を取得することが極めて容易になった。取得した塩基配列情報に基づいて、DNAを実際に取得したいという状況にも遭遇する。
【0005】
しかし、従来の遺伝子クローニング技術は、遺伝子ライブラリーとPCR法によるDNA複製との組み合わせであるため、まず複製元となる遺伝子ライブラリーを準備する必要がある。しかし、遺伝子ライブラリーの作製から始めるとなると、相当の期間(例えば1ヶ月以上)の期間を要する。2種以上の遺伝子区分をクローニングベクターに挿入しようとすると、2回以上の組換え作業が必要となり、作業的にも時間的にも大きな負担となる。しかも、クローニングベクターに長鎖DNAを挿入したいものの、長鎖DNAが制限酵素で多数に断片化されやすく、その挿入が非常に難しい。制限酵素が予想外の場所で働かないよう設計する必要もあり、長鎖になるほど設計が困難となる。
【0006】本発明の目的は、従来のような遺伝子ライブラリーを作製しなくともDNAを得ることができ、しかもDNAの塩基配列情報というデータからDNAを容易に合成することのできる方法を提供することにある。
【0007】
【課題を解決するための手段】
本発明者は、すでにDNAの塩基配列情報のわかっている相補塩基対をなす長鎖DNAおよび相補塩基対をなさない短鎖DNAを、合成のためのオブジェクト(部品)としてとらえることによって、上記の課題を解決できることを見出した。
【0008】
すなわち、本発明は、(1)合成したいDNAの部分配列と、オブジェクトDNAデータベースに登録されたDNAとを照合して、一致した部分配列を抽出する工程、ならびに (2)抽出した部分配列および未抽出の部分配列の鋳型一本鎖を用い、5’末端側のセンス鎖から始めてセンス鎖、アンチセンス鎖の順に交互に合計偶数本の鋳型DNAを配列し、しかも隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が互いに相補的な結合領域を有するように重複させた配列情報を作製する工程からなるDNA合成のためのDNA設計情報の作製方法、ならびに、(3)前記配列情報に従って部分DNAを準備する工程、(4)2〜10本の連続した前記部分DNAを第一のポリメラーゼ連鎖反応によって連結してモジュール化する工程、および(5)2〜10本の連続した前記モジュールを第二のポリメラーゼ連鎖反応によって連結して合成DNAを得る工程からなるDNAの合成方法を提供するものである。
【0009】
本発明のDNA設計情報の作製方法およびDNAの合成方法(以下、「DNA設計・合成方法」と略す)において、オブジェクトDNAデータベースとは、各種生物に由来するゲノムDNA、cDNA、EST、プライマー、PCR産物、ベクターなどのDNAの塩基配列情報を、実際に取得された情報・所在と関連させて格納したデータベースである。該オブジェクトDNAデータベースは、従来の遺伝子ライブラリーと異なり、染色体の全遺伝子集団を格納する必要はない。本発明の方法では、由来の異なる部分DNAを有機的に結合して目的のDNAを作り上げる。
【0010】
本発明のDNA設計・合成方法は、DNA配列情報に基づく合成方法であるため、合成したいDNAの配列情報は既知である必要がある。DNAの配列情報は、例えばGenBank、DDBJ、EMBLなどのインターネット上の遺伝子データベース、学術文献などから取得できる。このDNA配列情報をそのまま合成に用いれば、天然のDNAを合成することができる。さらに、DNA配列情報を目的に応じて操作することによってDNA改変体を合成することもできる。
【0011】
【発明の実施の形態】
以下、本発明のDNA設計・合成方法を、添付の図面を参照しながら説明する。図1は、本発明のDNA設計・合成方法の全工程を示したフローチャートである。DNA設計情報の作製方法は、工程(1)および(2)を含み、DNA合成方法は工程(1)〜(5)を含む。以下、図1の工程を、順を追って説明する。
【0012】
(1)配列情報をオブジェクトデータベースで検索する工程
本発明のDNA設計・合成方法は、まず、合成したいDNAの配列情報をデータベース検索にかける。図2は、DNA塩基配列情報からデータベースを検索する概念図である。DNAは、直鎖状、円環状のいずれでもよい。合成したい塩基配列の長さは、本発明のDNA設計・合成方法に組み込まれたPCR法で伸長可能な範囲内にある。PCR法の進歩によって塩基長が伸びれば、本発明のDNA設計・合成方法で合成できる塩基長も伸びる。
【0013】
まず、図2に示すように、目的のDNA塩基配列を短鎖オブジェクトDNAデータベース201で検索する。短鎖オブジェクトDNAとは、プライマーまたは鋳型DNAとして使用するものである。短鎖オブジェクトDNAの塩基長は、通常、10〜200塩基、好ましくは15〜120塩基である。プライマーとして抽出される短鎖オブジェクトDNAは、プライマー同士で互いに塩基配列が異なり、相補的な対(センス鎖とアンチセンス鎖との関係)を形成しない。図2の例では、完全一致する短鎖オブジェクトDNAとして、p1およびp3が抽出されている。
【0014】
次に、目的のDNA塩基配列を長鎖オブジェクトDNAデータベース202で検索する。長鎖オブジェクトDNAとは、本発明のDNA設計・合成方法において鋳型DNAとして使用するものである。長鎖オブジェクトDNAは、DNAが実際に取得されればその形態に特に制限がなく、cDNA、ゲノムDNA、合成DNA、ベクターなどである。長鎖オブジェクトDNAデータベース202には、公共の遺伝子構造解析プロジェクトで解明されたヒト、シロイナズナ、ショウジョウバエ、細菌などの各種生物のゲノム・cDNAライブラリーの一部または全部、さらに市販のcDNA・ゲノムライブラリーの一部または全部を用いることができる。
【0015】
長鎖オブジェクトDNAデータベース202には、ベクターDNAを登録しておくことが好ましい。従来、遺伝子ライブラリーからのPCR産物をクローニングベクターにサブクローニングするときには、ベクターとPCR産物とのライゲーションに先立ち、制限酵素処理が必要であった。しかし、制限酵素処理は、作製したPCR産物を断片化する恐れがあり、特に長鎖DNAをベクターに組み込むことを困難にしていた。本発明のDNA設計・合成方法では、ベクターDNAをオブジェクトとして合成に組み込むことが可能なため、上記の制限酵素処理を必要としない。したがって、長鎖DNAをベクターに組み込むことも容易となる。さらに、本発明のDNA設計・合成方法では、既存のクローニングベクターと部分的に異なるもの(例えば塩基置換、デリューション、SNP)の作製や、一部省略によるカスタマイズが非常に容易になる。さらに、本発明の方法では、2種以上の遺伝子区分を一個のクローニングベクターに組み込むことも容易である。
【0016】
クローニングベクターの種類には、プラスミド、ファージ、ウイルス、コスミド、酵母人工染色体などがあり、挿入遺伝子の長さ、用途などに応じて適当なベクターを使い分ける。プラスミドベクターは、多くの細菌に存在する小型の核外遺伝子であって、通常、5〜10kbpの外来性DNAを組み込むことができる。プラスミドベクターは、現在、試薬企業・研究機関により機能別に作製・販売されている。例えば、大腸菌由来のプラスミドにはpBR322、pBR325、pUC12、pUC13、pUC18、pUC19、pBluescript IIおよびpETがあり、枯草菌由来のプラスミドにはpUB110、pTP5およびpC194があり、そして酵母由来プラスミドにはpSH19およびpSH15がある。
【0017】
λファージは、大腸菌に寄生するウイルスであって、15〜20kbpの外来性DNAを埋め込めるベクターである。該ファージの代表例には、λgt10、λgt11、λZAPIIがある。コスミドは、λファージのcos部位をもったプラスミドであって、約40kbpまでの外来性DNAを組み込むことができる。バキュロウイルス、ワクシニアウイルス、レトロウイルスなどのウイルスベクターも使用できる。無害化したウイルスベクターは、特に遺伝子治療用のベクターとして有用である。
【0018】
上記ベクターには、ベクター導入の有無やクローニングの成否を区別するための選択マーカーが組み込まれている。限定するものではないが、大腸菌その他の細菌におけるテトラサイクリンまたはアンピシリン耐性;真核細胞培養についてのジヒドロ葉酸還元酵素またはネオマイシン耐性などが挙げられる。
【0019】
長鎖オブジェクトDNAデータベース202には、本発明のDNA設計・合成方法で取得されたPCR産物、モジュール、キメラベクターのDNAもまた、適宜登録されている。これらの再利用は、オリゴオブジェクトDNA作製のコストと時間の削減に貢献する。
【0020】
生物種間で機能を同じくする遺伝子であっても、生物進化によって塩基配列が部分的に異なっている。本発明で合成したいDNAの部分配列と長鎖オブジェクトDNAデータベース202との照合作業では、目的DNAと部分一致したDNAもまた抽出することが好ましい。部分一致するDNAを積極的に利用することで、データベース利用を促進し、オリゴオブジェクトDNA合成の必要性を一層削減することができる。例えば、部分一致配列が200塩基以上もあれば、鋳型DNAとして活用できる。図2の例では、長鎖オブジェクトDNAデータベース202に完全一致するDNAオブジェクトは見つからなかったものの、部分一致する長鎖DNAオブジェクトv3とそのアンチセンス鎖であるv4を抽出している。
【0021】
上記したような合成したいDNAの部分配列とオブジェクトDNAデータベースとの照合作業は、通常、コンピュータに格納されたコンピュータプログラムにより実行される。図3は、データベース抽出処理を実行するシステムの一例である。該システムは、システム全体を統括的に制御するプログラムされた主制御部301に、外部記憶装置302が接続されてなる。主制御部301には、キーボード、マウスなどの入力装置306、入力データをモニタする表示装置307および演算結果を出力する出力装置308が入出力制御部305を介して接続されている。主制御部301は、OSなどの制御プログラム、DNA設計情報の作製プログラム(外部記憶装置から読み込まれるものを含む)、およびデータを一時格納する内部メモリを有し、上記プログラムはデータベース抽出処理制御部303および設計情報作製処理制御部304からなる。外部記憶装置302は、HD、MO、CD、DVDなどのストレージ手段であり、短鎖オブジェクトDNAデータベース201および長鎖オブジェクトDNAデータベース202が格納されている。
【0022】
図4に、データベース抽出処理制御部303が実行する手順の一例を示す。まず、合成したいDNAの配列情報をデータベース抽出するための初期処理を行なう。初期処理の一例として、目的DNAの塩基配列を、5’末端から3’末端方向に1塩基ずつずらしながら16塩基に分割(S401)した後、各断片の塩基配列を16進数変換(例えばAA:0、AT:1 … CG:e、CC:f)や、さらに256進数変換することによって情報量を圧縮する(S402)ことなどが挙げられる。次いで、各分割断片(16塩基)について、短鎖オブジェクトデータベース201を検索する(S403)。候補が検索された場合に、目的配列内に完全一致する部分があるか否かを検索する(S404)。複数回一致することを考慮して、全長にわたり検索を繰り返す。完全一致した場合には、一致したオブジェクトを一致情報(塩基配列、方向、一致位置)と関連づけて抽出する(S405)。すべての分割断片について検索したら、S403に戻って、アンチセンス(逆)鎖についても同じ処理を行なう。
【0023】
短鎖オブジェクトDNAデータベース201を用いた検索処理が終了したら、長鎖オブジェクトDNAデータベース202の検索を前記短鎖オブジェクトDNAデータベースと同様に行なう(S406〜408)。ただし、ここの検索では、目的DNAの塩基配列の部分配列と部分一致するオブジェクトDNAも抽出する。具体的には、一致情報から一致部品の末端を検出し、データベース登録内容と比較することにより、前方部分一致(5’方向)と後方部分一致(3’方向)を検出し、一致した内容を順次つなげてゆき部分一致情報(塩基配列、方向、一致位置)を作製する。
【0024】
なお、短鎖および長鎖オブジェクトDNAデータベースの抽出処理は、上記した検索手法以外にも、例えばホモロジー検索として周知の検索手法のアルゴリズム(BRAST、FASTAなど)を採用することも可能である。ただし、検索の際には、部分的にも一致度100%のDNAのみを抽出する。
【0025】
(2)DNA設計情報を作製する工程
工程(1)で抽出した部分配列、およびその鎖間情報(すなわち抽出した部分配列の空隙を埋める未抽出の部分配列)の鋳型一本鎖を用いて、DNA合成のための設計情報を作製する。図5に設計情報作製の概念図を示す。設計条件として、5’末端を有するセンス鎖(図5のp1)から始めて、センス鎖、アンチセンス鎖の順に交互に合計偶数本の一本鎖を配列する。センス鎖の5’末端は、対になるアンチセンス鎖と少なくとも平滑であるか、またはp1のように突出している。オブジェクトDNAデータベースに一致した部分配列(図5のp1、p2、v3およびv4)があればそれを用い、もしもない場合には、オリゴオブジェクトDNA(図5のp3〜p8)を合成して鎖間を埋める。オリゴオブジェクトDNAは、通常、40〜200塩基の範囲で設計する。鎖間が大きく空いているときには、複数のオリゴオブジェクトに割り振り、それらをセンス鎖、アンチセンス鎖と互い違いに配列する。
【0026】
隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が互いに相補的な結合領域を有するように一本鎖を配列する。隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が相補的な結合領域は、全体で一本鎖を形成するときの糊代になる。PCR法において、糊代部分が起点となって5’→3’方向にDNA伸長が行なわれ、PCRサイクルを繰り返すうちに最終的に全体で一本のDNAを得る。糊代の長さはPCR法のアニール温度に応じて決める。通常、糊代のTm(融解温度)が50〜70℃、好ましくは55〜65℃になるように決める。1モジュール内のTmと、モジュール間のTmとで温度差をつけることも可能である。例えば1モジュール内のTmをモジュール間のTmよりも若干低く設定することによって、糊代部分の長さを短くすることができ、その結果、オリゴDNA作製コストの低減につながる。
【0027】
上記の設計処理作業は、図3のコンピュータシステムの設計情報作製処理の制御部304が実行する。図6に、制御部304が実行する内容のフローチャートを示す。まず、糊代のTm(融解温度)を設定する(S601)。各モジュール内の複数の糊代のTmは、通常、ほぼ等しく設定する。モジュール間の複数の糊代のTmについても同様である。次に、設定Tmを用いて補充鎖算出のための糊代長aを予測する(S602)。予測には、一般に糊代のGC塩基含量が高いほど糊代の結合力が強くなり、Tmが高くなる関係を利用する。Tmと糊代長の間には、例えば、以下の近似式(1):
【0028】
【数1】

Figure 2004313112
(式中、aは糊代の塩基数、nは鎖間の塩基数、GC塩基数は鎖間のGC含量、AT塩基数は鎖間のAT含量、Tm’は鎖間のATが最も続く場所のTm値である)が成り立つ。あるいは、近似式(2):
【数2】
Figure 2004313112
(式中、aは糊代の塩基数、GC塩基数は糊代のGC含量、AT塩基数は糊代のAT含量である)
が成り立つ。
【0029】
次に、抽出した部分配列の隣接鎖間距離X(例えば、図5のp1−p2間)測定する(S603)。ここで、X≧0ならば隣接鎖は重ならず、X<0ならば隣接鎖が重なることを意味する。X≧0の場合はS605に進み、それ以外はS604にて鎖間調整する。短鎖が重なっている場合は、重なっているどちらかの隣接鎖を間引き、長鎖の場合は重なり部分Xを設定Tmから予測される糊代長a、または0以下まで削る。
【0030】
S605に進み、鎖間を埋めるための最適な補充鎖(オリゴオブジェクトDNA)を算出する。個々の予測糊代長aのTmを上記式(1)または(2)で計算し、Tmが設定値からずれていれば、糊代長を変更することで設定Tmに近づける。鎖間が大きく空いていてオリゴDNA合成機の合成限界(設計時に設定した鎖長)を超えるときには、複数のオリゴオブジェクトDNAを割り当てる。S606に進み、オリゴオブジェクトDNA、短鎖オブジェクトDNAまたは長鎖オブジェクトDNAの塩基配列の糊代部分の配列が異なるかをチェックする。同一の糊代を作らないことによりミスマッチ増幅を回避する。上記の条件に反する場合には、S604に戻って鎖間調整を繰り返す。S607で、DNA合成のための設計情報を出力する。図5に、DNA設計情報の処理結果の一例を示す。ここでは、抽出した部分配列(p1、p2、v3およびv4)の鎖間を埋めるために、p3〜p8のオリゴオブジェクトDNAを配置している。設計情報の出力方式は、紙媒体でも電子媒体でもよい。
【0031】
(3)部分DNAおよびオリゴオブジェクトDNAを準備する工程
上記で得られたDNA設計情報に基づいて、部品となる短鎖オブジェクトDNAを短鎖オブジェクトDNA格納庫から出庫する。同じように、部品となる長鎖オブジェクトDNAを長鎖DNA格納庫から出庫する。長鎖オブジェクトDNAの一部分が必要な場合には、必要な部分配列をプライマーで挟んでPCR法で切り出す。
【0032】
データベースに登録されておらず、合成の必要なオリゴオブジェクトDNAは、オリゴDNA自動合成機で合成する。オリゴDNA自動合成機は、入力された塩基配列を基に、チューブで結合され試薬、溶媒を入れたボトルのバルブを開閉させながら固相上に必要な試薬を順に送り出す装置である。DNA合成機は、チューブから送り出される、固相上で反応させたい基以外を保護したヌクレオチド同士を、縮合剤を用いて結合させ、五炭糖の3’と5’の間でリン酸ジエステル結合を形成させるサイクルを次々と繰り返すことにより、3’→ 5’へDNA鎖を合成連結させる。オリゴオブジェクトDNA合成は、オリゴDNA受託合成メーカーに依頼して調達することもできる。
【0033】
(4)モジュール化工程
モジュール化とは、工程(3)のDNA設計情報に基づいて、部分DNAおよびオリゴDNAの連続鎖からなる2〜10本、好ましくは2〜6本のモジュール単位を連結することをいう。本発明のDNA設計・合成方法では、部分DNAを一旦モジュール化し、そのモジュールをさらに連結することで、DNAの増幅に偏りが生じて全長DNAが得られないなどの事態を回避することができる。図5の設計情報例を用いたモジュール化の概念図を図7に示す。登録された短鎖オブジェクトDNA(p1〜p2)および合成オリゴオブジェクトDNA(p3〜p6)でモジュール1を形成し、登録された部分一致長鎖オブジェクトDNA(v3〜4)でモジュール2を形成し、そして合成オリゴオブジェクトDNA(p7〜p8)でモジュール3を形成している。
【0034】
以下に、PCR法によるモジュール化を具体的に説明する。短鎖・長鎖オブジェクトDNAおよび合成したオリゴオブジェクトDNA、PCR法の原料であるdNTPs(デオキシヌクレオチド類)、塩、ならびに耐熱性DNAポリメラーゼで反応液を作る。耐熱性ポリメラーゼは、細菌由来のpol I型酵素(例えばTaq DNAポリメラーゼ)、始原菌由来のα型酵素(例えばpfu DNAポリメラーゼ、KOD DNAポリメラーゼ)のいずれでもよく、さらにこれらを二種混合したものでもよい。これらは試薬メーカーから市販されているもの、例えばTakara Ex Taq、Pyrobest DNA Polymerase(以上、TaKaRa社製)、KOD+(TOYOBO社製)などを制限なく使用することができる。DNAポリメラーゼの濃度は、通常、0.25単位/μlである。バッファーは、前記市販の耐熱性ポリメラーゼに同梱された10×バッファーを使用すればよい。例えばTaqポリメラーゼの10×バッファーには、通常、Tris−HCl10〜25mM、KCl50mM、およびMgCl1〜5.0mMが含まれている。
【0035】
鋳型DNAの濃度は、通常、数十pg/μl〜数ng/μlである。プライマーは、通常、0.2〜10μM用意する。プライマーが少なすぎると反応が進まず、逆に多すぎると非特異的な増幅の原因となる場合がある。dNTPsは各0.2〜2mM用意する。
【0036】
上記の反応液を加温し、鋳型DNAの二本鎖を乖離させる。次に、それぞれの一本鎖の相補的部分に重複するプライマー(隣の鋳型DNA)が二本鎖を形成(アニール)する温度に冷却する。最後に、相補部分を起点として耐熱性ポリメラーゼ酵素によって5’→3’方向にDNA伸長を行なう。このサイクルを繰り返すことにより、連続した部分DNAおよびオリゴDNAのモジュール化を達成する。
【0037】
PCR法の条件に関して、鋳型兼プライマーDNAのアニール温度は、設計時に設定した糊代のTmに設定する。PCR法の各ステップ(変性、アニール、伸長)にかける時間と温度は、例えば熱変性(93〜97℃)で30秒、アニール(糊代のTm)で30秒、伸長反応(68〜72℃)で0.5〜1分×増幅する鎖長(kb)である。サイクル数は、合成したいDNA量に依存するが、一般に30〜40サイクルでよい。
【0038】
(5)モジュール連結工程
上記で得られた連続するモジュールを、通常、2〜10本、好ましくは2〜6本PCR法で連結する。PCR法の手順および条件は、(4)のモジュール化工程と同様である。図7の例では、プライマーとしてp1およびp8を用いて、モジュール1〜3を連結している。オブジェクトDNAにベクターを使用した場合など、合成DNAを閉環する必要があるときには、セルフライゲーション操作を行う。T4ファージのDNAカイネ−スおよびリガーゼが2本鎖DNAの平滑末端同士を直接結合するのに用いられる。市販のライゲーションキットを使用することもできる。
【0039】
このように、本発明の設計・合成方法は、目的遺伝子の遺伝子ライブラリーを作製およびスクリーニングする必要がないので、10kbp以上の長鎖DNAでも3〜4日という短期間で作製可能である。
【0040】
(6)サブクローニング工程
サブクローニングは、DNA合成時にベクターDNAをオブジェクトとして組み込んでおけば省略することができる。しかし、上記合成DNAにベクターDNAが結合していない場合や、機能解析やタンパク質発現のためにベクターを乗せ換えるなどの必要がある場合には、以下の方法でサブクローニングする。
【0041】
クローニングベクターの挿入部位に、目的特定遺伝子区分を挿入して使用する。クローニングベクターに挿入する方法は、従来公知の方法を使用することができる。挿入の準備として、クローニングベクターを特定部位で切断する制限酵素により、クローニングベクターの挿入目的部位を切断する。PCR法により含成された合成DNAの末端を、クローニングベクターの挿入目的部位と連結可能なように制限酵素などで加工する。通常は、プライマー設計時にスムースに連結できるように細工する。最後に、PCR法により含成されたDNAと特定部位で切断したクローニングベクターとを、DNAライゲース酵素を用いて連結する。
【0042】
(7)形質転換工程
次いで、(5)または(6)のキメラベクターを宿主細胞に導入する。宿主細胞は、クローニングベクターが安定かつ自律的に増殖可能なものであれば、制限なく使用することができる。宿主細胞の例には、大腸菌、ストレプトマイセス、サルモネラ・チフィムリウムなどの細菌;酵母などの真菌;ショウジョウバエS2、シロナヨトウSf9などの昆虫細胞;CHO、COS、Bowes黒色腫細胞などの動物細胞;ならびに植物細胞が挙げられる。
【0043】
ベクターの細胞への導入方法として、エレクトロポレーション、DEAE−デキストラン、リン酸カルシウム沈殿、リポソーム媒介融合(リポフェクション)、マイクロインジェクション、複製能のないウイルスによる形質導入などがある。宿主細胞に応じて導入法を使い分ける。
【0044】
キメラベクターが挿入された宿主細胞は、適当な培地上にプレーティングを行なって培養し、単一のベクターを有する単一宿主細胞由来のコロニーを形成させる。培地中には、細胞の生育に必要な炭素源、窒素源、無機物などを含有させる。炭素源としては、グルコース、シュクロースなどの糖類;グリセロールなどのアルコール類;有機酸などが適宜使用される。窒素源としては、アンモニアまたはアンモニウム塩類、アミン類、その他の窒素化合物、あるいはペプトン、大豆加水分解物、発酵菌体分解物などの天然窒素源を用いることができる。無機塩としては、例えばリン酸一水素カリウム、リン酸二水素カリウム、硫酸マグネシウムがある。添加物として酵母、ビタミン類、成長促進因子などを添加してもよい。目的のキメラベクターをもった宿主細胞のみを培養するための選択マーカーとして、また雑菌の繁殖を防ぐために、ベクターの薬剤耐性遺伝子に対応する抗生物質を培地中に加える。例えば、アンピシリン耐性遺伝子を有するベクターを含む大腸菌を培養するには、大腸菌用LB培地に抗生物質アンピシリンを添加する。
【0045】
クローニングベクターは宿主細胞内で多量に自己増幅する。DNAの合成が適確に行なわれたか否か、目的物の品質はどうかなどをチェックする方法には、宿主細胞コロニーのミニプレップ処理などでクローニングベクターを精製した後、挿入DNAの全長または部分長をベクターから切り出し、切り出されたDNAを電気泳動でチェックする方法、PCR方法によるチェック、コロニーハイブリダイゼーション法、カラーセレクションなどがある。
【0046】
(8)遺伝子発現工程
宿主細胞に目的の合成DNAの産物(タンパク質)を作らせたい場合には、ベクターに発現ベクターを使用すればよい。発現ベクターは、プロモーターおよびターミネーターと連結したベクターである。プロモーターは、遺伝子の発現に用いる宿主に対応して適切なプロモーターであればいかなるものでもよい。形質転換する際の宿主がバチルス属菌である場合は、SPO1プロモーター、SPO2プロモーター、penPなどが利用でき、動物細胞である場合には、SV40由来のプロモーター、レトロウイルスのプロモーター、メタロチオネインプロモーター、ヒートショックプロモーター、サイトメガロウイルスプロモーター、SRαプロモーターなどが利用できる。市販の発現ベクターには、例えばpUC系、pBluescript II、pETおよびλgt11がある。合成DNAはリボソーム結合部位(SD配列)の後に組み込まれる。
【0047】
遺伝子発現の形態には、宿主細胞内にタンパク質を生産させる方法、宿主細胞外にタンパク質を分泌させる方法、宿主細胞外膜上にタンパク質を生産させる方法などがある。タンパク質を宿主細胞で発現させた後、培養物から目的タンパク質を単離精製する。公知の分離操作、例えば、尿素などの変性剤や界面活性剤による処理、超音波処理、酵素消化、塩析、溶媒沈殿法、透析、遠心分離、限外濾過、ゲル濾過、SDS−PAGE、等電点電気泳動、イオン交換クロマトグラフィー、疎水性クロマトグラフィー、アフィニティークロマトグラフィー、逆相クロマトグラフィーなどを適宜併用することができる。
【0048】
前記クローニングベクターをマウスなどの動物の受精卵に導入し、または動物に直接注入することにより、トランスジェニック動物やノックアウト動物を作ることも可能である。
【0049】
(9)DNA保管・登録工程
上記工程で得られた新規なオリゴオブジェクトDNA、合成DNA、合成DNAを組み込んだキメラベクターは、その一部を格納庫に保管する。例えば、共有を許される物は共有用の格納庫に保管し、一方、共有を許されない物は預かり用の格納庫に保管する。さらに、これらの保管されたオブジェクトDNAの塩基配列情報を、格納情報と関連付けて、短鎖・長鎖オブジェクトデータベースに登録する。登録によって、次回のDNA合成に既存の資源を有効活用することが可能となる。
【0050】
次に、本発明のDNA設計・合成方法の変形例を示す。図8は、DNA合成の依頼元、DNA設計情報の作製拠点およびDNAの合成拠点が別個に存在する例である。本発明のDNA設計・合成方法では、短鎖・長鎖オブジェクトDNAデータベースを充実させるほど効果が増すので、図8のようにDNA設計およびDNA合成の専門拠点を置くことは好ましい。
【0051】
この使用態様では、DNA合成を希望する依頼者は端末801からインターネットあるいは通信回線を介してDNA合成システムへアクセスする。DNA合成システムは、サーバコンピュータ803、短鎖オブジェクトDNAデータベース804、および長鎖オブジェクトDNAデータベース805(適宜、共有用データベースと依頼者特定データベースに分かれている)からなり、さらにオブジェクトDNA格納庫807(適宜、共有または依頼者特定格納庫に分かれている)およびオリゴDNA自動合成機808へDNA設計情報806を送付する手段を有する。
【0052】
図9は、上記DNA合成システムにおける上記三者間の手続きの流れを示す図である。研究者、技術者などの依頼者は、依頼者端末801からインターネットを介してゲノムネットなどの遺伝子情報データベース802にアクセスし、また、学術情報誌を入手することによって、合成したいDNAの配列情報を取得する(S901)。あるいは、用途や研究目的に沿って既知のDNA配列情報を基に一部改変したDNA配列情報を作製する。
【0053】
依頼者は、合成を依頼したいDNA配列情報をインターネット、通信回線などを通じてDNA合成システム(サーバコンピュータ803)に送る(S902)。DNA合成システムのサーバコンピュータ803が配列情報を受け取り、短鎖オブジェクトDNAデータベース804および長鎖オブジェクトDNAデータベース805を検索し、一致または部分一致する部分DNAを抽出する(S903)。得られた部分DNAの塩基配列情報とそれらの鎖間情報を用いて、DNA合成のための設計情報806を作製する(S904)。作製されたDNA設計情報806は、依頼者へ送るか、あるいはDNA合成ために生産拠点へ送付する。DNA設計情報の作製の情報拠点、オリゴDNA合成、PCR、シーケンスなどの拠点が離れていてもかまわない。
【0054】
DNA生産拠点では、担当者が設計情報806に基づいて、短鎖オブジェクトDNA格納庫および長鎖DNAオブジェクトDNA格納庫から必要なオブジェクトDNAを出庫し、足りないオリゴオブジェクトDNAについてはオリゴDNA自動合成機で合成する(S905)。得られた部品とPCR法を用いてオブジェクトDNAのモジュール化とモジュール連結を行なう(S906、S907)。連結された合成DNA810は、検査後、その状態であるいは凍結乾燥などの処理を施した後に依頼者へ届ける。また、適宜のサブクローニング後(S908)、クローニングベクターを宿主細胞に接種して形質転換し(S909)、形質転換細胞内でベクターを自律増殖させ、あるいは遺伝子を発現させてタンパク質を得て(S910)から、DNA、タンパク質などを依頼者に届けてもよい。形質転換したノックアウト動物またはやトランスジェニック動物811を供給することもできる。
【0055】
本発明のDNA設計・合成方法は、上記の使用態様以外にも応用または変形が可能である。その一例は、オブジェクトDNAデータベース;合成したいDNAの部分配列と、オブジェクトDNAデータベースに登録されたオブジェクトDNAとを照合して、一致した部分配列を抽出するデータベース抽出手段;ならびに抽出された部分配列および非抽出の部分配列の鋳型一本鎖の塩基配列を用いて、5’末端側のセンス鎖から始めてセンス鎖、アンチセンス鎖の順に交互に合計偶数本配列し、しかも隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が互いに相補的な結合領域を有するように配列する設計情報作製手段を備えたDNA設計システムである。また別の一例は、(1)合成したいDNAの部分配列と、オブジェクトDNAデータベースに登録されたオブジェクトDNAとを照合して、一致した部分配列を抽出する工程、ならびに(2)抽出された部分配列および非抽出の部分配列の鋳型一本鎖の塩基配列を用いて、5’末端側のセンス鎖から始めてセンス鎖、アンチセンス鎖の順に交互に合計偶数本配列し、しかも隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が互いに相補的な結合領域を有するように配列する工程をコンピュータに実行させるためのプログラムである。さらにまた別の一例は、該プログラムを記録したコンピュータ読取可能な記録媒体である。
【0056】
【実施例】
以下に、実施例を用いて本発明のDNA設計・合成方法をさらに詳細に説明する。
〔実施例1〕
塩基配列(配列番号1)の概要を図10に示すDNAの合成を行なった。この塩基配列は、図11の制限酵素地図に示されるように、クローニングベクターpBluescript II SK(+)(2961bp、以下「pBSK+」と略す)のマルチクローニングサイト(MCS)に、112bpのDNA断片を挿入した全長3073bpの環状のDNAである。図10のT7−T3間がMCSであり、また、下線で示した領域が今回pBSK+へ挿入する配列である。
【0057】
(1)データベース抽出
目的の環状DNAを、図3のシステムのデータベース抽出処理制御部303に、図4に示す手順でデータベース抽出処理を実行させた。あらかじめ、短鎖オブジェクトデータベースには、既存の各種プライマーを登録しておき、一方、長鎖オブジェクトデータベースには、pBSK+を登録しておいた。データベース抽出の結果を図12に示す。短鎖オブジェクトDNAデータベースからは、図12のDNA1(斜線矢印部分)が見つかった。長鎖オブジェクトDNAデータベースからは、図12のDNA2(白抜き矢印部分)が見つかった。DNA2がpBSK+であることから、本データベース抽出処理が順調に遂行されたことを確認した。
【0058】
(2)DNA設計情報作製
上記抽出された部分DNAとその鎖間情報とから、図3のシステムの設計情報作製処理制御部304に、図6に示す手順でDNA設計情報作製処理を実行させた。設計条件として、モジュール内およびモジュール間のTmを60℃とし、オリゴオブジェクトDNAの最大設計長を59塩基とした。短鎖オブジェクトDNAデータベースから抽出したDNA1を使用すると、糊代が足りなくなるため間引きし、新たにオリゴオブジェクトDNAとしてP1〜P4を作るという演算結果を得た。DNA合成のための設計情報の概観を図13に示す。また、各オブジェクトDNAの塩基配列情報を図14および15に示す。オブジェクトDNAのモジュールの組み合わせとTmを表1にまとめた。
【0059】
【表1】
Figure 2004313112
【0060】
(3)オブジェクトDNAの準備
上記設計情報に従ってオブジェクトDNAを準備した。まず、上記P1〜P4を、オリゴDNA合成機を用いて合成した。次いで、P5およびP6の切り出しに用いるプライマーV1(配列番号7)およびV2(配列番号8)を、オリゴDNA合成機を用いて合成した。長鎖オブジェクトDNAの格納庫からpBSK+を出庫し、上記プライマー(V1およびV2)を用いてPCR法でP5およびP6を切り出した。PCR法の反応液の組成および温度サイクルを、それぞれ、表2および図16に示す。
【0061】
【表2】
Figure 2004313112
【0062】
(4)モジュール化
P1〜P4を鋳型としたPCR法(プライマーとしてP1およびP4を使用)によって、モジュール2を作製した。PCR法の反応液の組成を表3に示す。温度サイクル条件は図16と同様に指定した。
【0063】
【表3】
Figure 2004313112
【0064】
図17にモジュール1および2の電気泳動結果を示す。図中、レーン▲1▼はpBSK+をプライマーV1、V2でPCRを行った後の産物を電気泳動したものであり、2000〜3000塩基あたりにバンドが確認された。レーン▲2▼はP1〜P4をプライマーP1、P4でPCRを行った産物を電気泳動したものであり、500塩基未満のバンドが確認された。
【0065】
(5)モジュール1とモジュール2との連結
(4)のモジュール1および2をエタノール沈殿後、サンプル濃度を調整し、次いで、モジュール1および2を鋳型としてV1およびP1プライマーでPCRを行った。表4および図18に反応液の組成および温度サイクル条件を示す。
【0066】
【表4】
Figure 2004313112
【0067】
上記PCR産物のサンプル濃度を変えて電気泳動した結果を図19に示す。図19において、モジュール1、モジュール2、およびモジュール1+2(モジュール1と2との連結)と予想されるバンドを確認した。
【0068】
(6)セルフライゲーション
電気泳動結果から、モジュール1+2のバンドを切り出し、Gel Extraction Kit(Qiagen社製)で精製後、末端部ブラントエンド(715、716)のセルフライゲーション(16℃×2時間)を行って、直鎖状DNAを閉環した。ライゲーション反応液の組成を表5に示す。
【0069】
【表5】
Figure 2004313112
【0070】
(7)形質転換
セルフライゲーションによって末端同士を再結合したキメラベクターを、コンピテントな状態の大腸菌(DH5α株)に形質転換した。形質転換された大腸菌はLB−AMP培地で順調に増殖した。培地から10個の大腸菌コロニーを選択してミニプレップした後、得られた精製物を電気泳動にかけた。その結果を図20に示す。電気泳動結果の中からレーン▲6▼、▲7▼および▲8▼を選択し、そのシーケンスを行った。その際、PT7プライマーでインサート部分を順方向にシーケンスし、PT3プライマーでインサート部分を逆方向にシーケンスした。シーケンスの結果から目的配列がマルチクローニングサイトに挿入されていることを確認した。
【0071】
【発明の効果】
本発明のDNA設計・合成方法は、DNAの複製ではなく合成であるため、従来のような遺伝子ライブラリーを準備して、スクリーニングする必要がない。したがって、所望のDNAを短期間で取得することが可能になる。本発明の方法はまた、合成するDNA配列情報を変更することによって自由な遺伝子設計が容易になる。さらに制限酵素処理を省略できるので、クローニングベクターの作製が従来方法よりも簡単になる。クローニングベクター自体の加工も可能となる。そして、一度作製したオリゴDNA、合成DNA(PCR産物)などの再利用が可能である。オブジェクトデータベースを充実させることによって、DNA合成コストの一層の削減が図れる。
【0072】
【配列表】
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112

【図面の簡単な説明】
【図1】本発明のDNA設計・合成方法の全工程を示したフローチャートである。
【図2】DNA塩基配列情報からデータベースを検索する概念図である。
【図3】本発明のDNA設計情報の作製方法を実行するコンピュータシステムの一例である。
【図4】図3のシステムにおいて、データベース抽出処理制御部が実行する作業のフローチャートである。
【図5】本発明のDNA設計・合成方法における設計情報作製の概念図である。
【図6】図3のシステムにおいて、設計情報作製処理制御部が実行する作業のフローチャートである。
【図7】本発明のDNA設計・合成方法におけるモジュール化の概念図である。
【図8】本発明のDNA設計・合成方法の応用例である。
【図9】図8のDNA合成システムにおける手続きの流れを示すフローチャートである。
【図10】本発明に従う実施例1で合成したいDNAの塩基配列の説明図である。
【図11】図10の合成したいDNAの塩基配列を制限酵素地図で表したものである。
【図12】図10のDNA塩基配列情報をオブジェクトDNAデータベース検索した結果を示す図である。
【図13】図10のDNA合成のための設計情報を示した図である。
【図14】DNA合成に用いるオブジェクトDNA(p5)の塩基配列である。
【図15】DNA合成に用いるオブジェクトDNA(p1〜p4)の塩基配列である。
【図16】本発明に従う実施例1において、オブジェクトDNA(p5、p6)を切り出すために行ったPCR法の温度サイクルを示す図である。
【図17】実施例1のモジュール1および2の電気泳動結果を示す図面代用写真である。
【図18】本発明に従う実施例1において、モジュール1と2とを連結するために行ったPCR法の温度サイクルを示す図である。
【図19】図18のPCR産物の電気泳動結果を示す図面代用写真である。
【図20】形質転換後のベクター精製物の電気泳動結果を示す図面代用写真である。
【符号の説明】
201 短鎖オブジェクトDNAデータベース
202 長鎖オブジェクトDNAデータベース
301 主制御部
303 データベース抽出処理制御部
304 設計情報作製処理制御部
803 サーバコンピュータ
804 短鎖オブジェクトDNAデータベース
805 長鎖オブジェクトDNAデータベース
806 DNA設計情報
807 オブジェクトDNA格納庫
808 オリゴDNA自動合成機
810 合成DNA
811 ノックアウト動物またはやトランスジェニック動物[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method for producing DNA design information for DNA synthesis, and a method for synthesizing DNA using the obtained design information. More specifically, the present invention relates to DNA synthesis without using a gene library based on DNA base sequence information. Related to the method of synthesis.
[0002]
[Description of the Prior Art]
Genetic cloning technology is a basic technology used by researchers and engineers to analyze the structure and function of individual DNAs and proteins. This technique involves inserting a specific gene segment into a cloning vector that can autonomously replicate in a host cell (the inserted gene segment is referred to as a “chimeric vector”), and introducing the chimeric vector into a host cell. Is a technology that replicates a large number of gene segments. In the gene cloning technique, by arranging a promoter for RNA / protein synthesis around a gene section to be replicated, it is possible to cause host cells to synthesize a large amount of RNA / protein directed by the inserted DNA. Then, by observing the expression of the specific gene inserted into the vector, the function of the gene in the cell can be analyzed.
[0003]
To perform gene cloning, it is necessary to prepare a gene library containing the target DNA. A gene library is a group of cloning vectors formed by ligating genomic DNA or cDNA of a target organism to a vector. The target DNA is amplified using the gene library and the polymerase chain reaction (hereinafter, referred to as “PCR method”). In the PCR method, a DNA sandwiched between both primers is obtained by sandwiching both ends of a DNA sequence to be amplified with complementary primers and using a heat-resistant polymerase such as Taq DNA polymerase to repeat dissociation of complementary strand → annealing → extension. This is a technique for amplifying a large number of categories. In general, a primer having a maximum of about 200 bases is generally produced by an oligo DNA synthesizer by itself, or an order is custom-made to an oligo DNA synthesis maker to purchase a synthesized primer.
[0004]
[Problems to be solved by the invention]
The genomes of many organisms and the nucleotide sequences of genes have been decoded, and in the post-genome era, it has become extremely easy to obtain nucleotide sequence information of genes from various gene databases. There is also a situation where it is desired to actually obtain DNA based on the obtained base sequence information.
[0005]
However, since the conventional gene cloning technique is a combination of a gene library and DNA replication by the PCR method, it is necessary to first prepare a gene library to be a replication source. However, starting from the production of a gene library requires a considerable period of time (for example, one month or more). In order to insert two or more gene segments into a cloning vector, two or more recombination operations are required, resulting in a large burden in terms of work and time. In addition, although it is desired to insert a long-chain DNA into a cloning vector, the long-chain DNA is easily fragmented into a large number with a restriction enzyme, and the insertion is very difficult. It is necessary to design the restriction enzyme so that it does not work in unexpected places, and the longer the chain, the more difficult it is to design.
[0006] An object of the present invention is to provide a method that can obtain DNA without preparing a conventional gene library and that can easily synthesize DNA from data of DNA base sequence information. It is in.
[0007]
[Means for Solving the Problems]
The present inventor considers long-chain DNAs forming complementary base pairs and short-chain DNAs not forming complementary base pairs, for which the base sequence information of DNA is already known, as objects (parts) for synthesis. We found that we could solve the problem.
[0008]
That is, the present invention provides (1) a step of comparing a partial sequence of a DNA to be synthesized with DNA registered in an object DNA database to extract a matched partial sequence; Using the template single-strand of the extracted partial sequence, a total of an even number of template DNAs are arranged alternately in the order of the sense strand and the antisense strand, starting from the sense strand on the 5 ′ end side, and the adjacent sense strand and antisense strand (3) a method for preparing DNA design information for DNA synthesis, comprising the steps of preparing sequence information in which the 5 ′ end and the 3 ′ end have a binding region complementary to each other. Preparing a partial DNA according to the sequence information; (4) connecting two to ten continuous partial DNAs by a first polymerase chain reaction to obtain a module; And (5) connecting two to ten consecutive modules by a second polymerase chain reaction to obtain a synthetic DNA.
[0009]
In the method for producing DNA design information and the method for synthesizing DNA of the present invention (hereinafter abbreviated as “DNA design / synthesis method”), the object DNA database refers to genomic DNA, cDNA, EST, primer, PCR derived from various organisms. This is a database in which base sequence information of DNA such as products and vectors is stored in association with information / location actually obtained. Unlike the conventional gene library, the object DNA database does not need to store the entire chromosome gene population. In the method of the present invention, target DNAs are produced by organically combining partial DNAs of different origins.
[0010]
Since the DNA design / synthesis method of the present invention is a synthesis method based on DNA sequence information, the sequence information of the DNA to be synthesized needs to be known. The DNA sequence information can be obtained from a genetic database on the Internet, such as GenBank, DDBJ, or EMBL, or academic literature. If this DNA sequence information is used as it is for synthesis, natural DNA can be synthesized. Furthermore, a DNA variant can be synthesized by manipulating the DNA sequence information according to the purpose.
[0011]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the DNA design / synthesis method of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a flowchart showing all steps of the DNA design / synthesis method of the present invention. The method for preparing DNA design information includes steps (1) and (2), and the method for synthesizing DNA includes steps (1) to (5). Hereinafter, the steps of FIG. 1 will be described step by step.
[0012]
(1) Step of searching sequence information in object database
In the DNA design / synthesis method of the present invention, first, sequence information of DNA to be synthesized is subjected to database search. FIG. 2 is a conceptual diagram for searching a database from DNA base sequence information. DNA may be linear or circular. The length of the base sequence to be synthesized is within a range that can be extended by the PCR method incorporated in the DNA design / synthesis method of the present invention. If the base length is increased by the progress of the PCR method, the base length that can be synthesized by the DNA design / synthesis method of the present invention also increases.
[0013]
First, as shown in FIG. 2, a target DNA base sequence is searched in the short-chain object DNA database 201. The short-chain object DNA is used as a primer or a template DNA. The base length of the short-chain object DNA is usually 10 to 200 bases, preferably 15 to 120 bases. The short-chain object DNAs extracted as primers have different base sequences from each other among the primers and do not form a complementary pair (the relationship between the sense strand and the antisense strand). In the example shown in FIG. 2, p1 and p3 are extracted as perfectly matching short-chain object DNA.
[0014]
Next, the target DNA base sequence is searched in the long-chain object DNA database 202. The long-chain object DNA is used as a template DNA in the DNA design / synthesis method of the present invention. The long-chain object DNA is not particularly limited in its form as long as the DNA is actually obtained, and includes cDNA, genomic DNA, synthetic DNA, and vector. The long-chain object DNA database 202 contains a part or all of the genomic / cDNA libraries of various organisms such as humans, Arabidopsis, Drosophila, bacteria, and the like, as well as commercially available cDNA / genomic libraries, which have been elucidated by public gene structure analysis projects. Some or all of can be used.
[0015]
It is preferable to register vector DNA in the long-chain object DNA database 202. Conventionally, when subcloning a PCR product from a gene library into a cloning vector, a restriction enzyme treatment was required prior to ligation of the vector with the PCR product. However, the treatment with the restriction enzyme may cause fragmentation of the produced PCR product, which makes it particularly difficult to incorporate long-chain DNA into a vector. In the DNA design / synthesis method of the present invention, the above-described restriction enzyme treatment is not required because the vector DNA can be incorporated as an object into the synthesis. Therefore, it becomes easy to incorporate the long chain DNA into the vector. Furthermore, in the DNA designing / synthesizing method of the present invention, it is very easy to prepare a vector partially different from an existing cloning vector (for example, base substitution, dilution, SNP), and to customize by partially omitting it. Furthermore, in the method of the present invention, it is easy to incorporate two or more gene segments into one cloning vector.
[0016]
The types of cloning vectors include plasmids, phages, viruses, cosmids, yeast artificial chromosomes, and the like. Appropriate vectors are used depending on the length of the inserted gene, application, and the like. Plasmid vectors are small extranuclear genes present in many bacteria, and can usually incorporate 5 to 10 kbp of exogenous DNA. At present, plasmid vectors are produced and sold by reagent companies and research institutions according to their functions. For example, plasmids derived from E. coli include pBR322, pBR325, pUC12, pUC13, pUC18, pUC19, pBluescript II and pET, plasmids derived from Bacillus subtilis include pUB110, pTP5 and pC194, and plasmids derived from yeast include pSH19 and pSH19. There is pSH15.
[0017]
Lambda phage is a virus that infests Escherichia coli and is a vector that can embed 15 to 20 kbp of exogenous DNA. Representative examples of the phage include λgt10, λgt11, λZAPII. Cosmids are plasmids with the phage lambda cos site and can incorporate up to about 40 kbp of foreign DNA. Viral vectors such as baculovirus, vaccinia virus and retrovirus can also be used. The detoxified virus vector is particularly useful as a vector for gene therapy.
[0018]
The above-mentioned vector incorporates a selection marker for discriminating the presence or absence of vector introduction and the success or failure of cloning. These include, but are not limited to, tetracycline or ampicillin resistance in E. coli and other bacteria; dihydrofolate reductase or neomycin resistance for eukaryotic cell culture.
[0019]
In the long-chain object DNA database 202, PCR products, modules, and DNAs of chimeric vectors obtained by the DNA design / synthesis method of the present invention are also appropriately registered. These reuses contribute to the reduction of cost and time for producing oligo object DNA.
[0020]
Even for genes having the same function between species, their nucleotide sequences partially differ depending on the evolution of the organism. In the collation operation between the partial sequence of the DNA to be synthesized and the long-chain object DNA database 202 in the present invention, it is preferable to also extract DNA that partially matches the target DNA. By actively using partially matching DNA, the use of a database can be promoted, and the need for oligo object DNA synthesis can be further reduced. For example, if the partial match sequence is 200 bases or more, it can be used as a template DNA. In the example of FIG. 2, although a DNA object that completely matches the long chain object DNA database 202 was not found, a partially matching long chain DNA object v3 and its antisense strand v4 are extracted.
[0021]
The collation operation between the partial sequence of the DNA to be synthesized and the object DNA database as described above is usually executed by a computer program stored in a computer. FIG. 3 is an example of a system that executes a database extraction process. The system includes an external storage device 302 connected to a main controller 301 that is programmed to control the entire system as a whole. An input device 306 such as a keyboard and a mouse, a display device 307 for monitoring input data, and an output device 308 for outputting a calculation result are connected to the main control unit 301 via an input / output control unit 305. The main control unit 301 has a control program such as an OS, a program for preparing DNA design information (including a program read from an external storage device), and an internal memory for temporarily storing data. 303 and a design information production processing control unit 304. The external storage device 302 is a storage means such as an HD, an MO, a CD, and a DVD, and stores a short-chain object DNA database 201 and a long-chain object DNA database 202.
[0022]
FIG. 4 shows an example of a procedure executed by the database extraction processing control unit 303. First, an initial process for extracting a database of sequence information of DNA to be synthesized is performed. As an example of the initial processing, the base sequence of the target DNA is divided into 16 bases while shifting one base at a time from the 5 ′ end to the 3 ′ end (S401), and the base sequence of each fragment is converted to hexadecimal numbers (for example, AA: 0, AT: 1... CG: e, CC: f), and further compressing the amount of information by 256-base conversion (S402). Next, the short-chain object database 201 is searched for each divided fragment (16 bases) (S403). When the candidate is searched, it is searched whether or not there is a completely matching portion in the target sequence (S404). The search is repeated over the entire length, taking into account the multiple matches. If they completely match, the matching object is extracted in association with the matching information (base sequence, direction, matching position) (S405). When all divided fragments have been searched, the process returns to S403, and the same processing is performed for the antisense (reverse) strand.
[0023]
When the search process using the short-chain object DNA database 201 is completed, the search of the long-chain object DNA database 202 is performed in the same manner as the short-chain object DNA database (S406 to 408). However, in this search, object DNA that partially matches the partial sequence of the base sequence of the target DNA is also extracted. Specifically, the end of the matching part is detected from the matching information, and the front part match (5 'direction) and the rear part match (3' direction) are detected by comparing with the contents registered in the database. The partial matching information (base sequence, direction, matching position) is sequentially created.
[0024]
The extraction processing of the short-chain and long-chain object DNA databases may employ, for example, a search method algorithm (BRAST, FASTA, etc.) known as a homology search, in addition to the above-described search method. However, at the time of the search, only DNA having a degree of coincidence of 100% is partially extracted.
[0025]
(2) Step of creating DNA design information
Design information for DNA synthesis is prepared using the template single strand of the partial sequence extracted in step (1) and its inter-strand information (that is, an unextracted partial sequence that fills the voids of the extracted partial sequence). . FIG. 5 shows a conceptual diagram of the design information production. As a design condition, starting from a sense strand having a 5 ′ end (p1 in FIG. 5), a total of even single strands are arranged alternately in the order of sense strand and antisense strand. The 5 'end of the sense strand is at least blunt with the antisense strand to be paired or protrudes like p1. If there is a partial sequence (p1, p2, v3 and v4 in FIG. 5) that matches the object DNA database, it is used, and if not, oligo object DNA (p3 to p8 in FIG. 5) is synthesized and Fill in. The oligo object DNA is usually designed in the range of 40 to 200 bases. When there is a large gap between the strands, they are allocated to a plurality of oligo objects, and they are alternately arranged with sense strands and antisense strands.
[0026]
The single strands are arranged such that adjacent 5 ′ ends and 3 ′ ends of the sense strand and the antisense strand have binding regions complementary to each other. The binding region in which the 5 ′ end and the 3 ′ end of the adjacent sense strand and antisense strand are complementary serves as a glue margin when a single strand is formed as a whole. In the PCR method, DNA extension is performed in the 5 ′ → 3 ′ direction starting from the glue margin portion, and one DNA is finally obtained as a whole while repeating the PCR cycle. The length of the glue margin is determined according to the annealing temperature of the PCR method. Usually, the Tm (melting temperature) of the paste margin is determined so as to be 50 to 70 ° C, preferably 55 to 65 ° C. It is also possible to make a temperature difference between Tm in one module and Tm between modules. For example, by setting the Tm within one module to be slightly lower than the Tm between modules, the length of the margin portion can be shortened, and as a result, the cost of producing oligo DNA is reduced.
[0027]
The above design processing work is executed by the control unit 304 of the design information creation processing of the computer system in FIG. FIG. 6 shows a flowchart of the contents executed by control unit 304. First, Tm (melting temperature) of the paste margin is set (S601). The Tm of a plurality of glue margins in each module is usually set to be substantially equal. The same applies to a plurality of glue allowances Tm between modules. Next, using the set Tm, the glue margin length a for replenishment chain calculation is predicted (S602). For the prediction, a relationship is generally used in which the higher the GC base content of the paste margin, the stronger the bonding strength of the paste margin and the higher the Tm. For example, the following approximate expression (1) is provided between Tm and the paste length.
[0028]
(Equation 1)
Figure 2004313112
(Where a is the number of bases in the glue margin, n is the number of bases between the chains, GC base is the GC content between the chains, AT base is the AT content between the chains, and Tm ′ is the AT lasting between the chains. (Which is the Tm value of the place). Alternatively, approximate expression (2):
(Equation 2)
Figure 2004313112
(Where a is the number of bases in the glue margin, the GC base number is the GC content in the glue margin, and the AT base number is the AT content in the glue margin)
Holds.
[0029]
Next, the distance X between adjacent chains of the extracted partial sequence (for example, between p1 and p2 in FIG. 5) is measured (S603). Here, when X ≧ 0, adjacent chains do not overlap, and when X <0, it means that adjacent chains overlap. If X ≧ 0, the process proceeds to S605. Otherwise, the inter-chain adjustment is performed in S604. If the short chains overlap, one of the overlapping adjacent chains is thinned out. If the short chains overlap, the overlapping portion X is trimmed to the glue length a predicted from the set Tm or to 0 or less.
[0030]
Proceeding to S605, an optimal replenisher strand (oligo object DNA) for filling in the inter-chain is calculated. The Tm of each predicted glue margin length a is calculated by the above equation (1) or (2), and if the Tm deviates from the set value, the glue margin length is changed to approach the set Tm. When the space between the strands is large and exceeds the synthesis limit of the oligo DNA synthesizer (chain length set at the time of design), a plurality of oligo object DNAs are allocated. Proceeding to S606, it is checked whether the base portion of the oligo object DNA, the short-chain object DNA or the long-chain object DNA has a different glue margin sequence. Avoiding mismatch amplification by not creating the same glue margin. If the above condition is not met, the process returns to S604 and the inter-chain adjustment is repeated. In S607, design information for DNA synthesis is output. FIG. 5 shows an example of the processing result of the DNA design information. Here, oligo object DNAs of p3 to p8 are arranged to fill in the spaces between the extracted partial sequences (p1, p2, v3 and v4). The output method of the design information may be a paper medium or an electronic medium.
[0031]
(3) Step of preparing partial DNA and oligo object DNA
Based on the DNA design information obtained as described above, the short-chain object DNA serving as a part is retrieved from the short-chain object DNA storage. Similarly, the long-chain object DNA as a part is delivered from the long-chain DNA storage. When a part of the long-chain object DNA is required, the necessary partial sequence is cut out by a PCR method with a primer interposed therebetween.
[0032]
Oligo object DNA that is not registered in the database and needs to be synthesized is synthesized by an oligo DNA automatic synthesizer. The automatic oligo DNA synthesizer is a device for sequentially sending necessary reagents onto a solid phase while opening and closing valves of bottles containing reagents and solvents, which are connected by tubes, based on an input base sequence. The DNA synthesizer uses a condensing agent to combine nucleotides, which are sent out of the tube and are protected on the solid phase except for the group to be reacted, with a phosphodiester bond between 3 ′ and 5 ′ of the pentose. Are repeated one after another, thereby synthesizing and linking a DNA strand from 3 ′ to 5 ′. Oligo object DNA synthesis can also be procured by requesting an oligo DNA contract synthesis manufacturer.
[0033]
(4) Modularization process
Modularization means connecting 2 to 10, preferably 2 to 6, module units consisting of continuous strands of partial DNA and oligo DNA based on the DNA design information in step (3). In the DNA design / synthesis method of the present invention, partial DNAs are once modularized and the modules are further connected to avoid a situation in which the amplification of DNA is biased and a full-length DNA cannot be obtained. FIG. 7 shows a conceptual diagram of modularization using the design information example of FIG. A module 1 is formed from the registered short-chain object DNA (p1 to p2) and a synthetic oligo object DNA (p3 to p6), and a module 2 is formed from the registered partially matched long-chain object DNA (v3 to 4). The module 3 is formed by the synthetic oligo object DNA (p7 to p8).
[0034]
Hereinafter, modularization by the PCR method will be specifically described. A reaction solution is prepared using short-chain / long-chain object DNA, synthesized oligo object DNA, dNTPs (deoxynucleotides) which are raw materials for PCR, salts, and a heat-resistant DNA polymerase. The thermostable polymerase may be either a pol I type enzyme derived from bacteria (eg, Taq DNA polymerase) or an α type enzyme derived from archaebacteria (eg, pfu DNA polymerase, KOD DNA polymerase), or a mixture of two types of these. Good. These may be commercially available from reagent manufacturers, such as Takara Ex Taq, Pyrobest DNA Polymerase (above, manufactured by TaKaRa), KOD + (manufactured by TOYOBO), and the like. The concentration of DNA polymerase is usually 0.25 units / μl. As the buffer, a 10 × buffer enclosed with the commercially available thermostable polymerase may be used. For example, a 10 × buffer of Taq polymerase typically contains 10-25 mM Tris-HCl, 50 mM KCl, and MgCl 2 1-5.0 mM.
[0035]
The concentration of the template DNA is usually several tens pg / μl to several ng / μl. Primers are usually prepared at 0.2 to 10 μM. If the number of primers is too small, the reaction does not proceed, while if it is too large, non-specific amplification may be caused. dNTPs are prepared at 0.2 to 2 mM each.
[0036]
The reaction solution is heated to dissociate the double strand of the template DNA. Next, the primers (adjacent template DNA) overlapping the complementary portions of each single strand are cooled to a temperature at which a double strand is formed (annealed). Finally, DNA extension is performed in the 5 ′ → 3 ′ direction using a thermostable polymerase enzyme starting from the complementary portion. By repeating this cycle, continuous modularization of partial DNA and oligo DNA is achieved.
[0037]
Regarding the conditions of the PCR method, the annealing temperature of the template / primer DNA is set to the bonding margin Tm set at the time of design. The time and temperature required for each step (denaturation, annealing, extension) of the PCR method are, for example, 30 seconds for thermal denaturation (93 to 97 ° C), 30 seconds for annealing (Tm of glue allowance), and an extension reaction (68 to 72 ° C). ) Is 0.5 to 1 minute × the chain length to be amplified (kb). The number of cycles depends on the amount of DNA to be synthesized, but generally may be 30 to 40 cycles.
[0038]
(5) Module connection process
The continuous modules obtained above are usually ligated by 2 to 10, preferably 2 to 6, PCR. The procedure and conditions of the PCR method are the same as in the modularization step (4). In the example of FIG. 7, modules 1 to 3 are connected using p1 and p8 as primers. When it is necessary to close the synthetic DNA such as when a vector is used as the object DNA, a self-ligation operation is performed. T4 phage DNA kinase and ligase are used to directly join blunt ends of double-stranded DNA. A commercially available ligation kit can also be used.
[0039]
As described above, according to the designing / synthesizing method of the present invention, it is not necessary to prepare and screen a gene library of a target gene, so that a long-chain DNA of 10 kbp or more can be prepared in a short period of 3 to 4 days.
[0040]
(6) Subcloning step
Subcloning can be omitted if vector DNA is incorporated as an object during DNA synthesis. However, when vector DNA is not bound to the above synthetic DNA, or when it is necessary to transfer the vector for functional analysis or protein expression, subcloning is performed by the following method.
[0041]
The target specific gene segment is inserted into the insertion site of the cloning vector and used. As a method for inserting into a cloning vector, a conventionally known method can be used. As a preparation for insertion, the insertion target site of the cloning vector is cut with a restriction enzyme that cuts the cloning vector at a specific site. The end of the synthetic DNA contained by the PCR method is processed with a restriction enzyme or the like so that it can be ligated to the insertion target site of the cloning vector. Usually, the primer is designed so that it can be connected smoothly when designing the primer. Finally, the DNA contained by the PCR method and the cloning vector cut at a specific site are ligated using a DNA ligase enzyme.
[0042]
(7) Transformation step
Next, the chimeric vector of (5) or (6) is introduced into a host cell. The host cell can be used without limitation as long as the cloning vector can be stably and autonomously propagated. Examples of host cells include bacteria such as Escherichia coli, Streptomyces, Salmonella typhimurium; fungi such as yeast; insect cells such as Drosophila S2 and Chinese armyworm Sf9; animal cells such as CHO, COS and Bowes melanoma cells; Cells.
[0043]
Methods for introducing vectors into cells include electroporation, DEAE-dextran, calcium phosphate precipitation, liposome-mediated fusion (lipofection), microinjection, transduction with a non-replicating virus, and the like. Different introduction methods are used depending on the host cell.
[0044]
The host cell into which the chimeric vector has been inserted is plated and cultured on an appropriate medium to form a colony derived from a single host cell having a single vector. The medium contains a carbon source, a nitrogen source, inorganic substances, and the like necessary for cell growth. As the carbon source, sugars such as glucose and sucrose; alcohols such as glycerol; and organic acids are appropriately used. As the nitrogen source, ammonia or ammonium salts, amines, other nitrogen compounds, or natural nitrogen sources such as peptone, hydrolyzate of soybean, and decomposition of fermentation cells can be used. Examples of the inorganic salt include potassium monohydrogen phosphate, potassium dihydrogen phosphate, and magnesium sulfate. Yeasts, vitamins, growth promoting factors and the like may be added as additives. An antibiotic corresponding to the drug resistance gene of the vector is added to the medium as a selectable marker for culturing only host cells having the target chimeric vector, and in order to prevent the propagation of various bacteria. For example, to culture Escherichia coli containing a vector having an ampicillin resistance gene, an antibiotic ampicillin is added to an LB medium for Escherichia coli.
[0045]
Cloning vectors self-amplify in host cells in large quantities. Methods for checking whether DNA synthesis has been performed properly and the quality of the target product include, for example, purifying a cloning vector by miniprep treatment of a host cell colony and then subjecting the inserted DNA to full length or partial length. From a vector and checking the cut-out DNA by electrophoresis, a check by a PCR method, a colony hybridization method, a color selection and the like.
[0046]
(8) Gene expression step
When a host cell is desired to produce a target synthetic DNA product (protein), an expression vector may be used as the vector. An expression vector is a vector linked to a promoter and a terminator. The promoter may be any promoter as long as it is appropriate for the host used for gene expression. When the host to be transformed is a bacterium belonging to the genus Bacillus, SPO1 promoter, SPO2 promoter, penP, and the like can be used. Promoters, cytomegalovirus promoters, SRα promoters and the like can be used. Commercially available expression vectors include, for example, the pUC system, pBluescript II, pET and λgt11. Synthetic DNA is incorporated after the ribosome binding site (SD sequence).
[0047]
Examples of the form of gene expression include a method of producing a protein in a host cell, a method of secreting the protein outside the host cell, and a method of producing the protein on the host cell outer membrane. After expressing the protein in host cells, the target protein is isolated and purified from the culture. Known separation operations, for example, treatment with a denaturant such as urea or a surfactant, ultrasonic treatment, enzyme digestion, salting out, solvent precipitation, dialysis, centrifugation, ultrafiltration, gel filtration, SDS-PAGE, etc. Electrofocusing, ion exchange chromatography, hydrophobic chromatography, affinity chromatography, reverse phase chromatography, and the like can be appropriately used in combination.
[0048]
By introducing the cloning vector into a fertilized egg of an animal such as a mouse, or by directly injecting the animal, a transgenic animal or a knockout animal can be produced.
[0049]
(9) DNA storage and registration process
A part of the novel oligo object DNA, the synthetic DNA, and the chimeric vector into which the synthetic DNA is obtained in the above step are stored in a storage. For example, items that are allowed to be shared are stored in a storage hangar, while items that are not allowed to be shared are stored in a storage hangar. Further, the base sequence information of the stored object DNA is registered in the short-chain / long-chain object database in association with the stored information. By registering, existing resources can be effectively used for the next DNA synthesis.
[0050]
Next, modified examples of the DNA design / synthesis method of the present invention will be described. FIG. 8 shows an example in which a requester of DNA synthesis, a base for preparing DNA design information, and a base for synthesizing DNA are separately provided. In the DNA design / synthesis method of the present invention, since the effect increases as the short- and long-chain object DNA databases are enhanced, it is preferable to establish a specialized base for DNA design and DNA synthesis as shown in FIG.
[0051]
In this usage mode, a client who desires DNA synthesis accesses the DNA synthesis system from the terminal 801 via the Internet or a communication line. The DNA synthesis system includes a server computer 803, a short-chain object DNA database 804, and a long-chain object DNA database 805 (appropriately divided into a sharing database and a client identification database). And a means for sending the DNA design information 806 to the oligo DNA automatic synthesizer 808.
[0052]
FIG. 9 is a diagram showing a flow of a procedure between the three parties in the DNA synthesis system. A client such as a researcher or a technician accesses a gene information database 802 such as a genome network from the client terminal 801 via the Internet, and obtains an academic information magazine to obtain sequence information of DNA to be synthesized. It is acquired (S901). Alternatively, DNA sequence information partially modified based on known DNA sequence information according to the purpose of use or research purpose is created.
[0053]
The client sends the DNA sequence information to be requested for synthesis to the DNA synthesis system (server computer 803) via the Internet, a communication line, or the like (S902). The server computer 803 of the DNA synthesis system receives the sequence information, searches the short-chain object DNA database 804 and the long-chain object DNA database 805, and extracts a matching or partially matching partial DNA (S903). The design information 806 for DNA synthesis is created using the obtained base sequence information of the partial DNA and their interstrand information (S904). The prepared DNA design information 806 is sent to a client or to a production site for DNA synthesis. The information base for production of DNA design information and the bases for oligo DNA synthesis, PCR, sequence and the like may be far apart.
[0054]
At the DNA production base, a person in charge releases the required object DNA from the short-chain object DNA storage and the long-chain DNA object DNA storage based on the design information 806, and synthesizes the insufficient oligo object DNA by an automatic oligo DNA synthesizer. (S905). Using the obtained parts and the PCR method, modularization of the object DNA and module connection are performed (S906, S907). The linked synthetic DNA 810 is delivered to the client after inspection, in that state, or after processing such as freeze-drying. After appropriate subcloning (S908), the cloning vector is inoculated into a host cell for transformation (S909), and the vector is autonomously propagated in the transformed cell or a gene is expressed to obtain a protein (S910). , The DNA, protein, etc. may be delivered to the client. Transformed knockout or transgenic animals 811 can also be provided.
[0055]
The DNA design / synthesis method of the present invention can be applied or modified in addition to the above-mentioned usage modes. One example is an object DNA database; database extraction means for comparing a partial sequence of DNA to be synthesized with object DNA registered in the object DNA database to extract a matched partial sequence; Using the base sequence of the single strand of the template of the extracted partial sequence, the sense strand and the antisense strand are alternately arranged in order of the sense strand and the antisense strand starting from the sense strand on the 5 'end side, and the adjacent sense strand and antisense strand This is a DNA design system provided with a design information producing means for arranging the 5 ′ ends and the 3 ′ ends of the above to have a binding region complementary to each other. Another example is (1) a step of comparing a partial sequence of DNA to be synthesized with an object DNA registered in an object DNA database to extract a matched partial sequence, and (2) a step of extracting the matched partial sequence. Using the base sequence of the single-stranded template of the unextracted partial sequence, the sense strand and the antisense strand are alternately arranged in order of the sense strand and the antisense strand starting from the sense strand on the 5′-end side, and the adjacent sense strand and antisense strand are further sequenced. This is a program for causing a computer to execute a step of arranging the 5′-end and the 3′-end of the sense strand so that they have binding regions complementary to each other. Still another example is a computer-readable recording medium on which the program is recorded.
[0056]
【Example】
Hereinafter, the DNA design / synthesis method of the present invention will be described in more detail using examples.
[Example 1]
The base sequence (SEQ ID NO: 1) was synthesized as shown in FIG. As shown in the restriction enzyme map of FIG. 11, a 112 bp DNA fragment was inserted into the multiple cloning site (MCS) of the cloning vector pBluescript II SK (+) (2961 bp, hereinafter abbreviated as “pBSK +”). This is a circular DNA having a total length of 3073 bp. MCS is between T7 and T3 in FIG. 10, and the underlined region is the sequence to be inserted into pBSK + this time.
[0057]
(1) Database extraction
The database extraction processing control unit 303 of the system shown in FIG. 3 executed the database extraction processing for the target circular DNA according to the procedure shown in FIG. Various existing primers were registered in the short-chain object database in advance, while pBSK + was registered in the long-chain object database. FIG. 12 shows the result of the database extraction. DNA1 (shaded arrow part) in FIG. 12 was found from the short chain object DNA database. DNA2 (open arrow portion) in FIG. 12 was found from the long chain object DNA database. Since DNA2 was pBSK +, it was confirmed that the database extraction process was successfully performed.
[0058]
(2) Preparation of DNA design information
Based on the extracted partial DNA and the inter-chain information, the design information creation processing control unit 304 of the system in FIG. 3 was caused to execute the DNA design information creation processing in the procedure shown in FIG. As design conditions, Tm within the module and between modules was set to 60 ° C., and the maximum design length of the oligo object DNA was set to 59 bases. When DNA1 extracted from the short-chain object DNA database was used, the amount of glue became insufficient, so that thinning was performed, and a calculation result was obtained in which P1 to P4 were newly formed as oligo object DNA. FIG. 13 shows an overview of design information for DNA synthesis. 14 and 15 show the base sequence information of each object DNA. Table 1 shows the combinations and Tm of the module of the object DNA.
[0059]
[Table 1]
Figure 2004313112
[0060]
(3) Preparation of object DNA
An object DNA was prepared according to the above design information. First, P1 to P4 were synthesized using an oligo DNA synthesizer. Next, primers V1 (SEQ ID NO: 7) and V2 (SEQ ID NO: 8) used for excision of P5 and P6 were synthesized using an oligo DNA synthesizer. PBSK + was discharged from the storage of the long-chain object DNA, and P5 and P6 were cut out by PCR using the above primers (V1 and V2). The composition of the reaction solution and the temperature cycle of the PCR method are shown in Table 2 and FIG. 16, respectively.
[0061]
[Table 2]
Figure 2004313112
[0062]
(4) Modularization
Module 2 was prepared by a PCR method using P1 to P4 as templates (P1 and P4 were used as primers). Table 3 shows the composition of the reaction solution of the PCR method. The temperature cycle conditions were specified as in FIG.
[0063]
[Table 3]
Figure 2004313112
[0064]
FIG. 17 shows the results of electrophoresis of modules 1 and 2. In the figure, lane (1) is the result of electrophoresis of the product after PCR of pBSK + with primers V1 and V2, and a band was observed around 2000 to 3000 bases. Lane (2) is a result of electrophoresis of a product obtained by PCR of P1 to P4 with primers P1 and P4, and a band of less than 500 bases was confirmed.
[0065]
(5) Connection between module 1 and module 2
After ethanol precipitation of the modules 1 and 2 of (4), the sample concentration was adjusted, and then PCR was performed with the V1 and P1 primers using the modules 1 and 2 as templates. Table 4 and FIG. 18 show the composition of the reaction solution and the temperature cycle conditions.
[0066]
[Table 4]
Figure 2004313112
[0067]
FIG. 19 shows the results of electrophoresis performed by changing the sample concentration of the PCR product. In FIG. 19, bands expected to be module 1, module 2, and module 1 + 2 (connection between modules 1 and 2) were confirmed.
[0068]
(6) Self-ligation
From the results of the electrophoresis, the band of module 1 + 2 was cut out, purified by Gel Extraction Kit (manufactured by Qiagen), and subjected to self-ligation (16 ° C. × 2 hours) of terminal blunt ends (715, 716) to form linear chains. The DNA was closed. Table 5 shows the composition of the ligation reaction solution.
[0069]
[Table 5]
Figure 2004313112
[0070]
(7) Transformation
The chimeric vector whose ends were recombined by self-ligation was transformed into competent Escherichia coli (DH5α strain). The transformed E. coli grew well in LB-AMP medium. After 10 E. coli colonies were selected from the medium and miniprepped, the resulting purified product was subjected to electrophoresis. FIG. 20 shows the result. Lanes (6), (7) and (8) were selected from the electrophoresis results, and the sequence was performed. At that time, the insert portion was sequenced in the forward direction with the PT7 primer, and the insert portion was sequenced in the reverse direction with the PT3 primer. From the sequence results, it was confirmed that the target sequence was inserted into the multiple cloning site.
[0071]
【The invention's effect】
Since the DNA design / synthesis method of the present invention is not DNA replication but synthesis, it is not necessary to prepare and screen a conventional gene library. Therefore, the desired DNA can be obtained in a short period of time. The method of the present invention also facilitates free gene design by changing DNA sequence information to be synthesized. Furthermore, since the restriction enzyme treatment can be omitted, the production of the cloning vector becomes simpler than the conventional method. Processing of the cloning vector itself is also possible. Then, the once-produced oligo DNA, synthetic DNA (PCR product), etc. can be reused. By enriching the object database, the cost of DNA synthesis can be further reduced.
[0072]
[Sequence list]
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112
Figure 2004313112

[Brief description of the drawings]
FIG. 1 is a flowchart showing all steps of the DNA design / synthesis method of the present invention.
FIG. 2 is a conceptual diagram for searching a database from DNA base sequence information.
FIG. 3 is an example of a computer system that executes the method for producing DNA design information of the present invention.
FIG. 4 is a flowchart of an operation performed by a database extraction processing control unit in the system of FIG. 3;
FIG. 5 is a conceptual diagram of design information preparation in the DNA design / synthesis method of the present invention.
FIG. 6 is a flowchart of an operation performed by a design information creation processing control unit in the system of FIG. 3;
FIG. 7 is a conceptual diagram of modularization in the DNA design / synthesis method of the present invention.
FIG. 8 is an application example of the DNA design / synthesis method of the present invention.
FIG. 9 is a flowchart showing a flow of a procedure in the DNA synthesis system of FIG.
FIG. 10 is an explanatory diagram of a base sequence of DNA to be synthesized in Example 1 according to the present invention.
FIG. 11 is a restriction map showing the nucleotide sequence of the DNA to be synthesized in FIG.
12 is a diagram showing a result of searching the DNA base sequence information of FIG. 10 by an object DNA database.
FIG. 13 is a diagram showing design information for DNA synthesis in FIG.
FIG. 14 is a base sequence of object DNA (p5) used for DNA synthesis.
FIG. 15 shows the base sequences of object DNAs (p1 to p4) used for DNA synthesis.
FIG. 16 is a diagram showing a temperature cycle of a PCR method performed to cut out object DNA (p5, p6) in Example 1 according to the present invention.
FIG. 17 is a photograph as a drawing showing electrophoresis results of modules 1 and 2 of Example 1.
FIG. 18 is a diagram showing a temperature cycle of a PCR method performed to connect modules 1 and 2 in Example 1 according to the present invention.
FIG. 19 is a drawing substitute photograph showing the results of electrophoresis of the PCR product of FIG. 18.
FIG. 20 is a photograph as a drawing showing the results of electrophoresis of the purified vector after transformation.
[Explanation of symbols]
201 Short chain object DNA database
202 Long Object DNA Database
301 Main control unit
303 Database extraction processing control unit
304 Design information production processing control unit
803 server computer
804 Short Object DNA Database
805 Long chain object DNA database
806 DNA design information
807 Object DNA Hangar
808 Oligo DNA automatic synthesizer
810 Synthetic DNA
811 knockout animals or transgenic animals

Claims (5)

(1)合成したいDNAの部分配列と、オブジェクトDNAデータベースに登録されたオブジェクトDNAとを照合して、一致した部分配列を抽出する工程、ならびに
(2)抽出された部分配列および非抽出の部分配列の鋳型一本鎖の塩基配列を用いて、5’末端側のセンス鎖から始めてセンス鎖、アンチセンス鎖の順に交互に合計偶数本配列し、しかも隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が互いに相補的な結合領域を有するように配列する工程
からなる、DNA合成のためのDNA設計情報の作製方法。
(1) a step of comparing a partial sequence of DNA to be synthesized with an object DNA registered in an object DNA database to extract a matched partial sequence; and (2) an extracted partial sequence and a non-extracted partial sequence Starting from the sense strand on the 5 'end side, the sense strand and the antisense strand are alternately arranged in total in an order of even number using the base sequence of the single strand of the template, and the 5' of the adjacent sense strand and antisense strand A method for producing DNA design information for DNA synthesis, comprising a step of arranging such that the ends thereof and the 3 ′ ends thereof have complementary binding regions.
工程(1)において、合成したいDNAの部分配列と部分的に一致したDNAもまた抽出することを特徴とする、請求項1に記載の作製方法。The method according to claim 1, wherein in the step (1), a DNA partially matching the partial sequence of the DNA to be synthesized is also extracted. (1)合成したいDNAの部分配列と、オブジェクトDNAデータベースに登録されたDNAとを照合して、一致した部分配列を抽出する工程、
(2)抽出した部分配列および未抽出の部分配列の鋳型一本鎖を用いて、5’末端側のセンス鎖から始めてセンス鎖、アンチセンス鎖の順に交互に合計偶数本配列し、しかも隣接するセンス鎖とアンチセンス鎖との5’末端同士および3’末端同士が互いに相補的な結合領域を有するように配列する工程
(3)前記配列に従って部分DNAを準備する工程、
(4)2〜10本の連続した前記部分DNAを第一のポリメラーゼ連鎖反応によって連結してモジュール化する工程、ならびに
(5)2〜10本の連続した前記モジュールを第二のポリメラーゼ連鎖反応によって連結して合成DNAを得る工程
からなるDNAの合成方法。
(1) collating the partial sequence of the DNA to be synthesized with the DNA registered in the object DNA database, and extracting a matched partial sequence;
(2) Using the template single-strand of the extracted partial sequence and the unextracted partial sequence, a total of even numbers are arranged alternately in the order of the sense strand and the antisense strand, starting from the sense strand on the 5 ′ end side, and are adjacent to each other. (3) arranging the sense strand and the antisense strand such that the 5′-ends and the 3′-ends of the antisense strand have binding regions complementary to each other; (3) preparing a partial DNA according to the sequence;
(4) a step of connecting 2 to 10 continuous partial DNAs by a first polymerase chain reaction to form a module, and (5) a step of connecting 2 to 10 continuous partial modules by a second polymerase chain reaction. A method for synthesizing DNA, comprising the step of obtaining a synthetic DNA by ligation.
工程(1)において、合成したいDNAの一部と部分的に一致したDNAも抽出することを特徴とする、請求項3に記載のDNA合成方法。4. The DNA synthesis method according to claim 3, wherein in step (1), DNA that partially matches DNA to be synthesized is also extracted. (6)新規に準備した部分DNAおよび合成したDNAをオブジェクトDNAデータベースに登録する工程をさらに含む、請求項3または4に記載のDNA合成方法。(6) The DNA synthesis method according to claim 3 or 4, further comprising a step of registering the newly prepared partial DNA and the synthesized DNA in an object DNA database.
JP2003113900A 2003-04-18 2003-04-18 Method for preparing dna design information and method for synthesizing dna Pending JP2004313112A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003113900A JP2004313112A (en) 2003-04-18 2003-04-18 Method for preparing dna design information and method for synthesizing dna

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003113900A JP2004313112A (en) 2003-04-18 2003-04-18 Method for preparing dna design information and method for synthesizing dna

Publications (1)

Publication Number Publication Date
JP2004313112A true JP2004313112A (en) 2004-11-11

Family

ID=33473652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003113900A Pending JP2004313112A (en) 2003-04-18 2003-04-18 Method for preparing dna design information and method for synthesizing dna

Country Status (1)

Country Link
JP (1) JP2004313112A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2895626A4 (en) * 2012-09-12 2016-08-17 Univ California Accurate genome sequencing of single cells by single-stranded amplification and sequencing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2895626A4 (en) * 2012-09-12 2016-08-17 Univ California Accurate genome sequencing of single cells by single-stranded amplification and sequencing
US10752945B2 (en) 2012-09-12 2020-08-25 The Regents Of The University Of California Accurate genome sequencing of single cells by single-stranded amplification and sequencing

Similar Documents

Publication Publication Date Title
US10745695B2 (en) TAL-effector assembly platform, customized services, kits and assays
CN112410377B (en) VI-E type and VI-F type CRISPR-Cas system and application
Carlson et al. Engineered ribosomes with tethered subunits for expanding biological function
Park et al. Site‐specific recombinational cloning using gateway and in‐fusion cloning schemes
Chen et al. Restriction site-free insertion of PCR products directionally into vectors
JP2006517090A (en) Synthetic gene
Nelms et al. A predicted hairpin cluster correlates with barriers to PCR, sequencing and possibly BAC recombineering
Wall et al. Combinatorial assembly of clone libraries using site-specific recombination
Di Blasi et al. Genetic toolkits to design and build mammalian synthetic systems
Abril et al. Prokaryotic sigma factors and their transcriptional counterparts in Archaea and Eukarya
Altmannova et al. InteBac: An integrated bacterial and baculovirus expression vector suite
CN106589134A (en) Chimeric protein pAgoE, construction method and applications thereof, chimeric protein pAgoE using guide, and construction method and applications thereof
Casini Advanced DNA assembly strategies and standards for synthetic biology
Kim et al. A fluorescence selection method for accurate large‐gene synthesis
Muyrers et al. ET recombination: DNA engineering using homologous recombination in E. coli
Andrews et al. High-resolution protein–protein interaction mapping using all-versus-all sequencing (AVA-Seq)
JP2004313112A (en) Method for preparing dna design information and method for synthesizing dna
Castellanos et al. A Borrelia burgdorferi mini‐vls system that undergoes antigenic switching in mice: investigation of the role of plasmid topology and the long inverted repeat
Rohilla et al. Systematic microsatellite repeat expansion cloning and validation
Tanniche et al. Lambda‐PCR for precise DNA assembly and modification
Deyling et al. Preparing genes for repetitive elastin-like polypeptides using gibson assembly
CN109563508A (en) By fixed point DNA cracking and repair targeting protein diversification in situ
Venken et al. Synthetic assembly DNA cloning to build plasmids for multiplexed transgenic selection, counterselection or any other genetic strategies using Drosophila melanogaster
Jiang et al. High-throughput FastCloning technology: A low-cost method for parallel cloning
Moore Gene synthesis: assembly of target sequences using mutually priming long oligonucleotides

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090804