JP5062634B2 - 塩基配列設計方法 - Google Patents

塩基配列設計方法 Download PDF

Info

Publication number
JP5062634B2
JP5062634B2 JP2008503907A JP2008503907A JP5062634B2 JP 5062634 B2 JP5062634 B2 JP 5062634B2 JP 2008503907 A JP2008503907 A JP 2008503907A JP 2008503907 A JP2008503907 A JP 2008503907A JP 5062634 B2 JP5062634 B2 JP 5062634B2
Authority
JP
Japan
Prior art keywords
gene
base sequence
translation system
sequence
codon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008503907A
Other languages
English (en)
Other versions
JPWO2007102578A1 (ja
Inventor
憲二 宮本
康文 榊原
博道 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keio University
Original Assignee
Keio University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keio University filed Critical Keio University
Priority to JP2008503907A priority Critical patent/JP5062634B2/ja
Publication of JPWO2007102578A1 publication Critical patent/JPWO2007102578A1/ja
Application granted granted Critical
Publication of JP5062634B2 publication Critical patent/JP5062634B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Plant Pathology (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

本発明は、翻訳系で発現させるための遺伝子の塩基配列設計方法に関する。
特定のアミノ酸配列をコードする遺伝子を、その遺伝子が由来する生物種とは異なる生物種のホスト細胞で発現させる際、翻訳過程が律速段階になり、十分な発現レベルが得られないことがある。
そのような場合の解決方法の一つとして、その遺伝子の使用しているコドンを、ホスト細胞の生物種で、高頻度で用いられているコドンに変更するということが行われてきた。
しかし、それでも、十分に発現レベルが高くならない場合があり、発現させる遺伝子の設計に、更なる工夫が期待されている。
そこで、本発明は、所定の翻訳系を用いて遺伝子を発現させるとき、高い発現レベルを得ることができる、遺伝子の塩基配列設計方法を提供することを目的とする。
翻訳系を用いて遺伝子を発現させる場合、その遺伝子及び翻訳系の由来する生物種に関わらず、その遺伝子をそのまま発現ベクターに組み込んで、翻訳系で発現させることが多い。しかし、生物種によって、codon usageが異なるため、その遺伝子のコドンが、用いている翻訳系ではうまく利用されず、発現レベルが上がらないことがある。本発明者らは、この問題を解決するため鋭意努力した結果、生物種によって、コドン配列の規則性が異なり、このことが、発現レベルが上がらない理由の一つであるという新たな知見を見出し、本発明の完成に至った。
本発明の塩基配列設計方法は、所定の翻訳系を用いて発現させる遺伝子の塩基配列設計方法であって、前記遺伝子のコドン配列を、学習データにおけるコドン配列の規則性に適合させることを特徴とする。前記学習データが、前記翻訳系が由来する生物種の遺伝子プールであってもよく、所定の翻訳系において、すでに発現レベルが所定レベル以上であることが明らかになっている遺伝子プールであってもよい。
また、前記塩基配列設計方法が、適合させた前記遺伝子の塩基配列を、適合させる際に用いた学習データに、データとして追加する工程を含んでもよい。
さらに、前記塩基配列設計方法が、隠れマルコフモデルを用いて、前記遺伝子のコドン配列を、学習データにおける前記コドン配列の規則性に適合させることを特徴としてもよい。この場合、バウム・ウエルチ アルゴリズムを用いて、前記コドン配列の規則性を計算してもよい。
さらに、前記塩基配列設計方法において、前記翻訳系が細胞内にあってもよく、in vitroタンパク合成系内にあってもよい。
本発明のプログラムは所定の翻訳系を用いて発現させるための遺伝子の塩基配列を設計するためのプログラムであって、コンピュータに前記塩基配列設計方法を実行させるプログラムである。本発明の記録媒体は、これらのプログラムの少なくとも一つを記録した、コンピュータで読み取り可能な記録媒体である。
本発明の塩基配列設計システムは、所定の翻訳系を用いて発現させるための遺伝子の塩基配列設計システムであって、(i) 塩基配列データを入力するための入力装置、(ii) 入力されたデータを用いて、請求項9に記載のプログラムを実行するコンピュータ、および(iii) (ii)により得られた結果を出力するための出力装置を備える。
==関連文献とのクロスリファレンス==
なお、本出願は、2006年3月9日出願の日本国出願番号特願2006−64816を基礎とする優先権の利益を主張し、これを引用することにより本明細書に含める。
本発明にかかる実施の形態における「枝刈り」の例である3つの条件の具体例を示す模式図である。
実施の形態及び実施例に特に説明がない場合には、J. Sambrook, E. F. Fritsch & T. Maniatis (Ed.), Molecular cloning, a laboratory manual (3rd edition), Cold Spring Harbor Press, Cold Spring Harbor, New York (2001); F. M. Ausubel, R. Brent, R. E. Kingston, D. D. Moore, J.G. Seidman, J. A. Smith, K. Struhl (Ed.), Current Protocols in Molecular Biology, John Wiley & Sons Ltd.などの標準的なプロトコール集に記載の方法、あるいはそれを修飾したり、改変した方法を用いる。また、市販の試薬キットや測定装置を用いる場合には、特に説明が無い場合、それらに添付のプロトコールを用いる。
なお、本発明の目的、特徴、利点、及びそのアイデアは、本明細書の記載により、当業者には明らかであり、本明細書の記載から、当業者であれば、容易に本発明を再現できる。以下に記載された発明の実施の形態及び具体的な実施例などは、本発明の好ましい実施態様を示すものであり、例示又は説明のために示されているのであって、本発明をそれらに限定するものではない。本明細書で開示されている本発明の意図並びに範囲内で、本明細書の記載に基づき、様々な改変並びに修飾ができることは、当業者にとって明らかである。
==塩基配列設計方法==
本発明は、所定の翻訳系を用いて発現させる遺伝子の塩基配列設計方法であって、その遺伝子のコドン配列を、学習データにおけるコドン配列の規則性に適合させることを特徴とする。以下、具体的に説明する。なお、本明細書で「コドン配列」とは、「三組みコドンの並び」のことをいうものとする。また、「コドン配列の規則性」とは、「現れることが期待される確率が最も高いコドン配列」を意味するものとする。
所定の翻訳系を用いて、目的の遺伝子を発現させる際、翻訳系の由来する生物種や遺伝子の由来する生物種に関わらず、その翻訳系で発現できる発現ベクターに遺伝子をそのまま組み込み、翻訳系に導入することが多い。しかし、本発明に従って、その遺伝子のコドン配列を、学習データにおけるコドン配列の規則性に適合させることによって、その翻訳系における発現に対し、遺伝子の塩基配列を好適化することができ、発現レベルを上げることができる。
用いる翻訳系は、mRNAを翻訳させられる系であれば限定されず、細胞内にあっても、in vitro翻訳系であってもかまわない。細胞内の翻訳系を用いる場合は、例えば、発現ベクターに、配列を好適化した遺伝子を組み込み、常法をによって細胞に導入すればよい。in vitroの翻訳系を用いる場合は、例えば、in vitroで転写させて合成したmRNAを、ウサギ網状赤血球、コムギ胚芽、あるいは大腸菌由来の無細胞タンパク質合成系に添加して、翻訳させればよい。
発現させる遺伝子は、特に限定されず、アミノ酸配列はどんなものでもよく、天然の遺伝子であっても、人為的に変異を導入された遺伝子でもかまわない。
学習データも、特に限定されないが、翻訳系が由来する生物種または近縁種の遺伝子プール、あるいは所定の翻訳系において、すでに発現レベルが所定レベル以上であることが明らかになっている遺伝子プールが好ましく、それらを組み合わせたりしてもよい。また、本発明の塩基配列好適化方法によってコドン配列を適合させた遺伝子データを、適合させる際に用いた学習データに追加し、次に同じ翻訳系を用いる場合、そのデータを追加した学習データを用いてもよい。
塩基配列を好適化するのは、発現させる遺伝子のコドン配列を、学習データにおけるコドン配列の規則性に適合させることにより行う。
例えば、今、2つのコドン配列の規則性によって、発現させる遺伝子のコドン配列を決める場合を考える。例として、発現させる遺伝子中の2つのアミノ酸の並びをA−Bとする。Aには、3種類のコドンa1、a2、a3が存在し、Bには、b1、b2の2種類のコドンが存在するとすると、コドンの選び方には6通り存在する。学習データにおいては、その中で、a1−b2の頻度が最も高いとすると、発現させる遺伝子の塩基配列として、a1−b2を選択する。このように、学習データにおいて、出現すると期待される確率が最も高いコドン配列を選択し、発現させる遺伝子のコドン配列とする。
この例では、規則性を考えるコドン配列におけるコドン数を2つとしたが、3つ以上でも良く、学習データと発現させる遺伝子のコドン配列の適合性を考えると、コドン数は多い方が良いと考えられる。隠れマルコフモデルを利用する場合には、理論的には任意の長さのコドン配列の適合性を計算できるが,隠れ状態の数によって規則性を考えるコドン配列におけるコドン数が決まる。その数は、コドン数が多くなると、それに伴い、コドン配列の頻度の計算量が増え、コストも増加するので、10個〜50個にするのが好ましい。
学習データにおけるコドン配列の規則性を規定するための方法は、特に限定されないが、隠れマルコフモデルを利用するのが好ましい。隠れマルコフモデルにおいては、大量の学習データ {g1, ..., g, ..., gT} を収集し、これらすべての遺伝子におけるコドンciに対して,
を最大化するようなパラメータの組 {πa, sab, da(ci)} を求める。(ここで、πaはスタートコドン(Met)出力前における状態aの初期確率、sabは状態 a から状態 bへの状態遷移確率、da(ci)は状態 a で コドンci が観測される出力確率である。)
ここで、各パラメータはバウム・ウエルチ(Baum Welch)アルゴリズムを用いて決定されるのが好ましい。即ち、
1. 初期値π, sab, da(ci)を設定する。
2. 学習データ上の遺伝子gにおいてi番目のコドンで状態aから状態bへの遷移確率γi(a,b,g)を、i,a,b全ての組み合わせに関して学習データから演算する。
具体的には、以下の式を計算する(ここで、Lは遺伝子gの全コドン数、ci Lはi番目からL番目(つまり最後まで)のコドンを意味する文字列、Sは状態 a から状態 bへの状態遷移に対応したsabに関して全ての状態遷移に対応したsab、Dはコドンciに対応したda(ci)に関して全てのコドンに対応したda(ci)である。)
3. γi(a,b,g)からπ, sab, da(ci)を計算して再定義する。
具体的には、以下の式を計算する。
4.各パラメータが安定しなければ2へ戻る。
このアルゴリズムを、各パラメータが完全に安定するまで行ってもよいが、それには事実上膨大な時間がかかるので、このサイクルを所定の回数行ってアルゴリズムを終了してもよい。この場合の回数は100回〜1000回程度行えばよい。なお、1において、初期値の設定方法は特に限定されないが、実施例のように擬似乱数に確率的な制約を加えて設定してもよい。
Baum Welchアルゴリズムで得られた各パラメータを用い、すべてのコドンの組み合わせにおける出力確率を演算して、最大のものを求めれば、目的のコドン配列が得られる。即ち、Baum Welchアルゴリズムによって決定されたモデルMにおける文字列の出力確率は状態遷移σ1,a2,a2,・・・σL,aLの組み合わせ全てを足したもの
となる。
しかしながら、この計算には膨大な時間がかかるため、近似値が得られる手法を用いてもよく、その手法は限定されないが、例えば、以下のような3つの条件を有する「枝刈り」を利用してもよい。(なお、図1に、この3つの条件の具体例を挙げた。)
まず、(i)に関しては明らかであって、ここでの目的が、発現させる遺伝子のコドン配列を決めることであるため、目的とすべきアミノ酸配列はあらかじめ決まっており、i番目に、アミノ酸aiに対応しないコドンciを使用している塩基配列を選択できない(ii)に関しても明らかといえるが、以下、帰納法にて厳密に証明する。
このように、(i)と(ii)に関しては好適解を求めるにあたって間違いを起こさないが、(iii)に関しては好適解を求めるに当たって間違いを起こしうる。nを十分に大きくすることで(iii)の条件が厳しくなり、誤った枝刈りを起こす可能性は減るため、nを十分大きくすることが好ましい。ただし、nを大きくするほど,(ii)のチェックを行うのに必要な計算量が増加する。
==塩基配列設計システム==
上記塩基配列設計方法を自動化するために、コンピュータに実行させることができるようにプログラム化する。こうして作成されたプログラムも、本発明の権利範囲内である。
さらに、このプログラムを実行するためのコンピュータとともに、塩基配列データを入力するための入力装置、及びプログラムの実行により得られた結果を出力するための出力装置を備えた塩基配列設計システムとすることもできる。
<実施例>
(1)S.cerevisiaeのadh1遺伝子及びadh2遺伝子の塩基配列の設計
本実施例では、翻訳系として大腸菌JM109を用いた。この細胞株は、大腸菌K12株に由来する菌株であるため、学習データとして、ゲノムデータベースDDBJ(http://www.ddbj.nig.ac.jp/)のE.coli K12 MG1655の塩基配列データを利用した。この翻訳系で発現させる遺伝子として、Saccharomyces cerevisiae由来のアルコールデヒドロゲナーゼ遺伝子adh1(adh1w、配列番号1)及びadh2(adh2w、配列番号2)を用いた。
まず、規則性を考えるコドン配列におけるコドン数を8個とし、コドンを決定するアミノ酸の8個前までのコドン配列についての規則性を検討した。学習データにおけるコドン配列の規則性を規定するためには、隠れマルコフモデルを利用した。バウム・ウエルチ(Baum Welch)アルゴリズムにおいては、初期値として、時刻を入力して発生させた疑似乱数に対し、状態遷移確率や出力確率のすべての確率値の合計が1になるように設定した乱数を用いた。また、350回のアルゴリズムを行って学習データを学習させた。
このようにして得られたモデルを用い、Adh1及びAdh2に対するコドン配列を好適化した。その際、上記3つの条件を有する「枝刈り」を用いた。本実施例では、nを50として、演算を行ったところ、S.cerevisiae由来のAdh1及びAdh2の両者で(iii)の枝刈りは起こらなかったため、誤りを含み得る枝刈りを行わなくても済み、厳密な最適解を得ることができた。
(2)好適化したadh1遺伝子及びadh2遺伝子の合成
好適化したadh1遺伝子(adh1c、配列番号3)及びadh2遺伝子(adh2c、配列番号4)を以下のように合成した。
adh1cに関しては40bpのプライマー群をつなげ合わせる方法(Assembly PCR法)で合成を行った。まず、adh1cの塩基配列に対応するforwardプライマーとreverseのプライマーを、40bpの長さずつに切り分ける形で用意した。adh1の塩基配列の長さは1047bpであるために、forwardプライマー26本(配列番号5〜30)、reverseプライマー26本(配列番号31〜56)となった。このようにして用意した26×2本のプライマーを以下の条件でAssembly PCR法を行った。
まず、全プライマーを等濃度混合したprimer mix(250μM)を作製し、以下の反応液(50μl)で、94℃30秒−52℃30秒−72℃30秒を55サイクル行った。
反応液: 0.2 mM dNTP 5μl
primer mix 0.5μl
Pfu Ultra (Stratagene) 0.25μl
Pfu Ultra用10×buffer 5μl
滅菌水 39.25μl
反応終了後、反応液をテンプレートにして、再び以下の反応液でPCRを行った。条件は、94℃2分の変性反応後、94℃30秒−53℃30秒−72℃60秒を30サイクル行い、72℃10分の伸長反応を行った。このとき、プライマーとして、後の段階でベクターとのライゲーションができるように、先頭のforwardプライマー(配列番号5)の最初にEcoRIサイトをつけて長さを調節したプライマー(配列番号57)と最初のreverseプライマー(配列番号31; EcoRIサイト付加済み)を用いた。
反応液: テンプレート 1μl
0.2 mM dNTP 5μl
プライマー(配列番号57)(250μM) 0.5μl
プライマー(配列番号31)(250μM) 0.5μl
Pfu Ultra (Stratagene) 1μl
Pfu Ultra 用10×buffer 5μl
滅菌水 36μl
PCR産物をアガロースゲルで精製し、EcoRIで切断後、pUC19のEcoRI部位に挿入した。塩基配列を決定することにより、正しい配列を有していることを確認した。また、adh2cに関しては、adh1cと同様に設計したプラスミドの合成をoperon社に合成委託したが、基本的には、adh1cと同様に合成することができる。
(3)adh1遺伝子及びadh2遺伝子の合成
一方、adh1w及びadh2wは、S.cerevisiae YPH 499から抽出したゲノムDNAを鋳型にしてPCRを行い、各クローンを得た。なお、PCRは、それぞれの遺伝子に対するプライマーペア(adh1wに対しては、配列番号58と59のプライマーペア、adh2wに対しては配列番号60と61のプライマーペア)を用い、94℃2分の変性反応後、94℃30秒−53℃30秒−72℃60秒を30サイクル行い、72℃10分の伸長反応を行った。
プライマー(大文字はクローニングのために付加した制限酵素サイトを示す):
adh1w増幅用forwardプライマー(配列番号58):
GGAATTCatgtctatcccagaaactcaaaaaggtgtt
adh1w増幅用reverseプライマー(配列番号59):
GGAATTCttatttagaagtgtcaacaacgtatctacc
adh2w増幅用forwardプライマー(配列番号60):
GGAATTCatgtctattccagaaactcaaaaagccatt
adh2w増幅用reverseプライマー(配列番号61):
GGAATTCttatttagaagtgtcaacaacgtatctacc
反応液: テンプレート 1μl
0.2 mM dNTP 5μl
フォワードプライマー(250μM) 0.5μl
リバースプライマー(250μM) 0.5μl
Pfu Ultra (Stratagene) 1μl
Pfu Ultra 用10×buffer 5μl
滅菌水 36μl
PCR産物をアガロースゲルで精製し、EcoRIで切断後、pUC19のEcoRI部位に挿入した。塩基配列を決定することにより、正しい配列を有していることを確認した。
(4)adh1w、adh2w、adh1c、adh2cの各遺伝子の発現ベクターの構築
このようにして得られたadh1c、adh2c、adh1w及びadh2wがEcoRI部位に挿入されたプラスミドを鋳型とし、PCRを行った。なお、PCRは(3)と同様の条件で行なったが、プライマーは各遺伝子を特異的に増幅するプライマーペア(adh1cに対しては、配列番号62と63のプライマーペア、adh2cに対しては配列番号64と65のプライマーペア、adh1wに対しては、配列番号66と67のプライマーペア、adh2wに対しては配列番号68と69のプライマーペア)を用いた。
プライマー(大文字はクローニングのために付加した制限酵素サイトを示す):
pCold用adh1c増幅用forwaordプライマー(配列番号62)
CCGGAATTCatgagcattccggaaacgcaaaaaggtgtg
pCold用adh1c増幅用reverseプライマー(配列番号63)
AACTGCAGttatttgctggtatccaccacatagcggcc
pCold用adh2c増幅用forwaordプライマー(配列番号64)
CCGGAATTCatgagcattccggaaacccagaaagcgattatt
pCold用adh2c増幅用reverseプライマー(配列番号65)
AACTGCAGttatttgctggtatccaccacatagcggcc
pCold用adh1w増幅用forwaordプライマー(配列番号66)
CCGGAATTCatgtctatcccagaaactcaaaaaggtgttatc
pCold用adh1w増幅用reverseプライマー(配列番号67)
AACTGCAGttatttagaagtgtcaacaacgtatctacc
pCold用adh2w増幅用forwaordプライマー(配列番号68)
CCGGAATTCatgtctattccagaaactcaaaaagccattatc
pCold用adh2w増幅用reverseプライマー(配列番号69)
AACTGCAGttatttagaagtgtcaacaacgtatctacc
PCR産物をアガロースゲルで精製し、EcoRI及びPstIで切断後、低温発現誘導型のベクターであるpColdIII及びpColdIV(タカラバイオ社)のEcoRI-PstI部位に挿入した。このようにして作製したプラスミド(表1)をJM109に形質転換した。
(5)好適化したadh1遺伝子及びadh2遺伝子の発現誘導
まず、各プラスミドを有するE.coli JM109株及びインサートを有さないpUC19を有するJM109株を3 ml LB液体培地にて、37 ℃ 12 時間程度、撹拌しながら前培養した。その後の本培養は、以下のようにベクターによって操作が異なる。
pUC19をベクターとするプラスミドは、前培養の後に、坂口フラスコに入った100 ml LB液体培地(+アンピシリン 50 μg/ml)に3 mlの培養液全てを加え、37 ℃で1.5 時間振盪培養(120 rpm)したのちに、終濃度100 μMになるようにIPTGを加え、その後に再び37 ℃で24 時間振盪培養(120 rpm)した。
pColdをベクターとするプラスミドは、前培養の後に、坂口フラスコに入った 100 ml LB液体培地(+アンピシリン50 μg/ml)に3 mlの培養液全てを加え、37 ℃で1.75 時間振盪培養(120 rpm)した後に、15 ℃で30 min静置した。その後、終濃度100 μMになるようにIPTGを加えて、さらに15 ℃で24 時間振盪培養(120 rpm)した。
このようにして得られた培養液を10,000 rpm 10 minにて遠心分離を行い、上清を捨てた後に残った菌体を100 mM トリスバッファー(pH8)に懸濁した。その懸濁液を再び7,200 rpmにて10 min遠心分離を行い、上清を捨てた後に残った菌体を100 mMトリスバッファー(pH8)に懸濁した。このようにして得られた懸濁液を4℃で10 min超音波破砕をした後に、再び10,000 rpmにて10 min遠心分離を行い、上清を無細胞抽出物とした。
この無細胞抽出物中のADH活性を以下のように測定した。すなわち、無細胞抽出物を1倍、10倍、100倍、1000倍に希釈し、各100μlを下記の基質溶液900μlと混合し、10 sec間隔で50secまで波長340 nmでの吸光度を測定した。
基質溶液: ピロリン酸ナトリウム 85mM
セミカルバジド塩酸塩 6.5mM
グリシン 18mM
エタノール 550mM
NAD+ 1.75mM
また、各無細胞抽出物について、BSAをスタンダードとしてブラッドフォード法(CBB法)を用いて総タンパク質量の測定を行った。得られた吸光度から、下記式を用いて、ADH活性を算出した。表2にその結果を示す。なお、ネガティブコントロール(プラスミドを何も組み込まないE.coli JM109株及びインサートを持たないpUC19を有するE.coli JM109株)の比活性は0であった。
このように、塩基配列を好適化することにより、1つの組み合わせ(adh2とpColdIV)を除いて、タンパク質の発現量が2.5倍から10倍増強された。以上より、所定の翻訳系を用いて遺伝子を発現させる際、本発明の塩基配列設計方法によって、発現レベルを少なくとも2.5倍から10倍増強させ得ることが示された。
本発明によって、所定の翻訳系を用いて遺伝子を発現させるとき、高い発現レベルを得ることができる、遺伝子の塩基配列設計方法を提供できる。

Claims (9)

  1. 所定の翻訳系を用いて発現させる遺伝子の塩基配列設計方法であって、
    入力装置が、遺伝子の塩基配列をコンピュータに入力する工程と、
    前記コンピュータが、入力された前記遺伝子の塩基配列から得られるコドン配列を、学習データにおける、バウム・ウエルチ アルゴリズムを用いて計算されたコドン配列の規則性に、隠れマルコフモデルを用いて適合させる工程と
    出力装置が、適合させた前記遺伝子の塩基配列を出力する工程と、
    を含むことを特徴とする塩基配列設計方法。
  2. 前記学習データが、前記翻訳系が由来する生物種の遺伝子プールであることを特徴とする請求項1に記載の方法。
  3. 前記学習データが、所定の翻訳系において、すでに発現レベルが所定レベル以上であることが明らかになっている遺伝子プールであることを特徴とする請求項1に記載の方法。
  4. 前記コンピュータが、さらに、適合させた前記遺伝子の塩基配列を、適合させる際に用いた前記学習データに、データとして追加する工程を含むことを特徴とする請求項1に記載の方法。
  5. 前記翻訳系が細胞内にあることを特徴とする請求項1〜4のいずれか1項に記載の方法。
  6. 前記翻訳系がin vitroタンパク合成系内にあることを特徴とする請求項1〜4のいずれか1項に記載の方法。
  7. 所定の翻訳系を用いて発現させるための遺伝子の塩基配列を設計するためのプログラムであって、
    コンピュータに請求項1〜6のいずれか1項の方法を実行させるプログラム。
  8. 請求項7に記載のプログラムを記録した、コンピュータで読み取り可能な記録媒体。
  9. 所定の翻訳系を用いて発現させるための遺伝子の塩基配列設計システムであって、
    (i) 遺伝子の塩基配列をコンピュータに入力するための入力装置、
    (ii) 前記入力装置によって入力された前記遺伝子の塩基配列から得られるコドン配列を、学習データにおける、バウム・ウエルチ アルゴリズムを用いて計算されたコドン配列の規則性に、隠れマルコフモデルを用いて適合させるためのコンピュータ、および
    (iii) 適合させた前記遺伝子の塩基配列を出力するための出力装置
    を備えた塩基配列設計システム。
JP2008503907A 2006-03-09 2007-03-08 塩基配列設計方法 Expired - Fee Related JP5062634B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008503907A JP5062634B2 (ja) 2006-03-09 2007-03-08 塩基配列設計方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006064816 2006-03-09
JP2006064816 2006-03-09
PCT/JP2007/054530 WO2007102578A1 (ja) 2006-03-09 2007-03-08 塩基配列設計方法
JP2008503907A JP5062634B2 (ja) 2006-03-09 2007-03-08 塩基配列設計方法

Publications (2)

Publication Number Publication Date
JPWO2007102578A1 JPWO2007102578A1 (ja) 2009-07-23
JP5062634B2 true JP5062634B2 (ja) 2012-10-31

Family

ID=38474997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008503907A Expired - Fee Related JP5062634B2 (ja) 2006-03-09 2007-03-08 塩基配列設計方法

Country Status (2)

Country Link
JP (1) JP5062634B2 (ja)
WO (1) WO2007102578A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4205762A1 (en) 2020-10-02 2023-07-05 Osaka University Improved dna vaccine for sars-cov-2
JP2022162206A (ja) * 2021-04-12 2022-10-24 NUProtein株式会社 塩基配列変換装置、塩基配列変換方法、ポリヌクレオチド、ポリヌクレオチドを作製する方法、およびプログラム
WO2022224336A1 (ja) 2021-04-20 2022-10-27 富士通株式会社 情報処理プログラム、情報処理方法および情報処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004059556A2 (de) * 2002-12-23 2004-07-15 Geneart Gmbh Verfaren und vorrichtung zum optimieren einer nucleotidsequenz zur expression eines proteins
JP2005046024A (ja) * 2003-07-31 2005-02-24 Research Association For Biotechnology 新規なプロテインキナーゼおよびプロテインキナーゼスプライス変異体をコードする遺伝子

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004059556A2 (de) * 2002-12-23 2004-07-15 Geneart Gmbh Verfaren und vorrichtung zum optimieren einer nucleotidsequenz zur expression eines proteins
JP2005046024A (ja) * 2003-07-31 2005-02-24 Research Association For Biotechnology 新規なプロテインキナーゼおよびプロテインキナーゼスプライス変異体をコードする遺伝子

Also Published As

Publication number Publication date
WO2007102578A1 (ja) 2007-09-13
JPWO2007102578A1 (ja) 2009-07-23

Similar Documents

Publication Publication Date Title
US10544403B2 (en) Modified transposases for improved insertion sequence bias and increased DNA input tolerance
Liang et al. Genotyping genome‐edited mutations in plants using CRISPR ribonucleoprotein complexes
US9767251B2 (en) Methods for accurate sequence data and modified base position determination
Gustafsson et al. Codon bias and heterologous protein expression
Clayton Transcription and replication of mitochondrial DNA
Gu et al. A universal trend of reduced mRNA stability near the translation-initiation site in prokaryotes and eukaryotes
WO2011034108A1 (ja) 改変型フラビンアデニンジヌクレオチド依存性グルコースデヒドロゲナーゼ
Yang et al. Signature gene expression reveals novel clues to the molecular mechanisms of dimorphic transition in Penicillium marneffei
WO2020249111A1 (zh) 一种基因组编辑检测方法、试剂盒及应用
JP5062634B2 (ja) 塩基配列設計方法
US20180258409A1 (en) Recombinase mutants
KR101600902B1 (ko) 코돈 조합화 및 변이유발을 이용한 유전자 라이브러리의 합성 방법
Dew-Budd et al. Evolutionary and biochemical analyses reveal conservation of the Brassicaceae telomerase ribonucleoprotein complex
CN113234701A (zh) 一种Cpf1蛋白及基因编辑系统
CN114561374A (zh) 一种新型嗜热核酸内切酶突变体及其制备方法和应用
Ezure et al. A cell-free protein synthesis system from insect cells
Vega-Sánchez et al. Tag-based approaches for deep transcriptome analysis in plants
Li et al. One Versatile Cas9-Integrated Single-Tube Duplex Quantitative Real-Time PCR System for Rapid Analysis of CRISPR/Cas-Induced Mutants
Östberg et al. Analysis of mammalian alcohol dehydrogenase 5 (ADH5): Characterisation of rat ADH5 with comparisons to the corresponding human variant
Gabr et al. Hypothesis: Trans‐splicing Generates Evolutionary Novelty in the Photosynthetic Amoeba Paulinella
WO2021081713A1 (zh) 转氨酶突变体及其应用
JP5799534B2 (ja) フラビンアデニンジヌクレオチド依存性グルコースデヒドロゲナーゼの安定性を向上するための方法
Christen et al. Genome partitioner: A web tool for multi-level partitioning of large-scale DNA constructs for synthetic biology applications
JP2009165426A (ja) 翻訳にキャップ構造を必要としない5’utrリーダー配列およびかかる配列を利用したインビトロ無細胞系タンパク質合成方法
Callis et al. Preparation, characterization, and use of tagged ubiquitins

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120731

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees