JP2023506569A - 遺伝子変異ライブラリを構築するための方法 - Google Patents
遺伝子変異ライブラリを構築するための方法 Download PDFInfo
- Publication number
- JP2023506569A JP2023506569A JP2022537822A JP2022537822A JP2023506569A JP 2023506569 A JP2023506569 A JP 2023506569A JP 2022537822 A JP2022537822 A JP 2022537822A JP 2022537822 A JP2022537822 A JP 2022537822A JP 2023506569 A JP2023506569 A JP 2023506569A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- oligomer
- pool
- library
- restriction endonuclease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 206010064571 Gene mutation Diseases 0.000 title claims description 43
- 238000003860 storage Methods 0.000 claims abstract description 33
- 230000035772 mutation Effects 0.000 claims abstract description 24
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 9
- 108091008146 restriction endonucleases Proteins 0.000 claims description 61
- 239000012634 fragment Substances 0.000 claims description 55
- 150000001413 amino acids Chemical class 0.000 claims description 53
- 239000002773 nucleotide Substances 0.000 claims description 43
- 125000003729 nucleotide group Chemical group 0.000 claims description 43
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 30
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 30
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 29
- 238000010276 construction Methods 0.000 claims description 28
- 108090000623 proteins and genes Proteins 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 230000000295 complement effect Effects 0.000 claims description 24
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 17
- 238000007481 next generation sequencing Methods 0.000 claims description 16
- 102000012410 DNA Ligases Human genes 0.000 claims description 13
- 108010061982 DNA Ligases Proteins 0.000 claims description 13
- 229920001184 polypeptide Polymers 0.000 claims description 12
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 12
- 238000012408 PCR amplification Methods 0.000 claims description 11
- 238000007480 sanger sequencing Methods 0.000 claims description 8
- 230000029087 digestion Effects 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 108091003079 Bovine Serum Albumin Proteins 0.000 claims description 6
- 230000033228 biological regulation Effects 0.000 claims description 6
- 229940098773 bovine serum albumin Drugs 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 229910003177 MnII Inorganic materials 0.000 claims description 4
- 238000010367 cloning Methods 0.000 claims description 4
- 238000001502 gel electrophoresis Methods 0.000 claims description 4
- 102000008300 Mutant Proteins Human genes 0.000 claims description 3
- 108010021466 Mutant Proteins Proteins 0.000 claims description 3
- 239000013615 primer Substances 0.000 description 50
- 235000001014 amino acid Nutrition 0.000 description 48
- 108020004414 DNA Proteins 0.000 description 42
- 108091028043 Nucleic acid sequence Proteins 0.000 description 27
- 239000000047 product Substances 0.000 description 21
- 230000003321 amplification Effects 0.000 description 16
- 238000003199 nucleic acid amplification method Methods 0.000 description 16
- 108020004705 Codon Proteins 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 13
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 101150062912 cct3 gene Proteins 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000013461 design Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 230000006862 enzymatic digestion Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000001962 electrophoresis Methods 0.000 description 5
- 239000012467 final product Substances 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 239000004065 semiconductor Substances 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 4
- 102000003960 Ligases Human genes 0.000 description 4
- 108090000364 Ligases Proteins 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 108010027697 Type I Site-Specific Deoxyribonucleases Proteins 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- VUFNLQXQSDUXKB-DOFZRALJSA-N 2-[4-[4-[bis(2-chloroethyl)amino]phenyl]butanoyloxy]ethyl (5z,8z,11z,14z)-icosa-5,8,11,14-tetraenoate Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OCCOC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 VUFNLQXQSDUXKB-DOFZRALJSA-N 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 2
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 2
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 2
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 2
- 108091081548 Palindromic sequence Proteins 0.000 description 2
- 102100029812 Protein S100-A12 Human genes 0.000 description 2
- 101710110949 Protein S100-A12 Proteins 0.000 description 2
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 2
- 108010067022 Type III Site-Specific Deoxyribonucleases Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- WOWHHFRSBJGXCM-UHFFFAOYSA-M cetyltrimethylammonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCC[N+](C)(C)C WOWHHFRSBJGXCM-UHFFFAOYSA-M 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 208000034454 F12-related hereditary angioedema with normal C1Inh Diseases 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940125644 antibody drug Drugs 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 208000016861 hereditary angioedema type 3 Diseases 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Ecology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
蓄積容量が大きい遺伝子変異ライブラリを作製するために、比較的少ないオリゴマー配列を合成し、次にそれを組み立てることが可能な、蓄積容量が大きい遺伝子変異ライブラリの構築方法が提供される。
Description
本発明は、遺伝子工学の分野、及び特に蓄積容量が大きい遺伝子変異ライブラリの構築に関する。本発明において、比較的少ないオリゴマー配列を合成し、次にそれを組み立てることによって、蓄積容量が大きい遺伝子変異ライブラリが作製される。
インビトロ分子最適化は、改善された又は新規の変異タンパク質を作製し、制御配列を同定し、構造及び機能に対する重大な残基を探索するために、非常に効果的に使用され得る。インビトロ分子最適化の方法を使用した合成ライブラリの構築は、タンパク質の特性、制御及び機能を体系的に調べるための非常に有効な方法である。異なる下流発現系に従い、遺伝子変異ライブラリの構築のために理論的に必要とされる全てのプライマーを合成するためにハイスループット半導体精密プライマープールを使用することによって、コドン最適化を行い得、予想外のコドン又は停止コドンを導入する問題を根本的に排除するために、各変異位置での異なるコドン分布率が設定され得る。ライブラリは、その後のスクリーニングに対する時間及び労力を削減するために、必要とされる変異体のみを含有する。しかし現在、ハイスループット半導体精密プライマープールにより合成されるオリゴマーの数は限定的であり、半導体チップにより蓄積容量が大きいライブラリ(105~1010)を合成するための費用は非常に高額になる。
Kitzman J O,Starita L M,Lo R S et al.,Massively parallel single-amino-acid mutagenesis[J].Nature Methods,2015,12(3):203-206.
Kosuri S,Eroshenko N,Leproust E M et al.,Scalable gene synthesis by selective amplification of DNA pools from high-fidelity microchips[J].Nature Biotechnology,2010,28(12):1295-1299.
Engler C et al.,PLoS ONE,2008,3(11):e3647
Engler C et al.,PLoS ONE,2009,4(5):e5553
Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual(Second Edition),Cold Spring Harbor,New York
Vladimir P,Ong J L,Kucera R B et al.,Optimization of Golden Gate assembly through application of ligation sequence-dependent fidelity and bias profiling[J].BioRxiv,2018:322297
これを考慮して、蓄積容量が大きい遺伝子変異ライブラリを得るために、比較的少ないオリゴマー配列を合成し、次いでそれを組み立てることが可能である、蓄積容量が大きい
ライブラリの構築方法が発明され、これによって大容量ライブラリ構築に対する費用が大きく削減される。
ライブラリの構築方法が発明され、これによって大容量ライブラリ構築に対する費用が大きく削減される。
具体的に、本発明は、次の態様に関する:
本発明の第1の態様は、蓄積容量が大きい遺伝子変異ライブラリを構築するための方法に関し、この方法は、
(1)ライブラリ構築を必要とするアミノ酸配列をコードするヌクレオチド配列に従い、設計される2つの隣接するオリゴマープールが消化後に同じ粘着末端を生成させる、変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有する2つ以上のオリゴマープールを設計し、合成し;
(2)前記オリゴマープールを増幅させ;
(3)組み立てられたオリゴマープールを得るために、反応系において前記オリゴマープールを組み立て;
(4)前記蓄積容量が大きい遺伝子変異ライブラリを得るために、前記組み立てられたオリゴマープールを増幅させること
を含む。
本発明の第1の態様は、蓄積容量が大きい遺伝子変異ライブラリを構築するための方法に関し、この方法は、
(1)ライブラリ構築を必要とするアミノ酸配列をコードするヌクレオチド配列に従い、設計される2つの隣接するオリゴマープールが消化後に同じ粘着末端を生成させる、変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有する2つ以上のオリゴマープールを設計し、合成し;
(2)前記オリゴマープールを増幅させ;
(3)組み立てられたオリゴマープールを得るために、反応系において前記オリゴマープールを組み立て;
(4)前記蓄積容量が大きい遺伝子変異ライブラリを得るために、前記組み立てられたオリゴマープールを増幅させること
を含む。
一実施形態では、本発明の方法における段階(2)は、増幅された各オリゴマープールを得るために、それぞれ各オリゴマープールを鋳型として使用し、各オリゴマープールの配列に従い設計したフォワードプライマー及びリバースプライマーをプライマー対として使用し、ハイフィデリティーDNAポリメラーゼを使用することによって、各オリゴマープールにおいてPCR増幅を実施することを含む。好ましくは、PCR増幅系にウシ血清アルブミンがさらに含まれる。
一実施形態では、本発明の方法の段階(3)は、増幅された各オリゴマープールを添加し、制限エンドヌクレアーゼ及びDNAリガーゼを同時に添加し、組み立てられたオリゴマープールを得るために制限ライゲーション法を使用することにより、増幅された各オリゴマープールを組み立てることを含む。
一実施形態では、本発明の方法の段階(4)は、PCRを実施するために、組み立てられたオリゴマープールを鋳型として使用し、第1のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーをプライマー対として使用し、ハイフィデリティーDNAポリメラーゼを使用することによって、組み立てられたオリゴマープールにおいてPCR増幅を実施して、蓄積容量が大きい遺伝子変異ライブラリを得ることを含む。
一実施形態では、本発明の遺伝子変異ライブラリの蓄積容量は、最大105、好ましくは最大106、より好ましくは最大107、より好ましくは最大108、より好ましくは最大109、より好ましくは最大1010である。
一実施形態では、本発明で使用される制限エンドヌクレアーゼはIIS制限エンドヌクレアーゼであり、消化後、隣接する2つのオリゴマープールが同じ粘着末端を生成させる。IIS型制限エンドヌクレアーゼは、AcuI、AlwI、BbsI、BbvI、BccI、BceAI、BciVI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BspMI、BspQI、BsrDI、BtgZI、BtsCI、BtsI、EarI、EciI、EcoP15I、FauI、FokI、HgaI、HphI、HpyAV、MboII、MmeI、MnlI、PleI、SapI及びSfaNIのうち1つ以上から選択される。好ましくは、IIS型制限エンドヌクレアーゼはBsaIである。
一実施形態では、本発明の方法の段階(1)は、次のことを含む:
(i)コードヌクレオチド配列において粘着末端を同定し、その配列を粘着末端の3’末端に従い2つ以上のオリゴマープールに対応する2つ以上の断片に分割し、
(ii)配列が2つの断片に分割される場合、
オリゴマープール1を得るために、第1の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列1を連続的に導入し、オリゴマープール2を得るために、第2の断片の5’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列2を連続的に導入するか;
又は、配列がn個の断片に分割される場合(nは3以上の正の整数)、
オリゴマープール1を得るために、第1の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列1を連続的に導入し;オリゴマープール2を得るために、第2の断片の5’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列2を連続的に導入し、第2の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列3を連続的に導入するなどし、同様に、オリゴマープールnを得るために、n番目の断片の5’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列2n-2を連続的に導入し、n番目の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列2n-1を連続的に導入する。
(i)コードヌクレオチド配列において粘着末端を同定し、その配列を粘着末端の3’末端に従い2つ以上のオリゴマープールに対応する2つ以上の断片に分割し、
(ii)配列が2つの断片に分割される場合、
オリゴマープール1を得るために、第1の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列1を連続的に導入し、オリゴマープール2を得るために、第2の断片の5’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列2を連続的に導入するか;
又は、配列がn個の断片に分割される場合(nは3以上の正の整数)、
オリゴマープール1を得るために、第1の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列1を連続的に導入し;オリゴマープール2を得るために、第2の断片の5’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列2を連続的に導入し、第2の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列3を連続的に導入するなどし、同様に、オリゴマープールnを得るために、n番目の断片の5’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列2n-2を連続的に導入し、n番目の断片の粘着末端の後に3’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列2n-1を連続的に導入する。
一実施形態では、特定配列1~特定配列2n-1は、元のコードヌクレオチド配列と相同ではないランダム配列であり得る。
一実施形態では、粘着末端は、単一粘着末端(single sticky end)又は縮重粘着末端(degenerate sticky end)である。一実施形態では、粘着末端は、単一粘着末端(single sticky end)であり、オリゴマープールの数は2~6、好ましくは2つである。別の実施形態では、粘着末端が縮重粘着末端(degenerate sticky end)であり、オリゴマープールの数は2つである。一実施形態では、粘着末端のGC含量は50%~75%である。一実施形態では,粘着末端はパリンドローム構造を含有しない。
一実施形態では、本発明の方法の段階(3)の制限ライゲーション法はGolden Gateクローニングである。
一実施形態では、本発明の方法は、(5)最終的なライブラリ産物を得るために、段階(4)で得た遺伝子変異ライブラリ産物を回収及び/又は精製することをさらに含む。好ましくは、段階(4)で得た遺伝子変異ライブラリ産物をゲル電気泳動により回収及び/又は精製する。
一実施形態では、本発明の方法は、(6)配列分布を検証する、及び/又はアミノ酸分布を検出するために、段階(5)で得た最終ライブラリ産物をシーケンシングすることをさらに含む。好ましくは、シーケンシングは、サンガーシーケンシング及び/又はNGSシーケンシングである。
一実施形態では、段階(1)で合成される各オリゴマープール中の変異ヌクレオチドの数は、1~108、好ましくは1~21である。一実施形態では、本発明の方法の段階(1)で合成される各オリゴマープール中の変異ヌクレオチドは、1~36個、好ましくは1~7個の変異アミノ酸をコードする。一実施形態では、段階(1)で合成される各オリゴマープール中の変異ヌクレオチドによりコードされる変異アミノ酸は、隣接又は非隣の何れかである。
一実施形態では、本発明の方法で使用されるハイフィデリティーDNAポリメラーゼは、Phusion DNAポリメラーゼ、Q5ポリメラーゼ及びprimerSTARポリメラーゼのうち1つ以上から選択される。好ましい実施形態では、使用されるハイフィデリティーDNAポリメラーゼはPhusion DNAポリメラーゼである。
本発明の第2の態様は、遺伝子変異ライブラリを構築するために本発明による方法を使用することに関する。
本発明の第3の態様は、タンパク質又はポリペプチドのスクリーニングにおける、本発明による方法により構築される遺伝子変異ライブラリの使用に関する。
本発明の第4の態様は、次の段階を含む、タンパク質中のアミノ酸変異とそのタンパク質の特性、制御及び/又は機能との関係を分析するための方法に関する:
(1)遺伝子変異ライブラリを構築するために本発明による方法を使用すること;
(2)構築された遺伝子変異ライブラリ中の変異遺伝子によりコードされるタンパク質の特性、制御及び/又は機能を非変異タンパク質と比較すること;及び
(3)そのタンパク質中のアミノ酸変異とそのタンパク質の、特性、制御及び/又は機能との間の関係を分析すること。
(1)遺伝子変異ライブラリを構築するために本発明による方法を使用すること;
(2)構築された遺伝子変異ライブラリ中の変異遺伝子によりコードされるタンパク質の特性、制御及び/又は機能を非変異タンパク質と比較すること;及び
(3)そのタンパク質中のアミノ酸変異とそのタンパク質の、特性、制御及び/又は機能との間の関係を分析すること。
本発明により解決しようとする技術的問題及び本発明により達成される技術的効果
変異ライブラリは、タンパク質工学及び抗体薬物工学にとって非常に重要である。変異ライブラリを構築するために本発明の方法を使用することによって、その後のスクリーニングのための多くの時間、エネルギー及び金銭が節約され得る。現在、先行技術(オリゴマープールのハイスループット半導体精密合成を含む)により合成されるオリゴマーの数は限定的であり、蓄積容量が大きい(蓄積容量は105を超える)遺伝子変異ライブラリを合成することは非常に困難であるか又は費用が非常に高くなる。蓄積容量が大きい遺伝子変異ライブラリを作製するために、比較的少ないオリゴマー配列を合成し、次いでそれを組み立てることが可能な、蓄積容量が大きいライブラリの構築方法が本発明で開示される。蓄積容量は、最大107~1010であり得、これは、蓄積容量が大きいライブラリを構築する費用を大きく削減し、蓄積容量が大きいライブラリを合成する高コストの問題を解決する。
変異ライブラリは、タンパク質工学及び抗体薬物工学にとって非常に重要である。変異ライブラリを構築するために本発明の方法を使用することによって、その後のスクリーニングのための多くの時間、エネルギー及び金銭が節約され得る。現在、先行技術(オリゴマープールのハイスループット半導体精密合成を含む)により合成されるオリゴマーの数は限定的であり、蓄積容量が大きい(蓄積容量は105を超える)遺伝子変異ライブラリを合成することは非常に困難であるか又は費用が非常に高くなる。蓄積容量が大きい遺伝子変異ライブラリを作製するために、比較的少ないオリゴマー配列を合成し、次いでそれを組み立てることが可能な、蓄積容量が大きいライブラリの構築方法が本発明で開示される。蓄積容量は、最大107~1010であり得、これは、蓄積容量が大きいライブラリを構築する費用を大きく削減し、蓄積容量が大きいライブラリを合成する高コストの問題を解決する。
添付の図面と一緒に合わせて次の詳細な説明から本発明がより完全に理解されよう。
本記載及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」及び「the」は、文脈から別段明確に示されない限り、複数の指示物を指す。従って、例えば「分子(molecule)」に対する言及は、任意選択的にこのような分子の2つ以上の組み合わせなどを含む。
本明細書中で使用される場合、「約」という用語は、当業者により容易に知られる対応する数値の従来からのエラー範囲を指す。「約」ある特定の値又はパラメーターに対する本明細書中での言及は、値又はパラメーターそれ自身を含む実施形態を含む(及び説明する)。
本明細書中に記載の本発明の態様及び実施形態は、「含む(comprise)」、「からなる(consist of)」及び「基本的にからなる(essentially
consist of)」を含む態様及び実施形態を含むと理解される。
consist of)」を含む態様及び実施形態を含むと理解される。
「遺伝子変異ライブラリ」という用語は、大量のDNA変異体配列の組み合わせを指し、これは、遺伝子合成、遺伝子変異及び/又は定方向進化研究の産物である。遺伝子変異ライブラリは、ハイスループット薬物標的スクリーニング、タンパク質工学による定方向進化、高親和性及び特異性で変異体抗体をスクリーニングするための多様性抗体ライブラリの合成など、研究分野において次第に使用されるようになってきた。遺伝子変異ライブラリの構築は、天然の選択過程を模倣するために部位特異的突然変異誘発及び定方向性進化などの技術を使用し、それにより元のタンパク質のアミノ酸配列を変化させ、特異的な機能を有する変異タンパク質を得ることを含む。遺伝子変異ライブラリは、アラニンスキャニングライブラリ、縮重変異ライブラリ、トリマーライブラリ、部位特異的飽和変異ライブラリ、ランダム変異ライブラリなどを含む。
「遺伝子変異ライブラリの蓄積容量」という用語は、遺伝子変異ライブラリの最大容量サイズを指し、即ち遺伝子変異ライブラリ中に含有されるDNA変異体配列の数である。言い換えると、遺伝子変異ライブラリの蓄積容量が大きいほど、ライブラリ中に含有されるDNA変異体配列の数が多くなる。
「オリゴマー」という用語は一般に、比較的少ない反復単位から構成されるポリマーを指し、その相対的分子量は、低分子と巨大分子との間である。本発明のオリゴマーは、ある特定の数のヌクレオチドを含有するヌクレオチドオリゴマーを指し、オリゴヌクレオチドと交換可能に使用され得る。本発明のオリゴマー中に含有されるヌクレオチド数は、2~200、3~150、4~100、4~50及び4~30であり得る。「オリゴマープール」という用語は、本発明において、複数の異なるオリゴマーを含有する混合物を指す
。
。
「変異ヌクレオチド」という用語は、ポリヌクレオチド又はオリゴヌクレオチド配列中の1つ以上の(例えばいくつかの)位置で変更されているヌクレオチドを指す。この変更は置換、欠失及び挿入から選択される。置換は、ある位置を占有するヌクレオチドを異なるヌクレオチドで置き換えることを意味し;欠失は、ある位置を占有するヌクレオチドを除去することを意味し;挿入は、ある位置を占有するヌクレオチドに隣接する、及びある位置を占有するヌクレオチドにすぐに続く位置でヌクレオチドを付加することを意味する。同様に、「変異アミノ酸」という用語は、タンパク質又はポリペプチド配列中の1つ以上の(例えばいくつかの)位置で変更されているアミノ酸を指す。この変更は置換、欠失及び挿入から選択される。置換は、ある位置を占有するアミノ酸を異なるアミノ酸で置き換えることを意味し;欠失はある位置を占有するアミノ酸を除去することを意味し;挿入は、ある位置を占有するアミノ酸に隣接する、及びある位置を占有するアミノ酸にすぐに続く位置にアミノ酸を付加することを意味する。
「制限エンドヌクレアーゼ」という用語は、特異的なヌクレオチド配列を認識し、各鎖の特異的な位置で2個のヌクレオチド間のホスホジエステル結合を切断する活性タンパク質のクラスを指す。制限エンドヌクレアーゼは広く分布し、ほぼ全ての細菌属及び種が少なくとも1つの制限エンドヌクレアーゼを有する。一般的な制限部位としては、AgeI、BamHI、BglII、EcoRI、EcoRV、FseI、HindIII、MauBI、MluI、NheI、NotI、PacI、PmeI、PstI、SacI、SacII、SalI、SmaI、SpeI、SfiIなどが挙げられるが限定されない。DNA配列への制限部位の導入は、DNA配列上での分子生物学的操作を促進し得る。
制限エンドヌクレアーゼは、構造/機能特性、サイズ、必要な補因子及びその作用形式に従い、次のタイプ:I型制限エンドヌクレアーゼ、II型制限エンドヌクレアーゼ及びIII型制限エンドヌクレアーゼに分けられ得る。I型制限エンドヌクレアーゼの分子量は比較的大きく、反応過程においてMg2+に加えてS-アデノシル-L-メチオニン、ATPなどを必要とする。これは宿主DNAのメチル化(即ち修飾)を触媒し得、これは非メチル化DNAの加水分解も触媒し得る(即ち認識及び酵素性消化)。通常、I型制限エンドヌクレアーゼの制限部位は、認識配列から数千塩基離れている。II型制限エンドヌクレアーゼは通常、分子量が比較的小さく、反応のためにMg2+のみを要する。これは、非メチル化DNAの加水分解しか触媒せず、認識配列上に特異的な制限部位を有する(特異的な短いパリンドローム配列)。従って、これは遺伝子工学において広く使用される。III型制限エンドヌクレアーゼはI型制限エンドヌクレアーゼと同様であり、修飾、認識及び酵素性消化の機能を有する。しかし、これは短い非対称配列を認識し、制限部位と認識配列との間の距離はおよそ20~30塩基対である。さらにIIS型制限エンドヌクレアーゼがある。これは、連続的な非対称配列を認識し、制限部位と認識配列との間の距離はおよそ1~6塩基対である。IIS制限エンドヌクレアーゼのサイズは中程度であり、約400~650アミノ酸である。IIS型制限エンドヌクレアーゼは主に単量体形態でDNAに結合するが、隣接する酵素と合わせて二量体を形成し、DNA鎖を協同的に切断することが一般的に認められている。従って、一部のIIS型酵素は、複数の認識配列があるDNA分子の切断においてより活性があり得る。一般的なIIS型制限エンドヌクレアーゼとしては、AcuI、AlwI、BbsI、BbvI、BccI、BceAI、BciVI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BspMI、BspQI、BsrDI、BtgZI、BtsCI、BtsI、EarI、EciI、EcoP15I、FauI、FokI、HgaI、HphI、HpyAV、MboII、MmeI、MnlI、PleI、SapI、SfaNIなどが挙げられるが限定されない。
「DNAリガーゼ」という用語は、1本のDNA鎖の末端3’-OHと別のDNA鎖の末端5’-Pとの間にホスホジエステル結合を形成し、それにより2本の隣接するDNA鎖を連結し得る酵素を指す。リガーゼの触媒性はATPの消費を必要とする。T4 DNAリガーゼは、DNA-DNA、DNA-RNA、RNA-RNA及び2本鎖DNAの粘着末端又は平滑末端を連結し得るリガーゼである。その分子量は約62kDであり、その活性は、0.2mol/L KCl及びスペルミンにより容易に阻害される。
「制限ライゲーション」という用語は、1つの反応で指定の順序で複数の断片を互いに連結し得る組み立て方法を指す。組み立てようとする断片上で相補的粘着末端を構築し、次いで組み立てようとする断片を制限エンドヌクレアーゼ(特にIIS型制限エンドヌクレアーゼ)及びDNAリガーゼと混合し、高温(制限エンドヌクレアーゼに対する最適温度、例えば37℃)から低温(リガーゼに対する最適温度、例えば16℃)の間で複数回繰り返す。高温は酵素性消化に好都合であり、低温はライゲーションに好都合である。各サイクルの結果、連結されないか又は元のプラスミドに連結し戻された断片の再消化が起こり得、それによって、より高い確率で正しく組み立てられたプラスミドを保持する。両酵素は最終的に不活性化される。IIS型制限エンドヌクレアーゼBsaI及びリガーゼを使用したGolden Gateにより最初に考案された制限ライゲーションの組み立て方法は、Golden Gateクローニングと呼ばれる。具体的な操作については、例えば非特許文献3及び非特許文献4を参照。
「導入する」という用語は、DNA鎖への外来ポリヌクレオチド配列の挿入を指す。挿入された外来ポリヌクレオチド配列は通常、正常に発現され得る。
「発現」という用語は、情報(遺伝子によりコードされる及び/又はエピジェネティックな情報など)が、細胞中に存在し、作動する構造に変換される工程を指す。従って、本明細書中で使用される場合、「発現」は、ポリヌクレオチドへの転写、ポリペプチドへの翻訳又はポリヌクレオチド及び/又はポリペプチド修飾(例えばポリペプチドの翻訳後修飾)さえも指し得る。オルタナティブスプライシングにより生成される転写産物若しくは分解された転写産物から生じるか又はポリペプチドの翻訳後プロセシング(例えばタンパク質分解による)から生じるかにかかわらず、転写されたポリヌクレオチドの断片、翻訳されたポリペプチドの断片又はポリヌクレオチド及び/又はポリペプチド修飾の断片(例えばポリペプチドの翻訳後修飾)もまた発現されるものとみなされるべきである。「発現される遺伝子」には、ポリヌクレオチド(mRNAなど)に転写され、次いでポリペプチドに翻訳される遺伝子、並びにRNAに転写されるがポリペプチドに翻訳されない遺伝子(例えばトランスファー及びリボソームRNA)が含まれる。
「PCR増幅」という用語はポリメラーゼ連鎖反応を指し、これは、特異的なDNA断片を増幅するための分子生物学的技術である。これはインビトロでの特別なDNA複製とみなされ得る。PCRの最大の特性は、微量のDNAを大幅に増加させ得ることである。具体的には、PCR技術の基本原理は、DNAの天然の複製工程と同様であり、その特異性は、増幅しようとする配列の両端と相補的なオリゴヌクレオチドプライマーに依存する。「PCR鋳型」という用語は、増幅しようとする特異的なDNA断片を指す。「PCRプライマー(対)」という用語は、オリゴヌクレオチド配列の対を指し、フォワードプライマー(F)は、鋳型としての2本鎖DNAにおけるセンス鎖の5’末端塩基に相補的なオリゴヌクレオチド配列であり(AはTに相補的であり、CはGに相補的及びその逆)、リバースプライマー(R)は、鋳型としての2本鎖DNAにおけるアンチセンス鎖の3’末端塩基に相補的なオリゴヌクレオチド配列である(AはTに相補的であり、CはGに相補的及びその逆)。PCR増幅は、3つの基本的な反応段階:変性、アニーリング及び伸長から構成され、(1)鋳型DNAの変性:ある一定の時間、90℃を上回る温度に鋳型DNAを加熱し、次いで2本鎖鋳型DNA又はPCR増幅により形成された2本鎖DNA
を解離させて1本鎖にして、この1本鎖がプライマーと結合して、次の反応ラウンドに対する準備をするようになり得ること;(2)鋳型DNA及びプライマーのアニーリング(再生):加熱により鋳型DNAを変性させて1本鎖にした後、約50℃に温度を低下させ、ここでプライマーが対形成し、1本鎖鋳型DNAの相補的配列と結合する;(3)プライマーの伸長:鋳型に基づいて、及び相補的塩基対形成及び半保存的な複製の原理に従い、反応原料としてdNTPを使用して、約70℃でのDNAポリメラーゼの作用下でDNA鋳型-プライマー複合体から鋳型DNA鎖に相補的な新しい半保存的な複製鎖を合成することを含む。変性-アニーリング-伸長の3つの工程のサイクルを反復することによって、より多くの「半保存的な複製鎖」を得ることができ、この新しい鎖は、次のサイクルのための鋳型になり得る。「DNAポリメラーゼ」という用語は、親DNAを鋳型として使用し、娘DNAを形成するために基質dNTP分子の重合を触媒する酵素のクラスを指す。DNAポリメラーゼの共通する特性は、(1)DNAポリメラーゼが5’→3’ポリメラーゼ活性を有し、これによってDNAが5’→3’方向にしか合成され得ないことが決定され;(2)DNAポリメラーゼが新しいDNA鎖のデノボ合成を触媒できず、ヌクレオチド鎖の末端3’-OHへのdNTPの付加しか触媒し得ず、従ってDNAプライマーが合成のための開始点として必要とされることである。ハイフィデリティーDNAポリメラーゼは、忠実度がより高く、それにより合成されるDNAが他のDNAポリメラーゼにより合成されるものよりも鋳型に対する同一性がより高くなるDNAポリメラーゼを指す。Phusion DNAポリメラーゼ、Q5ポリメラーゼ、primerSTARポリメラーゼなど、当技術分野で公知のあらゆるハイフィデリティーDNAポリメラーゼが本発明において使用され得る。
を解離させて1本鎖にして、この1本鎖がプライマーと結合して、次の反応ラウンドに対する準備をするようになり得ること;(2)鋳型DNA及びプライマーのアニーリング(再生):加熱により鋳型DNAを変性させて1本鎖にした後、約50℃に温度を低下させ、ここでプライマーが対形成し、1本鎖鋳型DNAの相補的配列と結合する;(3)プライマーの伸長:鋳型に基づいて、及び相補的塩基対形成及び半保存的な複製の原理に従い、反応原料としてdNTPを使用して、約70℃でのDNAポリメラーゼの作用下でDNA鋳型-プライマー複合体から鋳型DNA鎖に相補的な新しい半保存的な複製鎖を合成することを含む。変性-アニーリング-伸長の3つの工程のサイクルを反復することによって、より多くの「半保存的な複製鎖」を得ることができ、この新しい鎖は、次のサイクルのための鋳型になり得る。「DNAポリメラーゼ」という用語は、親DNAを鋳型として使用し、娘DNAを形成するために基質dNTP分子の重合を触媒する酵素のクラスを指す。DNAポリメラーゼの共通する特性は、(1)DNAポリメラーゼが5’→3’ポリメラーゼ活性を有し、これによってDNAが5’→3’方向にしか合成され得ないことが決定され;(2)DNAポリメラーゼが新しいDNA鎖のデノボ合成を触媒できず、ヌクレオチド鎖の末端3’-OHへのdNTPの付加しか触媒し得ず、従ってDNAプライマーが合成のための開始点として必要とされることである。ハイフィデリティーDNAポリメラーゼは、忠実度がより高く、それにより合成されるDNAが他のDNAポリメラーゼにより合成されるものよりも鋳型に対する同一性がより高くなるDNAポリメラーゼを指す。Phusion DNAポリメラーゼ、Q5ポリメラーゼ、primerSTARポリメラーゼなど、当技術分野で公知のあらゆるハイフィデリティーDNAポリメラーゼが本発明において使用され得る。
本発明の遺伝子変異ライブラリを構築するために様々な分子生物学的操作が行われている場合、使用される手順及び方法(合成、酵素消化、ライゲーション、PCR、回収、精製などを含むが限定されない)は全て、当業者にとって周知である(例えば非特許文献5を参照)。
本発明は、蓄積容量が大きい遺伝子変異ライブラリを構築するための方法を提供し、これは、先行技術における大容量の遺伝子変異ライブラリの構築のための費用が非常に高額となる問題を解決する。本発明により構築される遺伝子変異ライブラリの蓄積容量は、最大105、好ましくは最大106、より好ましくは最大107、より好ましくは最大108、より好ましくは最大109、より好ましくは最大1010であり得る。具体的な一実施形態では、遺伝子変異ライブラリの蓄積容量は1.25x107である。
ライブラリ構築を必要とするアミノ酸配列が提供され、そこで変異させることが必要なアミノ酸の位置及びタイプが決定される。蓄積容量は計算により得られ、アミノ酸配列をコードするヌクレオチド配列が決定される。コードヌクレオチド配列における粘着末端の配列及び位置が決定され、コードヌクレオチド配列が、粘着末端に従い2つ以上の(3~10など、好ましくは3~6個などの)オリゴマープールに対応する2つ以上の(3~10など、好ましくは3~6個などの)断片に分けられる。粘着末端は、その配列の数に従い、単一粘着末端(single sticky end)(1つしか配列を持たない)及び連続した変異点の間で2つの断片に配列を分割し得る縮重粘着末端(degenerate sticky end)(縮重粘着末端(degenerate sticky
end)は多くの異なる配列を持ち、具体的な配列の数は粘着末端での変異に依存する)に分けられる。単一粘着末端(single sticky end)は、2、3、4、5、6、7、8、9及び10個の断片など、2つを超える断片にコードヌクレオチド配列を分割するために適切であり得る。粘着末端に対する配列選択は次の基準に基づく:1)粘着末端はコードヌクレオチド配列の中央にあり、従ってオリゴマープールにおける配列は、それぞれおよそ同じ長さの2つの断片として合成され得る;2)粘着末端の配列中にはパリンドローム配列がない;3)粘着末端配列のGC含量は50%~75%である;
及び4)粘着末端の長さは選択されるIIS型制限エンドヌクレアーゼの制限部位と適合する。粘着末端の選択は、非特許文献6などの文献も参照し得る。各オリゴマープールは、適切な粘着末端/粘着末端を用いて低いミスマッチ率で組み立てられ、次いで最終的な断片を得るために第1のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーを使用して増幅される。
end)は多くの異なる配列を持ち、具体的な配列の数は粘着末端での変異に依存する)に分けられる。単一粘着末端(single sticky end)は、2、3、4、5、6、7、8、9及び10個の断片など、2つを超える断片にコードヌクレオチド配列を分割するために適切であり得る。粘着末端に対する配列選択は次の基準に基づく:1)粘着末端はコードヌクレオチド配列の中央にあり、従ってオリゴマープールにおける配列は、それぞれおよそ同じ長さの2つの断片として合成され得る;2)粘着末端の配列中にはパリンドローム配列がない;3)粘着末端配列のGC含量は50%~75%である;
及び4)粘着末端の長さは選択されるIIS型制限エンドヌクレアーゼの制限部位と適合する。粘着末端の選択は、非特許文献6などの文献も参照し得る。各オリゴマープールは、適切な粘着末端/粘着末端を用いて低いミスマッチ率で組み立てられ、次いで最終的な断片を得るために第1のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーを使用して増幅される。
本発明の合成されたオリゴマープールに含有される制限エンドヌクレアーゼの制限部位は、IIS型制限エンドヌクレアーゼの制限部位であり、これは通常、認識配列から1~6bp、好ましくは1~4bp離れている。IIS型制限エンドヌクレアーゼは、AcuI、AlwI、BaeI、BbsI、BbvI、BccI、BceAI、BcgI、BciVI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BsaXI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BspMI、BspQI、BsrDI、BtgZI、BtsCI、BtsI、EarI、EciI、EcoP15I、FauI、FokI、HaeIII、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SapI及びSfaNIから選択される。好ましくは、IIS型制限エンドヌクレアーゼはBsaIであり、その認識配列はGGTCTCである。
一例として2つの断片を用いて以下で本発明の方法を詳細にさらに説明する:
コードヌクレオチド配列を2つの断片に分割した後、上で決定された粘着末端が酵素消化後に保持され得るように、IIS型制限エンドヌクレアーゼ(BsaIなど)の認識配列の逆相補配列を第1のDNA断片の3’末端で付加し、次に、その後の増幅を促進するために15~30bp、好ましくは15~25bp、より好ましくは18~21bpの特定配列を認識配列が導入されたDNA配列の3’末端で付加し;酵素消化後に第1のDNA断片と同じ粘着末端が保持され得るようにするために、第2のDNA断片の5’末端でIIS型制限エンドヌクレアーゼ(BsaIなど)の認識配列及び上で決定された粘着末端配列を連続的に付加し、その後の増幅を促進するために、15~30bp、好ましくは15~25bp、より好ましくは18~21bpの特定配列を認識配列及び粘着末端が導入されたDNA配列の5’末端で付加する。特定配列は、元のコードヌクレオチド配列と相同ではないランダム配列であり得る。
コードヌクレオチド配列を2つの断片に分割した後、上で決定された粘着末端が酵素消化後に保持され得るように、IIS型制限エンドヌクレアーゼ(BsaIなど)の認識配列の逆相補配列を第1のDNA断片の3’末端で付加し、次に、その後の増幅を促進するために15~30bp、好ましくは15~25bp、より好ましくは18~21bpの特定配列を認識配列が導入されたDNA配列の3’末端で付加し;酵素消化後に第1のDNA断片と同じ粘着末端が保持され得るようにするために、第2のDNA断片の5’末端でIIS型制限エンドヌクレアーゼ(BsaIなど)の認識配列及び上で決定された粘着末端配列を連続的に付加し、その後の増幅を促進するために、15~30bp、好ましくは15~25bp、より好ましくは18~21bpの特定配列を認識配列及び粘着末端が導入されたDNA配列の5’末端で付加する。特定配列は、元のコードヌクレオチド配列と相同ではないランダム配列であり得る。
第1及び第2のオリゴマー配列は、当技術分野で公知の何らかの方法を使用して、例えばライブラリ作製手順を使用して、設計及び合成され得る。第1及び第2の配列の数は、合成されたプライマーの比率及び総数に従い計算され得る。合成されたオリゴマーの量が少なすぎてその後の操作のニーズに合わないので、第1及び第2のオリゴマーを増幅する必要がある。オリゴマープール-1及びオリゴマープール-2のための増幅プライマーは、当技術分野で公知の方法により設計される。オリゴマープール-1のためのフォワードプライマーを1Fと名付け、リバースプライマーを1Rと名付ける。オリゴマープール-2のためのフォワードプライマーを2Fと名付け、リバースプライマーを2Rと名付ける。プライマーの長さは、15~30bp、好ましくは15~25bp、より好ましくは18~21bpであり得る。それぞれ、合成されたオリゴマープールは、合成されたオリゴマープール-1を鋳型として使用し、1F/1Rをプライマーとして使用するか、又はオリゴマープール-2を鋳型として使用し、2F/2Rをプライマーとして使用し、ハイフィデリティーDNAポリメラーゼ(Phusion DNAポリメラーゼなど)、dNTP、PCR緩衝液及び任意選択的なウシ血清アルブミン(BSA)を添加することにより増幅させる。増幅されたオリゴマープール-1は、プライマー1F/1Rを用いて得られ、増幅されたオリゴマープール-2は、プライマー2F/2Rで得られる。増幅完了後、ゲル電気泳動を使用して、バンドが単一か否かを検出する。バンドが単一である場合、増幅産物をカラムにより精製するか;又は増幅されたバンドが単一でない場合、再増幅のためにPCR条件を変更する必要がある。変更する必要があるPCR条件としては、鋳型と
プライマーとの比率、アニーリング温度、アニーリング時間、サイクル数などが挙げられる。
プライマーとの比率、アニーリング温度、アニーリング時間、サイクル数などが挙げられる。
精製増幅産物を得た後、制限ライゲーション法を使用することによって2つのオリゴマーを組み立て、制限ライゲーション法は、好ましくはGolden Gateクローニングを使用することにより行われる。組み立て系の調製は、精製した第1のオリゴマー及び第2のオリゴマーを系に添加し、制限エンドヌクレアーゼ及びDNAリガーゼ(及び/又はその緩衝液)を同時に添加することを含む。組み立て反応の手順は、2つの段階(37℃で3分及び16℃で5分)を20回繰り返している。37℃は制限エンドヌクレアーゼに対する最適反応温度であり、16℃はDNAリガーゼに対する最適反応温度である。組み立て工程において、混合物を37℃で3分間反応させ、ここで制限エンドヌクレアーゼが制限部位を認識し、切断して、上で決定された粘着末端を生成させ、次に混合物を16℃で5分間反応させ、DNAリガーゼが、同じ粘着末端配列を有する2個のオリゴマーを連結する。正しく連結された断片は、制限エンドヌクレアーゼの認識配列を含有せず、不正確に連結された断片は制限エンドヌクレアーゼの認識配列を含有する。次のサイクルの37℃で、制限エンドヌクレアーゼは、断片が正確に連結されるまで、不正確に連結された断片を再び切断し得る。最後に混合物を80℃で15分間反応させて、その後の反応に影響を与えないように2つの酵素を不活性化した。組み立て系におけるDNAの量は非常に少なく、精製後にDNAを殆ど得ることができず、この系は、組み立てられていない断片を含有し得る。従って、組み立てられた配列のPCR増幅が必要である。
PCRを行うために鋳型として組み立てられた未精製産物、第1のオリゴマーのフォワードプライマー1F及び第2のオリゴマーのリバースプライマー2R及びハイフィデリティーDNAポリメラーゼ(Phusion DNAポリメラーゼなど)を使用することによって、組み立てられた配列のプールを増幅させて、蓄積容量が大きい遺伝子変異ライブラリを得る。次に、最終産物を得るために、PCR産物を回収及び/又は精製し得る。回収及び/又は精製は好ましくはゲル電気泳動による。平滑末端を介して最終産物を連結し、直線状にしたプラスミド(Puc57-EVなど)に連結し、ユニバーサルプライマー(M13Fプライマーなど)を使用して最終産物に対してサンガーシーケンシングを行って、配列が正しいか否かを調べ;同時に、最終産物をハイスループットシーケンシング技術(NGS)に供して、配列分布、アミノ酸分布などを検出する。
配列の説明
実施例によって、及び添付の図面と合わせて、本発明の技術的解決法をより詳細にさらに例示するが、本発明は次の実施例に限定されない。
具体的な実施例
実施例1.変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有するオリゴマープールの設計
1.1 ライブラリ構築を必要としたアミノ酸配列の提供及びその中で変異させる必要があるアミノ酸の位置及びタイプの決定
ライブラリ構築を必要としたアミノ酸配列は次のとおり:
実施例1.変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有するオリゴマープールの設計
1.1 ライブラリ構築を必要としたアミノ酸配列の提供及びその中で変異させる必要があるアミノ酸の位置及びタイプの決定
ライブラリ構築を必要としたアミノ酸配列は次のとおり:
であり、配列中、X1~X7は、変異させる必要があったアミノ酸であり、X1は20個のアミノ酸のうち4個に変異させられ、X2~X6は20個のアミノ酸のうち16個に変異させられ、X7は20個のアミノ酸のうち3個に変異させられ、従って、ライブラリの蓄積容量は、4x16x16x16x16x16x3=12582912であった。このアミノ酸配列をコードするヌクレオチド配列は次のとおり:
であり、X1~X7のそれぞれは、変異対象の1つのコドン(3ヌクレオチド)を表した。
1.2 断片への配列の分割
一例として単一粘着末端(single sticky end)を挙げることによって配列を断片に分割するための方法を詳細に説明した。
一例として単一粘着末端(single sticky end)を挙げることによって配列を断片に分割するための方法を詳細に説明した。
単一粘着末端(single sticky end)に従い、コードヌクレオチド配列を2つの断片に分割した。次の基準に基づき、変異ヌクレオチドの位置に従い、粘着末端の配列を選択した:1)粘着末端はオリゴマー配列の中央にあり、個別の合成のためにオリゴマープール中の配列をおよそ同じ長さの2つの断片に分割し得る;2)粘着末端の配列中にパリンドローム配列がなかった;3)粘着末端配列のGC含量が50%~75%であった;及び4)粘着末端の長さは選択されたIIS型制限エンドヌクレアーゼの制限部位と適合した。
1.1のコードヌクレオチド配列に対して、及び上の基準に基づき、1)CCTGは、120ヌクレオチドの位置48~51に位置し;2)CCTG中にパリンドローム構造がなく;3)CCTGのGC含量は75%であり;4)CCTGは、4個のヌクレオチドを有し、IIS型制限エンドヌクレアーゼBsaIの制限部位に対応し、従って、配列を2つの断片に分けるために粘着末端としてCCTG(上の配列中で太字で示される)を選択した。
1.3 断片化を介した各オリゴマープールの設計
第1のオリゴマーは51bp長であり、その具体的な配列は次のとおり:
第1のオリゴマーは51bp長であり、その具体的な配列は次のとおり:
であった。BsaIの認識配列GGTCTCの逆相補配列GAGACC(配列番号4)を第1のDNA配列の3’末端で付加した。BsaIの特異的な制限部位に従い、BsaIでの消化後、選択された粘着末端CCTGを生成させるためにBsaIの認識配列の逆相補配列GAGACCの5’末端で塩基Aをさらに付加した。制限部位が導入された配列は、
であった。その後の増幅のために、上記配列の3’末端で18~21bpの特定配列をさらに付加した。その特定配列は、例えば
であった。第1のオリゴマーの最終的な配列は、
であり、これをオリゴマープール-1と名付けた。
第2のオリゴマーの長さは69bpであり、その具体的な配列は次のとおり:
であった。第2のDNA配列の5’末端で粘着末端配列CCTG及び制限エンドヌクレアーゼBsaIの認識配列GGTCTC(配列番号9)を連続的に付加した。BsaIの特異的な制限部位に従い、BsaIでの消化後、選択された粘着末端CCTGを生成させるためにBsaIの認識配列GGTCTCの3’末端で塩基Gをさらに付加した。得られた配列は、
であった。その後の増幅のために、18~21bpの特定配列を上記配列の5’末端でさらに付加した。この特定配列は、例えば
であった。第2のオリゴマーの最終的な配列は、
であり、これをオリゴマープール-2と名付けた。
実施例2.ライブラリ作製手順によるオリゴマープールの設計
単一粘着末端(single sticky end)を一例として挙げた。オリゴマープールは通常はライブラリ作製手順により設計した。
単一粘着末端(single sticky end)を一例として挙げた。オリゴマープールは通常はライブラリ作製手順により設計した。
ライブラリ作製手順のウェブサイトは、http://10.1.1.25/cgi-bin/aa_lib_generate.pyであり、オリゴマープールを設計するためのライブラリ作製手順のインターフェースを図1で示す。
この手順は1回の操作あたり1つのオリゴマープールを設計し得、オリゴマープール-1及びオリゴマープール-2は個別に設計する必要があった。オリゴマープール-1のための代表的な設計工程は次のとおりであった:
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号により表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-1に対して、入力されたアミノ酸配列はRPDVNAS<1><2><3>G<4>TPLHLRDHLRPNRLであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-1に対して、入力されたDNA配列は、
AGACCTGACGTTAACGCTAGC<1><2><3>GGT<4>ACTCCGCTGCACCTGAGAGACCACCTACGTCCAAATCGGCTGであり;
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここで、オリゴマープール-1について、<1>は、20個のアミノ酸のうち4個に変異させられ、<2>~<4>は、20個のアミノ酸のうち16個に変異させられ、オリゴマープール-1中の合成対象のオリゴマーの数は、4x16x16x16=16384となり、従って16384を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、例えば、アミノ酸配列がE.コリ(E.coli)で発現された場合は「E.コリ(E.coli)」を選択し、アミノ酸配列がヒト細胞で発現された場合は「ヒト」を選択するなどし、ここでオリゴマープール-1に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで
オリゴマープール-1における各変異アミノ酸の出現頻度をファイルにおいて設定し得る。
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号により表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-1に対して、入力されたアミノ酸配列はRPDVNAS<1><2><3>G<4>TPLHLRDHLRPNRLであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-1に対して、入力されたDNA配列は、
AGACCTGACGTTAACGCTAGC<1><2><3>GGT<4>ACTCCGCTGCACCTGAGAGACCACCTACGTCCAAATCGGCTGであり;
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここで、オリゴマープール-1について、<1>は、20個のアミノ酸のうち4個に変異させられ、<2>~<4>は、20個のアミノ酸のうち16個に変異させられ、オリゴマープール-1中の合成対象のオリゴマーの数は、4x16x16x16=16384となり、従って16384を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、例えば、アミノ酸配列がE.コリ(E.coli)で発現された場合は「E.コリ(E.coli)」を選択し、アミノ酸配列がヒト細胞で発現された場合は「ヒト」を選択するなどし、ここでオリゴマープール-1に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで
オリゴマープール-1における各変異アミノ酸の出現頻度をファイルにおいて設定し得る。
同様に、オリゴマープール-2に対する代表的な設計工程は次のとおりであった:
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号によって表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-2に対して、入力されたアミノ酸配列は、LLSKMCRSRLAA<1><2>GHLEIVEVLLK<3>GADVRPDであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-2に対して、入力されたDNA配列は、CTCCTAAGTAAAATGTGCAGGTCTCGCCTGGCTG CT<1><2>GGTCACCTGGAAATCGTTGAAGTTCTGCTGAAG<3>GGTGCTGACGTGAGACCTGACである。
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール-2に対して、<1>~<2>は20個のアミノ酸のうち16個に変異させられ、<3>は20個のアミノ酸のうち3個に変異させられ、オリゴマープール-2中の合成対象のオリゴマーの数は、16x16x3=768となり、従って768を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、ここでオリゴマープール-2に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで、オリゴマープール-2における各変異アミノ酸の出現頻度(予想値)はファイルにおいて設定され得る。
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号によって表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-2に対して、入力されたアミノ酸配列は、LLSKMCRSRLAA<1><2>GHLEIVEVLLK<3>GADVRPDであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-2に対して、入力されたDNA配列は、CTCCTAAGTAAAATGTGCAGGTCTCGCCTGGCTG CT<1><2>GGTCACCTGGAAATCGTTGAAGTTCTGCTGAAG<3>GGTGCTGACGTGAGACCTGACである。
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール-2に対して、<1>~<2>は20個のアミノ酸のうち16個に変異させられ、<3>は20個のアミノ酸のうち3個に変異させられ、オリゴマープール-2中の合成対象のオリゴマーの数は、16x16x3=768となり、従って768を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、ここでオリゴマープール-2に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで、オリゴマープール-2における各変異アミノ酸の出現頻度(予想値)はファイルにおいて設定され得る。
実施例3.オリゴマープールの合成
当技術分野で公知の様々な合成方法によって、実施例1又は実施例2で設計したオリゴマープール1及びオリゴマープール-2を合成した。方法としては、ホスホトリエステル法、ホスホラミダイト法、水素リン酸法(hydrogen phosphoric acid method)、チップによる合成などが挙げられるが限定されない。
当技術分野で公知の様々な合成方法によって、実施例1又は実施例2で設計したオリゴマープール1及びオリゴマープール-2を合成した。方法としては、ホスホトリエステル法、ホスホラミダイト法、水素リン酸法(hydrogen phosphoric acid method)、チップによる合成などが挙げられるが限定されない。
本発明において、半導体チップ(CustomArrayからのB3P合成装置)を使用して、オリゴマープール1及びオリゴマープール2を合成した。オリゴマープールの合成に必要とされたのは、2つの断片に分割される場合は92kの容量(92,000配列)のチップの合成のみであった。2つの断片に分割しない場合、蓄積容量が1.26x107である長い配列に対するオリゴマープールを合成するために複数のチップが必要であった。チップは高価であった。従って、断片化を介したオリゴマープールの構築によって構築費用が大きく削減された。
実施例4.ハイフィデリティーDNAポリメラーゼを用いた、合成されたオリゴマープールの増幅
上で得られたオリゴマープール-1及びオリゴマープール-2のヌクレオチド配列に従い、当技術分野で公知の方法によってオリゴマープール-1及びオリゴマープール-2用の増幅プライマーを設計した。オリゴマープール-1用のフォワードプライマーを1Fと名付け、リバースプライマーを1Rと名付けた。オリゴマープール-2用のフォワードプライマーを2Fと名付け、リバースプライマーを2Rと名付けた。各プライマーの配列は次のとおりであった:
1F:AGACCTGACGTTAACGCTAG(配列番号13)
1R:CAGCCGATTTGGACGTAGGT(配列番号14)
2F:ACTCCTAAGTAAAATGTGCA(配列番号15)
2R:GTCAGGTCTCACGTCAGCAC(配列番号16)
上で得られたオリゴマープール-1及びオリゴマープール-2のヌクレオチド配列に従い、当技術分野で公知の方法によってオリゴマープール-1及びオリゴマープール-2用の増幅プライマーを設計した。オリゴマープール-1用のフォワードプライマーを1Fと名付け、リバースプライマーを1Rと名付けた。オリゴマープール-2用のフォワードプライマーを2Fと名付け、リバースプライマーを2Rと名付けた。各プライマーの配列は次のとおりであった:
1F:AGACCTGACGTTAACGCTAG(配列番号13)
1R:CAGCCGATTTGGACGTAGGT(配列番号14)
2F:ACTCCTAAGTAAAATGTGCA(配列番号15)
2R:GTCAGGTCTCACGTCAGCAC(配列番号16)
PCR反応系を次のように形成した:合成されたオリゴマープールを鋳型として使用し、1F/1R又は2F/2Rをプライマーとして使用し、ハイフィデリティーDNAポリメラーゼ(Phusion DNAポリメラーゼなど)、dNTPs、5xHF緩衝液及びウシ血清アルブミン(BSA)を添加し、水を使用してその系が50μlになるようにし;合成されたオリゴマープールを増幅させ、プライマー1F/1Rにより、増幅されたオリゴマープール-1を得て、プライマー2F/2Rにより、増幅されたオリゴマープール-2を得た。
反応系は次のとおりであった:
反応手順は次のとおりであった:
実施例5.Golden Gateを使用した2つのオリゴマープールの組み立て
Golden Gate組み立て系の調製は:オリゴマープール-1及びオリゴマープール-2を添加し、IIS型制限エンドヌクレアーゼBsaI及びT4 DNAリガーゼ及び10xT4 DNAリガーゼ緩衝液を反応系に同時に添加し、反応系を水で20μlにして、2つのオリゴマープールを組み立てることを含む。組み立てられた産物をAgilent 2100によって検出し、検出結果を図3で示した。
Golden Gate組み立て系の調製は:オリゴマープール-1及びオリゴマープール-2を添加し、IIS型制限エンドヌクレアーゼBsaI及びT4 DNAリガーゼ及び10xT4 DNAリガーゼ緩衝液を反応系に同時に添加し、反応系を水で20μlにして、2つのオリゴマープールを組み立てることを含む。組み立てられた産物をAgilent 2100によって検出し、検出結果を図3で示した。
反応系は次のとおりであった:
制限エンドヌクレアーゼBsaIに対しては37℃が最適反応温度であり、T4 DNAリガーゼに対しては16℃が最適反応温度であった。反応手順において、混合物を37℃で3分間反応させ、ここで制限エンドヌクレアーゼBsaIは、オリゴマープール-1及びオリゴマープール-2中の配列におけるBsaI制限部位を認識して切断し、各配列において4bp粘着末端を残し、次いで混合物を16℃で5分間反応させ、ここでT4 DNAリガーゼは、粘着末端で2つのオリゴマープールを連結した。正しく連結された断片(即ち、オリゴマープール-2とのオリゴマープール-1のライゲーションにより形成された断片)は、BsaI認識配列を含有せず、不正確に連結された断片(即ち、オリゴマープール-1とオリゴマープール-1又はオリゴマープール-2とオリゴマープール-2のライゲーションにより形成された断片)はBsaI認識配列を含有した。混合物を37℃で再び反応させた場合、制限エンドヌクレアーゼBsaIは、断片が正確に連結されるまで、不正確に連結された断片を再び切断し得る。20サイクル後、その後の反応に影響を及ぼさないように、混合物を80℃で15分間反応させて、BsaI及びT4 DNAリガーゼを不活性化させた。最終的に、組み立てられたオリゴマープールを得た。
反応手順は次のとおりであった:
実施例6.組み立てられたオリゴマープールの増幅
組み立てられたオリゴマープールの配列を配列番号17で示した。しかし、組み立て後の系中のDNAの量は非常に少なく、精製後、DNAは殆ど得ることができず、この系は、組み立てられなかった断片を含有し得る。従って、組み立てられた配列のPCR増幅が求められた。PCR反応系を次のように形成した:組み立てられたオリゴマープールを鋳型として使用し、1F/2Rをフォワード及びリバースプライマーとして使用し、ハイフィデリティーDNAポリメラーゼ(Phusion DNAポリメラーゼなど)、dNTPs及び5xHF緩衝液を添加し、水を使用して系が50μlになるようにして、組み立てられたオリゴマープールを増幅させた。
組み立てられたオリゴマープールの配列を配列番号17で示した。しかし、組み立て後の系中のDNAの量は非常に少なく、精製後、DNAは殆ど得ることができず、この系は、組み立てられなかった断片を含有し得る。従って、組み立てられた配列のPCR増幅が求められた。PCR反応系を次のように形成した:組み立てられたオリゴマープールを鋳型として使用し、1F/2Rをフォワード及びリバースプライマーとして使用し、ハイフィデリティーDNAポリメラーゼ(Phusion DNAポリメラーゼなど)、dNTPs及び5xHF緩衝液を添加し、水を使用して系が50μlになるようにして、組み立てられたオリゴマープールを増幅させた。
反応系は次のとおりであった:
反応手順は次のとおりであった:
最後に、遺伝子変異ライブラリ産物を得た。
実施例7.遺伝子変異ライブラリ産物の精製及びシーケンシング
実施例6で得られた産物を回収し、最終ライブラリ産物を得るためにアガロースゲル電気泳動によって精製した。最終ライブラリ産物の電気泳動図を図4で示す。
実施例6で得られた産物を回収し、最終ライブラリ産物を得るためにアガロースゲル電気泳動によって精製した。最終ライブラリ産物の電気泳動図を図4で示す。
単一粘着末端(single sticky end)を組み立てることにより得られた最終ライブラリ産物の平滑末端を直線化したプラスミドPuc57-EVに連結し、配列が正確か否かを調べるために、ユニバーサルプライマーM13Fを用いて最終産物に対してサンガーシーケンシングを行い;配列分布、アミノ酸分布などを検出するために、ハイスループットシーケンシング(NGS)を行った。シーケンシング結果を図5~図7及び以下の表1で示す。
図5は、単一粘着末端(single sticky end)を組み立てることにより得られたライブラリ配列のサンガーシーケンシング結果であり、これは、所望の遺伝子変異ライブラリが得られていることを証明する。
図6は、単一粘着末端(single sticky end)を組み立てることにより得られたライブラリ配列のNGSシーケンシングの配列分布図であり、表1は、単一粘着末端(single sticky end)を組み立てることにより得られたライブラリ配列のNGSシーケンシングの配列分布表である。
図7は、単一粘着末端(single sticky end)を組み立てることにより得られたライブラリ配列のNGSシーケンシングのアミノ酸分布である。上のデータから、ライブラリ配列におけるアミノ酸変異の位置の分布、タイプ及び頻度が、予想される設計と完全に一致することが分かり得る。
実施例8.組み立てのために縮重粘着末端(degenerate sticky end)を使用することにより遺伝子変異ライブラリを得ること
8.1 ライブラリ構築を必要としたアミノ酸配列を提供し、そこで変異させる必要であったアミノ酸の位置及びタイプを決定すること
ライブラリ構築を必要としたアミノ酸配列は次のとおり:KTEDTAVYYCSRD102103104105106107 DAWGQGTLVTVSS(配列番号18)であり、配列中、AA102~AA107は、変異させることが必要であったアミノ酸であり、AA102~AA106は20個のアミノ酸のうち18個に変異させられ、AA107は20個のアミノ酸のうち4個に変異させられ、従って、ライブラリの蓄積容量は1
8x18x18x18x18x4=7558272となった。アミノ酸配列をコードするヌクレオチド配列は次のとおり:AAAACCGAGGACACGGCCGTGTATTACTGTAGTAGAGAT102103104105106107GACGCCTGGGGCCAAGGAACCCTGGTCACCGTCTCCTCG(配列番号19)であり、配列中、AA102~AA107のそれぞれは、変異対象の1コドン(3個のヌクレオチド)を表した。
8.1 ライブラリ構築を必要としたアミノ酸配列を提供し、そこで変異させる必要であったアミノ酸の位置及びタイプを決定すること
ライブラリ構築を必要としたアミノ酸配列は次のとおり:KTEDTAVYYCSRD102103104105106107 DAWGQGTLVTVSS(配列番号18)であり、配列中、AA102~AA107は、変異させることが必要であったアミノ酸であり、AA102~AA106は20個のアミノ酸のうち18個に変異させられ、AA107は20個のアミノ酸のうち4個に変異させられ、従って、ライブラリの蓄積容量は1
8x18x18x18x18x4=7558272となった。アミノ酸配列をコードするヌクレオチド配列は次のとおり:AAAACCGAGGACACGGCCGTGTATTACTGTAGTAGAGAT102103104105106107GACGCCTGGGGCCAAGGAACCCTGGTCACCGTCTCCTCG(配列番号19)であり、配列中、AA102~AA107のそれぞれは、変異対象の1コドン(3個のヌクレオチド)を表した。
8.2 断片化を介した各オリゴマープールの設計
コードヌクレオチド配列を2つの断片に分割し、縮重粘着末端(degenerate
sticky end)をAA104の最後の塩基及びAA105の3個の塩基として選択した。
コードヌクレオチド配列を2つの断片に分割し、縮重粘着末端(degenerate
sticky end)をAA104の最後の塩基及びAA105の3個の塩基として選択した。
第1のオリゴマーは51bp長であり、その具体的な配列は次のとおり:5’-AAAACCGAGGACACGGCCGTGTAT TACTGTAGTAGAGAT102103104105-3’(配列番号20)であった。BsaIの認識配列GGTCTCの逆相補配列GAGACC(配列番号4)を第1のDNA配列の3’末端で付加した。正確に切断し、不必要な配列の導入を回避するために、BsaIの認識配列の逆相補配列GAGACCの5’末端で塩基Aをさらに付加した。制限部位が導入された配列は、AAAACCGAGGACACG GCCGTGTATTACTGTAGTAGAGAT102103104105AGAGACC(配列番号21)であった。その後の増幅のために、18~21bpの特定配列を上記配列の3’末端でさらに付加した。その特定配列は、例えば
であった。第1のオリゴマーの最終配列は、
であり、オリゴマープール-1と名付けた。
ライブラリ作製による配列設計は、アミノ酸配列及びDNA配列の入力を必要とし、第2のオリゴマーを設計する場合、AA104の最初の2塩基を付加することが必要とされ、従って第2のオリゴマーは51bp長であり、その具体的な配列は次のとおり:5’-104105106107GACGCCTGGGGCCAAGGAACCCTGGTC ACCGTCTCCTCG-3’(配列番号23)であった。配列の設計後、AA104の最初の2塩基を除去した。ライブラリ作製を使用することによって全配列を設計すべきであり、次に、第2のオリゴヌクレオチドの特殊性ゆえにBsaI制限部位/特定配列などのDNA配列を添加すべきである(AA104の最初の2塩基を除去する必要がある)。
8.3.ライブラリ作製手順によるオリゴマープールの設計
ライブラリ作製手順のウェブサイトはhttp://10.1.1.25/cgi-bin/aa_lib_generate.pyであり、オリゴマープールを設計するためのライブラリ作製手順のインターフェースを図1で示す。
ライブラリ作製手順のウェブサイトはhttp://10.1.1.25/cgi-bin/aa_lib_generate.pyであり、オリゴマープールを設計するためのライブラリ作製手順のインターフェースを図1で示す。
この手順は、1回の操作あたり1つのオリゴマープールを設計し得、オリゴマープール-1及びオリゴマープール-2は個別に設計する必要がある。オリゴマープール-1に対する代表的な設計工程は次のとおりであった:
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号で表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-1に対して、入力されたアミノ酸配列はKTEDTAVYYCSRD<1><2><3><4>RDH LRPNRLであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-1に対して、入力されたDNA配列は、AAAACCGAGGACACGGCCGTGTATTACTGTAGT AGAGAT<1><2><3><4>AGAGACCACCTACGTCCAAATCGGCTG
であり;
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール-1に対して、<1>~<4>は20個のアミノ酸のうち18個に変異させられ、オリゴマープール-1中の合成対象のオリゴマーの数は、18x18x18x18=104976となり、従って104976を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、例えば、アミノ酸配列がE.コリ(E.coli)で発現された場合は「E.コリ(E.coli)」を選択し、アミノ酸配列がヒト細胞で発現された場合は「ヒト」を選択するなどし、ここでオリゴマープール-1に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここでオリゴマープール-1における各変異アミノ酸の出現頻度はファイルにおいて設定され得る。
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号で表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-1に対して、入力されたアミノ酸配列はKTEDTAVYYCSRD<1><2><3><4>RDH LRPNRLであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-1に対して、入力されたDNA配列は、AAAACCGAGGACACGGCCGTGTATTACTGTAGT AGAGAT<1><2><3><4>AGAGACCACCTACGTCCAAATCGGCTG
であり;
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール-1に対して、<1>~<4>は20個のアミノ酸のうち18個に変異させられ、オリゴマープール-1中の合成対象のオリゴマーの数は、18x18x18x18=104976となり、従って104976を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、例えば、アミノ酸配列がE.コリ(E.coli)で発現された場合は「E.コリ(E.coli)」を選択し、アミノ酸配列がヒト細胞で発現された場合は「ヒト」を選択するなどし、ここでオリゴマープール-1に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここでオリゴマープール-1における各変異アミノ酸の出現頻度はファイルにおいて設定され得る。
BsaIでの消化後の配列1の粘着末端は、AA104の最後の塩基及びAA105の3個の塩基に位置し、縮重粘着末端(degenerate sticky end)であり、具体的には、
CAAC/CAAG/CACC/CAGC/CATC/CCAC/CCAG/CCCC/CCGG/CCTG/CGAC/CGAG/CGCC/CGGC/CGTG/CTAC/CTGG/CTTC/GAAC/GAAG/GACC/GAGC/GATC/GCAC/GCAG/GCCC/GCGG/GCTG/GGAC/GGAG/GGCC/GGGC/GGTG/GTAC/GTGG/GTTCで、全部で36種類であった。
CAAC/CAAG/CACC/CAGC/CATC/CCAC/CCAG/CCCC/CCGG/CCTG/CGAC/CGAG/CGCC/CGGC/CGTG/CTAC/CTGG/CTTC/GAAC/GAAG/GACC/GAGC/GATC/GCAC/GCAG/GCCC/GCGG/GCTG/GGAC/GGAG/GGCC/GGGC/GGTG/GTAC/GTGG/GTTCで、全部で36種類であった。
同様に、オリゴマープール-2に対する代表的な設計工程は次のとおりであった:
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号により表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-2に対して、入力されたアミノ酸配列は<1><2><3><4>DAWGQGTLVTVSSであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-2に対して、入力
されたDNA配列は、<1><2><3><4>GACGCCTGGGGCCAAGGAACC CTGGTCACCGTCTCCTCGであり;
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール-2に対して、<1>~<3>は20個のアミノ酸のうち18個に変異させられ、<4>は20個のアミノ酸のうち4個に変異させられ、オリゴマープール-2中の合成対象のオリゴマーの数は、18x18x18x4=23328となり、従って23328を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、ここでオリゴマープール-2に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで、オリゴマープール-2における各変異したアミノ酸の出現頻度(予想値)はファイルにおいて設定され得る。
アミノ酸配列(Amino acid sequence)入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ<1>、<2>、<3>などの番号により表され、1つの番号は1つのアミノ酸を表し、オリゴマープール-2に対して、入力されたアミノ酸配列は<1><2><3><4>DAWGQGTLVTVSSであり;
DNA配列(DNA sequence)入力ボックスにおいてアミノ酸配列をコードするDNA配列を入力し、配列中、変異部位はそれぞれ番号<1>、<2>、<3>などにより表され、1つの番号は1つのコドンを表し、オリゴマープール-2に対して、入力
されたDNA配列は、<1><2><3><4>GACGCCTGGGGCCAAGGAACC CTGGTCACCGTCTCCTCGであり;
ライブラリのサイズ(Size of the library)入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール-2に対して、<1>~<3>は20個のアミノ酸のうち18個に変異させられ、<4>は20個のアミノ酸のうち4個に変異させられ、オリゴマープール-2中の合成対象のオリゴマーの数は、18x18x18x4=23328となり、従って23328を入力し;
発現系(Expressing system)入力ボックスにおいて所望の発現系を選択し、ここでオリゴマープール-2に対して、ヒトコドンを使用し、「ヒト」を選択し;
任意選択的に「エクセルファイルにおいて予想発生率をアップロード(Upload the expected occurrence rates in excel file)」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで、オリゴマープール-2における各変異したアミノ酸の出現頻度(予想値)はファイルにおいて設定され得る。
配列のソフトウェア出力後、エクセルを使用して、得られたデータを処理した。エクセルにおけるカラム機能を使用して、AA104の最初の2個の塩基及びその後の配列を分離した。最初の2個の塩基が欠失したAA104を104’として記録した。次に、第2のDNA配列の5’末端で、粘着末端配列CCTG及び制限エンドヌクレアーゼBsaIの認識配列GGTCTC(配列番号9)を連続的に導入した。正確に切断し、不必要な配列の導入を回避するために、BsaIの認識配列GGTCTCの3’末端で塩基Gをさらに付加した。得られた配列は、
であった。その後の増幅のために、上記配列の5’末端で18~21bpの特定配列をさらに付加した。この特定配列は、例えば
であった。第2のオリゴマーの最終配列は、
であり、オリゴマープール-2と名付けた。BsaIでの消化後、オリゴマープール-2により生成された粘着末端は、オリゴマープール-1により生成したものと同じであり、具体的には
CAAC/CAAG/CACC/CAGC/CATC/CCAC/CCAG/CCCC/CCGG/CCTG/CGAC/CGAG/CGCC/CGGC/CGTG/CTAC/CTGG/CTTC/GAAC/GAAG/GACC/GAGC/GATC/GCAC/GCAG/GCCC/GCGG/GCTG/GGAC/GGAG/GGCC/GGGC/
GGTG/GTAC/GTGG/GTTC
であり、全部で36種類であった。同じ粘着末端を介してオリゴマープール-1及びオリゴマープール-2を連結した。
CAAC/CAAG/CACC/CAGC/CATC/CCAC/CCAG/CCCC/CCGG/CCTG/CGAC/CGAG/CGCC/CGGC/CGTG/CTAC/CTGG/CTTC/GAAC/GAAG/GACC/GAGC/GATC/GCAC/GCAG/GCCC/GCGG/GCTG/GGAC/GGAG/GGCC/GGGC/
GGTG/GTAC/GTGG/GTTC
であり、全部で36種類であった。同じ粘着末端を介してオリゴマープール-1及びオリゴマープール-2を連結した。
8.4 縮重粘着末端(degenerate sticky end)を用いた遺伝子ライブラリの構築
本発明の実施例3の方法に従い、オリゴマープールを合成した。上で得られたオリゴマープール-1及びオリゴマープール-2のヌクレオチド配列に従い、当技術分野で公知の方法によって、オリゴマープール-1及びオリゴマープール-2用の増幅プライマーを設計した。オリゴマープール-1のフォワード及びリバースプライマーをそれぞれ1sF及び1sRと名付けた。オリゴマープール-2のフォワード及びリバースプライマーをそれぞれ2sF及び2sRと名付けた。各プライマーの配列は次のとおりであった:
1sF:AAAACCGAGGACACGGCCGT(配列番号26)
1sR:CAGCCGATTTGGACGTAGGT(配列番号14)
2sF:ACTCCTAAGTAAAATGTGCA(配列番号15)
2sR:CGAGGAGACGGTGACCAGGG(配列番号27)
本発明の実施例3の方法に従い、オリゴマープールを合成した。上で得られたオリゴマープール-1及びオリゴマープール-2のヌクレオチド配列に従い、当技術分野で公知の方法によって、オリゴマープール-1及びオリゴマープール-2用の増幅プライマーを設計した。オリゴマープール-1のフォワード及びリバースプライマーをそれぞれ1sF及び1sRと名付けた。オリゴマープール-2のフォワード及びリバースプライマーをそれぞれ2sF及び2sRと名付けた。各プライマーの配列は次のとおりであった:
1sF:AAAACCGAGGACACGGCCGT(配列番号26)
1sR:CAGCCGATTTGGACGTAGGT(配列番号14)
2sF:ACTCCTAAGTAAAATGTGCA(配列番号15)
2sR:CGAGGAGACGGTGACCAGGG(配列番号27)
合成されたオリゴマープールを鋳型として使用し、1sF/1sR又は2sF/2sRをプライマーとして使用し、ハイフィデリティーDNAポリメラーゼ(Phusion DNAポリメラーゼなど)を添加することによって、本発明の実施例4の方法に従い、合成されたオリゴマープールを増幅させた。増幅されたオリゴマープール-1は、プライマー1sF/1sRを用いて得られ、増幅されたオリゴマープール-2は、プライマー2sF/2sRを用いて得られた。
本発明の実施例5の方法に従い、Golden Gates法を使用して、2つのオリゴマープールを組み立てた。本発明の実施例6の方法に従い、組み立てられたオリゴマー
プールを増幅し、最終的なライブラリ産物の電気泳動図を図8で示す。遺伝子ライブラリ産物を精製し、本発明の実施例7の方法に従い、シーケンシングした。シーケンシング結果を図9~図11及び下の表2で示す。
プールを増幅し、最終的なライブラリ産物の電気泳動図を図8で示す。遺伝子ライブラリ産物を精製し、本発明の実施例7の方法に従い、シーケンシングした。シーケンシング結果を図9~図11及び下の表2で示す。
図9は、縮重粘着末端(degenerate sticky end)を組み立てることにより得られたライブラリ配列のサンガーシーケンシングの結果であり、これは、所望の遺伝子変異ライブラリが得られていることを証明する。
図10は、縮重粘着末端(degenerate sticky end)を組み立てることにより得られたライブラリ配列のNGSシーケンシングの配列分布図であり、表2は、縮重粘着末端(degenerate sticky end)を組み立てることにより得られたライブラリ配列のNGSシーケンシングの配列分布表である。
図11は、縮重粘着末端(degenerate sticky end)を組み立て
ることにより得られたライブラリ配列のNGSシーケンシングのアミノ酸分布である。上のデータから、ライブラリ配列におけるアミノ酸変異の位置の分布、タイプ及び頻度が予想される設計と完全に一致することが分かり得る。
ることにより得られたライブラリ配列のNGSシーケンシングのアミノ酸分布である。上のデータから、ライブラリ配列におけるアミノ酸変異の位置の分布、タイプ及び頻度が予想される設計と完全に一致することが分かり得る。
本記載において技術的解決策の構成パートとして記載される何らかの技術特性又は技術特性の組み合わせは、それが実行され得、本発明の主旨を明らかに破らないことを前提として、他の技術的解決策にも適用され得;さらに、異なる技術的解決策の構成部分として記載される技術特性も、それが実行され得、本発明の主旨を明らかに破らないことを前提として、他の技術的解決策を形成するために、形はどうあれ、組み合わせられ得ることにも注意すべきである。本発明は、上記のケースを組み合わせることにより得られる技術的解決策も含み、これらの技術的解決策は、本発明に記載されるものと同等である。
具体的な実施形態及び実施例により本発明を上記で説明したが、当業者は、これらが本発明の範囲を限定するものではないことを理解すべきである。本発明の範囲は、特許請求の範囲により決定されるべきである。
本発明は、蓄積容量が大きいライブラリとなるように、比較的少数のオリゴマー配列を合成し、次いでそれらを組み立てることが可能な蓄積容量が大きいライブラリ構築方法を提供し、これにより、大容量ライブラリ構築のための費用が大きく削減され、蓄積容量が大きいライブラリの合成が高価であるという問題が解決される。
Claims (28)
- 蓄積容量が大きい遺伝子変異ライブラリを構築するための方法であって、
(1)ライブラリ構築を必要とするアミノ酸配列をコードするヌクレオチド配列に従い、消化後に、設計される2つの隣接するオリゴマープールが同じ粘着末端を生成させる、変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有する2つ以上のオリゴマープールを設計し、合成し;
(2)前記各オリゴマープールを増幅させ;
(3)組み立てられた各オリゴマープールを得るために反応系において前記増幅させた各オリゴマープールを組み立て;
(4)前記蓄積容量が大きい遺伝子変異ライブラリを得るために前記組み立てられた各オリゴマープールを増幅させること、
を含む方法。 - 段階(2)が、増幅させた各オリゴマープールを得るために、前記各オリゴマープールを鋳型として用い、前記各オリゴマープールの配列に従い設計したフォワードプライマー及びリバースプライマーをプライマー対として用いることによって、ハイフィデリティーDNAポリメラーゼを使用して、前記各オリゴマープールにおいてPCR増幅を行うことを含む、請求項1に記載の方法。
- 段階(3)が、組み立てられた各オリゴマープールを得るために、前記増幅させた各オリゴマープールを添加し、前記制限エンドヌクレアーゼ及びDNAリガーゼを同時に添加し、制限ライゲーション法を使用することによって、前記増幅させた各オリゴマープールを組み立てることを含む、請求項1又は2に記載の方法。
- 段階(4)が、前記蓄積容量が大きい遺伝子変異ライブラリを得るために、前記組み立てられた各オリゴマープールを鋳型として用い、第1のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーをプライマー対として用いることによって、ハイフィデリティーDNAポリメラーゼを使用して、前記組み立てられた各オリゴマープールにおいてPCR増幅を行うことを含む、請求項1~3の何れか1項に記載の方法。
- 前記遺伝子変異ライブラリの蓄積容量が最大105、好ましくは最大106、より好ましくは最大107、より好ましくは最大108、より好ましくは最大109、より好ましくは最大1010である、請求項1~4の何れか1項に記載の方法。
- 前記制限エンドヌクレアーゼがIIS型制限エンドヌクレアーゼである、請求項1~5の何れか1項に記載の方法。
- 前記IIS型制限エンドヌクレアーゼが、AcuI、AlwI、BbsI、BbvI、BccI、BceAI、BciVI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BspMI、BspQI、BsrDI、BtgZI、BtsCI、BtsI、EarI、EciI、EcoP15I、FauI、FokI、HgaI、HphI、HpyAV、MboII、MmeI、MnlI、PleI、SapI及びSfaNIのうち1つ以上から選択される、請求項6に記載の方法。
- 前記IIS型制限エンドヌクレアーゼがBsaIである、請求項7に記載の方法。
- 段階(1)が、
(i)コードヌクレオチド配列中の粘着末端を同定し、前記粘着末端の3’末端に従い、前記2つ以上のオリゴマープールに対応する2つ以上の断片に前記配列を分割し、
(ii)前記配列が2つの断片に分割される場合、オリゴマープール1を得るために、第1の断片の粘着末端の後に3’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列1を連続的に導入し、オリゴマープール2を得るために、第2の断片の5’末端で、粘着末端、前記制限エンドヌクレアーゼの認識配列及び特定配列2を連続的に導入するか;
又は、前記配列がn個の断片に分割される場合(nは3以上の正の整数である)、
オリゴマープール1を得るために、第1の断片の粘着末端の後に3’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列1を連続的に導入し;オリゴマープール2を得るために、第2の断片の5’末端で、粘着末端、前記制限エンドヌクレアーゼの認識配列及び特定配列2を連続的に導入し、第2の断片の粘着末端の後に3’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列3を連続的に導入するなどし;同様に、オリゴマープールnを得るために、n番目の断片の5’末端で、粘着末端、前記制限エンドヌクレアーゼの認識配列及び特定配列2n-2を連続的に導入し、n番目の断片の粘着末端の後に3’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列2n-1を連続的に導入すること、
を含む、請求項1~8の何れか1項に記載の方法。 - 前記特定配列1~前記特定配列2n-1が元のコードヌクレオチド配列と相同ではないランダム配列である、請求項9に記載の方法。
- 前記粘着末端が、単一粘着末端又は縮重粘着末端である、請求項6~10の何れか1項に記載の方法。
- 前記粘着末端が単一粘着末端であり、前記オリゴマープールの数が2~6、好ましくは2である、請求項11に記載の方法。
- 前記粘着末端が縮重粘着末端であり、前記オリゴマープールの数が2である、請求項11に記載の方法。
- 前記粘着末端のGC含量が50%~75%である、請求項6~13の何れか1項に記載の方法。
- 前記粘着末端がパリンドローム構造を含有しない、請求項6~14の何れか1項に記載の方法。
- 段階(3)の前記制限ライゲーション法がGolden Gateクローニングである、請求項2~15の何れか1項に記載の方法。
- 段階(2)の前記PCR増幅系がウシ血清アルブミンをさらに含む、請求項2~16の何れか1項に記載の方法。
- 最終的なライブラリ産物を得るために、(5)段階(4)で得られた遺伝子変異ライブラリの産物を回収及び/又は精製することをさらに含む、請求項1~17の何れか1項に記載の方法。
- 段階(4)で得られた遺伝子変異ライブラリの産物がゲル電気泳動により回収及び/又は精製される、請求項18に記載の方法。
- (6)配列分布を検証する、及び/又はアミノ酸分布を検出するために、段階(5)で得られた最終ライブラリ産物をシーケンシングすることをさらに含む、請求項18又は19に記載の方法。
- 前記シーケンシングがサンガーシーケンシング及び/又はNGSシーケンシングである、請求項20に記載の方法。
- 段階(1)で合成される各オリゴマープールにおける前記変異ヌクレオチドの数が1~108、好ましくは1~21である、請求項1~21の何れか1項に記載の方法。
- 段階(1)で合成される各オリゴマープールにおける前記変異ヌクレオチドが1~36個、好ましくは1~7個のアミノ酸の変異をコードする、請求項1~22の何れか1項に記載の方法。
- 段階(1)で合成される各オリゴマープールにおける前記変異ヌクレオチドによりコードされる変異アミノ酸が、隣接又は非隣接の何れかである、請求項1~23の何れか1項に記載の方法。
- 前記ハイフィデリティーDNAポリメラーゼが、Phusion DNAポリメラーゼ、Q5ポリメラーゼ及びprimerSTARポリメラーゼのうち1つ以上から選択される、請求項2~24の何れか1項に記載の方法。
- 請求項1~25の何れか1項に記載の方法により構築される、遺伝子変異ライブラリ。
- タンパク質又はポリペプチドをスクリーニングするための、請求項1~25の何れか1項に記載の方法により構築される遺伝子変異ライブラリの使用。
- 次の段階を含む、タンパク質中のアミノ酸変異と、前記タンパク質の特性、制御及び/又は機能と、の間の関係を分析するための方法:
(1)請求項1~25の何れか1項に記載の方法を使用することによって遺伝子変異ライブラリを構築し;
(2)構築された前記遺伝子変異ライブラリにおいて変異遺伝子によりコードされるタンパク質の特性、制御及び/又は機能を非変異タンパク質と比較し;
(3)前記タンパク質におけるアミノ酸変異と、前記タンパク質の特性、制御及び/又は機能と、の間の関係を分析すること。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911316464.2 | 2019-12-19 | ||
CN201911316464 | 2019-12-19 | ||
PCT/CN2020/137623 WO2021121391A1 (zh) | 2019-12-19 | 2020-12-18 | 一种基因突变文库的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023506569A true JP2023506569A (ja) | 2023-02-16 |
JPWO2021121391A5 JPWO2021121391A5 (ja) | 2023-12-26 |
Family
ID=76478523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022537822A Pending JP2023506569A (ja) | 2019-12-19 | 2020-12-18 | 遺伝子変異ライブラリを構築するための方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230348894A1 (ja) |
EP (1) | EP4079945A1 (ja) |
JP (1) | JP2023506569A (ja) |
CN (1) | CN114829685A (ja) |
WO (1) | WO2021121391A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024108567A1 (zh) * | 2022-11-25 | 2024-05-30 | 中国科学院深圳先进技术研究院 | 蛋白质多位点组合突变的自动化迭代优化方法与应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2395087A1 (en) * | 2010-06-11 | 2011-12-14 | Icon Genetics GmbH | System and method of modular cloning |
CN103088015A (zh) * | 2013-01-16 | 2013-05-08 | 上海中医药大学 | 一种dna多位点定向突变方法 |
CN104232628A (zh) * | 2013-06-13 | 2014-12-24 | 深圳华大基因研究院 | 一种用于dna靶标序列改造的引物和方法 |
JP2023509618A (ja) * | 2019-12-30 | 2023-03-09 | ナンジン、ジェンスクリプト、バイオテック、カンパニー、リミテッド | 遺伝子変異ライブラリーを構築する方法 |
-
2020
- 2020-12-18 JP JP2022537822A patent/JP2023506569A/ja active Pending
- 2020-12-18 EP EP20903962.7A patent/EP4079945A1/en active Pending
- 2020-12-18 US US17/757,411 patent/US20230348894A1/en active Pending
- 2020-12-18 WO PCT/CN2020/137623 patent/WO2021121391A1/zh unknown
- 2020-12-18 CN CN202080086883.6A patent/CN114829685A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230348894A1 (en) | 2023-11-02 |
EP4079945A1 (en) | 2022-10-26 |
WO2021121391A1 (zh) | 2021-06-24 |
CN114829685A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Carøe et al. | Single‐tube library preparation for degraded DNA | |
CN107075511B9 (zh) | 合成子的形成 | |
Kadkhodaei et al. | Multiple overlap extension PCR (MOE-PCR): an effective technical shortcut to high throughput synthetic biology | |
EP3867373A1 (en) | Improved ordered assembly of multiple dna fragments | |
Struhl | Subcloning of DNA fragments | |
JP2023506569A (ja) | 遺伝子変異ライブラリを構築するための方法 | |
CN114901820B (zh) | 构建基因突变文库的方法 | |
US10385334B2 (en) | Molecular identity tags and uses thereof in identifying intermolecular ligation products | |
Bitinaite et al. | DNA cloning and engineering by uracil excision | |
EP3350326B1 (en) | Compositions and methods for polynucleotide assembly | |
Finney et al. | Molecular cloning of PCR products | |
US20220177875A1 (en) | Compositions and Methods for Improved In Vitro Assembly of Polynucleotides | |
CN116848244A (zh) | 用于改进多核苷酸体外组装的组合物和方法 | |
JP7273934B1 (ja) | 変異体ライブラリプール作製方法 | |
CN114774404B (zh) | 一种dna串联重复序列的合成方法 | |
KR20230121625A (ko) | 폴리뉴클레오타이드의 개선된 시험관내 조립을 위한조성물 및 방법 | |
US20080014616A1 (en) | Methods of introducing targeted diversity into nucleic acid molecules | |
WO2023133436A2 (en) | Compositions & methods for architect oligo mediated dna synthesis | |
Evans | GOLDEN GATE CLONING REGARDLESS OF INTERNAL RESTRICTION SITES | |
CN118284693A (zh) | 突变体文库池制作方法 | |
US20210163922A1 (en) | Assembly and error reduction of synthetic genes from oligonucleotides | |
US20210130809A1 (en) | Evolution-guided multiplexed dna assembly of dna parts, pathways and genomes | |
US20090305359A1 (en) | Method for producing circular duplex polynucleotides from linear duplex polynucleotides and applications thereof | |
CN115852494A (zh) | 一种靶向测序文库的构建方法 | |
CN116904420A (zh) | 具有XNA识别及合成活性的Stoffel片段的突变株及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231218 |