CN101932725A

CN101932725A - 大核酸的装配

Info

Publication number: CN101932725A
Application number: CN200880119758XA
Authority: CN
Inventors: 丹尼尔·G·吉布森; 格威内德·A·本德斯; 杨磊; 约翰·I·格拉斯; J·克雷格·文特尔; 克莱德·A·哈奇森; 汉密尔顿·O·史密斯
Original assignee: Synthetic Genomics Inc
Current assignee: Viridos Inc
Priority date: 2007-10-08
Filing date: 2008-10-07
Publication date: 2010-12-29
Also published as: IL204892B; US20090275086A1; IL204892A0; WO2009048885A2; US9593329B2; EP2207899B1; AU2008311000A1; MY161418A; AU2008311000A2; JP2010539994A; JP5618413B2; CA2701923A1; EP2207899A2; DK2207899T3; AU2008311000B2; CA2701923C; WO2009048885A3; MX2010003644A; EP2207899A4

Abstract

本发明描述了装配任何所需核酸分子的方法，该方法通过体外组合盒来形成进一步在体内组合的装配体，或者通过在酵母培养物中重组来装配许多DNA片段，从而获得大的所需DNA分子。

Description

大核酸的装配

相关申请的交叉引用

本申请要求如下美国临时申请的权利：2007年10月8日提交的60/978,388；2007年10月29日提交的60/983,549；2008年1月23日提交的61/062,214；2008年1月24日提交的61/023,392和2008年9月11日提交的61/096,270。这些文件的内容引入本文作为参考。

技术领域

本发明涉及组合使用体外和体内装配步骤来装配大核酸分子的方法，以及多个重叠核酸片段在酵母内的装配。本发明此方面涉及评估酵母用大量组分装配长DNA分子的能力。

背景技术

现在人们已可以用自动分步合成法(automated step-wise synthesis)来合成适当(reasonably)大的核酸分子。但此类方法的实用上限约为5-30 kb。本发明人所知的合成的最长DNA序列是Kodumal，S.J.，等Proc.Natl.Acad.Sci.USA(2004)101：15573-15578所报道的32 kb的聚酮合成酶基因簇。很多令人感兴趣的核酸分子相当大，包括已知在纯培养物中增殖的任何细胞中最小的基因组，生殖道支原体(M.genitalium)的基因组约为600 kb。迄今报导的完整合成的基因组只有病毒基因组，包括合成的脊髓灰质炎病毒(Cello，J.，等Science，(2003)297：1016-1018)；用合成的寡核苷酸装配的

X174噬菌体(Smith，H.O.，等Proc.Natl.Acad.Sci.USA(2003)100：15440-15445)；和HCV(Blight，K.J.，等Science(2000)290：1972-1974)。

合成较大的DNA分子是有益的。这样做的一种用途是可以提供确定必需和非必需基因的基础。另一种用途则可以构建天然不存在的完整合成基因组。

本发明中使用了体外和体内装配方法。对体外装配方法的描述例如参见基于PCT/US2006/031394的PCT公开申请WO 2007/021944和基于PCT/US2006/031214的PCT公开申请WO 2007/032837。

在酵母体内重组也是已知的。目前酵母重组应用于构建质粒和酵母人工合成染色体(YACs)。1987年Ma等人用共同转化的两段含同源区域的DNA片段构建了质粒。在另一种叫做接头介导装配(linker-mediated assembly)的方法中，任何DNA序列都可用桥连(bridge)多个末端的合成性短接头连接到酵母中的载体DNA上(Raymond，C.K.，等Biotechniques (1999)26：134-138，140-141；和Raymond，C.K.，等Genome Res.(2002)12：190-197)。同样，可以装配四或五个重叠的DNA片段并连接到载体DNA上(Raymond，C.K.，等Biotechniques(1999)26：134-138，140-141；和Ebersol，T.，等Nucleic Acids Res.(2005)33 e130)，这表明(i)酵母细胞可以摄入多个DNA片段，而且(ii)同源酵母重组足以有效地将所述片段正确装配为单一重组分子。

之前的研究已经发现，可以将人基因组中相对大的节段(＞100kb)克隆到环状酵母载体中，前提是该载体携带位于人基因组节段侧翼的末端60个bp的同源物(homologies)(“钩(hooks)”)(Noskov，V.N.，等Nucleic Acids Res.(2001)29：E32)。另外，如Marschall，P.，等Gene Ther.(1999)6：1634-1637所述已知酵母支持在线状着丝粒酵母人工合成染色体(YAC)中的至少2Mb的DNA，且如Kouprina，N.，等EMBO Rep.(2003)4：257-262所述这已经用于克隆在大肠杆菌(E.coli)中不稳定的序列。

人们也探索了其它生物体重组核酸片段的能力。Holt，R.A.，等Bioessays(2007)29：580-590提议用λRed重组系统在大肠杆菌细胞中装配1830kb的流感嗜血杆菌(Haemophilus influenzae)基因组。Itaya，M.，等Proc.Natl.Acad.Sci.USA(2005)102：15971-15976和Yonemura，I.，等Gene(2007)391：171-177已经开发了在枯草芽孢杆菌(Bacillus subtilis)中装配大DNA节段的方法。通过每次加入一个重叠节段，只有在分步加入亚片段(sub-fragment)后，才能在宿主生物体内构筑这些DNA分子。

完整合成性生殖道支原体基因组的装配采用了组合方式，在早期阶段进行体外酶重组，在最后阶段进行体内酵母重组，从而制成完整的基因组，本发明人对其的描述见Gibson，D.G.，等Science(2008)319：1215-1220。

发明概述

本发明一方面涉及装配大的(可选是合成的)核酸分子的方法，所述核酸分子基于目的核苷酸序列或具有任意所需序列。所述方法方便地适用于任何包含大约50千碱基对或更大的序列。

通常，鉴定所需核酸序列，并用它作为设计所需核酸序列的构件(buildingblock)的模板。该靶分子可包含天然存在的序列，或可由工作人员设计而成。设计代表了此序列重叠节段的盒(cassette)，来覆盖完整的所需序列。在优选实施方案中，设计的一些盒含可用于鉴定的水印(watermark)序列。所述水印可以是非编码序列或是编码序列。通常，水印位于已知耐受插入转座子的位置，从而使其对最后获得的所需核酸序列的生物作用最小。所述盒一经设计就用常规技术合成或从天然来源获得，所述常规技术如用单个核苷酸从头合成(denovo)序列。

在本发明的一个实施方案中，在体外装配通常约为2-10kb的盒，例如用上述PCT公开申请所述的技术，来获得所需核苷酸序列的亚序列(subset)。可进行几步体外步骤来装配所需序列的越来越大的部分。以这种方式，就能获得含大小在100kb级别的序列的亚序列。然后将所需序列的这些较大的亚序列引入要对它们进行重组和装配的宿主细胞。如果必需，重复此步骤直至获得所需的大核酸分子。

制备的合成核酸盒和亚序列形式可以是质粒、巨型质粒(megaplasmid)、合成染色体如植物合成染色体、细菌合成染色体、哺乳动物合成染色体、酵母合成染色体、卫星合成染色体(satellite synthetic chromosomes)、腊肠染色体(sausage chromosome)、巨型染色体(gigachromosome)和大型染色体(megachromosome)。原核和真核的宿主细胞都考虑用已公开的方法来使用，它们包括但不限于细菌宿主细胞如大肠杆菌，酵母宿主细胞如酿酒酵母(S.cerevisiae)和昆虫宿主细胞如草地夜蛾(Spodoptera frugiperda)。

因此本发明一方面针对合成所需核酸分子的方法，其包括：

a)提供多个盒，每个盒包含所需核酸的部分核苷酸序列，其中所述盒含有的所需核酸分子的核苷酸序列有重叠部分，且其中所述盒如根据所述重叠部分组合，会得到所需核酸的完整核苷酸序列；

b)体外组合所述盒来获得多个亚序列，其中所述亚序列含有的所需序列有重叠部分，且其中所述亚序列如根据所述重叠部分组合，会得到所需核酸的核苷酸序列；和

c)体内装配所述亚序列来获得所需核酸分子，其中所述装配体还包含复制起点。

如上所述，可重复步骤b)和/或c)，这取决于原始盒的大小及所需核酸分子的长度。步骤c)的装配体应包含其它代表复制起点的核酸序列，还可包含着丝粒和/或选择标记。它们可存在于分开的载体或多个载体上，或者可以包含在体内重组所用的一或多个亚序列中。

至少一些盒也可包含“水印”，其为异源DNA，用于鉴定装配的亚序列或所需核酸中的盒。

在另一个实施方案中，利用了酵母或其它宿主细胞能够装配大量有重叠序列的核酸片段的优势，从而可以在体内用很多盒装配成很大的核酸分子。由此，本发明另一个方面涉及在宿主细胞中同时装配至少10个具有重叠序列的核酸片段的方法，该方法包括用所述片段的混合物转化所述细胞的培养物，其中所述片段中包括编码复制起点(优选着丝粒)的DNA，并培养所述宿主或转移了所述装配片段的另外的(alternative)复制细胞(replication cell)。

在一个实施方案中，所述片段中还包括选择标记。

在此实施方案的变形(variation)中，所述片段中的两个在它们的末端之一含抵御外切核酸酶活性的端粒序列。在此实施方案的另一个变形中，所述片段中包括在不同宿主中可使用的复制起点。这些变形也可用于上述体外/体内步骤组合方法中的体内步骤。

在体内重组方面，所述片段可以是双链的或单链的。双链片段通常为100-5×106个碱基对，单链片段通常较短，但在40-1,000个核苷酸的范围内。所述片段大小的宽范围应包括所有中间的整数值。当然所有片段不一定大小相同，或者甚至大小不一定在同一数量级。

因此本发明这方面涉及将10或更多种DNA片段装配成靶DNA分子的方法，该方法包括：

(a)用含所述至少10种片段中每一种的足量拷贝的混合物转染宿主细胞培养物，使所述培养物中每个细胞平均摄入的拷贝数为不同片段数目的至少约两倍，

其中所述片段包含至少10个碱基对的重叠序列且

其中所述重叠序列的排列方式使所述序列经过重叠能得到所需的装配顺序且

其中所述片段中包括复制起点；

(b)允许所述片段在所述宿主培养物中装配足够长的时间；和

(c)选项

(i)培养所述宿主以获得装配的核酸分子的足量拷贝用于回收，或

(ii)从所述宿主提取DNA并转染另外的培养物，使该另外的培养物复制出所述装配的核酸分子的足量拷贝用于回收。

如果采用选项(i)，复制起点就会是在宿主细胞中可用的(operable)复制起点。如果采用选项(ii)，那么复制起点必须与另外的培养物相容。如果采用选项(i)，可选包含着丝粒，因为缺乏它的结果仅仅是复制的DNA会积聚在单个细胞中而不会分散到子细胞中。确保复制的DNA分子分散到子细胞中并不是绝对必要的。另外可以包括选择标记。

编码复制起点(和/或两个可选元件-着丝粒和选择标记)的DNA可以作为单独的片段来提供(supplied)，或作为待装配的一或多个片段的一部分来提供。另外，如下所解释，可作为复制起点使用的DNA序列可能天然(indigenously)存在于待装配片段中，并不必额外提供。

可将DNA分子装配成环状装配体(assembly)从而使其抗外切核酸酶活性，或者两个待装配片段可在每个的一个末端包含端粒，从而获得受端粒围护(bracket)的线状装配体。

在一些实施方案中，选择标记包含在片段中并于选择条件进行培养，本发明方法还包括从原始培养物或另外的培养物中回收装配的DNA。可以从培养物或从单个细胞培养的菌落(colonies)中回收装配的片段。根据本发明方法，尽管必须用10或更多种片段装配至少一个靶DNA分子，多个DNA分子装配体可同时在同一细胞中起作用。

所有上述特征也适用于上述体外/体内组合合成中的最终体内步骤。

本发明其它方面涉及用本发明方法合成的不天然存在的合成大核酸分子。通常，因为体内重组步骤至少需要包括在宿主细胞内可用的复制起点，所以方法的产物就是新的。本发明还涉及细胞培养物，其包含用本发明方法合成的合成大核酸分子及使用这些培养物的方法。

附图说明

图1显示根据计算机模拟得到的整套25种DNA片段被(成功)摄入的概率相对于每个细胞摄入的DNA片段数的图。

图2是582,970bp的生殖道支原体JCVI-1.0的合成基因组图。

图3显示了生殖道支原体染色体的五步装配策略。

图4A-4C显示了通过体外重组进行的盒装配。

图5A-5D显示了A，B，和C系列装配反应的选定实例及它们的克隆产物的凝胶电泳分析。

图6显示了对含非同源的3′和5′Not I序列的退火接头(junction)的修复。在回噬(chew back)反应中去掉3′-GC核苷酸。在修复反应中，通过Taq聚合酶具有的5′-外切核酸酶活性去掉5′-GGCCGC Not I突出端。

图7A-7C显示了酵母TAR的克隆图及克隆子的特性。

图8显示了完整装配的酵母TAR克隆的大小。

图9是在酵母中构建生殖道支原体的合成基因组的示意图。

图10A-10D显示了多重PCR分析，来筛选出转染了25种DNA节段的酵母细胞。

图11A-11C显示了用限制性分析验证完整无损的生殖道支原体基因组的准确性的结果。

图12A-B显示了对图11所检测的克隆1的进一步分析。

发明内容

本发明方法适用于灵活构建由于太大而不适于简单的体外构建的核酸分子。现在体外装配大于约300kb的核酸分子有问题。较大的片段虽可以装配，但需要在合适的宿主细胞中重组，所述宿主细胞要既能重组有重叠末端的序列还能耐受2-10Mb或更大的大DNA分子。

因此本发明一个申请涉及基于从生物体获得的遗传信息来构建合成的基因组或基因组片段。可用源自完整基因组的遗传信息作为设计感兴趣的合成序列的基础。比如，完整的哺乳动物染色体或其片段的核酸序列可以是人工制备的构建体的模板。多种生物体的基因组序列是公众可获得的，可用于已经公开的方法。这些基因组序列包括但不限于得自如下的信息：敏捷气热菌/嗜热古菌(Aeropyrum pernix)；根瘤农杆菌/根瘤土壤杆菌(Agrobacteriumtumefaciens)；鱼腥蓝细菌属/鱼腥藻属(Anabaena)；冈比亚按蚊(Anophelesgambiae)；西方蜜蜂(Apis mellifera)；风产液菌(Aquifex aeolicus)；拟南芥(Arabidopsis thaliana)；闪烁古生球菌(Archaeoglobus fulgidus)；棉阿舒囊霉(Ashbya gossypii)；炭疽芽胞杆菌(Bacillus anthracis)；蜡样芽胞杆菌/蜡状芽胞杆菌(Bacillus cereus)；嗜碱芽孢杆菌(Bacillus halodurans)；地衣芽孢杆菌(Bacillus licheniformis)；枯草芽孢杆菌；脆弱拟杆菌(Bacteroides fragilis)；多形拟杆菌(Bacteroides thetaiotaomicron)；汉氏巴尔通氏体/横塞氏巴尔通氏体(Bartonella henselae)；五日热巴尔通氏体(Bartonella quintana)；噬菌蛭弧菌/食菌蛭弧菌(Bdellovibrio bacteriovorus)；长双歧杆菌(Bifidobacteriumlongum)；Blochmannia floridanus；支气管炎博德特氏菌(Bordetellabronchiseptica)；副百日咳博德特氏菌(Bordetella parapertussis)；百日咳博德特氏菌(Bordetella pertussis)；布氏疏螺旋体(Borrelia burgdorferi)；大豆慢生根瘤菌(Bradyrhizobium japonicum)；马尔他布鲁氏菌/山羊布鲁氏菌(Brucellamelitensis)；猪布鲁氏菌(Brucella suis)；蚜虫巴克纳氏菌(Buchneraaphidicola)；鼻疽伯克霍尔德菌/鼻疽伯克氏菌(Burkholderia mallei)；类鼻疽伯克霍尔德菌/类鼻疽伯克氏菌(Burkholderia pseudomallei)；Caenorhabditisbriggsae；秀丽隐杆线虫(Caenorhabditis elegans)；空肠弯曲杆菌(Campylobacter jejuni)；光滑假丝酵母(Candida glabrata)；家犬(Canisfamiliaris)；新月柄杆菌(Caulobacter crescentus)；鼠型砂眼衣原体(Chlamydiamuridarum)；砂眼衣原体(Chlamydia trachomatis)；豚鼠嗜衣原体(Chlamydophila caviae)；肺炎衣原体(Chlamydophila pneumoniae)；绿硫菌(Chlorobium tepidum)；青紫色素杆菌(Chromobacterium violaceum)；玻璃海鞘(Ciona intestinalis)；丙酮丁醇梭菌(Clostridium acetobutylicum)；产气荚膜梭菌(Clostridium perfringens)；破伤风梭菌(Clostridium tetani)；白喉棒状杆菌(Corynebacterium diphtheriae)；Corynebacterium efficiens；伯氏考克斯氏体(Coxiella burnetii)；人隐孢子虫(Cryptosporidium hominis)；小球隐孢子虫(Cryptosporidium parvum)；红藻(Cyanidioschyzon merolae)；汉逊德巴利酵母(Debaryomyces hansenii)；耐辐射奇异球菌(Deinococcus radiodurans)；Desulfotalea psychrophila；普通脱硫弧菌(Desulfovibrio vulgaris)；果蝇(Drosophila melanogaster)；兔脑炎原虫(Encephalitozoon cuniculi)；粪肠球菌(Enterococcus faecalis)；胡萝卜软腐欧文氏菌(Erwinia carotovora)；大肠杆菌(Escherichia coli)；核粒梭杆菌/核粒梭菌(Fusobacterium nucleatum)；原鸡(Gallus gallus)；硫还原地杆菌(Geobacter sulfurreducens)；紫色粘杆菌(Gloeobacter violaceus)；Guillardia theta；杜克嗜血杆菌(Haemophilusducreyi)；流感嗜血杆菌(Haemophilus influenzae)；嗜盐杆菌属/盐杆菌属(Halobacterium)；肝螺杆菌(Helicobacter hepaticus)；幽门螺旋杆菌(Helicobacter pylori)；人(Homo sapiens)；Kluyveromyces waltii；约氏乳杆菌(Lactobacillus johnsonii)；植物乳杆菌(Lactobacillus plantarum)；嗜肺军团菌(Legionella pneumophila)；木质部赖氏菌(Leifsonia xyli)；乳酸乳球菌(Lactococcus lactis)；问号钩端螺旋体(Leptospira interrogans)；无害李斯特氏菌(Listeria innocua)；单核细胞增生李斯特氏菌(Listeria monocytogenes)；稻瘟菌(Magnaporthe grisea)；Mannheimia succiniciproducens；花中间原体(Mesoplasma florum)；百脉根中慢生根瘤菌(Mesorhizobium loti)；嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)；布氏拟甲烷球菌(Methanococcoides burtonii)；詹氏甲烷球菌(Methanococcus jannaschii)；海沼甲烷球菌(Methanococcus maripaludis)；Methanogenium frigidum；坎德勒氏甲烷嗜热菌/坎氏甲烷嗜热菌(Methanopyrus kandleri)；噬乙酸甲烷八叠球菌(Methanosarcina acetivorans)；马氏甲烷八叠球菌(Methanosarcina mazei)；荚膜甲基球菌(Methylococcus capsulatus)；小家鼠(Mus musculus)；牛分枝杆菌(Mycobacterium bovis)；麻风分枝杆菌(Mycobacterium leprae)；副结核分支杆菌(Mycobacterium paratuberculosis)；结核分支杆菌(Mycobacteriumtuberculosis)；鸡败血支原体(Mycoplasma gallisepticum)；生殖道支原体(Mycoplasma genitalium)；蕈状支原体(Mycoplasma mycoides)；穿透支原体(Mycoplasma penetrans)；肺炎支原体(Mycoplasma pneumoniae)；肺支原体(Mycoplasma pulmonis)；运动支原体(Mycoplasma mobile)；骑行纳古菌(Nanoarchaeum equitans)；脑膜炎奈瑟氏菌(Neisseria meningitidis)；粗糙链孢霉(Neurospora crassa)；欧洲亚硝化单胞菌(Nitrosomonas europaea)；皮疽诺卡氏菌(Nocardia farcinica)；Oceanobacillus iheyensis；洋葱黄化植原体(Onionsyellows phytoplasma)；稻(Oryza sativa)；倭黑猩猩(Pan troglodytes)；出血败血性巴氏杆菌/出血败血性巴斯德氏菌(Pasteurella multocida)；黄孢亮毛伏革菌(Phanerochaete chrysosporium)；发光光杆状菌(Photorhabdus luminescens)；嗜酸耐热广古生菌(Picrophilus torridus)；恶性疟原虫(Plasmodiumfalciparum)；约氏疟原虫(Plasmodium yoelii yoelii)；毛果杨/三叶杨(Populustrichocarpa)；牙龈红棕色单胞菌(Porphyromonas gingivalis)；Prochlorococcusmarinus；痤疮丙酸杆菌(Propionibacterium acnes)；Protochlamydiaamoebophila；绿脓假单胞菌(Pseudomonas aeruginosa)；恶臭假单胞菌(Pseudomonas putida)；丁香假单胞菌(Pseudomonas syringae)；Pyrobaculumaerophilum；Pyrococcus abyssi；激烈热球菌(Pyrococcus furiosus)；掘越氏热球菌(Pyrococcus horikoshii)；烟孔火叶菌/烟孔热球菌(Pyrolobus fumarii)；青枯病菌/茄青雷尔氏菌(Ralstoniasolanacearum)；褐家鼠(Rattus norvegicus)；Rhodopirellula baltica；沼泽红假单胞菌(Rhodopseudomonas palustris)；康氏立克次氏体/斑疹热立克次氏体(Rickettsia conorii)；斑疹伤寒立克次氏体(Rickettsia typhi)；普氏立克次氏体(Rickettsia prowazekii)；西伯利亚立克次氏体(Rickettsia sibirica)；酿酒酵母(Saccharomyces cerevisiae)；红色糖多孢菌(Saccharopolyspora erythraea)；肠道沙门氏菌/肠沙门氏菌(Salmonellaenterica)；鼠伤寒沙门氏菌(Salmonella typhimurium)；粟酒裂殖酵母(Schizosaccharomyces pombe)；Shewanella oneidensis；福氏志贺氏菌(Shigellaflexneria)；苜蓿根瘤菌/苜蓿中华根瘤菌(Sinorhizobium meliloti)；金黄色葡萄球菌(Staphylococcus aureus)；表皮葡萄球菌(Staphylococcus epidermidis)；无乳链球菌(Streptococcus agalactiae)；变形链球菌(Streptococcus mutans)；肺炎链球菌(Streptococcus pneumoniae)；化脓链球菌/酿脓链球菌(Streptococcuspyogenes)；嗜热链球菌(Streptococcus thermophilus)；除虫链霉菌(Streptomycesavermitilis)；天蓝色链霉菌(Streptomyces coelicolor)；硫磺矿硫化叶菌/硫化裂片菌(Sulfolobus solfataricus)；Sulfolobus tokodaii；聚球蓝细菌属/聚球藻属(Synechococcus)；集胞蓝细菌属/集胞藻属(Synechocystis)；红鳍东方鲀(Takifugu rubripes)；黑青斑河豚(Tetraodon nigroviridis)；假微型海链藻/假矮海链藻(Thalassiosira pseudonana)；腾冲嗜热厌氧杆菌/腾冲嗜热厌氧菌(Thermoanaerobacter tengcongensis)；嗜酸热原体(Thermoplasmaacidophilum)；火山热原体(Thermoplasma volcanium)；细长嗜热蓝细菌聚球藻(Thermosynechococcus elongatus)；Thermotagoa maritima；嗜热栖热菌(Thermus thermophilus)；齿垢密螺旋体(Treponema denticola)；梅毒密螺旋体(Treponema pallidum)；Tropheryma whipplei；解脲脲原体(Ureaplasmaurealyticum)；霍乱弧菌(Vibrio cholerae)；副溶血弧菌(Vibrioparahaemolyticus)；创伤弧菌(Vibrio vulnificus)；魏格沃菌(Wigglesworthiaglossinidia)；尖音库蚊沃尔巴克氏体(Wolbachia pipientis)；产琥珀酸沃林氏菌(Wolinella succinogenes)；地毯草黄单胞菌(Xanthomonas axonopodis)；野油菜黄单胞菌(Xanthomonas campestris)；苛养木杆菌(Xylella fastidiosa)；解脂耶氏酵母(Yarrowia lipolytica)；假结核耶尔森氏菌(Yersiniapseudotuberculosis)；和鼠疫耶尔森氏菌(Yersinia pestis)。

另外，对于现在还未公开的核苷酸序列，在那些序列可以获得时，本发明描述的方法同样适用，所述序列包括表征(characterize)多细胞生物体的那些，所述多细胞生物体如高等植物，如玉米和水稻，哺乳动物如小鼠、猪、母牛、和陪伴动物(companion animal)。这些中的很多现在都可以获得了。

浏览下面的实施例以及对于本发明方法的讨论之后，可以明显得知其应用不限于构建模拟那些天然存在的基因组的合成基因组。可用工作人员所需的任何方式选择用于构建较大DNA分子的初始盒。因此，同一个DNA分子中可包含多个生物体的基因组部分，或者可采用盒的任意设计(arbitrarydesigns of the cassette)。获得原来的盒可以通过合成、或从天然存在的DNA分离、或通过RNA的逆转录。

根据此方法只装配单一代谢途径的多个成员或者装配多条代谢途径也是可取的。可用此方式构建天然不存在的代谢途径。因此，存在于一个生物体中的酶在作用于缺乏一种下游酶的不同生物体所产生的理想底物时，可以借助于构建编码这两种酶的装配体而在同一生物体中编码。因此可以用多种酶来构建复合代谢途径。另外，制备组合文库可以通过混合片段，其中的一或多个片段具有相同的重叠序列，而不是编码酶或其它蛋白质的不同间插序列。

可以组合方式构建遗传途径(genetic pathway)，从而使组合文库中的每个成员都有不同的基因变体组合。例如，可以用30个单个DNA元件构建6⁵个变体的组合文库，其中装配了5个片段，而且其中所述5个片段中的每个都有6个变体。

在一个实施方案中，本发明方法采用了两步合成法。在第一步骤中，在体外连接反应中装配了相对小的核酸分子。在上述PCT公开文献中公开的方法中使用了双链DNA；然而这些方法及其它方法也可用于装配单链DNA。对于单链或双链DNA，除了这些方法，还可使用等温法。在一种方式中使用了可以用于双链核酸的有效反应组合物。它利用了三种酶-T5外切核酸酶、前进(processive)聚合酶和Taq连接酶。此系统的细节如下：反应混合物包含T-5外切核酸酶、Phusion^TM聚合酶、Taq DNA连接酶、合适的缓冲液如ISO缓冲液(Tris pH 7.5，MgCl₂，dNTP’s，NAD，DTT，PEG 8,000)及在等温条件于1小时或更短时间内出现的装配体。可以冷冻此反应混合物，并通过将其加入寡聚片段，包括其双链形式，在50℃温育10-60分钟来直接使用。使用此组合物的方法应用了双链核酸，因为T-5外切核酸酶回噬双链的一条链来暴露重叠序列。在重叠的链退火后，Phusion^TM聚合酶和DNA连接酶起修复作用。所述ISO缓冲液的常用浓度的组分为100mM Tris-Cl 5％PEG 8,000，10mM MgCl₂，10mM DTT，1mM NAD，和200μM dNTP’s。

在第二步骤，当已获得所需序列的较大亚序列时，应用体内重组技术。在有些情况下，特别是在所述亚序列相对小的时候，可使用原核细胞。但连接较大亚序列时，优选真核系统，特别是酵母。参照应用下述完整体内装配的候补实施方案，将详细讨论体内重组的特征。

多个DNA片段，通常是10或更多个DNA片段的体内装配，在下文的例子中用酵母作为宿主培养物。然而，其它宿主可以代替酵母，如耐辐射奇异球菌。其它利于重组的生物体也是已知的。

另外，突变或缺失那些已知进行非同源连接(enjoining)的基因可能有好处。在酿酒酵母中，这些基因包括Ku和DNA连接酶IV及Rad 50、Mrell和Xrs2。这会使不需要的背景重组最少。

因此对多个片段在酵母中的装配的证实仅仅是为了说明目的。本文定义的“密切相关的(close)”培养物是向其中转染片段用于装配的培养物。“另外的(alternate)”培养物指一类另外的生物体或细胞培养物，可以向其中转移装配的DNA用于进一步复制。

体内重组的应用在酵母中举例说明，它为在单步有效装配步骤中装配多个DNA片段提供了有效工具，因此在候补的实施方案中就不需要进行之前的体外亚序列装配操作。此实施方案利用了酵母或其它宿主接受并重组多个片段、以及耐受并增殖此重组所产生的大装配体的能力。体内装配适合装配多达10-500个片段。如下所述，已经成功装配了25个片段。所述的基本技术能装配50，75，100，200，300，400或500个这样的片段。所述待装配的片段可以是双链的，包含100-5×10⁶个碱基对或任何中间的值，包括200，500，1,000，5,000，10,000，100,000或10⁶个碱基对，或者可以是单链的，包含40-1,000个核苷酸或任何中间的整数，如100或500个核苷酸。需装配的数目可取决于片段自身大小。如上述，不是所有片段的大小都需要相同，或甚至不在同一数量级。因此，在一个混合物中的片段可能处于各个不同的范围。可以耐受很大的装配体。

可以在酵母细胞中装配任何大小的构建体，前提是亚片段能进入胞核，而且所构建的DNA节段是完整正确复制的，并且对宿主细胞无毒。

所装配分子在酵母中的DNA复制取决于是否存在高度保守并必需的A元件或自主复制序列(ARS)共有序列(5’-^T _ATTTA^T _C ^A _GTTT^T _A-3’)(综述见Bell，S.P.，Curr.Opin.Genet.Dev.(1995)6：1634-1637)。统计学上，在所有4个碱基以同等几率出现时，在装配的构建体的每～262个kb上应出现一次此序列。如上述，这些复制起点可自动存在于需要装配的片段中，这样就不必特意提供特定的复制起点。在下述实施例4的说明中，这些元件会在代表生殖道支原体基因组的片段中出现得更频繁(平均26.9次，或每～16kb一次)，因为该基因组自身的A+T组成高。这个说法已经得到确认，因为在装配的基因组中出现了20例ARS共有序列，其中包括来自载体的两个ARS共有序列。这是一项重要的考虑因素，因为170kb的缺乏有效复制起点的YAC已显示能引起酵母中的细胞周期关卡反应(checkpoint response)(van Brabant，A.J.，等Mol.Cell(2001)7：705-713)。

因此在酵母中可以装配大到5Mb至20Mb的装配体，本发明方法的体内部分提供了机会用本发明方法装配6-1,000或中间数目的独立的DNA片段，从而装配出长达20Mb的序列。

无论宿主是哪一种，为了能够装配，待装配的片段必须在其末端包含重叠序列。在一个实施方案中，重叠约为10bp；在其它实施方案中，重叠可为15，25，50，60或80bp及此范围内的所有整数。所有片段的重叠长度不一定相同。但为了避免错误装配，片段间的各重叠应该不同。

在装配的体内方法中，使用常用的转染技术，用所有待装配片段的混合物来转染用于重组和装配的宿主细胞。混合物中片段分子的数目与培养物中待转染细胞数目的比例必须足够高，以使至少一些所述细胞能摄入比混合物中不同片段数多的片段分子。如下实施例对此进行了说明，当一份混合物含25种不同的片段，估计该混合物中存在足量的片段分子时，则平均每个细胞会摄入至少40个片段；根据说明，1,000个细胞中约有1个会包含25种不同片段的每一种。然而，通过提高摄入水平，平均每个细胞会摄入至少100个片段，也就会有更高百分比的细胞会包含所有25种不同的片段。平均每个细胞摄入的数目越多，每种不同片段都被摄入的概率就越大。

因此，为装配10种片段，含足量片段分子数的混合物给平均每个细胞提供15-20个片段是理想的；同样，如果一个实施方案中存在100种不同片段，提供的混合物浓度应足以使平均每个细胞能摄入150-200个片段。

为提供可行方法，待装配的片段中必须包括提供复制起点的DNA，可选并优选着丝粒，还可选并优选选择标记。所述复制起点可能仅可用于初始细胞，或在可用于打算复制的替换细胞种类，或者可使用穿梭载体来，比如在初始宿主中进行复制，随后在替换宿主如大肠杆菌或芽孢杆菌中转染待装配的序列。在单一片段中包含所有这两个或三个元件是方便的，但不必须包含。存在这些元件时，只有成功装配了序列的细胞才需回收。因为不受端粒保护的线性DNA会被降解，只有装配的环状DNA或受端粒保护的装配DNA能进行复制。

复制起点可由工作人员选择，其可包含在需要装配的一个片段中，或可包含在装配体所包括的一个分开的载体片段中。但取决于片段的性质，可能并不需要补充的复制起点，因为碰巧会存在用作片段自身原有复制起点的序列。事实上，真的存在这样序列的概率相当高。

存在着丝粒仅可保证复制的DNA会在复制过程中分布于亲代细胞和子细胞中。一些实施方案中，可允许多个拷贝的装配DNA保留在同一细胞中，并仍可有效回收。因此，尽管优选存在着丝粒，但并不是完全必要的。同样，存在选择标记是可选的，其利于从那些DNA已装配成环状或受端粒保护的细胞中成功回收转化体。

一些实施方案中，如上述形成环状DNA。但其它实施方案中，可使其中的两个片段带有端粒，从而装配出不被降解的线状分子，这样会更像酵母基因组。而且，选择标记有利于鉴定出成功的菌落。

一些实施方案中，单个宿主细胞中的片段不只形成单个靶DNA分子，还可产生多个片段装配体。因此，比如在单个宿主细胞中就可以形成两个分别的产物，一个装配自10个片段，另一个装配自5个片段，或者一个装配自20个片段而另一个装配自50个片段。

一个实施方案中，成功装配了环状或受端粒保护的DNA序列的细胞在宿主中繁殖，再从宿主培养物或从得自单个宿主细胞菌落的培养物中分离。在候补实施方案中，用片段混合物处理宿主培养物短时间，约15分钟到2小时，然后提取总DNA并转染到另外的细胞类型如大肠杆菌或芽孢杆菌中。此实施方案中，可使用含对替换细胞类型合适的复制起点的载体。此实施方案有时会有利地缩短回收足量的装配DNA所需的时间，因为这些替换细胞的增殖时间较短。例如，虽然自酵母获得足量装配分子用于分析需要2-3天，但大肠杆菌的复制时间却可使回收在几小时内完成。

在接受处理的培养物中，只有少量百分比的细胞需要摄入足够数目的片段并对它们进行重组从而进行成功装配。那些失败的细胞不会出现在培养物中，因为没进行装配的细胞中的DNA不会复制。如上所述，如果需要的话，在一些实施方案中也可包含选择标记，这提供了其它的也可能是多余的方法，来限制提取DNA的细胞为具有所需构建体的那些细胞。

将多个DNA片段装配成单个环状的或受端粒围护的分子可以用于构建任何需要的装配体。天然存在的基因组，如下文说明的生殖道支原体，可以此种方式装配，然后通过合成来制备。

备选基因组，如大肠杆菌的那些基因组，或其它基因组，如流感嗜血杆菌(H.influenzae)，可用此种方式来装配。分离基因组并在初始宿主中复制它可能会很简单，这是因为宿主具有装配多片段的能力，所以不需从生物体中完整提取所述基因组。装配不好的形式会自动含有再装配所需的重叠序列。

在装配了足够的DNA分子后，可以从宿主或替换宿主的细胞培养物中分离它们。可使用常用的分离技术，这些技术是本领域公知的。“分离”指的是DNA存在于其天然环境之外。因此，从这个角度说，即使是培养物中包含的再装配的DNA(已被迫再装配)也是“分离的”。但从这些细胞回收所述DNA可能是理想的，因为可进一步操作装配的DNA，或者在其它细胞，包括哺乳动物、植物或昆虫细胞中培养它。

如上所述，测定转染宿主细胞培养物如酵母所必需的片段浓度由经验决定。需要大量细胞来确保足量细胞能摄入适当的片段数目，并且必须提供足量片段来实现摄入。针对下文实施例4已实现的对25个片段的装配，如下进行举例性质的说明：

根据说明，单个宿主细胞必须摄入25种DNA片段中每一种的至少一个片段，来装配出25种片段的完整装配体。如果一个细胞随机摄入恰好25个片段，它摄入每一种片段的概率很低，为25！/25²⁵＝1.7×10^-10。因此理想的是平均每个宿主细胞基本摄入25个以上的片段。如果宿主细胞随机摄入N＞25个均匀分散的(equally represented)片段，那么获得所有25种不同片段的概率是多大？对这个版本的“收集者问题(collector’s problem)”的答案在整个概率范畴内都很难计算(Feller，W.，An Introduction to Probability Theory and Its Applications(1950)Wiley，New York)；但可以通过计算机模拟很容易地获得大概的答案，如图1所示，其中Y轴表示成功概率，X轴表示宿主细胞摄入的拷贝数。为了获得这个图，从一袋25个对象(DNA片段)作N次抽签(draw)，每次抽签后替换对象。如果所有25个对象都至少被抽到一次，则试验是成功的。对每个N进行一百万次试验，来获得真实成功概率的最近似值。图1显示如果一个细胞摄入～90个片段，它有约50％几率摄入所有25种不同片段。如果10⁸个宿主细胞接触到DNA，即使平均每个细胞仅摄入40个片段，1,000个细胞中约有1个也会摄入一整套的片段。

人们尚不了解酵母及其它装配宿主摄入并装配DNA的效率。如果重组很高效，那么一群细胞中只需有几个摄入一整套重叠片段即可。如果效率低，那么相对较多的细胞需要摄入整套片段。

用本发明方法可装配任何任意大的DNA分子。一个特别有用的用途是装配来自微生物的基因组。一个用途中，待装配的序列可包含生物体整个基因组或其部分的核苷酸序列。用公开方法装配的核苷酸序列可得自任何生物体，无论是原生生物(Protista)、古细菌(Archaebacteria)、真细菌(Eubacteria)、真菌(Fungi)、植物(Platae)、还是动物(Animalia)。已公开的方法也应该可用于病毒基因组的序列信息。

在体外/体内组合合成法或全体内重组合成法中所用到的“盒”指含所需靶核酸分子序列的部分的起始核酸分子，它是自单个核苷酸合成的，或者通过限制性消化基因组DNA分级分离(fractionation)得自生物体自身的基因组，或者得自从生物体mRNA逆转录得到的cDNA。最初的盒常在2-10kb的范围，可以是所有中间的值，优选在大约5kb的范围。这些盒也可用较小的寡核苷酸连接来进行装配。通常，盒是双链的，但单链盒也可使用。术语“盒”也包括初始盒的其它得自体外连接法的组合。通过体外连接所需序列的初始部分而获得的盒通常大小在约15kb到约200kb的范围，及所有中间的整数值。这些装配体可以称为“盒”或“亚序列”，其中“亚序列”指所需靶核酸分子序列的亚序列；这指的是用于体外/体内法中的体内重组的片段。

“亚序列”指的是盒的装配体，其大小适用于体外/体内法中的体内重组。它们可以是单链或双链。取决于靶核酸分子的大小，这些亚序列常在50-500kb的范围，可以为这些极值间的整数值。因此，本发明方法的这个实施方案由最初的盒开始，通过对其进行装配，得到随后在体内装配的“亚序列”。体外将盒装配到约75-200kb的大小，然后在体内对此大小的亚序列进行进一步装配，这虽然方便但并不必须。

如下实施例1-3所述，基于生殖道支原体G37制备完整的生殖道支原体JCVI-1.0染色体，并用TARBAC克隆载体在酵母中增殖。此构建体比原来报道的DNA合成产物大一个数量级以上。可将此染色体安装到接受的支原体胞质内来制出活体的“合成”细胞(Lartigue，C.，等Science(2007)317：632-638)。合成的染色体在耐受转座子插入的基因间位置包含五条短水印序列，期望这些插入不会影响活力。在基因MG408上也有一个插入来除去致病性，合成的基因组携带氨基糖苷(aminoglycoside)抗性基因，可用于移植(transplantation)试验中的选择。因为这个插入恰好存在于活的生殖道支原体菌株上，期望它不会影响活力。

当装配体变得越来越大，体外步骤的有效性就会降低。这可能是由于形成了多联体，它可能在反应中比环状优先形成。另外，大的细菌合成染色体(BAC’s)(＞100kb)转化得不太有效。Sheng，等发现在相同的受体大肠杆菌菌株中，240kb的BAC转化效率比80kb的BAC低30倍(Sheng，Y.，等NucleicAcids Res.(1995)23：1990-1996。

在下文的实施例2和4中，采用了体内酵母重组。在实施例2中，高效装配重叠片段，每个重叠片段末端都有与相邻片段同源的80bp同源物，然后通过酵母中的转化相关重组(TAR)机制连接到重叠的载体DNA上。两个四分之一部分的生殖道支原体基因组可高效克隆为酵母载体中的半个基因组，更令人惊讶的是，四个四分之一部分的生殖道支原体基因组可重组并克隆为完整基因组。

构建合成染色体并成功转移到支原体物种中，是利用合成遗传方法制备最小细胞(minimal cell)的第一步。盒式(cassette-based)装配策略利于构建最小细胞。可以从单个盒中缺失公知(putative)可以分离的基因。之后可以装配天然的和经过缺失的盒的混合物。此方法会产生文库，其各个成员包括完全天然的到大范围缺失的基因组。将基因组文库移植到受体支原体可产生很多新的活变体。然后可以通过对植入的基因组DNA作凝胶电泳来选出最小的基因组，研究它是不是较小的(reduced)或可能是最小的基因组。

生殖道支原体JCVI-1.0是个小基因组，其特定利用终止密码子UGA产生色氨酸。这使得在大肠杆菌及其它生物体中进行克隆的毒性较低，因为大多数生殖道支原体蛋白质都会被截短。如果其它构型使用了此密码，就需要在胞质中进行移植来制备合成细胞将UGA适当翻译成色氨酸。只要存在适当利用密码子的受体胞质，可能就可以使用其它的密码子改变。

如下实施例中，研究对象要制备出克隆的582,970个碱基对长的合成基因组，其序列与所设计的完全一样。这是艰巨的，因为实际序列同设计序列间的差异(错误)会以多种方式产生，包括制备盒的序列出现错误，制备的盒出现错误，或在修复装配体接头时出现错误。大肠杆菌或酵母装配体的增殖也会导致错误。后两种情况中，错误在装配的晚期发生。因此，要在装配中的多个时间点(points)审慎地测定基因组装配体克隆的序列。在下述实施例中，会发现上述的各种错误，但错误数量很少，而且它们都被成功纠正了。

比如，在核实下述C50-77 1/4分子的序列时，就检测出缺失了两个碱基对。一个缺失经回顾发现是盒54的合成错误。盒68出现错误是因为把不正确的序列传送到了该盒的合成仪上。盒54的错误用合成仪进行了纠正。盒68的错误通过用新合成的片段替换错误的限制性片段进行了纠正。重新装配了C50-77并测序。两个错误都得到了纠正，但又出现了两个新的碱基替代错误。其中一个错误可能是由于Taq聚合酶错误地掺入(misincorporation)了接头区(joint region)而导致。另一个目前仍无法解释，有可能是在大肠杆菌中增殖时产生的。最后的重装配体具有了正确的C50-77序列，将它用来装配整个染色体。

准备工作A确认生殖道支原体基因组的序列

对生殖道支原体G37基因组的测序最初是在1995年。但因为发现序列中的错误会使合成的基因组无活力，所以分离并再次测序了该基因组。测得的序列与原来的序列有34处不同。参见Glass，J.I.，等PNAS(USA)(2006)103：425-430。修订的序列准确反映了有活力的生殖道支原体G37的基因组。

如下实施例是为了说明而不是为了限制本发明，它们详细描述了生殖道支原体完整基因组的合成过程。在实施例1-3所介绍的组合体外/体内合成中，对合成的综述可概括如下：

此合成的582,970bp生殖道支原体JCVI 1.0基因组含有野生型生殖道支原体G37的除MG408之外的其它所有基因，破坏MG408是为了阻断致病性。该基因组也在已知耐受转座子插入的基因间位点包含添加的“水印”序列，用于鉴定该基因组是合成的基因组。它还包含抗生素抗性标记物来对其进行选择。从化学合成的寡核苷酸装配的5-7kb的重叠“盒”，经体外连接制备出～24kb、～72kb(“基因组的1/8”)、和～144kb(“基因组的1/4”)的中间阶段的装配体，这些装配体都克隆为大肠杆菌内的细菌合成染色体(BAC)。测序大多数这些中间阶段的克隆，鉴定出序列正确的所有四个1/4基因组的克隆。通过在酿酒酵母中作转化相关重组(TAR)克隆来装配完整的合成基因组，然后分离并测序。鉴定出序列正确的克隆。也可分离此合成的生殖道支原体基因组。

图2显示的是合成基因组。显示的特征包括：水印和氨基糖苷抗性标记物，有活力的Tn4001转座子插入点位置，包含整个基因组序列的重叠、合成性DNA盒的位置，485个生殖道支原体蛋白编码基因的位置，和43个生殖道支原体的rRNA、tRNA及结构性RNA基因的位置。

图3用示意介绍了整个计划。在装配的第一阶段，将4个盒连接制成A系列装配体，长度约为24kb。在下一阶段，将3个A装配体拼为总共八个约72kb的B系列装配体。一次取2个1/8基因组的B装配体，制成1/4基因组的C系列装配体。这些装配体全都是通过用BAC载体体外重组并克隆到大肠杆菌中制成的。半个基因组和全基因组的装配体是通过体内酵母重组制成的。测序粗体框中的装配体以验证它们是正确的。

在第一阶段，将4个相邻盒的组通过如下所述的体外重组进行装配，并连接到BAC载体DNA上形成带有～24kb插入子的环状重组质粒。例如，将盒1至4连接形成A1-4装配体，将盒5至8装配形成A5-8，以此类推。将盒40和41合并形成标记为41*的单个盒，由此101个原来的盒就减少成为100个，得到25个A系列装配体。在第二阶段，25个A系列装配体每次取3个，制成B系列装配体。例如，用A1-4、A5-8和A9-12构建B1-12。B62-77是个例外，它是用5个A装配体制备的。这使25个A装配体减少为只有8个B装配体，每个大小为基因组的约1/8(～72kb)。在第三阶段，一次取2个占基因组1/8的B装配体来制备4个C装配体。每个大小约为基因组的1/4(～144kb)。前三个阶段的这些装配体是通过体外重组制备的，并克隆到大肠杆菌中。

实施例1体外装配生殖道支原体的部分基因组

将天然的580,076kb生殖道支原体基因组序列(生殖道支原体G37ATCC 33530基因组序列；登录号L43967(Glass，J.I.，等PNAS(USA)(2006)103：425-430)分割为101个长度约为5-7kb的盒，分别合成并进行测序。通常在基因间设置盒边界，以使每个盒含一或多个完整基因，使得未来在各个盒中缺失或操作基因变简单。大多数盒与它们相邻的盒重叠80bp；但一些节段的重叠长达360bp。盒101与盒1重叠，从而完成环。

将短“水印”序列插入盒14，29，39，55和61的已知耐受转座子插入的基因间位点，以使合成的基因组区分于天然基因组。另外，在基因MG408中插入的包含氨基糖苷抗性基因的2,520bp(msrA)位于盒89。已显示有此毒力因子特异性缺陷的菌株不能粘附于哺乳动物细胞上，由此从最好获得的模型系统中去除了致病性。用GENEART(Regensburg，Germany)合成此盒。带所有上述插入子的合成基因组的大小为582,970bp。

用Blue Heron Technology(Bothell，WA)合成盒1至31、盒36至39、盒52至88以及盒90至101，核实它们的序列。以重组质粒DNA和携所述重组质粒的大肠杆菌克隆的形式提供所述盒。每个盒都配有序列、追踪信息及用于测序的引物。用Type IIS限制性酶可将所述盒从它们的载体DNA上切割释放出来。用DNA2.0(Menlo Park，CA)制备盒32至35和盒40至51。

从已用Not I切割的A系列克隆构建八个B系列装配体。通常不需从切割的载体DNA中凝胶纯化插入子，因为它们没有互补的突出端，因此在随后反应中是无活性的。一次取3个A装配体制备B装配体，B62-77是个例外，它是用4个A装配体构建的(图3)。如图3所示，用2个1/8基因组的B装配体构建一个

基因组的C系列装配体，共构建4个。鉴定大小正确的克隆、核实序列并储藏于-80℃。

用合适的Type IIS限制性酶切割携各个盒DNA插入子的重组质粒，释放插入的DNA。在用苯酚-氯仿提取并用乙醇沉淀后，不需去除载体DNA就可以使用所述盒。如图3说明，通过体外重组反应，在存在BAC载体DNA时，一次装配4个所述盒。反应的步骤是一开始用3′-外切核酸酶消化重叠的DNA分子，暴露出重叠，然后使互补的重叠退火，修复接头。

为了说明，通过混合等摩尔量的4个盒的DNA及带有盒66和69的末端重叠体的线状BAC载体，来构建装配体66-69。为了产生重叠，用位于BamHI克隆位点旁的引物通过PCR扩增BAC。引物66(68bp)在BamHI位点右侧与载体重叠20bp，然后是Not I位点，然后与盒66的前40bp重叠。引物69(68bp)在该位点左侧与载体重叠20bp，然后是Not I位点，然后与盒69的最后40bp重叠。然后消化双链(duplex)载体和盒DNA的混合物的3’末端，在无dNTP时用T4聚合酶暴露重叠区。通过在75℃温育来灭活T4聚合酶，之后慢慢冷却来使互补的重叠区域退火。用Taq聚合酶及Taq连接酶，于45℃在存在所有四种dNTP和烟酰胺腺嘌呤二核苷酸(NAD)时，修复退火的接头。

如图4A所示，在无dNTP时用T4聚合酶的3′-外切核酸酶活性从四个盒DNA(66至69)的3′末端消化，直至足以暴露与相邻片段重叠的区域(80bp)。在75℃灭活T4聚合酶，再通过缓慢冷却来使互补的重叠退火。然后在另一分开的反应中用Taq聚合酶和dNTP修复装配体，填平缺口，用Taq连接酶关闭切口(nick)，制成共价的装配体。如图4B所示，用两个引物通过PCR扩增制备用于装配反应的BAC载体，所述引物各与BamHI克隆位点的一侧重叠20bp，之后是Not I位点，然后与盒66或盒69有40bp的重叠。在图A的装配反应中包含经凝胶纯化后的线性扩增产物，使所需的装配体成为含所述4个盒及BAC DNA的环状DNA，如图C所示。

如图5所示，对装配反应的样本进行倒转电场凝胶电泳(FIGE)来评价装配是否成功。在图A中，在MJ-Research PTC-200热循环仪中，于250μl PCR管内，其中含有5％PEG-8000，200mM Tris-Cl pH 7.5，10mM MgCl2，1mMDTT，100μg/ml BSA，4.8U的T4聚合酶(NEB)，盒66，67，68，和69各150ng，以及150ng BAC66-69 DNA，进行A66-69的回噬装配(chew-back assembly，CBA)反应(80μl)。在37℃温育5分钟，在75℃温育20分钟，以-6℃/分钟冷却至60℃，维持30分钟，然后以-6℃/分钟冷却至4℃再维持。修复(TRB)反应体系(40μl)含10μl的回噬反应体系，40 U Taq DNA连接酶(NEB)，1.2UTaq DNA聚合酶(NEB)，5％PEG-8000，50mM Tris-Cl pH 7.5，10mM MgCl2，10mM DTT，25μg/ml BSA，每种dNTP 200μM和1mM NAD。在45℃温育15分钟。将5μl CBA反应体系样本和20μl TRB反应体系样本上样到0.8％E-gel^TM(Cat.No.G5018-08，BioRad)，用U-5程序(2)进行3小时FIGE。用Gel Doc^TM(BioRad)观察DNA带。DNA大小的标准品为1kb延伸梯带(extension ladder)(Invitrogen Cat.No.10511-012)。

图B显示了如图A所述进行的B50-61的装配反应。A50-53，A54-57，和A58-61 DNA的量约为每种450ng。BAC50-61 DNA为150ng。对CBA反应体系样本如图A进行分析。

图C显示了如图A所述进行的C25-49的装配反应。各使用了约300ng、250ng、和60ng的凝胶纯化的B25-36，B37-49，及BAC25-49 DNA。将10μl的CBA反应体系样本上样到BioRad“Ready Agarose Mini Gel^TM(目录号161-3016)，于23℃在Hoeffer HE33微型水平潜艇电泳托盘(mini horizontalsubmarine electrophoresis tray)中进行14小时FIGE(U-9程序(2))，电泳使用的是含0.5μg/ml EtBr的1×TAE缓冲液并且无循环。DNA大小的标准品为低分子量范围(low range)PFG标记物#NO350S(NEB)。用Typhoon 9410荧光成像仪(Fluorescence Imager)(Amersham)以激发波长532nm和发射波长610nm观察电泳带。

图D显示了如图C所述用U-9程序通过FIGE测定的经Not I切割的装配体的大小。

将其它样本电穿孔至DH10B(InvitroGen)，EPI300(Epicentre)，和/或Stbl4^TM(InvitroGen)细胞中，涂于含12.5μg/ml氯霉素的LB琼脂平板上。菌落在24到48小时后出现。挑取菌落，在3ml含氯霉素的LB肉汤中过夜培养。用碱裂法从1.5ml培养物中制备质粒DNA。然后用Not I切割DNA并通过FIGE分析核实这些装配体的正确大小。将大小正确的克隆冻于含15％甘油的LB培养基中，储藏于-80℃。测序一些经过克隆的装配体来确保图3粗体框所示的合成是准确的。

将25个A系列装配体和所有较大的装配体克隆到Epicentre的pCC1BAC载体中。pCC1BAC克隆可以单拷贝水平在EPI300细胞中增殖，然后根据Epicentre方案诱导到每个细胞10个拷贝。经诱导的100ml培养物产出最多200μg的质粒DNA。BAC中的装配体插入子的每侧紧挨着Not I位点，从而通过切割可以高效产出在其每个末端连有部分Not I位点的插入子DNA(生殖道支原体基因组无Not I位点)。当将侧翼有Not I的装配体用于较高级的装配时，通过回噬反应去掉Not I位点的3′部分(2个核苷酸)。退火后Not I位点的5′部分产生6个核苷酸的突出端，但如图6所示，在修复中通过Taq聚合酶的5′-外切核酸酶活性会去除该突出端。

实施例2酵母体内重组

如上述，半个基因组的克隆不会通过体外重组方法在大肠杆菌中增殖。甚至C78-101克隆都难以维持，仅Stbl4^TM大肠杆菌细胞例外。因此，用酿酒酵母作为克隆宿主。

构建线状YAC克隆通常是通过将插入子连接到限制性酶切克隆位点(Burke，D.T.，等Science，(1987)236：806-812。对此方法的改进是使重叠的插入子和载体DNA共转化到酵母的原生质球中，在那里，它们通过同源重组来连接(图7A)。这会产生环状克隆，称为TAR克隆(Larionov，V.，等Proc.Natl.Acad.Sci.USA(1996)93：491-496)。TAR克隆，如同线状YAC一样，含有着丝粒，因此维持与天然酵母基因组相伴的染色体拷贝数。TAR克隆的环状特征使它们可以容易地与线状酵母染色体分离。

图7A显示了用于TAR克隆的载体。其包含BAC和YAC序列(按比例显示)。载体与插入子的重组出现在通过PCR扩增添加到TARBAC的“钩”上。酵母复制起点(ARS)可使克隆增殖，因为生殖道支原体基因组中不存在ARS样序列(Newlon，C.S.，等Curr.Opin.Genet.Dev.(1993)3：752-758)。酵母中的选择是通过弥补宿主菌株中的组氨酸营养缺陷型来进行。BAC序列可使从酵母纯化的克隆有效电穿孔到大肠杆菌中。

为在酵母中将1/4基因组装配至半个基因组和整个基因组，使用pTARBAC3载体(Zeng，C.，等Genomics(2001)11：27-34)。此载体含YAC和BAC序列(图7A)。用类似于上述对BAC载体应用的策略来制备载体。通过PCR扩增用引物在末端产生重叠，所述引物与一段1/4基因组内的单切限制性位点的任一端有60bp重叠，随后是Not I位点及来自载体末端的20bp。将该载体插入第三个1/4基因组C50-77的基因间BsmBI位点。在TAR克隆过程中，在双链断口(break)的重组受刺激增强约20倍(Leem，S.H.，等nucleicAcids Res.(2003)31：E29。待转化的DNA有6个片段(载体，第3个四分之一基因组(quarter)的2个片段，和第1，2，和4个四分之一基因组)。为获得插入pTARBAC3中的全长基因组，单个酵母细胞必须摄入所有6个片段，并通过同源重组来装配它们。

图7B显示了生殖道支原体JCVI-1.0 1/4基因组的装配。从大肠杆菌纯化它们，经Not I消化，与TARBAC载体混合来共转化到酿酒酵母中，其中在60-264bp的重叠区处的重组将这六个片段组合为一个克隆。将此TARBAC插入C50-77中的BsmBI位点。

用公开方法转化酵母细胞(Kouprina，N.，等Methods Mol.Biol.(2006)349：85-101)。自过夜培养物收获酵母细胞，然后用水再用1M山梨醇清洗。在有1M山梨醇时用Zymolyase^TM和β-巯基乙醇处理将细胞转变为原生质球。所述原生质球用山梨醇清洗，重悬于含山梨醇和CaCl₂的缓冲液中。将等同于5ml原始酵母培养物的原生质球以200μl的体积与10ng载体和每种1/4基因组各120ng在室温温育10分钟。然后加入800μl的20％聚乙二醇(PEG)8000(US Biochemicals)，继续温育10分钟。在富集培养基(rich medium)中回收后，在30℃于无组氨酸的山梨醇平板的顶层琼脂上选出转化细胞。先用PCR然后用Southern印迹筛选转化体(图7C)。

图C中，最初用PCR筛选TAR克隆。然后通过Southern印迹鉴定出对所有插入片段的扩增都呈阳性的克隆。在琼脂糖块(plug)中制备酵母总DNA(每个都按照BioRad CHEF DRIII手册方案)，经Not I消化将载体与生殖道支原体序列分开，用脉冲场凝胶电泳(Bio-Rad CHEF DRII或DRIII)分辨，真空转移(BioRad Model 785 Vacuum Blotter)至Amersham Hybond-N+膜，用在九个生殖道支原体MgPa重复区内杂交的洋地黄毒苷(digoxigenin)标记(Roche)的两个PCR产物的混合物作探针来探测，用抗洋地黄毒苷AP Fab片段随后用荧光底物HNPP(Roche)来检测。所需克隆显示出一条带，其大小与从天然生殖道支原体基因组的琼脂糖块分辨出的染色体大小相同。这里显示的是经脉冲场电泳测序的最终得到的克隆的更具体的消化分析结果。各泳道(lane)如下：1)低分子量范围脉冲场凝胶标记物(NEB)，2)宿主酵母菌株VL6-48N(Larionov，V.，等Proc.Natl.Acad.Sci.USA(1997)94：7384-7387，未经消化，3)天然生殖道支原体ΔMG408(尽管此基因组是环状的，琼脂糖块中的部分分子破裂了，这些线状分子以约600kb的大小泳动，为TAR克隆提供了大小标记物和印迹信号的对照)，4)未经消化的酵母菌株sMgTARBAC37，和5)经Not I消化的酵母菌株sMgTARBAC37。第4泳道显示出克隆的拓扑结构为600kb的环状，它因太大而不能在凝胶中泳动。小部分的克隆破裂了，这些线状分子可以检测到微弱的印迹信号。第5泳道是经Not I消化的样本，它显示出插入的生殖道支原体DNA与TARBAC载体分离后的大小。

通过对亚克隆进行进一步的Southern印迹来测试PCR和Southern印迹阳性克隆的稳定性。通过这两个试验发现，约10％的转化菌落携带完整的合成基因组。选这些克隆之一sMgTARBAC37测序。

也对由两个相邻的1/4基因组组成一套、一共四套中的每一套，以及第1到第3个四分之一基因组，进行TAR克隆。分离来自这些不同试验的转化体的DNA并电穿孔至大肠杆菌中(Silverman，G.A.，Methods Mol.Biol.(1996)54：65-68)。用这种方式，我们获得了BAC克隆，根据其大小预测是D1-49，D50-101，还获得了装配体，根据其大小预测是25-77及1-77。从中选出D1-49测序，其序列是正确的。

实施例3从酵母回收合成的生殖道支原体基因组并确认其序列

根据针对酵母的Bio-Rad CHEF手册方案，从在30℃生长到OD 0.5的1.5L CM-HIS培养物中制备sMgTARBAC37的琼脂糖块。清洗所述块，在1×NEB缓冲液4中透析，然后在37℃与限制性酶Rsr II、Fse I、和AsiS I(它们只切割酵母不切割sMgTARBAC37)温育过夜。用琼脂糖凝胶电泳(4.5V/cm，2小时)从块中去除消化后的线状酵母DNA。在这些条件下，完整的环状sMGTARBAC37DNA会保留在块中。为了评价该sMgTARBAC37DNA的大小和纯度，将一个块与Not I温育，通过电泳分析此块内的DNA。用SYBR金染色凝胶。

图8显示了经Not I消化约590kb大小的带，但未经消化的对照没有显示出带。用剩余块的DNA来制备测序文库。测序sMgTARBAC37DNA的X覆盖度(coverage)，确认它同设计的一样。

实施例4在酵母中装配25种DNA片段

所用的DNA片段是生殖道支原体基因组的重叠部分，对其的详细描述见Gibson，D.G.，等Science(2008)319：1215-1220(见上文)。

A.制备A系列装配体：将表1所示的25种A系列装配体中的每一个包含在pCC1BAC^TM中，并在EPI300^TM大肠杆菌菌株(Epicentre

)中增殖。

表1

构建生殖道支原体JCVI-1.1合成基因组所用的25种A系列装配体的概述

使用了不同于公开描述的A86-89变体，其在非必需基因中插入了载体。该载体含组蛋白缺陷型标记，着丝粒和复制起点用于在酵母中的选择和维持。含不含带有酵母增殖元件的载体可用来评价装配结果。

克隆系统允许每个细胞有这些BAC的10个或更多个拷贝。将带有这25种装配体的大肠杆菌菌株接种到150ml的LB加12.5μg/ml氯霉素和1X诱导液(Epicentre)中，在37℃温育16小时。收获培养物，并用Qiagen’sHiSpeed Plasmid Maxi Kit纯化BAC。用500μl的TE缓冲液洗脱DNA。在37℃限制性消化16小时，使片段从它们的BAC释放，然后用苯酚氯仿提取加乙醇沉淀来终止反应。将产物溶于TE缓冲液，终浓度达120ng/μl。

在消化后，25种装配体中的每一种在其任一端都含有与目的邻接分子重叠至少80bp的序列。

B.酵母原生质球转化：用Zymolyase^TM处理酵母细胞来使细胞壁变脆弱，然后用PEG和CaCl₂处理使细胞处于感受态来摄入异源DNA，所用的酵母细胞是VL6-48N酵母菌株(Kouprina，N.，等见上文)。在制备酵母原生质球之前，使细胞生长至OD₆₀₀为1.3(～5×10⁷细胞/ml)。通过加入25种经消化的A系列装配体各96ng(0.8μl，120ng/μl)来汇总它们，然后与～10⁸个酵母原生质球混合。将等量(～100ng或～4×10⁹基因组当量)的来自步骤A的各种消化片段汇总在一起，不进行凝胶纯化。将约10⁸个酵母原生质球加入此DNA池，进行酵母转化(Kouprina，N.，等Nat.Protoc.(2008)3：371-377)。这相当于每个酵母原生质球对应～40生殖道支原体基因组当量或～1000个DNA分子(40×25)。转化后，使酵母原生质球再生，并在加腺嘌呤、无组氨酸的完全补加培养基(complete supplemental medium)(CSM-His)上以及1M山梨醇琼脂平板上于30℃选择3天。在30℃于选择培养基上温育3天后，获得约800个菌落。然后将单菌落以小块形式转移到CSM-His琼脂平板上，在30℃温育2天。一经筛选确认具有所需装配体，就分析这些平板上的各个菌落。

整个过程参见图9的示意图。如图所示，用含生殖道支原体基因组的25种不同的重叠A系列DNA节段(每个大小为～17kb至～35kb)转化酵母细胞。为了将它们装配成完整基因组，一个酵母细胞必须摄入25种不同DNA片段的至少一个代表，并将每一个掺入核中，在那里发生同源重组。图中标记为JCVI-1.1的装配成的基因组大小为590,011bp，其包括位于A86-89内部的载体序列(三角形)。如上述，载体中包含的酵母增殖元件是复制起点(ARSH4)，着丝粒(Cen6)和组氨酸选择标记(His3)。

C.多重PCR分析：用ChargeSwitch

Plasmid Yeast Mini Kit(Invitrogen，目录号CS10203)根据提供的手册，从培养的酵母细胞中提取DNA。在10μl反应体系中进行多重PCR，使用的主(master)混合物组成如下：PCR缓冲液，dNTP混合物，和HotStarTaq DNA聚合酶(Qiagen，目录号206143)。将2μl DNA和1μl的10X引物贮存液(stock)加入每个反应体系，该贮存液中含20种寡聚物各5μM。循环参数为：94℃ 15分钟，然后94℃ 30秒，45℃(第1套引物)或55℃(第2-第4套引物)90秒，72℃ 90秒，循环35次，之后是单次在72℃温育3分钟。将2μl的各种反应体系上样到2％ E-gel(Invitrogen)上，通72V电30分钟。用Amersham Typhoon 9410荧光成像仪观察带。

我们首先筛选摄入所有25种片段的酵母细胞。设计40对引物，使它们产生大小在100bp和1075bp之间的扩增子，从而使所述引物可以在四个多重PCR反应的每个中产生10种扩增子。之前已对第1和第2套多重引物作了描述(Gibson，D.G.，等见上文)。所述40种扩增子位于生殖道支原体基因组每间隔约15kb的位置上。所有25种节段都需要存在，才能通过PCR得到所有40种扩增子，从而很好地表明所有25种片段都掺入了酵母细胞。图10A-10B示意了此过程。如图10A所示，设计40种扩增子，从而使4个单独的多重PCR反应(第1套-第4套)各产生10种产物。如图10B所示，所述40套引物各扩增生殖道支原体基因组的一小部分，大约每15kb一小部分。25种节段(箭头)中的每一种给40种扩增子中的至少一种(以线来显示)提供引物结合位点。将呈小块的10个单菌落转移到单个选择平板上。在30℃温育2天后，将来自这10片中每一片的约10⁷个细胞刮至1ml水中。用第1套多重引物和从这10个克隆提取的DNA，进行多重PCR，并用凝胶电泳分析。1号和4号克隆产生了所有10种扩增子。当接触时间延长时，扩增子1-h产生了可见的弱信号(数据未示)。此PCR分析结果证明在1号和4号克隆内存在25种A系列装配体中的10种。

PCR产物大小在100bp至1075bp的范围，可以容易地在2％琼脂糖凝胶上进行电泳分离。图10C所示的结果中，从10个酵母克隆提取DNA，并用第一套引物进行多重PCR。1号和4号克隆(c1和c4)高效产生了10种预期扩增子中的9种。当从凝胶传出的信号增强时可见扩增子1-h。

D.对4号克隆的详细分析。用第1-第4套多重引物，进行多重PCR，并用凝胶电泳分析。除扩增子1-h之外，从4号克隆提取的DNA高效产生了所有40种PCR产物。这证实存在所有25种A系列装配体(与图10B相比)。A70-73由扩增子1-h和3-h代表。尽管扩增子1-h较其它扩增子的产量低，但扩增子3-h可高效制备，这提供了强有力的证据表明4号克隆中存在A70-73。选择4号克隆进行进一步分析。图10D的结果显示，用所有4套引物在4号克隆上进行多重PCR。除扩增子1-h之外，此克隆可高效制备所有40种扩增子。在标记为“L”的泳道中，上样100bp梯带(NEB)，标示大小。

E.对JCVI-1.1合成性生殖道支原体基因组的限制性分析：用Bio-RadYeast DNA plug Kit，根据提供的说明手册(目录号170-3593)从1％琼脂糖中的克隆制备DNA。完成此步骤后，将胶块浸没于水平潜艇电泳托盘的1×TAE中，通电5.4V/cm2小时。然后取出所述胶块，贮存于TE缓冲液中。根据Bio-Rad手册用EagI、BssHII、或AatII(NEB提供限制性酶和缓冲液)消化胶块。在37℃温育16小时后，将等量的各个胶块(约20μl)上样到1％BioRad Ready AgaroseMini Gels^TM上，然后在23℃于Hoefer^TM HE 33微型水平潜艇电泳托盘中用U-2程序进行倒转电场凝胶电泳(FIGE)14小时，电泳使用的是含0.5μg/ml溴化乙锭的1×TAE缓冲液，无循环。FIGE U-2的参数是正向(forward)90V，初始转向(initial switch)5.0秒，末次转向30秒，带线性渐变(linear ramp)，逆向(reverse)60V，初始转向5.0秒，末次转向30秒。用Typhoon^TM 9410荧光成像仪(Amersham)在激发波长532nm和发射波长610nm观察带。

为核实所有25种片段都装配到4号克隆的完整基因组中，从琼脂糖块中的这些酵母细胞制备DNA，如上述作限制性分析。还从未转化的宿主菌株提取DNA作为阴性对照。为富集块中的环状基因组，通过恒压电泳去除大多线状酵母染色体DNA。如图11C所示，用EagI、BssHII、和AatII消化后，在对消化后的块作倒转电场凝胶电泳时，观察到了预测这样消化完整的基因组装配体会产生的5个限制性片段。宿主酵母对照不显示这些带中的任何一条，只观察到了小于～150kb的DNA成片条带。此成片条带使所装配基因组的其它预测片段模糊不可见。与多重PCR结果一起(图10)，这些结果表明4号克隆含有装配的JCVI-1.1合成基因组，已经摄入了至少25种重叠的DNA节段，并在体内将它们重组。

在分析用第1套引物扩增得到的多重PCR产物时，1号克隆的模式与4号克隆的类似(图10C)。因此我们进一步分析1号克隆。用图10所示的4套多重PCR引物，从1号克隆观察到了所有40种扩增子，在图11所示的EagI消化后，图12显示出存在预期的590kb的带。

图12A中，用图10中的所有4套引物，对从1号克隆提取的DNA作多重PCR。在2％琼脂糖凝胶上电泳后，观察到所有40种扩增子。图12B中，从琼脂糖块中的1号克隆制备DNA，然后用EagI消化，并如图11进行分析。在1％琼脂糖凝胶上作倒转电场凝胶电泳后，可观察到预测的590kb的带(用*标注)。

所以在检测的10个酵母克隆中有2个含有完整的基因组。

Claims

1.合成所需核酸分子的方法，其包括：

a)提供多个盒，每个盒包含所需核酸的部分核苷酸序列，其中所述盒含有的所需核酸分子的核苷酸序列有重叠部分，且其中所述盒根据所述重叠部分进行组合会得到所需核酸的完整核苷酸序列；

b)体外组合所述盒来获得多个亚序列，其中所述亚序列含有的所需序列有重叠部分，且其中所述亚序列根据所述重叠部分进行组合会得到所需核酸的核苷酸序列；和

c)在宿主培养物中体内装配所述亚序列来获得所需核酸分子，其中所述装配体还包含复制起点。

2.权利要求1的方法，其中所述重叠部分每个至少包含20个碱基。

3.权利要求1的方法，其中所述步骤b)和/或步骤c)重复至少一次。

4.权利要求1的方法，其中所述步骤c)在酵母中进行，所述复制起点可用于酵母中。

5.权利要求4的方法，其中所述步骤c)的装配体包含着丝粒和/或选择标记。

6.权利要求1的方法，其中所述复制起点包含在另外的载体中。

7.权利要求5的方法，其中所述着丝粒和/或选择标记包含在另外的载体中。

8.权利要求1的方法，其中步骤a)中的一或多个盒包含水印。

9.将10个或更多个DNA片段装配成单个DNA分子的方法，该方法包括：

(a)用含所述10个片段中每一个的足量拷贝的混合物转染宿主细胞培养物，使所述培养物中每个细胞平均摄入的拷贝总数为这些不同片段的数目的至少两倍，

其中所述片段包含至少10个碱基对的重叠序列，且

其中所述重叠序列的排列方式使所述序列经过重叠能得到所需的装配顺序，且

其中所述片段包括复制起点；

(b)允许所述片段在所述酵母培养物中装配足够长的时间；和

(c)

10.权利要求9的方法，其还包括从宿主培养物或另外的培养物分离出所装配的DNA分子的步骤。

11.权利要求9的方法，其中在所述宿主培养物中至少装配两个靶DNA分子。

12.权利要求9的方法，其中所述复制起点在宿主中是可用的，所述片段包括在宿主中可用的着丝粒。

13.权利要求9的方法，其中所述片段中包括在另外的系统中可用的复制起点。

14.权利要求9的方法，其中所述片段包括选择标记，并且其中所述培养在选择条件下进行。

15.权利要求9的方法，其中所述片段是双链的并包含100-5x10⁶个碱基对。

16.权利要求9的方法，其中所述片段是单链的并包含40-1,000个核苷酸。

17.权利要求9的方法，其中所述片段中的两个各在其一端包含端粒。

18.权利要求9的方法，其中所述装配的DNA分子代表天然存在的基因组。

19.权利要求9的方法，其中所述装配的DNA分子包括所需的代谢途径。

20.权利要求9-19任一项的方法，其中所述宿主培养物是酵母。

21.用权利要求1-19任一项的方法装配的分离的DNA分子。

22.宿主培养物或另外的培养物，其包含根据权利要求1-19任一项的方法装配的DNA分子。

23.权利要求22的宿主培养物，其为酵母，及权利要求22的另外的培养物，其为大肠杆菌或芽孢杆菌培养物。

24.评价基因的临界状态的方法，该方法包括缺失或破坏来自转染入细胞培养物的权利要求21所述合成性核酸分子的候选基因，并评估该缺失或破坏对培养物存活的影响。