CN101390113A

CN101390113A - 利用甲基化进行dna计算的系统和方法

Info

Publication number: CN101390113A
Application number: CNA2007800063460A
Authority: CN
Inventors: N·迪米特罗娃; S·盖尔
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2006-02-24
Filing date: 2007-02-06
Publication date: 2009-03-18

Abstract

本发明涉及为了确立一组子句的真或假逻辑值进行DNA的灵活和可逆转修饰的新的方法和系统。其将生物学意义和实验步骤与用基本布尔运算符：OR、AND和NOT的逻辑执行结合起来。甲基化逻辑的特点是利用胞嘧啶和腺嘌呤的DNA甲基化的逆转。通过逆转DNA甲基化状态，可以否定逻辑变量。描述了四个脚本：其中三个使用甲基－敏感限制酶，以及第四个使用甲基－结合蛋白。编码可以使用单链或双链DNA。此外，本发明允许通过执行逻辑电路解决多－变量SAT问题。

Description

利用甲基化进行DNA计算的系统和方法

相关申请的交叉引用

申请人要求2006年2月24日提交的临时申请No.60/776,758的优先权。

本发明涉及使用DNA甲基化确定存在的生物标记和寻找新的生物标记的系统和方法。本发明的系统和方法用于多种应用，包括分子诊断学、DNA假设产生和体外实验。

DNA计算使用DNA和分子生物学，而不是传统的基于硅的计算机技术来解决复杂的问题。体积为1cm³的1克DNA可容纳100亿光盘、大约750百万兆字节的信息。

该领域最初由南加利福尼亚大学的Leonard Adleman研发。1994年，Adleman证实用于解决七点Hamiltonian路径问题的DNA的概念验证性使用作为计算形式。由于最初Adleman的实验，已经取得进展，多种图灵机被证实是可构建的。2004年，Weizmann Institute的Ehud Shapiro及研究者在NATURE杂志宣布他们构建了DNA计算机。该DNA计算机与输入和输出模块偶联，能诊断细胞中的癌活性，然后在诊断时释放抗癌药物。DNA计算基本上与并行计算类似，因为其利用DNA的许多不同分子同时尝试许多不同的可能性的优点。

DNA甲基化是指包括向胞嘧啶的第5个碳或者腺嘌呤的第6个碳加入甲基CH₃的技术。DNA甲基化已知是在动物和植物中作为用于基因表达调控的重要手段的机制。在细菌中，其作为用于保护免受外源DNA攻击的保护机制。作为生物学过程，DNA甲基化是可逆的。DNA甲基转移酶催化DNA中甲基从S-腺苷基-L-甲硫氨酸向胞嘧啶或腺嘌呤转移。DNA聚合酶在复制期间不复制甲基化状态。

本领域中已知的某些测定法可用作实验工具用于发育生物学和癌症领域中的DNA分析。这些测定法最初用于寻找候选基因的外遗传或甲基化状态和某些生物学过程中候选基因的参与。这些技术可导致鉴定或证实存在的生物标记或建立新的生物标记。生物标记在通过DNA计算模型区分癌细胞和健康细胞中起着重要作用。当前，由于不能在现存的DNA上重写或盖写，该领域中的含水计算(aqueous computing)受到限制。该限制阻碍了积极深入研究、遗传序列的表征、高度复杂问题的解决和诊断活力。因此，一旦处理了一段DNA，其不能再使用。现有的测定法是不可逆的，限制了其实用和信息价值。

1994年Adleman的历史性实验后，分子计算模型已经接近了不同的NP-完全问题。(参见，例如Conrad，M.，Information processing in molecularsystems.Currents in Modern Biology，1972.5：第1-14页，Livstone MS，v.N.D.，Landweber LF.，Molecular computing revisited：a Moore′s Law？TrendsBiotechnol.，2003.21(3):第98-101页，Head，T.，One Mathematician′s Tourfrom Biology into Computing and Back to Life，已投稿，2006)。Lederman等研发了作为单一溶液中全加器(full adder)的七个基于脱氧核酶分子逻辑门的阵列。(参见，例如，Lederman H，M.J.，Stefanovic D，Stojanovic MN.，Deoxyribozyme-Based Three-Input Logic Gates and Construction of aMolecular Full Adder.Biochemistry，2006，Margolin AA，S.M.，Booleancalculations made easy(for ribozymes).Nat Biotechnol.，2005)。Liu等披露了使用基于表面化学的DNA计算机以解决四-变量四-子句3-SAT问题。(参见，例如，Liu，Q.，Wang，L.，Frutos，A.，Condon，A.E.和Smith，L.M.，DNAcomputing on surfaces.Nature，2000)。

最近，Su等已经应用能刺激布尔逻辑电路的DNA计算机。(参见，例如，Su X，S.L.，Demonstration of a universal surface DNA computer.NucleicAcids Res.，2004)。他们构建了NOR和OR门并将其组合成单一逻辑电路。Head等提出用于记录溶于水的DNA分子上的信息新途径。(参见，例如，T.Head，X.C.，M.J.Nichols，M.Yamamura，S.Gal，Aqueous solutions ofalgorithmic problems：emphasizingknights on a 3X3 in DNA Computing-7thInternational Workshop on DNA-Based Computers，2002)。该含有分子的所得溶液被认为是构成了“液体记忆”。Head等也引进了用于读取来自这些分子的信息的方案。

Hatada等提出一组布尔子句的可满足性问题(SAT问题)的简单实例。(Hatada L，F.M.，Kimura M.，Morita S.，Yamada K.，Yoshikawa T.，YamanakaS.，Endo C，Sakurada A.，Sato M.，Kondo T.，Horii A.，Ushijima T.，Sasaki H.，Genome-wide profiling of promoter methylation in human，Oncogene，2006)。给定一组布尔子句，问题是寻找所有子句都满足的真假值(真)。用于解决这个SAT问题的步骤说明了称为“含水算法”的DNA计算方法。(参见，例如，T.Head，X.C.，M.Yamamura，S.Gal，Aqueous computing：a survey with aninvitation to participate，J.Computer Science & Technology，2002)。

Benenson等执行了一种自动化方法，其中通过可逆软件分子与输入分子杂交，接着输入分子被不可逆地软件定向切割而进行计算。(参见，例如，Benenson Y，A.R.，Paz-Elizur T，Livneh Z，Shapiro E.，DNA molecule providesa computing machine with both data and fuel，Proc Natl Acad Sci U S A，2003)。以前，Gal等使用特定限制酶位点的单向甲基化用于解决或模仿特定SAT问题的方法。(参见，例如，Gal S.，H.T.Exploring Methylation as a Toolor DNA Computing in DNAII：Conference onDNA based computers.2005)。

尽管至今的努力，仍然需要通过可逆DNA计算有效解决复杂问题的系统和方法。另外，需要有效和可靠地实现利用甲基化的实用和有力诊断工具的系统/方法。这些和其他需要通过此处披露的系统和方法得到满足。

本发明描述了用于使用DNA计算的甲基化逻辑的方法和系统。也披露了使用甲基化逻辑的用于证实生物标记的方法和系统。在示例性的实施方式中，公开的方法和系统涉及产生具有赋值变量的逻辑语句。所述变量包括多个甲基化变量，以及各个这样的甲基化变量的否定，所述否定对应于未甲基化变量。一旦变量被赋值并选定一特定系列的逻辑子句以确定所述子句的“真”值，便使目的样品/混合物与变量/逻辑子句联系起来。

因此，根据本发明的示例性实施方式，获得、鉴定和/或产生样品或混合物。然后将该混合物/样品甲基化。通过一种或多种分离技术，一般为一系列分离技术，通过一系列测定法分离混合物/样品。通过所提及的分离技术，获得最终需要的混合物/样品，然后使用解码手段将其解码。然后对解码的信息进行通常读取。在本发明的示例性实施方式中，该读取可用于验证现存的生物标记或产生新的生物标记。

与公开的系统和方法的逻辑语句相关的变量一般为特定基因，但也可以为一组基因、基因上的一组位点和其组合。该变量一般具有至少一个胞嘧啶或腺嘌呤以提供/有助于C-执行甲基化编码或A-执行甲基化编码。变量编码可根据公开的系统通过单链或双链DNA完成。

本发明的另一方面涉及一种解决一组遗传子句的方法和系统，所述方法/系统涉及使变量赋值以使各赋值变量对应于甲基化变量及其否定——该否定对应与未甲基化变量。所述变量的赋值用于解决给定逻辑子句中的AND、OR和NOT布尔逻辑项，即利用甲基化和未甲基化变量。本发明的方法和系统通常包括步骤：甲基化包含对应于赋值变量的成分/组分的给定的混合物/样品，然后通过一种或多种分离步骤，例如，一系列测定法分离混合物/样品，以产生需要的混合物。根据本发明的示例性实施方式，需要的混合物满足给定的逻辑子句。因此，赋值变量一般对应于特定基因、一组基因、一组基因上的位点等。变量一般具有至少一个胞嘧啶以提供/有助于C-执行甲基化编码或者至少一个腺嘌呤以提供/有助于A-执行甲基化编码。变量编码可通过单链或双链DNA实现。

本发明的方法和系统对DNA计算提供显著的益处。这样，本发明的方法和系统具有广泛的实用性。从以下的说明，特别是当与附图结合阅读时，本发明的方法和系统的其它特征、功能和益处将显而易见。

为了帮助本领域技术人员制备和使用本发明的系统和方法，参考附图，其中：

图1说明计算p OR q的步骤。

图2说明p′OR q OR r′的步骤。

本发明描述了在进行诊断决定的过程中有益地允许对DNA进行更复杂操作的数学逻辑框架。与常规DNA计算方法相反，本发明的方法和系统允许/有助于DNA计算的书写和重写。

本发明的方法和系统利用甲基化逻辑，从而利用胞嘧啶和/或腺嘌呤的DNA甲基化的可逆性以支持复杂/有益的计算技术。本发明的方法允许/有助于DNA序列的可逆的甲基化以改变编码变量的真假值。编码的变量包括但不限于基因、一组基因和/或基因的一段。

在具体方法中，可以用甲基化-敏感限制酶或甲基-结合蛋白来使胞嘧啶甲基化。编码具体逻辑变量的＂真＂和＂假＂值的DNA序列不必被不同的序列编码。相反，变量的否定由相反状态编码。例如，如果变量值为T并且由未甲基化的序列编码，这个变量的否定被相同但甲基化的DNA序列编码。

存在两个产生甲基化标记的核苷酸，即腺嘌呤和胞嘧啶。基于腺嘌呤和胞嘧啶的甲基化逻辑执行分别被称为A-执行(A-implementation)和C-执行(C-implementation)。下面列出的实施例提供了C-执行的示例性应用以更清楚地描述本发明。然而，对本领域技术人员易于显而易见的是，本发明的方法和系统不限于C-执行，而是具有更广泛的实用性，例如A-执行。

下面描述了如本文中公开的适合用于应用甲基化逻辑方法计算的许多市售可得的示例性生物化学工具。这些工具最初与计算机/处理器联合使用，并且此处描述的步骤以计算机模拟进行。具体序列的DNA的甲基化可简单地通过使寡核苷酸排序和使特定核苷酸为甲基-胞嘧啶进行制备。举例说明的提供者为Integrated DNA Technologies，http://www.idtdna.com。有许多本领域中已知的甲基转移酶、甲基结合蛋白和甲基-特异限制酶能够使序列甲基化，其中的每一个以单独或组合的形式与本发明的方法/系统联合使用。

根据本发明的进一步的示例性实施方式，存在多种可以在特定4-6个碱基对识别位点甲基化DNA的酶。如果一条链已经甲基化(称为半甲基化)，人Dnmtl酶使C-G背景中的胞嘧啶甲基化，使其两条链完全甲基化。目前，十三(13)种以上不同的DNA甲基酶是市售可得的。甲基化DNA结合蛋白可用于甲基化和未甲基化DNA的物理分离。也可以利用单独的或与基于结合蛋白的技术联合的可选择的分离技术。几种不同的结合蛋白是已知的并适用于本发明的应用，包括但不限于Kaiso、MBD1、MBD2、MBD3、MBD4和MeCP。一种或多种前述结合蛋白可以为序列特异性的，在这种情况下这种序列的利用通常是有效的。

根据本发明也可以进行特异性生物化学反应以区分甲基化和未甲基化DNA。例如，亚硫酸氢盐处理改变未甲基化的胞嘧啶并将其转化为尿苷残基。甲基化的胞嘧啶不改变。因此，可以利用亚硫酸氢盐处理以在一条链的尿苷和另一条链的鸟嘌呤之间产生一个碱基的错配。本领域中已知几种特异性内切核酸酶可以特异性切割这种结构。

或者，DNA测序、寡核苷酸杂交或PCR可以用于区分序列的不同水平的甲基化状态。最近，例如，已经分离可以切开半甲基化或甲基化DNA的特异性DNA内切核酸酶McrBC。因此，可以利用以McrBC为特征的一类内切核酸酶化合物以筛选人DNA中的甲基化DNA序列。也有根据DNA的甲基化状态可以切割的序列-特异性DNA切割酶、限制性内切酶(例如，MspI和HpaII)。当相同的序列使用一对这些酶时，即第一个酶可切割甲基化DNA，而另一个酶不能，根据本发明以及使用各反应的切割状态的比较以确定特异性DNA为甲基化的或不是甲基化的，即便对于如人基因组这样的复杂的混合物中也是可以的。这些已知的工具对于使用根据本发明的方法和系统的DNA甲基化的逻辑算法的分析是可得到的。

在本发明的示例性实施方式中，使用DNA甲基化的布尔逻辑有益地用于DNA计算。由于DNA甲基化是可逆的过程，其允许抽象框架。实际上，多种物理应用是可获得的，从而产生许多给出DNA选择的实质自由的潜在的应用步骤。DNA甲基化是重要的，因为书写-擦去步骤可以作为溶液中甲基化产物-非甲酸化产物的应用。允许/有助于使用不同编码的字符串的甲基化逻辑由本发明定义。通常需要的是编码的逻辑变量包含至少一个用于C-执行的胞嘧啶或至少一个用于A-执行的腺嘌呤。根据本发明，将一个DNA甲基化状态作为真而将另一个甲基化状态作为假。例如，对于给定的变量，胞嘧啶的甲基化可以被认为等于＂真＂。

结合本发明提供了下述定义/说明。

编码：逻辑变量可以是由单链或双链DNA编码的。在C-执行中，代码一般包括CpG二核苷酸。

书写：书写对应于体外或体内利用DNA甲基化。根据本发明的示例性实施方式，体外甲基化对应于利用前述的甲基转移酶之一。体内甲基化可对应于仅仅如果一条链已经甲基化才使CpG二核苷酸中的C甲基化的维持甲基转移酶DNMT1，以及甲基化所有CpG二核苷酸的从头甲基转移酶DNMT3a和DNMT3b。

擦去：擦去对应于前述的除去体外或体内DNA甲基化标记的任何步骤。

破坏：术语“破坏”中包含涉及破坏未甲基化或甲基化DNA的任何步骤。例如破坏涉及利用特异性消化甲基化或未甲基化DNA的一种或多种酶。用于本发明的目的，导致丢失甲基化标记方法(如PCR)为进一步的实例。

分离：根据本发明，多种技术可用于分离甲基化和未甲基化的组分。例如，甲基化DNA结合蛋白可用于分离具有甲基化核苷酸与其上没有附着任何甲基的核苷酸。

读取：如本文中所用，术语“读取”是指可用于产生读出步骤的技术或系统或其他可区分一段DNA是完全甲基化、半甲基化或部分甲基化或完全未甲基化的标记。甲基化-敏感限制酶和PCR可用于这个目的。

在任何计算法中，在编码/读取步骤对计算步骤之间可存在二元性。一般地，计算步骤使用多种物理和化学法，从而产生用于读取步骤以分析和/或解释的结果。本发明描述了四(4)个示例性执行脚本；前三个示例性脚本可使用甲基-敏感性限制酶执行，以及第四个执行脚本使用甲基-结合蛋白。描述了AND和OR逻辑性运算符的执行。NOT的执行是通过逆转输入序列(变量)的甲基化状态。这可以用上述的＂书写＂和＂擦去＂过程进行。

执行情况1：

编码：序列以单链DNA编码，在使序列杂交后评价“逻辑运算符”；

布尔项

AND：两条链和所有CpG位点应甲基化以具有＂真＂的真假值或者真假值为＂假＂；

OR：半甲基化或完全甲基化的DNA被处理为＂真＂，而未甲基化DNA被处理为＂假＂。

单链可以来自两个不同的已经溶解和再杂交的双链区域。例如，取父本和母本染色体然后将其溶解使其再杂交形成具有来自父本染色体的一条链和来自母本染色体的一条链的杂交体。

执行情况2：

编码：序列编码为双链DNA编码，AND和OR的运算相同，但是基于预期的运算符，不同地解释/分析读出。新序列与现存序列结合以进行合乎逻辑的命题(或电路)：

布尔项-

AND：需要序列的全部长度甲基化为＂真＂，否则为＂假＂。当然，两条链必须继续被甲基化。

OR：需要任何甲基化的区域为＂真＂，否则为＂假＂。

执行情况3：

这第三种示例性实施方式涉及上述执行情况1和2的组合，其中单链DNA表示逻辑变量，以及连接的双链DNA用于执行复杂的逻辑表达式。

执行情况4：

编码：逻辑变量编码为单链或双链DNA。使用包括甲基特异性抗体的甲基结合蛋白(或其他分离技术)，可将双链DNA分离为“结合”部分(具有甲基化DNA)和“未结合”部分(仅具有未甲基化DNA)。因此，在用甲基结合蛋白用于分离目的的示例性技术中，允许编码的序列杂交，然后使用甲基结合蛋白搜寻任何具有甲基化的DNA序列。使用PCR，可以以敏感和序列特异性方式区分序列在结合或未结合部分或两者都在。用不太复杂的混合物，可以在凝胶上看到分离。如果需要执行涉及来自人基因组的代表物的逻辑变量，那么PCR可有益地用于看到给定序列存在于哪部分。

布尔项-

AND：如果DNA序列均在“结合”部分，真假值为＂真＂。否则，评价为＂假＂。

OR：如果两条DNA序列中的一条在“结合”部分，表示至少部分所述DNA序列被甲基化，其被评价为＂真＂。如果两条DNA序列均在未结合部分，表示DNA序列未被甲基化，其被评价为＂假＂。

以下描述了根据本发明的示例性实施方式，怎样使用单链DNA(ssDNA)实现甲基化逻辑。

使用ssDNA的逻辑运算符AND

表1显示了用于逻辑性运算符AND的布尔逻辑和甲基化逻辑等价物。逻辑变量编码为通过链的杂交转化为双链DNA的单链DNA。在本发明中，A和B为杂交在一起的两条单链DNA或双链DNA上的两个不同位点。当且仅当双链DNA的两条链上均被甲基化时，杂交产物的真假值为＂真＂。可选择地，逻辑变量被编码为现在双链DNA上的两个不同位点。如果两个位点被甲基化，那么真假值为＂真.＂。存在多种待考虑的执行。在本发明的某些实施方式中，AND术语的执行可需要实验步骤以证实完全甲基化。在本发明的示例性实施方式中，完成应用HpaII的消化以使得仅完全甲基化的DNA保持完整。该限制酶对甲基化敏感，因此不能切割甲基化DNA。为了区分半甲基化与甲基化DNA，首先进行亚硫酸氢盐处理，接着使用在错配处切割的酶。可以使用亚硫酸氢盐处理以将未甲基化的C转变成U，从而在相反的链上产生与G错误配对的碱基。然后那些错误配对的碱基可以被识别错配的特异性酶切割。该方案应仅产生完整的完全甲基化的DNA。

表1、用于AND运算符的甲基化逻辑表

使用ssDNA的逻辑运算符OR

表2显示逻辑运算符OR的布尔逻辑和甲基化逻辑等价物。逻辑变量被编码为单链DNA，然后使用杂交转化为双链DNA。如果在至少一条链上双链DNA被甲基化，杂交产物的真假值等于＂真＂。可选择地，变量A和B可表示双链DNA分子上的两个不同位点。当两个位点中的一个被甲基化时，产生的真假值为＂真＂。

表2、用于OR运算符的甲基化逻辑表

如在AND的情况下，A和B为杂交在一起的两条单链DNA或双链DNA上的两个不同位点。在本发明的某些实施方式中，OR术语的执行可需要实验步骤以证实序列为半甲基化或完全甲基化。可应用MCrBC酶来切割完全甲基化或半甲基化序列。该酶的应用仅保持完整未甲基化的序列。或者，如在执行方案4中提及地，可以使用甲基结合蛋白或其他分离技术，以搜寻甲基化的任何物质。未甲基化DNA将在未结合部分中。

使用ssDNA的逻辑运算符NOT

表3显示了用于逻辑运算符NOT的布尔逻辑和甲基化逻辑等价物。逻辑变量编码为单链DNA。如果序列为甲基化，通过使用PCR，真假值被逆转，原因是在PCR过程中，甲基化标记丢失。将真假值由假变为真等价于应用设置甲基化标记的DNA甲基转移酶。

表3、用于NOT运算符的甲基化逻辑表

下面描述了具有双链DNA(dsDNA)的甲基化逻辑的示例性用途：

使用dsDNA的逻辑运算符AND

逻辑变量被编码为双链DNA。这些链可以被连接。如果和仅仅如果整个DNA序列被甲基化，连接产物的真假值为＂真＂。表4显示的用于逻辑运算符AND的布尔逻辑和甲基化逻辑相当。

表4、使用dsDNA的用于AND运算符的甲基化逻辑表

在本发明的某些实施方式中，AND术语的执行可需要实验步骤以证实完全甲基化。即使CpG二核苷酸中的单个C未甲基化，该步骤也应当能够检测未甲基化。可以使用亚硫酸氢盐处理以将未甲基化的C转变成U，从而在相反的链上产生与G错误配对的碱基。然后那些错误配对的碱基可以被识别错配的特异性酶切割。该方案应产生仅完整完全甲基化的DNA。

使用dsDNA的逻辑运行符OR

将逻辑变量编码为双链DNA然后连接。如果双链DNA至少部分甲基化，那么连接产物的真假值等于＂真＂。表5显示了使用dsDNA用于逻辑运算符OR的布尔逻辑和甲基化逻辑相当。如在AND的情况下，A和B为连接的双链DNA或者较长双链DNA序列上的两个不同的子序列。

表5、使用dsDNA的用于OR运行符的甲基化逻辑表

在本发明的某些实施方式中，OR术语的执行可需要实验步骤以证实序列是完全甲基化或部分甲基化。亚硫酸氢盐测序是能检测单一位点甲基化的方法。或者，如在执行方案4中提及地，可以使用包括甲基特异性抗体的甲基结合蛋白或其他分离技术，以搜寻甲基化的任何物质。未甲基化DNA将在未结合部分中。

使用dsDNA的逻辑运算符NOT

表6显示了用于逻辑运算符NOT的布尔逻辑和甲基化逻辑等价物。逻辑变量编码为双链DNA。如果序列为甲基化的，通过使用PCR将真假值逆转，原因是在PCR过程中，甲基化标记丢失。将真假值由假变为真等价于应用设置甲基化标记的DNA甲基转移酶。

表6、使用dsDNA的用于NOT运算符的甲基化逻辑表

为了进一步举例说明与公开的系统和方法相关的用途和优点，参考下述实施例。然而，应该理解这些实施例对本发明的范围不是限制性的，而仅仅是举例说明示例性执行和/或其实用程序：

实施例1

使p、q、r为布尔变量以及使p′、q′、r′为其各自的否定。各四个子句p OR q、p′OR q OR r′、q′OR r′、p′OR r的变量p、q和r的真假值(T/F)的赋值存在值为真吗？在这个实施例中，所述变量被编码为三个不同的双链DNA，然后将其连接在一起。这里甲基化p(Mp)位点等同p，未甲基化的p(Up)位点等同p′，Mq等同q，Uq等同q′以及Mr等同r和Ur等同r′。使用甲基化和未甲基化的双链元件(MpMqMr、MpUqMr、MpMqUr、MpUqUr等)的连接可以产生这些变量所有可能组合。大量的这些分子应当是可变的。将这些变量定义因此存在可以特异结合各变量的甲基化形式的结合蛋白。对于这些子句，为了保存p′形式，将所述DNA用于甲基结合蛋白，然后将不结合的DNA保存(仅保存未甲基化或Up形式)。为了保存p或甲基化形式，将DNA用于相同的蛋白质，但是保存结合的DNA。下面给出了各子句的详细内容。

步骤1：计算p OR q(图1所示)

将起始DNA的大量混合物分为两个罐。

在一个罐中，将混合物用于对p位点特异的甲基结合蛋白，在另一个罐中，将混合物用于对q位点特异的甲基结合蛋白。

在两种情况下，保存包含Mp或Mq(p OR q)的未结合材料。这个样品含有p OR q OR r和p OR q OR r′。

重新组合这两种结合的样品。现在这种混合物包含6种不同的双链DNA：MpUqMr、MpUqUr、UpMqMr、UpMqUr、MpMqMr和MpMqUr。

步骤2：计算p′OR q OR r′(图12所示)

将来自最后一步的DNA的混合物分成三个罐。

在一个罐中，将混合物用于对p位点特异的甲基结合蛋白并保存未结合材料。在另一个罐中，将混合物用于对q位点特异的甲基结合蛋白并保存结合材料。在第三个罐中，将混合物用于对r位点特异的甲基结合蛋白并保存未结合材料。

将三个保存的样品重新组合。这个样品现在包含MpUqUr、UpMqMr、UpMqUr、MpMqMr和MpMqUr。

步骤3：计算q′OR r′

将来自最后一步的DNA的混合物分成两个罐。

在一个罐中，将混合物用于对q位点特异的甲基结合蛋白并保存未结合材料。在另一个罐中，将混合物用于对r位点特异的甲基结合蛋白并保存未结合材料。

将两个保存的样品重新组合。现在这个样品含有MpUqUr、UpMqUr和MpMqUr。

步骤4：计算p′OR r

将来自最后一步的DNA的混合物分成两个罐。

在一个中，将混合物用于对p位点特异的甲基结合蛋白并保存未结合材料。在另一个罐中，将混合物用于对r位点特异的甲基结合蛋白并保存未结合材料。

将两个保存的样品重组。这个样品应仅含有来自甲基-p位点结合蛋白的结合材料的UpMqUr。由于来自前一步骤的所有分子含有Mr，所以来自甲基-r结合蛋白的未结合材料不产生DNA。

步骤5：读取答案

将材料进行亚硫酸氢盐处理并对得到的DNA片段测序。亚硫酸氢盐处理将未甲基化C转化成U，而对甲基化C无作用。在序列与起始材料相同时，那个位点在最终产物中甲基化。在序列不同且U被C置换时，那个位点在最终答案中未甲基化。

实施例2

使用甲基化逻辑表示逻辑式：(a OR b)AND(c′)AND d。也可以认为其作为逻辑电路。目标是知道对于哪个输入(a，b、c和d的值)逻辑电路产生＂真＂值。这里使用单链DNA表示逻辑变量。

步骤1：计算a OR b

A用一个序列编码，那么b用另一个序列编码，使它们将杂交。例如，a将用5′-ACGCGA-3′编码，那么b用5′-AAATCG-3′编码。这个DNA的杂交形式表示如下：(优选大于3个碱基重叠的a用于更好杂交)。也应当注意所有序列需要包含至少一个C使得其可被甲基化。如果需要，也可用甲基化的A。

a 5’-ACGCGA-3’

|||(链间的氢键)

b 3′-GCTAAA-5′

将包含未甲基化a(Ua)、甲基化a(Ma)、Ub和Mb的四个罐组合并产生四个不同种类的双链DNA(Ua/Ub、Ua/Mb、Ma/Ub和Ma/Mb)。

使用甲基-结合蛋白(例如，MeCP或MBD1或甲基-C的抗体)以搜寻已经杂交且同时包含甲基化C的序列。这对应于进行a OR b。

步骤2：计算c′AND d

2.1用不同的序列编码c和d，使得它们将杂交在一起，并作为具有aOR b杂交体突出端的杂交连接体(参加下文)。例如，c可以用5′-TTTGCG-3′编码，那么d用5′-ATACGC-3′编码，使得当杂交时，它们形成如下结构：(优选大于3-碱基重叠用于更好杂交)

c 5’-TTTCGC-3’

|||(链间的氢键)

d 3′-GCGATA-5′

如上所述，产生4种类型的单链DNA，Uc、Ud、Mc和Md。

2.2通过将PCR用于甲基化c罐，将NOT用于c，并将甲基转移酶用于未甲基化c罐。对于简单变量，可以将罐交换。

2.3未甲基化d和甲基化d的两个结果的杂交

2.4将AND运算符用于四个罐：亚硫酸氢盐处理，接着用破坏错配DNA的酶处理。亚硫酸氢盐处理将未甲基化的C转化成U，并且不影响甲基化的C。因此在未甲基化C与G杂交的杂交体中，接着用亚硫酸氢盐处理，将产生U-G错配而不是正常C:G碱基对。使用识别错配的双链DNA的特异性酶可以破坏错配的DNA。

步骤3：通过组合来自步骤1和2的罐和连接体，计算来自上两次计算的产物的AND。这个反应的产物具有如下的DNA序列结构：

a-c 5′-ACGCGATTTCGC-3′

|||||||||(链间的氢键)

b-d 3′-GCTAAAGCGATA-5′

用亚硫酸氢盐处理，接着用破坏错配DNA的酶处理。如上所述，亚硫酸氢盐处理将未甲基化的C转化成U，因此产生U为G的对应物的错配的DNA序列。通过该处理不能修饰甲基化C，因此在另一条链上应保持与G的正确碱基配对。然后使用特异性酶破坏错配的DNA。产生的DNA应满足复合子句：a OR b AND c′AND d。

步骤4：读取答案。对于此，将混合物分成两个罐，并用亚硫酸氢盐处理其中一个。如上所述，该处理将未甲基化C转化成U。然后对各罐中的DNA链测序。对两条链测序以找到电路中逻辑变量的真假值。任何差异是因为那个位置的未甲基化C。在这种情况下，当读取答案时，应否定位点c的状态。

在本发明的优选实施方式中，甲基化逻辑方法用于首先定义计算机模拟的子句(这等价于计算机模拟中的假想产生)，然后体外检验。使用逻辑变量可以表示一组基因，各逻辑变量表示单个基因或者一个或一组基因上的一个或多个特异性位点。基因启动子、第一外显子或任何调节区域的甲基化状态表示那个序列的真假值。样品来自对照(即，健康)和患病(例如，癌症)个体。问题与SAT问题相同：子句评价的逻辑变量(基因)的哪个值是真(对照与患病样品区分)？变量的真假值将表示负责健康对患病样品的生物标记。公开的系统和方法引入了新的和强效的寻找可以使存在的甲基化生物标记有效的方式，以及寻找新的生物标记的方式。总而言之，本发明描述了用于结合体外和计算机模拟的方法以在临床环境中有帮助的系统和方法。

本发明描述和举例说明了应用使用单链和双链DNA的执行DNA甲基化的布尔逻辑的方法和系统。此处描述的样品和方法提供了基于“甲基化逻辑”可以用于广泛范围内应用普遍DNA计算机的示例性技术/应用。这种方法比以前的方法更有力、动态和通用。在以前的方法中，总是需要存在适当的限制酶，以及最近需要甲基化酶。现有方法不可避免地限制了DNA计算的范围和能被分析的序列的类型和数目。本范例应允许潜在分析几乎任何序列，甚至与人基因组一样复杂的混合物中的一个序列。这个方法可以是用于分子诊断学的决策的重要工具。

总而言之，本发明的系统和方法提供了用于DNA计算的，特别是用于生物标记和理论计算的显著增强的技术。虽然参照示例性实施方式和其执行已经描述了本发明，本发明的系统和方法不限于这些示例性实施方式/执行。而且，如从此处的描述中对本领域技术人员显而易见的是，公开的系统和方法易于修改、改变和增强，而不背离本发明的实质和范围。因此，本发明在其范围内明确地包括这种修改、改变和增强。

Claims

1、一种使用甲基化逻辑的方法，其包括：

产生具有多个赋值变量的逻辑语句，其中所述多个变量包括甲基化变量和对应于未甲基化变量的所述甲基化变量的否定，

使混合物或样品甲基化，

逆转样品的甲基化状态；

通过一种或多种分离技术使所述混合物或样品分离以分离至少一种分离的混合物；

解码所述至少一种分离的混合物；以及

读取所述至少一种分离的混合物以使所述逻辑语句与所述解码关联。

2、根据权利要求1所述的方法，其中所述方法对于验证生物学标记和/或产生或鉴定新的生物学标记是有效的。

3、根据权利要求1所述的方法，其中所述一种或多种分离技术包括一系列测定法。

4、根据权利要求1所述的方法，其中所述读取对于验证已有的生物学标记或者产生和/或鉴定新的生物学标记是有效的。

5、根据权利要求1所述的方法，其中所述多个变量为特定基因。

6、根据权利要求1所述的方法，其中所述多个变量为一组基因。

7、根据权利要求1所述的方法，其中所述多个变量为基因上的一组位点。

8、根据权利要求1所述的方法，其中所述多个变量具有至少一个用于C-执行甲基化编码的胞嘧啶。

9、根据权利要求1所述的方法，其中所述多个变量具有至少一个用于A-执行甲基化编码的腺嘌呤。

10、根据权利要求1所述的方法，其中所述多个变量是由单链DNA编码的。

11、根据权利要求1所述的方法，其中所述多个变量是由双链DNA编码的。

12、根据权利要求1所述的方法，其中所述多个变量是由甲基结合蛋白编码的。

13、根据权利要求1所述的方法，其进一步包括产生逻辑电路。

14、用于解决一组遗传子句的系统，所述系统包括：

赋值变量，其中各变量对应于甲基化变量和所述变量的否定，所述否定对应于未甲基化变量；

使用所述甲基化和未甲基化变量在给定的逻辑子句内解决AND、OR和NOT布尔逻辑项，通过以下方式进行：

甲基化所述变量的给定混合物，

逆转样品的甲基化状态；

分离所述混合物以产生满足所述给定逻辑子句的需要的混合物。

15、根据权利要求12所述的方法，其中所述变量为特定基因。

16、根据权利要求12所述的方法，其中所述变量为一组基因。

17、根据权利要求12所述的方法，其中所述变量为基因上的一组位点。

18、根据权利要求12所述的方法，其中所述变量中的至少一个具有至少一个用于C-执行甲基化编码的胞嘧啶。

19、根据权利要求12所述的方法，其中所述变量中的至少一个具有至少一个用于A-执行甲基化编码的腺嘌呤。

20、根据权利要求12所述的方法，其中所述变量是由单链DNA编码的。

21、根据权利要求12所述的方法，其中所述变量是由双链DNA编码的。