CN1661101A - 与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法 - Google Patents

与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法 Download PDF

Info

Publication number
CN1661101A
CN1661101A CN 200410093094 CN200410093094A CN1661101A CN 1661101 A CN1661101 A CN 1661101A CN 200410093094 CN200410093094 CN 200410093094 CN 200410093094 A CN200410093094 A CN 200410093094A CN 1661101 A CN1661101 A CN 1661101A
Authority
CN
China
Prior art keywords
chip
aaa
oligonucleotide
dna
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410093094
Other languages
English (en)
Inventor
张晓东
吴凝
潘加奎
张素
胡钧
张治洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN 200410093094 priority Critical patent/CN1661101A/zh
Publication of CN1661101A publication Critical patent/CN1661101A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,本发明采用寡核苷酸芯片作为计算基质,在其上利用杂交反应来完成计算过程,然后用计算机计算法规则来读出数据,得到NP问题的解,DNA表面计算芯片上寡核苷酸序列的编码和排布遵循以下方式:将该NP问题完全数据池中的数据转化为可用0和1按序表达的方式;将NP完全问题的完全数据池转化为阵列,每个分单元代表一个数据;将阵列中的数据映射为寡核苷酸序列并排布在芯片上,每个序列成为芯片上的一个点。本发明充分利用了DNA芯片计算的高度并行性和电子计算机处理数据的快速灵活性,操作过程更为简便,不依靠酶反应过程,计算结果的假阳性率大大降低,可用于计算多种NP问题,具有通用性。

Description

与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法
技术领域
本发明涉及的是一种用于DNA芯片技术领域的制备方法,特别是一种与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法。
背景技术
1994年Adleman(Science,1994,266:1021-1024)首次以DNA序列作为信息载体,在试管中利用分子生物学试验技术解决了一个NP完全问题(七顶点的Hamilton路径问题),并指出DNA分子计算具有高信息度、高并行度的特点,使其在线性时间内能够求解像NP完全问题之类的难解问题。这些NP完全问题如果利用图灵机求解,则所需时间是指数递增的。在Adleman之后,许多学者提出了针对不同NP问题的多种的DNA计算模型,涉及SAT问题、最大团问题、最大独立集问题、图的着色问题、集合最小覆盖问题等,除NP问题以外,对DNA计算的加法、乘法等运算也提出了相应的模型。这些文献涉及的DNA计算均是在溶液体系中的计算,其核心是依照算法设计将经过编码后的DNA链作为输入分子置于试管中,在试管中经过设定的生物化学反应,如杂交、解链、切割、连接等来完成运算,并利用分子生物学技术,如聚合酶链式反应、亲和层析、克隆、分子纯化、电泳、磁珠分离、测序等技术,获取运算的中间结果或最终结果。
尽管在溶液中可以实现多种DNA计算模型,然而溶液中的反应也存在若干难以克服的问题,如中间产物分离困难、反应体系复杂、中间过程难以监控、反应的可重复性较差、与电子计算机难以实现杂合等,为了解决这些问题,需要发展DNA计算芯片及其相关算法。DNA计算芯片是指DNA并行计算的过程在DNA芯片上实现。DNA芯片分cDNA芯片和寡核苷酸芯片,cDNA芯片由点样法制作,寡核苷酸芯片通过光导原位合成法和点样法均可制作。基因芯片作为一种可寻址的、高密度的、并行的技术在基因表达谱分析、基因测序、药物筛选、基因诊断等多个领域有广泛的用途,但在DNA计算中的应用尚处于探索阶段。
2000年Wang等在美国化学协会杂志(J.Am.Chem.Soc.,2000,122(31):7435-7440)上报道了一种采用寡核苷酸芯片来实现简单的2-SAT问题的计算过程。SAT问题是一个典型的NP完全问题,该问题的表述是,给定一个布尔表达式:
F=C1∧C2∧…..∧Cn
其中Ci=v1∨v2∨….∨vk,vj为布尔变量,每个布尔变量取值为0或1,寻求F=1时的vj值.
在Wang的文章中,计算了一个简单的2-SAT问题,具体表述为
F=(X∨ Y)∧( X∨Y)
该SAT问题共有2个子句,包含2个变量X和Y,上划线表示该变量取值的相反取值,2个变量的完全数据池(即变量状态的所有组合方式)共含有4个数据。DNA芯片计算的算法为:2个变量的4种状态分别由4个序列来代表,完全数据池中的每个数据由2个变量相应状态编码的序列按序连接得到的较长的寡核苷酸链代表,在连接好的链上还需附加一个荧光标记的头部链和一个带有内切酶位点的尾部链,这些寡核苷酸链点样制成为2×2的芯片,尾部链的末端固定在芯片表面。然后在此芯片上进行计算,每个子句的计算均包括PNA杂交、链式延伸、内切酶酶切、解链四项表面操作。在第一个子句计算完成后,从图象上可以发现,不满足第一个子句的数据被从芯片表面删除,表现为荧光点缺失,接着进行第二个子句的计算,结果是又一个数据对应的荧光点从芯片表面删除,只留下两个荧光点,对应寻址就得到该问题的解。这一工作虽然使用了计算芯片,但由于算法设计中采用的编码方式为n个变量相应状态编码的序列按序连接,则变量数增加,序列的长度就增加,过长的序列合成(大于120bp)将成为一个很大的障碍,且计算过程涉及多项酶操作,在加大变量操作时会产生较大误差,另外,这种计算芯片及其计算模式只适用于SAT问题计算,不能用于其他NP问题的计算。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法。使其充分利用了DNA芯片计算的高度并行性和电子计算机处理数据的快速灵活性,操作过程更为简便,不依靠酶反应过程,计算结果的假阳性率大大降低,可用于计算多种NP问题,具有通用性。
本发明是通过以下技术方案实现的,本发明采用寡核苷酸芯片作为计算基质,在其上利用杂交反应来完成计算过程,然后用电子计算机依算法规则来读出数据,得到NP问题的解,DNA表面计算芯片上寡核苷酸序列的编码和排布遵循以下方式:
(1)分析NP完全问题,制订一种映射策略,将该NP问题完全数据池中的数据转化为可用0和1按序表达的方式;
(2)将NP完全问题的完全数据池转化为阵列,n个变量的NP完全问题,其完全数据池包含2n个数据,将这些数据制作成阵列,阵列的每个分单元由n个变量的取值0或1按序组成,每个分单元代表一个数据;
(3)将阵列中的数据映射为寡核苷酸序列并排布在芯片上,映射关系为:
①n个变量,每个变量有0和1两种状态,则共有2n种状态,分别一一对应为2n种不同的寡核苷酸序列;
②阵列中每个分单元由n个变量取值的0或1按序构成,则按序索引①中规定的对应关系,从而将每个分单元对应于依序排列的n个寡核苷酸序列,每个序列成为芯片上的一个点。
本发明提供的与电子计算机计算杂合的用于解NP数学问题的DNA表面计算芯片是寡核苷酸芯片,可以通过光导原位合成技术,也可以通过点样技术来制作。寡核苷酸芯片作为计算基质,在其上利用杂交反应来完成计算过程,然后用电子计算机依算法规则来读出数据,得到NP问题的解。
所述的DNA表面计算过程为:根据NP完全问题的类型,设计相应的DNA芯片计算算法,将预先合成的有标记的寡核苷酸链依据芯片算法进行混合,与DNA计算芯片发生杂交反应,得到杂交图像。输出的杂交图像可以是荧光图像、同位素显影图像、化学发光图像等等,也可以是电芯片的电学信号。用于反应的有标记的寡核苷酸链其标记物是荧光、同位素或者化学发光反应的底物。在计算过程中,可以用多个相同的芯片同时进行各个环节的计算,也可以加入解链步骤重复使用同一张芯片进行计算。针对n个变量设计的芯片不仅适合n个变量问题的计算,也适合所有小于n个变量的问题的计算。寡核苷酸芯片通过点样技术或通过光导原位合成技术来制作。
所述的用计算机计算法规则来读出数据,其读出过程为:根据NP完全问题的DNA芯片计算算法,在电子计算机上编写专用的图像处理和计算软件,通用的编写原则为对杂交图像进行信号采集处理,依不同问题的算法输出成相应的矩阵,然后再对矩阵进行计算,最后寻址,得到该类NP问题的全解。
本发明具有突出的实质性特点和显著进步,本发明DNA并行计算的过程在芯片上完成,以寡核苷酸芯片作为计算基质,在其上利用杂交反应来完成计算过程,然后用电子计算机依算法规则来读出数据,得到NP问题的解。与溶液中的DNA计算和已发表的表面DNA计算方法相比,本发明充分利用了DNA芯片计算的高度并行性和电子计算机处理数据的快速灵活性,使DNA计算的操作过程更为简便,不依靠酶反应过程,计算结果的假阳性率大大降低。DNA计算芯片制成后,一方面可用于计算多种NP问题,如SAT问题、最大团问题、最大顶点分割问题等,具有通用性,另一方面,针对n个变量设计的芯片不仅适合n个变量问题的计算,也适合所有小于n个变量的问题的计算,也具有通用性。
附图说明
图1本发明结构示意图
图2a-2d实施例1中DNA表面计算芯片杂交图像
图3a实施例2中最大团问题给定图
图3b实施例2中最大团问题给定图的补图
图4a-4e实施例2中DNA表面计算芯片杂交图像
图5实施例3中最大顶点分割问题给定图
图6a-6f实施例3中DNA表面计算芯片杂交图像
具体实施方式
实施例1:
与电子计算机计算杂合的用于解SAT问题的DNA表面计算芯片
本发明以4变量的一个SAT问题为例,该问题描述为:
F=(w∨x∨y)∧(w∨ y∨z)∧( x∨y)∧( w∨ y)
求F=1时的四个变量的值
DNA表面计算芯片设计及与电子计算机杂合计算此问题的步骤描述如下:
(1)生成DNA表面计算芯片
①该SAT问题包含4个变量(w,x,y,z)和4个子句,每个变量取值为1或0,则该问题的完全数据池含24=16个数据,按wxyz顺序排列,16个数据如下:0000,0001,0010,0011,0100,0101,0110,0111,1000,1001,1010,1011,1100,1101,1110,1111
将四个变量在阵列中的每个分单元做如下位置对应,以便寻址:
    w  xy  z
将完全数据池排布为如下阵列
    0  00  0     0  00  1     0  01  0     0  01  1
    0  10  0     0  10  1     0  11  0     0  11  1
    1  00  0     1  00  1     1  01  0     1  01  1
    1  10  0     1  10  1     1  11  0     1  11  1
②4个变量的8种状态采用8种不同的寡核苷酸序列进行编码,相应的配对探针可采用荧光、同位素、化学发光底物等进行标记。例如可采取如下编码:
    变量取值   固定于芯片上的序列(5’-3’)   完全配对探针(5’-3’)
    W=1   NH2-AAA AAA AAA AAA AAA gcagtatccaca   FAM-tgtggatactgc
    W=0   NH2-AAA AAA AAA AAA AAA tgtggatactgc   FAM-gcagtatccaca
    X=1   NH2-AAA AAA AAA AAA AAA tgaagcgcgtta   FAM-taacgcgcttca
    X=0   NH2-AAA AAA AAA AAA AAA taacgcgcttca   FAM-tgaagcgcgtta
    Y=1   NH2-AAA AAA AAA AAA AAA cagactagcctt   FAM-aaggctagtctg
    Y=0   NH2-AAA AAA AAA AAA AAA aaggctagtctg   FAM-cagactagcctt
    Z=1   NH2-AAA AAA AAA AAA AAA aagacgggaaac   FAM-gtttcccgtctt
    Z=0   NH2-AAA AAA AAA AAA AAA gtttcccgtctt   FAM-aagacgggaaac
将以上SAT问题编码的寡核苷酸链依照以上阵列形式点样于基片上,得到一个8*8的点阵,这就是用于此4变量SAT问题计算的DNA表面计算芯片。
(2)对SAT问题设计相应的DNA芯片计算算法如下:
a.给定已制备好的可明确寻址的寡核苷酸芯片,以满足第一个子句的所有寡核苷酸序列的互补链进行杂交,采集到第一幅图像;然后进行解链,再用满足第二个子句的所有寡核苷酸序列的互补链进行杂交,采集到第二幅图像;进行解链-杂交循环,直到所有子句的杂交图像都采集到。
b.对所有的杂交图像利用专用图像处理计算软件进行处理,对SAT问题,专用图像处理计算软件的编程原则为:首先依据阵列形式将图像划分为同样的矩阵方格,然后对每个方格做杂交亮点检测,方格中只要有杂交亮点,不管亮点数目有多少,均对此方格输出值为1,如果方格中没有杂交亮点,则输出值为0,这样每幅杂交图像将抽象为一个由0和1组成的矩阵。将所有抽象出的矩阵相加得到一个最终矩阵,该最终矩阵中如果存在等于SAT子句数目的数值,则此SAT问题有解,对应寻址,可以得到相应的全部解。
(3)采用以上算法对以上4变量的SAT问题进行DNA表面计算
从该问题中可以直接看出,满足第1子句的变量赋值为w=1或x=1或y=1;满足第1子句的变量赋值为w=1、y=0、z=1;满足第3子句的变量赋值为x=0、y=1;满足第4子句的变量赋值为w=0、y=0。依据算法,依次对芯片采用相应的完全配对探针进行杂交,得到四幅杂交图像,见附图2a-2d,分别对应第1、2、3、4子句。运用以上算法采用电子计算机对杂交图像进行信号处理,分别得到4个矩阵数据:
  0 0 1 11 1 1 11 1 1 11 1 1 1
  1 1 0 11 1 0 11 1 1 11 1 1 1
  1 1 1 10 0 1 11 1 1 10 0 1 1
  1 1 1 11 1 1 11 1 0 01 1 0 0
以上四个矩阵相加,得到一个最终矩阵,如:
  3 3 3 43 3 3 44 4 3 33 3 3 3
由于子句数目为4,以上矩阵中有4个位置的数值为4,则此4个位置经寻址所代表的变量赋值即为本问题的解,如:
  w x  y  z0 0  1  10 1  1  11 0  0  01 0  0  1
实施例2:
与电子计算机计算杂合的用于解图的最大团问题的DNA表面计算芯片
一个图G的团是图G的一个顶点子集S,使得S中任意两顶点之间都有边相连,若对G的任意其它团S′都有|S|≥|S′|,则称S是G的最大团。图的最大团问题是一个NP完全问题。
本发明以一个6顶点的给定图为例。给定图如附图3a,人工画出它的补图如附图3b。
DNA表面计算芯片设计及与电子计算机杂合计算此问题的步骤描述如下:
(1)生成DNA表面计算芯片
①该最大团问题包含6个顶点,首先定义一种完全数据池的映射策略:
a.顶点分别用A1、A2、A3、A4、A5、A6表示。
b.定义任一顶点Ai有两种赋值,当该顶点在图的顶点子集中时,则取值为1,否则取值为0。
c.将顶点子集映射为一个由0和1组成的数据,依次为A1A2A3A4A5A6。例如:顶点集合{A1,A2,A5}映射为数据110010。
②在以上的映射策略下,6个顶点的图的完全数据池含26=64个数据。
将6个顶点在阵列中的每个分单元做如下位置对应,以便寻址:
A1 A2 A3A4 A5 A6
将完全数据池排布为如下阵列:
 0  0  00  0  0  0  0  00  0  1  0  0  00  1  0  0  0  00  1  1  0  0  01  0  0  0  0  01  0  1  0  0  01  1  0  0  0  01  1  1
 0  0  10  0  0  0  0  10  0  1  0  0  10  1  0  0  0  10  1  1  0  0  11  0  0  0  0  11  0  1  0  0  11  1  0  0  0  11  1  1
 0  1  00  0  0  0  1  00  0  1  0  1  00  1  0  0  1  00  1  1  0  1  01  0  0  0  1  01  0  1  0  1  01  1  0  0  1  01  1  1
 0  1  10  0  0  0  1  10  0  1  0  1  10  1  0  0  1  10  1  1  0  1  11  0  0  0  1  11  0  1  0  1  11  1  0  0  1  11  1  1
 1  0  00  0  0  1  0  00  0  1  1  0  00  1  0  1  0  00  1  1  1  0  01  0  0  1  0  01  0  1  1  0  01  1  0  1  0  01  1  1
 1  0  10  0  0  1  0  10  0  1  1  0  10  1  0  1  0  10  1  1  1  0  11  0  0  1  0  11  0  1  1  0  11  1  0  1  0  11  1  1
 1  1  00  0  0  1  1  00  0  1  1  1  00  1  0  1  1  00  1  1  1  1  01  0  0  1  1  01  0  1  1  1  01  1  0  1  1  01  1  1
 1  1  10  0  0  1  1  10  0  1  1  1  10  1  0  1  1  10  1  1  1  1  11  0  0  1  1  11  0  1  1  1  11  1  0  1  1  11  1  1
③6个顶点的12种状态采用12种不同的寡核苷酸序列进行编码,Ai=1相应的配对探针可采用荧光、同位素、化学发光底物等进行标记。例如可采取如下编码,其中标记物FAM为绿色荧光染料。
变量取值 固定于芯片上的序列(5’-3’)  完全配对探针(5’-3’)
  A1=0  NH2-AAA AAA AAA AAA AAA tgaagcgcgtta
  A1=1  NH2-AAA AAA AAA AAA AAA taacgcgcttca  FAM-tgaagcgcgtta
  A2=0  NH2-AAA AAA AAA AAA AAA cagactagcctt
  A2=1  NH2-AAA AAA AAA AAA AAA aaggctagtctg  FAM-cagactagcctt
  A3=0  NH2-AAA AAA AAA AAA AAA aagacgggaaac
  A3=1  NH2-AAA AAA AAA AAA AAA gtttcccgtctt  FAM-aagacgggaaac
  A4=0  NH2-AAA AAA AAA AAA AAA gcagtatccaca
  A4=1  NH2-AAA AAA AAA AAA AAA tgtggatactgc  FAM-gcagtatccaca
  A5=0  NH2-AAA AAA AAA AAA AAA aggaactgagct
  A5=1  NH2-AAA AAA AAA AAA AAA agctcagttcct  FAM-aggaactgagct
  A6=0  NH2-AAA AAA AAA AAA AAA ctctgattcgtc
  A6=1  NH2-AAA AAA AAA AAA AAA gacgaatcagag  FAM-ctctgattcgtc
将以上最大团问题编码的寡核苷酸链依照以上阵列形式点样于基片上,得到一个24*16的点阵,这就是用于此6顶点最大团问题计算的DNA表面计算芯片。
(2)对最大团问题设计相应的DNA芯片计算算法如下
a.给定已制备好的可明确寻址的寡核苷酸芯片,以补图的第一个集合的所有寡核苷酸序列的互补链进行杂交,采集到第一幅图像;然后进行解链,再用补图的第二个集合的所有寡核苷酸序列的互补链进行杂交,采集到第二幅图像;进行解链-杂交循环,直到所有补图集合的杂交图像都采集到。最后采用所有顶点赋值为1的序列进行杂交,得到最后一张图像。
b.对所有的杂交图像利用专用图像处理计算软件进行处理,对最大团问题,专用图像处理计算软件的编程原则为:对补图图像,首先依据阵列构成将图像划分为相同的矩阵方格,然后对每个方格做杂交亮点检测,当方格中有两个杂交亮点时输出值为0,否则输出值为1,这样每幅杂交图像将抽象为一个由0和1组成的矩阵。将所有抽象出的矩阵对应位置相乘得到一个矩阵A。对最后一张图像,也划分为同样的矩阵方格,然后对每个方格做杂交亮点检测,输出方格中亮点数目,形成一个矩阵B。将矩阵A与矩阵B对应位置相乘,得到矩阵C,则矩阵C中的最大值寻址所得相应的顶点集合即为最大团问题的解。
(3)采用以上算法对以上6个顶点给定图的最大团问题进行DNA表面计算
以上述6顶点的给定图的的补图来筛选该数据池。补图中有四条连线,分别对应集合:{A1,A3}{A1,A5}{A5,A6}{A2,A6}
分别以补图的四个集合进行筛选,以(A1=1、A3=1)(A1=1、A5=1)(A5=1、A6=1)(A2=1、A6=1)分别对应的完全配对探针进行杂交,得到四幅杂交图像,见图4a-4d,利用电子计算机运用以上算法对杂交图像进行信号处理,得到的矩阵数据分别如:
    1 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 10 0 0 0 0 0 0 01 1 1 1 1 1 1 10 0 0 0 0 0 0 0
    1 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 0 0 1 1 0 01 1 0 0 1 1 0 01 1 0 0 1 1 0 01 1 0 0 1 1 0 0
    1 1 1 0 1 1 1 01 1 1 0 1 1 1 01 1 1 0 1 1 1 01 1 1 0 1 1 1 01 1 1 0 1 1 1 01 1 1 0 1 1 1 01 1 1 0 1 1 1 01 1 1 0 1 1 1 0
    1 1 1 1 1 1 1 11 1 1 1 1 1 1 11 0 1 0 1 0 1 01 0 1 0 1 0 1 01 1 1 1 1 1 1 11 1 1 1 1 1 1 11 0 1 0 1 0 1 01 0 1 0 1 0 1 0
以上四个矩阵对应位置相乘,得到一个新矩阵A,如:
  1 1 0 0 1 1 0 00 0 0 0 0 0 0 01 0 1 0 1 0 1 01 0 1 0 1 0 1 01 0 0 0 1 0 0 00 0 0 0 0 0 0 01 1 1 0 1 1 1 01 1 1 0 1 1 1 0
采用所有顶点赋值为1的序列进行杂交,即以A1=1、A2=1、A3=1、A4=1、A4=1、A5=1、A6=1的六个完全配对探针进行杂交,得到杂交图像,见附图4e,采用电子计算机依以上算法对杂交图像进行信号处理,得到的矩阵B。
  0 1 1 2 1 2 2 31 2 2 3 2 3 3 41 2 2 3 2 3 3 42 3 3 4 3 4 4 51 2 2 3 2 3 3 42 3 3 4 3 4 4 52 3 3 4 3 4 4 53 4 4 5 4 5 5 6
将矩阵A与矩阵B对应位置相乘,得到矩阵C,如:
  0 1 1 0 1 2 2 01 2 2 0 2 3 3 01 0 2 0 2 0 3 02 0 3 0 3 0 4 01 2 0 0 2 3 0 00 0 0 0 0 0 0 02 0 0 0 3 0 0 00 0 0 0 0 0 0 0
矩阵C中的最大值为4,寻址对应于完全数据池中的数据为011110,即给定图的最大团为集合:{A2,A3,A4,A5}
实施例3:
与电子计算机计算杂合的用于解图的最大顶点分割问题的DNA表面计算芯片。一个图的最大顶点分割问题是,给定一个图G,存在图G的顶点子集S,S中的任意一个顶点与该子集外的顶点之间连接线的总数目为最大,则此顶点子集即为给定图G的最大顶点分割。这也是一个NP完全问题。
本发明以一个6个顶点的给定图为例,给定图如附图5。
DNA计算芯片计算此问题的模型及步骤如下:
(1)生成DNA表面计算芯片
①该最大顶点分割问题包含6个顶点,首先定义一种完全数据池的映射策略:
a 设定Ai有两种赋值,当该顶点在顶点子集中时,则取值为1,否则取值为0。
b.将顶点子集映射为一个由0和1组成的数据,依次为A1A2A3A4A5A6。
例如:顶点子集{A1,A2,A5}映射为数据110010。
②在以上的映射策略下,6个顶点的图的完全数据池含26=64个数据。将6个顶点在矩阵中的每个分单元做如下位置对应,以便寻址:
A1  A2  A3A4  A5  A6
设定完全数据池排布为如下阵列:
 0  0  00  0  0  0  0  00  0  1  0  0  00  1  0  0  0  00  1  1  0  0  01  0  0  0  0  01  0  1  0  0  01  1  0  0  0  01  1  1
 0  0  10  0  0  0  0  10  0  1  0  0  10  1  0  0  0  10  1  1  0  0  11  0  0  0  0  11  0  1  0  0  11  1  0  0  0  11  1  1
 0  1  00  0  0  0  1  00  0  1  0  1  00  1  0  0  1  00  1  1  0  1  01  0  0  0  1  01  0  1  0  1  01  1  0  0  1  01  1  1
 0  1  1  0  1  1  0  1  1  0  1  1  0  1  1  0  1  1  0  1  1  0  1  1
  0  0  0   0  0  1   0  1  0   0  1  1   1  0  0   1  0  1   1  1  0   1  1  1
  1  0  00  0  0   1  0  00  0  1   1  0  00  1  0   1  0  00  1  1   1  0  01  0  0   1  0  01  0  1   1  0  01  1  0   1  0  01  1  1
  1  0  10  0  0   1  0  10  0  1   1  0  10  1  0   1  0  10  1  1   1  0  11  0  0   1  0  11  0  1   1  0  11  1  0   1  0  11  1  1
  1  1  00  0  0   1  1  00  0  1   1  1  00  1  0   1  1  00  1  1   1  1  01  0  0   1  1  01  0  1   1  1  01  1  0   1  1  01  1  1
  1  1  10  0  0   1  1  10  0  1   1  1  10  1  0   1  1  10  1  1   1  1  11  0  0   1  1  11  0  1   1  1  11  1  0   1  1  11  1  1
③6个顶点的12种状态采用采用12种不同的寡核苷酸序列进行编码,相应的配对探针可采用荧光、同位素、化学发光底物等进行标记。例如当Ai=1时,配对探针采用TAMRA(红色荧光染料)标记,当Ai=0时,配对探针采用FAM(绿色荧光染料)标记。
  变量取值     固定于芯片上的序列(5’-3’)     完全配对探针(5’-3’)
  A1=1     NH2-AAA AAA AAA AAA AAA     TAMRA-taacgcgcttca
  A1=0     NH2-AAA AAA AAA AAA AAA     FAM-tgaagcgcgtta
  A2=1     NH2-AAA AAA AAA AAA AAA     TAMRA-aaggctagtctg
  A2=0     NH2-AAA AAA AAA AAA AAA     FAM-cagactagcctt
  A3=1     NH2-AAA AAA AAA AAA AAA     TAMRA-gtttcccgtctt
  A3=0     NH2-AAA AAA AAA AAA AAA     FAM-aagacgggaaac
  A4=1     NH2-AAA AAA AAA AAA AAA     TAMRA-tgtggatactgc
  A4=0     NH2-AAA AAA AAA AAA AAA     FAM-gcagtatccaca
  A5=1     NH2-AAA AAA AAA AAA AAA     TAMRA-agctcagttcct
  A5=0     NH2-AAA AAA AAA AAA AAA     FAM-aggaactgagct
  A6=1     NH2-AAA AAA AAA AAA AAA     TAMRA-gacgaatcagag
  A6=0     NH2-AAA AAA AAA AAA AAA     FAM-ctctgattcgtc
将以上最大顶点分割问题编码的寡核苷酸链依照以上阵列形式点样于基片上,得到一个24*16的点阵,这就是用于此6顶点最大团问题计算的DNA表面计算芯片。可以看出,尽管需要解决的问题不同,所采用的DNA计算芯片可以与图的最大团问题所采用的芯片完全相同,不同的是计算过程和数据读出过程。
(2)对最大顶点分割问题设计的相应DNA芯片计算算法如下:
a.对每个顶点进行筛选。对给定图,先给第一个顶点赋值为1,将在给定图中与该顶点有连接线的其他顶点赋值为0,将所对应的配对探针混合后与计算芯片杂交,得到针对这一顶点的双色杂交图像;然后进行解链,再用第二个顶点的相应配对探针进行杂交,采集到第二幅双色图像;进行解链-杂交循环,直到所有顶点的双色杂交图像都采集到。
b.对所有的杂交图像利用专用图像处理计算软件进行处理,对最大顶点分割问题,专用图像处理计算软件的编程原则为:对每一幅双色杂交图像,首先依据阵列形式将图像划分为矩阵方格,然后对每个方格做杂交亮点检测,先检测方格中的红色杂交亮点(TAMPA显色),若有则输出值为1,否则输出值为0,这样得到一个由0和1组成的矩阵,再检测方格中的绿色杂交亮点(FAM显色),输出方格中绿色亮点数目,形成另一个矩阵,对每幅杂交图像都将得到两个矩阵,将两个矩阵对位相乘,就得到一个顶点的矩阵。最后将所有顶点抽象出的矩阵相加得到一个终矩阵,这个终矩阵中的最大值寻址所得相应的顶点集合即为最大顶点分割问题的解。
(3)采用以上算法对6个顶点给定图的最大顶点分割问题进行DNA表面计算
对第一个顶点A1进行筛选,A1与A2、A6之间有连线,因此对芯片采用A1=1,A2=0,A6=0相对应的三个完全配对探针进行杂交,得到杂交图像,见附图6a,在本说明书中,由于采用的是灰度图像,图像中较暗的点为红色点,较亮的点为绿色点。运用以上算法对杂交图像进行信号处理,得到的矩阵数据如下:
红色点抽象出矩阵  绿色点抽象出矩阵  两者对应位置相乘,得到矩阵A1
0 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 01 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1 1 1
 2 1 2 1 2 1 2 12 1 2 1 2 1 2 11 0 1 0 1 0 1 01 0 1 0 1 0 1 02 1 2 1 2 1 2 12 1 2 1 2 1 2 11 0 1 0 1 0 1 01 0 1 0 1 0 1 0
 0 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 02 1 2 1 2 1 2 12 1 2 1 2 1 2 11 0 1 0 1 0 1 01 0 1 0 1 0 1 0
同上处理顶点A2,取A2=1,A1=0、A3=0、A6=0进行杂交,杂交图像见附图6b,运用以上算法对杂交图像进行信号处理,得到的矩阵数据如下:
红色点抽象出矩阵    绿色点抽象出矩阵    两者对应位置相乘,得到矩阵A2
 0 0 0 0 0 0 0 00 0 0 0 0 0 0 01 1 1 1 1 1 1 11 1 1 1 1 1 1 10 0 0 0 0 0 0 00 0 0 0 0 0 0 01 1 1 1 1 1 1 11 1 1 1 1 1 1 1
 3 2 3 2 3 2 3 22 1 2 1 2 1 2 13 2 3 2 3 2 3 22 1 2 1 2 1 2 12 1 2 1 2 1 2 11 0 1 0 1 0 1 02 1 2 1 2 1 2 11 0 1 0 1 0 1 0
 0 0 0 0 0 0 0 00 0 0 0 0 0 0 03 2 3 2 3 2 3 22 1 2 1 2 1 2 10 0 0 0 0 0 0 00 0 0 0 0 0 0 02 1 2 1 2 1 2 11 0 1 0 1 0 1 0
同上处理顶点A3,取A3=1,A2=0、A4=0、A5=0、A6=0进行杂交,杂交图像见附图6c,运用以上算法对杂交图像进行信号处理,得到的矩阵数据如下:
红色点抽象出矩阵  绿色点抽象出矩阵  两者对应位置相乘,得到矩阵A3
 0 0 0 0 0 0 0 01 1 1 1 1 1 1 10 0 0 0 0 0 0 01 1 1 1 1 1 1 10 0 0 0 0 0 0 01 1 1 1 1 1 1 10 0 0 0 0 0 0 01 1 1 1 1 1 1 1
 4 3 3 2 3 2 2 14 3 3 2 3 2 2 13 2 2 1 2 1 1 03 2 2 1 2 1 1 04 3 3 2 3 2 2 14 3 3 2 3 2 2 13 2 2 1 2 1 1 03 2 2 1 2 1 1 0
 0 0 0 0 0 0 0 04 3 3 2 3 2 2 10 0 0 0 0 0 0 03 2 2 1 2 1 1 00 0 0 0 0 0 0 04 3 3 2 3 2 2 10 0 0 0 0 0 0 03 2 2 1 2 1 1 0
同上处理顶点A4,取A4=1,A3=0、A5=0、A6=0进行杂交,杂交图像见附图6d,运用以上算法对杂交图像进行信号处理,得到的矩阵数据如下:
红色点抽象出矩阵  绿色点抽象出矩阵  两者对应位置相乘,得到矩阵A4
 0 0 0 0 1 1 1 10 0 0 0 1 1 1 10 0 0 0 1 1 1 10 0 0 0 1 1 1 10 0 0 0 1 1 1 10 0 0 0 1 1 1 10 0 0 0 1 1 1 10 0 0 0 1 1 1 1
 3 2 2 1 3 2 2 12 1 1 0 2 1 1 03 2 2 1 3 2 2 12 1 1 0 2 1 1 03 2 2 1 3 2 2 12 1 1 0 2 1 1 03 2 2 1 3 2 2 12 1 1 0 2 1 1 0
 0 0 0 0 3 2 2 10 0 0 0 2 1 1 00 0 0 0 3 2 2 10 0 0 0 2 1 1 00 0 0 0 3 2 2 10 0 0 0 2 1 1 00 0 0 0 3 2 2 10 0 0 0 2 1 1 0
同上处理顶点A5,取A5=1,A3=0、A4=0、A6=0进行杂交,杂交图像见附图6e,运用以上算法对杂交图像进行信号处理,得到的矩阵数据如下:
红色点抽象出矩阵  绿色点抽象出矩阵  两者对应位置相乘,得到矩阵A5
 0 0 1 1 0 0 1 10 0 1 1 0 0 1 10 0 1 1 0 0 1 10 0 1 1 0 0 1 10 0 1 1 0 0 1 10 0 1 1 0 0 1 10 0 1 1 0 0 1 10 0 1 1 0 0 1 1
 3 2 3 2 2 1 2 12 1 2 1 1 0 1 03 2 3 2 2 1 2 12 1 2 1 1 0 1 03 2 3 2 2 1 2 12 1 2 1 1 0 1 03 2 3 2 2 1 2 12 1 2 1 1 0 1 0
 0 0 3 2 0 0 2 10 0 2 1 0 0 1 00 0 3 2 0 0 2 10 0 2 1 0 0 1 00 0 3 2 0 0 2 10 0 2 1 0 0 1 00 0 3 2 0 0 2 10 0 2 1 0 0 1 0
同上,处理顶点A6,取A6=1,A1=0、A2=0、A3=0、A4=0、A5=0进行杂交,杂交图像见附图6f,运用以上算法对杂交图像进行信号处理,得到的矩阵数据如下:
红色点抽象出矩阵  绿色点抽象出矩阵  两者对应位置相乘,得到矩阵A6
 0 1 0 1 0 1 0 10 1 0 1 0 1 0 10 1 0 1 0 1 0 10 1 0 1 0 1 0 10 1 0 1 0 1 0 10 1 0 1 0 1 0 10 1 0 1 0 1 0 10 1 0 1 0 1 0 1
 5 5 4 4 4 4 3 34 4 3 3 3 3 2 24 4 3 3 3 3 2 23 3 2 2 2 2 1 14 4 3 3 3 3 2 23 3 2 2 2 2 1 13 3 2 2 2 2 1 12 2 1 1 1 1 0 0
 0 5 0 4 0 4 0 30 4 0 3 0 3 0 20 4 0 3 0 3 0 20 3 0 2 0 2 0 10 4 0 3 0 3 0 20 3 0 2 0 2 0 10 3 0 2 0 2 0 10 2 0 1 0 1 0 0
将所得的6个顶点的矩阵A1、A2、A3、A4、A5、A6相加,得到终矩阵如下:
 0 5 3 6 3 6 4 54 7 5 6 5 6 4 33 6 6 7 6 7 7 65 6 6 5 6 5 5 22 5 5 6 5 6 6 56 7 7 6 7 6 6 33 4 6 5 6 5 7 45 4 6 3 6 3 5 0
该终矩阵中最大值为7,即最大分割后的边数为7,寻址得到满足给定6顶点图的最大顶点分割问题的集合共8个:
 A1 A2 A3 A4 A5 A61  0  1  0  0  11  0  1  0  1  01  0  1  1  0  00  1  0  0  1  10  1  0  1  0  10  1  0  1  1  01  1  0  1  1  00  0  1  0  0  1
          {A1,A3,A6}{A1,A3,A5}{A1,A3,A4}
即解为:
          {A2,A5,A6}{A2,A4,A6}{A2,A4,A5}
          {A1,A2,A4,A5}{A3,A6}

Claims (8)

1、一种与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征在于,采用寡核苷酸芯片作为计算基质,在其上利用杂交反应来完成计算过程,然后用计算机计算法规则来读出数据,得到NP问题的解,DNA表面计算芯片上寡核苷酸序列的编码和排布遵循以下方式:
(1)分析NP完全问题,制订一种映射策略,将该NP问题完全数据池中的数据转化为可用0和1按序表达的方式;
(2)将NP完全问题的完全数据池转化为阵列,n个变量的NP完全问题,其完全数据池包含2n个数据,将这些数据制作成阵列,阵列的每个分单元由n个变量的取值0或1按序组成,每个分单元代表一个数据;
(3)将阵列中的数据映射为寡核苷酸序列并排布在芯片上,映射关系为:
①n个变量,每个变量有0和1两种状态,则共有2n种状态,分别一一对应为2n种不同的寡核苷酸序列;
②阵列中每个分单元由n个变量取值的0或1按序构成,则按序索引①中规定的对应关系,从而将每个分单元对应于依序排列的n个寡核苷酸序列,每个序列成为芯片上的一个点。
2、根据权利要求1所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,所述的DNA表面计算,其过程为:根据NP完全问题的类型,设计相应的DNA芯片计算算法,将预先合成的有标记的寡核苷酸链依据芯片算法进行混合,与DNA计算芯片发生杂交反应,得到杂交图像。
3、根据权利要求2所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,用于反应的有标记的寡核苷酸链其标记物是荧光、同位素或者化学发光反应的底物。
4、根据权利要求2所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,输出的杂交图像是荧光图像、同位素显影图像或者化学发光图像,或者是是电芯片的电学信号。
5、根据权利要求1所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,所述的用计算机计算法规则来读出数据,其读出过程为:根据NP完全问题的DNA芯片计算算法,在电子计算机上编写专用的图像处理和计算软件,通用的编写原则为对杂交图像进行信号采集处理,依不同问题的算法输出成相应的矩阵,然后再对矩阵进行计算,最后寻址,得到该类NP问题的全解。
6、根据权利要求1或者5所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,在计算过程中,用多个相同的芯片同时进行各个环节的计算,或者加入解链步骤重复使用同一张芯片进行计算。
7、根据权利要求1所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,针对n个变量设计的芯片不仅适合n个变量问题的计算,还适合所有小于n个变量的问题的计算。
8、根据权利要求1所述的与计算机杂合的DNA表面计算用寡核苷酸芯片的制备方法,其特征是,寡核苷酸芯片通过点样技术或通过光导原位合成技术来制作。
CN 200410093094 2004-12-16 2004-12-16 与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法 Pending CN1661101A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410093094 CN1661101A (zh) 2004-12-16 2004-12-16 与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410093094 CN1661101A (zh) 2004-12-16 2004-12-16 与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法

Publications (1)

Publication Number Publication Date
CN1661101A true CN1661101A (zh) 2005-08-31

Family

ID=35010647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410093094 Pending CN1661101A (zh) 2004-12-16 2004-12-16 与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法

Country Status (1)

Country Link
CN (1) CN1661101A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101680872B (zh) * 2007-04-13 2015-05-13 塞昆纳姆股份有限公司 序列比较分析方法和系统
CN105074734A (zh) * 2013-01-11 2015-11-18 雷普索尔公司 化学操作的图灵机
CN106355251A (zh) * 2016-04-29 2017-01-25 北京大学 一种数据处理装置及数据处理方法
CN111420718A (zh) * 2020-04-01 2020-07-17 安徽大学 一种求解最小集合覆盖问题的微流控芯片及其dna计算方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101680872B (zh) * 2007-04-13 2015-05-13 塞昆纳姆股份有限公司 序列比较分析方法和系统
CN105074734A (zh) * 2013-01-11 2015-11-18 雷普索尔公司 化学操作的图灵机
CN105074734B (zh) * 2013-01-11 2018-01-23 雷普索尔公司 化学操作的图灵机
CN106355251A (zh) * 2016-04-29 2017-01-25 北京大学 一种数据处理装置及数据处理方法
CN106355251B (zh) * 2016-04-29 2018-10-12 北京大学 一种数据处理装置及数据处理方法
CN111420718A (zh) * 2020-04-01 2020-07-17 安徽大学 一种求解最小集合覆盖问题的微流控芯片及其dna计算方法

Similar Documents

Publication Publication Date Title
EP2126766A2 (en) Image data efficient genetic sequencing method and system
US20210265009A1 (en) Artificial Intelligence-Based Base Calling of Index Sequences
WO2021168360A1 (en) Bus network for artificial intelligence-based base caller
CN1661101A (zh) 与计算机杂合的dna表面计算用寡核苷酸芯片的制备方法
CN1731500A (zh) 颜色转换方法以及电路
CN1547159A (zh) 用于分析数字图像纹理结构的方法
WO2022047038A1 (en) Detecting and filtering clusters based on artificial intelligence-predicted base calls
CN1720665A (zh) 快闪型模数转换器中电压阶跃的非线性分布
US5618672A (en) Method for analyzing partial gene sequences
CN1674033A (zh) 一种一维条码解码方法
CN1366262A (zh) 利用空间相干性设定主色的方法
CN1146823C (zh) 文本打印设备
CN114854733B (zh) 一种用于构建凡纳滨对虾dna指纹图谱的微卫星标记引物组合以及应用和方法
CN1652133A (zh) 钢中非金属夹杂物多国标准检测结果的转换方法
CN1191517C (zh) 提高led显示屏显示品质的方法
CN1959737A (zh) 一种图像格式转换方法、图像处理方法与系统
Karim et al. A review of image analysis techniques for gene spot identification in cDNA Microarray images
CN1190754C (zh) 基于子空间分解的高效数字图像大尺度放大方法
CN1567726A (zh) 逼近理想化信噪比的方法和置换式a/d及d/a转换器
CN101064006A (zh) 图像自动定向的方法及装置
CN1482539A (zh) 全中文计算机编程语言
CN1815448A (zh) 一种高效易维护有限状态机的实现方法
CN1670714A (zh) 测试用例实现方法及软件测试方法
CN1051996A (zh) 计算机通用汉字系统
CN1949819A (zh) 半色调图像边缘的增强方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication