CN108052799A - 基于图像处理的多序列比对可视化的方法 - Google Patents

基于图像处理的多序列比对可视化的方法 Download PDF

Info

Publication number
CN108052799A
CN108052799A CN201810023610.1A CN201810023610A CN108052799A CN 108052799 A CN108052799 A CN 108052799A CN 201810023610 A CN201810023610 A CN 201810023610A CN 108052799 A CN108052799 A CN 108052799A
Authority
CN
China
Prior art keywords
image
amino acid
pixel
represented
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810023610.1A
Other languages
English (en)
Inventor
王玲芳
李伟忠
郑贵锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN201810023610.1A priority Critical patent/CN108052799A/zh
Publication of CN108052799A publication Critical patent/CN108052799A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • G06T7/0014Biomedical image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image

Abstract

本发明涉及一种基于图像处理的多序列比对可视化的方法,包括以下步骤:S1.将多序列比对算法产生的多条氨基酸序列作为输入;S2.分别为不同类型的氨基酸定义不同的颜色,然后对氨基酸序列进行颜色转换;S3.结合图像转换,将氨基酸序列中的每一个氨基酸分别对应图像中的一个像素,像素的颜色对应氨基酸的颜色,图像转换将多条一维的氨基酸序列转换成二维彩色图像;S4.对转换的图像利用基于边缘检测的图像分割算法进行分割,将分割后的图像展现给用户。

Description

基于图像处理的多序列比对可视化的方法
技术领域
本发明涉及生物信息学技术领域,更具体地,涉及一种基于图像处理的多序列比对可视化的方法。
背景技术
近年来,随着人类基因组计划在世界范围内的开展,人类基因组草图已基本完成,标志着人类对生命信息的探索进入了一个新的阶段。同时,对基因表达模式、蛋白质结构、蛋白质-蛋白质相互作用分析得到的数据越来越多。生物信息学的研究重点主要体现在基因组学和蛋白质组学两方面,具体地说就是从核酸和蛋白质序列出发,分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物序列进行分析,也就是研究新的计算机方法,从大量的序列信息中获取基因结构、功能和进化等知识。生物序列检索在生物信息学中是一项基础性工作。生物学研究认为:生物序列的功能是由它的结构决定的,而它的结构往往是由一些特定的子序列决定的。所以,进行特定序列的检索在生物学中具有重要的意义:可以用来进行蛋白质的功能区域预测、蛋白质保守区域的判断等。
目前有很多针对序列可视化的方法,但大多数是针对DNA序列的可视化。由于蛋白质序列隐含了蛋白质的结构信息,对于蛋白质序列的可视化一般要结合其生物学的意义,利用不同氨基酸序列之间的结构信息,例如α螺旋和β折叠。对于非生物学的专业的人来说,以氨基酸结构信息为目的来可视化序列信息是不可能的。此外,已有很多软件在根据氨基酸序列预测蛋白质结构上已经做得很完善,但是,对于没有生物学背景的研究人员,如果只是想根据序列相似性比对的结果做简单的总体性的分析,比如分析蛋白质可能的保守区域和变异区,这些软件的操作步骤是繁琐且不易使用的。为了方便用户在进行多序列比对后的进一步分析,可以针对大数据量的序列信息进行可视化。
目前常用的序列可视化方法为“基于灰度图像的DNA序列可视化方法”和“基于元胞自动机的蛋白质序列图像生成方法”。
“基于灰度图像的DNA序列可视化方法”的具体执行步骤如下:
1)对DNA序列的四种碱基编码:A-00,T-11,C-01,G-10;
2)将4个碱基组合成一个8位的数据,数据范围是0~255,在原始的DNA序列后面添加3个碱基“AAA”,保证每个DNA序列都可以编码;
3)假设原始DNA序列的长度是L,那么找最小的N,使N*N>=L,将DNA序列编码成一维数据的后面补上(N*N-L)个0,然后将一维数据转换成二维的图像。
DNA序列由四种核苷酸A、T、C、G排列组合而成,对于四种碱基也只需要2个字节编码即可。将DNA序列转换成图像信息后,可以利用图像处理技术对DNA序列信息进行分析。经过上述处理,任何一条DNA序列都可以编码得到等宽高的图像,这为后面要进行的分析提供了基础。保存这种格式的图片之后,研究者可以在极小的空间内可视化较长的序列。通过分析图像可以直观地看出DNA四种碱基的大致分布情况,也可以用不同的图像做对比,实现DNA序列的相似性比较。
但是,在用户体验上,“基于灰度图像的DNA序列可视化方法”只能根据已有的DNA序列信息构建出灰度图像,用户无法从颜色单一的图像获取较为准确或者有用的信息,这种可视化结果在实际应用中并不能满足用户需求。
而“基于元胞自动机的蛋白质序列图像生成方法”,首要解决的问题是建立氨基酸数字编码模型。蛋白质所有分子间相互作用和分子内部相互作用都受相似规则、互补规则或者两种规则同时作用,所以在编码的过程中要考虑到这些规则。通过数字编码将氨基酸序列变成一维的01序列。
主要的规则如下:
1)相似规则:已有的成分总是与它性质相近的成分结合,也即相似性质的成分结合紧密;
2)互补规则:具有相反规则的个体之间也有亲密关系,例如互补对称;
3)每对互补对称的氨基酸对前两个碱基都是互补的,如果氨基酸密码子前两位碱基相同,则第五位由氨基酸的分子量决定。
将一维序列通过元胞自动机合适的演化规则进行时空演化,生成二维图像。该方法为了处理方便,采用最基本的位图格式。通过生成图像的特征,判断蛋白质是否是同一类的。
由于上述方案采用最基本的位图格式,所以图像上的色彩只有黑白两种颜色。同时由于上述方案利用元胞自动机的规则,所以必须输入氨基酸序列的结构特征,把前后氨基酸的相互作用用各种演化规则做出不同的图像表达。这对专业要求很高,不适合非专业研究人士使用。
发明内容
本发明的发明目的在于解决现有技术采用单一色彩表示氨基酸或碱基所存在的用户无法从颜色单一的图像获取较为准确或者有用的信息的技术缺陷,提供了一种基于图像处理的多序列比对可视化的方法,该方法将一维氨基酸序列转换成彩色图像,结合图像处理技术中的基于边缘检测的图像分割算法对图像进行分割处理,用户可以通过分析图像颜色块的变化,直观的判断多序列之间的同源性、保守区以及变异区,便于对序列比对结果的分析,方便用户直接判断,而不需要根据复杂的建模或者了解序列的生物学含义来判断,在一定程度上减轻了用户的负担。
为实现以上发明目的,采用的技术方案是:
基于图像处理的多序列比对可视化的方法,包括以下步骤:
S1.将多序列比对算法产生的多条氨基酸序列作为输入;
S2.分别为不同类型的氨基酸定义不同的颜色,然后对氨基酸序列进行颜色转换;
S3.结合图像转换,将氨基酸序列中的每一个氨基酸分别对应图像中的一个像素,像素的颜色对应氨基酸的颜色,图像转换将多条一维的氨基酸序列转换成二维彩色图像;
S4.对转换的图像利用基于边缘检测的图像分割算法进行分割,将分割后的图像展现给用户。
优选地,所述步骤S2利用改进的Clustal Omega的配色标准对不同类型的氨基酸定义不同的颜色:
氨基酸AVFPMILW用红色表示;
氨基酸DE用蓝色表示;
氨基酸RK用品红色表示;
氨基酸STYHCNGQ用绿色表示;
剩余的氨基酸和其他字符使用黑色表示。
优选地,所述步骤S3的具体流程如下:
设氨基酸序列的条数为M,M条氨基酸序列中最长的氨基酸序列的长度为N,对其余的氨基酸序列的尾部进行补空使其长度也为N,从而新建一个M*N的二维彩色图像。
优选地,所述二维彩色图像中,氨基酸AVFPMILW采用RGB(255,0,0)表示,对应位置的像素为红色;氨基酸DE用RGB(20,90,255)表示,对应位置的像素为蓝色;氨基酸RK用RGB(180,90,180)表示,对应位置的像素为品红色;氨基酸STYHCNGQ用RGB(0,255,0)表示,对应位置的像素为绿色;剩余的氨基酸和其他字符用RGB(0,0,0)表示,对应位置的像素为黑色。
优选地,所述步骤S4首先对转换的图像进行边缘检测,然后基于边缘检测的结果进行图像分割,其中进行边缘检测的具体方案如下:
(1)令输入图像为IM×N,输入图像的尺寸为M×N,定义区域距离为DG,高斯曼哈顿距离图为DM,累计区域距离为D,区域半径为R,初始化D=0;R一般取3到5;
(2)取出输入图像中未处理过的点Iu,以Iu为中心点,获得边长为2R的矩阵区域Rect(Iu,R),同时初始化一个空集合Sv
(3)取出一个Rect(Iu,R)内的像素点Iv得到以Iv为中心,边长为2R的矩形区域Rect(Iv,R),将Iv加入到Sv中;
(4)计算当前高斯曼哈顿距离
其中,IuR′表示Rect(Iu,R)的图像,IvR表示Rect(Iv,R)的图像,令D=D+DG,表示将计算的高斯曼哈顿距离加入到累计区域距离;
(5)令Rect(Iu,R)内不包含Iu的所有像素的集合为Su,若则执行步骤(6),否则执行步骤(3);
(6)计算Iu的平均高斯曼哈顿距离作为高斯曼哈顿距离图DM内相应位置上的差异值;
(7)IM×N内M×N个像素点未处理完转步骤(2),否则转步骤(8);
(8)获得高斯曼哈顿距离图DM,以此作为边缘检测结果进行输出。
优选地,所述步骤S4利用基于边缘检测的图像分割算法进行分割后,利用分割的结果重构输入图像,然后再利用基于边缘检测的图像分割算法对重构的输入图像进行分割,分割-重构-分割的过程连续迭代多次,将最后一次分割的结果进行输出。
与现有技术相比,本发明的有益效果是:
1)本发明在RGB空间下直接对图像进行边缘检测进而分割图像,不需要进行灰度转换或者空间转换;
2)本发明在结合高斯曼哈顿距离图的彩色图像分割方法的基础上进行了改进,将分割后的图像重构进行迭代分割,这样能够排除再比对过程中产生插空或者氨基酸变异等的噪声干扰,能够得到更为准确的分割结果;
3)本发明采用了改进的Clustal Omega配色方案,在RGB表示上更容易,而且肉眼更容易分辨;用户可以通过分析图像颜色块的变化,直观的判断多序列之间的同源性、保守区以及变异区,便于对序列比对结果的分析,方便用户直接判断。
附图说明
图1为方法的流程示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
如图1所示,本发明提供的方法包括有以下步骤:
第一步、将多序列比对算法产生的多条氨基酸序列作为输入
输入多条氨基酸序列,或者选择含有多条氨基酸序列的文件作为输入文件,利用传统的Clustal Omega比对工具,得到序列比对结果文件,其中比对结果按照比对算法已经插空对齐。此比对结果作为方法的输入文件。
第二步、利用改进的Clustal Omega的配色标准分别为不同类型的氨基酸定义不同的颜色,然后对氨基酸序列进行颜色转换
在改进Clustal Omega的配色标准中,将20种氨基酸序列分成五种情况,根据其物理化学性质来给氨基酸配色。其中1)氨基酸AVFPMILW用红色(RED)表示;2)氨基酸DE用蓝色(BLUE)表示;3)氨基酸RK用品红色(MAGENTA)表示;4)氨基酸STYHCNGQ用绿色(GREEN)表示。对于其他的符号,Clustal Omega的做法是配色为灰色,但是考虑到之后要将氨基酸转换成像素表示,灰色的辨识度不高,而且做边缘检测时不易被检测出来,以及在结果图片不易被肉眼识别等因素,这里将灰色替换成个黑色,也即5)剩余的氨基酸和其他字符使用黑色(BLACK)表示。
第三步、结合图像转换,将氨基酸序列中的每一个氨基酸分别对应图像中的一个像素,像素的颜色对应氨基酸的颜色,图像转换将多条一维的氨基酸序列转换成二维彩色图像
设氨基酸序列的条数为M,M条氨基酸序列中最长的氨基酸序列的长度为N,对其余的氨基酸序列的尾部进行补空使其长度也为N,从而新建一个M*N的二维彩色图像。
所述二维彩色图像中,氨基酸AVFPMILW采用RGB(255,0,0)表示,对应位置的像素为红色;氨基酸DE用RGB(20,90,255)表示,对应位置的像素为蓝色;氨基酸RK用RGB(180,90,180)表示,对应位置的像素为品红色;氨基酸STYHCNGQ用RGB(0,255,0)表示,对应位置的像素为绿色;剩余的氨基酸和其他字符用RGB(0,0,0)表示,对应位置的像素为黑色。
第四步、对转换的图像利用基于边缘检测的图像分割算法进行分割,将分割后的图像展现给用户。
图像分割的一种重要途径是通过边缘检测,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方,这种不连续性称为边缘。边缘是图像的基本特征,是指图像中本邻域灰度值有很大反差的像素的集合。不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。人的视觉对边缘是比较敏感的,当然们观察各种场景时,首先注意到的就是不同物体的相交处的边缘,并很快得出每个物体的轮廓。
彩色图像空间的边缘检测方法包括基于RGB空间边缘检测方法、基于HSI空间的边缘检测方法和基于CIELAB空间的边缘检测方法。RGB空间是最为常见的色彩空间,这是一种三维模型,R、G、B分别对应空间内的三个坐标值。HSI、CIELAB空间都是由RGB空间经非线性变换得到的,但是由于非线性变换的原因,因此计算量较大,且颜色空间存在奇异点等问题。由于图像是直接初始化为RGB空间,不需要经过空间转换,因此计算量相对较小。本发明为了避免边缘检测中提取边缘信息阈值难以把握的问题,采取了结合高斯曼哈顿距离图的彩色图像边缘检测的方法。
一般的彩色图像边缘检测都需要先将图像转换为灰度图像,再进行边缘检测,而这种做法损失了部分彩色信息。
如下,灰度转换的公式为:
Ig(x,y)=I(x,y,1)*0,299+I(x,y,2)*0.587+I(x,y,3)*0.114
在上式中,Ig(x,y)为(x,y)位置上的灰度像素值,I(x,y,k)为(x,y)位置上的R、G、B通道的像素值,k取1,2,3,分别对应R、G、B通道。经研究实验对比表明,仅用以上转换方法,无法将红色与绿色,绿色与蓝色区域的边缘在灰度图中体现出来。为了能够直接在RGB空间实现边缘检测,给出如下距离公式计算像素之间的梯度:
其中,(xm,yn)和(xi,yj)分别对应图像中的像素和邻域水平的像素,ID(xm,yn)为(xm,yn)与(xi,yj)RGB空间上区域差异的度量值,k表示R、G、B三个通道,取值分别对应1,2,3。为了计算邻域水平像素间的梯度,可以令i=m+1,j=n,通过上式的计算,能够提取到比灰度转换更多更丰富的边缘信息。
通过计算当前像素与周围像素的差异来进行边缘检测是最为常用的方法,这种方法的优点非常明显:算法简单,处理速度快。但是它存在的缺点是:当前像素与周围像素的差异阈值的确定很难把握,而且存在误判边缘的问题,也就是将不是边缘的位置当作了边缘。为了有效地避免上述问题,可以通过比较相邻区域内所有像素的差异来确定中心位置的梯度,就能够将较小范围内邻域特征考虑进来。如果能够通过计算RGB每个通道对应区域的差异,就可以更好地描述中心像素之间的差异,因此给出曼哈顿距离的公式,如下:
在上式中,vk[Pi]是以Pi为中心邻域内的k通道值,vk[Pj]是以Pj为中心邻域内的k通道值,k取1,2,3,分别对应R、G、B通道,d是中心像素之间的距离值。通过计算验证,由上式计算而来的边缘信息较上述梯度计算法得到的边缘有了增强。
考虑到邻域内不同距离的像素对中心像素的贡献不同,引入高斯函数,高斯函数具有旋转对称性,用其对图像进行平滑运算时在各个方向上的平滑程度相同,因此后续边缘检测等操作中不会偏袒某一方向上的图像的细节,随着离高斯模板中心点越远,权值越小,这使得高斯滤波器比起普通的平滑滤波器更能更好地保留图像细节。因此引入高斯方程,
原高斯方程为:
结合高斯函数并给出如下方程,计算邻域内像素与中心像素之间的距离:
在上式中,参数σ2代表方差,用于调节高斯函数的形状,σ越大高斯函数越平。同样地,σ的值越大,则邻域像素被赋予的贡献值越多。通过积累RGB三个通道不同距离像素间的差异作为距离值,可以更好地里用彩色图像区域信息,更加细致地完成边缘检测。计算每个位置上的距离D值构建距离矩阵,以此完成得到高斯曼哈顿距离图,
具体生成方法如下所述:
(1)令输入图像为IM×N,输入图像的尺寸为M×N,定义区域距离为DG,高斯曼哈顿距离图为DM,累计区域距离为D,区域半径为R,初始化D=0;R一般取3到5;
(2)取出输入图像中未处理过的点Iu,以Iu为中心点,获得边长为2R的矩阵区域Rect(Iu,R),同时初始化一个空集合Sv
(3)取出一个Rect(Iu,R)内的像素点Iv得到以Iv为中心,边长为2R的矩形区域Rect(Iv,R),将Iv加入到Sv中;
(4)计算当前高斯曼哈顿距离
其中,IuR′表示Rect(Iu,R)的图像,IvR表示Rect(Iv,R)的图像,令D=D+DG,表示将计算的高斯曼哈顿距离加入到累计区域距离;
(5)令Rect(Iu,R)内不包含Iu的所有像素的集合为Su,若则执行步骤(6),否则执行步骤(3);
(6)计算Iu的平均高斯曼哈顿距离作为高斯曼哈顿距离图DM内相应位置上的差异值;
(7)IM×N内M×N个像素点未处理完转步骤(2),否则转步骤(8);
(8)获得高斯曼哈顿距离图DM,以此作为边缘检测结果进行输出。
由于在多序列比对的过程中,会出现插空或者序列在某处出现变异,会导致序列比对结果出现偏差。第一次对图像进行分割之后的结果包含了这些偏差,因此用它作为输出结果供用户判断并不是可靠的。在初次进行图像分割之后,利用分割的结果重构图像,再次利用图像分割的技术进行分割,这个过程可能会迭代几次。关于迭代的次数,迭代次数过少无法排除一些变异位点的噪声,迭代次数过多会导致图像模糊失去图像信息。要确定一个迭代次数的值是很难的,又有类似的图像分割实验表明,一般来说迭代5到10次就能得到理想的结果,所以本发明确定迭代次数为5次。经过5次迭代分割之后,原始图像中的一些噪声就能被减少,保守域会更加明显,更利于用户直观判断,而且增加了结果的可靠性。
利用上述图像分割的方法对序列比对结果进行可视化之后,以图像的方式展示给用户,可以减轻用户查看序列结果来判断的困难,用户可以通过图像的方式获得更好的感受。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.基于图像处理的多序列比对可视化的方法,其特征在于:包括以下步骤:
S1.将多序列比对算法产生的多条氨基酸序列作为输入;
S2.分别为不同类型的氨基酸定义不同的颜色,然后对氨基酸序列进行颜色转换;
S3.结合图像转换,将氨基酸序列中的每一个氨基酸分别对应图像中的一个像素,像素的颜色对应氨基酸的颜色,图像转换将多条一维的氨基酸序列转换成二维彩色图像;
S4.对转换的图像利用基于边缘检测的图像分割算法进行分割,将分割后的图像展现给用户。
2.根据权利要求1所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述步骤S2利用改进的Clustal Omega的配色标准对不同类型的氨基酸定义不同的颜色:
氨基酸AVFPMILW用红色表示;
氨基酸DE用蓝色表示;
氨基酸RK用品红色表示;
氨基酸STYHCNGQ用绿色表示;
剩余的氨基酸和其他字符使用黑色表示。
3.根据权利要求2所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述步骤S3的具体流程如下:
设氨基酸序列的条数为M,M条氨基酸序列中最长的氨基酸序列的长度为N,对其余的氨基酸序列的尾部进行补空使其长度也为N,从而新建一个M*N的二维彩色图像。
4.根据权利要求3所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述二维彩色图像中,氨基酸AVFPMILW采用RGB(255,0,0)表示,对应位置的像素为红色;氨基酸DE用RGB(20,90,255)表示,对应位置的像素为蓝色;氨基酸RK用RGB(180,90,180)表示,对应位置的像素为品红色;氨基酸STYHCNGQ用RGB(0,255,0)表示,对应位置的像素为绿色;剩余的氨基酸和其他字符用RGB(0,0,0)表示,对应位置的像素为黑色。
5.根据权利要求1所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述步骤S4首先对转换的图像进行边缘检测,然后基于边缘检测的结果进行图像分割,其中进行边缘检测的具体方案如下:
(1)令输入图像为IM×N,输入图像的尺寸为M×N,定义区域距离为DG,高斯曼哈顿距离图为DM,累计区域距离为D,区域半径为R,初始化D=0;R一般取3到5;
(2)取出输入图像中未处理过的点Iu,以Iu为中心点,获得边长为2R的矩阵区域Rect(Iu,R),同时初始化一个空集合Sv
(3)取出一个Rect(Iu,R)内的像素点Iv得到以Iv为中心,边长为2R的矩形区域Rect(Iv,R),将Iv加入到Sv中;
(4)计算当前高斯曼哈顿距离
<mrow> <msub> <mi>D</mi> <mi>G</mi> </msub> <mo>=</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>3</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mn>2</mn> <mi>R</mi> </mrow> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mn>2</mn> <mi>R</mi> </mrow> </munderover> <mo>|</mo> <msub> <mi>I</mi> <mrow> <mi>u</mi> <mi>R</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>I</mi> <mrow> <mi>v</mi> <mi>R</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <msup> <mi>&amp;sigma;</mi> <mn>2</mn> </msup> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,IuR表示Rect(Iu,R)的图像,IvR表示Rect(Iv,R)的图像,令D=D+DG,表示将计算的高斯曼哈顿距离加入到累计区域距离;
(5)令Rect(Iu,R)内不包含Iu的所有像素的集合为Su,若则执行步骤(6),否则执行步骤(3);
(6)计算Iu的平均高斯曼哈顿距离作为高斯曼哈顿距离图DM内相应位置上的差异值;
(7)IM×N内M×N个像素点未处理完转步骤(2),否则转步骤(8);
(8)获得高斯曼哈顿距离图DM,以此作为边缘检测结果进行输出。
6.根据权利要求5所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述步骤S4利用基于边缘检测的图像分割算法进行分割后,利用分割的结果重构输入图像,然后再利用基于边缘检测的图像分割算法对重构的输入图像进行分割,分割-重构-分割的过程连续迭代多次,将最后一次分割的结果进行输出。
CN201810023610.1A 2018-01-10 2018-01-10 基于图像处理的多序列比对可视化的方法 Pending CN108052799A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810023610.1A CN108052799A (zh) 2018-01-10 2018-01-10 基于图像处理的多序列比对可视化的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810023610.1A CN108052799A (zh) 2018-01-10 2018-01-10 基于图像处理的多序列比对可视化的方法

Publications (1)

Publication Number Publication Date
CN108052799A true CN108052799A (zh) 2018-05-18

Family

ID=62126982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810023610.1A Pending CN108052799A (zh) 2018-01-10 2018-01-10 基于图像处理的多序列比对可视化的方法

Country Status (1)

Country Link
CN (1) CN108052799A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109767808A (zh) * 2018-12-21 2019-05-17 景德镇陶瓷大学 一种新的基于元胞自动机的蛋白质进化仿真模型
CN111180008A (zh) * 2019-12-31 2020-05-19 云舟生物科技(广州)有限公司 载体图形的元件插入方法、存储介质及电子设备
CN112687338A (zh) * 2020-12-31 2021-04-20 云舟生物科技(广州)有限公司 基因序列的存储和还原方法、计算机存储介质及电子设备
CN112700819A (zh) * 2020-12-31 2021-04-23 云舟生物科技(广州)有限公司 基因序列的处理方法、计算机存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103820541A (zh) * 2014-01-25 2014-05-28 青岛科技大学 一种基于指数发卡组装和比色快速检测核酸的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103820541A (zh) * 2014-01-25 2014-05-28 青岛科技大学 一种基于指数发卡组装和比色快速检测核酸的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
唐利娜: "水下三维声成像及声纳图像处理技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
徐培杰: "基于哈斯矩阵图的蛋白质序列分类及可视化方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
贾迪 等: "RGB空间下结合高斯曼哈顿距离图的彩色图像边缘检测", 《电子学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109767808A (zh) * 2018-12-21 2019-05-17 景德镇陶瓷大学 一种新的基于元胞自动机的蛋白质进化仿真模型
CN109767808B (zh) * 2018-12-21 2020-07-28 景德镇陶瓷大学 一种新的基于元胞自动机的蛋白质进化仿真模型
CN111180008A (zh) * 2019-12-31 2020-05-19 云舟生物科技(广州)有限公司 载体图形的元件插入方法、存储介质及电子设备
CN111180008B (zh) * 2019-12-31 2021-05-07 云舟生物科技(广州)有限公司 载体图形的元件插入方法、存储介质及电子设备
CN112687338A (zh) * 2020-12-31 2021-04-20 云舟生物科技(广州)有限公司 基因序列的存储和还原方法、计算机存储介质及电子设备
CN112700819A (zh) * 2020-12-31 2021-04-23 云舟生物科技(广州)有限公司 基因序列的处理方法、计算机存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN108052799A (zh) 基于图像处理的多序列比对可视化的方法
CN110175986B (zh) 一种基于卷积神经网络的立体图像视觉显著性检测方法
Rathore et al. Colour based image segmentation using L* a* b* colour space based on genetic algorithm
CN103914699A (zh) 一种基于色彩空间的自动唇彩的图像增强的方法
CN105701493B (zh) 基于阶层图形的图像提取以及前景估测的方法和系统
CN112215847B (zh) 基于对抗学习多尺度特征的重叠染色体自动分割方法
KR101567792B1 (ko) 이미지 윤곽 묘사 시스템 및 방법
Shao et al. Automatic microarray image segmentation with clustering-based algorithms
CN109977834B (zh) 从深度图像中分割人手与交互物体的方法和装置
CN113963041A (zh) 一种图像纹理识别方法及系统
Kwasniewska et al. Super-resolved thermal imagery for high-accuracy facial areas detection and analysis
CN109003287A (zh) 基于改进遗传算法的图像分割方法
Zhou et al. Attention transfer network for nature image matting
Oliveira et al. A novel Genetic Algorithms and SURF-Based approach for image retargeting
CN109741358B (zh) 基于自适应超图学习的超像素分割方法
CN114445328A (zh) 基于改进Faster R-CNN的医学影像脑肿瘤检测方法与系统
CN110766708B (zh) 基于轮廓相似度的图像比较方法
CN108090914A (zh) 基于统计建模与像素分类的彩色图像分割方法
Shrivastava et al. Reliability analysis of psoriasis decision support system in principal component analysis framework
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
JP5911063B2 (ja) 物体検出装置およびプログラム
CN103034859B (zh) 一种获取姿势模型的方法及装置
CN114419347A (zh) 一种基于深度学习的空间曲线形状匹配方法
Lindblad et al. Exact linear time euclidean distance transforms of grid line sampled shapes
CN113744241A (zh) 基于改进slic算法的细胞图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180518

RJ01 Rejection of invention patent application after publication