CN106295124A - 利用多种图像检测技术综合分析基因子图相似概率量的方法 - Google Patents

利用多种图像检测技术综合分析基因子图相似概率量的方法 Download PDF

Info

Publication number
CN106295124A
CN106295124A CN201610600500.8A CN201610600500A CN106295124A CN 106295124 A CN106295124 A CN 106295124A CN 201610600500 A CN201610600500 A CN 201610600500A CN 106295124 A CN106295124 A CN 106295124A
Authority
CN
China
Prior art keywords
gene
subgraph
likelihood probability
utilize
probability amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610600500.8A
Other languages
English (en)
Other versions
CN106295124B (zh
Inventor
余孟春
何庆瑜
特伦斯·古力
谢清禄
朱军
王为
王一为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shizhen Information Technology Co Ltd
Original Assignee
Guangzhou Shizhen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shizhen Information Technology Co Ltd filed Critical Guangzhou Shizhen Information Technology Co Ltd
Priority to CN201610600500.8A priority Critical patent/CN106295124B/zh
Publication of CN106295124A publication Critical patent/CN106295124A/zh
Application granted granted Critical
Publication of CN106295124B publication Critical patent/CN106295124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Image Analysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及图像检测与处理技术领域,同时涉及生物信息学领域,具体涉及一种利用多种图像检测技术综合分析基因子图相似概率量的方法,它采用如下的方法步骤:A、人体基因序列全图和目标基因子图的数据准备;B、利用CNN卷积神经网络检测基因子图相似概率量;C、利用HOG+SVM分类检测基因子图相似概率量;D、利用Adaboost+LBP特征算法检测基因子图相似概率量;E、利用标准相关系数模板匹配法检测基因子图相似概率量;F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量;可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。

Description

利用多种图像检测技术综合分析基因子图相似概率量的方法
【技术领域】
本发明涉及图像检测与处理技术领域,同时涉及生物信息学领域,具体涉及一种利用多种图像检测技术综合分析基因子图相似概率量的方法。
【背景技术】
多种图像检测技术主要有四种:CNN卷积神经网络检测算、HOG+SVM分类检测、Boost分类+LBP特征算法、标准相关系数模板匹配法。
CNN(Convolutional Neural Networks)卷积神经网络算法是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点,其优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。
HOG(Histogram of Oriented Gradient)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子,它通过计算和统计图像局部区域的梯度方向直方图来构成特征。SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。HOG特征结合SVM分类器已经被广泛应用于图像识别领域中。
Boosting算法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数,它是一种框架算法。Adaboost是Boosting算法家族中代表算法。LBP(Local Binary Pattern,局部二值模式)是一种有效的非参数化的图像局部纹理描述方法,其特点是计算简单,能捕捉图像中微量的细节特征,从而可以提取更有利于分类的局部领域关系模式,已广泛的应用于纹理分类、人脸图像分析、图像检索等领域。
标准相关系数模板匹配法是目标跟踪的经典方法,其优点是简单准确,适用面广,而且计算速度快。相关系数(r)是一种数学距离,可以用来衡量两个向量的相似程度。所谓模板匹配法,就是指在一帧图像内寻找目标模板的位置,和模板相似最高的就是目标图像。基于相关系数的模板匹配,通常应用于全图中子区域与目标模板(目标图像)的检索,度量全图中子区域与目标模板的相似程度。
在各种图像处理检索与识别的技术中,都各自存在一定的局限性。而利用多种图像检索技术,应用于人体基因全图中与目标基因子图像进行检索与识别,分别得到各自的概率量,再通过BP(Back Propagation)神经网络分类器进行加权求和每个检测技术所得到的概率量,最终得到综合概率量,从而能够更精确的预示人体基因是否包含待检测目标基因序列。。
【发明内容】
本发明的目的在于针对现有技术的缺陷和不足,提供一种结构简单,设计合理、使用方便的利用多种图像检测技术综合分析基因子图相似概率量的方法,它能够更精确的检测在待检测人体基因序列图谱(人体基因全图)中包含目标基因(基因子图)的概率量。本发明技术可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。
本发明所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它采用如下的方法步骤:
A、人体基因序列全图和目标基因子图的数据准备;
B、利用CNN卷积神经网络检测基因子图相似概率量;
C、利用HOG+SVM分类检测基因子图相似概率量;
D、利用Adaboost+LBP特征算法检测基因子图相似概率量;
E、利用标准相关系数模板匹配法检测基因子图相似概率量;
F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。
进一步地,步骤A中人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息;此时利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息。
进一步地,步骤B中是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。
进一步地,步骤C中是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征,并经SVM分类器进行分类识别,最后得到的相似度系数表示为在人体基因全图中检测到与基因子图相似的概率量(S2)。
进一步地,步骤D是使用LBP(局部二值模式)+Adaboost分类器结合的方法,经LBP特征提取得到特征向量后利用Adaboost分类器进行分析,最后得到的基因子图相似概率量(S3)。
进一步地,步骤E中是根据模板匹配法对目标基因子图和人体基因序列全图进行匹配比较,在基因全图中识别与目标基因子图相似的子区域,其相似程度(概率量S4)由计算二者的标准相关系数(R)所得。
进一步地,方法F是以基因子图相似概率量S1、S2、S3、S4,作为BP神经网络分类器的输入层,以加权求和算法对四个概率量进行综合分析,最后得到最优化的基因子图概率量。
进一步地,目标基因子图概率量表示为在人体全基因序列信息中包含目标子基因序列的概率量,若以某项疾病易感基因序列作为目标子基因序列,在基因测序后的人体基因全序列中进行检测,则得到的最后基因子图概率量为包含该疾病易感基因的概率。
采用上述结构后,本发明有益效果为:本发明所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它能够更精确的检测在待检测人体基因序列图谱(人体基因全图)中包含目标基因(基因子图)的概率量。本发明技术可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。
【附图说明】
此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:
图1是本发明利用多种图像检测技术方案的实施流程图;
图2是本发明实施中待检测人体基因序列全图和目标基因子图数据准备流程图;
图3是本发明实施中BP神经网络分类器模型训练流程图;
图4是本发明实施中子基因信息经可视化转换后的基因子图示例图。
【具体实施方式】
下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的限定。
如图1-图4所示,本具体实施方式所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它采用如下的方法步骤:
A、人体基因序列全图和目标基因子图的数据准备;
B、利用CNN卷积神经网络检测基因子图相似概率量;
C、利用HOG+SVM分类检测基因子图相似概率量;
D、利用Adaboost+LBP特征算法检测基因子图相似概率量;
E、利用标准相关系数模板匹配法检测基因子图相似概率量;
F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。
进一步地,步骤A中人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息;此时利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息。
进一步地,步骤B中是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。
进一步地,步骤C中是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征,并经SVM分类器进行分类识别,最后得到的相似度系数表示为在人体基因全图中检测到与基因子图相似的概率量(S2)。
进一步地,步骤D是使用LBP(局部二值模式)+Adaboost分类器结合的方法,经LBP特征提取得到特征向量后利用Adaboost分类器进行分析,最后得到的基因子图相似概率量(S3)。
进一步地,步骤E中是根据模板匹配法对目标基因子图和人体基因序列全图进行匹配比较,在基因全图中识别与目标基因子图相似的子区域,其相似程度(概率量S4)由计算二者的标准相关系数(R)所得。
进一步地,方法F是以基因子图相似概率量S1、S2、S3、S4,作为BP神经网络分类器的输入层,以加权求和算法对四个概率量进行综合分析,最后得到最优化的基因子图概率量。
进一步地,目标基因子图概率量表示为在人体全基因序列信息中包含目标子基因序列的概率量,若以某项疾病易感基因序列作为目标子基因序列,在基因测序后的人体基因全序列中进行检测,则得到的最后基因子图概率量为包含该疾病易感基因的概率。
本发明中:
步骤A人体基因序列全图是人体经基因测序后所得的人体全基因序列信息,经二进制数据表示并转换为可视化图像后的图像信息;目标基因子图是目标子基因序列信息,经二进制数据表示并转换为可视化图像后的基因子图。
步骤B是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量,利用CNN多层的网络结构对二维形状的平移、比例缩放、倾斜或者共他形式的变形具有高度不变性的特点,通过特征提取、映射和子抽样,计算权值得到最终的相似概率量。
步骤C是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征,其特征提取是在图像的局部方格单元上操作,对图像几何的和光学的形变都能保持很好的不变性;SVM分类器通过高维特征空间采用线性算法进行分析、识别,计算相似概率量。
步骤D是使用LBP(局部二值模式)进行灰度范围内的纹理度量以检测特征,并使用Adaboost分类器对特征样本数据进行训练,经弱分类器组合进行分类、识别,得到较好的分析后的概率量。
步骤E根据模板匹配法对目标基因子图和人体基因序列全图进行匹配比较,在基因全图中识别与目标基因子图相似的子区域,其相似程度(概率量)由计算二者的相关系数(R)所得。
步骤F需首先根据基因数据库的样本,通过多种图像检测技术得到不同检测算法的概率量,作为BP神经网络算法的样本集,并训练得到BP神经网络分类器模型。
本发明里:
步骤A的人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息。此时,利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息;经上述方法,通过基因测序得到的人体基因序列全部的数据信息,即可转换为二维的可视化图像信息,即人体基因序列全图;从基因数据库中提取单个目标基因的序列数据信息,经数据转换和可视化,得到目标基因子图。
步骤B是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成,其实现步骤如下:
1)特征提取:每一个神经元从上一层的局部接受域得到突触输人,因而迫使它提取局部特征;
2)特征映射:卷积网络的每一个计算层都是由多个特征映射组成的,每个特征映射都是平面形式的,平面中单独的神经元在约束下共享相同的突触权值集,这样的结构形式具有平移不变性和自由参数数量的缩减(通过权值共享实现);
3)子抽样:每个卷积层后面跟着一个实现局部平均和子抽样的计算层,由此特征映射的分辨率降低,这样操作具有使特征映射的输出对平移和其他形式变形的敏感度下降的作用。
输入的图像通过可训练的滤波器和可加偏置进行卷积,卷积后在第一层产生特征映射图,然后特征映射图中每组的四个像素再进行求和,加权值,加偏置,通过一个Sigmoid函数得到第二层的特征映射图,这些映射图再进过滤波得到第三层,此层级结构再和第二层一样产生第四层。最终,这些像素值被光栅化,并连接成一个向量输入到传统的神经网络,得到输出;
一般地,第一层为特征提取层,每个神经元的输入与前一层的局部感受野相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;
第二层是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性;
通过CNN卷积神经网络对人体基因全图和目标基因子图进行特征的提取,并一步经多层网络的特征映射和子抽样计算,直至推导出全连接层,并得到输出的浮点数(相似度系数),该浮点数即表示为基因子图相似的概率量(S1)。
步骤C是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征,并经SVM分类器进行分类识别,最后得到的相似度系数表示为在人体基因全图中检测到与基因子图相似的概率量(S2)。
HOG特征是通过计算和统计图像局部区域的梯度方向直方图来构成特征。它将检测图像分成小的连通区域,即cell(细胞单元)。然后采集cell中各像素点的梯度的或边缘的方向直方图,最后把这些直方图组合起来就可以构成特征描述器(HOG特征向量),利用HOG特征进行提取的实现过程,包括以下步骤:
1)确定检测图像,并将图像进行灰度化;
2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化),调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;
3)计算图像每个像素的梯度,捕获轮廓信息,同时进一步弱化光照的干扰;
4)将图像划分成6×6像素的cells,统计每个cell的梯度直方图,即可形成每个cell的描述子;
5)将3×3个cells组成一个block,一个block内所有cell的特征描述子串联起来便得到该block的HOG特征描述子;
6)将检测图像(检测窗口)内的所有block的HOG特征描述子串联起来就可以得到该图像的HOG特征描述器,并作为SVM分类器输入的特征向量;
通过HOG特征提取,利用SVM对检测的人体基因全图及目标基因子图的特征向量进行分析,最终得到的浮点数为相似概率量(S2)。
步骤D是使用LBP(局部二值模式)+Adaboost分类器结合的方法,经LBP特征提取得到特征向量并利用Adaboost分类器进行分析,最后得到的基因子图相似概率量(S3)。
利用LBP特征进行基因图像特征提取,包括以下步骤:
1)首先将目标图像检测窗口划分为16×16的小区域(cell);
2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3×3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;
3)计算每个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率,然后对该直方图进行归一化处理;
4)将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是全图的LBP特征向量,作为Adaboost分类器的输入层。
Adaboost分类器经由T轮训练得到T个弱分类器,最后组合得到最优的强分类器。人体基因序列全图和目标基因子图在进行LBP特征提取后,得到各自的特征向量,作为Adaboost分类器的输入层并进行分析,最终得到相似度系数作为基因子图的相似概率量(S3)。
步骤E根据模板匹配法对目标基因子图和人体基因序列全图进行匹配比较,在基因全图中识别与目标基因子图相似的子区域,其相似程度(概率量S4)由计算二者的相关系数(R)所得。
以人体基因序列全图为I,目标基因子图为T,在I中搜索T的相似区域,并利用标准相关系数匹配计算R(概率量S4)。
对于目标基因子图为T覆盖在人体基因序列全图I上的每个位置,将其度量值保存到结果图像矩阵(R)中,在R中的每个位置(x,y)都包含匹配度量值,再计算标准相关系数R,其公式为:
R ( x , y ) = Σ x ′ , y ′ ( T ′ ( x ′ , y ′ ) · I ′ ( x + x ′ , y + y ′ ) ) Σ x ′ , y ′ T ′ ( x ′ , y ′ ) 2 · Σ x ′ , y ′ I ′ ( x + x ′ , y + y ′ ) 2
最终利用标准相关系数模板匹配法计算得到的R为相似度系数,即基因子图的相似概率量(S4)。
利用上述四种图像检测技术获得在人体基因序列全图中包含目标基因子图的相似概率量S1、S2、S3、S4,再将四个基因子图的相似概率量作为BP神经网络分类器的输入层,进行综合分析。
BP神经网络分类器是通过预先数据训练,达到训练目标并保存各层的权值参数,得到的BP神经网络分类器模型。其实现步骤为:
1)在基因数据库中提取已知的人体基因序列全图和目标基因子图,采用本发明技术方案的四种图像检测技术得到四个相似概率量,作为BP神经网络模型训练的输入样本集;
2)对输入数据进行预处理后,进行神经网络训练,并参照训练目标;
3)达到与训练目标一致的结果后,输入基因验证样本集,对BP神经网络进行验证分析,结果一致即得到理想的BP神经网络分类器模型,将其作为实践中的BP神经网络分类器。
以基因子图相似概率量S1、S2、S3、S4,作为BP神经网络分类器的输入层,以加权求和算法对四个概率量进行综合分析,最后得到最优化的基因子图概率量。
该目标基因子图概率量表示为在人体全基因序列信息中包含目标子基因序列的概率量。若以某项疾病易感基因序列作为目标子基因序列,在基因测序后的人体基因全序列中进行检测,则得到的最后基因子图概率量为包含该疾病易感基因的概率。
本发明所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它能够更精确的检测在待检测人体基因序列图谱(人体基因全图)中包含目标基因(基因子图)的概率量。本发明技术可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。
以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。

Claims (8)

1.利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:它采用如下的方法步骤:
A、人体基因序列全图和目标基因子图的数据准备;
B、利用CNN卷积神经网络检测基因子图相似概率量;
C、利用HOG+SVM分类检测基因子图相似概率量;
D、利用Adaboost+LBP特征算法检测基因子图相似概率量;
E、利用标准相关系数模板匹配法检测基因子图相似概率量;
F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。
2.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤A中人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息;此时利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息。
3.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤B中是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。
4.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤C中是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征,并经SVM分类器进行分类识别,最后得到的相似度系数表示为在人体基因全图中检测到与基因子图相似的概率量(S2)。
5.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤D是使用LBP(局部二值模式)+Adaboost分类器结合的方法,经LBP特征提取得到特征向量后利用Adaboost分类器进行分析,最后得到的基因子图相似概率量(S3)。
6.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤E中是根据模板匹配法对目标基因子图和人体基因序列全图进行匹配比较,在基因全图中识别与目标基因子图相似的子区域,其相似程度(概率量S4)由计算二者的标准相关系数(R)所得。
7.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:方法F是以基因子图相似概率量S1、S2、S3、S4,作为BP神经网络分类器的输入层,以加权求和算法对四个概率量进行综合分析,最后得到最优化的基因子图概率量。
8.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:目标基因子图概率量表示为在人体全基因序列信息中包含目标子基因序列的概率量,若以某项疾病易感基因序列作为目标子基因序列,在基因测序后的人体基因全序列中进行检测,则得到的最后基因子图概率量为包含该疾病易感基因的概率。
CN201610600500.8A 2016-07-27 2016-07-27 多种图像检测技术综合分析基因子图相似概率量的方法 Active CN106295124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610600500.8A CN106295124B (zh) 2016-07-27 2016-07-27 多种图像检测技术综合分析基因子图相似概率量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610600500.8A CN106295124B (zh) 2016-07-27 2016-07-27 多种图像检测技术综合分析基因子图相似概率量的方法

Publications (2)

Publication Number Publication Date
CN106295124A true CN106295124A (zh) 2017-01-04
CN106295124B CN106295124B (zh) 2018-11-27

Family

ID=57662393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610600500.8A Active CN106295124B (zh) 2016-07-27 2016-07-27 多种图像检测技术综合分析基因子图相似概率量的方法

Country Status (1)

Country Link
CN (1) CN106295124B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897580A (zh) * 2017-02-10 2017-06-27 华东师范大学 一种基于向量的基因间语义相似度的计算方法
CN107025386A (zh) * 2017-03-22 2017-08-08 杭州电子科技大学 一种基于深度学习算法进行基因关联分析的方法
CN107292129A (zh) * 2017-05-26 2017-10-24 中国科学院上海药物研究所 易感基因型检测方法
CN107506608A (zh) * 2017-09-29 2017-12-22 杭州电子科技大学 一种改进的基于协同过滤的miRNA‑疾病关联预测方法
CN108538390A (zh) * 2018-04-28 2018-09-14 中南大学 一种面向医学数据的增量式处理方法
CN109034102A (zh) * 2018-08-14 2018-12-18 腾讯科技(深圳)有限公司 人脸活体检测方法、装置、设备及存储介质
CN109545379A (zh) * 2018-12-05 2019-03-29 易必祥 基于基因大数据的治疗方法及系统
CN110265140A (zh) * 2019-01-17 2019-09-20 中国医药大学附设医院 足畸形检测模型、足畸形检测系统及足畸形检测方法
CN110348532A (zh) * 2019-07-17 2019-10-18 海默潘多拉数据科技(深圳)有限公司 一种基于机器学习与残差网络构成的有杆泵工况组合监测方法
WO2020037574A1 (zh) * 2018-08-22 2020-02-27 深圳市真迈生物科技有限公司 基于图像构建测序模板的方法、碱基识别方法和装置
CN112185571A (zh) * 2020-09-17 2021-01-05 吾征智能技术(北京)有限公司 一种基于口酸的疾病辅助诊断系统、设备、存储介质
CN112233795A (zh) * 2020-11-19 2021-01-15 吾征智能技术(北京)有限公司 一种基于耳朵纹理特征的疾病预测系统
CN112288783A (zh) * 2018-08-22 2021-01-29 深圳市真迈生物科技有限公司 基于图像构建测序模板的方法、碱基识别方法和装置
CN112488232A (zh) * 2020-12-09 2021-03-12 山西三友和智慧信息技术股份有限公司 一种基于cnn+svm的egc图像分类方法
US11847766B2 (en) 2018-08-22 2023-12-19 Genemind Biosciences Company Limited Method and device for detecting bright spots on image, and computer program product
US12008775B2 (en) 2018-08-22 2024-06-11 Genemind Biosciences Company Limited Method and device for image registration, and computer program product
WO2024119330A1 (zh) * 2022-12-05 2024-06-13 深圳华大生命科学研究院 基因图像数据校正方法、系统、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036323A (zh) * 2014-06-26 2014-09-10 叶茂 一种基于卷积神经网络的车辆检测方法
US20150230773A1 (en) * 2014-02-19 2015-08-20 Samsung Electronics Co., Ltd. Apparatus and method for lesion detection
CN105354273A (zh) * 2015-10-29 2016-02-24 浙江高速信息工程技术有限公司 一种快速检索高速公路逃费车辆高相似度图像的方法
CN105389596A (zh) * 2015-12-21 2016-03-09 长沙网动网络科技有限公司 卷积神经网络适用于识别多种尺寸图片的方法
CN105512640A (zh) * 2015-12-30 2016-04-20 重庆邮电大学 一种基于视频序列的人流量统计方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150230773A1 (en) * 2014-02-19 2015-08-20 Samsung Electronics Co., Ltd. Apparatus and method for lesion detection
CN104036323A (zh) * 2014-06-26 2014-09-10 叶茂 一种基于卷积神经网络的车辆检测方法
CN105354273A (zh) * 2015-10-29 2016-02-24 浙江高速信息工程技术有限公司 一种快速检索高速公路逃费车辆高相似度图像的方法
CN105389596A (zh) * 2015-12-21 2016-03-09 长沙网动网络科技有限公司 卷积神经网络适用于识别多种尺寸图片的方法
CN105512640A (zh) * 2015-12-30 2016-04-20 重庆邮电大学 一种基于视频序列的人流量统计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
惠国保,等: "《基于改进的图像局部区域相似度学习架构的图像特征匹配技术研究》", 《计算机学报》 *
杨冰,等: "《基于HOG金字塔人脸识别方法》", 《浙江大学学报》 *
欧阳琰: "《面部表情识别方法的研究》", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897580A (zh) * 2017-02-10 2017-06-27 华东师范大学 一种基于向量的基因间语义相似度的计算方法
CN107025386A (zh) * 2017-03-22 2017-08-08 杭州电子科技大学 一种基于深度学习算法进行基因关联分析的方法
CN107292129A (zh) * 2017-05-26 2017-10-24 中国科学院上海药物研究所 易感基因型检测方法
CN107506608B (zh) * 2017-09-29 2020-09-29 杭州电子科技大学 一种改进的基于协同过滤的miRNA-疾病关联预测方法
CN107506608A (zh) * 2017-09-29 2017-12-22 杭州电子科技大学 一种改进的基于协同过滤的miRNA‑疾病关联预测方法
CN108538390A (zh) * 2018-04-28 2018-09-14 中南大学 一种面向医学数据的增量式处理方法
CN109034102A (zh) * 2018-08-14 2018-12-18 腾讯科技(深圳)有限公司 人脸活体检测方法、装置、设备及存储介质
CN109034102B (zh) * 2018-08-14 2023-06-16 腾讯科技(深圳)有限公司 人脸活体检测方法、装置、设备及存储介质
WO2020037574A1 (zh) * 2018-08-22 2020-02-27 深圳市真迈生物科技有限公司 基于图像构建测序模板的方法、碱基识别方法和装置
US12008775B2 (en) 2018-08-22 2024-06-11 Genemind Biosciences Company Limited Method and device for image registration, and computer program product
CN112288783A (zh) * 2018-08-22 2021-01-29 深圳市真迈生物科技有限公司 基于图像构建测序模板的方法、碱基识别方法和装置
US11847766B2 (en) 2018-08-22 2023-12-19 Genemind Biosciences Company Limited Method and device for detecting bright spots on image, and computer program product
US11170506B2 (en) 2018-08-22 2021-11-09 Genemind Biosciences Company Limited Method for constructing sequencing template based on image, and base recognition method and device
CN109545379A (zh) * 2018-12-05 2019-03-29 易必祥 基于基因大数据的治疗方法及系统
CN109545379B (zh) * 2018-12-05 2021-11-09 易必祥 基于基因大数据的治疗系统
CN110265140A (zh) * 2019-01-17 2019-09-20 中国医药大学附设医院 足畸形检测模型、足畸形检测系统及足畸形检测方法
CN110348532A (zh) * 2019-07-17 2019-10-18 海默潘多拉数据科技(深圳)有限公司 一种基于机器学习与残差网络构成的有杆泵工况组合监测方法
CN110348532B (zh) * 2019-07-17 2021-03-02 海默潘多拉数据科技(深圳)有限公司 基于机器学习与残差网络构成的有杆泵工况组合监测方法
CN112185571A (zh) * 2020-09-17 2021-01-05 吾征智能技术(北京)有限公司 一种基于口酸的疾病辅助诊断系统、设备、存储介质
CN112185571B (zh) * 2020-09-17 2024-01-16 吾征智能技术(北京)有限公司 一种基于口酸的疾病辅助诊断系统、设备、存储介质
CN112233795A (zh) * 2020-11-19 2021-01-15 吾征智能技术(北京)有限公司 一种基于耳朵纹理特征的疾病预测系统
CN112488232A (zh) * 2020-12-09 2021-03-12 山西三友和智慧信息技术股份有限公司 一种基于cnn+svm的egc图像分类方法
WO2024119330A1 (zh) * 2022-12-05 2024-06-13 深圳华大生命科学研究院 基因图像数据校正方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
CN106295124B (zh) 2018-11-27

Similar Documents

Publication Publication Date Title
CN106295124B (zh) 多种图像检测技术综合分析基因子图相似概率量的方法
CN110348319B (zh) 一种基于人脸深度信息和边缘图像融合的人脸防伪方法
CN110287932B (zh) 基于深度学习图像语义分割的道路阻断信息提取方法
CN103400151B (zh) 一体化的光学遥感影像与gis自动配准与水体提取方法
CN106503739A (zh) 联合光谱和纹理特征的高光谱遥感影像svm分类方法及系统
CN111639587B (zh) 基于多尺度谱空卷积神经网络的高光谱图像分类方法
CN111090764B (zh) 基于多任务学习和图卷积神经网络的影像分类方法及装置
Yuan et al. Learning to count buildings in diverse aerial scenes
CN108492298A (zh) 基于生成对抗网络的多光谱图像变化检测方法
CN113657324A (zh) 基于遥感影像地物分类的城市功能区识别方法
CN104252625A (zh) 样本自适应多特征加权的遥感图像分类方法
Chen et al. Agricultural remote sensing image cultivated land extraction technology based on deep learning
CN113344045B (zh) 一种结合hog特征提高sar船只分类精度的方法
CN115496720A (zh) 基于ViT机制模型的胃肠癌病理图像分割方法及相关设备
CN107704840A (zh) 一种基于深度学习的遥感图像道路检测方法
CN110263867A (zh) 一种钢轨伤损分类方法
Narmatha et al. Skin cancer detection from dermoscopic images using Deep Siamese domain adaptation convolutional Neural Network optimized with Honey Badger Algorithm
Bachhal et al. Real-time disease detection system for maize plants using deep convolutional neural networks
Kumawat et al. Time-Variant Satellite Vegetation Classification Enabled by Hybrid Metaheuristic-Based Adaptive Time-Weighted Dynamic Time Warping
Chen et al. The building recognition and analysis of remote sensing image based on depth belief network
CN112465821A (zh) 一种基于边界关键点感知的多尺度害虫图像检测方法
CN114565762B (zh) 基于roi和分裂融合策略的弱监督肝脏肿瘤分割方法
JP3648728B2 (ja) 自己組織化特徴マップを用いた鋼材表面の劣化度評価システム
Ibrahimi et al. A review on plant diseases detection using artificial intelligence techniques
Rush et al. Feature Map Activation Analysis for Object Key-Point Detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 510670 17 / F, building 3, Yunsheng Science Park, No. 11, puyuzhong Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU MELUX INFORMATION TECHNOLOGY Co.,Ltd.

Address before: No.205-7, 79 Ruihe Road, Guangzhou Economic and Technological Development Zone, Guangdong 510665

Patentee before: GUANGZHOU MELUX INFORMATION TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
PP01 Preservation of patent right

Effective date of registration: 20231120

Granted publication date: 20181127

PP01 Preservation of patent right
PD01 Discharge of preservation of patent

Date of cancellation: 20231219

Granted publication date: 20181127

PD01 Discharge of preservation of patent