CN112037173B - 染色体检测方法、装置及电子设备 - Google Patents
染色体检测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112037173B CN112037173B CN202010774367.4A CN202010774367A CN112037173B CN 112037173 B CN112037173 B CN 112037173B CN 202010774367 A CN202010774367 A CN 202010774367A CN 112037173 B CN112037173 B CN 112037173B
- Authority
- CN
- China
- Prior art keywords
- chromosome
- sub
- images
- feature extraction
- priori data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000000349 chromosome Anatomy 0.000 title claims abstract description 343
- 238000001514 detection method Methods 0.000 title claims abstract description 133
- 238000000605 extraction Methods 0.000 claims abstract description 76
- 238000000034 method Methods 0.000 claims description 32
- 230000000877 morphologic effect Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 46
- 238000012549 training Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000007477 logistic regression Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004043 dyeing Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明实施例提供了一种染色体检测方法、装置及电子设备,其中,上述染色体检测方法,包括:将获取的染色体图像分割成N个子图像,N为大于1的整数;将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果。本发明实施例可以减轻染色体检测模型过拟合的问题,提升染色体检测模型的鲁棒性以及染色体检测的准确性。
Description
技术领域
本发明涉及染色体检测技术领域,尤其涉及一种染色体检测方法、装置及电子设备。
背景技术
众所周知,染色体检测对于疾病检查、预测以及研究等具有重要意义;而随着信息技术的发展,通过神经网络实现染色体的检测已经得到了一定的应用。
由于染色体所包括的特征数量较多且特征之间存在较大的重复性,非同源染色体之间的核型,例如长度、带纹等也存在较大的差距,导致现有技术中所采用的基于不同染色单体混合训练的神经网络往往存在过拟合的情况,染色体检测效果较差。
发明内容
本发明实施例提供一种染色体检测方法、装置及电子设备,以解决现有技术中所采用的基于不同染色单体混合训练的神经网络往往存在过拟合的情况,染色体检测效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种染色体检测方法,包括:
将获取的染色体图像分割成N个子图像,N为大于1的整数;
将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果。
第二方面,本发明实施例还提供了一种染色体检测装置,包括:
分割模块,用于将获取的染色体图像分割成N个子图像,N为大于1的整数;
检测模块,用于将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
本发明实施例提供的染色体检测方法,将获取的染色体图像分割成N个子图像,将N个子图像输入到染色体检测模型中,该染色体检测模块具有N个用于对应接收N个子图像的N个特征提取模块,以及用于接收N个特征提取模块的输出的预测模块,预测模块则可以进一步输出染色体检测结果。本发明实施例将染色体图像分割N个子图像,相较于现有技术中针对整条染色体输入到神经网络中进行检测的方式,可以针对染色体各个部分进行聚焦,提高对染色体各部分的关注度及特征利用率,同时,可以在训练得到染色体检测模型的过程中,增加训练样本的数量;进而可以减轻染色体检测模型过拟合的问题,提升染色体检测模型的鲁棒性以及染色体检测的准确性。
附图说明
图1为本发明实施例提供的染色体检测方法的流程图;
图2为本发明实施例中获取染色体检测结果的一种流程图;
图3为本发明实施例中染色体检测模型的网络框架图;
图4为在一具体应用场景中初始同源染色体配对结果示意图;
图5为在一具体应用场景中对初始同源染色体配对结果进行调整后的示意图;
图6为本发明实施例提供的染色体检测装置的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。
除非另作定义,本发明中使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。
如图1所示,本发明实施例提供的染色体检测方法,包括:
步骤101,将获取的染色体图像分割成N个子图像,N为大于1的整数;
步骤102,将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果。
容易理解的是,上述染色体图像可以是指某一条待检测的染色体的图像;而染色体图像的获取方式,此处不做具体限定,例如,染色体图像可以是对拍摄的原始图像进行染色体轮廓识别、图像分割等处理而得到。
将染色体图像分割成N个子图像,可以认为是将染色体图像中的染色体分为N截,每一子图像中均可以具有相应的一截染色体的数据。例如,可以根据染色体图像中染色体的骨架线将染色体分割成N个部分,每一个部分对应一个子图像;当然,在一些可能的实施方式中,也可以是根据染色体图像的像素坐标等信息来将染色体图像分割成N个子图像等。也就是说,针对染色体图像的分割方式可以根据实际需要进行确定,此处同样不做具体限定。
本实施例中,染色体检测模型可以是通过训练样本对构建的原始染色体检测神经网络进行训练得到。该染色体检测模块包括预测模块与N个特征提取模块,每一特征提取模块的输入端均可以接收上述的子图像,预测模块的输入端则也可以接收N个特征提取模块输出的内容,且预测模块的输出端可以输出上述的染色体检测结果。此处的染色体检测结果,可以是指染色体的核型、极性等,具体将在下文中进行说明。
以上N个特征提取模块,对应的网络框架与网络参数均可以是相同的,也可以存在差异,能够对输入的子图像进行特征的提取即可。容易理解的是,本实施例中,特征提取模块的输入并非是整条染色体的图像,而是基于对染色体图像进行分割后得到的子图像,如此,一方面,可以对染色体的不同部分进行聚焦,提高对染色体各部分的关注度及特征利用率,另一方面,可以在训练得到染色体检测模型的过程中,将任一个样本染色体图像,分割成多个样本子图像,增加训练样本的数量;进而可以减轻染色体检测模型过拟合的问题,提升染色体检测模型的鲁棒性。
本发明实施例提供的染色体检测方法,将获取的染色体图像分割成N个子图像,将N个子图像输入到染色体检测模型中,该染色体检测模块具有N个用于对应接收N个子图像的N个特征提取模块,以及用于接收N个特征提取模块的输出的预测模块,预测模块则可以进一步输出染色体检测结果。本发明实施例将染色体图像分割N个子图像,相较于现有技术中针对整条染色体输入到神经网络中进行检测的方式,可以针对染色体各个部分进行聚焦,提高对染色体各部分的关注度及特征利用率,同时,可以在训练得到染色体检测模型的过程中,增加训练样本的数量;进而可以减轻染色体检测模型过拟合的问题,提升染色体检测模型的鲁棒性以及染色体检测的准确性。
在一个示例中,针对染色体图像的分割,具体可以采用如下方式进行:基于细化算法对染色体图像进行处理得到骨架线,基于骨架线上三等分将染色体切成三个部分,每一部分对应一个上述的子图像。
细化算法一般指二值图像的骨架化的算法,基于细化算法对染色体图像进行处理得到骨架线,属于细化算法在染色体检测领域中的常规应用,此处不再赘述。
值得强调的是,本示例中所示的三等分的分割方式,仅仅是染色体图像分割的一种可行方式的举例,实际应用中,可以将染色体分割成其他数量的等分,或者,并非是按照等分的方式进行分割,而是按照预设的长度比例进行分割等。换而言之,染色体图像的分割方式可以根据实际需要进行选定。
可选地,所述预测模块包括核型预测单元,所述染色体检测结果包括染色体核型;
所述步骤102,将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,包括:
将所述N个子图像输入分别对应输入到所述N个特征提取模块中,得到N个特征集;
将所述N个特征集输入到所述核型预测单元中,得到所述染色体核型。
上述染色体核型,可以是指染色体的长度、条纹等内容。本实施例中,各个特征提取模块可以针对对应的子图像进行特征提取,获得相应的特征集,核型预测单元则可以接收N个特征提取模块输出的N个特征集,并通过例如逻辑回归等方式对N个特征集进行处理,得到染色体核型。
本实施例中,通过对染色体核型进行检测,有助于后续进一步实现染色体编号判断、同源染色体配对等操作。
可选地,为进一步提高染色体核型的检测准确度,所述将所述N个特征集输入到所述核型预测单元中,得到所述染色体核型,包括:
通过所述核型预测单元分别针对所述N个特征集中的每一特征集进行预测,得到N个初始预测结果;
通过所述核型预测单元根据所述N个初始核型预测结果,以及每一所述初始核型预测结果的预设权重进行计算,得到染色体核型。
本实施例可以认为是对核型预测单元的一种优选工作方式进行了限定。具体来说,核型预测单元可以分别针对每一特征集进行染色体核型的预测,得到N个初始预测结果,并针对N个初始预测结果进行复合判断,得到最终用于输出的染色体核型。
举例来说,若N=3,且三个特征集分别记为特征集A、特征集B以及特征集C,分别对应为三个特征提取模块的输出;染色体核型通过染色体编号的方式进行体现。
设核型预测单元针对三个特征集分别进行预测得到的三个初始预测结果为:其中,/>表示针对特征集A进行预测得到染色体为1号染色体的概率值,/>表示针对特征集B进行预测得到染色体为1号染色体的概率值,/>表示针对特征集C进行预测得到染色体为1号染色体的概率值。
每一概率值可以对应有一预设权重;当然,实际应用中,预设权重可以是针对不同特征提取模块赋予的权重。例如,三个概率值的预设权重分别为0.3、0.4、0.3,则核型预测单元针对初始预测结果与预设权重计算得到的结果为:染色体为1号染色体的概率为0.3×0.9+0.4×0.95+0.3×0.8=0.89;进一步地,若存在一概率阈值0.8,由于此处通过权重运算得到的概率值0.89大于概率阈值,因此,可以判定染色体为1号染色体,即对应了上述的染色体核型。
当然,以上只是对核型预测单元的工作过程的一种举例说明,实际应用中染色体核型的体现方式,也可以是长度、带纹比重等;上述预设权重也可以根据实际需要进行设置等。
可选地,所述预测模块还包括极性预测单元,所述染色体检测结果还包括染色体极性;
所述将所述N个子图像输入分别对应输入到所述N个特征提取模块中,得到N个特征集之后,所述方法还包括:
将所述N个特征集输入到所述极性预测单元中,得到染色体极性。
对于染色体极性,通常可以指关于形态或者生理等方面的极性,例如,在形态下,染色体基于着丝点位置可以在长度延伸方向上分别长臂与短臂。
本实施例中,通过预测得到染色体极性,可以得到染色体的具体延伸方向,例如,是否为短臂在上,长臂在下;进而有助于在不同染色单体之间进行特征的准确比对,避免因比对起始端不同导致的比对错误;除此以外,也有助于在对染色体进行展示时,保证染色体之间延伸方向的一致性,便于用户进行观察与校正。
可选地,所述N个子图像中每一子图像均具有对应图像序号;
所述将所述N个特征集输入到所述极性预测单元中,得到染色体极性,包括:
通过所述极性预测单元根据每一所述特征集对应的子图像的图像序号,对所述N个特征集进行合并,得到合并结果;
通过所述极性预测单元基于所述合并结果进行预测,得到所述染色体极性。
本实施例中,考虑到N个子图像之间通常具有固定的排列顺序,通过赋予对应的图像序号,有助于对后续对N个特征集合进行合并时,确定N个特征集的合并顺序;进一步地,极性预测单元针对合并结果进行预测时,得到的染色体极性也能够与染色体图像中的染色体的具体延伸方向进行匹配。
当然,在实际应用中,N个特征提取模块也可以具有对应的序号,根据子图像的序号与特征提取模块的序号,可以将N个子图像匹配输入至对应的特征提取模块中;后续极性预测单元在合并N个特征集时,可以直接根据输出各个特征集的各个特征提取模块的序号,确定N个特征集的合并顺序。
可选地,如图2所示,所述步骤102,将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,包括:
步骤201,通过第一特征提取模块对第一子图像进行卷积处理,得到第一卷积图像,其中,所述第一特征提取模块为所述N个特征提取模块中的任一个特征提取模块,所述第一子图像为所述N个子图像中与所述第一特征提取模块对应的子图像;
步骤202,通过所述第一特征提取模块随机生成第一掩模,并根据所述第一卷积图像与所述第一掩模生成第一处理图像;
步骤203,通过所述第一特征提取模块基于所述第一处理图像进行特征提取,得到第一特征集;
步骤204,将所述N个子图像对应的N个所述第一特征集输入到所述预测模块中,得到所述染色体检测结果。
本实施例,可以用特定的图像或物体,对待处理的图像的局部或全部进行遮挡,来控制图像处理的区域或处理过程;其中,由于遮挡的特定图像或物体称为掩模,即对应了上述的第一掩模。本实施例中,第一掩模的生成可以是随机的,通过第一掩模可以从第一卷积图像中提取出有效区域,得到第一处理图像。
本发明实施例中在特征提取模块中加入了掩模处理的过程;容易理解的是,特征提取模块作为染色体检测模型的组成部分,是基于训练样本进行训练而得到的;在使用训练样本训练得到染色体检测模型的过程中,由于加入了随机的掩模,相当于使得训练样本之间的重复度有所降低,提高了训练样本集的质量,进而可以有效避免染色体检测模型出现过拟合的情况,提升染色体检测模型的鲁棒性。
如图3所示,在一个示例中,每一特征提取模块均包括卷积层、掩模单元(PartialUnit)、非饱和激活函数层(Leaky Relu)以及多尺度均值特征提取层(Multilevelmeanvaluefeatures)。其中,卷积层可以是一基网络为32个大小为3×3,填充宽度为1步长为1的卷积网络(记为Cnov 3×3padding=1stride=1),Partial Unit通过随机生成有效区域掩模增强染色体检测模型的鲁棒性,Partial Unit的计算过程可以表示为:
其中,x′(i,j)为第一处理图像中坐标为(i,j)的像素点(以下简称第一像素点)的值;W为染色体检测模型中的网络参数,在训练得到染色体检测模型的过程中,该网络参数通常会实时调整,而在训练完成后,可以认为是固定值;X(i,j)为第一卷积图像中与第一像素点关联的像素矩阵;M(i,j)为第一像素点关联的掩模的矩阵;为求取张量积,||||为求取范数的运算,具体求取方式此处不做限定,可以认为是一归一化的过程,r(i,j)为与第一像素点关联的比重值。
掩模单元输入的第一处理图像再经过一次Leaky Relu的激活层,并提取多尺度均值特征后,输入到所述预测模块中,得到染色体检测结果。
为便于理解整个染色体检测模型的工作原理,本示例中继续结合以上实施例中提到的预测模块进行说明。
同样参见图3,预测模块包括核型预测单元与极性预测单元。
其中,核型预测单元包括:3个全连接&逻辑回归层(FC&Sofrmax)与复合判断层(Compoundjudgement);3个全连接&逻辑回归层用于分别生成3个初始预测结果,而复合判断层则根据预设权重对多个初始预测结果进行合并,输出染色体核型(Type);
极性预测单元包括合并层(concat)与一个全连接&逻辑回归层(FC&Sofrmax),合并层用于将3组多尺度均值特征进行合并,并将合并结果输入至全连接&逻辑回归层,并最终输出染色体极性(vertical)。
可选地,所述将所述N个子图像输入到染色体检测模型中,得到染色体检测结果之后,所述方法还包括:
依据所述染色体检测结果,生成初始同源染色体配对结果,其中,所述染色体检测结果包括染色体的形态信息,所述初始同源染色体配对结果包括每一所述染色体的初始编号;
分别获取每一所述染色体对应的第一先验数据,在存在形态信息与所述对应的第一先验数据不匹配的第一染色体的情况下,将所述第一染色体输入到备选集合中,其中,所述第一先验数据为与对应的所述染色体的初始编号匹配的先验数据;
分别获取每一第二染色体对应的至少一个第二先验数据,在全部所述第二染色体中存在形态信息与所述对应的至少一个第二先验数据中的任一所述第二先验数据匹配的第三染色体的情况下,将所述第三染色体的初始编号更新为所述任一所述第二先验数据对应的编号,所述第二染色体为所述染色体检测结果中的全部染色体中除所述第一染色体以外的染色体,所述第二先验数据为与对应的所述染色体的初始编号的相邻编号匹配的先验数据;
从所述更新后的所述初始编号中确定对应染色体数量少于2的全部目标编号,获取每一所述目标编号对应的第三先验数据,依据所述第三先验数据,确定所述备选集合中的所述第一染色体的编号。
在一个具体应用场景中,对于人类染色体,初始同源染色体配对结果可以是如图4所示的配对结果,从图4中可见,基于染色体检测结果直接生成的初始同源染色体配对结果并不够准确,而现有技术中,通常通过人工介入的方式进行配对结果的修改。
本实施例中,使用先验知识,也就是上文中提到的各类先验数据,对初始同源染色体配对结果进行修改,可以有效提高最终得到的同源染色体配对结果的准确度。
具体来说,初始同源染色体配对结果中,实质上是为每一染色体赋予了相应的初始编号(每一种编号可以对应一种核型),配对结果即将相同初始编号的染色体进行整合;而初始编号确定的依据,可以是染色体检测结果中的染色体的形态信息(记为第一形态信息),例如染色体的长度,带纹的比重以及染色体检测模型输出的高纬特征等。相似地,先验数据也可以包括了这些形态信息(记为第二形态信息),并且将染色体编号与第二形态信息进行了关联。
基于以上说明,可以认为本实施例针对初始同源染色体配对结果进行了三次染色体的遍历,具体地:
第一次遍历中,根据某一条染色体的初始编号,确定与初始编号对应的染色体的第二形态信息(此时对应第一先验数据),再将该条染色体的第一形态信息与对应的第二形态信息进行比对,若比对的结果显示差异小于阈值,则认为该染色体的初始编号是正确的,若比对的结果显示差异大于阈值,则认为该染色体的初始编号是错误的,并将该染色体(即第一染色体)输入到备选集合中;
第二次遍历则主要针对备选集合之外的染色体进行遍历,对应某一条染色体,设对应的初始编号为3号,则可以将该染色体的第一形态信息分别与上述相邻2号染色体、4号染色体的第二形态信息(此时对应第二先验数据)进行比对,判断是否存在错误拜访的染色体,若有,例如,若该染色体的第一形态信息与2号染色体的第二形态信息匹配,则将该染色体的编号更新为2号。当然,相邻编号的确定,可以根据实际需要进行确定,例如,对于3号染色体,此处需要确定的相邻编号,可以是上述的2号和4号,也可以是单独的2号或单独的4号,也可以是1号、2号、4号以及5号。
经过前两次遍历,基本上可以排除某一染色体编号下存在三条以上染色体的情况,但可能存在某一染色体编号下不足2条染色体的情况;因此,在第三次遍历中,确定出对应染色体数量少于2的全部目标编号,利用目标编号对应染色体的第二形态信息(此时对应第三先验数据),从备选集合中筛选出第一形态信息符合此处的第二形态信息的染色体,并赋予其新的编号。
通过以上处理过程,可以比较准确对为各个染色体确定相应的染色体编号,即比较准确地判断出各个染色体的核型,并可以根据各个染色体的核型实现同源染色体的准确配对与标定;最终的配对与标定结合可参见图5,从中可见,排除了某一染色体编号下存在3条以上染色体的情况,标定结果更加准确合理。
当然,可以理解的是,图4与图5中示出了人类同源染色体的标定,总共分为23对染色体;以上实施例提供的染色体检测方法同样可以应用到其它动植物中,相应得到的同源染色体的对数可能会相应变化。
本发明实施例还提供了一种染色体检测装置,包括:
分割模块601,用于将获取的染色体图像分割成N个子图像,N为大于1的整数;
检测模块602,将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果。
可选地,所述预测模块包括核型预测单元,所述染色体检测结果包括染色体核型;
所述检测模块602,包括:
第一获取单元,用于将所述N个子图像输入分别对应输入到所述N个特征提取模块中,得到N个特征集;
第二获取单元,用于将所述N个特征集输入到所述核型预测单元中,得到所述染色体核型。
可选地,所述第二获取单元,包括:
第一获取子单元,用于通过所述核型预测单元分别针对所述N个特征集中的每一特征集进行预测,得到N个初始预测结果;
第二获取子单元,用于通过所述核型预测单元根据所述N个初始核型预测结果,以及每一所述初始核型预测结果的预设权重进行计算,得到染色体核型。
可选地,所述预测模块还包括极性预测单元,所述染色体检测结果还包括染色体极性;
所述检测模块602还包括:
第三获取单元,用于将所述N个特征集输入到所述极性预测单元中,得到染色体极性。
可选地,所述N个子图像中每一子图像均具有对应图像序号;
所述第三获取单元,包括:
第三获取子单元,用于通过所述极性预测单元根据每一所述特征集对应的子图像的图像序号,对所述N个特征集进行合并,得到合并结果;
第四获取子单元,用于通过所述极性预测单元基于所述合并结果进行预测,得到所述染色体极性。
可选地,所述检测模块602,包括:
第四获取单元,用于通过第一特征提取模块对第一子图像进行卷积处理,得到第一卷积图像,其中,所述第一特征提取模块为所述N个特征提取模块中的任一个特征提取模块,所述第一子图像为所述N个子图像中与所述第一特征提取模块对应的子图像;
生成单元,用于通过所述第一特征提取模块随机生成第一掩模,并根据所述第一卷积图像与所述第一掩模生成第一处理图像;
第五获取单元,用于通过所述第一特征提取模块基于所述第一处理图像进行特征提取,得到第一特征集;
第六获取单元,用于将所述N个子图像对应的N个所述第一特征集输入到所述预测模块中,得到所述染色体检测结果。
可选地,所述装置还包括:
生成模块,用于依据所述染色体检测结果,生成初始同源染色体配对结果,其中,所述染色体检测结果包括染色体的形态信息,所述初始同源染色体配对结果包括每一所述染色体的初始编号;
获取输入模块,用于分别获取每一所述染色体对应的第一先验数据,在存在形态信息与所述对应的第一先验数据不匹配的第一染色体的情况下,将所述第一染色体输入到备选集合中,其中,所述第一先验数据为与对应的所述染色体的初始编号匹配的先验数据;
获取更新模块,用于分别获取每一第二染色体对应的至少一个第二先验数据,在全部所述第二染色体中存在形态信息与所述对应的至少一个第二先验数据中的任一所述第二先验数据匹配的第三染色体的情况下,将所述第三染色体的初始编号更新为所述任一所述第二先验数据对应的编号,所述第二染色体为所述染色体检测结果中的全部染色体中除所述第一染色体以外的染色体,所述第二先验数据为与对应的所述染色体的初始编号的相邻编号匹配的先验数据;
获取确定模块,用于从所述更新后的所述初始编号中确定对应染色体数量少于2的全部目标编号,获取每一所述目标编号对应的第三先验数据,依据所述第三先验数据,确定所述备选集合中的所述第一染色体的编号。
需要说明的是,该染色体检测装置是与上述染色体检测方法对应的电子设备,上述方法实施例中所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
可选地,本发明实施例还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的染色体检测方法。
可选地,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的染色体检测方法。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (9)
1.一种染色体检测方法,其特征在于,包括:
将获取的染色体图像分割成N个子图像,N为大于1的整数;
将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果;
依据所述染色体检测结果,生成初始同源染色体配对结果,其中,所述染色体检测结果包括染色体的形态信息,所述初始同源染色体配对结果包括每一所述染色体的初始编号;
分别获取每一所述染色体对应的第一先验数据,在存在形态信息与所述对应的第一先验数据不匹配的第一染色体的情况下,将所述第一染色体输入到备选集合中,其中,所述第一先验数据为与对应的所述染色体的初始编号匹配的先验数据;
分别获取每一第二染色体对应的至少一个第二先验数据,在全部所述第二染色体中存在形态信息与所述对应的至少一个第二先验数据中的任一所述第二先验数据匹配的第三染色体的情况下,将所述第三染色体的初始编号更新为所述任一所述第二先验数据对应的编号,所述第二染色体为所述染色体检测结果中的全部染色体中除所述第一染色体以外的染色体,所述第二先验数据为与对应的所述染色体的初始编号的相邻编号匹配的先验数据;
从更新后的所述初始编号中确定对应染色体数量少于2的全部目标编号,获取每一所述目标编号对应的第三先验数据,依据所述第三先验数据,确定所述备选集合中的所述第一染色体的编号。
2.根据权利要求1所述的方法,其特征在于,所述预测模块包括核型预测单元,所述染色体检测结果包括染色体核型;
所述将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,包括:
将所述N个子图像输入分别对应输入到所述N个特征提取模块中,得到N个特征集;
将所述N个特征集输入到所述核型预测单元中,得到所述染色体核型。
3.根据权利要求2所述的方法,其特征在于,所述将所述N个特征集输入到所述核型预测单元中,得到所述染色体核型,包括:
通过所述核型预测单元分别针对所述N个特征集中的每一特征集进行预测,得到N个初始核型预测结果;
通过所述核型预测单元根据所述N个初始核型预测结果,以及每一所述初始核型预测结果的预设权重进行计算,得到染色体核型。
4.根据权利要求2所述的方法,其特征在于,所述预测模块还包括极性预测单元,所述染色体检测结果还包括染色体极性;
所述将所述N个子图像输入分别对应输入到所述N个特征提取模块中,得到N个特征集之后,所述方法还包括:
将所述N个特征集输入到所述极性预测单元中,得到染色体极性。
5.根据权利要求4所述的方法,其特征在于,所述N个子图像中每一子图像均具有对应图像序号;
所述将所述N个特征集输入到所述极性预测单元中,得到染色体极性,包括:
通过所述极性预测单元根据每一所述特征集对应的子图像的图像序号,对所述N个特征集进行合并,得到合并结果;
通过所述极性预测单元基于所述合并结果进行预测,得到所述染色体极性。
6.根据权利要求1所述的方法,其特征在于,所述将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,包括:
通过第一特征提取模块对第一子图像进行卷积处理,得到第一卷积图像,其中,所述第一特征提取模块为所述N个特征提取模块中的任一个特征提取模块,所述第一子图像为所述N个子图像中与所述第一特征提取模块对应的子图像;
通过所述第一特征提取模块随机生成第一掩模,并根据所述第一卷积图像与所述第一掩模生成第一处理图像;
通过所述第一特征提取模块基于所述第一处理图像进行特征提取,得到第一特征集;
将所述N个子图像对应的N个所述第一特征集输入到所述预测模块中,得到所述染色体检测结果。
7.一种染色体检测装置,其特征在于,包括:
分割模块,用于将获取的染色体图像分割成N个子图像,N为大于1的整数;
检测模块,用于将所述N个子图像输入到染色体检测模型中,得到染色体检测结果,其中,所述染色体检测模型包括预测模块与N个特征提取模块,所述N个特征提取模块与所述N个子图像一一对应,所述N个特征提取模块的输入端用于接收所述N个子图像,所述N个特征提取模块的输出端均连接至所述预测模块的输入端,所述预测模块的输出端用于输出所述染色体检测结果;
生成模块,用于依据所述染色体检测结果,生成初始同源染色体配对结果,其中,所述染色体检测结果包括染色体的形态信息,所述初始同源染色体配对结果包括每一所述染色体的初始编号;
获取输入模块,用于分别获取每一所述染色体对应的第一先验数据,在存在形态信息与所述对应的第一先验数据不匹配的第一染色体的情况下,将所述第一染色体输入到备选集合中,其中,所述第一先验数据为与对应的所述染色体的初始编号匹配的先验数据;
获取更新模块,用于分别获取每一第二染色体对应的至少一个第二先验数据,在全部所述第二染色体中存在形态信息与所述对应的至少一个第二先验数据中的任一所述第二先验数据匹配的第三染色体的情况下,将所述第三染色体的初始编号更新为所述任一所述第二先验数据对应的编号,所述第二染色体为所述染色体检测结果中的全部染色体中除所述第一染色体以外的染色体,所述第二先验数据为与对应的所述染色体的初始编号的相邻编号匹配的先验数据;
获取确定模块,用于从更新后的所述初始编号中确定对应染色体数量少于2的全部目标编号,获取每一所述目标编号对应的第三先验数据,依据所述第三先验数据,确定所述备选集合中的所述第一染色体的编号。
8.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010774367.4A CN112037173B (zh) | 2020-08-04 | 2020-08-04 | 染色体检测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010774367.4A CN112037173B (zh) | 2020-08-04 | 2020-08-04 | 染色体检测方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112037173A CN112037173A (zh) | 2020-12-04 |
CN112037173B true CN112037173B (zh) | 2024-04-05 |
Family
ID=73581926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010774367.4A Active CN112037173B (zh) | 2020-08-04 | 2020-08-04 | 染色体检测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112037173B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112711983A (zh) * | 2020-12-08 | 2021-04-27 | 湖南自兴智慧医疗科技有限公司 | 核型分析系统、方法、电子设备及可读存储介质 |
CN115330603B (zh) * | 2022-10-17 | 2023-01-20 | 湖南自兴智慧医疗科技有限公司 | 基于深度学习卷积神经网络的人类染色体图像摆正方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038435A (zh) * | 2017-12-04 | 2018-05-15 | 中山大学 | 一种基于卷积神经网络的特征提取与目标跟踪方法 |
CN109754391A (zh) * | 2018-12-18 | 2019-05-14 | 北京爱奇艺科技有限公司 | 一种图像质量评价方法、装置及电子设备 |
CN110390676A (zh) * | 2019-07-26 | 2019-10-29 | 腾讯科技(深圳)有限公司 | 显微镜下医学染色图像的细胞检测方法、智能显微镜系统 |
CN110533684A (zh) * | 2019-08-22 | 2019-12-03 | 杭州德适生物科技有限公司 | 一种染色体核型图像切割方法 |
CN110533672A (zh) * | 2019-08-22 | 2019-12-03 | 杭州德适生物科技有限公司 | 一种基于条带识别的染色体排序方法 |
CN110555390A (zh) * | 2019-08-09 | 2019-12-10 | 厦门市美亚柏科信息股份有限公司 | 基于半监督训练方式的行人重识别方法、装置及介质 |
WO2020042704A1 (zh) * | 2018-08-27 | 2020-03-05 | 杭州德适生物科技有限公司 | 一种基于深度学习的染色体识别方法 |
CN111325739A (zh) * | 2020-02-28 | 2020-06-23 | 北京推想科技有限公司 | 肺部病灶检测的方法及装置,和图像检测模型的训练方法 |
-
2020
- 2020-08-04 CN CN202010774367.4A patent/CN112037173B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038435A (zh) * | 2017-12-04 | 2018-05-15 | 中山大学 | 一种基于卷积神经网络的特征提取与目标跟踪方法 |
WO2020042704A1 (zh) * | 2018-08-27 | 2020-03-05 | 杭州德适生物科技有限公司 | 一种基于深度学习的染色体识别方法 |
CN109754391A (zh) * | 2018-12-18 | 2019-05-14 | 北京爱奇艺科技有限公司 | 一种图像质量评价方法、装置及电子设备 |
CN110390676A (zh) * | 2019-07-26 | 2019-10-29 | 腾讯科技(深圳)有限公司 | 显微镜下医学染色图像的细胞检测方法、智能显微镜系统 |
CN110555390A (zh) * | 2019-08-09 | 2019-12-10 | 厦门市美亚柏科信息股份有限公司 | 基于半监督训练方式的行人重识别方法、装置及介质 |
CN110533684A (zh) * | 2019-08-22 | 2019-12-03 | 杭州德适生物科技有限公司 | 一种染色体核型图像切割方法 |
CN110533672A (zh) * | 2019-08-22 | 2019-12-03 | 杭州德适生物科技有限公司 | 一种基于条带识别的染色体排序方法 |
CN111325739A (zh) * | 2020-02-28 | 2020-06-23 | 北京推想科技有限公司 | 肺部病灶检测的方法及装置,和图像检测模型的训练方法 |
Non-Patent Citations (3)
Title |
---|
A survey of neural network based automated systems for human chromosome classification;Faroudja Abid & Latifa Hamami;Artificial Intelligence Review;全文 * |
基于深度卷积神经网络对中期染色体分类的应用研究;张成成;宋婕萍;徐淑琴;李卉;徐闰红;王小艳;张立;游齐靖;张凯;林浩添;;中国临床新医学(第02期);全文 * |
张成成等.基于深度卷积神经网络对中期染色体分类的应用研究.中国临床新医学.2020,第13卷(第2期),123-126. * |
Also Published As
Publication number | Publication date |
---|---|
CN112037173A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111780763B (zh) | 一种基于视觉地图的视觉定位方法、装置 | |
JP7058373B2 (ja) | 医療画像に対する病変の検出及び位置決め方法、装置、デバイス、及び記憶媒体 | |
CN112052787B (zh) | 基于人工智能的目标检测方法、装置及电子设备 | |
CN106815859B (zh) | 基于尺度自适应相关滤波和特征点匹配的目标跟踪算法 | |
CN111814741B (zh) | 一种基于注意力机制的遮挡胚胎原核及卵裂球检测方法 | |
CN112069874B (zh) | 胚胎光镜图像中细胞的识别方法及系统、设备及存储介质 | |
CN107633226B (zh) | 一种人体动作跟踪特征处理方法 | |
CN112037173B (zh) | 染色体检测方法、装置及电子设备 | |
US11967181B2 (en) | Method and device for retinal image recognition, electronic equipment, and storage medium | |
CN111144215B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN112836756B (zh) | 图像识别模型训练方法、系统和计算机设备 | |
CN115424101A (zh) | 病害识别方法、装置、设备及存储介质 | |
WO2023151237A1 (zh) | 人脸位姿估计方法、装置、电子设备及存储介质 | |
WO2021058867A1 (en) | Image analysis in pathology | |
CN106204597A (zh) | 一种基于自步式弱监督学习的视频物体分割方法 | |
CN114639102A (zh) | 基于关键点与尺寸回归的细胞分割方法和装置 | |
CN115797929A (zh) | 基于双注意力机制的小型农田图像分割方法、装置 | |
CN110007764B (zh) | 一种手势骨架识别方法、装置、系统及存储介质 | |
CN111738164A (zh) | 一种基于深度学习的行人检测方法 | |
CN113487610B (zh) | 疱疹图像识别方法、装置、计算机设备和存储介质 | |
CN114140395A (zh) | 肺部纤维化智能判定方法 | |
CN117495735A (zh) | 一种基于结构引导的建筑物立面纹理自动修复方法及系统 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN111027551B (zh) | 图像处理方法、设备和介质 | |
CN109902720B (zh) | 基于子空间分解进行深度特征估计的图像分类识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |