CN117995317A - 一种基于电子密度图预估重原子位置的方法、装置和介质 - Google Patents
一种基于电子密度图预估重原子位置的方法、装置和介质 Download PDFInfo
- Publication number
- CN117995317A CN117995317A CN202410396914.8A CN202410396914A CN117995317A CN 117995317 A CN117995317 A CN 117995317A CN 202410396914 A CN202410396914 A CN 202410396914A CN 117995317 A CN117995317 A CN 117995317A
- Authority
- CN
- China
- Prior art keywords
- coordinate point
- grid
- grids
- foreground
- electron density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000010606 normalization Methods 0.000 claims abstract description 8
- 238000012216 screening Methods 0.000 claims abstract description 6
- 238000004891 communication Methods 0.000 claims description 38
- 230000008569 process Effects 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 8
- 102000004169 proteins and genes Human genes 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种基于电子密度图预估重原子位置的方法、装置和介质,该方法包括:获取三维电子密度图的电子密度数据;将各个坐标点所对应的电子密度值进行归一化处理;对归一化处理后的各个坐标点的像素值进行二值化处理;将三维电子密度图所对应的三维空间区域划分为子网格;根据各个子网格内的连通区域的空间分布情况筛选出各个子网格中的候选网格;依据距离参数对各个候选网格进行聚类;基于各个聚类网格所占据的空间大小,确定与重原子相对应的聚类网格;基于与重原子相对应的聚类网格所对应的空间区域,确定重原子中心位置;因此本申请的基于电子密度图预估重原子位置的方法能够自动以较短的时间从电子密度图数据中获取重原子位置。
Description
技术领域
本申请涉及生物物理学与机器视觉技术领域,具体地,涉及电子密度图的可视化与分析,更具体地,涉及一种基于电子密度图预估重原子位置的方法、装置和介质。
背景技术
在生物物理学领域,对生物大分子以及蛋白质的结构进行解析的相关技术可应用于靶标蛋白的新药设计等。电子密度图用来表示分子中电子在空间中的分布情况,对电子密度图图像数据用机器视觉算法进行分析可辅助研究人员的研究工作。电子密度图数据反映的是蛋白质分子的三维结构,蛋白质在生物体中的实际作用通常可由其三维结构决定,例如对特定疾病的免疫能力及某些遗传疾病的形成。研究人员快速获取及分析蛋白质的三维结构,使其能更快理解及分析蛋白质在生物体中的功能和作用。
生物分子结构分析软件如Coot等,主要用于模拟、可视化和分析生物大分子结构,尤其是蛋白质和核酸结构,但是无法得到生物大分子结构的重原子位置。研究及工程人员通过分析电子密度图数据得到重原子位置的方法效率及便利性较低。
发明内容
提供了本申请以解决现有技术中存在的上述缺陷。需要一种基于电子密度图预估重原子位置的方法、装置和介质,能够自动从电子密度图数据中获取到重原子位置,在不影响最终效果的基础上大大减少了计算量,在电子密度图的数据量较大的情况下也能以较短的时间获得重原子位置的结果,还能够提高准确性。
根据本申请的第一方案,提供了一种基于电子密度图预估重原子位置的方法,所述方法包括如下步骤。获取三维电子密度图的电子密度数据,所述电子密度数据包括所述三维电子密度图上的各个坐标点所对应的电子密度值。将各个坐标点所对应的电子密度值进行归一化处理,使得各个坐标点所对应的所述电子密度值转换为像素值。对所述归一化处理后的各个坐标点的像素值进行二值化处理,得到所述电子密度图的各个坐标点所对应的二值化的像素值,使得所述各个坐标点被划分为前景坐标点和背景坐标点。将所述三维电子密度图所对应的三维空间区域划分为子网格。基于所述子网格内的前景坐标点,搜索能够构成连通区域的连通点,得到所述子网格内所包含的连通区域,根据各个子网格内的连通区域的空间分布情况筛选出各个子网格中的候选网格。依据距离参数对所述各个候选网格进行聚类,得到聚类后的聚类网格。基于各个聚类网格所占据的空间大小,确定与重原子相对应的聚类网格。基于与重原子相对应的聚类网格所对应的空间区域,确定重原子的中心位置。
根据本申请的第二方案,提供了一种基于电子密度图预估重原子位置的装置,包括接口和处理器。接口配置为接收三维电子密度图的电子密度数据。处理器配置为执行如本申请任一实施例所述的基于电子密度图预估重原子位置的方法。
根据本申请的第三方案,提供了一种非暂时性计算机可读介质,其上存储有指令,其中当由处理器执行时,其指令执行如本申请任一实施例所述的基于电子密度图预估重原子位置的方法的步骤。
本申请各个实施例提供的一种基于电子密度图预估重原子位置的方法、装置和介质,将电子密度图上的各个坐标点的电子密度值进行归一化到像素值范围,使得各个坐标点对应到像素点,然后进行二值化处理,将各个像素点划分为前景像素点和背景像素点,以便区分电子密度较大的坐标点和密度较小的坐标点,通过对子网格对候选网格的划分和聚类网格的判断,进一步筛选出符合重原子的聚类网格所对应的的空间区域,最后确定重原子的中心位置,作为重原子的中心位置,因此,能够让研究人员得到重原子的位置以及电子密度图上的重原子的分布,另外重原子的位置的确定方法对电子密度图数据进行了归一化和二值化的预处理,使得在不影响最终效果的基础上大大减少了计算量,在电子密度图的数据量较大的情况下也能以较短的时间获得重原子位置的结果,且准确性较高。
附图说明
在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所申请的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1示出根据本申请实施例的基于电子密度图预估重原子位置的方法的流程图;
图2示出根据本申请实施例的重原子位置的预估结果的示意图;以及
图3示出根据本申请实施例的基于电子密度图预估重原子位置的装置的结构示意图。
具体实施方式
为使本领域技术人员更好的理解本申请的技术方案,下面结合附图和具体实施方式对本申请作详细说明。下面结合附图和具体实施例对本申请的实施例作进一步详细描述,但不作为对本申请的限定。
本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分。“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其他要素的可能。
根据本申请的实施例提供了一种基于电子密度图预估重原子位置的方法。在步骤101,获取三维电子密度图的电子密度数据,所述电子密度数据包括所述三维电子密度图上的各个坐标点所对应的电子密度值。三维电子密度图表示生物大分子中电子在三维空间中的分布情况。重原子是生物大分子中的相对原子质量较大的原子。将三维电子密度图看成是K*M*N大小的三维矩阵,每个坐标点都有对应的电子密度值。
在步骤102,将各个坐标点所对应的电子密度值进行归一化处理,使得各个坐标点所对应的所述电子密度值转换为像素值。各个坐标点对应各个像素点,像素值的范围为[0-255],可以将各个坐标点所对应的电子密度值等比例归一化到0-255之间,使得三维电子密度图的数据灰度化,所以较大的电子密度值对应转换后的像素值也较大,较小的电子密度值对应转换后的像素值也较小,各个坐标点按照像素值的数值由大到小的排序对应按照电子密度值由大到小的排序。
在步骤103,对所述归一化处理后的各个坐标点的像素值进行二值化处理,得到所述电子密度图的各个坐标点所对应的二值化的像素值,使得所述各个坐标点被划分为前景坐标点和背景坐标点。重原子应位于电子密度值较大的坐标点范围内。通过划分,将坐标点区分为电子密度值较大的前景坐标点和电子密度值较小的背景坐标点,这样有利于减少得到重原子位置过程的计算量,减少算法执行的计算时间,数据量较大的三维电子密度图,依然能够较大地减少计算时间。数据量越大的三维电子密度图,越能够体现出计算时间短的优势。具体的,二值化处理方法可以采用otsu(大津)等方法。
在步骤104,将所述三维电子密度图所对应的三维空间区域划分为子网格。例如8*8*8、16*16*16或64*64*64等像素尺寸单元的网格参数对三维电子密度图所对应的三维空间区域进行划分。网格参数的设置方式可以通过固定设置的网格参数来执行,或通过外部接口由操作人员来输入等。通过子网格的划分,有利于准确地确定重原子相对应的区域范围。
在步骤105,基于所述子网格内的前景坐标点,搜索能够构成连通区域的连通点,得到所述子网格内所包含的连通区域,根据各个子网格内的连通区域的空间分布情况筛选出各个子网格中的候选网格。通过子网格内前景坐标点所构成的连通区域的空间分布情况来得到该子网格是否能够构成重原子所对应的位置。通过对各个子网格的筛选,能够筛出不构成重原子所对应的位置的子网格。
在步骤106,依据距离参数对所述各个候选网格进行聚类,得到聚类后的聚类网格。以距离参数为基准,在距离参数以内的候选网格聚类构成一个重原子所属的范围,以准确地界定重原子的范围,得到准确的重原子的位置。
在步骤107,基于各个聚类网格所占据的空间大小,确定与重原子相对应的聚类网格。在选出三维电子密度图范围内的所有聚类网格后,根据所占据的空间大小来筛出一些不符合重原子的所占据的空间大小的聚类网格,进一步能够准确地定位重原子的位置。
在步骤108,基于与重原子相对应的聚类网格所对应的空间区域,确定重原子的中心位置。将整个聚类网格所对应的三维空间区域认为是重原子所对应的空间范围,可以通过坐标计算预估的重原子中心位置,中心位置(x,y,z)的x为该重原子所有前景像素x坐标之和除以前景像素总个数,同理,y为所有前景像素y坐标之和除以前景像素总个数,z为所有前景像素z坐标之和除以前景像素总个数。
因此本申请的基于电子密度图预估重原子位置的方法,能够自动从电子密度图数据中获取到重原子位置,便于研究人员快速得到重原子的位置以及重原子的分布情况。该方法通过对电子密度图的数据进行了像素化和二值化的预处理,能够大大减少计算量,缩短得到重原子位置的时间,即使在电子密度图的数据量较大的情况下依然能以较短的时间获得重原子位置。该方法通过前景和背景的区分,以及各个网格的搜索和判断,能够更为准确地得到重原子的位置。
如图2所示为根据本申请实施例的重原子位置的预估结果的示意图。根据本申请的方法得到重原子所在区域和重原子的中心位置的结果,然后将重原子的中心位置的计算结果绘制到coot等软件图像里,得到图2所示的结果。通过图2可以清晰地看到各个代表重原子的聚类网格以及重原子的中心位置。
在一些实施例中,对所述归一化处理后的各个坐标点的像素值进行二值化处理包括,对各个坐标点进行第一次二值化处理,具体包括如下步骤。分别利用各个坐标点所对应的各个像素值分割各个坐标点,得到前景坐标点和背景坐标点,并得到各个像素值所对应的分割后的前景坐标点与背景坐标点之间的像素值的类间方差值,并选择最大的类间方差值作为第一分割阈值。基于所述第一分割阈值对各个坐标点进行分割处理,得到第一前景坐标点,所述第一前景坐标点为大于分割点对应的像素值的坐标点。
分别以各个坐标点所对应的各个像素值分别作为分割阈值,并得到各个坐标点分别对应的前景坐标点和背景坐标点,这样,能够得到不同分割情况下的前景坐标点和背景坐标点。最大的类间方差值对应分割后的前景坐标点和背景坐标点之间差别最大的情况。以此能够更好地区分电子密度大的坐标点和电子密度小的坐标点,以更准确地筛出重原子所在的位置。
在一些实施例中,分别利用各个坐标点所对应的各个像素值分割各个坐标点,得到前景坐标点和背景坐标点,并得到各个像素值所对应的分割后的前景坐标点与背景坐标点之间的像素值的类间方差值具体包括:利用公式(1)得到各个坐标点所对应的类间方差值;
V=ω0×ω1×(µ0-µ1)2(1);
其中,V表示类间方差值,ω0表示以不同的像素值分割时,前景坐标点占所有坐标点的比例,ω1表示以不同的像素值分割时,背景坐标点占所有坐标点的比例,µ0表示以不同的像素值分割时,各个前景坐标点的平均灰度,µ1表示以不同的像素值分割时,各个背景坐标点的平均灰度。
以三维电子密度图的所有的坐标点的数量为K*M*N为例,ω0=N0/(K*M*N),ω1=N1/(K*M*N)。通过V=ω0×(µ0-µ)2+ω1×(µ1-µ)2,推导得到公式(1),这样能够通过V得到前景像素点和背景像素点的差别情况。即依次取[0,255]之间的像素值分割各个坐标点,总共能够得到256个类间方差值V,选择最大的类间方差值。
在一些实施例中,将第一次分割处理后得到的第一前景坐标点作为待分割的坐标点,进行第二次二值化处理,具体包括如下步骤:分别利用各个待分割的坐标点所对应的各个像素值分割各个待分割的坐标点,得到前景坐标点和背景坐标点,并得到各个待分割的坐标点所对应的各个像素值分割后的前景坐标点与背景坐标点之间的像素值的类间方差值,并选择最大的类间方差值作为第二分割阈值。基于所述第二分割阈值对各个待分割的坐标点进行分割处理,得到第二前景坐标点。第二次二值化处理以第一前景坐标点作为待分割的坐标点范围,以便进一步筛选出电子密度平均值相比第一前景坐标点更大的第二前景坐标点,以更准确地对应重原子范围的坐标点。
在一些实施例中,分别利用各个待分割的坐标点所对应的各个像素值作为分割点,得到各个待分割的坐标点所对应的分割值具体包括:
利用公式(1)得到各个坐标点所对应的类间方差值;
V=ω0×ω1×(µ0-µ1)2(1);
其中,V表示类间方差值,ω0表示以待分割的坐标点所对应的不同像素值分割时,前景坐标点占所有待分割的坐标点的比例,ω1表示以待分割的坐标点所对应的不同像素值分割时,背景坐标点占所有待分割的坐标点的比例,µ0表示以待分割的坐标点所对应的不同像素值分割时,各个前景坐标点的平均灰度,µ1表示以待分割的坐标点所对应的不同像素值分割时,各个背景坐标点的平均灰度。
与第一次分割不同,ω0和ω1分别以第一前景坐标点为总的坐标点数量为基础,µ0对应第一前景坐标点中的前景坐标点的平均灰度,µ1对应第一前景坐标点中的背景坐标点的平均灰度,以从第一前景坐标点中进一步筛选出前景坐标点。
在一些实施例中,基于所述子网格的前景坐标点,搜索能够构成连通区域的连通点,得到所述子网格内所包含的连通区域具体包括如下步骤。基于所述子网格中的任一前景坐标点作为种子点,以递归的方式搜索该种子点在该子网格中邻域位置的所有连通点,并将种子点和所有连通点构成连通区域。在该连通区域外存在前景坐标点的情况下,以任一前景坐标点作为新的种子点,重复搜索过程得到对应的连通区域,直至连通区域外不包括前景坐标点。
对于三维电子密度图的每个子网格,任选子网格中的前景坐标点开始搜索连通点,该前景坐标点为第二前景坐标点。递归的方式搜索邻域的连通点可以包括:搜索种子点的8邻域(可以包括上、下、左、右、左上、左下、右上、右下)范围内的所有前景坐标点作为连通点,然后以各个8邻域内的各个连通点搜索8邻域范围内的所有前景坐标点并作为连通点,直至子网格内的8邻域范围内没有继续搜索到前景坐标点为止,再将种子点和所有连通点构成连通区域。这样能够不遗漏地将各个前景坐标点联系成为有关联的整体。
在8邻域范围外存在前景坐标点的情况下,继续按照上述过程进行搜索,以便将子网格内的所有前景坐标点全部搜索到,并构成连通区域。提高重原子的范围确定的准确性。如果有8邻域范围外存在前景坐标点的情况下,将子网格分为两个或多个连通区域。
在一些实施例中,筛选出子网格中的候选网格具体包括:基于所述子网格中的各个连通区域,得到所述子网格中体积最大的连通区域;所述体积最大的连通区域所对应的体积大于或等于该子网格的体积的三分之一的情况下,则该子网格为候选网格。根据子网格内的连通区域的情况,得到子网格内的各个连通区域所对应的三维体积。在连通区域的体积大于或等于该子网格的体积的三分之一的情况下,认为其符合重原子的特征,并将该子网格作为候选网格。这样能够以小的子网格来得到符合重原子特征的重原子的位置单元,并筛出不符合的子网格。
在一些实施例中,依据距离参数对所述各个候选网格进行聚类,得到聚类后的聚类网格具体包括如下步骤。将所有的候选网格形成集合。以集合中的任一候选网格以第一标记号进行标记,作为初始标记网格,聚类过程包括:将与初始标记网格的距离小于距离参数的候选网格利用第一标记号进行标记,并将第一标记号的候选网格合并到第一类队列中;对每个新加入到类队列中的候选网格作为新的标记网格,重复进行聚类过程,直至集合A中不存在与第一类队列中的标记网格相对应的距离小于距离参数的候选网格,并将所有第一类队列中的候选网格从集合中删除。在删除第一类队列的所有候选网格后的集合中存在候选网格的情况下,重复进行聚类的过程,得到各个类队列,并将各个类队列中的所有候选网格作为聚类网格。
符合重原子特征的子网格形成集合,并对集合中的各个子网格进行聚类。先以任一候选网格为开始,以距离参数为判断标准,小于距离参数认为是同一原子。以类队列为基准删除已经归类的候选网格。再以集合中剩下的候选网格进行归类,直至集合中没有候选网格,得到多个独立的聚类网格。这样以集合中的候选网格为基础形成多个可能是重原子区域的空间范围,且该空间范围以各个候选网格为基本单元,更加准确地得到重原子的位置。
在一些实施例中,基于各个聚类网格,确定与重原子相对应的聚类网格具体包括如下步骤。确定各个聚类网格中所包含的前景坐标点的数量。基于各个聚类网格所对应的前景坐标点的数量,确定前景坐标点的数量大于子网格所对应的网格体积参数的聚类网格,并将其作为重原子所对应的聚类网格。由于子网格内还包括一些非前景坐标点,聚类后的聚类网格中前景坐标点的数量大于子网格所对应的网格大小的情况下,例如子网格的网格大小为8*8*8,聚类网格中的前景坐标点数量大于512,能够说明聚类网格包含较多的电子密度较大的坐标点,该聚类网格可作为重原子所对应的区域。这样能够进一步筛出不属于重原子的聚类网格,使得重原子的位置更加清晰和准确。
根据本申请的实施例还提供一种基于电子密度图预估重原子位置的装置。图3示出根据本申请实施例的基于电子密度图预估重原子位置的装置的结构示意图。装置300包括接口301和处理器302。接口301配置为接收三维电子密度图的电子密度数据。处理器302配置为执行如本申请任一实施例所述的基于电子密度图预估重原子位置的方法。因此本申请的基于电子密度图预估重原子位置的装置,能够自动从电子密度图数据中获取到重原子位置,便于研究人员快速得到重原子的位置以及重原子的分布情况。该装置通过对电子密度图的数据进行了像素化和二值化的预处理,能够大大减少计算量,缩短得到重原子位置的时间,即使在电子密度图的数据量较大的情况下依然能以较短的时间获得重原子位置。该装置通过前景和背景的区分,以及各个网格的搜索和判断,能够更为准确地得到重原子的位置。
本申请中的处理器302 可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等。更具体地,该处理器可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。该处理器还可以是一个以上专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上系统(SoC)等。处理器可以通信地耦合到存储器并且被配置为执行存储在其上的计算机可执行指令。
根据本申请的实施例还提供一种非暂时性计算机可读介质,其上存储有指令,其中当由处理器执行时,其指令执行如本申请任一实施例所述的基于电子密度图预估重原子位置的方法的步骤。所述介质在执行时能够自动从电子密度图数据中获取到重原子位置,便于研究人员快速得到重原子的位置以及重原子的分布情况。能够大大减少计算量,缩短得到重原子位置的时间,即使在电子密度图的数据量较大的情况下依然能以较短的时间获得重原子位置,且能够更为准确地得到重原子的位置。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本申请的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本申请。这不应解释为一种不要求保护的申请的特征对于任一权利要求是必要的意图。相反,本申请的主题可以少于特定的申请的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本申请的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。
Claims (12)
1.一种基于电子密度图预估重原子位置的方法,其特征在于,所述方法包括:
获取三维电子密度图的电子密度数据,所述电子密度数据包括所述三维电子密度图上的各个坐标点所对应的电子密度值;
将各个坐标点所对应的电子密度值进行归一化处理,使得各个坐标点所对应的所述电子密度值转换为像素值;
对所述归一化处理后的各个坐标点的像素值进行二值化处理,得到所述电子密度图的各个坐标点所对应的二值化的像素值,使得所述各个坐标点被划分为前景坐标点和背景坐标点;
将所述三维电子密度图所对应的三维空间区域划分为子网格;
基于所述子网格内的前景坐标点,搜索能够构成连通区域的连通点,得到所述子网格内所包含的连通区域,根据各个子网格内的连通区域的空间分布情况筛选出各个子网格中的候选网格;
依据距离参数对所述各个候选网格进行聚类,得到聚类后的聚类网格;
基于各个聚类网格所占据的空间大小,确定与重原子相对应的聚类网格;
基于与重原子相对应的聚类网格所对应的空间区域,确定重原子的中心位置。
2.根据权利要求1所述的方法,其特征在于,对所述归一化处理后的各个坐标点的像素值进行二值化处理包括,对各个坐标点进行第一次二值化处理:
分别利用各个坐标点所对应的各个像素值分割各个坐标点,得到前景坐标点和背景坐标点,并得到各个像素值所对应的分割后的前景坐标点与背景坐标点之间的像素值的类间方差值,并选择最大的类间方差值作为第一分割阈值;
基于所述第一分割阈值对各个坐标点进行分割处理,得到第一前景坐标点,所述第一前景坐标点为大于分割点对应的像素值的坐标点。
3.根据权利要求2所述的方法,其特征在于,分别利用各个坐标点所对应的各个像素值分割各个坐标点,得到前景坐标点和背景坐标点,并得到各个像素值所对应的分割后的前景坐标点与背景坐标点之间的像素值的类间方差值具体包括:
利用公式(1)得到各个坐标点所对应的类间方差值;
V=ω0×ω1×(µ0-µ1)2(1);
其中,V表示类间方差值,ω0表示以不同的像素值分割时,前景坐标点占所有坐标点的比例,ω1表示以不同的像素值分割时,背景坐标点占所有坐标点的比例,µ0表示以不同的像素值分割时,各个前景坐标点的平均灰度,µ1表示以不同的像素值分割时,各个背景坐标点的平均灰度。
4.根据权利要求2所述的方法,其特征在于,将第一次分割处理后得到的第一前景坐标点作为待分割的坐标点,进行第二次二值化处理:
分别利用各个待分割的坐标点所对应的各个像素值分割各个待分割的坐标点,得到前景坐标点和背景坐标点,并得到各个待分割的坐标点所对应的各个像素值分割后的前景坐标点与背景坐标点之间的像素值的类间方差值,并选择最大的类间方差值作为第二分割阈值;
基于所述第二分割阈值对各个待分割的坐标点进行分割处理,得到第二前景坐标点。
5.根据权利要求4所述的方法,其特征在于,分别利用各个待分割的坐标点所对应的各个像素值作为分割点,得到各个待分割的坐标点所对应的分割值具体包括:
利用公式(1)得到各个坐标点所对应的类间方差值;
V=ω0×ω1×(µ0-µ1)2(1);
其中,V表示类间方差值,ω0表示以不同的待分割的坐标点所对应的不同像素值分割时,前景坐标点占所有待分割的坐标点的比例,ω1表示以不同待分割的坐标点所对应的不同像素值分割时,背景坐标点占所有待分割的坐标点的比例,µ0表示以不同待分割的坐标点所对应的不同像素值分割时,各个前景坐标点的平均灰度,µ1表示以不同的待分割的坐标点所对应的不同像素值分割时,各个背景坐标点的平均灰度。
6.根据权利要求1所述的方法,其特征在于,基于所述子网格的前景坐标点,搜索能够构成连通区域的连通点,得到所述子网格内所包含的连通区域具体包括:
基于所述子网格中的任一前景坐标点作为种子点,以递归的方式搜索该种子点在该子网格中邻域位置的所有连通点,并将种子点和所有连通点构成连通区域;
在该连通区域外存在前景坐标点的情况下,以任一前景坐标点作为新的种子点,重复搜索过程得到对应的连通区域,直至连通区域外不包括前景坐标点。
7.根据权利要求1所述的方法,其特征在于,基于所述子网格中的任一前景坐标点作为种子点,以递归的方式搜索该种子点在该子网格中邻域位置的所有连通点具体包括:
搜索该种子点的邻域范围内的坐标点,将该种子点的邻域范围内的前景坐标点作为该种子点相对应的连通点;
搜索该连通点的领域范围内的坐标点,将该连通点的邻域范围内的前景坐标点作为连通点,继续搜索直至在邻域范围内搜索不到前景坐标点,并将该种子点相关的所有的连通点连通形成连通区域。
8.根据权利要求1所述的方法,其特征在于,筛选出子网格中的候选网格具体包括:基于所述子网格中的各个连通区域,得到所述子网格中体积最大的连通区域;所述体积最大的连通区域所对应的体积大于或等于该子网格的体积的三分之一的情况下,则该子网格为候选网格。
9.根据权利要求1所述的方法,其特征在于,依据距离参数对所述各个候选网格进行聚类,得到聚类后的聚类网格具体包括:
将所有的候选网格形成集合;
以集合中的任一候选网格以第一标记号进行标记,作为初始标记网格,聚类过程包括:将与初始标记网格的距离小于距离参数的候选网格利用第一标记号进行标记,并将第一标记号的候选网格合并到第一类队列中;对每个新加入到类队列中的候选网格作为新的标记网格,重复进行聚类过程,直至集合A中不存在与第一类队列中的标记网格相对应的距离小于距离参数的候选网格,并将所有第一类队列中的候选网格从集合中删除;
在删除第一类队列的所有候选网格后的集合中存在候选网格的情况下,重复进行聚类的过程,得到各个类队列,并将各个类队列中的所有候选网格作为聚类网格。
10.根据权利要求1所述的方法,其特征在于,基于各个聚类网格,确定与重原子相对应的聚类网格具体包括:
确定各个聚类网格所包含的前景坐标点的数量;
基于各个聚类网格所对应的前景坐标点的数量,确定前景坐标点的数量大于子网格所对应的区域的体积参数的聚类网格,并将其作为重原子所对应的聚类网格。
11. 一种基于电子密度图预估重原子位置的装置,其特征在于,包括:
接口,其配置为接收三维电子密度图的电子密度数据;和
处理器,其配置为执行如权利要求1-10任一项所述的基于电子密度图预估重原子位置的方法。
12.一种非暂时性计算机可读介质,其上存储有指令,其中当由处理器执行时,其指令执行如权利要求1-10任一项所述的基于电子密度图预估重原子位置的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410396914.8A CN117995317B (zh) | 2024-04-03 | 一种基于电子密度图预估重原子位置的方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410396914.8A CN117995317B (zh) | 2024-04-03 | 一种基于电子密度图预估重原子位置的方法、装置和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117995317A true CN117995317A (zh) | 2024-05-07 |
CN117995317B CN117995317B (zh) | 2024-06-21 |
Family
ID=
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150168318A1 (en) * | 2012-07-30 | 2015-06-18 | Oregon State University | Apparatus and method for determining molecular structure |
CN107271468A (zh) * | 2017-06-05 | 2017-10-20 | 国家纳米科学中心 | 一种晶体电子密度分布模型的评价方法及其应用 |
CN111968707A (zh) * | 2020-08-07 | 2020-11-20 | 上海交通大学 | 基于能量的原子结构与电子密度图多目标优化拟合预测方法 |
CN113571122A (zh) * | 2021-02-02 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 一种电子密度图的确定方法、装置、电子设备和存储介质 |
CN115239999A (zh) * | 2022-07-22 | 2022-10-25 | 水木未来(北京)科技有限公司 | 蛋白质电子密度图处理方法、装置、电子设备和存储介质 |
CN115910222A (zh) * | 2021-08-19 | 2023-04-04 | 北京望石智慧科技有限公司 | 一种基于电子密度的分子建模、性质预测方法和系统 |
CN117292129A (zh) * | 2023-09-21 | 2023-12-26 | 上海复亚智能技术发展有限公司 | 一种图像分割方法、装置、设备及介质 |
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150168318A1 (en) * | 2012-07-30 | 2015-06-18 | Oregon State University | Apparatus and method for determining molecular structure |
CN107271468A (zh) * | 2017-06-05 | 2017-10-20 | 国家纳米科学中心 | 一种晶体电子密度分布模型的评价方法及其应用 |
CN111968707A (zh) * | 2020-08-07 | 2020-11-20 | 上海交通大学 | 基于能量的原子结构与电子密度图多目标优化拟合预测方法 |
CN113571122A (zh) * | 2021-02-02 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 一种电子密度图的确定方法、装置、电子设备和存储介质 |
CN115910222A (zh) * | 2021-08-19 | 2023-04-04 | 北京望石智慧科技有限公司 | 一种基于电子密度的分子建模、性质预测方法和系统 |
CN115239999A (zh) * | 2022-07-22 | 2022-10-25 | 水木未来(北京)科技有限公司 | 蛋白质电子密度图处理方法、装置、电子设备和存储介质 |
CN117292129A (zh) * | 2023-09-21 | 2023-12-26 | 上海复亚智能技术发展有限公司 | 一种图像分割方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
李洁琼: "冷冻电镜蛋白质可视化及匹配软件的设计与实现", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 5, 15 May 2022 (2022-05-15), pages 1 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2680678T3 (es) | Detección de los bordes de un núcleo usando análisis de imágenes | |
CN109447998B (zh) | 基于PCANet深度学习模型下的自动分割方法 | |
JP2021503666A (ja) | 単一チャネル全細胞セグメンテーションのためのシステム及び方法 | |
Megjhani et al. | Population-scale three-dimensional reconstruction and quantitative profiling of microglia arbors | |
EP3624053B1 (en) | Image analysis device | |
CN113574534A (zh) | 使用基于距离的相似性标签的机器学习 | |
EP3140778B1 (en) | Method and apparatus for image scoring and analysis | |
WO2013025329A1 (en) | System and method for sectioning a microscopy image for parallel processing | |
CN110969204A (zh) | 基于磁共振图像与数字病理图像融合的样本分类系统 | |
CN110827291A (zh) | 一种用于自动化脑mri定量分析的方法和装置 | |
WO2021058867A1 (en) | Image analysis in pathology | |
CN114841947A (zh) | 肺腺癌h&e染色病理图像肿瘤区域多尺度特征提取与预后分析方法、装置 | |
CN114445356A (zh) | 基于多分辨率的全视野病理切片图像肿瘤快速定位方法 | |
JP6733984B2 (ja) | 画像解析装置 | |
CN111951268B (zh) | 颅脑超声图像并行分割方法及装置 | |
CN117995317B (zh) | 一种基于电子密度图预估重原子位置的方法、装置和介质 | |
CN117995317A (zh) | 一种基于电子密度图预估重原子位置的方法、装置和介质 | |
CN110807286A (zh) | 一种结构网格识别方法 | |
US11756203B2 (en) | Characterization platform for scalable, spatially-resolved multispectral analysis of tissue | |
CN114494155A (zh) | 非小细胞肺癌ihc染色图像肿瘤区域免疫分级方法、系统及存储介质 | |
Sreeraj et al. | A machine learning based framework for assisting pathologists in grading and counting of breast cancer cells | |
CN111862003B (zh) | 医疗影像目标信息获取方法、装置、设备和存储介质 | |
US12026889B2 (en) | Characterization platform for scalable, spatially-resolved multispectral analysis of tissue | |
Li et al. | NRRS: a re-tracing strategy to refine neuron reconstruction | |
CN115797376B (zh) | 基于气管树搜索与最近邻分配的肺段分割方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |