CN113674367B - 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 - Google Patents
一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 Download PDFInfo
- Publication number
- CN113674367B CN113674367B CN202110960145.6A CN202110960145A CN113674367B CN 113674367 B CN113674367 B CN 113674367B CN 202110960145 A CN202110960145 A CN 202110960145A CN 113674367 B CN113674367 B CN 113674367B
- Authority
- CN
- China
- Prior art keywords
- maximum value
- density lipoprotein
- value
- low density
- minimum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003153 chemical reaction reagent Substances 0.000 title claims abstract description 28
- 238000001962 electrophoresis Methods 0.000 title claims abstract description 26
- 238000002203 pretreatment Methods 0.000 title claims abstract description 22
- 108010022197 lipoprotein cholesterol Proteins 0.000 title claims abstract description 19
- 102000007330 LDL Lipoproteins Human genes 0.000 claims abstract description 49
- 108010007622 LDL Lipoproteins Proteins 0.000 claims abstract description 49
- 102000015779 HDL Lipoproteins Human genes 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 30
- 108010010234 HDL Lipoproteins Proteins 0.000 claims abstract description 29
- 108010062497 VLDL Lipoproteins Proteins 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000007423 decrease Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 108010017342 very high density lipoproteins Proteins 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 102000004895 Lipoproteins Human genes 0.000 abstract description 13
- 108090001030 Lipoproteins Proteins 0.000 abstract description 13
- 230000006870 function Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 abstract description 5
- 238000013178 mathematical model Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 12
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 8
- 208000024172 Cardiovascular disease Diseases 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 235000012000 cholesterol Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 208000032928 Dyslipidaemia Diseases 0.000 description 2
- 208000017170 Lipid metabolism disease Diseases 0.000 description 2
- 230000002526 effect on cardiovascular system Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 108010071584 oxidized low density lipoprotein Proteins 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000037260 Atherosclerotic Plaque Diseases 0.000 description 1
- 108010004103 Chylomicrons Proteins 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- 208000032382 Ischaemic stroke Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- -1 free fraction Proteins 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供了一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法。所述预处理办法包括:获取扫描图后统计灰度值,得到灰度值统计图,并根据所述灰度值统计图进行裁剪,得到单一凝胶柱的扫描图;设置凝胶柱扫描图的阈值,获取极大值及其对应的坐标,得到极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰及拐点;根据波峰及拐点对凝胶柱的电泳图进行裁剪,并进行空白填充,得到各脂蛋白的图像数据。所述方法通过算法实现对凝胶柱扫描图的智能预处理,结合局部查找极大值的数学模型,实现对原始扫描图自动裁剪及目标试剂自动划分区域的功能,降低实验人员的时间成本,缩短实验周期,还能避免了因操作失误导致的截取错误的问题。
Description
技术领域
本发明属于样品检测和分析技术领域,尤其涉及一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法。
背景技术
血脂异常(主要是高胆固醇血症)是心血管病的主要危险因素。国内外的研究及临床实践证明,血脂异常是可以预防和控制的,降低人群胆固醇水平,可明显减少心肌梗死、缺血性卒中事件和心血管死亡,显著改善心血管病患者的生活质量并有效降低疾病负担。基于目前的检测方法和手段,大约50%的心血管疾病患者的脂类水平显示正常,只有30%的心脏病患者能够根据检测总胆固醇含量被发现。但是,使用脂蛋白亚组分的研究则能解决传统检测方法不能揭示的问题。
研究发现,低密度脂蛋白(Low Density Lipoprotein,LDL)和高密度脂蛋白(high-density lipoprotein,HDL)存在诸多亚组分,对于低密度脂蛋白的亚组分而言,一些大的低密度脂蛋白负责正常的胆固醇运输,被认为是“正常的LDL”,而小而密低密度脂蛋白(small dense Low Density Lipoprotein,sdLDL)被认为是“不好的或非正常的LDL”,它们易形成氧化型低密度脂蛋白(OX-LDL)使其携带的胆固醇沉积到心脑等部位的动脉壁上形成粥样斑块,从而会导致心血管疾病的产生。
单一测定总的低密度脂蛋白含量并不能显示患心血管疾病的风险,因为它不能区分“大的”和“小而密的”低密度脂蛋白,即使总的低密度脂蛋白水平显示正常,其中的“小而密的”低密度脂蛋白可以使患心血管疾病的风险达到3倍以上。
因此,血脂蛋白的细分类及其定量分析在预测心血管疾病风险中发挥着至关重要的作用。采用高分辨率聚丙烯酰胺凝胶电泳、自动化扫描和分析技术,使用血清或血浆样本可在3个小时内得到LDL的精确细分类及准确含量,根据检测结果预测心血管疾病的发生风险,如图1所示。
随着健康水平的提高,对低密度脂蛋白的检测需求也随之提高,面对大量电泳后的脂蛋白胆固醇试剂,若通过实验来测量不同密度的脂蛋白浓度,需要耗费大量的人力及物力。但随着AI技术的普及和商用化,当大量图像数据汇集时,为使用AI技术来对脂蛋白图像进行浓度预测提供了可行性。
然而,如何对样本图像进行批量预处理仍然是低密度脂蛋白的检测的难点之一,目前在进行数据分析时需要人为手动选取凝胶柱的液面和分层界线,大大影响了工作效率(如图2所示),每个凝胶柱的第一分界线和第二分界线高度有所不同,其次,不同模块下的凝胶柱扫描图,黑色背景的间隔也略有不同。
因此,提供一种自动化的、简洁高效的电泳后脂蛋白胆固醇试剂扫描图的预处理方法,对于低密度脂蛋白的检测具有重要的意义。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法。通过算法实现对电泳后的凝胶柱扫描图的智能预处理,从而实现对原始扫描图自动裁剪及目标试剂自动划分区域的功能。其中包括:极低密度脂蛋白、低密度脂蛋白、游离区域和高密度脂蛋白部分,从而降低实验人员的时间成本,缩短实验周期。
为达此目的,本发明采用以下技术方案:
第一方面,本发明提供一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法,所述预处理办法包括如下步骤,具体如图3(A)所示:
S1、获取电泳后脂蛋白胆固醇试剂的扫描图,统计灰度值得到灰度值统计图,并根据所述灰度值统计图进行裁剪,得到单一凝胶柱的扫描图;
S2、设置凝胶柱扫描图的最小极大值、间隔阈值、落差阈值和动量阈值,获取所述单一凝胶柱的扫描图中的极大值及其对应的坐标,得到极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰、波谷或拐点的坐标;
S3、根据步骤S2所得左右两侧的波峰的拐点对凝胶柱的电泳图进行裁剪,并进行空白填充,得到极低密度脂蛋白(VLDL)、高密度脂蛋白(HDL)和低密度脂蛋白(LDL)的图像数据,所得图像数据进入后续分析工作流程。
本发明所述的预处理办法,能够通过算法实现对电泳后的凝胶柱扫描图的智能预处理,结合局部查找极大值的数学模型,实现对原始扫描图自动裁剪及目标试剂自动划分区域的功能,其中包括:极低密度脂蛋白、低密度脂蛋白、游离区域和高密度脂蛋白部分,从而降低实验人员的时间成本,缩短实验周期,是一种通过统计图像灰度值进行计算的方式;同时,该发明还能避免了因操作失误导致的截选错误的问题,所述预处理方法实用性较高,为图像数据的处理和准确分析奠定了基础。
本发明中,所述“极低密度脂蛋白”、“低密度脂蛋白”、“高密度脂蛋白”和“小而密低密度脂蛋白”均为本领域技术人员熟知的术语。
其中,“极低密度脂蛋白”指的是密度极低(0.96~1.006)、分子大小为25~80NNL的脂蛋白;“低密度脂蛋白”指的是密度为(1.019~1.063)、分子大小为20~27NNL的脂蛋白;“高密度脂蛋白”指的是密度为(1.063~1.210)、分子大小为8~10NNL的脂蛋白;“小而密低密度脂蛋白”为低密度脂蛋白的亚组分。
作为本发明优选的技术方案,步骤S1中所述灰度值统计图包括灰度值水平统计图和灰度值纵向统计图,所述裁剪的方法包括:
遍历所述灰度值统计图,得到落差位点,根据所述落差位点获取起始线;
确定所述起始线后,再查找所述起始线后的最小值和极大值,确定切割线,以所述起始线与切割线之间的尺寸为固定尺寸,完成水平裁剪;
遍历所述灰度值统计图判断阈值大小,得到凝胶柱的竖直切割线,完成竖直裁剪。
作为本发明优选的技术方案,所述极大值的确定方法包括:
S11、设定超参数、段落点数n和三个阈值,所述三个阈值包括:极值最小坐标间隔、落差阈值和最小极大值;
其中,极大值小于最小极大值,则不予存储;
S12、通过遍历范围中每个点的值,从中依次读取两段,每段包含n个点,其最大值分别为M1和M2,并存储该阶段内的极大值,记为M0,同时赋予初始单调性d=1;
其中,单调性d=1表示单调递增,单调性d=0表示单调递减;
S13、将M0、M1和M2作比较,获取极大值。
其具体步骤如下:
S131、所述M0、M1和M2依次递减,则将M0更新为M1;
d=0,则进入下一区域;d=1,则说明存在极大值,并将d更新为0;
再将极大值和上一个极大值作比较,若所述极大值大于上一个极大值,则将其存储;
S132、所述M0、M1和M2依次递增,则将M0更新为M2;
d=0,则进入下一区域;d=1,则说明存在极大值,并将d更新为0;
再将极大值和上一个极大值作比较,若所述极大值大于上一个极大值,则将其存储;
S133、所述M1最大,则将M0更新为M,d赋值0;
并将M1和最小极大值作比较,M1大于最小极大值,则将其存储;
S134、所述M1最小且d=1,则将M0和最小极大值作比较,M0大于最小极大值,则将其存储;
所述M1最小且d=0,则将M0更新为M2,d更新为1,进入下一段。
作为本发明优选的技术方案,步骤S2中所述极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰及拐点的获取方法包括,如图3(B)所示:
根据所述单一凝胶柱的扫描图的位置信息得到极低密度脂蛋白和高密度脂蛋白波峰的坐标,根据波峰确定所述波峰两侧的拐点;
在极低密度脂蛋白波峰的右拐点和高密度脂蛋白波峰的左拐点之间,选取最大值确定为低密度脂蛋白的波峰,再通过动量阈值确定所述低密度脂蛋白波峰的右拐点。
作为本发明优选的技术方案,步骤S2中所述最小极大值为所述方法中设定的极大值,低于所述最小极大值的极大值不予存储;
所述间隔阈值为两个极大值之间的最小间距;
所述落差阈值为两个极大值之间的最小差值;
所述动量阈值为特定位置下的极大值的下一个极大值至少前移的数值。
作为本发明优选的技术方案,步骤S3中所得低密度脂蛋白的图像数据位于第三条和第五条分割线之间;
所述极低密度脂蛋白的图像数据位于第一条和第三条分割线之间;
所述高密度脂蛋白的图像数据位于第六条和第八条分割线之间;
第五条和第六条分割线之间表示游离部分的图像数据。
第二方面,本发明还提供一种处理电泳后脂蛋白胆固醇试剂扫描图的装置,所述装置包括:
图像获取模块,用于获取电泳后脂蛋白胆固醇试剂的扫描图;
图像分析处理模块,用于统计灰度值得到灰度值统计图,并根据所述灰度值统计图进行裁剪,得到单一凝胶柱的扫描图,并分析所述单一凝胶柱的扫描图,获取极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰及拐点,裁剪并进行空白填充后得到预处理后的图像数据。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现:还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,获取模块可以为单独设立的处理元件,也可以集成在某一个芯片中实现,此外,也可以以程序代码的形式存储于存储器中,由某一个处理元件调用并执行以上获取模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
第三方面,本发明提供一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的电泳后脂蛋白胆固醇试剂扫描图的预处理方法。
第四方面,一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的电泳后脂蛋白胆固醇试剂扫描图的预处理方法。
实现上述方法的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。
该程序在执行时,执行包括上述各方法实施例的步骤;所述计算机存储介质可包括但不限于软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。
所述计算机存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件。
与现有技术相比,本发明的有益效果为:
本发明提供一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法,所述预处理办法包括将电泳后的扫描图裁剪为单一凝胶柱的扫描图,再通过设置凝胶柱扫描图的最小极大值等阈值,获取极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰及拐点,通过上述灰度值分析,裁剪凝胶柱的电泳图进而得到各种脂蛋白的图像数据;
本发明所述的方法通过算法实现对电泳后的凝胶柱扫描图的智能预处理,结合局部查找极大值的数学模型,实现对原始扫描图自动裁剪及目标试剂自动划分区域的功能,且该方法能避免了因操作失误导致的截选错误的问题,能够有效降低实验人员的时间成本,缩短实验周期,实用性较高,为图像数据的处理和准确分析奠定了基础。
附图说明
图1为电泳后的VLDL、游离部分、LDL和HDL部分的检测示意图。
图2为人为手动选取凝胶柱的液面和分层界线的示意图。
图3(A)为本发明提供的预处理方法的流程示意图。
图3(B)为本发明提供的预处理方法中各类脂蛋白波峰和波谷的查找顺序示意图。
图4为具体实施例中获取灰度值统计图后,标记落差位置和起始线后的灰度值统计图。
图5为具体实施例中标记部分起始线和分割线后的灰度值统计图。
图6(A)为具体实施例中标记所有起始线和分割线后的灰度值统计图。
图6(B)为具体实施例中凝胶柱在水平状态下的原始扫描图像。
图7(A)为具体实施例中纵向灰度统计图的竖直切割线标记图。
图7(B)为具体实施例中凝胶柱在垂直状态下的原始扫描图像。
图8为具体实施例中采用本发明所述的预处理方法对VLDL、LDL、游离部分和HDL进行分割后的结果图。
图9为具体实施例中通过左右两个波峰的拐点对图片进行裁剪后获得的低密度脂蛋白试剂部分。
图10为具体实施例中在试管尾部进行空白填充后获得的低密度脂蛋白试剂部分。
图11为人为手动选取与采用本发明所述的预处理方法对扫描图进行分割的对比图;其中I图为人为手动选取,II图为使用本发明中所述的方法进行处理。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案,但下述的实例仅仅是本发明的简易例子,并不代表或限制本发明的权利保护范围,本发明的保护范围以权利要求书为准。
以下实施例中,若无特殊说明,所用试剂及耗材均购自本领域常规试剂厂商;若无特殊说明,所用实验方法和技术手段均为本领域常规的方法和手段。
本发明中,在收到电泳后脂蛋白胆固醇试剂扫描图的原始数据之后,首先要对原始扫描图进行裁剪,获取每个凝胶柱的扫描图;
扫描图处理的具体流程如下:
(1)通过统计灰度值获取灰度统计图,从左往右依次遍历所述灰度统计图,可以发现,从纯黑背景到凝胶柱时,所得统计图存在一个巨大的落差,即图中箭头所指位置,通过简单的逻辑判断便能找到这个落差在图中的中标位置;
在一具体的实施例中,获取灰度统计图如图4所示,从图中可以看到,从纯黑背景到凝胶柱时所得统计图存在一个巨大的落差,记为落差1;
落差1后存在两个高低不定的波谷和波峰,为了避开其影响,可在落差1的坐标基础上加上一个固定数值,可找到图中箭头右边的第一条虚线,并其作为起始线;
(2)在确定起始线后,需要确定切割线,两条切割线中的位置对应的是液面和瓶盖中间的部分;
在一具体的实施例中,如图5所示,左右两侧虚线为切割线;
由于波谷不一定一直是最小值,试管噪音可能导致右边的波谷存在更低值的情况,所以需要查找波谷两边波峰的位置,然后在两个波峰之间获取最小值及其坐标;
(3)如何查找两个波峰的坐标是本发明的难点之一,其算法在脂蛋白类型细分中也将用到;首先,找到两个波峰从起始线开始后一定区域内的极大值,该算法具体流程如下:
a、设定超参数,段落点数n,三个阈值:极值最小坐标间隔,落差阈值,最小极大值,若极大值小于最小极大值则不予存储;
b、通过遍历可得到每个点的值,从中依次读取两段,每段包含n个点,其最大值分别为M1和M2,并存储该阶段内的极大值记为M0(初始值为0,坐标为负的坐标阈值),同时赋予初始单调性d=1(1表示单调递增,0表示单调递减);
c、将M0、M1、M2作比较:
①若M0、M1、M2依次递减,则假设该区间内单调递减,将M0更新为M1;
若d=0,则进入下一区域;
若d=1,表示之前单调递增,这次单调递减,则说明存在极大值,同时将d更新为0,表示该区域单调递减;
接着将极大值和上一个极大值(初始为初始M0)的值和坐标作比较,若满足任何一点,则将其存储;
②若M0、M1、M2依次递增,则假设该区间内单调递增,将M0更新为M2;余下同步骤①相似;
③若M1最大,则说明M1为区域内极大值,将M0更新为M1,d赋值0;将其和阈值作比较,若满足任何一点,则将其存储;
④若M1最小;若d=1,则说明之前单调递增,存在M0可能为极大值,将其和阈值作比较,若满足任何一点,则将其存储;若d=0,则将M0更新为M2,d更新为1,进入下一段;
d、当区域内所有点遍历完毕时,即获得了该区间内符合阈值要求的所有极大值。
(4)取第二和第三个极值的坐标(第一为初始值),即分割线左右两个波峰,通过查找最小值,即可找到切割线的坐标,从扫描图中间开始,重复上述步骤可查找到第二条切割线的坐标;由于凝胶柱的尺寸是固定的,从切割线开始添加固定尺寸,即可完成水平裁剪;
所得预处理后的水平灰度图如图6(A)所示,其对应的水平凝胶柱的扫描图如图6(B)所示。
(5)纵向灰度统计图的规律性较强,通过遍历判断阈值大小即可找到凝胶柱的竖直切割线;
在一具体的实施例中,所得竖直切割线如图7(A)所示;同样,空白区域和空的凝胶柱之间存在一个灰度阈值(如图7(B)所示),通过试验可以确定,在裁剪时通过判断灰度阈值既可获得单支凝胶柱的扫描图。
本发明中,对原始扫描图处理完毕后,得到每个凝胶柱的扫描图,接下来需要对凝胶柱中的不同密度的脂蛋白进行分类。
(1)本发明将脂蛋白胆固醇简单的分为四大类,分别为极低密度脂蛋白(VLDL)、低密度脂蛋白(LDL)、游离区、高密度脂蛋白(HDL)四个部分;
在一具体的实施例中,如图8所示,VLDL、LDL、游离部分和HDL的分类具体为:从左至右,第1~3条虚线内为VLDL,第3~5条虚线内为LDL,第5~6条虚线内为游离部分,第6~8条虚线内为HDL。
(2)通过找到两个波峰从起始线开始后一定区域内的极大值所使用的算法,本发明中也可以利用该算法找到图中符合阈值要求的极大值及其对应的坐标;
在另一具体的实施例中,在不过多干预的情况下存在复数个极大值,通过设定合适的最小极大值、间隔阈值、落差阈值和动量阈值可以实现正常切割,包括测量极限的凝胶柱扫描图。
其中,低于最小极大值的极大值不予存储,间隔阈值指两个极大值之间的最小间距,落差阈值指两个极大值之间的最小差值,动量阈值指特定位置下的极大值的下一个极大值至少需前移多少数值。
单个凝胶柱扫描图的具体处理步骤如下:
a、对查找到的极大值通过阈值进行预处理;
b、通过图像的位置信息可找到VLDL和HDL波峰的坐标,分别是图像左右一定范围区域内的最大值,同时根据波峰确定两边的拐点,即波谷,拐点的确认根据段与段之内的最大值的差值确定,当两段的差值低于某个值则排除;
c、在VLDL波峰的右拐点和HDL波峰的左拐点之间,可选取最大值确认为LDL的波峰,在通过动量阈值确定LDL波峰的右拐点,即当找到一个拐点时首先判断其大小,若低于阈值且单调递减则确认为拐点,否则跳过该坐标;
确定分割线位置后即可对扫描图进行裁剪分类。
相应的,根据分割线位置对凝胶柱进行裁剪,第一条线和第三条线之间为VLDL部分,第三条和第五条之间为LDL部分,第五条和第六条之间为游离部分,第六条和第八条之间为HDL部分,在裁剪时可将每个部分单独裁出分析或裁取整个部分。
在某些具体的实施例中,通过左右两个波峰的拐点,对图片进行裁剪,所得图片如图9所示,其中1-12表示不同凝胶柱中低密度脂蛋白的扫描图;因为浓度的不同,脂蛋白分层的位置也不同,所以裁剪后的图片尺寸不一致,需要在试管尾部进行空白填充,填充后如图10所示;
待所有低密度脂蛋白试剂分割保存完毕,即可将数据应用于人工智能模型的训练,大数据的挖掘分析等工作。
本发明提供的预处理方法能够实现对原始扫描图自动裁剪及目标试剂自动划分区域的功能,降低实验人员的时间成本,缩短实验周期,还能避免了因操作失误导致的截选错误的问题。
以某一具体的实施例为例,如图11所示,其中I图为人工截取,II图为使用本发明中所述的方法进行预处理;由图可知,其应当从图中框线所示区域内的极小值开始截取,而I图中截取错误,增大了灰度误差,而采用本发明所述的预处理方法则能够准确进行划分。
申请人声明,以上所述仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,所属技术领域的技术人员应该明了,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,均落在本发明的保护范围和公开范围之内。
Claims (8)
1.一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法,其特征在于,所述预处理办法包括如下步骤:
S1、获取电泳后脂蛋白胆固醇试剂的扫描图,统计灰度值得到灰度值统计图,并根据所述灰度值统计图进行裁剪,得到单一凝胶柱的扫描图;
S2、设置凝胶柱扫描图的最小极大值、间隔阈值、落差阈值和动量阈值,获取所述单一凝胶柱的扫描图中的极大值及其对应的坐标,得到极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰及拐点;
S3、根据步骤S2所得左右两侧的波峰的拐点对凝胶柱的电泳图进行裁剪,并进行空白填充,得到极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的图像数据,所得图像数据进入后续分析工作流程;
步骤S1中所述灰度值统计图包括灰度值水平统计图和灰度值纵向统计图,所述裁剪的方法包括:
遍历所述灰度值水平统计图,得到落差位点,根据所述落差位点获取起始线;
确定所述起始线后,再查找所述起始线后的最小值和极大值,确定切割线,以所述落差位点与起始线之间的尺寸为固定尺寸,根据切割线完成水平裁剪;
遍历所述灰度值纵向统计图根据阈值大小,得到凝胶柱的竖直切割线,完成竖直裁剪。
2.根据权利要求1所述的预处理方法,其特征在于,所述极大值的确定方法包括:
S11、设定超参数、段落点数和三个阈值,所述三个阈值包括:极值最小坐标间隔、落差阈值和最小极大值;
其中,极大值小于最小极大值,则不予存储;
S12、通过遍历范围中每个点的值,从中依次读取两段,其最大值分别为M1和M2,并存储该阶段内的极大值,记为M0,同时赋予初始单调性d=1;
其中,单调性d=1表示单调递增,单调性d=0表示单调递减;
S13、将M0、M1和M2作比较,获取极大值。
3.根据权利要求2所述的预处理方法,其特征在于,步骤S13所述获取极大值的方法具体包括如下步骤:
S131、所述M0、M1和M2依次递减,则将M0更新为M1;
d=0,则进入下一区域;d=1,则说明存在极大值,并将d更新为0;
再将极大值和上一个极大值作比较,若所述极大值大于上一个极大值,则将其存储;
S132、所述M0、M1和M2依次递增,则将M0更新为M2;
d=0,则进入下一区域;d=1,则说明存在极大值,并将d更新为0;
再将极大值和上一个极大值作比较,若所述极大值大于上一个极大值,则将其存储;
S133、所述M1最大,则将M0更新为M1,d赋值0;
并将M1和最小极大值作比较,M1大于最小极大值,则将其存储;
S134、所述M1最小且d=1,则将M0和最小极大值作比较,M0大于最小极大值,则将其存储;
所述M1最小且d=0,则将M0更新为M2,d更新为1,进入下一段。
4.根据权利要求1所述的预处理方法,其特征在于,步骤S2中所述极低密度脂蛋白、高密度脂蛋白和低密度脂蛋白的波峰及拐点的获取方法包括:
根据所述单一凝胶柱的扫描图的位置信息得到极低密度脂蛋白和高密度脂蛋白波峰的坐标,根据波峰确定所述波峰两侧的拐点;
在极低密度脂蛋白波峰的右拐点和高密度脂蛋白波峰的左拐点之间,选取最大值确定为低密度脂蛋白的波峰,再通过动量阈值确定所述低密度脂蛋白波峰的右拐点。
5.根据权利要求1所述的预处理方法,其特征在于,步骤S2中所述最小极大值为所述方法中设定的极大值,低于所述最小极大值的极大值不予存储;
所述间隔阈值为两个极大值之间的最小间距;
所述落差阈值为两段最大值之间的最小差值;
所述动量阈值为特定位置下的极大值的下一个极大值至少前移的数值。
6.根据权利要求1所述的预处理方法,其特征在于,步骤S3中所得低密度脂蛋白的图像数据位于第三条和第五条分割线之间;
所述极低密度脂蛋白的图像数据位于第一条和第三条分割线之间;
所述高密度脂蛋白的图像数据位于第六条和第八条分割线之间;
第五条和第六条分割线之间表示游离部分的图像数据。
7.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~6中任一项所述的电泳后脂蛋白胆固醇试剂扫描图的预处理方法。
8.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~6中任一项所述的电泳后脂蛋白胆固醇试剂扫描图的预处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110960145.6A CN113674367B (zh) | 2021-08-20 | 2021-08-20 | 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 |
PCT/CN2022/112026 WO2023020374A1 (zh) | 2021-08-20 | 2022-08-12 | 电泳后脂蛋白胆固醇试剂扫描图的预处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110960145.6A CN113674367B (zh) | 2021-08-20 | 2021-08-20 | 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113674367A CN113674367A (zh) | 2021-11-19 |
CN113674367B true CN113674367B (zh) | 2024-03-26 |
Family
ID=78544502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110960145.6A Active CN113674367B (zh) | 2021-08-20 | 2021-08-20 | 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113674367B (zh) |
WO (1) | WO2023020374A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674367B (zh) * | 2021-08-20 | 2024-03-26 | 上海宝藤生物医药科技股份有限公司 | 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 |
CN115147395A (zh) * | 2022-07-20 | 2022-10-04 | 上海宝藤生物医药科技股份有限公司 | 一种脂蛋白亚型组分划分方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998019271A1 (en) * | 1996-10-25 | 1998-05-07 | Peter Mose Larsen | Proteome analysis for characterization of up- and down-regulated proteins in biological samples |
US6144758A (en) * | 1995-01-09 | 2000-11-07 | Fuji Photo Film Co., Ltd. | Biochemical image analyzing apparatus |
WO2001011564A1 (en) * | 1999-08-09 | 2001-02-15 | Smithkline Beecham P.L.C. | Image processing methods, programs and systems |
WO2010122460A1 (en) * | 2009-04-20 | 2010-10-28 | Pfizer Inc. | Control of protein glycosylation and compositions and methods relating thereto |
CN104508473A (zh) * | 2012-05-29 | 2015-04-08 | 健康诊断实验室有限公司 | 用于具有原位校准的凝胶电泳的组合物和方法 |
CN107316291A (zh) * | 2017-06-14 | 2017-11-03 | 上海联影医疗科技有限公司 | 乳腺图像处理方法及乳腺成像设备 |
CN110009008A (zh) * | 2019-03-18 | 2019-07-12 | 四川大学 | 基于提取的免疫固定电泳图特征对其进行自动分类的方法 |
CN110443789A (zh) * | 2019-08-01 | 2019-11-12 | 四川大学华西医院 | 一种免疫固定电泳图自动识别模型的建立及使用方法 |
CN113096125A (zh) * | 2021-05-11 | 2021-07-09 | 上海宝藤生物医药科技股份有限公司 | 低密度脂蛋白试剂浓度的确定方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2443458A4 (en) * | 2009-06-17 | 2012-12-26 | Maine Standards Company Llc | METHOD FOR MEASURING LIPOPROTEIN-SPECIFIC APOLIPOPROTEINS |
CN107292815B (zh) * | 2017-06-14 | 2020-09-01 | 上海联影医疗科技有限公司 | 乳腺图像的处理方法、装置及乳腺成像设备 |
CN110537930A (zh) * | 2019-09-06 | 2019-12-06 | 上海联影医疗科技有限公司 | 图像重建方法及装置、设备、存储介质 |
CN110782470B (zh) * | 2019-11-04 | 2023-03-28 | 浙江工业大学 | 一种基于形状信息的腕骨区域分割方法 |
CN113674367B (zh) * | 2021-08-20 | 2024-03-26 | 上海宝藤生物医药科技股份有限公司 | 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 |
-
2021
- 2021-08-20 CN CN202110960145.6A patent/CN113674367B/zh active Active
-
2022
- 2022-08-12 WO PCT/CN2022/112026 patent/WO2023020374A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6144758A (en) * | 1995-01-09 | 2000-11-07 | Fuji Photo Film Co., Ltd. | Biochemical image analyzing apparatus |
WO1998019271A1 (en) * | 1996-10-25 | 1998-05-07 | Peter Mose Larsen | Proteome analysis for characterization of up- and down-regulated proteins in biological samples |
WO2001011564A1 (en) * | 1999-08-09 | 2001-02-15 | Smithkline Beecham P.L.C. | Image processing methods, programs and systems |
WO2010122460A1 (en) * | 2009-04-20 | 2010-10-28 | Pfizer Inc. | Control of protein glycosylation and compositions and methods relating thereto |
CN104508473A (zh) * | 2012-05-29 | 2015-04-08 | 健康诊断实验室有限公司 | 用于具有原位校准的凝胶电泳的组合物和方法 |
CN107316291A (zh) * | 2017-06-14 | 2017-11-03 | 上海联影医疗科技有限公司 | 乳腺图像处理方法及乳腺成像设备 |
CN110009008A (zh) * | 2019-03-18 | 2019-07-12 | 四川大学 | 基于提取的免疫固定电泳图特征对其进行自动分类的方法 |
CN110443789A (zh) * | 2019-08-01 | 2019-11-12 | 四川大学华西医院 | 一种免疫固定电泳图自动识别模型的建立及使用方法 |
CN113096125A (zh) * | 2021-05-11 | 2021-07-09 | 上海宝藤生物医药科技股份有限公司 | 低密度脂蛋白试剂浓度的确定方法、装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
2016年某高校医学生血清低密度脂蛋白亚组分与血脂及体格指标的相关性;成晨;王敌;何亚琼;谢玉兰;芦慧霞;夏惠;潘达;孙桂菊;;卫生研究;20180930(第05期);全文 * |
电泳法检测冠心病患者血清负电性LDL的临床意义;陈立;陈欣;王珏;高强;韩猛;梁娜;;天津医药;20080815(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
WO2023020374A1 (zh) | 2023-02-23 |
CN113674367A (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113674367B (zh) | 一种电泳后脂蛋白胆固醇试剂扫描图的预处理方法 | |
CN111598827A (zh) | 外观瑕疵检测方法、电子装置及存储介质 | |
CN113160175B (zh) | 一种基于级联网络的肿瘤淋巴管浸润检测方法 | |
US20130307957A1 (en) | Scanning Microscope Having an Adaptive Scan | |
JP6733983B2 (ja) | 画像解析装置 | |
CN116645390B (zh) | 一种荧光图像细胞快速分割方法和系统 | |
CN114171197A (zh) | 一种乳腺癌her2状态的预测方法及相关设备 | |
CN115909006A (zh) | 基于卷积Transformer的乳腺组织图像分类方法及系统 | |
CN112419306A (zh) | 一种基于nas-fpn的肺结节检测方法 | |
CN116452697B (zh) | 继发性肺结核病灶检测方法和系统 | |
CN117423001A (zh) | 基于改进ssd的岩石岩性识别方法与系统、存储介质和设备 | |
CN115984559B (zh) | 智能样本精选方法及相关装置 | |
CN116912202A (zh) | 一种医用高值耗材管理方法和系统 | |
US20030223626A1 (en) | Systems and methods for analyzing target contrast features in images of biological samples | |
CN115165710B (zh) | 细胞的快速扫描方法和装置 | |
CN113158951B (zh) | 一种从低倍镜图像中寻找染色体分裂相的方法 | |
CN113763343B (zh) | 基于深度学习的阿兹海默症检测方法及计算机可读介质 | |
CN113435444B (zh) | 免疫层析检测方法、装置、存储介质及计算机设备 | |
CN111860289B (zh) | 一种时序动作检测方法、装置及计算机设备 | |
CN109978861B (zh) | 骨髓灰质检测方法、装置、设备和计算机可读存储介质 | |
CN117995317B (zh) | 一种基于电子密度图预估重原子位置的方法、装置和介质 | |
CN112241945A (zh) | 深度学习算法和硬件整体优的数字病理图像智能分析方法 | |
CN114674827B (zh) | 一种基于两阶段深度学习策略的桥梁裂纹检测方法 | |
CN111862003B (zh) | 医疗影像目标信息获取方法、装置、设备和存储介质 | |
CN115049714B (zh) | 原位杂交荧光显微全景图配准、微环境的构建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |