CN112906740B - 一种针对组织质谱成像结果去除批次间差异的方法 - Google Patents
一种针对组织质谱成像结果去除批次间差异的方法 Download PDFInfo
- Publication number
- CN112906740B CN112906740B CN202110063056.1A CN202110063056A CN112906740B CN 112906740 B CN112906740 B CN 112906740B CN 202110063056 A CN202110063056 A CN 202110063056A CN 112906740 B CN112906740 B CN 112906740B
- Authority
- CN
- China
- Prior art keywords
- data
- information
- batch
- cell
- tissue mass
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003384 imaging method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000001819 mass spectrum Methods 0.000 title abstract description 12
- 238000012937 correction Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000004949 mass spectrometry Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000010856 establishment of protein localization Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000001871 ion mobility spectroscopy Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010329 laser etching Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种针对组织质谱成像结果去除批次间差异的方法,属于组织质谱成像处理技术领域,通过对数据的检测及对比分析的方式对不同批次的纠正因子信息进行归类识别整理,便于相关人员因不同批次检测的数据信息所产生的原因进行准确判断,该方案能够对组织质谱成像数据进行批次差异的去除,首先对得到的细胞抗体强度进行转化,然后对数据进行PCA降维处理,之后对单细胞随机分配为不同的数据群组,然后计算对应数据群组的特征并计算矫正因子,根据得到的矫正因子进行数据矫正,数据整体收敛较好后,即可得到矫正后的数据结果,从而减小样本间的差异,有利于通过数据对后续的分析,为后续软件开发核算法优化提供依据。
Description
技术领域
本发明属于组织质谱成像处理技术领域,具体为一种针对组织质谱成像结果去除批次间差异的方法。
背景技术
组织质谱成像系统被广泛用于肿瘤、免疫、体外诊断、生物标志物筛选和形态学等众多领域,在细胞类型识别、不同细胞在空间组织机构中的相互关系,蛋白定位、蛋白表达和相互作用等研究中发挥着重要作用,组织质谱成像系统的研发基于先进创新的成像质谱流式技术,这一技术由成熟的质谱流式技术发展而来,进一步与激光刻蚀等成熟技术相结合,特别是金属标签标记抗体的专利技术,彻底避免了传统免疫荧光(IF)检测中自发荧光对结果的信号干扰,突破性地将单张组织切片参数检测范围从几个提升至几十个,大幅拓展了单样本的数据产出量和检测范围,使数据更全面,结果更可靠,也能更加有效地识别、鉴定特定环境中的生物标志物。与传统免疫组化相比较,组织质谱成像技术具有通道多、无串色、背景低、节约样本、数据质量高等优势。
但是由于实验的批次效应问题,样本间的差异往往会比较大,对后续的分析造成较大影响,目前仍然没有方法对组织质谱成像数据的样本批次效应进行去除,同时在进行样本间的差异进行检测及纠正因子计算过程中,仍然无法通过对数据的检测及对比分析的方式对不同批次的纠正因子信息进行归类识别整理,从而不便于相关人员因不同批次检测的数据信息所产生的原因进行准确判断,因此需一种针对组织质谱成像结果去除批次间差异的方法来解决上述问题。
发明内容
(一)解决的技术问题
为了克服现有技术的上述缺陷,本发明提供了一种针对组织质谱成像结果去除批次间差异的方法,解决了由于实验的批次效应问题,样本间的差异往往会比较大,对后续的分析造成较大影响,目前仍然没有方法对组织质谱成像数据的样本批次效应进行去除,同时在进行样本间的差异进行检测及纠正因子计算过程中,仍然无法通过对数据的检测及对比分析的方式对不同批次的纠正因子信息进行归类识别整理,从而不便于相关人员因不同批次检测的数据信息所产生的原因进行准确判断的问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种针对组织质谱成像结果去除批次间差异的方法,包括以下步骤:
S1、首先需检测得到的细胞原始抗体的抗体强度数值,并且需取对数。
S2、当对细胞原始抗体的抗体强度数值进行检测收集完成后,可对接收的数据信息进行PCA降维处理,从而得到新的数据矩阵。
S3、根据S2中得到的新数据矩阵,其次可将概率性地将单细胞分配给不同的数据群组,从而使每个数据群组内数据集的多样性最大化。
S4、通过分配的不同数据群组,计算每个数据群组的所有数据集的全局中心,以及特定数据集的中心,其次在每个数据群组中,基于中心为每个数据集计算校正因子。
S5、通过S4中特定于细胞的因子校正每个细胞,来修正每个单细胞,数据整体收敛完成并且通过后,即可得到矫正后的数据信息。
S6、当计算的矫正因子数据未通过数据整体收敛后,则重新返回至S3步骤,同样通过概率性地将单细胞分配给不同的数据群组,并且依次完成S4、S5和S6,直至通过数据整体收敛,即可得到矫正后的数据信息。
作为本发明的进一步方案:所述S1~S6中,进一步对数据处理的方式如下:
A1、根据S3中概率性地将单细胞分配给不同的数据群组,可通过对细胞分配的数据组进行编号处理,其次根据对应的编号信息进行数据接收采集。
A2、通过S5中对矫正的单细胞数据进行收敛时,可根据数据信息的收敛对其进行实时监测采集,根据计算各项数据组的特征信息及计算的矫正因子数据进行动态采集。
A3、通过A1中对对应的编号信息的接收数据、A2中动态采集的数据信息与A2中实时监测的数据进行整合,即通过计算的矫正因子信息与接收的细胞分配编号信息进行整合归类。
A4、其次可通过整合归类的数据信息识别多批次细胞纠正因子数据信息。
A5、可将识别的纠正因子数据通过动态显示的方式体现,并可形成最终数据报表。
作为本发明的进一步方案:所述S6中,可通过聚类分配的方式对数据分隔,聚类分配和数据集之间的依赖性随着每一轮的减少而减小,降低样本间的数据差异。
作为本发明的进一步方案:所述A2中动态采集的数据信息包括S3~S5,通过动态实时监测的方式进行数据采集,提高数据处理整合的准确性,有利于相关人员进行准确判断。
(三)有益效果
与现有技术相比,本发明的有益效果在于:
1、本发明能够对组织质谱成像数据进行批次差异的去除,首先对得到的细胞抗体强度进行转化,然后对数据进行PCA降维处理,之后对单细胞随机分配为不同的数据群组,然后计算对应数据群组的特征并计算矫正因子,根据得到的矫正因子进行数据矫正,数据整体收敛较好后,即可得到矫正后的数据结果,从而减小样本间的差异,有利于通过数据对后续的分析,为后续软件开发核算法优化提供依据;
2、本发明通过对细胞分配的数据组进行编号处理,其次根据对应的编号信息进行数据接收采集,通过计算各项数据组的特征信息及计算的矫正因子数据进行动态采集,实现计算的矫正因子信息与接收的细胞分配编号信息进行整合归类,通过整合归类的数据信息识别多批次细胞纠正因子数据信息并且由动态显示的方式体现,通过动态实时监测的方式进行数据采集,提高数据处理整合的准确性,同时通过对数据的检测及对比分析的方式对不同批次的纠正因子信息进行归类识别整理,便于相关人员因不同批次检测的数据信息所产生的原因进行准确判断。
附图说明
图1为该针对组织质谱成像结果去除批次间差异的方法流程框图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
如图所示,本发明提供一种技术方案:一种针对组织质谱成像结果去除批次间差异的方法,包括以下步骤:
S1、首先需检测得到的细胞原始抗体的抗体强度数值,并且需取对数。
S2、当对细胞原始抗体的抗体强度数值进行检测收集完成后,可对接收的数据信息进行PCA降维处理,从而得到新的数据矩阵。
S3、根据S2中得到的新数据矩阵,其次可将概率性地将单细胞分配给不同的数据群组,从而使每个数据群组内数据集的多样性最大化。
S4、通过分配的不同数据群组,计算每个数据群组的所有数据集的全局中心,以及特定数据集的中心,其次在每个数据群组中,基于中心为每个数据集计算校正因子。
S5、通过S4中特定于细胞的因子校正每个细胞,来修正每个单细胞,数据整体收敛完成并且通过后,即可得到矫正后的数据信息。
S6、当计算的矫正因子数据未通过数据整体收敛后,则重新返回至S3步骤,同样通过概率性地将单细胞分配给不同的数据群组,并且依次完成S4、S5和S6,直至通过数据整体收敛,即可得到矫正后的数据信息。
所述S1~S6中,进一步对数据处理的方式如下:
A1、根据S3中概率性地将单细胞分配给不同的数据群组,可通过对细胞分配的数据组进行编号处理,其次根据对应的编号信息进行数据接收采集。
A2、通过S5中对矫正的单细胞数据进行收敛时,可根据数据信息的收敛对其进行实时监测采集,根据计算各项数据组的特征信息及计算的矫正因子数据进行动态采集。
A3、通过A1中对对应的编号信息的接收数据、A2中动态采集的数据信息与A2中实时监测的数据进行整合,即通过计算的矫正因子信息与接收的细胞分配编号信息进行整合归类。
A4、其次可通过整合归类的数据信息识别多批次细胞纠正因子数据信息。
A5、可将识别的纠正因子数据通过动态显示的方式体现,并可形成最终数据报表。
所述S6中,可通过聚类分配的方式对数据分隔,聚类分配和数据集之间的依赖性随着每一轮的减少而减小,降低样本间的数据差异,所述A2中动态采集的数据信息包括S3~S5,通过动态实时监测的方式进行数据采集,提高数据处理整合的准确性,有利于相关人员进行准确判断。
该方案能够对组织质谱成像数据进行批次差异的去除,首先对得到的细胞抗体强度进行转化,然后对数据进行PCA降维处理,之后对单细胞随机分配为不同的数据群组,然后计算对应数据群组的特征并计算矫正因子,根据得到的矫正因子进行数据矫正,数据整体收敛较好后,即可得到矫正后的数据结果,从而减小样本间的差异,有利于通过数据对后续的分析,为后续软件开发核算法优化提供依据。
通过对细胞分配的数据组进行编号处理,其次根据对应的编号信息进行数据接收采集,通过计算各项数据组的特征信息及计算的矫正因子数据进行动态采集,实现计算的矫正因子信息与接收的细胞分配编号信息进行整合归类,通过整合归类的数据信息识别多批次细胞纠正因子数据信息并且由动态显示的方式体现,通过动态实时监测的方式进行数据采集,提高数据处理整合的准确性,同时通过对数据的检测及对比分析的方式对不同批次的纠正因子信息进行归类识别整理,便于相关人员因不同批次检测的数据信息所产生的原因进行准确判断。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。
Claims (4)
1.一种针对组织质谱成像结果去除批次间差异的方法,其特征在于:包括以下步骤:
S1、首先需检测得到的细胞原始抗体的抗体强度数值,并且需取对数;
S2、当对细胞原始抗体的抗体强度数值进行检测收集完成后,可对接收的数据信息进行PCA降维处理,从而得到新的数据矩阵;
S3、根据S2中得到的新数据矩阵,其次可将概率性地将单细胞分配给不同的数据群组,从而使每个数据群组内数据集的多样性最大化;
S4、通过分配的不同数据群组,计算每个数据群组的所有数据集的全局中心,以及特定数据集的中心,其次在每个数据群组中,基于中心为每个数据集计算校正因子;
S5、通过S4中特定于细胞的因子校正每个细胞,来修正每个单细胞,数据整体收敛完成并且通过后,即可得到矫正后的数据信息;
S6、当计算的矫正因子数据未通过数据整体收敛后,则重新返回至S3步骤,同样通过概率性地将单细胞分配给不同的数据群组,并且依次完成S4、S5和S6,直至通过数据整体收敛,即可得到矫正后的数据信息。
2.根据权利要求1所述的一种针对组织质谱成像结果去除批次间差异的方法,其特征在于:所述S1~S6中,进一步对数据处理的方式如下:
A1、根据S3中概率性地将单细胞分配给不同的数据群组,可通过对细胞分配的数据组进行编号处理,其次根据对应的编号信息进行数据接收采集;
A2、通过S5中对矫正的单细胞数据进行收敛时,可根据数据信息的收敛对其进行实时监测采集,根据计算各项数据组的特征信息及计算的矫正因子数据进行动态采集;
A3、通过A1中对对应的编号信息的接收数据、A2中动态采集的数据信息与A2中实时监测的数据进行整合,即通过计算的矫正因子信息与接收的细胞分配编号信息进行整合归类;
A4、其次可通过整合归类的数据信息识别多批次细胞纠正因子数据信息;
A5、可将识别的纠正因子数据通过动态显示的方式体现,并可形成最终数据报表。
3.根据权利要求1所述的一种针对组织质谱成像结果去除批次间差异的方法,其特征在于:所述S6中,可通过聚类分配的方式对数据分隔,聚类分配和数据集之间的依赖性随着每一轮的减少而减小,降低样本间的数据差异。
4.根据权利要求2所述的一种针对组织质谱成像结果去除批次间差异的方法,其特征在于:所述A2中动态采集的数据信息包括S3~S5,通过动态实时监测的方式进行数据采集,提高数据处理整合的准确性,有利于相关人员进行准确判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110063056.1A CN112906740B (zh) | 2021-01-18 | 2021-01-18 | 一种针对组织质谱成像结果去除批次间差异的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110063056.1A CN112906740B (zh) | 2021-01-18 | 2021-01-18 | 一种针对组织质谱成像结果去除批次间差异的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112906740A CN112906740A (zh) | 2021-06-04 |
CN112906740B true CN112906740B (zh) | 2023-11-21 |
Family
ID=76114983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110063056.1A Active CN112906740B (zh) | 2021-01-18 | 2021-01-18 | 一种针对组织质谱成像结果去除批次间差异的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906740B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708919B (zh) * | 2022-03-08 | 2022-11-15 | 广州基迪奥科技服务有限公司 | 一种快速低损的群体单细胞大数据精简方法 |
CN115452929B (zh) * | 2022-09-30 | 2023-04-21 | 上海立迪生物技术股份有限公司 | 一种成像质谱流式的信号校准方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110044997A (zh) * | 2018-01-15 | 2019-07-23 | 中国医学科学院药物研究所 | 一种体内药物的离子强度虚拟校正和定量质谱成像分析方法 |
CN111796095A (zh) * | 2019-04-09 | 2020-10-20 | 苏州扇贝生物科技有限公司 | 一种蛋白质组质谱数据处理方法及装置 |
CA3139879A1 (en) * | 2019-05-14 | 2020-11-19 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | System and method for characterizing cellular phenotypic diversity from multi-parameter cellular and sub-cellular imaging data |
-
2021
- 2021-01-18 CN CN202110063056.1A patent/CN112906740B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110044997A (zh) * | 2018-01-15 | 2019-07-23 | 中国医学科学院药物研究所 | 一种体内药物的离子强度虚拟校正和定量质谱成像分析方法 |
CN111796095A (zh) * | 2019-04-09 | 2020-10-20 | 苏州扇贝生物科技有限公司 | 一种蛋白质组质谱数据处理方法及装置 |
CA3139879A1 (en) * | 2019-05-14 | 2020-11-19 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | System and method for characterizing cellular phenotypic diversity from multi-parameter cellular and sub-cellular imaging data |
Non-Patent Citations (2)
Title |
---|
单细胞分析技术在人类细胞图谱计划中的应用;刘念;王园园;胡新笑;何滨;曲广波;史建波;胡立刚;江桂斌;;中国科学:化学(10);全文 * |
基因表达数据批次效应去除方法的研究进展;李飒;赵毅强;;南京农业大学学报(03);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112906740A (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112906740B (zh) | 一种针对组织质谱成像结果去除批次间差异的方法 | |
US10910205B2 (en) | Categorization data manipulation using a matrix-assisted laser desorption/ionization time-of-flight mass spectrometer | |
US10466104B2 (en) | Mass spectrometric data analyzer and program for analyzing mass spectrometric data | |
CN111539657A (zh) | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 | |
CN114627125A (zh) | 一种基于光学手段的不锈钢压片机表面质量评估方法 | |
CN115994907B (zh) | 用于食品检测机构综合信息的智能处理系统及方法 | |
CN112098361A (zh) | 一种基于近红外光谱的玉米种子鉴别方法 | |
CN116559111A (zh) | 一种基于高光谱成像技术的高粱品种识别方法 | |
CN111832389A (zh) | 一种骨髓细胞形态学自动检测系统的计数及分析方法 | |
US20190096648A1 (en) | Method for monitoring the quality of mass spectrometric imaging preparation workflows | |
CN112798678A (zh) | 基于血清的新型冠状病毒感染快速检测方法 | |
CN117686712A (zh) | 一种基于舌苔微生物蛋白筛查胃癌的方法 | |
CN105893790A (zh) | 针对质谱缺失蛋白质数据的分类方法 | |
CN113380318B (zh) | 人工智能辅助流式细胞术40cd免疫表型检测方法及系统 | |
CN113447455B (zh) | 一种基于太赫兹技术的纤维材料检测系统 | |
CN111833297B (zh) | 一种骨髓细胞形态学自动检测系统的疾病联想方法 | |
CN111755079B (zh) | 一种多晶硅最优原料配比方案确定方法及系统 | |
CN111126496B (zh) | 变压器固体绝缘材料类型确定方法 | |
CN112087272B (zh) | 一种电磁频谱监测接收机信号自动检测方法 | |
CN113011296B (zh) | 快速鉴别小麦品种纯度的方法和系统 | |
CN108073790A (zh) | 一种染色体变异检测装置 | |
CN109827908B (zh) | 一种利用光谱数据判别红富士苹果腐烂程度的方法 | |
CN116168375B (zh) | 一种汽车零部件智能识别方法及系统 | |
CN112881268A (zh) | 一种基于流式细胞术的尿液有形成分波形信号的处理方法 | |
CN118246798A (zh) | 一种大面积土地成分检测分析方法及耕地质量鉴定系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |