CN115406954A - 用于代谢物的数据分析方法、系统、设备和存储介质 - Google Patents
用于代谢物的数据分析方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN115406954A CN115406954A CN202211140787.2A CN202211140787A CN115406954A CN 115406954 A CN115406954 A CN 115406954A CN 202211140787 A CN202211140787 A CN 202211140787A CN 115406954 A CN115406954 A CN 115406954A
- Authority
- CN
- China
- Prior art keywords
- data
- metabolites
- metabolite
- tissue
- tumor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
- G01N27/68—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using electric discharge to ionise a gas
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了用于代谢物的数据分析方法、系统、设备和存储介质,包括获取若干个肿瘤组织的质谱数据,得到所述肿瘤组织的原位代谢物信号,并进行聚类分析,得到对应的代谢物;获取肿瘤组织的代谢组数据,得到代谢物的定性注释;根据质谱数据得到对应的质谱成像数据,根据质谱成像数据得到信号数据;对信号数据进行噪音去除和组织区域识别,得到真实信号数据;对真实信号数据进行主成分分析和降维可视化,得到聚类结果;将聚类结果还原至真实组织的平面上,得到所述肿瘤组织的代谢异质性。本发明不仅能够对多样本数据进行整合,对代谢物进行高通量注释,还能够进行数据分析,提高了原位代谢物成像技术应用的广泛性。
Description
技术领域
本发明涉及代谢物数据分析技术领域,特别是涉及一种用于原位代谢物的数据分析方法、系统、计算机设备和存储介质。
背景技术
目前,解析电喷雾电离-质谱仪联用技术(DESI-MS)是原位代谢谱解析的主要技术之一。在不需要对样品进行前处理的条件下,DESI-MS原位代谢物成像技术能快速对样品中的代谢物进行气化分析,直接获取样品中代谢物的空间分布信息,其具有样品前处理简单、灵敏度高、常压检测、操作简便、信息直观、原位、实时等优点,目前已被广泛用于癌症研究和药物代谢等领域。
现在已有不少研究将DESI-MS技术应用于生物组织上,它们对获取到的代谢数据可以进行简单可视化和聚类分析。另外,现在也有相关软件如High Definition Imaging(HDImaging)软件,也能够对DESI-MS数据进行基本的可视化,但无论是以往研究的分析方法还是HDImaging软件,都缺乏高级数据分析的功能,尤其是无法实现DESI-MS多样本整合分析以及对空间分布特征代谢物的高通量注释和筛选等,因而严重限制了DESI-MS原位代谢物成像技术在代谢小分子功能、代谢标志物发现等方面的广泛应用。
发明内容
为了解决上述技术问题,本发明提供了一种用于特征代谢物的DESI-MS数据分析方法,能够解决DESI-MS数据的多样本整合、以及LC-MS结果与DESI-MS结果的整合问题,并且能够对数据进行背景噪音去除,组织区域代谢物DESI-MS信号识别,以及组织区域代谢物空间分布模式重构,从而提高原位代谢物成像技术在代谢小分子功能、代谢标志物发现等方面应用的广泛性。
第一方面,本发明提供了一种用于代谢物的数据分析方法,所述方法包括:
获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物;
获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释;
根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据;
对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据;
对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果;
将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。
进一步地,所述获取肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物的步骤包括:
通过DESI-MS扫描获取肿瘤组织的质谱数据,并根据质谱数据,得到对应的第一质荷比;
通过核密度估计对所述第一质荷比进行聚类分析,得到所述质谱数据对应的代谢物的种类数量。
进一步地,所述获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释的步骤包括:
通过LC-MS实验对所述肿瘤组织进行代谢组成分分析,得到所述肿瘤组织的代谢组数据,并根据所述代谢组数据得到第二质荷比;
根据所述第二质荷比,得到对应的代谢物信息;
将所述第一质荷比和所述第二质荷比相比对,根据比对结果和所述代谢物信息,对所述质谱数据的代谢物进行定性分析,得到所述代谢物的定性注释。
进一步地,所述对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据的步骤包括:
将第二阈值作为强度,按照所述强度获取所述第一质荷比中对应的像素点;
计算所述像素点落在组织区域和背景区域的比值,若所述比值小于第三阈值,则将所述第一质荷比作为污染噪音,并将所述污染噪音从所述信号数据中去除;
对去除污染噪音后的所述信号数据进行图像识别,得到组织区域的信号数据,并将所述组织区域的信号数据作为所述代谢物的真实信号数据。
进一步地,所述将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性的步骤包括:
通过矩阵坐标将所述聚类结果还原至HE染色的真实组织的平面上,并在对应位置上设置聚类标签,得到代谢物空间聚类结果;
将所述肿瘤组织进行HE染色,得到对应的组织病理结构;
将所述代谢物空间聚类结果和所述组织病理结构相对比,得到所述肿瘤组织的代谢异质性。
进一步地,所述方法还包括:
根据多不饱和脂肪酸ω6的代谢通路,得到对应的通路代谢物;
从所述质谱成像数据中寻找所述通路代谢物,并将找到的所述通路代谢物作为第二通路代谢物;
获取所述第二通路代谢物的分布模式,将具有肿瘤边界特异性分布模式的所述第二通路代谢物作为肿瘤边界代谢标志物,其中,所述肿瘤边界代谢标志物为肾上腺酸。
第二方面,本发明提供了一种用于代谢物的数据分析系统,所述系统包括:
聚类分析模块,用于获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物;
代谢物注释模块,用于获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释;
信号数据获取模块,用于根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据;
信号去噪识别模块,用于对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据;
信号聚类模块,用于对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果;
代谢异质性分析模块,用于将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述本发明提供了一种用于代谢物的数据分析方法、系统、计算机设备和存储介质。通过所述方法,能够将DESI-MS数据进行多样本的整合,并且能够将LC-MS结果和DESI-MS结果进行整合,从而实现特征代谢物的高通量高精度的注释和筛选,同时还设定了数据分析过程,并由此找到与肿瘤演进相关的重要特征性代谢物,进一步提高了原位代谢物成像技术的应用范围。
附图说明
图1是本发明实施例提供的用于代谢物的数据分析方法的流程示意图;
图2是图1中步骤S10的流程示意图;
图3是本发明实施例提供的肿瘤组织切片扫描的质荷比示意图;
图4是本发明实施例提供的质荷比的聚类分析结果示意图;
图5是图1中步骤S20的流程示意图;
图6是本发明实施例提供的DESI-MS和LC-MS数据整合示意图;
图7是本发明实施例提供的相邻切片共享特征代谢物示意图;
图8是本发明实施例提供的不同切片共享特征代谢物示意图;
图9是本发明实施例提供的验证LC-MS对DESI代谢物注释结果准确性的示意图;
图10是本发明实施例提供的DESI-MS信号重构组织区域代谢物空间分布模式的示意图;
图11是本发明实施例提供的组织区域代谢物空间分布模式的重构揭示肿瘤代谢异质性的示意图;
图12是本发明实施例提供的获取肿瘤边界代谢标志物的过程示意图;
图13是本发明实施例提供的用于代谢物的数据分析系统的结构示意图;
图14是本发明实施例中计算机设备的内部结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明第一实施例提出的一种用于代谢物的数据分析方法,包括步骤S10~S60:
步骤S10,获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物。
对于肿瘤组织进行数据分析,首先需要获取肿瘤组织的相关数据,因此,我们可以利用DESI-MS技术扫描肿瘤组织的冰冻切片来获取从中获取数据信息,具体步骤如图2所示:
步骤S101,通过DESI-MS扫描获取肿瘤组织的质谱数据,并根据质谱数据,得到对应的第一质荷比。
本实施例中,我们利用DESI-MS技术扫描了若干张人肠癌组织的冰冻切片,然后经过质控保留了多个样品的40张切片数据,来从中获取高通量、高质量和高重复性的原位代谢物信号,需要说明的是,本实施例中出现的肿瘤名称以及具体的数据数值只是用于举例说明,而非限定,后续将不再重复说明。
DESI-MS空间代谢组学领域最大的挑战是相同代谢物在DESI-MS每一次扫描组织切片中所得到质荷比即m/z值都是不同的,从而难以对DESI-MS多样本数据进行整合。即使在保证仪器精度尽可能高的前提下,扫描次数越多,本应代表同一种代谢物的多个m/z值也会有较大的波动幅度,甚至超过仪器本身设定的m/z值误差范围,这就导致我们很难将多张切片的数据整合在一起,对于代谢物的高通量注释和筛选是个很大的挑战。
步骤S102,通过核密度估计对所述第一质荷比进行聚类分析,得到所述质谱数据对应的代谢物。
为了解决代谢物高通量注释的问题,我们采用了核密度估计的聚类算法对DESI-MS多样本数据进行整合,来鉴定相同代谢物在不同样品的原位空间分布特征。即在保证仪器精度尽可能高的前提下,当进行多张切片的扫描时,同一个代谢物的m/z值会在真实值附近波动,越密集的地方属于真实值的概率越大,据此对所有m/z进行核密度估计就能实现m/z的聚类。
而核密度估计有多种内核,本实施例优选的使用了Epanechnikov核函数,其原因在于它对于m/z的分群效果良好,其内核在均方误差意义下是最优的,并且相比于高斯核函数可以大大减少计算量,提高算法的运算速度。
如图3所示,将40张切片扫描得到的m/z值混合在一起从小到大排序,图中1个圆圈代表1个m/z值,不同颜色代表不同切片。所有切片扫描得到的m/z从小到大排序,其中m/z183.00~183.05区段展示,可以看到有些m/z值会出现聚集现象,而有些则出现了分段。
然后利用Epanechnikov核函数对m/z的分布做密度估计,得到如图4所示的区段m/z183.00~183.05的核密度估计结果,根据三个主峰值我们把这一区段的m/z聚成三类,意味着这些m/z分别代表着三种代谢物,来源于不同切片的m/z值只要属于同一个类就可以进行整合。于是我们通过核密度估计的算法对m/z值进行聚类,实现了不同DESI-MS数据集的整合。
步骤S20,获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释。
虽然完成了多张切片数据的整合,但是由于我们采用的DESI-MS扫描模式为一级质谱,只能得到代谢物的m/z,缺少更多代谢物二级结构的信息,所以并不能对这些m/z进行定性,例如无法区分同分异构体。
为了对组织中的代谢物进行准确的定性分析,但是仅通过代谢物的m/z在数据库查找相应分子量的物质来注释代谢物的结果并不理想。其原因一方面是代谢物的定性需要二级结构信息,而我们仅利用了m/z值,无法区分相同分子量但结构不同的物质;另一方面是不同实验平台和不同仪器设备得到的数据库存在数据误差,直接匹配可能导致错误的定性。
为此,我们利用了LC-MS实验来获取肿瘤组织的代谢组数据,然后通过LC-MS已知的代谢物信息对DESI-MS检测到的代谢物进行定性分析,具体步骤如图5所示:
步骤S201,通过LC-MS实验对所述肿瘤组织进行代谢组成分分析,得到所述肿瘤组织的代谢组数据,并根据所述代谢组数据得到第二质荷比;
步骤S202,根据所述第二质荷比,得到对应的代谢物信息;
步骤S203,将所述第一质荷比和所述第二质荷比相比对,根据比对结果和所述代谢物信息,对所述质谱数据的代谢物进行定性分析,得到所述代谢物的定性注释。
我们将与DESI-MS扫描的组织切片同源的肿瘤组织作为代谢组数据的来源,以结直肠癌冰冻组织块为材料进行举例说明,从该肿瘤组织中提取脂质和小分子物质,然后分别使用LC-MS技术进行代谢组成分分析,从而得到肿瘤组织的代谢组数据,根据代谢组数据我们可以获取对应的代谢物信息,并且我们可以从代谢组数据中可以得到m/z值即第二质荷比,根据第一质荷比与第二质荷比的比较结果,就能判定两种质荷比表示的是否为同一代谢物。需要说明的是,代谢组数据来源的肿瘤组织与经DESI-MS扫描的组织切片同源。
以上述聚类分析得到的结果为例,我们通过核密度算法将区段内的m/z值聚成三类,代表着这一区段内有三种代谢物,为了对这三种代谢物进行定性,我们把经过离子转换之后的LC-MS结果标注在该区段内即如图6所示,其中一个LC-MS的结果标注在了第一类,那么此类中DESI-MS的所有m/z都可以被注释为这一LC-MS结果对应的代谢物(化学式C5H9ClO5),同样的,第二类DESI-MS的m/z也可以被注释出来(化学式C4H4N6O3)。所以通过把DESI-MS和LC-MS的结果整合起来,我们就能将DESI-MS的所有m/z都注释出来,从而有利于后续代谢物生物功能的探究。
在具体的实验中,通过LC-MS实验得到的代谢组学结果共有1401个脂质和2450个小分子。其中脂质主要归属于甘油磷脂(GP)和鞘脂(SP)两个大类。进一步过滤分析脂质数据,将其根据m/z去重,最终得到514个脂质,用于DESI代谢物的定性注释。对于小分子,将得到的m/z与ChemSpider Search数据库匹配,发现1795个小分子有注释名称,注释率为73.27%,与Feng Chen等人运用液质联用技术,以非靶向方式研究结直肠癌患者血清代谢组,所得结果的注释率相似。Feng Chen的研究共得到1426个代谢物,其中885个可被注释,注释率62.06%。
于是通过液质联用代谢组学实验,我们最终获得注释的脂质共有514个,小分子共有2450个。DESI实验中28个样品共检测到代谢物为5854个,将DESI与液质联用检测到的m/z互相匹配,DESI代谢物具有定性注释的脂质有253个,占液质联用具有定性注释的脂质总数的百分比为49.22%;DESI代谢物具有定性注释的小分子有835个,占液质联用检测到的小分子总数的百分比为34.08%。
接着我们分别计算脂质和小分子在结直肠癌样本中的检测频率,发现有些代谢物存在组织特异性,只在单个结直肠癌组织中出现,不与其他组织共享。只在单个组织中检测到的小分子占总小分子比率为29.70%,脂质占总脂质比率为12.25%。这说明很多代谢物存在组织异质性,推测可能与肿瘤异质性相关。28个样品中在10个及以上组织中检测到的小分子占总小分子比率为21.44%,脂质占总脂质比率为37.94%,这说明同类型的组织有代谢相似性,同时说明DESI技术检测的可重复性和我们分析方法的准确性。
通过上述的步骤,我们实现了DESI-MS的多样本整合以及对代谢物的高通量注释,而基于此数据分析框架,我们就可以在同一块组织的两张相邻切片中重现特征代谢物,也能在不同组织来源切片中找到共同的代谢物特征。
对于在相邻切片中重现特征代谢物,如图7所示,以样品ST129为例,前后间隔一天分别对其两张相邻切片进行DESI-MS扫描,经过LC-MS注释从中找到共有的特征性代谢物。其中,图7的A部分人肠癌组织ST129的HE染色,T表示肿瘤,TB表示肿瘤边界,Ms表示固有肌层,MC表示黏膜层。
图7的B、C为特征代谢物在两张相邻切片中的分布举例,m/z标注在图右上方,所属代谢物的化学式和名称在图上方,B和C部分展示了三个注释出来的小分子代谢物,可以看到这些共享的特征性代谢物在相邻切片中的分布模式有非常高的相似性。相应的化学式和名称标注在图片上方,其中C2H6O5S在数据库中尚未匹配到具体物质名称。代谢物C15H24O3在肿瘤区域和边界都有分布,C15H24O3S主要在肿瘤和肌肉的交界分布,而C2H6O5S则在肿瘤区域集中分布。
同样的,我们也能够鉴定相同代谢物在不同样品的原位空间分布特征,如图8所示的是小分子代谢物花生四烯酸(AA),其分布集中在各组织的肿瘤区域。因此,无论是相同组织的相邻切片还是不同组织来源的切片,我们都能看到,相同代谢物在不同切片的原位空间分布特征是相对稳定的。
进一步地,我们以花生四烯酸为例做二级质谱(DESI-MS/MS),验证LC-MS对一级质谱(DESI-MS)代谢物注释结果的准确性。用代表性样品ST103做二级质谱对AA进行靶向定性,我们采用梯度电压10V、15V和20V分别对标准品AA进行打碎,根据特征碎片检出情况选择10V电压的结果为标准参照,则标准品AA的母离子[M-H]-为m/z 303.2438,两个特征碎片分别为m/z 205.2073和m/z 259.2533,图9的A部分所示的为标准品AA和样品ST103中AA的二级质谱图。得到标准品AA的二级质谱图之后,我们就可以在样品中验证算法注释的准确性。样品ST103一级质谱结果注释为AA的是m/z 303.2475,同样用10V电压对其进行打碎,得到母离子[M-H]-(m/z 303.2256)和两个特征碎片(m/z 205.1880和m/z 259.2353),并且特征碎片与标准品所得碎片位置吻合,因此花生四烯酸AA的DESI-MS注释结果是准确的。
再来看代谢物的信号分布模式。样品ST103中,一级质谱AA(m/z303.2475)的分布模式与二级质谱AA的母离子[M-H]-(m/z 303.2256)分布模式非常相似,都是在肿瘤区域聚集,如图9的B和C部分分别为样品中AA的二级质谱特征碎片图像和样品中AA的一级质谱图像,其中方框区域是肿瘤组织。而二级质谱的母离子[M-H]-(m/z303.2256)和两个特征碎片(m/z 205.1880和m/z 259.2353)也存在相同的分布模式。这一结果也进一步验证了AA注释结果的准确性。
二级质谱的结果验证了我们用LC-MS对DESI-MS代谢物注释结果的准确性。由此,我们实现了特征性代谢物的高通量高精度注释和筛选。
步骤S30,根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据。
步骤S40,对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据。
在得到代谢物的高通量注释之后,我们还可以对DESI-MS数据做进一步的分析,包括背景噪音去除、组织区域代谢物DESI-MS信号识别、以及组织区域代谢物空间分布模式重构。
仍以样品组织ST129为例,该样品包含病理结构清晰的组织,例如黏膜层、肿瘤、肿瘤间质组织和肌肉层等。该组织经DESI-MS扫描后,通过HDI1.5软件输出质谱成像文件,其中m/z值误差范围设置为0.02,peaks数目设置为3000,于是我们获得信号强度最高的前3000种小分子代谢物(m/z>100)的空间分布信息。与此同时,我们也得到一个二维数值矩阵,矩阵的行为组织区域物理位置坐标,矩阵的列为所有检测到的代谢物的质荷比,矩阵的数值代表检测到的代谢物的丰度。
通过HDI软件可视化组织的质谱成像文件,能观察到代谢物在组织区域分布的信号清晰且具有空间分布特征,然而有一部分代谢物信号被噪音污染,在组织区域和背景区域都有信号分布。因此,我们需要将被污染的信号去除,具体步骤如下所示:
步骤S401,将第二阈值作为强度,按照所述强度获取所述第一质荷比中对应的像素点;
步骤S402,计算所述像素点落在组织区域和背景区域的比值,若所述比值小于第三阈值,则将所述第一质荷比作为污染噪音,并将所述污染噪音从所述信号数据中去除;
步骤S403,对去除污染噪音后的所述信号数据进行图像识别,得到组织区域的信号数据,并将所述组织区域的信号数据作为所述代谢物的真实信号数据。
为了去除被污染的信号,对于整个扫描区域,如果某m/z的高信号值有半数以上都在背景区域,那么这一m/z就属于污染物,需要去除。更具体的,我们可以设定,每个m/z选择强度处于最高10%的那部分像素点,计算这部分像素点落在组织区域和背景区域的比值,也即tissue/background比值,比值小于0.5的m/z即认为已经受到了污染,一律丢弃。
按照上述方法去除污染严重的信号之后,剩余信号中仍然存在一些噪音,有的掩盖了代谢物在组织的真实信号分布,为此,可以继续通过图像识别技术来保留组织区域的信号,而排除背景区域的噪音,从而可以得到代谢物在组织区域的真实信号分布。
步骤S50,对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果。
去除噪音之后,由于实验操作和包埋剂沾染等原因,组织边缘很大程度上会被污染,考虑到我们研究的重点主要是组织内部区域,因此我们可以将组织区域的边缘统一往内部缩进若干个像素单位,优选的,我们可以设定统一向内缩进5个像素单元来进一步排除噪音的干扰。
数据预处理之后,对处理后的信号数据进行标准化,并使用PCA进行主成分分析,然后通过UMAP进行非线性降维实现可视化,最后进行聚类分析,其中,分辨率参数设置为系列梯度参数,根据样本特性和聚类效果选择最佳的分辨率参数,通过上述操作即可得到如图10的A部分所示的去除背景噪音后,DESI-MS原位代谢物信号主成成分分析降维并在UMAP空间可视化聚类的结果,需要说明的,其他方式获取的信号数据均可以采用上述方式进行处理,并不仅仅限于DESI-MS数据。
步骤S60,将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。
得到聚类结果后,可以将聚类结果还原到HE染色的真实组织的形状上,继而判断肿瘤组织的代谢异质性,具体步骤如下所示:
步骤S601,通过矩阵坐标将所述聚类结果还原至HE染色的真实组织的平面上,并在对应位置上设置聚类标签,得到代谢物聚类结果;
步骤S602,将所述肿瘤组织进行HE染色,得到对应的组织病理结构;
步骤S603,将所述代谢物聚类结果和所述组织病理结构相对比,得到所述肿瘤组织的代谢异质性。
如图10的B部分所示,将UMAP空间的聚类结果通过矩阵坐标还原至HE染色的组织平面,并给每个组织位置打上聚类的标签,同时,我们还将人肠癌组织ST129进行HE染色,即如图10的C部分所示,将代谢物聚类结果与人肠癌组织HE染色组织病理结构相对比,发现代谢物聚类结果与组织病理结构高度吻合,第1类对应组织的肿瘤细胞,第3类对应组织的肌肉层,第5类对应组织的上皮细胞,如图10的D部分分别展示了各个类在组织平面的分布。不仅如此,我们从聚类结果中还发现:第1、6类信号的分布都有一个共同点,它们都在黏膜层和肿瘤的交界处有分布,如图10的E部分所示,cluster1信号主要分布在HE染色的肿瘤区域,其中圈出的区域发生了类别1的信号的扩散,指示肿瘤细胞发生了扩散。cluster1扩散的信号和cluster6信号在空间中混合分布。肿瘤细胞扩散发生在肿瘤侵袭方向的黏膜层;箭头指示肿瘤侵袭的方向,圈出的区域发生了肿瘤的扩散。即呈现出了肿瘤细胞入侵粘膜层的趋势,这在某种程度上揭示了肿瘤细胞边界处异质性高的特点。对这一类具有肿瘤侵袭特征的原位代谢物信息的提取将有利于解析肿瘤空间演进的机制和模型,而仅仅依靠组织HE染色的结果是无法观察到这些现象的。
在其他的组织切片中,也同样能观察到肿瘤的代谢异质性。如图11所示,对样品组织ST88进行降维聚类之后,如图11的D部分,我们发现肿瘤被按照不同的代谢特征分成了三个类,表明肿瘤有代谢的异质性,同样,黏膜层也被分成两类即如图11的E部分,说明靠近肿瘤的黏膜层其实已经发生了恶化,黏膜层也有代谢的异质性。人肠癌组织不同区域有代谢异质性,这也符合之前的研究认识。据此可以证实本发明建立对DESI-MS高维原位代谢物信号降维和聚类的分析方法能够看到组织的代谢异质性。
在本发明建立的数据分析方法的基础上,还可以寻找到可能的肿瘤边界代谢标志物,具体步骤如下所示:
步骤S701,根据多不饱和脂肪酸ω6的代谢通路,得到对应的通路代谢物;
步骤S702,从所述质谱成像数据中寻找所述通路代谢物,并将找到的所述通路代谢物作为第二通路代谢物;
步骤S703,获取所述第二通路代谢物的分布模式,将具有肿瘤边界特异性分布模式的所述第二通路代谢物作为肿瘤边界代谢标志物,其中,所述肿瘤边界代谢标志物为肾上腺酸。
为了寻找可能的肿瘤边界代谢标志物,我们从多不饱和脂肪酸ω6的代谢通路入手,ω6多不饱和脂肪酸代谢通路促进炎症的发生,会增加肿瘤发生生长的风险。根据图12的A部分所示的代谢通路,可以看到代谢通路上的代谢物包括亚油酸(LA)、γ-次亚麻油酸(GLA)、二高-γ-亚麻酸(DGLA)、花生四烯酸(AA)和肾上腺酸(ADA)。
而通路上框出来的二高-γ-亚麻酸(DGLA)、花生四烯酸(AA)和肾上腺酸(ADA)这3个代谢物在扫描的切片中都能找得到。以ST87为例,图12的B部分所示,从代谢物的分布模式可以直观看到,DGLA在肿瘤里面弥散性分布,AA开始逐渐往边界靠拢,到ADA的时候只在边界分布。实际上在其他组织中我们也能看到这个现象,例如图12的B部分展示的ST32和ST103。
因此我们找到了在肿瘤边界特异性分布的小分子代谢物肾上腺酸(ADA)。ADA在肿瘤边界集中分布,表示其可以作为肿瘤边界的代谢标志物应用于肿瘤临床检测。
本实施例提供的一种用于代谢物的数据分析方法,相比DESI-MS技术领域现有的数据分析方法,本发明能够对DESI-MS多样本数据进行整合,鉴定相同代谢物在不同样品的原位空间分布特征,并对DESI-MS数据进行代谢物的高通量注释,由此找到与肿瘤演进相关的重要特征性代谢物,除此之外,本发明还能够对DESI-MS数据进行数据分析,包括背景噪音去除,组织区域代谢物DESI-MS信号识别,以及组织区域代谢物空间分布模式重构,从而提高了DESI-MS原位代谢物成像技术应用的广泛性。
请参阅图13,基于同一发明构思,本发明第二实施例提出的用于代谢物的数据分析系统,包括:
聚类分析模块10,用于获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物;
代谢物注释模块20,用于获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释;
信号数据获取模块30,用于根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据;
信号去噪识别模块40,用于对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据;
信号聚类模块50,用于对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果;
代谢异质性分析模块60,用于将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。
本发明实施例提出的用于代谢物的数据分析系统的技术特征和技术效果与本发明实施例提出的方法相同,在此不予赘述。上述用于代谢物的数据分析系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
请参阅图14,一个实施例中计算机设备的内部结构图,该计算机设备具体可以是终端或服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示器和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现用于代谢物的数据分析系方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域普通技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算设备可以包括比途中所示更多或更少的部件,或者组合某些部件,或者具有相同的部件布置。
此外,本发明实施例还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
此外,本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
综上,本发明实施例提出的一种用于代谢物的数据分析方法、系统、设备和存储介质,所述方法通过获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物;获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释;根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据;对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据;对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果;将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。本发明能够对DESI-MS多样本数据进行整合,鉴定相同代谢物在不同样品的原位空间分布特征,并对DESI-MS数据进行代谢物的高通量注释,由此找到与肿瘤演进相关的重要特征性代谢物,除此之外,本发明还能够进行数据分析,包括背景噪音去除,组织区域代谢物DESI-MS信号识别,以及组织区域代谢物空间分布模式重构,从而提高了原位代谢物成像技术应用的广泛性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例直接相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种用于代谢物的数据分析方法,其特征在于,包括:
获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物;
获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释;
根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据;
对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据;
对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果;
将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。
2.根据权利要求1所述的用于代谢物的数据分析方法,其特征在于,所述获取肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物的步骤包括:
通过DESI-MS扫描获取肿瘤组织的质谱数据,并根据质谱数据,得到对应的第一质荷比;
通过核密度估计对所述第一质荷比进行聚类分析,得到所述质谱数据对应的代谢物的种类数量。
3.根据权利要求2所述的用于代谢物的数据分析方法,其特征在于,所述获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释的步骤包括:
通过LC-MS实验对所述肿瘤组织进行代谢组成分分析,得到所述肿瘤组织的代谢组数据,并根据所述代谢组数据得到第二质荷比;
根据所述第二质荷比,得到对应的代谢物信息;
将所述第一质荷比和所述第二质荷比相比对,根据比对结果和所述代谢物信息,对所述质谱数据的代谢物进行定性分析,得到所述代谢物的定性注释。
4.根据权利要求2所述的用于代谢物的数据分析方法,其特征在于,所述对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据的步骤包括:
将第二阈值作为强度,按照所述强度获取所述第一质荷比中对应的像素点;
计算所述像素点落在组织区域和背景区域的比值,若所述比值小于第三阈值,则将所述第一质荷比作为污染噪音,并将所述污染噪音从所述信号数据中去除;
对去除污染噪音后的所述信号数据进行图像识别,得到组织区域的信号数据,并将所述组织区域的信号数据作为所述代谢物的真实信号数据。
5.根据权利要求2所述的用于代谢物的数据分析方法,其特征在于,所述将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性的步骤包括:
通过矩阵坐标将所述聚类结果还原至HE染色的真实组织的平面上,并在对应位置上设置聚类标签,得到代谢物空间聚类结果;
将所述肿瘤组织进行HE染色,得到对应的组织病理结构;
将所述代谢物空间聚类结果和所述组织病理结构相对比,得到所述肿瘤组织的代谢异质性。
6.根据权利要求1所述的用于代谢物的数据分析方法,其特征在于,所述方法还包括:
根据多不饱和脂肪酸ω6的代谢通路,得到对应的通路代谢物;
从所述质谱成像数据中寻找所述通路代谢物,并将找到的所述通路代谢物作为第二通路代谢物;
获取所述第二通路代谢物的分布模式,将具有肿瘤边界特异性分布模式的所述第二通路代谢物作为肿瘤边界代谢标志物,其中,所述肿瘤边界代谢标志物为肾上腺酸。
7.一种用于代谢物的数据分析系统,其特征在于,包括:
聚类分析模块,用于获取若干个肿瘤组织的质谱数据,根据所述质谱数据得到所述肿瘤组织的原位代谢物信号,并对所述原位代谢物信号进行聚类分析,得到所述肿瘤组织对应的代谢物;
代谢物注释模块,用于获取所述肿瘤组织的代谢组数据,根据所述代谢组数据对所述代谢物进行定性分析,得到所述代谢物的定性注释;
信号数据获取模块,用于根据所述质谱数据得到对应的质谱成像数据,并根据所述质谱成像数据得到所述代谢物在组织区域分布的信号数据;
信号去噪识别模块,用于对所述信号数据进行噪音去除和组织区域识别,得到所述代谢物的真实信号数据;
信号聚类模块,用于对所述真实信号数据进行主成分分析和降维可视化,得到所述真实信号数据的聚类结果;
代谢异质性分析模块,用于将所述聚类结果还原至真实组织的平面上,根据还原后的所述聚类结果,得到所述肿瘤组织的代谢异质性。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211140787.2A CN115406954B (zh) | 2022-09-19 | 2022-09-19 | 用于代谢物的数据分析方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211140787.2A CN115406954B (zh) | 2022-09-19 | 2022-09-19 | 用于代谢物的数据分析方法、系统、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115406954A true CN115406954A (zh) | 2022-11-29 |
CN115406954B CN115406954B (zh) | 2023-07-04 |
Family
ID=84166691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211140787.2A Active CN115406954B (zh) | 2022-09-19 | 2022-09-19 | 用于代谢物的数据分析方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115406954B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070221835A1 (en) * | 2006-03-06 | 2007-09-27 | Daniel Raftery | Combined Spectroscopic Method for Rapid Differentiation of Biological Samples |
US20130273560A1 (en) * | 2011-05-18 | 2013-10-17 | Purdue Research Foundation | Analyzing a metabolite level in a sample |
US20140088885A1 (en) * | 2011-03-11 | 2014-03-27 | Dong-Yup LEE | Method, an apparatus, and a computer program product for identifying metabolites from liquid chromatography-mass spectrometry measurements |
US20160341712A1 (en) * | 2013-10-23 | 2016-11-24 | Brigham And Women's Hospital, Inc. | System and method for analyzing tissue intra-operatively using mass spectrometry |
CN113917062A (zh) * | 2021-10-26 | 2022-01-11 | 四川大学华西医院 | 一种多维MXene纳米材料的代谢组学分析方法 |
CN114720615A (zh) * | 2022-01-20 | 2022-07-08 | 上海市第一人民医院 | 一种胰腺癌早期诊断标志物及其组织筛选方法和应用 |
CN114720616A (zh) * | 2022-01-20 | 2022-07-08 | 上海市第一人民医院 | 一种胰腺癌早期诊断标志物及其联合筛选方法和应用 |
-
2022
- 2022-09-19 CN CN202211140787.2A patent/CN115406954B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070221835A1 (en) * | 2006-03-06 | 2007-09-27 | Daniel Raftery | Combined Spectroscopic Method for Rapid Differentiation of Biological Samples |
US20140088885A1 (en) * | 2011-03-11 | 2014-03-27 | Dong-Yup LEE | Method, an apparatus, and a computer program product for identifying metabolites from liquid chromatography-mass spectrometry measurements |
US20130273560A1 (en) * | 2011-05-18 | 2013-10-17 | Purdue Research Foundation | Analyzing a metabolite level in a sample |
US20160341712A1 (en) * | 2013-10-23 | 2016-11-24 | Brigham And Women's Hospital, Inc. | System and method for analyzing tissue intra-operatively using mass spectrometry |
CN113917062A (zh) * | 2021-10-26 | 2022-01-11 | 四川大学华西医院 | 一种多维MXene纳米材料的代谢组学分析方法 |
CN114720615A (zh) * | 2022-01-20 | 2022-07-08 | 上海市第一人民医院 | 一种胰腺癌早期诊断标志物及其组织筛选方法和应用 |
CN114720616A (zh) * | 2022-01-20 | 2022-07-08 | 上海市第一人民医院 | 一种胰腺癌早期诊断标志物及其联合筛选方法和应用 |
Also Published As
Publication number | Publication date |
---|---|
CN115406954B (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190236397A1 (en) | Intensity normalization in imaging mass spectrometry | |
CA2501003C (en) | Sample analysis to provide characterization data | |
US6906320B2 (en) | Mass spectrometry data analysis techniques | |
Lange et al. | A geometric approach for the alignment of liquid chromatography—mass spectrometry data | |
US8321144B2 (en) | Non-contiguous regions processing | |
CN102388304B (zh) | 形成质量图像的方法 | |
Neilson et al. | Label-free quantitative shotgun proteomics using normalized spectral abundance factors | |
Barla et al. | Machine learning methods for predictive proteomics | |
JP4704034B2 (ja) | クロマトグラフィ/分光測定データの解析でデータビンニングを用いる方法 | |
JP2009516172A (ja) | 合成画像を使用した生物学的特徴の発見 | |
Smirnov et al. | Mass difference maps and their application for the recalibration of mass spectrometric data in nontargeted metabolomics | |
Palmer et al. | Using collective expert judgements to evaluate quality measures of mass spectrometry images | |
CN112418072A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
Noy et al. | Improved model-based, platform-independent feature extraction for mass spectrometry | |
Zhang et al. | Elastic net‐based framework for imaging mass spectrometry data biomarker selection and classification | |
JP6179600B2 (ja) | 質量分析データ解析装置 | |
CN115406954B (zh) | 用于代谢物的数据分析方法、系统、设备和存储介质 | |
Codrea et al. | Tools for computational processing of LC–MS datasets: a user's perspective | |
Cho et al. | Combining MALDI-TOF and molecular imaging with principal component analysis for biomarker discovery and clinical diagnosis of cancer | |
US11545348B2 (en) | Imaging mass spectrometer and method for imaging mass spectrometry | |
US10304671B2 (en) | Method for computer-assisted analysis of one or more tissue sections of the human or animal body | |
Zhu et al. | Feature Extraction for LC–MS via Hierarchical Density Clustering | |
Daskalakis et al. | Improving gene quantification by adjustable spot-image restoration | |
Xie et al. | Integrative Multiscale Biochemical Mapping of the Brain via Deep-Learning-Enhanced High-Throughput Mass Spectrometry | |
Akbari Lakeh et al. | Discriminating normal regions within cancerous hen ovarian tissue using multivariate hyperspectral image analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |