CN116631510B - 一种用于鉴别诊断克罗恩病和溃疡性结肠炎的装置 - Google Patents
一种用于鉴别诊断克罗恩病和溃疡性结肠炎的装置 Download PDFInfo
- Publication number
- CN116631510B CN116631510B CN202310559017.XA CN202310559017A CN116631510B CN 116631510 B CN116631510 B CN 116631510B CN 202310559017 A CN202310559017 A CN 202310559017A CN 116631510 B CN116631510 B CN 116631510B
- Authority
- CN
- China
- Prior art keywords
- sample
- ulcerative colitis
- gene
- mmps
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000011231 Crohn disease Diseases 0.000 title claims abstract description 48
- 206010009900 Colitis ulcerative Diseases 0.000 title claims abstract description 31
- 201000006704 Ulcerative Colitis Diseases 0.000 title claims abstract description 31
- 238000003748 differential diagnosis Methods 0.000 title description 12
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 75
- 230000014509 gene expression Effects 0.000 claims abstract description 44
- 102000002274 Matrix Metalloproteinases Human genes 0.000 claims abstract description 40
- 108010000684 Matrix Metalloproteinases Proteins 0.000 claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 7
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 claims description 25
- 102100025277 C-X-C motif chemokine 13 Human genes 0.000 claims description 24
- 101000858064 Homo sapiens C-X-C motif chemokine 13 Proteins 0.000 claims description 24
- 102100040006 Annexin A1 Human genes 0.000 claims description 23
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 claims description 23
- 101001013150 Homo sapiens Interstitial collagenase Proteins 0.000 claims description 23
- 102000000380 Matrix Metalloproteinase 1 Human genes 0.000 claims description 23
- 102100034221 Growth-regulated alpha protein Human genes 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 4
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 21
- 238000000034 method Methods 0.000 description 19
- 208000002551 irritable bowel syndrome Diseases 0.000 description 14
- 238000011088 calibration curve Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 101150027068 DEGS1 gene Proteins 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 238000011282 treatment Methods 0.000 description 5
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 4
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 101000577881 Homo sapiens Macrophage metalloelastase Proteins 0.000 description 4
- 101000990912 Homo sapiens Matrilysin Proteins 0.000 description 4
- 101000990902 Homo sapiens Matrix metalloproteinase-9 Proteins 0.000 description 4
- 101000669513 Homo sapiens Metalloproteinase inhibitor 1 Proteins 0.000 description 4
- 101000990915 Homo sapiens Stromelysin-1 Proteins 0.000 description 4
- 101000577874 Homo sapiens Stromelysin-2 Proteins 0.000 description 4
- 101000638886 Homo sapiens Urokinase-type plasminogen activator Proteins 0.000 description 4
- 102100027998 Macrophage metalloelastase Human genes 0.000 description 4
- 102100030417 Matrilysin Human genes 0.000 description 4
- 102100030412 Matrix metalloproteinase-9 Human genes 0.000 description 4
- 102100039364 Metalloproteinase inhibitor 1 Human genes 0.000 description 4
- 102100030416 Stromelysin-1 Human genes 0.000 description 4
- 102100028848 Stromelysin-2 Human genes 0.000 description 4
- 102100031358 Urokinase-type plasminogen activator Human genes 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 210000002744 extracellular matrix Anatomy 0.000 description 4
- 108010052500 Calgranulin A Proteins 0.000 description 3
- 108010052495 Calgranulin B Proteins 0.000 description 3
- 108010037462 Cyclooxygenase 2 Proteins 0.000 description 3
- 238000012351 Integrated analysis Methods 0.000 description 3
- 102100038280 Prostaglandin G/H synthase 2 Human genes 0.000 description 3
- 102100032442 Protein S100-A8 Human genes 0.000 description 3
- 102100032420 Protein S100-A9 Human genes 0.000 description 3
- 208000025865 Ulcer Diseases 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 230000006916 protein interaction Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 231100000397 ulcer Toxicity 0.000 description 3
- 206010016654 Fibrosis Diseases 0.000 description 2
- 102000005741 Metalloproteases Human genes 0.000 description 2
- 108010006035 Metalloproteases Proteins 0.000 description 2
- 206010028116 Mucosal inflammation Diseases 0.000 description 2
- 208000031481 Pathologic Constriction Diseases 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- -1 S100a12 Proteins 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000004761 fibrosis Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 210000004347 intestinal mucosa Anatomy 0.000 description 2
- 239000003771 matrix metalloproteinase inhibitor Substances 0.000 description 2
- 229940121386 matrix metalloproteinase inhibitor Drugs 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000036262 stenosis Effects 0.000 description 2
- 208000037804 stenosis Diseases 0.000 description 2
- 230000007838 tissue remodeling Effects 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 101150008694 ANXA1 gene Proteins 0.000 description 1
- 102000004145 Annexin A1 Human genes 0.000 description 1
- 108090000663 Annexin A1 Proteins 0.000 description 1
- 101150093802 CXCL1 gene Proteins 0.000 description 1
- 101150012886 CXCL13 gene Proteins 0.000 description 1
- 101100222383 Homo sapiens CXCL13 gene Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 101150014058 MMP1 gene Proteins 0.000 description 1
- 101710133727 Phospholipid:diacylglycerol acyltransferase Proteins 0.000 description 1
- 102100029812 Protein S100-A12 Human genes 0.000 description 1
- 108700016890 S100A12 Proteins 0.000 description 1
- 101150097337 S100A12 gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 206010009887 colitis Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 208000010758 granulomatous inflammation Diseases 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Physiology (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种辅助判断克罗恩病和溃疡性结肠炎的装置,包括参数采集设备和可读性载体;所述参数采集设备包括采集所述可读性载体中涉及的各项参数的设备;所述可读性载体上记载了PUC=exp(MMPs Scores)/(1+exp(MMPs Scores))(1);其中PUC为待测样本被预测为溃疡性结肠炎的概率;当PUC小于0.5时,待测样本为克罗恩病。本发明的装置中构建的模型放弃了MMPs相关基因集的具体表达值,而是基于MMPs相关基因集转换的二元变量,因而较好的克服了不同芯片检测平台来源的批次差异问题,有更高的临床使用价值。
Description
技术领域
本发明涉及一种基于患者肠道粘膜基因表达的二元变量构建模型用于鉴别诊断克罗恩病和溃疡性结肠炎的装置,属于生物医疗领域。
背景技术
炎症性肠病(inflammatory bowel disease,IBD)导致慢性肠道炎症,并与显著的发病率相关,这是影响免疫反应的遗传和环境因素交叉作用的结果。克罗恩病(Crohn'sdisease,CD)和溃疡性结肠炎(Ulcerative colitis,UC)是两种主要的炎症性肠病。尽管CD和UC有一些共同的病理和临床特征,但它们有一些差异,表明它们是两种不同的疾病类型。CD的特征是溃疡破裂和粘膜下纤维化,以及肉芽肿性炎症和粘膜下纤维变性。然而,UC的特征性组织学发现是直肠隐窝变形、淋巴细胞浸润和慢性炎症,通常局限于固有层。临床上,IBD的鉴别诊断通常通过对临床表现和内镜、组织病理学、放射学和实验室检查结果的综合评估来确定。
目前,IBD结肠炎患者CD和UC两种疾病之间的鉴别诊断对于量身定制的治疗计划至关重要,因为2种疾病在诊断后面临着不同的治疗和应对机制。然而,这些亚型的鉴别诊断仍然是一个显著的临床挑战,因为目前UC和CD没有单一的诊断金标准。根据公开文献,约5%至15%的患者不符合UC或CD的严格标准,高达14%的患者对于UC或CD的诊断会经历至少一次的更改。因此,IBD的诊断,特别是当炎症病变仅限于结肠的患者中目前的方法仍然较困难。
发明内容
本发明的目的在于提供一种辅助判断克罗恩病和/或溃疡性结肠炎的装置及方法。
本发明提供一种辅助判断克罗恩病和/或溃疡性结肠炎的试剂盒,包括参数采集设备和可读性载体;
所述参数采集设备包括采集所述可读性载体中涉及的各项参数的设备;
所述可读性载体上记载了如下式(1)-(3)的内容,
PUC=exp(MMPs Scores)/(1+exp(MMPs Scores)) (1)
MMPs Scores=-1.3813+[ANXA1×(0.6358)]+[CXCL13×(0.1000)]+[MMP1×(0.2507)]+[CXCL1×(0.4478)](2)
PUC+PCD=1 (3);
其中PUC为待测样本被预测为溃疡性结肠炎的概率;PCD为待测病例被预测为克罗恩病的概率;ANXA1、CXCL13、MMP1、CXCL1分别为ANXA1、CXCL13、MMP1、CXCL1基因的二元变量;如果待测样本中基因的表达值大于所述基因在溃疡性结肠炎样本中的表达值的中值,则所述基因的二元变量被赋值为1;否则,所述基因的二元变量被赋值为0;
当PUC大于0.5时,待测样本为溃疡性结肠炎;当PUC小于0.5时,待测样本为克罗恩病。
其中,所述参数采集设备为检测待测样本中ANXA1、CXCL13、MMP1、CXCL1基因表达量的装置。
其中,所述试剂盒还包括记录工具和/或计算工具;所述记录工具包括笔和/或计算机;所述计算工具包括计算器和/或所述计算机。
其中,所述可读性载体为试剂盒说明书;所述式Ⅰ的内容印刷在卡片上。
其中,所述可读性载体为计算机可读载体。
其中,所述基因在溃疡性结肠炎样本中的表达值的中值为,将至少10个溃疡性结肠炎样本使用相同检测装置进行基因表达量检测,将溃疡性结肠炎样本的表达量的取平均值即为溃疡性结肠炎样本中的表达值的中值。
本发明还提供一种辅助判断克罗恩病和/或溃疡性结肠炎的套装,包括检测ANXA1表达量的装置、检测CXCL13表达量的装置、检测MMP1表达量的装置、检测CXCL1表达量的装置和设置有参数运算模块的计算设备;所述参数运算模块能够进行如下式(1)-(3)的运算:
PUC=exp(MMPs Scores)/(1+exp(MMPs Scores)) (1);
MMPs Scores=-1.3813+[ANXA1×(0.6358)]+[CXCL13×(0.1000)]+[MMP1×(0.2507)]+[CXCL1×(0.4478)](2);
PUC+PCD=1 (3);
其中PUC为待测样本被预测为溃疡性结肠炎的概率;PCD为待测病例被预测为克罗恩病的概率;ANXA1、CXCL13、MMP1、CXCL1分别为ANXA1、CXCL13、MMP1、CXCL1基因的二元变量;如果待测样本中基因的表达值大于所述基因在样本中的表达值的中值,则所述基因的二元变量被赋值为1;否则,所述基因的二元变量被赋值为0;
当PUC大于0.5时,待测样本为溃疡性结肠炎;当PUC小于0.5时,待测样本为克罗恩病。
检测ANXA1、CXCL13、MMP1和CXCL1基因表达量的系统在制备判断克罗恩病和溃疡性结肠炎的产品中的应用也应在本发明的保护范围之内。
其中,所述检测ANXA1、CXCL13、MMP1和CXCL1基因表达量的系统为(AffymetrixHuman Gene 1.0ST Array/Affymetrix Human Genome U133 Plus 2.0Array/Agilent-014850Whole Human Genome Microarray 4x44K G4112F)。
上述ANXA1基因为annexin A1(NM_000700.3);CXCL13基因为C-X-C motifchemokine ligand 13(NM_001371558.1);MMP1基因为matrix metallopeptidase1(NM_002421);CXCL1基因为C-X-C motif chemokine ligand 1(NM_001511)。
本发明提供了一种利用金属蛋白酶类家族相关基因(Metalloproteinases-associated genes,MMPs-associated genes)构建模型用于IBD鉴别诊断的方法,及其在多个中心数据队列的验证结果。基质金属蛋白酶类(MMPs)是一组锌依赖性中性肽酶,可降解细胞外基质(extracellular matrix,ECM)的所有成分,与广泛的粘膜降解和组织重塑相关,最终有利于溃疡、瘘管和狭窄的发展,因而MMPs是参与和调节炎症性肠病的病程进展的重要基因家族。迄今为止,有充分的证据表明,IBD相关的粘膜炎症与多种MMP的诱导增强有关,并在IBD治疗的背景下已公开报道了至少3项基质金属蛋白酶抑制剂的临床试验。我们的研究表明,MMPs相关基因集也是CD和UC之间的主要差异基因集。为了克服不同来源数据队列检测平台的差异,我们将MMPs相关基因集的表达量转化为二元变量,并以此为基础通过最小绝对收缩和选择算子(LASSO)logistic回归建立了鉴别诊断模型来区分CD和UC。最后,本专利还在目前已公开发表的符合要求的IBD队列中对模型进行了验证,取得较好效果。因此,我们的诊断模型提供了有前景的诊断工具,可能很快改善临床实践。
这项方法的优点包括:1)这个方法的建立和验证整合了目前公开报道的绝大部分CD和UC的芯片数据,对于异质性较高的IBD疾病,大样本量联合多中心研究的结果是非常关键的,同时,目前尚未见到公开报道的用于UC和CD鉴别诊断的基因表达模型报道;2)在本方法中采用了不同的技术路线对多中心的IBD队列进行了整合分析,有效的降低了单一整合数据集方法造成的偏倚;3)对模型的评价步骤严格遵循了目前临床模型评估指南TRIPOD(Transparent Reporting of a multivariable prediction model for IndividualPrognosis Or Diagnosis),在指南的质量评价中属于最高一级别的证据,即分别在不同中心、不同队列进行区分度、校准度和临床适用性的评价;4)所构建的模型放弃了MMPs相关基因集的具体表达值,而是基于MMPs相关基因集转换的二元变量,因而较好的克服了不同芯片检测平台来源的批次差异问题,有更高的临床使用价值。
附图说明
图1为对基于RRA方法筛选得到的差异基因(differentially expressed genes,DEGs)构建得到的蛋白互作网络图,以及MCODE识别的重要基因模块图。
图2为基于数据整合寻找得到的DEGs构建得到的蛋白互作网络图,以及MCODE识别的重要基因模块图。
图3为基于LASSO回归和交叉验证,确定最终纳入模型基因的过程示意图。左侧虚线为经交叉验证确定的最优AUC面积对应的惩罚系数对数值log(λ);右侧虚线为最优AUC面积+1标准误对应的惩罚系数对数值log(λ)。
图4为基于构建模型绘制的列线图。
图5为构建模型在训练队列中的诊断能力,包括ROC,校准曲线和决策曲线分析(DCA)。
图6为构建模型在验证队列(GSE75214)中的诊断能力,包括ROC曲线,校准曲线和决策曲线。
图7为构建模型在验证队列(GSE179285)中的诊断能力,包括ROC曲线,校准曲线和决策曲线。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
本发明提供一种利用金属蛋白酶类家族相关基因(Metalloproteinases-associated genes,MMPs-associated genes)构建模型用于IBD鉴别诊断的方法,及其在多个中心数据队列的验证结果。基质金属蛋白酶类(MMPs)是一组锌依赖性中性肽酶,可降解细胞外基质(extracellular matrix,ECM)的所有成分,与广泛的粘膜降解和组织重塑相关,最终有利于溃疡、瘘管和狭窄的发展,因而MMPs是参与和调节炎症性肠病的病程进展的重要基因家族。迄今为止,有充分的证据表明,IBD相关的粘膜炎症与多种MMP的诱导增强有关,并在IBD治疗的背景下已公开报道了至少3项基质金属蛋白酶抑制剂的临床试验。我们的研究表明,MMPs相关基因集也是CD和UC之间的主要差异基因集。为了克服不同来源数据队列检测平台的差异,我们将MMPs相关基因集的表达量转化为二元变量,并以此为基础通过最小绝对收缩和选择算子(LASSO)logistic回归建立了鉴别诊断模型来区分CD和UC。最后,本专利还在目前已公开发表的符合要求的IBD队列中对模型进行了验证,取得较好效果。因此,我们的诊断模型提供了有前景的诊断工具,可能很快改善临床实践。
一、确定和纳入待分析数据集
通过Gene Expression Omnibus(GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)检索,关键词如下:("Inflammatory Bowel Diseases"[MeSH Terms]ORInflammatory Bowel Diseases[All Fields])AND"Homo sapiens"[porgn]AND("Expression profiling by array"[Filter]AND(“2008/01/01”[PDAT]:“2022/01/01”[PDAT]).共检索到139个数据集,依据如下纳入标准进行人工筛查:(1)样本量大于15;(2)在数据集中同时涵盖CD和UC的样本;(3)数据来源于回肠或结肠的肠道粘膜,排除血液等其他来源;(4)有可用的基因注释信息。最终共纳入5个不同中心数据集,包括GSE75214(N=59/74,样本量=CD/UC,下同),GSE10616(N=32/10),GSE36807(N=13/15),和GSE9686(N=11/5)。最终共包括115例CD患者和104例UC患者的基因芯片数据。5个数据队列的详细信息见表1。
表1
二、基于Robust Rank Aggregation(RRA)分析方法对不同数据集进行整合分析
基于RRA方法,我们对4个不同来源数据集(GSE75214、GSE10616、GSE36807和GSE9686)进行了整合,最终以logFC>0.7和adjP<0.05为标准识别了差异基因(differentially expressed genes,DEGs),共识别到差异基因141个。详细信息见表2。以此利用String网站(https://cn.string-db.org/)和Cytoscape软件(v3.7.2)构建蛋白互作网络,并通过MCODE(molecular complex detection)插件识别重要的功能集团,其中得分最高的功能集团主要成员均为MMPs家族,见图1(图1A中,UC中上调的基因以橙色表示,CD中上调的基因以蓝色表示,通过软件识别的最重要的基因模块以黄色表示。将基因模块进一步展示于图1B中,黄色表示种子基因),包括MMP1,MMP12,PLAU,MMP9,CXCL1,MMP10,PTGS2,TIMP1,和MMP7,以MMP3为基团的种子基因。
表2
三、基于批次校正和合并的方法对不同数据集进行整合分析
为了降低RRA方法带来的偏倚,引入了另一种方法对数据集进行整合分析。首先,由于GSE10616,GSE36807,和GSE9686数据集来源于相同的芯片平台(GPL570),采用R软件中的SVA包对3个队列进行了批次校正和合并,新产生的数据集命名为合并合并数据集(Combined Datasets),随后对Combined Datasets和GSE75214分别进行差异分析,最终以logFC>0.6和adjP<0.1为标准识别DEGs,最终对2个数据集识别的DEGs取交集,共得到65个DEGs,见表3。依据上述方法再次构建PPI网络并以MCODE识别最重要的基因模块,其中构成模块的基因仍然主要由MMPs家族基因构成,包括MMP12,MMP10,MMP3,MMP9,TIMP1,CXCL1,PLAU,S100A9,CXCL13,S100A8,ANXA1和S100A12,并以MMP7为种子基因,见图2(图2A中,UC中上调的基因以橙色表示,CD中上调的基因以蓝色表示,通过软件识别的最重要的基因模块以黄色表示。将基因模块进一步展示于图2B中,黄色表示种子基因)。
表3
/>
四、构建Lasso逻辑回归模型
基于上述两种不同技术路线,均认为MMPs相关基因为UC和CD中最重要的差异基因集,我们对上述2种方法识别到的基因集进行合并,剔除掉重复基因后共获得15个基因:MMP3,MMP1,MMP12,PLAU,MMP9,CXCL1,MMP10,PTGS2,TIMP1,MMP7,CXCL13,S100A12,S100A8,S100A9,和ANXA1。
为了克服不同芯片平台之间的批次差异导致的模型应用问题,我们对15个候选基因进行了二元变量转换:对于UC中表达增加的基因,如果该基因的表达值大于该基因在所有样本中的表达值的中值,则MMP相关基因的二元变量被赋值为1;否则,该指数被定义为0。对于CD中表达增加的基因,如果该基因的表达值小于该基因在所有样本中的表达值的中值,则MMP相关基因的二元变量被赋值为1;否则,将指数定义为0。因此,将15个基因的表达值从连续变量转换为二元变量。例如,对Combined Datasets中的某病人,其ANXA1,MMP10,CXCL13,TIMP1,MMP1,MMP3,MMP7,MMP9,S100A12,PLAU,MMP12,S100A9,PTGS2,CXCL1,S100A8均为在UC中表达上调的基因,其表达量分别为1.9734573,1.9701188,1.1136878,2.8159726,2.7689527,4.7186331,2.0414428,2.1097156,1.7163029,2.1842115,2.4673306,2.9328217,1.6551834,5.2526517,2.4706825,而其中位数分别为3.4117391,3.2046994,3.44135835,5.10064625,4.923122,5.00327205,3.33740685,4.17297635,2.2498484,3.638494,5.400392,3.835166,2.6820964,5.1378286,4.3677868,则15个基因的二元变量转换后更改为0,0,0,0,0,0,0,0,0,0,0,0,0,1,0。
随后将Combined Datasets设置为训练组,而将GSE75214设置为验证组,以验证模型的效果。为了确定最佳惩罚系数,我们进行了8重交叉验证,并将接受者操作特征曲线(ROC)曲线下的面积用作性能度量,以最大lambda(最优AUC对应lambda加一个标准误)为惩罚系数确定最终模型。模型构建的交叉验证示意图如图3所示(左侧虚线为最大AUC对应的lambda系数,右侧虚线为最大AUC对应的lambda加一个标准误的lambda系数,即为本方程选择的惩罚系数)。
最终构建的鉴别诊断模型为:
PUC=exp(MMPs Scores)/(1+exp(MMPs Scores)) (1)
MMPs Scores=-1.3813+[ANXA1×(0.6358)]+[CXCL13×(0.1000)]+[MMP1×(0.2507)]+[CXCL1×(0.4478)](2)
PUC+PCD=1 (3)
注:PUC为根据模型计算,该病例被预测为UC的概率,由于该模型为UC和CD的鉴别模型,因此PUC+PCD=1,该模型被预测为PCD的概率可由PUC间接得出。
为更方便的应用该鉴别模型,将该模型构建为列线图,并在图4展示。在图4中,我们以红色点作为应用举例。例如,对于对于CXCL13值为0、MMP1值为1、ANXA1值为0和CXCL1值为1的患者,UC诊断的预测概率为0.336,而CD诊断的预测可能性为0.664。根据0.5的截止值,根据本方法构建的模型,该患者被确定为患有CD。
五、模型评价
依据模型,对训练组(数据集GSE10616、GSE36807和GSE9686)、验证组1(数据集GSE75214)和验证组2(数据集GSE179285),按照上述方法进行模型构建,并对构建的模型进行区分度(ROC曲线),校准度(校准曲线)和临床适用性(DCA曲线)分别进行了检验,结果如下:
1.训练组数据结果显示:Combined Datasets的ROC曲线下面积为0.801,校准曲线结果显示校准效果较好(Sp>0.05,Brier评分<0.25),DCA曲线显示有较好的临床适应性(如图5所示)。
2.验证组1数据结果显示:GSE75214的ROC曲线下面积为0.811,校准曲线结果显示校准效果较好(Sp>0.05,Brier评分<0.25),DCA曲线显示有较好的临床适应性(如图6所示)。同时,训练组数据来自于芯片平台GPL570,验证组数据来自于芯片平台GPL6244,表明该模型在不同平台均有良好的表现。
3.验证组2数据结果展示:由于上述数据集均用于筛选基因,因此又选取了一组新发布的数据队GSE179285列用于模型的验证,GSE179285的ROC曲线下面积为0.751,校准曲线结果显示校准效果较好(Sp>0.05,Brier评分<0.25),DCA曲线显示有较好的临床适应性(如图7所示)。同时,训练组数据来自于芯片平台GPL570,验证组数据来自于芯片平台GPL6480,表明该模型在不同平台均有良好的表现。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
Claims (7)
1.一种辅助判断克罗恩病和溃疡性结肠炎的装置,包括参数采集设备和可读性载体;
所述参数采集设备包括采集所述可读性载体中涉及的各项参数的设备;
所述可读性载体上记载了如下式(1)-(3)的内容,
PUC=exp(MMPs Scores)/(1+exp(MMPs Scores)) (1)
MMPs Scores=-1.3813+[ANXA1×(0.6358)]+[CXCL13×(0.1000)]+[MMP1×(0.2507)]+[CXCL1×(0.4478)](2)
PUC+PCD=1 (3);
其中PUC为待测样本被预测为溃疡性结肠炎的概率;PCD为待测病例被预测为克罗恩病的概率;ANXA1、CXCL13、MMP1、CXCL1分别为ANXA1、CXCL13、MMP1、CXCL1基因的二元变量;如果待测样本中基因的表达值大于所述基因在溃疡性结肠炎样本中的表达值的中值,则所述基因的二元变量被赋值为1;否则,所述基因的二元变量被赋值为0;
当PUC大于0.5时,待测样本为溃疡性结肠炎;当PUC小于0.5时,待测样本为克罗恩病。
2.根据权利要求1所述的装置,其特征在于:所述参数采集设备为检测待测样本中ANXA1、CXCL13、MMP1、CXCL1基因表达量的装置。
3.根据权利要求1或2所述的装置,其特征在于:所述装置还包括记录工具和/或计算工具;所述记录工具包括笔和/或计算机;所述计算工具包括计算器和/或所述计算机。
4.根据权利要求1或2所述的装置,其特征在于:所述可读性载体为试剂盒说明书;所述式Ⅰ的内容印刷在卡片上。
5.根据权利要求1或2所述的装置,其特征在于:所述可读性载体为计算机可读载体。
6.根据权利要求1或2所述的装置,其特征在于:所述基因在溃疡性结肠炎样本中的表达值的中值为,将至少10个溃疡性结肠炎样本使用相同检测装置进行基因表达量检测,将溃疡性结肠炎样本的表达量的取平均值即为溃疡性结肠炎样本中的表达值的中值。
7.一种辅助判断克罗恩病和溃疡性结肠炎的套装,其特征在于,包括检测ANXA1表达量的装置、检测CXCL13表达量的装置、检测MMP1表达量的装置、检测CXCL1表达量的装置和设置有参数运算模块的计算设备;所述参数运算模块能够进行如下式(1)-(3)的运算:
PUC=exp(MMPs Scores)/(1+exp(MMPs Scores)) (1)
MMPs Scores=-1.3813+[ANXA1×(0.6358)]+[CXCL13×(0.1000)]+[MMP1×(0.2507)]+[CXCL1×(0.4478)](2)
PUC+PCD=1 (3);
其中PUC为待测样本被预测为溃疡性结肠炎的概率;PCD为待测病例被预测为克罗恩病的概率;ANXA1、CXCL13、MMP1、CXCL1分别为ANXA1、CXCL13、MMP1、CXCL1基因的二元变量;如果待测样本中基因的表达值大于所述基因在样本中的表达值的中值,则所述基因的二元变量被赋值为1;否则,所述基因的二元变量被赋值为0;
当PUC大于0.5时,待测样本为溃疡性结肠炎;当PUC小于0.5时,待测样本为克罗恩病。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022113405335 | 2022-10-28 | ||
CN202211340533 | 2022-10-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116631510A CN116631510A (zh) | 2023-08-22 |
CN116631510B true CN116631510B (zh) | 2024-01-12 |
Family
ID=87601934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310559017.XA Active CN116631510B (zh) | 2022-10-28 | 2023-05-17 | 一种用于鉴别诊断克罗恩病和溃疡性结肠炎的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116631510B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009192383A (ja) * | 2008-02-14 | 2009-08-27 | Kanazawa Univ | エルゴチオネインを利用したクローン病の診断および治療 |
CN105219844A (zh) * | 2015-06-08 | 2016-01-06 | 刘宗正 | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 |
CN108403711A (zh) * | 2017-02-10 | 2018-08-17 | 中国科学院上海生命科学研究院 | 一种用于检测和治疗炎性肠病的microRNA |
CN109994214A (zh) * | 2019-04-13 | 2019-07-09 | 中国医学科学院北京协和医院 | 克罗恩病和肠白塞的鉴别模型及模型构建方法 |
CN109998488A (zh) * | 2019-04-13 | 2019-07-12 | 中国医学科学院北京协和医院 | 克罗恩病和肠道溃疡型淋巴瘤的鉴别模型及构建方法 |
CN113744802A (zh) * | 2021-08-25 | 2021-12-03 | 聂凯 | 一种预测克罗恩病治疗应答基因标志物的筛选方法及应用 |
CN114732899A (zh) * | 2015-01-09 | 2022-07-12 | 辉瑞公司 | MAdCAM拮抗剂的剂量方案 |
CN114974595A (zh) * | 2022-05-13 | 2022-08-30 | 江苏省人民医院(南京医科大学第一附属医院) | 一种克罗恩病患者黏膜愈合预测模型及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030133991A1 (en) * | 2001-11-29 | 2003-07-17 | Greystone Medical Group, Inc. | Treatment of wounds and compositions employed |
-
2023
- 2023-05-17 CN CN202310559017.XA patent/CN116631510B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009192383A (ja) * | 2008-02-14 | 2009-08-27 | Kanazawa Univ | エルゴチオネインを利用したクローン病の診断および治療 |
CN114732899A (zh) * | 2015-01-09 | 2022-07-12 | 辉瑞公司 | MAdCAM拮抗剂的剂量方案 |
CN105219844A (zh) * | 2015-06-08 | 2016-01-06 | 刘宗正 | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 |
CN108403711A (zh) * | 2017-02-10 | 2018-08-17 | 中国科学院上海生命科学研究院 | 一种用于检测和治疗炎性肠病的microRNA |
CN109994214A (zh) * | 2019-04-13 | 2019-07-09 | 中国医学科学院北京协和医院 | 克罗恩病和肠白塞的鉴别模型及模型构建方法 |
CN109998488A (zh) * | 2019-04-13 | 2019-07-12 | 中国医学科学院北京协和医院 | 克罗恩病和肠道溃疡型淋巴瘤的鉴别模型及构建方法 |
CN113744802A (zh) * | 2021-08-25 | 2021-12-03 | 聂凯 | 一种预测克罗恩病治疗应答基因标志物的筛选方法及应用 |
CN114974595A (zh) * | 2022-05-13 | 2022-08-30 | 江苏省人民医院(南京医科大学第一附属医院) | 一种克罗恩病患者黏膜愈合预测模型及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116631510A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10354747B1 (en) | Deep learning analysis pipeline for next generation sequencing | |
Denny et al. | Systematic comparison of phenome-wide association study of electronic medical record data and genome-wide association study data | |
CN110634573A (zh) | 一种临床脑梗患者复发风险预警评分可视化模型系统及其评价方法 | |
Gorcenco et al. | New generation genetic testing entering the clinic | |
Lamri et al. | Fine-tuning of genome-wide polygenic risk scores and prediction of gestational diabetes in South Asian women | |
US20220277811A1 (en) | Detecting False Positive Variant Calls In Next-Generation Sequencing | |
WO2023071877A1 (zh) | 泌尿系统结石术后复发风险预测模型、评估系统及方法 | |
Bianco et al. | The association between HMGA1 rs146052672 variant and type 2 diabetes: a transethnic meta-analysis | |
Momozawa et al. | Genome wide association study of 40 clinical measurements in eight dog breeds | |
CN116200490A (zh) | 一种检测实体瘤微小残留病灶的方法 | |
Dann et al. | Precise identification of cell states altered in disease using healthy single-cell references | |
Yun et al. | Genetic risk score raises the risk of incidence of chronic kidney disease in Korean general population-based cohort | |
CN116631510B (zh) | 一种用于鉴别诊断克罗恩病和溃疡性结肠炎的装置 | |
Zhou et al. | The optimal cutoff value of Z-scores enhances the judgment accuracy of noninvasive prenatal screening | |
CN117079723A (zh) | 一种与肌萎缩侧索硬化症相关的生物标志物、诊断模型及其应用 | |
CN109182490B (zh) | Lrsam1基因snp突变位点分型引物及其在冠心病预测中的应用 | |
Brucker et al. | Association test using Copy Number Profile Curves (CONCUR) enhances power in rare copy number variant analysis | |
US20220267837A1 (en) | Methods for identifying carrier status and assessing risk for spinal muscular atrophy | |
CN115346674A (zh) | 一种肌萎缩侧索硬化患者便秘风险预测模型及其应用 | |
CN113517069A (zh) | 一种局灶性癫痫遗传风险评估模型的建立方法 | |
CN114566213A (zh) | 家系高通量测序数据的单亲二倍体分析方法及其系统 | |
Zentner et al. | A rapid scoring tool to assess mutation probability in patients with inherited cardiac disorders | |
CN112820410A (zh) | 一种临床脑梗患者复发风险预警评分可视化模型系统及其评价方法 | |
KR20220075700A (ko) | gPRS를 이용한 제2형 당뇨질환 예측 시스템 | |
Dannemann et al. | The effects of probe binding affinity differences on gene expression measurements and how to deal with them |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |