CN103714268A - 一种筛选多发性硬化疾病生物标志物的方法 - Google Patents

一种筛选多发性硬化疾病生物标志物的方法 Download PDF

Info

Publication number
CN103714268A
CN103714268A CN201310684605.2A CN201310684605A CN103714268A CN 103714268 A CN103714268 A CN 103714268A CN 201310684605 A CN201310684605 A CN 201310684605A CN 103714268 A CN103714268 A CN 103714268A
Authority
CN
China
Prior art keywords
gene
multiple sclerosis
sample
screening
gene expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310684605.2A
Other languages
English (en)
Inventor
周丰丰
麦国琴
赵苗苗
张召
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201310684605.2A priority Critical patent/CN103714268A/zh
Publication of CN103714268A publication Critical patent/CN103714268A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明属于生物信息学技术领域,具体公开了一种筛选多发性硬化疾病生物标志物的方法。该方法通过从GEO数据库中获取数据集GSE21942,平台为GPL570,将样本采用MAS5标准化处理;然后利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ(i,j=1,2,...,N),将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量。本发明利用数学算法将正常人与MS病人外周血单个核细胞中相互抑制的基因对筛选出来,得到多发性硬化疾病生物标志物;运用筛选出多发性硬化疾病生物标志物进行生物意义的研究分析,能够反映病人的真实情况。

Description

一种筛选多发性硬化疾病生物标志物的方法
【技术领域】
本发明属于生物信息学技术领域,特别涉及一种筛选多发性硬化疾病生物标志物的方法。
【背景技术】
多发性硬化(multiple sclerosis,MS)是一种以中枢神经系统白质炎性脱髓鞘病变为主要特征的自身免疫疾病,发病机制至今尚未完全明确。该病的临床表现为中枢神经系统白质散在分布的多病灶与病程中呈现的缓解复发,患者大脑、脑干、小脑、脊髓可同时或相继受累,临床表现多种多样:如肢体无力;眼部急性视神经炎或球后视神经炎,视力下降;共济失调;精神症状多表现为抑郁、易怒和脾气暴躁等。
目前,生物标志物、脑脊液检查、磁共振成像和诱发电位对多发性硬化的诊断具有重要意义。Kemppinen团队证明,与正常人相比,有229个基因在MS病人的外周血单个核细胞中差异表达(Kemppinen,Kaprio et al.2011)。Satoh及他的团队的研究结果表明,与正常人相比,有185个基因在MS病人的细胞中差异表达;有281个基因在MS病人的T细胞中差异表达(Satoh,Nakanishi et al.2005,Satoh,Nakanishi et al.2006)。Arthur团队的研究结果表明,与正常人相比,有2217个基因在MS病人的全血中差异表达(Arthur,Armati et al.2008)。
目前,已有多位科学家研究MS病人的不同组织中差异表达基因,但是他们筛选的差异基因之间是独立的,没有考虑基因间的相互联系。然而生物是一个系统,很多基因相互间是存在联系的。不考虑基因间的相互联系,很难反映病人的真实情况。
【发明内容】
本发明的目的在于提供一种筛选多发性硬化疾病生物标志物的方法。
本发明的目的通过以下技术方案实现:一种筛选多发性硬化疾病生物标志物的方法,包括如下步骤:
(1)从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中获取数据集GSE21942,平台为GPL570,将样本采用MAS5标准化处理;
(2)x和y分别表示两个基因,利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ(i,j=1,2,...,N),将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量(假设总计N个样本);
步骤(1)中:
所述样本为正常人和MS病人的外周血单个核细胞基因表达谱;
所述正常人的个数优选为15个;所述MS病人的个数优选为14个。
步骤(2)中:
所述筛选通过MATLAB编写代码实现。
当δ=0.01时,筛选得到的结果过少;当δ=1时,筛选得到的结果过多,都不适合用于样本分析。
本发明首次通过筛选相互抑制的基因对的方法来区分正常人与MS病人的基因表达谱,得到正常人与MS病人显著差别的相互抑制的基因对,正常人相互抑制的基因对有831对,MS病人相互抑制的基因对只有7对,这些基因对可以作为正常人与MS病人的生物标志物。同时,表明他们体内的稳态显著不同,正常人的调节系统比MS病人的更加严谨、精细、稳健和灵活。
本发明相对于现有技术具有如下的优点及有益效果:
本发明考虑基因间的相互联系,利用数学算法将正常人与MS病人外周血单个核细胞中相互抑制的基因对筛选出来,然后进行比较和生物意义分析,筛选得到多发性硬化疾病生物标志物。以基因间的相互联系为基础,筛选出多发性硬化疾病生物标志物进行生物意义的研究分析,能够反映病人的真实情况。
【附图说明】
图1是实施例1的筛选多发性硬化疾病生物标志物的方法的流程图。
图2是实施例1的15个正常人的相互抑制的基因对的示意图。
图3是实施例1的14个病人的相互抑制的基因对的示意图。
【具体实施方式】
下面结合实施例和附图对本发明作进一步详细的描述,但本发明的保护范围并不限于此。
实施例1
一种筛选多发性硬化疾病生物标志物的方法,包括如下步骤:
(1)从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中获取数据集GSE21942,平台为GPL570,样本中含有15个正常人和14个MS病人的外周血单个核细胞基因表达谱,将样本采用MAS5标准化处理;
(2)x和y分别表示两个基因,利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ(i,j=1,2,...,N),将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量(假设总计N个样本);所述筛选通过MATLAB编写代码实现。
当δ=0.01时,筛选得到的结果过少;当δ=1时,筛选得到的结果过多,都不适合用于样本分析。
当δ=0.08,15个正常人符合上述公式的结果为831个基因对,结果如图2所示,涉及的基因对有RNA剪接与剪接体组装,RNA剪接与转录,RNA剪接与泛素化,翻译与泛素化,转录与蛋白质水解,RNA沉默与RNA聚合酶III,凋亡与细胞分裂,信号传导与RNA过程蛋白,免疫细胞与去磷酸化作用蛋白,抗原过程蛋白与转录等。如图2所示,其中与STUB1(STIP1 homology and U-boxcontaining protein 1)相互抑制的基因最多,有409个基因;分别与copb2(coatomerprotein complex,subunit beta2)相互抑制的基因有21个,分别与SEC31A相互抑制的基因有17个。
当δ=0.08,14个MS病人符合上述公式的结果只有7个基因对,结果如图3所示,分别为GNB1与C1orf52,SEL1L与lrrc58,Uqcrh与ELF1,atg5与Dock5,FAM49B与Nub1,TTC19与Elf4,Cxxc1与ZBTB4。涉及的基因对有信号传导与选择性剪接,能量代谢与T细胞信号通路,转录相关蛋白等。
Kemppinen及他的团队的研究结果表明,与正常人相比,有229个基因在MS病人的外周血单个核细胞中差异表达(Kemppinen,Kaprio et al.2011)。Arthur团队证明,与正常人相比,有2217个基因在MS病人的全血中差异表达(Arthur,Armati et al.2008)。这些研究都是通过筛选独立的差异基因来比较正常人与MS病人,没有考虑基因间的相互联系,而本申请首次利用筛选相互抑制的基因对的方法来区分正常人与MS病人的基因表达谱,得到正常人与MS病人显著差别的相互抑制的基因对,如图2和图3所示。从结果中可看到,正常人与MS病人的相互抑制的基因对有着显著区别,正常人相互抑制的基因对有831对,MS病人相互抑制的基因对只有7对,这些基因对可以作为正常人与MS病人的生物标志物。同时,该结果也表明他们体内的稳态显著不同,正常人的调节系统比MS病人的更加严谨、精细、稳健和灵活。
以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所作出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。

Claims (3)

1.一种筛选多发性硬化疾病生物标志物的方法,其特征在于,包括如下步骤:
(1)从GEO数据库中获取数据集GSE21942,平台为GPL570,将样本采用MAS5标准化处理;
(2)x和y分别表示两个基因,利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ,将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:i,j=1,2,...,N;δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量。
2.根据权利要求1所述的筛选多发性硬化疾病生物标志物的方法,其特征在于,步骤(1)中所述样本为正常人和MS病人的外周血单个核细胞基因表达谱。
3.根据权利要求1所述的筛选多发性硬化疾病生物标志物的方法,其特征在于,步骤(2)中所述筛选通过MATLAB编写代码实现。
CN201310684605.2A 2013-12-12 2013-12-12 一种筛选多发性硬化疾病生物标志物的方法 Pending CN103714268A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310684605.2A CN103714268A (zh) 2013-12-12 2013-12-12 一种筛选多发性硬化疾病生物标志物的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310684605.2A CN103714268A (zh) 2013-12-12 2013-12-12 一种筛选多发性硬化疾病生物标志物的方法

Publications (1)

Publication Number Publication Date
CN103714268A true CN103714268A (zh) 2014-04-09

Family

ID=50407234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310684605.2A Pending CN103714268A (zh) 2013-12-12 2013-12-12 一种筛选多发性硬化疾病生物标志物的方法

Country Status (1)

Country Link
CN (1) CN103714268A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573404A (zh) * 2014-12-25 2015-04-29 深圳先进技术研究院 一种心肌病基因数据处理方法及装置
WO2021104092A1 (zh) * 2019-11-28 2021-06-03 中国科学院深圳先进技术研究院 一种神经退行性疾病标志物β-spectrin及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008069975A2 (en) * 2006-12-01 2008-06-12 New York University Methods of using f-spondin as a biomarker for cartilage degenerative conditions
CN101605494A (zh) * 2006-10-27 2009-12-16 阿里戴斯公司 使用相干喇曼技术及其校准技术用于医疗诊断和治疗目的
WO2010136232A1 (en) * 2009-05-28 2010-12-02 Fundació Institut De Recerca De L´Hospital Universitari Vall D'hebron In vitro method suitable for patients suffering from cis for the early diagnosis or prognosis of multiple sclerosis
CN102301002A (zh) * 2008-11-12 2011-12-28 卡里斯生命科学卢森堡控股有限责任公司 使用外来体来确定表现型的方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605494A (zh) * 2006-10-27 2009-12-16 阿里戴斯公司 使用相干喇曼技术及其校准技术用于医疗诊断和治疗目的
WO2008069975A2 (en) * 2006-12-01 2008-06-12 New York University Methods of using f-spondin as a biomarker for cartilage degenerative conditions
WO2008069975A3 (en) * 2006-12-01 2008-12-11 Univ New York Methods of using f-spondin as a biomarker for cartilage degenerative conditions
CN102301002A (zh) * 2008-11-12 2011-12-28 卡里斯生命科学卢森堡控股有限责任公司 使用外来体来确定表现型的方法和系统
WO2010136232A1 (en) * 2009-05-28 2010-12-02 Fundació Institut De Recerca De L´Hospital Universitari Vall D'hebron In vitro method suitable for patients suffering from cis for the early diagnosis or prognosis of multiple sclerosis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
余海浪等: "用于基因数据挖掘的基因表达数据库 GEO", 《中国生物工程杂志》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573404A (zh) * 2014-12-25 2015-04-29 深圳先进技术研究院 一种心肌病基因数据处理方法及装置
CN104573404B (zh) * 2014-12-25 2018-05-04 深圳先进技术研究院 一种心肌病基因数据处理方法及装置
WO2021104092A1 (zh) * 2019-11-28 2021-06-03 中国科学院深圳先进技术研究院 一种神经退行性疾病标志物β-spectrin及其应用

Similar Documents

Publication Publication Date Title
Wu et al. Intrinsic functional connectivity patterns predict consciousness level and recovery outcome in acquired brain injury
Mullainathan et al. Does machine learning automate moral hazard and error?
Choi et al. Deep learning-based stroke disease prediction system using real-time bio signals
Saminu et al. A recent investigation on detection and classification of epileptic seizure techniques using EEG signal
Nichols et al. Controlling the familywise error rate in functional neuroimaging: a comparative review
Ibrahim et al. Relationships between social support and depression, and quality of life of the elderly in a rural community in M alaysia
Weinberg et al. Forgiveness, coping, and terrorism: Do tendency to forgive and coping strategies associate with the level of posttraumatic symptoms of injured victims of terror attacks?
Prichep et al. Classification of traumatic brain injury severity using informed data reduction in a series of binary classifier algorithms
Kumari et al. A data mining approach for the diagnosis of diabetes mellitus
Song et al. Brain network studies in chronic disorders of consciousness: advances and perspectives
Aslam et al. Multiple sclerosis diagnosis using machine learning and deep learning: challenges and opportunities
Choi et al. Machine-learning-based elderly stroke monitoring system using electroencephalography vital signals
Wei et al. A deep learning framework with multi-perspective fusion for interictal epileptiform discharges detection in scalp electroencephalogram
Michon et al. Person-specific and precision neuroimaging: Current methods and future directions
Kamarajan et al. Random forest classification of alcohol use disorder using EEG source functional connectivity, neuropsychological functioning, and impulsivity measures
Cassidy et al. Coherent neural oscillations inform early stroke motor recovery
Solé-Casals et al. Towards semi-automatic artifact rejection for the improvement of Alzheimer’s disease screening from EEG signals
Lv et al. Multiparametric and multilevel characterization of morphological alterations in patients with transient ischemic attack
Ouyang et al. EEG autoregressive modeling analysis: A diagnostic tool for patients with epilepsy without epileptiform discharges
Abazid et al. A comparative study of functional connectivity measures for brain network analysis in the context of AD detection with EEG
CN103714268A (zh) 一种筛选多发性硬化疾病生物标志物的方法
Manippa et al. The neural correlates of developmental prosopagnosia: Twenty-five years on
Lo Giudice et al. Convolutional neural network classification of rest eeg signals among people with epilepsy, psychogenic non epileptic seizures and control subjects
Yan et al. Automated detection of clinical depression based on convolution neural network model
Ma et al. Abnormal amygdala functional connectivity and deep learning classification in multifrequency bands in autism spectrum disorder: A multisite functional magnetic resonance imaging study

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140409

RJ01 Rejection of invention patent application after publication