CN103714268A - 一种筛选多发性硬化疾病生物标志物的方法 - Google Patents
一种筛选多发性硬化疾病生物标志物的方法 Download PDFInfo
- Publication number
- CN103714268A CN103714268A CN201310684605.2A CN201310684605A CN103714268A CN 103714268 A CN103714268 A CN 103714268A CN 201310684605 A CN201310684605 A CN 201310684605A CN 103714268 A CN103714268 A CN 103714268A
- Authority
- CN
- China
- Prior art keywords
- gene
- multiple sclerosis
- sample
- screening
- gene expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明属于生物信息学技术领域,具体公开了一种筛选多发性硬化疾病生物标志物的方法。该方法通过从GEO数据库中获取数据集GSE21942,平台为GPL570,将样本采用MAS5标准化处理;然后利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ(i,j=1,2,...,N),将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量。本发明利用数学算法将正常人与MS病人外周血单个核细胞中相互抑制的基因对筛选出来,得到多发性硬化疾病生物标志物;运用筛选出多发性硬化疾病生物标志物进行生物意义的研究分析,能够反映病人的真实情况。
Description
【技术领域】
本发明属于生物信息学技术领域,特别涉及一种筛选多发性硬化疾病生物标志物的方法。
【背景技术】
多发性硬化(multiple sclerosis,MS)是一种以中枢神经系统白质炎性脱髓鞘病变为主要特征的自身免疫疾病,发病机制至今尚未完全明确。该病的临床表现为中枢神经系统白质散在分布的多病灶与病程中呈现的缓解复发,患者大脑、脑干、小脑、脊髓可同时或相继受累,临床表现多种多样:如肢体无力;眼部急性视神经炎或球后视神经炎,视力下降;共济失调;精神症状多表现为抑郁、易怒和脾气暴躁等。
目前,生物标志物、脑脊液检查、磁共振成像和诱发电位对多发性硬化的诊断具有重要意义。Kemppinen团队证明,与正常人相比,有229个基因在MS病人的外周血单个核细胞中差异表达(Kemppinen,Kaprio et al.2011)。Satoh及他的团队的研究结果表明,与正常人相比,有185个基因在MS病人的细胞中差异表达;有281个基因在MS病人的T细胞中差异表达(Satoh,Nakanishi et al.2005,Satoh,Nakanishi et al.2006)。Arthur团队的研究结果表明,与正常人相比,有2217个基因在MS病人的全血中差异表达(Arthur,Armati et al.2008)。
目前,已有多位科学家研究MS病人的不同组织中差异表达基因,但是他们筛选的差异基因之间是独立的,没有考虑基因间的相互联系。然而生物是一个系统,很多基因相互间是存在联系的。不考虑基因间的相互联系,很难反映病人的真实情况。
【发明内容】
本发明的目的在于提供一种筛选多发性硬化疾病生物标志物的方法。
本发明的目的通过以下技术方案实现:一种筛选多发性硬化疾病生物标志物的方法,包括如下步骤:
(1)从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中获取数据集GSE21942,平台为GPL570,将样本采用MAS5标准化处理;
(2)x和y分别表示两个基因,利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ(i,j=1,2,...,N),将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量(假设总计N个样本);
步骤(1)中:
所述样本为正常人和MS病人的外周血单个核细胞基因表达谱;
所述正常人的个数优选为15个;所述MS病人的个数优选为14个。
步骤(2)中:
所述筛选通过MATLAB编写代码实现。
当δ=0.01时,筛选得到的结果过少;当δ=1时,筛选得到的结果过多,都不适合用于样本分析。
本发明首次通过筛选相互抑制的基因对的方法来区分正常人与MS病人的基因表达谱,得到正常人与MS病人显著差别的相互抑制的基因对,正常人相互抑制的基因对有831对,MS病人相互抑制的基因对只有7对,这些基因对可以作为正常人与MS病人的生物标志物。同时,表明他们体内的稳态显著不同,正常人的调节系统比MS病人的更加严谨、精细、稳健和灵活。
本发明相对于现有技术具有如下的优点及有益效果:
本发明考虑基因间的相互联系,利用数学算法将正常人与MS病人外周血单个核细胞中相互抑制的基因对筛选出来,然后进行比较和生物意义分析,筛选得到多发性硬化疾病生物标志物。以基因间的相互联系为基础,筛选出多发性硬化疾病生物标志物进行生物意义的研究分析,能够反映病人的真实情况。
【附图说明】
图1是实施例1的筛选多发性硬化疾病生物标志物的方法的流程图。
图2是实施例1的15个正常人的相互抑制的基因对的示意图。
图3是实施例1的14个病人的相互抑制的基因对的示意图。
【具体实施方式】
下面结合实施例和附图对本发明作进一步详细的描述,但本发明的保护范围并不限于此。
实施例1
一种筛选多发性硬化疾病生物标志物的方法,包括如下步骤:
(1)从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中获取数据集GSE21942,平台为GPL570,样本中含有15个正常人和14个MS病人的外周血单个核细胞基因表达谱,将样本采用MAS5标准化处理;
(2)x和y分别表示两个基因,利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ(i,j=1,2,...,N),将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量(假设总计N个样本);所述筛选通过MATLAB编写代码实现。
当δ=0.01时,筛选得到的结果过少;当δ=1时,筛选得到的结果过多,都不适合用于样本分析。
当δ=0.08,15个正常人符合上述公式的结果为831个基因对,结果如图2所示,涉及的基因对有RNA剪接与剪接体组装,RNA剪接与转录,RNA剪接与泛素化,翻译与泛素化,转录与蛋白质水解,RNA沉默与RNA聚合酶III,凋亡与细胞分裂,信号传导与RNA过程蛋白,免疫细胞与去磷酸化作用蛋白,抗原过程蛋白与转录等。如图2所示,其中与STUB1(STIP1 homology and U-boxcontaining protein 1)相互抑制的基因最多,有409个基因;分别与copb2(coatomerprotein complex,subunit beta2)相互抑制的基因有21个,分别与SEC31A相互抑制的基因有17个。
当δ=0.08,14个MS病人符合上述公式的结果只有7个基因对,结果如图3所示,分别为GNB1与C1orf52,SEL1L与lrrc58,Uqcrh与ELF1,atg5与Dock5,FAM49B与Nub1,TTC19与Elf4,Cxxc1与ZBTB4。涉及的基因对有信号传导与选择性剪接,能量代谢与T细胞信号通路,转录相关蛋白等。
Kemppinen及他的团队的研究结果表明,与正常人相比,有229个基因在MS病人的外周血单个核细胞中差异表达(Kemppinen,Kaprio et al.2011)。Arthur团队证明,与正常人相比,有2217个基因在MS病人的全血中差异表达(Arthur,Armati et al.2008)。这些研究都是通过筛选独立的差异基因来比较正常人与MS病人,没有考虑基因间的相互联系,而本申请首次利用筛选相互抑制的基因对的方法来区分正常人与MS病人的基因表达谱,得到正常人与MS病人显著差别的相互抑制的基因对,如图2和图3所示。从结果中可看到,正常人与MS病人的相互抑制的基因对有着显著区别,正常人相互抑制的基因对有831对,MS病人相互抑制的基因对只有7对,这些基因对可以作为正常人与MS病人的生物标志物。同时,该结果也表明他们体内的稳态显著不同,正常人的调节系统比MS病人的更加严谨、精细、稳健和灵活。
以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所作出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。
Claims (3)
1.一种筛选多发性硬化疾病生物标志物的方法,其特征在于,包括如下步骤:
(1)从GEO数据库中获取数据集GSE21942,平台为GPL570,将样本采用MAS5标准化处理;
(2)x和y分别表示两个基因,利用公式(|(x(i)+y(i))/(x(j)+y(j))-1|<δ,将x或y基因表达不变的剔除,将相互抑制的基因对(x,y)筛选出来,得到多发性硬化疾病生物标志物;其中:i,j=1,2,...,N;δ表示基因x和y的近似程度,实验中取δ=0.08;x(i)表示基因x的第i个样本的基因表达量,y(i)表示基因y的第i个样本的基因表达量。
2.根据权利要求1所述的筛选多发性硬化疾病生物标志物的方法,其特征在于,步骤(1)中所述样本为正常人和MS病人的外周血单个核细胞基因表达谱。
3.根据权利要求1所述的筛选多发性硬化疾病生物标志物的方法,其特征在于,步骤(2)中所述筛选通过MATLAB编写代码实现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310684605.2A CN103714268A (zh) | 2013-12-12 | 2013-12-12 | 一种筛选多发性硬化疾病生物标志物的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310684605.2A CN103714268A (zh) | 2013-12-12 | 2013-12-12 | 一种筛选多发性硬化疾病生物标志物的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103714268A true CN103714268A (zh) | 2014-04-09 |
Family
ID=50407234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310684605.2A Pending CN103714268A (zh) | 2013-12-12 | 2013-12-12 | 一种筛选多发性硬化疾病生物标志物的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103714268A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573404A (zh) * | 2014-12-25 | 2015-04-29 | 深圳先进技术研究院 | 一种心肌病基因数据处理方法及装置 |
WO2021104092A1 (zh) * | 2019-11-28 | 2021-06-03 | 中国科学院深圳先进技术研究院 | 一种神经退行性疾病标志物β-spectrin及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008069975A2 (en) * | 2006-12-01 | 2008-06-12 | New York University | Methods of using f-spondin as a biomarker for cartilage degenerative conditions |
CN101605494A (zh) * | 2006-10-27 | 2009-12-16 | 阿里戴斯公司 | 使用相干喇曼技术及其校准技术用于医疗诊断和治疗目的 |
WO2010136232A1 (en) * | 2009-05-28 | 2010-12-02 | Fundació Institut De Recerca De L´Hospital Universitari Vall D'hebron | In vitro method suitable for patients suffering from cis for the early diagnosis or prognosis of multiple sclerosis |
CN102301002A (zh) * | 2008-11-12 | 2011-12-28 | 卡里斯生命科学卢森堡控股有限责任公司 | 使用外来体来确定表现型的方法和系统 |
-
2013
- 2013-12-12 CN CN201310684605.2A patent/CN103714268A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101605494A (zh) * | 2006-10-27 | 2009-12-16 | 阿里戴斯公司 | 使用相干喇曼技术及其校准技术用于医疗诊断和治疗目的 |
WO2008069975A2 (en) * | 2006-12-01 | 2008-06-12 | New York University | Methods of using f-spondin as a biomarker for cartilage degenerative conditions |
WO2008069975A3 (en) * | 2006-12-01 | 2008-12-11 | Univ New York | Methods of using f-spondin as a biomarker for cartilage degenerative conditions |
CN102301002A (zh) * | 2008-11-12 | 2011-12-28 | 卡里斯生命科学卢森堡控股有限责任公司 | 使用外来体来确定表现型的方法和系统 |
WO2010136232A1 (en) * | 2009-05-28 | 2010-12-02 | Fundació Institut De Recerca De L´Hospital Universitari Vall D'hebron | In vitro method suitable for patients suffering from cis for the early diagnosis or prognosis of multiple sclerosis |
Non-Patent Citations (1)
Title |
---|
余海浪等: "用于基因数据挖掘的基因表达数据库 GEO", 《中国生物工程杂志》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573404A (zh) * | 2014-12-25 | 2015-04-29 | 深圳先进技术研究院 | 一种心肌病基因数据处理方法及装置 |
CN104573404B (zh) * | 2014-12-25 | 2018-05-04 | 深圳先进技术研究院 | 一种心肌病基因数据处理方法及装置 |
WO2021104092A1 (zh) * | 2019-11-28 | 2021-06-03 | 中国科学院深圳先进技术研究院 | 一种神经退行性疾病标志物β-spectrin及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Intrinsic functional connectivity patterns predict consciousness level and recovery outcome in acquired brain injury | |
Mullainathan et al. | Does machine learning automate moral hazard and error? | |
Choi et al. | Deep learning-based stroke disease prediction system using real-time bio signals | |
Saminu et al. | A recent investigation on detection and classification of epileptic seizure techniques using EEG signal | |
Nichols et al. | Controlling the familywise error rate in functional neuroimaging: a comparative review | |
Ibrahim et al. | Relationships between social support and depression, and quality of life of the elderly in a rural community in M alaysia | |
Weinberg et al. | Forgiveness, coping, and terrorism: Do tendency to forgive and coping strategies associate with the level of posttraumatic symptoms of injured victims of terror attacks? | |
Prichep et al. | Classification of traumatic brain injury severity using informed data reduction in a series of binary classifier algorithms | |
Kumari et al. | A data mining approach for the diagnosis of diabetes mellitus | |
Song et al. | Brain network studies in chronic disorders of consciousness: advances and perspectives | |
Aslam et al. | Multiple sclerosis diagnosis using machine learning and deep learning: challenges and opportunities | |
Choi et al. | Machine-learning-based elderly stroke monitoring system using electroencephalography vital signals | |
Wei et al. | A deep learning framework with multi-perspective fusion for interictal epileptiform discharges detection in scalp electroencephalogram | |
Michon et al. | Person-specific and precision neuroimaging: Current methods and future directions | |
Kamarajan et al. | Random forest classification of alcohol use disorder using EEG source functional connectivity, neuropsychological functioning, and impulsivity measures | |
Cassidy et al. | Coherent neural oscillations inform early stroke motor recovery | |
Solé-Casals et al. | Towards semi-automatic artifact rejection for the improvement of Alzheimer’s disease screening from EEG signals | |
Lv et al. | Multiparametric and multilevel characterization of morphological alterations in patients with transient ischemic attack | |
Ouyang et al. | EEG autoregressive modeling analysis: A diagnostic tool for patients with epilepsy without epileptiform discharges | |
Abazid et al. | A comparative study of functional connectivity measures for brain network analysis in the context of AD detection with EEG | |
CN103714268A (zh) | 一种筛选多发性硬化疾病生物标志物的方法 | |
Manippa et al. | The neural correlates of developmental prosopagnosia: Twenty-five years on | |
Lo Giudice et al. | Convolutional neural network classification of rest eeg signals among people with epilepsy, psychogenic non epileptic seizures and control subjects | |
Yan et al. | Automated detection of clinical depression based on convolution neural network model | |
Ma et al. | Abnormal amygdala functional connectivity and deep learning classification in multifrequency bands in autism spectrum disorder: A multisite functional magnetic resonance imaging study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140409 |
|
RJ01 | Rejection of invention patent application after publication |