CN115579056B - 一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用 - Google Patents

一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用 Download PDF

Info

Publication number
CN115579056B
CN115579056B CN202211022570.1A CN202211022570A CN115579056B CN 115579056 B CN115579056 B CN 115579056B CN 202211022570 A CN202211022570 A CN 202211022570A CN 115579056 B CN115579056 B CN 115579056B
Authority
CN
China
Prior art keywords
schizophrenia
defective
genes
gene
unique
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211022570.1A
Other languages
English (en)
Other versions
CN115579056A (zh
Inventor
杨新平
劳健培
杨小雪
余文君
刘海华
王静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Hospital Southern Medical University
Original Assignee
Southern Hospital Southern Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Hospital Southern Medical University filed Critical Southern Hospital Southern Medical University
Priority to CN202211022570.1A priority Critical patent/CN115579056B/zh
Publication of CN115579056A publication Critical patent/CN115579056A/zh
Application granted granted Critical
Publication of CN115579056B publication Critical patent/CN115579056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于生物技术领域,具体涉及一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用,本发明基于大样本的全外显子组测序方法,获得缺陷型精神分裂症和非缺陷型精神分裂症所独有的致病突变与拷贝数变异基因,并用于对精神分裂症进行分子分型,具有较高的准确度。

Description

一组用于评估精神分裂症分子分型的基因群及其诊断产品和 应用
技术领域
本发明属于生物技术领域,具体涉及一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用。
背景技术
精神分裂症是一种病因复杂、临床表现具有异质性的慢性致残性疾病,患病率约1%。症状可大概分为“阳性”、“阴性”、“认知性”类别,包括:幻觉、妄想、行为异常、说话混乱、情绪紊乱等。目前大部分学者认为精神分裂症主要是由遗传与环境两个因素相互作用产生的结果。有双胞胎meta分析研究表明精神分裂症的遗传风险为80%,说明精神分裂症具有较高的遗传异质性。由于精神分裂症的病因复杂,且目前尚无明确的诊断方法与治疗手段,对精神分裂症的临床诊断仍旧停留在根据病史、症状与体征的评估。
1988年Carpenter等人提出的缺陷型精神分裂症的概念。Kirkpatrick等人在1989年进一步完善缺陷型精神分裂症的诊断标准并且确立了缺陷型精神分裂症诊断量表,其中他们对缺陷型精神分裂症的判断标准为:1.情感非主观性受限、主观情绪范围缩小、言语贫乏、兴趣减少、目的性减弱、社会性驱动力减少这6种阴性症状最少出现两种;2.第一点中两种或以上的症状在过去一年与临床稳定期一直存在;3.上述症状为原发性或者特发性的而非继发性;4.病人满足DSM标准。而没有满足这些条件的精神分裂症被认定为非缺陷性精神分裂症。
2005年中南大学湘雅二医学院医学心理研究中心王湘等人对缺陷型精神分裂症诊断量表进行信度与效度的研究,发现SDS具有良好的分型结果;2008年Grover等人研究发现缺陷型与非缺陷型精神分裂症之间有比较稳健的差异,且将缺陷组与非缺陷组分开可以降低精神分裂症的异质性。所以该分型具有一定的信度与效度。
虽然该分型方法具有一定的信度与效度,但是根据Carpenter等人对该分型的描述来说,判断缺陷症状的存在与否只能通过纵向也就是长时间的观察进行诊断而不能通过横向也就是短时间多指标的方法进行诊断。目前缺陷型与非缺陷型仍然是基于长时间的临床观察的方法进行诊断,缺乏一种快速高效的分型方法来弥补缺陷型与非缺陷型分型的所需观察时间长的缺点,而精神分裂症又具有遗传异质性,因此,探寻分别用于指示缺陷型精神分裂症与非缺陷型精神分裂症的标志物,并用于快速分子分型,对于缺陷型精神分裂症与非缺陷型精神分裂症分子分型及其背后的发病机制的探索具有重要意义。
发明内容
针对现有技术存在问题,本发明旨在提供一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用。本发明基于大样本的全外显子组测序方法,获得缺陷型精神分裂症和非缺陷型精神分裂症所独有的致病突变与拷贝数变异基因,用于对精神分裂症进行分子分型,具有较高的准确度。
基于上述目的,本发明的采用的技术方案如下:
第一方面,本发明提供一组用于评估精神分裂症分子分型的基因群,所述基因群包括如表1~表4所示的缺陷型精神分裂症所独有的基因和非缺陷型精神分裂症所独有的基因;
所述缺陷型精神分裂症独有的基因包括245个CNV基因和238个SNP/INDEL基因;所述非缺陷型精神分裂症独有基因包括657个CNV基因和322个SNP/INDEL基因。
第二方面,本发明提供上述基因群在进行精神分裂症分子分型中的应用。
第三方面,本发明提供上述基因群在制备对精神分裂症进行分子分型的诊断产品中的应用。
第四方面,本发明提供一种对精神分裂症进行分子分型的诊断产品,包含检测上述基因群中基因的表达水平的相关试剂。
优选地,所述诊断产品为体外诊断产品的形式,所述体外诊断产品为试剂盒或试纸条。
优选地,所述精神分裂症包括缺陷型精神分裂症和非缺陷型精神分裂症。
优选地,所述诊断产品通过对待检样本进行全外显子组测序,并基于CNV筛选与SNP/INDEL筛选,评估待检样本对应个体的精神分裂症所属分型。
优选地,所述CNV筛选方法如下:
通过对待检样本进行全外显子组测序,得到与精神分裂症相关的高质量CNV基因,并分析所述高质量CNV基因是否覆盖所述缺陷型精神分裂症和非缺陷型精神分裂症所独有的基因;
若所述高质量CNV基因覆盖所述缺陷型精神分裂症所独有的基因中的至少一个基因,且覆盖长度不小于100bp,则判定待检样本对应个体为缺陷型精神分裂症;
若所述高质量CNV基因未覆盖所述缺陷型精神分裂症所独有的基因,并且覆盖所述非缺陷型精神分裂症所独有的基因中的至少一个基因,且覆盖长度不小于100bp,则判定待检样本对应个体为非缺陷型精神分裂症。
优选地,所述SNP/INDEL筛选方法如下:
通过对待检样本进行全外显子组测序,获得与精神分裂症相关的高质量SNP/INDEL基因,并分析所述高质量SNP/INDEL基因是否覆盖所述缺陷型精神分裂症和非缺陷型精神分裂症所独有的基因;
若所述高质量SNP/INDEL基因覆盖所述缺陷型精神分裂症所独有的基因中的至少一个基因,则判定待检样本对应个体为缺陷型精神分裂症;
若所述高质量SNP/INDEL基因未覆盖所述缺陷型精神分裂症所独有的基因,并且覆盖所述非缺陷型精神分裂症所独有的基因中的至少一个基因,则判定待检样本对应个体为非缺陷型精神分裂症。
优选地,所述待检样本为血液或血清。
与现有技术相比,本发明的有益效果如下:
本发明基于大样本的全外显子组测序的方法,从遗传学的角度出发,寻找缺陷型精神分裂症与非缺陷型精神分裂症所含有的致病突变与拷贝数变异,筛选出两种亚型所独有的致病突变基因(SNP/INDEL基因)与拷贝数变异基因(CNV基因),进而从遗传学角度对缺陷型与非缺陷型的精神分裂症进行分子分型。
基于本发明所筛选出的缺陷型精神分裂症和非缺陷型精神分裂症所独有CNV基因和SNP/INDEL基因,分别对已经确定为缺陷型精神分裂症的样本与非缺陷型精神分裂症样本进行评估,由本发明所述基因群对缺陷型精神分裂症的检测效率达91%,对非缺陷型精神分裂症的检测效率则达93.7%,因此本发明所述基因群对精神分裂症分型检测具有较优的信度与广度。
附图说明
图1为CNV基因分布热图;
图2为SNP/INDEL基因分布热图;
图3为缺陷型与非缺陷型独有的CNV/SNP/INDEL基因与精神分裂症候选基因的基因富集图;
图4为缺陷型与非缺陷型独有的CNV与SNP/INDEL基因与精神分裂症候选基因的基因富集图;
图5为缺陷型与非缺陷型独有的SNV基因与精神分裂症候选基因数目韦恩图;
图6为缺陷型与非缺陷型独有的CNV基因与精神分裂症候选基因数目韦恩图;
图7为缺陷型与非缺陷型病人相对于正常人中独有的CNV及其覆盖的基因与SNP/INDEL所处的基因对样本的随机检测效率分布图;
图8为缺陷型与非缺陷型病人相对于正常人中独有的CNV及其覆盖的基因与SNP/INDEL所处的基因在缺陷型与非缺陷型样本中的分布热图;其中蓝色点为CNV覆盖的基因,红色点为SNP/INDEL所处的基因。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例中所用的试验方法如无特殊说明,均为常规方法;所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
1.样本收集
本研究的对象为病情稳定、发病时间长、年龄相近的缺陷型精神分裂症、非缺陷型精神分裂症病人、年龄相近的正常人。本研究收集91例缺陷型精神分裂症患者、111例非缺陷型精神分裂症患者以及122位正常人的血液样本并送全外显子组测序。
2.拷贝数变异(Copy number variants,CNV)处理
使用XHMM(version:1.0)软件对CNV进行检测,将寻找到的CNV区域过滤千人基因组计划中正常人群的CNV区域,然后计算缺陷型精神分裂症与正常人、非缺陷型精神分裂症与正常组的相对比值(odds ratio,OR),并取OR大于1.5作为致病CNV的过滤标准,并将过滤后的CNV与已知的高可信度精神分裂症CNV区域进行比较,交集部分作为最终的高可信度致病CNV(图1)。其中OR值的计算公式为:病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值,例如拿缺陷型与正常组来说:我们计算缺陷型病人(记作a)与正常组中(记作b)含有该CNV区域内基因的人数,再根据缺陷型与正常组样本数计算缺陷型与正常组中没有该CNV区域内基因的人数(记作c与d),则OR值则为:ad/bc。
图1为最终的高可信度致病CNV基因分布热图,反映每一个样本CNV基因的分布情况。其中红色为重复基因(duplication),蓝色为删除基因(deletion)。横坐标分为两部分,左边的部分为缺陷型精神分裂症病人组,右边的部分为非缺陷型精神分裂症病人组;纵坐标分为三部分,从上往下分别为缺陷型精神分裂症组独有CNV基因、缺陷型精神分裂症与非缺陷型精神分裂症共有CNV基因、非缺陷型精神分裂症独有CNV基因。根据样本的CNV区域内基因的分布,我们可以看出CNV区域内基因具备分型的可能性,具体体现在缺陷型与非缺陷型独有的CNV区域内基因可以将两个不同亚型的精神分裂症样本分开。
3.单核苷酸多态性(Single Nucleotide Polymorphism,SNP)与短插入缺失突变(Insertion/Deletion,INDEL)处理
使用GATK(version:4.12.0)软件中的BaseRecalibrator、ApplyBQSR、HaplotypeCaller、GatherVcfs、VariantRecalibrator以及ApplyVQSR工具完成碱基质量校正、基因突变位点基因型鉴定评估、校正突变评估结果的过程,参数设置参考GATK推荐分析流程参数设置。其中VariantRecalibrator校正突变评估结果的过程依赖机器学习高斯分类算法实现,训练集可靠与否直接影响结果的可靠性。我们经比较后选择使用GATK发布于github上的VariantRecalibrator训练集设置参数,对单核苷酸突变位点的训练集参数为:
‘--resource:hapmap,known=false,training=true,truth=true,prior=15.0
hapmap_3.3.hg38.vcf’,‘--resource:omni,
known=false,training=true,truth=true,prior=12.0 1000G_omni2.5.hg38.vcf’,
‘--resource:1000G,known=false,training=true,truth=false,prior=10.0
1000G_phase1.snps.high_confidence.hg38.vcf’,
‘--resource:dbsnp,known=true,training=false,truth=false,prior=7dbsnp_144.hg38.withchr.vcf’;
对短插入缺失突变位点的训练集参数为:
‘--resource:mills,known=false,training=true,truth=true,prior=12Mills_and_1000G_gold_standard.indels.hg38.vcf’,‘—resour
ce:dbsnp,known=true,training=false,truth=false,prior=2dbsnp_144.hg38.withchr.vcf’,‘--resource:axiomPoly,known=
false,training=true,truth=false,prior=10Axiom_Exome_Plus.
genotypes.all_populations.poly.hg38.vcf’。
所有训练集均下载于GATK bundle(ftp://ftp.broadinstitute.org/bundle/hg38/)。ApplyVQSR的tranches参数设定为99.0;经上述筛选,一共得到1399490个SNP/INDEL。
接着我们进行如下过滤以进一步筛选与精神分裂症发病相关的SNP/INDEL:(i)去除未通过GATK VQSR(variant quality score recalibration)筛选的突变位点或位于基因组中低复杂度区域的突变位点;(ii)去除相关性(KING relatedness)>0.1且单个样本中发现的突变在全部突变位点中占比超过85%的样本;(iii)对于同一突变位点具有多个基因型的情况,要求测序深度在10-1000范围内,并根据测序数据对不同基因型的支持占比进行突变情况判定:纯合突变须有不少于90%的序列支持;杂合突变须有25%-75%的序列支持其为纯合突变;野生型则为不超过10%;(iv)基因型质量(Genotype Quality,GQ)≥25的突变且次等位基因频率(minor allele frequency,MAF)≤0.01的高质量罕见突变用于后续研究。基因型质量表示该位点该基因型存在的可能性,该值越高则基因型存在的可能性越大,GATK中使用的基因型质量对校正后的基因型存在频率,GQ=-10×lg(1-P),P为该位点该基因型存在概率;次等位基因频率指在给定人群中的不常见的等位基因发生频率,等于给定人群中该位点的最小基因频率。在324个样本中共有705352个高质量的罕见突变位点被保留。
同样地我们计算缺陷型与正常跟非缺陷型与正常组的OR值(与前述相同)并取OR>1的位点进行危害性预测(根据CADD、MutationTaster、Polyphen、SIFT这四个常见的危害性突变预测软件进行突变危害性预测,其中MutationTaster、Polyphen、SIFT对危害性突变都有一个明确的定义(SIFT中标记为deleterious且打分为0;MutationTaster中标记为probably_damaging且打分为1;MutationTaster中标记为A),而CADD中对突变没有一个明确的危害性判定,但是它能够给出标准化打分,例如:CADD的PHRED分数大于等于10的突变为在所有突变中危害性排在前10%,而大于等于20的话则排名为前1%,我们定义CADD标准化打分大于30分的突变为危害性突变。为了增加可信度,我们在这四个突变危害性预测软件中最少三个预测为危害性突变的那些突变作为危害性突变),并将预测为危害性的位点对应的基因与已发表的高质量精神分裂症网络基因(基因来源:iScience.2021Oct 2;24(11):103209.doi:10.1016/j.isci.2021.103209.eCollection 2021Nov 19.)进行比较,最终获得高质量的危害性位点与对应的基因(图2)。
图2为SNP/INDEL基因分布热图,反映每一个样本SNP/INDEL基因的分布情况。其中红色为对应对应样本(横坐标)对应基因(纵坐标)存在SNP/INDEL。横坐标分为两部分,左边的部分为缺陷型精神分裂症病人组,右边的部分为非缺陷型精神分裂症病人组;纵坐标分为三部分,从上往下分别为缺陷型精神分裂症组独有SNP/INDEL基因、缺陷型与非缺陷型共有SNP/INDEL基因、非缺陷型精神分裂症独有SNP/INDEL基因。与CNV区域基因一样,SNP/INDEL基因具备分型的可能性,具体体现在缺陷型与非缺陷型独有的SNP/INDEL基因可以将两个疾病组样本分开。
4.用于分子分型的高质量CNV基因与SNP/INDEL基因
对于寻找到的危害性的突变与变异基因,我们发现缺陷型与非缺陷型精神分裂症都含有共有的与独有的危害性的突变与变异基因。我们一共发现缺陷型精神分裂症具有238个独有的SNP/INDEL基因与245个CNV基因,如表1和表2所示,非缺陷型具有322个独有的SNP/INDEL基因与657个CNV基因,如表3和表4所示;提示这部分独有的突变与变异基因可应用于缺陷型与非缺陷型精神分裂症的分子分型。
表1缺陷型精神分裂症所独有的245个CNV基因
表2缺陷型精神分裂症所独有的238个SNP/INDEL基因
表3非缺陷型精神分裂症所独有的657个CNV基因
/>
/>
/>
/>
/>
/>
/>
/>
表4非缺陷型精神分裂症所独有的322个SNP/INDEL基因
/>
/>
/>
实施例2
为了证明实施例1所筛选出的突变与变异基因具有分子分型能力,我们从中挑选两个来说明其与精神分裂症的关系,并进行了相关效果验证,具体如下。
1、本发明首次使用大样本高通量全外显子组的方法以遗传学的角度对缺陷型与非缺陷型精神分裂症进行分子分型,筛选出了两种精神分裂症分型所独有的CNV区域内基因与SNP/INDEL基因。样本数目大,检测到的基因可信度高代表性强。
我们发现的缺陷型精神分裂症与非缺陷型精神分裂症独有的突变与变异基因分别位于84个缺陷型精神分裂症样本与104个非缺陷型精神分裂症样本中,对缺陷型精神分裂症的检测效率达91%,对非缺陷型精神分裂症的检测效率则达93.7%。因此该分型方法检测信度与广度较好。其次,我们所使用的实验样本皆为已确诊缺陷型/非缺陷型精神分裂症病人样本,在这些已确诊的样本上进行大规模的全外显子测序并寻找高质量的精神分裂症突变基因,所得到的突变基因可信度高(具体体现在病人本身所带有的,并且经过严格的筛选与过滤)。我们使用样本所独有的CNV区域内与SNP/INDEL基因进行样本分型,发现无论是CNV区域还是SNP/INDEL突变基因,它们对不同缺陷型与非缺陷型的分型能力都高达90%以上,即缺陷型与非缺陷型独有的CNV区域内或SNP/INDEL突变基因基本在90%以上的样本中存在,说明独有的缺陷型与非缺陷型CNV区域内与SNP/INDEL基因具有良好的分型能力。为了证明该方法找到的突变与变异基因具有分子分型能力,我们从中挑选两个来说明其与精神分裂症的关系。
在缺陷型独有的突变与变异基因中我们检测到了MAPK3(丝裂原激活蛋白激酶3),该基因编码的蛋白参与调控细胞增殖分化或者是细胞循环等过程。有研究报道MAPK3为精神分裂症的病理发展的最核心的基因之一(Life Sciences;PMID:32853652);该基因位于16号染色体内,16号染色体的重复变异是与精神分裂症跟自闭症最相关的变异之一(ProcNatl Acad Sci U S A.;PMID:27402753),其中该基因位于16号染色体内,且该基因在缺陷型病人内为重复变异,暗示该基因与缺陷型精神分裂症可能存在因果联系。
在非缺陷型独有的突变与变异基因中我们检测到了BAIAP2(含BAR/IMD结构域受体蛋白2),该基因编码的蛋白作为胰岛素受体酪氨酸激酶底物发挥作用,表明胰岛素在中枢神经系统中的作用,其也被鉴定为与齿状核红核苍白球丘脑下部核萎缩基因(ATN1,同义名DRPLA)相互作用,该基因与罕见退行性疾病齿状核红核苍白球路易体萎缩症有关(HumMol Genet;PMID 10332026)。已有研究表明树突棘中BAIAP2缺陷可能通过N-甲基-d-天冬氨酸受体功能扰乱导致社会和认知缺陷(Neuropharmacology;PMID:26275848)该基因在非缺陷型的病人中检测为单碱基突变,突变导致该基因框移突变,且在突变危害性软件预测中该突变对于该基因功能影响大。暗示该基因与非缺陷型精神分裂症可能存在因果关联。
所以我们所使用的分子分型的方法找到的基因不仅与精神分裂症相关,也与其他精神疾病甚至是脑功能疾病也是有关联的,说明本发明所述基因群进行分子分型方法具有可信度。
2、本发明筛选出的用于分子分型的突变与变异基因与精神分裂症高度相关。
从fisher test统计学检验的结果可以看到缺陷型与非缺陷型精神分裂症独有的CNV/SNP/INDEL基因都与精神分裂症显著相关,也进一步证明全外显子组检测得到的突变与变异基因具有分子分型的价值。基于已公开的精神分裂症相关的数据库与文献,通过统计筛选得到一份高质量的精神分裂症候选基因(1720个)。我们使用fisher test统计学检验方法得到的缺陷型与非缺陷型独有的CNV跟SNP/INDEL基因与精神分裂症的富集关系(图3)。图3为缺陷型与非缺陷型独有的CNV/SNP/INDEL基因与精神分裂症候选基因的基因富集图。背景集为全体人类基因组的基因。横坐标从左到有分别为背景集、缺陷型独有的CNV/SNP/INDEL基因、非缺陷型独有的CNV/SNP/INDEL基因。统计值p值都小于0.05,即两个亚型独有的CNV/SNP/INDEL基因都显著富集在精神分裂症候选基因内(p=2.04e-43;p=3.55e-32)。可以看到缺陷型与非缺陷型独有的CNV/SNP/INDEL基因都显著富集在精神分裂症候选基因内,说明这两部分基因都与精神分裂症相关。反映出使用高通量的方法对缺陷型与非缺陷型精神分裂症的分子分型的策略是可行的。
我们对CNV于SNP/INDEL分开进行统计发现:对于缺陷型来说,独有的CNV与SNP/INDEL基因都与精神分裂症相关;对于非缺陷型来说,独有的CNV基因不富集在精神分裂症候选基因但独有的SNP/INDEL基因与精神分裂症相关(图4)。图4为缺陷型与非缺陷型独有的CNV与SNP/INDEL基因与精神分裂症候选基因的基因富集图。背景集为全体人类基因组的基因。横坐标从左到有分别为背景集、缺陷型独有的CNV基因、非缺陷型独有的CNV基因、缺陷型独有的SNP/INDEL基因、非缺陷型独有的SNP/INDEL基因。除了非缺陷型独有的CNV以外,统计值p值都小于0.05,具有统计学差异(p=4.79e-3;p=1;p=1.51e-55;p=6.63e-89)。CNV与精神分裂症候选基因无关的原因可能与非缺陷型精神分裂症没有一个确定的定义有关。
3、本发明筛选出的用于精神分裂症分子分型的基因群与其他精神分裂症研究的结果基因重复度小
本方法所找到的基因与其他研究的精神分裂症候选基因重复度低,可以扩充已有的精神分裂症候选基因(图5,图6)。图5为缺陷型与非缺陷型独有的SNV基因与精神分裂症候选基因数目韦恩图。图6为缺陷型与非缺陷型独有的CNV基因与精神分裂症候选基因数目韦恩图。
4、本发明筛选出的用于精神分裂症分子分型的基因群的分型效果分析
结合大样本全外显子组测序与高质量精神分裂症候选基因筛选的方法对缺陷型与非缺陷型精神分裂症进行分子分型。
我们通过使用全外显子组测序加上CNV与SNP/INDEL的筛选方法发现了缺陷型与非缺陷型精神分裂症的独有的突变基因。我们基于这些高质量精分相关的突变基因的基础上过滤出缺陷型与非缺陷型病人相对于正常人中独有的CNV及其覆盖的基因,其中缺陷型245个基因,非缺陷型657个基因,分别对应表1、表3与CNV及其所处的基因;缺陷型238个基因,非缺陷型322个基因,分别对应表2和表4与SNP/INDEL及其所处的基因,这些病人独有的突变及其基因作为缺陷型或者是非缺陷型精神分裂症的生物标志物能够对样本进行分型。具体的分型方法如下:
CNV分型方法:我们通过全外显子组加上CNV的筛选方法对病人进行CNV检测与筛选以后,得到与精神分裂症相关的高质量CNV及其所覆盖的基因。然后我们去掉这部分高质量的CNV中在正常人也检测出来的CNV,剩余的CNV中检测到检测到任一个属于缺陷型的CNV且覆盖该区域总至少一个基因,覆盖长度不小于100bp,无论是否检出非缺陷型,均判别为缺陷型;仅检出非缺陷型CNV且覆盖该区域总至少一个基因,覆盖长度不小于100bp,判别为非缺陷型;如果是两种分型的CNV都检测不出来的话就分类到其他。
SNP/INDEL分型方法:我们同样通过全外显子组加上SNP/INDEL的筛选方法对病人进行SNP/INDEL检测与筛选以后,得到与精神分裂症相关的高质量SNP/INDEL及其所处的基因。然后我们去除这部分突变中正常人也检测到的突变,剩余的突变中如果检测到任何一个属于缺陷型的SNP/INDEL并且处于同一个基因内,无论是否检测处非缺陷型,都判别为缺陷型;仅检测出非缺陷型SNP/INDEL并且处于同一个基因内,则判别为非缺陷型;如果两种分型的突变都检测不出来则分类到其他。
为了证明缺陷型与非缺陷型独有的SNP/INDEL与CNV基因具有很好的样本检测的可能,我们从使用的样本(缺陷型91个,非缺陷型111个)中随机挑选缺陷型54个,非缺陷型66个(占总样本60%),并计算这些独有基因对样本的区分率,如图7所示,图7为缺陷型与非缺陷型病人相对于正常人中独有的CNV及其覆盖的基因与SNP/INDEL所处的基因对样本的随机检测效率分布图。结果发现无论是缺陷型还是非缺陷型的独有的SNP/INDEL以及CNV基因,其都能够检测到超过60%的缺陷型与非缺陷型样本。
其次,为了证明缺陷型与非缺陷型病人独有的突变与变异基因具有良好的分型效果,我们对这些基因在样本中的分布进行查看,如图8所示,图8为缺陷型与非缺陷型病人相对于正常人中独有的CNV及其覆盖的基因与SNP/INDEL所处的基因在缺陷型与非缺陷型样本中的分布热图。其中蓝色点位CNV覆盖的基因,红色点为SNP/INDEL所处的基因,结果发现这些基因能够很好的区分缺陷型与非缺陷型精分样本,说明用此方法寻找出来的独有的突变与变异基因具有很好的分型效果。
综上,本方法首次使用大样本高通量全外显子组的方法以遗传学的角度对缺陷型与非缺陷型精神分裂症进行分子分型,寻找到了两种精神分裂症分型所独有的CNV基因与SNP/INDEL基因。样本数目大,检测到的基因可信度高代表性强。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (9)

1.一组用于评估精神分裂症分子分型的基因群,其特征在于,所述基因群包括如表1~表4所示的缺陷型精神分裂症所独有的基因和非缺陷型精神分裂症所独有的基因;
所述缺陷型精神分裂症独有的基因包括245个CNV基因和238个SNP/INDEL基因;所述非缺陷型精神分裂症独有基因包括657个CNV基因和322个SNP/INDEL基因。
2.权利要求1所述基因群在制备对精神分裂症进行分子分型的诊断产品中的应用。
3.一种对精神分裂症进行分子分型的诊断产品,其特征在于,包含检测权利要求1所述基因群中基因的表达水平的相关试剂。
4.如权利要求3所述的诊断产品,其特征在于,所述诊断产品为体外诊断产品的形式,所述体外诊断产品为试剂盒或试纸条。
5.如权利要求3所述的诊断产品,其特征在于,所述精神分裂症包括缺陷型精神分裂症和非缺陷型精神分裂症。
6.如权利要求4所述的诊断产品,其特征在于,所述诊断产品通过对待检样本进行全外显子组测序,并基于CNV筛选与SNP/INDEL筛选,评估待检样本对应个体的精神分裂症所属分型。
7.如权利要求6所述的诊断产品,其特征在于,所述CNV筛选方法如下:
通过对待检样本进行全外显子组测序,得到与精神分裂症相关的高质量CNV基因,并分析所述高质量CNV基因是否覆盖权利要求1所述缺陷型精神分裂症和非缺陷型精神分裂症所独有的基因;
若所述高质量CNV基因覆盖权利要求1所述缺陷型精神分裂症所独有的基因中的至少一个基因,且覆盖长度不小于100bp,则判定待检样本对应个体为缺陷型精神分裂症;
若所述高质量CNV基因未覆盖权利要求1所述缺陷型精神分裂症所独有的基因,并且覆盖权利要求1所述非缺陷型精神分裂症所独有的基因中的至少一个基因,且覆盖长度不小于100bp,则判定待检样本对应个体为非缺陷型精神分裂症。
8.如权利要求6所述的诊断产品,其特征在于,所述SNP/INDEL筛选方法如下:
通过对待检样本进行全外显子组测序,获得与精神分裂症相关的高质量SNP/INDEL基因,并分析所述高质量SNP/INDEL基因是否覆盖权利要求1所述缺陷型精神分裂症和非缺陷型精神分裂症所独有的基因;
若所述高质量SNP/INDEL基因覆盖权利要求1所述缺陷型精神分裂症所独有的基因中的至少一个基因,则判定待检样本对应个体为缺陷型精神分裂症;
若所述高质量SNP/INDEL基因未覆盖权利要求1所述缺陷型精神分裂症所独有的基因,并且覆盖权利要求1所述非缺陷型精神分裂症所独有的基因中的至少一个基因,则判定待检样本对应个体为非缺陷型精神分裂症。
9.如权利要求6所述的诊断产品,其特征在于,所述待检样本为血液或血清。
CN202211022570.1A 2022-08-24 2022-08-24 一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用 Active CN115579056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211022570.1A CN115579056B (zh) 2022-08-24 2022-08-24 一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211022570.1A CN115579056B (zh) 2022-08-24 2022-08-24 一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用

Publications (2)

Publication Number Publication Date
CN115579056A CN115579056A (zh) 2023-01-06
CN115579056B true CN115579056B (zh) 2024-05-31

Family

ID=84579280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211022570.1A Active CN115579056B (zh) 2022-08-24 2022-08-24 一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用

Country Status (1)

Country Link
CN (1) CN115579056B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102027134A (zh) * 2008-03-27 2011-04-20 加利福尼亚大学董事会 参与代谢途径的基因的受损等位基因以及用于检测和使用其的方法
CN102137938A (zh) * 2008-07-04 2011-07-27 解码遗传学私营有限责任公司 预测精神分裂症的风险的拷贝数变异
CN105543390A (zh) * 2016-02-04 2016-05-04 青岛市肿瘤医院 一种检测型偏执型精神分裂症易感性的引物及试剂盒
CN106434880A (zh) * 2016-08-30 2017-02-22 张建华 一种检测单纯型精神分裂症易感性的引物及试剂盒
CN108823303A (zh) * 2018-07-05 2018-11-16 广州海思医疗科技有限公司 一种检测试剂盒及其评估精神分裂症遗传风险的用途
CN111235268A (zh) * 2020-04-28 2020-06-05 上海恩元生物科技有限公司 Snp位点基因型检测试剂及相应的试剂盒中的用途及试剂盒
CN113249459A (zh) * 2020-02-11 2021-08-13 上海恩元生物科技有限公司 用于精神分裂症患者用药指导的基因群检测的引物组及相关用途、相应的试剂盒和使用方法
CN114277123A (zh) * 2021-12-29 2022-04-05 上海交通大学 与精神分裂症相关的含有snp位点的多核苷酸和用途

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0306604D0 (en) * 2003-03-21 2003-04-30 Curidium Ltd Second medical use
US11854684B2 (en) * 2020-12-29 2023-12-26 Kpn Innovations, Llc. Methods and systems for nourishment refinement using psychiatric markers

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102027134A (zh) * 2008-03-27 2011-04-20 加利福尼亚大学董事会 参与代谢途径的基因的受损等位基因以及用于检测和使用其的方法
CN102137938A (zh) * 2008-07-04 2011-07-27 解码遗传学私营有限责任公司 预测精神分裂症的风险的拷贝数变异
CN105543390A (zh) * 2016-02-04 2016-05-04 青岛市肿瘤医院 一种检测型偏执型精神分裂症易感性的引物及试剂盒
CN106434880A (zh) * 2016-08-30 2017-02-22 张建华 一种检测单纯型精神分裂症易感性的引物及试剂盒
CN108823303A (zh) * 2018-07-05 2018-11-16 广州海思医疗科技有限公司 一种检测试剂盒及其评估精神分裂症遗传风险的用途
CN113249459A (zh) * 2020-02-11 2021-08-13 上海恩元生物科技有限公司 用于精神分裂症患者用药指导的基因群检测的引物组及相关用途、相应的试剂盒和使用方法
CN111235268A (zh) * 2020-04-28 2020-06-05 上海恩元生物科技有限公司 Snp位点基因型检测试剂及相应的试剂盒中的用途及试剂盒
CN114277123A (zh) * 2021-12-29 2022-04-05 上海交通大学 与精神分裂症相关的含有snp位点的多核苷酸和用途

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Deficit schizophrenia: Concept and validity;Sandeep Grover 等;《Indian J Psychiatry》;20081231;第50卷(第1期);61-66 *
S. C. Bakker 等.The PIP5K2A and RGS4 genes are differentially associated with deficit and non-deficit schizophrenia.《Genes,Brain and Behavior》.2007,第6卷(第2期),113-119. *
精神分裂症患者认知功能损伤的神经生物学基础和电生理表现;李嘉慧 等;《中国医学物理学杂志》;20201231;第37卷(第1期);115-121 *
精神分裂症患者高危阶段与首发阶段事件相关电位(ERP)的对照研究;胡家群 等;《中国健康心理学杂志》;20201231;第28卷(第2期);161-164 *
缺陷型及非缺陷型首发精神分裂症患者关联性负变的对照研究;李喆 等;《中国循证医学杂志》;20131231;第13卷(第8期);938-942 *

Also Published As

Publication number Publication date
CN115579056A (zh) 2023-01-06

Similar Documents

Publication Publication Date Title
Zarrei et al. A large data resource of genomic copy number variation across neurodevelopmental disorders
Lussier et al. DNA methylation as a predictor of fetal alcohol spectrum disorder
Siu et al. Functional DNA methylation signatures for autism spectrum disorder genomic risk loci: 16p11. 2 deletions and CHD8 variants
Craddock et al. Genetics of bipolar disorder: successful start to a long journey
Amos et al. High-density SNP analysis of 642 Caucasian families with rheumatoid arthritis identifies two new linkage regions on 11p12 and 2q33
Lin et al. Integrated post-GWAS analysis sheds new light on the disease mechanisms of schizophrenia
WO2011006119A2 (en) Gene expression profiles associated with chronic allograft nephropathy
US11884980B2 (en) Method for detection of traumatic brain injury
CN110648722B (zh) 新生儿遗传病患病风险评估的装置
CN111863125A (zh) 基于NGS-trio的单亲二倍体检测方法及应用
Ricci et al. Pooled genome-wide analysis to identify novel risk loci for pediatric allergic asthma
EP3294933A1 (en) Systems and methods to predict autism before onset of behavioral symptoms and/or to diagnose autism
CN115579056B (zh) 一组用于评估精神分裂症分子分型的基因群及其诊断产品和应用
Hamilton Linkage and association studies of anxiety disorders.
WO2022027212A1 (zh) 基于NGS-trio的单亲二倍体检测方法及应用
Shen et al. Comparative analysis of the autism‑related variants between different autistic children in a family pedigree
CN104073499A (zh) Tmc1基因突变体及其应用
CN113564246A (zh) 单细胞测序作为标志物在制备诊断原发性干燥综合征中的应用
CN111334513A (zh) 一种非综合征型唇裂相关的低频/罕见突变及其检测方法
JP7064215B2 (ja) 落屑症候群又は落屑緑内障の発症リスクの判定方法
CN109402114A (zh) 一种用于辅助鉴定身高的方法及其专用引物组
Ng et al. Screening of single nucleotide polymorphisms among fuchs’ endothelial corneal dystrophy subjects in Malaysia
Quinones-Valdez et al. Long-read RNA-seq demarcates cis-and trans-directed alternative RNA splicing
JP7072803B2 (ja) 広義原発開放隅角緑内障の発症リスクの判定方法
Goar Computational strategies to investigate the genetic cause of human eye disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant