CN116884488B - 一种男性不育标志物的筛查方法、系统及设备 - Google Patents

一种男性不育标志物的筛查方法、系统及设备 Download PDF

Info

Publication number
CN116884488B
CN116884488B CN202311149986.4A CN202311149986A CN116884488B CN 116884488 B CN116884488 B CN 116884488B CN 202311149986 A CN202311149986 A CN 202311149986A CN 116884488 B CN116884488 B CN 116884488B
Authority
CN
China
Prior art keywords
rbps
marker
analysis
expression
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311149986.4A
Other languages
English (en)
Other versions
CN116884488A (zh
Inventor
宋伟
邹定峰
苏路瑛
李凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Basic Medical Sciences of CAMS
Original Assignee
Institute of Basic Medical Sciences of CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Basic Medical Sciences of CAMS filed Critical Institute of Basic Medical Sciences of CAMS
Priority to CN202311149986.4A priority Critical patent/CN116884488B/zh
Publication of CN116884488A publication Critical patent/CN116884488A/zh
Application granted granted Critical
Publication of CN116884488B publication Critical patent/CN116884488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种男性不育标志物的筛查方法、系统及设备,涉及生殖分子生物学领域。所述方法包括:获取RBP样本集和不同组织转录组数据;将RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;对睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;将第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,即为目标男性不育标志物。本发明提供的方法综合利用了多种数据源,具有睾丸组织特异性,采用高度关联性分析和多层次筛选的方法,提高筛查的准确性和可靠性,为男性不育的诊断和治疗提供重要的参考依据。

Description

一种男性不育标志物的筛查方法、系统及设备
技术领域
本发明属于生殖分子生物学领域,更具体地,涉及一种男性不育标志物的筛查方法、系统及设备。
背景技术
遗传缺陷是男性产生不育的根本病理原因之一。遗传缺陷包括基因突变、基因缺失、染色体异常等引起的遗传性疾病或异常。这些遗传缺陷直接或间接地影响精子发生的各个阶段,进而导致精子发生异常或无法正常进行。
精子发生是雄性生殖发育中受众多基因精密调控的细胞增殖与分化过程,在该过程中,RNA代谢异常活跃,需要复杂的转录后基因调控(Post-Transcriptional GeneRegulation, PTGR)机制的协同作用以确保种系中基因组的稳定性来延续生命的繁殖。RNA结合蛋白质(RNA Binding Protein, RBP)作为PTGR机制的重要组成部分,通过协调RNA活动的各个方面来调控细胞正常代谢,例如RNA的运输、定位、稳定性、编辑、剪接、翻译和降解。研究报道睾丸组织是RBP表达最特异的器官,RBPs的功能障碍通常会导致严重的精子发生缺陷和男性生育力低下,甚至造成不育症的发生。然而,在庞大而复杂的精子发生调控网络中,仍有大量RBPs在精子发生中的作用尚未明确,有待进一步探索。
发明内容
本发明公开一种男性不育标志物的筛查方法,所述方法深入研究了精子发生过程中功能性RBP对于解析精子发生过程中基因的调控机制以及临床不育症的发病机理,系统性搜集RBP文库结合组织共表达网络分析,获取了514个在睾丸组织中共表达最显著的RBP,其中包括62个在睾丸组织高度富集或特异性表达的RBPs,所述62个RBPs为临床不育症的诊断和治疗提供新的分子指标,具有重要的临床应用价值。
一种男性不育标志物的筛查方法,所述方法包括:
获取RBP样本集和不同组织转录组数据;
将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
进一步,所述方法还包括:
将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;
将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物。
进一步,所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块。
进一步,所述方法还包括:
将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
进一步,所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx。
进一步,所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判。
进一步,所述目标男性不育标志物包括以下任意一种或几种:DDX20、DDX25、ZCCHC13、PAGE1、PABPC3、RBM44、SWT1、BOLL、ODF2、SLC25G6。
进一步,所述方法还包括对所述目标男性不育标志物进行模式动物基因敲除验证,所述模式动物基因敲除验证包括:
步骤1:制备用于单细胞测序的敲除所述目标男性不育标志物的载体;
步骤2:制备稳定表达Cas9蛋白的精原干细胞;
步骤3:将所述载体包装病毒感染到所述精原干细胞中,流式筛选到感染后未致死的精原干细胞;
步骤4:将所述未致死的精原干细胞移植到生殖细胞缺陷的模式动物睾丸中进行体内精子发生;
步骤5:对精子发生的生精细胞进行单细胞测序负向筛选出对精子发生至关重要的基因。
一种男性不育标志物的筛查系统,所述系统包括:
获取单元,用于获取RBP样本集和不同组织转录组数据;
共表达网络分析单元,用于将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
睾丸组织共表达模块分析单元,用于在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
数据整合单元,用于将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
一种男性不育标志物的筛查设备,所述设备包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行上述的男性不育标志物的筛查方法。
本发明的优点:
1.本发明所公开的方法利用了不同组织转录组数据和RBP样本集进行共表达网络分析,进一步结合了差异表达分析和基因功能分析,利用多种数据进行数据挖掘,提高了筛查的准确性和可靠性。
2. 本发明所公开的方法选择了睾丸组织中高度富集的共表达模块作为第一候选标志物,这样可以更加准确地筛选出与男性不育相关的标志物,增加了筛查的特异性。
3. 本发明所公开的方法通过联合分析第一候选标志物和无精症患者的转录组数据中差异表达基因,得到第二候选标志物,这样可以进一步筛选出与无精症相关的标志物,提高了筛查的相关性。
4. 本发明所公开的方法将第一候选标志物进行疾病相关性分析,得到第三候选标志物,再通过联合分析第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因,得到第四候选标志物,这样的多层次筛选可以进一步提高筛查的准确性和可靠性。
5. 本发明所公开的方法对目标标志物进行模式动物基因敲除验证,通过制备单细胞测序的敲除目标标志物的载体,包装病毒感染到精原干细胞中,并在生殖细胞缺陷的模式动物体内进行体内精子发生,从而验证目标标志物的有效性,这种验证方法突破了除精原干细胞外的生精细胞不能在体外培养的限制,可以更直接地在体内验证标志物的功能和作用,提高了筛查结果的可信度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是一种本发明实施例提供的一种男性不育标志物的筛查方法流程示意图;
图2是一种本发明实施例提供的一种男性不育标志物的筛查系统示意图;
图3是一种本发明实施例提供的一种男性不育标志物的筛查设备示意图;
图4是一种本发明实施例提供的共表达网络分析RBP的可视化热图,每一个小方块代表了模块与不同组织之间的相关性,方块中值表示相关性和p值,正分数表示正相关;
图5是一种本发明实施例提供的睾丸组织共表达RBPs特征及功能分析中514个RBP在睾丸中不同细胞中表达谱;
图6是一种本发明实施例提供的睾丸组织共表达RBPs特征及功能分析中生精细胞中高表达RBP的功能分析示意图;
图7是一种本发明实施例提供的睾丸组织共表达RBPs特征及功能分析中514个RBP相互作用网络图;
图8是一种本发明实施例提供的睾丸组织共表达RBP在睾丸组织特异性表达及功能分析示意图,将RBP划分为候选RBP、已报道在精子发生无功能的RBP、已报道在精子发生中具有功能的RBP和其他不显著富集的RBP;
图9是一种本发明实施例提供的62个在睾丸组织中高表达RBP的功能分析示意图;
图10是一种本发明实施例提供的候选RBP疾病分析结果示意图;
图11是一种本发明实施例提供的候选RBP疾病分析中,25个RBP在无精症患者转录组中的表达分析;
图12是一种本发明实施例提供的候选RBP疾病分析中,患有梗阻性无精子症(OA)患者与患有非梗阻性无精子症(NOA)患者睾丸单细胞分群;
图13是一种本发明实施例提供的候选RBP疾病分析中,候选RBPs在OA与NOA患者生精细胞中的表达变化;
图14是一种本发明实施例提供的模式动物基因敲除验证步骤流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S101、S102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种男性不育标志物的筛查方法,包括:
S101:获取RBP样本集和不同组织转录组数据;
在一个实施例中,所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx。HPA(Human Protein Atlas)是一个综合性的人类蛋白质组学数据库,旨在提供全面的人类蛋白质表达信息。该数据库通过对人类不同组织和细胞类型中蛋白质的免疫组化染色和高通量转录组学分析,提供了蛋白质在不同组织和细胞中的表达情况、亚细胞定位、组织特异性等信息。HPA还提供了基因和蛋白质的注释信息、蛋白质拓扑结构和功能的预测等。TiGER(Tissue-specific Gene Expression andRegulation)是一个组织特异性基因表达和调控数据库,旨在研究和理解基因在不同组织和细胞类型中的表达调控。该数据库整合了大量的转录组学数据,包括RNA-seq和微阵列等,提供了基因在不同组织和细胞类型中的表达水平和调控因子的信息。TiGER还提供了基因表达的调控网络和通路分析工具,帮助研究人员深入分析基因的组织特异性表达和调控机制。GTEx(Genotype-Tissue Expression)是一个大规模的人类基因表达数据库,旨在研究基因在人体不同组织和器官中的表达模式和调控机制。该数据库整合了来自上千个个体的RNA-seq数据,包括正常组织和器官的基因表达谱,提供了基因在不同组织中的表达水平、组织特异性、基因变异对表达的影响等信息。GTEx还提供了遗传变异与基因表达的关联分析工具,帮助研究人员理解基因的表达调控和基因与疾病之间的关系。
在一个具体实施例中,早期RNA结合蛋白质的捕获主要来源于对多聚腺苷酸化RNA结合蛋白组的分析以及对常规RNA结合域(RBP)的分析,最近的研究报道了一些非常规的RBP,它们缺乏可识别的RBP,但通常包含直接参与RNA结合的内在无序区域或单核苷酸和双核苷酸结合域。为了全面系统的概括精子发生过程中的功能性RBP,发明人团队进一步更新了总RBP列表,将poly(A)结合蛋白以及包含非常规RBP的RNA结合蛋白的研究结果进行合并汇总,如OOPS、SONAR、XRNAX等,最终将来自不同类型的人类细胞的候选RBP的综合数量增加到4692个,这远超过目前单一研究报道的RBP列表。这可能是由于不同研究采用紫外交联和质谱的分析方法,往往会遗漏实验和分析中低丰度的蛋白质或该研究方法不能很好的将RNA与蛋白质进行交联,因此,随着新的检测技术发展,未来RBP的数量可能会持续增加。同时,RBP的广泛性和功能的重要性也将随着进一步深入的研究逐渐被解析出来。
S102:将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
在一个实施例中,所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块。
在一个具体实施例中,蛋白质在调控细胞的生物学过程中,通常采取“联合作战”的模式,因此,绝大多数蛋白质以协同表达的模式共同参与细胞的功能调控。为了探索汇集的RBP是否在精子发生过程中参与重要的转录后调控,发明人团队将汇集的RBP与HPA数据库中不同组织的转录本进行共表达网络分析(WGCNA),最终获得19个组织共表达模块,其中包括10个组织特异性表达模块和9个非组织特异性表达模块,见图4。在组织特异性表达模块中,组织特异性得分最高的模块是在睾丸组织中高度富集,其中包含了514个睾丸组织中共表达RBPs。
S103:在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
在一个实施例中,发明人团队针对在睾丸组织富集的模块中的RBP进行了表达特征及功能分析。首先,分析了514个RBP在睾丸不同生精细胞及体细胞的表达特征,发现超过96%的RBP在生殖细胞中表达并显示出谱系特异性表达,见图5。进一步,预测了这些RBPs的功能,发现精原细胞中高表达的RBPs大多具有解旋酶活性,精母细胞中核质转运活性明显,精子细胞中微管相关蛋白和蛋白酶体活性更高,见图6。这些结果表明,这些RBP的功能与精子发生阶段的特征相匹配。蛋白质-蛋白质相互作用(PPI)网络分析表明,这些RBP的主要成员构成了一个广泛的转录后协同调控网络参与精子发生的调控过程,在功能上具有紧密相关性,见图7。
在一个实施例中,为了进一步探索在精子发生过程中具有潜在生精功能的RBP,发明人团队将睾丸组织富集的模块中的RBP与HPA数据库中人睾丸组织高度富集以及特异性表达的基因进行分析,最终获得了62个在睾丸组织中高度富集或特异性表达的RBP,其中大部分是在睾丸组织中具有重要功能的RBP,如DDX4、DAZL、BOLL、YBX2、TDRD1、LIN28A、NANOS2、DDX5、DDX25、RPL10L等,见图8。功能分析发现这些基因广泛涉及男性不育等相关术语,见图9。通过文献检索以及对在线功能性生精数据库Spermatogenesis Online 1.0查询,发现上述62个候选RBP中,有37个基因在睾丸组织的功能已有明确报道,其中包括7个无生育表型的RBP以及30个对精子发生至关重要的RBP,这也表明目前发明人的筛选方案具有很高的准确性。
S104:将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
在一个实施例中,所述方法还包括:
将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;
将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物。
在一个实施例中,所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判。DisGeNET是一个广泛整合了多个公共数据库中的疾病关联基因信息的知识库。它提供了基于多种数据源的疾病-基因关联数据,并为每个关联提供了一个相关性分值。这些数据源包括疾病基因组学、文献挖掘和遗传关联研究等。在DisGeNET中,疾病-基因关联的得分是根据多种因素计算得出的。其中包括关联研究的质量评估、关联研究的样本大小、重复性等。这些因素被用来评估每个疾病-基因关联的可靠性和重要性。得分越高表示关联越强,表明该基因与疾病之间的关联更为可信。通过使用DisGeNET的多组数据得分,可以评估一个基因与多个疾病之间的关联程度,有助于确定一个基因在不同疾病中的重要性和相关性。SpermGenes是一个专门用于研究与精子发生和生殖功能相关的基因的数据库。SpermGenes 2.0是该数据库的最新版本,提供了更全面和更新的精子相关基因信息。SpermGenes 2.0中的得分是根据多个因素计算得出的。这些因素包括基因在不同精子发生阶段的表达水平、基因在精子中的丰度和特异性、基因在不同物种中的保守性等。通过综合考虑这些因素,为每个基因分配一个得分,用于评估其与精子发生和生殖功能的相关性。SpermGenes 2.0的得分可以帮助研究人员确定在精子发生和生殖功能中具有重要作用的基因,并提供了有关这些基因的详细信息,有助于进一步的研究和理解生殖系统的功能和疾病。
在一个具体实施例中,与转录因子相比,RBP在进化上更为保守,并且在组织中分布更广泛,并常常作为管家基因发挥功能,而管家RBP表达的突变或改变往往又会导致组织特异性缺陷。因此,RBP的致病性可能在不同组织有不同的表现。接下来,发明人团队针对剩余未被研究的25个RBP进行疾病相关性分析。为此,使用了DisGeNET数据库进行候选RBP的人类疾病查询,DisGeNET数据库整合了公共数据库、GWAS目录、动物模型和科学文献的数据,收集了大量与人类疾病相关的变异和基因,因此该数据库具有很好的代表性及全面性。同时,通过精子发生2.0在线预测功能性基因的网站数据联合分析,发明人团队发现25个候选RBP中有13个RBP在不同组织器官中导致疾病发生,有5个RBP存在疾病相关的突变,分别为NSUN4、CLPB、FAM186A、DDX20和TDRD10。其中大多数疾病涉及到神经系统以及肿瘤相关的疾病,一部分基因涉及生殖系统疾病,见图10。考虑神经系统和睾丸两个组织存在诸多的相似性,因此,这些在睾丸中共表达且高度富集的基因在神经系统也会导致疾病的产生,同样,这些基因在睾丸组织中也可能导致生殖系统的疾病产生。进一步,通过分析无精症患者的转录组测序数据,发现DDX20、ODF2、PABPC3和LUZP4的表达水平在无精子症患者的睾丸中显著降低,见图11。对人类睾丸(GSE14951222)的单细胞转录组学分析显示,在严重的非梗阻性无精子症患者中相应细胞类型中的候选RBPs表达下调,见图12、13,表明这些RBPs可能在相应的生殖细胞中具有潜在功能。
在一个实施例中,所述方法还包括:将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
在一个实施例中,所述目标男性不育标志物包括以下任意一种或几种:DDX20、DDX25、ZCCHC13、PAGE1、PABPC3、RBM44、SWT1、BOLL、ODF2、SLC25G6。
在一个具体实施例中,为了进一步探索上述候选的RBP在男性不育中的致病性,发明人团队对来自中国地区无精症患者的全外显子的测序数据进行分析,发现候选基因中PABPC3、DDX20、CLPB、ODF2等在无精症患者的全外显子测序中存在大量的突变,其中DDX20包括剪接缺失以及众多的点突变,尤其是在重要结构域上的Arg 348 His点突变,通过在线的预测突变危害的PolyPhen2数据库进行分析,发现其中预测具有危害突变的HumVar数值得分以及预测可能参与复杂疾病的稀有等位基因的HumDiv数值得分都达到了满分。
在一个实施例中,所述方法还包括对所述目标男性不育标志物进行模式动物基因敲除验证,所述模式动物基因敲除验证步骤如图14所示,具体包括:
步骤1:制备用于单细胞测序的敲除所述目标男性不育标志物的载体;
在一个实施例中,为了实现单细胞层面的CRISPR/Cas9敲除筛选,发明人团队改造了表达sgRNA的质粒,通过将sgRNA表达元件插入到慢病毒3’长末端重复序列(LongTerminal Repeat, LTR)中,使得sgRNA成为由RNA聚合酶II转录的TurboGFP mRNA的一部分,并且通过使用聚腺苷酸富集的RNA-seq方案检测,而功能性gRNA继续从U6启动子表达,进而发挥sgRNA引导的Cas9敲除。选择前期已完成验证过的一个靶点sgRNA构建到CROP-TurboGFP-guide载体中,包装成慢病毒,并感染稳定表达Cas9蛋白的Hela细胞。随后提取感染细胞的基因组,通过对靶标附近基因进行PCR扩增出基因组片段并测序,测序结果发现,改造的载体能够产生有效的基因组切割效果。同时,提取感染细胞的RNA,使用oligo dT引物进行逆转录成cDNA,再使用针对载体中表达sgRNA元件片段的引物对cDNA进行PCR扩增,通过回收PCR产物进行测序,发现由oligo dT富集的RNA能够很好的检测到sgRNA的表达。上述结果表明,改造后的载体能够正常引导Cas9蛋白质对基因组进行切割,同时载体表达的sgRNA能够被oligo dT的引物富集,可以在单细胞测序中被检测到。
步骤2:制备稳定表达Cas9蛋白的精原干细胞;在一个实施例中,生殖细胞由于存在天然的免疫屏障导致精原干细胞较常规细胞系更加难以感染,于是发明人团队选择使用内源表达Cas9蛋白质,以此减少病毒大小,提高感染效率。为了获得内源表达Cas9的精原干细胞,发明人团队使用表达Cas9蛋白质的小鼠,使用Ddx4-Cre工具鼠与Cas9小鼠杂交,获得在生殖细胞中表达Cas9蛋白质的小鼠。随后,取出生后6天左右且已表达Cas9蛋白质小鼠的睾丸分离生精细胞并建系。在表达Cas9蛋白质的精原干细胞稳定成系后,通过免疫荧光显微镜检测SSC中标签蛋白tdTomato的表达,发现培养中的SSC自带红色荧光。进一步,通过提取培养的Cas9-精原干细胞及小鼠睾丸组织的蛋白质进行western blot分析精原干细胞中Cas9的蛋白质表达,我们发现培养的Cas9-精原干细胞表达Cas9蛋白良好。同时,发明人团队通过免疫荧光检测了建系的精原干细胞干性标志物的表达,未分化型精原干细胞标志物Lin28a和PLZF表达较高,表明Cas9-精原干细胞建系成功。
步骤3:将所述载体包装病毒感染到所述精原干细胞中,流式筛选到感染后未致死的精原干细胞;
流式筛选是一种细胞分选技术,基于细胞表面的特定标记物,通过标记物与特定抗体的结合,使细胞在流式细胞仪中以不同的信号强度进行分离和检测。步骤4:将所述未致死的精原干细胞移植到生殖细胞缺陷的模式动物睾丸中进行体内精子发生;
在一个实施例中,为了在体内筛选精子发生中的功能性RBP,发明人团队设计将感染的精原干细胞移植回输至精原细胞缺失的小鼠睾丸内。发明人团队通过对6周c57小鼠腹腔注射白消安耗竭生殖细胞。为了保持睾丸的最近状态,测试了20mg/kg、25mg/kg、30mg/kg以及35mg/kg的不同白消安浓度,并分别检测了注射后3周、4周及8周睾丸组织的生精变化,最终选择了30mg/kg的浓度,H&E染色显示曲细精管较完整,生精细胞基本缺失,符合精原干细胞的移植需求。
用白消安处理小鼠后,会让小鼠精原干细胞死亡,一个月后,小鼠睾丸中就没有生精细胞了,便可以通过移植回输精原干细胞,再体内模拟精子发生的过程,精原干细胞分化成精母细胞,减数分裂,随后分化为圆形精子,精子变形形成成熟精子。
步骤5:对精子发生的生精细胞进行单细胞测序负向筛选出对精子发生至关重要的基因。
在一个实施例中,通过构建单细胞筛选的体系,可以检测回输的细胞里感染了哪些病毒(载体),通过测序负向筛选进一步得知哪些基因被敲除了。由于生殖细胞在体内精子发生是一个连续的过程,某个基因可能在精原干细胞中没有功能,但在减数分裂的精母细胞中有功能,这样回输体内,就有可能检测到精母细胞有功能,通过回输体内,可以检测到精母细胞停滞发育,进一步检测这个细胞某一个或几个基因被敲除了,因此得知被敲除基因或几个基因联合发挥作用的细胞时期。
通过上述构建单细胞筛选体系,回输体内观测基因敲除后细胞发育过程与是否死亡,进一步通过单细胞测序检测导致细胞停止发育与死亡的某一种或几种基因的方法,解决体外培养仅能培养精原干细胞的不足,所述方法在生殖细胞发育研究领域具有重要的应用价值。
图2是本发明实施例提供的一种男性不育标志物的筛查系统,包括:
S201:获取单元,用于获取RBP样本集和不同组织转录组数据;
S202:共表达网络分析单元,用于将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
S203:睾丸组织共表达模块分析单元,用于在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
S204:数据整合单元,用于将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
图3是本发明实施例提供的一种男性不育标志物的筛查设备示意图,其包括:存储器和/或处理器;该设备还可以包括:输入装置和输出装置。
存储器、处理器、输入装置和输出装置可以通过总线或者其他方式连接。图3所示的是以总线连接方式为例;其中,存储器用于存储程序指令;处理器用于调用程序指令,当程序指令被执行时,用于实现上述男性不育标志物的筛查方法。在一个实施例中,存储器可以理解为程序的任何保存设备,处理器可以理解为程序的使用设备。

Claims (5)

1.一种男性不育标志物的筛查方法,其特征在于,所述方法包括:
获取RBP样本集和不同组织转录组数据;RBP为RNA结合蛋白,RBP通过识别特殊的RNA结构域与RNA互作,参与到RNA剪切、转运、序列编辑、胞内定位及翻译过程;所述RBP样本集中的RBP来源于以下任意一种或几种分析方法:多聚腺苷酸化RNA结合蛋白组分析、常规RNA结合域分析、polyA结合蛋白分析和非常规RBP的RNA结合蛋白研究结果;所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx;
将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块;
在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物;
将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判;将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物;
将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物也为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
2.根据权利要求1所述的男性不育标志物的筛查方法,其特征在于,所述目标男性不育标志物包括以下任意一种或几种:DDX20、DDX25、ZCCHC13、PAGE1、PABPC3、RBM44、SWT1、BOLL、ODF2、SLC25G6。
3.根据权利要求1所述的男性不育标志物的筛查方法,其特征在于,所述方法还包括对所述目标男性不育标志物进行模式动物基因敲除验证,所述模式动物基因敲除验证包括:
步骤1:制备可进行单细胞测序的敲除所述目标男性不育标志物的载体;
步骤2:制备稳定表达Cas9蛋白的精原干细胞;
步骤3:将所述载体包装病毒感染到所述精原干细胞中,流式筛选到感染后未致死的精原干细胞;
步骤4:将所述未致死的精原干细胞移植到生殖细胞缺陷的模式动物睾丸中进行体内精子发生;
步骤5:对精子发生的生精细胞进行单细胞测序负向筛选出对精子发生至关重要的基因。
4.一种男性不育标志物的筛查系统,其特征在于,所述系统包括:
获取单元,用于获取RBP样本集和不同组织转录组数据;RBP为RNA结合蛋白,RBP通过识别特殊的RNA结构域与RNA互作,参与到RNA剪切、转运、序列编辑、胞内定位及翻译过程;所述RBP样本集中的RBP来源于以下任意一种或几种分析方法:多聚腺苷酸化RNA结合蛋白组分析、常规RNA结合域分析、polyA结合蛋白分析和非常规RBP的RNA结合蛋白研究结果;所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx;
共表达网络分析单元,用于将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块;
睾丸组织共表达模块分析单元,用于在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
数据整合单元,用于将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物;将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判;将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物;将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物也为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
5.一种男性不育标志物的筛查设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行权利要求1-3任意一项所述的男性不育标志物的筛查方法。
CN202311149986.4A 2023-09-07 2023-09-07 一种男性不育标志物的筛查方法、系统及设备 Active CN116884488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311149986.4A CN116884488B (zh) 2023-09-07 2023-09-07 一种男性不育标志物的筛查方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311149986.4A CN116884488B (zh) 2023-09-07 2023-09-07 一种男性不育标志物的筛查方法、系统及设备

Publications (2)

Publication Number Publication Date
CN116884488A CN116884488A (zh) 2023-10-13
CN116884488B true CN116884488B (zh) 2023-11-24

Family

ID=88255476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311149986.4A Active CN116884488B (zh) 2023-09-07 2023-09-07 一种男性不育标志物的筛查方法、系统及设备

Country Status (1)

Country Link
CN (1) CN116884488B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105473714A (zh) * 2013-05-31 2016-04-06 重组股份有限公司 遗传不育动物
EP3006560A1 (en) * 2014-10-09 2016-04-13 European Molecular Biology Laboratory Miwi2 as a marker for spermatogonial stem cells and method for diagnosing spermatogonial stem cells based on said marker
CN107916289A (zh) * 2017-05-31 2018-04-17 南京优智源医药科技有限公司 精子piRNA和精子蛋白MitoPLD作为检测和预测男性不育的生物标志物
CN113215234A (zh) * 2021-06-10 2021-08-06 中国科学院生物物理研究所 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110158966A1 (en) * 2002-07-23 2011-06-30 Judith Seligman Stem cells characterized by expression of germline specific genes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105473714A (zh) * 2013-05-31 2016-04-06 重组股份有限公司 遗传不育动物
EP3006560A1 (en) * 2014-10-09 2016-04-13 European Molecular Biology Laboratory Miwi2 as a marker for spermatogonial stem cells and method for diagnosing spermatogonial stem cells based on said marker
CN107916289A (zh) * 2017-05-31 2018-04-17 南京优智源医药科技有限公司 精子piRNA和精子蛋白MitoPLD作为检测和预测男性不育的生物标志物
CN113215234A (zh) * 2021-06-10 2021-08-06 中国科学院生物物理研究所 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
牦牛、犏牛TB-RBP基因克隆及在睾丸组织中的表达;柴志欣;王会;王吉坤;王嘉博;钟金城;;华北农学报(第01期);全文 *

Also Published As

Publication number Publication date
CN116884488A (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
Lachance et al. Evolutionary history and adaptation from high-coverage whole-genome sequences of diverse African hunter-gatherers
Kruger et al. A neofunctionalized X-linked ampliconic gene family is essential for male fertility and equal sex ratio in mice
Lemmon et al. The role of cis regulatory evolution in maize domestication
Georges Mapping, fine mapping, and molecular dissection of quantitative trait loci in domestic animals
Veeramah et al. The impact of whole-genome sequencing on the reconstruction of human population history
Network What do we need to know about speciation?
Kent et al. Conservation genomics of the declining North American bumblebee Bombus terricola reveals inbreeding and selection on immune genes
Dean et al. Proteomics and comparative genomic investigations reveal heterogeneity in evolutionary rate of male reproductive proteins in mice (Mus domesticus)
Morgan et al. Sequence and structural diversity of mouse Y chromosomes
Du et al. Deep sequencing analysis of microRNAs in bovine sperm
Choi et al. Divergent selection and primary gene flow shape incipient speciation of a riparian tree on Hawaii Island
Gioti et al. Neurospora and the dead-end hypothesis: genomic consequences of selfing in the model genus
US20220277807A1 (en) Methods and systems for assessing genetic variants
Liu et al. A comprehensive catalogue of regulatory variants in the cattle transcriptome
Argaw-Denboba et al. Paternal microbiome perturbations impact offspring fitness
David et al. Genotyping by sequencing transcriptomes in an evolutionary pre-breeding durum wheat population
Kozlowski et al. Transposable Elements are an evolutionary force shaping genomic plasticity in the parthenogenetic root-knot nematode Meloidogyne incognita
Tzur lncRNAs in fertility: redefining the gene expression paradigm?
Zunino et al. Genomic evidence of genuine wild versus admixed olive populations evolving in the same natural environments in western Mediterranean Basin
CN116884488B (zh) 一种男性不育标志物的筛查方法、系统及设备
Battlay et al. Large haploblocks underlie rapid adaptation in an invasive weed
Barragan et al. Homozygosity at its limit: inbreeding depression in wild Arabidopsis arenosa populations
Cauret et al. Functional dissection and assembly of a small, newly evolved, W chromosome-specific genomic region of the African clawed frog Xenopus laevis
Fischer et al. Genome sequences of Tropheus moorii and Petrochromis trewavasae, two eco-morphologically divergent cichlid fishes endemic to Lake Tanganyika
Li et al. Unravelling the genomic basis and evolution of the pea aphid male wing dimorphism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant