CN107563152A - 基于生物云平台的甲基化数据分析应用系统 - Google Patents

基于生物云平台的甲基化数据分析应用系统 Download PDF

Info

Publication number
CN107563152A
CN107563152A CN201710657059.1A CN201710657059A CN107563152A CN 107563152 A CN107563152 A CN 107563152A CN 201710657059 A CN201710657059 A CN 201710657059A CN 107563152 A CN107563152 A CN 107563152A
Authority
CN
China
Prior art keywords
methylation
analysis
methylates
result
differential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710657059.1A
Other languages
English (en)
Inventor
资意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Original Assignee
BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BIOMARKER TECHNOLOGIES Co Ltd filed Critical BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Priority to CN201710657059.1A priority Critical patent/CN107563152A/zh
Publication of CN107563152A publication Critical patent/CN107563152A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种基于生物云平台的甲基化数据分析应用系统,能够提高甲基化测序数据的分析效率。该系统包括:用户界面模块,用于获取并发送第一用户请求给基本分析模块;基本分析模块,用于对第一用户请求进行解析,从云端数据库获取待分析的甲基化测序数据和参考基因组,对甲基化测序数据进行初步分析,并将初步分析的结果发送给用户界面模块;用户界面模块,还用于对初步分析的结果进行展示,获取并发送第二用户请求给个性化分析模块;个性化分析模块,用于对第二用户请求进行解析,对待进行进一步分析的内容进行进一步分析,将进一步分析的结果发送给用户界面模块进行呈现。

Description

基于生物云平台的甲基化数据分析应用系统
技术领域
本发明涉及信息隐藏和数字图像处理领域,具体涉及一种基于生物云平台的甲基化数据分析应用系统。
背景技术
随着高通量测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,生物大数据时代已经到来。DNA甲基化是表观遗传学的重要组成部分,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。随着对甲基化研究的不断深入,各种各样甲基化检测方法被开发出来以满足不同类型研究的要求。基于重亚硫酸盐处理DNA片段后再进行高通量测序,已经成为DNA甲基化研究的重要方法。但是由于高通量测序产生出来的数据量十分巨大,需要使用生物信息学方法进行研究,并进一步分析得到有生物学意义的结果。
使用传统的生物信息方法分析甲基化数据时,不仅仅要求配备高性能的超级计算集群和超大的硬盘空间,还需要求具备生物学知识、计算机知识和数学知识的复合型生物信息分析人员,整个分析过程涉及多个流程,效率不高。除此之外,目前已有的生物信息分析软件及数据库数量众多,难以高效整合这些数据和分析资源,也是现在制约科研工作的一个重要原因。
发明内容
有鉴于此,本发明提供一种基于生物云平台的甲基化数据分析应用系统,能够解决现有技术对甲基化测序数据处理过程中知识面需求过广,分析方法难以整合的技术问题,提高甲基化测序数据的分析效率。
本发明实施例提出一种基于生物云平台的甲基化数据分析应用系统,包括:
用户界面模块、基本分析模块和个性化分析模块;其中,
所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;
所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;
所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;
所述个性化分析模块,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。
本发明实施例提供的基于生物云平台的甲基化数据分析应用系统,用户可以采用专业的生物信息分析方法对指定的甲基化测序数据进行分析,最终以图表呈现。整合多种分析方法,将数据分析做到具有个性化的特点,使得数据分析方式不再局限于传统生物信息分析的局限性,使普通用户也可实现对甲基化测序数据进行分析,并极大地丰富了对甲基化测序数据的解读性,提高对测序数据的处理效率,而且,用户指定的甲基化测序数据可以从云端数据库获取,从而能够节省本地磁盘空间。
附图说明
图1为本发明基于生物云平台的甲基化数据分析应用系统一实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参看图1,本实施例公开一种基于生物云平台的甲基化数据分析应用系统,包括:
用户界面模块1(可以为WEB图形化用户界面模块)、基本分析模块2和个性化分析模块3;其中,
所述用户界面模块1,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块2,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;
所述基本分析模块2,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块1,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;
所述用户界面模块1,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块3,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;
所述个性化分析模块3,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块1进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。
云端数据库中不仅存储有甲基化测序数据,还可以存储基本分析模块的初步分析结果以及个性化分析模块的进一步分析结果。云端数据库中的数据来自于SRA、GEO、NCBI、Ensembl、UCSC中任意一种数据库。云端数据库中的数据还可以是除上述数据库以外其他数据库。
本发明实施例提供的基于生物云平台的甲基化数据分析应用系统,用户可以采用专业的生物信息分析方法对指定的甲基化测序数据进行分析,最终以图表呈现。整合多种分析方法,将数据分析做到具有个性化的特点,使得数据分析方式不再局限于传统生物信息分析的局限性,使普通用户也可实现对甲基化测序数据进行分析,并极大地丰富了对甲基化测序数据的解读性,提高对测序数据的处理效率,而且,用户指定的甲基化测序数据可以从云端数据库获取,从而能够节省本地磁盘空间。
在前述装置实施例的基础上,所述甲基化测序数据质量控制的过程为:识别所述待分析的甲基化测序数据的质量值的编码方式,并将不符合编码方式要求的数据的质量值转换为统一编码标准,基于转换后的质量值统计数据的碱基质量分布和碱基类型分布,并绘制分布图。
在前述装置实施例的基础上,所述与参考基因组比对,主要使用Bismark软件工具包实现。由于样品经过重亚硫酸盐处理,基因组上所有的未甲基化的胞嘧啶都转化成了尿嘧啶;经过聚合酶链式反应尿嘧啶转化为了胸腺嘧啶;而原本甲基化的胞嘧啶没有改变;比对时将参考基因组和测序序列分别进行胞嘧啶全部转化为胸腺嘧啶、鸟嘌呤转化为腺嘌呤的处理,并分别将处理后的两种序列和两种基因组分别进行比对,选取四次比对中最优的比对作为比对结果,基于比对结果统计比对效率、基因组覆盖情况、插入片段分布。
在前述装置实施例的基础上,所述甲基化位点判定的过程为:
基于所述甲基化测序数据与所述参考基因组比对的结果,将最优比对序列和原始的测序序列进行比较,确定该测序序列的甲基化信息,由于实验阶段重亚硫酸盐的转换效率不能完全达到100%,并且不同发育时期的甲基化状态也有所差异,为了确定该位点是否发生了甲基化,我们使用二项分布检验,计算出胞嘧啶位点发生了甲基化的P值,并对P值进行校正,并基于初步判断结果计算出错误发现率,选取错误发现率小于第一数值(比如0.05)的位点判断为甲基化位点。
在前述装置实施例的基础上,所述绘制物种甲基化图谱的过程为:
对甲基化位点进行类型区分,并对不同类型的甲基化位点的甲基化水平进行分析,同时分析不同类型甲基化位点周围第二数值(比如9bp)个碱基长度的序列分布情况,其中,甲基化位点的类型包括CG类型、CHG类型和CHH类型;和
从染色体水平描述甲基化分布情况,以第三数值(比如100000bp)个碱基为窗口计算所述甲基化测序数据的甲基化水平,以所述第三数值个碱基为窗口统计甲基化密度分布情况,并绘制染色体水平甲基化分布图;和
将所述甲基化测序数据分为基因上游区域、第一个内含子、内在内含子、第一个外显子、内在外显子、最后一个外显子、基因下游区域,共七个功能元件区域,分别计算这些区域内的甲基化水平,绘制甲基化水平功能元件分布图。
在前述装置实施例的基础上,所述差异甲基化区域识别的过程为:
使用划动窗口的方法,以第四数值(比如100bp)个碱基大小为一个区域,选取区域内差异甲基化水平大于第五数值(比如0.2),且至少包含第六数值(比如4)个甲基化位点的区域,将其作为潜在的差异甲基化区域;
使用费舍尔精确检验,对所述潜在的差异甲基化区域的甲基化信息进行显著性差异检验,得到所述潜在的差异甲基化区域的P值,对所有区域的P值进行校正,计算出错误发现率,选取错误发现率小于第七数值(比如0.01)的区域,并将距离小于第八数值(比如200bp)的区域进行合并,最终得到差异甲基化区域。
所述对差异甲基化区域相关联的基因进行数据库注释,包括基因功能分类、蛋白功能分类、代谢通路。
在前述装置实施例的基础上,所述甲基化水平分析的过程为:
对于所述甲基化测序数据,以染色体为目标区域或者以基因为目标区域,利用甲基化水平计算方法,计算得到目标区域的甲基化水平,基于所述甲基化水平得到甲基化水平列表、甲基化水平统计图、甲基化水平分布图。
所述甲基化水平计算方法,包括Fraction计算方法、Mean计算方法、Weight计算方法,Fraction计算方法是计算出区域内所述胞嘧啶判定为甲基化位点的数目,除以区域内胞嘧啶的总数,得到区域甲基化水平,Mean计算方法是计算出每个胞嘧啶位点所述与参考基因组比对结果中支持该位点甲基化的测序序列数目,除以所述与参考基因组比对结果中该位点覆盖到的测序数目,算出单个位点的甲基化水平,区域甲基化水平为该区域内单个位点甲基化水平的平均值,Weight计算方法是计算出区域内所述与参考基因组比对结果中所有胞嘧啶位点的支持该位点甲基化的测序序列数目,除以所述与参考基因组比对结果中所有胞嘧啶位点覆盖到的测序序列数目。
所述的差异甲基化水平分析包括基因间的甲基化水平分析,输入需要比较的基因,在所述的甲基化水平计算方法中选择计算方法计算需要比较的基因的甲基化水平,对所述甲基化水平进行比较,基于比较的结果绘制基因间甲基化水平箱线图。
所述差异甲基化水平分析还包括所述的差异甲基化区域内识别结果内的基因分析,具体可以选择基因区域和染色体区域,选择所述的甲基化类型进行分析,得到注释结果列表、基因功能分类、蛋白功能、代谢通路、富集结果。
所述绘制甲基化水平Circos图具体为,选择所述的甲基化类型、染色体和样品,即可绘制出对应染色体和甲基化类型的甲基化水平Circos图。
所述与转录组结果进行联合分析,通过导入转录组项目,可进行基因甲基化水平和表达量相关性分析,差异表达量基因甲基化水平分析:
所述基因甲基化水平和表达量相关性分析,选择染色体或基因,选择所述的甲基化水平计算方法,使用皮尔森相关性系数进行甲基化水平和表达量相关性分析,得到基因甲基化水平和相关性结果;
所述差异表达量基因甲基化水平分析,选择合适的差异分组和所述的甲基化水平计算方法,计算每个差异表达基因不同区域的甲基化水平,得到差异基因甲基化水平列表和差异基因甲基化分布图。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种基于生物云平台的甲基化数据分析应用系统,其特征在于,包括:
用户界面模块、基本分析模块和个性化分析模块;其中,
所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;
所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;
所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;
所述个性化分析模块,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。
2.根据权利要求1所述的系统,其特征在于,所述甲基化测序数据质量控制的过程为:识别所述待分析的甲基化测序数据的质量值的编码方式,并将不符合编码方式要求的数据的质量值转换为统一编码标准,基于转换后的质量值统计数据的碱基质量分布和碱基类型分布,并绘制分布图。
3.根据权利要求2所述的系统,其特征在于,所述甲基化测序数据与所述参考基因组比对的过程为:将测序序列的胞嘧啶全部转化为胸腺嘧啶,命名为CT序列,将测序序列的鸟嘌呤转换为腺嘌呤,命名为GA序列,同时将参考基因组的胞嘧啶全部转化为胸腺嘧啶,命名为CT基因组,将参考基因组的鸟嘌呤转换为腺嘌呤,命名为GA基因组,将转换后的CT序列和转换后GA的序列分别和CT基因组、GA基因组进行比对,选取四次比对中最优的比对作为比对结果,最后根据比对结果统计比对效率、基因组覆盖情况以及插入片段的大小分布。
4.根据权利要求3所述的系统,其特征在于,所述甲基化位点判定的过程为:
基于所述甲基化测序数据与所述参考基因组比对的结果,将所述的最优比对序列和原始的测序序列进行比较,确定该测序序列的甲基化信息,使用二项分布检验,计算出胞嘧啶位点发生了甲基化的P值,并对P值进行校正,计算出错误发现率,选取错误发现率小于第一数值的位点判断为甲基化位点。
5.根据权利要求4所述的系统,其特征在于,所述绘制物种甲基化图谱的过程为:
对甲基化位点进行类型区分,并对不同类型的甲基化位点的甲基化水平进行分析,同时分析不同类型甲基化位点周围第二数值个碱基长度的序列分布情况,其中,甲基化位点的类型包括CG类型、CHG类型和CHH类型;和
从染色体水平描述甲基化分布情况,以第三数值个碱基为窗口计算所述甲基化测序数据的甲基化水平,以所述第三数值个碱基为窗口统计甲基化密度分布情况,并绘制染色体水平甲基化分布图;和
将所述甲基化测序数据分为基因上游区域、第一个内含子、内在内含子、第一个外显子、内在外显子、最后一个外显子、基因下游区域,共七个功能元件区域,分别计算这些区域内的甲基化水平,绘制甲基化水平功能元件分布图。
6.根据权利要求5所述的系统,其特征在于,所述差异甲基化区域识别的过程为:
使用划动窗口的方法,以第四数值个碱基大小为一个区域,选取区域内差异甲基化水平大于第五数值,且至少包含第六数值个甲基化位点的区域,将其作为潜在的差异甲基化区域;
使用费舍尔精确检验,对所述潜在的差异甲基化区域的甲基化信息进行显著性差异检验,得到所述潜在的差异甲基化区域的P值,对所有区域的P值进行校正,计算出错误发现率,选取错误发现率小于第七数值的区域,并将距离小于第八数值的区域进行合并,最终得到差异甲基化区域。
7.根据权利要求6所述的系统,其特征在于,所述甲基化水平分析的过程为:
对于所述甲基化测序数据,以染色体为目标区域或者以基因为目标区域,利用甲基化水平计算方法,计算得到目标区域的甲基化水平,基于所述甲基化水平得到甲基化水平列表、甲基化水平统计图、甲基化水平分布图,其中,所述甲基化水平计算方法包括:Fraction计算方法、Mean计算方法和Weight计算方法。
8.根据权利要求7所述的系统,其特征在于,所述差异甲基化水平分析包括:基因间的甲基化水平分析以及差异甲基化区域内的基因分析。
9.根据权利要求8所述的系统,其特征在于,所述与转录组结果进行联合分析包括:基因甲基化水平和表达量相关性分析,以及差异表达量基因甲基化水平分析。
10.根据权利要求9所述的系统,其特征在于,所述基因甲基化水平和表达量相关性分析的过程为,基于用户选择的染色体或基因,以及所述的甲基化水平计算方法,使用皮尔森相关性系数进行甲基化水平和表达量相关性分析,得到基因甲基化水平和相关性结果;
所述差异表达量基因甲基化水平分析的过程为,基于用户选择的差异分组和所述的甲基化水平计算方法,计算每个差异表达基因不同区域的甲基化水平,得到差异基因甲基化水平列表和差异基因甲基化分布图。
CN201710657059.1A 2017-08-03 2017-08-03 基于生物云平台的甲基化数据分析应用系统 Pending CN107563152A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710657059.1A CN107563152A (zh) 2017-08-03 2017-08-03 基于生物云平台的甲基化数据分析应用系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710657059.1A CN107563152A (zh) 2017-08-03 2017-08-03 基于生物云平台的甲基化数据分析应用系统

Publications (1)

Publication Number Publication Date
CN107563152A true CN107563152A (zh) 2018-01-09

Family

ID=60975104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710657059.1A Pending CN107563152A (zh) 2017-08-03 2017-08-03 基于生物云平台的甲基化数据分析应用系统

Country Status (1)

Country Link
CN (1) CN107563152A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109326330A (zh) * 2018-08-30 2019-02-12 武汉古奥基因科技有限公司 生物信息分析工具的制作方法、装置及可存储介质
CN114996763A (zh) * 2022-07-28 2022-09-02 北京锘崴信息科技有限公司 基于可信执行环境的隐私数据安全分析方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982253A (zh) * 2011-09-02 2013-03-20 深圳华大基因科技有限公司 一种多样本间甲基化差异检测方法及装置
CN105132409A (zh) * 2015-09-02 2015-12-09 中国科学院北京基因组研究所 RNA 5mC重亚硫酸盐测序的文库构建方法及其应用
CN105447336A (zh) * 2015-12-29 2016-03-30 北京百迈客生物科技有限公司 基于生物云平台的微生物多样性分析方法及系统
CN105550536A (zh) * 2015-12-29 2016-05-04 北京百迈客生物科技有限公司 一种基于生物云平台的外显子测序数据分析方法及系统
CN105653897A (zh) * 2015-12-25 2016-06-08 北京百迈客生物科技有限公司 基于生物云平台的lncRNA分析系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982253A (zh) * 2011-09-02 2013-03-20 深圳华大基因科技有限公司 一种多样本间甲基化差异检测方法及装置
CN105132409A (zh) * 2015-09-02 2015-12-09 中国科学院北京基因组研究所 RNA 5mC重亚硫酸盐测序的文库构建方法及其应用
CN105653897A (zh) * 2015-12-25 2016-06-08 北京百迈客生物科技有限公司 基于生物云平台的lncRNA分析系统及方法
CN105447336A (zh) * 2015-12-29 2016-03-30 北京百迈客生物科技有限公司 基于生物云平台的微生物多样性分析方法及系统
CN105550536A (zh) * 2015-12-29 2016-05-04 北京百迈客生物科技有限公司 一种基于生物云平台的外显子测序数据分析方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
TOM R.GAUNT 等: "Systematic identification of genetic influences on methylation across the human life course", 《GENOME BIOLOGY》 *
吴金雨: "基于高通量测序的DNA甲基化相关生物信息学工具的开发", 《中国博士学位论文全文数据库 基础科学辑》 *
李华兵 等: "利用滑动窗口和KNN算法识别差异甲基化区域", 《杭州电子科技大学学报(自然科学版)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109326330A (zh) * 2018-08-30 2019-02-12 武汉古奥基因科技有限公司 生物信息分析工具的制作方法、装置及可存储介质
CN109326330B (zh) * 2018-08-30 2020-10-16 武汉古奥基因科技有限公司 生物信息分析工具的制作方法、装置及可存储介质
CN114996763A (zh) * 2022-07-28 2022-09-02 北京锘崴信息科技有限公司 基于可信执行环境的隐私数据安全分析方法及装置
CN114996763B (zh) * 2022-07-28 2022-11-15 北京锘崴信息科技有限公司 基于可信执行环境的隐私数据安全分析方法及装置

Similar Documents

Publication Publication Date Title
Guo et al. Identification of cancer subtypes by integrating multiple types of transcriptomics data with deep learning in breast cancer
Shi et al. Winner's curse correction and variable thresholding improve performance of polygenic risk modeling based on genome-wide association study summary-level data
Browning et al. A fast, powerful method for detecting identity by descent
CA2424031C (en) System and process for validating, aligning and reordering genetic sequence maps using ordered restriction map
WO2018201805A1 (zh) 用于计算癌症样本纯度和染色体倍性的方法和装置
CN113168886A (zh) 用于使用神经网络进行种系和体细胞变体调用的系统和方法
Mourad et al. A hierarchical Bayesian network approach for linkage disequilibrium modeling and data-dimensionality reduction prior to genome-wide association studies
CN107679367B (zh) 一种基于网络节点关联度的共调控网络功能模块识别方法及系统
CN107368701A (zh) 大批量单细胞ATAC‑seq数据质量控制和分析方法
Camara Methods and challenges in the analysis of single-cell RNA-sequencing data
CN107563152A (zh) 基于生物云平台的甲基化数据分析应用系统
Li et al. Exploring additional valuable information from single-cell RNA-seq data
Chen et al. Progress and challenge for computational quantification of tissue immune cells
Zhang et al. Bioinformatics tools for RNA-seq gene and isoform quantification
Hu et al. MD-ALL: an integrative platform for molecular diagnosis of B-acute lymphoblastic leukemia
CN107153777A (zh) 一种估算四倍体物种基因组的二倍化程度的方法
Gu et al. SVLR: genome structural variant detection using Long-read sequencing data
CN106326689A (zh) 确定群体中受到选择作用的位点的方法和装置
Han et al. Evaluation of recent statistical methods for detecting differential methylation using BS-seq data
Rodriguez et al. A scalable, flexible workflow for MethylCap-seq data analysis
Kannan et al. CAISC: A software to integrate copy number variations and single nucleotide mutations for genetic heterogeneity profiling and subclone detection by single-cell RNA sequencing
Kielpinski et al. Reproducible analysis of sequencing-based RNA structure probing data with user-friendly tools
US9569584B2 (en) Combining RNAi imaging data with genomic data for gene interaction network construction
CN107038350B (zh) 一种药物的长非编码rna靶点预测方法和系统
Davis et al. Understanding cellular function and disease with comparative pathway analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109