CN105095687B - 一种免疫组库数据分析方法及终端 - Google Patents

一种免疫组库数据分析方法及终端 Download PDF

Info

Publication number
CN105095687B
CN105095687B CN201510363037.5A CN201510363037A CN105095687B CN 105095687 B CN105095687 B CN 105095687B CN 201510363037 A CN201510363037 A CN 201510363037A CN 105095687 B CN105095687 B CN 105095687B
Authority
CN
China
Prior art keywords
sample
analysis
immune group
group library
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510363037.5A
Other languages
English (en)
Other versions
CN105095687A (zh
Inventor
贺建奎
童寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN201510363037.5A priority Critical patent/CN105095687B/zh
Publication of CN105095687A publication Critical patent/CN105095687A/zh
Application granted granted Critical
Publication of CN105095687B publication Critical patent/CN105095687B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明实施例公开了一种免疫组库数据分析方法及终端,其中方法包括:接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件;响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。

Description

一种免疫组库数据分析方法及终端
技术领域
本发明涉及计算机技术领域,尤其涉及一种免疫组库数据分析方法及终端。
背景技术
免疫组库包括个体内的所有特异性不同的T淋巴细胞和B淋巴细胞克隆总和。T细胞受体(TCR)和B细胞受体(BCR)是特异性识别抗原和介导免疫应答的分子,TCR/BCR的多样性直接反应了机体免疫应答的状态。免疫组库在疫苗和医药的发展、生物标志物的发现、最小残余疾病检测、自身免疫性疾病的研究以及移植后监测等都具有应用价值。在实际应用中,现有的一些平台在对免疫组库数据进行处理时,只能对免疫组库数据做简单序列的识别,不能对免疫组库数据进行更进一步的分析(例如,不能进行V、D和J基因频率分布分析,免疫多样性分析,高克隆CDR3(即互补决定区3)序列频率检验,CDR3长度分布分析,V、D和J基因组合分析,Ig链类型的比例分析和多Ig链类型共同序列分析等),从而不能使用户全面评估免疫组库的状况,深入挖掘免疫组库与疾病的关系。
发明内容
本发明实施例公开了一种免疫组库数据分析方法及终端,有利于对免疫组库的状况进行更全面的评估。
本发明实施例公开了一种免疫组库数据分析方法,所述方法包括:
接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
本发明实施例还公开了一种终端,所述终端包括:
接收模块,用于接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
输出模块,用于响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
在本发明实施例中,终端将接收针对第一样本的第一分析指令,该第一分析指令携带第一样本的注释文件;终端将响应第一分析指令,根据第一样本的注释文件,生成并输出针对第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种免疫组库数据分析方法的流程示意图;
图2是本发明实施例公开的另一种免疫组库数据分析方法的流程示意图;
图3是本发明实施例公开的另一种免疫组库数据分析方法的流程示意图;
图4是本发明实施例公开的一种终端的结构示意图;
图5是本发明实施例公开的另一种终端的结构示意图;
图6为本发明实施例公开的V基因频率分布图;
图7为本发明实施例公开的D基因频率分布图;
图8为本发明实施例公开的J基因频率分布图;
图9为本发明实施例公开的CDR3的长度分布图;
图10为本发明实施例公开的免疫多样性分析图;
图11为本发明实施例公开的Ig链类型比例分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种免疫组库数据分析方法及终端,有利于对免疫组库的状况进行更全面的评估。以下分别进行详细说明。
请参见图1,图1为本发明实施例公开的一种免疫组库数据分析方法的流程示意图。如图1所示,该免疫组库数据分析方法可以包括以下步骤。
S101、接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。
本发明实施例中,终端接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。其中,该终端可包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等终端。该终端的操作系统可包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、Black Berry(黑莓)操作系统和Windows操作系统等等,本发明实施例不做限定。
本发明实施例中,第一分析指令携带第一样本的注释文件,其中,该注释文件包括第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型;其中,该第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
S102、响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
本发明实施例中,终端接收第一分析指令之后,将响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图。
可选的,终端接收第一分析指令之后,将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类,生成并输出第一样本的V基因频率分布图;该V基因频率分布图用于指示第一样本包括的各V基因种类所具有的数量,即用于指示第一样本的V基因有哪些种类,各种类的数量有多少。如图6所示,图6为V基因频率分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的D基因种类,生成并输出第一样本的D基因频率分布图;该D基因频率分布图用于指示第一样本包括的各D基因种类所具有的数量,即用于指示第一样本的D基因有哪些种类,各种类的数量有多少。如图7所示,图7为D基因频率分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的J基因种类,生成并输出第一样本的J基因频率分布图;该J基因频率分布图用于指示第一样本包括的各J基因种类所具有的数量,即用于指示第一样本的J基因有哪些种类,各种类的数量有多少。如图8所示,图8为J基因频率分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列,统计第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量;终端根据第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量,生成并输出第一样本的高克隆CDR3序列的频率分布图,该高克隆CDR3序列的频率分布图用于指示第一样本的各高克隆CDR3序列所具有的数量。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的各CDR3的长度,并统计第一样本的各CDR3长度对应的数量;在终端确定第一样本的各CDR3长度对应的数量之后,终端将生成并输出第一样本的CDR3的长度分布图,该CDR3的长度分布图用于指示第一样本的各CDR3长度的所具有数量。如图9所示,图9为CDR3的长度分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的香农熵(定义为免疫多样性度量);终端根据计算得到的香农熵生成并输出第一样本的免疫多样性分析图,该免疫多样性分析图用于指示第一样本的免疫多样性,其中,香农熵的值越接近于1说明第一样本的免疫多样性越好,香农熵的值越接近于0说明第一样本的免疫多样性越差。如图10所示,图10为免疫多样性分析图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的Ig链的类型,计算第一样本的各Ig链类型的比例;终端根据第一样本的各Ig链类型的比例,生成并输出第一样本的Ig链类型比例分布图;该Ig链类型比例分布图用于指示第一样本包括的各Ig链类型所占的比例。如图11所示,图11为Ig链类型比例分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出第一样本的多Ig链类型共同序列分析图,该多Ig链类型共同序列分析图用于指示第一样本包括的不同类型的Ig链之间CDR3序列的共享情况。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类、D基因种类和J基因种类,对第一样本的各V、D和J基因进行组合,计算各VDJ基因组合的数量;终端根据各VDJ基因组合的数量,生成并输出VDJ基因组合分析图,该VDJ基因组合分析图用于指示第一样本的各VDJ基因组合所具有的数量。
在图1所描述的方法中,终端将接收针对第一样本的第一分析指令,该第一分析指令携带第一样本的注释文件;终端接收第一分析指令之后,将响应第一分析指令,根据第一样本的注释文件,生成并输出针对第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
请参见图2,图2为本发明实施例公开的另一种免疫组库数据分析方法的流程示意图。如图2所示,该免疫组库数据分析方法可以包括以下步骤。
S201、终端接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。
本发明实施例中,第一分析指令携带第一样本的注释文件,其中,该注释文件包括第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型;其中,该第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
S202、终端响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
S203、终端接收用于对该第一样本和第二样本进行免疫组库差异分析的第二分析指令,该第二分析指令携带该第一样本的注释文件与该第二样本的注释文件。
本发明实施例中,该第二样本的注释文件包括第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,该第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
S204、终端响应该第二分析指令,根据该第一样本的注释文件与该第二样本的注释文件,生成并输出针对该第一样本和该第二样本的差异分析图,该差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据该第一样本的注释文件包括的CDR3序列,统计第一样本的高克隆CDR3序列的比例,并根据该第二样本的注释文件包括的CDR3序列,统计第二样本的高克隆CDR3序列的比例;终端根据第一样本的高克隆CDR3的比例和第二样本的高克隆CDR3的比例,生成并输出针对第一样本和第二样本的高克隆差异分析图,该高克隆差异分析图用于指示第一样本和第二样本的高克隆CDR3比例差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本的注释文件中包括的V基因种类,统计第一样本包括的各V基因种类的数量,并且根据第二样本的注释文件中包括的V基因种类,统计第二样本包括的各V基因种类的数量;终端根据第一样本包括的各V基因种类的数量和第二样本包括的各V基因种类的数量,生成并输出针对第一样本和第二样本的V基因使用频率差异分析图,该V基因使用频率差异分析图用于指示第一样本和第二样本的各V基因种类的数量差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本的注释文件中包括的D基因种类,统计第一样本包括的各D基因种类的数量,并且根据第二样本的注释文件中包括的D基因种类,统计第二样本包括的各D基因种类的数量;终端根据第一样本包括的各D基因种类的数量和第二样本包括的各D基因种类的数量,生成并输出针对第一样本和第二样本的D基因使用频率差异分析图,该D基因使用频率差异分析图用于指示第一样本和第二样本的各D基因种类的数量分布差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本的注释文件中包括的J基因种类,统计第一样本包括的各J基因种类的数量,并且根据第二样本的注释文件中包括的J基因种类,统计第二样本包括的各J基因种类的数量;终端根据第一样本包括的各J基因种类的数量和第二样本包括的各J基因种类的数量,生成并输出针对第一样本和第二样本的J基因使用频率差异分析图,该J基因使用频率差异分析图用于指示第一样本和第二样本的各J基因种类的数量分布差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出针对第一样本和第二样本的共同序列分析图,该共同序列分析图用于指示第一样本和第二样本包括的不同类型的Ig链之间CDR3序列的共享差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的V基因种类、D基因种类和J基因种类,生成并输出针对第一样本和第二样本的主成分分析图。
在图2所描述的方法中,第二样本可以为健康人的免疫组库数据样本,本发明实施例通过将第一样本与第二样本的免疫组库数据进行对比,有利于全面评估第一样本的免疫组库的状况。
请参见图3,图3为本发明实施例公开的另一种免疫组库数据分析方法的流程示意图。如图3所示,该免疫组库数据分析方法可以包括以下步骤。
S301、终端接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,该注释指令携带包括该第一样本的免疫组库数据的数据文件。
本发明实施例中,免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
S302、终端判断该注释指令携带的数据文件是否为预设格式的文件。
本发明实施例中,终端接收注释指令之后,将判断注释指令携带的数据文件是否为预设格式的文件;若是,则执行步骤S303;若否,则终端输出用于提示用户包括第一样本的免疫组库数据的数据文件的格式有误的提示信息。可选的,该预设格式包括fasta格式。
S303、若判断结果为是,终端响应该注释指令,从该数据文件中提取该第一样本的免疫组库数据。
S304、终端将提取的该第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从该预设免疫组库数据中获取与该第一样本的免疫组库数据相同的目标免疫组库数据。
本发明实施例中,举例来说,若第一样本的免疫组库数据为多个TCR基因序列,则终端将提取的第一样本的TCR基因序列与预先存储的预设免疫组库数据包含的TCR基因序列进行对比,判断序列是否相同。若第一样本的一TCR基因序列与预设免疫组库数据包含的一TCR基因序列相同,则终端确定预设免疫组库数据包含的该TCR基因序列为目标免疫组库数据。
S305、终端根据预先存储的与该目标免疫组库数据对应的注释数据,生成该第一样本的注释文件。
本发明实施例中,终端预先储存有预设免疫组库数据的注释文件,该注释文件包括预设免疫组库数据的各基因序列对应的注释数据,该注释数据包括V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型。终端将根据与目标免疫组库数据对应的注释数据,对第一样本的免疫组库数据进行注释,生成第一样本的注释文件。
举例来说,若预设免疫组库数据包括的TCR基因序列A为目标免疫组库数据,若第一样本的TCR基因序列B与TCR基因序列A相同,则终端将根据TCR基因序列A对应的注释数据,对第一样本的TCR基因序列B进行注释;具体地,终端将与TCR基因序列A对应的注释数据设置为第一样本的TCR基因序列B的注释数据。
S306、终端接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。
S307、终端响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
在图3所描述的方法中,终端可对第一样本的免疫组库数据进行注释,在得到注释文件之后,可使用该注释文件生成第一样本的V基因频率分布图、D基因频率分布图和J基因频率分布图,高克隆CDR3序列的频率分布图,CDR3的长度分布图,免疫多样性分析图,VDJ基因组合分析图,Ig链类型比例分布图和多Ig链类型共同序列分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
请参阅图4,图4是本发明实施例公开的一种终端的结构示意图。其中,图4所示的终端可以包括接收模块401和输出模块402。其中:
接收模块401,用于接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
本发明实施例中,终端的接收模块401接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。其中,该终端可包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等终端。该终端的操作系统可包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、Black Berry(黑莓)操作系统和Windows操作系统等等,本发明实施例不做限定。
输出模块402,用于响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
本发明实施例中,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类,生成并输出第一样本的V基因频率分布图;该V基因频率分布图用于指示第一样本包括的各V基因种类所具有的数量,即用于指示第一样本的V基因有哪些种类,各种类的数量有多少。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的D基因种类,生成并输出第一样本的D基因频率分布图;该D基因频率分布图用于指示第一样本包括的各D基因种类所具有的数量,即用于指示第一样本的D基因有哪些种类,各种类的数量有多少。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的J基因种类,生成并输出第一样本的J基因频率分布图;该J基因频率分布图用于指示第一样本包括的各J基因种类所具有的数量,即用于指示第一样本的J基因有哪些种类,各种类的数量有多少。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列,统计第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量;终端根据第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量,生成并输出第一样本的高克隆CDR3序列的频率分布图,该高克隆CDR3序列的频率分布图用于指示第一样本的各高克隆CDR3序列所具有的数量。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的各CDR3的长度,并统计第一样本的各CDR3长度对应的数量;在终端确定第一样本的各CDR3长度对应的数量之后,终端将生成并输出第一样本的CDR3的长度分布图,该CDR3的长度分布图用于指示第一样本的各CDR3长度的所具有数量。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的香农熵(定义为免疫多样性度量);终端根据计算得到的香农熵生成并输出第一样本的免疫多样性分析图,该免疫多样性分析图用于指示第一样本的免疫多样性,其中,香农熵的值越接近于1说明第一样本的免疫多样性越好,香农熵的值越接近于0说明第一样本的免疫多样性越差。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的Ig链的类型,计算第一样本的各Ig链类型的比例;终端根据第一样本的各Ig链类型的比例,生成并输出第一样本的Ig链类型比例分布图;该Ig链类型比例分布图用于指示第一样本包括的各Ig链类型所占的比例。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出第一样本的多Ig链类型共同序列分析图,该多Ig链类型共同序列分析图用于指示第一样本包括的不同类型的Ig链之间CDR3序列的共享情况。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类、D基因种类和J基因种类,对第一样本的各V、D和J基因进行组合,计算各VDJ基因组合的数量;终端根据各VDJ基因组合的数量,生成并输出VDJ基因组合分析图,该VDJ基因组合分析图用于指示第一样本的各VDJ基因组合所具有的数量。
作为一种可选的实施方式,所述接收模块401,还用于接收用于对所述第一样本和第二样本进行免疫组库差异分析的第二分析指令,所述第二分析指令携带所述第一样本的注释文件与所述第二样本的注释文件,所述第二样本的注释文件包括所述第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
所述输出模块402,还用于响应所述第二分析指令,根据所述第一样本的注释文件与所述第二样本的注释文件,生成并输出针对所述第一样本和所述第二样本的差异分析图,所述差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据该第一样本的注释文件包括的CDR3序列,统计第一样本的高克隆CDR3序列的比例,并根据该第二样本的注释文件包括的CDR3序列,统计第二样本的高克隆CDR3序列的比例;终端根据第一样本的高克隆CDR3的比例和第二样本的高克隆CDR3的比例,生成并输出针对第一样本和第二样本的高克隆差异分析图,该高克隆差异分析图用于指示第一样本和第二样本的高克隆CDR3比例差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本的注释文件中包括的V基因种类,统计第一样本包括的各V基因种类的数量,并且根据第二样本的注释文件中包括的V基因种类,统计第二样本包括的各V基因种类的数量;终端根据第一样本包括的各V基因种类的数量和第二样本包括的各V基因种类的数量,生成并输出针对第一样本和第二样本的V基因使用频率差异分析图,该V基因使用频率差异分析图用于指示第一样本和第二样本的各V基因种类的数量差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本的注释文件中包括的D基因种类,统计第一样本包括的各D基因种类的数量,并且根据第二样本的注释文件中包括的D基因种类,统计第二样本包括的各D基因种类的数量;终端根据第一样本包括的各D基因种类的数量和第二样本包括的各D基因种类的数量,生成并输出针对第一样本和第二样本的D基因使用频率差异分析图,该D基因使用频率差异分析图用于指示第一样本和第二样本的各D基因种类的数量分布差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本的注释文件中包括的J基因种类,统计第一样本包括的各J基因种类的数量,并且根据第二样本的注释文件中包括的J基因种类,统计第二样本包括的各J基因种类的数量;终端根据第一样本包括的各J基因种类的数量和第二样本包括的各J基因种类的数量,生成并输出针对第一样本和第二样本的J基因使用频率差异分析图,该J基因使用频率差异分析图用于指示第一样本和第二样本的各J基因种类的数量分布差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出针对第一样本和第二样本的共同序列分析图,该共同序列分析图用于指示第一样本和第二样本包括的不同类型的Ig链之间CDR3序列的共享差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的V基因种类、D基因种类和J基因种类,生成并输出针对第一样本和第二样本的主成分分析图。
请一并参阅图5,图5是本发明实施例公开的另一种终端的结构示意图。其中,图5所示的终端是由图4所示的终端进行优化得到的。与图4所示的终端相比较,图5所示的终端除包括图4所示的终端的所有模块外,还可以包括判断模块403、提取模块404、对比模块405和生成模块406。其中:
所述接收模块401,还用于接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,所述注释指令携带包括所述第一样本的免疫组库数据的数据文件。
本发明实施例中,免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
所述判断模块403,用于在所述接收模块401接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令之后,判断所述注释指令携带的数据文件是否为预设格式的文件。
本发明实施例中,接收模块401接收注释指令之后,判断模块403将判断注释指令携带的数据文件是否为预设格式的文件;若是,则提取模块404响应注释指令,从数据文件中提取第一样本的免疫组库数据;若否,则终端输出用于提示用户包括第一样本的免疫组库数据的数据文件的格式有误的提示信息。可选的,该预设格式包括fasta格式。
所述提取模块404,用于若所述判断模块403的判断结果为是,则响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据。
所述对比模块405,用于将提取的所述第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从所述预设免疫组库数据中获取与所述第一样本的免疫组库数据相同的目标免疫组库数据。
本发明实施例中,举例来说,若第一样本的免疫组库数据为多个TCR基因序列,则对比模块405将提取模块404提取的第一样本的TCR基因序列与预先存储的预设免疫组库数据包含的TCR基因序列进行对比,判断序列是否相同。若第一样本的一TCR基因序列与预设免疫组库数据包含的一TCR基因序列相同,则对比模块405确定预设免疫组库数据包含的该TCR基因序列为目标免疫组库数据。
所述生成模块406,用于根据预先存储的与所述目标免疫组库数据对应的注释数据,生成所述第一样本的注释文件。
本发明实施例中,终端预先储存有预设免疫组库数据的注释文件,该注释文件包括预设免疫组库数据的各基因序列对应的注释数据,该注释数据包括V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型。生成模块406将根据与目标免疫组库数据对应的注释数据,对第一样本的免疫组库数据进行注释,生成第一样本的注释文件。
举例来说,若预设免疫组库数据包括的TCR基因序列A为目标免疫组库数据,若第一样本的TCR基因序列B与TCR基因序列A相同,则生成模块406将根据TCR基因序列A对应的注释数据,对第一样本的TCR基因序列B进行注释;具体地,生成模块406将与TCR基因序列A对应的注释数据设置为第一样本的TCR基因序列B的注释数据。
在图4和图5所描述的终端中,接收模块将接收针对第一样本的第一分析指令,该第一分析指令携带第一样本的注释文件;接收模块接收第一分析指令之后,输出模块将响应第一分析指令,根据第一样本的注释文件,生成并输出针对第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
以上对本发明实施例公开的一种免疫组库数据分析方法及终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种免疫组库数据分析方法,其特征在于,所述方法包括:
接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,所述注释指令携带包括所述第一样本的免疫组库数据的数据文件;
响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据;
将提取的所述第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从所述预设免疫组库数据中获取与所述第一样本的免疫组库数据相同的目标免疫组库数据;
根据预先存储的与所述目标免疫组库数据对应的注释数据,生成所述第一样本的注释文件;
接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图;
接收用于对所述第一样本和第二样本进行免疫组库差异分析的第二分析指令,所述第二分析指令携带所述第一样本的注释文件与所述第二样本的注释文件,所述第二样本的注释文件包括所述第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
响应所述第二分析指令,根据所述第一样本的注释文件与所述第二样本的注释文件,生成并输出针对所述第一样本和所述第二样本的差异分析图,所述差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
2.根据权利要求1所述的方法,其特征在于,所述接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令之后,所述方法还包括:
判断所述注释指令携带的数据文件是否为预设格式的文件;
若判断结果为是,则执行响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据的步骤。
3.根据权利要求2所述的方法,其特征在于,所述预设格式包括fasta格式。
4.一种免疫组库数据分析终端,其特征在于,所述终端包括:
接收模块,用于接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,所述注释指令携带包括所述第一样本的免疫组库数据的数据文件;
提取模块,用于响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据;
对比模块,用于将提取的所述第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从所述预设免疫组库数据中获取与所述第一样本的免疫组库数据相同的目标免疫组库数据;
生成模块,用于根据预先存储的与所述目标免疫组库数据对应的注释数据,生成所述第一样本的注释文件;
所述接收模块,还用于接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
输出模块,用于响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图;
所述接收模块,还用于接收用于对所述第一样本和第二样本进行免疫组库差异分析的第二分析指令,所述第二分析指令携带所述第一样本的注释文件与所述第二样本的注释文件,所述第二样本的注释文件包括所述第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
所述输出模块,还用于响应所述第二分析指令,根据所述第一样本的注释文件与所述第二样本的注释文件,生成并输出针对所述第一样本和所述第二样本的差异分析图,所述差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
5.根据权利要求4所述的终端,其特征在于,所述终端还包括:
判断模块,用于在所述接收模块接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令之后,判断所述注释指令携带的数据文件是否为预设格式的文件;
所述提取模块,还用于若所述判断模块的判断结果为是,则响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据。
6.根据权利要求5所述的终端,其特征在于,所述预设格式包括fasta格式。
CN201510363037.5A 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端 Expired - Fee Related CN105095687B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510363037.5A CN105095687B (zh) 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510363037.5A CN105095687B (zh) 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端

Publications (2)

Publication Number Publication Date
CN105095687A CN105095687A (zh) 2015-11-25
CN105095687B true CN105095687B (zh) 2018-10-26

Family

ID=54576105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510363037.5A Expired - Fee Related CN105095687B (zh) 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端

Country Status (1)

Country Link
CN (1) CN105095687B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200199650A1 (en) * 2017-05-18 2020-06-25 Geneplus-Beijing Analysis system for peripheral blood-based non-invasive detection of lesion immune repertoire diversity and uses of system
CN108624667A (zh) * 2018-05-15 2018-10-09 佛山市第人民医院(中山大学附属佛山医院) 一种基于二代测序的t细胞受体库分析方法及装置
CN112331344B (zh) * 2020-11-12 2021-08-03 深圳泛因医学有限公司 免疫状态评估方法及应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102212888A (zh) * 2011-03-17 2011-10-12 靳海峰 一种基于高通量测序的免疫组库构建方法
CN102637244A (zh) * 2011-12-31 2012-08-15 苏州金唯智生物科技有限公司 生物序列分析平台及其使用方法
CN103617256A (zh) * 2013-11-29 2014-03-05 北京诺禾致源生物信息科技有限公司 待变异检测文件的处理方法及装置
CN103710454A (zh) * 2013-12-31 2014-04-09 南方科技大学 Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
CN104520443A (zh) * 2012-06-11 2015-04-15 赛昆塔公司 使用序列标签的序列确定方法
CN104673892A (zh) * 2014-12-30 2015-06-03 南方科技大学 开发恒河猴t细胞免疫组库的引物组、高通量测序方法及应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104395481A (zh) * 2012-04-13 2015-03-04 赛昆塔公司 免疫组库分析中样品污染的检测和定量
US11203783B2 (en) * 2013-11-21 2021-12-21 Repertoire Genesis Incorporation T cell receptor and B cell receptor repertoire analysis system, and use of same in treatment and diagnosis

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102212888A (zh) * 2011-03-17 2011-10-12 靳海峰 一种基于高通量测序的免疫组库构建方法
CN102637244A (zh) * 2011-12-31 2012-08-15 苏州金唯智生物科技有限公司 生物序列分析平台及其使用方法
CN104520443A (zh) * 2012-06-11 2015-04-15 赛昆塔公司 使用序列标签的序列确定方法
CN103617256A (zh) * 2013-11-29 2014-03-05 北京诺禾致源生物信息科技有限公司 待变异检测文件的处理方法及装置
CN103710454A (zh) * 2013-12-31 2014-04-09 南方科技大学 Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
CN104673892A (zh) * 2014-12-30 2015-06-03 南方科技大学 开发恒河猴t细胞免疫组库的引物组、高通量测序方法及应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
The Past, Present, and Future of Immune Repertoire Biology – The Rise of Next-Generation Repertoire Analysis;Adrien Six等;《Frontiers in Immunology》;20131127;第4卷;第1-16页 *
免疫组库的临床应用;付钰 等;《国际免疫学杂志》;20140930;第37卷(第5期);第411-412页 *
基于高通量测序的辽宁绒山羊转录组研究与应用;刘红亮;《中国优秀硕士学位论文全文数据库农业科技辑》;20140215(第2期);正文第19页第2.2.6.2小节 *

Also Published As

Publication number Publication date
CN105095687A (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
Derryberry et al. HZAR: hybrid zone analysis using an R software package
CN104036105B (zh) 确定涉及大数据分析的随机性应用的正确性的方法和系统
CN107423578B (zh) 检测体细胞突变的装置
CN105095687B (zh) 一种免疫组库数据分析方法及终端
Tang et al. Reactivity and stability of large ecosystems
EP3139297B1 (en) Malware determination device, malware determination system, malware determination method, and program
CN110414277B (zh) 基于多特征参数的门级硬件木马检测方法
CN104965999B (zh) 一种中短基因片段测序的分析拼接方法及设备
CN111933214B (zh) 用于检测rna水平体细胞基因变异的方法、计算设备
CN108984208A (zh) 一种功能文件生成方法、装置及系统
Lee et al. DAFi: A directed recursive data filtering and clustering approach for improving and interpreting data clustering identification of cell populations from polychromatic flow cytometry data
Zhou et al. Estimating time to the most recent common ancestor (TMRCA): comparison and application of eight methods
CN111581390B (zh) 一种知识图谱的构建方法、装置以及电子设备
CN113327646B (zh) 测序序列的处理方法及装置、存储介质、电子设备
CN110209571A (zh) 更新接口的测试方法及装置、存储介质、计算机设备
CN105608006B (zh) 一种基于概率模型的程序错误检测方法及系统
CN113778902A (zh) 测试案例覆盖度的检测方法及装置
Link et al. HIV-Quasipore: a suite of HIV-1-specific nanopore basecallers designed to enhance viral quasispecies detection
CN108876393B (zh) 判断用户风险程度的方法、装置
CN110377463A (zh) 接口测试方法、装置、终端及计算机可读存储介质
Mangul et al. Profiling adaptive immune repertoires across multiple human tissues by RNA Sequencing
CN109324964A (zh) 基于系统多个版本的压力测试方法及装置
CN106506257A (zh) 一种链路训练优化方法和装置
US9002861B2 (en) Matching device and computer-readable storage medium
JPH07219759A (ja) 通信ソフトウェア開発支援装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181026

Termination date: 20200626