CN105095687A - 一种免疫组库数据分析方法及终端 - Google Patents

一种免疫组库数据分析方法及终端 Download PDF

Info

Publication number
CN105095687A
CN105095687A CN201510363037.5A CN201510363037A CN105095687A CN 105095687 A CN105095687 A CN 105095687A CN 201510363037 A CN201510363037 A CN 201510363037A CN 105095687 A CN105095687 A CN 105095687A
Authority
CN
China
Prior art keywords
sample
analysis
immune group
gene
database data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510363037.5A
Other languages
English (en)
Other versions
CN105095687B (zh
Inventor
贺建奎
童寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern University of Science and Technology
Original Assignee
Southern University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern University of Science and Technology filed Critical Southern University of Science and Technology
Priority to CN201510363037.5A priority Critical patent/CN105095687B/zh
Publication of CN105095687A publication Critical patent/CN105095687A/zh
Application granted granted Critical
Publication of CN105095687B publication Critical patent/CN105095687B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明实施例公开了一种免疫组库数据分析方法及终端,其中方法包括:接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件;响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。

Description

一种免疫组库数据分析方法及终端
技术领域
本发明涉及计算机技术领域,尤其涉及一种免疫组库数据分析方法及终端。
背景技术
免疫组库包括个体内的所有特异性不同的T淋巴细胞和B淋巴细胞克隆总和。T细胞受体(TCR)和B细胞受体(BCR)是特异性识别抗原和介导免疫应答的分子,TCR/BCR的多样性直接反应了机体免疫应答的状态。免疫组库在疫苗和医药的发展、生物标志物的发现、最小残余疾病检测、自身免疫性疾病的研究以及移植后监测等都具有应用价值。在实际应用中,现有的一些平台在对免疫组库数据进行处理时,只能对免疫组库数据做简单序列的识别,不能对免疫组库数据进行更进一步的分析(例如,不能进行V、D和J基因频率分布分析,免疫多样性分析,高克隆CDR3(即互补决定区3)序列频率检验,CDR3长度分布分析,V、D和J基因组合分析,Ig链类型的比例分析和多Ig链类型共同序列分析等),从而不能使用户全面评估免疫组库的状况,深入挖掘免疫组库与疾病的关系。
发明内容
本发明实施例公开了一种免疫组库数据分析方法及终端,有利于对免疫组库的状况进行更全面的评估。
本发明实施例公开了一种免疫组库数据分析方法,所述方法包括:
接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
本发明实施例还公开了一种终端,所述终端包括:
接收模块,用于接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
输出模块,用于响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
在本发明实施例中,终端将接收针对第一样本的第一分析指令,该第一分析指令携带第一样本的注释文件;终端将响应第一分析指令,根据第一样本的注释文件,生成并输出针对第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种终端防盗方法的流程示意图;
图2是本发明实施例公开的另一种终端防盗方法的流程示意图;
图3是本发明实施例公开的另一种终端防盗方法的流程示意图;
图4是本发明实施例公开的一种终端的结构示意图;
图5是本发明实施例公开的另一种终端的结构示意图;
图6为本发明实施例公开的V基因频率分布图;
图7为本发明实施例公开的D基因频率分布图;
图8为本发明实施例公开的J基因频率分布图;
图9为本发明实施例公开的CDR3的长度分布图;
图10为本发明实施例公开的免疫多样性分析图;
图11为本发明实施例公开的Ig链类型比例分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种免疫组库数据分析方法及终端,有利于对免疫组库的状况进行更全面的评估。以下分别进行详细说明。
请参见图1,图1为本发明实施例公开的一种免疫组库数据分析方法的流程示意图。如图1所示,该免疫组库数据分析方法可以包括以下步骤。
S101、接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。
本发明实施例中,终端接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。其中,该终端可包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等终端。该终端的操作系统可包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、BlackBerry(黑莓)操作系统和Windows操作系统等等,本发明实施例不做限定。
本发明实施例中,第一分析指令携带第一样本的注释文件,其中,该注释文件包括第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型;其中,该第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
S102、响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
本发明实施例中,终端接收第一分析指令之后,将响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图。
可选的,终端接收第一分析指令之后,将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类,生成并输出第一样本的V基因频率分布图;该V基因频率分布图用于指示第一样本包括的各V基因种类所具有的数量,即用于指示第一样本的V基因有哪些种类,各种类的数量有多少。如图6所示,图6为V基因频率分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的D基因种类,生成并输出第一样本的D基因频率分布图;该D基因频率分布图用于指示第一样本包括的各D基因种类所具有的数量,即用于指示第一样本的D基因有哪些种类,各种类的数量有多少。如图7所示,图7为D基因频率分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的J基因种类,生成并输出第一样本的J基因频率分布图;该J基因频率分布图用于指示第一样本包括的各J基因种类所具有的数量,即用于指示第一样本的J基因有哪些种类,各种类的数量有多少。如图8所示,图8为J基因频率分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列,统计第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量;终端根据第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量,生成并输出第一样本的高克隆CDR3序列的频率分布图,该高克隆CDR3序列的频率分布图用于指示第一样本的各高克隆CDR3序列所具有的数量。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的各CDR3的长度,并统计第一样本的各CDR3长度对应的数量;在终端确定第一样本的各CDR3长度对应的数量之后,终端将生成并输出第一样本的CDR3的长度分布图,该CDR3的长度分布图用于指示第一样本的各CDR3长度的所具有数量。如图9所示,图9为CDR3的长度分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的香农熵(定义为免疫多样性度量);终端根据计算得到的香农熵生成并输出第一样本的免疫多样性分析图,该免疫多样性分析图用于指示第一样本的免疫多样性,其中,香农熵的值越接近于1说明第一样本的免疫多样性越好,香农熵的值越接近于0说明第一样本的免疫多样性越差。如图10所示,图10为免疫多样性分析图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的Ig链的类型,计算第一样本的各Ig链类型的比例;终端根据第一样本的各Ig链类型的比例,生成并输出第一样本的Ig链类型比例分布图;该Ig链类型比例分布图用于指示第一样本包括的各Ig链类型所占的比例。如图11所示,图11为Ig链类型比例分布图。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出第一样本的多Ig链类型共同序列分析图,该多Ig链类型共同序列分析图用于指示第一样本包括的不同类型的Ig链之间CDR3序列的共享情况。
可选的,终端接收第一分析指令之后,终端将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类、D基因种类和J基因种类,对第一样本的各V、D和J基因进行组合,计算各VDJ基因组合的数量;终端根据各VDJ基因组合的数量,生成并输出VDJ基因组合分析图,该VDJ基因组合分析图用于指示第一样本的各VDJ基因组合所具有的数量。
在图1所描述的方法中,终端将接收针对第一样本的第一分析指令,该第一分析指令携带第一样本的注释文件;终端接收第一分析指令之后,将响应第一分析指令,根据第一样本的注释文件,生成并输出针对第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
请参见图2,图2为本发明实施例公开的另一种免疫组库数据分析方法的流程示意图。如图2所示,该免疫组库数据分析方法可以包括以下步骤。
S201、终端接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。
本发明实施例中,第一分析指令携带第一样本的注释文件,其中,该注释文件包括第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型;其中,该第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
S202、终端响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
S203、终端接收用于对该第一样本和第二样本进行免疫组库差异分析的第二分析指令,该第二分析指令携带该第一样本的注释文件与该第二样本的注释文件。
本发明实施例中,该第二样本的注释文件包括第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,该第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
S204、终端响应该第二分析指令,根据该第一样本的注释文件与该第二样本的注释文件,生成并输出针对该第一样本和该第二样本的差异分析图,该差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据该第一样本的注释文件包括的CDR3序列,统计第一样本的高克隆CDR3序列的比例,并根据该第二样本的注释文件包括的CDR3序列,统计第二样本的高克隆CDR3序列的比例;终端根据第一样本的高克隆CDR3的比例和第二样本的高克隆CDR3的比例,生成并输出针对第一样本和第二样本的高克隆差异分析图,该高克隆差异分析图用于指示第一样本和第二样本的高克隆CDR3比例差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本的注释文件中包括的V基因种类,统计第一样本包括的各V基因种类的数量,并且根据第二样本的注释文件中包括的V基因种类,统计第二样本包括的各V基因种类的数量;终端根据第一样本包括的各V基因种类的数量和第二样本包括的各V基因种类的数量,生成并输出针对第一样本和第二样本的V基因使用频率差异分析图,该V基因使用频率差异分析图用于指示第一样本和第二样本的各V基因种类的数量差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本的注释文件中包括的D基因种类,统计第一样本包括的各D基因种类的数量,并且根据第二样本的注释文件中包括的D基因种类,统计第二样本包括的各D基因种类的数量;终端根据第一样本包括的各D基因种类的数量和第二样本包括的各D基因种类的数量,生成并输出针对第一样本和第二样本的D基因使用频率差异分析图,该D基因使用频率差异分析图用于指示第一样本和第二样本的各D基因种类的数量分布差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本的注释文件中包括的J基因种类,统计第一样本包括的各J基因种类的数量,并且根据第二样本的注释文件中包括的J基因种类,统计第二样本包括的各J基因种类的数量;终端根据第一样本包括的各J基因种类的数量和第二样本包括的各J基因种类的数量,生成并输出针对第一样本和第二样本的J基因使用频率差异分析图,该J基因使用频率差异分析图用于指示第一样本和第二样本的各J基因种类的数量分布差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出针对第一样本和第二样本的共同序列分析图,该共同序列分析图用于指示第一样本和第二样本包括的不同类型的Ig链之间CDR3序列的共享差异情况。
可选的,终端接收第二分析指令之后,将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的V基因种类、D基因种类和J基因种类,生成并输出针对第一样本和第二样本的主成分分析图。
在图2所描述的方法中,第二样本可以为健康人的免疫组库数据样本,本发明实施例通过将第一样本与第二样本的免疫组库数据进行对比,有利于全面评估第一样本的免疫组库的状况。
请参见图3,图3为本发明实施例公开的另一种免疫组库数据分析方法的流程示意图。如图3所示,该免疫组库数据分析方法可以包括以下步骤。
S301、终端接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,该注释指令携带包括该第一样本的免疫组库数据的数据文件。
本发明实施例中,免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
S302、终端判断该注释指令携带的数据文件是否为预设格式的文件。
本发明实施例中,终端接收注释指令之后,将判断注释指令携带的数据文件是否为预设格式的文件;若是,则执行步骤S303;若否,则终端输出用于提示用户包括第一样本的免疫组库数据的数据文件的格式有误的提示信息。可选的,该预设格式包括fasta格式。
S303、若判断结果为是,终端响应该注释指令,从该数据文件中提取该第一样本的免疫组库数据。
S304、终端将提取的该第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从该预设免疫组库数据中获取与该第一样本的免疫组库数据相同的目标免疫组库数据。
本发明实施例中,举例来说,若第一样本的免疫组库数据为多个TCR基因序列,则终端将提取的第一样本的TCR基因序列与预先存储的预设免疫组库数据包含的TCR基因序列进行对比,判断序列是否相同。若第一样本的一TCR基因序列与预设免疫组库数据包含的一TCR基因序列相同,则终端确定预设免疫组库数据包含的该TCR基因序列为目标免疫组库数据。
S305、终端根据预先存储的与该目标免疫组库数据对应的注释数据,生成该第一样本的注释文件。
本发明实施例中,终端预先储存有预设免疫组库数据的注释文件,该注释文件包括预设免疫组库数据的各基因序列对应的注释数据,该注释数据包括V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型。终端将根据与目标免疫组库数据对应的注释数据,对第一样本的免疫组库数据进行注释,生成第一样本的注释文件。
举例来说,若预设免疫组库数据包括的TCR基因序列A为目标免疫组库数据,若第一样本的TCR基因序列B与TCR基因序列A相同,则终端将根据TCR基因序列A对应的注释数据,对第一样本的TCR基因序列B进行注释;具体地,终端将与TCR基因序列A对应的注释数据设置为第一样本的TCR基因序列B的注释数据。
S306、终端接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。
S307、终端响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
在图3所描述的方法中,终端可对第一样本的免疫组库数据进行注释,在得到注释文件之后,可使用该注释文件生成第一样本的V基因频率分布图、D基因频率分布图和J基因频率分布图,高克隆CDR3序列的频率分布图,CDR3的长度分布图,免疫多样性分析图,VDJ基因组合分析图,Ig链类型比例分布图和多Ig链类型共同序列分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
请参阅图4,图4是本发明实施例公开的一种终端的结构示意图。其中,图4所示的终端可以包括接收模块401和输出模块402。其中:
接收模块401,用于接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
本发明实施例中,终端的接收模块401接收针对第一样本的第一分析指令,该第一分析指令携带该第一样本的注释文件。其中,该终端可包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等终端。该终端的操作系统可包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、BlackBerry(黑莓)操作系统和Windows操作系统等等,本发明实施例不做限定。
输出模块402,用于响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
本发明实施例中,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据该第一样本的注释文件,生成并输出针对该第一样本的整体分析图。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类,生成并输出第一样本的V基因频率分布图;该V基因频率分布图用于指示第一样本包括的各V基因种类所具有的数量,即用于指示第一样本的V基因有哪些种类,各种类的数量有多少。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的D基因种类,生成并输出第一样本的D基因频率分布图;该D基因频率分布图用于指示第一样本包括的各D基因种类所具有的数量,即用于指示第一样本的D基因有哪些种类,各种类的数量有多少。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的J基因种类,生成并输出第一样本的J基因频率分布图;该J基因频率分布图用于指示第一样本包括的各J基因种类所具有的数量,即用于指示第一样本的J基因有哪些种类,各种类的数量有多少。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列,统计第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量;终端根据第一样本的高克隆CDR3序列以及各高克隆CDR3序列对应的数量,生成并输出第一样本的高克隆CDR3序列的频率分布图,该高克隆CDR3序列的频率分布图用于指示第一样本的各高克隆CDR3序列所具有的数量。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的各CDR3的长度,并统计第一样本的各CDR3长度对应的数量;在终端确定第一样本的各CDR3长度对应的数量之后,终端将生成并输出第一样本的CDR3的长度分布图,该CDR3的长度分布图用于指示第一样本的各CDR3长度的所具有数量。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的各CDR3序列确定第一样本的香农熵(定义为免疫多样性度量);终端根据计算得到的香农熵生成并输出第一样本的免疫多样性分析图,该免疫多样性分析图用于指示第一样本的免疫多样性,其中,香农熵的值越接近于1说明第一样本的免疫多样性越好,香农熵的值越接近于0说明第一样本的免疫多样性越差。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的Ig链的类型,计算第一样本的各Ig链类型的比例;终端根据第一样本的各Ig链类型的比例,生成并输出第一样本的Ig链类型比例分布图;该Ig链类型比例分布图用于指示第一样本包括的各Ig链类型所占的比例。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出第一样本的多Ig链类型共同序列分析图,该多Ig链类型共同序列分析图用于指示第一样本包括的不同类型的Ig链之间CDR3序列的共享情况。
可选的,接收模块401接收第一分析指令之后,输出模块402将响应该第一分析指令,根据第一样本的注释文件中包括的V基因种类、D基因种类和J基因种类,对第一样本的各V、D和J基因进行组合,计算各VDJ基因组合的数量;终端根据各VDJ基因组合的数量,生成并输出VDJ基因组合分析图,该VDJ基因组合分析图用于指示第一样本的各VDJ基因组合所具有的数量。
作为一种可选的实施方式,所述接收模块401,还用于接收用于对所述第一样本和第二样本进行免疫组库差异分析的第二分析指令,所述第二分析指令携带所述第一样本的注释文件与所述第二样本的注释文件,所述第二样本的注释文件包括所述第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
所述输出模块402,还用于响应所述第二分析指令,根据所述第一样本的注释文件与所述第二样本的注释文件,生成并输出针对所述第一样本和所述第二样本的差异分析图,所述差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据该第一样本的注释文件包括的CDR3序列,统计第一样本的高克隆CDR3序列的比例,并根据该第二样本的注释文件包括的CDR3序列,统计第二样本的高克隆CDR3序列的比例;终端根据第一样本的高克隆CDR3的比例和第二样本的高克隆CDR3的比例,生成并输出针对第一样本和第二样本的高克隆差异分析图,该高克隆差异分析图用于指示第一样本和第二样本的高克隆CDR3比例差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本的注释文件中包括的V基因种类,统计第一样本包括的各V基因种类的数量,并且根据第二样本的注释文件中包括的V基因种类,统计第二样本包括的各V基因种类的数量;终端根据第一样本包括的各V基因种类的数量和第二样本包括的各V基因种类的数量,生成并输出针对第一样本和第二样本的V基因使用频率差异分析图,该V基因使用频率差异分析图用于指示第一样本和第二样本的各V基因种类的数量差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本的注释文件中包括的D基因种类,统计第一样本包括的各D基因种类的数量,并且根据第二样本的注释文件中包括的D基因种类,统计第二样本包括的各D基因种类的数量;终端根据第一样本包括的各D基因种类的数量和第二样本包括的各D基因种类的数量,生成并输出针对第一样本和第二样本的D基因使用频率差异分析图,该D基因使用频率差异分析图用于指示第一样本和第二样本的各D基因种类的数量分布差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本的注释文件中包括的J基因种类,统计第一样本包括的各J基因种类的数量,并且根据第二样本的注释文件中包括的J基因种类,统计第二样本包括的各J基因种类的数量;终端根据第一样本包括的各J基因种类的数量和第二样本包括的各J基因种类的数量,生成并输出针对第一样本和第二样本的J基因使用频率差异分析图,该J基因使用频率差异分析图用于指示第一样本和第二样本的各J基因种类的数量分布差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的CDR3序列和Ig链的类型,生成并输出针对第一样本和第二样本的共同序列分析图,该共同序列分析图用于指示第一样本和第二样本包括的不同类型的Ig链之间CDR3序列的共享差异情况。
可选的,接收模块401接收第二分析指令之后,输出模块402将响应第二分析指令,根据第一样本和第二样本的注释文件中包括的V基因种类、D基因种类和J基因种类,生成并输出针对第一样本和第二样本的主成分分析图。
请一并参阅图5,图5是本发明实施例公开的另一种终端的结构示意图。其中,图5所示的终端是由图4所示的终端进行优化得到的。与图4所示的终端相比较,图5所示的终端除包括图4所示的终端的所有模块外,还可以包括判断模块403、提取模块404、对比模块405和生成模块406。其中:
所述接收模块401,还用于接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,所述注释指令携带包括所述第一样本的免疫组库数据的数据文件。
本发明实施例中,免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列。
所述判断模块403,用于在所述接收模块401接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令之后,判断所述注释指令携带的数据文件是否为预设格式的文件。
本发明实施例中,接收模块401接收注释指令之后,判断模块403将判断注释指令携带的数据文件是否为预设格式的文件;若是,则提取模块404响应注释指令,从数据文件中提取第一样本的免疫组库数据;若否,则终端输出用于提示用户包括第一样本的免疫组库数据的数据文件的格式有误的提示信息。可选的,该预设格式包括fasta格式。
所述提取模块404,用于若所述判断模块403的判断结果为是,则响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据。
所述对比模块405,用于将提取的所述第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从所述预设免疫组库数据中获取与所述第一样本的免疫组库数据相同的目标免疫组库数据。
本发明实施例中,举例来说,若第一样本的免疫组库数据为多个TCR基因序列,则对比模块405将提取模块404提取的第一样本的TCR基因序列与预先存储的预设免疫组库数据包含的TCR基因序列进行对比,判断序列是否相同。若第一样本的一TCR基因序列与预设免疫组库数据包含的一TCR基因序列相同,则对比模块405确定预设免疫组库数据包含的该TCR基因序列为目标免疫组库数据。
所述生成模块406,用于根据预先存储的与所述目标免疫组库数据对应的注释数据,生成所述第一样本的注释文件。
本发明实施例中,终端预先储存有预设免疫组库数据的注释文件,该注释文件包括预设免疫组库数据的各基因序列对应的注释数据,该注释数据包括V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型。生成模块406将根据与目标免疫组库数据对应的注释数据,对第一样本的免疫组库数据进行注释,生成第一样本的注释文件。
举例来说,若预设免疫组库数据包括的TCR基因序列A为目标免疫组库数据,若第一样本的TCR基因序列B与TCR基因序列A相同,则生成模块406将根据TCR基因序列A对应的注释数据,对第一样本的TCR基因序列B进行注释;具体地,生成模块406将与TCR基因序列A对应的注释数据设置为第一样本的TCR基因序列B的注释数据。
在图4和图5所描述的终端中,接收模块将接收针对第一样本的第一分析指令,该第一分析指令携带第一样本的注释文件;接收模块接收第一分析指令之后,输出模块将响应第一分析指令,根据第一样本的注释文件,生成并输出针对第一样本的整体分析图,该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见,实施本发明实施例有利于对免疫组库的状况进行更全面的评估。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-OnlyMemory,ROM)、随机存取器(RandomAccessMemory,RAM)、磁盘或光盘等。
以上对本发明实施例公开的一种免疫组库数据分析方法及终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种免疫组库数据分析方法,其特征在于,所述方法包括:
接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收用于对所述第一样本和第二样本进行免疫组库差异分析的第二分析指令,所述第二分析指令携带所述第一样本的注释文件与所述第二样本的注释文件,所述第二样本的注释文件包括所述第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
响应所述第二分析指令,根据所述第一样本的注释文件与所述第二样本的注释文件,生成并输出针对所述第一样本和所述第二样本的差异分析图,所述差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
3.根据权利要求1所述的方法,其特征在于,所述接收针对第一样本的第一分析指令之前,所述方法还包括:
接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,所述注释指令携带包括所述第一样本的免疫组库数据的数据文件;
响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据;
将提取的所述第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从所述预设免疫组库数据中获取与所述第一样本的免疫组库数据相同的目标免疫组库数据;
根据预先存储的与所述目标免疫组库数据对应的注释数据,生成所述第一样本的注释文件。
4.根据权利要求3所述的方法,其特征在于,所述接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令之后,所述方法还包括:
判断所述注释指令携带的数据文件是否为预设格式的文件;
若判断结果为是,则执行响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据的步骤。
5.根据权利要求4所述的方法,其特征在于,所述预设格式包括fasta格式。
6.一种终端,其特征在于,所述终端包括:
接收模块,用于接收针对第一样本的第一分析指令,所述第一分析指令携带所述第一样本的注释文件,所述注释文件包括所述第一样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第一样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
输出模块,用于响应所述第一分析指令,根据所述第一样本的注释文件,生成并输出针对所述第一样本的整体分析图,所述整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。
7.根据权利要求6所述的终端,其特征在于,
所述接收模块,还用于接收用于对所述第一样本和第二样本进行免疫组库差异分析的第二分析指令,所述第二分析指令携带所述第一样本的注释文件与所述第二样本的注释文件,所述第二样本的注释文件包括所述第二样本的免疫组库数据的V基因种类、D基因种类、J基因种类、CDR3序列和Ig链的类型,所述第二样本的免疫组库数据包括多个TCR基因序列和/或多个BCR基因序列;
所述输出模块,还用于响应所述第二分析指令,根据所述第一样本的注释文件与所述第二样本的注释文件,生成并输出针对所述第一样本和所述第二样本的差异分析图,所述差异分析图包括高克隆差异分析图、免疫多样性差异分析图、V、D和J基因使用频率差异分析图、共有序列分析图和主成分分析图中的任意一种或多种分析图。
8.根据权利要求6所述的终端,其特征在于,所述终端还包括提取模块、对比模块和生成模块,其中:
所述接收模块,还用于接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令,所述注释指令携带包括所述第一样本的免疫组库数据的数据文件;
所述提取模块,用于响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据;
所述对比模块,用于将提取的所述第一样本的免疫组库数据与预先存储的预设免疫组库数据进行对比,从所述预设免疫组库数据中获取与所述第一样本的免疫组库数据相同的目标免疫组库数据;
所述生成模块,用于根据预先存储的与所述目标免疫组库数据对应的注释数据,生成所述第一样本的注释文件。
9.根据权利要求8所述的终端,其特征在于,所述终端还包括:
判断模块,用于在所述接收模块接收用户输入的用于对第一样本的免疫组库数据进行注释的注释指令之后,判断所述注释指令携带的数据文件是否为预设格式的文件;
所述提取模块,还用于若所述判断模块的判断结果为是,则响应所述注释指令,从所述数据文件中提取所述第一样本的免疫组库数据。
10.根据权利要求9所述的方法,其特征在于,所述预设格式包括fasta格式。
CN201510363037.5A 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端 Expired - Fee Related CN105095687B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510363037.5A CN105095687B (zh) 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510363037.5A CN105095687B (zh) 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端

Publications (2)

Publication Number Publication Date
CN105095687A true CN105095687A (zh) 2015-11-25
CN105095687B CN105095687B (zh) 2018-10-26

Family

ID=54576105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510363037.5A Expired - Fee Related CN105095687B (zh) 2015-06-26 2015-06-26 一种免疫组库数据分析方法及终端

Country Status (1)

Country Link
CN (1) CN105095687B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108624667A (zh) * 2018-05-15 2018-10-09 佛山市第人民医院(中山大学附属佛山医院) 一种基于二代测序的t细胞受体库分析方法及装置
WO2018209625A1 (zh) * 2017-05-18 2018-11-22 北京吉因加科技有限公司 一种基于外周血无创性检测病灶免疫组库多样性的分析系统及其用途
CN113707316A (zh) * 2020-11-12 2021-11-26 深圳泛因医学有限公司 免疫状态评估方法及应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102212888A (zh) * 2011-03-17 2011-10-12 靳海峰 一种基于高通量测序的免疫组库构建方法
CN102637244A (zh) * 2011-12-31 2012-08-15 苏州金唯智生物科技有限公司 生物序列分析平台及其使用方法
WO2013155119A1 (en) * 2012-04-13 2013-10-17 Sequenta, Inc. Detection and quantitation of sample contamination in immune repertoire analysis
CN103617256A (zh) * 2013-11-29 2014-03-05 北京诺禾致源生物信息科技有限公司 待变异检测文件的处理方法及装置
CN103710454A (zh) * 2013-12-31 2014-04-09 南方科技大学 Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
CN104520443A (zh) * 2012-06-11 2015-04-15 赛昆塔公司 使用序列标签的序列确定方法
WO2015075939A1 (ja) * 2013-11-21 2015-05-28 Repertoire Genesis株式会社 T細胞受容体およびb細胞受容体レパトアの解析システムならびにその治療および診断への利用
CN104673892A (zh) * 2014-12-30 2015-06-03 南方科技大学 开发恒河猴t细胞免疫组库的引物组、高通量测序方法及应用

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102212888A (zh) * 2011-03-17 2011-10-12 靳海峰 一种基于高通量测序的免疫组库构建方法
CN102637244A (zh) * 2011-12-31 2012-08-15 苏州金唯智生物科技有限公司 生物序列分析平台及其使用方法
WO2013155119A1 (en) * 2012-04-13 2013-10-17 Sequenta, Inc. Detection and quantitation of sample contamination in immune repertoire analysis
CN104520443A (zh) * 2012-06-11 2015-04-15 赛昆塔公司 使用序列标签的序列确定方法
WO2015075939A1 (ja) * 2013-11-21 2015-05-28 Repertoire Genesis株式会社 T細胞受容体およびb細胞受容体レパトアの解析システムならびにその治療および診断への利用
CN103617256A (zh) * 2013-11-29 2014-03-05 北京诺禾致源生物信息科技有限公司 待变异检测文件的处理方法及装置
CN103710454A (zh) * 2013-12-31 2014-04-09 南方科技大学 Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
CN104673892A (zh) * 2014-12-30 2015-06-03 南方科技大学 开发恒河猴t细胞免疫组库的引物组、高通量测序方法及应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ADRIEN SIX等: "The Past, Present, and Future of Immune Repertoire Biology – The Rise of Next-Generation Repertoire Analysis", 《FRONTIERS IN IMMUNOLOGY》 *
付钰 等: "免疫组库的临床应用", 《国际免疫学杂志》 *
刘红亮: "基于高通量测序的辽宁绒山羊转录组研究与应用", 《中国优秀硕士学位论文全文数据库农业科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018209625A1 (zh) * 2017-05-18 2018-11-22 北京吉因加科技有限公司 一种基于外周血无创性检测病灶免疫组库多样性的分析系统及其用途
CN108624667A (zh) * 2018-05-15 2018-10-09 佛山市第人民医院(中山大学附属佛山医院) 一种基于二代测序的t细胞受体库分析方法及装置
CN113707316A (zh) * 2020-11-12 2021-11-26 深圳泛因医学有限公司 免疫状态评估方法及应用
CN113707316B (zh) * 2020-11-12 2024-03-26 深圳泛因医学有限公司 免疫状态评估方法及应用

Also Published As

Publication number Publication date
CN105095687B (zh) 2018-10-26

Similar Documents

Publication Publication Date Title
CN104346566A (zh) 检测隐私权限风险的方法、装置、终端、服务器及系统
CN113378835B (zh) 标注模型训练、样本标注方法及相关装置
RU2011152811A (ru) Способ выявления ложных положительных результатов сканирования файлов на вредоносное по
US10803861B2 (en) Method and apparatus for identifying information
CN107688533B (zh) 应用程序测试方法、装置、计算机设备和存储介质
Melsted et al. Fusion detection and quantification by pseudoalignment
CN105095687A (zh) 一种免疫组库数据分析方法及终端
CN104238819A (zh) 移动终端中显示屏状态的检测方法及系统
CN112506798B (zh) 一种区块链平台的性能测试方法、装置、终端及存储介质
CN111782546A (zh) 一种基于机器学习的自动接口测试方法及装置
WO2017190577A1 (zh) 一种认证、用于认证的信息生成方法及装置
CN105072197A (zh) 一种信息推荐方法及装置
CN106557308A (zh) 一种软件持续集成方法及装置
CN103914212B (zh) 一种终端设备及其应用配置方法
CN104977525A (zh) 一种手动编辑飞针测试文件的方法
CN111160410A (zh) 一种物体检测方法和装置
CN107783867B (zh) 手势测试方法、装置、计算机设备和存储介质
CN111324470A (zh) 用于生成信息的方法及装置
CN113626301B (zh) 生成测试脚本的方法和装置
CN105403221A (zh) 一种导航路线的生成方法及移动终端
CN109324964A (zh) 基于系统多个版本的压力测试方法及装置
CN114880422A (zh) 基于机器人流程自动化的兴趣点信息处理方法、相关装置
CN110532304B (zh) 数据处理方法及装置、计算机可读存储介质以及电子设备
Park et al. Analysis of task success rate for classifying 2D-touch and 3D-touch through threshold
CN102378005A (zh) 运动图像处理装置、运动图像处理方法和程序

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181026

Termination date: 20200626

CF01 Termination of patent right due to non-payment of annual fee