CN114203254B - 一种基于人工智能分析免疫特征相关tcr的方法 - Google Patents

一种基于人工智能分析免疫特征相关tcr的方法 Download PDF

Info

Publication number
CN114203254B
CN114203254B CN202111459551.0A CN202111459551A CN114203254B CN 114203254 B CN114203254 B CN 114203254B CN 202111459551 A CN202111459551 A CN 202111459551A CN 114203254 B CN114203254 B CN 114203254B
Authority
CN
China
Prior art keywords
tcr
samples
tcr clone
algorithm
clone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111459551.0A
Other languages
English (en)
Other versions
CN114203254A (zh
Inventor
孙涛
周凯悦
徐鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Immuquad Biotechnologies LLC
Original Assignee
Hangzhou Immuquad Biotechnologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Immuquad Biotechnologies LLC filed Critical Hangzhou Immuquad Biotechnologies LLC
Priority to CN202111459551.0A priority Critical patent/CN114203254B/zh
Publication of CN114203254A publication Critical patent/CN114203254A/zh
Application granted granted Critical
Publication of CN114203254B publication Critical patent/CN114203254B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,包括样本获取步骤,样本测序步骤,样本合并步骤,TCR克隆相关度阈值确定步骤,模型建立步骤和实例检测步骤,本申请方案在进行前期信息采集时候,可以通过采集已经治疗完成的患者进行采样收集,可以通过采集已确诊患者外周血PBMC,并进行TCR高通量测序获得TCR数据用于机器学习,再根据受试者TCR数据病史信息分析该受试者样本数据是否存在相应的免疫特征的可能,有助于参与测试的人员受试者能及时发现相关疾病风险,到医院进行进一步的针对性检测测试。并且本申请即使针对未知疾病,也可以针对症状选取训练样本的受试人员,对相关症状发生的可能性进行检测,预防风险。

Description

一种基于人工智能分析免疫特征相关TCR的方法
技术领域
本发明涉及分子生物学检测领域,特别涉及一种基于人工智能分析免疫特征相关TCR的方法。
背景技术
目前,在体检时,被体检人员需要检验各种项目来针对相应器官性能,如果相关指标发生异常时,才能发现相关问题,检测能针对的疾病通常是重大疾病或者是常见疾病,能够检测出来的相应问题较少,安全隐患不能及时排除。
发明内容
本发明的目的是提供一种基于人工智能分析免疫特征相关TCR的方法,其具有可综合分析多种免疫相关TCR特征的优点。
本发明的上述技术目的是通过以下技术方案得以实现的:
TCR数据样本获取步骤,获取训练样本,所述训练样本包括第一数量的阳性样本和第二数量的阴性样本;
样本测序步骤,获取每一训练样本的TCR免疫组数据;
样本TCR数据二次处理合并步骤,对所有训练样本的TCR beta CDR3序列进行合并然后去重,得到若干TCR克隆种类序列,定义每一TCR克隆种类序列对应的阳性样本的数量为该TCR克隆种类序列的阳性数值,每一TCR克隆种类序列对应的阴性样本数量为该TCR克隆种类序列的阴性数值;
TCR克隆相关度阈值确定步骤,利用Fisher精确检验,确定每一TCR克隆种类序列的实际相关值,并通过数据处理校验确定最佳TCR克隆相关度阈值;
模型建立步骤,将实际相关值小于TCR克隆相关度阈值的TCR克隆种类序列定义为特异性序列,并根据特异性序列生成识别模型;
实例检测步骤,将待检测的TCR免疫组数据输入识别模型中,通过第一预设算法计算待检测的TCR免疫组数据与对应的特异性序列的相关度确定该TCR免疫组数据对应的检测结果。
通过采用上述技术方案,T细胞(抗原)受体(T Cell Receptor,TCR)为所有T细胞表面的特征性标志,以非共价键与CD3结合,形成TCR-CD3复合物。TCR的作用是识别抗原。TCR是由两条不同肽链构成的异二聚体,由α、β两条肽链组成,每条肽链又可分为可变区(V区)、多变区(D区)、连结区(J区)和恒定区(C区)、跨膜区和胞质区等几部分;其特点是胞质区很短。TCR分子属于免疫球蛋白超家族,其抗原特异性主要存在于TCR中的V区;V区(Vα、Vβ)又各有三个高变区CDR1、CDR2、CDR3,其中以CDR3区域变异最大,CDR3直接决定了TCR的抗原结合特异性。在TCR识别MHC-抗原肽复合体时,CDR1,CDR2识别和结合MHC分子抗原结合槽的侧壁,而CDR3直接与抗原肽相结合。
T细胞能识别微量的疾病抗原,每种T细胞的TCR能特异性地识别疾病抗原,T细胞是全身存在且互通的,T细胞识别到某种疾病信号后,会产生克隆性增殖,从而容易被检测到和T细胞有抗原记忆能力,能持续长达6个月以上。本申请方案在进行前期信息采集时候,可以通过采集已确诊患者外周血PBMC,并进行TCR高通量测序获得TCR数据用于机器学习,再根据受试者TCR数据分析该受试者是否存在相应疾病的免疫特征的可能,可以通过采集已经治疗完成的患者进行采样收集,根据受试者病史信息分析样本数据是否存在相应疾病的可能,有助于受试者参与测试的人员能及时发现相关疾病风险,到医院进行进一步的针对性测试检测。并且本申请即使针对未知疾病,也可以针对症状选取训练样本的受试人员,对相关症状发生的可能性进行检测,预防风险。
本发明把免疫组基因测序和人工智能相结合,把上千万种TCR映射到上百万种的疾病抗原,从而通过免疫系统检测绝大多数疾病的抗原。
进一步设置:样本获取步骤中获取训练样本时采用高通量测序。
高通量测序技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降,从而使得本申请方案的实施成为可能。
进一步设置:TCR克隆相关度阈值确定步骤中,通过FDR、交叉熵损失函数和ROC曲线筛选出Fisher精确检验得出的P值,最终得出最佳TCR克隆相关度阈值。
进一步设置:TCR克隆相关度阈值确定步骤中,通过FDR修正时,限定FDR结果不大于20%。
进一步设置:TCR克隆相关度阈值确定步骤中,ROC曲线针对TCR免疫组数据和FDR及交叉熵损失修正后得到的P值,结合已知的测试预测数据的真实分类,继续计算真阳性、假阳性、假阴性、真阴性的样本个数,从而得到针对各个不同TCR克隆相关度阈值计算得到的灵敏性和特异性,并绘制得到ROC曲线,ROC曲线与X轴围成的面积AUC最大的阈值,为最佳TCR克隆相关度阈值。
通过采用上述技术方案,通过FDR和交叉熵损失函数对计算出来的P值进行筛选和校正,从而提高P值的准确度,再由ROC曲线最终得出相关度阈,得出的数据可靠性较高,提高检验结果的准确性。
进一步设置:实例检测步骤,第一预设算法采用KNN最近临近算法和二元分类器算法相结合。
进一步设置:所述二元分类器算法包括支持向量机算法和logistics回归算法。
通过采用上述技术方案,通过二元分类器算法得出结果,结果清晰准确,KNN方法思路简单,易于理解,易于实现,无需估计参数。
进一步设置:所述实例检测步骤前包括算法验证步骤,所述算法验证步骤包括获取验证样本,并将验证样本通过若干备选算法与识别模型验证,得出检测准确率,选取准确率高的算法作为第一预设算法。
通过采用上述技术方案,对识别算法进行对比判断,从而可以选择准确率较高的算法进行识别,提高识别准确性。
进一步设置:还包括再次学习步骤,将实验检测步骤的TCR免疫组数据进行记录,并同时计数,当数量达到原样本数量的1/10时,对该免疫特征的TCR识别模型进行重新构建。
通过采用上述技术方案,可以在实际应用过程中,完成检测的同时增加样本量,来提高检测的准确性。
附图说明
图1是实施例1中TCR测序数据示例图;
图2是实施例1中采用交叉熵损失函数对样本数据处理的结果图;
图3实施例1中采用错误发现率对样本数据处理的结果图。
具体实施方式
以下结合附图对本发明做进一步详细说明。
实施例1:
一种基于人工智能分析A免疫特征相关TCR的方法,包括如下步骤:
样本获取步骤,获取A免疫特征的训练样本,训练样本包括不少于250个的阳性样本(患A疾病的人员)和不少于250个的阴性样本(未患A疾病的人员);
样本测序步骤,获取每一训练样本的TCR免疫组数据,并在服务器中对TCR免疫组数据进行记录,记录时通过记录TCRβ链的CDR3的氨基酸序列,并按照频率高低顺序进行排序,图1是TCR测序数据示例,展示了每一个样本在TCR测序分析后的原始数据;
样本TCR数据二次处理合并步骤,对上述所有样本全部TCR免疫组数据进行二次数据处理合并,并将所有样本的TCR数据合并成一个样本的TCR数据。然后,去统计每一条TCR克隆在阳性样本中有N1个样本含有这条克隆,有N3个样本中没有;在阴性样本中有N2个样本含有这条克隆,有N4个样本中没有。每一条TCR克隆将获得4组统计数据:1.N1(出现在阳性样本中的个数);2.N3(没出现在阳性样本中的个数);3.N2(出现在阴性样本中的个数);4.N4(没出现在阴性样本中的个数)。
TCR克隆相关度阈值确定步骤,对每一TCR克隆种类序列,以阳性样本和阴性样本为第一分类,以阳性数值和阴性数值为第二分类,通过Fisher精确检验,确定该TCR克隆种类序列的相关值,通过该方式计算全部TCR克隆种类序列的实际相关值;
通过交叉熵损失对数据进行处理,参见图2交叉熵损失函数图,绘制了交叉熵损失函数随着p值阈值的选取而变化的趋势。随着p值阈值的增大,损失函数的值是相应减小的。
交叉熵损失计算,参见下式,全部TCR克隆种类序列的数量为N,样本序号为i,yi为样本的label,阳性为1,阴性为0;pi为样本的实际相关值。
Figure BDA0003389354120000051
通过FDR计算,将全部TCR克隆种类序列的实际相关值排序,以全部TCR克隆种类序列的数量为总数,进行FDR计算,得出FDR结果,参见图3错误发现率;错误发现率是随着阈值的增加而增大的。结合图二交叉熵损失函数随着P值阈值的趋势,要选取一个阈值,使得错误发现率和损失函数同时处于较低的水平,结合图1和图2可以得出P值为10-1~10-6时,错误发现率和损失函数同时处于较低的水平。
然后通过ROC曲线最终确定最佳阈值,P是真实正样本的个数,N是真实负样本的个数。TP为P个正样本中被分类器预测也为正的样本个数,FP是N个负样本中被分类器预测为正样本的个数,TN为N个负样本中被分类器预测也为阴性的样本个数,FN为P个正样本中被分类器预测为负的样本个数,真阳率TPR=TP/(TP+FN),假阳率FPR=FP/(FP+TN),以TPR为Y轴,FPR为X轴绘制ROC曲线。AUC为ROC曲线与X轴所围成的面积,AUC越大说明模型的拟合效果越好,对应的p值的阈值找得越合适。取该实验中阈值为10-4时得到的AUC值最大,因此选择10-4作为阈值最佳。
模型建立步骤,将实际相关值小于最佳TCR克隆相关度阈值的TCR克隆种类序列定义为A疾病特异性序列,并根据特异性序列生成识别模型;
识别模型以每个样本特有的TCR种类数(丰度)为X轴,与A疾病特异性序列重叠的TCR种类数为Y轴,将阳性与阴性的训练样本的对应数据带入,结合X,Y坐标轴和对应样本的阳性阴性分类。
算法验证步骤,准备验证样本,包括53例阳性样本和96例阴性样本,对验证样本的每个样本进行测序,得出TCR种类数(丰度)为X轴,与A疾病特异性序列重叠的TCR种类数。
将识别模型中TCR种类数(丰度)和与A疾病特异性序列重叠的TCR种类数作为识别自变量,阳性或阴性定位识别因变量,通过支持向量机建立支持向量机识别模型,并通过验证样本的TCR种类数(丰度)和与A疾病特异性序列重叠的TCR种类数作为验证自变量,去得出验证阳性或验证阴性,与验证样本的实际阳性和阴性进行比对,对每个验证样本进行计算后,得出验证正确样本数为51例阳性和96例阴性,验证准确率为98.66%。
将识别模型中TCR种类数(丰度)和与A疾病特异性序列重叠的TCR种类数作为识别自变量,阳性或阴性定位识别因变量,通过KNN算法建立KNN识别模型,并通过验证样本的TCR种类数(丰度)和与A疾病特异性序列重叠的TCR种类数作为验证自变量,去得出验证阳性或验证阴性,与验证样本的实际阳性和阴性进行比对,对每个验证样本进行计算后,得出验证正确样本数为45例阳性和89例阴性,验证准确率为89.93%。
将识别模型中TCR种类数(丰度)和与A疾病特异性序列重叠的TCR种类数作为识别自变量,阳性或阴性定位识别因变量,通过logistics回归算法建立logistics回归识别模型,并通过验证样本的TCR种类数(丰度)和与A疾病特异性序列重叠的TCR种类数作为验证自变量,去得出验证阳性或验证阴性,与验证样本的实际阳性和阴性进行比对,对每个验证样本进行计算后,得出验证正确样本数为37例阳性和80例阴性,验证准确率为78.52%。
实例检测步骤,将待检测的TCR免疫组数据样本D输入支持向量机识别模型中,采用支持向量机进行算法判断,得出TCR免疫组数据样本D为阳性。
还包括再次学习步骤,将实验检测步骤的TCR免疫组数据进行记录,并同时计数,当数量达到原样本数量的1/10时,对该免疫特征的TCR识别模型进行重新构建。
以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所做的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。

Claims (7)

1.一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,包括如下步骤:
TCR数据样本获取步骤,获取训练样本,所述训练样本包括第一数量的阳性样本和第二数量的阴性样本;
样本测序步骤,获取每一训练样本的TCR免疫组数据;
样本TCR数据二次处理合并步骤,对所有训练样本的TCRbetaCDR3序列进行合并然后去重,得到若干TCR克隆种类序列,定义每一TCR克隆种类序列对应的阳性样本的数量为该TCR克隆种类序列的阳性数值,每一TCR克隆种类序列对应的阴性样本数量为该TCR克隆种类序列的阴性数值;
TCR克隆相关度阈值确定步骤,利用Fisher精确检验,确定每一TCR克隆种类序列的实际相关值,并通过数据处理校验确定最佳TCR克隆相关度阈值;
TCR克隆相关度阈值确定步骤中,对每一TCR克隆种类序列,以阳性样本和阴性样本为第一分类,以阳性数值和阴性数值为第二分类,通过Fisher精确检验,确定该TCR克隆种类序列的相关值,通过该方式计算全部TCR克隆种类序列的实际相关值;
通过交叉熵损失对数据进行处理;
通过FDR计算,将全部TCR克隆种类序列的实际相关值排序,以全部TCR克隆种类序列的数量为总数,进行FDR计算,得出FDR结果;
通过ROC曲线最终确定最佳阈值:以真阳率TPR为Y轴,假阳率FPR为X轴绘制ROC曲线,AUC为ROC曲线与X轴所围成的面积,AUC越大说明模型的拟合效果越好,对应的p值的阈值找得越合适;
模型建立步骤,将实际相关值小于TCR克隆相关度阈值的TCR克隆种类序列定义为特异性序列,并根据特异性序列生成识别模型;
实例检测步骤,将待检测的TCR免疫组数据输入识别模型中,通过第一预设算法计算待检测的TCR免疫组数据与对应的特异性序列的相关度确定该TCR免疫组数据对应的检测结果;所述实例检测步骤前包括算法验证步骤,所述算法验证步骤包括获取验证样本,并将验证样本通过若干备选算法与识别模型验证,得出检测准确率,选取准确率高的算法作为第一预设算法;
所述方法还包括:
再次学习步骤,将实验检测步骤的TCR免疫组数据进行记录,并同时计数,当数量达到原样本数量的1/10时,对该免疫特征的TCR识别模型进行重新构建。
2.根据权利要求1所述的一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,样本获取步骤中获取训练样本时采用高通量测序。
3.根据权利要求1所述的一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,TCR克隆相关度阈值确定步骤中,通过FDR、交叉熵损失函数和ROC曲线筛选出Fisher精确检验得出的P值,最终得出最佳TCR克隆相关度阈值。
4.根据权利要求3所述的一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,TCR克隆相关度阈值确定步骤中,ROC曲线针对TCR免疫组数据和FDR及交叉熵损失修正后得到的P值,结合已知的测试预测数据的真实分类,继续计算真阳性、假阳性、假阴性、真阴性的样本个数,从而得到针对各个不同TCR克隆相关度阈值计算得到的灵敏性和特异性,并绘制得到ROC曲线,ROC曲线与X轴围成的面积AUC最大的阈值,为最佳TCR克隆相关度阈值。
5.根据权利要求4所述的一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,TCR克隆相关度阈值确定步骤中,通过FDR修正时,限定FDR结果不大于20%。
6.根据权利要求1所述的一种基于人工智能分析免疫特征相关TCR的方法,其特征在于,所述实例检测步骤中,第一预设算法采用KNN最近临近算法、二元分类器算法中的一种或多种算法结合。
7.根据权利要求6所述的一种基于人工智能分析免疫特征相关TCR的方法,所述二元分类器算法包括支持向量机算法和logistics回归算法。
CN202111459551.0A 2021-12-02 2021-12-02 一种基于人工智能分析免疫特征相关tcr的方法 Active CN114203254B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111459551.0A CN114203254B (zh) 2021-12-02 2021-12-02 一种基于人工智能分析免疫特征相关tcr的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111459551.0A CN114203254B (zh) 2021-12-02 2021-12-02 一种基于人工智能分析免疫特征相关tcr的方法

Publications (2)

Publication Number Publication Date
CN114203254A CN114203254A (zh) 2022-03-18
CN114203254B true CN114203254B (zh) 2023-05-23

Family

ID=80650191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111459551.0A Active CN114203254B (zh) 2021-12-02 2021-12-02 一种基于人工智能分析免疫特征相关tcr的方法

Country Status (1)

Country Link
CN (1) CN114203254B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111363783A (zh) * 2018-12-26 2020-07-03 武汉康测科技有限公司 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法
CN111624342A (zh) * 2020-07-11 2020-09-04 成都益安博生物技术有限公司 一种卵巢癌的外周血tcr标志物及其检测试剂盒和应用
CN111681717A (zh) * 2020-05-28 2020-09-18 北京银谷芳香科技有限公司 基于人工智能的中药质量控制与天然物功效预测模型及其构建和使用方法
CN111944902A (zh) * 2020-08-04 2020-11-17 佛山科学技术学院 一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法
CN112927757A (zh) * 2021-02-24 2021-06-08 河南大学 基于基因表达和dna甲基化数据的胃癌生物标志物识别方法
CN113421609A (zh) * 2021-08-08 2021-09-21 上海市嘉定区中心医院 一种基于lncRNA对的结肠癌预后预测模型及其构建方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016222788B2 (en) * 2015-02-24 2022-03-31 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
AU2018235623A1 (en) * 2017-03-15 2019-08-22 Hyogo College Of Medicine Novel biomarkers for cancer immunotherapy
CN110675914B (zh) * 2019-09-17 2024-01-26 佛山市第一人民医院(中山大学附属佛山医院) 一种筛选肿瘤特异性t细胞及tcr的方法
CN111429965B (zh) * 2020-03-19 2023-04-07 西安交通大学 一种基于多连体特征的t细胞受体对应表位预测方法
CN113160887B (zh) * 2021-04-23 2022-06-14 哈尔滨工业大学 一种融合了单细胞tcr测序数据的肿瘤新生抗原筛选方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111363783A (zh) * 2018-12-26 2020-07-03 武汉康测科技有限公司 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法
CN111681717A (zh) * 2020-05-28 2020-09-18 北京银谷芳香科技有限公司 基于人工智能的中药质量控制与天然物功效预测模型及其构建和使用方法
CN111624342A (zh) * 2020-07-11 2020-09-04 成都益安博生物技术有限公司 一种卵巢癌的外周血tcr标志物及其检测试剂盒和应用
CN111944902A (zh) * 2020-08-04 2020-11-17 佛山科学技术学院 一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法
CN112927757A (zh) * 2021-02-24 2021-06-08 河南大学 基于基因表达和dna甲基化数据的胃癌生物标志物识别方法
CN113421609A (zh) * 2021-08-08 2021-09-21 上海市嘉定区中心医院 一种基于lncRNA对的结肠癌预后预测模型及其构建方法

Also Published As

Publication number Publication date
CN114203254A (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
DeWitt III et al. Human T cell receptor occurrence patterns encode immune history, genetic background, and receptor specificity
CN108763865B (zh) 一种预测dna蛋白质结合位点的集成学习方法
CN113160887A (zh) 一种融合了单细胞tcr测序数据的肿瘤新生抗原筛选方法
WO2023104173A1 (zh) 基于人脑功能磁共振影像的自闭症分类器构建方法及系统
CN114446389B (zh) 一种肿瘤新抗原特征分析与免疫原性预测工具及其应用
CN107208131A (zh) 用于肺癌分型的方法
CN110191964B (zh) 确定生物样本中预定来源的游离核酸比例的方法及装置
Baidya et al. A deep prediction of chronic kidney disease by employing machine learning method
CN106156541B (zh) 分析个体两类状态的免疫差异的方法和装置
CN115896242A (zh) 一种基于外周血免疫特征的癌症智能筛查模型及方法
CN113096737B (zh) 一种用于对病原体类型进行自动分析的方法及系统
CN114203254B (zh) 一种基于人工智能分析免疫特征相关tcr的方法
CN112599190B (zh) 一种基于混合分类器来识别耳聋相关基因的方法
Kabir et al. Multi-classification based Alzheimer's disease detection with comparative analysis from brain MRI scans using deep learning
CN112259157A (zh) 一种蛋白质相互作用预测方法
Andryushchenko et al. Statistical classification of immunosignatures under significant reduction of the feature space dimensions for early diagnosis of diseases
CN113393902A (zh) 基于免疫表征技术对样本分类的方法、装置及存储介质
CN112966702A (zh) 蛋白质-配体复合物的分类方法及分类装置
WO2023018343A1 (en) Automatic detection and differentiation of pancreatic cystic lesions in endoscopic ultrasonography
Debnath et al. A supervised machine learning approach for sequence based protein-protein interaction (ppi) prediction
CN113178257A (zh) 肺结节的分类模型的训练方法
CN116635950A (zh) 样本定量分析的改进或与样本定量分析相关的改进
JP2013505012A5 (zh)
Cao et al. Prediction of microsatellite instability of colorectal cancer using multi-scale pathological images based on deep learning
WO2022205775A1 (zh) 确定个体免疫力指数的方法、设备、电子设备和机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant