CN110163243B - 基于接触图与模糊c均值聚类的蛋白质结构域划分方法 - Google Patents

基于接触图与模糊c均值聚类的蛋白质结构域划分方法 Download PDF

Info

Publication number
CN110163243B
CN110163243B CN201910268930.8A CN201910268930A CN110163243B CN 110163243 B CN110163243 B CN 110163243B CN 201910268930 A CN201910268930 A CN 201910268930A CN 110163243 B CN110163243 B CN 110163243B
Authority
CN
China
Prior art keywords
contact
protein
information
fuzzy
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910268930.8A
Other languages
English (en)
Other versions
CN110163243A (zh
Inventor
胡俊
饶亮
刘俊
周晓根
陈伟锋
张贵军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhaoji Biotechnology Co ltd
Shenzhen Xinrui Gene Technology Co ltd
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910268930.8A priority Critical patent/CN110163243B/zh
Publication of CN110163243A publication Critical patent/CN110163243A/zh
Application granted granted Critical
Publication of CN110163243B publication Critical patent/CN110163243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法,首先根据输入的待进行结构域划分的蛋白质序列信息,使用RaptorX‑Contact服务器预测蛋白质的接触图信息;然后对接触图信息进行加权处理;其次使用模糊C均值聚类算法对接触图信息进行聚类;再次根据聚类信息进行蛋白质结构域的划分;最后,使用I‑TASSER服务器预测每个结构域的三维结构。本发明提供一种计算代价低、划分精度高的一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法。

Description

基于接触图与模糊C均值聚类的蛋白质结构域划分方法
技术领域
本发明涉及生物信息学、模式识别与计算机应用领域,具体而言涉及一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法。
背景技术
在生命活动中,蛋白质为了完成复杂的生物功能,往往是以多结构域的形式存在的。每个蛋白质结构域都可以独立于蛋白质的其余部分发挥特定的生物学功能。在蛋白质分子的进化过程中,蛋白质结构域可以以不同的排列方式重新组合,从而产生具有不同功能的蛋白质。因此,精确地进行蛋白质结构域划分,有助于蛋白质功能的研究及药物靶蛋白的设计,具有十分重要的指导意义。
目前,专门用于蛋白质结构域划分的方法有:FIEFDom(Bondugula R,etal.FIEFDom:a transparent domain boundary recognition system using a fuzzymean operator[J].Nucleic acids research,2008,37(2):452-462.即:Bondugula R等.FIEFDom:一种基于模糊均值算子的明显域边界识别系统[J].核酸研究,2008,37(2):452-462)、DomPro(Cheng J,et al.DOMpro:protein domain prediction using profiles,secondary structure,relative solvent accessibility,and recursive neuralnetworks[J].Data Mining and Knowledge Discovery,2006,13(1):1-10.即:Cheng J等.DOMpro:利用谱文件、二级结构、相对溶剂可及性和递归神经网络预测蛋白质结构域[J].数据挖掘与知识发现,2006,13(1):1-10)、ThreaDom(Xue Z,et al.ThreaDom:extractingprotein domain boundary information from multiple threading alignments[J].Bioinformatics,2013,29(13):i247-i256.,即:Xue Z等.ThreaDom:从多线程对齐中提取蛋白域边界信息[J].生物信息学,2013,29(13):i247-i256)与ThreaDomEx(Wang Y,etal.ThreaDomEx:a unified platform for predicting continuous and discontinuousprotein domains by multiple-threading and segment assembly[J].Nucleic acidsresearch,2017,45(W1):W400-W407.即:Wang Y等.ThreaDomEx:一个通过多线程和分段装配来预测连续和不连续蛋白质结构域的统一平台[J].核酸研究.2017,45(W1):W400-W407)等。相比于其他的蛋白质结构域划分方法,ThreaDomEx方法在结构域划分精度方面更加优秀。ThreaDomEx首先根据输入蛋白质序列信息,从现存数据库中搜索出与输入蛋白质同源、相似的蛋白质,并以此蛋白质结构作为模板结构;然后根据模板结构计算结构域保守分数来推断结构域的边界;最后,利用边界聚类方法对域模型的选择进行优化。由于ThreaDomEx需要搜索现存数据库,并不能保证每次搜索到的模板结构都是优秀的,且搜索数据库需要花费大量的时间,所以其得到的结构域划分信息并不能保证是最优的且划分效率有待进一步提升。
综上所述,现存的蛋白质结构域划分方法在计算代价、划分精确性方面,距离实际应用的要求还有很大差距,迫切地需要改进。
发明内容
为了克服现有蛋白质结构域划分方法在计算代价、划分精确性方面的不足,本发明提出一种计算代价低、划分精确性高的基于接触图与模糊C均值聚类的蛋白质结构域划分方法。
本发明解决其技术问题所采用的技术方案是:
一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法,所述方法包括以下步骤:
1)输入待进行结构域划分的蛋白质序列信息,记作S;
2)使用RaptorX-Contact服务器(http://raptorx.uchicago.edu/ContactMap/)对蛋白质序列S进行接触图预测,预测出的接触图信息记作
Figure GDA0002733690500000021
其中L表示蛋白质序列S的残基数目,mi,j∈{0,1}表示S中的第i残基Ri与第j个残基Rj的接触状态:mi,j=1表示两个残基接触,mi,j=0表示两个残基不接触;
3)对M中的任意元素mi,j,使用一个2k+1行2k+1列的权重矩阵W:
Figure GDA0002733690500000022
进行如下处理,得到
Figure GDA0002733690500000023
Figure GDA0002733690500000024
其中
Figure GDA0002733690500000031
4)使用步骤3)将M中的所有元素依次进行处理,并使用得到的所有
Figure GDA0002733690500000032
组成一个新的接触图信息
Figure GDA0002733690500000033
5)使用
Figure GDA0002733690500000034
中第i列的所有元素组成蛋白质序列S中的第i个残基Ri的特征向量,记作
Figure GDA0002733690500000035
6)使用模糊C均值聚类算法,将所有xi聚类成N个簇,分别记作C1,C2,…,CN
7)对于任意一个簇Cn,n=1,2,…,N,中的任意一个元素
Figure GDA0002733690500000036
进行如下操作:若
Figure GDA0002733690500000037
Figure GDA0002733690500000038
也在Cn中,则
Figure GDA0002733690500000039
保留;否则将
Figure GDA00027336905000000310
从Cn中移除,并放入集合
Figure GDA00027336905000000311
中;
8)对
Figure GDA00027336905000000312
中的任意一个元素
Figure GDA00027336905000000313
进行如下操作:若
Figure GDA00027336905000000314
Figure GDA00027336905000000315
在Cn,n=1,2,…,N,中,则将
Figure GDA00027336905000000316
放入Cn中;
9)对于任意一个簇Cn,n=1,2,…,N,进行如下操作:将Cn中的每个元素
Figure GDA00027336905000000317
对应的残基
Figure GDA00027336905000000318
放入集合Dn中;
10)根据残基在蛋白质中的位置信息对每个集合Dn,n=1,2,…,N,中的所有残基进行排序;排序后的每个集合Dn,n=1,2,…,N,表示输入蛋白质中对应的一个结构域;
11)使用I-TASSER服务器(https://zhanglab.ccmb.med.umich.edu/I-TASSER/)分别对划分出的每个结构域进行结构预测。
本发明的技术构思为:首先根据输入的待进行结构域划分的蛋白质序列信息,使用RaptorX-Contact服务器预测蛋白质的接触图信息;然后对接触图信息进行加权处理;其次使用模糊C均值聚类算法对接触图信息进行聚类;再次根据聚类信息进行蛋白质结构域的划分;最后,使用I-TASSER服务器预测每个结构域的三维结构。本发明提供一种计算代价低、划分精度高的一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法。
本发明的有益效果表现在:一方面,从蛋白质接触图中提取氨基酸残基的周边接触信息,获取了更多有用信息,为进一步提升蛋白质结构域划分的精确度做好了准备;另一方面,根据残基的接触图信息,使用模糊C均值聚类算法进行域划分,提高了蛋白质结构域划分的效率与精确性。
附图说明
图1为一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法的示意图。
图2为使用一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法对蛋白质3ub1A进行结构域划分后的结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法,包括以下步骤:
1)输入待进行结构域划分的蛋白质序列信息,记作S;
2)使用RaptorX-Contact服务器(http://raptorx.uchicago.edu/ContactMap/)对蛋白质序列S进行接触图预测,预测出的接触图信息记作
Figure GDA0002733690500000041
其中L表示蛋白质序列S的残基数目,mi,j∈{0,1}表示S中的第i残基Ri与第j个残基Rj的接触状态:mi,j=1表示两个残基接触,mi,j=0表示两个残基不接触;
3)对M中的任意元素mi,j,使用一个2k+1行2k+1列的权重矩阵W:
Figure GDA0002733690500000042
进行如下处理,得到
Figure GDA0002733690500000043
Figure GDA0002733690500000044
其中
Figure GDA0002733690500000045
4)使用步骤3)将M中的所有元素依次进行处理,并使用得到的所有
Figure GDA0002733690500000046
组成一个新的接触图信息
Figure GDA0002733690500000047
5)使用
Figure GDA0002733690500000048
中第i列的所有元素组成蛋白质序列S中的第i个残基Ri的特征向量,记作
Figure GDA0002733690500000049
6)使用模糊C均值聚类算法,将所有xi聚类成N个簇,分别记作C1,C2,…,CN
7)对于任意一个簇Cn,n=1,2,…,N,中的任意一个元素
Figure GDA0002733690500000051
进行如下操作:若
Figure GDA0002733690500000052
Figure GDA0002733690500000053
也在Cn中,则
Figure GDA0002733690500000054
保留;否则将
Figure GDA0002733690500000055
从Cn中移除,并放入集合
Figure GDA0002733690500000056
中;
8)对
Figure GDA0002733690500000057
中的任意一个元素
Figure GDA0002733690500000058
进行如下操作:若
Figure GDA0002733690500000059
Figure GDA00027336905000000510
在Cn,n=1,2,…,N,中,则将
Figure GDA00027336905000000511
放入Cn中;
9)对于任意一个簇Cn,n=1,2,…,N,进行如下操作:将Cn中的每个元素
Figure GDA00027336905000000512
对应的残基
Figure GDA00027336905000000513
放入集合Dn中;
10)根据残基在蛋白质中的位置信息对每个集合Dn,n=1,2,…,N,中的所有残基进行排序;排序后的每个集合Dn,n=1,2,…,N,表示输入蛋白质中对应的一个结构域;
11)使用I-TASSER服务器(https://zhanglab.ccmb.med.umich.edu/I-TASSER/)分别对划分出的每个结构域进行结构预测。
本实施例以蛋白质3ub1A的结构域划分为实施例,一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法,包括以下步骤:
1)输入待进行结构域划分的蛋白质3ub1A序列信息,记作S;
2)使用RaptorX-Contact服务器(http://raptorx.uchicago.edu/ContactMap/)对蛋白质序列S进行接触图预测,预测出的接触图信息记作
Figure GDA00027336905000000514
其中L表示蛋白质序列S的残基数目,mi,j∈{0,1}表示S中的第i残基Ri与第j个残基Rj的接触状态:mi,j=1表示两个残基接触,mi,j=0表示两个残基不接触;
3)对M中的任意元素mi,j,使用一个2k+1行2k+1列,k=2,的权重矩阵W:
Figure GDA00027336905000000515
进行如下处理,得到
Figure GDA00027336905000000516
Figure GDA00027336905000000517
其中
Figure GDA0002733690500000061
4)使用步骤3)将M中的所有元素依次进行处理,并使用得到的所有
Figure GDA0002733690500000062
组成一个新的接触图信息
Figure GDA0002733690500000063
5)使用
Figure GDA0002733690500000064
中第i列的所有元素组成蛋白质序列S中的第i个残基Ri的特征向量,记作
Figure GDA0002733690500000065
6)使用模糊C均值聚类算法,将所有xi聚类成2个簇,分别记作C1与C2
7)对于任意一个簇Cn,n=1,2,中的任意一个元素
Figure GDA0002733690500000066
进行如下操作:若
Figure GDA0002733690500000067
Figure GDA0002733690500000068
也在Cn中,则
Figure GDA0002733690500000069
保留;否则将
Figure GDA00027336905000000610
从Cn中移除,并放入集合
Figure GDA00027336905000000611
中;
8)对
Figure GDA00027336905000000612
中的任意一个元素
Figure GDA00027336905000000613
进行如下操作:若
Figure GDA00027336905000000614
Figure GDA00027336905000000615
在Cn,n=1,2,中,则将
Figure GDA00027336905000000616
放入Cn中;
9)对于任意一个簇Cn,n=1,2,进行如下操作:将Cn中的每个元素
Figure GDA00027336905000000617
对应的残基
Figure GDA00027336905000000618
放入集合Dn中;
10)根据残基在蛋白质中的位置信息对每个集合Dn,n=1,2,中的所有残基进行排序;排序后的每个集合Dn,n=1,2,表示输入蛋白质中对应的一个结构域;
11)使用I-TASSER服务器(https://zhanglab.ccmb.med.umich.edu/I-TASSER/)分别对划分出的每个结构域进行结构预测。
以蛋白质3ub1A的结构域划分为实施例,运用以上方法划分得到蛋白质3ub1A的结构域如图2所示。
以上说明是本发明以蛋白质3ub1A的结构域划分为实例所得出的划分结果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法,其特征在于,所述划分方法包括以下步骤:
1)输入待进行结构域划分的蛋白质序列信息,记作S;
2)使用RaptorX-Contact服务器对蛋白质序列S进行接触图预测,预测出的接触图信息记作
Figure FDA0002017744750000011
其中L表示蛋白质序列S的残基数目,mi,j∈{0,1}表示S中的第i残基Ri与第j个残基Rj的接触状态:mi,j=1表示两个残基接触,mi,j=0表示两个残基不接触;
3)对M中的任意元素mi,j,使用一个2k+1行2k+1列的权重矩阵W:
Figure FDA0002017744750000012
进行如下处理,得到
Figure FDA0002017744750000013
Figure FDA0002017744750000014
其中
Figure FDA0002017744750000015
4)使用步骤3)将M中的所有元素依次进行处理,并使用得到的所有
Figure FDA0002017744750000016
组成一个新的接触图信息
Figure FDA0002017744750000017
5)使用
Figure FDA0002017744750000018
中第i列的所有元素组成蛋白质序列S中的第i个残基Ri的特征向量,记作
Figure FDA0002017744750000019
6)使用模糊C均值聚类算法,将所有xi聚类成N个簇,分别记作C1,C2,…,CN
7)对于任意一个簇Cn,n=1,2,…,N,中的任意一个元素
Figure FDA00020177447500000110
进行如下操作:若
Figure FDA00020177447500000111
Figure FDA00020177447500000112
也在Cn中,则
Figure FDA00020177447500000113
保留;否则将
Figure FDA00020177447500000114
从Cn中移除,并放入集合
Figure FDA00020177447500000115
中;
8)对
Figure FDA0002017744750000021
中的任意一个元素
Figure FDA0002017744750000022
进行如下操作:若
Figure FDA0002017744750000023
Figure FDA0002017744750000024
在Cn,n=1,2,…,N,中,则将
Figure FDA0002017744750000025
放入Cn中;
9)对于任意一个簇Cn,n=1,2,…,N,进行如下操作:将Cn中的每个元素
Figure FDA0002017744750000026
对应的残基
Figure FDA0002017744750000027
放入集合Dn中;
10)根据残基在蛋白质中的位置信息对每个集合Dn,n=1,2,…,N,中的所有残基进行排序;排序后的每个集合Dn,n=1,2,…,N,表示输入蛋白质中对应的一个结构域;
11)使用I-TASSER服务器分别对划分出的每个结构域进行结构预测。
CN201910268930.8A 2019-04-04 2019-04-04 基于接触图与模糊c均值聚类的蛋白质结构域划分方法 Active CN110163243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910268930.8A CN110163243B (zh) 2019-04-04 2019-04-04 基于接触图与模糊c均值聚类的蛋白质结构域划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910268930.8A CN110163243B (zh) 2019-04-04 2019-04-04 基于接触图与模糊c均值聚类的蛋白质结构域划分方法

Publications (2)

Publication Number Publication Date
CN110163243A CN110163243A (zh) 2019-08-23
CN110163243B true CN110163243B (zh) 2021-04-06

Family

ID=67638974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910268930.8A Active CN110163243B (zh) 2019-04-04 2019-04-04 基于接触图与模糊c均值聚类的蛋白质结构域划分方法

Country Status (1)

Country Link
CN (1) CN110163243B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111128301A (zh) * 2019-12-06 2020-05-08 北部湾大学 一种基于模糊聚类的重叠蛋白质复合物识别方法
CN112365921B (zh) * 2020-11-17 2022-07-15 浙江工业大学 一种基于长短时记忆网络的蛋白质二级结构预测方法
CN115035947B (zh) * 2022-06-10 2023-03-10 水木未来(北京)科技有限公司 蛋白质结构建模方法及装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108350053A (zh) * 2015-11-09 2018-07-31 英属哥伦比亚大学 淀粉样蛋白β表位及其抗体
CN109215732A (zh) * 2018-08-28 2019-01-15 浙江工业大学 一种基于残基接触信息自学习的蛋白质结构预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500292A (zh) * 2013-09-27 2014-01-08 南京理工大学 配体特异性蛋白质-配体绑定区域预测方法
US20170098030A1 (en) * 2014-05-11 2017-04-06 Ofek - Eshkolot Research And Development Ltd System and method for generating detection of hidden relatedness between proteins via a protein connectivity network
WO2017081687A1 (en) * 2015-11-10 2017-05-18 Ofek - Eshkolot Research And Development Ltd Protein design method and system
WO2017180652A1 (en) * 2016-04-11 2017-10-19 Applied Proteomics, Inc. Mass spectrometric data analysis workflow
CN109360599B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于残基接触信息交叉策略的蛋白质结构预测方法
CN109215733B (zh) * 2018-08-30 2021-05-18 浙江工业大学 一种基于残基接触信息辅助评价的蛋白质结构预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108350053A (zh) * 2015-11-09 2018-07-31 英属哥伦比亚大学 淀粉样蛋白β表位及其抗体
CN109215732A (zh) * 2018-08-28 2019-01-15 浙江工业大学 一种基于残基接触信息自学习的蛋白质结构预测方法

Also Published As

Publication number Publication date
CN110163243A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
CN110163243B (zh) 基于接触图与模糊c均值聚类的蛋白质结构域划分方法
CN109215732B (zh) 一种基于残基接触信息自学习的蛋白质结构预测方法
CN118645154B (zh) 一种基于单细胞RNA表达数据的单细胞Hi-C图谱预测方法
CN116843970B (zh) 基于任务特定通道重构网络的细粒度小样本分类方法
CN119418777A (zh) 基于多模态蛋白质语言模型的dna绑定残基预测方法
Gao et al. High-performance deep learning toolbox for genome-scale prediction of protein structure and function
CN118941715A (zh) 钢桁梁弦杆端部螺栓孔群信息智能提取方法及系统
Xue et al. Inferring single-cell resolution spatial gene expression via fusing spot-based spatial transcriptomics, location, and histology using GCN
Feng et al. Artificial intelligence in bioinformatics: Automated methodology development for protein residue contact map prediction
CN121039740A (zh) 采用GraphST的空间转录组学的空间信息聚类、整合和解卷积
Tsiknakis et al. Unveiling the power of model-agnostic multiscale analysis for enhancing artificial intelligence models in breast cancer histopathology images
CN114626513B (zh) 一种基于全脑光学成像数据的神经元重构方法及装置
Gancheva et al. Software architecture for adaptive in silico knowledge discovery and decision making based on big genomic data analytics
Leinweber et al. CavSimBase: a database for large scale comparison of protein binding sites
CN112216345B (zh) 一种基于迭代搜索策略的蛋白质溶剂可及性预测方法
Merelli et al. Image-based surface matching algorithm oriented to structural biology
Chavda et al. Role of Data Mining in Bioinformatics
Gierahn et al. Crossword: a fully automated algorithm for the segmentation and quality control of protein microarray images
Abu-Doleh et al. Protein contact map prediction using multi-stage hybrid intelligence inference systems
Chitralegha et al. Protein sequence motif patterns using adaptive Fuzzy C-Means granular computing model
Gancheva et al. SOA based system for big genomic data analytics and knowledge discovery
Lee et al. Protein secondary structure prediction using BLAST and exhaustive RT-RICO, the search for optimal segment length and threshold
CN109243526B (zh) 一种基于特定片段交叉的蛋白质结构预测方法
Zhu et al. Empirical Study of Large‐Scale HLA Simulation of Parallel Region‐Matching Knowledge Recognition Algorithm Based on Region Matching
Ng et al. Large-scale neuroinformatics for in situ hybridization data in the mouse brain

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231221

Address after: 518054, D1101, Building 4, Software Industry Base, No. 19, 17, and 18 Haitian 1st Road, Binhai Community, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Xinrui Gene Technology Co.,Ltd.

Address before: 510075 No. n2248, floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Effective date of registration: 20231221

Address after: 510075 No. n2248, floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Address before: The city Zhaohui six districts Chao Wang Road Hangzhou City, Zhejiang province 310014 18

Patentee before: JIANG University OF TECHNOLOGY

TR01 Transfer of patent right