LU502739B1 - A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein - Google Patents

A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein Download PDF

Info

Publication number
LU502739B1
LU502739B1 LU502739A LU502739A LU502739B1 LU 502739 B1 LU502739 B1 LU 502739B1 LU 502739 A LU502739 A LU 502739A LU 502739 A LU502739 A LU 502739A LU 502739 B1 LU502739 B1 LU 502739B1
Authority
LU
Luxembourg
Prior art keywords
calculate
protein
amino acid
interaction
sequence
Prior art date
Application number
LU502739A
Other languages
English (en)
Inventor
Fei Guo
Original Assignee
Univ Central South
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Central South filed Critical Univ Central South
Priority to LU502739A priority Critical patent/LU502739B1/en
Application granted granted Critical
Publication of LU502739B1 publication Critical patent/LU502739B1/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Claims (3)

REVENDICATIONS
1. Une méthode de prédiction de l’interaction entre protéines à information mutuelle LU502739 multivariée et énergie de liaison des résidus est caractérisée par les étapes suivantes : Étape (1): Regroupement des catégories d’acides aminés, 20 acides aminés standard ont été divisés en n groupes fonctionnels selon la dipolarité et le volume, et ces n groupes fonctionnels ont été enregistrés comme Co, Ci, Cz, ..., Cy, conversion de la séquence d’acides aminés d’origine en une séquence de classe de groupe selon la classe de groupe fonctionnel de chaque acide aminé ; Étape (2): Définir différents types de représentations de caractéristiques à 3 tuples et à 2 tuples. Les représentations de caractéristiques à 3 tuples sont « CoCoCo », « CoCoC1»,...« ChCnCn »; Les caractéristiques de 2 tuples sont exprimées par « CoCo », « CoC1 »,...« CnCn ». Étape (3): Le nombre de caractéristiques à 3 tuples et de caractéristiques à 2 tuples dans la séquence de classe de groupe est compté, et le tableau de fréquence des caractéristiques est établi. La fonction de calcul de fréquence f (a) = (na+1)/(I+1) est utilisée pour calculer la fréquence de n classes dans la séquence respectivement ; Étape (4): Calculer les caractéristiques d’information mutuelle de 2 tuples, et la formule de calcul est :
vu. Hla a) Où f (ab) est la fréquence d’ occurrence simultanée de la classe ab dans le groupe binaire ; Étape (5): Calculer les caractéristiques d’information mutuelle de 3 tuples. La formule de calcul est : I(abc)— I(ab)+f(a|c)Inf(a|c)-f(albc)Inf(a[bc) Où f (a |c) est la fréquence d’occurrence simultanée de la classe a dans tous les groupes binaires où la classe c se produit, f (a |bc) est la fréquence d’occurrence simultanée de la classe a dans tous les triplets où la classe bc se produit ; La première partie de la valeur de caractéristiques de l’information mutuelle est obtenue à travers les cinq étapes ci-dessus ; Étape (6): Calculer les caractéristiques physico-chimiques des acides aminés ; Étape (7): La matrice de contact des acides aminés AAC a été calculée à l’aide de la fréquence d’appariement des résidus grâce à une analyse statistique de la base de données des complexes protéiques : api A ; Nat; Parmi eux, i,j représentent deux acides aminés, Ni, j= *-Snj sont le nombre de contact de i et],
REVENDICATIONS Calcul de la matrice de substitution SMR, SMR;, =AAC (i, A1), ou I=1,..., 20 est l'un des LU502739 vingt types d'acides aminés, 1=1,..., L est l'une des L positions dans une séquence protéique donnée, et Aj est un type d'acide aminé en position I. Une matrice de substitution SMR de 20 x L est obtenue par cette étape ; Étape (8): L’algorithme d’extraction des caractéristiques de l’histogramme de direction du gradient HOG est utilisé pour extraire les caractéristiques des séquences d’acides aminés ; Étape (9): Par décomposition en valeurs singulières de la matrice transposée de la matrice SMR, 20 vecteurs singuliers droits peuvent être obtenus. Étape (10): Les valeurs propres obtenues par les étapes 1 à 9 sont entrées dans un modèle de forêt stochastique pour la prédiction, obtenant ainsi l’interaction entre deux protéines.
2. Un procédé de prédiction de l’interaction entre protéines à information mutuelle multivariée et d’énergie de laisd Lhd} = JED + GABA ition 1 est caractérisé en ce que l’étape de calcul spécifique de l’étape (6) est la suivante : Étape (6.1): Calculer la valeur propre de l’autocorrélation Moreau-Broto, et la formule de calcul est : , ke Où lag est la distance entre les résidus, p est la p-ème propriété physico-chimique de l’acide aminé naturel et | est la position de la séquence Séquence, I=1, 2, … , L-lag et lag = 1, 2, … , lg, exprimé par six propriétés physico- chimiques, on obtient lg x 6 valeurs propres. Étape (6.2): Normaliser les valeurs propres Ig x 6 obtenues ; Étape (6.3): La fréquence de 20 acides aminés dans la séquence a été comptée.
3. Un procédé de prédiction d’interaction entre protéines à information mutuelle multvariée et d’énergie de liaison des résidus selon la revendication 1 est caractérisé en ce que le processus de calcul spécifique de l’étape (8) est le suivant : Étape (8.1): Les valeurs de gradient Gn (i, I) et Gy (i, 1) dans les directions horizontale et verticale sont calculées par les formules suivantes : { EMR 4 LOD 0, i= Eli) = IR FLACIMRU~LD, Ii v 9 —EMRIE— LIL (= f | SMEOLI+ 1-8 isd Geld) = 1 SMELT 1) — ENRGI- 1 1<1<L { Q—SMRT ET, fu} Étape (8.2): Calculer l’amplitude de gradient FLEE JEL IF OLE Etape (8.3): Calculer la direction de gradient Batty 11
REVENDICATIONS
Étape (8.4): La matrice d’amplitude de gradient et la matrice de direction dd gradient sont LU502739 divisées en 9 sous-matrices de même taille ;
Étape (8.5): L’histogramme de chaque direction de gradient est compté et la taille de l’histogramme de chaque direction de gradient est prise comme valeur propre.
Grâce aux étapes ci-dessus, x valeurs propres sont obtenues à partir de chaque séquence et 2x valeurs propres sont obtenues à partir des deux séquences.
12
LU502739A 2022-08-31 2022-08-31 A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein LU502739B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
LU502739A LU502739B1 (en) 2022-08-31 2022-08-31 A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
LU502739A LU502739B1 (en) 2022-08-31 2022-08-31 A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein

Publications (1)

Publication Number Publication Date
LU502739B1 true LU502739B1 (en) 2024-02-29

Family

ID=90195306

Family Applications (1)

Application Number Title Priority Date Filing Date
LU502739A LU502739B1 (en) 2022-08-31 2022-08-31 A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein

Country Status (1)

Country Link
LU (1) LU502739B1 (fr)

Similar Documents

Publication Publication Date Title
WO2022126971A1 (fr) Procédé et appareil de groupement de textes selon la densité, dispositif et support de stockage
Babu et al. Medical disease prediction using grey wolf optimization and auto encoder based recurrent neural network
WO2020062660A1 (fr) Procédé, appareil et dispositif d&#39;évaluation de risque de crédit d&#39;entreprise, et support de stockage
US7809660B2 (en) System and method to optimize control cohorts using clustering algorithms
CN110135494A (zh) 基于最大信息系数和基尼指标的特征选择方法
CN103278616B (zh) 一种土壤腐蚀性快速评价的多因子方法
CN111062425A (zh) 基于c-k-smote算法的不平衡数据集处理方法
CN110134719A (zh) 一种结构化数据敏感属性的识别与分类分级方法
CN111984702A (zh) 村镇聚落的空间演化分析方法、装置、设备及存储介质
Lee et al. Modeling of inter‐sample variation in flow cytometric data with the joint clustering and matching procedure
CN107885971A (zh) 采用改进花授粉算法识别关键蛋白质的方法
Lian et al. Artificial-cell-type aware cell-type classification in CITE-seq
CN114003636A (zh) 一种基于变量相关性的多元时间序列相似性搜索方法
CN110010204B (zh) 基于融合网络和多打分策略的预后生物标志物识别方法
LU502739B1 (en) A Prediction Method of Interaction Between Multi-Information and Residue Binding Energy Protein
Yuan et al. CSCIM_FS: Cosine similarity coefficient and information measurement criterion-based feature selection method for high-dimensional data
CN108920889B (zh) 化学品健康危害筛查方法
CN113554176B (zh) 代谢特征谱推断方法、系统、计算机设备及存储介质
CN105005783B (zh) 从高维非对称数据中提取分类信息的方法
WO2022011855A1 (fr) Procédé de filtrage des variations structurelles faussement positives, support de stockage, et dispositif informatique
CN109543712B (zh) 时态数据集上的实体识别方法
He et al. A HK clustering algorithm based on ensemble learning
CN111986819A (zh) 药物不良反应监测方法、装置、电子设备及可读存储介质
CN103761433A (zh) 一种网络服务资源分类方法
Anitha et al. The predicting diseases of employees with VASA dataset using entropy

Legal Events

Date Code Title Description
FG Patent granted

Effective date: 20240229