LU501881B1 - Eine methode und ein system zur vorhersage von mirna-krankheitsassoziationen auf der grundlage von heterogenen graphen - Google Patents

Eine methode und ein system zur vorhersage von mirna-krankheitsassoziationen auf der grundlage von heterogenen graphen Download PDF

Info

Publication number
LU501881B1
LU501881B1 LU501881A LU501881A LU501881B1 LU 501881 B1 LU501881 B1 LU 501881B1 LU 501881 A LU501881 A LU 501881A LU 501881 A LU501881 A LU 501881A LU 501881 B1 LU501881 B1 LU 501881B1
Authority
LU
Luxembourg
Prior art keywords
disease
mirna
denotes
matrix
message
Prior art date
Application number
LU501881A
Other languages
English (en)
Inventor
Xin Lu
Qiaoqin Li
Yongguo Liu
Chong Fu
Yun Zhang
Jiajing Zhu
Jihui Song
Original Assignee
Univ Electronic Sci & Tech China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Electronic Sci & Tech China filed Critical Univ Electronic Sci & Tech China
Application granted granted Critical
Publication of LU501881B1 publication Critical patent/LU501881B1/de

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Ecology (AREA)
  • Biomedical Technology (AREA)
  • Physiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Die Erfindung stellt eine Methode und ein System zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von heterogenen Graphen bereit, das zum Gebiet der Krankheitsassoziationsvorhersagetechnologie gehört. Das Verfahren kombiniert bekannte Assoziationen mit miRNA-Ähnlichkeit und Krankheitsähnlichkeit, um einen heterogenen Graphen zu konstruieren, entwirft eine Nachrichtenübermittlungsfunktion mit variablen Gewichten zwischen Schichten auf dem heterogenen Graphen zum ersten Mal, entwirft eine Nachrichtenaggregationsfunktion, die miRNA- und Krankheitsähnlichkeit kombiniert. Nach Nachricht Aggregation des heterogenen Graphen neuronales Netz, die höherer Ordnung topologischen Eigenschaften des heterogenen Graphen wurden fusioniert, um die endgültige Funktion Vektor Darstellung von miRNA und Krankheit zu erhalten, und schließlich die miRNA Krankheit Verband Vorhersage Matrix wurde durch induktive Matrix Zersetzung erhalten, und die unbekannte miRNA-Krankheit Verband wurde auf der Grundlage der miRNA Krankheit Verband Vorhersage Matrix vorhergesagt, um das Vertrauen der Vorhersage Ergebnisse zu verbessern.

Description

Description Eine Methode und ein System zur Vorhersage von miRNA-Krankheitsassoziationen auf der 01881 Grundlage von heterogenen Graphen Technischer Bereich Die Erfindung gehört zum Gebiet der Technologie zur Vorhersage von Krankheitsassoziationen und bezieht sich insbesondere auf eine Methode und ein System zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von heterogenen Graphen.
Technologie im Hintergrund Biologische Studien haben ergeben, dass nichtkodierende RNA (ncRNA) im menschlichen Körper eine sehr wichtige Rolle bei verschiedenen biologischen Prozessen im Körper spielen. miRNA sind eine Gruppe von 21-24 nt einzelstrangigen endogenen kurzstrangigen ncRNA, die eng mit der Entwicklung verschiedener Krankheiten, insbesondere Krebs, verbunden sind. Biologische Experimente zur Bestimmung des Zusammenhangs zwischen miRNAs und Krankheiten sind jedoch teuer und zeitaufwändig, so dass der Einsatz von Computermodellen zur Vorhersage des Zusammenhangs zwischen miRNA und Krankheiten von großer Bedeutung ist.
Bei der Anwendung von Computermodellen zur Vorhersage von miRNA-Krankheitsassoziationen wird die kombinierte Ahnlichkeitsmatrix von miRNA in der Regel zuerst aus der funktionellen Korrelation von miRNA und anderen Informationen über miRNA berechnet, dann wird die semantische Korrelation von Krankheiten aus dem DAG-Graphen von Krankheiten berechnet und mit anderen krankheitsbezogenen Informationen kombiniert, um die semantische ~~ Ahnlichkeitsmatrix zu berechnen, und schließlich wird die bekannte miRNA-Krankheitsassoziationsmatrix mit Methoden des maschinellen Lernens kombiniert, oder der Assoziationsgraph wird durch die Kombination von Protein-, Gen-, IncRNA- und anderen verwandten Informationen erstellt, um die unbekannten miRNA-Krankheitsassoziationen vorherzusagen.
Die bestehenden Techniken verwenden einfach GCN fiir die Merkmalsextraktion auf der Grundlage von Ahnlichkeitsnetzwerken, die die bekannten Wechselwirkungen zwischen miRNA und Krankheiten nicht vollständig ausnutzen können, und daher ist die Merkmalsextraktion von miRNAs und Krankheiten schlecht, insbesondere das NIMCGCN ist fast unmöglich, für miRNA oder Krankheiten mit unbekannten Assoziationen vorherzusagen.
1
Description Inhalt der Erfindung HUS01881 Als Antwort auf die oben genannten Mängel im Stand der Technik bietet die vorliegende Erfindung eine Methode und ein System zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von heterogenen Graphen, um das Problem zu lösen, dass miRNA-Krankheitsassoziationen schlecht vorhergesagt werden und einige Methoden nicht in der Lage sind, unbekannte Assoziationen vorherzusagen.
Um die oben genannten Ziele zu erreichen, werden in der vorliegenden Erfindung die folgenden technischen Lösungen verwendet.
Die vorliegende Ausführungsform stellt eine Methode zur Vorhersage der miRNA-Krankheitsassoziation auf der Grundlage von heterogenen Graphen bereit, die folgende Schritte umfasst.
S1, Beschaffung von miRNA- und Krankheitsdaten und Erstellung einer integrierten Ahnlichkeitsmatrix.
S2, Erstellen einer heterogenen Karte auf der Grundlage der umfassenden Ahnlichkeitsmatrix und Berechnen der Konnektivitätsinformationen erster Ordnung auf der heterogenen Graphen.
S3, Erweiterung der Konnektivitätsinformationen erster Ordnung auf der heterogenen Graphen und Verschmelzung der topologischen Merkmale hoherer Ordnung der heterogenen Graphen, um die miRNA-Merkmalsmatrix und die Krankheitsmerkmalsmatrix zu erhalten.
S4, Erhalten eines miRNA-Krankheitsassoziationsvorhersagemodells unter Verwendung induktiver Matrixzerlegung auf der Grundlage der miRNA-Merkmalsmatrix und der Krankheitsmerkmalsmatrix.
SS, Trainieren des miRNA-Krankheitsassoziationsvorhersagemodells und Verwenden der nach dem Training erhaltenen miRNA-Krankheitsassoziationsvorhersagematrix, um die Assoziation von unbekannten miRNAs mit Krankheiten vorherzusagen.
Die vorteilhaften Wirkungen der vorliegenden Erfindung sind wie folgt. Die vorliegende Erfindung schlägt eine Methode zur Vorhersage der miRNA-Krankheitsassoziation auf der Grundlage von heterogenen neuronalen Graphen vor, wobei bekannte Assoziationen mit miRNA-Ähnlichkeit und Krankheitsähnlichkeit kombiniert werden, um einen heterogenen Graphen zu konstruieren, zum ersten Mal eine Nachrichtenübertragungsfunktion mit variablen Gewichten zwischen Schichten auf dem heterogenen Graphen zu entwerfen, eine Nachrichtenaggregationsfunktion zu entwerfen, die miRNA- und Krankheitsähnlichkeit kombiniert.
2
Description . . LUp01881 Nach der Nachrichtenaggregation des heterogenen Graphen neuronalen Netzes wurden die topologischen Merkmale hôherer Ordnung des heterogenen Graphen fusioniert, um die endgültige Merkmalsvektordarstellung von miRNA und Krankheit zu erhalten, und schlieBlich wurde die miRNA-Krankheitsassoziationsvorhersagematrix durch induktive Matrixzersetzung erhalten, und die unbekannte — miRNA-Krankheitsassoziation wurde auf der Grundlage = der miRNA-Krankheitsassoziationsvorhersagematrix vorhergesagt, um das Vertrauen der Vorhersageergebnisse zu verbessern.
Weitere umfasst die integrierte = Ahnlichkeitsmatrix in Schritt S1 eine miRNA-Ähnlichkeitsmatrix und eine Krankheitsähnlichkeitsmatrix.
Die besagte miRNA-Ähnlichkeitsmatrix hat die folgenden Ausdrücke.
FM Om ar PM ar D Co oo | tees RE A fenkrionaïe dénichteir SM{m wm Yay 2 5 (GA med, habenkeine fanktionelle Abnlichteë Der Ausdruck für die beschriebene Krankheitsähnlichkeitsmatrix lautet wie folgt. USA A HORS AV LL à A me ua copys ao i andl haben BERATER ARNICANET SIN A 3e € 2 ; | GIN Yd ond fabenktein semamische Aknlichkeit SS1(d, ,d y+SS2(d, ,d SS(d,,d,)= ( U y) ( u y) 2 SS1(d d )= D rama Pl, (6)+DI, (f)) oo DVi(d,)+DV1(d,) SS2(d .d.) = D rerea or) Pa ()+D2,, (f)) eo DV2(d,)+ DV2(d,) m, bezeichnet miRNA 7 , m, bezeichnet miRNA j , SM(m,m,) bezeichnet miRNA-Ahnlichkeitsmatrix, FM(m,m,) bezeichnet funktionale miRNA-Ahnlichkeitsmatrix , GM(m,,m,) bezeichnet nukleare GauB-Spektrum-Ahnlichkeitsmatrix von miRNA, d, bezeichnet Krankheit u, d, bezeichnet Krankheit v, SD(d,,d,) bezeichnet Krankheits-Ahnlichkeitsmatrix, SS(d,,d,) bezeichnet semantische Ahnlichkeitsmatrix , GD(d,,d,) bezeichnet nukleare Gauß-Spektrum-Ähnlichkeitsmatrix von Krankheit, SS2(d,,d,) bezeichnet zweite semantische 3
Description Ka . . . Sa . _ LU501881 Ahnlichkeitsmatrix, SS1(d,,d,) bezeichnet erste semantische Ahnlichkeitsmatrix, / bezeichnet die Krankheitsknoten, die den DAGs von Krankheit # und Krankheit v gemeinsam sind, T (d,) bezeichnet die Menge der Krankheitsknoten in der DAG von Krankheit u , T(d,) bezeichnet die Menge der Krankheitsknoten in der DAG von Krankheit v , D1, (1) bezeichnet die erste Klasse der semantischen Werte von 7 in der DAG von Krankheit u , D1, (f) bezeichnet die erste Klasse der semantischen Werte von f in der DAG von Krankheit v, D2, (f)bezeichnet die zweite Klasse der semantischen Werte von 7 in der DAG von Krankheit u, D2, ({)bezeichnet die zweite Klasse der semantischen Werte von # in der DAG von Krankheit v , DVI(d,) bezeichnet die erste Klasse der semantischen Werte von Krankheit w , DV1(d,) bezeichnet die erste Klasse der semantischen Werte von Krankheit v , DV2(d,) bezeichnet die zweite Klasse der semantischen Werte von Krankheit u , DV?2(d,) bezeichnet die zweite Klasse der semantischen Werte von Krankheit v.
Die vorteilhafte Wirkung der oben genannten weiteren Lösung besteht darin, dass die vorliegende Erfindung eine integrierte miRNA- und Krankheitsähnlichkeitsmatrix auf der Grundlage bekannter miRNA-Krankheitsassoziationen konstruiert, was die Qualität der endgültigen Vorhersage verbessern kann.
Darüber hinaus umfasst der Schritt S2 die folgenden Schritte.
$201, Normalisierung der integrierten Ähnlichkeitsmatrix.
S202, Verwenden von miRNA und Krankheit als Knoten, Konstruieren eines heterogenen Graphen mit Assoziation zwischen miRNA und Krankheit, Ähnlichkeit zwischen miRNAs und Ähnlichkeit zwischen Krankheiten als Kanten, wobei die Kantengewichte von miRNA- und Krankheitsknoten 0 oder 1 sind, bestimmt durch die bekannte miRNA- und Krankheitsassoziationsmatrix, die Kantengewichte zwischen miRNA-Knoten normalisierte miRNA-Ähnlichkeit sind und die Kantengewichte von Krankheitsknoten die normalisierte Krankheitsähnlichkeit darstellen.
S203, Bestimmung einer ursprünglichen Merkmalsmatrix für den heterogenen Graphen.
S204, Einstellen einer Nachrichtenübermittlungsfunktion mit variablen Gewichten zwischen 4
Description ; TE . LU501881 Schichten auf dem heterogenen Graphen auf der Grundlage der ursprünglichen Merkmalsmatrix.
S205, auf der Grundlage der …— Nachrichtenübertragungsfunktion wird = die Nachrichtenaggregationsfunktion, die die miRNA- und Krankheitsähnlichkeit kombiniert, durch Aggregation erhalten, wodurch die Berechnung der Konnektivitätsinformationen erster Ordnung abgeschlossen wird.
Weitere umfasst die Nachrichtenfunktion in Schritt S204 eine Nachrichtenfunktion zwischen miRNA- und Krankheitsknoten, eine Nachrichtenfunktion zwischen miRNA-Knoten und eine Nachrichtenfunktion zwischen Krankheitsknoten.
Der Ausdruck für die Nachrichtenübermittlungsfunktion zwischen der miRNA und dem Krankheitsknoten lautet wie folgt.
MESSage, 5m, = Pa (M, vd,) Pa =1/,[Nd, | Nm, Die Nachrichtenübermittlungsfunktion zwischen den miRNA-Knoten wird wie folgt ausgedrückt.
MESSAGE = q,W,(vm,,vm,) Gi =1/ [Nm | Nm Die Nachrichtenübermittlungsfunktion zwischen den genannten Krankheitsknoten wird wie folgt ausgedrückt. message, , =1,W,(d,, vd) r, =1/ nd, | Nd, | message, .,, bezeichnet die Nachrichtenübertragungsfunktion zwischen miRNA und Krankheit #, p, piu bezeichnet das Ubertragungsgewicht zwischen miRNA und Krankheit = , [J bezeichnet die Multiplikation mit Elementen, vm, bezeichnet das Anfangsmerkmal von miRNA, vd, bezeichnet das Anfangsmerkmal von Krankheit u, Nd, bezeichnet die Menge der Krankheitsknoten in den Nachbarknoten erster Ordnung von miRNA, Nm, bezeichnet die Menge der miRNA-Knoten in den Nachbarknoten erster Ordnung von Krankheit #, message, bezeichnet die Nachrichtenübertragungsfunktion zwischen miRNA-Knoten, q, bezeichnet das
Description . LU501881 Ubertragungsgewicht zwischen miRNAs, vm, und vm, bezeichnen die anfänglichen Merkmale von miRNA; bzw. miRNA j, “*>*) bezeichnet die Vektor-Splicing-Operation zur Kombination der Merkmale von zwei Knoten, Nm, bezeichnet die Menge der miRNA-Knoten und ihrer eigenen Knoten in den Nachbarknoten erster Ordnung von miRNA/, Nm, bezeichnet die Menge der miRNA-Knoten und ihrer eigenen Knoten in den Nachbarknoten erster Ordnung von miRNA j » message, …,, bezeichnet die Nachrichtentibertragungsfunktion zwischen Krankheitsknoten, vd, bezeichnet das Anfangsmerkmal der Krankheit v, r,, bezeichnet die Ubertragungsgewichte zwischen Krankheitsknoten , W,W,,W, bezeichnen trainierbaren Gewichtsmatrizen, W, €eD PP J, [] POD yg) Omar) | Per") bezeichnen den zweidimensionalen realen Raum von dx(nm+nd), nm bezeichnet die die Gesamtzahl der miRNAs, nd bezeichnet die Gesamtzahl der Krankheiten, d bezeichnet die Dimensionalität der Knotenmerkmale, Nd, bezeichnet die Menge der Krankheitsknoten und ihrer eigenen Knoten in der Nachbarschaft erster Ordnung der Krankheit # , Nd, bezeichnet die Menge der Krankheitsknoten und ihrer eigenen Knoten in der Nachbarschaft erster Ordnung der Krankheit v.
Der vorteilhafte Effekt der oben genannten weiteren Lösungen besteht darin, dass die Erfindung verschiedene Bindungsfunktionen für verschiedene Knotentypen verwendet, um die Menge der Knoteninformationen zu erhöhen.
Weitere ausgedrückt die … Nachrichtenaggregationsfunktion für miRNA und Krankheitsähnlichkeit in Schritt S205 wie folgt .
Mm 1 1, vd,’ = Leaky Relu(——— > message, on + > SD(u,q)message, , ,) 2 Nm, | n,n, “ ? 2 d,eNda, a a 1 1, . vm, = Leaky Relu(——— > message, a +— > SM (i, t)message,, , , ) 2% Nd, | d;eNd,, : 2 m, NM ; ' m, bezeichnet einen beliebigen miRNA-Knoten in der Nachbarschaft erster Ordnung von Krankheit u, d, bezeichnet einen beliebigen Krankheitsknoten in der Nachbarschaft erster Ordnung von Krankheit u, d, bezeichnet einen beliebigen Krankheitsknoten in der Nachbarschaft 6
Description ; ; ; a ; LU501881 erster Ordnung von miRNA 7, m, bezeichnet einen beliebigen miRNA-Knoten in der Nachbarschaft erster Ordnung von miRNA i , vd” und wm" bezeichnen Konnektivitätsknotenmerkmale erster Ordnung, die heterogene Graphen einbeziehen; SD(u,q) bezeichnet die kombinierte Ähnlichkeit von Krankheit # und Krankheit q, SM (if) bezeichnet die kombinierte Ähnlichkeit vonmiRNA; und miRNA.
Ein weiterer Vorteil der oben genannten Lösung besteht darin, dass die Erfindung die Nachrichtenaggregationsfunktion verwendet, um die übergebenen Nachrichten zu einer endgültigen Knotendarstellung zu aggregieren.
Ferner umfasst der Schritt S3 die folgenden Schritte S301, Erweiterung der Konnektivitätsinformationen erster Ordnung auf dem heterogenen Graphen und Definition der Transfergewichte der Ordnung L.
S302, Definition einer Nachrichtenübermittlungsfunktion und einer Nachrichtenaggregationsfunktion hôherer Ordnung in dem heterogenen Graphen entsprechend den Ubermittlungsgewichten.
S303, basierend auf der Nachrichtenübertragungsfunktion höherer Ordnung und der Nachrichtenaggregationsfunktion in dem heterogenen Graphen, werden das endgültige Mehrfachordnungsmerkmal vm“ der miRNA: und das endgültige Mehrfachordnungsmerkmal vdu der Krankheit # auf der Grundlage der Aggregation von Merkmalen verschiedener Ordnungen durch den DGC erhalten.
vm" = vm, + vm" +, vm vd" = vd, + vd} +. . vd" L bezeichnet die Figenordnung, vd" bezeichnet den Eigenvektor der Krankheit # der Ordnung L-1, vm" bezeichnet den Figenvektor der miRNA der Ordnung L-1.
S304, das endgültige Mehrfachordnungsmerkmal vm”"" jeder miRNA: wird spaltenweise sortiert, um die Merkmalsmatrix X, der miRNA zu erhalten, und das endgültige Mehrfachordnungsmerkmal vd” jeder Krankheit u wird spaltenweise sortiert, um die Merkmalsmatrix X, der Krankheit zu erhalten.
7
Description . . . . LUR01881 Der vorteilhafte Effekt der obigen Lösung ist, dass die Erfindung die Verallgemeinerungsfähigkeit des Modells durch Aggregation mehrerer Schichten von Merkmalen verbessern und eine Überanpassung wirksam verhindern kann.
Weitere sind die Ausdrücke für die Nachrichtenübertragungsfunktionen verschiedener Ordnungen in den heterogenen Graphen im Schritt S302 wie folgt.
message” = pW m0 vd) dem; ui ‘1 i u message” =d°W°(vm",vm"") mem Ji“ 2 i > J message’ = FW vd" vd") Der Ausdruck der Nachrichtenaggregationsfunktion lautet wie folgt. 1 vd" = LeakyRelu(——— >. message”, + >. SD(u,q)messagey’, , ) Nm, | m,eNm, “ ? d,eNda, “ “ 1 vm" = Leaky Relu(—— >) message). + > SM (i,t)message‘?_„) |Ndm,| CRC ’ m,eNm,, vd bezeichnet die Knotenmerkmale von Krankheit # mit Konnektivität der Ordnung / des heterogenen Graphen, vm’ bezeichnet die Knotenmerkmale von miRNA/ mit Konnektivität der Ordnung I des heterogenen Graphen , message“ bezeichnet die Nachrichtenübertragungsfunktion der Ordnung/ zwischen miRNA7 und Krankheit u, pi, ¢' rÜbezeichnen die Ubertragungsgewichte der Konnektivität der Ordnung 7, W©, Ww", Ww bezeichnen die trainierbare Gewichtsmatrix der Ordnung /, vm“ bezeichnet den Merkmalsvektor der miRNA der Ordnung /-1, vd" bezeichnet den Merkmalsvektor der Krankheit # der Ordnung /-1 , message“ bezeichnet die Nachrichteniibertragungsfunktion der Ordnung / zwischen miRNA und miRNA-Knoten, vm‘” bezeichnet den Merkmalsvektor der miRNA jder Ordnung /—1, message" bezeichnet die Nachrichtenübertragungsfunktion der Ordnung / zwischen Krankheit # und Krankheit v und vd" bezeichnet den Merkmalsvektor der Krankheit v der Ordnung /—1.
Der vorteilhafte Effekt der obigen weiteren Losung ist, dass die Erfindung verschiedene 8
Description Parameter in mehreren Schichten verwendet, um den Parameterraum zu vergrößern und ris Vorhersagekraft des Modells zu verbessern. Weitere ist der Ausdruck der miRNA-Krankheitsassoziationsvorhersagematrix in Schritt S4 wie folgt. P=0,*0, O, = sigmoid WO ReELUWO X +b) +69) O, = sigmoid WP Re LUW X, +b") +60) P bezeichnet die miRNA-Krankheitsassoziationsvorhersagematrix , X, bezeichnet die Merkmalsmatrix der miRNA, X, bezeichnet die Merkmalsmatrix der Krankheit, 0; bezeichnet die Transponierung von O,, O,, e0™ 0 en"), wD und bY bezeichnen die trainierbare Gewichtsmatrix und die Bias-Terme der Schicht 1 des mehrschichtigen Perzeptron-MLP, die auf miRNA wirken; W'* und 6° bezeichnen die trainierbare Gewichtsmatrix und die Bias-Terme der Schicht 2 des mehrschichtigen Perzeptron-MLP, die auf miRNA wirken. W” und 5!" bezeichnen die trainierbare Gewichtsmatrix und die Bias-Terme der Schicht 1 des mehrschichtigen Perzeptron-MLP, der auf die Krankheit einwirkt, und W” und bY bezeichnen die trainierbare Gewichtsmatrix bzw. die Bias-Terme der Schicht 2 des mehrschichtigen Perzeptron-MLP, der auf die Krankheit einwirkt.
Der vorteilhafte Effekt der obigen weiteren Losung besteht darin, dass die Erfindung ein mehrschichtiges Perzeptron MLP anstelle einer Projektionsmatrix verwendet, wodurch komplexere Funktionen modelliert werden können und das Modell eine bessere Anpassung an die Daten aufweist.
Die vorliegende Erfindung stellt eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von heterogenen Graphen bereit, das es umfasst.
Ein integriertes Ähnlichkeitsmatrix-Konstruktionsmodul zum Erhalten von miRNA- und Krankheitsdaten und zum Konstruieren einer integrierten Ähnlichkeitsmatrix.
Ein Modul zur Konstruktion eines heterogenen Graphen zum Konstruieren eines heterogenen Graphen auf der Grundlage der integrierten Ahnlichkeitsmatrix und zum Berechnen von 9
Description Konnektivitätsinformationen erster Ordnung über den heterogenen Graphen. 7501881 Ein Merkmalsberechnungsmodul zum Erweitern der Konnektivitätsinformationen erster Ordnung auf der heterogenen Karte und zum Verschmelzen der topologischen Merkmale höherer Ordnung der heterogenen Karte, um die miRNA-Merkmalsmatrix und die Krankheitsmerkmalsmatrix zu erhalten.
Das Modul zur Berechnung der miRNA-Krankheitsassoziationsvorhersagematrix, um ein miRNA-Krankheitsassoziationsvorhersagemodell auf der Grundlage der miRNA-Merkmalsmatrix und der Krankheitsmerkmalsmatrix unter Verwendung einer induktiven Matrixzerlegung zu erhalten.
Vorhersagemodul zum Trainieren des miRNA-Krankheitsassoziationsvorhersagemodells und zum Verwenden der nach dem Training erhaltenen miRNA-Krankheitsassoziationsvorhersagematrix, um die Assoziation von unbekannten miRNAs mit Krankheiten vorherzusagen.
Die vorteilhaften Wirkungen der vorliegenden Erfindung sind wie folgt. Die vorliegende Erfindung nutzt die topologischen Informationen bekannter miRNA-Krankheits-Assoziationsnetzwerke und kombiniert dabei miRNA-Ahnlichkeits- und Krankheits-Ahnlichkeitsnetzwerke, um miRNA-Krankheitsassoziationen vorherzusagen, und kann miRNAs oder Krankheiten mit unbekannten Assoziationen vorhersagen. Die vorliegende Erfindung nutzt erstens die miRNA- und Krankheitsähnlichkeitsinformationen, indem sie Konnektivität hoher Ordnung auf dem heterogenen Graphen erhält, und kann miRNAs oder Krankheiten unbekannter Assoziation durch die heterogene Graphenstruktur vorhersagen. Durch die Verwendung einer auf einem neuronalen Netz basierenden induktiven Matrixzerlegungsmethode werden die miRNA- und Krankheitsmerkmale effektiv kombiniert, um das Vertrauen in die Vorhersageergebnisse zu erhôhe. Außerdem ist das gesamte Modell ein End-to-End-Modell, das die Trainingseffizienz effektiv verbessert.
Beschreibung der beigefiigten Zeichnungen Abb. 1 zeigt ein Flussdiagramm des Verfahrens der vorliegenden Erfindung.
Abb. 2 zeigt die Struktur des heterogenen Diagramms in dieser Ausführungsform.
Abb. 3 zeigt eine schematische Darstellung der Systemstruktur der vorliegenden Erfindung. Spezifische Durchfiihrung Die folgende Beschreibung spezifischer Ausfithrungsformen der Erfindung dient dazu, dem 1
Description Fachmann das Verständnis der Erfindung zu erleichtern. Aber es sollte klar sein, dass die Erfindung” 687 nicht auf den Umfang der spezifischen Ausführungsformen beschränkt ist und dass für einen Fachmann alle Variationen, die die Ideen der Erfindung nutzen, naheliegend sind, solange die Variationen innerhalb des Geistes und des Umfangs der Erfindung liegen, wie sie durch die beigefügten Ansprüche definiert und festgelegt sind. Die Erfindung ist geschützt.
Beispiel 1 Wie in Abbildung 1 dargestellt, stellt die vorliegende Erfindung eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von heterogenen Graphen bereit, die wie folgt umgesetzt wird.
S1, Beschaffung von miRNA- und Krankheitsdaten und Erstellung einer integrierten Ähnlichkeitsmatrix.
In dieser Ausführungsform werden 5430 bekannte miRNA- und Krankheits-Assoziationsdaten aus HMDD2.0 gewonnen, um die bekannte miRNA- und Krankheits-Assoziationsmatrix A, Aell™" zu bestimmen. Wenn die miRNA Nummer 7 mit der Krankheitsnummer j assoziiert ist, dann ist A4(i,j)=1, andernfalls ist A(i,j)=0. nm ist die Gesamtzahl der miRNA und nd ist die Gesamtzahl der Krankheiten, in diesem Szenario ist nm =383, nd =495 Die Daten zur funktionellen Ahnlichkeit der miRNA wurden von MISIM gesammelt und als FM ausgedriickt.
In dieser Implementierung wird fiir jede Krankheit ein gerichteter azyklischer Graph (DAG) auf der Grundlage der aus miRBase gewonnenen Mesh-Terminologie konstruiert. Der für die Krankheit D konstruierte DAG-Graph wird als DAG(D) = (D,T (D),E(D)) bezeichnet, wobei T (D) alle Knoten im DAG einschließlich D und £ (D) alle Kanten im DAG bezeichnet. Dann wird der erste semantische Wert jeder Krankheitsschicht für die Krankheit D wie folgt konstruiert.
CIM (dis Homa d= D pt, Ge) = ma LAS DL CE is ein untergeordeeter Enoten von di Wena d = 1 d bezeichnet die Krankheitsknoten innerhalb der DAG der Krankheit D. A ist der Abschwächungskoeffizient auf verschiedenen Ebenen, der in dieser Anwendung 0.5 beträgt. Nach Bestimmung der semantischen Ähnlichkeit auf jeder Ebene wird der erste semantische Wert der Krankheit D wie folgt konstruiert.
DV1(D)= > D1„(d) deT(D) 1
Description | | | | ; ; LU501881 Die erste semantische Ahnlichkeit zwischen der Krankheit d; und der Krankheit d, ergibt sich aus der folgenden Gleichung.
SS1(d d )= > ranma, Pl, ()+DL, ()) Co DV1(d,)+ DVW(d,) t bezeichnet einen beliebigen Krankheitsknoten in der Menge der Krankheitsknoten, die der DAG der Krankheit d, und der DAG der Krankheit d, gemeinsam sind, wobei zu berücksichtigen ist, dass Krankheiten, die in weniger DAG vorkommen, eine höhere Repräsentation haben und daher höher gewichtet werden sollten, so dass die Anzahl der DAG, die d enthalten, N, ist und die Gesamtzahl aller DAG N,, ist, wodurch der zweite semantische Wert der Krankheit wie folgt definiert wird.
N D2„(d) = —log[—-] N all DV2(D)= X D2,(d) deT(D) Die zweite semantische Ähnlichkeit zwischen Krankheit d, und Krankheit d, ist die folgende.
SS2 dd )= Der, ara CD 24, ()+D 24, () Po DV2(d,)+ DV2(d,) Die GauBschen spektralen Kernähnlichkeitsmatrizen GM und GD für miRNA und Krankheit wurden dann berechnet, und schließlich wurde die kombinierte miRNA-Ahnlichkeitsmatrix SM wie folgt berechnet.
Fifi on PONT, ar D LL LL A LL eee EEE PRO sn, RT ; Freer | ONCE Sehe SL de 3 ; * AM (am à msdn habenkeine Anıktionelie Aknlichkeit Der Ausdruck für die Krankheitsähnlichkeitsmatrix lautet wie folgt.
NS dad | > Wr a 24 ES, PUIN dP gamed haben semantliche Afnlichkeïr MIX yey 2 © ’ GIN dy dundd habenkein semantisohe Ahrlichkoir SS1(d,,d )+SS2(d,,d SS(d,,d,)= ( U y) ( u y) 2 1
Description ; ; ; ; _ LU501881 m, bezeichnet miRNA 7 , m, bezeichnet miRNA j , SM(m,m,) bezeichnet miRNA-Ahnlichkeitsmatrix, FM(m,m,) bezeichnet funktionale miRNA-Ahnlichkeitsmatrix , GM(m,,m,) bezeichnet nukleare GauB-Spektrum-Ahnlichkeitsmatrix von miRNA, d, bezeichnet Krankheit u, d, bezeichnet Krankheit v, SD(d,,d,) bezeichnet Krankheits-Ahnlichkeitsmatrix, SS(d,,d,) bezeichnet semantische Ahnlichkeitsmatrix , GD(d,,d,) bezeichnet nukleare Gauß-Spektrum-Ähnlichkeitsmatrix von Krankheit, SS2(d,,d,) bezeichnet zweite semantische Ahnlichkeitsmatrix, SS1(d,,d,) bezeichnet erste semantische Ahnlichkeitsmatrix, / bezeichnet die Krankheitsknoten, die den DAGs von Krankheit # und Krankheit v gemeinsam sind, T (d,) bezeichnet die Menge der Krankheitsknoten in der DAG von Krankheit u , T(d,) bezeichnet die Menge der Krankheitsknoten in der DAG von Krankheit v , D1, (1) bezeichnet die erste Klasse der semantischen Werte von 7 in der DAG von Krankheit u , D1, (f) bezeichnet die erste Klasse der semantischen Werte von f in der DAG von Krankheit v, D2, (f)bezeichnet die zweite Klasse der semantischen Werte von 7 in der DAG von Krankheit u, D2, ({)bezeichnet die zweite Klasse der semantischen Werte von # in der DAG von Krankheit v , DVI(d,) bezeichnet die erste Klasse der semantischen Werte von Krankheit w , DV1(d,) bezeichnet die erste Klasse der semantischen Werte von Krankheit v , DV2(d,) bezeichnet die zweite Klasse der semantischen Werte von Krankheit u , DV?2(d,) bezeichnet die zweite Klasse der semantischen Werte von Krankheit v.
S2 , Erstellen einer heterogenen Graphen auf der Grundlage der umfassenden Ahnlichkeitsmatrix und Berechnen der Konnektivitätsinformationen erster Ordnung auf der heterogenen Graphen, was erreicht wird durch.
$201, Normalisierung der integrierten Ahnlichkeitsmatrix.
S202, Verwenden von miRNA und Krankheit als Knoten, Konstruieren eines heterogenen Graphen mit Assoziation zwischen miRNA und Krankheit, Ahnlichkeit zwischen miRNAs und Ahnlichkeit zwischen Krankheiten als Kanten, wobei die Kantengewichte von miRNA- und 1
Description Krankheitsknoten 0 oder 1 sind, bestimmt durch die bekannte miRNA- Hind 88 Krankheitsassoziationsmatrix, die Kantengewichte zwischen miRNA-Knoten normalisierte miRNA-Ähnlichkeit sind und die Kantengewichte von Krankheitsknoten die normalisierte Krankheitsähnlichkeit darstellen.
S203, Bestimmung einer ursprünglichen Merkmalsmatrix für den heterogenen Graphen.
S204, Einstellen einer Nachrichtenübermittlungsfunktion mit variablen Gewichten zwischen Schichten auf dem heterogenen Graphen auf der Grundlage der ursprünglichen Merkmalsmatrix.
S205, auf der Grundlage der —Nachrichtenübertragungsfunktion wird die Nachrichtenaggregationsfunktion, die die miRNA- und Krankheitsähnlichkeit kombiniert, durch Aggregation erhalten, wodurch die Berechnung der Konnektivitätsinformationen erster Ordnung abgeschlossen wird.
In dieser Ausführungsform wird der heterogene Graph auf der Grundlage von miRNA- und Krankheitsknoten konstruiert, indem zunächst die Zeilen der SM- und SD-Matrix normalisiert werden und anschließend die normalisierten SM- und SD-Matrizen einheitlich als SM und SD dargestellt werden. Der heterogene Graph G<V,E> wird mit miRNA und Krankheit als Knoten und der Assoziation zwischen miRNA und Krankheit, der Ähnlichkeit zwischen miRNAs und der Ähnlichkeit zwischen Krankheiten als Kanten konstruiert. Die Kantengewichte zwischen miRNA-Knoten und Krankheitsknoten sind O oder 1, bestimmt durch die bekannte Assoziationsmatrix A. Die Kantengewichte zwischen miRNA-Knoten sind die normalisierte miRNA-Ähnlichkeit, und die Kantengewichte zwischen Krankheitsknoten sind die normalisierte Krankheitsähnlichkeit.
In dieser Ausführungsform wird die Konnektivitätsinformation erster Ordnung auf dem heterogenen Graphen berechnet, indem zunächst für den heterogenen Graphen G eine ursprüngliche Merkmalsmatrix X =[vm,vm,,...,M,„,vd,,vd,,...,vd,,] bestimmt wird, wobei vm das anfängliche Merkmal der miRNA Nummer i, vm, e[J"™™ bezeichnet, der erste nm -Term des anfänglichen miRNA-Merkmals die unnormierte Ähnlichkeit der miRNA ist und der letzte nd -Term die Assoziationsinformation mit der Krankheit ist. vd, €[]"™ bezeichnet das anfängliche Merkmal der Krankheit Nr. u, wobei der erste nd -Term die unnormalisierte Ähnlichkeit der Krankheit und der letzte nm -Term die Assoziationsinformation mit der miRNA darstellt. Wie in Abbildung 2 dargestellt, zeigt HGNN die Verwendung von GNN auf einem -_—
Description . . . . … . 0501881 heterogenen Graphen, wobei GNN zwei Schritte der Nachrichtenübermittlung un Nachrichtenaggregation umfasst. In Abbildung 2 bezeichnen m1, m2, m3... die miRNA-Knoten 1, 2,
3..., dl, d2, d3... die Krankheitsknoten 1, 2, 3..., und die Zahlen in Klammern hinter diesen Knoten geben die Schicht an, in der sie sich befinden. Verbindungen zwischen Knoten im Diagramm, mit Zahlen, die berechtigte Verbindungen und Kantengewichte für die Ähnlichkeit zwischen entsprechenden Knoten angeben, und ohne Zahlen, die ungewichtete Verbindungen angeben, zeigen das Vorhandensein oder Fehlen bekannter Verbindungen zwischen Knoten an, wobei Vorhandensein verbunden bedeutet, nicht vorhanden bedeutet, nicht verbunden.
1. Die Nachrichtenübermittlung zwischen Knotenpunkten Die Nachrichtenfunktion zwischen der miRNA und dem Krankheitsknoten ist wie folgt definiert. MESSage, 5m, = Pa (M, vd,) Pa =1/,[Nd, | Nm, Die Funktion der Nachrichtenübermittlung zwischen den miRNA-Knoten ist wie folgt definiert. message, om, = q,W,(vm,,vm,) Gi =1/ [Nm | Nm Die Funktion zur Nachrichtenübermittlung zwischen Krankheitsknoten ist wie folgt definiert. message, , =1,W,(d,, vd) r, =1/ nd, Na, message, .,, bezeichnet die Nachrichtenübertragungsfunktion zwischen miRNA und Krankheit #, p, piu bezeichnet das Ubertragungsgewicht zwischen miRNA7 und Krankheit = , [J bezeichnet die Multiplikation mit Elementen, vm, bezeichnet das Anfangsmerkmal von miRNA, vd, bezeichnet das Anfangsmerkmal von Krankheit u, Nd, bezeichnet die Menge der Krankheitsknoten in den Nachbarknoten erster Ordnung von miRNA, Nm, bezeichnet die Menge der miRNA-Knoten in den Nachbarknoten erster Ordnung von Krankheit u, message, ,,, bezeichnet die Nachrichtenübertragungsfunktion zwischen miRNA-Knoten, q, bezeichnet das 1
Description . LU501881 Ubertragungsgewicht zwischen miRNAs, vm, und vm, bezeichnen die anfänglichen Merkmale von miRNA; bzw. miRNA j, “*>*) bezeichnet die Vektor-Splicing-Operation zur Kombination der Merkmale von zwei Knoten, Nm, bezeichnet die Menge der miRNA-Knoten und ihrer eigenen Knoten in den Nachbarknoten erster Ordnung von miRNA/, Nm, bezeichnet die Menge der miRNA-Knoten und ihrer eigenen Knoten in den Nachbarknoten erster Ordnung von miRNA j » message, …,, bezeichnet die Nachrichtentibertragungsfunktion zwischen Krankheitsknoten, vd, bezeichnet das Anfangsmerkmal der Krankheit v, r,, bezeichnet die Ubertragungsgewichte zwischen Krankheitsknoten , W,W,,W, bezeichnen trainierbaren Gewichtsmatrizen, W, €eD PP J, [] POD yg) Omar) | Per") bezeichnen den zweidimensionalen realen Raum von d x (nm +nd) » Nm bezeichnet die die Gesamtzahl der miRNAs, nd bezeichnet die Gesamtzahl der Krankheiten, d bezeichnet die Dimensionalität der Knotenmerkmale, Nd, bezeichnet die Menge der Krankheitsknoten und ihrer eigenen Knoten in der Nachbarschaft erster Ordnung der Krankheit # , Nd, bezeichnet die Menge der Krankheitsknoten und ihrer eigenen Knoten in der Nachbarschaft erster Ordnung der Krankheit v.
In dieser Ausführungsform werden die Nachrichtenaggregation wie folgt aggregiert.
In dieser Ausführungsform erhalten alle Knoten nach der Nachrichtenübermittlung die Nachrichtendarstellungen ihrer umliegenden Nachbarn erster Ordnung, die dann über eine Nachrichtenaggregationsfunktion zu diesem Knoten aggregiert werden. Da die Gewichte der Kanten, die mit Krankheit und miRNA im heterogenen Graphen verbunden sind, beide 1 sind, die Gewichte der Kanten, die mit miRNA und d, verbunden sind, als ———— definiert sind, und 2*|Nm, | die Gewichte der Kanten, die mit Krankheit und m, verbunden sind, als 29nd, | definiert sind, * werden die Nachrichtenaggregationsfunktionen des Krankheitsknotens bzw. des miRNA-Knotens wie folgt dargestellt. 1 1 vd” = Leaky Re lu(——— > message, _„ +—* > SD(u,q)message, , ,) 2 Nm, | n,n, “ 2 d,eNda, “ ! 1
Description | | LU501881 vm" = Leaky Re lu(——— > message, 4 +—* > SM (i, t)message,, , , ) 2% Nd, | d;eNd,, : 2 m, NM ; ' vd" und vm" stellen Knotenmerkmale dar, die die Konnektivität erster Ordnung des heterogenen Graphen einbeziehen.
S3, Erweiterung der Konnektivitätsinformationen erster Ordnung auf der heterogenen Graphen und Verschmelzung der topologischen Merkmale höherer Ordnung der heterogenen Graphen, um die miRNA-Merkmalsmatrix und die Krankheitsmerkmalsmatrix zu erhalten, was erreicht wird durch.
S301, Erweiterung der Konnektivitätsinformationen erster Ordnung auf dem heterogenen Graphen und Definition der Transfergewichte der Ordnung L.
S302, Definition einer Nachrichtenübermittlungsfunktion und einer Nachrichtenaggregationsfunktion hôherer Ordnung in dem heterogenen Graphen entsprechend den Ubermittlungsgewichten.
S303, basierend auf der Nachrichtenübertragungsfunktion höherer Ordnung und der Nachrichtenaggregationsfunktion in dem heterogenen Graphen, werden das endgültige Mehrfachordnungsmerkmal vm“ der miRNA: und das endgültige Mehrfachordnungsmerkmal vdu der Krankheit # auf der Grundlage der Aggregation von Merkmalen verschiedener Ordnungen durch den DGC erhalten.
vm" = vm, + vm" teen, vm!" vd" = vd, vd ee vd L bezeichnet die Eigenordnung, vd" bezeichnet den Eigenvektor der Krankheit u der Ordnung L-1, vm" bezeichnet den Figenvektor der miRNA der Ordnung L-1.
$304, das endgültige Mehrfachordnungsmerkmal vm™" jeder miRNA: wird spaltenweise sortiert, um die Merkmalsmatrix X der miRNA zu erhalten, und das endgültige Mehrfachordnungsmerkmal vd/"“ jeder Krankheit u wird spaltenweise sortiert, um die Merkmalsmatrix X, der Krankheit zu erhalten.
In dieser Ausführungsform sind die Konnektivitätsinformationen höherer Ordnung im fusionierten heterogenen Graphen wie folgt.
1
Description . . . . #501881 Da die benachbarten Knoten in verschiedenen Schichten des heterogenen Graphen unterschiedlich sein können, werden die Gewichte der vorliegenden Erfindung als variable Gewichte festgelegt, und die Transfergewichte p‘, qq), rl) für die Schicht / des heterogenen Graphen werden gemäß dem Verfahren zur Definition der Transfergewichte zwischen verschiedenen Arten von Knoten in Schritt 3 wie folgt definiert.
DO =17 IN| Nm) q) =1/, in| Ni) À) =1 [Na Na) Nd" ist die Menge der Krankheits-Knoten im Nachbarschaftsknoten der Ordnung / der miRNA Nummer 7, Nm) ist die Menge der miRNA-Knoten im Nachbarschaftsknoten der Ordnung / der Krankheitsnummer wu , Nm!) ist die Menge der miRNA-Knoten im Nachbarschaftsknoten der Ordnung / der miRNA Nummer i, Nm) ist die Menge der miRNA-Knoten im Nachbarschaftsknoten der Ordnung / der miRNA Nummer j, Nd! ist die Menge der Krankheits-Knoten im Nachbarschaftsknoten der Ordnung / der Krankheitsnummer u, und Nd! ist die Menge der Krankheits-Knoten im Nachbarschaftsknoten der Ordnung/ der Krankheitsnummer v.
Definieren Sie die Nachrichtenübermittlungsfunktionen und Nachrichten- aggregationsfunktionen für die verschiedenen Schichten des heterogenen Graphen wie folgt.
message” = pW (0m "0 vd") dem; ui ‘1 i u message) =q' WW," (vm vm) message’ = FW vd" vd") 1 vd = LeakyRelu(——— >) message’ + >. SD(d,,vd message!’ ,) Nm, | m,eNm, “ ? d,eNda, “ “ 1 vm” = Leaky Relu(——— >) message,’ + > SM(vm,, vm,)message.)_ ) | Nim, | d,eNdn, ’ m, ENM ; ‘ vd bezeichnet die Knotenmerkmale von Krankheit # mit Konnektivität der Ordnung / des heterogenen Graphen, vm’ bezeichnet die Knotenmerkmale von miRNA/ mit Konnektivität der 1
Description A . LU501881 Ordnung / des heterogenen Graphen , message‘ bezeichnet die Nachrichten- übertragungsfunktion der Ordnung / zwischen miRNA 7 und Krankheit u, pi. 4, rÜbezeichnen die Ubertragungsgewichte der Konnektivität der Ordnung 7, W©, Ww", Ww bezeichnen die trainierbare Gewichtsmatrix der Ordnung /, vm“ bezeichnet den Merkmalsvektor der miRNA der Ordnung /-1, vd" bezeichnet den Merkmalsvektor der Krankheit # der Ordnung /-1 , message“ bezeichnet die Nachrichteniibertragungsfunktion der Ordnung / zwischen miRNA und miRNA-Knoten, vm‘” bezeichnet den Merkmalsvektor der miRNA jder Ordnung /—1, message" bezeichnet die Nachrichtenübertragungsfunktion der Ordnung / zwischen Krankheit # und Krankheit v und vd" bezeichnet den Merkmalsvektor der Krankheit v der Ordnung /—1.
In dieser Ausführungsform kann eine hoherwertige Darstellung der Konnektivität der Knoten durch Stapeln mehrerer Schichten des Modells erreicht werden. Wie in Abbildung 2 gezeigt, gibt es, da die vorliegende Erfindung auf einem heterogenen Graphen basiert, zusätzliche miRNA-zu-miRNA-Assoziationspfade und Krankheit-zu-Krankheit-Assoziationspfade, so dass die vorliegende Erfindung die Anzahl der Schichten L=5 definiert, und schließlich erhält die 7-te miRNA das Multi-Konnektivitätsmerkmal {vm, vm vm VY, und die u-te Krankheit erhält das Multi-Konnektivitätsmerkmal {vd, vd"... vd" . Basierend auf den mehrschichtigen Merkmalen des aggregierten heterogenen Graphen der Diffusionsgraphenfaltung (diffusion graph convolution, DGC) wird das endgültige Merkmal der 7% -ten miRNA als vm = vm, + vm +... vm"? | und das endgültige Merkmal der u -ten Krankheit als vd = vd, +vd"+,.-- vd" erhalten, und das endgültige Merkmal m”™ jeder miRNA wird nach Spalten sortiert, um die Merkmalsmatrix der miRNA X, zu erhalten, und auf ähnliche Weise kann die Merkmalsmatrix der Krankheit erhalten werden. In ähnlicher Weise können wir die Matrix der Krankheitsmerkmale X, erhalten.
S4, Erhalten eines miRNA-Krankheitsassoziationsvorhersagemodells unter Verwendung induktiver Matrixzerlegung auf der Grundlage der miRNA-Merkmalsmatrix und der 1
Description . . LU501881 Krankheitsmerkmalsmatrix.
In dieser Ausführungsform wird auf der Grundlage der induktiven Matrixzerlegung die endgültige miRNA-Krankheitsassoziationsvorhersagematrix P wie folgt ausgedrückt. Px6,(X,)6,X P bezeichnet die miRNA-Krankheitsassoziationsvorhersagematrix, ÿ, und @, bezeichnen den mehrschichtigen Perzeptron-MLP mit mehreren vollständig verbundenen Schichten für die Verarbeitung von ~~ miRNA- bzw. Krankheitsmerkmalen. X,„ bezeichnet die miRNA-Merkmalsmatrix, X, die Krankheitsmerkmalsmatrix und 7 die Transponierung. Um die Komplexität des Netzwerks zu verringern, wird in diesem Schema ein zweischichtiger mehrschichtiger Perzeptron-MLP verwendet, wobei beide mehrschichtigen Perzeptron-MLPs nm+nd Eingabeneuronen, 2 versteckte Schichten mit 512 Dimensionen und die Anzahl der Neuronen in der Ausgabeschicht k=128 enthalten. Die Ausgabemerkmalsmatrizen von @, und ¢, werden als O, bzw. O, bezeichnet.
O, = sigmoid WO ReELUWO X +b) +69) O, = sigmoid WP Re LUW X, +b") +60) 0, etm 0 en md © und bY bezeichnen die trainierbare Gewichtsmatrix und den Bias-Term der Schicht / im MLP, die auf die miRNA einwirkt, bzw. W” und 5!’ bezeichnen die trainierbare Gewichtsmatrix und den Bias-Term der Schicht / im MLP, die auf die Krankheit einwirkt. /=1.2 in der obigen Gleichung , ReZU bezeichnet die ReLU-Aktivierungsfunktion und Sigmoid ist die Aktivierungsfunktion.
Die endgültige Vorhersagematrix der miRNA-Krankheitsassoziation wurde durch Kombination des inneren Produkts erhalten.
P=0,*0, O; bezeichnet die Transposition von O,.
SS, Trainieren des miRNA-Krankheitsassoziationsvorhersagemodells und Verwenden der nach dem Training erhaltenen miRNA-Krankheitsassoziationsvorhersagematrix, um die Assoziation von unbekannten miRNAs mit Krankheiten vorherzusagen.
2
Description . . . . . . 2101881 Bei dieser Implementierung wird das Modell trainiert. Die Verlustfunktion des Modells besteht aus dem positiven Probenverlust, dem negativen Probenverlust und dem kanonischen Verlust, die wie folgt definiert sind.
. (I-a) 2 a 2 2 2 2 L= min SPA = P|, +5 |PaCA=P)[ + BADE +7 (wl. +a P, ist die positive Assoziations-Mapping-Matrix , Wenn bekannt ist, dass die miRNA-Nummer 7 mit der Krankheitsnummer uw assoziiert ist, ist F,(7,u)=1, andernfalls P,liu)=0. P, ist die negative Assoziations-Mapping-Matrix, P, =—(F, —1), der erste Term der Formel bezeichnet den positiven Probenverlust, der zweite Term bezeichnet den negativen Probenverlust, der dritte Term bezeichnet den Parameter-Regularisierungsverlust von GNN. ¢ bezeichnet alle trainierbaren Parameter in GNN. Der vierte Term bezeichnet den parametrischen regulierten Verlust des MLP, wobei y, und y, die trainierbaren Parameter der beiden MLP bezeichnen, a bezeichnet den Hyperparameter für den Anteil positiver und negativer Probenverluste, der den Anteil positiver und negativer Probenverluste misst, ist der Regularisierungsparameter von GNN und 7 ist der Regularisierungsparameter von MLP.
In dieser Ausführungsform wird die Kreuzvalidierung mit der Leave-One-Out-Methode verwendet, und das Modell wird durch Gradientenabstieg mit dem Adam-Algorithmus auf der Grundlage der Verlustfunktion trainiert.
In dieser Ausführungsform werden unbekannte Assoziationen vorhergesagt. Die unbekannte miRNA-Krankheitsassoziation wird auf der Grundlage des endgültigen Modellergebnisses P vorhergesagt.
Durch das obige Design nutzt die vorliegende Erfindung erstens die miRNA- und Krankheitsähnlichkeitsinformationen, indem sie Konnektivität hoher Ordnung auf dem heterogenen Graphen erhält, und kann miRNAs oder Krankheiten unbekannter Assoziation durch die heterogene Graphenstruktur vorhersagen. Durch die Verwendung einer auf einem neuronalen Netz basierenden induktiven Matrixzerlegungsmethode werden die miRNA- und Krankheitsmerkmale effektiv kombiniert, um das Vertrauen in die Vorhersageergebnisse zu erhöhe. Außerdem ist das gesamte Modell ein End-to-End-Modell, das die Trainingseffizienz effektiv verbessert.
2
Description Beispiel 2 LU501881 Wie in Abbildung 3 dargestellt, stellt die vorliegende Erfindung ein auf einer heterogenen Graphen basierendes miRNA-Krankheitsassoziationsvorhersagesystem bereit, das Folgendes umfasst.
Ein integriertes Ähnlichkeitsmatrix-Konstruktionsmodul zum Erhalten von miRNA- und Krankheitsdaten und zum Konstruieren einer integrierten Ähnlichkeitsmatrix.
Ein Modul zur Konstruktion eines heterogenen Graphen zum Konstruieren eines heterogenen Graphen auf der Grundlage der integrierten Ahnlichkeitsmatrix und zum Berechnen von Konnektivitätsinformationen erster Ordnung über den heterogenen Graphen.
Ein Merkmalsberechnungsmodul zum Erweitern der Konnektivitätsinformationen erster Ordnung auf der heterogenen Karte und zum Verschmelzen der topologischen Merkmale höherer Ordnung der heterogenen Karte, um die miRNA-Merkmalsmatrix und die Krankheitsmerkmalsmatrix zu erhalten.
Das Modul zur Berechnung der miRNA-Krankheitsassoziationsvorhersagematrix, um ein miRNA-Krankheitsassoziationsvorhersagemodell auf der Grundlage der miRNA-Merkmalsmatrix und der Krankheitsmerkmalsmatrix unter Verwendung einer induktiven Matrixzerlegung zu erhalten.
Vorhersagemodul zum Trainieren des miRNA- Krankheitsassoziationsvorhersagemodells und zum Verwenden der nach dem Training erhaltenen miRNA-Krankheitsassoziationsvorhersagematrix, um die Assoziation von unbekannten miRNAs mit Krankheiten vorherzusagen.
Das auf einer heterogenen Graphen basierende System zur Vorhersage von miRNA-Krankheitsassoziationen, das durch die in Abbildung 3 gezeigte Ausführungsform bereitgestellt wird, kann die in der obigen Ausführungsform der Methode gezeigte technische Lösung durchführen, die mit ähnlichen Prinzipien und vorteilhaften Effekten umgesetzt wird und hier nicht wiederholt wird.
2

Claims (9)

Claims
1. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von 881 heterogenen Graphen, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst.
S1, Beschaffung von miRNA- und Krankheitsdaten und Erstellung einer integrierten Ahnlichkeitsmatrix.
S2 , Erstellen einer heterogenen Graphen auf der Grundlage der umfassenden Ahnlichkeitsmatrix und Berechnen der Konnektivitätsinformationen erster Ordnung auf der heterogenen Graphen.
S3, Erweiterung der Konnektivitätsinformationen erster Ordnung auf der heterogenen Karte und Verschmelzung der topologischen Merkmale hoherer Ordnung der heterogenen Graphen, um die miRNA-Merkmalsmatrix und die Krankheitsmerkmalsmatrix zu erhalten.
S4, Erhalten eines miRNA-Krankheitsassoziationsvorhersagemodells unter Verwendung induktiver Matrixzerlegung auf der Grundlage der miRNA-Merkmalsmatrix und der Krankheitsmerkmalsmatrix.
SS, Trainieren des miRNA-Krankheitsassoziationsvorhersagemodells und Verwenden der nach dem Training erhaltenen miRNA-Krankheitsassoziationsvorhersagematrix, um die Assoziation von unbekannten miRNAs mit Krankheiten vorherzusagen.
2. Fine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage heterogener Graphen nach Anspruch 1, dadurch gekennzeichnet, dass die integrierte Ahnlichkeitsmatrix in Schritt SI eine —miRNA-Ahnlichkeitsmatrix und eine Krankheitsähnlichkeitsmatrix umfasst.
Die besagte miRNA-Ähnlichkeitsmatrix hat die folgenden Ausdrücke.
FM (orm An a LA An PERLE San m m ; re medi fade Amitionete dénlichkeit ee GM Tan an) dar habenkeine frnktionelie Ahnlichkeir Der Ausdruck für die beschriebene Krankheitsähnlichkeitsmatrix lautet wie folgt. SSL FM dy 1 1 ee ua SD dm : — es of, ands Raber seman oie APINICRREN | | GIN Yd ond fabenktein semamische Aknlichkeit SS(d..d)= SS1(d,,d,)+SS2(d,,d,) 2 _——
Claims SSI(d,,d,)= Lorman Da. 02140) (PL, + 740) or DVi(d,)+DV1(d,) SSAd.d)= rian, P24 0) + D2, (1) DV2(d,)+ DV2(d,) m, bezeichnet miRNA 7 , m, bezeichnet miRNA j , SM(m,m,) bezeichnet miRNA-Ahnlichkeitsmatrix, FM(m,m,) bezeichnet funktionale miRNA-Ahnlichkeitsmatrix , GM(m,,m,) bezeichnet nukleare GauB-Spektrum-Ahnlichkeitsmatrix von miRNA, d, bezeichnet Krankheit u, d, bezeichnet Krankheit v, SD(d,,d,) bezeichnet Krankheits-Ahnlichkeitsmatrix, SS(d,,d,) bezeichnet semantische Ahnlichkeitsmatrix , GD(d,,d,) bezeichnet nukleare Gauß-Spektrum-Ähnlichkeitsmatrix von Krankheit, SS2(d,,d,) bezeichnet zweite semantische Ahnlichkeitsmatrix, SS1(d,,d,) bezeichnet erste semantische Ahnlichkeitsmatrix, / bezeichnet die Krankheitsknoten, die den DAGs von Krankheit # und Krankheit v gemeinsam sind, T(d,) bezeichnet die Menge der Krankheitsknoten in der DAG von Krankheit u , T(d,) bezeichnet die Menge der Krankheitsknoten in der DAG von Krankheit v , D1, (1) bezeichnet die erste Klasse der semantischen Werte von 7 in der DAG von Krankheit u , D1, (f) bezeichnet die erste Klasse der semantischen Werte von f in der DAG von Krankheit v, D2, (f)bezeichnet die zweite Klasse der semantischen Werte von 7 in der DAG von Krankheit u, D2, ({)bezeichnet die zweite Klasse der semantischen Werte von # in der DAG von Krankheit v , DVI(d,) bezeichnet die erste Klasse der semantischen Werte von Krankheit w , DV1(d,) bezeichnet die erste Klasse der semantischen Werte von Krankheit v , DV2(d,) bezeichnet die zweite Klasse der semantischen Werte von Krankheit u , DV?2(d,) bezeichnet die zweite Klasse der semantischen Werte von Krankheit v.
3. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage heterogener Graphen nach Anspruch 2, dadurch gekennzeichnet, dass der Schritt S2 die folgenden Schritte umfasst. _———
Claims $201, Normalisierung der integrierten Ähnlichkeitsmatrix. (0901881 S202, Verwenden von miRNA und Krankheit als Knoten, Konstruieren eines heterogenen Graphen mit Assoziation zwischen miRNA und Krankheit, Ahnlichkeit zwischen miRNAs und Ahnlichkeit zwischen Krankheiten als Kanten, wobei die Kantengewichte von miRNA- und Krankheitsknoten O oder 1 sind, bestimmt durch die bekannte miRNA- und Krankheitsassoziationsmatrix, die Kantengewichte zwischen miRNA-Knoten normalisierte miRNA-Ahnlichkeit sind und die Kantengewichte von Krankheitsknoten die normalisierte Krankheitsähnlichkeit darstellen.
S203, Bestimmung einer ursprünglichen Merkmalsmatrix für den heterogenen Graphen.
S204, Einstellen einer Nachrichtenübermittlungsfunktion mit variablen Gewichten zwischen Schichten auf dem heterogenen Graphen auf der Grundlage der ursprünglichen Merkmalsmatrix.
S205, auf der Grundlage der …— Nachrichtenübertragungsfunktion wird = die Nachrichtenaggregationsfunktion, die die miRNA- und Krankheitsähnlichkeit kombiniert, durch Aggregation erhalten, wodurch die Berechnung der Konnektivitätsinformationen erster Ordnung abgeschlossen wird.
4. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage heterogener Graphen nach Anspruch 3, dadurch gekennzeichnet, dass die Nachrichtenfunktion in Schritt S204 eine Nachrichtenfunktion zwischen miRNA- und Krankheitsknoten, eine Nachrichtenfunktion zwischen miRNA-Knoten und eine Nachrichtenfunktion zwischen Krankheitsknoten umfasst.
Der Ausdruck für die Nachrichtenübermittlungsfunktion zwischen der miRNA und dem Krankheitsknoten lautet wie folgt.
message, 5m, = Pa (M, vd,) Da =1/ Nd, | Nm, | Die Nachrichtenübermittlungsfunktion zwischen den miRNA-Knoten wird wie folgt ausgedrückt.
MESSAGE = q,W,(vm,,vm,) Gi =1/ [Nm | Nm Die Nachrichtenübermittlungsfunktion zwischen den genannten Krankheitsknoten wird wie folgt ausgedrückt. _———
Claims LU501881 message, , = r W.(vd, vd) r, =1/ nd, | Nd, | message, mn, bezeichnet die Nachrichtenübertragungsfunktion zwischen miRNA und Krankheit #, p, piu bezeichnet das Ubertragungsgewicht zwischen miRNA7 und Krankheit = , [J bezeichnet die Multiplikation mit Elementen, vm, bezeichnet das Anfangsmerkmal von miRNA, vd, bezeichnet das Anfangsmerkmal von Krankheit u, Nd, bezeichnet die Menge der Krankheitsknoten in den Nachbarknoten erster Ordnung von miRNA, Nm, bezeichnet die Menge der miRNA-Knoten in den Nachbarknoten erster Ordnung von Krankheit u, message, ,,, bezeichnet die Nachrichtenübertragungsfunktion zwischen miRNA-Knoten, q, bezeichnet das Übertragungsgewicht zwischen miRNAs, vm, und vm, bezeichnen die anfänglichen Merkmale von miRNA7 bzw. miRNA j, (* »*) bezeichnet die Vektor-Splicing-Operation zur Kombination der Merkmale von zwei Knoten, Nm, bezeichnet die Menge der miRNA-Knoten und ihrer eigenen Knoten in den Nachbarknoten erster Ordnung von miRNA 7, Nm, bezeichnet die Menge der miRNA-Knoten und ihrer eigenen Knoten in den Nachbarknoten erster Ordnung von miRNA j » message, …,, bezeichnet die Nachrichtentibertragungsfunktion zwischen Krankheitsknoten, vd, bezeichnet das Anfangsmerkmal der Krankheit v, r,, bezeichnet die Ubertragungsgewichte zwischen Krankheitsknoten , W,W,,W, bezeichnen trainierbaren Gewichtsmatrizen, W, €eD PP J, [] POD yg) Omar) | Per") bezeichnen den zweidimensionalen realen Raum von d x (nm +nd) » Nm bezeichnet die die Gesamtzahl der miRNAs, nd bezeichnet die Gesamtzahl der Krankheiten, d bezeichnet die Dimensionalität der Knotenmerkmale, Nd, bezeichnet die Menge der Krankheitsknoten und ihrer eigenen Knoten in der Nachbarschaft erster Ordnung der Krankheit # , Nd, bezeichnet die Menge der Krankheitsknoten und ihrer eigenen Knoten in der Nachbarschaft erster Ordnung der Krankheit v.
5. Eine Methode zur Vorhersage der miRNA-Krankheitsassoziation auf der Grundlage _—
Bas . . . LU501881 heterogener Graphen nach Anspruch 4, dadurch gekennzeichnet, dass die Expression der Nachrichtenaggregationsfunktion für die miRNA- und Krankheitsähnlichkeit im Schritt S205 wie folgt ist.
vd” = Leaky Relu(———— > message, . + Lx > SD(u,q)message, , ,) 2 Nm, | n,n, “ ? 2 d,eNda, a 1 1 vm" = Leaky Relu(——— message + —* SM (i, t)message i GG Nd, | 2 md, 2 A, ( ) 8g cm) m, bezeichnet einen beliebigen miRNA-Knoten in der Nachbarschaft erster Ordnung von Krankheit u, d, bezeichnet einen beliebigen Krankheitsknoten in der Nachbarschaft erster Ordnung von Krankheit u, d, bezeichnet einen beliebigen Krankheitsknoten in der Nachbarschaft erster Ordnung von miRNA 7, m, bezeichnet einen beliebigen miRNA-Knoten in der Nachbarschaft erster Ordnung von miRNA i , vd” und wm" bezeichnen Konnektivitätsknotenmerkmale erster Ordnung, die heterogene Graphen einbeziehen; SD(u,q) bezeichnet die kombinierte Ähnlichkeit von Krankheit # und Krankheit q, SM (if) bezeichnet die kombinierte Ähnlichkeit vonmiRNA; und miRNA.
6. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage heterogener Graphen nach Anspruch 5, dadurch gekennzeichnet, dass der Schritt S3 die folgenden Schritte umfasst.
S301, Erweiterung der Konnektivitätsinformationen erster Ordnung auf dem heterogenen Graphen und Definition der Transfergewichte der Ordnung L.
S302, Definition einer Nachrichtenübermittlungsfunktion und einer Nachrichtenaggregationsfunktion hôherer Ordnung in dem heterogenen Graphen entsprechend den Ubermittlungsgewichten.
S303, basierend auf der Nachrichtenübertragungsfunktion höherer Ordnung und der Nachrichtenaggregationsfunktion in dem heterogenen Graphen, werden das endgültige Mehrfachordnungsmerkmal vm“ der miRNA: und das endgültige Mehrfachordnungsmerkmal vdu der Krankheit # auf der Grundlage der Aggregation von Merkmalen verschiedener Ordnungen durch den DGC erhalten.
Claims 1 LA LU501881 vm = vm, + vm Jee, vm! > vd" = vd, vd ee vd L bezeichnet die Eigenordnung, vd" bezeichnet den Eigenvektor der Krankheit u der Ordnung L-1, vm" bezeichnet den Figenvektor der miRNA der Ordnung L-1.
$304, das endgültige Mehrfachordnungsmerkmal vm™" jeder miRNA: wird spaltenweise sortiert, um die Merkmalsmatrix X der miRNA zu erhalten, und das endgültige Mehrfachordnungsmerkmal vd/"“ jeder Krankheit u wird spaltenweise sortiert, um die Merkmalsmatrix X, der Krankheit zu erhalten.
7. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage heterogener Graphen nach Anspruch 6, dadurch gekennzeichnet, dass die Ausdrücke fir die Nachrichtenübertragungsfunktionen verschiedener Ordnungen in den heterogenen Graphen im Schritt S302 wie folgt sind.
message” = pW m0 vd") dem; ui ‘1 i u message) =q' WW," (vm vm) message! =r JW (vd vd") Der Ausdruck der Nachrichtenaggregationsfunktion lautet wie folgt. 1 vd" = LeakyRelu(——— >. message”, + >. SD(u,q)messagey’, , ) Nm, | m,eNm, “ ? d,eNda, “ “ 1 vm" = Leaky Relu(—— >) message). + > SM (i,t)message‘?_„) |Ndm,| CRC ’ m,eNm,, vd bezeichnet die Knotenmerkmale von Krankheit # mit Konnektivität der Ordnung / des heterogenen Graphen, vm“ bezeichnet die Knotenmerkmale von miRNA/ mit Konnektivität der Ordnung I des heterogenen Graphen , message“ bezeichnet die Nachrichtenübertragungsfunktion der Ordnung/ zwischen miRNA7 und Krankheit u, pi, ¢' rÜbezeichnen die Ubertragungsgewichte der Konnektivität der Ordnung 7, W©, Ww", Ww 6
Claims bezeichnen die trainierbare Gewichtsmatrix der Ordnung /, vm" bezeichnet den Merkmalsvektor ve der miRNA der Ordnung /—1, vd" bezeichnet den Merkmalsvektor der Krankheit # der Ordnung /-1 , message.” bezeichnet die Nachrichteniibertragungsfunktion der Ordnung / zwischen miRNA und miRNA-Knoten, vm‘” bezeichnet den Merkmalsvektor der miRNA j der Ordnung /-1, message’ bezeichnet die Nachrichteniibertragungsfunktion der Ordnung / zwischen Krankheit # und Krankheit v und vd" bezeichnet den Merkmalsvektor der Krankheit v der Ordnung /—1.
8. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage heterogener Graphen nach Anspruch 7, dadurch gekennzeichnet, dass der Ausdruck der miRNA-Krankheitsassoziationsvorhersagematrix in Schritt S4 wie folgt ist.
P=0,*0, O, = sigmoid WO ReELUWO X +b) +69) O, = sigmoid WP Re LUW X, +b") +60) P bezeichnet die miRNA-Krankheitsassoziationsvorhersagematrix , X, bezeichnet die Merkmalsmatrix der miRNA, X, bezeichnet die Merkmalsmatrix der Krankheit, 0; bezeichnet die Transponierung von O,, O,, e0™ 0 en"), wD und bY bezeichnen die trainierbare Gewichtsmatrix und die Bias-Terme der Schicht 1 des mehrschichtigen Perzeptron-MLP, die auf miRNA wirken, W'” und © bezeichnen die trainierbare Gewichtsmatrix und die Bias-Terme der Schicht 2 des mehrschichtigen Perzeptron-MLP, die auf miRNA wirken. W” und 5!" bezeichnen die trainierbare Gewichtsmatrix und die Bias-Terme der Schicht 1 des mehrschichtigen Perzeptron-MLP, der auf die Krankheit einwirkt, und W” und bY bezeichnen die trainierbare Gewichtsmatrix bzw. die Bias-Terme der Schicht 2 des mehrschichtigen Perzeptron-MLP, der auf die Krankheit einwirkt.
9. Eine Methode zur Vorhersage von miRNA-Krankheitsassoziationen auf der Grundlage von heterogenen Graphen, dadurch gekennzeichnet, dass es umfasst.
Ein integriertes Ahnlichkeitsmatrix-Konstruktionsmodul zum Erhalten von miRNA- und _———
Claims Krankheitsdaten und zum Konstruieren einer integrierten Ähnlichkeitsmatrix. (0901881 Fin Modul zur Konstruktion eines heterogenen Graphen zum Konstruieren eines heterogenen Graphen auf der Grundlage der integrierten Ahnlichkeitsmatrix und zum Berechnen von Konnektivitätsinformationen erster Ordnung über den heterogenen Graphen.
Ein Merkmalsberechnungsmodul zum Erweitern der Konnektivitätsinformationen erster Ordnung auf der heterogenen Karte und zum Verschmelzen der topologischen Merkmale hôherer Ordnung der heterogenen Karte, um die miRNA-Merkmalsmatrix und die Krankheitsmerkmalsmatrix zu erhalten.
Das Modul zur Berechnung der miRNA-Krankheitsassoziationsvorhersagematrix, um ein miRNA-Krankheitsassoziationsvorhersagemodell auf der Grundlage der miRNA-Merkmalsmatrix und der Krankheitsmerkmalsmatrix unter Verwendung einer induktiven Matrixzerlegung zu erhalten.
Vorhersagemodul zum Trainieren des miRNA-Krankheitsassoziationsvorhersagemodells und zum Verwenden der nach dem Training erhaltenen miRNA-Krankheitsassoziationsvorhersagematrix, um die Assoziation von unbekannten miRNAs mit Krankheiten vorherzusagen. _——
LU501881A 2022-03-08 2022-04-20 Eine methode und ein system zur vorhersage von mirna-krankheitsassoziationen auf der grundlage von heterogenen graphen LU501881B1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210219713.1A CN114613437B (zh) 2022-03-08 2022-03-08 一种基于异构图的miRNA与疾病关联预测方法及系统

Publications (1)

Publication Number Publication Date
LU501881B1 true LU501881B1 (de) 2022-11-17

Family

ID=81861156

Family Applications (1)

Application Number Title Priority Date Filing Date
LU501881A LU501881B1 (de) 2022-03-08 2022-04-20 Eine methode und ein system zur vorhersage von mirna-krankheitsassoziationen auf der grundlage von heterogenen graphen

Country Status (2)

Country Link
CN (1) CN114613437B (de)
LU (1) LU501881B1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114944192B (zh) * 2022-06-22 2023-06-30 湖南科技大学 一种基于图注意力的疾病相关环状rna识别方法
CN117012375B (zh) * 2023-10-07 2024-03-26 之江实验室 一种基于患者拓扑特征相似性的临床决策支持方法和系统
CN117393143B (zh) * 2023-10-11 2024-06-25 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于图表示学习的环状rna-疾病关联预测方法
CN118506884A (zh) * 2024-07-19 2024-08-16 山东大学 miRNA-疾病关联关系预测方法、系统、设备及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681705B (zh) * 2020-05-21 2024-05-24 中国科学院深圳先进技术研究院 一种miRNA-疾病关联预测方法、系统、终端以及存储介质
CN114049930B (zh) * 2021-11-12 2024-07-16 东南大学 一种基于异质网络表示学习的中药药方重定位方法
CN114121181B (zh) * 2021-11-12 2024-03-29 东南大学 一种基于注意力机制的异构图神经网络中药靶标预测方法
CN114077836A (zh) * 2021-11-19 2022-02-22 中国电信集团系统集成有限责任公司 一种基于异构神经网络的文本分类方法及装置
CN114093425A (zh) * 2021-11-29 2022-02-25 湖南大学 一种融合异构网络与图神经网络的lncRNA与疾病关联预测方法

Also Published As

Publication number Publication date
CN114613437A (zh) 2022-06-10
CN114613437B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
LU501881B1 (de) Eine methode und ein system zur vorhersage von mirna-krankheitsassoziationen auf der grundlage von heterogenen graphen
DE102018129424A1 (de) System und verfahren zum lernen der struktur von tiefen neuronalen netzwerken
DE112018006189T5 (de) Robuste gradienten-gewichtskomprimierungsschemata für deep-learning-anwendungen
DE102018111905A1 (de) Domänenspezifische Sprache zur Erzeugung rekurrenter neuronaler Netzarchitekturen
CN110473592B (zh) 一种多视角人类协同致死基因预测方法
DE112018005205T5 (de) Komprimierung von vollständig verbundenen / wiederkehrenden Schichten von einem oder mehreren tiefen Netzen durch Durchsetzen von räumlicher Lokalität für Gewichtsmatrizen und erwirken von Frequenzkomprimierung
WO2004017258A2 (de) Verfahren, datenverarbeitungseinrichtung und computerprogrammprodukt zur datenverarbeitung
DE102012009502A1 (de) Verfahren zum Trainieren eines künstlichen neuronalen Netzes
DE112020004471T5 (de) Folgerungsvorrichtung, Trainingsvorrichtung, Folgerungsverfahren und Trainingsverfahren
Wang et al. Theory-based residual neural networks: A synergy of discrete choice models and deep neural networks
DE102021004591A1 (de) Für Graphen vorgesehene neuronale Netzwerke für Datensätze mit Heterophilie
DE112019005373T5 (de) Framework für maschinelles lernen zum finden von materialien mit gewünschten eigenschaften
DE102018127802A1 (de) Hybrider klassifikator eines gepulsten neuronalen netzwerks und einer support-vektor-maschine
DE102020205959A1 (de) Algorithmen zum berechnen von kraftfeldern in neuronalen graphennetzwerken für molekulardynamische computersimulationen
DE202022105010U1 (de) Ein Differential Crossover- und Quanten-Partikelschwarm-Optimierungssystem
DE112016007411T5 (de) Fuzzy-eingabe für autoencoder
DE112021002868T5 (de) Erzeugung von rich descriptor framework zu text unter verwendung vongraphen und strukturellen neuronalen codierern
DE112021003761T5 (de) Prädiktive modelle mit zerlegbaren hierarchischen ebenen, die konfiguriert werden, um interpretierbare resultate zu erzeugen
DE102019204118A1 (de) Verfahren zum Übertragen eines Merkmals eines ersten Bilds an ein zweites Bild
DE102019104571A1 (de) Künstliches neuronales netz
DE112022003696T5 (de) Verfahren und systeme zur erzeugung von modellen für die bildanalyse pipeline prediction
DE102021210803A1 (de) Effizientes skalieren der prädiktion des interatomaren potenzials neuronaler netzwerke auf cpu-cluster
DE112020007371T5 (de) Verfahren und Einrichtung für ein neuronales Netzwerk basierend auf energiebasierten Modellen einer latenten Variable
Fischer Random dynamics in collective behaviour: consensus, clustering & extinction of populations
EP3716058A1 (de) Verfahren zum ansteuern eines geräts mit einem neuen programmcode

Legal Events

Date Code Title Description
FG Patent granted

Effective date: 20221117