LU601421B1 - Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system - Google Patents
Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -systemInfo
- Publication number
- LU601421B1 LU601421B1 LU601421A LU601421A LU601421B1 LU 601421 B1 LU601421 B1 LU 601421B1 LU 601421 A LU601421 A LU 601421A LU 601421 A LU601421 A LU 601421A LU 601421 B1 LU601421 B1 LU 601421B1
- Authority
- LU
- Luxembourg
- Prior art keywords
- data
- interaction
- model
- artificial intelligence
- semantic
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Die vorliegende Erfindung bezieht sich auf das Gebiet der Technologie der künstlichen Intelligenz und offenbart ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system, wobei das Verfahren die Erfassung und standardisierte Verarbeitung heterogener Daten aus mehreren Quellen, die Merkmalsextraktion auf der Grundlage von tiefen neuronalen Netzen und graphischen neuronalen Netzen, die Konstruktion eines semantischen Interaktionsmodells und die Ausführung der Interaktionsverarbeitung sowie die dynamische Optimierung des Modells auf der Grundlage eines mehrdimensionalen Bewertungsmechanismus umfasst. Das System besteht aus einem Modul zur Datenvorverarbeitung, einem Modul zur Modellierung von Merkmalen und zur Interaktion sowie einem Feedback- und Optimierungsmodul, die alle zusammenarbeiten, um einen effizienten und genauen semantischen Abgleich und eine natürlichsprachliche Antwort zu erzielen. Die Methode verbessert die Genauigkeit des semantischen Abgleichs durch einen kontextbezogenen Aufmerksamkeitsmechanismus und eine zweiseitige Interaktionsabbildungsformel und erreicht eine intelligente, adaptive Optimierung und hohe Antworteffizienz der Mensch-Computer- Interaktion, die für intelligenten Kundenservice, semantische Suche, Mensch-Computer-Fragen und andere Szenarien geeignet ist.
Description
Ein auf Algorithmen der künstlichen Intelligenz basierendes LU601421
Dateninteraktionsverfahren und -system
Technischer Bereich
Die vorliegende Erfindung bezieht sich auf das Gebiet der Technologie der künstlichen
Intelligenz, insbesondere auf ein auf Algorithmen der künstlichen Intelligenz basierendes
Dateninteraktionsverfahren und -system, das auf Anwendungsszenarien wie die Verarbeitung natürlicher Sprache, semantisches Verständnis und intelligente Mensch-Computer-Interaktion anwendbar ist.
Technologie im Hintergrund
Mit der Entwicklung der Technologie der künstlichen Intelligenz werden intelligente
Mensch-Computer-Interaktionssysteme in großem Umfang in Kundendienstrobotern,
Suchmaschinen, intelligenten Fragen und Antworten und anderen Bereichen eingesetzt.
Bestehende Interaktionsmethoden stützen sich jedoch im Allgemeinen auf den Abgleich von
Schlüsselwörtern oder statische Regelvorlagen, was das Verständnis komplexer Semantik und das
Erfassen des kontextuellen Zusammenhangs erschwert, was zu einer schlechten
Interaktionsgenauigkeit und einem schlechten Benutzererlebnis führt. Obwohl einige Systeme
Deep-Learning-Modelle einsetzen, sind sie immer noch unzureichend bei der Verarbeitung heterogener Daten, der Erfassung semantischer Assoziationen und der Durchführung dynamischer
Optimierungen. Daher besteht ein dringender Bedarf an einer intelligenten Interaktionsmethode und einem intelligenten Interaktionssystem, das die Verarbeitung von Daten aus mehreren Quellen, eine tiefgehende semantische Modellierung und Feedback-Optimierungsmechanismen integriert, um die Effizienz und Intelligenz der Interaktion zu verbessern.
Bestehenden Dateninteraktionssystemen fehlt ein einheitlicher Datenfusions- und
Vorverarbeitungsmechanismus, wenn es um heterogene Daten aus verschiedenen Quellen geht, was es schwierig macht, strukturierte Daten, Bildinformationen und Sprachdaten im selben semantischen Raum zu modellieren und zu analysieren. Darüber hinaus verlässt sich das System bei unstrukturierten Daten oft auf unabhängige Verarbeitungskanäle, was zu einer verzögerten
Interaktion der Informationen führt und eine tiefgreifende Fusion auf der semantischen Ebene unmöglich macht, so dass es zu einem erheblichen Informationsverlust zwischen multimodalen
Daten kommt, was die Unterstützung komplexer semantischer Verständnisaufgaben zwischen
Mensch und Computer erschwert.
Andererseits haben einige Systeme zwar tiefe neuronale Netze, graphische neuronale Netze und andere Modelle für die Merkmalsextraktion eingeführt, doch stehen sie in der Praxis immer noch vor folgenden Problemen: Erstens ist die Modellstruktur festgelegt, und es ist nicht möglich, die Beteiligung an der Merkmalsauswahl entsprechend den Aufgabenänderungen flexibel abzustimmen; Zweitens, das Fehlen eines kontinuierlichen Bewertungs- und Feedback-
Lernmechanismus für Benutzerverhaltensdaten während des Interaktionsprozesses und die
Unfähigkeit, die Strategie entsprechend den semantischen Veränderungen in Echtzeit anzupassen, was zu einer Verzögerung bei der Aktualisierung der Antwortergebnisse führt und den Grad der
Intelligenz des Systems beeinträchtigt. Daher besteht ein dringender Bedarf an einer vollständigen
Dateninteraktionslösung, die heterogene Datenmodellierung, tiefgehende semantische Interaktion und adaptive Optimierung integriert.
Inhalt der Erfindung
Um den oben genannten Zweck der Erfindung zu erreichen, stellt die vorliegende Erfindung die folgende technische Lösung bereit: ein auf Algorithmen der künstlichen Intelligenz basierendes
Dateninteraktionsverfahren, das die folgenden Schritte umfasst: LU601421
Schritt 1. Erfassen von heterogenen Daten aus mehreren Quellen und Vorverarbeiten der heterogenen Daten aus mehreren Quellen, um standardisierte Eingangsdaten zu erhalten;
Schritt 2, Durchführen einer Merkmalsextraktion an den standardisierten Eingabedaten, basierend auf einem Algorithmus der künstlichen Intelligenz, und Konstruieren eines
Dateninteraktionsmodells;
Schritt 3, Verwendung des Dateninteraktionsmodells zur Durchführung einer
Interaktionsverarbeitung an den Zieldaten, um ein Antwortergebnis zu erzeugen;
Schritt 4, Bewertung und Bereitstellung von Feedback zu den Antwortergebnissen und dynamische Optimierung des Dateninteraktionsmodells entsprechend den Bewertungsergebnissen.
Vorzugsweise umfassen die heterogenen Daten aus mehreren Quellen in Schritt 1 strukturierte Daten, halbstrukturierte Daten und unstrukturierte Daten, wobei die strukturierten
Daten durch Datenbankextraktion und die halbstrukturierten Daten durch
Schnittstellendienstzugang gewonnen werden. Die unstrukturierten Daten werden technisch durch
Stimmerkennung und Bilderkennung erfasst, und die oben genannten strukturierten Daten, halbstrukturierten Daten und unstrukturierten Daten werden einheitlich den Operationen des
Auffüllens der fehlenden Werte, des Zurückweisens der anormalen Werte und der
Formatkonvertierung unterzogen, um die standardisierten Eingabedaten mit einer einheitlichen
Dimension und einem einheitlichen Format zu erzeugen.
Vorzugsweise ist der Algorithmus der künstlichen Intelligenz in Schritt 2 eine Kombination aus einem tiefen neuronalen Netz und einem graphischen neuronalen Netz, und durch schichtweise
Faltung, Pooling und Graphstrukturmodellierung der standardisierten Eingabedaten werden semantische und strukturelle Korrelationsmerkmale extrahiert und ein Dateninteraktionsmodell zur Unterstützung der Dateninteraktionsaufgabe erstellt. Insbesondere wird ein mehrdimensionaler Aufmerksamkeitsmechanismus während der Modellschulung eingeführt, um die Genauigkeit der Interaktion zwischen verschiedenen Arten von Datenmerkmalen zu verbessern.
Vorzugsweise umfasst die Dateninteraktionsverarbeitung im dritten Schritt: (1) Identifizierung der Benutzeranforderung: Dies wird durch ein Vektor-Mapping-Modul am
Modelleingang durchgeführt; (2) Semantischer Abgleich: die mehrschichtige Assoziationsberechnung zwischen der
Benutzereingabe und dem semantischen Zielinhalt wird durch Einführung einer mehrdimensionalen dynamischen Abgleichsfunktion, die durch kontextuelle Aufmerksamkeit gewichtet wird, vervollständigt, wobei die semantische Abgleichsgradfunktion wie folgt ist:
Sim(Q,D) = DEL, a; HA + à KL(Po|IPp):
Ilgill ll] +e wobei:
Sim(Q, D) ist die semantische Übereinstimmungsgradfunktion;
Q = {91,92 ,9In} > D = {d,,dz,…,dp} bezeichnen die n-dimensionalen
Einbettungsvektoren der Benutzeranfrage bzw. der Zieläußerung; a; ist der durch den Mechanismus der kontextuellen Aufmerksamkeit berechnete
Gewichtungskoeffizient, der XL, a; = 1 erfüllt;
“ LU601 421
G; * d; ist die Ähnlichkeit zwischen dem Vektor der Benutzeranfrage und dem semantischen Zielvektor in der i-ten Dimension;
A ist eine trainierbare Zwei-Wege-Interaktions-Mapping-Matrix zur Verbesserung der nichtlinearen Kreuzrepräsentation des Merkmalsraums; y ist der Interaktionsverstärkungsfaktor, der das Verhältnis von innerem Produkt zu
Interaktionsterms steuert: € ist ein Glättungsterm zur Vermeidung von Null-Nennern;
KL(Pol|Pp) ist die KL-Streuung der beiden eingebetteten Sequenzen, die auf der
Grundlage der Kontextinformationen berechnet wird und den Unterschied in der
Informationsverteilung widerspiegelt, und À ist ihr Gewichtskontrollfaktor. (3) Antwortgenerierung: Generierung von natürlichem Sprachoutput durch ein vorab trainiertes Sprachmodell zur Vervollständigung der Dateninteraktion.
Das System führt eine mehrdimensionale Bewertung der aktuellen Antwortergebnisse auf der
Grundlage der historischen Interaktionsdatensätze durch und passt die Modellparameter und
Aufmerksamkeitsgewichte anhand der Bewertungsergebnisse dynamisch an, um adaptives Lernen und Modelloptimierung zu erreichen. Gleichzeitig führt das System einen Schiebefenster-
Mechanismus ein, um die jüngsten repräsentativen Datenproben für eine schnelle Rückmeldung und iterative Aktualisierung zu filtern.
Die vorliegende Erfindung stellt auch ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionssystem bereit, das die folgenden Module umfasst:
Ein Datenvorverarbeitungsmodul zum Sammeln heterogener Daten aus mehreren Quellen und zur Durchführung einer standardisierten Verarbeitung;
Ein Modul zur Modellierung von Merkmalen und zur Interaktion, um Datenmerkmale zu extrahieren und ein Dateninteraktionsmodell auf der Grundlage eines Algorithmus der künstlichen
Intelligenz zu konstruieren, um eine semantische Übereinstimmung zwischen Benutzereingaben und Dateninhalten zu erreichen;
Ein Feedback-Optimierungsmodul, das dazu dient, die Ergebnisse der Interaktionsreaktion in mehreren Dimensionen zu bewerten und das Dateninteraktionsmodell auf der Grundlage der
Bewertungsergebnisse dynamisch zu optimieren.
Das Datenvorverarbeitungsmodul umfasst:
Ein Datenerfassungsteilmodul zur Erfassung strukturierter, halbstrukturierter und unstrukturierter Daten über eine Datenbankschnittstelle, eine API-Schnittstelle, Bilderkennung und Spracherkennung;
Ein Submodul zur Datenbereinigung, um fehlende Werte aufzufüllen, Ausreißer zu identifizieren und zu eliminieren sowie Formatkonvertierungsoperationen durchzuführen;
Ein standardisiertes Konvertierungs-Submodul für die einheitliche Konvertierung der bereinigten Daten in ein standardisiertes Format, das für das Modell akzeptabel ist, einschließlich
Tensorquantisierung und numerische Normalisierungsverarbeitung.
Das Modul für Merkmalsmodellierung und Interaktion umfasst: LU601421
Ein Merkmalsextraktions-Submodul zum Extrahieren semantischer und struktureller
Merkmale in den Eingabedaten unter Verwendung eines tiefen neuronalen Netzes und eines graphischen neuronalen Netzes;
Ein semantisches Matching-Submodul zum Durchführen einer semantischen
Assoziationsberechnung zwischen Benutzereingaben und Zielinformationen mit Hilfe eines
Ähnlichkeitsalgorithmus und eines Aufmerksamkeitsmechanismus;
Ein Untermodul zur Erzeugung von Antworten, um die Ergebnisse des Abgleichs mit der kontextuellen Semantik zu kombinieren und eine natürliche Sprache als Systemantwort zu erzeugen.
Das Modul zur Feedback-Optimierung umfasst:
Ein Bewertungs- und Analyse-Submodul zur Bewertung der Interaktionsergebnisse auf der
Grundlage der Genauigkeit, der Reaktionszeit und des Benutzer-Feedbacks, und
Ein Modelloptimierungssubmodul zum Anpassen von Modellparametern auf der Grundlage der Bewertungsergebnisse, einschließlich der Anpassung der Lernrate und der Aktualisierung der
Aufmerksamkeitsgewichtung;
Ein Untermodul für das Screening und die Iteration von Proben, das verwendet wird, um hochwertige Trainingsproben unter Verwendung eines Schiebefenstermechanismus auszuwählen, um die Verallgemeinerungsfähigkeit des Modells in verschiedenen Datenszenarien zu verbessern.
Vorteilhafte Wirkung der vorliegenden Erfindung im Vergleich zum Stand der Technik:
Verbesserung der Fusions- und Verarbeitungseffizienz von heterogenen Daten aus verschiedenen Quellen: Durch die Einführung eines einheitlichen
Datenstandardisierungsvorverarbeitungsmechanismus kombiniert die vorliegende Erfindung den integrierten = Bereinigungs- und Formatkonvertierungsprozess von strukturierten, halbstrukturierten und unstrukturierten Daten, um zu realisieren, dass Daten aus verschiedenen
Quellen und Strukturen einheitlich in dasselbe intelligente Modell eingegeben werden können, wodurch die Schwelle des Datenzugriffs erheblich gesenkt und die Effizienz der
Datenverarbeitung und der Interaktionskonsistenz verbessert wird.
Verbesserung der Genauigkeit und Robustheit des semantischen Abgleichs: Die vorliegende
Erfindung integriert ein tiefes neuronales Netz und ein graphisches neuronales Netz, führt einen kontextbezogenen Aufmerksamkeitsmechanismus und eine innovative semantische
Abgleichsgradfunktion in der Merkmalsmodellierungsphase ein, erforscht effektiv die implizite semantische Korrelation und strukturelle Abhängigkeit zwischen Daten und verbessert die
Abgleichsgenauigkeit zwischen Benutzereingaben und Zieldaten sowie die Anpassungsfähigkeit des Systems an semantische Abweichungen bei Dateninteraktionsaufgaben erheblich.
Modelladaptive Optimierung und Closed-Loop-Lernen: Durch die Einführung eines
Reaktionsbewertungsmechanismus, einer Sliding-Window-Screening-Strategie und eines dynamischen Modellparameter-Aktualisierungsmoduls erreicht die vorliegende Erfindung eine
Echtzeit-Rückkopplung und eine iterative Optimierung aus den interaktiven Reaktionsergebnissen, so dass das System eine kontinuierliche Lern- und Selbstevolutionseigenschaft hat und eine gute
Generalisierungsleistung und Langzeitstabilität bei mehreren Szenen und Aufgaben aufweist.
Beschreibung der beigefügten Zeichnungen
Bild 1 zeigt ein schematisches Diagramm des Ablaufs der in der vorliegenden Anwendung vorgesehenen Verfahrensschritte;
Bild 2 zeigt ein schematisches Diagramm eines Systemmoduls, das von der vorliegenden
Anwendung bereitgestellt wird. LU601421
Detaillierte Beschreibung
Damit der Fachmann die Ausführungsformen der vorliegenden Erfindung besser verstehen kann, werden die technischen Lösungen in den Ausführungsformen der vorliegenden Erfindung 5 im Folgenden in Verbindung mit den beigefügten Zeichnungen in den Ausführungsformen der vorliegenden Erfindung klar und vollständig beschrieben, und es ist klar, dass die beschriebenen
Ausführungsformen nur einen Teil der Ausführungsformen der vorliegenden Erfindung und nicht alle Ausführungsformen darstellen. Ausgehend von den Ausführungsformen der vorliegenden
Erfindung fallen alle anderen Ausführungsformen, die von einem Fachmann ohne schöpferische
Arbeit erreicht werden, in den Schutzbereich der vorliegenden Erfindung.
Unter Bezugnahme auf Bild 1 stellen Ausführungsformen der vorliegenden Erfindung ein auf
Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren bereit, das die folgenden Schritte umfasst:
Schritt 1, Erfassen von heterogenen Daten aus mehreren Quellen und Vorverarbeiten der heterogenen Daten aus mehreren Quellen, um standardisierte Eingangsdaten zu erhalten.
In Schritt 1 wird zunächst die interne Managementplattform des Kunden, das externe
Informationssammlungsterminal und die Benutzerinteraktionsschnittstelle angedockt, um die heterogenen Daten aus mehreren Quellen zu erhalten. Zu den strukturierten Daten gehören
Kundentransaktionsdatensätze, Inventarformulare, Produktklassifizierungscodes usw., die durch
Datenbankextraktion (SQL-Abfrage) gewonnen werden; auf die halbstrukturierten Daten, wie z.
B. Benutzerverhaltensprotokolle im JSON-Format, Schnittstellenrückgabedaten im XML-Format usw., wird regelmäßig über die RESTful API-Schnittstelle zugegriffen; Zu den unstrukturierten
Daten gehoren von Kunden hochgeladene Sprachkonsultationsinhalte und Vor-Ort-Bilddaten, die mithilfe eines Spracherkennungsmodells bzw. eines Bilderkennungsalgorithmus (YOLO) transkribiert und geparst werden. Alle erfassten Daten werden einheitlich in das
Datenvorverarbeitungsmodul eingegeben, das nacheinander die Operationen des Auffüllens fehlender Werte (basierend auf Mittelwert und Median), der AusreiBerentfernung (Z-Score-
Methode) und der Formatkonvertierung (Vektorisierung und Tensorisierung) durchführt und schließlich standardisierte Eingabedaten mit einheitlichen Dimensionen und Format fiir die
Merkmalsextraktion und semantische Modellierung durch nachfolgende KI-Modelle erzeugt.
Schritt 2, Merkmalsextraktion aus den standardisierten Eingabedaten auf der Grundlage eines
Algorithmus der künstlichen Intelligenz und Aufbau eines Dateninteraktionsmodells.
In Schritt 2 wird nach Erhalt der standardisierten Eingabedaten ein Kombinationsmodell, das ein tiefes neuronales Netz und ein neuronales Graphen-Netz vereint, zur Merkmalsextraktion und
Interaktionsmodellierung verwendet. Konkret werden zunächst die strukturierten und halbstrukturierten Daten mit Hilfe eines mehrschichtigen neuronalen Faltungsnetzes schichtweise gefaltet und gepoolt, um ihre tiefen semantischen Merkmale zu extrahieren. Bei unstrukturierten
Daten werden die transkribierte Textsemantik und die Bildbeschriftungsinformationen als strukturelle Grapheninputs konstruiert, und ihre Knoten- und Kantenbeziehungen werden mithilfe neuronaler Graphennetze modelliert, um potenzielle strukturelle Assoziationsmerkmale zu ermitteln. Um die Fusionsfähigkeit zwischen verschiedenen Datentypen zu verbessern, führt das
Modell einen mehrdimensionalen Aufmerksamkeitsmechanismus in der Merkmalsfusionsschicht ein, der die Wichtigkeitsgewichte jeder Merkmalsdimension berechnet, um eine feine interaktive
Darstellung von semantischen, strukturellen und kontextuellen Informationen zu erreichen. Das daraus resultierende Dateninteraktionsmodell kann die assoziativen Merkmale höherer Ordnung in heterogenen Daten effektiv erfassen und die anschließende semantische Zuordnung von Datd/601421 und die Generierung von Antworten unterstützen.
Schritt 3, Interaktionsverarbeitung der Zieldaten unter Verwendung des
Dateninteraktionsmodells zur Erzeugung eines Antwortergebnisses.
In Schritt 3 führt das System als Reaktion auf die natürlichsprachliche Eingabeaufforderung des Benutzers zunächst eine Einbettungsverarbeitung des Eingabetextes mit Hilfe eines
Vektorabbildungsmoduls auf der Eingangsseite des Modells durch. Dieses Modul verwendet die vortrainierte Einbettungsschicht, um die vom Benutzer eingegebene Äußerung in eine
Vektorsequenz fester Dimension Q = {q,, G2, ..., In} zu transformieren, wobei jedes q; ein eindimensionaler Einbettungsvektor ist, der zur Darstellung der tiefen semantischen Information der semantischen Einheiten verwendet wird. In dieser Phase wird eine erste strukturierte
Darstellung der Benutzeranfragen erreicht, die die Grundlage für den späteren semantischen
Abgleich und die Generierung von Antworten bildet.
In der anschließenden semantischen Matching-Phase berechnet das System eine mehrschichtige Assoziation zwischen dem obigen Einbettungsvektor Q der
Benutzeranforderung und der Sequenz der semantischen Zielvektoren D = {d,, d>, ...,d,,} im
Kandidatenkorpus. Insbesondere wird ein Mechanismus zur Gewichtung der kontextuellen
Aufmerksamkeit eingeführt, um die Aufmerksamkeitskoeffizienten Œ; für jede Dimension zu lernen, und es wird eine dynamische Abgleichsfunktion Sim(Q, D) konstruiert. Diese Funktion verschmilzt die durch die trainierbare Interaktionsabbildungsmatrix A erzeugten Kreuzterme mit der herkömmlichen Kosinusähnlichkeit, wobei der Grad der Verschmelzung der beiden Terme durch den Interaktionsverstärkungsfaktor Yy gesteuert wird. Um die globale Unterscheidung zwischen Semantiken zu verbessern, wird die kontextbasierte KL-Streuung KL(Po||Pp) als ergänzende Matching-Metrik eingeführt und mit dem Kontrollfaktor A zur Gewichtung der
Summierung kombiniert, um eine genaue Erfassung komplexer Semantiken zu erreichen.
In der Phase der Antwortgenerierung nimmt das System die Zielsemantik mit einem
Übereinstimmungsgrad über einem festgelegten Schwellenwert als Eingabe und übergibt sie an das vorab trainierte Sprachmodell, das für die Textgenerierung trainiert wurde. Durch den kontextabhängigen Dekodierungsmechanismus erzeugt das Modell eine semantisch logische und natürliche Antwort als Ausgabe der endgültigen Dateninteraktion. Wenn ein Benutzer beispielsweise fragt: „Bitte empfehlen Sie einen geeigneten Steuerdienstplan für Startups“, kann das System die Schlüsselsemantik erkennen und ausgeben: „Wir empfehlen Ihnen, das spezielle
Steuerpaket für kleine und mittlere Unternehmen (KMU) zu wählen, das Steuerplanung und vierteljährliche Einreichungsdienste umfasst“. Damit ist ein präziser und intelligenter Prozess der
Dateninteraktion abgeschlossen.
Schritt 4, Auswertung und Rückmeldung über die Antwortergebnisse und dynamische
Optimierung des Dateninteraktionsmodells entsprechend den Auswertungsergebnissen. LU601421
In Schritt 4 ist eine mehrdimensionale Bewertung der Antwortqualität erforderlich, die insbesondere drei Indikatoren für Genauigkeit, Antwortverzögerung und Benutzerzufriedenheit umfasst. Das System extrahiert zunächst Antwortdaten innerhalb eines aktuellen Zeitraums aus historischen Interaktionsdatensätzen und verwendet einen gleitenden Zeitfenstermechanismus (z.
B. fast 100 gültige Interaktionen), um eine repräsentative Stichprobe zu filtern. Für jede Interaktion zeichnet das System die Differenz zwischen dem tatsächlichen Feedback-Ergebnis und der Soll-
Ausgabe auf, die zur Berechnung der Genauigkeitsrate verwendet wird; gleichzeitig wird die
Zeitdifferenz zwischen dem Eingang der Anfrage beim Modell und dem Ausgabeergebnis aufgezeichnet, um die Antwortlatenz zu erhalten; außerdem wird die Nutzerzufriedenheit anhand der Nutzerbewertungen oder Verhaltensrückmeldungen (z. B. die Rate der „Likes“, die Rate der zweiten Fragen usw.) geschätzt. Auf der Grundlage der Ergebnisse der oben genannten Metriken passt das System die Parameter des tiefen neuronalen Netzes und des graphischen neuronalen
Netzes dynamisch an, einschließlich des Gewichtungskoeffizienten @; im
Aufmerksamkeitsmechanismus, um eine adaptive Feinabstimmung des Modells zu erreichen.
Wird beispielsweise ein Rückgang der Antwortgenauigkeit, aber eine geringe Latenzzeit festgestellt, wird das System der Verbesserung der Ausdrucksfähigkeit der semantischen
Abgleichsschicht Vorrang einräumen und die neuesten Beispieldaten verwenden, um eine schnelle
Aktualisierung in kleinen Mengen durchzuführen, wodurch die Gesamtleistung der
Dateninteraktion und die intelligente Antwortqualität verbessert werden.
In Bild 2 ist ein auf Algorithnen der künstlichen Intelligenz basierendes
Dateninteraktionssystem dargestellt, das die folgenden Module umfasst:
Ein Datenvorverarbeitungsmodul zum Sammeln heterogener Daten aus mehreren Quellen und zur Durchführung einer standardisierten Verarbeitung;
Ein Modul zur Modellierung von Merkmalen und zur Interaktion, um Datenmerkmale zu extrahieren und ein Dateninteraktionsmodell zu erstellen, das auf einem Algorithmus der künstlichen Intelligenz basiert, um eine semantische Übereinstimmung zwischen
Benutzereingaben und Dateninhalten zu erreichen;
Ein Feedback-Optimierungsmodul, das dazu dient, die Ergebnisse der Interaktionsreaktion in mehreren Dimensionen zu bewerten und das Dateninteraktionsmodell auf der Grundlage der
Bewertungsergebnisse dynamisch zu optimieren.
Das Datenvorverarbeitungsmodul umfasst:
Ein Datenerfassungsteilmodul zur Erfassung strukturierter, halbstrukturierter und unstrukturierter Daten über eine Datenbankschnittstelle, eine API-Schnittstelle, Bilderkennung und Spracherkennung;
Ein Submodul zur Datenbereinigung, um fehlende Werte aufzufüllen, Ausreißer zu identifizieren und zu eliminieren sowie Formatkonvertierungsoperationen durchzuführen;
Ein standardisiertes Konvertierungs-Submodul für die einheitliche Konvertierung der bereinigten Daten in ein standardisiertes Format, das für das Modell akzeptabel ist, einschließlich
Tensorquantisierung und numerische Normalisierungsverarbeitung.
Das Modul für Merkmalsmodellierung und Interaktion umfasst:
Ein Merkmalsextraktions-Submodul zum Extrahieren semantischer und struktureller
Merkmale in den Eingabedaten unter Verwendung eines tiefen neuronalen Netzes und eines graphischen neuronalen Netzes;
Ein semantisches Matching-Submodul zum Durchführen einer semantische 601421
Assoziationsberechnung zwischen Benutzereingaben und Zielinformationen mit Hilfe eines
Ähnlichkeitsalgorithmus und eines Aufmerksamkeitsmechanismus;
Ein Untermodul zur Erzeugung von Antworten, das die Ergebnisse des Abgleichs mit der kontextuellen Semantik kombiniert, um eine natürliche Sprache als Antwort des Systems zu erzeugen.
Das Feedback-Optimierungsmodul umfasst:
Ein Bewertungs- und Analyse-Submodul zum Bewerten der Interaktionsergebnisse auf der
Grundlage der Genauigkeitsrate, der Reaktionszeit und des Benutzer-Feedbacks und zum
Bewerten der Interaktionsergebnisse;
Ein Modelloptimierungs-Submodul zum Anpassen von Modellparametern basierend auf den
Bewertungsergebnissen, einschließlich der Anpassung der Lernrate und der Aktualisierung der
Aufmerksamkeitsgewichtung;
Ein Untermodul für das Screening und die Iteration von Proben, das verwendet wird, um hochwertige Trainingsproben unter Verwendung eines Schiebefenster-Mechanismus auszuwählen, um die Generalisierungsfähigkeit des Modells in verschiedenen Datenszenarien zu verbessern.
Es ist zu beachten, dass die Ausführungsformen und die Merkmale und technischen Lösungen in den Ausführungsformen der vorliegenden Erfindung miteinander kombiniert werden können, ohne in Konflikt zu geraten.
Selbstverständlich sind die oben beschriebenen Ausführungsformen nur ein Teil der
Ausführungsformen der vorliegenden Erfindung und nicht alle Ausführungsformen, und die beigefügten Zeichnungen zeigen bevorzugte Ausführungsformen der vorliegenden Erfindung, ohne den Patentumfang der vorliegenden Erfindung einzuschränken. Die vorliegende Erfindung kann in vielen verschiedenen Ausführungsformen realisiert werden, und umgekehrt werden diese
Ausführungsformen bereitgestellt, um ein gründlicheres und umfassenderes Verständnis der
Offenbarung der vorliegenden Erfindung zu ermöglichen. Obwohl die vorliegende Erfindung unter Bezugnahme auf die vorstehenden Ausführungsformen detailliert beschrieben wurde, ist es für den Fachmann möglich, die in den vorstehenden Ausführungsformen aufgezeichneten technischen Lösungen zu modifizieren oder einige der darin enthaltenen technischen Merkmale durch gleichwertige zu ersetzen. Jede äquivalente Struktur, die unter Verwendung der
Beschreibung der vorliegenden Erfindung und der beigefügten Zeichnungen hergestellt wird und die direkt oder indirekt auf anderen verwandten technischen Gebieten angewandt wird, fällt ebenfalls in den Anwendungsbereich des Patentschutzes der vorliegenden Erfindung.
Claims (9)
1. Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst: S1, Erfassen von heterogenen Daten aus mehreren Quellen und Vorverarbeiten der heterogenen Daten aus mehreren Quellen, um standardisierte Eingangsdaten zu erhalten; S2, Durchführen einer Merkmalsextraktion an den standardisierten Eingabedaten auf der Grundlage eines Algorithmus der künstlichen Intelligenz und Konstruieren eines Dateninteraktionsmodells; S3, Durchführen einer Interaktionsverarbeitung an den Zieldaten unter Verwendung des Dateninteraktionsmodells und Erzeugen eines Antwortergebnisses; S4, Auswerten und Bereitstellen von Rückmeldungen zu den Antwortergebnissen und dynamisches Optimieren des Dateninteraktionsmodells entsprechend den Auswertungsergebnissen.
2. Das auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1 basierende Dateninteraktionsverfahren, dadurch gekennzeichnet, dass in dem Schritt S1 die heterogenen Daten aus mehreren Quellen strukturierte Daten, halbstrukturierte Daten und unstrukturierte Daten umfassen, wobei die strukturierten Daten durch ein Datenbankextraktionsverfahren erfasst werden und die halbstrukturierten Daten durch ein Schnittstellendienstzugriffsverfahren erfasst werden. Die unstrukturierten Daten werden technisch durch Stimmerkennung und Bilderkennung erfasst, und die oben genannten strukturierten Daten, halbstrukturierten Daten und unstrukturierten Daten werden vereinigt, um die Operationen des Auffüllens der fehlenden Werte, des Zurückweisens der anormalen Werte und der Formatierungsumwandlung durchzuführen, um die standardisierten Eingabedaten mit einheitlicher Dimension und einheitlichem Format zu erzeugen.
3. Das auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Algorithmus der künstlichen Intelligenz im Schritt S2 eine Kombination aus einem tiefen neuronalen Netz und einem neuronalen Graphennetz ist und semantische und strukturelle Korrelationsmerkmale extrahiert und ein Dateninteraktionsmodell konstruiert, das zur Unterstützung der Dateninteraktionsaufgabe verwendet wird, indem eine schichtweise Faltung, ein Pooling und eine Graphenstrukturmodellierung an den standardisierten Eingabedaten durchgeführt wird. Insbesondere wird ein mehrdimensionaler Aufmerksamkeitsmechanismus während des Modelltrainings eingeführt, um die Genauigkeit der Interaktion zwischen verschiedenen Arten von Datenmerkmalen zu verbessern.
4. Das auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass in dem Schritt S3 die Verarbeitung der Dateninteraktion umfasst: S3 (1) Identifizierung der Benutzeranforderung: wird durch ein Vektor-Mapping-Modul am Modelleingang durchgeführt; S3 (2) semantischer Abgleich: Vervollstindigung einer — mehrschichtigen Assoziationsberechnung zwischen der Benutzereingabe und dem semantischen Zielinhalt durch Einführung einer mehrdimensionalen dynamischen Abgleichsfunktion, die durch kontextuelle Aufmerksamkeit gewichtet wird, wobei die semantische Abgleichsgradfunktion wie folgt ist:
-d+v-(a-Ad; LU601421 Sim(Q, D) = DIE, a; [MAD + à + KL(Po|IPp): la:l|-[1d:l|+e wobei: Sim(Q, D) ist die semantische Übereinstimmungsgradfunktion; Q = {q1,92,—,9n} > D = {d,,dz,…,dp} bezeichnen die n-dimensionalen Einbettungsvektoren der Benutzeranfrage bzw. der ZieläuBerung; a; ist der durch den Mechanismus der kontextuellen Aufmerksamkeit berechnete Gewichtungskoeffizient, der D{-, a; = 1 erfüllt; qi'd; ist die Ähnlichkeit zwischen dem Vektor der Benutzeranfrage und dem semantischen Zielvektor in der L-ten Dimension; A ist eine trainierbare Zwei-Wege-Interaktions-Mapping-Matrix zur Verbesserung der nichtlinearen Kreuzrepräsentation des Merkmalsraums; y ist der Interaktionsverstärkungsfaktor, der das Verhältnis von innerem Produkt zu Interaktionsterms steuert; € ist ein Glättungsterm zur Vermeidung von Null-Nennern; KL(Pol|Pp) ist die KL-Streuung der beiden eingebetteten Sequenzen, die auf der Grundlage der Kontextinformationen berechnet wird und den Unterschied in der Informationsverteilung widerspiegelt, und A ist ihr Gewichtskontrollfaktor. S3 (3) Antwortgenerierung: Das vortrainierte Sprachmodell generiert natürliche Sprachausgaben, um die Dateninteraktion zu vervollständigen.
5. Das auf Algorithmen der kiinstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Schritt S4 die Bewertungsindikatoren Genauigkeit, Antwortverzôgerung und Benutzerzufriedenheit umfassen und das System eine mehrdimensionale Bewertung der aktuellen Antwortergebnisse auf der Grundlage der historischen Interaktionsaufzeichnungen durchführt. Das System passt die Modellparameter und Aufmerksamkeitsgewichte anhand der Bewertungsergebnisse dynamisch an, um ein adaptives Lernen und eine Modelloptimierung zu erreichen, während das System einen Schiebefenster- Mechanismus einführt, um die jüngsten repräsentativen Datenproben für eine schnelle Rückmeldung und eine iterative Aktualisierung zu screenen.
6. Ein auf einem Algorithnus der künstlichen Intelligenz basierendes Dateninteraktionssystem, dadurch gekennzeichnet, dass es die folgenden Module umfasst: Ein Datenvorverarbeitungsmodul zum Sammeln heterogener Daten aus mehreren Quellen und zu deren Standardisierung; Ein Modul zur Modellierung von Merkmalen und zur Interaktion, um Datenmerkmale zu extrahieren und ein Dateninteraktionsmodell zu konstruieren, das auf einem Algorithmus dep601421 künstlichen Intelligenz basiert, um einen semantischen Abgleich zwischen Benutzereingaben und Dateninhalten zu erreichen; Ein Feedback-Optimierungsmodul, das dazu dient, die Ergebnisse der Interaktionsreaktion in mehreren Dimensionen zu bewerten und das Dateninteraktionsmodell auf der Grundlage der Bewertungsergebnisse dynamisch zu optimieren.
7. Das auf einem Algorithmus der künstlichen Intelligenz basierendes Dateninteraktionssystem nach Anspruch 6, dadurch gekennzeichnet, dass das Datenvorverarbeitungsmodul umfasst: Ein Datenerfassungs-Submodul zum Erfassen von strukturierten, halbstrukturierten und unstrukturierten Daten über eine Datenbankschnittstelle, eine API-Schnittstelle, Bilderkennung und Spracherkennung; Ein Submodul zur Datenbereinigung, um fehlende Werte aufzufüllen, Ausreißer zu identifizieren und zu eliminieren sowie Formatkonvertierungsoperationen durchzuführen; Ein Standardisiertes Konvertierungssubmodul zur einheitlichen Konvertierung der bereinigten Daten in ein standardisiertes Format, das für das Modell akzeptabel ist, einschließlich Tensorquantisierung und numerischer Normalisierungsverarbeitung.
8. Das auf einem Algorithmus der künstlichen Intelligenz basierendes Dateninteraktionssystem nach Anspruch 6, wobei das Modul zur Modellierung von Merkmalen und zur Interaktion Folgendes umfasst: Ein Merkmalsextraktions-Submodul zum Extrahieren semantischer und struktureller Merkmale in den Eingabedaten unter Verwendung eines tiefen neuronalen Netzes und eines graphischen neuronalen Netzes; Ein semantisches Matching-Submodul zur Durchführung einer semantischen Assoziationsberechnung zwischen Benutzereingaben und Zielinformationen mittels eines Ähnlichkeitsalgorithmus und eines Aufmerksamkeitsmechanismus; Ein Untermodul zur Generierung von Antworten, das dazu dient, die Ergebnisse des Abgleichs mit der kontextuellen Semantik zu kombinieren, um eine natürliche Sprache als Systemantwort zu generieren.
9. Das auf einem Algorithmus der künstlichen Intelligenz basierendes Dateninteraktionssystem nach Anspruch 6, dadurch gekennzeichnet, dass das Feedback- Optimierungsmodul umfasst: Ein Bewertungs- und Analyse-Submodul zum Bewerten der Interaktionsergebnisse auf der Grundlage der Genauigkeitsrate, der Reaktionszeit und des Benutzer-Feedbacks sowie zum Bewerten der Interaktionsergebnisse; Ein Modelloptimierungs-Submodul zum Anpassen von Modellparametern auf der Grundlage der Bewertungsergebnisse, einschließlich der Anpassung der Lernrate und der Aktualisierung der Aufmerksamkeitsgewichtung; Ein Untermodul für das Screening und die Iteration von Proben, das dazu dient, hochwertige Trainingsproben mit Hilfe eines Schiebefenster-Mechanismus auszuwählen, um die Generalisierungsfähigkeit des Modells in verschiedenen Datenszenarien zu verbessern.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| LU601421A LU601421B1 (de) | 2025-04-29 | 2025-04-29 | Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| LU601421A LU601421B1 (de) | 2025-04-29 | 2025-04-29 | Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| LU601421B1 true LU601421B1 (de) | 2025-10-30 |
Family
ID=97519374
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| LU601421A LU601421B1 (de) | 2025-04-29 | 2025-04-29 | Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system |
Country Status (1)
| Country | Link |
|---|---|
| LU (1) | LU601421B1 (de) |
-
2025
- 2025-04-29 LU LU601421A patent/LU601421B1/de active IP Right Grant
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Yu et al. | An integrated data preparation scheme for neural network data analysis | |
| EP1135767B1 (de) | Verfahren und anordnung zur klassenbildung für ein sprachmodell basierend auf linguistischen klassen | |
| DE102019004300A1 (de) | Verwendung eines dynamischen speichernetzwerks zum verfolgen digitaler dialogzustände und erzeugen von antworten | |
| EP3736817A1 (de) | Überprüfung und/oder verbesserung der konsistenz von datenkennzeichnungen bei der medizinischen bildverarbeitung | |
| DE60032258T2 (de) | Bestimmen ob eine variable numerisch oder nicht numerisch ist | |
| DE202024105837U1 (de) | Effizientes Wissensdestillations-Framework zum Trainieren maschinell erlernter Modelle | |
| CN117992669A (zh) | 一种基于主题建模和深度学习的推荐方法及装置 | |
| LU601421B1 (de) | Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system | |
| CN120012004B (zh) | 基于多维数据分析的异常行为识别方法及系统 | |
| DE112022003696T5 (de) | Verfahren und systeme zur erzeugung von modellen für die bildanalyse pipeline prediction | |
| DE102019219470A1 (de) | System und verfahren für extraktion und abruf von informationen zur unterstützung bei automobilreparaturen | |
| DE112019006005T5 (de) | Semantische-Beziehungen-Lerneinrichtung, Semantische-Beziehungen-Lernverfahren und Semantische-Beziehungen-Lernprogramm | |
| Licht | New methods for generating significance levels from multiply-imputed data | |
| CN119721143A (zh) | 基于梯度归因的奇异值分解压缩大语言模型的方法与装置 | |
| DE102024121641A1 (de) | Erzeugung hochauflösender bilder mithilfe von diffusionsmodellen | |
| WO2001065421A1 (de) | Verfahren und anordnung zur modellierung eines systems | |
| Fang et al. | CNN-based realized covariance matrix forecasting | |
| CN116756119A (zh) | 面向动态负载的数据库在线参数调优方法及装置 | |
| DE102022134730A1 (de) | Systeme und Verfahren zum Trainieren eines Maschinenlernalgorithmus und An-wendung eines Maschinenlernmodells zur Bildentrauschung | |
| DE102018212155A1 (de) | Verfahren und eine Vorrichtung zum aktiven Einregeln eines Prädiktors auf ein Eingangssignal | |
| CN114999451A (zh) | 一种用于智能调度检修的方言识别方法和系统 | |
| LU600539B1 (de) | Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz | |
| Tang et al. | Deep dynamic probabilistic canonical correlation analysis | |
| EP1170678B1 (de) | Verfahren und Vorrichtung zur automatischen Suche relevanter Bilddatensätze | |
| LU503356B1 (de) | Ein kollaboratives akademisches Frühwarnverfahren zwischen Mensch und Maschine |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FG | Patent granted |
Effective date: 20251030 |