LU601421B1

LU601421B1 - Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system

Info

Publication number: LU601421B1
Application number: LU601421A
Authority: LU
Inventors: Tianyu Yu; Zhou Ren; Hui Li; Yongfeng Ni; Yan Pan; Luyao Liu; Zhipeng Wang; Qiang Suo; Qiwen Cao; Roujia TAO
Original assignee: Shanghai Prothentic Tech Co Ltd
Priority date: 2025-04-29
Filing date: 2025-04-29
Publication date: 2025-10-30

Abstract

Die vorliegende Erfindung bezieht sich auf das Gebiet der Technologie der künstlichen Intelligenz und offenbart ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system, wobei das Verfahren die Erfassung und standardisierte Verarbeitung heterogener Daten aus mehreren Quellen, die Merkmalsextraktion auf der Grundlage von tiefen neuronalen Netzen und graphischen neuronalen Netzen, die Konstruktion eines semantischen Interaktionsmodells und die Ausführung der Interaktionsverarbeitung sowie die dynamische Optimierung des Modells auf der Grundlage eines mehrdimensionalen Bewertungsmechanismus umfasst. Das System besteht aus einem Modul zur Datenvorverarbeitung, einem Modul zur Modellierung von Merkmalen und zur Interaktion sowie einem Feedback- und Optimierungsmodul, die alle zusammenarbeiten, um einen effizienten und genauen semantischen Abgleich und eine natürlichsprachliche Antwort zu erzielen. Die Methode verbessert die Genauigkeit des semantischen Abgleichs durch einen kontextbezogenen Aufmerksamkeitsmechanismus und eine zweiseitige Interaktionsabbildungsformel und erreicht eine intelligente, adaptive Optimierung und hohe Antworteffizienz der Mensch-Computer- Interaktion, die für intelligenten Kundenservice, semantische Suche, Mensch-Computer-Fragen und andere Szenarien geeignet ist.

Description

Ein auf Algorithmen der künstlichen Intelligenz basierendes LU601421

Dateninteraktionsverfahren und -system

Technischer Bereich

Die vorliegende Erfindung bezieht sich auf das Gebiet der Technologie der künstlichen

Intelligenz, insbesondere auf ein auf Algorithmen der künstlichen Intelligenz basierendes

Dateninteraktionsverfahren und -system, das auf Anwendungsszenarien wie die Verarbeitung natürlicher Sprache, semantisches Verständnis und intelligente Mensch-Computer-Interaktion anwendbar ist.

Technologie im Hintergrund

Mit der Entwicklung der Technologie der künstlichen Intelligenz werden intelligente

Mensch-Computer-Interaktionssysteme in großem Umfang in Kundendienstrobotern,

Suchmaschinen, intelligenten Fragen und Antworten und anderen Bereichen eingesetzt.

Bestehende Interaktionsmethoden stützen sich jedoch im Allgemeinen auf den Abgleich von

Schlüsselwörtern oder statische Regelvorlagen, was das Verständnis komplexer Semantik und das

Erfassen des kontextuellen Zusammenhangs erschwert, was zu einer schlechten

Interaktionsgenauigkeit und einem schlechten Benutzererlebnis führt. Obwohl einige Systeme

Deep-Learning-Modelle einsetzen, sind sie immer noch unzureichend bei der Verarbeitung heterogener Daten, der Erfassung semantischer Assoziationen und der Durchführung dynamischer

Optimierungen. Daher besteht ein dringender Bedarf an einer intelligenten Interaktionsmethode und einem intelligenten Interaktionssystem, das die Verarbeitung von Daten aus mehreren Quellen, eine tiefgehende semantische Modellierung und Feedback-Optimierungsmechanismen integriert, um die Effizienz und Intelligenz der Interaktion zu verbessern.

Bestehenden Dateninteraktionssystemen fehlt ein einheitlicher Datenfusions- und

Vorverarbeitungsmechanismus, wenn es um heterogene Daten aus verschiedenen Quellen geht, was es schwierig macht, strukturierte Daten, Bildinformationen und Sprachdaten im selben semantischen Raum zu modellieren und zu analysieren. Darüber hinaus verlässt sich das System bei unstrukturierten Daten oft auf unabhängige Verarbeitungskanäle, was zu einer verzögerten

Interaktion der Informationen führt und eine tiefgreifende Fusion auf der semantischen Ebene unmöglich macht, so dass es zu einem erheblichen Informationsverlust zwischen multimodalen

Daten kommt, was die Unterstützung komplexer semantischer Verständnisaufgaben zwischen

Mensch und Computer erschwert.

Andererseits haben einige Systeme zwar tiefe neuronale Netze, graphische neuronale Netze und andere Modelle für die Merkmalsextraktion eingeführt, doch stehen sie in der Praxis immer noch vor folgenden Problemen: Erstens ist die Modellstruktur festgelegt, und es ist nicht möglich, die Beteiligung an der Merkmalsauswahl entsprechend den Aufgabenänderungen flexibel abzustimmen; Zweitens, das Fehlen eines kontinuierlichen Bewertungs- und Feedback-

Lernmechanismus für Benutzerverhaltensdaten während des Interaktionsprozesses und die

Unfähigkeit, die Strategie entsprechend den semantischen Veränderungen in Echtzeit anzupassen, was zu einer Verzögerung bei der Aktualisierung der Antwortergebnisse führt und den Grad der

Intelligenz des Systems beeinträchtigt. Daher besteht ein dringender Bedarf an einer vollständigen

Dateninteraktionslösung, die heterogene Datenmodellierung, tiefgehende semantische Interaktion und adaptive Optimierung integriert.

Inhalt der Erfindung

Um den oben genannten Zweck der Erfindung zu erreichen, stellt die vorliegende Erfindung die folgende technische Lösung bereit: ein auf Algorithmen der künstlichen Intelligenz basierendes

Dateninteraktionsverfahren, das die folgenden Schritte umfasst: LU601421

Schritt 1. Erfassen von heterogenen Daten aus mehreren Quellen und Vorverarbeiten der heterogenen Daten aus mehreren Quellen, um standardisierte Eingangsdaten zu erhalten;

Schritt 2, Durchführen einer Merkmalsextraktion an den standardisierten Eingabedaten, basierend auf einem Algorithmus der künstlichen Intelligenz, und Konstruieren eines

Dateninteraktionsmodells;

Schritt 3, Verwendung des Dateninteraktionsmodells zur Durchführung einer

Interaktionsverarbeitung an den Zieldaten, um ein Antwortergebnis zu erzeugen;

Schritt 4, Bewertung und Bereitstellung von Feedback zu den Antwortergebnissen und dynamische Optimierung des Dateninteraktionsmodells entsprechend den Bewertungsergebnissen.

Vorzugsweise umfassen die heterogenen Daten aus mehreren Quellen in Schritt 1 strukturierte Daten, halbstrukturierte Daten und unstrukturierte Daten, wobei die strukturierten

Daten durch Datenbankextraktion und die halbstrukturierten Daten durch

Schnittstellendienstzugang gewonnen werden. Die unstrukturierten Daten werden technisch durch

Stimmerkennung und Bilderkennung erfasst, und die oben genannten strukturierten Daten, halbstrukturierten Daten und unstrukturierten Daten werden einheitlich den Operationen des

Auffüllens der fehlenden Werte, des Zurückweisens der anormalen Werte und der

Formatkonvertierung unterzogen, um die standardisierten Eingabedaten mit einer einheitlichen

Dimension und einem einheitlichen Format zu erzeugen.

Vorzugsweise ist der Algorithmus der künstlichen Intelligenz in Schritt 2 eine Kombination aus einem tiefen neuronalen Netz und einem graphischen neuronalen Netz, und durch schichtweise

Faltung, Pooling und Graphstrukturmodellierung der standardisierten Eingabedaten werden semantische und strukturelle Korrelationsmerkmale extrahiert und ein Dateninteraktionsmodell zur Unterstützung der Dateninteraktionsaufgabe erstellt. Insbesondere wird ein mehrdimensionaler Aufmerksamkeitsmechanismus während der Modellschulung eingeführt, um die Genauigkeit der Interaktion zwischen verschiedenen Arten von Datenmerkmalen zu verbessern.

Vorzugsweise umfasst die Dateninteraktionsverarbeitung im dritten Schritt: (1) Identifizierung der Benutzeranforderung: Dies wird durch ein Vektor-Mapping-Modul am

Modelleingang durchgeführt; (2) Semantischer Abgleich: die mehrschichtige Assoziationsberechnung zwischen der

Benutzereingabe und dem semantischen Zielinhalt wird durch Einführung einer mehrdimensionalen dynamischen Abgleichsfunktion, die durch kontextuelle Aufmerksamkeit gewichtet wird, vervollständigt, wobei die semantische Abgleichsgradfunktion wie folgt ist:

Sim(Q,D) = DEL, a; HA + à KL(Po|IPp):

Ilgill ll] +e wobei:

Sim(Q, D) ist die semantische Übereinstimmungsgradfunktion;

Q = {91,92 ,9In} > D = {d,,dz,…,dp} bezeichnen die n-dimensionalen

Einbettungsvektoren der Benutzeranfrage bzw. der Zieläußerung; a; ist der durch den Mechanismus der kontextuellen Aufmerksamkeit berechnete

Gewichtungskoeffizient, der XL, a; = 1 erfüllt;

“ LU601 421

G; * d; ist die Ähnlichkeit zwischen dem Vektor der Benutzeranfrage und dem semantischen Zielvektor in der i-ten Dimension;

A ist eine trainierbare Zwei-Wege-Interaktions-Mapping-Matrix zur Verbesserung der nichtlinearen Kreuzrepräsentation des Merkmalsraums; y ist der Interaktionsverstärkungsfaktor, der das Verhältnis von innerem Produkt zu

Interaktionsterms steuert: € ist ein Glättungsterm zur Vermeidung von Null-Nennern;

KL(Pol|Pp) ist die KL-Streuung der beiden eingebetteten Sequenzen, die auf der

Grundlage der Kontextinformationen berechnet wird und den Unterschied in der

Informationsverteilung widerspiegelt, und À ist ihr Gewichtskontrollfaktor. (3) Antwortgenerierung: Generierung von natürlichem Sprachoutput durch ein vorab trainiertes Sprachmodell zur Vervollständigung der Dateninteraktion.

Das System führt eine mehrdimensionale Bewertung der aktuellen Antwortergebnisse auf der

Grundlage der historischen Interaktionsdatensätze durch und passt die Modellparameter und

Aufmerksamkeitsgewichte anhand der Bewertungsergebnisse dynamisch an, um adaptives Lernen und Modelloptimierung zu erreichen. Gleichzeitig führt das System einen Schiebefenster-

Mechanismus ein, um die jüngsten repräsentativen Datenproben für eine schnelle Rückmeldung und iterative Aktualisierung zu filtern.

Die vorliegende Erfindung stellt auch ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionssystem bereit, das die folgenden Module umfasst:

Ein Datenvorverarbeitungsmodul zum Sammeln heterogener Daten aus mehreren Quellen und zur Durchführung einer standardisierten Verarbeitung;

Ein Modul zur Modellierung von Merkmalen und zur Interaktion, um Datenmerkmale zu extrahieren und ein Dateninteraktionsmodell auf der Grundlage eines Algorithmus der künstlichen

Intelligenz zu konstruieren, um eine semantische Übereinstimmung zwischen Benutzereingaben und Dateninhalten zu erreichen;

Ein Feedback-Optimierungsmodul, das dazu dient, die Ergebnisse der Interaktionsreaktion in mehreren Dimensionen zu bewerten und das Dateninteraktionsmodell auf der Grundlage der

Bewertungsergebnisse dynamisch zu optimieren.

Das Datenvorverarbeitungsmodul umfasst:

Ein Datenerfassungsteilmodul zur Erfassung strukturierter, halbstrukturierter und unstrukturierter Daten über eine Datenbankschnittstelle, eine API-Schnittstelle, Bilderkennung und Spracherkennung;

Ein Submodul zur Datenbereinigung, um fehlende Werte aufzufüllen, Ausreißer zu identifizieren und zu eliminieren sowie Formatkonvertierungsoperationen durchzuführen;

Ein standardisiertes Konvertierungs-Submodul für die einheitliche Konvertierung der bereinigten Daten in ein standardisiertes Format, das für das Modell akzeptabel ist, einschließlich

Tensorquantisierung und numerische Normalisierungsverarbeitung.

Das Modul für Merkmalsmodellierung und Interaktion umfasst: LU601421

Ein Merkmalsextraktions-Submodul zum Extrahieren semantischer und struktureller

Merkmale in den Eingabedaten unter Verwendung eines tiefen neuronalen Netzes und eines graphischen neuronalen Netzes;

Ein semantisches Matching-Submodul zum Durchführen einer semantischen

Assoziationsberechnung zwischen Benutzereingaben und Zielinformationen mit Hilfe eines

Ähnlichkeitsalgorithmus und eines Aufmerksamkeitsmechanismus;

Ein Untermodul zur Erzeugung von Antworten, um die Ergebnisse des Abgleichs mit der kontextuellen Semantik zu kombinieren und eine natürliche Sprache als Systemantwort zu erzeugen.

Das Modul zur Feedback-Optimierung umfasst:

Ein Bewertungs- und Analyse-Submodul zur Bewertung der Interaktionsergebnisse auf der

Grundlage der Genauigkeit, der Reaktionszeit und des Benutzer-Feedbacks, und

Ein Modelloptimierungssubmodul zum Anpassen von Modellparametern auf der Grundlage der Bewertungsergebnisse, einschließlich der Anpassung der Lernrate und der Aktualisierung der

Aufmerksamkeitsgewichtung;

Ein Untermodul für das Screening und die Iteration von Proben, das verwendet wird, um hochwertige Trainingsproben unter Verwendung eines Schiebefenstermechanismus auszuwählen, um die Verallgemeinerungsfähigkeit des Modells in verschiedenen Datenszenarien zu verbessern.

Vorteilhafte Wirkung der vorliegenden Erfindung im Vergleich zum Stand der Technik:

Verbesserung der Fusions- und Verarbeitungseffizienz von heterogenen Daten aus verschiedenen Quellen: Durch die Einführung eines einheitlichen

Datenstandardisierungsvorverarbeitungsmechanismus kombiniert die vorliegende Erfindung den integrierten = Bereinigungs- und Formatkonvertierungsprozess von strukturierten, halbstrukturierten und unstrukturierten Daten, um zu realisieren, dass Daten aus verschiedenen

Quellen und Strukturen einheitlich in dasselbe intelligente Modell eingegeben werden können, wodurch die Schwelle des Datenzugriffs erheblich gesenkt und die Effizienz der

Datenverarbeitung und der Interaktionskonsistenz verbessert wird.

Verbesserung der Genauigkeit und Robustheit des semantischen Abgleichs: Die vorliegende

Erfindung integriert ein tiefes neuronales Netz und ein graphisches neuronales Netz, führt einen kontextbezogenen Aufmerksamkeitsmechanismus und eine innovative semantische

Abgleichsgradfunktion in der Merkmalsmodellierungsphase ein, erforscht effektiv die implizite semantische Korrelation und strukturelle Abhängigkeit zwischen Daten und verbessert die

Abgleichsgenauigkeit zwischen Benutzereingaben und Zieldaten sowie die Anpassungsfähigkeit des Systems an semantische Abweichungen bei Dateninteraktionsaufgaben erheblich.

Modelladaptive Optimierung und Closed-Loop-Lernen: Durch die Einführung eines

Reaktionsbewertungsmechanismus, einer Sliding-Window-Screening-Strategie und eines dynamischen Modellparameter-Aktualisierungsmoduls erreicht die vorliegende Erfindung eine

Echtzeit-Rückkopplung und eine iterative Optimierung aus den interaktiven Reaktionsergebnissen, so dass das System eine kontinuierliche Lern- und Selbstevolutionseigenschaft hat und eine gute

Generalisierungsleistung und Langzeitstabilität bei mehreren Szenen und Aufgaben aufweist.

Beschreibung der beigefügten Zeichnungen

Bild 1 zeigt ein schematisches Diagramm des Ablaufs der in der vorliegenden Anwendung vorgesehenen Verfahrensschritte;

Bild 2 zeigt ein schematisches Diagramm eines Systemmoduls, das von der vorliegenden

Anwendung bereitgestellt wird. LU601421

Detaillierte Beschreibung

Damit der Fachmann die Ausführungsformen der vorliegenden Erfindung besser verstehen kann, werden die technischen Lösungen in den Ausführungsformen der vorliegenden Erfindung 5 im Folgenden in Verbindung mit den beigefügten Zeichnungen in den Ausführungsformen der vorliegenden Erfindung klar und vollständig beschrieben, und es ist klar, dass die beschriebenen

Ausführungsformen nur einen Teil der Ausführungsformen der vorliegenden Erfindung und nicht alle Ausführungsformen darstellen. Ausgehend von den Ausführungsformen der vorliegenden

Erfindung fallen alle anderen Ausführungsformen, die von einem Fachmann ohne schöpferische

Arbeit erreicht werden, in den Schutzbereich der vorliegenden Erfindung.

Unter Bezugnahme auf Bild 1 stellen Ausführungsformen der vorliegenden Erfindung ein auf

Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren bereit, das die folgenden Schritte umfasst:

Schritt 1, Erfassen von heterogenen Daten aus mehreren Quellen und Vorverarbeiten der heterogenen Daten aus mehreren Quellen, um standardisierte Eingangsdaten zu erhalten.

In Schritt 1 wird zunächst die interne Managementplattform des Kunden, das externe

Informationssammlungsterminal und die Benutzerinteraktionsschnittstelle angedockt, um die heterogenen Daten aus mehreren Quellen zu erhalten. Zu den strukturierten Daten gehören

Kundentransaktionsdatensätze, Inventarformulare, Produktklassifizierungscodes usw., die durch

Datenbankextraktion (SQL-Abfrage) gewonnen werden; auf die halbstrukturierten Daten, wie z.

B. Benutzerverhaltensprotokolle im JSON-Format, Schnittstellenrückgabedaten im XML-Format usw., wird regelmäßig über die RESTful API-Schnittstelle zugegriffen; Zu den unstrukturierten

Daten gehoren von Kunden hochgeladene Sprachkonsultationsinhalte und Vor-Ort-Bilddaten, die mithilfe eines Spracherkennungsmodells bzw. eines Bilderkennungsalgorithmus (YOLO) transkribiert und geparst werden. Alle erfassten Daten werden einheitlich in das

Datenvorverarbeitungsmodul eingegeben, das nacheinander die Operationen des Auffüllens fehlender Werte (basierend auf Mittelwert und Median), der AusreiBerentfernung (Z-Score-

Methode) und der Formatkonvertierung (Vektorisierung und Tensorisierung) durchführt und schließlich standardisierte Eingabedaten mit einheitlichen Dimensionen und Format fiir die

Merkmalsextraktion und semantische Modellierung durch nachfolgende KI-Modelle erzeugt.

Schritt 2, Merkmalsextraktion aus den standardisierten Eingabedaten auf der Grundlage eines

Algorithmus der künstlichen Intelligenz und Aufbau eines Dateninteraktionsmodells.

In Schritt 2 wird nach Erhalt der standardisierten Eingabedaten ein Kombinationsmodell, das ein tiefes neuronales Netz und ein neuronales Graphen-Netz vereint, zur Merkmalsextraktion und

Interaktionsmodellierung verwendet. Konkret werden zunächst die strukturierten und halbstrukturierten Daten mit Hilfe eines mehrschichtigen neuronalen Faltungsnetzes schichtweise gefaltet und gepoolt, um ihre tiefen semantischen Merkmale zu extrahieren. Bei unstrukturierten

Daten werden die transkribierte Textsemantik und die Bildbeschriftungsinformationen als strukturelle Grapheninputs konstruiert, und ihre Knoten- und Kantenbeziehungen werden mithilfe neuronaler Graphennetze modelliert, um potenzielle strukturelle Assoziationsmerkmale zu ermitteln. Um die Fusionsfähigkeit zwischen verschiedenen Datentypen zu verbessern, führt das

Modell einen mehrdimensionalen Aufmerksamkeitsmechanismus in der Merkmalsfusionsschicht ein, der die Wichtigkeitsgewichte jeder Merkmalsdimension berechnet, um eine feine interaktive

Darstellung von semantischen, strukturellen und kontextuellen Informationen zu erreichen. Das daraus resultierende Dateninteraktionsmodell kann die assoziativen Merkmale höherer Ordnung in heterogenen Daten effektiv erfassen und die anschließende semantische Zuordnung von Datd/601421 und die Generierung von Antworten unterstützen.

Schritt 3, Interaktionsverarbeitung der Zieldaten unter Verwendung des

Dateninteraktionsmodells zur Erzeugung eines Antwortergebnisses.

In Schritt 3 führt das System als Reaktion auf die natürlichsprachliche Eingabeaufforderung des Benutzers zunächst eine Einbettungsverarbeitung des Eingabetextes mit Hilfe eines

Vektorabbildungsmoduls auf der Eingangsseite des Modells durch. Dieses Modul verwendet die vortrainierte Einbettungsschicht, um die vom Benutzer eingegebene Äußerung in eine

Vektorsequenz fester Dimension Q = {q,, G2, ..., In} zu transformieren, wobei jedes q; ein eindimensionaler Einbettungsvektor ist, der zur Darstellung der tiefen semantischen Information der semantischen Einheiten verwendet wird. In dieser Phase wird eine erste strukturierte

Darstellung der Benutzeranfragen erreicht, die die Grundlage für den späteren semantischen

Abgleich und die Generierung von Antworten bildet.

In der anschließenden semantischen Matching-Phase berechnet das System eine mehrschichtige Assoziation zwischen dem obigen Einbettungsvektor Q der

Benutzeranforderung und der Sequenz der semantischen Zielvektoren D = {d,, d>, ...,d,,} im

Kandidatenkorpus. Insbesondere wird ein Mechanismus zur Gewichtung der kontextuellen

Aufmerksamkeit eingeführt, um die Aufmerksamkeitskoeffizienten Œ; für jede Dimension zu lernen, und es wird eine dynamische Abgleichsfunktion Sim(Q, D) konstruiert. Diese Funktion verschmilzt die durch die trainierbare Interaktionsabbildungsmatrix A erzeugten Kreuzterme mit der herkömmlichen Kosinusähnlichkeit, wobei der Grad der Verschmelzung der beiden Terme durch den Interaktionsverstärkungsfaktor Yy gesteuert wird. Um die globale Unterscheidung zwischen Semantiken zu verbessern, wird die kontextbasierte KL-Streuung KL(Po||Pp) als ergänzende Matching-Metrik eingeführt und mit dem Kontrollfaktor A zur Gewichtung der

Summierung kombiniert, um eine genaue Erfassung komplexer Semantiken zu erreichen.

In der Phase der Antwortgenerierung nimmt das System die Zielsemantik mit einem

Übereinstimmungsgrad über einem festgelegten Schwellenwert als Eingabe und übergibt sie an das vorab trainierte Sprachmodell, das für die Textgenerierung trainiert wurde. Durch den kontextabhängigen Dekodierungsmechanismus erzeugt das Modell eine semantisch logische und natürliche Antwort als Ausgabe der endgültigen Dateninteraktion. Wenn ein Benutzer beispielsweise fragt: „Bitte empfehlen Sie einen geeigneten Steuerdienstplan für Startups“, kann das System die Schlüsselsemantik erkennen und ausgeben: „Wir empfehlen Ihnen, das spezielle

Steuerpaket für kleine und mittlere Unternehmen (KMU) zu wählen, das Steuerplanung und vierteljährliche Einreichungsdienste umfasst“. Damit ist ein präziser und intelligenter Prozess der

Dateninteraktion abgeschlossen.

Schritt 4, Auswertung und Rückmeldung über die Antwortergebnisse und dynamische

Optimierung des Dateninteraktionsmodells entsprechend den Auswertungsergebnissen. LU601421

In Schritt 4 ist eine mehrdimensionale Bewertung der Antwortqualität erforderlich, die insbesondere drei Indikatoren für Genauigkeit, Antwortverzögerung und Benutzerzufriedenheit umfasst. Das System extrahiert zunächst Antwortdaten innerhalb eines aktuellen Zeitraums aus historischen Interaktionsdatensätzen und verwendet einen gleitenden Zeitfenstermechanismus (z.

B. fast 100 gültige Interaktionen), um eine repräsentative Stichprobe zu filtern. Für jede Interaktion zeichnet das System die Differenz zwischen dem tatsächlichen Feedback-Ergebnis und der Soll-

Ausgabe auf, die zur Berechnung der Genauigkeitsrate verwendet wird; gleichzeitig wird die

Zeitdifferenz zwischen dem Eingang der Anfrage beim Modell und dem Ausgabeergebnis aufgezeichnet, um die Antwortlatenz zu erhalten; außerdem wird die Nutzerzufriedenheit anhand der Nutzerbewertungen oder Verhaltensrückmeldungen (z. B. die Rate der „Likes“, die Rate der zweiten Fragen usw.) geschätzt. Auf der Grundlage der Ergebnisse der oben genannten Metriken passt das System die Parameter des tiefen neuronalen Netzes und des graphischen neuronalen

Netzes dynamisch an, einschließlich des Gewichtungskoeffizienten @; im

Aufmerksamkeitsmechanismus, um eine adaptive Feinabstimmung des Modells zu erreichen.

Wird beispielsweise ein Rückgang der Antwortgenauigkeit, aber eine geringe Latenzzeit festgestellt, wird das System der Verbesserung der Ausdrucksfähigkeit der semantischen

Abgleichsschicht Vorrang einräumen und die neuesten Beispieldaten verwenden, um eine schnelle

Aktualisierung in kleinen Mengen durchzuführen, wodurch die Gesamtleistung der

Dateninteraktion und die intelligente Antwortqualität verbessert werden.

In Bild 2 ist ein auf Algorithnen der künstlichen Intelligenz basierendes

Dateninteraktionssystem dargestellt, das die folgenden Module umfasst:

Ein Modul zur Modellierung von Merkmalen und zur Interaktion, um Datenmerkmale zu extrahieren und ein Dateninteraktionsmodell zu erstellen, das auf einem Algorithmus der künstlichen Intelligenz basiert, um eine semantische Übereinstimmung zwischen

Benutzereingaben und Dateninhalten zu erreichen;

Bewertungsergebnisse dynamisch zu optimieren.

Das Datenvorverarbeitungsmodul umfasst:

Tensorquantisierung und numerische Normalisierungsverarbeitung.

Das Modul für Merkmalsmodellierung und Interaktion umfasst:

Ein Merkmalsextraktions-Submodul zum Extrahieren semantischer und struktureller

Ein semantisches Matching-Submodul zum Durchführen einer semantische 601421

Ähnlichkeitsalgorithmus und eines Aufmerksamkeitsmechanismus;

Ein Untermodul zur Erzeugung von Antworten, das die Ergebnisse des Abgleichs mit der kontextuellen Semantik kombiniert, um eine natürliche Sprache als Antwort des Systems zu erzeugen.

Das Feedback-Optimierungsmodul umfasst:

Ein Bewertungs- und Analyse-Submodul zum Bewerten der Interaktionsergebnisse auf der

Grundlage der Genauigkeitsrate, der Reaktionszeit und des Benutzer-Feedbacks und zum

Bewerten der Interaktionsergebnisse;

Ein Modelloptimierungs-Submodul zum Anpassen von Modellparametern basierend auf den

Bewertungsergebnissen, einschließlich der Anpassung der Lernrate und der Aktualisierung der

Aufmerksamkeitsgewichtung;

Ein Untermodul für das Screening und die Iteration von Proben, das verwendet wird, um hochwertige Trainingsproben unter Verwendung eines Schiebefenster-Mechanismus auszuwählen, um die Generalisierungsfähigkeit des Modells in verschiedenen Datenszenarien zu verbessern.

Es ist zu beachten, dass die Ausführungsformen und die Merkmale und technischen Lösungen in den Ausführungsformen der vorliegenden Erfindung miteinander kombiniert werden können, ohne in Konflikt zu geraten.

Selbstverständlich sind die oben beschriebenen Ausführungsformen nur ein Teil der

Ausführungsformen der vorliegenden Erfindung und nicht alle Ausführungsformen, und die beigefügten Zeichnungen zeigen bevorzugte Ausführungsformen der vorliegenden Erfindung, ohne den Patentumfang der vorliegenden Erfindung einzuschränken. Die vorliegende Erfindung kann in vielen verschiedenen Ausführungsformen realisiert werden, und umgekehrt werden diese

Ausführungsformen bereitgestellt, um ein gründlicheres und umfassenderes Verständnis der

Offenbarung der vorliegenden Erfindung zu ermöglichen. Obwohl die vorliegende Erfindung unter Bezugnahme auf die vorstehenden Ausführungsformen detailliert beschrieben wurde, ist es für den Fachmann möglich, die in den vorstehenden Ausführungsformen aufgezeichneten technischen Lösungen zu modifizieren oder einige der darin enthaltenen technischen Merkmale durch gleichwertige zu ersetzen. Jede äquivalente Struktur, die unter Verwendung der

Beschreibung der vorliegenden Erfindung und der beigefügten Zeichnungen hergestellt wird und die direkt oder indirekt auf anderen verwandten technischen Gebieten angewandt wird, fällt ebenfalls in den Anwendungsbereich des Patentschutzes der vorliegenden Erfindung.

Claims

Ansprüche LU601421

1. Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst: S1, Erfassen von heterogenen Daten aus mehreren Quellen und Vorverarbeiten der heterogenen Daten aus mehreren Quellen, um standardisierte Eingangsdaten zu erhalten; S2, Durchführen einer Merkmalsextraktion an den standardisierten Eingabedaten auf der Grundlage eines Algorithmus der künstlichen Intelligenz und Konstruieren eines Dateninteraktionsmodells; S3, Durchführen einer Interaktionsverarbeitung an den Zieldaten unter Verwendung des Dateninteraktionsmodells und Erzeugen eines Antwortergebnisses; S4, Auswerten und Bereitstellen von Rückmeldungen zu den Antwortergebnissen und dynamisches Optimieren des Dateninteraktionsmodells entsprechend den Auswertungsergebnissen.

2. Das auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1 basierende Dateninteraktionsverfahren, dadurch gekennzeichnet, dass in dem Schritt S1 die heterogenen Daten aus mehreren Quellen strukturierte Daten, halbstrukturierte Daten und unstrukturierte Daten umfassen, wobei die strukturierten Daten durch ein Datenbankextraktionsverfahren erfasst werden und die halbstrukturierten Daten durch ein Schnittstellendienstzugriffsverfahren erfasst werden. Die unstrukturierten Daten werden technisch durch Stimmerkennung und Bilderkennung erfasst, und die oben genannten strukturierten Daten, halbstrukturierten Daten und unstrukturierten Daten werden vereinigt, um die Operationen des Auffüllens der fehlenden Werte, des Zurückweisens der anormalen Werte und der Formatierungsumwandlung durchzuführen, um die standardisierten Eingabedaten mit einheitlicher Dimension und einheitlichem Format zu erzeugen.

3. Das auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Algorithmus der künstlichen Intelligenz im Schritt S2 eine Kombination aus einem tiefen neuronalen Netz und einem neuronalen Graphennetz ist und semantische und strukturelle Korrelationsmerkmale extrahiert und ein Dateninteraktionsmodell konstruiert, das zur Unterstützung der Dateninteraktionsaufgabe verwendet wird, indem eine schichtweise Faltung, ein Pooling und eine Graphenstrukturmodellierung an den standardisierten Eingabedaten durchgeführt wird. Insbesondere wird ein mehrdimensionaler Aufmerksamkeitsmechanismus während des Modelltrainings eingeführt, um die Genauigkeit der Interaktion zwischen verschiedenen Arten von Datenmerkmalen zu verbessern.

4. Das auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass in dem Schritt S3 die Verarbeitung der Dateninteraktion umfasst: S3 (1) Identifizierung der Benutzeranforderung: wird durch ein Vektor-Mapping-Modul am Modelleingang durchgeführt; S3 (2) semantischer Abgleich: Vervollstindigung einer — mehrschichtigen Assoziationsberechnung zwischen der Benutzereingabe und dem semantischen Zielinhalt durch Einführung einer mehrdimensionalen dynamischen Abgleichsfunktion, die durch kontextuelle Aufmerksamkeit gewichtet wird, wobei die semantische Abgleichsgradfunktion wie folgt ist:

-d+v-(a-Ad; LU601421 Sim(Q, D) = DIE, a; [MAD + à + KL(Po|IPp): la:l|-[1d:l|+e wobei: Sim(Q, D) ist die semantische Übereinstimmungsgradfunktion; Q = {q1,92,—,9n} > D = {d,,dz,…,dp} bezeichnen die n-dimensionalen Einbettungsvektoren der Benutzeranfrage bzw. der ZieläuBerung; a; ist der durch den Mechanismus der kontextuellen Aufmerksamkeit berechnete Gewichtungskoeffizient, der D{-, a; = 1 erfüllt; qi'd; ist die Ähnlichkeit zwischen dem Vektor der Benutzeranfrage und dem semantischen Zielvektor in der L-ten Dimension; A ist eine trainierbare Zwei-Wege-Interaktions-Mapping-Matrix zur Verbesserung der nichtlinearen Kreuzrepräsentation des Merkmalsraums; y ist der Interaktionsverstärkungsfaktor, der das Verhältnis von innerem Produkt zu Interaktionsterms steuert; € ist ein Glättungsterm zur Vermeidung von Null-Nennern; KL(Pol|Pp) ist die KL-Streuung der beiden eingebetteten Sequenzen, die auf der Grundlage der Kontextinformationen berechnet wird und den Unterschied in der Informationsverteilung widerspiegelt, und A ist ihr Gewichtskontrollfaktor. S3 (3) Antwortgenerierung: Das vortrainierte Sprachmodell generiert natürliche Sprachausgaben, um die Dateninteraktion zu vervollständigen.

5. Das auf Algorithmen der kiinstlichen Intelligenz basierendes Dateninteraktionsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Schritt S4 die Bewertungsindikatoren Genauigkeit, Antwortverzôgerung und Benutzerzufriedenheit umfassen und das System eine mehrdimensionale Bewertung der aktuellen Antwortergebnisse auf der Grundlage der historischen Interaktionsaufzeichnungen durchführt. Das System passt die Modellparameter und Aufmerksamkeitsgewichte anhand der Bewertungsergebnisse dynamisch an, um ein adaptives Lernen und eine Modelloptimierung zu erreichen, während das System einen Schiebefenster- Mechanismus einführt, um die jüngsten repräsentativen Datenproben für eine schnelle Rückmeldung und eine iterative Aktualisierung zu screenen.

6. Ein auf einem Algorithnus der künstlichen Intelligenz basierendes Dateninteraktionssystem, dadurch gekennzeichnet, dass es die folgenden Module umfasst: Ein Datenvorverarbeitungsmodul zum Sammeln heterogener Daten aus mehreren Quellen und zu deren Standardisierung; Ein Modul zur Modellierung von Merkmalen und zur Interaktion, um Datenmerkmale zu extrahieren und ein Dateninteraktionsmodell zu konstruieren, das auf einem Algorithmus dep601421 künstlichen Intelligenz basiert, um einen semantischen Abgleich zwischen Benutzereingaben und Dateninhalten zu erreichen; Ein Feedback-Optimierungsmodul, das dazu dient, die Ergebnisse der Interaktionsreaktion in mehreren Dimensionen zu bewerten und das Dateninteraktionsmodell auf der Grundlage der Bewertungsergebnisse dynamisch zu optimieren.

7. Das auf einem Algorithmus der künstlichen Intelligenz basierendes Dateninteraktionssystem nach Anspruch 6, dadurch gekennzeichnet, dass das Datenvorverarbeitungsmodul umfasst: Ein Datenerfassungs-Submodul zum Erfassen von strukturierten, halbstrukturierten und unstrukturierten Daten über eine Datenbankschnittstelle, eine API-Schnittstelle, Bilderkennung und Spracherkennung; Ein Submodul zur Datenbereinigung, um fehlende Werte aufzufüllen, Ausreißer zu identifizieren und zu eliminieren sowie Formatkonvertierungsoperationen durchzuführen; Ein Standardisiertes Konvertierungssubmodul zur einheitlichen Konvertierung der bereinigten Daten in ein standardisiertes Format, das für das Modell akzeptabel ist, einschließlich Tensorquantisierung und numerischer Normalisierungsverarbeitung.

8. Das auf einem Algorithmus der künstlichen Intelligenz basierendes Dateninteraktionssystem nach Anspruch 6, wobei das Modul zur Modellierung von Merkmalen und zur Interaktion Folgendes umfasst: Ein Merkmalsextraktions-Submodul zum Extrahieren semantischer und struktureller Merkmale in den Eingabedaten unter Verwendung eines tiefen neuronalen Netzes und eines graphischen neuronalen Netzes; Ein semantisches Matching-Submodul zur Durchführung einer semantischen Assoziationsberechnung zwischen Benutzereingaben und Zielinformationen mittels eines Ähnlichkeitsalgorithmus und eines Aufmerksamkeitsmechanismus; Ein Untermodul zur Generierung von Antworten, das dazu dient, die Ergebnisse des Abgleichs mit der kontextuellen Semantik zu kombinieren, um eine natürliche Sprache als Systemantwort zu generieren.

9. Das auf einem Algorithmus der künstlichen Intelligenz basierendes Dateninteraktionssystem nach Anspruch 6, dadurch gekennzeichnet, dass das Feedback- Optimierungsmodul umfasst: Ein Bewertungs- und Analyse-Submodul zum Bewerten der Interaktionsergebnisse auf der Grundlage der Genauigkeitsrate, der Reaktionszeit und des Benutzer-Feedbacks sowie zum Bewerten der Interaktionsergebnisse; Ein Modelloptimierungs-Submodul zum Anpassen von Modellparametern auf der Grundlage der Bewertungsergebnisse, einschließlich der Anpassung der Lernrate und der Aktualisierung der Aufmerksamkeitsgewichtung; Ein Untermodul für das Screening und die Iteration von Proben, das dazu dient, hochwertige Trainingsproben mit Hilfe eines Schiebefenster-Mechanismus auszuwählen, um die Generalisierungsfähigkeit des Modells in verschiedenen Datenszenarien zu verbessern.