AT528486A2 - METHOD FOR TRAINING A MACHINE LEARNING MODEL TO AUTOMATICALLY RECOGNIZE THE EMOTIONAL COLOR INDICATED BY EXPRESSIONS/WORD FORMS IN A TEXT CONTAINING MULTIPLE WORDS AND ITS INTENSITY, AS WELL AS METHOD AND SYSTEM FOR SUCH RECOGNITION - Google Patents
METHOD FOR TRAINING A MACHINE LEARNING MODEL TO AUTOMATICALLY RECOGNIZE THE EMOTIONAL COLOR INDICATED BY EXPRESSIONS/WORD FORMS IN A TEXT CONTAINING MULTIPLE WORDS AND ITS INTENSITY, AS WELL AS METHOD AND SYSTEM FOR SUCH RECOGNITIONInfo
- Publication number
- AT528486A2 AT528486A2 ATA95012/2025A AT950122025A AT528486A2 AT 528486 A2 AT528486 A2 AT 528486A2 AT 950122025 A AT950122025 A AT 950122025A AT 528486 A2 AT528486 A2 AT 528486A2
- Authority
- AT
- Austria
- Prior art keywords
- word
- database
- text
- words
- rules
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken in einem Text mit mehreren Wörtern eigen ist, sowie deren Intensität zu erkennen, wobei das Verfahren Folgendes beinhaltet: - Erstellen einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; - Erstellen einer Datenbank emotional gefärbter Wörter oder Wortkombinationen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; - Erstellen einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern oder Wortkombinationen in einem Satz; - Erstellen einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen; - Erstellen eines Trainingsdatensatzes unter Verwendung der erstellten Datenbanken; - Trainieren eines Modells unter Verwendung des erstellten Trainingsdatensatzes, um ein trainiertes maschinelles Lernmodell zu erhalten.The invention relates to a method for training a machine learning model to automatically recognize the emotional coloring inherent in expressions in a multi-word text, as well as their intensity, the method comprising: - creating a database of emotions, each assigned a weighting coefficient for emotional coloring intensity; - creating a database of emotionally colored words or word combinations, each assigned an emotion and a weighting coefficient for emotional coloring intensity; - creating a database of logical and semantic rules for the interaction of words or word combinations in a sentence; - creating a database with rules for working with antonyms of emotions and their effects on changing the emotional coloring of a sentence, as well as with rules for hidden levels of meaning; - creating a training dataset using the created databases; - training a model using the created training dataset to obtain a trained machine learning model.
Description
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
VERFAHREN ZUM TRAINIEREN EINES MASCHINELLEN LERNMODELLS, UM AUTOMATISCH DIE EMOTIONALE FÄRBUNG, DIE AUSDRÜCKEN/WORTFORMEN IN EINEM MEHRERE WÖRTER ENTHALTENDEN TEXT EIGEN IST, UND IHRE INTENSITÄT ZU ERKENNEN, SOWIE VERFAHREN UND SYSTEM FÜR EIN SOLCHES ERKENNEN METHOD FOR TRAINING A MACHINE LEARNING MODEL TO AUTOMATICALLY RECOGNIZE THE EMOTIONAL COLOR INDICATED BY EXPRESSIONS/WORD FORMS IN A TEXT CONTAINING MULTIPLE WORDS AND ITS INTENSITY, AS WELL AS METHOD AND SYSTEM FOR SUCH RECOGNITION
[0001] Die Erfindung betrifft das Gebiet der analytischen Überprüfung von Texten, insbesondere ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken in einem Text mit mehreren Wörtern eigen ist, und deren Intensität zu erkennen, sowie ein Verfahren für ein solches Erkennen, und es kann beispielsweise dazu verwendet werden, die emotionale Färbung von Nachrichten in den Medien und die Intensität der emotionalen Wirkung auf die Zielgruppe zu bewerten. [0001] The invention relates to the field of analytical text analysis, in particular a method for training a machine learning model to automatically recognize the emotional coloring inherent in expressions in a multi-word text and their intensity, as well as a method for such recognition, and it can be used, for example, to evaluate the emotional coloring of news in the media and the intensity of the emotional effect on the target audience.
[0002] Derzeit gibt es mehrere Verfahren zur Analyse der emotionalen Färbung eines Textes. [0002] Currently, there are several methods for analyzing the emotional tone of a text.
[0003] Ein Verfahren zur Erkennung von Aggression und „Cybermobbing“ in sozialen Netzwerken wurde von Forschern wie Aditya Malte und Pratik Ratadiya durch die Untersuchung von Schlüsselwörtern und Wortkombinationen erforscht. Unter Verwendung der bidirektionalen Transformer-Architektur BERT untersuchten sie Facebook-Texte in zwei Sprachen: Englisch und Hindi (Acheampong, FA, Wenyu, C, Nunoo-Mensah, H. (2020). Text-Based Emotion Detection: Advances, Challenges, and Opportunities. Engineering Reports; 2:e12189. [Online]. Verfügbar: https://doi.org/10. 1002/eng2.12189 (letzter Zugriff am 23. September 2021)) [1]. [0003] A method for detecting aggression and “cyberbullying” on social networks has been explored by researchers such as Aditya Malte and Pratik Ratadiya through the examination of keywords and word combinations. Using the bidirectional transformer architecture BERT, they examined Facebook texts in two languages: English and Hindi (Acheampong, FA, Wenyu, C, Nunoo-Mensah, H. (2020). Text-Based Emotion Detection: Advances, Challenges, and Opportunities. Engineering Reports; 2:e12189. [Online]. Available: https://doi.org/10.1002/eng2.12189 (last accessed on September 23, 2021)) [1].
[0004] Die Erkennung von Emotionen anhand von Emojis im Text wurde von den Forschern Chen und LeCompte vorgeschlagen. Sie verwendeten das Keyword-Erkennungsverfahren, die Support Vector Machine und die multinomiale Naive-Bayes-Methode, wodurch eine Klassifizierung der Emotionen in Traurigkeit, Wut, Angst, Vergnügen, Überraschung, Dankbarkeit und Liebe erzielt wurde. Dieser Ansatz verbesserte die Erkennungsfähigkeiten. [0004] The recognition of emotions based on emojis in text was proposed by researchers Chen and LeCompte. They used keyword recognition, support vector machines, and multinomial Naive Bayesian methods, which resulted in a classification of emotions into sadness, anger, fear, pleasure, surprise, gratitude, and love. This approach improved the recognition capabilities.
[0005] Die automatische Datenerkennung in einem mehrsprachigen Text wurde in der Studie [1] von Jian et al. beschrieben. Die vorgeschlagene Struktur verwendet das Verfahren der natürlichen Sprachverarbeitung (NLP), um ausgewählte Wörter auf der Grundlage von Ekman's Konzept (der Emotionsmodelle) zu klassifizieren, indem zunächst das SVM-Verfahren (Support Vector Machine) und anschließend NB (Naive Bayes) verwendet werden. [0005] Automatic data recognition in a multilingual text was described in the study [1] by Jian et al. The proposed structure uses natural language processing (NLP) to classify selected words based on Ekman's concept (of emotion models) by first using the Support Vector Machine (SVM) method and then Naive Bayes (NB).
[0006] In [1] wird die Entwicklung eines automatischen Emotionsklassifikators für die Untersuchung des Twitter-Netzwerks beschrieben, bei dem Tweets anhand von drei Textkorpora von Emotionen analysiert werden, wobei zunächst Charakteristika aus diesen Datenbanken einzeln extrahiert und anschließend mithilfe des WordNet-Wörterbuchs in den Datenbanken Synonyme für Wörter, die Emotionen bezeichnen, generiert werden. Das Modell wurde unter Verwendung des SVM-Klassifikators trainiert, und die Emotionen wurden unter einer der sechs Kategorien des Ekman-Modells gruppiert. [0006] In [1], the development of an automatic emotion classifier for the study of the Twitter network is described, in which tweets are analyzed using three text corpora of emotions, whereby characteristics are first extracted individually from these databases and then synonyms for words denoting emotions are generated using the WordNet dictionary in the databases. The model was trained using the SVM classifier, and the emotions were grouped under one of the six categories of the Ekman model.
[0007] Das Emotex-Modell wurde entwickelt, um das soziale Netzwerk Twitter zu analysieren, insbesondere um Stimmungen der Zielgruppe richtig einzuschätzen (Hasan, M., Elke, A., Rundensteiner, E.Agu. (2014). EMOTEX: Detecting Emotions in Twitter Messages. [Online]. Verfügbar: https://web.cs.wpi.edu/-emmanuel/publications/PDFs/C30.pdf (letzter Zugriff am 23 September 2021))[2], was es ermöglicht, Emotionen in einem Text mithilfe des lehrergestützten Verfahrens und Emotionswörterbüchern zu erkennen. Der Ansatz beinhaltet zwei Verfahren zur Durchführung von Klassifizierungsaufgaben mit und ohne Verteilung lexikalischer Elemente im Internet. Das Emotex-Modell basiert auf Texten aus dem sozialen Netzwerk Twitter mit gekennzeichneten Emotionen und SVM-, NB-Klassifikatoren und dem Entscheidungsbaum. Die Daten werden vorverarbeitet und entsprechend den Vektoren in Strukturen unterteilt, aus denen als Ergebnis Trainingssätze (Datensätze) für ein Klassifizierungsmodell erstellt werden. Bei der Arbeit mit Twitter werden für die Echtzeitklassifizierung von Tweets im Internet Datensätze und Verarbeitungsprozesse verwendet, die offline verfügbar sind. Das Modell hat eine einfache Struktur und beschreibt eine Vielzahl von emotionalen Zuständen, die mit 28 Hauptwörtern bezeichnet werden. Es ist mit dem Circumplex-Modell kompatibel, wobei die gefundenen Emotionen auf ei-[0007] The Emotex model was developed to analyze the social network Twitter, specifically to accurately assess the sentiments of the target audience (Hasan, M., Elke, A., Rundensteiner, E.Agu. (2014). EMOTEX: Detecting Emotions in Twitter Messages. [Online]. Available: https://web.cs.wpi.edu/-emmanuel/publications/PDFs/C30.pdf (last accessed on 23 September 2021))[2], which makes it possible to identify emotions in a text using the teacher-supported procedure and emotion dictionaries. The approach includes two procedures for performing classification tasks with and without the distribution of lexical items on the internet. The Emotex model is based on texts from the social network Twitter with tagged emotions and SVM, NB classifiers, and the decision tree. The data is preprocessed and divided into structures according to the vectors, from which training sets (datasets) for a classification model are created. When working with Twitter, datasets and processing methods available offline are used for the real-time classification of tweets on the internet. The model has a simple structure and describes a variety of emotional states, which are designated by 28 keywords. It is compatible with the circumplex model, with the identified emotions based on a specific set of characteristics.
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
ner zweidimensionalen Skala verteilt sind, auf der sie nach den Eigenschaften „zufrieden” — „unzufrieden” und dem Grad der Aktivität bewertet werden: „zufrieden aktiv” — „zufrieden inaktiv” und „unzufrieden aktiv” — „unzufrieden inaktiv”. are distributed on a two-dimensional scale, on which they are rated according to the properties “satisfied” — “dissatisfied” and the degree of activity: “satisfied active” — “satisfied inactive” and “dissatisfied active” — “dissatisfied inactive”.
[0008] Die Analyse bestehender Ansätze zeigt, dass es an geeigneten Analyseapparaten mangelt, die verschiedene Fälle der Verwendung von Wortformen berücksichtigen, die die emotionale Färbung des Textes beeinflussen, dass die Auswahl an Emotionen und emotionalen Zuständen, die mit den verfügbaren Instrumenten erkannt werden können, zu begrenzt ist und dass es keinen Mechanismus zur Analyse der Wechselwirkung von Wortformen gibt, die die emotionale Färbung beeinflussen. [0008] Analysis of existing approaches shows that there is a lack of suitable analytical instruments that take into account different cases of the use of word forms that influence the emotional coloring of the text, that the selection of emotions and emotional states that can be detected with the available instruments is too limited, and that there is no mechanism for analyzing the interaction of word forms that influence the emotional coloring.
[0009] Zusätzlich fehlt allen aufgeführten Ansätzen eine sorgfältige Bewertung der emotionalen Eigenschaften des Textes. Dies wird insbesondere auf die Bewertung der Charakteristika der in den Medien behandelten Nachrichten angewendet, die die öffentliche Meinung prägen und entsprechende Konsequenzen nach sich ziehen. Die vorhandenen Instrumente sind nicht in der Lage, eine Vielzahl von Emotionen zu erkennen, die in der modernen Forschung auf dem Gebiet der Psychologie untersucht werden und als wichtige Eigenschaft des Menschen gelten. Außerdem lassen sich mit den aufgeführten Modellen Emotionen wie Humor und Ironie als Ableitung ihrer Ausprägung nicht definieren. [0009] In addition, all the approaches listed lack a careful evaluation of the emotional properties of the text. This applies in particular to the evaluation of the characteristics of news items covered in the media, which shape public opinion and have corresponding consequences. The existing instruments are unable to recognize a wide variety of emotions that are studied in modern research in the field of psychology and are considered important human characteristics. Furthermore, emotions such as humor and irony cannot be defined as a result of their expression using the models listed.
[0010] Somit besteht die Aufgabe der beanspruchten Erfindung darin, Folgendes zu entwickeln: ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, sowie deren Intensität zu erkennen, ein Verfahren zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, und deren Intensität, sowie ein System, das das Verfahren implementiert, wodurch die Erzielung eines technischen Effekts sichergestellt würde, der in der Fähigkeit besteht, die emotionale Färbung des Textes und deren Intensität sorgfältig zu bewerten, insbesondere um den Grad der Empathie des Textes zu messen. [0010] Thus, the object of the claimed invention is to develop: a method for training a machine learning model to automatically recognize the emotional coloring inherent in expressions/word forms in a text and their intensity, a method for automatically recognizing the emotional coloring inherent in expressions/word forms in a text and their intensity, and a system that implements the method, thereby ensuring the achievement of a technical effect consisting of the ability to carefully evaluate the emotional coloring of the text and its intensity, in particular to measure the degree of empathy of the text.
[0011] Die Aufgabe wird durch die Entwicklung eines Verfahrens zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, und deren Intensität zu erkennen gelöst, das Folgendes beinhaltet: [0011] The problem is solved by developing a method for training a machine learning model to automatically recognize the emotional coloring inherent in expressions/word forms in a text with several words/word forms and their intensity, which includes the following:
[0012] Erstellen einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; [0012] Creating a database of emotions, each of which is assigned a weighting coefficient for the emotional coloring intensity;
[0013] Erstellen einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; [0013] Creating a database of emotionally colored words/word combinations/word forms, each of which is assigned an emotion and a weighting coefficient for the emotional coloring intensity;
[0014] Erstellen einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; [0014] Creating a database of logical and semantic rules for the interaction of words/word combinations/word forms in a sentence;
[0015] Erstellen einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Anderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen; [0015] Creating a database with rules for working with antonyms of emotions and their effects on changing the emotional tone of a sentence, as well as rules for hidden levels of meaning;
[0016] Erstellen eines Trainingsdatensatzes unter Verwendung der erstellten Datenbanken; [0016] Creating a training data set using the created databases;
[0017] Trainieren eines Modells unter Verwendung des erstellten Trainingsdatensatzes, um ein trainiertes maschinelles Lernmodell zu erhalten. [0017] Training a model using the created training data set to obtain a trained machine learning model.
[0018] Zusätzlich wird die Aufgabe durch die Entwicklung eines Verfahrens zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität gelöst, das Folgendes beinhaltet: [0018] In addition, the problem is solved by developing a method for automatically recognizing the emotional coloring inherent in expressions/word forms in a text with several words/word forms, as well as their intensity, which includes the following:
[0019] Empfangen eines Textes und Aufteilen in Sätze; [0019] Receiving a text and splitting it into sentences;
[0020] Analysieren des Textes unter Verwendung eines maschinellen Lernmodells mit der Kennzeichnung seiner emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten; [0020] Analyzing the text using a machine learning model, labeling its emotionally colored words/word combinations/word forms with one of the emotions and its weighting coefficient;
Ss Ss Ss Ss
Ss N Ss N
Sr ‚hes AT 528 486 A2 2026-01-15 Sr 'hes AT 528 486 A2 2026-01-15
[0021] wobei das maschinelle Lernmodell unter Verwendung eines Trainingsdatensatzes trainiert wird, der unter Verwendung der folgenden Datenbanken erstellt wurde: einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; einer Datenbank der Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen; [0021] wherein the machine learning model is trained using a training dataset created using the following databases: a database of emotions, each assigned a weighting coefficient for emotional coloring intensity; a database of emotionally colored words/word combinations/word forms, each assigned an emotion and a weighting coefficient for emotional coloring intensity; a database of logical and semantic rules for the interaction of words/word combinations/word forms in a sentence; a database of rules for working with antonyms of emotions and their effects on changing the emotional coloring of a sentence, as well as rules for hidden levels of meaning;
[0022] Analysieren des nach dem Durchführen des vorherigen Schritts erhaltenen Textes unter Verwendung der Regeln der syntaktischen Unterordnung mit der Erkennung von Sprachkonstrukten/Wortformen innerhalb des Textes und der Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen; [0022] Analyzing the text obtained after performing the previous step using the rules of syntactic subordination with the recognition of language constructs/word forms within the text and the interpretation of selected emotionally colored words/word combinations/word forms;
[0023] Visualisieren der Analyseergebnisse. [0023] Visualizing the analysis results.
[0024] Die Aufgabe wird auch durch die Entwicklung eines Systems zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität gelöst, wobei das System Folgendes beinhaltet: [0024] The problem is also solved by developing a system for automatically recognizing the emotional coloring inherent in expressions/word forms in a text with several words/word forms, as well as their intensity, wherein the system includes the following:
[0025] mindestens einen Prozessor, [0025] at least one processor,
[0026] mindestens ein maschinenlesbares Medium, das mit dem mindestens einen Prozessor kommunikativ verbunden ist, und [0026] at least one machine-readable medium that is communicatively connected to the at least one processor, and
[0027] Programmanweisungen zum Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität, die auf dem mindestens einen maschinenlesbaren Medium gespeichert sind und von dem mindestens einen Prozessor ausgeführt werden, wobei die Programmanweisungen Folgendes beinhalten Programmanweisungen zum Empfangen eines Textes und Aufteilen in Sätze; [0027] Program instructions for recognizing the emotional coloring inherent in expressions/word forms in a text with several words/word forms, as well as their intensity, which are stored on the at least one machine-readable medium and are executed by the at least one processor, wherein the program instructions include the following: Program instructions for receiving a text and splitting it into sentences;
[0028] ein maschinelles Lernmodell, das unter Verwendung eines Trainingsdatensatzes trainiert wurde, der unter Verwendung von folgenden Datenbanken erstellt wurde: einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; einer Datenbank der Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen; [0028] a machine learning model trained using a training dataset created using the following databases: a database of emotions, each assigned a weighting coefficient for emotional coloring intensity; a database of emotionally colored words/word combinations/word forms, each assigned an emotion and a weighting coefficient for emotional coloring intensity; a database of logical and semantic rules for the interaction of words/word combinations/word forms in a sentence; a database of rules for working with antonyms of emotions and their effects on changing the emotional coloring of a sentence, as well as rules for hidden levels of meaning;
[0029] Programmanweisungen zum Analysieren des Textes unter Verwendung des maschinellen Lernmodells mit der Kennzeichnung seiner emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten; [0029] Program instructions for analyzing the text using the machine learning model, labeling its emotionally colored words/word combinations/word forms with one of the emotions and its weighting coefficient;
[0030] Programmanweisungen zum Analysieren des nach dem Durchführen des vorherigen Schritts erhaltenen Textes unter Verwendung der Regeln der syntaktischen Unterordnung mit der Erkennung von Sprachkonstrukten/Wortformen innerhalb des Textes und der Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen; [0030] Program instructions for analyzing the text obtained after performing the previous step using the rules of syntactic subordination with the recognition of language constructs/word forms within the text and the interpretation of selected emotionally colored words/word combinations/word forms;
[0031] Programmanweisungen zum Visualisieren der Analyseergebnisse. [0031] Program instructions for visualizing the analysis results.
[0032] Die Erstellung der vorstehend aufgeführten Datenbanken mit der Aufgabe des anschließBenden Trainings eines maschinellen Lernmodells, die eine Datenbank, in die eine Vielzahl von Emotionen eingegeben werden kann, insbesondere solche, die in der modernen Forschung auf dem Gebiet der Psychologie untersucht werden und als wichtige Eigenschaft eines Menschen gelten; eine Datenbank mit Wörtern/Wortkombinationen/Wortformen, denen jeweils eine zugehörige Emotion und ihr Gewichtungskoeffizient für die Intensität zugewiesen sind; sowie eine Datenbank mit logischen und semantischen Regeln (LSR), die die Interaktion von Wörtern/Wortkombinationen/Wortformen innerhalb eines Satzes bestimmen, um ein geeignetes Ergebnis zu [0032] The creation of the aforementioned databases for the purpose of subsequently training a machine learning model includes a database into which a variety of emotions can be entered, in particular those that are studied in modern research in the field of psychology and are considered an important characteristic of a person; a database of words/word combinations/word forms, each of which is assigned an associated emotion and its weighting coefficient for intensity; and a database of logical and semantic rules (LSR) that determine the interaction of words/word combinations/word forms within a sentence in order to produce a suitable result.
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
erhalten, beinhalten, ermöglicht es, die emotionale Färbung eines Textes korrekt und genauer zu bestimmen. preserving, including, makes it possible to determine the emotional coloring of a text correctly and more accurately.
[0033] Das Verfahren und System gemäß den Ansprüchen „verarbeiten“ einen Text im Wesentlichen mit einem maschinellen Lernmodell, einschließlich der Verwendung von LSR, das, wie vorstehend erwähnt, die Interaktion von Wörtern/Wortkombinationen/Wortformen innerhalb eines Satzes bestimmt, um geeignete Ergebnisse zu erhalten, und im nächsten Schritt den Text unter Verwendung der Regeln der syntaktischen Unterordnung (RSS) analysiert, die die syntaktische Struktur des Satzes und die Eigenheiten der Interaktion berücksichtigen und die Kohärenz zwischen seinen Bestandteilen sicherstellen. [0033] The method and system according to the claims “process” a text essentially with a machine learning model, including the use of LSR, which, as mentioned above, determines the interaction of words/word combinations/word forms within a sentence to obtain suitable results, and in the next step analyzes the text using the rules of syntactic subordination (RSS), which take into account the syntactic structure of the sentence and the peculiarities of the interaction and ensure coherence between its components.
[0034] Somit ermöglicht die Fähigkeit, eine Vielzahl von Emotionen für die Klassifizierung von Wörtern/Wortkombinationen/Wortformen, die Eigenheiten der Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz und die Eigenheiten der Interaktion sowie die Sicherstellung der Kohärenz zwischen seinen Mitgliedern zu bestimmen, einen technischen Effekt zu erzielen, der in einer sorgfältigen Bewertung der emotionalen Färbung eines Textes und seiner Intensität besteht. [0034] Thus, the ability to determine a variety of emotions for the classification of words/word combinations/word forms, the characteristics of the interaction of words/word combinations/word forms in a sentence and the characteristics of the interaction as well as ensuring coherence between its members, enables a technical effect to be achieved which consists in a careful evaluation of the emotional coloring of a text and its intensity.
[0035] Bevorzugt werden die Analyseergebnisse durch Kennzeichnen der emotional gefärbten Wörter/Wortkombinationen/Wortformen und/oder durch Erstellen eines Diagramms und/oder durch Erstellen einer Darstellung visualisiert. [0035] Preferably, the analysis results are visualized by marking the emotionally colored words/word combinations/word forms and/or by creating a diagram and/or by creating a representation.
[0036] Die emotional gefärbten Wörter/Wortkombinationen/Wortformen innerhalb des verarbeiteten Textes werden mit einer geeigneten Farbe gekennzeichnet, die einer bestimmten Emotion entspricht. [0036] The emotionally colored words/word combinations/word forms within the processed text are marked with a suitable color that corresponds to a specific emotion.
[0037] Das Diagramm kann die Verteilung des emotionalen Charakters des Textes und die Dynamik der emotionalen Färbung darstellen. [0037] The diagram can represent the distribution of the emotional character of the text and the dynamics of the emotional coloring.
[0038] In dem Diagramm können die Farben das Verhältnis der im Text erkannten Emotionen anzeigen, die in den emotional gefärbten Wortformen enthalten sind. [0038] In the diagram, the colors can indicate the ratio of the emotions recognized in the text that are contained in the emotionally colored word forms.
[0039] Hauptsächlich werden im Schritt der Textanalyse unter Verwendung des maschinellen Lernmodells zusätzlich eine Datenbank emotional gefärbter Wörtern/Wortkombinationen/Wortformen, eine Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes, und eine Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz verwendet. [0039] In the text analysis step, the machine learning model also mainly uses a database of emotionally colored words/word combinations/word forms, a database of rules for working with antonyms of emotions and their effects on changing the emotional coloring of a sentence, and a database of logical and semantic rules for the interaction of words/word combinations/word forms in a sentence.
[0040] Außerdem werden zusätzlich, hauptsächlich im Schritt der Textanalyse unter Verwendung der Regeln der syntaktischen Unterordnung, eine Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist; und eine Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkung auf die Änderung der emotionalen Färbung eines Satzes verwendet. [0040] In addition, mainly in the text analysis step using the rules of syntactic subordination, a database of emotions, each assigned the weighting coefficient k for the emotional coloring intensity; and a database with rules for working with antonyms of emotions and their effect on changing the emotional coloring of a sentence are used.
[0041] Daher wird die Textanalyse bevorzugt sowohl unter Verwendung eines maschinellen Lernmodells durchgeführt, das unter Verwendung eines mit den oben aufgeführten Datenbanken erstellten Trainingsdatensatzes trainiert wurde, als auch direkt unter Verwendung dieser Datenbanken. [0041] Therefore, the text analysis is preferably carried out both using a machine learning model that has been trained using a training data set created with the databases listed above, and directly using these databases.
[0042] Zusätzlich wird bei den Schritten der Analyse eine digitale Codierung verwendet, für die nachstehend ein Beispiel gegeben wird. Selbstverständlich kann diese Codierung modifiziert werden, ohne vom Sinn der Erfindung abzuweichen. [0042] In addition, a digital coding is used in the analysis steps, an example of which is given below. Of course, this coding can be modified without deviating from the purpose of the invention.
[0043] Die Erfindungen können im Rahmen eines globalen Systems, das mit Texten arbeitet, umgesetzt werden. [0043] The inventions can be implemented within the framework of a global system that works with texts.
[0044] Ein Beispiel für ein solches globales System wird anhand der folgenden Zeichnungen im Detail erläutert: [0044] An example of such a global system is explained in detail with reference to the following drawings:
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
[0045] Fig. 1 ist ein Blockschema einer ersten Anwendung eines globalen Systems, das mit Texten arbeitet und ein System zur automatischen Erkennung der emotionalen Färbung gemäß der beanspruchten Erfindung beinhaltet; [0045] Fig. 1 is a block diagram of a first application of a global system that works with texts and includes a system for automatic recognition of emotional coloring according to the claimed invention;
[0046] Fig. 2 ist ein Blockschema einer zweiten Anwendung eines globalen Systems, das mit Texten arbeitet. [0046] Fig. 2 is a block diagram of a second application of a global system that works with texts.
[0047] Das globale System, in dem das beanspruchte System verwendet werden kann, reiht Texte (z. B. Nachrichten) nach ihrer emotionalen Färbung und ihrem Thema. Es besteht aus zwei Anwendungen, die unabhängig voneinander arbeiten. [0047] The global system in which the claimed system can be used ranks texts (e.g., news items) according to their emotional tone and topic. It consists of two applications that operate independently of each other.
[0048] Fig. 1 ist ein Blockschema der Funktionsweise einer ersten Anwendung eines globalen Systems, das eine ständige Nachrichtensuche, -sammlung (Herunterladen ihrer Texte), Bestimmung der emotionalen Färbung und des Themas sowie das Speichern von Informationen bereitstellt. [0048] Fig. 1 is a block diagram of the operation of a first application of a global system that provides continuous news search, collection (downloading of their texts), determination of emotional coloring and theme, and storage of information.
[0049] Es durchsucht bestimmte Websites und lädt Nachrichten für einen bestimmten Zeitraum herunter. Nachrichtentexte werden nach folgendem Schema heruntergeladen: Abrufen 1 einer Liste von Nachrichtenlinks aus RSS-Kanälen, Abrufen 2 von Nachrichtentexten aus den Links, Klassifizieren 3 der Texte nach emotionaler Färbung und Klassifizieren 4 der Texte nach Thema, Bestimmen 5 der Wichtigkeit der Nachrichten anhand der emotionalen Färbung und des Themas, Speichern 6 des Ergebnisses in einer Datenbank. [0049] It searches specific websites and downloads news for a specific period. News texts are downloaded according to the following scheme: 1. Retrieving a list of news links from RSS feeds, 2. Retrieving news texts from the links, 3. Classifying the texts according to emotional tone, 4. Classifying the texts according to topic, 5. Determining the importance of the news based on the emotional tone and topic, 6. Storing the result in a database.
[0050] Fig. 2 ist ein Blockschema der Funktionsweise einer zweiten Anwendung eines globalen Systems, das Nachrichtenverarbeitung durchführt. Es basiert auf einer Client-Server-Architektur (ein Client 7, ein Server 8, eine Datenbank 9) und als Ergebnis seines Betriebs werden die heruntergeladenen und gespeicherten Nachrichten, sortiert nach dem Indikator der emotionalen Färbung, angezeigt. [0050] Fig. 2 is a block diagram of the operation of a second application of a global system that performs message processing. It is based on a client-server architecture (a client 7, a server 8, a database 9) and as a result of its operation, the downloaded and stored messages are displayed, sorted according to the indicator of emotional coloring.
[0051] Die zweite Anwendung funktioniert nach folgendem Schema: Ein Client 7 fordert Artikel von einem Server 8 an, woraufhin der Server 8 Informationen zu den Artikeln von einer Datenbank 9 anfordert. Die Datenbank 9 stellt dem Server 8 Informationen zu den Artikeln bereit, und dieser wiederum stellt dem Client 7 statistische Daten und die wichtigsten Nachrichten bereit. [0051] The second application works according to the following scheme: A client 7 requests articles from a server 8, whereupon the server 8 requests information about the articles from a database 9. The database 9 provides the server 8 with information about the articles, and the server 8 in turn provides the client 7 with statistical data and the most important news.
[0052] Nachfolgend wird eine der am meisten bevorzugten Ausführungsformen der beanspruchten Erfindung detailliert beschrieben. [0052] One of the most preferred embodiments of the claimed invention is described in detail below.
[0053] 1) Eine Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist wie folgt erstellt. [0053] 1) A database of emotions, each assigned the weighting coefficient k for the emotional coloring intensity, is created as follows.
[0054] Zunächst wird eine Liste von Emotionen erstellt, die auf der Grundlage von Daten aus dem Gebiet der Psychologieforschung im Voraus zusammengestellt wurde und mit einem Zahlen- und Buchstabencode versehen ist, wovon nachstehend ein Beispiel in Tabelle 1 gegeben ist. Die Aufgabe des Codes wird im Folgenden näher erläutert. [0054] First, a list of emotions is created, which has been compiled in advance based on data from the field of psychological research and is assigned a numerical and alphanumeric code, an example of which is given below in Table 1. The function of the code is explained in more detail below.
[0055] Tabelle 1 — Liste der Emotionen Numerischer Bezeichnung der Emotion/des emotionalen Zustands Buchstabencode [0055] Table 1 — List of emotions Numerical designation of the emotion/emotional state Letter code
Code der der Emotion Emotion 1 Aggression A 2 Antipathie B 3 Apathie C 4 Sicherheit D 5 Ekel E 6 Verzweiflung F 7 Gefühl von Unsicherheit, Unwissenheit G (enthält mangelndes Selbstvertrauen) 8 Gefühl von Respekt H 9 Selbstvertrauen | Code of Emotion Emotion 1 Aggression A 2 Antipathy B 3 Apathy C 4 Security D 5 Disgust E 6 Despair F 7 Feeling of insecurity, ignorance G (contains lack of self-confidence) 8 Feeling of respect H 9 Self-confidence |
10 Stolz J 11 Bereitschaft, geduldig zu sein K 12 Freundlichkeit L 13 Vertrauen M 14 Verärgerung N 15 Euphorie oO 16 Mitleid P 17 Entsetzen Q 18 Zufriedenheit R 19 Neid S 20 Gelassenheit T 21 Überraschung U 22 Böswilligkeit V 23 Vernachlässigung W 24 Ironie X 25 Moralische Zufriedenheit Y 26 Moralsteigerung Z 27 Hoffnung ZA 28 Vergnügen AA 29 Wachsamkeit AB 30 Inspiration AC 31 Misstrauen AD 32 Unzufriedenheit AE 33 Hass AF 34 Empörung AG 35 Depression AH 36 Freude Al 37 Irritation AJ 38 Enttäuschung AK 39 Sarkasmus AL 40 Sympathie AM 41 Mut (ein Gefühl von Mut) AN 42 Scham AO 43 Mitgefühl AP 44 Ruhe AQ 45 Angst AR 46 Trauer AS 47 Anerkennung AT 48 Ängstlichkeit, Besorgnis AU 49 Bedauern über etwas AV 10 Pride J 11 Willingness to be patient K 12 Friendliness L 13 Trust M 14 Annoyance N 15 Euphoria oO 16 Pity P 17 Horror Q 18 Satisfaction R 19 Envy S 20 Serenity T 21 Surprise U 22 Malice V 23 Neglect W 24 Irony X 25 Moral satisfaction Y 26 Moral elevation Z 27 Hope ZA 28 Pleasure AA 29 Vigilance AB 30 Inspiration AC 31 Distrust AD 32 Dissatisfaction AE 33 Hatred AF 34 Indignation AG 35 Depression AH 36 Joy Al 37 Irritation AJ 38 Disappointment AK 39 Sarcasm AL 40 Sympathy AM 41 Courage (a feeling of bravery) AN 42 Shame AO 43 Compassion AP 44 Calm AQ 45 Anxiety AR 46 Grief AS 47 Recognition AT 48 Anxiety, worry AU 49 Regret about something AV
[0056] Als nächstes wird mindestens eine Gruppe 1 von Experten zusammengestellt, um den Gewichtungskoeffizienten (k) für die Intensität für jede Emotion aus der Liste zu erhalten. Jeder der Experten erhält eine Liste mit den Bezeichnungen der Emotionen, Tabellen zur Bewertung der Charakteristika dieser Emotionen mit einer geeigneten Liste von Charakteristika und bipolare Skalen zur Bewertung der Charakteristika nach dem semantischen Differentialverfahren. Die Bewertung erfolgt auf der Grundlage von EPA-Faktoren (Evaluation, Potency, Activity, die für Evaluation, Stärke und Aktivität stehen). Durch die Definition numerischer Indikatoren anhand verschiedener Faktoren und Skalen lässt sich auch die Überzeugungskraft des Textes ermitteln. Je näher die Indikatoren an den Polen der Skalen liegen, desto größer ist die Wirkung der ausgewählten Faktoren auf die Zielgruppe. [0056] Next, at least one group 1 of experts is assembled to obtain the weighting coefficient (k) for the intensity for each emotion from the list. Each expert receives a list with the names of the emotions, tables for evaluating the characteristics of these emotions with a suitable list of characteristics, and bipolar scales for evaluating the characteristics using semantic differential. The evaluation is based on EPA factors (Evaluation, Potency, Activity). By defining numerical indicators based on various factors and scales, the persuasiveness of the text can also be determined. The closer the indicators are to the poles of the scales, the greater the effect of the selected factors on the target group.
[0057] Nachdem die Experten gemäß des vorgegebenen Beispiels bewertet haben, wird die end-[0057] After the experts have evaluated according to the given example, the final-
7118 7118
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
gültige Bewertung jeder Emotion berechnet, indem der gewichtete Durchschnitt auf der Grundlage der Ergebnisse der Berechnung der von den Experten der Gruppe 1 in einem bestimmten Schritt für jede Emotion abgegebenen Charakteristikabewertungen berechnet wird. Die erhaltenen Werte sind die Werte der Gewichtungskoeffizienten k für die Intensität der relevanten Emotionen. In Tabelle 2 unten sind sie in der 5. Spalte „Gewichtungskoeffizient k” eingetragen und nach ihrem Betrag von |1]| bis |8| gruppiert. A valid rating for each emotion is calculated by taking the weighted average based on the results of the characteristic ratings given by the experts in Group 1 for each emotion at a given step. The values obtained are the weighting coefficients k for the intensity of the relevant emotions. In Table 2 below, they are entered in column 5, "Weighting coefficient k," and grouped according to their magnitude from 1 to 8.
[0058] Tabelle 2 — Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist [0058] Table 2 — Database of emotions, each assigned the weighting coefficient k for emotional coloring intensity
Positionsnr. | Numerischer Bezeichnung der Buchstabencode GewichtungsCode der Emotion der Emotion koeffizient Emotion k 1 44* Ruhe AQ 1 2 46* Trauer AS -1 3 3* Apathie C -1 4 4* Gefühl von Sicherheit D 1 5 13* Vertrauen M 1 6 7* Gefühl von Unsicher- ©) -2 heit 7 31* Misstrauen AD -2 8 35* Depression AH -2 9 20* Gelassenheit T 2 10 9* Selbstvertrauen | 2 11 43* Mitgefühl AP -3 12 2* Antipathie B -3 13 49* Bedauern (über etwas) AV -3 14 37* Irritation AJ -3 15 14* Verärgerung N -3 16 23* Vernachlässigung W -3 (einschließlich Nichtbeachtung) 17 11 Bereitschaft, geduldig K 3 Zu sein 18 8* Gefühl von Respekt H 3 19 29* Wachsamkeit AB -4 20 32* Unzufriedenheit AE -4 21 19* Neid S -4 22 18* Zufriedenheit R 4 23 12* Freundlichkeit L 4 24 40* Sympathie AM 4 25 16* Mitleid P -5 26 24* Ironie X -5 27 22* Böswilligkeit V -5 28 21* Überraschung U 5 29 47* Anerkennung AT 5 30 38* Enttäuschung AK -5 31 39* Sarkasmus AL -6 32 42* Scham AO -6 33 10* Stolz J 6 34 41* Mut AN 6 35 48* Ängstlichkeit AU -6 36 27* Hoffnung ZA 6 37 25* Moralische Y 6 Zufriedenheit Position No. | Numerical designation of the letter code Weighting code of the emotion Coefficient of emotion k 1 44* Calm AQ 1 2 46* Sadness AS -1 3 3* Apathy C -1 4 4* Feeling of security D 1 5 13* Trust M 1 6 7* Feeling of insecurity ©) -2 heit 7 31* Distrust AD -2 8 35* Depression AH -2 9 20* Serenity T 2 10 9* Self-confidence | 2 11 43* Compassion AP -3 12 2* Antipathy B -3 13 49* Regret (about something) AV -3 14 37* Irritation AJ -3 15 14* Annoyance N -3 16 23* Neglect W -3 (including ignoring) 17 11 Willingness to be patient K 3 18 8* Sense of respect H 3 19 29* Vigilance AB -4 20 32* Dissatisfaction AE -4 21 19* Envy S -4 22 18* Satisfaction R 4 23 12* Friendliness L 4 24 40* Sympathy AM 4 25 16* Pity P -5 26 24* Irony X -5 27 22* Malice V -5 28 21* Surprise U 5 29 47* Recognition AT 5 30 38* Disappointment AK -5 31 39* Sarcasm AL -6 32 42* Shame AO -6 33 10* Pride J 6 34 41* Courage AN 6 35 48* Anxiety AU -6 36 27* Hope ZA 6 37 25* Moral Y 6 Satisfaction
38 1* Aggression A -7 39 6* Verzweiflung F -7 40 34* Empörung AG -7 41 33* Hass AF -7 42 36* Freude Al 7 43 26* Moralsteigerung Z 7 44 30* Inspiration AC 7 45 28* Vergnügen AA 7 46 45* Angst AR -8 47 17* Entsetzen Q -8 48 15* Euphorie oO 8 49 5* Ekel E -8 38 1* Aggression A -7 39 6* Despair F -7 40 34* Indignation AG -7 41 33* Hatred AF -7 42 36* Joy Al 7 43 26* Moral Enhancement Z 7 44 30* Inspiration AC 7 45 28* Pleasure AA 7 46 45* Fear AR -8 47 17* Horror Q -8 48 15* Euphoria oO 8 49 5* Disgust E -8
[0059] Der mit (*) gekennzeichnete numerische Code wird für die weitere Kodierung während der Textverarbeitung mit einem Programm und unter Verwendung der bereits erstellten Datenbanken in dessen Betrieb benötigt, was nachstehend näher beschrieben wird. [0059] The numeric code marked with (*) is required for further encoding during text processing with a program and using the databases already created in its operation, which is described in more detail below.
[0060] 2) Eine Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist, wird wie folgt erstellt. [0060] 2) A database of emotionally colored words/word combinations/word forms, each of which is assigned an emotion and a weighting coefficient for the emotional coloring intensity, is created as follows.
[0061] Mindestens eine Gruppe 2 von Experten, die die Sprache fließend beherrschen, ist an der Analyse einer bestimmten Gruppe von Nachrichtentexten in dieser Sprache beteiligt. Die Experten müssen die Texte (in den Texten der Gruppe die emotional gefärbten Wörter/Wortkombinationen/Wortformen markieren, deren Bedeutungsinhalt einen Eindruck hinterlässt, eine positive/negative emotionale Reaktion hervorruft, d. h. die für die automatisierte Bewertung von Texten in der jeweiligen Sprache entscheidend sind) mit einem zugehörigen Buchstabencode (einem Buchstabencode aus den Tabellen 1 und 2) kennzeichnen. Dieser Schritt wird intuitiv durchgeführt, basierend auf der Wahrnehmung der Person, die die Bewertung vornimmt. Nach einer solchen Kennzeichnung können die gekennzeichneten Texte überprüft werden, um die Bewertung zu verifizieren und zu korrigieren, um Subjektivität zu vermeiden. Nach Abschluss des Kennzeichnungsvorgangs werden die genannten Wörter/Wortkombinationen/Wortformen mit dem zugehö6rigen Gewichtungskoeffizienten k, der der vom Experten zugewiesenen Emotion entspricht, in die Datenbank für Wörter/Wortkombinationen/Wortformen eingegeben. Ein Ausschnitt aus einer solchen Datenbank, aufgebaut als Tabelle 3, ist nachfolgend als Beispiel aufgeführt. [0061] At least one group 2 of experts who are fluent in the language participates in the analysis of a specific group of news texts in that language. The experts must mark the texts (in the texts of the group, the emotionally charged words/word combinations/word forms whose meaning leaves an impression, evokes a positive/negative emotional reaction, i.e., which are crucial for the automated evaluation of texts in the respective language) with an associated letter code (a letter code from Tables 1 and 2). This step is performed intuitively, based on the perception of the person performing the evaluation. After such marking, the marked texts can be reviewed to verify and correct the evaluation in order to avoid subjectivity. After completion of the marking process, the aforementioned words/word combinations/word forms are entered into the database for words/word combinations/word forms with the associated weighting coefficient k, which corresponds to the emotion assigned by the expert. An excerpt from such a database, structured as Table 3, is shown below as an example.
[0062] Tabelle 3 — Ausschnitt aus einer Datenbank emotional gefärbter Wörter und Wortkombinationen [0062] Table 3 — Excerpt from a database of emotionally charged words and word combinations
Positionsnr. | Buchstaben- Bezeichnung der Wort/Wortkombination/Wortform code der Emotion Emotion 1 F Verzweiflung liefert kein Ergebnis 2 F Verzweiflung hatte genug 3 ©) Gefühl von Unsicher- |Unstimmigkeit Position No. | Letter designation of the word/word combination/word form code of the emotion Emotion 1 F Despair yields no result 2 F Despair had had enough 3 ©) Feeling of insecurity | Discord
heit, Unwissenheit (enthält mangelndes Selbstvertrauen) heit, ignorance (contains lack of self-confidence)
4 ©) Gefühl von Unsicher- |es ist unmöglich festzustellen, ob ein heit, Unwissenheit hochrangiger Beamter dies tut oder (enthält mangelndes nicht Selbstvertrauen) 4 ©) Feeling of insecurity | it is impossible to determine whether a high-ranking official is doing this or not (does not include lack of self-confidence)
5 ©) Gefühl von Unsicher- |wir werden darüber nachdenken... heit, Unwissenheit (enthält mangelndes Selbstvertrauen) 5 ©) Feeling of insecurity | we will think about it... ity, ignorance (contains lack of self-confidence)
6 ©) Gefühl von Unsicher- |und vielleicht nicht nur sie heit, Unwissenheit (enthält mangelndes Selbstvertrauen) 7 ©) Gefühl von Unsicher- |die Gespräche haben noch keine Erheit, Unwissenheit gebnisse gebracht (enthält mangelndes Selbstvertrauen) 6 ©) Feeling of insecurity | and perhaps not only them, ignorance (contains lack of self-confidence) 7 ©) Feeling of insecurity | the talks have not yet brought any clarity, ignorance results (contains lack of self-confidence)
[0063] Die Anzahl der Gruppen 1 und 2 sowie die Anzahl der Personen in jeder Gruppe werden entsprechend den Anforderungen einer bestimmten Untersuchung festgelegt. [0063] The number of groups 1 and 2 and the number of persons in each group are determined according to the requirements of a specific study.
[0064] Somit ermöglicht der Buchstabencode, Wörter/Wortkombinationen/Wortformen mit dem zugehörigen Buchstabencode der Emotion zu kennzeichnen, der der lexikalischen Einheit entspricht, ohne dass der Experte Zeit mit der Suche nach dem numerischen Wert k verschwenden muss, und gibt außerdem den Grad der Positivität/Negativität des Wortes/der Wortkombination/der Wortform als Träger dieser Emotion an. [0064] Thus, the letter code makes it possible to mark words/word combinations/word forms with the associated letter code of the emotion that corresponds to the lexical unit, without the expert having to waste time searching for the numerical value k, and also indicates the degree of positivity/negativity of the word/word combination/word form as the carrier of this emotion.
[0065] Als Nächstes werden Daten für die Klassifizierung von Sätzen nach ihrer Bedeutung anhand semantischer Kategorien wie Objekt der Emotion, Subjekt der Emotion usw. sowie logischer und semantischer Regeln während der automatisierten Textbewertung ermittelt. Die nachstehende Tabelle 4 stellt den numerischen Code der semantischen Kategorie des Satzes und den Charakter seiner Bedeutung gemäß den Regeln (Spalte 1), die semantische Kategorie des Satzes und den Indikator für die Art der Interaktion seiner Komponenten (Spalte 2) sowie die CodeIndikatoren (+ oder —) für die Wörter, die an erster oder zweiter Stelle nach dem *-Zeichen stehen (Spalten 3 und 4) bereit. [0065] Next, data for classifying sentences according to their meaning based on semantic categories such as object of emotion, subject of emotion, etc., as well as logical and semantic rules, are determined during automated text evaluation. Table 4 below provides the numerical code of the sentence's semantic category and the nature of its meaning according to the rules (column 1), the sentence's semantic category and the indicator for the type of interaction of its components (column 2), and the code indicators (+ or —) for the words that appear first or second after the * sign (columns 3 and 4).
[0066] In den Spalten von Tabelle 4 geben diese +/- das Vorhandensein oder Fehlen eines Charakteristikums in den Komponenten einer Wortform an. Das Zeichen „+“ bedeutet, dass die Positionierung eines Wortes nach * dem Tabellenwert von 1-8 der emotionalen Färbungsintensität entspricht (die sowohl positiv (+) als auch negativ (-) sein kann). Das „-“ Zeichen in der Spalte „Vorhandensein der Eigenschaft” in Tabelle 4 bedeutet, dass die Positionierung eines Wortes nach * (an erster oder zweiter Stelle nach *) dem Wert „0” entspricht und nicht bewertet wird. [0066] In the columns of Table 4, these +/- indicate the presence or absence of a characteristic in the components of a word form. The sign “+” means that the positioning of a word after * corresponds to the table value of 1-8 for emotional coloring intensity (which can be either positive (+) or negative (-)). The “-” sign in the “Presence of the characteristic” column in Table 4 means that the positioning of a word after * (in the first or second position after *) corresponds to the value “0” and is not evaluated.
[0067] Die Symbole in den Spalten 1, 3 und 4 dienen dazu, ein Modell so zu trainieren, dass es bei der anschließenden Verarbeitung der Texte die semantischen Kategorien der Spalte 2 erkennt. Diese Kategorien sind mit der Bedeutung von emotional gefärbten Wörtern/Wortkombinationen/Wortformen verknüpft und ermöglichen es, Sätze in sinnvolle Fragmente zu unterteilen, anhand derer sich die Bedeutung im gesamten Text nachvollziehen lässt. [0067] The symbols in columns 1, 3, and 4 serve to train a model so that it recognizes the semantic categories of column 2 during subsequent text processing. These categories are linked to the meaning of emotionally charged words/word combinations/word forms and make it possible to divide sentences into meaningful fragments, which allow the meaning to be understood in the entire text.
[0068] Tabelle 4 — Art der Darstellung der digitalen Kodierung semantischer Kategorien sowie logischer und semantischer Regeln [0068] Table 4 — Type of representation of the digital encoding of semantic categories as well as logical and semantic rules
Numerischer Semantische Kategorie Vorhandensein der | Vorhandensein der Code der se- Eigenschaft Eigenschaft mantischen Kategorie Numerical Semantic Category Presence of | Presence of the code of the semantic category Property Semantic Category
60* Objekt der Emotion + — 60* Object of emotion + —
61* Subjekt der Emotion + — 61* Subject of the emotion + —
70* Verstärkung emotionaler Zeichen + + 70* Enhancement of emotional signs + +
71* Auswirkung auf denGewichtskoeffi- -_ + 71* Effect on the weight coefficient -_ +
zientenbetrag bei einer Änderung seines Vorzeichens (+/-) 72* Abschwächung des + + Gewichtskoeffizientenbetrags einer Wortform Client amount when its sign changes (+/-) 72* Attenuation of the + + Weight coefficient amount of a word form
10 / 18 10 / 18
Andere Vorgangsweisen entsprechend den Eigenheiten des Textes 78* Indikator für die Intensität emotiona- + + ler Effekte Other procedures according to the characteristics of the text 78* Indicator for the intensity of emotional + + effects
[0069] 3) Eine Datenbank mit LSR für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz wird auf der Grundlage der Durchführung zahlreicher Verfahren zur Analyse der Interaktion einer großen Anzahl von Wörtern, Wortkombinationen und Sätzen in Texten mit emotionaler Färbung erstellt. Ein Beispiel für die erstellte Datenbank ist nachstehend in Tabelle 5 aufgeführt. Diese Regeln tragen dazu bei, sowohl Satzfragmente als auch den gesamten Text auf lexikalischer Organisationsebene genauer zu bewerten. [0069] 3) A database of LSRs for the interaction of words/word combinations/word forms in a sentence is created based on the execution of numerous procedures for analyzing the interaction of a large number of words, word combinations, and sentences in texts with emotional coloring. An example of the created database is shown below in Table 5. These rules help to evaluate both sentence fragments and the entire text more accurately at the lexical organizational level.
[0070] Tabelle 5 — Datenbank logischer und semantischer Regeln für die Interaktion von Wortformen in einem Satz [0070] Table 5 — Database of logical and semantic rules for the interaction of word forms in a sentence
Positi- Numerischer Gemäß dem Formel für die Regel onsnr. Code Regeln | Koeffizienten angewendete Regel 1 70* Verstärkung. k(S)= | k(wi)|+p(w)), p=0.5 Positive Numerical According to the formula for the rule onsnr. Code Rules | Coefficients applied rule 1 70* amplification. k(S)= | k(wi)|+p(w)), p=0.5
Für die Verstärkung der emotionalen Färbung einer Wortform, mit der sie interagiert. For the enhancement of the emotional coloring of a word form with which it interacts.
2 71* Negation (Zeichenumkehr). |k(Si) = - k(w;) + k(wi), Um die Emotion einer Wort- | wenn k(wj)) € [-2; -0.1], form ins Gegenteil umzukeh- | und k(w)) € [2; 0.1] ren. 2 71* Negation (sign reversal). |k(Si) = - k(w;) + k(wi), To reverse the emotion of a word- | if k(wj)) ≤ [-2; -0.1], form into its opposite- | and k(w)) ≤ [2; 0.1].
3 72* Abschwächung. k(S)=] k(w) | - m(w)), m=0.5 Für die Abschwächung der emotionalen Färbung einer Wortform, mit der sie interagiert. 3 72* attenuation. k(S)=] k(w) | - m(w)), m=0.5 For the attenuation of the emotional coloring of a word form with which it interacts.
4 73* Zeicheninteraktionen. Zum |k(S) = ki, wenn Zusammensetzen von k der | | k(wi) | >| k(wi)| Konstrukte mit positiven und negativen Vorzeichen. 4 73* character interactions. For |k(S) = ki, when combining k of the | | k(wi) | >| k(wi)| constructs with positive and negative signs.
5 74* Erfassung k(S)) = kj, wenn Um in einem Satz Wortfor- | | k(wj) | = | k(wi) | men zu bewerten, die Emotionen mit denselben Zeichen vermitteln. 5 74* Recording k(S)) = kj, if To evaluate word forms in a sentence | | k(wj) | = | k(wi) | that convey emotions with the same symbols.
6 75* Doppelte Negation (Nega- |%(/S)) = kw +kw) tion der Negation). Um den 2 Charakter einer Wortform zu bestimmen, wenn sie aus zwei in der Bedeutung verwandten Wortformen mit negativer Bedeutung besteht. 6 75* Double negation (Nega- |%(/S)) = kw +kw) tion of the negation). To determine the character of a word form when it consists of two related word forms with negative meaning.
7 76* Verdeckte a2026 Bedeutungsebenen (verdeckte (k(Si) = k(wi) + k(w)) >0, Bedeutungsebenen - FB). Wenn Wi, Wi Um die emotionale Färbung | (K(S) = k(wi) + k(w))) Eigenschaften der Zielgruppe zu bestimmen. EA CEeZ 7 76* Hidden levels of meaning (hidden (k(Si) = k(wi) + k(w)) > 0, levels of meaning - FB). If Wi, Wi To determine the emotional coloring | (K(S) = k(wi) + k(w))) properties of the target group. EA CEeZ
Zielgruppe zu bestimmen. EA To define the target audience. EA
CEeZ CEeZ
8 717* Um die spezifische Gewich- nn tung des Gewichtungskoeffi- x. zienten der emotionalen Färbungsintensität einer Wortform zu ermitteln und auf dieser Grundlage den Grad der Wichtigkeit einer Quelle (ihre Wirkung in der gegebenen Informationsumgebung) 8 717* To determine the specific weighting of the weighting coefficient of the emotional coloring intensity of a word form and, on this basis, the degree of importance of a source (its effect in the given information environment)
Die Bewertung des Grades der Wichtigkeit G einer Quelle (Website) hinsichtlich ihrer „Wirkung” wird als das gesamte spezifische Gewicht definiert: The assessment of the degree of importance G of a source (website) with regard to its "impact" is defined as the total specific weight:
- { zu bestimmen. G, „ Sqı ode] 9 78* Bewertung der emotionalen A G Färbungsintensität einer 2 7 Nachricht (das Verhältnis SA des Gesamtindikators für die | opei / die Gesamtintensität der emotionale Färbung aller | virkung der Botschaft unter BeKomponenten zur Anzahl rücksichtigung der in den drei dieser Komponenten). vorherigen Schritten bewerteten Daten ist; - { to determine. G, „ Sqı ode] 9 78* Assessment of the emotional A G coloring intensity of a 2 7 message (the ratio SA of the total indicator for the | opei / the total intensity of the emotional coloring of all | effects of the message under components to the number of these components). data assessed in the three previous steps is;
G ist der Indikator für die emotionalen Färbungsintensität unter Berücksichtigung quantitativer und qualitativer Indikatoren für das Thema und die emotionale Färbung, die auf deren Verstärkung hinweisen; G is the indicator for the emotional coloring intensity, taking into account quantitative and qualitative indicators of the topic and the emotional coloring that point to its intensification;
n ist die Anzahl der zu bewertenden Komponenten. n is the number of components to be evaluated.
Spalte 3 von Tabelle 5 beschreibt den Inhalt von Spalte 2 von Tabelle 4. Column 3 of Table 5 describes the content of column 2 of Table 4.
[0071] 4) Datenbanken mit Verfahren zur Verarbeitung von Wörtern/Wortkombinationen/Wortformen und Texten sowie mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Einfluss auf die Anderung der emotionalen Färbung eines Satzes werden wie folgt erhalten. [0071] 4) Databases with methods for processing words/word combinations/word forms and texts, as well as with rules for working with antonyms of emotions and their influence on changing the emotional coloring of a sentence, are obtained as follows.
[0072] Die Regel der Negation (71*, Tabelle 5) führt zur Bildung von Tabelle 6 mit Antonympaaren von Emotionen, um den Charakter einer Wortform zu bestimmen, ob positiv oder negativ, je nach ihrem Kontext. [0072] The rule of negation (71*, Table 5) leads to the formation of Table 6 with antonym pairs of emotions to determine the character of a word form, whether positive or negative, depending on its context.
[0073] Tabelle 6. — Tabelle von Antonympaaren von Emotionen [0073] Table 6. — Table of antonym pairs of emotions
Feld 1 Feld2 Feld 3 1*17 Aggression 36*27 1528 Euphorie E A5*18 3447 Empörung El A7°25 3627 Freude a 17 A518 Angst El 15*28 A725 Anerkennung a 3417 Field 1 Field 2 Field 3 1*17 Aggression 36*27 1528 Euphoria E A5*18 3447 Indignation El A7°25 3627 Joy a 17 A518 Fear El 15*28 A725 Recognition a 3417
usw. nach dem gleichen Prinzip ... etc. according to the same principle...
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
[0074] Darüber hinaus gibt es Fälle, in denen die Interpretation der emotionalen Färbung eines Satzes/einer Information von der Partei abhängt, die ihn/sie übermittelt. Dies führt zu den Regeln von „verdeckten Bedeutungsebenen“, wenn derselbe Ausdruck von der Zielgruppe sowohl positiv als auch negativ wahrgenommen werden kann, je nach den Ansichten dieser Zielgruppe und seiner Einstellung gegenüber der Informationsquelle. [0074] Furthermore, there are cases in which the interpretation of the emotional coloring of a sentence/piece of information depends on the party conveying it. This leads to the rules of “hidden levels of meaning” when the same expression can be perceived by the target audience as both positive and negative, depending on the views of that target audience and its attitude towards the source of information.
[0075] Die Regeln für „verdeckten Bedeutungsebenen“ beinhalten: [0075] The rules for “hidden levels of meaning” include:
[0076] Regeln für verdeckte Bedeutungsebenen des Kontexts, die eng mit dem Wahrnehmung und den Ansichten der Zielgruppe verbunden sind; [0076] Rules for hidden levels of meaning in the context that are closely related to the perceptions and views of the target group;
[0077] Regeln für verdeckte Bedeutungsebenen für die Quelle, die die emotionale Färbung bestimmter Wortformen der Nachrichten in Abhängigkeit von der politischen Position der Publikation bestimmen. [0077] Rules for hidden levels of meaning for the source, which determine the emotional coloring of certain word forms of the news depending on the political position of the publication.
[0078] Daher sind die vorstehend genannten Regeln die Hauptregeln für die Beurteilung des Charakters eines Textes und basieren auf Wortformen, die die lexikalische Organisationsebene des Textes repräsentieren. [0078] Therefore, the above-mentioned rules are the main rules for assessing the character of a text and are based on word forms that represent the lexical organizational level of the text.
[0079] Darüber hinaus ist eine korrekte Erkennung syntaktischer Konstrukte wichtig, die durch die Beachtung der Regeln der syntaktischen Unterordnung sichergestellt wird. [0079] In addition, correct recognition of syntactic constructs is important, which is ensured by observing the rules of syntactic subordination.
[0080] Die folgenden syntaktischen Prinzipien (SP) gelten für diese Regeln: [0081] syntaktische Regeln zur Gewährleistung der Kohärenz; [0080] The following syntactic principles (SP) apply to these rules: [0081] syntactic rules to ensure coherence;
[0082] syntaktische Regeln zur Kontrolle; [0082] syntactic rules for control;
[0083] syntaktische Regeln zur Konjunktion. [0083] Syntactic rules for conjunction.
[0084] Die Anwendung der genannten Regeln (LSR und SP) gewährleistet die Bewertung des Charakters eines Textes anhand bestimmter Wortformen, die die lexikalische Organisationsebene des Textes repräsentieren, und ihre Wirkung wird durch die Verwendung der syntaktischen Organisationsebene des Textes sichergestellt, die die syntaktische Struktur eines Satzes mit SPRegeln und die Eigenheiten der Interaktion der Satzglieder unter Sicherstellung der Kohärenz zwischen Wortformen auf der syntaktischen Ebene der Textdarstellung berücksichtigt. [0084] The application of the aforementioned rules (LSR and SP) ensures the evaluation of the character of a text based on certain word forms that represent the lexical organizational level of the text, and its effect is ensured by the use of the syntactic organizational level of the text, which takes into account the syntactic structure of a sentence with SP rules and the peculiarities of the interaction of the sentence elements while ensuring coherence between word forms at the syntactic level of text representation.
[0085] Die Tabellen 2-6 werden zum Trainieren eines unüberwachten maschinellen Lernmodells sowie in den Schritten der Textanalyse verwendet. [0085] Tables 2-6 are used to train an unsupervised machine learning model and in the steps of text analysis.
[0086] Um die emotionale Färbung, die den Ausdrücken eines bestimmten Textes eigen ist, und deren Intensität zu erkennen, wird dieser Text mithilfe eines maschinellen Lernmodells analysiert, wobei die emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten gekennzeichnet werden. Die Tabellen 3, 4, 5 und 6 werden ebenfalls in diesem Schritt verwendet. Insbesondere werden in jedem Satz des Textes alle Verben und Substantive erkannt, es wird eine Suche nach den Wörtern des Satzes in der Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen (Tabelle 3) durchgeführt, die erkannten Wortformen mit Emotionen, die zum gleichen Feld gehören, werden gefiltert, wobei längere Sequenzen unter Berücksichtigung der emotionalen Färbungsintensität des Satzes (unter Verwendung von Tabelle 5) übrig bleiben, die Emotionen des Satzes und ihre Statistiken werden hinzugefügt und in der Datenbank gespeichert, die emotional gefärbte Texte enthält, die in diesem Prozess analysiert wurden, und die emotionale Färbungsintensität des Textes wird berechnet (unter Verwendung von Tabelle 5). [0086] To identify the emotional coloring inherent in the expressions of a particular text and its intensity, this text is analyzed using a machine learning model, whereby the emotionally colored words/word combinations/word forms are labeled with one of the emotions and its weighting coefficient. Tables 3, 4, 5, and 6 are also used in this step. Specifically, in each sentence of the text, all verbs and nouns are identified, a search for the words of the sentence is performed in the database of emotionally colored words/word combinations/word forms (Table 3), the identified word forms with emotions belonging to the same field are filtered, leaving longer sequences, taking into account the emotional coloring intensity of the sentence (using Table 5), the emotions of the sentence and their statistics are added and stored in the database containing emotionally colored texts analyzed in this process, and the emotional coloring intensity of the text is calculated (using Table 5).
[0087] Statistiken beziehen sich auf einen numerischen Indikator dafür, wie viele Wortformen mit bestimmten Emotionen in einem bestimmten Satz erkannt wurden, sowie auf das quantitative Verhältnis der emotional gefärbten Wortformen zur Gesamtzahl der Wörter in einem Satz. Dadurch lässt sich die emotionale Färbungsintensität des Satzes und anschließend des gesamten Textes berechnen. [0087] Statistics refer to a numerical indicator of how many word forms with specific emotions were identified in a given sentence, as well as the quantitative ratio of the emotionally colored word forms to the total number of words in a sentence. This allows the emotional coloring intensity of the sentence and subsequently of the entire text to be calculated.
[0088] Die Datenbank, die die in diesem Prozess analysierten emotional gefärbten Texte beinhaltet, wird benötigt, damit dem Benutzer am Ende der Verarbeitung Folgendes angezeigt wird: [0088] The database containing the emotionally charged texts analyzed in this process is needed so that the following is displayed to the user at the end of the processing:
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
1) Texte von verarbeiteten Nachrichten, in denen Wörter/Wortkombinationen/Wortformen mit einer bestimmten Farbe markiert sind, 2) Darstellungen, die das Vorhandensein bestimmter Emotionen und deren Verhältnis in einem bestimmten Text und in der Gesamtheit der Texte, die für einen vom Benutzer festgelegten Zeitraum hochgeladen wurden, veranschaulichen. 1) Texts of processed messages in which words/word combinations/word forms are marked with a specific color, 2) Representations illustrating the presence of certain emotions and their relationship in a specific text and in the totality of texts uploaded for a period of time specified by the user.
[0089] Wortformen können sowohl Wörter als auch Wortkombinationen sein, je nachdem, welche davon in einem bestimmten Satz benötigt wird. [0089] Word forms can be both words and combinations of words, depending on which is needed in a particular sentence.
[0090] Die für diese Aktionen verwendeten Hauptalgorithmen sind wie folgt: „Unüberwachtes maschinelles Lernen“ (Unsupervised machine learning), „FastText-Embedding“, ElasticSearch (metrischer Klassifikator und k-NN-Verfahren der nächsten Nachbarn). [0090] The main algorithms used for these actions are as follows: “Unsupervised machine learning”, “FastText embedding”, ElasticSearch (metric classifier and k-NN nearest neighbors method).
[0091] Anschließend wird der nach dem Durchführen des vorherigen Schritts erhaltene Text anhand der Regeln für die syntaktische Unterordnung (Sicherstellung von Kohärenz, Kontrolle, KonjJunktion) durch Erkennen von Sprachkonstruktionen innerhalb des Textes und Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen analysiert. In diesem Schritt werden die Verfahren zur Synthese der Ausgabedaten und die Tabellen 2, 4 und 6 verwendet. Anhand dieser Tabellen werden schließlich die emotionale Färbung der ausgegebenen Wortformen und ihre Klasse bewertet und die syntaktische Struktur des Textes erkannt. Die Verfahren zur Synthese der Ausgabedaten sind für die endgültige Bestimmung der syntaktischen Struktur des Satzes und anschließend des gesamten Textes erforderlich, und anhand der Tabellen 2, 4 und 6 wird die emotionale Färbung der syntaktischen Konstrukte in der Wortform/im Satz/im gesamten Text berechnet. [0091] Subsequently, the text obtained after performing the previous step is analyzed according to the rules for syntactic subordination (ensuring coherence, control, conjunction) by recognizing linguistic constructions within the text and interpreting selected emotionally colored words/word combinations/word forms. In this step, the output data synthesis procedures and Tables 2, 4, and 6 are used. Based on these tables, the emotional coloring of the output word forms and their class are evaluated, and the syntactic structure of the text is determined. The output data synthesis procedures are necessary for the final determination of the syntactic structure of the sentence and subsequently of the entire text, and Tables 2, 4, and 6 are used to calculate the emotional coloring of the syntactic constructs in the word form/sentence/entire text.
[0092] Die Ergebnisse werden in geeigneter Weise visualisiert, beispielsweise durch Kennzeichnen der emotional gefärbten Wörter/Wortkombinationen/Wortformen und/oder durch Erstellen eines Diagramms und/oder durch Erstellen einer Darstellung. [0092] The results are visualized in a suitable manner, for example by marking the emotionally colored words/word combinations/word forms and/or by creating a diagram and/or by creating a representation.
[0093] Ein Beispiel für die Erkennung der emotionalen Färbung eines Artikels ist nachstehend aufgeführt. [0093] An example of the detection of the emotional coloring of an article is given below.
[0094] Reaktion auf ÖKOZID (45*18): Die Umweltaktivistin Greta Thunberg traf sich am 29. Juni in Kiew mit Selensky) [0094] Response to ECOCIDE (45*18): Environmental activist Greta Thunberg met with Zelensky in Kyiv on June 29)
[0095] Der Präsident der Ukraine, Wolodymyr Selenskyj, traf sich mit Greta Thunberg. Eine BEKANNTE (70*08) Umweltaktivistin traf heute, am 29. Juni, als Mitglied der Internationalen Arbeitsgruppe zu UMWELTFOLGEN (29*14) des KRIEGES (45*18) in Kiew ein. [0095] The President of Ukraine, Volodymyr Zelenskyy, met with Greta Thunberg. A well-known (70*08) environmental activist arrived in Kyiv today, June 29, as a member of the International Working Group on the Environmental Consequences (29*14) of the War (45*18).
Details Details
[0096] Greta Thunberg DANKTE (12*24) für die Einladung und betonte, dass sie Vertreter von Öffentlichen Umweltorganisationen in einen Dialog über die Hauptaufgaben der Internationalen Arbeitsgruppe einbinden und die Aufmerksamkeit auf die UMWELTFOLGEN (29*14) des KRIEGES (45*18) lenken werde. Volodymyr Selenskyj wies seinerseits darauf hin, dass sich die internationale Arbeitsgruppe mit einer Vielzahl von Fragen befassen sollte, die mit den Auswirkungen der RUSSISCHEN AGGRESSION (61*17) auf das Ökosystem der Ukraine zusammenhängen. [0096] Greta Thunberg thanked (12*24) for the invitation and emphasized that she would involve representatives of public environmental organizations in a dialogue on the main tasks of the International Working Group and draw attention to the environmental consequences (29*14) of the war (45*18). Volodymyr Zelenskyy, for his part, pointed out that the International Working Group should address a variety of issues related to the impact of Russian aggression (61*17) on the ecosystem of Ukraine.
[0097] Thunberg wies darauf hin, dass der ÖKOZID (45*18) und die ZERSTÖRUNG (48*16) der Umwelt eine Form des KRIEGES (45*18) sind, die in Russland bekannt ist. Sie sagte: [0097] Thunberg pointed out that ecocide (45*18) and the destruction (48*16) of the environment are a form of war (45*18) known in Russia. She said:
[0098] Sie GREIFEN (32*14) GEZIELT (70*14) die Umwelt, die Lebensgrundlage der Menschen, AN und ZERSTÖREN auch LEBEN (45*18). Schließlich geht es hier letztendlich um Menschen. Hier geht es um UKRAINER, die unter diesem KRIEG (45*18) LEIDEN (16*15). [0098] They deliberately attack (32*14) the environment, the basis of human life, and destroy lives (45*18). Ultimately, this is about people. This is about Ukrainians who suffer (16*15) under this war (45*18).
[0099] Die Umweltaktivistin ÄUSSERTE DIE HOFFNUNG (72*26), dass unterschiedliche Organisationen und Behörden in der Lage sein werden, Bewertungsinformationen über die FOLGEN (29*14) der ZERSTÖRUNG (48*16) DER UMWELT sammeln zu können, um „EINE CHANCE (70*95) ZU SCHAFFEN, RUSSLAND für seine HANDLUNGEN UND VERBRECHEN (34*17) ZUR VERANTWORTUNG (47*25) ZU ZIEHEN“ und „auf beharrliche Weise” eine CHANCE (70*95) ZU SCHAFFEN für die WIEDERHERSTELLUNG (47*25) der Ukraine. [0099] The environmental activist EXPRESSED THE HOPE (72*26) that different organizations and authorities will be able to gather assessment information on the CONSEQUENCES (29*14) of the DESTRUCTION (48*16) OF THE ENVIRONMENT in order to “CREATE A CHANCE (70*95) TO HOLD RUSSIA ACTION (47*25) FOR ITS ACTIONS AND CRIMES (34*17)” and to “persistently” create a CHANCE (70*95) for the RESTORATION (47*25) of Ukraine.
14 / 18 14 / 18
x bes AT 528 486 A2 2026-01-15 x specified AT 528 486 A2 2026-01-15
Ss N Ss N
Hauptemotionen: [00100] Berechnen der Klassen, die Emotionen entsprechen. In diesem Text: Main emotions: [00100] Calculating the classes that correspond to emotions. In this text:
[00101] 45*18, Angst — 7 (erscheint 6 Mal im Text und erscheint 1 Mal in der Überschrift dieser Meldung); [00101] 45*18, Angst — 7 (appears 6 times in the text and appears 1 time in the headline of this message);
[00102] 48*16, Ängstlichkeit — 3 (erscheint 3 Mal im Text); [00103] 29*14, Wachsamkeit — 3 (erscheint 3 Mal im Text); [00104] 47*25, Anerkennung — 2 (erscheint 2 Mal im Text); [00105] 34*17, Empörung — 1 (erscheint 1 Mal im Text); [00102] 48*16, Anxiety — 3 (appears 3 times in the text); [00103] 29*14, Vigilance — 3 (appears 3 times in the text); [00104] 47*25, Recognition — 2 (appears 2 times in the text); [00105] 34*17, Indignation — 1 (appears 1 time in the text);
[00106] 32*14, Unzufriedenheit — 1 (erscheint 1 Mal im Text); [00107] 12*24, Freundlichkeit — 1 (erscheint 1 Mal im Text); [00108] 16*15, Mitleid — 1 (erscheint 1 Mal im Text); [00106] 32*14, Dissatisfaction — 1 (appears 1 time in the text); [00107] 12*24, Friendliness — 1 (appears 1 time in the text); [00108] 16*15, Pity — 1 (appears 1 time in the text);
[00109] Die Schlussfolgerung lautet also wie folgt: [00109] The conclusion is therefore as follows:
[00110] Die Hauptemotionen, die dem Text eigen sind: [00110] The main emotions inherent in the text:
[00111] Angst, mit einem hohen Ausprägungsgrad (7); [00111] Fear, with a high degree of severity (7);
[00112] Ängstlichkeit, ebenfalls mit hohem Ausprägungsgrad (3); [00113] Wachsamkeit (3). [00112] Anxiety, also with a high degree of expression (3); [00113] Vigilance (3).
[00114] Zusätzliche Emotionen: [00114] Additional emotions:
[00115] Anerkennung (2), Unzufriedenheit (1), Empörung (1), Freundlichkeit (1), Mitleid (1). [00115] Recognition (2), Dissatisfaction (1), Indignation (1), Friendliness (1), Pity (1).
[00116] Somit stellt die beanspruchte Erfindung ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, sowie deren Intensität zu erkennen, ein Verfahren zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, und deren Intensität, sowie ein System, das das Verfahren implementiert, was die Erzielung eines technischen Effekts sicherstellt, der in der Fähigkeit besteht, die emotionale Färbung des Textes und deren Intensität sorgfältig zu bewerten, insbesondere um den Grad der Empathie des Textes zu messen, bereit. [00116] Thus, the claimed invention provides a method for training a machine learning model to automatically recognize the emotional coloring inherent in expressions/word forms in a text and their intensity, a method for automatically recognizing the emotional coloring inherent in expressions/word forms in a text and their intensity, and a system that implements the method, which ensures the achievement of a technical effect consisting of the ability to carefully evaluate the emotional coloring of the text and its intensity, in particular to measure the degree of empathy of the text.
Claims (9)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/UA2023/000062 WO2025136344A1 (en) | 2023-12-19 | 2023-12-19 | A method for training a machine learning model to automatically detect the emotional coloring peculiar to expressions/word forms in a text containing multiple words and its intensity, as well as a method and system for such detection |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| AT528486A2 true AT528486A2 (en) | 2026-01-15 |
Family
ID=90721003
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ATA95012/2025A AT528486A2 (en) | 2023-12-19 | 2023-12-19 | METHOD FOR TRAINING A MACHINE LEARNING MODEL TO AUTOMATICALLY RECOGNIZE THE EMOTIONAL COLOR INDICATED BY EXPRESSIONS/WORD FORMS IN A TEXT CONTAINING MULTIPLE WORDS AND ITS INTENSITY, AS WELL AS METHOD AND SYSTEM FOR SUCH RECOGNITION |
Country Status (2)
| Country | Link |
|---|---|
| AT (1) | AT528486A2 (en) |
| WO (1) | WO2025136344A1 (en) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12340175B2 (en) * | 2021-01-29 | 2025-06-24 | Elaboration, Inc. | Automated classification of emotio-cogniton |
-
2023
- 2023-12-19 AT ATA95012/2025A patent/AT528486A2/en unknown
- 2023-12-19 WO PCT/UA2023/000062 patent/WO2025136344A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| WO2025136344A1 (en) | 2025-06-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Prasad | Content analysis | |
| DE112018000334T5 (en) | System and method for domain independent aspect level mood recognition | |
| DE69623082T2 (en) | Automatic extraction summary method using feature probabilities | |
| DE69617515T2 (en) | Automatic method for generating thematic summaries | |
| DE69829389T2 (en) | TEXT NORMALIZATION USING A CONTEXT-FREE GRAMMAR | |
| EP3100174A1 (en) | Method for automatically detecting meaning and measuring the clearness of text | |
| DE102013205737A1 (en) | Method for automatically extracting and organizing information from data sources in e.g. web pages, involves producing combined representation of the equivalence classes in which the order for displayable representation is displayed | |
| DE112012001794T5 (en) | Method for determining a mood from a text | |
| DE112013002654T5 (en) | Method for classifying text | |
| DE102019107591A1 (en) | DISPLAY SYSTEM, PROGRAM AND STORAGE MEDIUM | |
| DE112018001165T5 (en) | AUTOMATED DOCUMENT ANALYSIS FOR DIFFERENT NATURAL LANGUAGES | |
| DE202023102803U1 (en) | System for emotion detection and mood analysis through machine learning | |
| CN108363699A (en) | A kind of netizen's school work mood analysis method based on Baidu's mhkc | |
| DE202022102766U1 (en) | System to detect and avoid misleading messages and false rumors on social media | |
| Merino-Tejedor et al. | The assessment of detachment among university students: Validation of the Recovery Experience Questionnaire in educational contexts | |
| Bieberstein et al. | Gender differences in the meanings associated with food hazards: A means-end chain analysis | |
| Jasim et al. | Studies on linguistic stylistic analysis of suicide notes and suicidal thoughts posts | |
| AT528486A2 (en) | METHOD FOR TRAINING A MACHINE LEARNING MODEL TO AUTOMATICALLY RECOGNIZE THE EMOTIONAL COLOR INDICATED BY EXPRESSIONS/WORD FORMS IN A TEXT CONTAINING MULTIPLE WORDS AND ITS INTENSITY, AS WELL AS METHOD AND SYSTEM FOR SUCH RECOGNITION | |
| EP2221735A2 (en) | Method for automatic classification of a text with a computer system | |
| EP3905097A1 (en) | Device and method for determining a knowledge graph | |
| Grzybowski et al. | The words of affectivity. Affect, category, and social evaluation norms for 400 Polish adjectives | |
| Li et al. | Category exemplar production norms for Hong Kong Cantonese: Instance probabilities and word familiarity | |
| DE202023105413U1 (en) | System for automated text generation with error correction | |
| DE102012221927A1 (en) | Procedure for managing e-mail | |
| DE202022106104U1 (en) | System for efficient time series sentiment analysis of user-generated data |