DE112012001794T5 - Verfahren zum Bestimmen einer Stimmung aus einem Text - Google Patents

Verfahren zum Bestimmen einer Stimmung aus einem Text Download PDF

Info

Publication number
DE112012001794T5
DE112012001794T5 DE112012001794.3T DE112012001794T DE112012001794T5 DE 112012001794 T5 DE112012001794 T5 DE 112012001794T5 DE 112012001794 T DE112012001794 T DE 112012001794T DE 112012001794 T5 DE112012001794 T5 DE 112012001794T5
Authority
DE
Germany
Prior art keywords
mood
text
determining
texts
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE112012001794.3T
Other languages
English (en)
Inventor
Jana Eggink
Thomas Kemp
Nico Schenk
Daniel Duran
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of DE112012001794T5 publication Critical patent/DE112012001794T5/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Verfahren zum Bestimmen einer Stimmung aus einem Text mit Formatierungsinformationen, die sich auf Teile des Texts beziehen, mit Bestimmen einer durch wenigstens einen der Teile ausgedrückten Stimmung, wobei die Stimmung automatisch mittels eines Mikroprozessors bestimmt wird und von den sich auf den wenigstens einen Teil beziehenden Formatierungsinformationen abhängt.

Description

  • Eine Ausführungsform der Erfindung bezieht sich auf ein Verfahren zum Bestimmen einer Stimmung aus einem Text mit Formatierungsinformationen. Weitere Ausführungsformen der Erfindung beziehen sich auf eine Vorrichtung zum Bestimmen einer Stimmung aus Textdokumenten mit Formatierungsinformationen, die beispielsweise in einem elektronischen Netzwerk veröffentlicht wurden.
  • HINTERGRUND
  • Heutzutage ist eine große Menge von Textdaten elektronisch verfügbar, z. B. veröffentlicht in großen Netzwerken wie dem Internet. Beispielsweise veröffentlichen Autoren ihre persönlichen Meinungen in Bezug auf verschiedene Gegenstände (Themen) auf ihren Internetseiten, in Nutzertagebüchern, Nutzerforen und elektronischen Kommunikationsräumen (Chatrooms). Diese Informationen können in vielerlei Hinsicht interessant sein, beispielsweise zum Auswerten einer öffentlichen Meinung in Bezug auf einen vorgegebenen Gegenstand.
  • Zum Analysieren von Textdaten ist es wichtig, den Inhalt der Textdaten effizient auszuwerten, beispielsweise um einen jeweiligen Gegenstand bzw. ein jeweiliges Thema zu bestimmen und eine Meinung des Autors in Bezug auf diesen Gegenstand auswerten. Es ist jedoch oft sehr schwierig und mühsam, einen Gegenstand und eine Meinung des Autors bzw. ein Gefühl im Hinblick auf den Gegenstand durch Analysieren des semantischen Inhalts der Textdaten zu bestimmen. Folglich existiert ein Bedarf für ein Verfahren zum schnellen und genauen Bestimmen wichtiger Passagen des Texts im Hinblick auf den Gegenstand und in Hinblick auf die Meinung des Autors zu diesem Gegenstand.
  • Es ist Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung zum schnellen und genauen Bestimmen einer Stimmung des Autors, die in einem Teil eines Texts ausgedrückt ist, und zum Analysieren einer großen Menge von Texten im Hinblick auf durch die Autoren ausgedrückte Stimmungen anzugeben.
  • Diese Aufgabe wird durch ein Verfahren und eine Vorrichtung gemäß den unabhängigen Ansprüchen gelöst.
  • Weitere Merkmale der Erfindung sind aus den Zeichnungen und der zugehörigen Beschreibung ersichtlich.
  • FIGURENKURZBESCHREIBUNG
  • Die begleitenden Figuren sollen ein weitergehendes Verständnis von Ausführungsformen ermöglichen und sind Teil der Spezifikation. Die Zeichnungen illustrieren Ausführungsformen und dienen dazu, zusammen mit der Beschreibung Prinzipien der Ausführungsformen zu erklären. Andere Ausführungsformen und viele der angestrebten Vorteile der Ausführungsformen ergeben sich aus der folgenden detaillierten Beschreibung. Einzelne Elemente der Zeichnungen sind nicht notwendigerweise zueinander maßstabsgetreu wiedergegeben. Gleiche Bezugszeichen beschreiben entsprechende, ähnliche Teile.
  • 1 zeigt eine Vorrichtung eines Verfahrens zum Bestimmen einer Stimmung.
  • 2 zeigt eine weitere Ausführungsform eines Verfahrens zum Bestimmen einer Stimmung, in der eine Punktzahl in Bezug auf einen Text ausgegeben wird.
  • 3 zeigt eine Anwendung des Verfahrens aus 2 auf einer Internetseite mit Qualitätsbewertungen.
  • 4 zeigt eine weitere Ausführungsform eines Verfahrens zum Bestimmen einer Stimmung, wobei eine Punktzahl in Bezug auf einen Gegenstand bzw. ein Thema ausgegeben wird.
  • 5 zeigt eine Anwendung des Verfahrens aus 4 auf einer Internetseite mit Angeboten zum Kauf.
  • 6 zeigt ein Nutzertagebuch, aus dem Stimmungen auf Basis von Formatierungsinformationen analysiert werden können.
  • 7 zeigt eine Produktbewertung, die auf einer Internetseite veröffentlicht ist, und aus der durch Nutzen der Formatierungsinformationen Stimmungen analysiert und auf Gegenstände bezogen werden können.
  • 8 zeigt ein Auswertungsergebnis einer Stimmungsanalyse für verschiedene Internetseiten mit Meinungsäußerungen von Nutzern im Hinblick auf einen vorbestimmten Gegenstand.
  • 9 zeigt eine Ausführungsform einer Vorrichtung zum automatischen Bestimmen einer Stimmung, wobei die Vorrichtung Ausgaben an eine Produktentwicklung, einen Produktvertrieb, ein Lieferkettenmanagement und/oder an ein System für Nutzerempfehlungen gibt.
  • DETAILLIERTE BESCHREIBUNG
  • Im Folgenden werden Ausführungsformen der Erfindung beschrieben. Es ist wichtig festzustellen, dass alle beschriebenen Ausführungen in jeder Weise kombiniert werden können, dass es also keine Beschränkungen gibt, gemäß denen bestimmte Ausführungsformen nicht mit anderen kombiniert werden dürfen. Weiterhin sollte bemerkt werden, dass gleiche Bezugszeichen in den Figuren gleiche oder ähnliche Elemente bezeichnen.
  • Weiterhin ist zu bemerken, dass andere Ausführungsformen genutzt werden können und strukturelle oder logische Änderungen vorgenommen werden können, ohne dass der Bereich der Erfindung dadurch verlassen würde. Die folgende Beschreibung darf daher nicht einschränkend verstanden werden, und der Schutzbereich der vorliegenden Erfindung ist durch die angehängten Ansprüche festgelegt.
  • Die Eigenschaften der verschiedenen beschriebenen Ausführungsformen können miteinander kombiniert werden, soweit nicht anders angegeben.
  • In 1 ist eine Ausführungsform eines Verfahrens zum Bestimmen einer Stimmung gezeigt. Das Verfahren beinhaltet es, ausgehend von einem Text mit auf Teile des Texts bezogenen Formatierungsinformationen eine durch wenigstens einen der Teile ausgedrückte Stimmung zu bestimmen, wobei die Stimmung automatisch mittels eine Mikroprozessors bestimmt wird und von den Formatierungsinformationen, die sich auf den wenigstens einen Teil beziehen, abhängt.
  • In B100 wird eine Stimmung automatisch mittels eines Mikroprozessors aus dem Text heraus bestimmt. Es wird vorausgesetzt, dass der Text die Formatierungsinformation enthält, die sich auf Teile des Texts, beispielsweise auf einzelne Zeichen des Texts, auf Wörter, Phrasen, Sätze, Absätze, Seiten oder ähnliches beziehen. Die durch wenigstens einen Teil ausgedrückte Stimmung wird in Abhängigkeit von der Formatierungsinformation, die sich auf diesen Teil bezieht, bestimmt.
  • Der Text kann jeder Art sein, die von einem Mikroprozessor automatisch analysiert werden kann. Beispielsweise kann der Text auf einer Internetseite veröffentlicht oder in Form eines Dokuments auf einem Server, in einer Datenbank oder in irgendeiner anderen Vorrichtung mit einem Speicher, welcher für das Verfahren erreichbar ist, gespeichert sein. Beispielsweise kann der Speicher über ein elektronisches Netzwerk wie z. B. das Internet erreichbar sein.
  • Die Stimmung, die durch den Teil des Texts ausgedrückt ist, kann einer Haltung des Autors gegenüber einem semantischen Inhalt oder gegenüber einer Bedeutung des Teils des Texts entsprechen. Beispielsweise kann sie einer in dem Teil des Texts ausgedrückten Meinung des Autors oder einer Ansicht des Autors in Bezug auf einen Gegenstand des Teils des Texts entsprechen. Die Stimmung kann weiterhin einem mentalen Gefühl oder einer Emotion entsprechen, die der Autor gehabt haben könnte, als er den Text schrieb. Die Stimmung kann daher einer Darlegung oder Manifestation eines persönlichen Gefühls oder einer Sensibilität des Autors entsprechen, die in dem Teil des Texts ausgedrückt ist.
  • Da anzunehmen ist, dass die tatsächlichen Gedanken, die der Autor beim Schreiben des Texts hatte, nicht aus dem Text herausgelesen werden können, ist festzuhalten, dass die Stimmung den Gedanken oder Gefühlen entspricht, die von den Wörtern oder Phrasen des Texts offenbart werden sollten. Folglich kann die Stimmung einem Gefühl, z. B. einer positiven oder negativen Meinung entsprechen, das bzw. die der Autor ausdrücken und dem Lesen mitteilen wollte, als er den Text schrieb.
  • Der Text kann verschiedene Arten von Formatierungsinformationen aufweisen, die sich auf Teile des Texts beziehen. Beispielsweise können sich die Formatierungsinformationen auf Zeichen des Texts beziehen, beispielsweise als Großschreibung, Unterstreichung, Kursivstellung, Farbe, Schriftsatztyp oder Schriftgröße der Zeichen.
  • Die Farbe der Zeichen kann beispielsweise ausgewertet werden als eine Grundlage zum Bestimmen der Stimmung. Zeichen, Wörter oder Phrasen, die eine vom übrigen Text abweichende Farbe aufweisen, haben erwartungsgemäß eine hohe Wahrscheinlichkeit, eine persönliche Meinung zu beinhalten, und können daher von großer Wichtigkeit zum Bestimmen einer in dem entsprechenden Teil des Texts ausgedrückten Stimmung sein. Weiterhin kann auch die Farbe selbst eine Stimmung ausdrücken. Beispielsweise können die Farben Rot, Gelb und Grün entsprechend dem Ampelschema für Schlecht, in Ordnung und Gut verwendet werden. Weiterhin kann jede Farbe zum Hervorheben eines Teils des Texts mit besonderer Wichtigkeit genutzt werden. Bestimmte Farben, sowie Rot, sind weiterhin zum Hervorheben wichtiger Passagen bekannt.
  • Weiterhin können Formatierungsinformationen auch durch die Zeichen selbst ausgedrückt sein, beispielsweise durch Interpunktionszeichen wie beispielsweise Punkte und einzelne oder mehrfache Ausrufungszeichen. Die Formatierungsinformationen können auch Folgen von Zeichen umfassen, die einen illustrativen Effekt haben, wie beispielsweise ein lächelndes Gesicht, welches durch einen Doppelpunkt gefolgt von einem Strich und einer rechten Klammer ausgedrückt werden kann. Das lächelnde Gesicht ”:-)” ist auch als ”emoticon” bekannt. Die Zeichen, die Teil der Formatierungsinformationen sind, können auch Abkürzungen enthalten, die beispielsweise Gefühle, wie ”ll” (lautes Lachen) – englisch ”lol” (laughing out loudly), ”rübl” (rolle über den Boden vor Lachen) – englisch ”rofl” (rolling over the floor laughing), oder ”wzT” (Was zum Teufel) – englisch ”wtf” (what the fuck). Weitere Abkürzungen, die persönliche Meinungen kennzeichnen, wie zum Beispiel ”ME” (Meines Erachtens) – englisch ”IMHO” (in my humble opinion) oder ”just my two cents” (”meiner unbedeutenden Meinung nach”), können auch analysiert werden.
  • Die Formatierungsinformationen können sich auch auf Aufzählungszeichen beziehen. Beispielsweise können ”+” oder ”–” genutzt werden, um Aufzählungspunkte als positiv oder negativ zu kennzeichnen.
  • Auch im Text verwendete Symbole können als Formatierungsinformation analysiert werden, wie beispielsweise (+) oder (–), die positive oder negative Meinungen des Autors ausdrücken. Wenn jedoch derartige Symbole isoliert in der Mitte von laufendem Text erscheinen, können sie eine andere Bedeutung haben, beispielsweise als mathematisches Symbol oder als einfacher Trennstrich, der Teile eines langen Worts trennt.
  • Wie oben ausgeführt, kann sich die Formatierungsinformation auch auf ganze Phrasen, Sätze, Absätze oder Passagen des Texts beziehen. Beispielsweise kann das Faktum, dass ein Absatz eine abweichende Formatierung im Vergleich zum Rest des Texts aufweist, beispielsweise einen größeren Einzug oder einen größeren linken und/oder rechten Seitenrand, auf eine höhere Wichtigkeit des Absatzes und möglicherweise auf den Ausdruck einer Stimmung innerhalb des Absatzes hinweisen.
  • Bei der Analyse des Texts können die Formatierungsinformationen auch zum Auswerten oder Bewerten einer Organisation von Absätzen genutzt werden. Beispielsweise können so Absätze von höherer Wichtigkeit identifiziert werden, die beispielsweise eine umfassende Meinung des Autors wiedergeben. Zum Beispiel kann ein abschließender Absatz als wichtiger in Bezug auf den Ausdruck einer Stimmung des Autors angesehen werden als ein einführender Absatz.
  • Wenn Absätze analysiert werden, kann auch eine Art der Aufzählung der Absätze berücksichtigt werden. Beispielsweise kann angenommen werden, dass eine Aufzählungsliste Aufzählungspunkte enthält, die als ähnlich oder als semantische Ähnlichkeiten aufweisend betrachtet werden können. Diesbezüglich kann eine einleitende Phrase von Interesse sein. Die einleitende Phrase kann sich auf alle Aufzählungspunkte beziehen, wie zum Beispiel die Phrase ”Liste der vorhandenen oder fehlenden Eigenschaften von Produkt X:” am Beginn einer Aufzählung.
  • Eine Stimmung oder Meinung, welche am Beginn einer Liste geäußert wird, kann auf alle gelisteten Aufzählungspunkte anwendbar ein. Wenn beispielsweise die Listen ”Gute Produkteigenschaften sind: A, B, C. Schlechte Produkteigenschaften sind: X, Y, Z.”, untersucht werden, bezieht sich die positive Stimmung der ”guten Eigenschaften” auf A, B und C, während X, Y und Z als schlechte Eigenschaften gekennzeichnet sind. Folglich ist eine korrekte Analyse der Aufzählungspunkte der Liste nur möglich, wenn die einführende Phrase auf alle Aufzählungspunkte bezogen wird.
  • Die Analyse der Formatierungsinformation, beispielsweise wie oben beschrieben, kann zum Beispiel genutzt werden, um in einem ersten Schritt die wichtigsten Passagen des zu analysierenden Texts zu identifizieren. In einem zweiten Schritt kann der semantische Inhalt der so identifizierten Passagen bestimmt werden. In einem dritten Schritt kann der semantische Inhalt erneut vor dem Hintergrund der Formatierungsinformationen bewertet werden.
  • Wenn beispielsweise im ersten Schritt eine Absatzformatierung analysiert wurde, um einen Absatz von hoher Wichtigkeit zu identifizieren, kann der semantische Inhalt oder der Gegenstand des Absatzes im zweiten Schritt bestimmt werden. Die Stimmung, die der Autor in dem Absatz ausdrücken wollte, kann im dritten Schritt analysiert werden, beispielsweise im Hinblick auf Farben, die innerhalb des Absatzes verwendet wurden. Wenn beispielsweise die Farben Rot, Grün und Gelb innerhalb des Absatzes verwendet wurden, kann angenommen werden, dass der semantische Inhalt eines in rot formatierten Teils kritisch oder negativ ist, während ein semantischer Inhalt, der in grün formatiert wurde, als akzeptabel, unkritisch oder positiv angenommen werden kann.
  • Wie in B102 dargestellt, ist es folglich möglich, zusätzlich zu bestimmen, ob die Stimmung einem positiven oder negativen Gefühl eines Autors des Texts im Hinblick auf den semantischen Inhalt des wenigstens einen Teils des Texts entspricht. Beispielsweise kann eine grüne Farbe, ein Smiley (lächelndes Gesicht) oder ein Aufzählungszeichen ”+” ein Zeichen für ein positives Gefühl sein, während die Farbe Rot, ein ärgerliches oder trauriges Gesicht oder das Symbol ”–” ein Indikator für ein negatives Gefühl sein kann.
  • In B104 kann eine Stärke der Stimmung bestimmt werden.
  • Die Stärke des Gefühls kann beispielsweise aus der Formatierungsinformation abgeleitet werden. Beispielsweise kann angenommen werden, dass ein Text, welcher in unterstrichenen Großbuchstaben geschrieben ist, ein starkes Gefühl ausdrücken soll. Entsprechend kann auch die Verwendung einer auffälligen Farbe oder Schriftgröße, oder die wiederholte Verwendung von Interpunktionszeichen wie beispielsweise in ”!!!” ein Zeichen für eine starke Stimmung sein. Es kann genommen werden, dass Teile des Texts mit einer starken Stimmung von besonderem Interesse sind für den Leser oder für jemanden, der den Text im Hinblick auf seinen Inhalt analysiert.
  • In B106 kann ein Grad der Wichtigkeit des Teils des Texts auf Basis der Stimmung und/oder der Stärke der Stimmung bestimmt werden.
  • Wie oben ausgeführt, können Teile, die eine Stimmung oder sogar eine starke Stimmung aufweisen, von größerer Wichtigkeit für den Leser sein als Teile, die keinerlei Stimmung aufweisen. Folglich kann eine Analyse der Stimmung auf Basis der Formatierungsinformation helfen, wichtige Passagen in einer schnellen und effizienten Art und Weise zu identifizieren. Beispielsweise kann auf Basis eines Grads der Wichtigkeit eine semantische Analyse zunächst für die wichtigsten Teils des Texts ausgeführt werden, und nur im Bedarfsfall für den Rest bzw. verbleibenden Teil des Texts.
  • In 2 ist eine weitere Ausführungsform des Verfahrens zum Bestimmen einer Stimmung gezeigt. In dieser Ausführungsform wird für jeden einer Mehrzahl von Teilen des Texts eine jeweilige Stimmung und/oder ein jeweiliger Grad der Wichtigkeit bestimmt. Weiterhin wird eine Punktzahl bestimmt, und zwar in Abhängigkeit von Werten, die den jeweiligen Stimmungen jedes der Mehrzahl von Teilen des Texts zugeordnet sind. Entsprechend kann eine umfassende Gesamtpunktzahl in Bezug auf den Text bestimmt werden.
  • In B200 wird die Punktzahl initialisiert, beispielweise auf Null gesetzt.
  • In B202 wird ein erster Teil des Texts ausgewählt als zu analysierender Teil. Dieser Teil wird analysiert im Hinblick auf die mit ihm verbundenen Formatierungsinformationen.
  • In B204 wird eine Stimmung, die durch den Teil ausgedrückt wird, in Abhängigkeit von der Formatierungsinformation bestimmt, beispielsweise durch eins der Verfahren wie zu 1 beschrieben.
  • Beispielsweise kann, wie in B206 gezeigt, bestimmt werden, ob die Stimmung einem positiven oder negativen Gefühl des Autors im Hinblick auf den Inhalt des Teils entspricht.
  • Weiterhin kann, wie in B208 gezeigt, eine Stärke der Stimmung des Teils bestimmt werden, wie oben beschrieben.
  • Zudem kann ein Grad der Wichtigkeit des Teils auf Basis der Stimmung und/oder der Stärke der Stimmung bestimmt werden, wie in B210 gezeigt.
  • In B212 wird die Punktzahl angepasst, und zwar in Abhängigkeit eines Werts, welcher dem jeweiligen, dem Teil des Texts bestimmten Gefühl zugeordnet ist. Beispielsweise kann der Wert addiert oder subtrahiert werden, und zwar abhängig davon, ob das Gefühl des Autors positiv oder negativ ist. Folglich kann zu Stimmungen, die ein positives Gefühl des Autors wiedergeben, ein positiver Wert zugeordnet werden, während zu Stimmungen, die einem negativen Gefühl des Autors entsprechen, ein negativer Wert zugeordnet werden kann. Diese Werte können fakultativ bzw. optional gewichtet werden, und zwar mit Gewichtungsfaktoren, die der jeweiligen Stärke der Stimmung und/oder dem Grad der Wichtigkeit des Teils des Texts entsprechen. Die Punktzahl wird dann entsprechend modifiziert bzw. angepasst. Folglich wird die Punktzahl durch Bestimmen einer gewichteten Summe der entsprechenden Stimmungen jedes der Vielzahl der Teile bestimmt, wobei eine Gewichtung einer jeweiligen Stimmung auf Basis eines Grads der Wichtigkeit und/oder auf Basis einer jeweiligen Stärke der jeweiligen Stimmung bestimmt wird.
  • In B214 wird ein nächster Teil des Texts als zu analysierender Teil ausgewählt, und die Analyse wird in B204 fortgesetzt.
  • Wenn das Ende des Texts erreicht ist, wird die dem Text entsprechende Punktzahl in B216 ausgegeben.
  • Demzufolge kann die in 2 gezeigte Ausführungsform des Verfahrens einem Nutzer helfen, einen Text mit Formatierungsinformation automatisch auszuwerten, und zwar im Hinblick auf ein umfassendes bzw. übergreifendes Gefühl des Autors, welches positiv oder negativ sein kann, und durch eine automatisch mittels eines Mikroprozessors ausgeführte Analyse. Das Ergebnis der Analyse kann als Punktzahl ausgegeben oder optional in einer visuell codierten Art und Weise wiedergegeben werden, beispielsweise durch einen Farbcode (grün für eine positive Punktzahl, rot für eine negative Punktzahl und gelb für eine dazwischenliegende Punktzahl).
  • 3 zeigt eine Anwendung der in 2 gezeigten Ausführungsform auf eine Internetseite zur Qualitätsbewertung. Im Hinblick auf dieses Beispiel kann angenommen werden, dass ein die Internetseite 300 besuchender Nutzer an einer Waschmaschine des Typs WM001 interessiert ist und Nutzerkritiken im Hinblick auf diesen Typ von Waschmaschinen analysieren möchte. Da innerhalb des Internets eine große Menge von Informationen im Hinblick auf diese Waschmaschine zugreifbar sein kann, kann es eine ermüdende Aufgabe für den Benutzer sein, diese Informationen durch persönliche Inaugenscheinnahme zu durchsuchen und auszuwerten. Es sollte bemerkt werden, dass diese Informationen Nutzerbewertungen zu einem Produkt mit beispielsweise null bis fünf Sterne enthalten können, aber auch Dokumente aus Internettagebüchern oder von persönlichen Internetseiten.
  • Um diese große Menge von Informationen zu analysieren, kann der Nutzer die Ausführungsform des in 2 gezeigten Verfahrens verwenden. Diese Ausführungsform kann helfen, schnell eine übergreifende Punktzahl für jeden der publizierten Texte auf Basis der in den Texten verwendeten Formatierungsinformationen zu bestimmen.
  • Im Beispiel wurden vier Dokumente 302-1, 304-1, 306-1 und 308-1 analysiert und jeweils mit positiven, negativen oder gleichgültigen Smileys (Gesichtern) 302-2, 304-2, 306-2 und 308-2 zusammengefasst, die die automatisch bestimmte Gesamtpunktzahl visualisieren. Folglich kann der Nutzer einen schnellen Eindruck einer übergreifenden Stimmung jedes der Texte bekommen, und kann dann einige der Texte, die von besonderem Interesse für eine weitere Analyse sind, auswählen.
  • Es sollte zudem bemerkt werden, dass zusätzlich zur Visualisierung der Punktzahl auch die wichtigsten Teile der Dokumente 302-1, 304-1, 306-1, 308-1 bestimmt und als Schlagzeilen angezeigt wurden, wobei die Schlagzeilen diejenigen Fakten zusammenfassen, die als entscheidend für die übergreifende, in dem Text ausgedrückte Meinung beurteilt wurden. Folglich erhält der Nutzer eine automatische Unterstützung, die ihm hilft, schnell eine Übersicht über Texte zu bekommen, die z. B. von überall aus dem Internet gesammelt wurden.
  • In 4 ist eine weitere Ausführungsform des Verfahrens zum Bestimmen einer Stimmung gezeigt. In dieser Ausführungsform wird der semantische Inhalt wenigstens eines der Teile des Texts bestimmt und die Stimmung in Bezug auf den semantischen Inhalt ausgewertet. Es ist gezeigt, dass für eine Vielzahl von Texten eine jeweilige Stimmung in Bezug auf den semantischen Inhalt für wenigstens einen jeweiligen Teil jedes der Texte durch Nutzung statistischer Methoden ausgewertet werden kann.
  • In B400 werden Texte gesammelt, die auf einen vorbestimmten Gegenstand bzw. auf ein vorbestimmtes Thema bezogen sind, zum Beispiel ein vorbestimmtes Produkt oder eine Eigenschaft eines Produkts. Die Texte werden von Speichereinrichtungen gesammelt, die über ein Netzwerk wie beispielsweise des Internet erreichbar sind.
  • In B402 wird die Punktzahl initialisiert, beispielsweise in Bezug auf den vorbestimmten Gegenstand bzw. das vorbestimmte Thema.
  • In B404 wird ein erster Teil eines ersten Texts bestimmt, der einen semantischen Inhalt mit Bezug zu dem Gegenstand bzw. Thema hat.
  • In B406 wird automatisch eine durch den Teil ausgedrückte Stimmung bestimmt, und zwar abhängig von Formatierungsinformationen, die auf den Teil bezogen sind.
  • Dies kann beispielsweise durch Nutzen der in 1 gezeigten Ausführungsform des Verfahrens geschehen.
  • In B408 wird bestimmt, ob die Stimmung einem positiven oder negativen Gefühl des Autors des Texts im Hinblick auf den semantischen Inhalt des Teils entspricht.
  • Weiterhin wird eine Stärke der Stimmung des Teils in B410 bestimmt.
  • In B412 wird ein Grad der Wichtigkeit des Teils auf Basis der Stimmung und/oder der Stärke der Stimmung bestimmt.
  • In B414 wird ein Wert zu der Stimmung zugeordnet. Der Wert kann dann zur Punktzahl der addiert oder von der Punktzahl abgezogen werden, und zwar abhängig davon, ob das Gefühl des Autors positiv oder negativ ist. Optional kann der Wert gewichtet werden, und zwar in Bezug auf die jeweilige Stärke der Stimmung und/oder in Bezug auf den Grad der Wichtigkeit des Teils. Folglich kann die Punktzahl durch Hinzuzählen oder Abziehen des der Stimmung zugeordneten Werts geändert werden, optional mit Gewichtung in Bezug auf die jeweilige Stärke der Stimmung und/oder den Grad der Wichtigkeit des Texts.
  • In B416 wird ein nächster Teil des Texts ausgewählt oder, wenn ein Ende des Texts erreicht ist, ein erster Teil eines nächsten Texts. Solange ein weiterer Teil analysiert werden kann, wird die Analyse in B406 fortgesetzt.
  • Durch Iteration der Blöcke B406 bis B416 wird eine gewichtete Summe von Werten bestimmt, wobei die Werte den jeweiligen Stimmungen entsprechen, die die Teile des Texts mit semantischem Inhalt mit Bezug zu dem Gegenstand aufweisen. Innerhalb dieser Summe finden sich alle Teile des Texts mit semantischem Inhalt mit Bezug zu dem Gegenstand wieder, und zwar gewichtet mit der jeweiligen Stärke der Stimmung und/oder dem jeweiligen Grad der Wichtigkeit.
  • Die Punktzahl kann dann in B418 ausgegeben werden. Sie gibt eine kurze numerische Zusammenfassung der in dem Text ausgedrückten Stimmungen im Hinblick auf den vorbestimmten Gegenstand wieder. Die Ausführungsform des Verfahrens erlaubt folglich eine automatische Analyse jeglicher Texte mit Bezug auf den Gegenstand, die über ein elektronisches Netzwerk erreichbar sind, und gibt einen kurzen Überblick über die Analyseergebnisse.
  • 5 zeigt ein Beispiel einer Anwendung des in 4 gezeigten Verfahrens. Das Beispiel zeigt eine Internetseite eines Verkäufers, der die Waschmaschinen WM001, WM002 und WM003 anbietet. Jede dieser Waschmaschinen kann als der vorbestimmte Gegenstand innerhalb der in 4 gezeigten Ausführungsform des Verfahrens verwendet werden. Folglich können jegliche Texte mit einem semantischen Inhalt, der zu einem dieser Produkte oder zu einer Eigenschaft eines dieser Produkte in Bezug steht, von Interesse sein. Ein elektronisches Netzwerk wie das Internet kann nach entsprechenden Texten durchsucht werden, beispielsweise durch das Analysieren von Internettagebüchern oder von Nutzerkritiken, die zu diesen Gegenständen in Bezug stehen.
  • Entsprechend der in 4 gezeigten Ausführungsform kann für jede der Waschmaschinen WM001, WM002 und WM003 eine Punktzahl bestimmt werden, die eine übergreifende Meinung der Texte in Bezug auf die jeweilige Waschmaschine wiedergibt. Diese Punktzahl kann durch Zugriff auf die Formatierungsinformationen effizient und automatisch bestimmt werden, wie oben beschrieben.
  • Das Ergebnis der Analyse kann beispielsweise durch positive, gleichgültige oder negative Smileys (Gesichter) 500, 502, 504 visualisiert werden. Weiterhin kann die übergreifende Punktzahl für jedes Produkt auf die Elemente 500-1, 500-2, 500-3, ..., 504-1, 504-2, 504-3 heruntergebrochen werden, die sich auf die Texte beziehen, in welchen die jeweiligen positiven, negativen oder neutralen Meinungen geäußert wurden. Schlagzeilen dieser Texte können beispielsweise per Mausklick auf eins der Elemente 500-1, 500-2, 500-3, ..., 504-1, 504-2, 504-3 angezeigt werden. Hierdurch kann eine weitergehende Analyse jedes der durchsuchten Dokumente unterstützt werden, beispielsweise eine weitergehende Analyse von Teilen der Texte, welche die Formatierungsinformationen tragen. Hierdurch wird ein schneller Zugriff des Nutzers auf die jeweiligen Texte und damit eine verfeinerte Analyse ermöglicht.
  • Demzufolge erzeugt die Internetseite eine automatisch generierte Übersicht über Stimmungen, welche mit Hilfe von Formatierungsinformationen in den zugreifbaren Texten ausgedrückt wurden, und welche in Bezug zu dem vorbestimmten Gegenstand stehen. Folglich wird der Benutzer effizient unterstützt, wenn er eine breite Suche und Stimmungsanalyse im Hinblick auf den vorbestimmten Gegenstand durchführt.
  • In 6 ist ein Internettagebuch mit Bezug auf ein Kameramodell XYZ gezeigt. Das Internettagebuch enthält Formatierungsinformationen, und kann daher durch eine der oben beschriebenen Ausführungsformen des Verfahrens analysiert werden.
  • In einem ersten Beitrag 600 fragt ein Nutzer A eine Nutzergemeinschaft nach Erfahrungen in Bezug auf einen Weißabgleich der Kamera. In einem abschließenden Absatz drückt Nutzer A seine schlechten Gefühle im Hinblick auf den Weißabgleich aus. Dieser Absatz kann innerhalb des Beitrags einfach identifiziert werden, da er zentriert gesetzt, fettgedruckt und eingeleitet durch einen kursiv gedruckten Ausruf ist. Folglich kann das Verfahren gemäß 1 diesen Absatz einfach identifizieren als einen Absatz, der eine starke Stimmung beinhaltet, und zwar mit Bezug auf den Weißabgleich des Kameramodells XYZ. Weiterhin kann die Methode nach 1 diesen Absatz einfach als einen Absatz von hoher Wichtigkeit im Hinblick auf das übergreifende Thema des Beitrags zum Internettagebuch erkennen. Eine semantische Analyse des Texts ermöglicht es festzustellen, dass die Stimmung negativ ist (verdorbene Bilder).
  • Der folgende Betrag 602 des Nutzers B enthält weniger Formatierungsinformationen. Dennoch kann eine Analyse der Interpunktionszeichen und der Anordnung der Absätze es ermöglichen, den letzten Satz als einen Satz innerhalb des Beitrags zu identifizieren, der ein positives Gefühl einer gewissen Stärke und Wichtigkeit aufweist.
  • Im folgenden Beitrag 604 des Nutzers A kann der wichtigste Teil des Texts einfach auf Basis der Großschreibung der Buchstaben erkannt werden. Aus diesem Teil ergibt sich einfach, dass das Auffinden des Menüs das zentrale Problem der Diskussion ist.
  • Im Beitrag 606 äußert Nutzer C einen Vorschlag und drückt seine persönliche Meinung aus, was einfach an der Einleitung durch die Abkürzung ”IMHO” erkannt werden kann (in my humble/honest opinion, meiner bescheidenen/ehrlichen Meinung nach).
  • In dem abschließen Beitrag 608 des fragenden Nutzers A können die wichtigsten und am meisten stimmungsgeladenden Teile wieder durch Rückgriff auf die Interpunktionszeichen erkannt werden. Weiterhin wird im abschließenden Absatz, welcher zentriert gesetzt, kursiv gedruckt und durch ein schreiendes ”Emoticon” eingeleitet ist, die Meinung des Nutzers A zusammengefasst und zur Komplexität des Produkts in Bezug gesetzt.
  • In diesem Beispiel kann die Formatierungsinformation genutzt werden, um stimmungsgeladene und wichtige Teile des Texts zu erkennen. Folglich kann das Herauslesen einer Stimmung auf Basis einer Formatierungsinformation helfen, Texte, beispielsweise im Hinblick auf einen vorbestimmten Gegenstand, genau und effektiv zu analysieren.
  • In 7 ist eine Produktbewertung eines Kameramodells XYZ gezeigt. Die Produktbewertung beinhaltet drei Listen 700, 702 und 704, wobei jede der Listen durch eine Überschrift eingeleitet wird, wobei die Überschrift das Thema jedes der Listenbeiträge angibt. Weiterhin weist jede Liste Aufzählungspunkte auf, die durch ein positives (+) oder negatives (–) Aufzählungszeichen eingeleitet werden, wodurch die Meinung des Autors bzw. Veröffentlichers verdeutlicht wird. Am Ende der Produktbewertung wird eine übergreifende Zusammenfassung 706 durch ein Symbol ”→” eingeleitet, welchem ein fettgedruckter, zusammenfassender Satz folgt. Eine detaillierte Analyse der Produktbewertung beispielsweise mittels des in 1 gezeigten Verfahrens erlaubt es, Eigenschaften zu identifizieren, die der Veröffentlicher als positiv oder negativ empfunden hat.
  • Wenn eine große Anzahl entsprechender Produktbewertungen verfügbar ist, beispielsweise mit Bezug auf das Kameramodell XYZ, kann eine detaillierte Analyse der Nutzereinschätzungen zu verschiedenen Eigenschaften des Kameramodells durchgeführt werden. Beispielsweise können innerhalb jedes der Texte wichtige Teile und stimmungsgeladene Aussagen der Nutzer identifiziert werden, und zwar auf Basis der Formatierungsinformationen. Dann kann ein semantischer Inhalt der wichtigen Teile und der stimmungsgeladenen Aussagen analysiert werden. Wie zu B212 beschrieben, kann den Teilen beispielsweise ein Wert zugeordnet werden, wobei der Wert eine Meinung des Autors widerspiegelt. Auf dieser Basis kann im Hinblick auf jede Eigenschaft eine statistische Analyse durchgeführt werden, wobei z. B. ein Mittelwert und eine Standardabweichung der Werte bestimmt werden kann, die zu den in den Texten ausgedrückten Meinungen zugeordnet sind. Folglich kann eine automatisierte statistische Analyse von Nutzerbewertungen durchgeführt werden, beispielsweise im Hinblick auf ein vorbestimmtes Produkt oder in Bezug auf eine Eigenschaft bzw. auf ein Merkmal des vorbestimmten Produkts.
  • Ein Bewertungsergebnis einer entsprechenden Analyse ist in 8 gezeigt. In dem Beispiel sind Nutzerkritiken 800 einer deutschen Internetseite eines Verkäufers ABC und Nutzerkritiken 802 einer japanischen Internetseite eines Verkäufers DEF zusammengefasst und zum direkten Vergleich ausgegeben. Als vorbestimmte Gegenstände bzw. Themen ist das Klapprechner (Laptop) Modell XYZ, seine Tastatur, Batterie, Abdeckung und Lüftung bestimmt.
  • In Bezug auf die Tastatur wurden zehn positive Meinungen auf der deutschen Internetseite des Verkäufers ABC abgegeben, während nur sechs positive Rückmeldungen und acht negative Rückmeldungen auf der japanischen Internetseite des Verkäufers DEF abgegeben wurden. Dies kann ein Hinweis auf ein Problem sein, das nur japanische Tastaturen betrifft. Diesbezüglich kann eine detailliertere Analyse der gegebenen Rückmeldungen erforderlich sein.
  • Wenn die Rückmeldungen analysiert werden, kann ein unterschiedlicher kultureller Hintergrund der jeweiligen Autoren berücksichtigt werden. Folglich muss die Stimmung in Abhängigkeit von dem kulturellen Hintergrund des Autors des Texts bestimmt werden. Wenn beispielsweise Rückmeldungen auf einer japanischen Internetseite analysiert werden, sollte berücksichtigt werden, dass häufig der letzte Absatz die tatsächlich beabsichtigte Meinung beinhaltet, während der Beginn eine höfliche Einführung in das Thema enthält.
  • Weiterhin können auch stimmungstransportierende Phrasen von einem kulturellen Hintergrund abhängen. Wenn zum Beispiel auf einer japanischen Webseite eine Rückmeldung angibt, dass etwas schwierig sei, kann dies auf ernsthafte Probleme hinweisen, während dieselbe Stellungnahme in einer Rückmeldung vor amerikanischem oder europäischem Hintergrund bedeutet, dass gewisse Schwierigkeiten möglicherweise auftreten können.
  • Das in 8 gezeigte Auswertungsergebnis kann zu verschiedenen, zu berücksichtigenden Ausgaben bzw. Ergebnissen führen.
  • Beispielsweise kann das negative Feedback der japanischen Internetseite des Verkäufers DEF an eine Abteilung für Produktentwicklung berichtet werden, die für ein Modell der nächsten Generation darauf achten wird, dass alle erforderlichen Funktionen einfach erreichbar sind. Weiterhin durch die Produktentwicklungsabteilung kann eine Reparatursoftware zum Herunterladen bereitgestellt werden.
  • Weiterhin kann auch ein Produktvertrieb im Hinblick auf das Bewertungsergebnis angepasst werden. Beispielsweise können die negativen Stellungnahmen von der japanischen Internetseite des Verkäufers DEF dazu führen, dass eine Regel für den Produktvertrieb aufgestellt wird, welche sicherstellt, dass auf dem japanischen Markt nur eine Variante des Klapprechnermodells vertrieben wird, die den entsprechenden Bedürfnissen angepasst ist.
  • Weiterhin kann eine Lieferkette bzw. ein Lieferkettenmanagement (supply chain management) entsprechend den Ergebnissen angepasst werden.
  • Weiterhin können Produktbewertungen, die persönliche Meinungen aufweisen, auch im Hinblick auf einen einzelnen Autor analysiert werden. Dadurch können Informationen im Hinblick auf ein persönliches Profil des Autors gesammelt werden, die seinen oder ihren persönlichen Geschmack wiedergeben.
  • Beispielsweise können für einen bezüglich verschiedener Benutzereinstellungen seiner Kamera sehr positiv gestimmten Nutzer persönliche Empfehlungen zu anderen Produkten, z. B. zu Laptops oder Mobiltelefonen, bereitgestellt werden, die ebenfalls verschiedene Benutzereinstellungen ermöglichen. Im Gegensatz dazu könnten einem Nutzer, welcher sich über sein kompliziertes Produkt beschwert, Empfehlungen bereitgestellt werden, die sich auf ein Produkt mit einfacher Benutzerschnittstelle beziehen.
  • Folglich kann aus der automatisierten Auswertung von Rückmeldungen eines Benutzers entsprechend einer der oben beschriebenen Ausführungsformen des Verfahrens ein Nutzerprofil des Benutzers abgeleitet werden, welches seine persönlichen Neigungen und seinen persönlichen Geschmack beschreibt. Weiterhin können dem Nutzer persönliche Empfehlungen entsprechend seinem Profil zur Verfügung gestellt werden.
  • 9 zeigt eine Vorrichtung 900 zum automatischen Auswerten von Texten, beispielsweise entsprechend den in den 1, 2 und 4 gezeigten Ausführungsformen. Die Vorrichtung 900 weist einen Internetseiten-Durchsucher (website crawler) 902 auf, welcher als Sammeleinrichtung agiert und dazu ausgelegt ist, von Speichereinrichtungen, die über ein Netzwerk wie beispielsweise das Internet erreichbar sind, Texte mit Bezug zu einem vorbestimmten Gegenstand zu sammeln. Im gezeigten Beispiel hat der Internet-Seiten-Durchsucher 902 Zugriff auf einen Server 904, einen ersten Speicher 906, Dokumente 908 und 910, eine Datenbank 912 mit Texten und einen zweiten Speicher 914. Folglich können verschiedene Arten von Texten mit Formatierungsinformationen, die zu dem vorbestimmten Gegenstand in Bezug stehen, durch den Internet-Seiten-Durchsucher 902 herangezogen werden.
  • Diese Texte können einer Suchvorrichtung 916 (bzw. Scanvorrichtung) bereitgestellt werden, welche dazu ausgelegt ist, Teile des Texts mit jeweiligen Formatierungsinformationen, die zu den Teilen des Texts in Bezug steht, zu bestimmen.
  • Diese Teile können einer Bestimmvorrichtung 918 zur Verfügung gestellt werden, welche dazu ausgelegt ist, für jeden der Teile der Texte eine jeweilige Stimmung und einen jeweiligen semantischen Inhalt zu bestimmen, wobei das Bestimmen der jeweiligen Stimmung von den jeweiligen Formatierungsinformationen, die durch die Suchvorrichtung bestimmt wurden, abhängt. Die Bestimmvorrichtung 918 kann die Stimmung beispielsweise gemäß dem in 1 gezeigten Verfahren bestimmen.
  • Die Ergebnisse der Bestimmvorrichtung 918 können einer Bewertungsvorrichtung 920 zur Verfügung gestellt werden, die dazu ausgelegt ist, für jeden der Teile der Texte den jeweiligen semantischen Inhalt in Bezug auf die jeweilige Stimmung statistisch zu bewerten, wie beispielsweise zu 8 beschrieben.
  • Die Ergebnisse können dann an einer Anzeigevorrichtung 922 gezeigt werden. Wie dargestellt können die Ergebnisse nach verschiedenen Teilgegenständen bzw. Teilthemen aufgeteilt werden, wobei diese Teilthemen beispielsweise die Tastatur, die Batterie, die Farbe oder die Lüftung des Klapprechner-Modells XYZ sein können.
  • Wenn der vorbestimmte Gegenstand in Bezug zu einem Produkt oder einer Eigenschaft eines Produkts steht, können weitere Ergebnisse bereitgestellt werden.
  • Beispielsweise ist es möglich, eine technische Eigenschaft des Produkts entsprechend einem der Ergebnisse anzupassen. Beispielsweise kann eine Eigenschaft, die als unzureichend empfunden wurde, entsprechend den Nutzeranforderungen verbessert werden, beispielsweise die Kapazität einer Batterie.
  • Weiterhin können auch Mittel zum Reparieren einer Fehlfunktion des Produkts bereitgestellt werden. Wenn beispielsweise eine Softwareversion eine Fehlfunktion z. B. eines Menüs auslöst, kann eine Reparaturversion (patch) bereitgestellt und beispielsweise über eine Unterstützungs-Internetseite vertrieben werden.
  • Weiterhin kann ein Produktvertrieb und/oder eine Lieferkette entsprechend den Ergebnissen der Bewertungsvorrichtung angepasst werden. Wenn beispielsweise einer der Verkäufer besonders erfolgreich im Verkauf eines Produkts ist, kann dieser Verkäufer mit einer größeren Menge von Produkten für den Verkauf und mit zusätzlichem Werbematerial zum Wecken des Interesses noch weiterer Nutzer versorgt werden. Wenn ein Produkt in einem nationalen Markt besonders erfolgreich ist, kann eine Lieferkette derart optimiert werden, dass Verkäufer in diesem Markt mit genügend Teilen für den Verkauf versorgt werden.
  • Weiterhin können die Bewertungsergebnisse auch in Hinblick auf den Autor analysiert werden. In diesem Fall wird der Autor als der vorbestimmte Gegenstand ausgewählt, nicht ein Produkt. Wenn die Rückmeldungen des Autors zu unterschiedlichen Produkten ausgewertet werden, können wertvolle Informationen über seine Vorlieben erfasst werden. Solche Informationen können beispielsweise einem persönlichen Profil des Autors hinzugefügt werden. Infolge dessen können persönliche Empfehlungen beispielsweise von Produkten, die für den Autor von Interesse sein könnten, bereitgestellt werden.
  • Folglich wird es mit den beanspruchten Verfahren und Vorrichtungen zum automatischen Auswerten von Texten auf Basis von Formatierungsinformationen möglich, eine große Menge von Texten zu analysieren und zu durchsuchen, wobei Teile, welche Stimmungen und Meinungen der Autoren beschreiben, schnell identifiziert werden können. Folglich können wertvolle Informationen gewonnen werden, die helfen, Produkte zu entwickeln, zu optimieren und optimal in einem Markt zu vertreiben, und zwar entsprechend den Nutzeranforderungen. Diese Analysen können automatisch und mit reduziertem Aufwand durchgeführt werden, und zwar wegen des Bezugs auf die Formatierungsinformationen, die helfen, stimmungsgeladene und wichtige Passagen der Texte genau zu identifizieren.

Claims (18)

  1. Verfahren zum Bestimmen einer Stimmung, mit aus einem Text mit Formatierungsinformationen, die sich auf Teile des Texts beziehen, Bestimmen einer durch wenigstens einen der Teile ausgedrückten Stimmung, wobei die Stimmung automatisch mittels eines Mikroprozessors bestimmt wird und von den sich auf den wenigstens einen Teil beziehenden Formatierungsinformationen abhängt.
  2. Verfahren nach Anspruch 1, mit Bestimmen, ob die Stimmung einem positiven oder negativen Gefühl des Autors des Texts in Bezug auf den semantischen Inhalt des wenigstens einen Teils entspricht.
  3. Verfahren nach Anspruch 1 oder 2, mit Bestimmen einer Stärke der Stimmung.
  4. Verfahren nach einem der vorstehenden Ansprüche, mit Bestimmen eines Grads der Wichtigkeit des wenigstens einen Teils auf Basis der Stimmung und/oder der Stärke der Stimmung.
  5. Verfahren nach einem der vorstehenden Ansprüche, wobei für jeden einer Mehrzahl der Teile eine jeweilige Stimmung und/oder ein jeweiliger Grad der Wichtigkeit bestimmt wird, und eine Punktzahl bestimmt wird, die von Werten abhängt, die den jeweiligen Stimmungen jeder der Mehrzahl von Teilen des Texts zugeordnet sind.
  6. Verfahren nach Anspruch 5, wobei die Punktzahl durch Bestimmen einer gewichteten Summe der jeweiligen Stimmungen jedes der Mehrzahl von Teilen bestimmt wird, wobei eine Gewichtung einer jeweiligen Stimmung auf Basis eines jeweiligen Grads der Wichtigkeit und/oder auf Basis einer jeweiligen Stärke der jeweiligen Stimmung bestimmt wird.
  7. Verfahren nach einem der vorstehenden Ansprüche, mit Bestimmen eines semantischen Inhalts des wenigstens einen der Teile, und Bewerten der Stimmung in Bezug auf den semantischen Inhalt.
  8. Verfahren nach einem der vorstehenden Ansprüche, mit für eine Mehrzahl von Texten, Bewerten einer jeweiligen Stimmung in Bezug auf einen semantischen Inhalt wenigstens eines jeweiligen Teils von jedem der Texte durch Nutzen statistischer Verfahren.
  9. Verfahren nach Anspruch 7 oder 8, wobei der semantische Inhalt auf ein Produkt oder eine Eigenschaft des Produkts bezogen ist.
  10. Verfahren nach einem der vorstehenden Ansprüche, wobei die Formatierungsinformation wenigstens eine Information aus einer Gruppe umfassend eine Großschrift, eine Unterstreichung, einen Schriftsatztyp, eine Schriftgröße, eine Fettschreibung, eine Kursivschreibung, eine Farbe, eine Absatzanordnung, einen Absatzseitenrand, ein Aufzählungszeichen, ein Interpunktionszeichen, eine Abkürzung für einen Stimmungsausdruck, eine Nummerierung und eine in einem Text verwendete Absatzreihenfolge umfasst.
  11. Verfahren nach einem der vorstehenden Ansprüche, wobei das Bestimmen der Stimmung von einem kulturellen Hintergrund eines Autors des Textes abhängt.
  12. Vorrichtung zum automatischen Auswerten von Texten, mit einer Sammeleinrichtung, wobei die Sammeleinrichtung zum Sammeln von auf einen vorbestimmten Gegenstand bezogenen Texten von Speichereinrichtungen, welche für die Sammelvorrichtung über ein Netzwerk erreichbar sind, ausgebildet ist; einer Suchvorrichtung, wobei die Suchvorrichtung zum Bestimmen von Teilen der Texte mit jeweiligen, auf die Teile der Texte bezogenen Formatierungsinformationen ausgebildet ist; einer Bestimmvorrichtung, wobei die Bestimmvorrichtung zum Bestimmen einer jeweiligen Stimmung und eines jeweiligen semantischen Inhalts für jeden der Teile der Texte ausgebildet ist, wobei das Bestimmen der jeweiligen Stimmung von den jeweiligen Formatierungsinformationen abhängt; und einer Bewertungsvorrichtung, wobei die Bewertungsvorrichtung zum Bewerten des jeweiligen semantischen Inhalts jedes der Teile der Texte in Bezug auf die jeweilige Stimmung ausgebildet ist.
  13. Vorrichtung nach Anspruch 12, wobei der vorbestimmte Gegenstand einen Bezug zu einem Produkt oder einer Eigenschaft eines Produkts aufweist.
  14. Vorrichtung nach Anspruch 13, wobei eine technische Eigenschaft des Produkts entsprechend einem Ergebnis einer Bewertung der Bewertungsvorrichtung angepasst wird.
  15. Vorrichtung nach Anspruch 13 oder 14, wobei abhängig von dem Ergebnis der Bewertung der Bewertungsvorrichtung ein Mittel zum Reparieren einer Fehlfunktion des Produkts bereitgestellt wird.
  16. Vorrichtung nach einem der vorstehenden Ansprüche, wobei abhängig von dem Ergebnis der Bewertung der Bewertungsvorrichtung ein Produktvertrieb und/oder eine Lieferkette angepasst wird.
  17. Vorrichtung nach einem der vorstehenden Ansprüche, wobei ein Benutzerprofil eines Autors der Texte entsprechend dem Ergebnis der Bewertung der Bewertungsvorrichtung angepasst wird.
  18. Vorrichtung nach Anspruch 17, wobei auf Basis des angepassten Benutzerprofils dem Autor eine Empfehlung bereitgestellt wird.
DE112012001794.3T 2011-04-21 2012-03-12 Verfahren zum Bestimmen einer Stimmung aus einem Text Ceased DE112012001794T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11003379 2011-04-21
EP11003379.2 2011-04-21
PCT/EP2012/001102 WO2012143069A1 (en) 2011-04-21 2012-03-12 A method for determining a sentiment from a text

Publications (1)

Publication Number Publication Date
DE112012001794T5 true DE112012001794T5 (de) 2014-02-20

Family

ID=45875918

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112012001794.3T Ceased DE112012001794T5 (de) 2011-04-21 2012-03-12 Verfahren zum Bestimmen einer Stimmung aus einem Text

Country Status (4)

Country Link
US (1) US9965443B2 (de)
CN (1) CN103493040A (de)
DE (1) DE112012001794T5 (de)
WO (1) WO2012143069A1 (de)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5607859B2 (ja) * 2012-04-25 2014-10-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ
US9535899B2 (en) 2013-02-20 2017-01-03 International Business Machines Corporation Automatic semantic rating and abstraction of literature
US9311294B2 (en) * 2013-03-15 2016-04-12 International Business Machines Corporation Enhanced answers in DeepQA system according to user preferences
US9342846B2 (en) 2013-04-12 2016-05-17 Ebay Inc. Reconciling detailed transaction feedback
CN104750380A (zh) * 2013-12-31 2015-07-01 中国移动通信集团公司 一种信息处理的方法及电子设备
US11100557B2 (en) 2014-11-04 2021-08-24 International Business Machines Corporation Travel itinerary recommendation engine using inferred interests and sentiments
US20160162582A1 (en) * 2014-12-09 2016-06-09 Moodwire, Inc. Method and system for conducting an opinion search engine and a display thereof
CN104915005B (zh) * 2015-06-08 2018-05-11 中国科学院自动化研究所 通过颜色实现情感色彩的方法
CN106855852B (zh) * 2015-12-09 2020-09-15 北京国双科技有限公司 语句情感的确定方法及装置
CN107590120A (zh) * 2016-07-07 2018-01-16 深圳狗尾草智能科技有限公司 人工智能处理方法及装置
US10924808B2 (en) * 2017-12-28 2021-02-16 Facebook, Inc. Automatic speech recognition for live video comments
US11354684B2 (en) * 2018-02-06 2022-06-07 Citrix Systems, Inc. Data analytics for international product quality and user experience
KR20220149624A (ko) * 2018-05-18 2022-11-08 이베이 인크. 거래 피드백의 처리
KR102572701B1 (ko) 2018-08-17 2023-08-31 삼성전자주식회사 사용자의 상태 정보에 기초하여 응답 메시지를 제공하는 전자 장치 및 그 동작 방법
US10902188B2 (en) * 2018-08-20 2021-01-26 International Business Machines Corporation Cognitive clipboard
US10878196B2 (en) 2018-10-02 2020-12-29 At&T Intellectual Property I, L.P. Sentiment analysis tuning
US11349798B2 (en) 2019-02-01 2022-05-31 Community.Com, Inc. System and method for multivariate testing of messages to subgroup in a one-to-many messaging platform
CN109979592A (zh) * 2019-03-25 2019-07-05 广东邮电职业技术学院 心理健康预警方法、用户终端、服务器与系统
CN111984781A (zh) * 2019-05-23 2020-11-24 国际商业机器公司 偏见最小化的自动概括
US11050841B2 (en) 2019-08-19 2021-06-29 Microsoft Technology Licensing, Llc User profile sharing
US20210209289A1 (en) * 2020-01-07 2021-07-08 Samsung Electronics Co., Ltd. Method and apparatus for generating customized content based on user intent
US11501074B2 (en) * 2020-08-27 2022-11-15 Capital One Services, Llc Representing confidence in natural language processing
US11785429B2 (en) 2020-09-03 2023-10-10 Community.Com, Inc. Semantic clustering of messages
US20220245354A1 (en) * 2021-01-29 2022-08-04 Elaboration, Inc. Automated classification of emotio-cogniton
US11657415B2 (en) * 2021-05-10 2023-05-23 Microsoft Technology Licensing, Llc Net promoter score uplift for specific verbatim topic derived from user feedback
US20230289377A1 (en) * 2022-03-11 2023-09-14 Tredence Inc. Multi-channel feedback analytics for presentation generation

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6622140B1 (en) 2000-11-15 2003-09-16 Justsystem Corporation Method and apparatus for analyzing affect and emotion in text
US7058566B2 (en) 2001-01-24 2006-06-06 Consulting & Clinical Psychology, Ltd. System and method for computer analysis of computer generated communications to produce indications and warning of dangerous behavior
US7062437B2 (en) * 2001-02-13 2006-06-13 International Business Machines Corporation Audio renderings for expressing non-audio nuances
US7289949B2 (en) * 2001-10-09 2007-10-30 Right Now Technologies, Inc. Method for routing electronic correspondence based on the level and type of emotion contained therein
US8495503B2 (en) 2002-06-27 2013-07-23 International Business Machines Corporation Indicating the context of a communication
US8200477B2 (en) * 2003-10-22 2012-06-12 International Business Machines Corporation Method and system for extracting opinions from text documents
US7983910B2 (en) * 2006-03-03 2011-07-19 International Business Machines Corporation Communicating across voice and text channels with emotion preservation
EP2162833A1 (de) 2007-07-10 2010-03-17 International Business Machines Corporation Verfahren, system und computerprogramm für intelligente textkommentierung
US20090083052A1 (en) * 2007-09-26 2009-03-26 Bokor Brian R Virtual Business Object Business Processes in a Virtual Environment
US8239189B2 (en) * 2008-02-26 2012-08-07 Siemens Enterprise Communications Gmbh & Co. Kg Method and system for estimating a sentiment for an entity
JP2010181993A (ja) 2009-02-04 2010-08-19 Kddi Corp 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム
CN101853259A (zh) 2009-03-31 2010-10-06 国际商业机器公司 添加和处理带有情感数据的标签的方法和设备
US20100257022A1 (en) * 2009-04-07 2010-10-07 Yahoo! Inc. Finding Similar Campaigns for Internet Advertisement Targeting
CN101609459A (zh) 2009-07-21 2009-12-23 北京大学 一种情感特征词提取系统
US20110288897A1 (en) * 2010-05-24 2011-11-24 Avaya Inc. Method of agent assisted response to social media interactions
US8554701B1 (en) * 2011-03-18 2013-10-08 Amazon Technologies, Inc. Determining sentiment of sentences from customer reviews
US8650023B2 (en) * 2011-03-21 2014-02-11 Xerox Corporation Customer review authoring assistant

Also Published As

Publication number Publication date
US20140114648A1 (en) 2014-04-24
CN103493040A (zh) 2014-01-01
US9965443B2 (en) 2018-05-08
WO2012143069A1 (en) 2012-10-26

Similar Documents

Publication Publication Date Title
DE112012001794T5 (de) Verfahren zum Bestimmen einer Stimmung aus einem Text
Gopaldas A front-to-back guide to writing a qualitative research article
Wozniak et al. Frames, stories, and images: The advantages of a multimodal approach in comparative media content research on climate change
Eder Rolling stylometry
Bauer et al. Quantitive evaluation of Web site content and structure
DE102019000433A1 (de) Generieren einer themenbasierten Zusammenfassung eines Textinhalts
Oelke et al. Visual readability analysis: How to make your writings easier to read
DE102018007165A1 (de) Vorhersage von stilbrüchen innerhalb eines textinhalts
CN108364199B (zh) 一种基于互联网用户评论的数据分析方法及系统
CN103970864B (zh) 基于微博文本的情绪分类和情绪成分分析方法及系统
DE102017008430A1 (de) Verfahren und Systeme zum Erzeugen von virtuelle Realität-Umgebungen aus elektronischen Dokumenten
WO2009079617A1 (en) System and method for analyzing and categorizing text
DE102004003878A1 (de) System und Verfahren zum Identifizieren eines speziellen Wortgebrauchs in einem Dokument
US20130054502A1 (en) Determination of document credibility
DE102021004157A1 (de) Maschinell lernendes Modellieren zum Schutz gegen die Online-Offenlegung empfindlicher Daten
DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
McKelvey et al. Visualizing communication on social media: Making big data accessible
KR101007284B1 (ko) 인터넷을 이용한 의견 검색 시스템 및 그 방법
CN110688407B (zh) 一种社会关系挖掘的方法
De Castro Salgado et al. On the epistemic nature of cultural viewpoint metaphors
John et al. A visual approach for the comparative analysis of character networks in narrative texts
DE102010027146A1 (de) Verfahren zur dauerhaft aktualisierten Darstellung der Lesbarkeits-Einschätzung einzelner Passagen (z.B. Absätze) eines Textes im Gesamtüberblick
Kim et al. Developing information quality assessment framework of presentation slides
CN111046295B (zh) 书评页面的响应方法、计算设备及计算机存储介质
US11373198B2 (en) Evaluation device, evaluation method, and evaluation program

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: MFG PATENTANWAELTE MEYER-WILDHAGEN MEGGLE-FREU, DE

R082 Change of representative

Representative=s name: MFG PATENTANWAELTE MEYER-WILDHAGEN MEGGLE-FREU, DE

R082 Change of representative

Representative=s name: MFG PATENTANWAELTE MEYER-WILDHAGEN MEGGLE-FREU, DE

R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final