DE212021000356U1 - Erzeugen einer gestuften Textformatierung für elektronische Dokumente und Anzeigen - Google Patents

Erzeugen einer gestuften Textformatierung für elektronische Dokumente und Anzeigen Download PDF

Info

Publication number
DE212021000356U1
DE212021000356U1 DE212021000356.7U DE212021000356U DE212021000356U1 DE 212021000356 U1 DE212021000356 U1 DE 212021000356U1 DE 212021000356 U DE212021000356 U DE 212021000356U DE 212021000356 U1 DE212021000356 U1 DE 212021000356U1
Authority
DE
Germany
Prior art keywords
text
sentence
display
rules
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE212021000356.7U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cascade Reading Inc
Original Assignee
Cascade Reading Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cascade Reading Inc filed Critical Cascade Reading Inc
Publication of DE212021000356U1 publication Critical patent/DE212021000356U1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/001Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes using specific devices not provided for in groups G09G3/02 - G09G3/36, e.g. using an intermediate record carrier such as a film slide; Projection systems; Display of non-alphanumerical information, solely or in combination with alphanumerical information, e.g. digital display on projected diapositive as background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/22Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of characters or indicia using display control signals derived from coded signals representing the characters or indicia, e.g. with a character-code memory
    • G09G5/24Generation of individual character patterns
    • G09G5/243Circuits for displaying proportional spaced characters or for kerning
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/22Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of characters or indicia using display control signals derived from coded signals representing the characters or indicia, e.g. with a character-code memory
    • G09G5/32Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of characters or indicia using display control signals derived from coded signals representing the characters or indicia, e.g. with a character-code memory with means for controlling the display position
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/02Networking aspects
    • G09G2370/022Centralised management of display operation, e.g. in a server instead of locally
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2380/00Specific applications
    • G09G2380/08Biomedical applications
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2380/00Specific applications
    • G09G2380/14Electronic books and readers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Computerlesbares Speichermedium, das Anweisungen enthält, die bei ihrer Ausführung eine Hardware-Verarbeitungsschaltung eines Rechensystems veranlassen, Schritte zur Implementierung von gestufter Textformatierung für eine elektronische Anzeige durchzuführen, wobei die Schritte einschließen:
Verarbeiten eines Stroms eines menschenlesbaren Textes in einem Parser für eine maschinelle Verarbeitung von natürlicher Sprache (NLP), um Wortarten und Schlüsselphrasen in einem Satz zu identifizieren;
Taggen der identifizierten Wortarten gemäß den jeweiligen Arten und Schlüsselphrasen;
Erzeugen einer Textstufungsanordnung für die Anzeige des Satzes durch Anwenden vordefinierter Regeln auf die Wortarten und Schlüsselphrasen, wobei die Anzeige des Satzes unter Verwendung der vordefinierten Regeln Umbrüche und Stufen, einschließlich von Einzügen, bereitstellt; und
Ausgeben einer die gestufte Textanordnung einschließenden elektronischen Anzeige des Satzes.

Description

  • PRIORITÄTSBEANSPRUCHUNG
  • Diese Anmeldung beansprucht die Prioritätsrechte an der am 7. April 2020 eingereichten vorläufigen US-Patentanmeldung Nr. 63/006,633 , die in ihrer Gesamtheit durch Bezugnahme hierin eingeschlossen ist.
  • Allgemeiner Stand der Technik
  • Auf den technischen Gebieten der Veröffentlichung von Dokumenten und der Anzeigen von Benutzeroberflächen können verschiedene Strategien verfolgt werden, um eine Ausgabe und ein Format von digitalem Textinhalt auf intelligente Weise zu erzielen. Eine dieser Strategien für die Gestaltung von Dokumenten beinhaltet die Verwendung einer gestuften Textformatierung. Eine gestufte Textformatierung transformiert einen herkömmlichen Blocktext in Stufungsmuster, um Lesern dabei zu helfen, eine grammatikalische Struktur zu erkennen, und ein Leseverständnis zu erhöhen. In einer Studie zeigten Lernende, die für weniger als eine Stunde pro Woche in gestuftem Format formatierte Texte lasen, kleine, aber statistisch bedeutsame Verbesserungen ihrer generellen Beherrschung der englischen Sprache und ihrer Schreibfähigkeiten. Siehe Tate et al, 2019, Visual-Syntactic Text Format: Improving Adolescent Literacy, Visual-Syntactic Text Format: Improving Adolescent Literacy, Journal of Scientific Studies of Reading, Band 23, 2019 - 4. Ausgabe.
  • Ein gestuftes Textformat zielt darauf ab, sowohl eine visuelle als auch eine syntaktische Verarbeitung beim Lesen zu unterstützen. Visuell erfassen die Augen bei jeder Fixation typischerweise nur eine begrenzte Breite von Zeichen in einem Text, und zwar in einem Bereich von etwa 9 bis 15 Zeichen. Aufgrund dieses begrenzten Sichtfelds ist eine Konzentration bei der Verarbeitung erschwert, wenn Lesende versuchen, ihr Sichtfeld beim Lesen in einem homogenen Blocktext quer über die Seite und mehrere Zeilen nach unten zu bewegen. Das gestufte Textanzeigeformat verringert dieses Problem durch: i) Aufbrechen von Text in kürzere, in eine oder zwei Augenfixationsspannen passende Zeilen (zum Beispiel etwa 8 bis 30 Zeichen in Querrichtung); und ii) Verwenden von unterschiedlichen Einzugsmustern, um die Augen von Zeile zu Zeile zu führen.
  • Das gestufte Textformat hilft Lesern außerdem dabei, die syntaktische Struktur eines Satzes zu erkennen. Eine Syntax ist komplexer als eine einfache, aneinandergereihte Abfolge von einer Phrase nach der anderen; sie ist nämlich hierarchisch. Die Fähigkeit des menschlichen Gehirns, Sätze durch den rekursiven Prozess des Verschachtelns von sprachlichen Einheiten mit anderen Einheiten zu bilden, ist ein wesentliches Merkmal, durch das menschlicher Sprache unendlich viele Bedeutungen ausdrücken kann. Wenn das Gehirn eines Lesers die Syntax natürlicher Sprache in schriftlicher Form analysiert, muss es daher mehr tun, als den Satz einfach in eine Abfolge kleinerer Einheiten zu „zerhacken“. Vielmehr muss das Gehirn des Lesers bestimmen, wie jede Phrase innerhalb größerer Phasen- und Teilsatzstrukturen verschachtelt ist und wie jede verschachtelte Phrase zu der größeren, in der sie enthalten ist, in Beziehung steht. Demgemäß wurde dieses Muster einer Stufen-Syntaxanalyse entworfen, um den Leser, der eine bestimmte Phrase betrachtet, in die Lage zu versetzen, gleichzeitig die relativen Einzüge der Phasen darüber und darunter wahrzunehmen. Diese kombinierten visuellen und syntaktischen Wirkungen ermöglichen dem „geistigen Auge“ außerdem, beim Lesen ein größeres und länger bleibendes visuelles Bild des Satzes entstehen zu lassen und zu überprüfen.
  • Ältere Strategien für die Erzeugung von gestuftem Text beinhalten die Verwendung von Regeln, die von Menschen verfasst und niedergeschrieben wurden, wie die Verwendung von manuellen Regeln, die auf eine Identifizierung von Wortarten und von Phrasengrenzen angewendet werden. Auch wenn von Menschen niedergeschriebene Regeln in der Theorie dafür ausgelegt sein mögen, einen großen Bereich von Text- und Syntaxstrukturen abzudecken, stellt der notwendige Aufwand für das Ausarbeiten dieser Regeln ein Skalierbarkeitsproblem dar. Zu Anwendungen, die ein hohes Maß an Skalierbarkeit verlangen, gehört beispielsweise eine Verarbeitung von Text, der aus einer großen Vielfalt von Quellen kommt oder der einen großen Bereich von syntaktischen Formen beinhaltet, auf Abruf oder in Echtzeit. Genauer stellen eine Syntax, die zum ersten Mal in einer gegebenen Sprache auftaucht, oder sogar unterschiedliche Sprachen mit unterschiedlichen Syntaxen Herausforderungen dar. Infolgedessen besteht auf den Gebieten des Digital Publishing, der grafischen Benutzeroberflächen und der dynamischen elektronischen Anzeigen ein Bedarf an neuen Strategien, durch die eine Abhängigkeit von von Menschen niedergeschriebenen oder manuellen Regeln, oder von einer Kontrolle der Umformatierung und Anzeige von Text durch den Menschen überwunden wird.
  • Figurenliste
  • Um eine Identifizierung von erörterten Elementen oder Aktionen zu erleichtern, bezeichnet die Zahl oder bezeichnen die Zahlen mit der größten Bedeutung in einer Bezugszahl die Nummer der Figur, in der dieses Element das erste Mal erscheint.
    • 1 stellt eine Umgebung und ein System für die Vorbereitung von Sätzen eines menschenlesbaren Textes für eine Anzeige in einem gestuften Format gemäß einer Ausführungsform dar.
    • 2 stellt ein Beispiel für eine auf Plug-in basierende hybride Anwendung und Offline-Endbenutzeranwendung für menschenlesbaren Text für eine Anzeige in einem gestuften Format gemäß einer Ausführungsform dar.
    • 3 stellt ein Beispiel für eine Texttransformation zum Anzeigen von Sätzen von menschenlesbarem Text in einem gestuften Format gemäß einer Ausführungsform dar.
    • 4 stellt einen Prozess zum Rendern von Text in einem Stufenformat gemäß einer Ausführungsform dar.
    • 5 stellt einen Prozess zum Trainieren und Verwenden eines Maschinenlernmodells zum Erzeugen eines Stufenformats für menschenlesbaren Text gemäß einer Ausführungsform dar.
    • 6 stellt ein Beispiel für die Erzeugung von gestuftem menschenlesbarem Text anhand von Natural Language Processing bzw. einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar.
    • 7 stellt ein Verfahren zum Erzeugen von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar.
    • 8 stellt ein Beispiel für eine Adaptierung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar.
    • 9 stellt ein Verfahren zum Adaptieren von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar.
    • 10 stellt ein Beispiel für die Erzeugung von gestuftem menschenlesbarem Text aus einem aufgenommenen Bild anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar.
    • 11 stellt ein Verfahren zum Erzeugen von gestuftem menschenlesbarem Text aus einem aufgenommenen Bild anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar.
    • 12 stellt ein Beispiel für eine Umwandlung von menschenlesbarem Text aus einem ersten Anzeigeformat in ein zweites Anzeigeformat in einer über den Augen zu tragenden Vorrichtung anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar.
    • 13 stellt ein Verfahren zur Umwandlung von menschenlesbarem Text aus einem ersten Anzeigeformat in ein zweites Anzeigeformat in einer über den Augen zu tragenden Vorrichtung anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar.
    • 14 stellt ein Beispiel für die Erzeugung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache, während der Text verfasst wird, gemäß einer Ausführungsform dar.
    • 15 stellt ein Verfahren zum Erzeugen von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache, während der Text verfasst wird, gemäß einer Ausführungsform dar.
    • 16 stellt ein Beispiel für den Empfang einer Modifikation an einem Stufenformat gemäß einer Ausführungsform dar.
    • 17 stellt ein Verfahren zum Diagnostizieren eines Gesundheitszustands, der sich auf die Fähigkeit zu lesen auswirkt, gemäß einer Ausführungsform dar.
    • 18 stellt ein Beispiel für eine Personalisierung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar.
    • 19 stellt ein Verfahren für eine Personalisierung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar.
    • 20 stellt ein Beispiel für eine duale Anzeige von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar.
    • 21 stellt ein Verfahren für eine duale Anzeige von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar.
    • 22 stellt ein Beispiel für einen Tiefensuchbaum für die Verarbeitung eines Textes in natürlicher Sprache gemäß einer Ausführungsform dar.
    • 23 stellt ein Beispiel für einen Code in Hypertext Markup Language (HTML), der anhand einer maschinellen Verarbeitung von natürlicher Sprache für gestuften menschenlesbaren Text getaggt wurde, gemäß einer Ausführungsform dar.
    • 24 ist ein Blockdiagramm, das ein Beispiel für eine Maschine darstellt, auf der eine oder mehrere Ausführungsformen implementiert werden können.
  • Ausführliche Beschreibung
  • Wie hierin beschrieben, werden verschiedene Ausführungsformen von computerimplementierten Systemen und Verfahren zum Erzeugen von Anzeigen von gestuftem Text, unter anderem innerhalb von grafischen Benutzeroberflächen, digitalen Veröffentlichungen und Dateien und Ausgaben elektronischer Anzeigen angegeben. Gemäß einer Ausführungsform wird maschinelles Lernen (ML) angewendet, um durch die Analyse von großen Corpora typischer realer Beispiele syntaktische Regeln für die Erzeugung syntaktischer Informationen automatisch zu lernen. Ein ML-Modell oder mehrere solcher Modelle, die in dieser Lernphase erzeugt werden, werden ihrerseits verwendet, um automatisch syntaktische und andere Informationen für ein Segment eines Textes zu erzeugen, das seinerseits ganz oder zum Teil in Kombination mit expliziten Regeln, beispielsweise von Menschen niedergeschriebenen oder manuellen Regeln, zur Erzeugung gestufter Textformate für Blocktext verwendet werden kann.
  • Gemäß einer Ausführungsform können viele verschiedene Klassen von Algorithmen für maschinelles Lernen auf Aufgaben im Rahmen einer maschinellen Verarbeitung von natürlicher Sprache angewendet werden, um die Erzeugung von Anzeigen von gestuftem Text zu unterstützen. Diese Algorithmen nehmen einen großen Satz von aus den Eingangsdaten erzeugten „Merkmalen“, als Eingabe. Manche von den ältesten verwendeten Algorithmen, wie etwa Entscheidungsbäume, haben Systeme von harten Wenn-dann-Regeln hervorgebracht, die den Systemen von von Menschen niedergeschriebenen Regeln ähneln, die zu dieser Zeit üblich waren. Jedoch hat sich die Forschung zunehmend auf statistische Modelle verlegt, die weiche, probabilistische Entscheidungen auf Basis einer Hinzufügung von reellwertigen Gewichtungen zu jedem eingegebenen Merkmal treffen. Solche Modelle haben den Vorteil, dass sie eine relative Sicherheit vieler verschiedener möglicher Antworten statt nur einer einzigen ausdrücken können, wodurch zuverlässigere Ergebnisse hervorgebracht werden, wenn ein solches Modell Teil eines größeren Systems ist. Es versteht sich, dass probabilistische Modelle Zufallsvariablen und Wahrscheinlichkeitsverteilungen in das Modell eines Ereignisses oder Phänomens einbeziehen. Während ein deterministisches Modell ein einziges mögliches Ergebnis für ein Ereignis liefert, liefert ein probabilistisches Modell eine Wahrscheinlichkeitsverteilung als Lösung. Statistische Inferenz ist der Prozess, in dem eine Datenanalyse verwendet wird, um Eigenschaften einer zugrundeliegenden Wahrscheinlichkeitsverteilung abzuleiten. Die Statistik führt Populationsinferenzen anhand einer Stichprobe durch, und maschinelles Lernen findet generalisierbare prädiktive Muster.
  • Gemäß einer Ausführungsform bietet ein hierin offenbartes System, das Algorithmen und Modelle für maschinelles Lernen verwendet, wenn es im Rahmen von Electronic Publishing und Anzeigemedien angewendet wird, zahlreiche technische Vorteile gegenüber Lösungen, die in erster Linie auf von Menschen niedergeschriebenen Regeln beruhen. Zum Beispiel konzentrieren sich die Lernabläufe, die während des maschinellen Lernens verwendet werden, automatisch auf die häufigsten Fälle, während es einem Menschen beim Niederschreiben von Regeln häufig überhaupt nicht klar ist, worauf er seine Bemühungen abstellen sollte. Außerdem können die automatischen Lernabläufe statistische Inferenzalgorithmen nutzen, um Modelle hervorzubringen, die robust genug sind, um ungewohnte Eingaben aus einem Textstrom zu bewältigen (der z.B. davor noch nicht aufgetauchte Wörter oder Strukturen enthält), und um fehlerhafte Eingaben aus einem Textstrom (z.B. mit falsch geschriebenen Wörtern oder versehentlichen Auslassungen von Wörtern) zu bewältigen. Im Allgemeinen ist ein eleganter Umgang mit solchen Eingaben anhand von niedergeschriebenen Regeln oder, allgemeiner, ist die Schaffung von Systemen aus niedergeschriebenen Regeln, die weiche Entscheidungen treffen, äußerst schwierig, fehleranfällig und zeitaufwändig.
  • Gemäß einer beispielhaften Ausführungsform führt ein Parser für NLP (Natural Language Processing bzw. maschinelle Verarbeitung von natürlicher Sprache), der ein Paradigma für maschinelles Lernen verwendet, eine oder mehrere der folgenden Funktionen an Eingabetext durch, etwa an Text, der in einem Textstrom bereitgestellt wird: Syntaxanalyse, Extraktion von Tokens und Sätzen, Identifizierung von Wortarten, Identifizierung von Schlüsselphrasen und Erstellen von Abhängigkeits-Parse-Bäumen für jeden Satz. Andere angegebene Textanalysefähigkeiten, die auf ML basieren, schließen ein: Sentimentanalyse, Entitäts- bzw. Eigennamenerkennung (z.B. von Menschen, Orten, benutzerdefinierten Entitäten), Topic Modeling, Spracherkennung, Übersetzung und Unterstützung für Fachterminologie, wie etwa für medizinische Begriffe (wie dies z.B. von dem Comprehend®-Merkmal von Amazon Web Services (AWS) bereitgestellt wird). Diese Engines schließen ferner Mehrsprachen-Fähigkeiten zum Analysieren von Text in mehreren Sprachen ein.
  • Gemäß einer beispielhaften Ausführungsform schließen von dem auf ML basierenden NLP-Parser durchgeführte Aufgaben im Rahmen einer maschinellen Verarbeitung von natürlicher Sprache ein: 1) Grammatikinduktion, um eine formelle Grammatik zur Beschreibung der Syntax einer Sprache zu erzeugen; 2) Lemmatisierung, um nur Flexionsendungen zu entfernen und die wörterbuchgerechte Grundform eines Wortes zurückzugeben, die auch als Lemma bezeichnet wird; 3) morphologische Segmentierung zum Trennen von Wörtern in einzelne Morpheme und zum Identifizieren der Klasse der Morpheme; 4) Wortart-Tagging, um aus einem Satz die Wortart (Part of Speech, POS) für jedes Wort zu bestimmen; 5) Parsing bzw. Syntaxanalyse, um den Parse-Baum (die grammatische Analyse) eines bestimmten Satzes zu bestimmen; 6) Satzumbrüche (auch als Satzgrenzendisambiguierung bezeichnet), um in einem Textstück die Satzgrenzen zu finden; 7) Stemming, um flektierte (oder manchmal derivatisierte) Wörter auf ihre Stammform zu reduzieren; 8) Wortsegmentierung, um ein Stück zusammenhängenden Textes in separate Wörter aufzuteilen; 9) Terminologieextraktion, um relevante Begriffe aus einem gegebenen Corpus automatisch zu extrahieren; 10) Semantik, um die berechnete Bedeutung einzelner Wörter im Kontext zu bestimmen; 11) maschinelle Übersetzung, um Text aus einer menschlichen Sprache automatisch in eine andere zu übersetzen; 12) Erzeugung natürlicher Sprache, um Informationen aus Computerdatenbänken oder semantische Absichten in lesbare menschliche Sprache umzuwandeln; 13) Natural Language Understanding bzw. natürlich-sprachliches Verstehen, um Textstücke in formellere Darstellungen umzuwandeln, wie etwa in logische Strukturen erster Ordnung, die für Computerprogramme einfacher zu manipulieren sind.
  • Gemäß einer Ausführungsform ist der ML-basierte NLP-Parser anwendungsspezifisch. Gemäß einer anderen beispielhaften Ausführungsform ist der ML-basierte NLP-Parser einer, der im Handel von Amazon, Inc., Google, Inc., Stanford (CoreNLP) erhältlich ist, oder irgendein anderer ML-basierter Parser, der derzeit erhältlich ist oder in Zukunft erhältlich sein wird und der die hierin genannte Parsing-Funktionalität bietet, um die verschiedenen beispielhaften Ausführungsformen zu unterstützen. Ferner schließt der Begriff „ML-basiert“, wie hierin verwendet, jede Anwendung von künstlicher Intelligenz (KI) ein, die Systemen die Fähigkeit verleiht, automatisch zu lernen und sich aufgrund von Erfahrungen zu verbessern, ohne explizit programmiert werden zu müssen. Beispiele für ML-basierte Algorithmen sind, ohne Beschränkung auf die hierin abgedeckten, Algorithmen für überwachtes maschinelles Lernen, Algorithmen für nicht-überwachtes maschinelles Lernen, Algorithmen für semi-überwachtes maschinelles Lernen und Algorithmen für bestärkendes maschinelles Lernen. Modelle, die in den ML-basierten Parsern verwendet werden können, schließen künstliche neuronale Netze ein, wie rekurrente neuronale Netze, Entscheidungsbäume, Support Vector Maschines, Regressionsanalyse, Bayes'sche Netze, genetische Algorithmen und andere.
  • Gemäß einer beispielhaften Ausführungsform verwendet eine hierin beschriebene Engine einen ML-basierten NLP-Parser als Vorläufer/Eingabe in einen Stufentextformatierungsprozess. Der ML-basierte NLP-Parser erschafft „getaggten“ digitalen Text, der die Wortarten und Schlüsselphrasen in einem Satz definiert. Dieser getaggte Text wird verwendet, um durch Anwenden von nachstehend beschriebenen Anzeigeregeln auf eine durch das NLP-Parsing identifizierte Wortart die Textstufung zu entwickeln. Gemäß einer Ausführungsform liegt ein Schwerpunkt der Engine auf den von dem NLP-Parser in dem Regelprozess definierten Wortarten und Schlüsselphrasen, so dass von den bereitgestellten und auf die NLP-Ausgabe angewendeten Regeln die richtigen Satzumbrüche und die richtige Stufung einschließlich von Einzügen definiert werden.
  • Gemäß einer anderen beispielhaften Ausführungsform kann ein System zur Bereitstellung von Anzeigen von gestuftem Text über einen mit einer Cloud verbundenen Dienst eingesetzt werden, wobei dieser in einem Online-Modus, in einem Offline-Modus, der als Endanwendung angeboten wird, die auf einer Endpunktvorrichtung eines Benutzers liegt und die ohne eine Verbindung mit einem Wide-Area-Network (z.B. dem Internet) funktioniert, oder in einer Kombination von sowohl Online- als auch Offline-Modus betrieben werden kann. Wie hierin verwendet, ist ein mit einer Cloud verbundener Dienst ein Dienst, der über eine Cloud-Rechnerplattform geleistet, angeboten oder verbreitet wird, wobei diese Folgendes einschließen oder mit Folgendem betriebsmäßig verbunden sein kann: mit einem Front-End-Client, der auf einem Endbenutzer-Rechnersystem (z.B. einem Desktop-Computer, einem Laptop-Computer, einer mobilen Vorrichtung, einer Tablet-Vorrichtung, einer digitalen Brille, digitalen Kontaktlinsen, einem Fernseher usw.) arbeitet, mit Backend-Diensten (z.B. Servern, Speichervorrichtungen usw.), mit einem Cloudbasierten Leistungserbringungssystem (einer Cloud-fähigen Website, einem Rechner-Cluster usw.) und mit ein Netz (z.B. dem Internet, einem privaten Netz, einem Mobilfunknetz, einem drahtlosen Netz usw.). Eine Cloud-Rechnerplattform kann eine Reihe von über eine Cloud erbrachten Diensten bereitstellen, einschließlich von Software als Dienstleistung (Software as a Service, SaaS), Daten als Dienstleistung (Data as a Service, DaaS) einer Plattform als Dienstleistung (Platform as a Service, PaaS) und Infrastruktur als Dienstleistung (Infrastructure as a Service, laaS), die eine Reihe verschiedener Dienste bereitstellen, die herkömmlicherweise von On-premise-Hardware und von Software, die auf einem lokalen Netz eines Endbenutzers liegt, ermöglicht werden.
  • Gemäß einer beispielhaften Ausführungsform stellt ein Online-Modus des Cloud-Dienstes eine Reihe von Diensten bereit, die sich unter Verwendung einer Cloud-Infrastruktur über APIs miteinander verbinden. Solche APIs können zur Leistungserbringung verwendet werden.
  • Gemäß einer beispielhaften Ausführungsform empfängt ein Cloud-Dienst, der ein Tagging von Stufentext bereitstellt, Text, der aus einer Veröffentlichungsquelle (zum Beispiel einem Online- oder Offline-Publisher, einem Magazin, einer Zeitung, einem Buch, einem Autor, einer Intra- oder Internetquelle) eingegeben wird, taggt den Text mit Anzeigeparametern, und der getaggte Text wird an einem Client-System eines Betrachters, der ein Endbenutzer ist, bereitgestellt. In einer anderen beispielhaften Ausführungsform sendet ein Publisher Text an ein Client-System eines Lesers, der ein Endbenutzer ist, das Client-System sendet den Text an den Cloud-Dienst, der wiederum den getaggten Text an das Client-System des Lesers zurückschickt.
  • Gemäß einer anderen beispielhaften Ausführungsform werden ML-Engines, -Verfahren und -Metriken zum Modifizieren von Stufungsregeln angegeben.
  • Gemäß einer anderen beispielhaften Ausführungsform wird ein Benutzerprofilspeicher angegeben, der eine für Datenschutz und HIPPA-Konformität anonymisierte ID, Benutzereingabedeskriptoren (Sprache, Demographie, Kontaktinformationen), Leistungsmetrik und Fortschrittsnachverfolgung einschließt. In anderen alternativen Ausführungsformen werden andere Datenschutzsysteme verwendet, zum Beispiel zum Schutz der Privatsphäre von Kindern unter Verwendung der hierin beschriebenen Systeme und Verfahren.
  • Gemäß einer anderen Ausführungsform wird ein Zugriff auf gespeicherten Inhalt, einschließlich auf Metriken der Frequenz, Nutzungszeit, Attribute (Belletristik, Sachbuch, Forschungstext, Poesie usw.), angegeben.
  • Gemäß einer anderen Ausführungsform wird eine Versionsverwaltung und Aktualisierung etwaiger Endbenutzeranwendungen angegeben.
  • Gemäß einer anderen Ausführungsform wird eine Stufungstechnik erzeugt wie hierin beschrieben.
  • Gemäß einer anderen Ausführungsform arbeitet eine Endpunktanwendung in einem Offline-Modus, in dem eine oder mehrere von den Stufungsfunktionen auf der Endpunkt-/Benutzervorrichtung liegen können, wobei ein Benutzer gestuften Text empfangen kann, ohne dass ein Internetzugang notwendig ist.
  • Gemäß einer anderen beispielhaften Ausführungsform wird eine Fähigkeit zur kontinuierlichen Verbesserung von ML angegeben, mit der Regeln zum Stufen von Text anhand von aktiven und passiven Verfahren mit ihrer Nutzung durch maschinelles Lernen besser werden.
  • Gemäß einer anderen Ausführungsform schließen Verfahren zum Eingeben/Ausgeben (I/O) von Text optische Zeichenerkennung (OCR), am Körper tragbare Appliances wie Google Glasses® oder intelligente Kontaktlinsen ein.
  • Gemäß einer anderen beispielhaften Ausführungsform wird ein Werkzeug zum Entwerfen/Verfassen von Text zum Verfassen von Text und zum Anzeigen des verfassten Textes in einem Stufenformat angegeben.
  • Gemäß einer noch anderen beispielhaften Ausführungsform werden Systeme und Verfahren zum Diagnostizieren kognitiver Störungen angegeben.
  • Gemäß einer anderen beispielhaften Ausführungsform wird eine personalisierte/kontextabhängige Formatierung angegeben, die einen personalisierten Algorithmus bereitstellt, der für ein Individuum einzigartig ist, um eine Formatierung bereitzustellen, die für jeden Benutzer und die Präferenzen des Benutzers personalisiert und/oder für eine möglichst gute Verständlichkeit optimiert ist.
  • Gemäß einer anderen beispielhaften Ausführungsform werden Leseprofile angegeben, durch die die Stufenformatierung auf Basis von Leserkontext, wie etwa Lesegeschwindigkeit, Helligkeitsgraden, Uhrzeit, Manipulation durch den Benutzer usw. modifiziert wird.
  • Gemäß einer noch anderen beispielhaften Ausführungsform ein Leseverständnis-Score (Reading Comprehension Score, RCS), der verwendet wird, um eine Lesefähigkeit eines Benutzers einzustufen und zu messen.
  • Gemäß einer noch anderen beispielhaften Ausführungsform wird eine Bibliothek von publizierten Inhalten angegeben, die unter Verwendung von gestuftem Text formatiert wurden.
  • Gemäß einer noch anderen beispielhaften Ausführungsform stellt die hierin beschriebene Fähigkeit zum Anzeigen von gestuftem Text gestuften Text in anderen Sprachen als Englisch, einschließlich aller Hauptsprachen, bereit. Genauer gesagt sind die Ausführungsformen hierin nicht auf die Verwendung mit englischem Text beschränkt, auch wenn beispielhafte Ausführungsformen angegeben werden, die eine Verwendung für die Anzeige von englischem Text zeigen, sondern sind vielmehr auf alle Sprachen anwendbar.
  • Gemäß einer noch anderen beispielhaften Ausführungsform wird eine Stimmausgabe in eine visuelle Anzeige im Stufenformat integriert, so dass, während man einen gestuften Text liest, derselbe Text auch vorgelesen wird, und zwar mit einer Geschwindigkeit, die so regelbar ist, dass sie zu der Geschwindigkeit des individuellen Lesers passt.
  • 1 stellt eine Umgebung 100 und ein System 105 für die Vorbereitung von Sätzen eines menschenlesbaren Textes zur Anzeige in einem gestuften Format gemäß einer Ausführungsform dar. Die Umgebung kann das System 105 einschließen, das ein Cloud-basiertes Leistungserbringungssystem sein kann. Das System kann auf eine Reihe verschiedener Backend-Systeme 110 verteilt sein, die für einen Anbieter von Cloud-Diensten, der das System 105 hostet, Infrastrukturdienste wie eine Rechenkapazität und Speicherkapazität bereitstellen. Das System 105 kann kommunikationsmäßig mit einem Netz 120 (z.B. dem Internet, einem privaten Netz, einem öffentlichen Netz usw.) gekoppelt sein (z.B. über ein drahtgebundenes Netz, ein Mobilfunknetz, einen gemeinsamen Bus usw.). Eine Endbenutzerrechenvorrichtung 115 kann kommunikationsmäßig mit dem Netz verbunden sein und kann eine Verbindung mit dem System 105 einrichten. Die Endbenutzervorrichtung kann über einen Web-Browser, eine heruntergeladene Anwendung, eine On-Demand-Anwendung usw. mit dem System 105 kommunizieren. In einem Beispiel können Komponenten des Systems über eine installierte Anwendung, die einen Offline-Zugriff auf Merkmale des Systems 105 bereitstellt, für die Bereitstellung an der Endbenutzer-Rechenvorrichtung 115 vorbereitet werden.
  • Das System 105 kann eine direkte Online-Verbindung über die Endbenutzerrechenvorrichtung 115 bereitstellen, kann einen Satz von gebündelten Diensten für eine Endbenutzeranwendung auf die Endbenutzerrechenvorrichtung 115 übertragen, die Offline, ohne Internetverbindung, und hybrid mit einer Endbenutzeranwendung, die sich über das Internet mit dem Cloud-Dienst verbindet (z.B. über ein Plug-in usw.), arbeitet. 2 stellt ein Beispiel 200 für eine auf Plug-in basierende hybride Anwendung 205 und eine Offline-Endbenutzeranwendung 215 für die Anzeige von menschenlesbarem Text in einem gestuften Format gemäß einer Ausführungsform dar. Die auf Plug-in basierende hybride Anwendung 205 und die Offline-Endbenutzeranwendung 215 können über das Netz 120 mit dem System 105 verbunden sein. Eine Modusschaltfläche 210 kann bereitgestellt sein, um dem Benutzer zu ermöglichen, Stufenmodi zu ändern (z.B. Aus, Ein, Lernen, Diagnose, Bearbeiten usw.). Obwohl die Modusschaltfläche in der auf einem Plug-in basierenden hybriden Anwendung 205 gezeigt ist, kann sie auch in einer Online-Anwendung und in der Offline-Endbenutzeranwendung 215 bereitgestellt sein. Die Endbenutzeranwendung kann einen Offline-Betrieb ermöglichen, und Stufungsfunktionen können in einer Anwendung liegen, die an der Endbenutzerrechenvorrichtung 220 ausgeführt wird, so dass ein Benutzer gestuften Text ohne Internetzugang produzieren kann. Auch wenn der Benutzer den Dienst im Offline-Modus verwenden kann, können Aktivität und Benutzerentscheidungen protokolliert werden, die, wenn eine Internetverbindung verfügbar ist, periodisch in das System 105 hochgeladen werden können.
  • Betrachtet man erneut die Beschreibung von 1, so kann der Versionsverwaltungsdienst 155 Anwendungsversionen nachverfolgen und kann periodische Aktualisierungen für die tragbaren Komponenten bereitstellen, die für die an der Endbenutzer-Rechenvorrichtung 115 ausgeführte Anwendung bereitgestellt werden, wenn diese mit dem Internet verbunden ist. Ein Hybridmodus ermöglicht dem Benutzer, unabhängig von einer Konnektivität im Stufenformat zu lesen, stellt aber trotzdem Daten zur Verbesserung des Systems 105 bereit. Die Endbenutzeranwendung kann in einer Reihe von Formen eingesetzt werden. Zum Beispiel können ein Browser-Plug-in und Erweiterungen Benutzer in die Lage versetzen, die Formatierung des Textes, den sie im Web und in Anwendungen lesen, unter Verwendung des Stufungsformats zu ändern. In einem anderen Beispiel kann die Endbenutzeranwendung in eine Menüleiste, eine Zwischenablage oder einen Texteditor integriert sein, so dass, wenn ein Benutzer Text unter Verwendung einer Maus oder von Hotkeys hervorhebt, ein Fenster präsentiert werden kann, in dem ausgewählter Text unter Verwendung des Stufenformats gerendert wird. In einem anderen Beispiel kann die Endbenutzeranwendung ein Portable-Document-File(PDF)-Reader sein, der eine PDF-Datei als Eingabequelle eingeben kann und das Stufenformat ausgeben kann, um es dem Benutzer anzuzeigen. In einem noch anderen Beispiel kann die Endbenutzeranwendung ein Augmented Image Enhancement sein, das eine Live-Ansicht von einer Kamera übersetzt und eine optische Zeichenerkennung (OCR) anwenden kann, um das Bild in Text umzuwandeln und das Layout in Echtzeit im Stufenformat zu rendern.
  • OCR-Fähigkeiten können den Benutzer in die Lage versetzen, ein Bild von Text über eine Kamera (z.B. auf ihrem Telefon usw.) aufzunehmen und es sofort in den stufig formatierten Text umzuwandeln. Dies kann auch über eine vom Benutzer am Körper getragene Vorrichtung stattfinden, wie etwa über eine intelligente Brille, intelligente Kontaktlinsen und dergleichen, wo eine Eingabe von Text, den der Benutzer sieht, für eine bessere Verständlichkeit in ein gestuftes Format umgewandelt wird. Auf diese Weise kann der Text durch ein persönliches Sichtgerät des Benutzers in Echtzeit umgewandelt werden. Eine Augmented-Video(AV)-, Augmented-Reality(AR)- und Virtual-Reality(VR)-Anwendung der Stufenformatierung kann mit vom Benutzer am Körper getragenen visuellen Anzeigevorrichtungen, einschließlich von AV- und VR-Headsets, -Brillen und -Kontaktlinsen durchgeführt werden, damit es dem Benutzer möglich ist, Text in dem Stufenformat zu sehen. Die hierin erörterten Systeme und Techniken sind auf eine Reihe verschiedener Umgebungen anwendbar, wo Text durch Verarbeiten des Textes und Umwandeln des Textes in eine Stufenformatierung auf einer Vorrichtung gerendert wird. Eine Anzeige von Text auf einem Bildschirm erfordert Rendering-Anweisungen, und der Stufenanweisungssatz kann in die Befehlssequenz eingefügt werden. Dies kann für einen Dokumententyp (z.B. PDF usw.) und für Systeme gelten, in die eine Rendering-Engine eingebettet ist, wo der Aufruf der Rendering-Engine abgefangen werden kann und die Anweisungen zum gestuften Formatieren eingefügt werden können.
  • In einem Beispiel kann eine parallele Anzeige des Ausgangstexts und des stufig formatierten Textes über zwei Bildschirme oder einen geteilten Bildschirm in einer parallelen Präsentation präsentiert werden. Zum Beispiel kann originaler Ausgangstext auf einem Bildschirm angezeigt werden, und der Stufentext wird parallel dazu auf einem zweiten Bildschirm angezeigt und kann synchronisiert werden, so dass, wenn ein Benutzer eine der Anzeigen scrollt, beide synchron bleiben. Dies kann für Lernzwecke genutzt werden, um Syntax, Schlüsselphrasen und Wortarten hervorzuheben oder um eine „leichter verständliche Ansicht“ zu präsentieren, die wie ein Röntgenbild eines Textes ist, das die dem Text zugrundeliegende Struktur anzeigt. Zum Beispiel können Schlüsselphrasen fett oder nicht fett dargestellt werden, Verben können farbig oder fett dargestellt werden usw., um die zugrundeliegende Struktur hervorzuheben.
  • In einem Beispiel kann eine duale Stufenanzeigenanordnung bereitgestellt werden. Zum Beispiel kann eine stufig formatierte Textstelle in einem Fenster des Bildschirms angezeigt werden, während eine Übersetzung der Textstelle in eine andere Sprache in gestuftem Format in einem zweiten Fenster des Bildschirms präsentiert werden kann. In einem anderen Beispiel können Blocktext auf einer Seite und stufig formatierter Text auf der anderen Seite einer dualen Anzeige angezeigt werden. In einem noch anderen Beispiel wird ein Scrollen eines geteilten Bildschirms angegeben, und Block und Stufen und/oder Sprachen können auf verschiedenen Seiten des Bildschirms oder auf verschiedenen Anzeigen einer dualen Anzeigenkonfiguration angezeigt werden. Duale Bildschirme können einem Benutzer ermöglichen, in der anderen Ansicht nachzusehen, um ihm dabei zu helfen, schwierige Textstellen zu verstehen.
  • Das System 105 kann eine Reihe verschiedener Dienstkomponenten einschließen, die ganz oder teilweise an verschiedenen Rechenvorrichtungen der Backend-Systeme 110 ausgeführt werden können, einschließlich eines Text-Rendering-Dienstes 125, eines Dienstes 130 zur maschinellen Verarbeitung von natürlicher Sprache (NLP), eines Dienstes 135 für maschinelles Lernen, eines Analysedienstes 140, eines Benutzerprofildienstes 145, eines Zugriffskontrolldienstes 150 und eines Versionsverwaltungsdienstes 155. Der Text-Rendering-Dienst 125, der Dienst 130 zur maschinellen Verarbeitung von natürlicher Sprache (NLP), der Dienst 135 für maschinelles Lernen, der Analysedienst 140, der Benutzerprofildienst 145, der Zugriffskontrolldienst 150 und der Versionsverwaltungsdienst 155 können Anweisungen beinhalten, einschließlich von Anweisungen für eine Schnittstelle zum Programmieren von Anwendungen (Application Programming Interfaces, APIs), die eine Dateneingabe von und in externe(n) Systeme(n) und zwischen den anderen Diensten bereitstellen können.
  • Das System 105 kann in einer Reihe verschiedener Modi operieren: ein Endbenutzer (z.B. ein Reader usw.) wandelt Text an einem lokalen Client um, wofür er einen lokalen Client nutzt, der über eine Kopie von Offline-Komponenten verfügt, um gestuften Text zu erzeugen, der Endbenutzer kann Text an das System 105 senden, um Standardtext in gestuften Text umzuwandeln, ein Publisher kann Text an das System 105 senden, um seinen Text in ein gestuftes Format umzuwandeln, der Publisher kann einen Offline-Komponentensatz des Systems 105 verwenden, um seinen Text in ein Stufenformat umzuwandeln, und der Publisher kann unter Verwendung des Systems 105 Text in herkömmlicher Blockformatierung oder gestufter Formatierung veröffentlichen.
  • Der Text-Rendering-Dienst 125 kann eine Texteingabe empfangen und kann den Text an den Parser des NLP-Dienstes 130 weiterleiten, um für den Text Tags zur Bezeichnung von Wortarten und Schlüsselphrasen zu erzeugen. Zum Beispiel kann eine Syntaxanalyse (z.B. durch GOOGLE®, AMAZON®, Python libraries nltk und spaCy usw.) für einen gegebenen Text eine Aufschlüsselung von Wörtern mit einem umfangreichen Satz von linguistischen Informationen für jedes Token liefern. Die Informationen können in zwei Teile geteilt werden:
  • Wortart: Dieser Teil enthält Informationen über die Morphologie jedes Tokens. Für jedes Wort erhält man eine tiefgehende Analyse, die dessen Typ (z.B. Nomen, Verb usw.), Genus, Casus, Tempus, grammatikalischen Modus, Diathese und noch viel mehr enthält. Als Beispiel ist für den eingegebenen Satz „A computer once beat me at chess, but it was no match for me at kickboxing.“ (Emo Philips) die Part-of-Speech-Analyse in Tabelle 1 gezeigt. Tabelle 1
    A Tag: DET
    ‚computer‘ Tag: NOMEN Numerus: SINGULAR
    ‚once‘ Tag: ADV
    ‚beat‘ Tag: VERB Modus: INDIKATIV Tempus: VERGANGENHEIT
    ‚me‘ Tag: PRON Casus: AKKUSATIV Numerus: SINGULAR Person: ERSTE
    at Tag: ADP
    ‚chess‘ Tag: NOMEN Numerus: SINGULAR
    ‚,‘ Tag: SATZZEICHEN
    ‚but‘ Tag: KONJ
    ‚it‘ Tag: PRON Casus: NOMINATIV Genus: NEUTER Numerus: SINGULAR Person: DRITTE
    ‚was‘ Tag: VERB Modus: INDIKATIV Numerus: SINGULAR Person: DRITTE Tempus: VERGANGENHEIT
    ‚no‘ Tag: DET
    ‚match‘ Tag: NOMEN Numerus: SINGULAR
    ‚for‘ Tag: ADP
    ‚kick‘ Tag: NOMEN Numerus: SINGULAR
    ‚boxing‘ Tag: NOMEN Numerus: SINGULAR
    ‚.‘ Tag: SATZZEICHEN
  • Abhängigkeitsbäume: Der zweite Teil der Antwort wird als Abhängigkeitsbaum bezeichnet, von dem die syntaktische Struktur jedes Satzes beschrieben wird. Ein Diagramm eines berühmten Kennedy-Zitats zeigt einen solchen Abhängigkeitsbaum in 22. Für jedes Wort geben die Pfeile an, welche Wörter von ihm modifiziert werden. Die obige Analyse kann mit sehr wenigen Codezeilen erhalten werden. Außer Englisch kann die syntaktische Analyse eine Reihe zusätzlicher Sprachen unterstützen: Chinesisch (vereinfacht), Chinesisch (traditionell), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Russisch und Spanisch.
  • Gemäß einem Ausführungsbeispiel werden die Wortarten und Schlüsselphrasen getaggt. Beispiele für Tagging-Techniken sind eine Modifikation von Style Sheets oder das Versenden eines Stufenformat-Style-Sheet, das die getaggten Schlüsselphrasen einschließt, um es mit anzuwendenden Stufenformatierungsregeln abzugleichen. In einer anderen beispielhaften Ausführungsform kann ein Textabruf interzeptioniert und in gestuftem Format gerendert werden. In einer anderen beispielhaften Ausführungsform wird Text im Format American Standard Code for Information Interchange (ASCII) produziert und auf Basis der Stufenformatierungsregeln angezeigt. In einer anderen beispielhaften Ausführungsform wird eine Datei in Extensible Markup Language (XML) für den Text erzeugt, und XML-Tags werden für die Wortarten und Schlüsselphrasen vergeben, die zum Abrufen anwendbarer Stufenformatierungsregeln verwendet werden können, um den Text im gestuften Format in einer Textverarbeitungsanwendung, einem Web-Browser oder einer anderen Anwendung anzuzeigen. Dann kann ein universeller Basistextcode über den verschiedenen Techniken verwendet werden, so dass Umbruchpunkte und Einzüge, die in den Stufenformatierungsregeln enthalten sind, einheitlich angewendet werden können, um eine plattformübergreifende standardisierte gestufte Anzeige zu schaffen.
  • Der Dienst 125 zum Rendern von Text kann Stufenformatierungsregeln und -algorithmen zum Verarbeiten der Texteingaben verwenden. 3 stellt ein Beispiel für eine Texttransformation 300 zum Anzeigen von Sätzen von menschenlesbarem Text in einem gestuften Format gemäß einer Ausführungsform dar. Ein Browser-Fenster 305 kann ein Plug-in 310, das mit dem System 105 verbunden ist, und eine Stufenmodusschaltfläche 315 aufweisen, wenn der Stufenmodus ausgeschaltet ist, kann Standardtext 320 angezeigt werden, wenn ein Benutzer Text auf einer Website betrachtet. Wenn der Stufenmodus eingeschaltet ist, kann der Text im Stufenformat 325 formatiert und angezeigt werden.
  • 4 stellt einen Prozess 400 zum Rendern von Text in einem Stufenformat gemäß einer Ausführungsform dar. In dem Prozess 400 kann eine Variable Max_Line definiert werden (z.B. 40 Zeichen, usw.). Eine KeyPhrase-Zählwertvariable kann gepflegt werden, um eine Anzahl von Schlüsselphrasen zu zählen, die in dem Satz identifiziert werden. Für jeden Satz (der z.B. anhand eines Punktes am Ende eines Satzes usw. definiert wird) kann ein NLP-Prozessor aufgerufen werden (z.B. der NLP-Dienst 130, wie in 1 beschrieben, mit einem API-Aufruf an AMAZON® Comprehend, GOOGLE® Natural Language, MICROSOFT® Text Analytics usw.), und für Schlüsselphrasen und Syntax kann eine Zeichenkette abgerufen werden (z.B. JSON string usw.). In einer beispielhaften Ausführungsform werden die Zeichenketten in einer zu evaluierenden Datenstruktur gespeichert. Es kann ein Token des Satzes gelesen werden. Wenn das letzte Zeichen des Tokens ein „,“ ist, kann die Zeile nach dem Token mit einer Einzugsregel für eine Satzfortsetzung umgebrochen werden, wenn das letzte Zeichen ein anderes Satzzeichen als „,“ ist, kann die Zeile nach dem Token mit einer Einzugsregel für einen Nebensatz umgebrochen werden, wenn ein Wortart-Tag für das Token eine unterordnende Konjunktion (z.B. SCONJ usw.) oder und eine Adposition ist (z.B. ADP usw.), dann kann die Zeile nach dem Satz mit einem Einzug für eine Konstituentenregel umgebrochen werden, wenn der KeyPhrase-Zählwert = 2, kann die Zeile am nächsten Token umgebrochen werden. Der Prozess 400 kann fortgesetzt werden, wenn eine Variable EndOffset kleiner ist als die Variable Max_Line. Wenn die Variable Max_Line erreicht wird: wenn es sich bei dem Token um eine der Schlüsselphrasen handelt und der KeyPhrase-Zählwert < 2, kann das Token in die Zeile geschrieben werden und die Zeile kann mit der Satzfortsetzungsregel umgebrochen werden und die KeyPhrase-Zählwertvariable der Zeile kann inkrementiert werden. Die Länge des Tokens kann durch 2 geteilt werden. Wenn das Ergebnis (z.B. die Hälfte der Tokenlänge) innerhalb von Max_Line +3 liegt, kann das Token in der aktuellen Zeile fortgesetzt werden, andernfalls kann in der Zeile zurückgegangen werden und die Zeile kann vor dem Token mit der Satzfortsetzungsregel umgebrochen werden. Für jeden Satz kann jede Schlüsselphrase aus dem Array (z.B. einem JSON-Array usw.) hervorgehoben werden. Die Satzfortsetzungsregel kann definieren, dass der erste Zeilenumbruch des Satzes bei BeginOffset = 4 erfolgt und die Einzüge an BeginOffset + 1 ab der Zeile darüber und der folgenden Zeile liegen. Die Konstituenteneinzugsregel kann definieren, dass ein Token an dem letzten vorangehenden Einzug für eine unterordnende Konjunktion oder Adposition ausgerichtet wird. Die Nebensatzeinzugsregel kann definieren, dass BeginOffset = 3.
  • In einem Beispiel wird, nachdem Text verarbeitet wurde und Zeilenumbrüche und Einzüge für das gewünschte gestufte Textformat bestimmt wurden, das erforderliche Satzzeichen-Tagging in einem oder mehreren Formaten hinzugefügt, die auf die gewünschte Anzeigeanwendung anwendbar sind, wie Word®, Hypertext Markup Language (HTML), Kindle® oder anderen. In einem Beispiel wird für eine HTML-formatierte Datei das HTML-Zeilenumbruch-Tag <br> verwendet, um jede Zeile des angezeigten gestuften Textes umzubrechen. In einem ersten Einzugsbeispiel wird ein Einzug anhand von Folgendem erreicht: <p style=„margin-left: 40px“>Dieser Text wird eingerückt.</p>. In diesem ersten Beispiel wird der Text in dem Absatz-Tag um 40 Pixel von links eingerückt. Alle anderen Absatz-Tags werden nicht eingerückt. In einem anderen Beispiel wird ein Einzug anhand von Folgendem erreicht: <p style=„text-indent: 40px“>Dieser Text wird eingerückt.</p>. In einem zweiten Einzugsbeispiel wird nur die erste Textzeile in dem Absatz um 40 Pixel von links eingerückt. Alle weiteren Textzeilen in dem Absatz werden nicht eingerückt.
  • In einem anderen Beispiel wird ein gestufter Gestaltungsbogen (Cascading Style Sheet, CSS) verwendet, um einen Einzug für den verarbeiteten Text zu spezifizieren. (Man beachte, dass der Begriff „gestuft“ in dem Ausdruck „gestufter Gestaltungsbogen“ nicht mit der Verwendung von „gestuftes Textformat“, wie hierin verwendet, in Beziehung steht). In einem Beispiel wird der CSS zwischen den <head></head>-HTML-Tags in einem HTML-Dokument platziert. Das folgende Beispiel erschafft eine Style-Klasse mit der Bezeichnung „Tab“, die den Text und den Absatz um 40 Pixel von links einzieht.
        <style type="text/css">



        <!--

         .tab { margin-left: 40px; }

        --> 

        </style>
  • Wenn sich der obige Code im Abschnitt <head> befindet, wird er verwendet, indem er zu Absatz-Tags (<p>) hinzugefügt wird, wie gezeigt: <p class=„tab“>Beispiel für einen Tab</p> Alternativ oder zusätzlich dazu wird in einem anderen Beispiel CSS-Code in einer separaten Datei, mit der Endung .css, platziert. Diese Datei wird mit von dem HTML-Dokument verknüpft, und dieses Dokument kann diese CSS-Eigenschaften verwenden. Die Verwendung einer externen CSS-Datei ermöglicht eine Modifizierung des CSS unabhängig von dem HTML-Dokument. Zum Beispiel wird die externe CSS-Datei durch Hinzufügen der folgenden Zeile in dem HTML-Dokument in dem Element <head> (nach dem <head>-Tag und vor dem </head>-Tag) mit dem HTML-Dokument verknüpft. Demgemäß können die gewünschten Einzüge unter Verwendung des <p class=„tab“>-Beispiels eingefügt werden.
  • In einem anderen Beispiel können Einzüge proportional statt statisch sein. Zum Beispiel wird anstelle des Einrückens um 40 px (Pixel) der Einzug durch eine Prozentangabe, beispielsweise 5 %, ersetzt, um Text um 5 % des maximalen Zeilenwerts einzurücken. In einem anderen Beispiel wird durch Ändern von margin-left in margin-right ein Linkseinzug in einen Rechtseinzug geändert.
  • In einem noch anderen Beispiel werden Einzüge und Zeilenumbrüche unter Verwendung von XML-Tags und -Werten formatiert. Zum Beispiel kann Microsoft® Word® den XML-Code eines Dokuments enthalten:
  •         <w:pPr>
     
            <w:ind w:left="1440" w:right="1440" />
    
    
            </w:pPr>
  • In dem Beispiel kann das w:ind-Tag in Kombination mit w:left- und w:right-Tags den linken und den rechten Einzug definieren. In dem Beispiel kann der w:left-Wert von 1440 angeben, dass der Text um ein Inch von links eingerückt werden soll, und der w:right-Wert von 1440 kann angegeben, dass der Text um ein Inch von rechts eingerückt werden soll.
  • In einem anderen Beispiel können XML-Tags verwendet werden, um Zeilenumbrüche anzugeben. Zum Beispiel kann Microsoft® Word® den XML-Code eines Dokuments enthalten:
  • <w:r><w:t>Dies ist ein anderer</w:t></w:r><w:r><w:br/><w:t xml:space=„preserve“> einfacher Satz.</w:t></w:r>. In dem Beispiel wird das Tag <w:br/> verwendet, um einen Zeilenumbruch (z.B. eine Zeilenumschaltung usw.) anzugeben, was dazu führt, dass „einfacher Satz“ in einer neuen Zeile nach „Dies ist ein anderer“ ausgegeben wird.
  • 23 stellt ein Beispiel 2300 für einen Code in Hypertext Markup Language (HTML), der anhand einer maschinellen Verarbeitung von natürlicher Sprache für gestuften menschenlesbaren Text getaggt wurde, gemäß einer Ausführungsform dar. Ein Ausgangstext 2305 kann durch den NLP-Dienst 130 verarbeitet werden wie in 1 beschrieben, um Wortarten und Schlüsselphrasen 2310 zu identifizieren. Obwohl das Beispiel den Ausgangstext 2305 als HTML-Code zeigt, kann der Text auch im ASCII-Format, XML-Format oder einer Reihe anderer maschinenlesbarer Formate vorliegen. Der Text-Rendering-Dienst 125, wie in 1 beschrieben, kann getaggten Ausgabetext 2315 rendern, der Zeilenumbrüche (z.B. als </br>-Tags in HTML-Code usw.) und Einzüge (z.B. unter Verwendung des Tags text-indent: in HTML usw.) angibt, die auf Basis der Wortarten und Schlüsselphrasen in den Text eingefügt werden.
  • Die Beschreibung fährt mit 1 fort und damit, dass der Dienst 135 zum maschinellen Lernen in Verbindung mit dem NLP-Dienst 130 so arbeiten kann, dass er getaggten digitalen Text erschafft, der die Wortarten und Schlüsselphrasen in einem Satz definiert, und in Verbindung mit dem Dienst 135 zum maschinellen Lernen so arbeiten kann, dass er probabilistische Verfahren verwendet, die neuronale Netze (z.B. rekurrente neuronale Netze (RNN) usw.) beinhalten, um Regeln zum Taggen der Wortarten und Schlüsselphrasen zu erzeugen und um Stufungsregeln für die Wortarten und Schlüsselphrasen zu erzeugen. Der Dienst 135 zum maschinellen Lernen kann eine Reihe verschiedener Algorithmen für maschinelles Lernen (z.B. neuronale Netze, Klassifizierer, Deep Learning usw.) und Metriken als Eingaben verwenden, um die Stufenformatierungsregeln und -algorithmen zu modifizieren.
  • In einem Beispiel sind auf ML basierende Algorithmen und Systeme, die hierin verwendet werden, neuronale Netze, die Deep-Learning-Algorithmen nutzen können. Ein neuronales Netz, wie das menschliche Gehirn, weist einen Satz von untereinander verbundenen Neuronen auf. Deep Learning bedient sich Datenstrukturen, die nach dem menschlichen Gehirn modelliert sind, und trainiert die Neuronen unter Verwendung großer Datensätze. Die Algorithmen helfen dem Computer, auf Basis der bereitgestellten Daten zu lernen. Neuronale Netze werden immer genauer und können in der Lage sein, effektiver und schneller zu lernen als das menschliche Gehirn. Neuronale Netze sind ein Teilbereich der künstlichen Intelligenz, die maschinelles Lernen (z.B. Entscheidungsbäume, logistische Regression, Association Mining, Support Vector Maschines, neuronale Netze usw.), Search & Optimization, logisches Schlussfolgern, Erfüllen von Lösungsbedingungen, probabilistisches Schlussfolgern, Regelungstheorie usw. einschließt, mit denen die menschliche Intelligenz nachgeahmt wird.
  • Der NLP-Dienst 130 kann ein vorab trainiertes Kl-Modell (z.B. AMAZON® Comprehend usw.) verwenden, das ein RNN zum Analysieren von Text verwenden kann. Mit größeren Datenmengen ist das RNN in der Lage, anhand von eingegebenem freiem Text ein Mapping zu lernen, um eine Ausgabe zu schaffen wie etwa vorhergesagte Entitäten, Schlüsselphrasen, Wortarten usw., die in dem freien Text vorhanden sein können. Zum Beispiel ist AMAZON® Comprehend ein vorab trainiertes Modell, das Benutzer direkt auf ihren eigenen Text anwenden und das an großen Mengen von Trainingsdaten trainiert wird. Zu Anfang werden dem Modell zum Lernen viele Beispiele für Paarungen (z.B. Eingabe-Ausgabe-Paare) bereitgestellt. Nachdem das Modell mehrere Beispiele für Eingaben und gewünschte Ausgaben durchgegangen ist, lernt das Modell ein Mapping von Eingabe auf Ausgabe. An diesem Punkt ist das Modell darauf vorbereitet, Vorhersagen über neuen Text zu treffen, und ist bereit, als Dienst eingesetzt zu werden. Gemäß einer beispielhaften Ausführungsform wird eine Wortart-Modellierung durch Trainieren eines rekurrenten neuronalen Netzes (RNN) erreicht. In einem Beispiel schließt ein RNN ein System von als Neuronen bezeichneten, untereinander verbundenen Verarbeitungseinheiten ein, die durch Edges bzw. Kanten miteinander verbunden sind. Das RNN wird trainiert durch Empfangen einer Reihe von Paaren aus Eingaben (Text) und Ausgaben (Wortarten), die das Modell lernen muss. Die Knoten führen progressiv komplexe Berechnungen durch, um ein mathematisches Modell zu lernen, das die Assoziation zwischen dem Text und Wortarten mappt.
  • In einem Beispiel kann der NLP-Dienst 130 ein ML-Modell verwenden, das nicht vorab trainiert wurde, sondern das für den spezifischen Zweck der Angabe von Wortarten, Schlüsselphrasen und Entitäten, wie hierin erörtert, trainiert wird. Zum Beispiel kann der NLP-Dienst 130 ein neuronales Netz unter Verwendung von Text-Wortart-, Text-Schlüsselphrase- und Text-Entität-Paaren trainieren, damit ein neuronales Netz lernt, Wortarten, Schlüsselphrasen und Entitäten als Ausgabe zu taggen. In einem Beispiel können zusätzliche Modelle für maschinelles Lernen unter Verwendung von Kernsatz-Formatregel-, Wortart-Formatregel-, Entität-Formatregel-Paaren trainiert werden, um Stufenformatierungsregeln für die verschiedenen Wortarten, Kernsätze und Entitäten zu identifizieren. In einem anderen Beispiel können Paare aus Benutzereinstellung und Wortarten, Schlüsselphrase und Entität verwendet werden, um ein Modell zum maschinellen Lernen darauf zu trainieren, Benutzereinstellungen auf Basis von verschiedenen Wortarten, Schlüsselphrasen und Entitäten zu identifizieren. Die verschiedenen Modelle für maschinelles Lernen können eine Ausgabe auf Basis einer statistischen Wahrscheinlichkeit für eine Beziehung zwischen einer bestimmten Eingabe und einer ausgewählten Ausgabe bereitstellen. Verschiedene Threshold-Schichten können zum Filtern von Ausgaben in den Modell vorhanden sein, um die Genauigkeit der Ausgabenauswahl zu erhöhen.
  • Wie oben beschrieben, kann in bestimmten Ausführungsformen eine Stufung unter Verwendung einer Kombination aus einem Zeilenlängenparameter und dem Vorhandensein von Satzzeichen, Präpositionen und unterordnenden Konjunktionen bestimmt werden. Text wird in einer Folge gedruckt, wie durch diesen kaskadierenden Algorithmus bestimmt, wobei auf Nominalphrasen wie „Schlüsselphrasen“ und/oder „Entitäten“ geachtet wird. Gemäß dieser Ausführungsform hilft der Prozess dabei, zu verhindern, dass die Formatierungsregeln Nominalphrasenkonstituenten trennen.
  • Die Identifizierung von Wortarten, Schlüsselphrasen und Entitäten zielt darauf ab, zu verhindern, dass eine Stufung Nominalphrasenkonstituenten trennt, wenn die Stufenformatierungsregeln angewendet werden. Informationen, die verwendet werden können, um ein Leseverständnis zu fördern, können durch eine unrichtige und/oder unzulängliche Darstellung einer Konstituentenstruktur verloren gehen. Demgemäß wird gemäß einer anderen beispielhaften Ausführungsform ein auf Grammatik basierender Parsing-Algorithmus verwendet (z.B. der Stanford-Parser (https://nlp.stanford.edu/software/lex-parser.shtml) usw.), der eine Ausgabe hervorbringen kann, die linguistische Abhängigkeiten bewahrt. Der Stanford-Parser ist ein probabilistischer Parser, der aus von Hand geparsten Sätzen gewonnenes Wissen über Sprache nutzt, um zu versuchen, die wahrscheinlichste Analyse neuer Sätze hervorzubringen. In dieser Ausführungsform dient ein Syntaxbaum (z.B. ein Abhängigkeitsbaum, wie in 22 gezeigt, usw.) als Eingabe in einen Stufungsalgorithmus, der tatsächliche Konstituentenbeziehungen verwenden kann, um Zeilenumbrüche für Text zu bestimmen. Zum Beispiel wird folgender Satz geparst: „The strongest rain ever recorded in India shut down the financial hub of Mumbai, snapped communication lines, closed airports and forced thousands of people to sleep in their offices or walk home during the night, officials said today.“, wie in Tabelle 2 gezeigt ist.
    Figure DE212021000356U1_0001
    Figure DE212021000356U1_0002
  • Gemäß dieser Ausführungsform verleiht ein auf Grammatik basierendes Parsing die Fähigkeit zur Bewahrung der Abhängigkeiten innerhalb der Sprache, zu der eine Identifizierung von Abständen zwischen Konstituenten möglicherweise nicht in der Lage ist. Die durch den Grammatik-basierten Parser identifizierten Abhängigkeiten können Lesern dabei helfen, referenzielle, kausale und inferenzielle Beziehungen zwischen Teilsätzen zu verstehen.
  • Gemäß einer beispielhaften Ausführungsform wird der getaggte Text verwendet, um die Textstufung durch Anwenden von Regeln auf die Wortart zu entwickeln, statt spezifische Wörter als Auslöser für Stufen zu verwenden. Zum Beispiel werden statt einer Entwicklung einer Tabelle spezifischer Präpositionen (z.B. von, in usw.) die von dem NLP-Dienst 130 definierten Wortarten und/oder Schlüsselphrasen in dem Regelprozess verwendet, so dass Satzumbrüche und eine Stufung, die Einzüge beinhaltet, von den bereitgestellten Regeln definiert und auf die Ausgabe des NLP-Dienstes 130 angewendet werden.
  • Der Text-Rendering-Dienst 125 kann mehrere Aufrufe des NLP-Dienstes 130 für eine Mehrzahl von Funktionen durchführen, einschließlich von: Identifizierung der Wortart, Identifizierung von Schlüsselphrasen, Identifizierung von Entitäten (z.B. Menschen, Orten, Dingen usw.), die in einem Satz enthalten sein können. Dies sind jeweils separate Aufrufe/Funktionen, die, wenn sie kombiniert werden, den zur Erzeugung von gestuftem Text zu verwendenden Tag-Satz bereitstellen. In der englischen Grammatik handelt es sich bei einem Constituent bzw. Konstituenten um einen linguistischen Teil des größeren Satzes, um Phrasen oder einen Clause bzw. Teilsatz. Zum Beispiel sind alle Wörter, Phrasen und Teilsätze, die einen Satz bilden, Konstituenten. Sätze werde als Hierarchie dargestellt. Zum Beispiel kann ein englischer Satz „The cat chased a mouse“ eine Satzkonstituentenhierarchie habe wie in Tabelle 3 gezeigt. Tabelle 3
    Nominalphrase Verbphrase
    Artikel Nomen Verb Nominalphrase
    The cat chased Article Noun
    a mouse
  • Eine Augenfixation ist ein Punkt, auf dem das Auge während eines Leseprozesses ruht. Eine optimale Augenbewegung ist eine Anzahl von Zeichen, die von zwei Augenfixationen erfasst werden, und von Leerzeichen. Linguistische Struktur bezeichnet die Grammatik, Syntax, Semantik, Morphologie, Phonologie usw. eines Satzes oder einer Textpassage. Syntax ist ein Teilgebiet der Linguistik, die sich mit der Struktur eines Satzes befasst und dafür Wortarten verwendet. Wortart-Tagging ist eine Aufgabe der NLP-Verarbeitung, die grammatikalische Wortarten taggt. Offset, wie hierin verwendet, bezeichnet einen Ankerpunkt zur Bestimmung, wo mit dem Zählen von Zeichen einschließlich von Leerzeichen begonnen werden soll. Eine Cursor-Position wird als aktueller Offset bezeichnet. Begin Offset bezeichnet den Anfang, End Offset ist das Ende des Wortes oder Leerzeichens.
  • Gemäß einer beispielhaften Ausführungsform werden Schlüsselphrasen auf probabilistische Weise von dem NLP-Dienst 130 unter Verwendung von linguistischer Datenverarbeitung bestimmt. Die identifizierten Schlüsselphrasen transportieren mit großer Wahrscheinlichkeit Schlüsselinhalte des Satzes, die für das Verständnis relevant sind.
  • Der durch den Text-Rendering-Dienst 125 erzeugte gestufte Text kann das Leseverständnis verbessern. Gemäß einer beispielhaften Ausführungsform werden Informationen, die in Wer-, Wann-, Wo- und Was-Teilsätzen codiert sind, und Nominalphrasen, die diese Teilsätze darstellen, als Signifikanten oder Anhaltspunkte für die Bestimmung von Zeilenumbrüchen und/oder Einzügen verwendet, um ein gestuftes Textformat zu erzielen. Es wird angenommen, dass eine optimale Augenbewegung Zeilenumbrüche betrifft. Die linguistische Struktur definiert eine Stufung anstelle von Regeln, die die Sprachstruktur interpretieren. Der Text-Rendering-Dienst 125 verwendet Schlüsselphrasen, um das Wer, Wann, Wo und Was eines Satzes zu bestimmen. Dies kann einem auf Verben abstellenden Algorithmus gegenübergestellt werden. Statt tausende Regeln zur Evaluierung von Text zu verarbeiten, verwendet der NLP-Dienst 130 Wortart-Tagging. Einzüge, die vom Text-Rendering-Dienst 125 eingefügt werden, basieren auf einer Satzkonstituentenhierarchie, die von Wortart-Tags mitgeteilt wird. Eine konfigurierbare maximale Zeilenlänge wird unter Berücksichtigung der Augenfixation und abhängig von den Einzugsregeln eingestellt.
  • In einem Beispiel kann ein Satz in englischer Sprache als Eingabe für den NLP-Verarbeitungsdienst 130 bereitgestellt werden. Ein englischer Satz besteht aus Subjekt, Verb und Objekt. Der Satz ist definiert als eine Abfolge von Wörtern, die mit einem Punkt enden, mit Subjekt, Verb und Objekt. Die maximale Länge einer Zeile ist konfigurierbar, richtet sich aber nach zwei Augenfixationen. Zum Beispiel kann die maximale Länge auf 35 Zeichen eingestellt werden. Der NLP-Dienst 130 kann eine Entitätserkennung, Schlüsselphrasenidentifizierung und Wortart(POS)-Identifizierung durchführen. Der Text-Rendering-Dienst 125 kann Text entsprechend Entitäten, Schlüsselphrasen und Wortarten unter Verwendung von Formatierungsregeln verarbeiten, die basierend auf einem Typ, auf individuell vorgesehenen Regeln, Kategorien usw. ausgewählt werden können. Die Einzüge und Zeilenumbrüche, die von dem Text-Rendering-Dienst 125 eingefügt werden, basieren auf der POS-Identifizierung und linguistischen Regeln für Satzkonstituenten.
  • Für jeden Satz kann der Text-Rendering-Dienst 125 folgendes durchführen:
  • Wortart-Tags, Schlüsselphrasen und Entitäten von dem NLP-Dienst 130 holen.
  • Den Satz an Position 1 im Texteditor beginnen lassen.
  • Wort für Wort in eine Zeile schreiben, bis die maximale Zeilenlänge erreicht ist.
  • Die Zeile umbrechen, wenn ein „,“ oder ein „)“ als eines der Satzzeichen kommt. Eine neue Zeile beginnen durch Hinzufügen von 2 Zeichen zu der Position, wo die vorherige Zeile begonnen hat. In einem Beispiel kann es sein, dass die Zeile nicht umgebrochen wird, wenn ein Satzzeichen kommt, und dass mit einer weiteren Evaluierung der linguistischen Struktur des Satzes fortgefahren wird.
  • ODER
  • Zeile umbrechen, wenn das Wort der Kopf einer Präpositionalphrase ist, weil es den Umfang des folgenden Textes festlegt. Den Kopf einer Präpositionalphrase an einer Position des letzten Kopfes der Präpositionalphrase beginnen lassen. Wenn es sich um den ersten Kopf der Präpositionalphrase handelt, dann dies als die erste Position des Kopfes der Präpositionalphrase aufzeichnen, 2 Positionen mehr als die Zeile davor einrücken.
  • ODER
  • Zeile umbrechen, wenn das Wort eine unterordnende Konjunktion ist, weil es Teile des Satzes miteinander verknüpft. Einrücken des nächsten Wortes am letzten Einzug der unterordnenden Konjunktion. Wenn es sich um die erste unterordnende Konjunktion handelt, dann dies als die erste Position für eine unterordnende Konjunktion aufzeichnen, zwei Positionen mehr als die Zeile davor einrücken.
  • ODER
  • Zeile umbrechen, wenn ein Satzzeichen, das am Ende des Wortes kommt, „:“ oder „;“ oder „?“ oder „!" ist, und Einrücken an der Position „3“, die linksbündig ist.
  • Der Text-Rendering-Dienst 125 kann vor einer Stufung eine Begrenzung auf nur eine Schlüsselphrase pro Zeile durchführen. Daher wird ein Schlüsselphrasenzählwert beibehalten, wenn Wörter erscheinen. Der Text-Rendering-Dienst 125 bricht eine Zeile nicht mitten in einer Schlüsselphrase um. Wenn die maximale Zeilenlänge erreicht wird, während ein Token verarbeitet wird, dann wird umgebrochen, wenn mehr als die Hälfte des Wortes jenseits der Obergrenze liegt. Wenn zum Beispiel die maximale Zeilenlänge erreicht wird, während das Wort enchantment verarbeitet wird. Die Zeilenobergrenze wird erreicht, während das Zeichen „c” verarbeitet wird. Das Wort ist 11 Zeichen lang und das Zeichen „c” steht an Position 3 in dem Wort. 11/2 ist ungefähr 5, was größer ist als 3, daher wird die Zeile vor enchantment umgebrochen.
  • Eine ständige Verbesserung von Text-Tagging- und Stufungsregeln kann anhand des Dienstes 135 für maschinelles Lernen durch die Anwendung von künstlicher Intelligenz, die Techniken für maschinelles Lernen beinhaltet, erreicht werden. Die Eingaben/Ausgaben in den und aus dem Dienst 135 für maschinelles Lernen können aktiv und passiv verarbeitet werden. Zum Beispiel kann in einem Beispiel, wo zwei Benutzer das gleiche Material lesen können, wobei das Stufenformat zwischen Person A und Person B etwas unterschiedlich ist, der Dienst 135 für maschinelles Lernen gemäß einer Methode des aktiven maschinellen Lernens arbeiten. Das Leseverständnis der Benutzer des Materials kann über Beurteilungen verfolgt werden, und der Dienst 135 für maschinelles Lernen kann Ausgaben erzeugen, die von dem Text-Rendering-Dienst 125 verwendet werden können, um die Stufungsregeln im Laufe der Zeit zu modifizieren. Dies ermöglicht umso größere Verbesserungen, je intensiver eine Nutzung ist. Der Dienst 135 für maschinelles Lernen kann in einem passiven Modus arbeiten, um Attribute wie ein Leseverständnis ohne eine explizite Beurteilung zu messen. Zum Beispiel kann der Dienst 135 für maschinelles Lernen Daten erfassen, die (einzeln und in Kombination) verwendet werden können, um eine Ausgabe zu erzeugen, die ein Leseverständnis angeben, ohne dass sich der Benutzer einer Beurteilung unterzieht. Manche von den Daten, die evaluiert werden können, um Modelle für maschinelles Lernen zu evaluieren, können zum Beispiel, und ohne dass dies eine Beschränkung darstellt, eine Zeit sein, die für das Lesen eines bestimmten Textabschnitts aufgewendet wird (z.B. kann weniger Zeitaufwand auf ein besseres Verstehen hinweisen, usw.), ein Eye-Tracking unter Verwendung von Kameras (z.B. eingebetteten Kameras, externen usw.), die eine Effizienz einer Augenbewegung über unterschiedlichen Stufenformaten des gleichen Inhalts evaluieren, um eine Eingabe für maschinelles Lernen bereitzustellen, und eine Modifikation eines Benutzers kann den Grad der persönlichen Modifikation für Benutzereinstellungen evaluieren (z.B. größere Abstände, Satzfragmentlänge, Schriftart, farbliche Hervorhebung von Schlüsselphrasen oder Wortarten usw.).
  • Der Analysedienst 140 kann Benutzeranalytik, einschließlich von Metriken für Leseverständnis, Benutzereinstellungen, die sich in Modifikationen an dem System niederschlagen (z.B. Scroll-Geschwindigkeit, Abstände, Fragmentlänge, Dunkel-Modus, Hervorhebung von Schlüsselphrasen usw.) usw. protokollieren und speichern. Die Modifikationen können für verschiedene Stufenformate evaluiert werden, um zu bestimmen, wie sich verschiedene Modifikationen auf das Verstehen auswirken, und können als Eingabe in den Dienst 135 für maschinelles Lernen eingespeist werden, um voreingestellte Stufenformate zu verbessern. Der Benutzerprofildienst 145 kann Benutzerprofildaten, einschließlich einer für Datenschutz und Einhaltung von Datenschutzvorschriften (z.B. HIPPA-Konformität usw.) anonymisierten Kennung speichern und kann Leistungsmetriken und Fortschritt verfolgen. Zum Beispiel können Personalisierungen, die von dem Benutzer kontinuierlich vorgenommen werden, von dem Dienst 135 für maschinelles Lernen auf Basis einer Eingabe aus dem Analysedienst 140 gelernt werden und können verwendet werden, um benutzerspezifische Stufungsregeln zu erzeugen. Der Zugriffskontrolldienst 150 kann einen Zugriff auf gespeicherten Inhalt, einschließlich von Metriken von Frequenz, Nutzungszeit, Attribute (Belletristik, Sachbuch, wissenschaftlicher Text, Poesie usw.), angegeben. Gemäß einer anderen Personalisierung kann ein Benutzer Anzeigeparameter wie Textfarbe, Schriftart, Schriftgröße und andere Anzeigeparameter personalisieren.
  • In einem Beispiel kann ein Lese-Score für einen Benutzer entwickelt werden. Es kann eine Scoring-Matrix erstellt werden, die basieren kann auf dem Alter und der Einstufung eines Lernenden, die ein Ergebnis davon sein kann, wie er spezifizierten Inhalt liest und wie sein damit zusammenhängendes Verständnis ist (z.B. von einem Leseverständnis-Score (RCS) usw.). Die Metriken können auf einer Evaluierung eines Gebrauchs von Text durch den Benutzer unter Verwendung von Stufenformatierung basieren. Zum Beispiel kann eine Bewertung im Zeitverlauf verfolgt werden - aktiv oder passiv -, um Schnelligkeit und Effizienz des Verstehens des Textes durch den Benutzer zu bestimmen. Für den Benutzer kann ein Quotient berechnet werden, der mit der Schnelligkeit des Verstehens steigt. Eingaben, die vor der Durchführung einer Lesebeurteilung durchgeführt werden können, können verwendet werden, um einen Basis-Quotienten für den Benutzer zu erzeugen.
  • Eine Bibliothek für kognitives Training kann unter Verwendung von Stufenformatierung entwickelt werden. Zum Beispiel können verschiedene Dinge mit publiziertem Inhalt, wie Bücher, Magazine und Schriften, unter Verwendung des Stufenformats übersetzt werden, und Benutzer können in die Lage versetzt werden, zum Zwecke des Gehirntrainings auf die Bibliothek zuzugreifen, um ihr Versteh- und Merkvermögen zu verbessern. Tests und Quizze können verwendet werden, um eine Verstehleistung des Benutzers zu beurteilen, um dem Benutzer einen greifbaren Beweis für eine kognitive Verbesserung bereitzustellen.
  • Eine Stufenformatierung kann angewendet werden, um eine Reihe verschiedener Sprachen zu verarbeiten. (Mindestens) ein Parser kann verwendet werden, um Text in einer anderen Sprache zu taggen, und Regeln können geschaffen und auf die NLP-Ausgabe (z.B. spanischen Text usw.) angewendet werden, um Text in einer fremden Sprache entsprechend zu stufen. Zusätzlich zu Sprachadaptierungen können Adaptierungen auf Basis der Syntax anderer Sprachen vorgenommen werden, und somit kann der gestufte Text für eine andere Sprache in einem anderen Format anhand anderer Formatierungsregeln gestuft werden, um lokalisierte Syntaxvarianten zu berücksichtigen. Dies ermöglicht eine große Menge an erkannten Sprachen (z.B. 100+ Sprachen) und zahlreiche Varianten der Adaptierung des gestuften Textes an die Sprache und die Syntax.
  • In einem Beispiel kann eine Stimmausgabe mit einer visuellen Anzeige des stufig formatierten Textes kombiniert werden. Ton kann integriert werden, so dass beim Lesen von gestuftem Text auch ein Vorlesen desselben Textes stattfindet, und zwar mit einer Geschwindigkeit, die so regelbar ist, dass sie zu der Geschwindigkeit des individuellen Lesers passt. Zum Beispiel kann eine Sprachsynthese bzw. Text-to-Speech verwendet werden, um die Audio-/Sprachausgabe in Echtzeit bereitzustellen, und eine Lesegeschwindigkeit und ein Leseverstehen können evaluiert und eine Geschwindigkeit der Sprachsynthese kann verändert werden (z.B. kann sie beschleunigt, verlangsamt, pausiert, wieder aufgenommen werden usw.), um das Audio mit dem Lesen des Benutzers synchron zu halten.
  • 5 stellt einen Prozess 500 zum Trainieren und Verwenden eines Modells für maschinelles Lernen zum Erzeugen eines Stufenformats für menschenlesbaren Text gemäß einer Ausführungsform dar. Der Prozess 500 kann Merkmale bereitstellen wie in 1 bis 4 beschrieben.
  • In einem Schritt 505 kann ein Corpus von Lerntext empfangen werden, der Lerntext kann einen Variantentext enthalten, der eine Reihe verschiedener Textformatierungen und markierte und unmarkierte Schlüsselphrasen und Wortarten enthalten kann.
  • In einem Schritt 510 können alle unmarkierten Wortarten und Schlüsselphrasen durch einen Prozessor für maschinelles Lernen markiert werden (z.B. durch den Dienst 135 für maschinelles Lernen wie in 1 beschrieben usw.). In einem Schritt 515 kann die Ausgabe des Prozessors für maschinelles Lernens verwendet werden, um ein Text-Tagging-Modell zu erzeugen, das von dem Prozessor für maschinelles Lernen verwendet werden kann, um künftige unmarkierte Eingaben zu markieren. In einem Beispiel kann der Prozessor für maschinelles Lernen die Formatierung des Lerntextes evaluieren, um ein Stufenformatmodell zu erzeugen, das erlernte Einzugs- und Zeilenumbruchregeln enthält, die bei der Evaluierung identifiziert werden.
  • In einem Schritt 520 kann eingegebener Text von einem Cloud-basierten NLP (z.B. dem NLP-Dienst 130 wie in 1 beschrieben usw.) empfangen werden. In einem Schritt 525 kann der Eingabetext durch das Text-Tagging-Modell evaluiert werden. In einem Schritt 530 können identifizierten Wortarten und Schlüsselphrasen auf Basis der Evaluierung Marken zugeordnet werden. In einem Schritt 535 kann eine Stufenformatierungsregel auf Basis der Marken angewendet werden, um Anweisungen für die Ausgabe von Text auf einer Anzeigevorrichtung zu erzeugen. In einem Beispiel kann die Stufenformatierungsregel unter Verwendung des Stufenformatmodells ausgewählt werden. In einem Schritt 540 kann durch Verarbeiten des Eingabetextes unter Verwendung der Anweisungen Ausgabetext auf der Anzeigevorrichtung angezeigt werden.
  • In einem Beispiel kann in einem Schritt 545 eine Benutzereingabe empfangen werden, die eine Modifikation an einem Stufenformat des Ausgabetextes angibt. Die Stufenformatierungsregel kann in einem Schritt 550 auf Basis der Benutzereingabe modifiziert werden. Auf Basis der Benutzereingabe kann in einem Schritt 555 ein Gesundheitszustand diagnostiziert werden.
  • 6 stellt ein Beispiel 600 für die Erzeugung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar. Das Beispiel 600 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Es kann eingegebener Text 605 empfangen werden. Der empfangene Text kann aus einer Webseite, einem Dokument, einem Content Publisher, einem Texteditor und dergleichen empfangen werden. Wortarten und Schlüsselphrasen 610 in dem Eingabetext 605 können von einem NLP-Parser auf Basis von vordefinierten Wortart- und Schlüsselphrasendaten 615 identifiziert werden. In einem Beispiel kann ein Prozessor für maschinelles Lernen unbekannte Schlüsselphrasen durch Verarbeiten des Eingabetextes 605 identifizieren, um Wörter oder Wortkombinationen als Schlüsselphrasen zu klassifizieren. Der Eingabetext 605, der die Wortarten und Schlüsselphrasen 610 enthält, kann von dem System 105 empfangen werden.
  • Die identifizierten Wortarten und Schlüsselphrasen 610 können gegenüber einem Satz von Stufenformatierungsregeln 620 evaluiert werden. Der Satz von Stufenformatierungsregeln 620 kann Regeln einschließen zum Einfügen von Zeilenumbrüchen, Einzügen und anderen Formatierungselementen in den Eingabetext 605, um Ausgabetext 625 zu erzeugen. Die Stufenformatierungsregeln können spezifisch sein für ein Schlüsselwort oder eine Wortart oder können für eine Klasse oder einen Typ der Wortart oder Schlüsselphrase definiert werden. Zum Beispiel kann eine Regel für eine Adposition, ein Subjekt, Eigennamen, Buchtitel usw. existieren. Zum Beispiel kann „human events“ eine Schlüsselphrase sein, und eine Stufenformatierungsregel, die einem Schlüsselphrasentyp entspricht, zu dem „humanevents“ gehört, kann Anweisungen enthalten zum Einfügen eines Zeilenumbruchs und eines Einzugs ab der letzten Zeile vor dem Erscheinen von „humanevents“.
  • Der Eingabetext 605 kann durch Einfügen der geeigneten Formatierung umgewandelt und als Ausgabetext 625 angezeigt werden. Die resultierende Anzeige stellt eine gestufte Textanzeige bereit, in die jede der den Wortarten und Schlüsselphrasen 610 entsprechenden relevanten Stufenformatierungsregeln aufgenommen wurde.
  • 7 stellt ein Verfahren 700 zum Erzeugen von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar. Das Verfahren 700 kann ein Merkmal bereitstellen wie in 1 bis 5 beschrieben. In einem Schritt 705 kann Text unter Verwendung eines Parsers für die maschinelle Verarbeitung von natürlicher Sprache (NLP) verarbeitet werden (z.B. von dem NLP-Dienst 130 wie in 1 beschrieben usw.). In einem Beispiel kann der NLP-Parser ein neuronales Netz sein. In einem Beispiel verwendet der NLP-Parser eine probabilistische Analyse, um einen Satz in dem Text zu parsen. In einem Schritt 710 können identifizierte Wortarten und Schlüsselphrasen in dem Text mit entsprechenden Wortart- und Schlüsselphrasen-Tags getaggt werden. In einem Schritt 715 kann eine Textstufung, die Satzumbrüche und Einzüge enthält, auf Basis von Regeln, die auf die Wortarten und Schlüsselphrasen angewendet werden, erzeugt werden. In einem Beispiel kann die Textstufung auf einer Anzeigevorrichtung angezeigt werden. In einem Beispiel ist die Anzeigevorrichtung ausgewählt aus der Gruppe: Desktop-Computer, Laptops, E-Reader, Tablet-Computer, Armbanduhren, Fernsehgeräte, Autobildschirme, Smartphones, graphische Anzeigen, vom Benutzer am Körper getragene visuelle Anzeigevorrichtungen. In einem Beispiel schließen die vom Benutzer am Körper getragenen visuellen Anzeigevorrichtungen Vorrichtungen ein, die ausgewählt sind aus der Gruppe: AV-Headsets, VR-Headsets, Brillen und Kontaktlinsen.
  • 8 stellt ein Beispiel 800 für eine Adaptierung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar. Das Beispiel 800 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Wie unter Bezugnahme auf 6 beschrieben wurde, kann Eingabetext 805 empfangen werden und Wortarten und Schlüsselphrasen 810 in dem Eingabetext 805 können von einem NLP-Parser auf Basis von vordefinierten Wortart- und Schlüsselphrasendaten 815 identifiziert werden. Die identifizierten Wortarten und Schlüsselphrasen 810 können gegenüber einem Satz von Stufenformatierungsregeln 820 evaluiert werden. Der Satz von Stufenformatierungsregeln 820 kann Regeln einschließen zum Einfügen von Zeilenumbrüchen, Einzügen und anderen Formatierungselementen in den Eingabetext 805, um Ausgabetext 825 zu erzeugen. Wie ebenfalls unter Bezugnahme auf 6 beschrieben wurde, kann der Eingabetext 805 durch Einfügen der geeigneten Formatierung umgewandelt und als Ausgabetext 825 angezeigt werden. Die resultierende Anzeige stellt eine gestufte Textanzeige bereit, in die jede der den Wortarten und Schlüsselphrasen 810 entsprechenden relevanten Stufenformatierungsregeln aufgenommen wurde. Benutzer können bestimmte Vorlieben haben, was die Anzeige von Text betrifft, und Modifikationen, die von einem Benutzer vorgenommen werden, können erfasst werden und können verwendet werden, um die Stufenformatierungsregeln 820 zu modifizieren. Ein Benutzer kann eine Benutzermodifikation 830 an dem Ausgabetext 825 vornehmen. Die Benutzermodifikation 830 kann die Stufenformatierungsregeln direkt auf Basis der Benutzermodifikation 830 modifizieren, was sich auf die Anzeige einer bestimmten Wortart oder Schlüsselphrase 810 auswirkt. Die Benutzermodifikation 830 kann als Eingabe in einen Prozessor für maschinelles Lernen verwendet werden, der Benutzermodifikationen im Zeitverlauf, einschließlich der Benutzermodifikation 830, verfolgen kann, um eine Adaptierung der Stufenformatierungsregeln im Zeitverlauf zu lernen. Zum Beispiel kann ein Satz von benutzerspezifischen Stufenformatierungsregeln gepflegt werden, und der Satz von benutzerspezifischen Stufenformatierungsregeln kann nach der Anwendung der Stufenformatierungsregeln 820 angewendet werden, um den Ausgabetext 825 für den Benutzer zu adaptieren.
  • 9 stellt ein Verfahren 900 zum Adaptieren von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar. Das Verfahren 900 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. In einem Schritt 905 kann Text geparst werden, um Wortarten in einem Satz zu identifizieren (z.B. von dem NLP-Dienst 130 wie in 1 beschrieben usw.). In einem Schritt 910 können die Wortarten mit entsprechenden Wortart-Tags getaggt werden. In einem Schritt 915 können Regeln auf die Wortarten angewendet werden, um Anweisungen zum Anzeigen des Satzes in einem gestuften Format, das Satzumbrüche und Stufen, einschließlich von Einzügen einschließt, auf Basis der Regeln zu erzeugen. In einem Schritt 920 kann der Satz unter Verwendung der Regeln in einem ersten gestuften Format in Fragmenten angezeigt werden. In einem Schritt 925 kann eine Eingabe empfangen werden, die ein menschliches Feedback für das erste gestufte Format angibt. In einem Beispiel kann das menschliche Feedback subjektive Benutzereinstellungen und/oder die Fähigkeit eines Menschen, einen unter Verwendung der Regeln angezeigten Satz zu verstehen, angeben. In einem Schritt 930 können die Regeln unter Verwendung des menschlichen Feedbacks adaptiert werden, um Anweisungen für ein adaptiertes gestuftes Format, das von dem ersten gestuften Format verschieden ist, zu erzeugen, bis eine Stoppbedingung erreicht ist. In einem Schritt 935 können die adaptierten Regeln als die Regeln für die Wortarten gespeichert werden. In einem Beispiel kann das menschliche Feedback, das verwendet wird, um die Regeln zu adaptieren, auf einem einzelnen Individuum basieren, und die Regeln können spezifisch für das einzelne Individuum adaptiert werden, und es können Regeln bereitgestellt werden, die für jedes einzelne von einer Mehrzahl von Individuen personalisiert wurden. In einem Beispiel kann das Stoppkriterium aus der folgenden Gruppe ausgewählt sein: eine Zahl von Iterationen einer Adaptierung, eine Eingabe, die von einem Menschen empfangen wird, oder eine Bestimmung, dass die Adaptierungen die Lesbarkeit des gestuften Textes nicht verbessern. In einem Beispiel kann das menschliche Feedback eine Änderung des Abstands von Satzfragmenten, Satzfragmentlängen oder beidem angeben.
  • 10 stellt ein Beispiel 1000 für die Erzeugung von gestuftem menschenlesbarem Text aus einem aufgenommenen Bild anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar. Das Beispiel 1000 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Eine Bilderzeugungsvorrichtung 1005 kann ein Bild, das Text 1010 enthält, aufnehmen. Das Bild kann verarbeitet werden (z.B. über optische Zeichenerkennung usw.), um den Text 1010 aus dem Bild zu extrahieren. Der Text 1010 kann über das System 105 evaluiert werden, um Wortarten und Schlüsselphrasen in dem Text zu identifizieren. Stufenformatierungsregeln für die identifizierten Wortarten und Schlüsselphrasen in dem Text 1010 können auf den Text 1010 angewendet werden. Der Text 1010 kann in gestuften Ausgabetext umgewandelt und zum Gebrauch für einen Benutzer angezeigt werden.
  • 11 stellt ein Verfahren 1100 zum Erzeugen von gestuftem menschenlesbarem Text aus einem aufgenommenen Bild anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar. Das Verfahren 1100 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. In einem Schritt 1105 kann ein Bild von Text innerhalb eines Sichtfelds einer Bilderzeugungsvorrichtung aufgenommen werden. In einem Schritt 1110 kann der Text in dem Bild erkannt werden, um eine maschinenlesbare Textfolge zu erzeugen. In einem Schritt 1115 kann die maschinenlesbare Textfolge mit einem Parser für die maschinelle Verarbeitung von natürlicher Sprache (NLP) verarbeitet werden, um Wortarten zu identifizieren. In einem Beispiel kann der NLP-Parser ein neuronales Netz einschließen. In einem Beispiel kann der NLP-Parser eine probabilistische Analyse verwenden, um einen Satz in dem Text zu parsen. In einem Schritt 1120 können die identifizierten Wortarten ihrer Art entsprechend getaggt werden. In einem Schritt 1125 kann eine Textstufung, die Umbrüche und Einzüge einschließt, auf Basis von Regeln erzeugt werden, die auf Wortarten angewendet werden. In einem Beispiel kann die Textfolge Sätze eines Textes enthalten, und die Umbrüche und Einzüge können auf den Satz angewendet werden.
  • 12 stellt ein Beispiel 1200 für eine Umwandlung von menschenlesbarem Text aus einem ersten Anzeigeformat in ein zweites Anzeigeformat in einer über den Augen getragenen Vorrichtung anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar. Das Beispiel 1200 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Ein Benutzer 105 kann eine intelligente Brille tragen, die eine Bilderzeugungsvorrichtung 1210 einschließt. Die Bilderzeugungsvorrichtung 1210 kann ein Bild, das Text 1215 enthält, aufnehmen. Das Bild kann verarbeitet werden (z.B. über optische Zeichenerkennung usw.), um den Text 1215 aus dem Bild zu extrahieren. Der Text 1215 kann über das System 105 evaluiert werden, um Wortarten und Schlüsselphrasen in dem Text zu identifizieren. Stufenformatierungsregeln für die identifizierten Wortarten und Schlüsselphrasen in dem Text 1215 können auf den Text 1215 angewendet werden. Der Text 1215 kann in gestuften Ausgabetext umgewandelt und auf einer Anzeigevorrichtung der intelligenten Brille, die eine Bilderzeugungsvorrichtung 1210 einschließt, zum Gebrauch für einen Benutzer angezeigt werden.
  • 13 stellt ein Beispiel 1300 für eine Umwandlung von menschenlesbarem Text von einem ersten Anzeigeformat in ein zweites Anzeigeformat in einer über den Augen getragenen Vorrichtung anhand einer maschinellen Verarbeitung von natürlicher Sprache gemäß einer Ausführungsform dar. Das Verfahren 1300 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. In einem Schritt 1305 kann ein Bild von Text innerhalb eines Sichtfelds einer Bilderzeugungskomponente einer über den Augen getragenen Vorrichtung aufgenommen werden. In einem Schritt 1310 kann der Text in dem Bild erkannt werden, um eine maschinenlesbare Textfolge zu erzeugen. In einem Schritt 1315 kann die maschinenlesbare Textfolge mit einem Parser für die maschinelle Verarbeitung von natürlicher Sprache (NLP) verarbeitet werden, um Wortarten zu identifizieren. In einem Beispiel kann der NLP-Parser ein neuronales Netz einschließen. In einem Beispiel kann der NLP-Parser eine probabilistische Analyse verwenden, um einen Satz in dem Text zu parsen. In einem Schritt 1320 können die identifizierten Wortarten ihrer Art entsprechend getaggt werden. In einem Schritt 1325 kann eine Textstufung, die Umbrüche und Einzüge einschließt, auf Basis von Regeln erzeugt werden, die auf Wortarten angewendet werden. In einem Beispiel kann die Textfolge Sätze eines Textes enthalten, und die Umbrüche und Einzüge können auf den Satz angewendet werden. In einem Schritt 1330 kann die Textstufung einem Benutzer über eine Anzeigekomponente der über den Augen getragenen Vorrichtung angezeigt werden.
  • 14 stellt ein Beispiel 1400 für die Erzeugung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache, während ein Text verfasst wird, gemäß einer Ausführungsform dar. Das Beispiel 1400 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Ein Werkzeug 1405 zum Verfassen von Text kann eine Texteingabe 1410 von einem Benutzer empfangen (z.B. über eine Tastatur, einen Sprachbefehl usw.). Wenn die Texteingabe 1410 empfangen wird, wird sie von dem System 105 verarbeitet (über eine Online-Verbindung, lokal verfügbare Komponenten usw.), um Wortarten und Schlüsselphrasen in der Texteingabe 1410 zu identifizieren. Stufenformatierungsregeln für die identifizierten Wortarten und Schlüsselphrasen in der Texteingabe 1410 können auf die Texteingabe 1410 angewendet werden. Der angezeigte Ausgabetext 1415 kann als gestufter Ausgabetext angezeigt werden, während der Benutzer den Text eingibt, um dem Benutzer eine Echtzeit-Stufenformatierung bereitzustellen, während Text eingegeben wird.
  • 15 stellt ein Verfahren 1500 zum Erzeugen von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache, während ein Text verfasst wird, gemäß einer Ausführungsform dar. Das Verfahren 1500 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Die hierin erörterten Systeme und Techniken können zum Entwerfen und Verfassen in einem gestuften Format verwendet werden. In einem Beispiel ist der Benutzer in der Lage, einen Entwurf zu machen und die Textstufung in Echtzeit zu sehen. Wie bei einer Grammatikprüfung oder Rechtschreibprüfung ist der Benutzer in der Lage, Dokumente unter Verwendung des gestuften Formats zu erstellen (z.B. statt eines Block-Entwurfs, der dann umgewandelt wird, usw.). In einem Schritt 1505 kann Text aus einem Werkzeug zum Verfassen von Text empfangen werden (z.B. durch den NLP-Dienst 130, wie in 1 usw. beschrieben). In einem Schritt 1515 kann der Text verarbeitet werden, sobald er eingegeben wurde, um Wortarten und Sätze des Textes zu identifizieren. In einem Beispiel kann der Text durch einen Parser für die Verarbeitung natürlicher Sprache (NLP) verarbeitet werden, um Wortarten in einem Satz zu identifizieren, die identifizierten Wortarten können entsprechend ihrer Art getaggt werden und eine Textstufung, die Satzumbrüche einschließt, und eine Stufung, die Einzüge einschließt, die durch Regeln definiert werden, können auf die Wortarten angewendet werden. In einem Schritt 1515 kann eine Anzeige des Textes in dem Werkzeug zum Verfassen von Text gemäß einer Textanzeigeregel für die Erzeugung einer gestuften Anzeige nahezu in Echtzeit modifiziert werden. In einem Beispiel können Merkmale der gestuften Anzeige auf Basis einer Eingabe modifiziert werden, die aus einem Bearbeitungswerkzeug in dem Werkzeug zum Verfassen von Text, das eine Anpassung der gestuften Anzeige ermöglicht, empfangen wird. Gemäß einer anderen beispielhaften Ausführungsform ist das Werkzeug zum Verfassen von Text als gestuftem Text ein Grammatikprüfwerkzeug, wie Grammarly®, das eine Stufentextausgabe ebenso wie eine Markierung von Grammatikfehlern und Korrekturvorschläge bereitstellt.
  • 16 stellt ein Beispiel für eine Umgebung 1600 zum Empfangen einer Modifikation an einem Stufenformat gemäß einer Ausführungsform dar. Eine Benutzeroberfläche 1605 und ein Plug-in 1610 können Merkmale bereitstellen wie in 1 bis 5 beschrieben. Die Benutzeroberfläche 1605 und das Plug-in 1610 können mit dem System 105 verbunden sein, wie in 1 beschrieben. Das System 105 kann einen Diagnosedienst 1620 einschließen, der Anweisungen für eine Diagnostizierung eines Gesundheitszustands auf Basis von Modifikationen, die an einem Stufenformat vorgenommen werden wie in 1-10 beschrieben, einschließen kann. Es kann eine Stufenmodusschaltfläche 1015 bereitgestellt sein, die einem Benutzer ermöglicht, einen Bearbeitungsmodus ein- oder auszuschalten. Text kann in einem Stufenformat angezeigt werden, und wenn der Stufenbearbeitungsmodus aktiv ist, können Änderungen an dem Stufenformat verfolgt werden und können analysiert werden, um einen Gesundheitszustand zu diagnostizieren und/oder um personalisierte Stufenformatregeln für den Benutzer zu erzeugen.
  • 17 stellt ein Verfahren 1700 für die Diagnostizierung eines Gesundheitszustands, der sich auf die Fähigkeit zu lesen auswirkt, gemäß einer Ausführungsform dar. Das Verfahren 1700 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Die hierin erörterten Systeme und Techniken können auch verwendet werden, um Gesundheitszustände wie Legasthenie und Gehirnerschütterungen zu diagnostizieren. Zum Beispiel können verschiedene Stufen und Modifikationen bereitgestellt werden, um die Diagnose dieser und anderer Gesundheitszustände zu erleichtern. Eine Person kann ein Headset aufsetzen und mit verschiedenen Formatparametern konfrontiert werden, die verschiedene Faktoren durchgehen, die über den Zustand Auskunft geben. In einem Schritt 1705 können auf Basis von Stufungsregeln Sätze in einem gestuften Format, das Satzumbrüche und Einzüge einschließt, angezeigt werden. In einem Schritt 1710 kann eine Eingabe empfangen werden, die ein menschliches Feedback angibt, das der Fähigkeit eines Menschen entspricht, den Text der Sätze zu verstehen. In einem Beispiel kann das menschliche Feedback eine Änderung des Abstands von Satzfragmenten, Satzfragmentlängen oder beidem angeben. Alternativ dazu wird das menschliche Feedback durch Verfolgen der Augenbewegungen des Lesers über dem Text bereitgestellt. In einem Schritt 1715 können die Stufungsregeln unter Verwendung des menschlichen Feedbacks adaptiert werden, um ein adaptiertes gestuftes Format hervorzubringen, das von dem originalen gestuften Format verschieden ist. In einem Schritt 1720 kann die Anzeige der Sätze auf Basis der adaptierten Stufungsregeln modifiziert werden. In einem Schritt 1725 können die Stufungsregeln weiter adaptiert werden und die Anzeige kann weiter modifiziert werden, während menschliches Feedback empfangen wird. In einem Schritt 1730 kann ein Gesundheitszustand auf Basis des empfangenen menschlichen Feedbacks für eine Mehrzahl von Adaptierungen der Stufungsregeln diagnostiziert werden.
  • 18 stellt ein Beispiel 1800 für eine Personalisierung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar. Das Beispiel 1800 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Die Benutzeroberfläche 1805 und das Plug-in 1810 können mit dem System 105 verbunden sein, wie in 1 beschrieben. Das System 105 kann ein Benutzerregister 1820 aufweisen, das Benutzern und Publishern ermöglichen kann, sich zu registrieren, um Text über das System 105 zu veröffentlichen und zu konsumieren. Es kann eine Stufenmodusschaltfläche 1015 bereitgestellt sein, die einem Benutzer ermöglicht, einen Bearbeitungsmodus ein- oder auszuschalten. Text kann in einem Stufenformat angezeigt werden, und wenn der Stufenbearbeitungsmodus aktiv ist, können Änderungen an dem Stufenformat verfolgt werden und können evaluiert werden, um personalisierte Stufenformatregeln für den Benutzer zu erzeugen.
  • In einem Beispiel kann sich ein Publisher über das Benutzerregister 1810 registrieren und kann publizierten Inhalt zum Gebrauch durch Benutzer des Systems 105 bereitstellen. Publisher-Daten 1820 können Text einschließlich von Büchern, Magazinen, Handbüchern, Prüfungsunterlagen usw. einschließen, die in das System 105 eingegeben werden können. Wortarten und Schlüsselphrasen können von einem NLP-Parser auf Basis von vordefinierten Wortart- und Schlüsselphrasendaten in den Publisher-Daten 1820 identifiziert werden. In einem Beispiel kann ein Prozessor für maschinelles Lernen unbekannte Schlüsselphrasen durch Verarbeiten von Publisher-Daten 1820 identifizieren, um Wörter oder Wortkombinationen als Schlüsselphrasen zu klassifizieren. Die Publisher-Daten 1820, die die Wortarten und Schlüsselphrasen enthalten, können von dem System 105 empfangen werden.
  • Die identifizierten Wortarten und Schlüsselphrasen können gegen einen Satz von Stufenformatierungsregeln evaluiert werden, die Regeln zum Einfügen von Zeilenumbrüchen, Einzügen und anderen Formatierungselementen in die Publisher-Daten 1820 enthalten können. Die Stufenformatierungsregeln können spezifisch sein für ein Schlüsselwort oder eine Wortart oder können für eine Klasse oder einen Typ der Wortart oder Schlüsselphrase definiert werden. Die gestuften Publisher-Daten können dem Publisher zurückgegeben werden, um sie in die Publisher-Daten 1820 aufzunehmen, und können von einem Benutzer über die Benutzeroberfläche 1805 konsumiert werden.
  • 19 stellt ein Verfahren 1900 für eine Personalisierung von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar. Das Verfahren 1900 kann Merkmale bereitstellen wie in 1 bis 5 beschrieben. Die hierin erörterten Systeme und Techniken können verwendet werden, um einen personalisierten Algorithmus zu entwickeln, der für ein Individuum einzigartig ist. Menschen verarbeiten Textinformationen auf verschiedene Weise, und es kann ein persönlicher Lesealgorithmus (PRA) geschaffen werden, der für jede Person optimiert ist. Durch Verfeinern verschiedener Attribute und Beurteilen von Verstehbarkeit und Lesbarkeit können personalisierte Einstellungen entwickelt werden, die zum Formatieren verwendet werden. Diese können geschaffen werden durch Parameteränderungen der Ausgabe des gestuften Textes, die von dem Benutzer vorgenommen werden, damit sie zu der Art passen, wie er Text konsumieren möchte. Anpassungen, die verfolgt werden können, können eine benutzerseitige Anpassung von Steuerungen, Änderungen an einer existierenden Formatierung (z.B. ungestuftem Inhalt), eine Modifikation der Stufung mit mehr oder weniger Einzug, einer oder zwei (oder mehr) Schlüsselphrasen, Stufentextanpassungen einschließlich der Verwendung von benutzerspezifischen Parametern oder Anpassungen dieser Parameter, die automatisch auf Basis einer Benutzerhistorie vorgenommen werden, usw. einschließen.
  • Zum Beispiel können Leseprofile geschaffen werden (eigenständig oder zur Kombination), die auf Basis von Leserkontext die Stufenformatierung modifizieren. Kontextprofile können durch eine Benutzereingabe oder durch automatisierte Evaluierung durch einen Computer mitgeteilt werden, wie beispielsweise für spezifische medizinische und kognitive Zustände (z.B. Legasthenie, Aufmerksamkeitsdefizit-/Hyperaktivitätssyndrom (ADHS), Aufmerksamkeitsdefizitsyndrom und -störung (ADS) usw.), Muttersprachen (z.B. kann ein chinesischer Muttersprachler von einem anderen Format profitieren als ein spanischer Muttersprachler usw.), die Natur des gelesenen Inhalts (z.B. Erzählliteratur, Sachliteratur, Nachrichten, Dichtung usw.), Bildschirmmodi (z.B. Telefon, Tablet, Laptop, Monitor, AR/VR-Vorrichtung usw.). In einem Beispiel kann die Diagnose automatisch gestellt werden anhand von maschinellem Lernen, um Modelle für verschiedene Gesundheitszustände zu erzeugen und Metriken für den Benutzer mit den Modellen zu vergleichen, usw. In einem anderen Beispiel kann ein Benutzer seine eigenen persönlichen Parameter und Ausgabeformate (z.B. Länge, Abstand, Hervorhebung, Einzüge, Zeilenrücklauf usw.), Schriftart, Farbe, Größe, Hintergrundfarbe einstellen.
  • In einem Schritt 1905 kann menschenlesbarer Inhalt von einer mit der Cloud verbundenen Quelle erhalten werden, die Sätze aus Text einschließt. In einem Schritt 1910 ein Register für Individuen und personalisierte Textformatparameter für die Individuen. In einem Beispiel können die Textformatierungsparameter Regeln für die Erzeugung eines gestuften, für ein Individuum personalisierten Textanzeigeformats einschließen. In einem Schritt 1915 kann ein Satz aus Text aus einer Publishing-Quelle empfangen werden, die mit einem Individuum aus dem Register verknüpft ist, und Anzeigesteueranweisungen können erzeugt werden, um die Anzeige des Satzes auf einer Client-Vorrichtung zu steuern. Die Anzeigesteueranweisungen können die personalisierten Textformatparameter für das Individuum verwenden, und die Anweisungen können die Anzeige des Satzes in einem gestuften, für das Individuum personalisierten Format ermöglichen. In einem Beispiel kann die mit der Cloud verbundene Quelle eine Browser-Anwendung sein, und die Browser-Anwendung kann den Satz aus Text an die Textverarbeitungs-Engine liefern.
  • 20 stellt ein Beispiel 2000 für eine duale Anzeige von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar. Das Beispiel 2000 kann ein Merkmal bereitstellen wie in 1 bis 5 beschrieben. Text kann über eine Benutzeroberfläche 2005 empfangen werden. Der Text 2010 kann von dem System 105 verarbeitet werden, um Wortarten und Schlüsselphrasen zu identifizieren. Der Text 2010 (z.B. nicht-gestuft, Originalsprache, gestuft usw.) oder Ausgangstext kann in einem ersten Fenster der Benutzeroberfläche 2005 angezeigt werden. Auch wenn als Beispiel Blocktext verwendet wird, kann der rohe Text Text in einer ersten Sprache, gestufter Text, ein erstes gestuftes Format usw. sein. Modifizierter Text 2015 kann in einem zweiten Fenster der Benutzeroberfläche 2005 angezeigt werden. Der modifizierte Text 2015 kann Text sein, der stufig formatiert, übersetzt, in einem anderen Stufenformat als der Originaltext formatiert ist, usw. In einem Beispiel kann der modifizierte Text 2015 in einem Stufenformat präsentiert werden, das Zeilenumbrüche und Einzüge aus Stufenformatierungsregeln verwendet, die auf Basis der identifizierten Wortarten und Schlüsselphrasen angewendet werden. Der modifizierte Text 2015 kann mit hervorgehobenen (z.B. unterstrichenen, fett dargestellten, farbigen, farblich abgestuften usw.) Wortarten und Schlüsselphrasen präsentiert werden, so dass ein Benutzer in der Lage ist, die Struktur des Textes 2010 zu identifizieren.
  • 21 stellt ein Verfahren 2100 für eine duale Anzeige von gestuftem menschenlesbarem Text anhand einer maschinellen Verarbeitung von natürlicher Sprache auf Basis einer Feedback-Eingabe gemäß einer Ausführungsform dar. Das Verfahren 2100 kann ein Merkmal bereitstellen wie in 1 bis 5 beschrieben. In einem Schritt 2105 kann Text unter Verwendung eines Parsers für die maschinelle Verarbeitung von natürlicher Sprache (NLP) verarbeitet werden (z.B. von dem NLP-Dienst 130 wie in 1 usw. beschrieben). In einem Beispiel kann der NLP-Parser ein neuronales Netz sein. In einem Beispiel verwendet der NLP-Parser eine probabilistische Analyse, um einen Satz in dem Text zu parsen. In einem Schritt 2110 können identifizierte Wortarten und Schlüsselphrasen in dem Text mit entsprechenden Wortart- und Schlüsselphrasen-Tags getaggt werden. In einem Schritt 2115 kann eine Textstufung, die Satzumbrüche und Einzüge enthält, auf Basis von Regeln, die auf die Wortarten und Schlüsselphrasen angewendet werden, erzeugt werden.
  • In einem Schritt 2120 kann der Text an eine erste Anzeigefläche einer Anzeigevorrichtung ausgegeben werden, und der gestufte Text kann an eine zweite Ausgabefläche der Anzeigevorrichtung ausgegeben werden. Die Wortarten und Schlüsselphrasen können in dem gestuften Text hervorgehoben sein. In einem Beispiel kann die Anzeigevorrichtungen eine von Desktop-Computern, Laptops, E-Readern, Tablet-Computern, Armbanduhren, Fernsehgeräten, Autobildschirmen, Smartphones, graphischen Anzeigen, vom Benutzer am Körper getragenen visuellen Anzeigevorrichtungen sein. In einem Beispiel schließen die vom Benutzer am Körper getragenen visuellen Anzeigevorrichtungen Vorrichtungen ein, die ausgewählt sind aus der Gruppe: AV-Headsets, VR-Headsets, Brillen und Kontaktlinsen.
  • 22 stellt ein Beispiel für einen Abhängigkeitsbaum 2200 für die Verarbeitung eines Textes in natürlicher Sprache gemäß einer Ausführungsform dar. Der Abhängigkeitsbaum 2200 zeigt eine Analyse eines Zitats. Für jedes Wort geben die Pfeile an, welche Wörter von ihm modifiziert werden.
  • 24 stellt ein Blockdiagramm eines Beispiels für eine Maschine 2400 dar, an der eine oder mehrere der hierin erörterten Techniken (z.B. Methoden) durchgeführt werden können. In alternativen Ausführungsformen kann die Maschine 2400 als eigenständige Vorrichtung arbeiten oder kann mit anderen Maschinen verbunden (z.B. vernetzt) sein. Bei einem vernetzten Einsatz kann die Maschine 2400 in der Rolle einer Server-Maschine, einer Client-Maschine oder sowohl als auch in Server-Client-Netzumgebungen arbeiten. In einem Beispiel kann die Maschine 2400 als Peer-Maschine in Peer-to-Peer(P2P)- (oder anderen verteilten) Netzumgebungen wirken. Die Maschine 2400 kann ein Personal Computer (PC), ein Tablet-PC, eine Set-Top-Box (STB), ein Personal Digital Assistant (PDA), ein Mobiltelefon, eine Web Appliance, ein Router, ein Switch oder eine Brücke eines Netzes oder eine beliebige Maschine sein, die in der Lage ist, Anweisungen (nacheinander oder auf andere Art) auszuführen, die von dieser Maschine durchzuführende Aktionen spezifizieren. Ferner ist zwar nur eine einzige Maschine dargestellt, aber der Begriff „Maschine“ ist so aufzufassen, dass er jegliche Zusammenstellung von Maschinen einschließt, die individuell oder gemeinsam einen Satz (oder mehrere Sätze) von Anweisungen ausführen, um irgendeine oder mehrere von den hierin erörterten Methoden durchzuführen, wie etwa Cloud-Computing, Software as a Service (SaaS), andere Computerkonfigurationen.
  • Beispiele wie hierin beschrieben können Logik oder eine Reihe von Komponenten oder Mechanismen einschließen oder mit solchen arbeiten. Schaltkreissätze sind eine Zusammenstellung von Schaltkreisen, die in materiellen Einheiten implementiert sind, die Hardware einschließen (z.B. einfache Schaltungen, Gatter, Logik usw.). Die Zugehörigkeit zu einem Schaltkreissatz kann zeitlich flexibel und einer Hardware-Variabilität unterworfen sein. Schaltkreissätze schließen Untersätze ein, die allein oder in Kombination spezifizierte Operationen durchführen, wenn sie arbeiten. In einem Beispiel kann Hardware des Schaltkreissatzes unabänderlich dafür ausgelegt sein, eine spezifische Operation durchzuführen (z.B. verdrahtet sein). In einem Beispiel kann die Hardware des Schaltkreissatzes variabel verbundene physische Komponenten (z.B. Rechenwerke, Transistoren, einfache Schaltungen usw.) einschließen, die ein computerlesbares Medium einschließen, das physikalisch (z.B. magnetisch, elektrisch, durch bewegliche Platzierung von Teilchen mit invarianter Masse usw.) modifiziert wurde, um Anweisungen für die spezifische Operation zu codieren. Bei der Verbindung der physischen Komponenten werden die zugrundeliegenden elektrischen Eigenschaften eines Hardware-Bestandteils verändert, zum Beispiel von einem Isolator in einen Leiter oder umgekehrt. Die Befehle können es über die variablen Verbindungen möglich machen, dass eingebettete Hardware (z.B. die Rechenwerke oder ein Lademechanismus) Elemente des Schaltkreissatzes in Hardware bildet, um Teile der spezifischen Operation auszuführen, wenn sie arbeiten. Demgemäß ist das computerlesbare Medium kommunikationsmäßig mit den anderen Komponenten des Schaltkreissatzmitglieds gekoppelt, wenn die Vorrichtung arbeitet. In einem Beispiel kann jede der physischen Komponenten in mehr als einem Untersatz von mehr als einem Schaltkreissatz verwendet werden. Zum Beispiel können Rechenwerke im Betrieb zu einem Zeitpunkt in einem ersten Schaltkreis eines ersten Schaltkreissatzes verwendet werden und zu einer anderen Zeit von einem zweiten Schaltkreis in dem ersten Schaltkreissatz oder von einem dritten Schaltkreis in einem zweiten Schaltkreissatz verwendet werden.
  • Die Maschine (z.B. ein Computersystem) 2400 kann einen Hardware-Prozessor 2402 (z.B. eine zentrale Verarbeitungseinheit (CPU), einen Grafikprozessor (GPU), einen Hardware-Prozessorkern oder irgendeine Kombination davon), einen Hauptspeicher 2404 und einen statischen Speicher 2406 einschließen, von denen manche oder alle über ein Zwischenglied (z.B. einen Bus) 2408 miteinander kommunizieren können. Die Maschine 2400 kann ferner eine Anzeigeeinheit 2410, eine alphanumerische Eingabevorrichtung 2412 (z.B. eine Tastatur) und eine Benutzeroberflächen(UI)-Navigationsvorrichtung 2414 (z.B. eine Maus) einschließen. In einem Beispiel können die Anzeigeeinheit 2410, die Anzeigevorrichtung 2412 und die Ul-Navigationsvorrichtung 2414 eine Touchscreen-Anzeige sein. Die Maschine 2400 kann außerdem eine Speichervorrichtung (z.B. Laufwerkseinheit) 2416, eine Signalerzeugungseinheit 2418 (z.B. ein Lautsprecher), eine Netzschnittstellenvorrichtung 2420 und einen oder mehrere Sensoren 2421 einschließen, wie etwa einen Sensor eines globalen Positionsbestimmungssystems (GPS), einen Kompass, einen Beschleunigungsmesser oder andere Sensoren. Die Maschine 2400 kann einen Ausgabe-Controller 2428, wie etwa eine serielle (z.B. über Universal Serial Bus (USB) ermöglichte), parallele oder andere drahtgebundene oder drahtlose (z.B. über Infrarot (IR), Nahfeldkommunikation (NFC) usw. eingerichtete) Verbindung sein, um mit einer oder mehreren peripheren Vorrichtungen (z.B. einem Drucker, einem Kartenleser usw.) zu kommunizieren bzw. diese zu steuern.
  • Die Speichervorrichtung 2416 kann ein maschinenlesbares Medium 2422 einschließen, auf dem ein oder mehrere Sätze von Datenstrukturen oder Anweisungen 2424 (z.B. Software) gespeichert sind, die eine oder mehrere von den hierin beschriebenen Techniken oder Funktionen verkörpern oder von diesen verwendet werden. Die Anweisungen 2424 können während ihrer Ausführung durch die Maschine 2400 auch ganz oder zumindest zum Teil innerhalb des Hauptspeichers 2404, innerhalb des statischen Speichers 2406 oder innerhalb des Hardware-Prozessors 2402 liegen. In einem Beispiel können der Hardware-Prozessor 2402, der Hauptspeicher 2404, der statische Speicher 2406 und die Speichervorrichtung 2416 jeweils allein oder in einer beliebigen Kombination ein maschinenlesbares Medium bilden.
  • Auch wenn das maschinenlesbare Medium 2422 als einzelnes Medium dargestellt ist, kann der Begriff „maschinenlesbares Medium“ ein einzelnes Medium oder mehrere Medien (z.B. eine zentralisierte oder verteilte Datenbank und/oder zugehörige Caches und Server) einschließen, die dafür eingerichtet sind, die eine oder die mehreren Anweisungen 2424 zu speichern.
  • Der Begriff „maschinenlesbares Medium“ kann jedes Medium einschließen, das in der Lage ist, Anweisungen zur Ausführung durch die Maschine 2400 zu speichern, zu codieren oder zu übertragen, und das die Maschine 2400 veranlasst, irgendeine oder mehrere von den Techniken der vorliegenden Offenbarung durchzuführen, oder die in der Lage ist, Datenstrukturen, die von solchen Befehlen verwendet werden oder mit diesen verknüpft sind, zu speichern, zu codieren oder zu übertragen. Nicht-beschränkende Beispiele für maschinenlesbare Medien können Festkörperspeicher und optische und magnetische Medien einschließen. In einem Beispiel können maschinenlesbare Medien flüchtige Ausbreitungssignale ausschließen (z.B. nicht-flüchtige maschinenlesbare Speichermedien). Spezifische Beispiele für nicht-flüchtige maschinenlesbare Speichermedien können einschließen: nicht-flüchtigen Arbeitsspeicher, wie etwa Halbleiterspeichervorrichtungen (z.B. elektrisch programmierbaren Nur-Lese-Speicher (EPROM), elektrisch löschbaren Nur-Lese-Speicher (EEPROM)) und Flash-Speichervorrichtungen; Magnetplatten, wie etwa interne Festplatten und Wechselplatten; magneto-optische Platten; und CD-ROM- und DVD-ROM-Platten.
  • Die Anweisungen 2424 können ferner über ein ein Übertragungsmedium nutzendes Kommunikationsnetz 2426 über die Netzschnittstellenvorrichtung 2420 gesendet oder empfangen werden, wofür irgendeines oder einer Reihe von Übertragungsprotokollen (z.B. Frame Relay, Internetprotokoll (IP), Transmission Control Protocol (TCP), User Datagram Protocol (UDP), Hypertext Transfer Protocol (HTTP) usw.) genutzt werden. Beispiele für Kommunikationsnetze können einschließen: ein Local Area Network (LAN), ein Wide Area Network (WAN), ein paketvermitteltes Netz (z.B. das Internet), Mobiltelefonnetze (z.B. zelluläre Netze), Plain-Old-Telephone(POTS)-Netze und drahtlose Datennetze (z.B. die Normenfamilie 802.11 des Institute of Electrical and Electronics Engineers (IEEE), die als Wi-Fi® bezeichnet wird, usw.), die IEEE-Normenfamilie 802.15.4, Peer-to-Peer(P2P)-Netze, Normen des 3rd Generation Partnership Project (3GPP) für drahtlose 4G- und 5G-Kommunikation, einschließlich von: der Normenfamilie von 3GPP Long-Term Evolution (LTE), der Normenfamilie von 3GPP LTE Advanced, der Normenfamilie von 3GPP LTE Advanced Pro, der Normenfamilie von 3GPP New Radio (NR) und anderen. In einem Beispiel kann die Netzschnittstellenvorrichtung 2420 eine oder mehrere physische Buchsen (z.B. Ethernet-, Koaxial- oder Telefonbuchsen) oder eine oder mehrere Antennen zur Verbindung mit dem Kommunikationsnetz 2426 einschließen. In einem Beispiel kann die Netzschnittstellenvorrichtung 2420 eine Mehrzahl von Antennen einschließen, um unter Verwendung mindestens einer von einer Single-Input-Multiple-Output(SIMO)-, Multiple-Input-Multiple-Output(MIMO)- oder Multiple-Input-Single-Output(MISO)-Technik drahtlos zu kommunizieren. Der Begriff „Übertragungsmedium“ ist so aufzufassen, dass er jedes immaterielle Medium einschließt, das in der Lage ist, Anweisungen zur Ausführung durch die Maschine 2400 zu speichern, zu codieren und zu übertragen, und das digitale oder analoge Kommunikationssignale einschließt, oder ein anderes immaterielles Medium, um eine Kommunikation einer solchen Software zu erleichtern.
  • Zusätzliche Anmerkungen
  • Die obige ausführliche Beschreibung schließt Verweise auf die begleitenden Zeichnungen ein, die einen Teil der ausführlichen Beschreibung bilden. Die Zeichnungen zeigen zur Erläuterung spezifische Ausführungsformen, die in die Praxis umgesetzt werden können. Diese Ausführungsformen werden hierin auch als „Beispiele“ bezeichnet. Diese Beispiele können Element zusätzlich zu den gezeigten oder beschriebenen einschließen. Jedoch ziehen die Erfinder auch Beispiele in Betracht, in denen nur solche Elemente bereitgestellt sind, die gezeigt oder beschrieben sind. Darüber hinaus ziehen die Erfinder auch Beispiele in Betracht, die eine beliebige Kombination oder Permutation dieser gezeigten oder beschriebenen Elemente (oder eines oder mehrerer Aspekte davon) einschließen, entweder in Bezug auf ein bestimmtes Beispiel (oder einen oder mehrere Aspekte davon) oder mit Bezug auf andere hierin gezeigte oder beschriebene Beispiele (oder einen oder mehrere Aspekte davon).
  • Alle Veröffentlichungen, Patente und Patentdokumente, auf die in diesem Dokument Bezug genommen wird, werden durch Bezugnahme vollumfänglich hierin aufgenommen, als würden sie einzeln durch Bezugnahme hierin aufgenommen. Im Falle von inkonsistenten Verwendungen zwischen diesem Dokument und den durch eine solche Bezugnahme aufgenommenen Dokumenten ist die Verwendung in der einbezogenen Entgegenhaltung (oder den mehreren) als Ergänzung zu derjenigen in diesem Dokument zu betrachten: bei nicht vereinbaren Inkonsistenzen gilt die Verwendung in diesem Dokument.
  • In diesem Dokument werden die Begriffe „ein/eine“ verwendet, wie dies in Patentdokumenten üblich ist, um einen/eine/eines oder mehr als einen/eine/eines einzuschließen, unabhängig von irgendwelchen anderen Instanzen oder Verwendungen von „mindestens ein/eine/eines“ oder „ein/eine/eines oder mehrere“. In diesem Dokument wird der Begriff „oder“ so verwendet, dass er ein nicht-exklusives oder bezeichnet, so dass „A oder B“ „A, aber nicht B“ und „A und B“ einschließt, solange nicht etwas anderes angegeben ist. In den beigefügten Ansprüchen werden die Begriffe „einschlie-ßen“ und „in dem/der“ als die allgemeinsprachlichen Äquivalente der jeweiligen Ausdrücke „umfassen“ und „wobei“ verwendet. Außerdem sind die Begriffe „einschließen und „umfassen“ in den folgenden Ansprüchen offen, das heißt, Systeme, Vorrichtungen, Artikel oder Prozesse, die Elemente zusätzlich zu den nach einem solchen Begriff in einem Anspruch aufgelisteten einschlie-ßen, sollen immer noch im Bereich dieses Anspruchs liegen. Darüber hinaus werden in den folgenden Ansprüchen die Ausdrücke „erster/erste/erstes“, „zweiter/zweite/zweites“ und „dritter/dritte/drittes“ usw. nur als Bezeichner verwendet und sollen keine numerischen Anforderungen an ihre Objekte stellen.
  • Die obige Beschreibung soll erläuternd, aber nicht beschränkend sein. Zum Beispiel können die oben beschriebenen Beispiele (oder ein oder mehrere Aspekte davon) in Kombination miteinander verwendet werden. Es können andere Ausführungsformen verwendet werden, wie etwa von einem Durchschnittsfachmann, der die obige Beschreibung liest. Die Zusammenfassung soll den Leser in die Lage versetzen, die Natur der technischen Offenbarung schnell zu erfassen, und wird mit der Maßgabe vorgelegt, dass sie nicht zu verwenden ist, um den Bereich oder die Bedeutung der Ansprüche zu interpretieren oder zu beschränken. Außerdem können in der obigen ausführlichen Beschreibung verschiedene Merkmale miteinander gruppiert worden sein, um die Offenbarung zu verschlanken. Dies sollte nicht als so interpretiert werden, als solle ein nicht-beanspruchtes offenbartes Merkmal für irgendeinen Anspruch wesentlich sein. Vielmehr kann der Gegenstand der Erfindung in weniger als allen Merkmalen einer bestimmten offenbarten Ausführungsform liegen. Somit sollen die folgenden Beispiele hiermit in die ausführliche Beschreibung aufgenommen werden, wobei jeder Anspruch für sich selbst, als eigenständige Ausführungsform steht. Der Bereich der Ausführungsform sollte unter Bezugnahme auf die beigefügten Ansprüche zusammen mit dem vollen Bereich der Äquivalente, die für diese Ansprüche gelten können, bestimmt werden.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 63006633 [0001]

    Claims (37)

    1. Computerlesbares Speichermedium, das Anweisungen enthält, die bei ihrer Ausführung eine Hardware-Verarbeitungsschaltung eines Rechensystems veranlassen, Schritte zur Implementierung von gestufter Textformatierung für eine elektronische Anzeige durchzuführen, wobei die Schritte einschließen: Verarbeiten eines Stroms eines menschenlesbaren Textes in einem Parser für eine maschinelle Verarbeitung von natürlicher Sprache (NLP), um Wortarten und Schlüsselphrasen in einem Satz zu identifizieren; Taggen der identifizierten Wortarten gemäß den jeweiligen Arten und Schlüsselphrasen; Erzeugen einer Textstufungsanordnung für die Anzeige des Satzes durch Anwenden vordefinierter Regeln auf die Wortarten und Schlüsselphrasen, wobei die Anzeige des Satzes unter Verwendung der vordefinierten Regeln Umbrüche und Stufen, einschließlich von Einzügen, bereitstellt; und Ausgeben einer die gestufte Textanordnung einschließenden elektronischen Anzeige des Satzes.
    2. Computerlesbares Speichermedium nach Anspruch 1, wobei das Ausgeben der elektronischen Anzeige ein Erzeugen eines elektronischen Dokuments in einem die gestufte Textanordnung definierenden Format umfasst.
    3. Computerlesbares Speichermedium nach Anspruch 1, wobei das Ausgeben der elektronischen Anzeige ein Erstellen einer die gestufte Textanordnung definierenden grafischen Anzeige umfasst.
    4. Computerlesbares Speichermedium nach Anspruch 1, wobei die Schritte ferner umfassen: Erstellen eines oder mehrerer codierter Segmente des Satzes, wobei das eine oder jedes von den codierten Segmenten Text und Metadaten zu einer Position innerhalb der Textstufungsanordnung einschließt.
    5. Computerlesbares Speichermedium nach Anspruch 1, wobei der NLP-Parser ein neuronales Netz umfasst.
    6. Computerlesbares Speichermedium nach Anspruch 1, wobei der NLP-Parser probabilistische Verfahren zum Parsen des Satzes verwendet.
    7. Computerlesbares Speichermedium nach Anspruch 1, wobei die Schritte ferner ein Anzeigen der Textstufungsanordnung auf einer Anzeige einer Anzeigevorrichtung umfassen.
    8. Computerlesbares Speichermedium nach Anspruch 7, wobei die Anzeigevorrichtung eine grafische Anzeige oder eine von einem Benutzer am Körper getragene visuelle Anzeige bereitstellt.
    9. Computerlesbares Speichermedium nach Anspruch 8, wobei die von einem Benutzer am Körper getragene visuelle Anzeige bereitgestellt wird von einem von: einem AV-Headset, einem VR-Headset, einer intelligenten Brille oder intelligenten Kontaktlinsen.
    10. Computerlesbares Speichermedium nach Anspruch 1, wobei die Schritte ferner umfassen: Verarbeiten des Textes in dem Parser für eine maschinelle Verarbeitung von natürlicher Sprache (NLP), um Entitäten in einem Satz zu identifizieren; Taggen der identifizierten Entitäten; und Weiterentwickeln der Textstufungsanordnung durch Anwenden von Regeln auf die Entitäten.
    11. Rechensystem, umfassend: einen Arbeitsspeicher, der ein Bild speichert, das Text enthält; und eine maschinelle Verarbeitungsschaltung, die Anweisungen ausführt, wobei die Anweisungen die maschinelle Verarbeitungsschaltung veranlassen, eine abgebildete Textfolge aus einem ersten Anzeigeformat in ein zweites Anzeigeformat umzuwandeln, mit Schritten zum: Erkennen des Textes in dem Bild und Erzeugen einer maschinenlesbaren Textfolge; Verarbeiten der Textfolge in einem Parser für eine maschinelle Verarbeitung von natürlicher Sprache (NLP), um Wortarten in der Textfolge zu identifizieren; Taggen der identifizierten Wortarten gemäß ihrer Art; Erzeugen einer Textstufungsanordnung für die Anzeige der Textfolge durch Anwenden vordefinierter Regeln auf die Wortarten und Schlüsselphrasen, wobei die Anzeige des Satzes unter Verwendung der vordefinierten Regeln Umbrüche und eine Stufung, einschließlich von Einzügen, bereitstellt; und Ausgeben einer elektronische Anzeige der Textfolge, die die gestufte Textanordnung einschließt.
    12. Rechensystem nach Anspruch 11, wobei das Ausgeben der elektronischen Anzeige ein Erschaffen eines elektronischen Dokuments in einem Format umfasst, das die gestufte Textanordnung einschließt.
    13. Rechensystem nach Anspruch 11, wobei das Ausgeben der elektronischen Anzeige ein Erstellen einer die gestufte Textanordnung definierenden grafischen Anzeige umfasst.
    14. Rechensystem nach Anspruch 11, wobei die Schritte ferner umfassen: Erstellen eines oder mehrerer codierter Segmente der Textfolge, wobei das eine oder jedes von den codierten Segmenten Text und Metadaten zu einer Position innerhalb der Textstufungsanordnung einschließt.
    15. Rechensystem nach Anspruch 11, wobei der NLP-Parser ein neuronales Netz umfasst.
    16. Rechensystem nach Anspruch 11, wobei der NLP-Parser probabilistische Verfahren zum Parsen des Satzes verwendet.
    17. Rechensystem nach Anspruch 11, wobei die Textfolge Sätze aus Text enthält, und wobei die Umbrüche und Einzüge auf den Satz angewendet werden.
    18. Computersystem nach Anspruch 11, wobei die Schritte dienen zum: Verarbeiten der Textfolge in einem Parser für die maschinelle Verarbeitung von natürlicher Sprache (NLP), um Schlüsselphrasen und Entitäten in der Textfolge zu identifizieren; Taggen der identifizierten Schlüsselphrasen und Entitäten; und Weiterentwickeln der Textstufungsanordnung durch Anwenden von Regeln auf die Schlüsselphrasen und Entitäten.
    19. Rechensystem nach Anspruch 11, wobei die elektronische Anzeige von einer Anzeigevorrichtung bereitgestellt wird, die eine grafische Anzeige oder eine von einem Benutzer am Körper getragene visuelle Anzeige bereitstellt.
    20. Rechensystem nach Anspruch 19, wobei die von einem Benutzer am Körper getragene visuelle Anzeige bereitgestellt wird von einem von: einem AV-Headset, einem VR-Headset, einer intelligenten Brille oder intelligenten Kontaktlinsen.
    21. Cloud-Architektur zur Unterstützung einer Anzeige von Sätzen von menschenlesbarem Text in einem gestuften Format, umfassend: eine mit der Cloud verbundene Quelle für menschenlesbaren Inhalt, der Sätze aus Text einschließt; eine Textverarbeitungs-Engine, die über einen über die Cloud vernetzten Dienst eingesetzt wird, wobei die Textverarbeitungs-Engine eingerichtet ist, um einen Satz aus Text aus einer Publishing-Quelle zu empfangen und Anzeigesteueranweisungen zum Steuern einer Anzeige des Satzes in einer Client-Vorrichtung zu erzeugen, wobei die Anweisungen die Anzeige des Satzes in einem gestuften Format ermöglichen; eine Browser-Anwendung, die an einer Client-Vorrichtung installiert ist, die eine Anzeige aufweist; und eine Plug-in-Komponente, die in der Browser-Anwendung installiert ist und von der die Anzeigesteueranweisungen verwendet werden, um den Satz in einem gestuften Format auf der Anzeige anzuzeigen.
    22. Cloud-Architektur nach Anspruch 21, wobei die mit der Cloud verbundene Quelle die Browser-Anwendung ist, und wobei ferner die Browser-Anwendung den Satz aus Text an die Textverarbeitungs-Engine liefert.
    23. Cloud-Architektur zur Unterstützung einer Anzeige von Sätzen von menschenlesbarem Text in einem gestuften Format, umfassend: eine mit der Cloud verbundene Quelle für menschenlesbaren Inhalt, der Sätze aus Text einschließt; eine Textverarbeitungs-Engine, die in einer Cloud eingesetzt wird, wobei die Textverarbeitungs-Engine eingerichtet ist, um einen Satz aus Text aus einer Publishing-Quelle zu empfangen und Anzeigesteueranweisungen zum Steuern einer Anzeige des Textes in einer Client-Vorrichtung zu erzeugen, wobei die Anweisungen die Anzeige des Satzes in einem gestuften Format ermöglichen; und eine Browser-Anwendung, die an einer Client-Vorrichtung, die eine Anzeige aufweist, installiert ist, wobei die Browser-Anwendung die Anzeigesteueranweisungen verwendet, um den Satz in einem gestuften Format auf der Anzeige anzuzeigen; wobei die mit der Cloud verbundene Quelle die Browser-Anwendung ist, und wobei ferner die Browser-Anwendung den Satz aus Text an die Textverarbeitungs-Engine liefert.
    24. Cloud-Architektur zur Unterstützung einer Anzeige von Sätzen aus menschenlesbarem Text in einem Kaskadenformat, wobei die Cloud-Architektur umfasst: eine mit der Cloud verbundene Quelle für menschenlesbaren Inhalt einschließlich von Sätzen aus Text; und eine Textverarbeitungs-Engine zum: Pflegen eines Registers für Individuen und personalisierte Textformatierungsparameter für die Individuen; und Empfangen eines Satzes aus Text aus einer Publishing-Quelle, die mit einem von den Individuen in dem Register verknüpft ist, und Erzeugen von Anzeigesteueranweisungen zum Steuern einer Anzeige des Satzes in einer Client-Vorrichtung, wobei die Anzeigesteueranweisungen die personalisierten Textformatierungsparameter für das eine Individuum verwenden, wobei die Anweisungen die Anzeige des Satzes in einem gestuften Format, das für Individuen in dem Register personalisiert wurde, ermöglichen.
    25. Cloud-Architektur nach Anspruch 24, wobei die Textformatierungsparameter Regeln für die Erzeugung eines gestuften, für ein Individuum personalisierten Textanzeigeformats einschließen.
    26. Cloud-Architektur nach Anspruch 24, wobei die mit der Cloud verbundene Quelle eine Browser-Anwendung ist, und wobei die Browser-Anwendung den Satz aus Text an die Textverarbeitungs-Engine liefert.
    27. System zum Anzeigen von Sätzen aus menschenlesbarem Text in einem gestuften Format, umfassend: mindestens einen Prozessor; und einen Arbeitsspeicher, der Anweisungen enthält, die, wenn sie von dem mindestens einen Prozessor ausgeführt werden, den mindestens einen Prozessor veranlassen, Schritte durchzuführen zum: a) Parsen des Textes, um Wortarten in einem Satz zu identifizieren; b) Taggen der identifizierten Wortarten gemäß ihrer Art; c) Anwenden von Regeln auf die Wortarten, um Anweisungen zum Anzeigen des Satzes in einem gestuften Format zu erzeugen, wobei die Satzumbrüche und die Stufung einschließlich von Einzügen auf Basis der Regeln definiert werden; d) Anzeigen des Satzes in Fragmenten in dem ersten gestuften Format anhand der Anweisungen; e) Empfangen einer Eingabe, die ein menschliches Feedback für das gestufte Format angibt; f) Adaptieren der Regeln unter Verwendung des menschlichen Feedbacks, um adaptierte Regeln hervorzubringen, wobei das Anwenden der adaptierten Regeln auf den Satz Anweisungen erzeugt, die zu einem adaptierten gestuften Format führen, wobei das adaptierte gestufte Format von dem gestuften Format, für das ein menschliches Feedback empfangen wurde, verschieden ist; und g) Wiederholen der Schritte a) bis f) unter Verwendung der adaptierten Regeln, bis ein Stoppkriterium erfüllt ist.
    28. System nach Anspruch 27, wobei das menschliche Feedback subjektive Benutzereinstellungen oder die Fähigkeit eines Menschen, einen unter Verwendung der Regeln angezeigten Satz zu verstehen, angibt.
    29. System nach Anspruch 27, wobei das menschliche Feedback, das verwendet wird, um die Regeln zu adaptieren, auf einem einzelnen Individuum basiert, und die Regeln spezifisch für das einzelne Individuum adaptiert werden, wobei Regeln bereitgestellt werden können, die für jedes einzelne von einer Mehrzahl von Individuen personalisiert wurden.
    30. System nach Anspruch 27, wobei das Stoppkriterium bereitgestellt wird von einem von: einer Anzahl von Wiederholungen der Schritte a) bis f); einer von einem Menschen empfangenen Eingabe; oder einer Bestimmung, dass die Adaptierungen die Lesbarkeit des gestuften Textes nicht verbessern.
    31. System nach Anspruch 27, ferner einschließend, dass das menschliche Feedback eine Verfolgung von Augenbewegungen und/oder eine Angabe einer Änderung von Abständen von Satzfragmenten, Satzfragmentlängen oder beidem einschließt.
    32. System nach Anspruch 27, wobei der Arbeitsspeicher ferner Anweisungen enthält, die, wenn sie von dem mindestens einen Prozessor ausgeführt werden, den mindestens einen Prozessor veranlassen, Schritte durchzuführen zum: Anzeigen von Sätzen aus menschenlesbarem Text in einem gestuften Format, durch Durchführen von Schritten zum: Parsen des Textes, um Schlüsselphrasen und Entitäten in dem Satz zu identifizieren; Taggen der identifizierten Schlüsselphrasen und Entitäten; und Anwenden von Regeln auf die Schlüsselphrasen und Entitäten, um Schlüsselphrasen- und Entitätsanweisungen zu erzeugen, die verwendet werden, um den Satz in dem gestuften Format anzuzeigen, wobei die Satzumbrüche und die Stufung, einschließlich von Einzügen, von den Regeln definiert werden, wobei das Anzeigen des Satzes in Fragmenten in dem ersten gestuften Format eine Verwendung der Schlüsselphrasen- und Entitätsanweisungen einschließt.
    33. System zum Diagnostizieren eines Gesundheitszustands, der sich auf eine Lesefähigkeit eines untersuchten Menschen auswirkt, umfassend: mindestens einen Prozessor; und einen Arbeitsspeicher, der Anweisungen enthält, die, wenn sie von dem mindestens einen Prozessor ausgeführt werden, den mindestens einen Prozessor veranlassen, Schritte durchzuführen zum: a) Anzeigen von Sätzen in einem gestuften Format für den untersuchten Menschen, wobei die Satzumbrüche und die Stufung, einschließlich von Einzügen, von Regeln definiert werden; b) Empfangen einer Eingabe, die ein menschliches Feedback angibt, das die Fähigkeit des untersuchten Menschen, die Sätze zu verstehen, betrifft; c) Adaptieren der Regeln unter Verwendung des menschlichen Feedbacks, um ein adaptiertes gestuftes Format hervorzubringen, wobei das adaptierte gestufte Format von dem gestuften Format, für das ein menschliches Feedback empfangen wurde, verschieden ist; d) Wiederholen der Schritte a) bis c) unter Verwendung der adaptierten Regeln; und e) Verwenden des empfangenen menschlichen Feedbacks für eine Mehrzahl von Adaptierungen der Regeln zur Diagnostizierung eines Gesundheitszustands.
    34. System nach Anspruch 33, wobei das menschliche Feedback subjektive Benutzereinstellungen oder die Fähigkeit eines Menschen, einen unter Verwendung der Regeln angezeigten Satz zu verstehen, angibt.
    35. System Verfahren nach Anspruch 33, wobei das menschliche Feedback, das verwendet wird, um die Regeln zu adaptieren, auf einem einzelnen untersuchten Menschen basiert, und die Regeln spezifisch für den einzelnen untersuchten Menschen adaptiert werden, wobei Regeln bereitgestellt werden können, die für jeden einzelnen von einer Mehrzahl von untersuchten Menschen personalisiert wurden.
    36. System nach Anspruch 33, wobei das Stoppkriterium ausgewählt ist aus einem von: einer Anzahl von Wiederholungen der Schritte a) bis d); einer von einem Menschen empfangenen Eingabe; oder einer Bestimmung, dass die Adaptierungen die Lesbarkeit des gestuften Textes nicht verbessern.
    37. System nach Anspruch 33, wobei das menschliche Feedback eine Änderung von Abständen angibt von: Satzfragmenten, Satzfragmentlängen oder beidem.
    DE212021000356.7U 2020-04-07 2021-04-07 Erzeugen einer gestuften Textformatierung für elektronische Dokumente und Anzeigen Active DE212021000356U1 (de)

    Applications Claiming Priority (3)

    Application Number Priority Date Filing Date Title
    US202063006633P 2020-04-07 2020-04-07
    US63/006,633 2020-04-07
    PCT/US2021/026270 WO2021207422A1 (en) 2020-04-07 2021-04-07 Generating cascaded text formatting for electronic documents and displays

    Publications (1)

    Publication Number Publication Date
    DE212021000356U1 true DE212021000356U1 (de) 2023-01-03

    Family

    ID=78024057

    Family Applications (1)

    Application Number Title Priority Date Filing Date
    DE212021000356.7U Active DE212021000356U1 (de) 2020-04-07 2021-04-07 Erzeugen einer gestuften Textformatierung für elektronische Dokumente und Anzeigen

    Country Status (5)

    Country Link
    US (1) US20230123328A1 (de)
    CN (1) CN115769219A (de)
    AU (1) AU2021253859A1 (de)
    DE (1) DE212021000356U1 (de)
    WO (1) WO2021207422A1 (de)

    Cited By (1)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US11734491B2 (en) 2021-04-09 2023-08-22 Cascade Reading, Inc. Linguistically-driven automated text formatting

    Families Citing this family (1)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    WO2023149745A1 (en) * 2022-02-04 2023-08-10 Samsung Electronics Co., Ltd. Method and system for enhancing a multimodal input content

    Family Cites Families (15)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US5778402A (en) * 1995-06-07 1998-07-07 Microsoft Corporation Method and system for auto-formatting a document using an event-based rule engine to format a document as the user types
    US6088711A (en) * 1997-07-01 2000-07-11 Microsoft Corporation Method and system for defining and applying a style to a paragraph
    AU2003901428A0 (en) * 2003-03-24 2003-04-10 Objective Systems Pty Ltd A system and method for formatting and distributing reading material
    US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text
    US20100332217A1 (en) * 2009-06-29 2010-12-30 Shalom Wintner Method for text improvement via linguistic abstractions
    WO2014018039A1 (en) * 2012-07-26 2014-01-30 Nuance Communications, Inc. Text formatter with intuitive customization
    US10650089B1 (en) * 2012-10-25 2020-05-12 Walker Reading Technologies Sentence parsing correction system
    EP2915068A4 (de) * 2012-11-02 2016-08-03 Fido Labs Inc System und verfahren zur verarbeitung natürlicher sprache
    US20160111016A1 (en) * 2013-09-17 2016-04-21 Preethi Govindaraj Method of educational instruction
    CA2869871C (en) * 2014-01-03 2023-03-28 Halogen Software Inc. System and method for personality-based formatting of information
    GB2542288A (en) * 2014-04-25 2017-03-15 Mayo Foundation Enhancing reading accuracy, efficiency and retention
    KR20160115566A (ko) * 2015-03-27 2016-10-06 엔트릭스 주식회사 클라우드 스트리밍 서비스 시스템, 이미지와 텍스트의 분리를 통한 이미지 클라우드 스트리밍 서비스 방법 및 이를 위한 장치
    US10635502B2 (en) * 2017-09-21 2020-04-28 Sap Se Scalable, multi-tenant machine learning architecture for cloud deployment
    US11361143B2 (en) * 2019-07-18 2022-06-14 International Business Machines Corporation Proactive rich text format management
    US11170154B1 (en) * 2021-04-09 2021-11-09 Cascade Reading, Inc. Linguistically-driven automated text formatting

    Cited By (1)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US11734491B2 (en) 2021-04-09 2023-08-22 Cascade Reading, Inc. Linguistically-driven automated text formatting

    Also Published As

    Publication number Publication date
    WO2021207422A1 (en) 2021-10-14
    CN115769219A (zh) 2023-03-07
    US20230123328A1 (en) 2023-04-20
    AU2021253859A1 (en) 2022-12-08

    Similar Documents

    Publication Publication Date Title
    DE112022002081T5 (de) Linguistisch gesteuerte automatische textformatierung
    DE112018004376T5 (de) Schützen kognitiver systeme vor auf gradienten beruhenden angriffen durch die verwendung irreführender gradienten
    DE112017006151T5 (de) Anpassbare Verarbeitungskomponenten
    DE69737884T2 (de) Textprozessor
    Gutierrez-Sigut et al. LSE-sign: A lexical database for spanish sign language
    WO2015113578A1 (de) Verfahren zur automatischen sinnerkennung und messung der eindeutigkeit von text
    DE102019001267A1 (de) Dialogartiges System zur Beantwortung von Anfragen
    DE102013003055A1 (de) Verfahren und Vorrichtung zum Durchführen von Suchen in natürlicher Sprache
    DE112021004163T5 (de) Zuschneiden eines kommunikationsinhalts
    DE102018006481A1 (de) Nutzung von Deep-Learning-Techniken zum Bestimmen einer kontextbezogenen Lesereihenfolge in einem Dokument
    DE112018006345T5 (de) Abrufen von unterstützenden belegen für komplexe antworten
    DE102018007165A1 (de) Vorhersage von stilbrüchen innerhalb eines textinhalts
    Haug et al. Neural multi-step reasoning for question answering on semi-structured tables
    DE102019004300A1 (de) Verwendung eines dynamischen speichernetzwerks zum verfolgen digitaler dialogzustände und erzeugen von antworten
    DE112012001794T5 (de) Verfahren zum Bestimmen einer Stimmung aus einem Text
    DE112020003365T5 (de) Überwachte kreuzmodale wiedergewinnung für zeitreihen und text unter verwendung von multimodalen triplettverlusten
    DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
    DE212021000356U1 (de) Erzeugen einer gestuften Textformatierung für elektronische Dokumente und Anzeigen
    DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
    DE112020003538T5 (de) Kreuzmodale wiedergewinnung mit wortüberlappungsbasiertem clustern
    DE112020002129T5 (de) Deep-learning-ansatz für datenverarbeitungsspannen
    DE112021004694T5 (de) Trainieren eines frage-antwort-dialogsystems zum vermeiden von gegnerischen angriffen
    DE102021004562A1 (de) Abwandlung von Szenengraphen auf Grundlage von Befehlen in natürlicher Sprache
    DE102018008268A1 (de) Automatisches Generieren von Anweisungen aus Tutorials zur Suche und Nutzernavigation
    Saeed et al. Medical dataset classification for Kurdish short text over social media

    Legal Events

    Date Code Title Description
    R207 Utility model specification
    R150 Utility model maintained after payment of first maintenance fee after three years