DE102010027146A1 - Method for displaying degree of difficulty of readability of text in word processor, involves comparing numerical readability subscripts in overview of text, so that readability assessments of passages are compared with each other - Google Patents
Method for displaying degree of difficulty of readability of text in word processor, involves comparing numerical readability subscripts in overview of text, so that readability assessments of passages are compared with each other Download PDFInfo
- Publication number
- DE102010027146A1 DE102010027146A1 DE102010027146A DE102010027146A DE102010027146A1 DE 102010027146 A1 DE102010027146 A1 DE 102010027146A1 DE 102010027146 A DE102010027146 A DE 102010027146A DE 102010027146 A DE102010027146 A DE 102010027146A DE 102010027146 A1 DE102010027146 A1 DE 102010027146A1
- Authority
- DE
- Germany
- Prior art keywords
- readability
- text
- passages
- index
- assessment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
Name der ErfindungName of invention
- »Verfahren zur Darstellung der Lesbarkeits-Einschätzung aller einzelnen Passagen eines Textes im vergleichenden Überblick« (In diesem Dokument im Folgenden abgekürzt als »Lesbarkeits-Einschätzung«).»Method for presenting the readability assessment of all individual passages of a text in a comparative overview« (Hereafter abbreviated as "Readability Assessment").
Zugehörigkeit zum technischen GebietAffiliation to the technical field
Die »Lesbarkeits-Einschätzung« gehört zur algorithmisch gestützten Nachbesserung von in Textverarbeitungen erfassten Texten, wie dies z. B. bei Rechtschreibkorrekturen und anderen Analyseverfahren zur Beseitigung von Schwachstellen im Text der Fall ist.The "readability assessment" belongs to the algorithmically supported improvement of texts recorded in word processing, as eg This is the case, for example, with spelling corrections and other analysis methods for eliminating weaknesses in the text.
Dies dient dem Lektorieren von Texten durch den Autor selbst wie durch einen Fremd-Lektor.This serves for the proofreading of texts by the author himself as by a foreign-Lektor.
Unserer Einschätzung nach ist die »Lesbarkeits-Einschätzung« zugehörig zur IPC-Einstufung »G06F Datenverarbeitung«, Untergruppe »17: Digitale Rechen- oder Datenverarbeitungsanlagen oder -verfahren, besonders angepasst an spezielle Funktionen«, darin »G06F17/21 Textverarbeitung« mit Vorrang von »G06F17/28 Verarbeiten oder Übersetzen natürlicher Sprache« und wiederum Vorrang von »G06F17/27 Automatische Analyse, z. B. parsing, Rechtschreibkorrektur«.In our estimation, the "readability assessment" is associated with the IPC classification "G06F Data Processing", Subgroup "17: Digital Computing or Data Processing Equipment or Procedures, Especially Adapted to Special Functions", in which "G06F17 / 21 word processing" takes precedence over »G06F17 / 28 Processing or Translating Natural Language« and in turn precedence of »G06F17 / 27 Automatic analysis, eg. Parsing, spelling correction «.
Bisheriger Stand der TechnikPrevious state of the art
Sprachanalyse zur Bestimmung der Lesbarkeit eines Textes ist Gegenstand der Forschung mindestens seit den zwanziger Jahren des letzten Jahrhunderts (
Lesbarkeit ist hierbei die Einschätzung der Verständlichkeit einer Textpassage, bezogen auf den vom Autor verwendeten Schreibstil.Legibility here is the assessment of the comprehensibility of a text passage, based on the writing style used by the author.
Bis heute gibt es eine weite Differenzierung verschiedenster Formeln, die alle eine brauchbare Einschätzung aber nur der Gesamt-Lesbarkeit eines Textes liefern. Die wichtigsten Kriterien sind hier die textimmanenten Merkmale »Wortschwierigkeit« und »Satzkomplexität«, statistisch bestimmt in Form von Buchstaben oder besser Silben pro Wort sowie Buchstaben, Silben oder Worte pro Satz, wobei diese Kriterien in verschiedenen Formeln zueinander ins Verhältnis gebracht werden.To date, there is a wide differentiation of various formulas, all of which provide a useful assessment but only the overall readability of a text. The most important criteria here are the text-immanent features "word difficulty" and "sentence complexity", determined statistically in the form of letters or better syllables per word as well as letters, syllables or words per sentence, whereby these criteria are compared in different formulas.
Insgesamt mangelt es besonders dem deutschen Markt an Möglichkeiten, Texte auf Lesbarkeit zu analysieren (
Eine Umsetzung in Textverarbeitungen oder selbst direkten, aktuellen Software-Programmen für Textanalyse wie »TextQuest« (
Auswahl einer Formel für die Lesbarkeits-Analyse (gehört noch zu »Stand der Technik«)Selection of a formula for readability analysis (belongs to »state of the art«)
Es existiert eine Vielzahl von Formeln für eine Lesbarkeits-Analyse, die sinnvoll auswertbare Ergebnisse bringen. Sei es die originale, erste Formel von
Welche Formel der Lesbarkeits-Einschätzung hinterlegt ist, ist von nur nebensächlicher Bedeutung. Die bekanntesten Formeln weisen alle einen hohen Grad an Brauchbarkeit für eine Einschätzung der Lesbarkeit auf und variieren nur in Details, die Gegenstand der aktuellen Sprachforschung sind, sich aber insgesamt nur schwach auswirken und unterschiedliche sprachliche Aspekte betonen.Which formula of the readability assessment is deposited is only incidental importance. The best-known formulas all have a high degree of usability for assessing readability and vary only in details that are the subject of current linguistic research, but generally have a weak impact and emphasize different linguistic aspects.
Viele Autoren arbeiten bereits mit „ihrer” Formel, haben sich also für eine der existenten Formeln entschieden und werden dies weiter tun wollen.Many authors are already working with "their" formula, so they have opted for one of the existing formulas and will want to continue doing so.
Entsprechend kann man in unserem Verfahren der »Lesbarkeits-Einschätzung« jede Formel hinterlegen, die auf den Verhältnissen von Buchstaben und Silbenzahlen pro Wort und Satz sowie Wörtern pro Satz oder auch der Auswertung von Häufigkeitslisten von Wörtern einer bestimmten Sprache basiert.Accordingly, in our "readability assessment" method, one can deposit any formula based on the ratios of letters and syllable numbers per word and sentence as well as words per sentence or even the evaluation of frequency lists of words of a particular language.
Prinzipiell gilt unsere in der vergleichenden Anzeige für einzelne Textpassagen (wie Absätze) im Überblick liegende Innovation für alle denkbaren Formeln.In principle, our innovation in the comparative display for individual text passages (such as paragraphs) applies to all imaginable formulas.
Wir mussten uns allerdings für eine gut brauchbare Formel als Basis für den Nutzer entscheiden. So können auch nicht mit mathematischen Grundlagen der einzelnen Formeln vertraute Anwender, die die nicht in vollem Umfang durchblicken, das Verfahren nutzen.However, we had to opt for a well-usable formula as the basis for the user. Thus, users who are not fully familiar with the mathematical principles of the individual formulas can also use the procedure.
So haben wir erhebliche Arbeit darin investiert, eine für die moderne deutsche Sprache im Bereich der Belletristik und des Journalismus bis hin zu Fachbüchern am sinnvollsten greifende Formel zu finden. So we have invested considerable work in finding a formula that makes the most sense for the modern German language in the field of fiction and journalism right through to textbooks.
Dies geschah durch aufwendige statistische Analysen und Vergleiche von vielen Megabyte für die »Lesbarkeits-Einschätzung« sinnhaften Texten.This was done through elaborate statistical analyzes and comparisons of many megabytes for the "readability assessment" of meaningful texts.
Für die Basis-Implementierung wird die ursprüngliche Formel von 1948 von Rudolf Flesch
- 1
-
Dubay, William H. (Herausgeber), 2007: »Unlocking Language: The Classic Readability Studies«, BookSurge LIc. (Nachdruck des vergriffenen Originalaufsatzes) www.wikipedia.de
- • DSL: Die durchschnittliche Satzlänge ergibt sich, indem die Anzahl der Wörter im Text durch die Anzahl der Sätze des Textes dividiert wird.
- • DSW: Die durchschnittliche Silbenanzahl pro Wort ergibt sich, indem die Silbenanzahl des gesamten Textes durch die Anzahl der Wörter im Text dividiert wird.
- • LI: Der Lesbarkeitsindex als Maß für eine Einschätzung der Lesbarkeit.
- 1
-
Dubay, William H. (Editor), 2007: "Unlocking Language: The Classic Readability Studies," BookSurge LIc. (Reprint of the out-of-print original essay) www.wikipedia.de
- • DSL: The average sentence length is obtained by dividing the number of words in the text by the number of sentences in the text.
- • DSW: The average number of syllables per word is calculated by dividing the syllable count of the entire text by the number of words in the text.
- • LI: the readability index as a measure of readability.
Angepasst wurde diese »Flesch«-Formel an die deutsche Sprache dadurch, dass bei Wörtern, die auf ein »e« enden, die Silbenzählung für dies Wort um »1« reduziert wurde, ausgehend von der Überlegung, dass bei vielen Wörtern mit endständigem »e« dies nicht als hinzukommende Silbe empfunden wird. Relevant ist hier allerdings nicht die Empfindung, sondern aufwendige statistische Analyse.This "Flesch" formula was adapted to the German language by reducing the syllable count for this word by "1" for words ending in "e", based on the consideration that many words with a terminal " This is not perceived as an added syllable. Relevant here, however, is not sensation, but elaborate statistical analysis.
Statistische Analysen haben gezeigt, dass die ursprüngliche »Flesch«-Formel durch diesen zusätzliche Abwandlung hervorragend für die Lesbarkeits-Analyse der deutschen Sprache geeignet ist.Statistical analyzes have shown that the original "Flesch" formula is perfectly suited for the readability analysis of the German language due to this additional modification.
Das der Erfindung zugrunde liegende ProblemThe problem underlying the invention
Für die Erkenntnis, dass eine Verbesserung der Lesbarkeit eines Textes erwünscht ist, muss man gar nicht erst so weit gehen wie William DuBay (
Auch ein kommerzielles Interesse ist schon jede Innovation an sich wert. So beschreibt wiederum DuBay in den gleichen Quellen, dass Zeitschriften durch Erhöhung der Lesbarkeit drastische Absatz-Steigerungen bis zu 60% erfahren hätten. Wie beim »bisherigen Stand der Technik« oben dargelegt, gibt es allerdings bisher keine Möglichkeit herauszufinden, warum ein Text als schwer lesbar eingestuft wird. Ein insgesamt als schwer lesbar eingestufter Text zeigt in der Gesamtanalyse nicht, wo die Passagen vorliegen, die einen Text schwerer lesbar machen.Even a commercial interest is worth every innovation in itself. For example, DuBay describes in the same sources that magazines have experienced drastic sales increases of up to 60% by increasing readability. However, as stated in the "prior art" above, so far there is no way to find out why a text is classified as difficult to read. An overall text that is classified as difficult to read does not show in the overall analysis where the passages are that render a text more difficult to read.
Ebenso besteht das Problem, dass gemessen am Gesamttext gut lesbare Passagen schlecht lesbare kompensieren. Der Text erscheint vom Gesamtindex her gut lesbar, ist dies in etlichen »schwachen« Passagen aber nicht.There is also the problem that, compared to the overall text, easily readable passages compensate for poorly readable passages. The text appears easy to read from the overall index, but this is not the case in a number of "weak" passages.
Einzelne Textpassagen im Überblick und im Vergleich mit benachbarten Textpassagen in ihrer Lesbarkeit einschätzen zu können, um so gezielt die Lesbarkeit an der konkreten Stelle und somit nach und nach durch Auffinden der besonderen Schwerpunkte schlechter Lesbarkeit im gesamten Text verbessern zu können, ist eine bisher nicht gelöste Aufgabe.Being able to assess the readability of individual text passages at a glance and in comparison with adjacent passages in order to be able to improve the readability at the specific place and thus gradually by finding the particular focus of poor readability throughout the text is a hitherto unresolved one Task.
Die Darstellung der Lesbarkeit erfolgt bisher einzig in numerischer Form, eine graphische Umsetzung bspw. in einer farbigen Anzeige existiert bisher nicht.The display of readability is done so far only in numerical form, a graphical implementation, for example, in a color display does not exist yet.
Texte müssen nach bisherigen Verfahren gezielt einer Lesbarkeits-Analyse unterworfen werden, bis ein Ergebnis vorliegt.Texts must be subjected to a readability analysis in a targeted manner, according to previous procedures, until a result is obtained.
Ein einfaches Hinzuschalten einer Lesbarkeits-Analyse beim normalen Bearbeiten eines Textes war bisher nicht möglich. Die Möglichkeit eines direkten Änderns einer gefundenen Schwachstelle mit sofort aktualisierter Anzeige der neuen Lesbarkeits-Einschätzung existierte bisher nicht.It was not possible to simply add a readability analysis while editing a text normally. The possibility of directly changing a found vulnerability with immediately updated display of the new readability assessment did not exist so far.
Problemlösung und Verbesserungen des bekannten Standes der Technik durch die »Lesbarkeits-Einschätzung«Problem solving and improvements of the known state of the art through the »readability assessment«
Auflösung der Lesbarkeitsanalyse auf Textpassagen (wie Absätze)Resolution of the readability analysis on text passages (as paragraphs)
Die »Lesbarkeits-Einschätzung« geht einen neuen Weg, indem nicht der gesamte Text Ziel der Lesbarkeits-Analyse ist, sondern der Text für die Analyse in einzelne Textpassagen aufgetrennt wird.The "readability assessment" takes a new path, in that the entire text is not the goal of the readability analysis, but the text is separated into individual passages of text for analysis.
Diese Textpassagen sind gleichartige, in sich geschlossene sprachliche Einheiten. Vorgewählte Einheit für die untersuchten Textpassagen ist ein jeder Absatz des Textes (einstellbar sind auch andere Arten von Einheiten wie z. B. Sätze). These text passages are similar, self-contained linguistic entities. The selected unit for the text passages examined is each paragraph of the text (other types of units, such as sentences, can also be set).
Die Innovation steckt in der technischen Umsetzung, die Lesbarkeit aller einzelnen Textpassagen gleichzeitig im gesamten Text sichtbar zu machen, so dass beim Lektorieren des Textes durch den Bearbeiter schwer lesbare Passagen sofort ins Auge springen und direkt korrigierbar sind.The innovation lies in the technical implementation of making the readability of all individual text passages visible in the entire text at the same time, so that hard-to-read passages are immediately apparent when the text is being edited by the editor and can be directly corrected.
Grafische Anzeige der Lesbarkeits-Indizes direkt an den TextpassagenGraphical display of readability indexes directly on the text passages
Die Anzeige der Ergebnisse der Lesbarkeits-Analyse kann numerisch durch Darstellung des Lesbarkeitsindex (LI) neben oder auf den Absätzen erfolgen.The readability analysis results can be displayed numerically by presenting the readability index (LI) next to or on the paragraphs.
Für eine leichte, direkte Erfassung der Lesbarkeits-Einschätzung einer jeden Textpassage durch den Lektor wurde als eine Variante einer gegenüber einer reinen Zahlendarstellung besser erkennbaren grafischen Abbildung der Lesbarkeits-Index mit einer Funktion auf einen Farbraum abgebildet.For easy, direct detection by the lecturer of the readability assessment of each text passage, the readability index with a function was mapped to a color space as a variant of a graphic image that is more easily recognizable than a mere number representation.
Voreingestellt ist eine Abbildung des Wertebereichs des Lesbarkeitsindex auf die Farben des Regenbogens bzw. des entsprechenden Ausschnittes des Farbkreises aus HSV-Werten von Rot über Orange, Gelb und Grün nach Blau, da dies intuitiv gut erfassbar ist.The default setting is an illustration of the range of the readability index on the colors of the rainbow or the corresponding section of the color wheel from HSV values from red to orange, yellow and green to blue, since this is intuitively easy to grasp.
Einsetzbar sind ebenso andere Zuordnungen, die der Bearbeiter als geeignet empfindet, bspw. ein Bereich des Farbraum, der die Ampelfarben von Rot über Gelb nach Grün abbildet. Für farbblinde Nutzer ist auch eine Zuordnung zu Grauwerten einstellbar.Also usable are other assignments that the processor perceives as suitable, for example, an area of the color space which images the traffic light colors from red to yellow to green. For color-blind users, an assignment to gray values can also be set.
Lesbarkeits-Einschätzung direkt beim BearbeitenReadability assessment directly when editing
Grundsätzlich ist auch während der Anzeige der Lesbarkeit eine normale Bearbeitung des Textes im Textverarbeitungssystem möglich. Änderungen der Lesbarkeits-Einschätzung werden somit sofort beim Bearbeiten sichtbar.In principle, even during the display of readability, a normal processing of the text in the word processing system is possible. Changes to the readability assessment are thus immediately visible during editing.
In der Implementierung der »Lesbarkeits-Einschätzung« im Textverarbeitungssystem ermöglicht ein Schalter im Texteingabe-Fenster, dass man zwischen normaler und der Ansicht mit hinterlegter Lesbarkeits-Einschätzung umschalten kann, falls sich der Autor durch die Darstellung der Farben gestört fühlt.In the implementation of the "Readability Assessment" in the word processing system, a switch in the text entry window allows you to switch between normal view and readability assessment, if the author feels disturbed by the appearance of the colors.
Ansonsten ist die Möglichkeit der Textbearbeitung mit und ohne die farbliche Darstellung der Lesbarkeits-Indizes gleichermaßen gegeben.Otherwise, the possibility of text editing with and without the color representation of the readability indexes is equally given.
Die mit der Erfindung erzielten VorteileThe advantages achieved by the invention
Durch die Aufgliederung der Analyse in einzelne Textpassagen als sprachlich geschlossene Texteinheiten (wie Absätze) und deren grafisch umgesetzte Lesbarkeits-Einschätzung sind die besonders schwer lesbaren Passagen eines Texts direkt erkennbar. Dadurch, dass der Text auch während der Anzeige der Lesbarkeit editierbar bleibt, kann sofort in Rückkoppelung mit der Anzeige nachgebessert werden.By breaking down the analysis into individual text passages as linguistically closed text units (such as paragraphs) and their graphically implemented readability assessment, the particularly difficult to read passages of a text are directly recognizable. The fact that the text remains editable while the readability is displayed can be improved immediately after being linked back to the display.
Somit kann der Bearbeiter des Textes gezielt an den sinnvollsten Stellen eingreifen, um den Text sowohl punktuell wie damit auch insgesamt besser lesbar zu machen. Dies gelingt nach der technisch bisher möglichen Gesamtanalyse der Lesbarkeit eines Textes nur schwer. Gar nicht gelingt dies, wenn sich statistische Schwankungen im Text gegenseitig aufheben, so dass schwer lesbare Passagen nicht auffallen und der Autor diese mit analytischen Mitteln nicht bemerkt.Thus, the editor of the text can specifically intervene in the most meaningful places in order to make the text more punctual as well as overall better readable. This is difficult to achieve after the technically possible overall analysis of the readability of a text. This is not possible when statistical fluctuations in the text cancel each other out so that hard-to-read passages are not noticed and the author does not notice them by analytical means.
Auch kann ein Autor erkennen, ob eventuell einen Lesbarkeitsindex »verschlechternde« Passagen durchaus einem Stilmittel entsprechen, sprich, Formulierungen und Passagen beinhalten, die sogenannte »starke« Textpassagen darstellen und aufgrund ihrer Aussagekraft durchaus eine algorithmisch eingeschätzte »schwierigere« Lesbarkeit verkraften.Also, an author can recognize whether any readability index "deteriorating" passages quite a stylistic device, that is, phrases and passages that represent so-called "strong" passages of text and tolerated by their expressiveness quite an algorithmically assessed "difficult" legibility.
In einem Gesamttext würde von einem Gesamt-Negativurteil der Lesbarkeit nur ein »schlechtes Gefühl« verbleiben, ohne dass der Autor wüsste, woher jetzt die negative Einstufung herrührt.In the overall text, a total negative judgment of readability would leave only a "bad feeling" without the author knowing where the negative rating came from.
Insgesamt stellt die hier vorgestellte »Lesbarkeits-Einschätzung« ein Verfahren dar, mittels dem Schriftsteller und Autoren im Sach- und Fachtext-Bereich gezielt besser verständliche Texte schreiben zu können.All in all, the "Readability Assessment" presented here is a method by which writers and authors in the field of subject matter and specialist text can specifically write better understandable texts.
Dies führt im Bereich der Belletristik zu einem »flüssigeren« Lesegefühl (für eine Steigerung der Verkaufszahlen eines Romans durchaus wichtig). Im Bereich von technischen Anleitungen allerdings bewirkt eine bessere Lesbarkeit sofort ein besseren Verständnis seitens des Lesers für die vermittelte Materie. Besser – verständlicher – erklärte Technik wird auch besser genutzt.In the field of fiction, this leads to a more "fluent" reading feeling (quite important for an increase in the sales figures of a novel). In the area of technical instructions, however, a better readability instantly brings a better understanding on the part of the reader for the mediated matter. Better - understandable - explained technique is also better used.
Es wird ein entsprechend hohes Kaufinteresse an einer Implementierung unserer »Lesbarkeits-Einschätzung« erwartet.A correspondingly high level of buying interest in an implementation of our "readability assessment" is expected.
Weiterbildungen und Ausgestaltungen Further developments and refinements
Die für einzelne Textpassagen (wie z. B. Absätze) ermittelten Daten können für statistische Auswertungen der Textpassagen im Bezug zum gesamten Text genutzt werden.The data determined for individual passages of text (such as paragraphs) can be used for statistical evaluations of the text passages in relation to the entire text.
So kann eine sequentielle Darstellung der Lesbarkeits-Indizes aller Absätze als Höhenpunkt in einem Koordinatensystem erfolgen, so dass man auch für lange Texte die Lesbarkeits-Einschätzungen aller Absätze im optischen Überblick hat.Thus, a sequential representation of the readability indices of all paragraphs can be done as a height point in a coordinate system, so that even for long texts the readability assessments of all paragraphs in the optical overview.
Eine Abbildung der Standardabweichung der Lesbarkeits-Indizes über alle Textpassagen (wie Absätze) des Textes vermittelt ein Maß, wie gleichförmig ein Text lesbar ist. An diesem Maß erkennt man, ob über den gesamten Text ein gleichförmiger Lesefluss herrscht oder aber, ob ein mittlerer Lesbarkeits-Index für den gesamten Text nur durch viele als sehr gut lesbar eingeschätzte Absätze ermittelt wurde, die entsprechend viele schlecht lesbare Absätze kompensieren.An illustration of the standard deviation of the readability indices across all text passages (such as paragraphs) of the text provides a measure of how uniform a text is readable. This measure shows whether there is a consistent flow of reading throughout the text, or whether a medium readability index for the entire text has been determined only by many paragraphs that are considered to be very readable, compensating for many badly readable paragraphs.
Ähnliche Erkenntnisse kann man aus einem Histogramm entnehmen, dass die Häufigkeit aller Absätze für bestimmte Bereiche des dazugehörigen Lesbarkeitsindex abbildet.Similar findings can be seen from a histogram that shows the frequency of all paragraphs for specific areas of the associated readability index.
Lesbarkeit wird ebenfalls durch algorithmisch erkennbare Schwächen im Schreibstil beeinflusst. Dies können in engem Textbereich doppelt verwendete Wörter sein, weiter sind anhand von entsprechenden Wortlisten auch typische Füll- und Blähwörter erkennbar, die für den Sinn eines Textes neutral oder sogar negativ sind.Readability is also influenced by algorithmically recognizable writing style weaknesses. These can be doubly used words in a narrow text area, furthermore, with the aid of corresponding word lists, typical filling and swelling words can be recognized, which are neutral or even negative for the meaning of a text.
Koppelt man die aus den genannten Formeln ermittelten Lesbarkeits-Index mit solchen Stilschwächen, so kann ein pro aufgefundener Stilschwäche auf den Lesbarkeits-Index aufgeschlagener Malus in einer präziseren Einschätzung der Lesbarkeit resultieren, die neben den nur aus den Formeln ermittelten Werten weitere Parameter berücksichtigt.By combining the readability index determined by the above formulas with such style weaknesses, a malus added to the readability index for each style defect found can result in a more precise assessment of readability, which takes into account other parameters besides the values determined only from the formulas.
Ausführungsbeispiel der ErfindungEmbodiment of the invention
Das folgende Textbeispiel zeigt die in ihrer Lesbarkeit verschieden eingestuften einzelnen Absätze mit den Farben, die den jeweiligen Lesbarkeitsindizes (LI) zugeordnet sind (sonst als Hintergrundfarbe des Absatzes, hier ersatzweise als HSV-Wert angegeben).The following text example shows the individual paragraphs classified differently in terms of their readability with the colors assigned to the respective readability indices (LI) (otherwise as the background color of the paragraph, in this case as an HSV value).
Inhaltlich sinnleerer Beispieltext für eine »Lesbarkeits-Einschätzung« Ich denke mal, dass ich mit gewichtigen Argumentationshilfen, die ich mir schlicht aus den Fingern gesaugt habe, in grässlicher Bauweise überaus ekelhafte Megabandwurmsätze gebaut bekomme, die selbst eingefleischte Vieltextleser nur mit Erschrecken betrachten werden. Wenn derlei Überlangsätze nunmehr auch noch in einem Langabsatz zusammengefasst werden, dann ist meine Erwartungshaltung sicherlich schnell in Erfüllung gehend, dass eben dieser gigantische Absatz sich als von grässlichster, schwierigster Lesbarkeit seiend entpuppen dürfte. Substantially meaningless sample text for a »readability assessment« I think that with weighty argumentation aids, which I have simply sucked from my fingers, built in horrible construction extremely disgusting megaband worm sentences that will look even diehard multi-text readers with fright. If such overlay sentences are now also summarized in a long paragraph, then my expectation is certainly quickly fulfilled that just this gigantic paragraph should turn out to be the most ghastly, difficult readability.
Hier formuliere ich wirklich ohne jedwedes Bemühen, einen verständlichen Absatz zu schreiben, ich bemühe mich aber auch nicht, den Absatz absichtlich in seiner Lesbarkeit zu verhauen. Ich bin tatsächlich überaus gespannt, ob und wie dabei ein gut erkennbarer Unterschied in Lesbarkeit und Verständlichkeit herauskommt. Wenn alles richtig läuft, dann sollten diese vier Sätze farblich recht gut unterscheidbar sein, dabei von oben nach unten immer einfacherer werdend. Here I really formulate without any effort to write an understandable paragraph, but I also do not make an effort to purposely slash the paragraph in its readability. In fact, I am extremely curious to see if and how a well-recognizable difference in readability and comprehensibility emerges. If all goes well, then these four sentences should be well distinguishable in terms of color, becoming increasingly simpler from top to bottom.
Nun weiß ich so langsam, wie das hier zu funktionieren hat. Und damit kommen wir dem perfekten Ergebnis der neuen Papyrus Lesbarkeits-Einschätzung deutlich näher. Hier kommt denn dann der Schlusssatz, den ich noch zu schreiben habe. Das war eine übergroße Leichtigkeit, dies hier zu schreiben, auch, wenn es ziemlicher Unsinn ist. Now I know how this has to work. And that brings us closer to the perfect result of the new papyrus readability assessment. Here then comes the final sentence, which I still have to write. It was an overwhelming ease to write this, even if it's nonsense.
Es ist an den Farben leicht erkennbar, das ein Überarbeiten des ersten Absatzes den größten Effekt zeigt, um eine Verbesserung der Lesbarkeit des gesamten Textes zu erreichen.It is easily recognizable by the colors that a reworking of the first paragraph shows the biggest effect in order to improve the readability of the entire text.
Durch gezielte Nachbesserung im ersten Absatz erreicht man schnell eine gravierende Verbesserung der Lesbarkeit. By targeted improvement in the first paragraph you can quickly reach a serious improvement in readability.
Ich denke mal, dass ich mit gewichtigen Argumentationshilfen, die ich mir schlicht aus den Fingern gesaugt habe, in grässlicher Bauweise überaus ekelhafte Megabandwurmsätze gebaut bekomme, die selbst eingefleischte Vieltextleser nur mit Erschrecken betrachten werden. Wenn derlei Überlangsätze nunmehr auch noch in einem Langabsatz zusammengefasst werden, dann ist meine Erwartungshaltung sicherlich schnell in Erfüllung gehend, dass eben dieser gigantische Absatz sich als von grässlichster, schwierigster Lesbarkeit seiend entpuppen dürfte. I think that with weighty arguments, which I have simply sucked from my fingers, built in horrible design extremely disgusting megaband worm sentences that will look even diehard multi-text readers with horror. If such overlay sentences are now also summarized in a long paragraph, then my expectation is certainly quickly fulfilled that just this gigantic paragraph should turn out to be the most ghastly, difficult readability.
Ändert man zum Beispiel die im Fettdruck angezeigten, leicht erkennbaren Füllwörter durch Entfernen oder Umschreiben, so ändert sich – während des Bearbeitens sichtbar – die Lesbarkeits-Einschätzung.For example, if you change the easily recognizable filler words shown in bold by removing or rewriting them, the legibility assessment will change - while you are editing.
Ich denke mal, dass ich mit Argumentationshilfen, die ich mir schlicht aus den Fingern gesaugt habe, Bandwurmsätze gebaut bekomme, die selbst Vieltextleser nur mit großem Erschrecken betrachten werden. Wenn derlei Langsätze nunmehr auch noch in einem Langabsatz zusammengefasst werden, dann ist meine Erwartung sicherlich schnell erfüllt, dass eben dieser gigantische Absatz von schwierigster Lesbarkeit sein dürfte. I think that I can get tapeworm sentences built with arguments that I have just sucked from my fingers, even read the multi-text reader with great fright. If such long sentences are now also summarized in a long paragraph, then my expectation is certainly quickly fulfilled that just this gigantic paragraph of the most difficult legibility should be.
Weiteres Anwendungsbeispiel: Dieser AntragFurther application example: This application
Eine erste Arbeitsfassung dieses Antrages enthielt bereits sämtliche Textpassagen und Argumente.A first version of this application already contained all text passages and arguments.
Als besonders schwierig lesbar gekennzeichnete Passagen wurden gezielt durch Vereinfachung der Satzkonstruktionen und der Wortwahl verbessert. So konnte die Lesbarkeit mit wenig Aufwand von unter einer Stunde stark verbessert werden. Die ursprüngliche Lesbarkeit des gesamten Textes von »16,4«, für einen komplexen Fachtext normal, konnte auf deutlich angenehmer lesbare »30,4« angehoben werden.Passages marked as particularly difficult to read have been purposefully improved by simplifying sentence constructions and wording. Thus, the readability could be greatly improved with less effort of less than one hour. The original readability of the entire text of »16.4«, normal for a complex technical text, could be raised to much more pleasant readable »30.4«.
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte Nicht-PatentliteraturCited non-patent literature
- Kitson, H. D., 1921. »The mind of the buyer.« New York: Macmillan [0004] Kitson, HD, 1921. "The Mind of the Buyer." New York: Macmillan [0004]
- Felsch, Claudia, 2004, »Frequentielle Lesbarkeitsanalyse«, Grin Vg. für akad. Texte [0007] Felsch, Claudia, 2004, »Frequential Readability Analysis«, Grin Vg. For akad. Texts [0007]
- http://www.textquest.de [0008] http://www.textquest.de [0008]
- Rudolf Flesch von 1948 (Dubay, William H. (Herausgeber), 2007: »Unlocking Language: The Classic Readability Studies«, BookSurge Llc. – Nachdruck des vergriffenen Originalauf,satzes [0009] Rudolf Flesch, 1948 (Dubay, William H. (Editor), 2007: "Unlocking Language: The Classic Readability Studies," BookSurge, Llc. - Reproduction of the Out of Print Original Edition [0009]
- Toni Amstad von 1978 (Toni Amstad, 1978: »Wie verständlich sind unsere Zeitungen?«, Universität Zürich: Dissertation [0009] Toni Amstad from 1978 (Toni Amstad, 1978: "How understandable are our newspapers?", University of Zurich: Dissertation [0009]
- Dubay, William H. (Herausgeber), 2007: »Unlocking Language: The Classic Readability Studies«, BookSurge LIc. (Nachdruck des vergriffenen Originalaufsatzes) [0017] Dubay, William H. (Editor), 2007: "Unlocking Language: The Classic Readability Studies," BookSurge LIc. (Reprint of the original edition which was out of print) [0017]
- www.wikipedia.de [0017] www.wikipedia.de [0017]
- DuBay, William H., 2004: »Principles of Readability«, (http://www.impact-information.com/impactinfo/readability02.pdf [0020] DuBay, William H., 2004: Principles of Readability, (http://www.impact-information.com/impactinfo/readability02.pdf [0020]
- DuBay, William H., 2006: »Smart Language: Readers, Readability, and the Grading of Text, BookSurge LIc. [0020] DuBay, William H., 2006: "Smart Language: Readers, Readability, and the Grading of Text, BookSurge LIc. [0020]
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102010027146A DE102010027146A1 (en) | 2010-07-09 | 2010-07-09 | Method for displaying degree of difficulty of readability of text in word processor, involves comparing numerical readability subscripts in overview of text, so that readability assessments of passages are compared with each other |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102010027146A DE102010027146A1 (en) | 2010-07-09 | 2010-07-09 | Method for displaying degree of difficulty of readability of text in word processor, involves comparing numerical readability subscripts in overview of text, so that readability assessments of passages are compared with each other |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102010027146A1 true DE102010027146A1 (en) | 2012-01-12 |
Family
ID=45372554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102010027146A Ceased DE102010027146A1 (en) | 2010-07-09 | 2010-07-09 | Method for displaying degree of difficulty of readability of text in word processor, involves comparing numerical readability subscripts in overview of text, so that readability assessments of passages are compared with each other |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102010027146A1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2769427C1 (en) * | 2021-04-05 | 2022-03-31 | Анатолий Владимирович Буров | Method for automated analysis of text and selection of relevant recommendations to improve readability thereof |
WO2022132427A1 (en) * | 2020-12-14 | 2022-06-23 | Microsoft Technology Licensing, Llc | System for analyzing and prescribing content changes to achieve target readability level |
US11537789B2 (en) | 2019-05-23 | 2022-12-27 | Microsoft Technology Licensing, Llc | Systems and methods for seamless application of autocorrection and provision of review insights through adapted user interface |
CN117236343A (en) * | 2023-11-15 | 2023-12-15 | 江西师范大学 | Automatic readability assessment method based on language feature interpreter and contrast learning |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4773009A (en) * | 1986-06-06 | 1988-09-20 | Houghton Mifflin Company | Method and apparatus for text analysis |
-
2010
- 2010-07-09 DE DE102010027146A patent/DE102010027146A1/en not_active Ceased
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4773009A (en) * | 1986-06-06 | 1988-09-20 | Houghton Mifflin Company | Method and apparatus for text analysis |
Non-Patent Citations (9)
Title |
---|
Dubay, William H. (Herausgeber), 2007: »Unlocking Language: The Classic Readability Studies«, BookSurge LIc. (Nachdruck des vergriffenen Originalaufsatzes) |
DuBay, William H., 2004: »Principles of Readability«, (http://www.impact-information.com/impactinfo/readability02.pdf |
DuBay, William H., 2006: »Smart Language: Readers, Readability, and the Grading of Text, BookSurge LIc. |
Felsch, Claudia, 2004, »Frequentielle Lesbarkeitsanalyse«, Grin Vg. für akad. Texte |
http://www.textquest.de |
Kitson, H. D., 1921. »The mind of the buyer.« New York: Macmillan |
Rudolf Flesch von 1948 (Dubay, William H. (Herausgeber), 2007: »Unlocking Language: The Classic Readability Studies«, BookSurge Llc. - Nachdruck des vergriffenen Originalauf,satzes |
Toni Amstad von 1978 (Toni Amstad, 1978: »Wie verständlich sind unsere Zeitungen?«, Universität Zürich: Dissertation |
www.wikipedia.de |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11537789B2 (en) | 2019-05-23 | 2022-12-27 | Microsoft Technology Licensing, Llc | Systems and methods for seamless application of autocorrection and provision of review insights through adapted user interface |
WO2022132427A1 (en) * | 2020-12-14 | 2022-06-23 | Microsoft Technology Licensing, Llc | System for analyzing and prescribing content changes to achieve target readability level |
RU2769427C1 (en) * | 2021-04-05 | 2022-03-31 | Анатолий Владимирович Буров | Method for automated analysis of text and selection of relevant recommendations to improve readability thereof |
CN117236343A (en) * | 2023-11-15 | 2023-12-15 | 江西师范大学 | Automatic readability assessment method based on language feature interpreter and contrast learning |
CN117236343B (en) * | 2023-11-15 | 2024-03-12 | 江西师范大学 | Automatic readability assessment method based on language feature interpreter and contrast learning |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Buchholz et al. | New game, new chance? Social inequalities and upgrading secondary school qualifications in West Germany | |
DE112012001794T5 (en) | Method for determining a mood from a text | |
EP1902407B1 (en) | System for transmitting data from a document application to a data application | |
DE602005002835T2 (en) | Method for identifying redundant text in electronic documents | |
DE102018005611A1 (en) | Automatic pairing of fonts using asymmetric metric learning | |
WO2005029392A1 (en) | Method and system for collecting data from a plurality of machine readable documents | |
DE102018007165A1 (en) | FORECASTING STYLES WITHIN A TEXT CONTENT | |
DE10051680A1 (en) | Scheme showing multiple print job modification items in a print software user interface | |
EP1921422A1 (en) | Method and device for generating a text object | |
DE102010027146A1 (en) | Method for displaying degree of difficulty of readability of text in word processor, involves comparing numerical readability subscripts in overview of text, so that readability assessments of passages are compared with each other | |
DE10352341A1 (en) | Method for changing the dimensions of an electronically stored image | |
Gorozhanov et al. | Corpus analysis of the grammatical categories’ constituents in fiction texts considering the linguo-regional component | |
DE102011003156A1 (en) | Map data, storage medium and navigation device | |
DE3110297C2 (en) | Display device for several groups of characters in a text | |
DE102006043166B4 (en) | Method for processing a digital original layout of a print object, electronic system and computer program | |
DE102018113615A1 (en) | Method for displaying data on a mobile terminal | |
DE102022207482B4 (en) | Computer-implemented method for determining a data quality index, computer program and control unit | |
DE3822671A1 (en) | Method and device for the electronic comparison of continuous lines | |
Simon | Das unerwartete< u> in der altassyrischen Nebenüberlieferung hethitischer Wörter | |
DE19653435A1 (en) | Newspaper automated intelligent layout system for electronic publishing of electronic and print media e.g. newspapers, magazines and computer text systems | |
Müller et al. | The value of words—how digital methods help to connect communication science and economics | |
Siegert et al. | The Academic Self-Concept of Ninth Graders with a Turkish Background and Ninth Graders Without a Migration Background | |
Axjonow | The impact of financial and non-financial disclosure on corporate reputation among non-professional stakeholders | |
Ballwieser | Reflections on Theory and Practice of Financial Reporting: Challenges, Scientific Findings, and Gaps | |
Lohmann et al. | Parental Unemployment Dynamics and Education Trajectories from Primary School to Early Adulthood |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final |
Effective date: 20120522 |