DE102016005962A1 - Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung - Google Patents

Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung Download PDF

Info

Publication number
DE102016005962A1
DE102016005962A1 DE102016005962.1A DE102016005962A DE102016005962A1 DE 102016005962 A1 DE102016005962 A1 DE 102016005962A1 DE 102016005962 A DE102016005962 A DE 102016005962A DE 102016005962 A1 DE102016005962 A1 DE 102016005962A1
Authority
DE
Germany
Prior art keywords
text
output
document
return request
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102016005962.1A
Other languages
English (en)
Inventor
Johannes Köppern
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koppern und Eberts Ug (haftungsbeschrankt)
Original Assignee
Koppern und Eberts Ug (haftungsbeschrankt)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koppern und Eberts Ug (haftungsbeschrankt) filed Critical Koppern und Eberts Ug (haftungsbeschrankt)
Priority to DE102016005962.1A priority Critical patent/DE102016005962A1/de
Publication of DE102016005962A1 publication Critical patent/DE102016005962A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Abstract

Die Erfindung betrifft ein Verfahren zum Ausgeben eines Texts (6) eines Dokuments (7), bei welchem das Dokument (7) in digitaler Form bereitgestellt wird und der Text (6) des Dokuments (7) akustisch an einen Nutzer (9) des Dokuments (7) ausgegeben (8) wird, wobei während der akustischen Ausgabe (8) des Texts (6) eine Rücksprunganforderung (15) erzeugt wird, und durch die Rücksprunganforderung (15) an eine zuvor bereits akustisch ausgegebene Textstelle (17) des Texts (6) zurückgesprungen wird, wobei ein nach der Textstelle (17) folgender Textabschnitt (18) des Texts (6) dann mit einer in der Ausgabeart von der vorhergegangenen akustischen Ausgabe (8) unterschiedlichen weiteren Ausgabe (19) noch einmal ausgegeben wird.

Description

  • Die Erfindung betrifft ein Verfahren zum Ausgeben eines Texts eines Dokuments, bei welchem das Dokument in digitaler Form bereitgestellt wird und der Text des Dokuments akustisch an einen Nutzer des Dokuments ausgegeben wird. Die Erfindung betrifft auch eine Textvorleseeinrichtung zum Ausgeben eines Texts eines Dokuments, mit welcher das Dokument in digitaler Form bereitstellbar ist und der Text des Dokuments akustisch an einen Nutzer des Dokuments ausgebbar ist.
  • Verfahren zum Ausgeben eines Texts eines Dokuments sind aus dem Stand der Technik bekannt. So ist es beispielsweise üblich, dass der Text einem Nutzer des Dokuments vorgelesen beziehungsweise akustisch ausgegeben wird. So kann der Nutzer den Inhalt des Texts auch erfassen, ohne den Text selbst lesen zu müssen.
  • Nachteilig an dem bekannten Verfahren ist jedoch, dass es vorkommen kann, dass der Nutzer nicht den gesamten Inhalt auch sofort versteht, während ihm dieser vorgelesen wird.
  • Es ist Aufgabe der Erfindung, eine Lösung aufzuzeigen, wie ein Text eines Dokuments deutlicher und verständlicher an einen Nutzer des Dokuments ausgegeben werden kann.
  • Diese Aufgabe wird erfindungsgemäß durch ein Verfahren sowie durch eine Textvorleseeinrichtung mit den Merkmalen gemäß den jeweiligen unabhängigen Ansprüchen gelöst. Vorteilhafte Ausführungen der Erfindung sind Gegenstand der abhängigen Ansprüche, der Beschreibung und der Figuren.
  • Bei einem erfindungsgemäßen Verfahren wird ein Text eines Dokuments ausgegeben. Das Dokument wird in digitaler Form bereitgestellt und der Text des Dokuments wird akustisch an einen Nutzer des Dokuments ausgegeben. Als ein wesentlicher Gedanke der Erfindung ist es vorgesehen, dass während der akustischen Ausgabe des Texts eine Rücksprunganforderung erzeugt wird, und durch die Rücksprunganforderung an eine zuvor bereits akustisch ausgegebene Textstelle des Texts zurückgesprungen wird, wobei ein, insbesondere unmittelbar, nach der Textstelle folgender Textabschnitt des Texts dann mit einer in der Ausgabeart von der vorhergegangenen akustischen Ausgabe unterschiedlichen weiteren Ausgabe noch einmal ausgegeben wird.
  • Durch das erfindungsgemäße Verfahren kann der Text deutlicher und verständlicher an den Nutzer ausgegeben werden, da der Textabschnitt des Texts zum wiederholten Mal und in einer anderen Ausgabeart ausgegeben wird.
  • Der Textabschnitt oder ein weiterer Textabschnitt kann gemäß dem Verfahren beispielsweise auch zusätzlich nochmal ein weiteres Mal nach und/oder während der weiteren Ausgabe ausgegeben werden.
  • Insbesondere wird durch die Rücksprunganforderung von einer aktuell vorgelesenen Stelle des Texts zu der von dieser aktuellen Stelle verschiedenen Textstelle zurückgesprungen. Dadurch wird dem Nutzer die Gelegenheit gegeben den Textabschnitt nach der Textstelle in einer anderen Ausgabeart als der bisherigen Ausgabeart zu erfassen beziehungsweise zu rezipieren.
  • Dies hilft dem Verständnis des Nutzers für den Text beispielsweise, falls der Textabschnitt ein kompliziertes Textelement wie eine mathematische Formel oder ein Fremdwort oder eine komplexe Wortzusammensetzung umfasst. Die weitere Ausgabe kann aber auch erfolgen, falls der Nutzer von der vorhergegangenen akustischen Ausgabe abgelenkt wird.
  • In der anderen Ausgabeart bedeutet, dass der Textabschnitt nicht genau so wie durch die vorhergehende akustische Ausgabe ausgegeben wird. Der Textabschnitt kann durch die weitere Ausgabeart aber auch wieder akustisch ausgeben werden, beispielsweise in einer anderen Sprechgeschwindigkeit oder auf einem anderen Tonkanal einer Lautsprechereinheit.
  • Vorzugsweise ist es vorgesehen, dass der Textabschnitt durch die weitere Ausgabe mit einer unterschiedlichen, insbesondere langsameren, Sprechgeschwindigkeit als bei der vorhergegangenen akustischen Ausgabe akustisch ausgegeben wird. Von den unterschiedlichen Ausgabearten werden also auch unterschiedliche Sprechgeschwindigkeiten umfasst. Vorteilhaft ist, dass die vorhergehende akustische Ausgabe des Texts schneller erfolgen kann und der Nutzer somit wenig Zeit zum Anhören aufwenden muss, erst wenn der Textabschnitt ausgegeben wird, welcher als komplex oder zumindest mit einer höheren Wichtigkeit als der restliche Text kategorisiert wird, wird der Textabschnitt durch die weitere Ausgabe noch einmal vorgelesen beziehungsweise akustisch ausgegeben. Die weitere Ausgabe erfolgt dann vorzugsweise mit einer langsameren Sprechgeschwindigkeit als die vorangegangene Ausgabe.
  • Vorzugsweise ist es weiterhin vorgesehen, dass der Textabschnitt durch die weitere Ausgabe visuell und/oder taktil, insbesondere mittels einer Braillezeile, an den Nutzer ausgegeben wird. So kann der Nutzer eine durch den Textabschnitt bereitgestellte Information auch aufnehmen, falls die akustische Ausgabe unmöglich, unklar oder zumindest undeutlich ist. Undeutliche akustische Ausgaben können auftreten, wenn beispielsweise ein Texterkennungsverfahren (OCR – optical character recognition/ICR – intelligent character recognition) fehlerhaft durchgeführt wird oder ein bestimmter Teil des Texts aufgrund seiner Komplexität nicht so einfach in Worte zu fassen ist. Dies kann beispielsweise bei mathematischen Ausdrücken oder aber grafischen Darstellung der Fall sein. Es kann aber auch vorkommen, dass die akustische Ausgabe fehlschlägt, weil der Text in einer unbekannten Sprache verfasst ist. Durch die weitere visuelle Ausgabe wird dem Nutzer die Möglichkeit gegeben, sich den Textabschnitt selbst anzusehen. Ergänzend oder alternativ kann die weitere Ausgabe aber auch über die Braillezeile oder beispielsweise eine andersartig ausgebildete taktile Stimulation der Nerven des Nutzers erfolgen.
  • Vorzugsweise ist es weiterhin vorgesehen, dass der Textabschnitt bei der visuellen Ausgabe größer ausgegeben wird, als dieser während der bereits erfolgten akustischen Ausgabe zusätzlich visuell ausgegeben wird. So kann es sein, dass der Text während der akustischen Ausgabe zusätzlich auch optisch ausgegeben wird und der Textabschnitt dann aufgrund der Rücksprunganforderung durch die weitere Ausgabe nochmal vergrößert optisch ausgegeben wird. Dies hat den Vorteil, dass der Nutzer nun noch einmal die Gelegenheit hat sich den vergrößerten Textabschnitt genauer anzusehen.
  • Vorzugsweise ist es weiterhin vorgesehen, dass während der visuellen Ausgabe des Textabschnitts die ursprüngliche akustische Ausgabe des Texts fortgesetzt wird. Dadurch kann der Nutzer während er den Textabschnitt anhand der visuellen Ausgabe genauer studiert zugleich auch noch der akustischen Ausgabe des dem Textabschnitt nachfolgenden Teil des Texts zuhören. Der Nutzer kann dadurch also zwei unterschiedliche Informationen des Texts gleichzeitig – zum einen visuell und zum anderen auditiv – aufnehmen und kann deshalb die Gesamtinformation des Texts schneller erfassen.
  • Vorzugsweise ist es weiterhin vorgesehen, dass der Textabschnitt durch die weitere Ausgabe ausgegeben wird und zugleich die ursprüngliche akustische Ausgabe des Texts fortgesetzt wird. Dies ist insbesondere möglich, indem beispielsweise ein erster, insbesondere linker, Tonkanal eines Tonausgabegeräts, insbesondere eines Kopfhörers für die weitere Ausgabe genutzt wird und eine zweiter, insbesondere rechter, Tonkanal des Tonausgabegeräts für die weitere Ausgabe genutzt wird. Es können dadurch zwei Informationen des Texts gleichzeitig ausgegeben werden. Vorteilhaft ist, dass der Nutzer somit das ursprüngliche Anhören des Texts nicht unterbrechen muss und somit schneller mit dem Anhören des Texts fertig wird. Insbesondere ist es in diesem Fall vorgesehen, dass die weitere Ausgabe mit einer von einer ersten Stimme der ursprünglichen akustischen Ausgabe unterschiedlichen zweiten Stimme ausgegeben wird. So kann die erste Stimme beispielsweise eine männliche Stimme sein, während die zweite Stimme beispielsweise eine weibliche Stimme sein kann. Der Zuhörer beziehungsweise der Nutzer kann die verschiedenen Informationen, welche durch die Ausgabe und die weitere Ausgabe ausgegeben werden, dadurch schneller und einfacher auseinanderhalten.
  • Vorzugsweise ist es weiterhin vorgesehen, dass die Rücksprunganforderung anhand des Texts abhängig von einer Methode des maschinellen Lernens erzeugt wird und/oder abhängig von einer heuristischen Methode und/oder die Rücksprunganforderung anhand einer Eingabe des Nutzers erzeugt wird. So kann der Text abhängig von der Methode des maschinellen Lernens untersucht werden und es können für die weitere Ausgabe relevante Bereiche des Texts bestimmt werden. So können als der Textabschnitt beispielsweise mathematische Ausdrücke, graphische Darstellungen oder eine besonders wichtige Information des Texts, wie beispielsweise ein Geldbetrag, ein Treffpunkt, ein Datum, eine Unterschrift, ein Stempel oder ein Name, durch die Methode des maschinellen Lernens und/oder durch die heuristische Methode ausgewählt werden. Insbesondere wird durch die Methode des maschinellen Lernens also sowohl die Rücksprunganforderung erzeugt, als auch die Textstelle beziehungsweise eine Position der Textstelle bestimmt. Ergänzend oder alternativ kann der Nutzer auch einschreiten und die Rücksprunganforderung selbst erzeugen, um an die Textstelle zurückzuspringen. Dies ist beispielsweise vorteilhaft, wenn der Nutzer der ursprünglichen akustischen Ausgabe nicht folgen kann oder diese undeutlich ist.
  • Vorzugsweise ist es weiterhin vorgesehen, dass von dem Zeitpunkt des Erzeugens der Rücksprunganforderung anhand einer Sprechgeschwindigkeit der akustischen Ausgabe des Texts und/oder einer Wortanzahl des Texts zur bereits akustisch ausgegebene Textstelle des Texts zurückgesprungen wird. Somit kann ab dem Erzeugen der Rücksprunganforderung zu einer bestimmten Stelle des Texts zurückgesprungen werden, ohne dass hierzu nachfolgend eine Eingabe des Nutzers, beispielsweise eine Angabe der Textstelle, nötig wäre. Dies kann dann beispielsweise ablaufen, indem der Nutzer bemerkt, dass er im letzten akustisch ausgegebenen Satz des Texts etwas nicht verstanden hat. Die Textstelle für den Beginn des Textabschnitts wird dann beispielsweise als Anfang dieses letzten Satzes bestimmt. Es kann aber auch sein, dass durch die Rücksprunganforderung beispielsweise weniger als 1 s oder 2 s oder 3 s oder 4 s oder 5 s einer verstrichenen Zeit im Text zurückgesprungen werden. Das Zurückspringen im Text wird dadurch einfacher, da die Textstelle automatisch und vorhersehbar bestimmt wird und keine weitere Aktion des Nutzers nötig ist.
  • Vorzugsweise ist es weiterhin vorgesehen, dass die Rücksprunganforderung an einer Rücksprunganforderungsstelle des Texts erzeugt wird, und nach Abschluss der weiteren Ausgabe des Textabschnitts wieder an die Rücksprunganforderungsstelle gesprungen wird. So kann nach dem weiteren Ausgeben des Textabschnitts in einfacher Weise gleich wieder dort mit der akustischen Ausgabe weiter gemacht werden, wo diese aufgrund der Rücksprunganforderung unterbrochen wird. Dem Nutzer wird dadurch ein mitunter aufwendiges Suchen nach der Rücksprunganforderungsstelle erspart. Weiterhin kann dadurch vermieden werden, dass ein Teil des Texts von der akustischen Ausgabe vergessen wird.
  • Vorzugsweise ist es weiterhin vorgesehen, dass nach Abschluss der weiteren Ausgabe des Textabschnitts, ab einem Anfang eines mit der vorhergegangenen akustischen Ausgabe, insbesondere zuletzt, ausgegebenen Satzes des Texts, mit der akustischen Ausgabe des Texts fortgefahren wird. Dadurch das akustische Ausgeben ab dem Anfang des zuletzt ausgegebenen Satzes findet der Nutzer einen leichteren Verständniseinstieg in den Text. So kann es beispielsweise sein, dass die Rücksprunganforderung zu einem Zeitpunkt erzeugt wird, zu welchem ein Satz des Texts noch nicht vollständig ausgegeben ist. Falls die akustische Ausgabe nach der weiteren Ausgabe der Textstelle dann genau an der Stelle fortgesetzt wird, an welcher die Rücksprunganforderung erzeugt wurde, so müsste sich der Nutzer den bisher ausgegebenen Teil des Satzes merken, um den Satz zu verstehen. Vorteilhaft beim Fortsetzen der akustischen Ausgabe am Anfang des Satzes ist also, dass der Nutzer den Text leichter verstehen kann.
  • Vorzugsweise ist es weiterhin vorgesehen, dass eine Formatierung des Textabschnitts bei der weiteren Ausgabe angepasst wird und der Textabschnitt bei der weiteren Ausgabe mit der angepassten Formatierung ausgegeben wird. So kann der Textabschnitt für die, insbesondere visuelle, weitere Ausgabe neu gesetzt beziehungsweise neu formatiert werden. Dies bedeutet beispielsweise, dass Wörter oder Zeichen des Textabschnitts positionell neu angeordnet werden und/oder in einer anderen Schriftgröße und/oder einer anderen Schriftart ausgegeben werden als der Textabschnitt ursprünglich vorliegt. Dadurch kann der Textabschnitt von dem Nutzer schneller, einfacher und fehlerfreier erfasst werden.
  • Die Erfindung betrifft auch eine Textvorleseeinrichtung zum Ausgeben eines Texts eines Dokuments. Mit der Textvorleseeinrichtung ist das Dokument in digitaler Form bereitstellbar und der Text des Dokuments ist akustisch an einen Nutzer des Dokuments ausgebbar. Als ein wesentlicher Gedanke der Erfindung ist, dass während der akustischen Ausgabe des Texts eine Rücksprunganforderung erzeugbar ist, und durch die Rücksprunganforderung an eine zuvor bereits akustisch ausgegebene Textstelle des Texts zurückgesprungen werden kann, wobei ein nach der Textstelle folgender Textabschnitt des Texts dann mit einer von der vorhergegangenen akustischen Ausgabe unterschiedlichen weiteren Ausgabe noch einmal ausgebbar ist.
  • Die Textvorleseeinrichtung ist insbesondere für einen sehbehinderten Nutzer als Unterstützungsgerät im beruflichen und/oder privaten Alltag des Nutzers ausgebildet.
  • Insbesondere umfasst die Textvorleseeinrichtung eine Lautsprechereinheit, eine Anzeigeeinheit, eine Eingabeeinheit und eine Verarbeitungseinheit.
  • Die Erfindung betrifft auch ein Computerprogrammprodukt, das auf einem durch einen Computer nutzbaren Medium gespeichert ist, und dazu ausgebildet ist, ein erfindungsgemäßes Verfahren durchzuführen.
  • Die mit Bezug auf das erfindungsgemäße Verfahren vorgestellten bevorzugten Ausführungsformen und deren Vorteile gelten entsprechend für das erfindungsgemäße Computerprogrammprodukt sowie die erfindungsgemäße Textvorleseeinrichtung.
  • Weitere Merkmale der Erfindung ergeben sich aus den Ansprüchen, den Figuren und der Figurenbeschreibung. Alle vorstehend in der Beschreibung genannten Merkmale und Merkmalskombinationen sowie die nachfolgend in der Figurenbeschreibung genannten und/oder in den Figuren alleine gezeigten Merkmale und Merkmalskombinationen sind nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder aber in Alleinstellung verwendbar.
  • Die Erfindung wird nun anhand eines bevorzugten Ausführungsbeispiels sowie unter Bezugnahme auf die beigefügten Zeichnungen näher erläutert.
  • Es zeigen:
  • 1 eine schematische Darstellung eines Ausführungsbeispiels einer erfindungsgemäßen Textvorleseeinrichtung;
  • 2 eine schematische Darstellung eines weiteren Ausführungsbeispiels der Textvorleseeinrichtung;
  • 3 eine schematische Darstellung eines Texts eines Dokuments, welcher durch die Textvorlesevorrichtung ausgegeben wird; und
  • 4 eine weitere schematische Darstellung des Texts.
  • In den Figuren werden gleiche oder funktionsgleiche Elemente mit den gleichen Bezugszeichen versehen.
  • 1 zeigt eine Textvorleseeinrichtung 1. Die Textvorleseeinrichtung 1 umfasst gemäß dem Ausführungsbeispiel eine Lautsprechereinheit 2, eine Verarbeitungseinheit 3, eine Anzeigeeinheit 4 und eine Eingabeeinheit 5.
  • Die Lautsprechereinheit 2 umfasst beispielsweise mehrere Lautsprecher für eine akustische Ausgabe, welche separat voneinander oder aber in einem gemeinsamen Gehäuse integriert angeordnet sind. Die Verarbeitungseinheit 3 umfasst beispielsweise einen Prozessor und ein Speichermedium. Die Anzeigeeinheit 4 ist beispielsweise als Bildschirm oder Projektor ausgebildet. Die Eingabeeinheit 5 ist beispielsweise als Tastatur oder Bedienhebel oder Bedienknopf oder Touchpad oder Gestenerkennungseinheit ausgebildet. Durch die Eingabeeinheit 5 kann die Textvorleseeinrichtung 1, beispielsweise durch einen Nutzer, gesteuert werden.
  • In einem weiteren Ausführungsbeispiel kann auch eine Kombination der Anzeigeeinheit 4 und der Eingabeeinheit 5 vorliegen. So kann die Anzeigeeinheit 4 beispielsweise als berührungsempfindliches Display ausgebildet sein. Ergänzend oder alternativ kann die Eingabeeinheit 5 auch als Braille-Tastatur ausgebildet sein und somit auch zur Ausgabe von Information, insbesondere eines Textes, vorgesehen sein.
  • Es wird ein Text 6 eines Dokuments 7 durch eine akustische Ausgabe 8 mittels der Lautsprechereinheit 2 an einen Nutzer 9 des Dokuments 7 ausgegeben. Das Dokument 7 kann dabei beispielsweise als digitale Datei vorliegen. Der Text 6 kann in einer beliebigen Sprache vorliegen und vielfältige Zeichen oder graphische Elemente umfassen. So können durch den Text 6 auch Bilder oder mathematische Ausdrücke, wie beispielsweise Formeln, dargestellt werden.
  • Gemäß dem Ausführungsbeispiel von 1 wird der Text 6 während der akustischen Ausgabe 8 auch durch die Anzeigeeinheit 4 ausgegeben. So wird im durch die Anzeigeeinheit 4 ausgegebenen Text 6 beispielsweise jeweils die Stelle hervorgehoben, welche gerade durch die akustische Ausgabe 8 ausgegeben wird.
  • 2 zeigt ein weiteres Ausführungsbeispiel der Textvorleseeinrichtung 1. Demnach ist die Lautsprechereinheit 2 als Kopfhörer ausgebildet und die Eingabeeinheit 5 als Mikrofon. Die Lautsprechereinheit 2 und die Eingabeeinheit 5 können in Kombination auch beispielsweise als Sprechgarnitur (Headset) ausgebildet sein.
  • Vorzugsweise kann über ein erstes Lautsprechermodul 10 der Lautsprechereinheit 2 eine erste Information ausgegeben werden, während über ein zweites Lautsprechermodul 11 der Lautsprechereinheit 2 eine von der ersten Information unterschiedliche zweite Information ausgegeben werden kann. Die Lautsprechereinheit 2 ist also insbesondere zumindest im Stereomodus beziehungsweise Zweikanalmodus betreibbar.
  • 3 zeigt das Dokument 7 mit dem Text 6. Der Text 6 wird durch die akustische Ausgabe 8 ausgegeben. Zusätzlich wird der Text 6 gemäß dem Ausführungsbeispiel während der akustischen Ausgabe 8 visuell ausgegeben. Durch einen Unterstrich 12 im Text 6 wird ein bereits akustisch ausgegebener Teil 13 des Texts 6 markiert. Der unterstrichene Teil 13 des Texts 6 wurde also schon durch die akustische Ausgabe 8 ausgegeben. Ein letztes durch die akustische Ausgabe 8 ausgegebene Wort 14 liegt gemäß dem Text 6 von 3 beispielsweise als Zeichenfolge „sea” vor.
  • Insbesondere unmittelbar nach dem letzten akustisch ausgegebenen Wort 14 wird eine Rücksprunganforderung 15 erzeugt. Die Rücksprunganforderung 15 wird an einer Rücksprunganforderungsstelle 16 erzeugt. Die Rücksprunganforderung 15 kann beispielsweise von dem Nutzer 9 erzeugt werden. Der Nutzer 9 erzeugt die Rücksprunganforderung 15 beispielsweise dann, wenn er irgendeinen Teil des bisher akustisch ausgegebenen Texts 6 nicht verstanden hat oder diesen genauer studieren möchte.
  • Die Rücksprunganforderung 15 kann aber auch anhand einer Methode des maschinellen Lernens erzeugt werden. Dadurch kann beispielsweise erkannt werden, wenn in dem Text 6 ein kompliziert zu verstehendes Wort beziehungsweise ein schwierig zu verstehender Ausdruck oder eine Abkürzung, insbesondere ein Akronym, oder ein Smiley oder eine schwer beschreibbare Grafik enthalten ist, welches bei der akustischen Ausgabe 8 nicht ausreichend verständlich ausgesprochen oder beschrieben wird. Grafiken werden insbesondere analysiert und durch Worte beschrieben, welche dann zumindest durch die akustische Ausgabe 8 ausgegeben werden.
  • Durch die Rücksprunganforderung 15 wird an eine zuvor bereits akustisch ausgegebene Textstelle 17 des Texts 6 zurückgesprungen. Ein unmittelbar nach der Textstelle 17 folgender Textabschnitt 18 des Texts 6 wird dann mit einer weiteren Ausgabe 19 noch einmal ausgegeben. Der Textabschnitt 18 liegt beispielsweise gemäß dem Ausführungsbeispiel von 3 als Zeichenfolge „invidunt ut labore” vor. Die Zeichenfolge des Textabschnitts 18 ist zur besseren Anschaulichkeit in 3 und 4 nur mit Konturschrift und nicht ausgefüllt dargestellt. Vorzugsweise liegt der gesamte Text 6, inklusive des Textabschnitts 18, jedoch mit einer einheitlich ausgebildeten Zeichenfolge, also ohne die zur besseren Darstellung gewählten Konturschrift, vor.
  • Weiterhin wird die Textstelle durch die weitere Ausgabe 19 in einer zur akustischen Ausgabe 8 unterschiedlichen Ausgabeart ausgegeben. Das bedeutet nicht, dass die Textstelle 17 durch die weitere Ausgabe 17 nicht auch akustisch ausgegeben werden kann, vielmehr bedeutet dies, dass die Textstelle 17 nicht genau so wieder ausgegeben wird, wie sie durch die akustische Ausgabe 8 bereits ausgegeben wurde. Der Textabschnitt 18 kann durch die weitere Ausgabe 19 also beispielsweise mit einer langsameren Sprechgeschwindigkeit akustisch ausgegeben werden. Ergänzend oder alternativ kann die weitere Ausgabe 19 auch mit einer im Vergleich zur akustischen Ausgabe 8 angepassten Stimme erfolgen. So kann die Stimme beispielsweise heller oder dunkler sein oder aber durch ein anderes Geschlecht oder ein anderes Alter oder eine andere Stimmlage oder eine andere Betonungsweise charakterisiert sein.
  • Ergänzend oder anstatt kann der Textabschnitt 18 aber auch visuell und/oder taktil an den Nutzer 9 durch die weitere Ausgabe 19 ausgegeben werden. Bei der visuellen weiteren Ausgabe 19 wird beispielsweise zu der Textstelle 17 oder dem Textabschnitt 18 vergrößernd herangefahren (hingezoomt) oder lediglich der gesamte Textabschnitt 18 wird, im Vergleich zu einer beispielsweise schon vorhergehenden visuellen Ausgabe des Texts 6, vergrößert durch die Anzeigeeinheit 4 ausgegeben.
  • Vorzugsweise wird der Textabschnitt 18 bei der weiteren Ausgabe 19 bezüglich seiner Formatierung angepasst. So können Wörter des Textabschnitts 18 neu angeordnet beziehungsweise neu gesetzt werden oder aber in einer anderen Farbe, Schriftart oder einem anderen Schrifttyp, wie beispielsweise kursiv oder fett, durch die weitere Ausgabe 19 ausgegeben werden.
  • Es kann auch sein, dass die akustische Ausgabe 8 über das erste Lautsprechermodul 10 erfolgt und die weitere Ausgabe 19 über das zweite Lautsprechermodul 11 erfolgt.
  • Während der weiteren Ausgabe 19 kann die akustische Ausgabe 8 unterbrochen beziehungsweise zeitweise angehalten werden oder aber unbeeinflusst von der Rücksprunganforderung 15 fortgesetzt werden.
  • Das Zurückspringen an die Textstelle 17 erfolgt vorzugsweise anhand einer Sprechgeschwindigkeit der akustischen Ausgabe 8 des Texts 6. So kann die Textstelle 17 beispielsweise derart bestimmt werden, dass an eine Stelle des Texts 6 zurückgesprungen wird, welche vor 1 s oder 10 s oder 30 s vorgelesen beziehungsweise akustisch ausgegeben wurde.
  • Das Zurückspringen an die Textstelle 17 kann aber beispielsweise auch anhand einer bestimmten Wortanzahl erfolgen. So kann von der Rücksprunganforderungsstelle 16 beispielsweise um n Wörter als die bestimmte Wortanzahl im Text 6 zurückgesprungen werden. Ebenso kann um m Silben als die bestimmte Wortanzahl im Text 6 zurückgesprungen werden, wobei es entweder phonetische Silben oder geschriebene Silben sein können.
  • Es kann sein, dass nach Abschluss der weiteren Ausgabe 19 der Textstelle 18 wieder an die Rücksprunganforderungsstelle 16 vor gesprungen wird. Dort kann dann die akustische Ausgabe 8 und gegebenenfalls eine zusätzliche visuelle Ausgabe des Texts 6 fortgesetzt werden.
  • Alternativ wird die akustische Ausgabe 8 nach der weiteren Ausgabe 19 insbesondere ab einem Anfang 20 eines mit der akustischen Ausgabe 8 zuletzt ausgegebenen Satzes 21 des Texts 6 fortgesetzt. Der Anfang 20 ist dabei beispielsweise unmittelbar nach einem Satzzeichen, wie beispielsweise einem Punkt, einem Strichpunkt, einem Komma, einem Ausrufezeichen, einem Fragezeichen oder einem Absatz angeordnet. Der Anfang 20 kann aber auch beispielsweise mehrere bereits vorgelesene Sätze zurück liegen.
  • 4 zeigt den Text 6 des Dokuments 7 analog zu 3, wobei der Textabschnitt 18 als mathematischer Ausdruck, insbesondere eine Formel, ausgebildet ist. Der mathematische Ausdruck wird dann als der Textabschnitt 18 durch die weitere Ausgabe 19 ausgegeben.

Claims (10)

  1. Verfahren zum Ausgeben eines Texts (6) eines Dokuments (7), bei welchem das Dokument (7) in digitaler Form bereitgestellt wird und der Text (6) des Dokuments (7) akustisch an einen Nutzer (9) des Dokuments ausgegeben (8) wird, dadurch gekennzeichnet, dass während der akustischen Ausgabe (8) des Texts (6) eine Rücksprunganforderung (15) erzeugt wird, und durch die Rücksprunganforderung (15) an eine zuvor bereits akustisch ausgegebene Textstelle (17) des Texts (6) zurückgesprungen wird, wobei ein nach der Textstelle (17) folgender Textabschnitt (18) des Texts (6) dann mit einer in der Ausgabeart von der vorhergegangenen akustischen Ausgabe (8) unterschiedlichen weiteren Ausgabe (19) noch einmal ausgegeben wird.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Textabschnitt (18) durch die weitere Ausgabe (19) mit einer unterschiedlichen, insbesondere langsameren, Sprechgeschwindigkeit als bei der vorhergegangenen akustischen Ausgabe (8) akustisch ausgegeben wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Textabschnitt (18) durch die weitere Ausgabe (19) visuell und/oder taktil, insbesondere mittels einer Braillezeile (5), an den Nutzer (9) ausgegeben wird.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der Textabschnitt (18) bei der visuellen Ausgabe (19) größer ausgegeben wird, als dieser während der bereits erfolgten akustischen Ausgabe (8) zusätzlich visuell ausgegeben wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Rücksprunganforderung (15) anhand des Texts (6) abhängig von einer Methode des maschinellen Lernens erzeugt wird und/oder die Rücksprunganforderung (15) anhand einer Eingabe des Nutzers (9) erzeugt wird.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass von dem Zeitpunkt des Erzeugens der Rücksprunganforderung (15) anhand einer Sprechgeschwindigkeit der akustischen Ausgabe (8) des Texts (6) und/oder einer Wortanzahl des Texts (6) zur bereits akustisch ausgegebene Textstelle (17) des Texts (6) zurückgesprungen wird.
  7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Rücksprunganforderung (15) an einer Rücksprunganforderungsstelle (16) des Texts (6) erzeugt wird, und nach Abschluss der weiteren Ausgabe (19) des Textabschnitts (18) wieder an die Rücksprunganforderungsstelle (16) gesprungen wird.
  8. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass nach Abschluss der weiteren Ausgabe (19) des Textabschnitts (18), ab einem Anfang (20) eines mit der vorhergegangenen akustischen Ausgabe (8), insbesondere zuletzt, ausgegebenen Satzes (21) des Texts (6) mit der akustischen Ausgabe (8) des Texts (6) fortgefahren wird.
  9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass eine Formatierung des Textabschnitts (18) bei der weiteren Ausgabe (19) angepasst wird und der Textabschnitt (18) bei der weiteren Ausgabe (19) mit der angepassten Formatierung ausgegeben wird.
  10. Textvorleseeinrichtung (1) zum Ausgeben eines Texts (6) eines Dokuments (7), mit welcher das Dokument (7) in digitaler Form bereitstellbar ist und der Text (6) des Dokuments (7) akustisch an einen Nutzer (9) des Dokuments (7) ausgebbar (8) ist, dadurch gekennzeichnet, dass während der akustischen Ausgabe (8) des Texts (6) eine Rücksprunganforderung (15) erzeugbar ist, und durch die Rücksprunganforderung (15) an eine zuvor bereits akustisch ausgegebene Textstelle (17) des Texts (6) zurückgesprungen werden kann, wobei ein nach der Textstelle (6) folgender Textabschnitt (18) des Texts (6) dann mit einer von der vorhergegangenen akustischen Ausgabe (8) unterschiedlichen weiteren Ausgabe (19) noch einmal ausgebbar ist.
DE102016005962.1A 2016-05-13 2016-05-13 Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung Withdrawn DE102016005962A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102016005962.1A DE102016005962A1 (de) 2016-05-13 2016-05-13 Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016005962.1A DE102016005962A1 (de) 2016-05-13 2016-05-13 Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung

Publications (1)

Publication Number Publication Date
DE102016005962A1 true DE102016005962A1 (de) 2017-11-16

Family

ID=60163602

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016005962.1A Withdrawn DE102016005962A1 (de) 2016-05-13 2016-05-13 Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung

Country Status (1)

Country Link
DE (1) DE102016005962A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US20120245719A1 (en) * 2011-03-23 2012-09-27 Story Guy A Jr Managing playback of synchronized content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US20120245719A1 (en) * 2011-03-23 2012-09-27 Story Guy A Jr Managing playback of synchronized content

Similar Documents

Publication Publication Date Title
Jilka The contribution of intonation to the perception of foreign accent
DE102016125068B4 (de) Verfahren und Vorrichtung zum Handhaben von Audioausgaben
Dellwo Influences of speech rate on the acoustic correlates of speech rhythm: An experimental phonetic study based on acoustic and perceptual evidence
DE602004010069T2 (de) Gerät und verfahren zur vertonung von sprachlauten, sowie tastatur zur bedienung eines solchen gerätes
EP1282112B1 (de) Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf
DE60305645T2 (de) System und Verfahren zur Text-zu-Sprache Umsetzung mit einer Funktion zur Bereitstellung zusätzlicher Information
JP2022533310A (ja) 対象言語のコンテンツを二つの形態で同時表現させ、対象言語の聴解力を向上させるためのシステムと方法
Zhang et al. Syllable frequency and word frequency effects in spoken and written word production in a non-alphabetic script
Cerni et al. Effects of orthographic forms on the acquisition of novel spoken words in a second language
Wang L2 stress perception: The reliance on different acoustic cues
Kim et al. Familiarization effects on word intelligibility in dysarthric speech
DE102008061097A1 (de) Automatisierte Auswahl von Computer-Optionen
Morrill et al. Speaking rate consistency and variability in spontaneous speech by native and non-native speakers of English
DE112015003357T5 (de) Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage
DE60312963T2 (de) Methode und gerät zur schnellen, durch mustererkennung gestützen transkription von gesprochenen und geschriebenen äusserungen
EP3255556A1 (de) Schnell-lese-verfahren und -system für text
DE102016005962A1 (de) Verfahren zum verständlicheren Ausgeben eines Texts eines Dokuments und Textvorleseeinrichtung
Ullas et al. Audiovisual and lexical cues do not additively enhance perceptual adaptation
Tsonos et al. Prosodic mapping of text font based on the dimensional theory of emotions: a case study on style and size
Uchihara et al. Frequency of exposure influences accentedness and comprehensibility in learners’ pronunciation of second language words
Van der Zande et al. Lexically guided retuning of visual phonetic categories
WO2008025612A1 (de) Elektrisches gerät mit einer bedienungsanleitungsroutine und verfahren zur information eines nutzers des elektrischen geräts
EP3115886A1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
Vlaardingerbroek et al. Secondary school external examination systems: Reliability, robustness and resilience
Fish Pedagogy of pitch in L2 Blackfoot

Legal Events

Date Code Title Description
R086 Non-binding declaration of licensing interest
R012 Request for examination validly filed
R016 Response to examination communication
R120 Application withdrawn or ip right abandoned