DE102020124144A1

DE102020124144A1 - Verfahren zum Erzeugen einer grafischen Zusammenfassung, ein Computerprogramm und ein System

Info

Publication number: DE102020124144A1
Application number: DE102020124144.5A
Authority: DE
Inventors: Gaurav Sinha; Benito Campos; Saribek Karapetyan
Original assignee: Individual
Current assignee: Vavisual Abstract De GmbH
Priority date: 2020-09-16
Filing date: 2020-09-16
Publication date: 2022-03-17
Also published as: US20240012843A1; WO2022058194A1

Abstract

Verfahren zum Erzeugen einer grafischen Zusammenfassung aus zumindest einem Text mittels eines Rechners, mit folgenden durch den Rechner durchgeführten Schritten:
a) Einlesen des Textes als elektronische Textdatei,
b) Identifizieren vordefinierter Wörter im eingelesenen Text,
c) Zuordnen einer vorgefertigten Grafik zu jeweils einem oder mehreren im Text identifizierten vordefinierten Wörtern,
d) Speichern der Zuordnung aus Schritt c) in einer elektronischen Liste,
e) Erzeugen einer elektronischen Bilddatei aus den Grafiken gemäß den in der elektronischen Liste gespeicherten Zuordnungen, wobei die Grafiken in der elektronischen Bilddatei in Form einer Kollage angeordnet werden,
f) Ausgeben der elektronischen Bilddatei als die zu erzeugende grafische Zusammenfassung des Textes.

Description

Die Erfindung betrifft ein Verfahren zum Erzeugen einer grafischen Zusammenfassung aus zumindest einem Text mittels eines Rechners gemäß den Merkmalen des Anspruchs 1. Die Erfindung betrifft außerdem ein Computerprogramm zur Durchführung eines solchen Verfahrens sowie ein System mit wenigstens einem Rechner und wenigstens einem Speicher, in dem ein derartiges Computerprogramm gespeichert ist.
Wissenschaftliche Fachartikel werden regelmäßig jeweils mit einer Zusammenfassung (Abstract) veröffentlicht, die den Forschern das Suchen und Finden von für sie relevanten Fachartikeln erleichtert. Dennoch zeigt sich in der Praxis, dass das Durchsuchen einer Vielzahl von Fachartikeln bzw. Abstracts sehr aufwendig ist, insbesondere weil der Leseaufwand für viele Abstracts sehr hoch ist und die Konzentration nach einiger Zeit nachlässt. Auch der Aufwand zum Erstellen der Abstracts ist sehr hoch, vor allem bei sehr komplexen Fachartikeln, die zu einem kurzen aussagekräftigen Extrakt zusammengefasst werden sollen.
Der Erfindung liegt die Aufgabe zugrunde, eine automatisierte Lösung anzugeben, mit der die zuvor erläuterten Probleme zumindest reduziert werden.
Diese Aufgabe wird gemäß Anspruch 1 gelöst durch ein Verfahren zum Erzeugen einer grafischen Zusammenfassung aus zumindest einem Text mittels eines Rechners, mit folgenden durch den Rechner durchgeführten Schritten:

a) Einlesen des Textes als elektronische Textdatei,
b) Identifizieren vordefinierter Wörter im eingelesenen Text,
c) Zuordnen einer vorgefertigten Grafik zu jeweils einem oder mehreren im Text identifizierten vordefinierten Wörtern,
d) Speichern der Zuordnung aus Schritt c) in einer elektronischen Liste,
e) Erzeugen einer elektronischen Bilddatei aus den Grafiken gemäß den in der elektronischen Liste gespeicherten Zuordnungen, wobei die Grafiken in der elektronischen Bilddatei in Form einer Kollage angeordnet werden,
f) Ausgeben der elektronischen Bilddatei als die zu erzeugende grafische Zusammenfassung des Textes.

Im Schritt d) kann somit die im Schritt c) ermittelte Zuordnung der bestimmten vorgefertigten Grafik zu jeweils einem oder mehreren im Text identifizierten vordefinierten Wörtern gespeichert werden, z.B. als Verweis auf die Grafik. Alternativ kann auch die Grafik selbst in der elektronischen Liste gespeichert werden.
Für das Erzeugen der elektronischen Bilddatei werden somit die Grafiken, für die in der elektronischen Liste eine Zuordnung gespeichert ist, herangezogen. Die Grafiken können beispielsweise aus einer allgemeinen Datenbank entnommen werden, oder aus der elektronischen Liste, wenn sie dort gespeichert wurden.
Es wird somit automatisiert durch ein computerimplementiertes Verfahren aus dem ursprünglich verfügbaren Text bzw. der Textdatei eine Zusammenfassung erstellt. Die Zusammenfassung enthält grafische Elemente, daher kann sie als grafische Zusammenfassung bezeichnet werden. Die grafischen Elemente werden zusätzlich besonders vorteilhaft in Form einer Kollage angeordnet, d. h. sie können auf einer zweidimensionalen Bildfläche übereinander und/oder nebeneinander angeordnet werden, sowohl fluchtend zueinander als auch in versetzter Anordnung.
Wie ersichtlich ist, steht bei der vorliegenden Erfindung nicht die Vermittlung bestimmter Inhalte oder deren Vermittlung in besonderer Aufmachung im Blickpunkt, sondern die Präsentation von Bildinhalten in einer Weise, die auf die physischen Gegebenheiten der menschlichen Wahrnehmung und Aufnahme von Informationen Rücksicht nimmt. Die Erfindung ist darauf gerichtet, die Wahrnehmung der gezeigten Informationen durch den Menschen in bestimmter Weise überhaupt erst zu ermöglichen, zumindest aber zu verbessern und zweckmäßiger zu gestalten
Da Grafik vom Gehirn des Menschen schneller als Text verarbeitet wird, findet hier eine Beschleunigung der Wahrnehmung statt. Darüber hinaus ist der Inhalt durch die Kondensation der Textmenge mit geringerem Leseaufwand aufzunehmen, wodurch eine Beschleunigung der Aufnahme von Informationen erreicht werden kann. Zudem kann durch die Verbindung von Grafiken mit Text und damit durch die Rücksichtnahme auf die menschliche Aufnahme von Informationen eine bessere Verankerung der aufgenommenen Informationen im Gedächtnis stattfinden. Forschungen zeigen, dass die Fähigkeit Bilder visuell zu verarbeiten, im Millisekundenbereich liegt. Es wurde festgestellt, dass Probanden in der Lage sind, unbekannte Bilder innerhalb von 150 ms korrekt zu interpretieren. Die mittlere Lesegeschwindigkeit hingegen liegt bei jungen, normalsichtigen Probanden auf Englisch und mit standardisierten Lesetafeln (Radner-Lesetafeln) bei 202 Wörtern pro Minute und nimmt mit dem Schwierigkeitsgrad des Textes ab.
Eine theoretische Erklärung für die positiven Effekte von Visualisierungen liefert die kognitive Theorie des multimedialen Lernens aus Text und Bildern. Wenn Lernende referentielle Verbindungen zwischen ihren getrennt entwickelten mentalen Repräsentationen von verbalem und visuellem Material und ihrem Vorwissen herstellen, wird das Lernen gefördert.
Die verwendeten vorgefertigten Grafiken können jeweils als eine elektronische Bilddatei ausgebildet sein.
Das Identifizieren der vordefinierten Wörter im eingelesenen Text kann z.B. anhand eines einfachen Textvergleichs und/oder anhand komplexerer Algorithmen durchgeführt werden, z.B. durch automatische Berücksichtigung grammatikalischer Regeln, Fuzzy Logic und/oder neuronale Netze. Wenn im Text vordefinierte Wörter identifiziert werden, können diese im Text z.B. als einzelne Wörter oder als Teile zusammengesetzter Wörter vorhanden sein. In beiden Fällen kann eine automatische Identifizierung erfolgen.
Die Erfindung kann zur Verbesserung des Aufnehmens von Texten und des Lernens in allen Bereichen eingesetzt werden, d. h. für beliebige Arten von Texten.
Ein besonders vorteilhaftes Anwendungsgebiet der Erfindung liegt im Bereich wissenschaftlicher Texte. Mit der Erfindung kann das automatische Erzeugen grafischer Zusammenfassungen für wissenschaftliche Texte ermöglicht werden. In diesem Bereich besteht ein weiterer Vorteil der Erfindung darin, dass aufgrund der computerimplementierten Lösung die grafischen Zusammenfassungen standardisiert erzeugt werden können und somit nicht vom Geschmack einzelner Verfasser abhängen.
Ein wissenschaftlicher Text ist ein systematisch gegliederter Text, in dem ein oder mehrere Wissenschaftler das Ergebnis seiner oder ihrer eigenständigen Forschung darstellen. Wissenschaftliche Texte entstehen im Allgemeinen an Hochschulen oder anderen, auch privaten, Forschungseinrichtungen und werden von Studenten, Doktoranden, Professoren oder anderen Forschern verfasst. Ein wissenschaftlicher Text beruht auf vorangegangenen wissenschaftlichen Arbeiten, die im wissenschaftlichen Text dargestellt werden.
Wissenschaftliches Arbeiten beschreibt ein methodisch-systematisches Vorgehen, bei dem die Ergebnisse der Arbeit für jeden objektiv nachvollziehbar oder wiederholbar sind. Das bedeutet, Quellen werden offengelegt (zitiert) und Experimente so beschrieben, dass sie reproduziert werden können. Wer eine wissenschaftliche Arbeit liest, kann stets erkennen, auf Grundlage welcher Fakten und Beweise der Autor zu seinen Schlussfolgerungen gelangt ist, auf welche Forschungsergebnisse anderer Wissenschaftler er sich beruft (Zitation) und welche (neuen) Aspekte von ihm sind.
Der als Eingangsgröße eingelesene Text kann der vollständige wissenschaftliche Text oder ein Teil davon sein, zum Beispiel ein bereits vorbereiteter Abstract.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass die vordefinierten Wörter in einer vordefinierten Liste enthalten sind, wobei die Liste in einer elektronischen Datenbank gespeichert ist, wobei in der Datenbank jeweils einem oder mehreren Wörtern eine vorgefertigte Grafik zugeordnet ist. Dies erlaubt eine Erstellung der grafischen Zusammenfassung in einer definierten, standardisierten Weise. Die Nutzung einer solchen Datenbank hat den weiteren Vorteil, dass darauf auch von verschiedenen Orten zugegriffen werden kann, sodass an verschiedenen Orten grafische Zusammenfassungen nach den gleichen Standards erstellt werden können.
Die Zuordnung der vorgefertigten Grafik zu einem oder mehreren Wörtern kann eine eindeutige Zuordnung sein oder eine nicht eindeutige Zuordnung, zum Beispiel eine diffuse Zuordnung nach dem Prinzip der Fuzzy Logic oder dem Prinzip der neuronalen Netze.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass durch den Rechner eine Ausgabedatei erzeugt und ausgegeben wird, die die grafische Zusammenfassung und Metadaten in Textform enthält. Auf diese Weise enthält Ausgabedatei nicht allein grafische Daten, sondern zusätzlich Metadaten in Textform. Dies hat den Vorteil, dass die erstellten Ausgabedateien wiederum automatisch erfasst und ausgewertet werden können, zum Beispiel durch Suchmaschinen. Auch durch eine einfache Textsuche nach Schlagwörtern lässt sich die Ausgabedatei dann auffinden. Die Metadaten können zum Beispiel aus den mit der Grafik verknüpften vordefinierten Wörtern oder zumindest einem Teil davon gebildet sein.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass durch den Rechner jeweils einer Grafik in der grafischen Zusammenfassung eine oder mehrere Metadaten zugeordnet werden, die den Bildinhalt der Grafik beschreiben. Dies hat den Vorteil, dass beispielsweise Suchmaschinen nicht erst eine Analyse der Grafik und Zuordnung eines passenden Begriffs durchführen müssen, sondern direkt auf Metadaten zugreifen können, die den Bildinhalt der Grafik beschreiben.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass durch den Rechner charakteristische Wörter im Text identifiziert werden und anhand der identifizierten charakteristischen Wörter eine Kurzzusammenfassung des Textes in Textform erzeugt wird, wobei durch den Rechner eine Ausgabedatei erzeugt und ausgegeben wird, in der die grafische Zusammenfassung mit der Kurzzusammenfassung kombiniert ist. Hierdurch kann der Informationsgehalt in der Ausgabedatei deutlich gesteigert werden, ohne den Betrachter überfordern. Die Erfassung der Inhalte der Ausgabedatei ist weiterhin relativ schnell möglich und ermüdet den Betrachter nicht so stark wie die Erfassung des gesamten Textes.
Die Kurzzusammenfassung des Textes kann dabei in grafischer Weise mit der grafischen Zusammenfassung kombiniert werden. Dabei können auch verschiedene Teile der Kurzzusammenfassung verteilt angeordnet werden und mit den Grafiken vermischt angeordnet werden. Die Ausgabedatei kann eine reine Bilddatei sein. In diesem Fall kann die Kurzzusammenfassung in ein elektronisches Bildformat gewandelt werden. Die Ausgabedatei kann auch eine Kombination aus den Grafiken (in Form von Bilddateien) und Textbestandteilen der Kurzzusammenfassung sein, zum Beispiel in der Art von HTML-Dokumenten.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass das Layout der grafischen Zusammenfassung unabhängig vom Inhalt des Textes immer gleich aufgebaut ist. Dies hat den Vorteil, dass durch das einheitliche Design beim sequentiellen Betrachten von mehreren grafischen Zusammenfassungen, im Gegensatz zu reinen Textabstracts, eine Beschleunigung der Wahrnehmung stattfindet. Die Fähigkeit, Bilder visuell zu verarbeiten, kann unter konstanten Bedingungen um etwa das Zehnfache auf 13 ms gesteigert werden. Diese Fähigkeit, so kurz gesehene Bilder zu identifizieren, kann dem Gehirn helfen, wenn es entscheidet, wo die Augen fokussiert werden sollen, die in kurzen Bewegungen, Fixierungen genannt, etwa dreimal pro Sekunde von Punkt zu Punkt springen. Die Entscheidung, wohin die Augen zu bewegen sind, kann 100 bis 140 Millisekunden dauern, sodass vorher ein sehr schnelles Verstehen stattfinden muss.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass die Grafiken in wenigstens zwei unterschiedlichen Farben in die grafische Zusammenfassung eingefügt werden. Es können auch mehr als zwei unterschiedlichen Farben zur Unterscheidung der Grafiken eingesetzt werden. Beispielsweise können so viele unterschiedliche Farben wie Grafiken eingesetzt werden, sodass jede Grafik in einer anderen Farbe dargestellt wird.
Farben binden die Aufmerksamkeit eines Betrachters unterschiedlich und schaffen gleichzeitig mehr Nähe oder mehr Distanz. Dadurch kann die Aufmerksamkeit des Betrachters geleitet werden: von der Hauptaussage, zu den Kerninhalten zu den Einzelheiten. Hierdurch gelingt durch Rücksichtnahme auf die physischen Gegebenheiten der menschlichen Wahrnehmung eine Beschleunigung der Wahrnehmung.
Die physiologische Erklärung für dieses Phänomen liegt darin, dass aufgrund der Eigenschaften des menschlichen Auges die violett-blauen Bilder etwas weiter entfernt zu sein scheinen als die Rotlichtbilder, die dem Betrachter etwas näher erscheinen. Das typische gesunde Auge empfängt das blau-grüne Licht (Bilder) direkt auf die Fovea, während das violett-blaue Licht leicht vor der Fovea fokussiert wird. Bei dem Versuch, diese Bilder zu fokussieren, wird die Augenlinse etwas weniger konvex, so dass das/die violett-blaue(n) Bild(er) etwas weiter entfernt zu sein scheinen. Rotes Licht (Bilder) hingegen fokussiert leicht hinter der Fovea. Hier wird die Linse etwas konvexer, so dass die roten Bilder dem Betrachter etwas näher zu sein scheinen.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass die grafische Zusammenfassung oder die Ausgabedatei über ein globales Netzwerk, insbesondere das Internet, an eine Korrekturinstanz übertragen wird und nach Bearbeitung durch die Korrekturinstanz eine korrigierte grafische Zusammenfassung oder Ausgabedatei empfangen wird. Die Korrekturinstanz kann ein automatisch arbeitendes System sein. Die Korrekturinstanz kann auch eine manuelle Nachbearbeitung beinhalten. Auf diese Weise wird die Qualität der erzeugten grafischen Zusammenfassungen noch weiter erhöht.
Gemäß einer vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass

g) der Rechner die im Verfahrensschritt e) erzeugte Bilddatei, zusammen mit dem für die Erzeugung dieser Bilddatei verwendeten Text, elektronisch an Korrekturleser weiterleitet, wobei Korrekturleser mindestens eine vordefinierte Person ist,
h) dann mindestens ein Korrekturleser den Text mit der im Verfahrensschritt c) zugeordneten Grafik vergleicht und
i) mindestens ein Korrekturleser mindestens ein Korrekturergebnis in eine elektronische Datenbank eingibt, wobei das Korrekturergebnis folgenden elektronischen Datenbankeintrag enthält,
j) und zwar, eine Auflistung der in Verfahrensschritt d) aufgelisteten Grafiken, die in der in Verfahrensschritt e) erzeugten Bilddatei enthalten sind und dem für die Erzeugung dieser Bilddatei verwendeten Text in Verfahrensschritt c) falsch zugeordnet wurden,
k) dann nach erfolgtem Datenbankeintrag ein automatischer Datenbankeintrag erzeugt wird, der einem Datenbankadministrator anzeigt, welche Graphiken falsch zugeordnet wurden,
l) dann ein Datenbankadministrator den in Verfahrensschritt j) erzeugten Datenbankeintrag prüft,
m) und zwar eine oder mehrere falsch zugeordnete Grafiken aus der im Verfahrensschritt e) erzeugten Bilddatei löscht und jede falsch zugeordnete Grafik durch eine korrekte Grafik ersetzt.

Dies ermöglicht es, einen automatisch erstellten grafischen Abstract in einem teilautomatisierten Verfahren auf seine inhaltliche Richtigkeit zu überprüfen.
Die eingangs genannte Aufgabe wird außerdem gelöst durch ein Computerprogramm mit Programmcodemitteln eingerichtet zur Durchführung des Verfahrens der zuvor erläuterten Art, wenn das Computerprogramm auf einem Rechner ausgeführt wird. Auch hierdurch werden die zuvor erläuterten Vorteile erzielt.
Die eingangs genannte Aufgabe wird außerdem gelöst durch ein System mit wenigstens einem Rechner und mit wenigstens einem Speicher, in dem ein Computerprogramm der zuvor erläuterten Art gespeichert ist, wobei der Rechner Zugriff auf den Speicher hat und zur Ausführung des Computerprogramms eingerichtet ist. Auch hierdurch werden die zuvor erläuterten Vorteile erzielt.
Zusammengefasst kann gesagt werden, dass die mit der Erfindung erzielten Vorteile insbesondere darin bestehen, dass grafische Abstracts in einem kostengünstigen, schnellen und standardisierten Verfahren automatisch erzeugt werden können. Die erzeugten grafischen Abstracts können mit dem Text-Abstract verknüpft werden, was die Suche mittels gängiger Suchmaschinen ermöglicht.
Die Erfindung wird nachfolgend anhand von Ausführungsbeispielen unter Verwendung von Zeichnungen näher erläutert. Die Zeichnungen zeigen in

1 ein System zur Durchführung des Verfahrens in schematischer Darstellung;
2 einen wissenschaftlicher Text;
3 den Inhalt einer elektronischen Datenbank;
4 eine Basisvorlage für die zu erstellende elektronische Bilddatei;
5 eine erstellte Ausgabedatei mit elektronischer Bilddatei;
6 ein Flussdiagramm für ein Korrekturverfahren;
7 zu korrigierende Bestandteile der elektronischen Bilddatei;
8 ein weiterer wissenschaftlicher Text;
9 eine weitere Ausgabedatei;
10 mehrere Ausgabedateien im Vergleich;
11 Ausfüllvorschriften der Basisvorlage.

Die 1 zeigt ein System 3, mit dem das erfindungsgemäße Verfahren durchgeführt werden kann. Das System 3 weist einen Rechner 4, einen Speicher 5 und eine Datenbank 6 auf. Der Rechner 4 hat Zugriff auf den Speicher 5 und die Datenbank 6. Im Speicher 5 ist ein Computerprogramm gespeichert, durch das bei Ausführung auf dem Rechner 4 das erfindungsgemäße Verfahren ausgeführt wird. In der Datenbank 6 sind die durch das Verfahren zu identifizierenden vordefinierten Wörter 12 in einer vordefinierten Liste enthalten. Dabei ist in der Datenbank 6 jeweils einem oder mehreren Wörtern 12 eine vorgefertigte Grafik 11 zugeordnet, wie nachfolgend noch anhand der 3 erläutert wird.
Dem System 3 wird als Eingangsgröße ein Text 1 in Form einer elektronischen Textdatei zugeführt. Das System 3 erzeugt als Ausgangsgröße eine grafische Zusammenfassung des Textes oder eine mit weiteren Daten angereicherte Ausgabedatei 2. Vor der endgültigen Ausgabe der Ausgabedatei 2 kann ein Korrekturschritt durchgeführt werden. Dabei wird durch das System 3 die bis dahin erzeugte grafische Zusammenfassung oder die Ausgabedatei 2 über ein globales Netzwerk 7 an eine Korrekturinstanz übertragen. Nach Bearbeitung durch die Korrekturinstanz wird eine korrigierte grafische Zusammenfassung oder Ausgabedatei empfangen und im System 3 entweder direkt ausgegeben oder weiterverarbeitet.
Die 2 zeigt einen wissenschaftlichen Text 1 in Form eines Abstracts, wobei der wissenschaftliche Text 1 eine elektronische Textdatei ist. Die Textdatei wird im Verfahrensschritt a) eingelesen. Das Verfahren ist in der Lage, vordefinierte Wörter in dem wissenschaftlichen Text 1 zu identifizieren.
Dabei folgt das Verfahren vorgegebenen Regeln. In diesem Ausführungsbeispiel wird die Art der im Text 1 beschriebenen Studie aus dem wissenschaftlichen Text 1 ermittelt. Das Verfahren wendet in diesem Verfahrensschritt z.B. eine zuvor erstelle Regel an, die lautet:

1. Suche nach den Wörtern „secondary analysis“ UND/ODER „retrospective“ UND/ODER „records review“ UND/ODER „cost-effectiveness analysis“
2. Speichere das Resultat der Suche in der Variable „retrospective_studytype“
3. Suche nach den Wörter „prospective“ UND/ODER „trial“
4. Speichere das Resultat der Suche in der Variable „prospective_studytype“
5. Suche nach den Wörtern „systematic review“ UND/ODER „meta-analysis“ UND/ODER „literature search“
6. Speichere das Resultat der Suche in der Variable „metaanalysis_studytype“
7. WENN (die Variable prospective_studytyp mehr als 0 Suchtreffer enthält UND die Variable retrospective_studytype 0 Suchtreffer enthält UND die Variable metaanalysis_studytype 0 Suchtreffer enthält DANN speichere „studytype: prospective study“) ANSONSTEN (WENN die Variable retrospective_studytyp mehr als 0 Suchtreffer enthält UND die Variable prospective_studytype 0 Suchtreffer enthält DANN speichere „studytype: retrospective study“)
8. WENN (die Variable metaanalysis_studytyp mehr als 0 Suchtreffer enthält DANN speichere „studytype: meta-analysis/systematic review/treatment guidelines“) ANDERNFALLS speichere nichts.

Durch Anwendung der o.g. Regel bei dem wissenschaftlichen Text 1 ist das Verfahren in der Lage, die Art der Studie korrekt als prospektive Studie zu identifizieren und den Studientyp unter der entsprechenden Variable als „prospective study“ in einer elektronischen Datenbank abzuspeichern.
Das Verfahren wendet nun hintereinander weitere vorgegebene Regeln an, um z.B. die Art der im Text 1 beschriebenen Erkrankung zu identifizieren, die Anzahl der untersuchten Probanden zu ermitteln und die Art der untersuchten Studienzielgrößen zu erkennen. Der in diesem Verfahrensschritt dargestellte Regelanwendungsprozess kann vorteilhaft mit „machine learning“-Verfahren ergänzt werden.
In einem weiteren Schritt werden den in den verschiedenen Variablen abgelegten Suchergebnissen vorgefertigte Grafiken 11 zugeordnet, wobei mehr als eine vorgefertigte Grafik 11 in der elektronischen Datenbank 6 gespeichert sind.
Die 3 zeigt beispielhaft den Inhalt der Datenbank 6. In diesem Ausführungsbespiel befinden sich in der elektronischen Datenbank 6 drei vorgefertigte Grafiken 11, wobei die vorgefertigten Grafiken 11 elektronische Bilddateien sind, die in der elektronischen Datenbank 6 gespeichert sind. Es handelt sich um eine Bilddatei mit dem Schriftzug „Prospective study“ (Bilddatei Nr. 1), um das Bild eines Fötus (Bilddatei Nr. 2) und um das Bild eines Mannes mit Krückstock (Bilddatei Nr. 3). Jede dieser drei Bilddateien ist mit sogenannten „tags“ verknüpft, wobei ein „tag“ mindestens ein Wort ist, das in der elektronischen Datenbank 6 gespeichert ist, wobei mindestens ein „tag“ mit mindestens einer vorgefertigten Grafik 6 verknüpft ist. Die „tags“ definieren in diesem Ausführungsbespiel die vordefinierten Wörter 12, die durch das Verfahren im eingelesenen Text 1 zu identifizieren sind, und die damit verknüpften Grafiken 11.
In diesem Ausführungsbeispiel wurde der Studientyp als prospektive Studie identifiziert und in der Variable „studytype“ als „prospective study“ gespeichert. Der Inhalt der Variable wird nun mit den „tags“ aller vorgefertigten Grafiken 11, die in der elektronischen Datenbank 6 gespeichert sind, abgeglichen. Da eine völlige Übereinstimmung zwischen dem Inhalt der Variable und dem tag 1 der Bilddatei Nr. 1 besteht, speichert das Verfahren diese Verknüpfung. Der Schritt wird anschließend für alle weiteren Variablen wiederholt, bis der Inhalt aller gespeicherten Variablen mit allen „tags“ der vorgefertigten Grafiken 11 abgeglichen wurden, wobei jede völlige Übereinstimmung zwischen dem Inhalt einer Variable und dem tag einer Bilddatei als Verknüpfung gespeichert wird.
Dann wird eine elektronische Liste aller Grafiken 11 erstellt, die mit den gespeicherten Variablen durch übereinstimmende „tags“ verknüpft sind, um dann in Verfahrensschritt 1e aus den in der elektronischen Liste genannten Grafiken 11 eine elektronische Bilddatei zu erzeugen, wobei die elektronische Bilddatei eine Kollage der in der elektronischen Liste enthaltenen Grafiken 11 enthält.
Die 4 zeigt eine Basisvorlage für die zu erstellende elektronische Bilddatei. Diese Basisvorlage entspricht einer leeren „Kollagewand“, wobei an vordefinierten Stellen der Basisvorlage Bilddateien eingefügt werden. In diesem Ausführungsbeispiel ist bereits die Bilddatei Nr. 1 (Bilddatei mit dem Schriftzug „Prospective study“) in dem rechten unteren Bilddrittel platziert.
Wie erwähnt, wird aus den in der elektronischen Liste enthaltenen Grafiken 11 eine elektronische Bilddatei oder Ausgabedatei 2 erzeugt, die in 5 beispielhaft dargestellt ist. In diesem Ausführungsbeispiel wurde der Studientyp als prospektive Studie identifiziert und über die Verfahrensschritte mit der Bilddatei Nr. 1 (Bilddatei mit dem Schriftzug „Prospective study“) verknüpft. Bilddatei Nr. 1 wird nun in die Basisvorlage kopiert. Dieser Schritt wird mit allen in der elektronischen Liste enthaltenen Grafiken 11 durchgeführt, bis alle Bilddateien in die „Kollagewand“ integriert wurden. In diesem Ausführungsbeispiel entsteht durch das Verfahren die in 5 wiedergegebene elektronische Ausgabedatei 2.
Wie in diesem Ausführungsbeispiel zu erkennen ist, wurde dabei das Bild eines Fötus in dem linken, oberen Bildabschnitt platziert. Da im zugrundeliegenden Text 1 keine Föten erwähnt werden, handelt es sich um eine fehlerhafte Zuordnung. Fehlerhafte Zuordnungen können automatisiert oder zumindest teilautomatisiert erkannt und behoben werden.
Die 6 zeigt ein Flussdiagramm eines Korrekturverfahrens zur Erkennung und Behebung der fehlerhaften Zuordnungen. Das Verfahren beginnt mit einem Schritt 60. In einem nachfolgenden Schritt 61 werden zumindest Teile der erzeugten elektronischen Bilddatei und der zugrunde liegende Text 1 automatisch an Korrekturleser weitergeleitet. Im nachfolgenden Schritt 62 überprüft mindestens ein Korrekturleser die inhaltliche Richtigkeit der Teile der Bilddatei anhand des zugrunde liegenden wissenschaftlichen Textes 1. Dabei kann das Ergebnis der Prüfung als Datenbankeintrag vom Korrekturleser gespeichert werden. Wird eine falsche Zuordnung erkannt, trägt der Korrekturleser im Schritt 63 in die Datenbank ein, welche Grafiken falsch zugeordnet sind. Andernfalls wird mit dem Schritt 66 fortgefahren, in dem der Korrekturleser in die Datenbank einträgt, dass keine Grafiken zugeordnet sind. Dann kann ein automatischer Datenbankeintrag erzeugt werden, der einem Datenbankadministrator anzeigt, ob und falls zutreffend, welche Graphiken falsch zugeordnet wurden (Schritte 64, 67). Der Datenbankadministrator kann dann falsch zugeordnete Grafiken aus der im Verfahren erzeugten Bilddatei löschen und jede falsch zugeordnete Grafik durch eine in der Datenbank 6 enthaltene, korrekt zugeordnete Grafik ersetzen (Schritt 65). Das Verfahren endet mit dem Schritt 68.
In diesem Ausführungsbeispiel würde das System 3 z. B. den in 7 unten gezeigten Bildausschnitt sowie den oben gezeigten Text-Abstract-Ausschnitt, der in den Verfahrensschritten 1b und 1c verwendet wurde, um die Zuordnung zwischen Bilddatei (hier Bilddatei eines Fötus) und der „Kollagenwand“ zu erstellen, an mindestens einen Korrekturleser verschicken. Der Korrekturleser beantwortet folgende (subjektive) Frage: „Ist die Grafik dem Text richtig zugeordnet worden?“. Als Antwortoptionen kann der Korrekturleser zwischen „Ja“, „Vielleicht“ und „Nein“ wählen. Die Antwort wird als Datenbankeintrag vom Korrekturleser gespeichert, wobei ein automatischer Datenbankeintrag erzeugt wird, der einem Datenbankadministrator anzeigt, ob und falls zutreffend, welche Graphiken falsch zugeordnet wurden und der Datenbankadministrator anschließend falsch (Korrekturleser antwortet „Nein“) und/oder eventuell falsch (Korrekturleser antwortet „Vielleicht“) zugeordnete Grafiken überprüft und im Falle einer falschen Zuordnung aus der erzeugten Bilddatei löscht und jede falsch zugeordnete Grafik durch eine in der Datenbank 6 enthaltene, korrekt zugeordnete Grafik 11 ersetzt. Der in diesem Verfahrensschritt dargestellte Korrekturprozess kann z.B. durch Crowd-Sourcing unterstützt werden, z.B. über den Dienstleister Amazon mechanical Turk, und nach dem hier beschriebenen Prozess vollautomatisiert werden.
Die 8 zeigt ein weiteres Beispiel für einen Text 1, der als Grundlage für das gemäß 9 dargestellte Beispiel einer durch das erfindungsgemäße Verfahren erzeugten Ausgabedatei 2 dient. An diesem Beispiel soll verdeutlicht werden, dass ein relativ umfangreicher, als Grundlage dienender Text 1 durch das erfindungsgemäße Verfahren in der Ausgabedatei 2 deutlich reduziert ist und daher viel schneller zu erfassen ist. Der Text 1 hat 423 Wörter, die Ausgabedatei 2 hingegen nur 71 Wörter und 3 Abbildungen. Das Erfassen des Inhalts ist durch das Ersetzen von Text durch Bilder und durch die Kondensation der Textmenge mit geringerem Lese- und Zeitaufwand zu erreichen.
Die 10 verdeutlicht anhand der wiedergegebenen drei Ausgabedateien 2 die Vorteile des immer gleichen Aufbaus (gleiches Layout) der Ausgabedatei 2 bzw. der erzeugten grafischen Zusammenfassung. Das Layout kann z.B. immer drei Paneele haben, die Paneele haben immer die gleichen Farben, die Proportionen der Paneele zueinander sind konstant und das Bild hat ein Verhältnis von Länge zu Höhe von 16:9. Durch das einheitliche Design kann beim sequentiellen Betrachten von mehreren grafischen Zusammenfassungen eine Beschleunigung der Wahrnehmung erreicht werden.
Die 11 zeigt die Basisvorlage sowie die Ausfüllvorschriften der Basisvorlage. Das erste, linksgelegene Paneel ist in roten Farbtönen gehalten und enthält die Hauptbotschaft des Texts 1, das rechte, obere Paneel in Gelbtönen, enthält eine stichpunktartige Zusammenfassung des Texts 1 und das rechte, untere Paneel, in Blautönen, enthält die statistischen und numerischen Fakten des Texts 1.

Claims

Verfahren zum Erzeugen einer grafischen Zusammenfassung aus zumindest einem Text (1) mittels eines Rechners (4), mit folgenden durch den Rechner (4) durchgeführten Schritten: a) Einlesen des Textes (1) als elektronische Textdatei, b) Identifizieren vordefinierter Wörter (12) im eingelesenen Text, c) Zuordnen einer vorgefertigten Grafik (11) zu jeweils einem oder mehreren im Text (1) identifizierten vordefinierten Wörtern (12), d) Speichern der Zuordnung aus Schritt c) in einer elektronischen Liste, e) Erzeugen einer elektronischen Bilddatei aus den Grafiken (11) gemäß den in der elektronischen Liste gespeicherten Zuordnungen, wobei die Grafiken (11) in der elektronischen Bilddatei in Form einer Kollage angeordnet werden, f) Ausgeben der elektronischen Bilddatei als die zu erzeugende grafische Zusammenfassung des Textes (1).
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Text (1) ein wissenschaftlicher Text, insbesondere ein wissenschaftlicher Abstract, ist und die vordefinierten Wörter (12) wissenschaftliche Fachbegriffe sind oder zumindest zum Teil enthalten.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die vordefinierten Wörter (12) in einer vordefinierten Liste enthalten sind, wobei die Liste in einer elektronischen Datenbank (6) gespeichert ist, wobei in der Datenbank (6) jeweils einem oder mehreren Wörtern eine vorgefertigte Grafik (11) zugeordnet ist.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass durch den Rechner (4) eine Ausgabedatei (2) erzeugt und ausgegeben wird, die die grafische Zusammenfassung und Metadaten in Textform enthält.
Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass durch den Rechner (4) jeweils einer Grafik (11) in der grafischen Zusammenfassung eine oder mehrere Metadaten zugeordnet werden, die den Bildinhalt der Grafik (11) beschreiben.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass durch den Rechner (4) charakteristische Wörter im Text (1) identifiziert werden und anhand der identifizierten charakteristischen Wörter eine Kurzzusammenfassung des Textes (1) in Textform erzeugt wird, wobei durch den Rechner (4) eine Ausgabedatei (2) erzeugt und ausgegeben wird, in der die grafische Zusammenfassung mit der Kurzzusammenfassung kombiniert ist.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Layout der grafischen Zusammenfassung unabhängig vom Inhalt des Textes (1) immer gleich aufgebaut ist.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Grafiken (11) in wenigstens zwei unterschiedlichen Farben in die grafische Zusammenfassung eingefügt werden.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die grafische Zusammenfassung oder die Ausgabedatei (2) über ein globales Netzwerk (7), insbesondere das Internet, an eine Korrekturinstanz übertragen wird und nach Bearbeitung durch die Korrekturinstanz eine korrigierte grafische Zusammenfassung oder Ausgabedatei empfangen wird.
Computerprogramm mit Programmcodemitteln eingerichtet zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche, wenn das Computerprogramm auf einem Rechner (4) ausgeführt wird.
System (3) mit wenigstens einem Rechner (4) und mit wenigstens einem Speicher (5), in dem ein Computerprogramm nach Anspruch 10 gespeichert ist, wobei der Rechner (4) Zugriff auf den Speicher (5) hat und zur Ausführung des Computerprogramms eingerichtet ist.