DE102019103802A1

DE102019103802A1 - System, Datenverarbeitungseinrichtung und Verfahren zum Bestimmen von Übersetzungspaaren basierend auf Bilddaten

Info

Publication number: DE102019103802A1
Application number: DE102019103802.2A
Authority: DE
Inventors: Christian Ebert
Original assignee: Cabuu GmbH
Current assignee: Cabuu GmbH
Priority date: 2019-02-14
Filing date: 2019-02-14
Publication date: 2020-08-20

Abstract

Die vorliegende Erfindung betrifft das Gebiet des Vokabellernens sowie der Vokabeltrainereinrichtungen. Die vorliegende Erfindung betrifft insbesondere ein System, eine Datenverarbeitungseinrichtung und ein Verfahren zum Bestimmen von Übersetzungspaaren aus Bilddaten. Die Datenverarbeitungseinrichtung ist eingerichtet zum Empfangen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache; Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung; und Bestimmen von Übersetzungspaaren auf Basis der Textdaten, wobei ein Übersetzungspaar jeweils wenigstes ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache aufweist. Die Datenverarbeitungseinrichtung kann insbesondere dazu eingerichtet sein, auf Basis der extrahierten Textdaten vorgegebene, verifizierte Übersetzungspaare aus einer Datenbank mit vorgegebenen, verifizierten Übersetzungspaaren auszuwählen.

Description

Die vorliegende Erfindung betrifft das Gebiet des Vokabellernens sowie der Vokabeltrainereinrichtungen. Die vorliegende Erfindung betrifft insbesondere ein System, eine Datenverarbeitungseinrichtung und ein Verfahren zum Bestimmen von Übersetzungspaaren aus Bilddaten.
Aus dem Stand der Technik sind verschiedene Möglichkeiten zum Erlernen von Fremdsprachen und insbesondere zum Vokabellernen bekannt. Der erste Berührungspunkt mit Fremdsprachen ist üblicherweise in der Schule. In einem Schulbuch werden fremdsprachige Texte präsentiert. Die zugehörigen Vokabeln bzw. die neu hinzukommenden, dem Schüler noch nicht bekannten Vokabeln sind dem Text in Form einer Vokabelliste beigefügt. Die Vokabeln können beispielsweise mittels der sogenannten Karteikartenmethode gelernt werden. Ein Problem dieser Lösung besteht jedoch darin, dass der Umgang mit Karteikarten von vielen Lernenden als antiquiert empfunden wird. Insbesondere bei Schülern besteht ein Akzeptanzproblem, da Karteikarten als nicht mehr zeitgemäß empfunden werden.
Schulbuchverlage bieten daher speziell auf die Schulbücher abgestimmte elektronische Vokabeltrainereinrichtungen an. Statt im Schulbuch werden die Vokabeln nunmehr auf einer Anzeigeeinrichtung präsentiert. Die elektronischen Vokabeltrainereinrichtungen weisen ferner eine Mensch-Maschine-Schnittstelle (HMI) auf, mittels welcher der Nutzer mit der Vokabeltrainereinrichtung interagieren kann. Als Vokabeltrainereinrichtung kann ein Computer oder Smartphone eingesetzt werden, welcher bzw. welches mittels entsprechender Software dazu eingerichtet ist, als Vokabeltrainereinrichtung zu fungieren. Ein Vorteil dieser Lösungen kann darin bestehen, dass ein spielerischer Zugang zum Lernstoff ermöglicht werden kann und das Lernergebnis weiter verbessert werden kann. Als Beispiel ist die Vokabellern-App phase 6 classic, phase-6 GmbH, Berlin, Deutschland, zu nennen deren Vokabeltrainer Vokabelsammlungen zu vielen gängigen Kurs- und Schulbüchern verschiedener Anbieter bereitstellt.
Ein Nachteil dieser Lösungen ist jedoch die mangelnde Flexibilität. Engagierte Lehrer möchten die Möglichkeit haben, verschiedene Lehrmaterialien flexibel miteinander kombinieren zu können. Beispielsweise wäre es wünschenswert, abweichend von den in einem bestimmten Schulbuch vorgegebenen Vokabellisten bzw. Übersetzungspaaren ergänzende Materialien miteinander kombinieren zu können. Im Rahmen einer Projektarbeit kann beispielsweise eine Ergänzung um projektspezifisches Vokabular wünschenswert sein. Oder es ist möglich, dass ein Lehrer Vokabular zu aktuellen gesellschaftlichen, politischen und wirtschaftlichen Entwicklungen mit einfließen lassen möchte.
Vor diesem Hintergrund kann eine Aufgabe der vorliegenden Erfindung darin gesehen werden, eine Einrichtung bereitzustellen, welche ein flexibles Vokabellernen mit unterschiedlichen Lernmaterialien ermöglicht. Es wäre wünschenswert, das Vokabellernen so einfach und motivierend wie möglich zu gestalten. Es wäre ferner wünschenswert, eine technische Lösung bereitzustellen, welche den Zeitaufwand bei der Vorbereitung der Lernmaterialien reduziert.
Gemäß dem ersten Aspekt der vorliegenden Offenbarung wird daher eine Datenverarbeitungseinrichtung, insbesondere eine Datenverarbeitungseinrichtung für ein Vokabeltrainersystem vorgeschlagen, wobei die Datenverarbeitungseinrichtung eingerichtet ist zum Empfangen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache. Beispielsweise kann es sich bei dem Bild um ein Bild einer Vokabelliste handeln, welche eine erste Spalte mit Wörtern einer ersten Sprache und eine zweite Spalte mit Wörtern einer zweiten Sprache aufweist. Die Datenverarbeitungseinrichtung ist eingerichtet zum Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung (OCR bzw. Textzeichenerkennung); und zum Bestimmen von Übersetzungspaaren auf Basis der Textdaten. Ein Übersetzungspaar kann jeweils wenigstes ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache aufweisen.
Gemäß einem zweiten Aspekt der vorliegenden Offenbarung wird ein System bzw. ein Vokabeltrainersystem vorgeschlagen, mit

- einer Bilderfassungseinrichtung zum Erfassen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache, insbesondere zum Erfassen von einer Vokabelliste mit Wörtern der ersten Sprache und Wörtern der zweiten Sprache;
- einer Datenverarbeitungseinrichtung, wie vorstehend beschrieben; und
- einer Mensch-Maschine-Schnittstelle zur Interaktion eines Nutzers mit zumindest einer Auswahl aus den von der Datenverarbeitungseinrichtung bestimmten Übersetzungspaaren. Bei der Bilderfassungseinrichtung kann es sich um einen Scanner oder um eine Kamera handeln, beispielsweise um eine in einem Smartphone integrierte Kamera.

Gemäß einem dritten Aspekt der vorliegenden Offenbarung wird ein entsprechendes Verfahren vorgeschlagen mit den Schritten:

- Empfangen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache,
- Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung; und
- Bestimmen von Übersetzungspaaren auf Basis der Textdaten. Ein Übersetzungspaar kann jeweils wenigstes ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache aufweisen.

Gemäß einem weiteren Aspekt wird ein Computerprogramm vorgeschlagen, das dazu eingerichtet ist, dass vorstehend genannte Verfahren auszuführen, wenn das Computerprogramm auf einem Computer ausgeführt wird. Gemäß einem weiteren Aspekt wird ein Maschinen-, bzw. computerlesbares Speichermedium vorgeschlagen, auf welchen ein entsprechendes Computerprogramm gespeichert ist. Die für den ersten Aspekt der Erfindung ausführlich beschriebenen Ausgestaltungen und Vorteile gelten für die weiteren Aspekte der Erfindung entsprechend.
Die Erfinder haben erkannt, dass ein flexiblerer Zugang zum Vokabellernen mit unterschiedlichsten Lernmaterialien dadurch ermöglicht werden kann, dass eine Datenverarbeitungseinrichtung für eine Vokabeltrainereinrichtung bereitgestellt wird, die dazu eingerichtet ist Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache zu empfangen. Aus den Bilddaten können Textdaten mittels Texterkennung extrahiert werden. Texterkennung, optische Texterkennung oder auch optische Zeichenerkennung (englische Abkürzung OCR von Optical Character Recognition) bezeichnet die automatisierte Texterkennung innerhalb von Bildern. In einem nächsten Schritt können auf Basis der Textdaten Übersetzungspaare bestimmt werden. Ein Übersetzungspaar weist jeweils wenigstens ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache auf. Aus mehreren Übersetzungspaaren können Lernlisten zusammengestellt werden. Diese Lernlisten können dann mit einem elektronischen Vokabeltrainersystem, beispielsweise durch ein Smartphone mit zugehöriger App, erlernt werden. Somit können auch bewährte Lernmaterialien in gedruckter Form von unterschiedlichen Quellen auf einfache und kostengünstige Weise weiterhin eingesetzt werden.
In einer Ausgestaltung kann die Datenverarbeitungseinrichtung dazu eingerichtet sein auf Basis der extrahierten Textdaten vorgegebene Übersetzungspaare aus einer Datenbank mit vorgegebenen Übersetzungspaaren auszuwählen. Unter vorgegebenen Übersetzungspaaren können verifizierte bzw. vertrauenswürdige Übersetzungspaare verstanden werden, bei welchen eine Zuordnung der Worte in der ersten und der zweiten Sprache verifiziert wurde. Das Bestimmen von Übersetzungspaaren auf Basis der Textdaten kann folgende Schritte aufweisen: zumindest abschnittsweises Abgleichen der extrahierten Textdaten mit vorgegebenen Übersetzungspaaren aus einer Datenbank mit vorgegebenen Übersetzungspaaren und Auswählen von (verifizierten) vorgegebenen Übersetzungspaaren aus der Datenbank auf Basis des Abgleichs. Das Bestimmen von Übersetzungspaaren kann somit durch Auswählen von vorgegebenen, verifizierten Übersetzungspaaren erfolgen.
Mit anderen Worten werden Worte oder Wortpaare der aus den Bilddaten extrahierten Textdaten nicht unmittelbar als Übersetzungspaare bereitgestellt. Stattdessen dienen die extrahierten Textdaten als Basis, um aus einer Datenbank mit vorgegebenen Übersetzungspaaren passende Übersetzungspaare auszuwählen. Somit kann sichergestellt werden, dass nur vorgegebene verifizierte bzw. vertrauenswürdige Übersetzungspaare bereitgestellt werden. Ein Vorteil dieser Ausgestaltung kann insbesondere darin bestehen, dass keine falschen Übersetzungsergebnisse geliefert werden. Selbst wenn ein Übersetzungspaar aus der Datenbank ausgewählt wird, welches in den empfangenen Bilddaten eigentlich nicht vorkommt, wird keine falsche Übersetzung angezeigt. Es kann also lediglich eine Anzeige von Übersetzungen erfolgen, die in der Vorlage tatsächlich in der gezeigten Form nicht vorhanden sind. Der Lernende lernt trotzdem ein korrektes Übersetzungspaar. Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, auf Basis der Textdaten eine Datenbanksuche in einer Datenbank mit vorgegebenen Übersetzungspaaren durchzuführen und Übersetzungspaare, welche ein Ähnlichkeitskriterium erfüllen, auszuwählen. Ein weiterer Vorteil der Abfrage von vorgegebenen Übersetzungspaaren aus der Datenbank kann darin bestehen, dass eine gewünschte Schreibweise festgelegt werden kann, beispielsweise amerikanisches Englisch (AE) oder britisches Englisch (BE). Damit kann eine Verwirrung des Lernenden durch zwar jeweils korrekte, aber doch unterschiedliche Schreibweisen vermieden werden.
Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, die vorgegebenen Übersetzungspaare auf Basis einer Ähnlichkeitsanalyse aus der Datenbank mit vorgegebenen Übersetzungspaaren auszuwählen. Ein Vorteil dieser Lösung kann darin bestehen, dass eine fehlertolerante Auswahl der Übersetzungspaare erfolgen kann. Beispielsweise können bei der optischen Texterkennung sogenannte OCR Fehler auftreten. Derartige Fehler sollten nicht in die Übersetzungspaare übernommen werden, da diese den Lernerfolg negativ beeinträchtigen könnten.
In einer Ausgestaltung kann die Ähnlichkeitsanalyse eine Bestimmung (maximal) überlappender Blöcke aufweisen. Optional kann eine fehlertolerante Bestimmung überlappender Blöcke erfolgen.
Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, die Übersetzungspaare unter Berücksichtigung einer räumlichen Anordnung der Wörter der ersten Sprache und der Wörter der zweiten Sprache in den Bilddaten oder in den Textdaten zu bestimmen. Ein Vorteil dieser Ausgestaltung kann darin bestehen, dass die Wahrscheinlichkeit korrekte Übersetzungspaare auf Basis der Textdaten zu bestimmen erhöht werden kann. Hierbei kann ausgenutzt werden, dass zugehörige Wörter der ersten und zweiten Sprache üblicherweise in räumlicher Nähe zueinander angeordnet sind. Die Wörter müssen jedoch nicht notwendigerweise unmittelbar nebeneinander vorkommen. Die Wörter der ersten und zweiten Sprache könnten auch übereinander angeordnet sein. Ferner können die erste und die zweite Sprache miteinander vertauscht sein. Die vorgeschlagene Ausgestaltung kann insbesondere in Verbindung mit einer Datenbankabfrage vorteilhaft sein. Indem eine räumliche Nähe vorausgenutzt wird, kann eine Datenbankabfrage beispielsweise derart vereinfacht werden, dass nur Wortpaare in räumlicher Nähe als Übersetzungspaare berücksichtigt werden. Eine Datenbankabfrage kann damit eine höhere Geschwindigkeit und/oder eine bessere Trefferquote tatsächlich in den Bilddaten vorkommender Vokabel- bzw. Übersetzungspaare erreichen.
In einer Weiterbildung kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, die Übersetzungspaare unter Berücksichtigung einer vertikalen Position von Worten in den Textdaten zu bestimmen. Beispielsweise kann die Bestimmung unabhängig von einer horizontalen Position erfolgen oder mit einer größeren Toleranz hinsichtlich einer horizontalen Position. Indem unterschiedliche vertikale Positionen berücksichtigt werden, kann eine fehlertolerante Erkennung ermöglicht werden. Beispielsweise kann es bei schräg aufgenommenen Bilddaten zu einem Zeilenversatz zwischen einem Wort der ersten Sprache in einer ersten Spalte und einem zugehörigen zweiten Wort der zweiten Sprache in einer zweiten Spalte geben. Darüber hinaus können sich Übersetzungen mit mehreren Wörtern über mehrere Zeilen erstrecken. Indem die Übersetzungspaare unter Berücksichtigung einer vertikalen Position von Worten in den Textdaten bestimmt werden, können diese Fälle abgedeckt werden und somit eine höhere Trefferquote bei der Bestimmung der Übersetzungspaare auf Basis der Textdaten erreicht werden.
Optional kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, die Textdaten in mehrere Textblöcke aufzuteilen und vorgegebene Übersetzungspaare auf Basis der Textblöcke aus der Datenbank mit vorgegebenen Übersetzungspaaren auszuwählen. Optional können sich die Textblöcke überlappen. Der gleiche Text kann in mehreren Textblöcken vorkommen. Es versteht sich, dass doppelt vorhandene Übersetzungspaare nachträglich aussortiert werden können, um Redundanz zu vermeiden oder zu reduzieren. Ein Textblock kann eine oder mehrere Zeilen der Textdaten, insbesondere 1 bis 5 benachbarte Zeilen, insbesondere 1 bis 3 benachbarte Zeilen der Textdaten aufweisen. Dies kann eine fehlertolerante Erkennung über ein Textfenster von mehreren Zeilen hinweg ermöglichen. Üblicherweise sind Wortpaare der ersten oder zweiten Sprache in der gleichen Zeile eingeordnet. Allerdings kann es bei der Texterkennung zu einem Zeilenversatz kommen. Die Berücksichtigung von Textblöcken, welche mehrere Zeilen abdecken kann eine verbesserte Erkennungsrate von Übersetzungspaaren ermöglichen.
Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, ein Übersetzungspaar, welches bestimmt wurde, um eine Zusatzinformation, welche dem Übersetzungspaar zugeordnet ist, aus einer Datenbank mit Zusatzinformation zu ergänzen. Die dem Übersetzungspaar zugeordnete Zusatzinformation kann ausgewählt sein aus einer Gruppe aufweisend: eine Wortart-Information, eine Lautschrift-Darstellung, einen Beispielsatz, ein Bild, eine Illustration, ein Video, eine Animation, und einen Hyperlink. Eine Wortart kann beispielsweise „Adverb“ oder „Substantiv“ sein. Ein Problem von Texterkennung ist, dass eine Lautschrift-Information durch Texterkennung oftmals nicht bzw. nicht korrekt erkannt wird. Indem die Zusatzinformation nicht aus den Textdaten als solche extrahiert wird sondern nach der Bestimmung auf Basis eines bestimmten Übersetzungspaares aus einer Datenbank mit Zusatzinformation abgefragt wird, kann einerseits eine korrekte Darstellung der Lautschrift gewährleistet werden und darüber hinaus auch eine konsistente Darstellung der Lautschriftinformation ermöglicht werden. Dies gilt selbst dann, wenn eine Vielzahl unterschiedlicher Bildquellen als Grundlage zur Bestimmung der Übersetzungspaare eingesetzt wird. Zusatzinformation kann sich auf solche Information beziehen, welche in einer ursprünglichen Vokabelliste, von welcher ein Bild aufgenommen wurde, nicht vorhanden ist. Es versteht sich, dass die Datenbank mit Zusatzinformation und die Datenbank mit vorgegebenen Übersetzungspaaren als separate Datenbanken oder als eine gemeinsame Datenbank implementiert sein können.
In einer Ausgestaltung kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, die folgenden Schritte auszuführen:

- Zerlegen der Textdaten in Texttoken;
- Abgleichen der Texttoken mit vorgegebenen Übersetzungspaaren aus einer Datenbank mit vorgegebenen Übersetzungspaaren. Das Abgleichen der Texttoken kann folgende Schritte aufweisen:
- Identifizieren von Datenbankeinträgen, für welche in der ersten Sprache eine Übereinstimmung mit einem Texttoken besteht,
- Identifizieren von Datenbankeinträgen, für welche in der zweiten Sprache eine Übereinstimmung mit einem Texttoken besteht;
- Auswählen von Übersetzungspaaren aus der Datenbank, basierend auf Datenbankeinträgen, für welche sowohl in der ersten Sprache eine Übereinstimmung mit einem Texttoken als auch in der zweiten Sprache eine Übereinstimmung mit einem Texttoken identifiziert ist. Ein Vorteil dieser Ausgestaltung kann darin bestehen, dass beispielsweise unvollständige oder halb abgeschnittene Einträge in den Bilddaten unberücksichtigt gelassen werden können. Ferner kann eine effiziente und strukturierte Datenbankabfrage ermöglicht werden. Unter Texttoken können individuelle Vorkommen von Wortformen und sonstigen Textbestandteilen wie Satzzeichen, Datumsangaben, Seitenzahlen, etc. verstanden werden. Unter Texttoken können klassifizierbare Textbestandteile verstanden werden. Es versteht sich, dass nicht notwendigerweise eine vollständige Übereinstimmung bestehen muss, sondern auch eine fehlertolerante Übereinstimmung bestehen kann. Beispielsweise können OCR Fehler bei der Identifikation von Datenbankeinträgen, für welche eine Übereinstimmung besteht, unberücksichtigt bleiben. Optional kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, für einen Datenbankeintrag, für welchen in nur einer Sprache eine Übereinstimmung identifiziert ist, einen Vorschlag für ein Übersetzungspaar bereitzustellen. Hierdurch kann eine Vollständigkeit von Übersetzungspaaren weiter verbessert werden.

In einer Weiterbildung können die Übersetzungspaare ausgewählt werden unter der Bedingung, dass ein Abstand zwischen dem ersten Texttoken und dem zweiten Texttoken einen vorgegebenen Maximalabstand in den Textdaten nicht überschreitet. Beispielsweise kann es sich um einen vertikalen und/oder horizontalen Maximalabstand handeln. Ein Vorteil kann darin bestehen, dass beispielsweise eine fehlertolerante Suche über mehrere Zeilen hinweg ermöglicht werden kann.
Die Datenverarbeitungseinrichtung kann eingerichtet sein zum Bestimmen der ersten Sprache und der zweiten Sprache basierend auf Basis der Textdaten; und Auswählen einer Datenbank mit vorgegebenen Wortpaaren auf Basis der bestimmten Sprachen. Mit anderen Worten kann bei der Auswertung berücksichtigt werden, dass Vokabellisten üblicherweise Worte der ersten Sprache und Worte der zweiten Sprache aufweisen. Auf dieser Basis kann eine automatische Bestimmung und Auswahl einer passenden Datenbank mit vorgegebenen Wortpaaren erfolgen.
Die Datenverarbeitungseinrichtung kann eingerichtet sein zum Empfangen von Bilddaten einer Vokabelliste, wobei die Vokabelliste eine erste Spalte mit Wörtern der ersten Sprache und eine zweite Spalte mit Wörtern der zweiten Sprache aufweist. Ein Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache kann also insbesondere eine Vokabelliste sein. Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein die Textdaten aus den Bilddaten mittels optischer Texterkennung unter Berücksichtigung einer räumlichen Anordnung der Spalten der Vokabelliste zu bestimmen. Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, die Übersetzungspaare unter Berücksichtigung der räumlichen Anordnung der Spalten der Vokabelliste zu bestimmen. Ein Vorteil dieser Ausgestaltung kann darin bestehen, dass die Erkennungsgenauigkeit weiter verbessert werden kann.
Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, eine Lernliste mit einer Mehrzahl durch die Datenverarbeitungseinrichtung bestimmter Übersetzungspaare bereitzustellen. Eine Lernliste kann als eine Menge von Übersetzungspaaren verstanden werden. Die Lernliste kann somit eine Mehrzahl von Übersetzungspaaren aufweisen, welche die Basis für eine nachfolgende Lernabfrage bzw. ein Nachfolgetraining für einen Nutzer bilden können. Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, basierend auf einem Auswahlkriterium eine Lernliste mit einer Auswahl aus den bestimmten Übersetzungspaaren bereitzustellen. Das Auswahlkriterium kann beispielsweise sein, ob das Übersetzungspaar bereits vom Nutzer gelernt wurde oder nicht. Bekannte Übersetzungspaare können beispielsweise ausgeschlossen werden. Damit kann sich der Nutzer auf neu hinzugekommene Übersetzungspaare fokussieren.
Es versteht sich, dass die vorstehend genannten und die nachstehend noch zu erläuternden Merkmale nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der vorliegenden Erfindung zu verlassen.
Ausführungsbeispiele der vorliegenden Offenbarung sind in den Zeichnungen dargestellt und werden in der nachfolgenden Beschreibung näher erläutert.

1 zeigt eine schematische Darstellung eines Vokabeltrainersystems mit einer Datenverarbeitungseinrichtung gemäß einem ersten Ausführungsbeispiel;
2 zeigt eine schematische Darstellung eines Vokabeltrainersystems gemäß einem zweiten Ausführungsbeispiel;
3 zeigt ein Flussdiagramm eines ersten beispielhaften Verfahrens;
4 zeigt ein Flussdiagramm eines zweiten beispielhaften Verfahrens;
5A zeigt ein Bild einer ersten beispielhaften Vokabelliste;
5B zeigt erste Textdaten aus dem ersten Bild gemäß 5A;
5C zeigt eine erste Liste mit Übersetzungspaaren, welche auf Basis der Textdaten gemäß 5B von einer Datenverarbeitungseinrichtung bestimmt wurden;
6A zeigt ein Bild einer zweiten beispielhaften Vokabelliste;
6B zeigt zweite Textdaten aus dem zweiten Bild gemäß 6A;
6C zeigt eine Liste mit Übersetzungspaaren, welche auf Basis der Textdaten gemäß 6B von einer Datenverarbeitungseinrichtung bestimmt wurden;
7A zeigt ein Bild einer dritten beispielhaften Vokabelliste;
7B zeigt dritte Textdaten aus dem dritten Bild gemäß 7A;
7C zeigt eine Liste mit Übersetzungspaaren, welche auf Basis der Textdaten gemäß 7B von einer Datenverarbeitungseinrichtung bestimmt wurden;
8A zeigt ein Bild einer vierten beispielhaften Vokabelliste;
8B zeigt vierte Textdaten aus dem vierten Bild gemäß 8A;
8C zeigt eine Liste mit Übersetzungspaaren, welche auf Basis der Textdaten gemäß 8B von einer Datenverarbeitungseinrichtung bestimmt wurden.

1 zeigt eine schematische Darstellung eines Vokabeltrainersystems 1. Das Vokabeltrainersystem 1 weist eine Datenverarbeitungseinrichtung 10, eine Bilderfassungseinrichtung 20 und eine Mensch-Maschine-Schnittstelle (HMI) 30 auf.
Die Bilderfassungseinrichtung 20 ist eingerichtet zum Erfassen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache. Insbesondere kann es sich bei der Bilderfassungseinrichtung 20 um eine Kamera oder einen Scanner handeln. Mit der Bilderfassungseinrichtung kann, beispielsweise wie in 1 dargestellt, ein Bild von einer Vokabelliste aus einem Lehrbuch erfasst werden. Beispielhafte Bilder von Vokabellisten aus verschiedenen Textbüchern sind in 5A, 6A, 7A und 8A abgebildet. Die Bilderfassungseinrichtung 20 kann kabellos oder kabelgebunden mit der Datenverarbeitungseinrichtung 10 verbunden sein.
Die Datenverarbeitungseinrichtung 10 ist dazu eingerichtet, die von der Bilderfassungseinrichtung 20 bereitgestellten Bilddaten zu empfangen. Die Datenverarbeitungseinrichtung ist ferner eingerichtet zum Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung. Optional kann die Datenverarbeitungseinrichtung 10 mit einer externen Texterkennungseinrichtung 40, beispielsweise einem Cloud-basierten OCR-Dienst, verbunden sein und die Textdaten mittels dieser externen Einrichtung 40 aus den Bilddaten extrahieren. Alternativ können die Textdaten ohne Inanspruchnahme eines externen Dienstes extrahiert werden. Hierzu kann die Datenverarbeitungseinrichtung 10 mit einer internen OCR-Einrichtung ausgestattet sein. Beispiele für aus den in 5A, 6A, 7A und 8A gezeigten Bilddaten extrahierte Textdaten sind in 5B, 6B, 7B und 8B abgebildet.
Die Datenverarbeitungseinrichtung 10 ist ferner eingerichtet zum Bestimmen von Übersetzungspaaren auf Basis der Textdaten. Ein Übersetzungspaar kann jeweils wenigstens ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache aufweisen. Optional kann die Datenverarbeitungseinrichtung 10 dazu eingerichtet sein, die Übersetzungspaare dadurch zu bestimmen, dass auf Basis der extrahierten Textdaten vorgegebene Übersetzungspaare aus einer Datenbank 50 mit vorgegebenen Übersetzungspaaren ausgewählt werden. Die Datenbank 50 kann eine interne oder externe Datenbank sein. Die Datenbank 50 kann somit Teil der Datenverarbeitungseinrichtung 10 sein. Es ist jedoch auch möglich, eine externe Datenbank, insbesondere eine Cloud-basierte Datenbank zu verwenden, welche mit der Datenverarbeitungseinrichtung 10 über eine Kommunikationsschnittstelle verbunden werden kann. Eine beispielhafte Darstellung von Übersetzungspaaren ist in 5C, 6C, 7C und 8C in Form von Vokabellisten abgebildet.
Das Vokabeltrainersystem weist ferner eine Mensch-Maschine-Schnittstelle 30 zur Interaktion eines Nutzers mit zumindest einer Auswahl aus den von der Datenverarbeitungseinrichtung 10 bestimmten Übersetzungspaaren auf. Beispielsweise kann es sich hierbei um eine Anzeigeeinrichtung in Form eines Displays oder einer akustische Ausgabeeinrichtung handeln. Vorzugsweise kann ein Übersetzungspaar sowohl angezeigt werden, damit der Nutzer die Schreibweise erlernen kann, als auch hörbar wiedergegeben werden, damit der Nutzer die Aussprache erlernen kann.
2 zeigt eine schematische Darstellung eines Vokabeltrainersystems mit einer Datenverarbeitungseinrichtung gemäß einem zweiten Ausführungsbeispiel. Hierbei kann ein Smartphone 11 zum Einsatz kommen. Die Kamera des Smartphones 11 kann als Bilderfassungseinrichtung 20 dienen. Eine ohnehin bereits vorhandenen Mensch-Maschine-Schnittstellen 30 des Smartphones 11, wie Touchscreen, Lautsprecher und/oder Mikrofon kann als Mensch-Maschine-Schnittstelle für das Vokabeltrainersystem 1 eingesetzt werden.
Die Datenverarbeitungseinrichtung 10 kann Teil des Smartphones 11 sein. Beispielsweise kann das Smartphone ein Computerprogramm, insbesondere in Form einer App aufweisen, welches dazu eingerichtet ist, dass Smartphone derart anzusteuern, dass es als Datenverarbeitungseinrichtung 10 wirkt oder die nachfolgend in 3 oder 4 beschriebenen Verfahrensschritte der Datenverarbeitungseinrichtung ausführt. Das Smartphone 11 kann über eine Kommunikationsschnittstelle mit einem ersten Server 40 verbunden sein, welcher einen OCR Dienst bereitstellt. Der Server 40 kann wiederum mit einer Datenbank 50 mit vorgegebenen Übersetzungspaaren verbunden sein. Alternativ hierzu kann das Smartphone auch direkt mit der Datenbank 50 verbunden sein. Im vorliegenden Ausführungsbeispiel ist die Datenbank 50 beispielhaft als ein zweiter Server dargestellt. Unter einem Smartphone kann im Rahmen der vorliegenden Offenbarung auch ein Tablet, Notebook oder PC verstanden werden.
In einer weiteren Ausgestaltung kann die Datenverarbeitungseinrichtung 10 auch durch eine externe Datenverarbeitungseinrichtung, beispielsweise durch den ersten Server 40 oder den zweiten Server 50 gebildet werden. Eine derartige (externe oder cloud-basierte) Datenverarbeitungseinrichtung kann über eine Kommunikationsschnittstelle mit dem Smartphone 11 verbunden sein. Hierbei kann das Smartphone 11 als Bilderfassungseinrichtung 20 und/oder als Mensch-Maschine-Schnittstelle (HMI) 30 dienen. Ein Vorteil diese Ausgestaltung besteht darin, dass nur eine geringere Rechenleistung durch das Smartphone bereitgestellt werden muss. Hierdurch kann die Akkulaufzeit verlängert werden. Ferner sind komplexere Berechnungen möglich, die eine bessere Bestimmung von Übersetzungspaaren ermöglichen können.
3 zeigt ein beispielhaftes Flussdiagramm eines Verfahrens. In einem ersten Schritt S101 werden Bilddaten von einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache empfangen. In einem zweiten Schritt S102 werden Textdaten mittels optischer Texterkennung aus den Bilddaten extrahiert. In einem dritten Schritt S103 werden auf Basis der Textdaten Übersetzungspaare bestimmt, wobei ein Übersetzungspaar jeweils wenigstens ein Wort der ersten Sprache und ein dazugehöriges zweites Wort der zweiten Sprache aufweist. In einem optionalen vierten Schritt S104 kann aus den Übersetzungspaaren eine Vokabelliste gebildet werden. Die Vokabelliste kann einem Nutzer zum Lernen bereitgestellt werden. Beispielsweise kann diese über eine Vokabeltrainer-Software in Form einer App auf einem Smartphone präsentiert werden, wie in 2 gezeigt.
4 zeigt ein ausführlicheres Flussdiagramm einer zweiten Variante eines beispielhaften Verfahrens. In einem ersten Schritt S201 kann, beispielsweise mittels der Kamera eines Smartphones, ein Foto von Vokabelliste eines Lehrbuchs aufgenommen werden. In einem zweiten Schritt S202 können die Bilddaten dieses Bildes mit Worten der ersten Sprach und Worten der zweiten Sprache an eine Datenverarbeitungseinrichtung in Form eines Servers 40 übermittelt werden. Der Server 40 empfängt die Bilddaten in Schritt S203. Im vorliegenden Fall kann der Server 40 dazu eingerichtet sein, die Textdaten aus den Bilddaten mittels optischer Texterkennung zu extrahieren unter Verwendung eines externen OCR-Dienstes. Dieser kann von einem weiteren Server 50 bereitgestellt werden und die Texterkennung in Schritt S204 durchführen. Alternativ kann dieser Schritt auch innerhalb des gleichen Servers 40 ausgeführt werden. Im Rahmen der vorliegenden Anmeldungen soll unter Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung auch eine Übergabe an einen externen Texterkennungsdienst und Entgegennahme der Texterkennungsergebnisse bzw. Textdaten verstanden werden. Optional können der Server 40 und der Server 50 zusammen eine Datenverarbeitungseinrichtung gemäß der vorliegenden Anmeldung bilden. In Schritt S205 werden die Textdaten, welche mittels optischer Texterkennung aus den Bilddaten extrahiert wurden, empfangen.
In einem nachfolgenden Schritt können auf Basis der Textdaten Übersetzungspaare bestimmt werden. Im vorliegenden Fall ist dieser Schritt in vier Teilschritte S206 bis S209 aufgeteilt. In einem ersten Schritt S206 können die Textdaten in sogenannte Texttoken aufgeteilt werden. Optional können die Textdaten aufbereitet bzw. normalisiert werden. Mit anderen Worten kann eine Vorverarbeitung bzw. Vorbereitung der Textdaten erfolgen. Beispielsweise können Satzzeichen, Klammern, Bindestriche, etc. entfernt werden, die bei der Erkennung stören könnten. Ferner kann die Groß-/Kleinschreibung vereinheitlicht werden. Beispielsweise kann der gesamte Text in Großbuchstaben oder Kleinbuchstaben umgewandelt werden. Dies gilt insbesondere dann, wenn die Textdaten nur zur Suche von vorgegebenen Übersetzungspaaren in einer Datenbank verwendet werden. In einem nächsten Schritt S207 kann ein Abgleich der Texttoken mit vorgegebenen Übersetzungspaaren aus einer Datenbank mit vorgegebenen Übersetzungspaare erfolgen. In einem ersten Teilschritt S207 können Datenbankeinträge identifiziert werden, für welche in der ersten Sprache eine Übereinstimmung mit einem Texttoken besteht. Ferner können Datenbankeinträge identifiziert werden, für welche in der zweiten Sprache eine Übereinstimmung mit einem Texttoken besteht. In einem nachfolgenden Schritt S208 kann ein sogenanntes Matching von erkannten Token mit Übersetzungspaaren in der Datenbank erfolgen. Hierfür können Datenbankeinträge bzw. Übersetzungspaare aus der Datenbank ausgewählt werden basierend auf denjenigen Datenbankeinträgen für welche sowohl in der ersten Sprache eine Übereinstimmung mit einem Texttoken identifiziert wurde, als auch in der zweiten Sprache eine Übereinstimmung mit einem Texttoken identifiziert wurde. Basierend auf den in Schritt S208 bestimmten Übersetzungspaaren kann in Schritt S209 eine Lernliste zusammengestellt werden. Als Lernliste können beispielsweise vollständig erkannte Übersetzungspaare verwendet werden. Alternativ oder zusätzlich kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, für einen Datenbankeintrag, für welchen für nur eine Sprache eine Übersetzung identifiziert ist, einen Vorschlag für ein Übersetzungspaar bereitzustellen.
Insbesondere kann die vorgeschlagene Lösung eines oder mehrere der folgenden Merkmale aufweisen, um die Bestimmung von Übersetzungspaaren zu verbessern. Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, mit einer eigenen Datenbank als Ausgangspunkt nach vollständigen Übersetzungspaaren zu suchen. Vorzugsweise wird also nicht nach einzelnen Wörterbucheinträgen gesucht und nicht unmittelbar ein Text der OCR Erkennung als Wort eines Wortpaares präsentiert. Eine Bestimmung von Übersetzungspaaren kann fehlertolerant durch Berechnung (maximal) überlappender Blöcke zwischen extrahierten Textdaten und Datenbankeinträgen erfolgen. Eine vollständige Erkennung ist somit nicht notwendig. Darüber hinaus kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, in einem vorzugsweise vertikalen Suchfenster eine Erkennung durchzuführen. Die Datenverarbeitungseinrichtung kann dazu ausgebildet sein, die extrahierten Textdaten als Basis bzw. Index für eine Datenbanksuche in einer Datenbank mit Übersetzungspaaren zu verwenden.
Ein Vorteil der vorgeschlagenen Lösung kann somit darin bestehen, dass die Datenverarbeitungseinrichtung keine falschen Übersetzungsergebnisse liefern kann. Was bei dieser Herangehensweise hingegen vorkommen kann, ist eine (falsch-positive) Anzeige von Übersetzungen, die in der Vorlage tatsächlich in der gezeigten Form nicht vorhanden sind.
Im Folgenden sind einige Probleme bei der Erkennung von Vokabelmaterial aus Vokabellisten mittels OCR angeführt, sowie Aspekte der technischen Lösung beschrieben. Die 5A, 6A, 7A und 8A zeigen jeweils beispielhafte Bilddaten 21 mit einem Bild einer Vokabelliste. Die 5B, 6B, 7B und 8B zeigen die aus den jeweiligen Bilddaten extrahiert Textdaten 22. Die 5C, 6C, 7C und 8C zeigen eine Liste 23 von Übersetzungspaaren, welche auf Basis der Textdaten 22 bestimmt wurden.
5A zeigt ein erstes Bild 21 einer beispielhaften ersten Vokabelliste. Das Bild der Vokabelliste weist hierbei 4 Spalten auf, eine erste Spalte mit englischsprachigen Worten, eine zweite Spalte mit den zugehörigen deutschsprachigen Worten, eine dritte Spalte mit englischsprachigen Worten und eine vierte Sprache mit deutschsprachigen Worten. Für einen Nutzer ist ersichtlich, dass es sich hierbei um zwei Seiten eines Lehrbuches handelt. Bei der Texterkennung wird jedoch üblicherweise eine zeilenweise Verarbeitung eingesetzt, sodass sich aus dem in 5A angezeigten Bild die in 5B gezeigten Textdaten ergeben.
Längere Einträge sind oft umgebrochen und erstrecken sich über mehrere Zeilen, wie in 5A in der Box 71 gekennzeichnet. Durch die spaltenweise Anordnung der Übersetzungen ist es nicht trivial, Umbrüche als solche zu erkennen und die entsprechende Phrase als Ganzes zu erfassen, da ggf. anderes Textmaterial interveniert. Eine herkömmliche OCR Komponente selbst erkennt solche mehrzeiligen Einheiten in Vokabellisten im Allgemeinen nicht als zusammenhängend, sondern ordnet die Information unterschiedlichen Zeilen bzw. Blöcken zu. Beispielsweise könnte der in 5A innerhalb der Box 71 gezeigte Bestandteil „engagieren“ fälschlicherweise als weitere Übersetzung für das in der gleichen Zeile innerhalb der Textdaten in 5B vorangehende Wort „confident“ angesehen werden.
Die Datenverarbeitungseinrichtung kann daher vorzugsweise dazu eingerichtet sein, die Übersetzungspaare unter Berücksichtigung einer räumlichen Anordnung der Wörter der ersten Sprache und der zweiten Sprache in den Bilddaten und/oder in den Textdaten zu bestimmen. Beispielsweise können bei der Bestimmung von Übersetzungspaaren eine oder mehrere benachbarte Zeilen ausgewertet werden. Dies ist in 5B Beispielshaft als Suchfenster 72 dargestellt. Daraus ergibt sich dann das korrekte Übersetzungspaar, wie in 5C in Box 73 dargestellt.
Ein weiteres Problem kann darin bestehen, dass es im Rahmen der OCR-Erkennung häufiger zu einer Zuordnung des erkannten Textes zu falschen Zeilen kommen kann. Dies ist beispielhaft in 5A für den in Box 81 gekennzeichneten Textteil dargestellt, welcher als Textdaten das in Box 82 in 5B gezeigte Ergebnis liefert. In diesem Beispiel befindet sich der Begriff „window dresser“ auf Höhe von „Schaufensterauslage“. Tatsächlich sollte sich der Begriff nach der Vorlage in 5A jedoch eine Zeile darunter, auf Höhe von „Schaufensterdekorateur(in)“ befinden. Die korrekte Zuordnung von Ausgangsort und Übersetzung ist hier nicht trivial. Gemäß der vorgeschlagenen Lösung kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, vollständige Übersetzungspaare in einem Suchfenster über mehrere Zeilen hinweg zu suchen. Die entsprechenden, korrekt erkannten Übersetzungspaare sind in 5C in Box 83 gezeigt.
Ein weiteres Problem kann darin bestehen, dass es bei der OCR-Erkennung, obwohl diese mittlerweile erstaunlich präzise sein kann, weiterhin zu OCR-Erkennungsfehlern kommen kann. Diese können bei direkter Nutzung des erkannten Materials zu Fehlern führen. Im schlimmsten Fall würde ein Nutzer hierdurch eine falsche Schreibweise eines Wortes lernen. Als Beispiel ist hierbei in 5A der Textblock 91 gekennzeichnet. Dieser führt bei der Texterkennung, wie in 5B in Box 92 gezeigt, zu einem falschen Ergebnis. In diesem Beispiel wird beim Eintrag „fair; unfair“ das Semikolon in der Übersetzung als „j“ erkannt und die Texterkennungszeile damit zu „fair, gerechtjunfair“. Die Erkennung der Übersetzung von englisch „fair; unfair“ als deutsch „gerecht“ bzw. „unfair“ ist damit schwierig. Bei direkter Übernahme würde das künstliche falsche Wort „gerechtjunfair“ zugeordnet werden.
Die Datenverarbeitungseinrichtung kann daher dazu eingerichtet sein, eine fehlertolerante Auswahl von Datenbankeinträgen auf Basis der Textdaten auszuführen. Beispielsweise können (maximal) überlappende Blöcke bestimmt werden. Damit können einzelne Erkennungsfehler immer noch zu genug Überlappungen führen, um als Treffer gewertet zu werden. Grundsätzlich kann können auch andere Arten des Abgleichs verwendet werden. Die Datenverarbeitungseinrichtung kann dazu eingerichtet sein, die vorgegebenen Übersetzungspaare auf Basis einer Ähnlichkeitsanalyse aus der Datenbank mit vorgegebenen Übersetzungspaaren auszuwählen. Entsprechend korrekt über erkannte Übersetzungspaare sind in 5C in Box 93 gezeigt.
Ein weiteres Problem kann in einer fehlerhaften Zuordnung von Spalten bei mehrsprachigen Vorlagen gesehen werden. Ein erstes Teilproblem können hierbei unterschiedlichen Präsentationsrichtungen sein. In 5A ist die Übersetzungsrichtung Englisch/Deutsch. In 6A ist Übersetzungsrichtung Deutsch/Englisch. Die Datenverarbeitungseinrichtung kann daher vorzugsweise dazu eingerichtet sein eine erste Sprache und eine zweite Sprache basierend auf den Textdaten zu extrahieren und eine entsprechende Datenbank mit vorgegebenen Wortpaaren auf Basis der bestimmten Sprachen auswählen.
Ein weiteres Problem können mehrsprachigen Vorlagen darstellen, bei denen der Charakter einer Spalte beachtet werden sollte. In dem in 6 gezeigten Beispiel kann die Abfolge der Spalten vereinfacht als Ausgangssprache in Spalte 1, Zielsprache in Spalte 2 und weiteres Material bzw. Störmaterial in Spalte 3 gesehen werden. Ein Beispiel für eine Vorlage mit mehreren Spalten ist in 7A gezeigt. Hierbei ist auf der linken Seite die Spalte mit der Ausgangssprache abgeschnitten, jedoch noch die Spalte mit der Zielsprache 701 erhalten. Eine Zuordnung sollte jedoch nur zwischen den vollständig wiedergegebenen Paaren in Spalte 702 und 703 erfolgen. Die Spalte 701 zeigt hingegen nur deutschen Übersetzungen der vorangegangenen Seite.
Die Datenverarbeitungseinrichtung kann daher dazu eingerichtet sein, nach vollständigen Übersetzungspaaren in vertikaler Nähe zu suchen, aber unabhängig von der horizontalen Position. Indem eine Suche nach Übersetzungspaaren mit einem ersten Wort der ersten Sprache und einem zweiten Wort der zweiten Sprache erfolgt, wird somit eine Suche nach sinnvollen Übersetzungspaaren durchgeführt. Indem eine räumliche Position dennoch berücksichtigt wird, kann die Datenbanksuche vereinfacht, beschleunigt und/oder auch die Treffergenauigkeit erhöht werden. Ein Beispiel für ein Suchfenster in den Textdaten ist mit dem Bezugszeichen 72` und 72" in 6B dargestellt. Die Suchfenster erstrecken sich über mehrere Zeilen in vertikaler Richtung. Trotz einer falschen Position des Wortes „Aktivitäten“ in vertikaler Richtung, kann eine korrekte Zuordnung zum englischen Wort „activity“ erfolgen. Optional kann die Bestimmung von Übersetzungspaaren auch unter Randbedingungen erfolgen. Beispielsweise wurde auf Basis der in den Textdaten enthaltenen Substantive in 6C, wie in Box 73 gezeigt, das Übersetzungspaar zum zugehörige Adjektiv ausgewählt.
7A zeigt, wie vorstehend bereits beschrieben, ein Bild mit drei Spalten 701,702 und 703. Dabei ist die Spalte 701 lediglich der abgeschnittene Teil einer linken Buchseite. Eine tatsächliche Entsprechung besteht lediglich zwischen den Spalten 702 und 703. Der in der Spalte 701 erhaltene Text findet sich jedoch trotzdem in den Textdaten, welche auf Basis der Bilddaten extrahiert worden wieder, wie in 7B gezeigt. Die Textdaten 704 entsprechen dabei der Spalte 701, die Textdaten 705 entsprechend der Spalte 702 und die Textdaten 706 entsprechend der Spalte 703. Indem auf Basis der Textdaten vollständige Übersetzungspaare bestimmt werden, kann die in 7B in Box 72', gezeigte Paarung ausgeschlossen werden. Für die Paarung „beeindruckt sein“ und „helpline“ kann in einer Datenbank mit vorgegebenen Übersetzungspaaren kein Eintrag gefunden werden. Allerdings kann für die in 7B in Box 72" gezeigte Zuordnung zwischen „Helpline“ und „Notruf“ bzw. „telefonischer Beratungsdienst“ ein vorgegebenes Übersetzungspaar gefunden werden. Somit ergeben sich die korrekten Übersetzungspaare, wie in 7C in Spalten 707 und 708 gezeigt. Im vorliegenden Fall wurde, wie in Box 73 gezeigt, das Übersetzungspaar „helpline“ und „telefonischer Beratungsdienst“ festgestellt. Eine gegebenenfalls nicht in der Datenbank hinterlegte Zuordnung zwischen „helpline“ und „Notruf“ ist hingegen nicht enthalten.
Optional kann die Datenverarbeitungseinrichtung dazu eingerichtet sein, ein von der Datenverarbeitungseinrichtung bestimmtes Übersetzungspaar um eine Zusatzinformation zu ergänzen. Die Zusatzinformation, welche mit den Übersetzungspaar verknüpft ist, kann aus einer Datenbank mit Zusatzinformation abgefragt werden. In dem in 7A gezeigten Beispiel ist dem Wort „desperate“ eine mit Bezugszeichen 711 bezeichnete Lautschrift-darstellung zugeordnet. Ein Problem bei Lautschriftdarstellung kann darin bestehen, dass hierbei unterschiedliche Darstellungen zum Einsatz kommen können. Dies kann einen Nutzer verwirren. In den in 7B gezeigten Textdaten ist die Lautschriftdarstellung, wie mit Bezugszeichen 712 gekennzeichnet, nicht zutreffend erkannt worden. Eine derartige Zusatzinformation kann daher vorzugsweise aus einer Datenbank mit Zusatzinformation abgefragt werden. Somit kann, selbst wenn unterschiedliche Vorlagen und unterschiedliche Lautschriftdarstellungen in den Bilddaten enthalten, wie in 7C mit Bezugszeichen 730 gekennzeichnet, ein Übersetzungspaar mit einer konsistenten Lautschriftdarstellung präsentiert werden. Darüber hinaus können wie in 7C gezeigt auch weitere Zusatzinformationen wie beispielsweise eine Wortartinformation hinsichtlich Adjektiven, Verben, und Substantiven bereitgestellt werden.
In 8A, 8B und 8C ist ein weiteres Beispiel einer potentiellen Fehlzuordnung gezeigt. Hierbei wurden mehrere Zeilen aus den Bilddaten, wie in 8A mit Bezugszeichen 81 bezeichnet, mit einem Zeilenversatz in den Textdaten erkannt, wie in 8B mit Bezugszeichen 82 bezeichnet. Mit der vorgeschlagenen Lösung kann bei der Bestimmung der Übersetzungspaare dennoch eine korrekte Zuordnung erzielt werden, wie 8C in Box 83 gezeigt.
Bei dem in 8B gezeigten Beispiel kann ferner ein Texttoken 801, welche ein Verweis auf einer Seitenzahl darstellt, erkannt und aussortiert werden. Auch eine nicht gewünschte Lautschriftinformation 802 kann aussortiert werden. Wie in 8C gezeigt kann stattdessen eine gewünschte eine Zusatzinformation aus einer Datenbank mit Zusatzinformation ergänzt werden. Im vorliegenden Fall, dass es sich um eine Phrase 803 handelt.
Zusammenfassend können das vorgeschlagene Vokabeltrainersystem, das Verfahren sowie die Datenverarbeitungseinrichtung eine Bestimmung von Übersetzungspaaren aus einem Bild verbessern. Die Datenverarbeitungseinrichtung kann insbesondere dazu eingerichtet sein, auf Basis der extrahierten Textdaten vorgegebene, verifizierte Übersetzungspaare aus einer Datenbank mit vorgegebenen, verifizierten Übersetzungspaaren auszuwählen. Somit können fehlerhafter Übersetzungspaare vermieden und der Lernerfolg nachhaltig verbessert werden.

Claims

Datenverarbeitungseinrichtung eingerichtet zum - Empfangen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache, - Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung; und - Bestimmen von Übersetzungspaaren auf Basis der Textdaten, wobei ein Übersetzungspaar jeweils wenigstes ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache aufweist.
Datenverarbeitungseinrichtung nach Anspruch 1, wobei die Datenverarbeitungseinrichtung dazu eingerichtet ist auf Basis der extrahierten Textdaten vorgegebene Übersetzungspaare aus einer Datenbank mit vorgegebenen Übersetzungspaaren auszuwählen.
Datenverarbeitungseinrichtung nach Anspruch 2, wobei das Bestimmen von Übersetzungspaaren auf Basis der Textdaten folgende Schritte aufweist: - zumindest abschnittsweises Abgleichen der extrahierten Textdaten mit vorgegebenen Übersetzungspaaren aus einer Datenbank mit vorgegebenen Übersetzungspaaren und Auswählen von vorgegebenen Übersetzungspaaren aus der Datenbank auf Basis des Abgleichs.
Datenverarbeitungseinrichtung nach Anspruch 2 oder 3, wobei die Datenverarbeitungseinrichtung eingerichtet ist, die vorgegebenen Übersetzungspaare auf Basis einer Ähnlichkeitsanalyse aus der Datenbank mir vorgegebenen Übersetzungspaaren auszuwählen.
Datenverarbeitungseinrichtung nach Anspruch 4, wobei die Ähnlichkeitsanalyse eine Bestimmung überlappender Blöcke aufweist.
Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche, wobei die Datenverarbeitungseinrichtung eingerichtet ist, die Übersetzungspaare unter Berücksichtigung einer räumlichen Anordnung der Wörter der ersten Sprache und der Wörter der zweiten Sprache in den Bilddaten oder in den Textdaten zu bestimmen.
Datenverarbeitungseinrichtung nach Anspruch 6, wobei die Datenverarbeitungseinrichtung eingerichtet ist, die Übersetzungspaare unter Berücksichtigung einer vertikalen Position von Worten in den Textdaten zu bestimmen.
Datenverarbeitungseinrichtung einem der Ansprüche 2 bis 7, wobei die Datenverarbeitungseinrichtung dazu eingerichtet ist, die Textdaten in mehrere Textblöcke aufzuteilen und vorgegebene Übersetzungspaare auf Basis der Textblöcke aus der Datenbank mit vorgegebenen Übersetzungspaaren auszuwählen.
Datenverarbeitungseinrichtung nach Anspruch 8, wobei ein Textblock eine oder mehrere Zeilen der Textdaten, insbesondere 1 bis 5 benachbarte Zeilen, insbesondere 1 bis 3 benachbarte Zeilen der Textdaten aufweist.
Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche, wobei die Datenverarbeitungseinrichtung dazu eingerichtet ist, ein bestimmtes Übersetzungspaar um eine Zusatzinformation, welche dem Übersetzungspaar zugeordnet ist, aus einer Datenbank mit Zusatzinformation zu ergänzen.
Datenverarbeitungseinrichtung nach Anspruch 10, wobei die dem Übersetzungspaar zugeordnete Zusatzinformation ausgewählt ist aus einer Gruppe aufweisend: eine Wortart-Information, eine Lautschrift-Darstellung, einen Beispielsatz, ein Bild, eine Illustration, ein Video, eine Animation, und einen Hyperlink.
Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche, wobei die Datenverarbeitungseinrichtung dazu eingerichtet ist, die folgenden Schritte auszuführen: - Zerlegen der Textdaten in Texttoken; - Abgleichen der Texttoken mit vorgegebenen Übersetzungspaaren aus einer Datenbank mit vorgegebenen Übersetzungspaaren, wobei das Abgleichen der Texttoken folgende Schritte aufweist: - Identifizieren von Datenbankeinträgen, für welche in der ersten Sprache eine Übereinstimmung mit einem Texttoken besteht, - Identifizieren von Datenbankeinträgen, für welche in der zweiten Sprache eine Übereinstimmung mit einem Texttoken besteht; - Auswählen von Übersetzungspaaren aus der Datenbank, basierend auf Datenbankeinträgen, für welche sowohl in der ersten Sprache eine Übereinstimmung mit einem Texttoken als auch in der zweiten Sprache eine Übereinstimmung mit einem Texttoken identifiziert ist.
Datenverarbeitungseinrichtung nach Anspruch 12, wobei die Datenverarbeitungseinrichtung ferner dazu eingerichtet ist, für einen Datenbankeintrag, für welchen in nur einer Sprache eine Übereinstimmung identifiziert ist, einen Vorschlag für ein Übersetzungspaar bereitzustellen.
Datenverarbeitungseinrichtung nach Anspruch 12 oder 13, wobei die Übersetzungspaare ausgewählt werden unter der Bedingung, dass ein Abstand zwischen dem ersten Texttoken und dem zweiten Texttoken einen vorgegebenen Maximalabstand in den Textdaten nicht überschreitet.
Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche, wobei die Datenverarbeitungseinrichtung ferner dazu eingerichtet ist zum - Bestimmen der ersten Sprache und der zweiten Sprache basierend auf Basis der Textdaten; und - Auswählen einer Datenbank mit vorgegebenen Wortpaaren auf Basis der bestimmten Sprachen.
Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche, wobei die Datenverarbeitungseinrichtung eingerichtet ist zum Empfangen von Bilddaten einer Vokabelliste, wobei die Vokabelliste eine erste Spalte mit Wörtern der ersten Sprache und eine zweite Spalte mit Wörtern der zweiten Sprache aufweist.
Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche, wobei die Datenverarbeitungseinrichtung dazu eingerichtet ist eine Lernliste mit einer Mehrzahl durch die Datenverarbeitungseinrichtung bestimmter Übersetzungspaare bereitzustellen.
Vokabeltrainersystem mit - einer Bilderfassungseinrichtung zum Erfassen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache, insbesondere zum Erfassen von einer Vokabelliste; - einer Datenverarbeitungseinrichtung nach einem der vorhergehenden Ansprüche; und - einer Mensch-Maschine-Schnittstelle zur Interaktion eines Nutzers mit zumindest einer Auswahl aus den von der Datenverarbeitungseinrichtung bestimmten Übersetzungspaaren.
Verfahren mit den Schritten: - Empfangen von Bilddaten mit einem Bild mit Wörtern einer ersten Sprache und Wörtern einer zweiten Sprache, und - Extrahieren von Textdaten aus den Bilddaten mittels optischer Texterkennung (Textzeichenerkennung/OCR); - Bestimmen von Übersetzungspaaren auf Basis der Textdaten, wobei ein Übersetzungspaar jeweils wenigstes ein Wort der ersten Sprache und ein zugehöriges zweites Wort der zweiten Sprache aufweist.
Computerprogramm, das dazu eingerichtet ist, dass Verfahren nach Anspruch 19 auszuführen, wenn das Computerprogramm auf einem Computer ausgeführt wird.