DE102008009442A1 - Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken - Google Patents

Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken Download PDF

Info

Publication number
DE102008009442A1
DE102008009442A1 DE102008009442A DE102008009442A DE102008009442A1 DE 102008009442 A1 DE102008009442 A1 DE 102008009442A1 DE 102008009442 A DE102008009442 A DE 102008009442A DE 102008009442 A DE102008009442 A DE 102008009442A DE 102008009442 A1 DE102008009442 A1 DE 102008009442A1
Authority
DE
Germany
Prior art keywords
word
position value
text
computer graphics
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102008009442A
Other languages
English (en)
Inventor
Alex Racic
Constantin Papst
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOOKRIX GmbH and Co KG
Original Assignee
BOOKRIX GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOOKRIX GmbH and Co KG filed Critical BOOKRIX GmbH and Co KG
Priority to DE102008009442A priority Critical patent/DE102008009442A1/de
Priority to PCT/EP2009/001001 priority patent/WO2009100913A1/de
Priority to US12/867,696 priority patent/US20100318900A1/en
Priority to EP09711265A priority patent/EP2252942A1/de
Publication of DE102008009442A1 publication Critical patent/DE102008009442A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit den Schritten: Bestimmen mindestens eines Wortpositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in einer ersten Computergrafik dargestellten Textes; Auswerten mindestens eines Selektionspositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist; Prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes; Bestimmen eines Attribuierungsbereiches der ersten Computergrafik auf Basis des durch den Selektionspositionwert erfassten Wortpositionswertes; Modifizieren der ersten Computergrafik mindestens im Attribuierungsbereich, sowie eine Vorrichtung, eine Anordnung und ein Computerprogrammprodukt hierfür.

Description

  • Technisches Gebiet
  • Die Erfindung betrifft ein Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, sowie eine Vorrichtung, eine Anordnung und ein Computerprogrammprodukt hierfür.
  • Hintergrund der Erfindung
  • Bei Systemen zur Darstellung und Verarbeitung von natürlichsprachlichem Text, etwa bei Textverarbeitungsprogrammen oder Texteditoren, ist es bekannt, Textpassagen auszuwählen, um ihnen Attribute zuzuweisen, wie Absatzstile, Hervorhebungen, Schriftart, Schriftgrad, Schriftstil, Farbe, Laufweite, etc.
  • Dabei ist der Text, der in solcherart System in zeichencodierter Form vorliegt, durch eine entsprechende Nutzerinteraktion auszuwählen, indem der Nutzer etwa den Beginn der auszuwählenden Textpassage mit einer Maus oder einem berührungsempfindlichen Bildschirm anclickt und bis zum Ende der auszuwählenden Passage zieht. Eine solches Auswählen ist in dem System nach der deutschen Übersetzung DE 695 19 905 T2 der europäischen Patentschrift EP 0 698 845 B1 beschrieben. Dadurch, dass der Text in zeichencodierter Form vorliegt, kann der Text hierzu einfach identifiziert und weiterverarbeitet werden, je nach dem zuzuweisenden Attribut oder der für den ausgewählten Text vorgesehenen Datenverarbeitungsoperation.
  • Zur Auswahl von Teilen einer Computergrafik ist bekannt, ein Selektions-, oder Fangrechteck durch Klicken des Rechteckursprungs und Ziehen bis zum Rechteckende zu definieren. Dabei werden typischerweise die Grafikelemente (Pixel im Falle einer Rastergrafik) innerhalb der genauen Ausmaße des Fangrechtecks markiert.
  • Jedoch wäre es auch wünschenswert, Textpassagen ein Attribut zuweisen zu können, die nicht in zeichencodierter Form vorliegen, sondern als eine Computergrafik, beispielsweise einer Rastergrafik, in der Text dargestellt ist. Eine solche, Text verkörpernde Grafik wird auch als Textgrafik bezeichnet.
  • In einer Textgrafik enthaltener Text entzieht sich den üblichen Auswahl- und Verarbeitungsmethoden, die für zeichencodiert vorliegenden Text angewendet werden. Der Rechner kann nur auf Pixel der die Textgrafik bildenden Rastergrafik (oder Vektorelemente einer Vektorgrafik) zugreifen, und hat keine unmittelbar verarbeitbaren Informationen über die Zeichen und Gruppierungen des Textes in der Textgrafik.
  • Aus der deutschen Übersetzung DE 694 34 434 T2 der europäischen Patentschrift EP 0 731 948 B1 ist ein System zur benutzerfreundlichen Anzeige und Handhabung von Textgrafiken bekannt, wobei die Textgrafiken aus eingescannten Seiten gedruckter Patentdokumente stammen, und bei welchem die in den Textgrafiken dargestellten Texte zudem in einer parallelen Datenhaltung in zeichencodierter Form vorliegen. Dabei wird die Paginierung von eingescannten Druckseiten von Patentschriften in der zeichencodierten Textform nachempfunden, und es ist eine Darstellungsform möglich, bei der in nebeneinanderliegenden Fenstern die Textgrafik und der zeichencodierte Text dargestellt werden. Durch diesen doppelten Ansatz wird einerseits die originalgetreue grafische Darstellung angeboten und andererseits die Weiterverarbeitbarkeit des zeichencodierten Textes ermöglicht, insbesondere das Suchen und Navigieren innerhalb eines Dokumentes.
  • Jedoch verlangt dieser Ansatz eine doppelte Datenhaltung, was grundsätzlich den Bedarf an Speicher, und bei Netzwerkanwendungen, auch an Kommunikationsbandbreite deutlich erhöht, da jeweils der grafisch codierte und zeichencodierte Text übermittelt werden muss. Ferner ist hierbei der in der Textgrafik enthaltene Text zwar mit den üblichen Bearbeitungsmethoden für Grafik bearbeitbar, wie Vergrößern, Verkleinern, Drehen, usw., aber es werden keine textspezifischen Attribuierungen vorgenommen.
  • Aufgabe der vorliegenden Erfindung ist es daher, ein Verfahren anzugeben, welches das Zuordnen von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text ermöglicht, und dabei die Nachteile des Standes der Technik vermeidet, sowie eine Vorrichtung, eine Anordnung und ein Computerprogrammprodukt hierfür.
  • Überblick über die Erfindung
  • Diese Aufgabe wird erfindungsgemäß jeweils durch den Gegenstand der Ansprüche 1, 14 und 27 bis 29 gelöst.
  • Die Erfindung nach Anspruch 1 lehrt ein Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit den folgenden Schritten:
    • – Auswählen einer ersten Computergrafik, welche eine grafische Darstellung von Text aufweist;
    • – Bestimmen mindestens eines Wortpositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes;
    • – Auswerten mindestens eines Selektionspositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist;
    • – Prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes;
    • – Bestimmen eines Attribuierungsbereiches der ersten Computergrafik auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes;
    • – Modifizieren der ersten Computergrafik mindestens im Attribuierungsbereich.
  • Indem ein Wortpositionswert für ein in der Textgrafik dargestelltes Wort bestimmt wird, wird es ermöglicht, einzelne Worte aus der Textgrafik zu addressieren und für die weitere Verarbeitung und Zuordnung von Attributen heranzuziehen. Hierdurch wird ermöglicht, in der Textgrafik enthaltene Wort zu verarbeiten, ohne parallel eine zeichencodierte Textfassung mitzuführen. Auf diese Weise wird der Bedarf an Speicher und Kommunikationsbandbreite verringert. Zudem muss der zeichencodierte „Quelltext" des in der Textgrafik dargestellten Dokumentes nicht für die Darstellung in den Einflussbereich des Benutzers übermittelt werden. Indem der Wortpositionswert ein Koordinatentupel bezüglich der Textgrafik, beispielsweise einer Buchseitendarstellung, festlegt, wird ein datenmäßig effizienter Identifikationswert gewählt, der zugleich die eindeutige Identifikation eines Wortes erlaubt.
  • Durch das Auswerten des Selektionspositionswertes wird es ermöglicht, diejenigen Worte der Textgrafik, die der Zuweisung von Textattributen (Attribuierung) zu unterziehen sind, aus der Menge aller Worte der Textgrafik auszuwählen. Der Selektionspositionswert, der somit ein Auswahlmerkmal darstellt, kann zum Beispiel durch eine Interaktion des Benutzers oder durch einen oder mehrere gespeicherte Datenbankeinträge bestimmt sein. Der Selektionspositionswert kann so etwa einen oder mehrere (Auswahl-)Punkte oder (Auswahl-)Bereiche in der Textgrafik bestimmen. Die Prüfung, ob ein Wort durch einen Selektionspositionswert erfasst wird, wird für jedes Wort der Textgrafik durchgeführt mithilfe eines Vergleiches zwischen dem jeweiligen Wortpositionswert des Wortes und dem Selektionspositionswert. Die Feststellung aufgrund einer Vergleichsoperation ermöglicht, die für eine Selektion anzuwendenden Kriterien flexibel festzulegen.
  • Im Gegensatz zu einer einfachen, herkömmlichen Auswahl eines Text darstellenden Grafikbereiches mit einem Fangrechteck, kann der Nutzer (oder das automatisierte System mit der entsprechenden Angabe in der Datenbank) erfindungsgemäß auf effiziente Art eine Menge von Worten in der Textgrafik auswählen, ohne etwa an die genauen grafischen Umgrenzungen des Wortes in der Grafik gebunden zu sein, da die Auswahl anhand des Wortpositionswertes für jedes Wort stattfindet. Es wird dabei ferner ermöglicht, einem Textabschnitt zugehörige Worte als zur Auswahl gehörig zu erkennen, die nicht innerhalb der grafischen Umgrenzung eines Auswahlbereiches liegen, aber zum Fluss des markierten Textes gehören.
  • Dadurch, dass aufgrund des Wortpositionswertes eines so als ausgewählt erkannten Wortes ein Attribuierungsbereich der Textgrafik bestimmt wird, wird ermöglicht, festzustellen, für welche flächenmäßigen Bereiche der Textgrafik die Attribuierung vorgenommen wird. Dieser Bereich wird aufgrund der jeweiligen Wortgeometrie und dem Wortpositionswert ermittelt, und ist von dem durch den Selektionspositionswert angegebenen Bereich unabhängig. Der Attribuierungsbereich insgesamt kann sich dabei aus jeweiligen Attribuierungsbereichen mehrerer Worte zusammensetzen und kann dabei etwa als das jeweilige Wort eng umgrenzendes Rechteck berechnet werden. Der einzelne Attribuierungsbereich kann dabei ferner in seiner Höhe nach der Worthöhe desjenigen Wortes bemessen sein, welches die größte Höhe der gewählten Schriftgröße des Textes erzeugt. Somit werden die Bereiche der Textgrafik ermittelt, auf die die Attribuierung grafisch angewendet wird.
  • Indem nun die Textgrafik in den Attributierungsbereichen modifiziert wird, wird es ermöglicht, die Attributierung auf die Computergrafik anzuwenden, sodass diese direkt darstellbar wird. Dies kann etwa durch die Anwendung eines Grafikfilters auf die Textgrafik, wie etwa eines Alpha-Filters, oder durch Überlagern der Textgrafik mit einer zweiten Computergrafik geschehen. Im Falle eines Attributes „Hervorheben" kann hierfür beispielsweise eine gleichmäßige oder strukturierte gelbe oder grüne Grafik, opak (teiltransparent, halbtransparent) über die Textgrafik gelegt werden. Es wird hierdurch ermöglicht, Attributierungen vorzunehmen, ohne dass hierfür ein Anzeigegerät angepasst werden müsste, oder zusätzlicher technischer Aufwand in der Handhabung, Übertragung oder Anzeige der attribuierten Textgrafik entstünde.
  • Hierdurch kann eine Anzahl verschiedener Attribuierungen auf Worte einer Textgrafik flexibel angewendet werden.
  • Weitere Ausführungsformen der Erfindung nach Anspruch 1 können entsprechend der auf diesen Anspruch rückbezogenen Unteransprüche verwirklicht werden.
  • Die Erfindung kann etwa dadurch weitergebildet sein, dass der Selektionspositionswert während einer ersten Benutzersitzung auf Basis einer Benutzerinteraktion bestimmt wird und in einem Speicher abgelegt wird. Dabei kann eine Mehrzahl von Selektionspositionswerten für jeden Nutzer individuell gespeichert werden, sodass die ausgewählten Textteile auch zu einem späteren Zeitpunkt weiterverabeitet werden können. Wird in Weiterbildungen der Erfindung der Selektionspositionswert während einer zweiten Benutzersitzung aus dem Speicher abgerufen, so kann für den Benutzer während einer späteren Benutzersitzung die in der ersten Sitzung vorgenommene Attribuierung aufgrund der gespeicherten Selektionspositionswerte wiederhergestellt werden.
  • In Weiterbildungen der Erfindung wird ein Attribuierungstyp bestimmt, der das zuzuordnende Textattribut identifiziert. Hierdurch wird ermöglicht, den markierten Text in Abhängigkeit des Attribuierungstyps unterschiedlich weiterzuverarbeiten, etwa dadurch, dass die zweite Computergrafik in Abhängigkeit von dem bestimmten Attribuierungstyp ausgewählt wird.
  • Weiterbildungen der Erfindung können dadurch gekennzeichnet sein, dass das die erste Computergrafik mit der zweiten Computergrafik opak überlagert wird. Dies kann durch pixelweise rechnerische Bildverknüpfungsoperationen verwirklicht werden, indem die erste und zweite Grafik aus dem Speicher abgerufen, verknüpft und das Verknüpfungsergebnis in den Speicher abgelegt wird. Das Verknüpfungsergebnis stellt die überlagerte erste Grafik dar.
  • Die Erfindung kann dadurch weitergebildet sein, dass der Attribuierungsbereich bestimmt wird unter Ermittlung des durch die grafische Wortdarstellung beanspruchten Bereiches der ersten Computergrafik.
  • Weist der Selektionspositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel auf, können das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Selektionsbereiches bilden. Dieser stellt durch seine Ecken Vergleichswerte bereit, die für die Vergleichsoperationen der Wortselektionsprüfung herangezogen werden können.
  • Entsprechend kann die Erfindung dahingehend weitergebildet werden, dass der Wortpositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist, und zusätzlich dahingehend, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Wortbereiches bilden.
  • Hierdurch kann die Wortselektionsprüfung unter Koordinatenvergleich so gestaltet sein, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise im Selektionsbereich liegt. Um auch Worte zu erfassen, die nicht im Selektionsbereich liegen, aber zum Textfluss zugehören, kann zudem die Wortselektionsprüfung so gestaltet werden, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise zwischen der vertikalen Koordinate des ersten Koordinatentupels des Selektionspositionswertes und der vertikalen Koordinate des zweiten Koordinatentupels des Selektionspositionswertes liegt.
  • Die Erfindung nach Anspruch 14 stellt eine Vorrichtung zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text nach dem hier vorgeschlagenen Verfahren bereit, mit einer Verarbeitungseinheit und einem Speicher, dadurch gekennzeichnet, dass
    • – der Speicher eine erste Computergrafik enthält, welche eine grafische Darstellung von Text aufweist;
    • – die Verarbeitungseinheit ausgebildet ist, mindestens einen Wortpositionswert zu bestimmen, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes;
    • – die Verarbeitungseinheit ausgebildet ist, mindestens einen Selektionspositionswert auszuwerten, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist;
    • – die Verarbeitungseinheit ausgebildet ist, zu prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes;
    • – die Verarbeitungseinheit ausgebildet ist, einen Attribuierungsbereich der ersten Computergrafik zu bestimmen auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes;
    • – die Verarbeitungseinheit ausgebildet ist, die erste Computergrafik mindestens im Attribuierungsbereich zu modifizieren.
  • Durch diese Einrichtungen und Ausbildungen des Speichers und der Verarbeitungseinheit ist die Vorrichtung eingerichtet, das erfindungsgemäße Verfahren auszuführen.
  • Die Verarbeitungseinheit kann durch programmtechnisches Einrichten von Mehrzweckhardware, wie Mehrzweckprozessoren, und oder durch eine Kombination von Programmierung und anwendungsspezifischen Prozessorkomponenten (Application Specific Integrated Circuits, ASICs) verwirklicht werden. Insbesondere kann für die Verwirklichung Rückgriff auf durch Betriebssysteme oder Middleware bereitgestellte Funktionen genommen werden und/oder auf internettypische Technologien, wie PHP (PHP Hypertext Preprocessor) und/oder JavaScript.
  • Ausführungsformen der Erfindung nach Anspruch 16 können entsprechend den auf diesen Anspruch rückbezogenen Unteransprüchen verwirklicht werden, sowie entsprechend den übrigen Weiterbildungen und Ausführungsformen aller erfindungsgemäßen Vorrichtungen und Verfahren.
  • Die Erfindung nach Anspruch 27 stellt eine Anordnung zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit einer als Server ausgebildeten erfindungsgemäßen oder weitergebildeten Vorrichtung und einem mit dem Server über ein Netzwerk verbindbaren Client, wobei:
    • – die Verarbeitungseinheit des Servers ausgebildet ist, eine erste Computergrafik, welche eine grafische Darstellung von Text aufweist, über eine im Server enthaltene Kommunikationsschnittstelle über das Netzwerk an den Client zu übermitteln;
    • – der Client ausgebildet ist, die erste Computergrafik über eine im Client enthaltene Benutzerschnittstelle darzustellen, eine Benutzerinteraktion entgegenzunehmen, und den daraus resultierenden Wert über eine im Client enthaltene Kommunikationsschnittstelle über das Netzwerk an den Server zu übermitteln,
    • – und die Verarbeitungseinheit des Servers ausgebildet ist, den Selektionspositionswert auf Basis des übermittelten Wertes auszuwerten, und die aus der Modifizierung entstandene Computergrafik an den Client zu übermitteln.
  • Durch die Konfiguration der Anordnung mit Client und Server wird die Anordnung in Übereinstimmung mit gängigen Architekturen dezentraler Systeme gebracht, wie sie zwischen Diensteanbietercomputern und Dienstenachfragercomputern über das Internet oder über Mobilfunknetze weit verbreitet sind. Somit läßt sich die Anordnung ohne wesentlichen technischen Zusatzaufwand in bestehende Systeme integrieren.
  • Die Erfindung nach Anspruch 28 stellt ein auf einem computerlesbaren Speichermedium gespeichertes Computerprogrammprodukt bereit, welches computerlesbare Programmittel zur Ausführung der Schritte des erfindungsgemäßen Verfahrens durch einen Computer enthält. Die Erfindung nach Anspruch 29 stellt entsprechend ein Computerprogrammprodukt bereit, welches in einer digitalen Trägerwelle verkörpert ist. Die digitale Trägerwelle kann etwa durch ein kabelloses oder kabelgebundenes elektrisches oder optisches Signal oder durch alle Formen der Verkörperung der informationstragenden Bits in einem Medium realisiert sein. Beide Computerprogrammprodukte dienen zur Durchführung des Verfahrens, wenn das Programmprodukt auf einem Rechner abläuft.
  • Das Computerprogrammprodukt kann in entsprechender Weise auf einem magnetischen oder optischen Datenträger gespeichert sein, wie einer CD-ROM, DVD-ROM, Diskette oder Festplatte, oder in einem Halbleiterbaustein, wie etwa einem Speicherbaustein oder einem Speicherteil eines Prozessors.
  • Kurzbeschreibung der Zeichnungen
  • Die Erfindung wird nachfolgend beispielhaft anhand mehrerer Figuren erläutert. Es zeigen:
  • 1 eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens,
  • 2 eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens im Anwendungszusammenhang,
  • 3 eine schematische Übersicht über ein Ausführungsbeispiel einer Anordnung zur Zuordnung von Textattributen, mit einem Client und mit einer Vorrichtung zur Zuordnung als Server
  • 4 eine Veranschaulichung eines ersten Aspektes des Markierungsvorgangs gemäß des Verfahrens der 1,
  • 5 eine Veranschaulichung eines zweiten Aspektes des Markierungsvorgangs gemäß des Verfahrens der 1, und
  • 6 eine Veranschaulichung eines dritten Aspektes des Markierungsvorgangs gemäß des Verfahrens der 1.
  • Detaillierte Beschreibung
  • 1 zeigt eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens.
  • In Schritt 100 wählt die Verarbeitungsvorrichtung zunächst eine Textgrafik zur weiteren verfahrensmäßigen Bearbeitung aus. Bei der Textgrafik handelt es sich um eine Computergrafik, die Textelemente aufweist, wobei die Textelemente nicht zeichencodiert sind, sondern rein graphisch in der Computergrafik dargestellt sind. Bei der Computergrafik kann es sich um eine Rastergrafik oder eine Vektorgrafik handeln.
  • In Schritt 110 ermittelt die Verarbeitungsvorrichtung dann für jedes in der Textgrafik enthaltene Wort der zugehörige Wortpositionswert, welcher ein oder zwei Koordinatentupel enthalten kann. Das Koordinatentupel bezeichnet dabei die relative Position des Wortes im Koordinatensystem der Textgrafik. Bei zwei Koordinatentupeln etwa kann das erste die X-Koordinate und die Y-Koordinate der linke obere Ecke des Wortes bezeichnen, und das zweite Koordinatentupel die X-Koordinate und die Y-Koordinate der rechten unteren Ecke des Wortes.
  • Die Wortpositionswerte können etwa aus einer Datenbank abgerufen werden, welche für jedes Wort einer Textgrafik den zugehörigen Wortpositionswert enthält, oder sie können durch Bildverarbeitungsmethoden, beispielsweise Texterkennungs- oder Optische Zeichenerkennungsmethoden (Optical Character Recognition, OCR) bestimmt werden.
  • In Schritt 120 wertet dann die Verarbeitungseinheit einen oder mehrere Selektionspositionswerte aus, die etwa aus eine Benutzereingabe stammen können oder aus einer Datenbank abgerufen wurde, die für jede Textgrafik dieser zugeordnete Selektionspositionswerte enthält.
  • Ein Selektionspositionswert kann, wie der Wortpositionswert, ein Koordinatentupel sein, oder er kann analog zum Wortpositionswert zwei Tupel beinhalten, die die Ecken eines Selektionsbereiches bilden.
  • Alternativ zum in den Schritten 110 und 120 beschriebenen Vorgehen kann auch zunächst der oder die Selektionspositionswert empfangen bzw. abgerufen werden, um dann nur diejenigen Wortpositionswerte der Textgrafik zu ermitteln, welche durch den Selektionspositionswert erfasst sein könnten. Durch diese Vorauswahl, die durch Auswertung einer Abstandsmetrik um den Selektionspositionswert herum getroffen werden kann, wird der Rechenaufwand bei OCR-basierter dynamischer Wortpositionswertermittlung oder der Zugriffsaufwand bei Abrufen aus einem Speicher oder einer Datenbank vermindert.
  • In Schritt 130 prüft dann die Verarbeitungseinheit jeden der ermittelten Wortpositionswerte, d. h. für jedes oder jedes nach der Metrik grundsätzlich in Frage kommendes Wort, ob das in der Textgrafik dargestellte Wort durch den Selektionspositionswert erfasst wird. Auf diese Weise werden alle in der Textgrafik dargestellten Worte ermittelt, die für die Attribuierung ausgewählt werden sollen. Dies kann etwa durch eine Auswahl und ggf. Kombination der folgenden vier Fallunterscheidungen geschehen, wenn Wortpositionswerte und Selektionspositionswerte jeweils zwei Koordinatentupel aufweisen, welche Eckpunkte eines Bereiches darstellen. Ein Wort wird dann markiert wenn mindestens eine der folgenden Fallunterscheidungen zutrifft: 1. Fallunterscheidung
    FALLS (WortUntenRechts_X >= SelektionStart_X
    UND WortUntenRechts_Y >= SelektionStart_Y
    UND WortUntenRechts_Y < SelektionEnde_Y)
    DANN MarkiereWort
    2. Fallunterscheidung
    FALLS (WortObenLinks_Y > SelektionStart_Y
    UND WortObenLinks_X <= SelektionEnde_X
    UND WortObenLinks_Y <= SelektionEnde_Y)
    DANN MarkiereWort
    3. Fallunterscheidung
    FALLS (WortObenLinks_Y > SelektionStart_Y
    UND WortUntenRechts_Y < SelektionEnde_Y)
    DANN MarkiereWort
    4. Fallunterscheidung
    FALLS (WortUntenRechts_X >= SelektionStart_X
    UND WortObenLinks_X <= SelektionEnde_X
    UND WortObenLinks_Y <= SelektionStart_Y
    UND WortObenLinks_Y <= SelektionEnde_Y
    UND WortUntenRechts_Y >= SelektionStart_Y
    UND WortUntenRechts_Y >= SelektionEnde_Y)
    DANN MarkiereWort
  • Bei allen Fallunterscheidungen steht „ObenLinks" für das erste Wortpositions-Koordinatentupel und „UntenRechts" für das zweite Wortpositions-Koordinatentupel und „Start" für das erste Selektionspositions-Koordinatentupel und „Ende" für das zweite Selektionspositions-Koordinatentupel. Der Fachmann wird hieraus ersehen, dass unter entsprechender Anpassung der Fallunterscheidungsbedingungen auch ein „ObenRechts" und ein „UntenLinks" als erstes und zweites Wortpositions-Koordinatentupel verwendet werden kann. „X" und „Y" stehen für die X- bzw. Y-Koordinate des Koordinatentupels. Im beispielhaften Koordinatensystem verlaufen die Koordinatenangaben einer Rastercomputergrafik vom Ursprung in der linken oberen Ecke nach rechts in X-Richtung und nach unten in Y-Richtung.
  • Die erste Fallunterscheidung prüft, ob der untere rechte Punkt des Wortes gleich oder weiter rechts liegt als der Startpunkt der Markierung, und dabei gleichzeitig der untere rechte Punkt des Wortes gleich hoch oder tiefer liegt als der Startpunkt der Markierung, und ferner gleichzeitig der untere rechte Punkt des Wortes höher liegt als der Endpunkt der Markierung.
  • Die zweite Fallunterscheidung prüft, ob der obere linke Punkt des Wortes tiefer als der Startpunkt der Markierung liegt und dabei gleichzeitig der obere linke Punkt des Wortes gleich oder sogar weiter links als der Endpunkt der Markierung liegt, und ferner gleichzeitig der obere linke Punkt gleich hoch oder sogar höher als der Endpunkt der Markierung liegt.
  • Die dritte Fallunterscheidung prüft eine der ersten Fallunterscheidung verwandte, jedoch hinsichtlich der Selektionspositionswerte umgekehrte Situation. Hier prüft die Verarbeitungseinheit, ob der obere linke Punkt des Wortes tiefer liegt als der Startpunkt der Markierung und dabei der untere rechte Punkt des Wortes höher liegt als der Endpunkt der Markierung.
  • Die vierte Fallunterscheidung schließlich prüft, ob der untere rechte Punkt des Wortes gleich oder sogar weiter rechts liegt als der Startpunkt der Markierung, dabei gleichzeitig der obere linke Punkt gleich oder sogar weiter links liegt als der Endpunkt der Markierung, dabei gleichzeitig der obere linke Punkt gleich hoch oder sogar höher liegt als der Startpunkt der Markierung, dabei wiederum gleichzeitig der obere linke Punkt gleich hoch oder sogar höher liegt als der Endpunkt der Markierung, dabei zudem der untere rechte Punkt des Wortes gleich hoch oder sogar tiefer liegt als der Startpunkt der Markierung, und dabei schließlich der untere rechte Punkt gleich hoch oder sogar tiefer liegt als der Endpunkt der Markierung.
  • Die Fallunterscheidungen können gegebenfalls in logisch äquivalenten unterschiedlichen Fallunterscheidungskonstrukten programm- oder schaltungstechnisch realisiert werden.
  • Anschaulich werden die Auswahlszenarien durch die vier oben genannten Fallunterscheidungen wie in der folgenden Tabelle erfasst. Die Zeilen bezeichnen die Position des Startpunktes relativ zur Position des Wortes im Koordinatensystem, und die Spalten bezeichnen die Position des Endpunktes relativ zur Position des Wortes im Koordinatensystem. Die Angabe in der Tabellenzelle bezeichnet die jeweilige der oben beschriebenen vier Fallunterscheidungen.
    innerhalb rechts links unterhalb unterhalb rechts unterhalb
    links oberhalb 2. 2. 1. 1. 1.
    oberhalb 2. 2. 1. 1. 1.
    rechts oberhalb 2. 2. 3. 2. 2.
    links 4. 4. 1. 1. 1.
    innerhalb 4. 4. 1. 1. 1.
  • Als Ergebnis der Fallunterscheidung in Schritt 130 ermittelt somit die Verarbeitungseinheit die Menge der Worte, die von dem Selektionspositionswert bzw. der zugrundeliegenden Selektionsoperation durch einen Benutzer erfasst werden.
  • Hierbei kann es sich um eine Menge oder einen Vektor von Wortpositionswerten handeln. Ist kein Wort von der Selektion betroffen, so kann das Verfahren an dieser Stelle abgebrochen werden.
  • Für jeden der in Schritt 130 ermittelten, vom Selektionspositionswert oder den Selektionspositionswerten betroffenenen Wortpositionswerten berechnet nun die Verarbeitungseinheit in Schritt 140 einen der das jeweilige Wort in der Textgrafikdarstellung umgebenden Bereich. Der Attribuierungsbereich ist vom Wortpositionswert verschieden. In praktischen Implementierungen ist der Attribuierungsbereich ein Bereich der Textgrafik, der in horizontaler Ausdehnung das Wort eng umgrenzt, und in vertikaler Ausdehnung so hoch ist, wie das maximal hohe Wort der gleichen Schriftart und Schriftgröße des zu attribuierenden Wortes sein kann. Hierdurch wird eine grafisch gleichmäßig hohe Attribuierung in zeilenweise angeordnetem Fließtext sichergestellt, unabhängig von der tatsächlichen Worthöhe einzelner, zu attribuierender Worte. Ferner bestimmt die Verarbeitungseinheit in Schritt 140 den Gesamtattribuierungsbereich für die Gesamttextgrafik durch Summierung der Einzelbereiche.
  • Abhängig von der vornehmenden Attribuierung, die beispielsweise durch eine Benutzerinteraktion ausgewählt und dann entsprechend in Schritt 150 bestimmt werden kann, wählt die Verabeitungseinheit in Schritt 160 dann eine Computergrafik aus, die in Kombination mit der Textgrafik einen der Attribuierung entsprechenden visuellen Effekt erzeugt. Alternative Ausführungsformen können vorsehen, dass anstelle oder zusätzlich zu einer zweiten Computergrafik und der Überlagerung ein Grafikfilter in Abhängigkeit von der anzuwendenden Attribuierung ausgewählt wird, etwa ein Alpha-Filter, oder dergleichen, der auf die Textgrafik angewendet wird. Für ein Hervorheben oder ein Highlighting nach Art eines Textmarkers kann eine glatte oder filzstiftartig texturierte, flächig gelbe oder grüne Computergrafik als Overlay-Grafik ausgewählt werden, die semi-transparent oder opak sein kann, und die dann rechnerisch von der Verarbeitungseinheit in Schritt 170 mit der Textgrafik zu einer Ergebnisgrafik kombiniert wird, indem die Textgrafik mit der Overlay-Grafik überlagert wird. Hierbei wird im Unterschied zu herkömmmlichen Hervorhebungseffekten nicht lediglich die Hintergrundfarbe verändert, sondern zugleich auch die Schriftfarbe graduell eingefärbt, was auch den visuellen Effekt des Highlightings verbessert.
  • Alternativ kann die Overlay-Computergrafik auch als nicht transparente Grafik vorliegen, wobei der semitransparente oder opake Effekt bei der rechnerischen Kombination dynamisch erzeugt wird.
  • Das Überlagern findet dabei nur in denjenigen Bereichen der Textgrafik statt, die Attribuierungsbereiche sind, während die übrigen Bereiche unverändert bleiben.
  • Alternativ zum Highlighting sind auch Umrahmungen möglich, indem eine transparente Overlay-Grafik mit einer soliden Rahmendarstellung in Größe des Attribuierungsbereiches dynamisch erzeugt wird.
  • 2 zeigt eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens im Anwendungszusammenhang.
  • In Schritt 200 wird auf dem Server eine Benutzersitzung eröffnet. Der Server kann hierfür einen geeignete Anfrage von einem Benutzer an einem Client erhalten haben, etwa im Rahmen eines Einloggens. Der Client kann hierbei einen Web-Client beinhalten, und der Server einen Web-Server, wobei Web-Client und Web-Server entsprechend zur Durchführung des Verfahrens eingerichtet sind.
  • In Schritt 210 ruft nun die Verarbeitungseinheit des Servers für den angemeldeten Nutzer spezifisch gespeicherte Selektionspositionswerte aus einer Datenbank ab, die der Nutzer in einer vorausgehenden Benutzersitzung erzeugt hat. Dann führt die Verarbeitungseinheit des Servers das Attribuierungsverfahren durch, wie es mit Bezug auf 1 in den Schritten 100170 gezeigt wurde. Die als Ergebnis gewonnene überlagerte Computergrafik mit den attribuierten Textelementen wird dann über das Internet an den Web-Client übermittelt, der die attribuierte Textgrafik in Schritt 230 darstellt. Durch Angabe eines Startpunktes und eines Endpunktes wählt der Benutzer einen Auswahlbereich aus, und wählt ferner eine Attribuierungsart aus, die vom Client in Schritt 240 dem Benutzer über eine Benutzerschnittstelle angeboten und erfasst wird. Der Client übermittelt dann diese Werte der Benutzerauswahl in Schritt 250 an den Server, der entsprechend diese Werte als Selektionspositionswert übernimmt oder den Selektionspositionswert rechnerisch hieraus ableitet, und abermals das Attribuierungsverfahren der Schritte 100 bis 170 durchführt. Dabei fügt die Verarbeitungseinheit des Servers den Selektionspositionswert den bereits in der Datenbank nutzerspezifisch gespeicherten hinzu, indem den die Selektionspositionswert in Schritt 260 speichert. In Schritt 270 Übermittelt der Server die neuerlich attribuierte, gesamte Textgrafik an den Client zur Darstellung.
  • In einer alternativen Ausführung kann das Speichern der Selektionspositionswerte in Schritt 260 direkt im Anschluß an das Übermitteln der Benutzerauswahl in Schritt 250 und Übernehmen oder Berechnen des Selektionspositionswertes daraus erfolgen, und entsprechend kann das Durchführen des Attribuierungsverfahrens der Schritte 100 bis 170 im Anschluß an das Speichern in Schritt 260 durchgeführt werden.
  • 3 zeigt eine schematische Übersicht über ein Ausführungsbeispiel einer Anordnung zur Zuordnung von Textattributen, mit einem Client und mit einer Vorrichtung zur Zuordnung von Textattributen als Server.
  • Die als Server 1 ausgebildete Vorrichtung zur Zuordnung von Textattributen weist eine Verarbeitungseinheit 10, eine Kommunikationsschnittstelle 12 und einen Speicher 14 auf, welche alle miteinander kommunikativ gekoppelt sind, etwa durch ein rechnerinternes Bussystem. Falls die Aufgaben zwischen einzelnen Computern verteilt werden, kann die Verbindung zwischen einem Verarbeitungsrechner, einem Kommunikationsgateway und einem Datenbankserver über ein lokales Netzwerk in äquivalenter Weise erfolgen.
  • Die Verarbeitungseinheit 10 ist insbesondere eingerichtet, die Schritte 100170 des Verfahrens, und, in der vorliegenden Client-Server-Konfiguration, auch die Schritte 200220 und 260 und 270 auszuführen. Hierfür kann die Verarbeitungseinheit auch Funktionen eines Betriebssystems und eines Webservers verwirklichen. Zur Kommunikation über ein Netzwerk bedient sich die Verarbeitungseinheit 10 dabei der Kommunikationsschnittstelle 12, welche beispielsweise zur Kommunikation über Internet via TCP/IP, oder über zelluläre Mobilfunknetze eingerichtet ist.
  • Im Speicher 14 ist eine erste Computergrafik 18 enthalten oder referenziert, welche Textbestandteile grafisch darstellt. Die Computergrafik 18 ist dabei eine Raster- oder Vektorgrafik, die die Zeichen des Textes durch Pixel oder Vektoren darstellt, ohne den Text zeichencodiert, etwa in einem ASCII-, ISO 8859-1-, oder Unicode-Format zu enthalten, und wird üblicherweise als Textgrafik bezeichnet.
  • So kann etwa eine zeilenweise angeordnete Textmenge in der Textgrafik dargestellt sein, die den Textfluß einer Buchseite darstellt.
  • Ferner ist im Speicher 14 eine zweite Computergrafik 16 (Overlay-Grafik) enthalten oder referenziert, welche eine farbige Fläche oder Textur oder eine andere grafische Gestaltung aufweist, die einer der Textgrafik oder Teilen davon, d. h. Worten darin, zuzuweisenden Attribuierung entsprechen. So kann für eine Attributzuweisung des Attributs „Hervorgehoben" eine farbige, etwa gelbe oder grüne, flächige Textur ausgewählt werden. Die zweite Computergrafik 16 kann dabei opak sein, d. h. einen bestimmten Transparenzgrad aufweisen, der durch einen Alphakanal der Grafik 16 bestimmt sein kann. Der Alphakanal für die Grafik kann intern oder in einer externen Datenhaltung vorliegen. Alternativ kann auch eine nichttransparente Grafik als zweite Computergrafik 16 verwendet werden, wenn die Verabeitungseinheit 10 ausgebildet ist, den Schritt 170 der Überlagerung der Grafiken so auszuführen, dass im Ergebnis die zweite Grafik als der ersten opak überlagert erscheint.
  • Der Client 2 ist ein Computer, der einem Benutzer zur Interaktion dient, und der, beispielsweise über einen Web-Client oder ein Anzeigeprogramm für elektronische Dokumente, mit dem Server 1 kommuniziert, um Textgrafiken sowie Programm- oder HTML-code für die auf dem Client darzustellende Nutzeroberfläche vom Server abzurufen und darzustellen bzw. auszuführen.
  • Client 2 umfasst dabei eine Verarbeitungseinheit 20, die etwa mit einem programmierten Universalprozessor verwirklicht sein kann, sowie eine damit verbundene Kommunikationsschnittstelle 22 (Network-Stack) und einen Speicher 24, welcher wiederum eine Textgrafik 26 aufweist.
  • Ferner ist eine Benutzerschnittstelle, beispielsweise eine grafische Benutzerschnittstelle (GUI), die durch ein Zeigegerät oder einen Touch-Screen bedient wird, im Client 2 enthalten oder mit diesem verbunden. Die Textgrafik 26 wird über die Benutzerschnittstelle 28 zusammen mit entsprechenden Auswahl- und Menüoptionen dem Nutzer dargestellt und es werden durch die Benutzerschnittstelle Befehle des Benutzers entgegengenommen, indem aus den Nutzeraktionen entsprechende Befehlswerte gewonnen werden.
  • Die Verarbeitungseinheit 20 ist insbesondere eingerichtet, mit dem Server zu interagieren und die Schritte 230 bis 250 des Verfahrens auszuführen. Ferner ist die Verarbeitungseinheit ausgebildet, eine Nutzeridentifikation zu erfassen und an den Server 1 zu übermitteln, der daraufhin eine Benutzersitzung eröffnet und nutzerspezifisch gespeicherte Werte abruft.
  • 4 zeigt eine Veranschaulichung eines ersten Aspektes des Markierungsvorgangs gemäß des Verfahrens der 1.
  • Hier sind vier Bereiche A, B, C, D einer Textgrafik dargestellt, die eine Doppelseite eines aufgeschlagenen Buches mit zeilenweise fließendem Text zeigt. Die vier Bereiche A, B, C und D sind jeweils Bereiche, in denen dem darin dargestellten Text das Attribut „Hervorhebung" verfahrensgemäß zugeordnet wurde. Wie in der Figur dargestellt, ist dem attribuierten Textteil der Grafik eine grau dargestellte grafische Kennzeichnung hinzugefügt worden, wobei die grau dargestellten Teile zugleich den verfahrensgemäß bestimmten Attribuierungsbereich der Textgrafik kennzeichnen. Zur Verdeutlichung ist zudem für jeden der Bereiche noch der zugehörige Selektionspositionswert verdeutlicht, der vorliegend jeweils aus zwei Koordinatentupeln besteht. Es ist dies für den Bereich A der Punkt 40 als Startkoordinatentupel der Markierung und Punkt 42 als Endkoordinatentupel, für den Bereich B der Punkt 44 als Startkoordinatentupel der Markierung und Punkt 46 als Endkoordinatentupel, für den Bereich C der Punkt 48 als Startkoordinatentupel der Markierung und Punkt 50 als Endkoordinatentupel, und schließlich für den Bereich D der Punkt 52 als Startkoordinatentupel der Markierung und Punkt 54 als Endkoordinatentupel.
  • Insbesondere am Bereich C wird anschaulich, dass auch Worte und Bereiche der Textgrafik attribuiert wurden, die nicht in einem durch Start- und Endkoordinatentupel aufgespannten Fangrechteck mindestens teilweise enthalten sind, sondern vollständig außerhalb liegen. Ferner ist hier sichtbar, dass die attribuierten Grafikbereiche alle gleich hoch sind, und nicht mit der tatsächlichen Worthöhe variieren. Dies wird dadurch sichergestellt, dass der Attribuierungsbereich grundsätzlich unabhängig von der tatsächlichen Worthöhe berechnet wird.
  • In Varianten des Verfahrens kann die Berechnung des zu attribuierenden Textgrafikbereiches für jedes einzelne Wort auch schon in die Bestimmung des Wortpositionswertes des jeweiligen Wortes vorgezogen werden, etwa indem für jedes einzelne Wort dabei eine Umgrenzung als Wortpositionswert bestimmt wird, die mit dem weiter oben definierten Attribuierungsbereich des jeweiligen Wortes übereinstimmt. In diesem Fall kann der Wortpositionswert direkt als Attribuierungsbereich des jeweiligen Wortes übernommen werden, und es wird in Schritt 140 dann nur noch der Gesamtattribuierungsbereich für die Gesamttextgrafik bestimmt.
  • 5 zeigt eine Veranschaulichung eines zweiten Aspektes des Markierungsvorgangs gemäß des Verfahrens der 1, insbesondere der einzelnen Bereiche, Positionswerte und Koordinatentupel zueinander.
  • In einer Textgrafik mit mehreren Worten ist durch ein erstes Koordinatentupel eines Selektionspositionswertes ein Startpunkt 60 einer Auswahl durch einen Benutzer gegeben, und durch ein zweites Koordinatentupel desselben Selektionspositionswertes ein Endpunkt 62 der Auswahl. Der Auswahlbereich kann somit als ein rechteckiger Selektionsbereich 70 angesehen werden. Im Unterschied zum herkömmlichen Fangrechteck aber werden wegen der besonderen Fallunterscheidungen in Schritt 130 nicht bloß Worte einbezogen, die mindestens teilweise in das Rechteck fallen, wie auch in 4 für Bereich C veranschaulicht. 5 zeigt insofern einen Spezialfall, bei dem das „Testwort" genau in den Selektionsbereich 70 fällt.
  • Entsprechend ist vorliegend durch ein erstes Koordinatentupel eines Wortpositionswertes eine obere linke Ecke 64 eines Wortes gegeben, und durch ein zweites Koordinatentupel desselben Wortpositionswertes eine untere linke Ecke 66 des Wortes, wodurch ein (gepunktet umrissen dargestellter) rechteckiger Wortbereich 68 aufgespannt wird.
  • Hierfür wird entsprechend ein den Wortbereich 68 mit einem Abstandsbereich umgebender Attribuierungsbereich 72 (hier als Kasten dargestellt) berechnet. Der Abstandsbereich wird etwa so bemessen, dass er so hoch ist, wie das maximal hohe Wort der gleichen Schriftart und Schriftgröße des zu attribuierenden Wortes sein kann. Dabei kann als Breite die Breite des Wortbereiches übernommen werden, oder es kann ein am Wortabstand orientierter horizontaler Abstandsbereich zwischen Wortbereich und Rand des Attribuierungsbereiches hinzugerechnet werden.
  • 6 zeigt eine Veranschaulichung eines dritten Aspektes des Markierungsvorgangs gemäß des Verfahrens der 1.
  • Die durch die Bezugszeichen referenzierten Elemente entsprechen denen der 5, jedoch wird hier noch ein mal der Fall detailliert dargestellt, bei dem ein Wort mit seinem Wortbereich vollständig außerhalb des durch den Selektionspositionswert gebildeteten Rechtecks liegt.
  • Ein entsprechender Eintrag zur Speicherung der Selektionen und/oder Attribuierungen kann in einer Benutzer- oder Benutzersitzungsdatenbank etwa unter Verwendung von Feldern jeweils für eine Dokumentenkennung zur Identifikation des Dokumentes, welches durch die Textgrafik dargestellt wird, eine Seitenkennung zur Identifikation der Dokumentseite, ein Startkoordinatentupel des Selektionspositionswertes, ein Endkoordinatentupel des Selektionspositionswertes, ein Koordinatentupel einer linken oberen Ecke des Wortpositionswertes, ein Koordinatentupel einer rechten unteren Ecke des Wortpositionswertes, sowie eines Zeitstempels erfolgen.
  • Das vorliegende System stellt somit die Möglichkeit bereit, Text in Textgrafiken, der nicht zeichencodiert vorliegt, sondern rein grafisch in der Textgrafik dargestellt wird, mit Attributen wie Hervorhebung oder Umrahmung zu versehen, ohne hierfür einer parallelen Vorhaltung des Textes in zeichencodierter Form zu bedürfen, und ohne, dass die der Attribuierung zu unterziehende Text der Textgrafik mit den herkömmlichen Markierungsmethoden für Computergrafiken ausgewählt werden muss.
  • Hierdurch kann die Auswahl des zu attribuierenden Textes etwa durch einen Startpunkt und einen Endpunkt einer Markierung definiert werden und es erübrigt sich die genaue Positionierung eines Fangrechtecks um jeden der zu markierenden Textteile herum. Ein Benutzer kann somit eine Markierung etwa durch lediglich zwei Mausklicks vornehmen, und erhält, etwa bei einer dargestellten Buchseite, eine Markierung aller im Textfluss stehenden Wörter zwischen den beiden Punkten. Ein Nutzer kann mit dem vorliegenden System ferner alle Attribuierungen im Rahmen einer Benutzersitzung speichern und sie in einer späteren Benutzersitzung wiederherstellen lassen. Bei einer Nutzung durch mehrere Nutzer wird im vorliegenden System lediglich die Selektions- und Attribuierungsinformation gespeichert, sodass die Attribuierung einerseits für jeden Nutzer individuell und unterschiedlich wiederhergestellt werden kann, andererseits aber eine Mehrfachspeicherung der attribuierten Textgrafiken vermeidet, da jeweils die Attribuierung auf Basis der ursprünglichen Textgrafik wiederhergestellt wird, und somit bei einer Vielzahl von Nutzern erheblich ressourcensparend wird. Das Überlagern der Textgrafik mit der opaken grafischen Darstellung des Textattributes kann zudem den visuellen Eindruck verbessern. Das System kann dabei leicht so weitergebildet werden, dass sich eine Markierung über mehrere dargestellte Seiten Textgrafik erstreckt, indem die Markierung auf einer ersten Seite bis zum letzten Wort der letzten Zeile geführt wird, indem dort ein Endpunkt eingefügt wird, und auf der folgenden Seite am ersten Wort der ersten Zeile wieder beginnt, indem dort ein Startpunkt eingefügt wird.
  • 1
    Vorrichtung zur Zuordnung von Textattributen (Server)
    2
    Benutzercomputer (Client)
    10
    Verarbeitungseinheit
    12
    Kommunikationsschnittstelle
    14
    Speicher
    16
    zweite Computergrafik (Textattribut-Overlay)
    18
    erste Computergrafik mit Textgrafik
    20
    Verarbeitungeinheit
    22
    Kommunikationsschnittstelle
    24
    Speicher
    26
    Überlagerte Computergrafik
    28
    Benutzerschnittstelle
    40
    Startpunkt Selektionsbereich A
    42
    Endpunkt Selektionsbereich A
    44
    Startpunkt Selektionsbereich B
    46
    Endpunkt Selektionsbereich B
    48
    Startpunkt Selektionsbereich C
    50
    Endpunkt Selektionsbereich C
    52
    Startpunkt Selektionsbereich D
    54
    Endpunkt Selektionsbereich D
    60
    Startpunkt Selektionsbereich
    62
    Endpunkt Selektionsbereich
    64
    Erster Eckpunkt Wortbereich
    66
    Zweiter Eckpunkt Wortbereich
    68
    Wortbereich
    70
    Selektionsbereich
    72
    Attribuierungsbereich eines Wortes
    100
    Auswählen der ersten Computergrafik (Textgrafik)
    110
    Bestimmen der Wortpositionswerte
    120
    Auswerten des Selektionspositionswertes
    130
    Prüfen, ob Worte in Grafik durch Selektion erfasst
    140
    Bestimmen des Attribuierungsbereiches
    150
    Bestimmen des Attribuierungstyps
    160
    Auswählen der zweiten Computergrafik (Attribut-Overlay)
    170
    Überlagern der Computergrafiken
    200
    Eröffnen einer Benutzersitzung
    210
    Abrufen gespeicherter Selektionspositionswerte
    220
    Übermitteln der überlagerten Computergrafik
    230
    Darstellen der Computergrafik
    240
    Erfassen der Benutzerauswahl
    250
    Übermitteln der Benutzerauswahl
    260
    Speichern des Selektionspositionswertes
    270
    Übermitteln der überlagerten Computergrafik
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - DE 69519905 T2 [0003]
    • - EP 0698845 B1 [0003]
    • - DE 69434434 T2 [0007]
    • - EP 0731948 B1 [0007]
  • Zitierte Nicht-Patentliteratur
    • - ISO 8859-1- [0070]

Claims (29)

  1. Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit den folgenden Schritten: – Auswählen einer ersten Computergrafik, welche eine grafische Darstellung von Text aufweist; – Bestimmen mindestens eines Wortpositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes; – Auswerten mindestens eines Selektionspositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist; – Prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes; – Bestimmen eines Attribuierungsbereiches der ersten Computergrafik auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes; – Modifizieren der ersten Computergrafik mindestens im Attribuierungsbereich.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Selektionspositionswert während einer ersten Benutzersitzung auf Basis einer Benutzerinteraktion bestimmt wird und in einem Speicher abgelegt wird.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass der Selektionspositionswert während einer zweiten Benutzersitzung aus dem Speicher abgerufen wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass ein Attribuierungstyp bestimmt wird, der das zuzuordnende Textattribut identifiziert.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass eine zweite Computergrafik ausgewählt wird und die erste Computergrafik mit der zweiten Computergrafik überlagert wird.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die erste Computergrafik mit der zweiten Computergrafik opak überlagert wird.
  7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass der Attribuierungsbereich bestimmt wird unter Ermittlung des durch die grafische Wortdarstellung beanspruchten Bereiches der ersten Computergrafik.
  8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass der Selektionspositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Selektionsbereiches bilden.
  10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass der Wortpositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
  11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Wortbereiches bilden.
  12. Verfahren nach den Ansprüchen 9 und 11, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise im Selektionsbereich liegt.
  13. Verfahren nach den Ansprüchen 9 und 11 oder nach Anspruch 12, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise zwischen der vertikalen Koordinate des ersten Koordinatentupels des Selektionspositionswertes und der vertikalen Koordinate des zweiten Koordinatentupels des Selektionspositionswertes liegt.
  14. Vorrichtung zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text nach dem Verfahren nach einem der Ansprüche 1 bis 13, mit einer Verarbeitungseinheit und einem Speicher, dadurch gekennzeichnet, dass – der Speicher eine erste Computergrafik enthält, welche eine grafische Darstellung von Text aufweist; – die Verarbeitungseinheit ausgebildet ist, mindestens einen Wortpositionswert zu bestimmen, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes; – die Verarbeitungseinheit ausgebildet ist, mindestens einen Selektionspositionswert auszuwerten, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist; – die Verarbeitungseinheit ausgebildet ist, zu prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes; – die Verarbeitungseinheit ausgebildet ist, einen Attribuierungsbereich der ersten Computergrafik zu bestimmen auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes; – die Verarbeitungseinheit ausgebildet ist, die erste Computergrafik mindestens im Attribuierungsbereich zu modifizieren.
  15. Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, dass ferner eine Kommunikationsschnittstelle enthalten ist, welche ausgebildet ist, einen aus einer Benutzerinteraktion resultierenden Wert zu empfangen, und die Verarbeitungseinheit ausgebildet ist, den Selektionspositionswert während einer ersten Benutzersitzung auf Basis des Wertes zu bestimmen und in dem Speicher abzulegen.
  16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, den Selektionspositionswert während einer zweiten Benutzersitzung aus dem Speicher abzurufen.
  17. Vorrichtung nach einem der Ansprüche 14 bis 16, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, einen Attribuierungstyp zu bestimmen, der das zuzuordnende Textattribut identifiziert.
  18. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, eine zweite Computergrafik auszuwählen.
  19. Vorrichtung nach Anspruch 18, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, die erste Computergrafik mit der zweiten Computergrafik opak zu überlagern.
  20. Vorrichtung nach einem der Ansprüche 14 bis 19, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, den Attribuierungsbereich unter Ermittlung des durch die grafische Wortdarstellung beanspruchten Bereiches der ersten Computergrafik zu bestimmen.
  21. Vorrichtung nach einem der Ansprüche 14 bis 20, dadurch gekennzeichnet, dass der Selektionspositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
  22. Vorrichtung nach Anspruch 21, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Selektionsbereiches bilden.
  23. Vorrichtung nach einem der Ansprüche 14 bis 22, dadurch gekennzeichnet, dass der Wortpositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
  24. Vorrichtung nach Anspruch 23, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Wortbereiches bilden.
  25. Vorrichtung nach den Ansprüchen 22 und 24, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise im Selektionsbereich liegt.
  26. Vorrichtung nach den Ansprüchen 22 und 24 oder nach Anspruch 25, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich zwischen der vertikalen Koordinate des ersten Koordinatentupels des Selektionspositionswertes und der vertikalen Koordinate des zweiten Koordinatentupels des Selektionspositionswertes liegt.
  27. Anordnung zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit einer als Server ausgebildeten Vorrichtung nach einem der Ansprüche 14 bis 26 und einem mit dem Server über ein Netzwerk verbindbaren Client, wobei: – die Verarbeitungseinheit des Servers ausgebildet ist, eine erste Computergrafik, welche eine grafische Darstellung von Text aufweist, über eine im Server enthaltene Kommunikationsschnittstelle über das Netzwerk an den Client zu übermitteln; – der Client ausgebildet ist, die erste Computergrafik über eine im Client enthaltene Benutzerschnittstelle darzustellen, eine Benutzerinteraktion entgegenzunehmen, und den daraus resultierenden Wert über eine im Client enthaltene Kommunikationsschnittstelle über das Netzwerk an den Server zu übermitteln, – und die Verarbeitungseinheit des Servers ausgebildet ist, den Selektionspositionswert auf Basis des übermittelten Wertes auszuwerten, und die aus der Modifizierung entstandene Computergrafik an den Client zu übermitteln.
  28. Auf einem computerlesbaren Speichermedium gespeichertes Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 13 durch einen Computer.
  29. In einer digitalen Trägerwelle verkörpertes Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 13 durch einen Computer.
DE102008009442A 2008-02-13 2008-02-13 Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken Ceased DE102008009442A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102008009442A DE102008009442A1 (de) 2008-02-13 2008-02-13 Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken
PCT/EP2009/001001 WO2009100913A1 (de) 2008-02-13 2009-02-09 Verfahren und vorrichtung zur textattribuierung in textgrafiken
US12/867,696 US20100318900A1 (en) 2008-02-13 2009-02-09 Method and device for attributing text in text graphics
EP09711265A EP2252942A1 (de) 2008-02-13 2009-02-09 Verfahren und vorrichtung zur textattribuierung in textgrafiken

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102008009442A DE102008009442A1 (de) 2008-02-13 2008-02-13 Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken

Publications (1)

Publication Number Publication Date
DE102008009442A1 true DE102008009442A1 (de) 2009-08-27

Family

ID=40651295

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008009442A Ceased DE102008009442A1 (de) 2008-02-13 2008-02-13 Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken

Country Status (4)

Country Link
US (1) US20100318900A1 (de)
EP (1) EP2252942A1 (de)
DE (1) DE102008009442A1 (de)
WO (1) WO2009100913A1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8786556B2 (en) 2009-03-12 2014-07-22 Nokia Corporation Method and apparatus for selecting text information
US20130031460A1 (en) * 2011-07-29 2013-01-31 Konica Minolta Laboratory U.S.A., Inc. Using a common input/output format to generate a page of an electronic document
CN104281399B (zh) * 2013-07-12 2017-08-25 英业达科技有限公司 依据手势翻译对应目标文字的系统及其方法
US9898310B2 (en) * 2013-10-16 2018-02-20 International Business Machines Corporation Symmetrical dimensions in context-oriented programming to optimize software object execution

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0698845B1 (de) 1994-07-25 2001-01-17 International Business Machines Corporation Anordnung und Verfahren zum Markieren von Text auf einem Anzeigebildschirm in einem persönlichen Kommunikationsgerät
EP0731948B1 (de) 1993-11-19 2005-07-20 Micropatent Llc Verfahren und gerät um text- und bilddaten zu synchronisieren, anzeigen und manipulieren

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6551357B1 (en) 1999-02-12 2003-04-22 International Business Machines Corporation Method, system, and program for storing and retrieving markings for display to an electronic media file
WO2001090928A1 (en) 2000-05-24 2001-11-29 Goreader, Inc. Method, apparatus, and system for manipulation of electronic content
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US20040100498A1 (en) 2002-11-21 2004-05-27 International Business Machines Corporation Annotating received world wide web/internet document pages without changing the hypertext markup language content of the pages
US20060062453A1 (en) * 2004-09-23 2006-03-23 Sharp Laboratories Of America, Inc. Color highlighting document image processing
US7796837B2 (en) * 2005-09-22 2010-09-14 Google Inc. Processing an image map for display on computing device
US20100254606A1 (en) * 2005-12-08 2010-10-07 Abbyy Software Ltd Method of recognizing text information from a vector/raster image
DE102006059659B4 (de) * 2006-12-18 2009-12-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild
US8520983B2 (en) * 2009-10-07 2013-08-27 Google Inc. Gesture-based selective text recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0731948B1 (de) 1993-11-19 2005-07-20 Micropatent Llc Verfahren und gerät um text- und bilddaten zu synchronisieren, anzeigen und manipulieren
DE69434434T2 (de) 1993-11-19 2006-04-20 Rose Blush Software Llc, Los Altos Verfahren und gerät um text- und bilddaten zu synchronisieren, anzeigen und manipulieren
EP0698845B1 (de) 1994-07-25 2001-01-17 International Business Machines Corporation Anordnung und Verfahren zum Markieren von Text auf einem Anzeigebildschirm in einem persönlichen Kommunikationsgerät
DE69519905T2 (de) 1994-07-25 2001-06-21 Ibm Anordnung und Verfahren zum Markieren von Text auf einem Anzeigebildschirm in einem persönlichen Kommunikationsgerät

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Adobe Acrobat 8 Professional Executable. Released 2006, Adobe Systems Inc. <http://www.adobe.com/aboutadobe/pressroom/pressre eases/pdfs/200609/091806Acrobat.pdf> (recherchiert am 31.10.08) *
Adobe Acrobat 8 Professional Executable. Released 2006, Adobe Systems Inc. <http://www.adobe.com/aboutadobe/pressroom/pressreleases/pdfs/200609/091806Acrobat.pdf> (recherchiert am 31.10.08)
ISO 8859-1-

Also Published As

Publication number Publication date
EP2252942A1 (de) 2010-11-24
US20100318900A1 (en) 2010-12-16
WO2009100913A1 (de) 2009-08-20

Similar Documents

Publication Publication Date Title
DE69605255T2 (de) Vorrichtung und Verfahren für die Extraktion von Artikeln eines Dokuments
DE69610882T2 (de) Blockselektionsystem, bei dem überlappende Blöcke aufgespaltet werden
DE3729023C2 (de) Bildbearbeitungsgerät
DE69619606T2 (de) Merkmalermittlungsanlage
DE69418932T2 (de) Verfahren zur automatischen Bestimmung von Farbtrennflächen zur Korrektur von Fehlüberdeckungen beim Mehrplatten-Farbdruck
DE3586342T2 (de) Anlage fuer automatische auspassung und aufbereitung handgeschriebener textbilder.
DE69700276T2 (de) Benutzerkontrollierbare beständige Browseranzeigeseiten
DE602004005216T2 (de) Dokumentenscanner
DE3335162A1 (de) Vorrichtung und verfahren fuer graphische darstellungen mittels computern
EP2050023B1 (de) Verfahren zum analysieren und/oder testen zumindest einer benutzeroberfläche, datenverarbeitungseinrichtung und computerprogrammprodukt
DE10135445A1 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE602005002835T2 (de) Verfahren zur Identifizierung von redundantem Text in elektronischen Dokumenten
EP2289022B1 (de) Verfahren und vorrichtung zur automatischen ermittlung von steuerelementen in computeranwendungen
DE19507780A1 (de) Vorrichtung zur verteilten Bildverarbeitung
DE102017218120A1 (de) Verfahren zur Bereitstellung einer haptischen Rückmeldung an einen Bediener einer berührungssensitiven Anzeigeeinrichtung
DE102008009442A1 (de) Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken
DE3914905C2 (de)
DE10017551C2 (de) Verfahren zur zyklischen, interaktiven Bildanalyse sowie Computersystem und Computerprogramm zur Ausführung des Verfahrens
EP2250547A1 (de) Vorrichtung und verfahren zur animation eines grafischen digitalen dokumentes
EP2601594A1 (de) Verfahren und vorrichtung zur automatischen verarbeitung von daten in einem zellen-format
DE102008010264A1 (de) Verfahren und Vorrichtung zur seitenweisen Bereitstellung eines elektronischen Dokumentes als Computergrafik
DE60005400T2 (de) Computervorrichtung, verfahren und programmprodukt zum ausfüllen von drucksachen per computer
DE102018113615A1 (de) Verfahren zur Darstellung von Daten auf einem mobilen Endgerät
DE102010033873A1 (de) Selektorsystem für Textverarbeitungsstil mit Verwendung einer 2D-Matrix
DE102017219631A1 (de) CAD/CAM Analyse Werkzeug mit Rückverbindung zu CAD/CAM Daten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8172 Supplementary division/partition in:

Ref document number: 102008064668

Country of ref document: DE

Kind code of ref document: P

Q171 Divided out to:

Ref document number: 102008064668

Country of ref document: DE

Kind code of ref document: P

8131 Rejection