DE60217450T2 - Verfahren und Anordnung zur vorherigen Anmerkung von Dokumente und zur Erstellung einer Zusammenfassung anhand von Dokumentbilddaten - Google Patents

Verfahren und Anordnung zur vorherigen Anmerkung von Dokumente und zur Erstellung einer Zusammenfassung anhand von Dokumentbilddaten Download PDF

Info

Publication number
DE60217450T2
DE60217450T2 DE60217450T DE60217450T DE60217450T2 DE 60217450 T2 DE60217450 T2 DE 60217450T2 DE 60217450 T DE60217450 T DE 60217450T DE 60217450 T DE60217450 T DE 60217450T DE 60217450 T2 DE60217450 T2 DE 60217450T2
Authority
DE
Germany
Prior art keywords
document
annotations
words
image
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60217450T
Other languages
English (en)
Other versions
DE60217450D1 (de
Inventor
Ecran E. Kuruoglu
Alex S. Guilford Taylor
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/982,024 external-priority patent/US7712028B2/en
Priority claimed from US09/981,835 external-priority patent/US20040034832A1/en
Application filed by Xerox Corp filed Critical Xerox Corp
Application granted granted Critical
Publication of DE60217450D1 publication Critical patent/DE60217450D1/de
Publication of DE60217450T2 publication Critical patent/DE60217450T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

  • Diese Erfindung bezieht sich auf das Gebiet der Dokumentenverarbeitung. Die Erfindung ist für die Verarbeitung von erfassten Dokumenten-Images besonders geeignet, aber nicht darauf beschränkt. Die Erfindung bezieht sich auch auf die Verarbeitung eines eingescannten Dokumenten-Images zur Erzeugung einer Zusammenfassung des Dokuments aus dem eingescannten Image.
  • Es gibt viele Situationen, in denen eine Person mehrere Dokumente lesen muss und in jedem Dokument nach der gleichen Information sucht. Dies ist sehr zeitaufwändig, und es ist wahrscheinlich, dass der Benutzer in anderem Text vergrabene, wichtige Information verpassen oder übersehen könnte.
  • Es wäre wünschenswert, wenn ein zu lesendes Dokument automatisch irgendwie markiert werden könnte, um die Aufmerksamkeit eines Benutzers ohne Rücksicht auf den Typ oder das Format des Dokuments auf bestimmte Teile des Dokuments zu lenken, die signifikante Information enthalten können.
  • Es gibt auch viele Gelegenheiten, zu denen es wünschenswert wäre, automatisch eine Zusammenfassung eines Dokuments zu erstellen. Mehrere Möglichkeiten, sich einem solchen System zu nähern, sind im Stande der Technik vorgeschlagen worden.
  • Zum Beispiel wird in der europäischen Patentanmeldung EP 0 902 379 A2 ein Verfahren beschrieben, wo ein Benutzer bestimmte Wörter oder Sätze in einer elektronischen Version eines Dokuments (zum Beispiel einem ASCII-Text) markieren kann, die das System dann herauszieht, um eine Zusammenfassung des Dokuments zu erstellen. Ein solches System verlangt jedoch vom Benutzer, mit einer elektronischen Version des Dokuments zu arbeiten. Des Weiteren muss das Dokument bereits in elektronischer Gestalt existieren, ehe irgendwelche Wörter oder Sätze durch den Benutzer ausgewählt werden können.
  • Was die Zusammenfassung von Papierdokumenten (oder eingescannten Images von Papierdokumenten) betrifft, kann auf die folgenden Dokumente Bezug genommen werden:
    In den US-Patenten Nr. 5 638 543 und 5 689 716 werden Systeme beschrieben, in denen Images von Papierdokumenten eingescannt und die Images mit optischer Zeichenerkennung (OCR: optical character recognition) verarbeitet werden, um eine maschinen lesbare Version des Dokuments zu erzeugen. Eine Zusammenfassung wird erzeugt, indem in Abhängigkeit von kritischen oder thematischen Wörtern, die in einem Satz erkannt worden sind, Sätzen „Punktewertungen" zuerkannt werden. Die Zusammenfassung wird aus den Sätzen erzeugt, die die besten Punktewertungen haben.
  • Im US-Patent Nr. 5 848 191 wird ein System beschrieben, das dem des US-Patents Nr. 5 689 716 ähnlich ist und Punktewertungen verwendet, um Sätzen eine Rangordnung zu geben, wobei die Punktewertung von der Anzahl von thematischen Wörtern abhängt, die in einem Satz vorkommen. Im US-Patent Nr. 5 848 191 wird aber die Zusammenfassung direkt vom eingescannten Image erzeugt, ohne OCR durchzuführen.
  • Im US-Patent Nr. 5 491 760 wird ein System beschrieben, bei dem signifikante Wörter, Wendungen und Grafiken in einem Dokumenten-Image unter Verwendung automatischer oder interaktiver morphologischer Bilderkennungsverfahren erkannt werden. Eine Zusammenfassung des Dokuments oder ein Register können auf der Grundlage der identifizierten, signifikanten Teile des Dokumenten-Images erstellt werden.
  • Im Aufsatz „Summarization of imaged documents without OCR" [Zusammenfassung abgebildeter Dokumente ohne OCR] von Chen und Bloomberg auf Seiten 307 bis 320 in Computer Vision and Image Understanding, Band 70, Nr. 3, Juni 1998, wird ein detailliertes Verfahren beschrieben, das auf einem Herausziehen von Merkmalen und einer Punktewertung von Sätzen auf der Grundlage der Werte eines Satzes diskreter Merkmale beruht. Vorausinformation wird in Gestalt der Werte von Merkmalsvektoren verwendet, die aus Zusammenfassungen gewonnen werden, die durch professionelles Personal für die Erstellung von Zusammenfassungen erstellt worden sind. Die in die Zusammenfassung aufzunehmenden Sätze werden nach der Punktewertung des Satzes ausgewählt.
  • Alle oben aufgeführten, mit Papier arbeitenden Verfahren verwenden Varianten einer statistischen Bewertung, um (entweder auf der Grundlage eines OCR-Textes oder auf der Grundlage von Image-Maps) zu beurteilen, welche Merkmale oder Sätze zur Verwendung in der erstellten Zusammenfassung herausgezogen werden sollten.
  • Es kann auf XP000551171, Chen und Mitautoren, „Detection and location of multicharacter sequences in lines of imaged text" [Erkennung und Ortung von Mehrzeichenfolgen in Zeilen eines abgebildeten Textes], verwiesen werden, wo die Merkmale des Oberbegriffs eines Aspekts der Erfindung beschrieben werden. Es kann auch auf XP002324871, Nagao, „Automatic text summarization based on the global document anno tation" [Automatische Textzusammenfassung auf der Grundlage der globalen Dokumentenannotation], verwiesen werden, wo die Merkmale des Oberbegriffs eines zweiten Aspekts der Erfindung beschrieben werden. Es kann auch auf US-A-4 868 750, EP-A-0 902 380 und XP002324872, Stevens und Mitautoren, „Automatic processing of document annotations" [Automatische Verarbeitung von Dokumentenannotationen] verwiesen werden. Die vorliegende Erfindung wird in den Ansprüchen definiert.
  • Die vorliegende Erfindung kann ein Verfahren zur Verfügung stellen, bei dem ein Zieldokument auf der Grundlage eines oder mehrerer Schlüsselwörter annotiert wird, die im Voraus in das Verarbeitungssystem eingegeben worden sind.
  • Genauer wird das Zieldokument durchsucht, um das Auftreten des einen oder mehrerer Schlüsselwörter zu identifizieren, und jedes solche Auftreten wird (mit einer elektronisch erzeugten Annotation) annotiert, um den Benutzer zu einer solchen Textstelle zu leiten.
  • Ein Aspekt der vorliegenden Erfindung besteht darin, eine Zusammenfassung eines erfassten (z.B. eingescannten) Images eines Dokuments auf der Grundlage erkannter handschriftlicher oder elektronischer Annotationen zu erzeugen, die vor dem Einscannen an einem Dokument angebracht worden sind.
  • Genauer wird das erfasste Image darauf verarbeitet, Annotationen zu erkennen, die vor der Bilderfassung am Dokument angebracht worden sind. Die in einem ersten Dokument erkannten Annotationen können verwendet werden, um Merkmale oder Textstellen zu identifizieren, die verwendet werden sollen, um ein anderes Dokument zusammenzufassen.
  • Der Ausdruck „annotieren" soll hier breit interpretiert werden und kann eine jegliche geeignete Markierung (z.B. Hervorheben, Einringeln, Ausstreichen, Einklammern, Unterstreichen, fettes Drucken, kursives Drucken, farbiges Hinterlegen) oder andere Techniken zur visuellen Anzeige eines Abschnitts des Dokuments beinhalten.
  • Bevorzugt werden die Schlüsselwörter aus einem Quelldokument abgeleitet, das zuvor durch einen Benutzer annotiert worden ist. Das System kann somit als ein „Forward-Annotations"system für ein automatisches „Forwarding" [Weiterleiten] der an einem Quelldokument angebrachten Annotationen zu gleichwertigen Annotationen eines Zieldokuments bezeichnet werden.
  • Vorzugsweise kann das Quelldokument entweder ein Papier- (oder anderes physisches) Dokument oder ein elektronisches Dokument (z.B. eine Textdatei) sein.
  • Vorzugsweise kann das Zieldokument entweder ein Papier- (oder anderes physisches) Dokument oder ein elektronisches Dokument (z.B. eine Textdatei oder ein Image des Dokuments) sein.
  • Vorzugsweise umfasst das System eine Projektspeichervorrichtung für die Speicherung von Schlüsselwörtern aus einer Mehrzahl von Quelldokumenten.
  • Vorzugsweise speichert die Speichervorrichtung auch die vollständigen Quelldokumente (entweder in elektronischer Textform oder als ein eingescanntes Image).
  • Diese und weitere Aspekte der Erfindung werden aus der folgenden Beschreibung klar werden, wenn in Verbindung mit den beigefügten Zeichnungen gelesen, in denen die gleichen Bezugszahlen für gleiche Teile verwendet worden sind und in denen:
  • 1 ein Blockdiagramm ist, das ein Dokumentenverarbeitungssystem zeigt;
  • 2 ein schematisches Diagramm ist, das die Arbeitsprinzipien des Systems veranschaulicht;
  • 3 eine schematische Veranschaulichung eines Beispielprozesses ist;
  • 4 ein schematisches Ablaufdiagramm ist, das ein Eingabeverfahren veranschaulicht;
  • 5 ein schematisches Ablaufdiagramm ist, das ein Ausgabeverfahren veranschaulicht;
  • 6 ein schematisches Blockdiagramm einer ersten Ausführungsform für die Verarbeitung eines Papierdokuments zur Erzeugung einer Zusammenfassung des Dokuments ist;
  • 7 ein schematisches Ablaufdiagramm ist, das den Prozess für die Erzeugung der Zusammenfassung zeigt;
  • 8 eine schematische Ansicht einer annotierten Seite eines Dokuments ist;
  • 9 eine vergrösserte schematische Ansicht eines Ausschnitts von 8 ist, die das Herausziehen eines Satzes veranschaulicht; und
  • 10 ein schematisches Diagramm ist, das Optionen für die Anzeige der Zusammenfassung veranschaulicht.
  • Auf die Zeichnungen Bezug nehmend, umfasst ein Dokumentenverarbeitungssystem 10 eine Bilderfassungsvorrichtung 14 für die Erfassung eines digitalen Images eines Dokuments 12. Die Bilderfassungsvorrichtung kann zum Beispiel einen Flachbettscanner oder einen Desktopscanner mit Kamera umfassen.
  • Das System umfasst weiter einen Prozessor 16 zur Verarbeitung des Images, einen oder mehrere Benutzereingabevorrichtungen 18, zum Beispiel eine Tastatur und/oder eine Zeigevorrichtung, sowie einen oder mehrere Ausgabevorrichtungen 20, zum Beispiel eine Ausgabebildschirm und/oder einen Drucker.
  • Der Prozessor 16 umfasst eine Massenspeichervorrichtung 22, die zum Beispiel durch irgendwelche geeigneten Speichermedien wie magnetische Medien, optische Medien oder Halbleitermedien implementiert sein kann.
  • Auf 2 Bezug nehmend, besteht die Funktion dieser Ausführungsform darin, automatisch ein „Ziel"dokument 25 zu annotieren, das ein Benutzer vielleicht zu lesen wünscht, um auf der Grundlage von früher gespeicherten Annotationen aus anderen „Quell"dokumenten 26 interessante Bereiche anzuzeigen. Das System erzeugt ein annotiertes Zieldokument 27, das auf externen Annotationen beruht, die zuvor durch den gleichen Benutzer (oder durch andere Benutzer) an einem oder mehreren früheren Dokumenten 26 angebracht worden waren. Das System kann daher als ein „Forward-Annotations-" system [Vorwärts- oder Weiterleit-Annotationssystem] bezeichnet werden.
  • Ein Beispiel dafür wird in 3 veranschaulicht. 3(c) zeigt ein Quelldokument 30, das durch einen Benutzer auf Papier annotiert worden ist, um den nützlichen Text 32 darzustellen, den der Benutzer in künftigen Zieldokumenten zu identifizieren wünscht. Das Dokument 30 wird in das Verarbeitungssystem 10 eingescannt, das das eingescannte Image verarbeitet, um den annotierten Text zu identifizieren (genauer weiter unten beschrieben).
  • 3(a) veranschaulicht ein Papierzieldokument 34, das der Benutzer jetzt zu lesen wünscht. Bei dieser Etappe ist das Zieldokument rein (d.h. es enthält keine Annotationen, die den Benutzer zu signifikantem Text führen). Das Zieldokument 34 wird in das Verarbeitungssystem eingescannt, das dann das eingescannte Image verarbeitet, um zu identifizieren, ob irgendwelche der zuvor annotierten Wörter 32 im Zieldokument vorhanden sind. Wenn ja, dann werden die im Zieldokument 34 vorkommenden gleichen Wörter annotiert (im digitalen Image 35 des Zieldokuments 34), um die gleichen Annotationen 36 wie im Quelldokument 30 zu erhalten, wie in 3(b) veranschaulicht. Das annotierte Zieldokument kann dann angezeigt oder ausgedruckt werden, um durch den Benutzer gelesen zu werden.
  • Wieder auf 2 Bezug nehmend, unterhält der Prozessor 16 eine Bibliothek bzw. einen Sammelort für die Daten oder Images von jedem Quelldokument in Gestalt eines Projekts 38. Jedes Projekt 38 kann eine Mehrzahl von Dokumenten oder Annotationen von unterschiedlichen Dokumenten beinhalten. Das Projekt kann entweder Dokumenten-Images oder Daten enthalten, die die identifizierten Annotationen darstellen.
  • In dieser Ausführungsform sind die Quelldokumente nicht auf Papierdokumente beschränkt, sondern können elektronische Versionen eines Dokuments wie eine Textdatei oder eine Wortverarbeitungsdatei beinhalten. In diesem Falle können die Annotationen im elektronischen Quelldokument mit jeder geeigneten Technik wie zum Beispiel Unterstreichen, Hervorheben oder Einsetzen von Markern erfolgen. Ausserdem können die Annotationen im elektronischen Quelldokument eine Vielfalt von Datenformaten wie Bild, Video, Audio, Grafik und Text beinhalten.
  • 4 zeigt ein Verfahren für die Eingabe von Quelldokumenten in das Verarbeitungssystem 10. Im Schritt 40 wird ein Papierdokument (einschliesslich der Papierannotationen) mit der Erfassungsvorrichtung 14 eingescannt, um ein digitales Image des Dokuments zu erzeugen.
  • Im Schritt 42 werden die Papierannotationen im eingescannten Image identifiziert. Verfahren zur Identifikation von Annotationen sind dem Fachmann bekannt und brauchen deshalb hier nicht detailliert beschrieben zu werden. Als ein Beispiel jedoch wird im US-Patent Nr. 5 348 863 ein geeignetes System zur Unterscheidung handschriftlicher Annotationen von maschinengedrucktem Text beschrieben.
  • Im Schritt 44 wird der den annotierten Bereichen entsprechende Text durch einen optischen Zeichenerkennungs-(OCR-) Algorithmus verarbeitet, um diesen Bereich (Text) in elektronischen Text zu verwandeln. Dies erfolgt in der vorliegenden Ausführungsform als ein optimales Verfahren, um den gleichen Text in späteren Zieldokumenten (insbesondere elektronischen Zieldokumenten) zu identifizieren. Es wird aber verständlich sein, dass je nach Wunsch stattdessen eine Bitmap des annotierten Textes herausgezogen und die Annotation als Quelle in Bitmapform verwendet werden kann.
  • Im Schritt 46 wird der herausgezogene Text (OCR-Text oder Bitmap) zusammen mit Daten, die den Typ der Annotation (zum Beispiel unterstrichen oder hervorgehoben oder geringelt usw.) darstellen, im Projekt 38 gespeichert. Der Text wird somit als ein Schlüsselwort oder als eine Schlüsselwendung zur Verwendung beim Durchsuchen künftiger Zieldokumente behandelt.
  • Wie oben erwähnt, kann je nach Wunsch auch das ganze Dokument (und nicht nur die Schlüsselwörter oder Schlüsselwendungen) im Projekt 38 gespeichert werden. Jedoch werden die Schlüsselwörter oder Schlüsselwendungen als Text für künftige Suchvorgänge gespeichert.
  • Wenn das Quelldokument ein elektronisches Dokument ist, dann wird es stattdessen im Schritt 48 elektronisch eingegeben. Das elektronische Dokument wird im Schritt 50 verarbeitet, um annotierte Bereiche des Dokuments zu identifizieren und herauszuziehen, und solche Annotationen werden dann im Schritt 46 in der gleichen Weise wie oben beschrieben gespeichert.
  • Unter Verwendung dieses Verfahrens ist es möglich, ein Projekt 38 aufzubauen, das ein oder mehrere Dokumente enthält, die Annotationen enthalten, die auf Textstellen hinweisen, die für den Benutzer interessant sind.
  • 5 veranschaulicht ein Verfahren der Verarbeitung von Zieldokumenten, bei denen die gleichen Annotationen wie in den Quelldokumenten angebracht werden sollen. Wenn das Zieldokument ein Papierdokument ist, dann wird es im Schritt 52 unter Verwendung der Erfassungsvorrichtung 14 eingescannt, um ein digitales Image zu bilden.
  • Im Schritt 54 wird das digitale Image unter Verwendung eines OCR-Algorithmus verarbeitet, um das eingescannte Image in elektronischen Text zu verwandeln.
  • Im Schritt 56 wird der elektronische Text durchsucht, um zu identifizieren, ob irgendwelche der im Projekt 38 gespeicherten früheren Annotationen im Zieldokument vorhanden sind. Wenn ja, dann werden gleichwertige Annotationen (in elektronischer Form) am elektronischen Text angebracht.
  • Im Schritt 58 wird das annotierte Zieldokument zur Anzeige oder zum Druck ausgegeben.
  • Wenn das Zieldokument ein elektronisches Dokument ist, dann wird dieses stattdessen im Schritt 60 zur direkten Verarbeitung im Schritt 56 eingegeben.
  • Wenn gewünscht, kann der Benutzer die Option haben, sowohl an markierten (Quell-) Dokumenten als auch an nicht markierten (Ziel-) Dokumenten angebrachte Annotationen selektiv zu redigieren, zu manipulieren oder zu löschen.
  • Wenn gewünscht, kann das System aktiviert oder desaktiviert werden, um häufig verwendete Wörter (ohne Stop-Wörter) zu erkennen, das Dokument automatisch zu annotieren und die häufig verwendeten Wörter als Schlüsselwörter für das Projekt aufzuzeichnen.
  • Wenn gewünscht, kann das Dokument, nachdem es im Schritt 56 verarbeitet worden ist, als Teil des Projekts 38 gespeichert werden. In diesem Falle würde das Projekt eine vollständige Darstellung des Dokuments und nicht nur die herausgezogenen Annotationen (Schlüsselwörter oder Schlüsselwendungen) speichern. Das Dokument kann dann zur Anzeige aufgerufen werden, indem man einfach eine Annotation in einem anderen, im Projekt gespeicherten Dokument anklickt.
  • In dieser Ausführungsform kann die OCR-Verarbeitung eingescannter Images Annotationen aktivieren, die an Papierquelldokumenten angebracht worden waren, um sie für eine Annotation elektronischer Zieldokumente zu verwenden, oder Annotationen aktivieren, die an elektronischen Quelldokumenten angebracht worden waren, um sie für eine Annotation von Papierzieldokumenten zu verwenden. Ausserdem kann sie auch Unterschiede in den Zeichensätzen und Zeichengrössen in verschiedenen Papierdokumenten kompensieren. Wenn diese Vielseitigkeit aber in anderen Ausführungsformen nicht verlangt wird, dann können die Prinzipien der Erfindung ohne OCR verwendet werden, zum Beispiel in einem System, das nur elektronische (Quell- und Ziel-) Dokumente verarbeitet, oder einem System, das nur Papier- (Quell- und Ziel-) dokumente verarbeitet.
  • Auf 6 Bezug nehmend, wird ein System 110 zur Erzeugung einer Zusammenfassung aus einem Papierdokument 112 veranschaulicht. Das System umfasst eine optische Erfassungsvorrichtung 114 zur Erfassung eines digitalen Images (zum Beispiel eines Bitmap-Images) jeder Seite des Papierdokuments 112. Die Erfassungsvorrichtung 114 kann in Gestalt einer digitalen Kamera oder eines Dokumentenscanners vorliegen.
  • Das System 110 beinhaltet auch einen Prozessor 116 zur Verarbeitung des erfassten digitalen Images, um daraus eine Zusammenfassung zu erzeugen. Der Prozessor ist an eine oder mehrere Benutzereingabevorrichtungen 118 (zum Beispiel eine Tastatur oder eine Zeigevorrichtung) und auch an eine oder mehrere Ausgabevorrichtungen 120 für die Ausgabe der erzeugten Zusammenfassung angekoppelt. Die Ausgabevorrichtung 120 kann zum Beispiel eine Anzeigeeinheit und/oder einen Drucker beinhalten.
  • Im Gegensatz zum Stande der Technik besteht eines der Prinzipien dieser Ausführungsform darin, die Zusammenfassung auf der Grundlage von Annotationen zu erzeugen, die vor dem Einscannen (oder Erfassen) durch die optische Erfassungsvorrichtung 114 von Hand am Papierdokument angebracht worden waren. Der Prozessor 116 verarbeitet das digitale Bild, um handschriftliche Annotationen zu erkennen, die interessante Bereiche im Papierdokument anzeigen. Textstellen oder andere Merkmale, die durch die Annotationen angezeigt werden, werden herausgezogen und verwendet, um die Zusammenfassung zu erstellen. Die Zusammenfassung spiegelt daher die durch handschriftliche Annotationen im Papierdokument identifizierten, interessanten Bereiche wider.
  • Auf 7 Bezug nehmend, umfasst der Prozess für die Erzeugung der Zusammenfassung durch den Prozessor 116 einen ersten Schritt 130, in dem die durch den Benutzer angebrachten Annotationen im erfassten digitalen Image identifiziert werden. Geeignete Verfahren zur Identifikation von Annotationen werden zum Beispiel in den US-Patenten Nr. 5 570 435, 5 748 805 und 5 384 863 beschrieben. Diese Patente offenbaren Verfahren zur Unterscheidung regulären Maschinendrucks von handschriftlichen Markierungen und Annotationen.
  • 8 veranschaulicht die Art von handschriftlichen Annotationen, die typischerweise identifiziert werden können und u.a. Unterstreichen 132, Umringeln 134, Einklammern 136, Randklammern oder Randmarkierungen 138, Durchstreichen 140, Ortswechsel anzeigende verankerte Pfeile 142 und handgeschriebene Notizen oder Einschübe 144 beinhalten.
  • Im Schritt 146 (7) erfolgt die Interpretation der Annotationen. Das Niveau der Interpretation kann je nach der durch das System 110 erlaubten Komplexität der Annotation zwischen verschiedenen Ausführungsformen variieren. Zum Beispiel bedürfen das einfache Unterstreichen 132 oder Umringeln 134 eines Wortes keiner Interpretation, da die Wörter durch die Annotationen direkt identifiziert werden. Einklammern 136 und Randmarkierung 138 erfordern nur die einfache Interpretation, dass der ganze, durch die Klammern oder Markierungen umspannte Text identifiziert wird.
  • Durchgestrichene Annotationen 140 werden bevorzugt als eine negative Annotation interpretiert, um den durchgestrichenen Text von der Zusammenfassung auszuschliessen. In einer Beziehung kann dies als gleichwertig mit gar keiner Annotation (und daher als keine Aufmerksamkeit auf die Textstelle für einen Einbezug in die Zusammenfassung lenkend) betrachtet werden. Eine durchgestrichene Annotation 140 liefert aber auch eine Möglichkeit, ein oder mehrere Wörter, die sich in der Nähe eines hervorgehobenen Wortes befinden, davon auszuschliessen, als Teil eines Textzusammenhangs einbezogen zu werden (9).
  • Ortswechselpfeile 142 und handgeschriebene Notizen und Einfügungen 144 verlangen auch eine Interpretation, um die durch die Annotationen identifizierten Positionen zu identifizieren.
  • Im Schritt 148 (7) werden Bereiche des digitalen Images, die durch die interpretierten Annotationen identifiziert worden sind, zur Verwendung in der Zusammenfassung herausgezogen. Jeder Bereich wird hier als ein „Merkmal" bezeichnet und ist eine Image-Map des aus dem digitalen Image herausgezogenen Bereichs. Ausserdem wird jedes Merkmal mit einem Zeiger oder einer Adresse markiert, die die Stelle im ursprünglich eingescannten Image anzeigen, von der es herausgezogen (oder kopiert) worden ist.
  • Wenn eine Annotation nur ein einzelnes Wort oder eine kurze Wendung identifiziert, dann wird das herausgezogene Merkmal für diese Annotation vorzugsweise erweitert, um zusätzliche Informationen oder Textstellen aus dem Kontext für die Annotation einzubeziehen. Normalerweise wird das Merkmal erweitert, um den Satz 150 (9) einzubeziehen, der die Annotation umgibt. Daher identifiziert im Schritt 148 der Prozessor 116 den Ort von Punkten oder anderen maschinengedruckten Markierungen oder Begrenzungen, die den Anfang und das Ende eines Satzes anzeigen.
  • Obwohl 8 und 9 nur die Annotation von Textstellen in einem Dokument veranschaulichen, können auch ein oder mehrere Grafikteile des Dokuments annotiert werden, um in die Zusammenfassung einbezogen zu werden. In einem solchen Fall wird im Schritt 148 eine Image-Map herausgezogen, die dem annotierten graphischen „Merkmal" entspricht.
  • Im Schritt 152 wird die Zusammenfassung aus den herausgezogenen Merkmalen zusammengestellt. Die Zusammenfassung kann in Gestalt von Image-Maps der herausgezogenen Merkmale zusammengestellt werden, oder Textteile der Merkmale können mit OCR verarbeitet werden, um Zeichencodes für den Text zu erzeugen. In ähnlicher Weise können handschriftliche Notizen oder Einfügungen mit OCR verarbeitet werden, um Zeichencodes zu erzeugen, oder sie können als Image-Maps verwendet werden.
  • Während der Zusammenstellung kann eine weitere Interpretation der Annotationen, die erforderlich sein kann, erfolgen. Zum Beispiel kann durchgestrichener Text von der Zusammenfassung gelöscht (entfernt) werden (zum Beispiel der durchgestrichene Text 140 in 9).
  • Zusätzlich können während der Zusammenstellung identisch annotierte Merkmale zum Beispiel mit Aufzählungszeichen (Bullets) einzeln aufgeführt werden. Zum Beispiel können Sätze, die geringelte Wörter enthalten, als eine Liste mit Bullets organisiert werden. Eine solche Operation ist vorzugsweise eine durch den Benutzer gesteuerte Option, kann aber ein leistungsfähiges Vorgehen liefern, um es einem Benutzer zu ermöglichen, einzelne Informationen in der Zusammenfassung gruppenweise zusammenzufassen, indem einfach die gleiche Annotation wie im ursprünglichen Dokument verwendet wird, um die Information zu markieren.
  • Zusätzlich können während der Zusammenstellung auf der Grundlage der handschriftlichen Annotationen Teile der Zusammenfassung als wichtig hervorgehoben werden. Zum Beispiel können Annotationen wie ein Ausrufezeichen (154 in 8) oder eine doppelte Unterstreichung als Markierung für die Wichtigkeit in die Zusammenfassung einbezogen werden, indem der Text fett oder unterstrichen oder in einer anderen Farbe wiedergegeben wird.
  • Im Schritt 156 wird die zusammengestellte Zusammenfassung zum Beispiel auf dem Bildschirm oder dem Drucker des Benutzers ausgegeben.
  • In dieser Ausführungsform liefert das System 110 eine Mehrzahl von geschichteten Detailniveaus in einem Fenster 157 für die Zusammenfassung, wie in 10 angedeutet. Diese Schichten können entweder während der Zusammenstellung oder während der Ausgabe der zusammenfassenden Information angewendet werden.
  • Das unterste Detailniveau 158 enthält lediglich aus dem Dokument herausgezogene Sachüberschriften.
  • Durch Anklicken einer Sachüberschrift wird die Sachüberschrift zu ihrem zweiten Detailniveau 160 ausgeweitet, um die Textzusammenfassung dieses zutreffenden Abschnitts des Dokuments zu erzeugen. Das zweite Detailniveau 160 enthält nur Textmerkmale. Durch erneutes Anklicken wird aber die Zusammenfassung erweitert (drittes Detailniveau 162), um nicht textliche Merkmale als einen Teil der Zusammenfassung einzubeziehen, zum Beispiel annotierte Figuren aus dem betreffenden Abschnitt des Dokuments.
  • Durch Anklicken irgendeines Satzes wird die Zusammenfassung erweitert (viertes Detailniveau 164), um weiteren Kontext des Satzes anzuzeigen, zum Beispiel den Absatz, der den Satz enthält.
  • In einer letzten Schicht (fünftes Detailniveau 166) kann die mit einem beliebigen Satz im Dokument zusammenhängende Annotation „aufgerufen" werden, indem der Satz angeklickt wird.
  • In einer alternativen Ausführungsform kann auf die Mehrzahl von geschichteten Detailniveaus für die Zusammenfassung einfach dadurch zugegriffen werden, dass jedes Detailniveau, das in dem in 10 gezeigten Fenster 157 vorgegeben ist, angeklickt wird. Das bedeutet, dass das Fenster 157 sowohl dafür verwendet werden kann, um ein Detailniveau anzuzeigen, das derzeit verwendet wird, um ein Dokument zusammenzufassen, als auch dafür, auf ein spezielles Detailniveau zuzugreifen.
  • In der vorliegenden Ausführungsform, die keinen Teil der Erfindung darstellt, beruht die Zusammenfassung auf Annotationen, die an dem zusammenzufassenden Dokument angebracht worden sind. In anderen Ausführungsformen, die einen Teil der Erfindung bilden, kann aber die Zusammenfassung auf der Grundlage von Annotationen erstellt werden, die an einem anderen Dokument angebracht worden sind, zum Beispiel einem früher annotierten Dokument oder einem Masterdokument. In einer solchen Ausführungsform wird ein erstes Dokument handschriftlich annotiert, und die Annotationen werden durch das System 110 erkannt und gespeichert. Ein zweites Dokument wird dann durch das System erfasst, und das zweite Dokument wird auf der Grundlage der erkannten Annotationen aus dem ersten Dokument verarbeitet. In anderen Worten werden die im ersten Dokument erkannten Annotationen als ein Führer verwendet, um die Zusammenfassung des zweiten Dokuments zu erzeugen (in der gleichen Weise, als ob die handschriftlichen Annotationen am zweiten Dokument angebracht worden wären).
  • Obwohl einige der oben umrissenen Ausführungsformen ein Zieldokument einfach auf der Grundlage einer oder mehrerer Quellannotationen annotieren, können in anderen der oben umrissenen Ausführungsformen zusätzlich die Annotationen in anderer Weise genutzt werden. Zum Beispiel können die verschiedenen, oben umrissenen beispielhaften Ausführungsformen kombiniert werden. In einem solchen kombinierten Verfahren könnte ein Zieldokument auf der Grundlage der zuvor an einem anderen Quelldokument angebrachten Annotationen automatisch zusammengefasst werden.
  • Die Erfindung ist unter Bezugnahme auf verschiedene beispielhafte Ausführungsformen beschrieben worden. Abwandlungen und Veränderungen werden Dritten einfallen, wenn sie diese Beschreibung zusammen mit den Zeichnungen lesen und verstehen. Die Ausführungsformen sind lediglich Beispiele, und verschiedene Alternativen, Abwandlungen, Variationen oder Verbesserungen können im Rahmen der in den folgenden Ansprüchen definierten Erfindung gemacht werden.

Claims (5)

  1. System für die Verarbeitung eines Quelldokuments (26; 30) und eines Zieldokuments (25; 34), wobei das System umfasst: eine Speichervorrichtung (22) zur Speicherung einer Mehrzahl von Wörtern; eine Eingabevorrichtung (14, 16) zur Eingabe von Wörtern in die Speichervorrichtung; eine Suchvorrichtung (16), um zu identifizieren, ob etwelche der Wörter, die in der Speichervorrichtung vorhanden sind, im Zieldokument vorhanden sind; und eine Annotationsvorrichtung (16), um die im Zieldokument aufgefundenen Wörter zu annotieren; dadurch gekennzeichnet, dass: die Eingabevorrichtung konfiguriert ist, um Wörter aus dem Quelldokument in die Speichervorrichtung einzugeben, wobei die Eingabevorrichtung umfasst: eine Erfassungsvorrichtung (14) zur Erfassung eines digitalen Images eines physischen Quelldokuments; einen Detektor (16) zur Erkennung eines oder mehrerer annotierter Bereiche im erfassten Image des Quelldokuments; und eine Vorrichtung (16) zur Eingabe eines oder mehrerer Wörter von einem erkannten annotierten Bereich des Quelldokuments in die Speichervorrichtung.
  2. System nach Anspruch 1, weiter eine Erfassungsvorrichtung (14) zur Erfassung eines digitalen Images eines zu annotierenden, physischen Zieldokuments umfassend.
  3. Verfahren zur Verarbeitung eines Quelldokuments (26) und eines Zieldokuments (25), umfassend: Eingabe und Speicherung (4046) einer Mehrzahl von interessanten Wörtern; Durchsuche (56) des Zieldokuments, um zu identifizieren, ob etwelche der interessanten Wörter im Zieldokument vorhanden sind; Annotieren (56) der im Zieldokument aufgefundenen Wörter; dadurch gekennzeichnet, dass der Eingabe- und Speicherschritt die Eingabe und Speicherung von Wörtern aus dem Quelldokument durch die Teilschritte umfasst: Erfassung (40) eines digitalen Images eines physischen Quelldokuments; Erkennung (42) eines oder mehrerer annotierter Bereiche im erfassten Image des Quelldokuments; und Speicherung (46) eines oder mehrerer Wörter von einem erkannten annotierten Bereich des Quelldokuments.
  4. Gerät zur Erzeugung einer Zusammenfassung eines Dokuments, umfassend: eine Bilderfassungsvorrichtung zur Erfassung des Images eines Dokuments; eine Verarbeitungsvorrichtung zur Erkennung von Annotationen, die vor der Bilderfassung am Dokument angebracht worden waren; und einen Zusammenfassungsgenerator zur Erzeugung einer Zusammenfassung eines Dokuments auf der Grundlage der erkannten Annotationen; dadurch gekennzeichnet, dass der Zusammenfassungsgenerator so arbeitet, dass er eine Zusammenfassung eines anderen Dokuments als dem, bei dem die Annotationen erkannt werden, erzeugt.
  5. Verfahren zur Erzeugung einer Zusammenfassung eines Dokuments, umfassend: a) Erfassung eines Images eines Dokuments; b) Erkennung von an dem Dokument vor der Bilderfassung angebrachten Annotationen; und c) Verwendung der erkannten Annotationen bei der Erzeugung einer Zusammenfassung eines Dokuments; dadurch gekennzeichnet, dass Schritte (a) und (b) an einem anderen Dokument ausgeführt werden als dem in Schritt (c) verwendeten Dokument.
DE60217450T 2001-10-19 2002-10-11 Verfahren und Anordnung zur vorherigen Anmerkung von Dokumente und zur Erstellung einer Zusammenfassung anhand von Dokumentbilddaten Expired - Lifetime DE60217450T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US981835 2001-10-19
US09/982,024 US7712028B2 (en) 2001-10-19 2001-10-19 Using annotations for summarizing a document image and itemizing the summary based on similar annotations
US09/981,835 US20040034832A1 (en) 2001-10-19 2001-10-19 Method and apparatus for foward annotating documents
US982024 2001-10-19

Publications (2)

Publication Number Publication Date
DE60217450D1 DE60217450D1 (de) 2007-02-22
DE60217450T2 true DE60217450T2 (de) 2007-10-11

Family

ID=27130616

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60217450T Expired - Lifetime DE60217450T2 (de) 2001-10-19 2002-10-11 Verfahren und Anordnung zur vorherigen Anmerkung von Dokumente und zur Erstellung einer Zusammenfassung anhand von Dokumentbilddaten

Country Status (3)

Country Link
EP (1) EP1304625B1 (de)
JP (1) JP2003186889A (de)
DE (1) DE60217450T2 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006065524A (ja) * 2004-08-26 2006-03-09 Hitachi Ltd 文書処理装置および方法
US8341112B2 (en) 2006-05-19 2012-12-25 Microsoft Corporation Annotation by search
US8065313B2 (en) * 2006-07-24 2011-11-22 Google Inc. Method and apparatus for automatically annotating images
US9703782B2 (en) 2010-05-28 2017-07-11 Microsoft Technology Licensing, Llc Associating media with metadata of near-duplicates
US8903798B2 (en) 2010-05-28 2014-12-02 Microsoft Corporation Real-time annotation and enrichment of captured video
US8559682B2 (en) 2010-11-09 2013-10-15 Microsoft Corporation Building a person profile database
US9678992B2 (en) 2011-05-18 2017-06-13 Microsoft Technology Licensing, Llc Text to image translation
US9239848B2 (en) 2012-02-06 2016-01-19 Microsoft Technology Licensing, Llc System and method for semantically annotating images
US9286280B2 (en) 2012-12-10 2016-03-15 International Business Machines Corporation Utilizing classification and text analytics for optimizing processes in documents
US10430506B2 (en) 2012-12-10 2019-10-01 International Business Machines Corporation Utilizing classification and text analytics for annotating documents to allow quick scanning
US9304618B2 (en) * 2014-02-28 2016-04-05 Ricoh Co., Ltd. Creating a summary of content and stroke association

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
US6658623B1 (en) * 1997-09-15 2003-12-02 Fuji Xerox Co., Ltd. Displaying in a first document a selectable link to a second document based on a passive query
US6279014B1 (en) * 1997-09-15 2001-08-21 Xerox Corporation Method and system for organizing documents based upon annotations in context

Also Published As

Publication number Publication date
DE60217450D1 (de) 2007-02-22
EP1304625B1 (de) 2007-01-10
EP1304625A3 (de) 2005-07-20
EP1304625A2 (de) 2003-04-23
JP2003186889A (ja) 2003-07-04

Similar Documents

Publication Publication Date Title
DE10162156B4 (de) Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Verfahren
DE60116442T2 (de) System zur Zuordnung von Schlüsselwörtern zu Dokumenten
CA2078423C (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
DE69434434T2 (de) Verfahren und gerät um text- und bilddaten zu synchronisieren, anzeigen und manipulieren
DE69833839T2 (de) Ein Verfahren und System um ähnliche Dokumente vorzuschlagen
DE69731418T2 (de) Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen
EP0544432B1 (de) Verfahren und Gerät zur Dokumentverarbeitung
DE69724557T2 (de) Dokumentenanalyse
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
DE102017008430A1 (de) Verfahren und Systeme zum Erzeugen von virtuelle Realität-Umgebungen aus elektronischen Dokumenten
US7712028B2 (en) Using annotations for summarizing a document image and itemizing the summary based on similar annotations
DE3714172C2 (de)
DE10308014A1 (de) System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt
DE69915566T2 (de) Zusammenstellung und Änderung von Fotocollagen durch Bilderkennung
EP0424803B1 (de) Verfahren zur mindestens teilweisen Umsetzung von Bilddaten in Text mit Vorbereitung für nachfolgende Speicherung oder Weiterverarbeitung
US8520224B2 (en) Method of scanning to a field that covers a delimited area of a document repeatedly
US20020010719A1 (en) Method and system for generating document summaries with location information
DE19859180A1 (de) Automatisches adaptives Dokumenten-Hilfesystem
DE602004005216T2 (de) Dokumentenscanner
DE10322725A1 (de) System und Verfahren zum Erzeugen von Bildkommentarinformationen
DE19751570A1 (de) Dokumentmanagementsystem, Verfahren zum Betreiben eines solchen Systems und Digitalkopierer
EP1671262B1 (de) Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten
DE10317234A1 (de) Systeme und Verfahren für eine verbesserte Genauigkeit von einem extrahierten digitalen Inhalt
DE10105941A1 (de) System und Verfahren zum automatischen Zuweisen eines Dateinamens zu einem gescannten Dokument
DE60217450T2 (de) Verfahren und Anordnung zur vorherigen Anmerkung von Dokumente und zur Erstellung einer Zusammenfassung anhand von Dokumentbilddaten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition