DE3787865T2 - Verfahren zur Faksimile-Übertragung und -Kompression. - Google Patents

Verfahren zur Faksimile-Übertragung und -Kompression.

Info

Publication number
DE3787865T2
DE3787865T2 DE87112542T DE3787865T DE3787865T2 DE 3787865 T2 DE3787865 T2 DE 3787865T2 DE 87112542 T DE87112542 T DE 87112542T DE 3787865 T DE3787865 T DE 3787865T DE 3787865 T2 DE3787865 T2 DE 3787865T2
Authority
DE
Germany
Prior art keywords
symbol
document
symbols
prototype
average
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE87112542T
Other languages
English (en)
Other versions
DE3787865D1 (de
Inventor
Richard George Casey
James Cornelius King
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE3787865D1 publication Critical patent/DE3787865D1/de
Application granted granted Critical
Publication of DE3787865T2 publication Critical patent/DE3787865T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Transmission Control (AREA)
  • Character Discrimination (AREA)

Description

  • Die Erfindung bezieht sich auf ein Verfahren zur Faksimile-Übertragung und -Kompression. Die Erfindung beschreibt insbesondere ein Verfahren zur Verbesserung der Erscheinung eines übertragenen Faksimiles und zur Reduzierung der übertragenen Datenmenge, aus der sich das Faksimile zusammensetzt.
  • Brickman und andere beschreiben in der US-Patentschrift US-A- 4,499,499 ein Musterübereinstimmungssystem, bei dem Dokumente als OCR-abgetastete Symbole übertragen werden (OCR = Optische Zeichenerkennung). Sowohl das Sendesystem als auch das Empfangssystem verwalten identische Bibliotheken mit Prototypen. Jeder Prototyp erhält einen Identifizierungscode und wird nur einmal übermittelt, und zwar bei seiner ersten Erkennung. Eine Reduzierung des Übermittlungsvolumens wird dadurch erreicht, daß bei nachfolgenden sich wiederholenden Symbolen nur die Identifizierungscodes übertragen werden.
  • Pratt und andere erwähnen in dem Artikel "Combined System Matching Facsimile Data Compression System", Berichte der IEEE, Band 68, Nr. 7, Juli 1980 die Symbolwiederholungen in einem Dokument, mit deren Hilfe eine Faksimilie-Kompression und ein Verringern des Übertragungsvolumens erreicht werden kann. Das System vergleicht jedes Eingangssymbol mit Einträgen in einer Prototypbibliothek. Wenn eine Übereinstimmung angezeigt wird, wird das entsprechende Bibliotheks-ID und die horizontale Stelle in bezug auf das vorhergehende Symbol codiert. Andernfalls wird das Binärmuster des Symbols übertragen und in die Bibliothek als neues Prototypelement gesetzt.
  • Casey und andere vergleichen in der US-Patentschrift US-A- 4,499,596 Eingangs-PEL-Muster mit Prototypen in Bibliotheken. Bei Übereinstimmung wird eine Indexnummer erzeugt. Bei Nichtübereinstimmung wird das Muster als neuer Prototyp in die Bibliothek aufgenommen.
  • In diesen Faksimilie-Systemen mit Musterübereinstimmung auf dem Stand der Technik wird jeder Prototyp unmittelbar nach der ersten Erkennung gesendet. Geräusche, die aufgrund schlecht gedruckter Dokumente auftreten, können schlecht ausgewählten Prototypen zur Folge haben, und damit zu einer schlechten Bildqualität des empfangenen Dokuments führen. Da die Leerzeichen zwischen den Zeichen in diesen Systemen nicht festgelegt sind, muß jeder Identifizierungscode von einer Adresse begleitet sein, die die relative Position des Symbols im Dokument anzeigt. Wenn erreicht werden kann, daß diese Adresse nicht für jedes Symbol übertragen werden muß, hat dies eine Reduzierung des Übertragungsvolumens zur Folge.
  • Die vorliegende Erfindung bezieht sich auf ein Verfahren zur Erleichterung der Übertragung sowie zur Verbesserung des Erscheinungsbilds eines Faksimile.
  • Die Erfindung wird in den beigefügten Patentansprüchen beschrieben.
  • Eine Reduzierung des Übertragungsvolumens wird dadurch erreicht, daß der Umfang der weißen Fläche auf jeder Seite des Prototyps festgelegt wird. Der Umfang der weißen Fläche wird zusammen mit dem Prototyp als einer der Parameter zum Empfangssystem gesendet. Wenn sich wiederholende Symbole oder der Prototyp nachfolgend auftauchen, wird nur der Identifizierungscode übertragen. Der Prototyp wird als Pseudo-Schriftzeichen mit einer weißen Fläche aufgerufen. Da die Leerzeichen zwischen den Zeichen für die Pseudo-Schriftarten bereits festgelegt wurden, muß nur die Adresse eines ersten Symbols auf einer Seite des Dokuments gesendet werden. Nachfolgende Symbole können nebeneinander plaziert werden, ohne daß noch weitere Adressen benötigt werden.
  • Das Erscheinungsbild des übermittelten Faksimile wird verbessert, indem die Redundanz, die bei der Wiederholung von Symbolen im übermittelten Dokument auftritt, genutzt wird. Das Sendesystem nimmt den Durchschnitt aller Eingangssymbole, die das gleiche Muster haben, und überträgt den Durchschnitt als Prototyp für diese Symbole. Dadurch wird die Qualität eines übertragenen Faksimiles verbessert.
  • Nachfolgend wird die Erfindung theoretisch beschrieben, wobei ein bevorzugtes Ausführungsbeispiel mit Bezug auf Begleitzeichnungen vorgestellt wird.
  • Fig. 1 zeigt einen Teil einer Zeile eines zu übermittelnden Dokuments;
  • Fig. 2 zeigt ein logisches Blockdiagramm der Systemkonfiguration entsprechend der vorliegenden Erfindung;
  • Fig. 3a zeigt zehn Zeichen eines abgetasteten Dokuments, wobei die Zeichen zum gleichen Prototyp gehören;
  • Fig. 3b zeigt den Durchschnitt der zehn Zeichen von Fig. 3a;
  • Fig. 4 ist ein Teil des AP-Quellcodes zur Festlegung der mittleren Mitte-zu-Mitte-Entfernung zwischen Symbolen der Klasse i und Symbolen der Klasse j;
  • Fig. 5 ist ein Teil des APL-Quellcodes zur Festlegung der weißen Flächen bi und fi der Symbole von Klasse i;
  • Fig. 6 ist die APL-Routine, die vom Verfahren in Fig. 5 zum iterativen Festlegen von bi und fi aufgerufen wird; und
  • Fig. 7 ist eine Matrix von durchschnittlichen Rand-zu-Rand- Entfernungen zwischen verschiedenen Symbolklassen.
  • Fig. 1 zeigt die Textzeile eines Dokuments, das für eine digitale Faksimile-Übertragung optisch abgetastet wird. Die Matrixdarstellung der Zeile wird erzielt und die Stellen der einzelnen Zeichenmuster werden festgelegt. Symbol i (das Zeichen "v") folgt Symbol j (das Zeichen "a"), dem wiederum Symbol k (das Zeichen "r") folgt. Die Flächenparameter eines Symbols sind durch die Breite W, die vordere weiße Fläche f und hintere weiße Fläche b gekennzeichnet. Die Symbole i und j sind durch die weiße Fläche sij voneinander getrennt, die bi + fi Punktspalten entspricht. Die Symbole j und k sind durch sjk voneinander getrennt, das bj + fk Punktspalten hat.
  • Wj, sij und sjk des Symbols j können direkt auf dem digitalen Bild gemessen werden. Die vordere weiße Fläche fj und die hintere weiße Fläche bj des Symbols sind jedoch nicht direkt meßbar und können nur von sij und sjk abgeleitet werden.
  • In der Musterübereinstimmung wird "Klasse i" als Gesamtheit aller Symbolmuster definiert, die mit dem i-ten Prototyp übereinstimmen. Parameter Wi kann als mittlerer Wert der Breiten geschätzt werden, die für Mitglieder der Klasse i festgestellt wurden.
  • Um bi und fj festlegen zu können, werden die Flächen zwischen den Zeichen für das gesamte Dokument zuerst gemessen. sij ist die durchschnittliche weiße Fläche zwischen Mustern der Klasse i und Klasse j. Schätzungen von bi und fj können erhalten werden, indem die Quadratsumme der SD-Differenzen folgender Gleichung minimiert wird:
  • wobei
  • δij = {1, wenn die Klassensequenz (i,j) im Text erscheint, andernfalls 0
  • Die Minimierung wird durch Differenzierung von Gleichung (1) in bezug auf bi und fj und die Gleichstellung des Ergebnisses mit Null durchgeführt. Dies führt zu 2N-Gleichungen:
  • die Summe der geschätzten vorderen Flächen aller Prototypen ist, die unmittelbar i folgen.
  • die Summe der geschätzten hinteren Flächen aller Prototypen ist, die unmittelbar vor Prototyp j kommen.
  • die Anzahl der Prototypen ist, die Prototyp i unmittelbar folgen
  • die Anzahl der Prototypen ist, die unmittelbar vor Prototyp j kommen.
  • Wenn jedes Klassenpaar vorhanden ist, d. h. wenn z. B. δij = 1 für alle i,j ist, sehen die zu lösenden Gleichungen folgendermaßen aus:
  • mit den Lösungen
  • bi = Ri/N - σb (4)
  • fj = Cj/N - σj (5)
  • wobei σb und σf Zufallskonstanten sind, für die folgenden Gleichung gilt:
  • Die Konstanten sind so zu wählen, daß die Flächenparameter nicht negativ sind.
  • Wenn nicht alle Klassenpaare im Dokument auftreten, kann der allgemeine Fall dadurch gelöst werden, daß zuerst Schätzungen von bi und fi folgendermaßen gefunden werden:
  • Diese Werte werden dann verwendet, um den fehlenden Wert von zu ermitteln, z. B.:
  • andernfalls.
  • Dadurch wird ein kompletter Satz von sij erhalten. Die Gleichungen 4, 5 und 6 können verwendet werden, um neue Schätzung von bi und fi zu erhalten. Bei diesem Verfahren kann die Iteration bei der k-ten Schleife berechnet werden.
  • Das Verfahren wird bis zur Konvergenz wiederholt.
  • Veränderungen bei der Zeichenbreite wirken sich auf die beobachteten Werte von sij aus; ein schwach abgebildetes Zeichen führt beispielsweise zu zusätzlicher weißer Fläche. Eine genauere Schätzung kann dadurch erreicht werden, indem die durchschnittlichen Mitte-zu-Mitte-Entfernungen cij zwischen den Zeichen der Klasse i und j gemessen werden, anstatt die leere Fläche sij zu ermitteln. Das oben erwähnte Verfahren kann zur Minimierung der Gleichung verwendet werden:
  • Die Minimierung geschieht auf gleiche Art und Weise wie zuvor, mit der Ausnahme, daß
  • sij durch (cij-Wi + Wj/2) ersetzt wird.
  • Fig. 2 zeigt eine Konfiguration mit einem Sendesystem 1 und einem Empfangssystem 2. Das Sendesystem 1 besteht aus einem käuflichen Scanner 3, wie beispielsweise dem IBM-Modell 8815. Der Scanner 3 tastet das zu übermittelnde Dokument ab und erzeugt Datenausgänge, die in Puffer 4 gespeichert werden. Der Puffer 4, der in dieser Implementierung ein IBM PC ist, kann auch als Terminal für die Zentraleinheit (CPU) dienen. Die CPU 5 kann eine IBM System/370 CPU sein, die mit einem APL-Interpreter läuft, der vom APL Language Processor, Ausgabe Nr. 3, IBM Manual Nr. G6 26-3847, 5. Auflage, 1978, definiert wird. Die System/370-Architektur wird in Amdahl und anderen, in der US- Patentschrift Nr. 3,226,689 sowie in der Publikation "IBM System/370 Principles of Operation", Nr. A22-7000-4 beschrieben. Obgleich der Einfachheit halber ein APL-Quellcode verwendet wurde, der auf einem IBM System/370-Computer läuft, können auch andere Programmiersprachen und Recheneinrichtungen implementiert werden, um vergleichbare Funktionen ohne größere Versuche durchführen zu können.
  • Das Empfangssystem 2 besteht aus einer Empfangs-CPU 6, die ebenfalls ein IBM System/370-Computer sein kann. Die Empfangs-CPU 6 ist an einen flexiblen Seitendrucker 7 (häufig als Laserdrucker bezeichnet) angeschlossen, wie beispielsweise ein IBM-Seitendruckermodell 3812, bei dem Schriftarten vom Host-Computer heruntergeladen werden können.
  • Da Verfahren zur Identifizierung von Symbolen mittels optischer Zeichenerkennungseinrichtungen hinlänglich bekannt sind, wird bei dem Verfahren der vorliegenden Erfindung die Beschreibung an dem Punkt begonnen, wo die Symbole bereits abgetastet und identifiziert wurden.
  • (a) Geräuschreduzierung durch Durchschnittsbildung
  • Das übermittelte Dokument wird vom OCR-Scanner 3 abgetastet. Jedes abgetastete Symbol, das von der Sende-CPU 5 empfangen wird, wird als p·q-Bitfeld registriert, wobei eine "1" ein schwarzes PEL und eine "0" ein weißes PEL darstellt. Die Sende- CPU gleicht jedes Bitfeld einem Muster an und ordnet je nach Übereinstimmungsmuster einen Identifizierungscode (ID) zu. Das Bitfeld und der ID des Symbols werden im Speicher gespeichert.
  • Wenn das Ende des Dokuments erreicht ist, ruft die Sende-CPU die gespeicherten Bitfelder und die entsprechenden IDs auf. Bei den Bitfeldern werden dann auf ähnliche Art und Weise wie beim Pseudo-Code von Tabelle 1 die Durchschnittswerte ermittelt. Do for id = 1 to m M = Gesamtanzahl der Prototypen INitalize N to O Initialize array A(p,q) to O Do for K = 1 to Z Z = Gesamtanzahl der gespeicherten Felder Read array (k) If Id of array (k) = id Increment N Do for i = 1 to p, j = 1 to q Add bit(i,j) of array (k) to A(i,j) Enddo Endif Enddo Divide A(i,j) by N Do for i = 1 to p, and j = 1 to q If A(i,j) is greater than a threshold then A(i,j), else A(i,j) = 0 Endif Enddo
  • Tabelle 1
  • Fig. 3a zeigt zehn Symbole, die das gleiche Muster haben. Fig. 3b zeigt den Durchschnitt dieser zehn Symbole. Der Durchschnitt von Fig. 3b wird abgeleitet, indem die zehn Felder zusammengefaßt und auf einem Schwellenwert = 5 festgelegt werden.
  • Das Ergebnis der Durchschnittsbildung, A(i,j), aller Bitfelder, die zu einem Muster gehören, wird daraufhin als Prototyp für dieses Muster verwendet. Es wird zum Empfangssystem gesendet, wo es zum Bilden einer Schriftart verwendet wird. Während der Wiederherstellung des Dokuments wird die Schriftart verwendet, wenn das entsprechende Symbol gedruckt werden soll.
  • (b) Das Festlegen von weißen Flächenparametern
  • Die Mitte-zu-Mitte-Entfernungen cij zwischen den Symbolen der Klasse i und j werden gemessen. Der Durchschnitt von cij wird auf ähnliche Art und Weise wie in Tabelle 1 aufgeführt berechnet. Die Breite wi des verbesserten Prototyps i und die Breite wj des verbesserten Prototyps j werden festgelegt, nachdem die Durchschnittsbildung des Abschnitts (a) durchgeführt wurde. Das Subtrahieren der Hälfte von wij und der Hälfte von wj vom Durchschnitt von cij ergibt den Durchschnitt der Rand-zu-Rand-Entfernung sij zwischen den Symbolen von Klasse i und j.
  • Fig. 4 zeigt eine Auflistung des APL-Quellcodes zum Festlegen der durchschnittlichen Rand-zu-Rand-Entfernungen sij zwischen Symbolen der Klassen i und j. Obgleich in dieser Implementierung Rand-zu-Rand-Entfernungen verwendet werden, kann das Verfahren der Erfindung zur Berechnung weißer Flächen auch ohne größere Versuche bei anderen Entfernungen zwischen festgelegten Symbolpunkten angewendet werden.
  • Nachdem alle Rand-zu-Rand-Entfernungen sij festgestellt wurden, werden sie in einer Matrix der in Fig. 7 gezeigten Form zusammengefaßt.
  • Jede Reihe x der Matrix in Fig. 4 enthält die Durchschnittsentfernungen sxk, 1≤k≤N, aller Klassensequenzen (x,k) mit Symbolen der Klasse x als unmittelbar vorangehende Symbole. Jede Reihe y der Matrix enthält die Durchschnittsentfernungen sky, 1≤k≤N, aller Klassensequenzen (k,y) mit Symbolen der Klasse y als unmittelbar nachfolgende Symbole.
  • Nicht jede Klassensequenz ist im Dokument vorhanden. Es gibt daher einige fehlende Einträge in der Matrix. Die Gleichungen (4) und (5) können jedoch nur verwendet werden, wenn alle Klassensequenzen vorhanden sind; daher müssen die fehlenden sij- Einträge festgestellt werden.
  • Fig. 5 zeigt eine Auflistung eines Segments des SPL-Quellcodes zum Ermitteln der Schätzungen des fehlenden sij-Werts. In Zeile 14 wird die Summe aller bestehenden Einträge jeder Reihe berechnet (als R im APL-Quellcode). Ri ist die durchschnittliche weiße Fläche zwischen zwei Symbolen mit Klasse i als nachfolgendem Symbol. Auf gleiche Art und Weise wird die Summe aller bestehenden Einträge jeder Spalte berechnet (als C im APL-Quellcode). Ci ist die durchschnittliche weiße Fläche zwischen zwei Symbolen mit Klasse i als vorhergehenden Symbolen. Die Konstante
  • wird in den Zeilen 19-21 berechnet (im Code als Q dargestellt).
  • In Zeile 23 wird die Reihenmatrix F berechnet. Jedes i-te Element von F ist der Durchschnittswert der Entfernungen ski, 1≤k≤N, der Sequenzen (k,i) mit den Symbolen der Klasse i als unmittelbar nachfolgende Symbole. MINF der Zeile 23 enthält das kleinste Element der Matrix F. FF ist eine Reihenmatrix, die durch das Subtrahieren jedes Elements von F durch MINF gebildet wird. Jedes i-te Element der Matrix FF ist ein geschätzter Wert eines entsprechenden bi.
  • In Zeile 25 wird die Spaltenmatrix B berechnet. Jedes i-te Element von B ist der Durchschnittswert der Entfernungen sik, 1≤k≤N, der Sequenz (i,k) mit den Symbolen von Klasse i als unmittelbar vorangehende Symbole. BB ist eine Spaltenmatrix, die durch Subtrahieren jedes Elements von B durch den Wert (Q-MINF) gebildet wird. Jedes i-te Element der Matrix BB ist ein geschätzter Wert eines entsprechenden bi.
  • In Zeile 27 wird eine N·N Matrix durch Verbinden von BB und FF gebildet, indem die äußere Produktfunktion von APL verwendet wird. Ein entsprechender Term in dieser neuen Matrix wird auf jeden fehlenden Eintrag in der ursprünglichen Matrix angewendet. Dadurch wird eine neue vollständige Matrix SS der Durchschnittsentfernung aller sij-Werte gebildet.
  • Fig. 6 zeigt eine Auflistung des APL-Quellcodes, der in Verbindung mit den Zeilen 32 bis 39 des APL-Codes in Tabelle 3 verwendet wird. Der Code in Tabelle 4 überprüft die Matrix SS, BB und FF iterativ und ermittelt dadurch bessere Werte für bi und fi.

Claims (5)

1. Ein Verfahren zur Faksimile-Übermittlung eines Dokuments von einem Sendeprozessor (5) zu einem Empfangsprozessor (6), wobei jeder Prozessor eine Bibliothek mit Symbolprototypen hat, die durch einen Identifizierungscode gekennzeichnet werden; das Verfahren umfaßt das Anlegen der Bibliothek mit den Symbolprototypen sowie das Abtasten des Dokuments und das Senden des entsprechenden Identifizierungscodes eines Prototyps, der mit dem abgetasteten Symbol übereinstimmt; das Verfahren ist folgendermaßen gekennzeichnet:
während die Bibliothek angelegt wird, wird auf der Grundlage der Daten (sij, Wj, cij), die von der Darstellung der abgetasteten Symbole kommen, der Umfang der weißen Fläche (bi, fi) auf den gegenüberliegenden Seiten des Symbolprototyps in Richtung der Abtastung festgelegt, und darüber hinaus wird jedem Prototyp ein Parameter mit dem entsprechenden Code zugeordnet, der den Umfang der festgelegten weißen Fläche (bi, fi) darstellt.
2. Ein Verfahren nach Anspruch 1, das weiterhin beinhaltet:
jedes Symbol wird im Dokument abgetastet, wobei das Symbol als p·q Feld dargestellt wird, in dem ein Binärzustand für ein schwarzes Pel und der entgegengesetzte Zustand für ein weißes Pel steht; das Feld stellt den Prototyp für dieses Symbol bereit;
die Anpassung jedes nachfolgenden Bitfeldes, das einem bestimmten, zuvor abgetasteten Symbol entspricht, mit dem Prototyp, der das entsprechende Symbol darstellt;
die Ermittlung des Durchschnittswerts des Bitfeldes, das jedem bestimmten abgetasteten Symbol entspricht, um einen verbesserten Prototyp für dieses Symbol zu erzeugen; und
das Anlegen einer Bibliothek mit verbesserten Prototypen als Schriftart, die sich aus den Symbolen zusammensetzt.
3. Ein Verfahren nach Anspruch 2, bei dem nach Beendigung der Dokumentabtastung die verbesserten Prototypen jedes abgetasten Symbols zum Empfangsprozessor gesendet werden, um das Dokument wiederherzustellen.
4. Ein Verfahren nach einem der oben genannten Ansprüche, zu dem folgende Schritte gehören:
das Messen der Mitte-zu-Mitte-Entfernungen (cij) zwischen benachbarten Symbolpaaren, die im Dokument abgetastet werden;
das Berechnen des Durchschnitts der gemessenen Entfernungen für jede Kombination von benachbarten, abgetasteten Symbolpaaren;
das Messen der Breite (wi, wj) jedes Symbols eines solchen Nachbarpaares; und
das Ableiten der durchschnittlichen Rand-zu-Rand-Entfernung zwischen dem Symbolen jedes Nachbarpaares, indem die Hälfte der Breite jedes Symbols eines Nachbarpaares vom Durchschnitt der gemessenen Entfernungen abgezogen wird, wobei der Umfang der weißen Fläche auf der Grundlage der durchschnittlichen Rand-zu-Rand-Entfernungen ermittelt wird.
5. Ein Verfahren nach Anspruch 4, zu dem folgender Schritt gehört:
das Ableiten der Rand-zu-Rand-Entfernungen für alle Kombinationen von benachbarten Symbolpaaren, die nicht im abgetasteten Dokument vorhanden sind, wobei die Ableitung von den gemessenen Mitte-zu-Mitte-Entfernungen und Breiten der Symbole von benachbarten Symbolpaaren erfolgt, die im abgetasteten Dokument vorhanden sind.
DE87112542T 1986-10-17 1987-08-28 Verfahren zur Faksimile-Übertragung und -Kompression. Expired - Fee Related DE3787865T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/920,489 US4769716A (en) 1986-10-17 1986-10-17 Facsimile transmission using enhanced symbol prototypes with precalculated front and back white spaces

Publications (2)

Publication Number Publication Date
DE3787865D1 DE3787865D1 (de) 1993-11-25
DE3787865T2 true DE3787865T2 (de) 1994-05-05

Family

ID=25443835

Family Applications (1)

Application Number Title Priority Date Filing Date
DE87112542T Expired - Fee Related DE3787865T2 (de) 1986-10-17 1987-08-28 Verfahren zur Faksimile-Übertragung und -Kompression.

Country Status (4)

Country Link
US (1) US4769716A (de)
EP (1) EP0263950B1 (de)
JP (1) JPS63108869A (de)
DE (1) DE3787865T2 (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640607A (en) * 1992-04-21 1997-06-17 Microsoft Corporation Method for sending bit mapped image by appending special code to text string and transmitting the text string separately from compressed residual image
US5956419A (en) * 1995-04-28 1999-09-21 Xerox Corporation Unsupervised training of character templates using unsegmented samples
US5689620A (en) * 1995-04-28 1997-11-18 Xerox Corporation Automatic training of character templates using a transcription and a two-dimensional image source model
US5706364A (en) * 1995-04-28 1998-01-06 Xerox Corporation Method of producing character templates using unsegmented samples
US5883986A (en) * 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
US5884014A (en) * 1996-05-23 1999-03-16 Xerox Corporation Fontless structured document image representations for efficient rendering
JP3061765B2 (ja) 1996-05-23 2000-07-10 ゼロックス コーポレイション コンピュータベースの文書処理方法
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US7519221B1 (en) 2005-02-28 2009-04-14 Adobe Systems Incorporated Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts
US7702182B2 (en) * 2006-02-16 2010-04-20 Adobe Systems, Incorporated Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images
US7646921B2 (en) * 2006-09-11 2010-01-12 Google Inc. High resolution replication of document based on shape clustering
US7697758B2 (en) * 2006-09-11 2010-04-13 Google Inc. Shape clustering and cluster-level manual identification in post optical character recognition processing
US8175394B2 (en) * 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54116121A (en) * 1978-03-01 1979-09-10 Fujitsu Ltd Production system of character train
JPS56100565A (en) * 1980-01-16 1981-08-12 Toshiba Corp Facsimile device
US4463386A (en) * 1982-05-03 1984-07-31 International Business Machines Corporation Facsimile data reduction
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4494150A (en) * 1982-07-13 1985-01-15 International Business Machines Corporation Word autocorrelation redundancy match facsimile compression for text processing systems
US4499499A (en) * 1982-12-29 1985-02-12 International Business Machines Corporation Method for identification and compression of facsimile symbols in text processing systems
JPS60254871A (ja) * 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法

Also Published As

Publication number Publication date
EP0263950B1 (de) 1993-10-20
JPH0453476B2 (de) 1992-08-26
JPS63108869A (ja) 1988-05-13
EP0263950A2 (de) 1988-04-20
EP0263950A3 (de) 1991-03-20
US4769716A (en) 1988-09-06
DE3787865D1 (de) 1993-11-25

Similar Documents

Publication Publication Date Title
DE3716787C2 (de)
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE3787865T2 (de) Verfahren zur Faksimile-Übertragung und -Kompression.
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE69230282T2 (de) Bildverarbeitungsverfahren und -vorrichtung
DE69421255T2 (de) Dokumentkopierabwehrverfahren
DE69610243T2 (de) Verfahren zum Trainieren einer Erkennungsanlage mit Zeichenmustern
DE69230629T2 (de) Verfahren und Vorrichtung zur Bildverbesserung
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE69428082T2 (de) Verfahren zur Detektion finanzieller Beträge in binären Bildern
DE69331456T2 (de) Überprüfbare optische Zeichenerkennung
DE69129136T2 (de) Binärbildverarbeitung zur Dekodierung selbstaktierender Kodierungen in Markengestalt
DE69529210T2 (de) Verfahren zum paaren von fingerabdrückminutiae mittels attribut-verhältnissgraphen
DE3689416T2 (de) Mustermerkmalextraktion.
DE69724557T2 (de) Dokumentenanalyse
DE69604481T2 (de) Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
DE3851867T2 (de) Zeichenerkennungsgerät.
DE69032344T2 (de) Verfahren zum Messen von Neigungswinkeln
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE69721941T2 (de) Gerät und Verfahren zum Extrahieren von Mustern
DE69308905T2 (de) Verarbeiten von mit Punktmatrix- oder Tintenstrahlkopf gedrucktem Text für optische Zeichenerkennung
DE69423254T2 (de) Verfahren und Gerät zur automatischen Spracherkennung von Dokumenten
DE69603547T2 (de) Codierungsverfahren und Decodierungsschaltung für die Komprimierung von chinesischen Textzeichendaten
DE69230633T2 (de) Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich
DE4005492C2 (de) Bildcodierverfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee