DE3787865T2 - Verfahren zur Faksimile-Übertragung und -Kompression. - Google Patents
Verfahren zur Faksimile-Übertragung und -Kompression.Info
- Publication number
- DE3787865T2 DE3787865T2 DE87112542T DE3787865T DE3787865T2 DE 3787865 T2 DE3787865 T2 DE 3787865T2 DE 87112542 T DE87112542 T DE 87112542T DE 3787865 T DE3787865 T DE 3787865T DE 3787865 T2 DE3787865 T2 DE 3787865T2
- Authority
- DE
- Germany
- Prior art keywords
- symbol
- document
- symbols
- prototype
- average
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000005540 biological transmission Effects 0.000 title claims description 9
- 238000007906 compression Methods 0.000 title description 3
- 230000006835 compression Effects 0.000 title description 3
- 238000009795 derivation Methods 0.000 claims 1
- 239000011159 matrix material Substances 0.000 description 18
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
- H04N1/411—Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
- H04N1/4115—Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimiles In General (AREA)
- Facsimile Transmission Control (AREA)
- Character Discrimination (AREA)
Description
- Die Erfindung bezieht sich auf ein Verfahren zur Faksimile-Übertragung und -Kompression. Die Erfindung beschreibt insbesondere ein Verfahren zur Verbesserung der Erscheinung eines übertragenen Faksimiles und zur Reduzierung der übertragenen Datenmenge, aus der sich das Faksimile zusammensetzt.
- Brickman und andere beschreiben in der US-Patentschrift US-A- 4,499,499 ein Musterübereinstimmungssystem, bei dem Dokumente als OCR-abgetastete Symbole übertragen werden (OCR = Optische Zeichenerkennung). Sowohl das Sendesystem als auch das Empfangssystem verwalten identische Bibliotheken mit Prototypen. Jeder Prototyp erhält einen Identifizierungscode und wird nur einmal übermittelt, und zwar bei seiner ersten Erkennung. Eine Reduzierung des Übermittlungsvolumens wird dadurch erreicht, daß bei nachfolgenden sich wiederholenden Symbolen nur die Identifizierungscodes übertragen werden.
- Pratt und andere erwähnen in dem Artikel "Combined System Matching Facsimile Data Compression System", Berichte der IEEE, Band 68, Nr. 7, Juli 1980 die Symbolwiederholungen in einem Dokument, mit deren Hilfe eine Faksimilie-Kompression und ein Verringern des Übertragungsvolumens erreicht werden kann. Das System vergleicht jedes Eingangssymbol mit Einträgen in einer Prototypbibliothek. Wenn eine Übereinstimmung angezeigt wird, wird das entsprechende Bibliotheks-ID und die horizontale Stelle in bezug auf das vorhergehende Symbol codiert. Andernfalls wird das Binärmuster des Symbols übertragen und in die Bibliothek als neues Prototypelement gesetzt.
- Casey und andere vergleichen in der US-Patentschrift US-A- 4,499,596 Eingangs-PEL-Muster mit Prototypen in Bibliotheken. Bei Übereinstimmung wird eine Indexnummer erzeugt. Bei Nichtübereinstimmung wird das Muster als neuer Prototyp in die Bibliothek aufgenommen.
- In diesen Faksimilie-Systemen mit Musterübereinstimmung auf dem Stand der Technik wird jeder Prototyp unmittelbar nach der ersten Erkennung gesendet. Geräusche, die aufgrund schlecht gedruckter Dokumente auftreten, können schlecht ausgewählten Prototypen zur Folge haben, und damit zu einer schlechten Bildqualität des empfangenen Dokuments führen. Da die Leerzeichen zwischen den Zeichen in diesen Systemen nicht festgelegt sind, muß jeder Identifizierungscode von einer Adresse begleitet sein, die die relative Position des Symbols im Dokument anzeigt. Wenn erreicht werden kann, daß diese Adresse nicht für jedes Symbol übertragen werden muß, hat dies eine Reduzierung des Übertragungsvolumens zur Folge.
- Die vorliegende Erfindung bezieht sich auf ein Verfahren zur Erleichterung der Übertragung sowie zur Verbesserung des Erscheinungsbilds eines Faksimile.
- Die Erfindung wird in den beigefügten Patentansprüchen beschrieben.
- Eine Reduzierung des Übertragungsvolumens wird dadurch erreicht, daß der Umfang der weißen Fläche auf jeder Seite des Prototyps festgelegt wird. Der Umfang der weißen Fläche wird zusammen mit dem Prototyp als einer der Parameter zum Empfangssystem gesendet. Wenn sich wiederholende Symbole oder der Prototyp nachfolgend auftauchen, wird nur der Identifizierungscode übertragen. Der Prototyp wird als Pseudo-Schriftzeichen mit einer weißen Fläche aufgerufen. Da die Leerzeichen zwischen den Zeichen für die Pseudo-Schriftarten bereits festgelegt wurden, muß nur die Adresse eines ersten Symbols auf einer Seite des Dokuments gesendet werden. Nachfolgende Symbole können nebeneinander plaziert werden, ohne daß noch weitere Adressen benötigt werden.
- Das Erscheinungsbild des übermittelten Faksimile wird verbessert, indem die Redundanz, die bei der Wiederholung von Symbolen im übermittelten Dokument auftritt, genutzt wird. Das Sendesystem nimmt den Durchschnitt aller Eingangssymbole, die das gleiche Muster haben, und überträgt den Durchschnitt als Prototyp für diese Symbole. Dadurch wird die Qualität eines übertragenen Faksimiles verbessert.
- Nachfolgend wird die Erfindung theoretisch beschrieben, wobei ein bevorzugtes Ausführungsbeispiel mit Bezug auf Begleitzeichnungen vorgestellt wird.
- Fig. 1 zeigt einen Teil einer Zeile eines zu übermittelnden Dokuments;
- Fig. 2 zeigt ein logisches Blockdiagramm der Systemkonfiguration entsprechend der vorliegenden Erfindung;
- Fig. 3a zeigt zehn Zeichen eines abgetasteten Dokuments, wobei die Zeichen zum gleichen Prototyp gehören;
- Fig. 3b zeigt den Durchschnitt der zehn Zeichen von Fig. 3a;
- Fig. 4 ist ein Teil des AP-Quellcodes zur Festlegung der mittleren Mitte-zu-Mitte-Entfernung zwischen Symbolen der Klasse i und Symbolen der Klasse j;
- Fig. 5 ist ein Teil des APL-Quellcodes zur Festlegung der weißen Flächen bi und fi der Symbole von Klasse i;
- Fig. 6 ist die APL-Routine, die vom Verfahren in Fig. 5 zum iterativen Festlegen von bi und fi aufgerufen wird; und
- Fig. 7 ist eine Matrix von durchschnittlichen Rand-zu-Rand- Entfernungen zwischen verschiedenen Symbolklassen.
- Fig. 1 zeigt die Textzeile eines Dokuments, das für eine digitale Faksimile-Übertragung optisch abgetastet wird. Die Matrixdarstellung der Zeile wird erzielt und die Stellen der einzelnen Zeichenmuster werden festgelegt. Symbol i (das Zeichen "v") folgt Symbol j (das Zeichen "a"), dem wiederum Symbol k (das Zeichen "r") folgt. Die Flächenparameter eines Symbols sind durch die Breite W, die vordere weiße Fläche f und hintere weiße Fläche b gekennzeichnet. Die Symbole i und j sind durch die weiße Fläche sij voneinander getrennt, die bi + fi Punktspalten entspricht. Die Symbole j und k sind durch sjk voneinander getrennt, das bj + fk Punktspalten hat.
- Wj, sij und sjk des Symbols j können direkt auf dem digitalen Bild gemessen werden. Die vordere weiße Fläche fj und die hintere weiße Fläche bj des Symbols sind jedoch nicht direkt meßbar und können nur von sij und sjk abgeleitet werden.
- In der Musterübereinstimmung wird "Klasse i" als Gesamtheit aller Symbolmuster definiert, die mit dem i-ten Prototyp übereinstimmen. Parameter Wi kann als mittlerer Wert der Breiten geschätzt werden, die für Mitglieder der Klasse i festgestellt wurden.
- Um bi und fj festlegen zu können, werden die Flächen zwischen den Zeichen für das gesamte Dokument zuerst gemessen. sij ist die durchschnittliche weiße Fläche zwischen Mustern der Klasse i und Klasse j. Schätzungen von bi und fj können erhalten werden, indem die Quadratsumme der SD-Differenzen folgender Gleichung minimiert wird:
- wobei
- δij = {1, wenn die Klassensequenz (i,j) im Text erscheint, andernfalls 0
- Die Minimierung wird durch Differenzierung von Gleichung (1) in bezug auf bi und fj und die Gleichstellung des Ergebnisses mit Null durchgeführt. Dies führt zu 2N-Gleichungen:
- die Summe der geschätzten vorderen Flächen aller Prototypen ist, die unmittelbar i folgen.
- die Summe der geschätzten hinteren Flächen aller Prototypen ist, die unmittelbar vor Prototyp j kommen.
- die Anzahl der Prototypen ist, die Prototyp i unmittelbar folgen
- die Anzahl der Prototypen ist, die unmittelbar vor Prototyp j kommen.
- Wenn jedes Klassenpaar vorhanden ist, d. h. wenn z. B. δij = 1 für alle i,j ist, sehen die zu lösenden Gleichungen folgendermaßen aus:
- mit den Lösungen
- bi = Ri/N - σb (4)
- fj = Cj/N - σj (5)
- wobei σb und σf Zufallskonstanten sind, für die folgenden Gleichung gilt:
- Die Konstanten sind so zu wählen, daß die Flächenparameter nicht negativ sind.
- Wenn nicht alle Klassenpaare im Dokument auftreten, kann der allgemeine Fall dadurch gelöst werden, daß zuerst Schätzungen von bi und fi folgendermaßen gefunden werden:
- Diese Werte werden dann verwendet, um den fehlenden Wert von zu ermitteln, z. B.:
- andernfalls.
- Dadurch wird ein kompletter Satz von sij erhalten. Die Gleichungen 4, 5 und 6 können verwendet werden, um neue Schätzung von bi und fi zu erhalten. Bei diesem Verfahren kann die Iteration bei der k-ten Schleife berechnet werden.
- Das Verfahren wird bis zur Konvergenz wiederholt.
- Veränderungen bei der Zeichenbreite wirken sich auf die beobachteten Werte von sij aus; ein schwach abgebildetes Zeichen führt beispielsweise zu zusätzlicher weißer Fläche. Eine genauere Schätzung kann dadurch erreicht werden, indem die durchschnittlichen Mitte-zu-Mitte-Entfernungen cij zwischen den Zeichen der Klasse i und j gemessen werden, anstatt die leere Fläche sij zu ermitteln. Das oben erwähnte Verfahren kann zur Minimierung der Gleichung verwendet werden:
- Die Minimierung geschieht auf gleiche Art und Weise wie zuvor, mit der Ausnahme, daß
- sij durch (cij-Wi + Wj/2) ersetzt wird.
- Fig. 2 zeigt eine Konfiguration mit einem Sendesystem 1 und einem Empfangssystem 2. Das Sendesystem 1 besteht aus einem käuflichen Scanner 3, wie beispielsweise dem IBM-Modell 8815. Der Scanner 3 tastet das zu übermittelnde Dokument ab und erzeugt Datenausgänge, die in Puffer 4 gespeichert werden. Der Puffer 4, der in dieser Implementierung ein IBM PC ist, kann auch als Terminal für die Zentraleinheit (CPU) dienen. Die CPU 5 kann eine IBM System/370 CPU sein, die mit einem APL-Interpreter läuft, der vom APL Language Processor, Ausgabe Nr. 3, IBM Manual Nr. G6 26-3847, 5. Auflage, 1978, definiert wird. Die System/370-Architektur wird in Amdahl und anderen, in der US- Patentschrift Nr. 3,226,689 sowie in der Publikation "IBM System/370 Principles of Operation", Nr. A22-7000-4 beschrieben. Obgleich der Einfachheit halber ein APL-Quellcode verwendet wurde, der auf einem IBM System/370-Computer läuft, können auch andere Programmiersprachen und Recheneinrichtungen implementiert werden, um vergleichbare Funktionen ohne größere Versuche durchführen zu können.
- Das Empfangssystem 2 besteht aus einer Empfangs-CPU 6, die ebenfalls ein IBM System/370-Computer sein kann. Die Empfangs-CPU 6 ist an einen flexiblen Seitendrucker 7 (häufig als Laserdrucker bezeichnet) angeschlossen, wie beispielsweise ein IBM-Seitendruckermodell 3812, bei dem Schriftarten vom Host-Computer heruntergeladen werden können.
- Da Verfahren zur Identifizierung von Symbolen mittels optischer Zeichenerkennungseinrichtungen hinlänglich bekannt sind, wird bei dem Verfahren der vorliegenden Erfindung die Beschreibung an dem Punkt begonnen, wo die Symbole bereits abgetastet und identifiziert wurden.
- Das übermittelte Dokument wird vom OCR-Scanner 3 abgetastet. Jedes abgetastete Symbol, das von der Sende-CPU 5 empfangen wird, wird als p·q-Bitfeld registriert, wobei eine "1" ein schwarzes PEL und eine "0" ein weißes PEL darstellt. Die Sende- CPU gleicht jedes Bitfeld einem Muster an und ordnet je nach Übereinstimmungsmuster einen Identifizierungscode (ID) zu. Das Bitfeld und der ID des Symbols werden im Speicher gespeichert.
- Wenn das Ende des Dokuments erreicht ist, ruft die Sende-CPU die gespeicherten Bitfelder und die entsprechenden IDs auf. Bei den Bitfeldern werden dann auf ähnliche Art und Weise wie beim Pseudo-Code von Tabelle 1 die Durchschnittswerte ermittelt. Do for id = 1 to m M = Gesamtanzahl der Prototypen INitalize N to O Initialize array A(p,q) to O Do for K = 1 to Z Z = Gesamtanzahl der gespeicherten Felder Read array (k) If Id of array (k) = id Increment N Do for i = 1 to p, j = 1 to q Add bit(i,j) of array (k) to A(i,j) Enddo Endif Enddo Divide A(i,j) by N Do for i = 1 to p, and j = 1 to q If A(i,j) is greater than a threshold then A(i,j), else A(i,j) = 0 Endif Enddo
- Fig. 3a zeigt zehn Symbole, die das gleiche Muster haben. Fig. 3b zeigt den Durchschnitt dieser zehn Symbole. Der Durchschnitt von Fig. 3b wird abgeleitet, indem die zehn Felder zusammengefaßt und auf einem Schwellenwert = 5 festgelegt werden.
- Das Ergebnis der Durchschnittsbildung, A(i,j), aller Bitfelder, die zu einem Muster gehören, wird daraufhin als Prototyp für dieses Muster verwendet. Es wird zum Empfangssystem gesendet, wo es zum Bilden einer Schriftart verwendet wird. Während der Wiederherstellung des Dokuments wird die Schriftart verwendet, wenn das entsprechende Symbol gedruckt werden soll.
- Die Mitte-zu-Mitte-Entfernungen cij zwischen den Symbolen der Klasse i und j werden gemessen. Der Durchschnitt von cij wird auf ähnliche Art und Weise wie in Tabelle 1 aufgeführt berechnet. Die Breite wi des verbesserten Prototyps i und die Breite wj des verbesserten Prototyps j werden festgelegt, nachdem die Durchschnittsbildung des Abschnitts (a) durchgeführt wurde. Das Subtrahieren der Hälfte von wij und der Hälfte von wj vom Durchschnitt von cij ergibt den Durchschnitt der Rand-zu-Rand-Entfernung sij zwischen den Symbolen von Klasse i und j.
- Fig. 4 zeigt eine Auflistung des APL-Quellcodes zum Festlegen der durchschnittlichen Rand-zu-Rand-Entfernungen sij zwischen Symbolen der Klassen i und j. Obgleich in dieser Implementierung Rand-zu-Rand-Entfernungen verwendet werden, kann das Verfahren der Erfindung zur Berechnung weißer Flächen auch ohne größere Versuche bei anderen Entfernungen zwischen festgelegten Symbolpunkten angewendet werden.
- Nachdem alle Rand-zu-Rand-Entfernungen sij festgestellt wurden, werden sie in einer Matrix der in Fig. 7 gezeigten Form zusammengefaßt.
- Jede Reihe x der Matrix in Fig. 4 enthält die Durchschnittsentfernungen sxk, 1≤k≤N, aller Klassensequenzen (x,k) mit Symbolen der Klasse x als unmittelbar vorangehende Symbole. Jede Reihe y der Matrix enthält die Durchschnittsentfernungen sky, 1≤k≤N, aller Klassensequenzen (k,y) mit Symbolen der Klasse y als unmittelbar nachfolgende Symbole.
- Nicht jede Klassensequenz ist im Dokument vorhanden. Es gibt daher einige fehlende Einträge in der Matrix. Die Gleichungen (4) und (5) können jedoch nur verwendet werden, wenn alle Klassensequenzen vorhanden sind; daher müssen die fehlenden sij- Einträge festgestellt werden.
- Fig. 5 zeigt eine Auflistung eines Segments des SPL-Quellcodes zum Ermitteln der Schätzungen des fehlenden sij-Werts. In Zeile 14 wird die Summe aller bestehenden Einträge jeder Reihe berechnet (als R im APL-Quellcode). Ri ist die durchschnittliche weiße Fläche zwischen zwei Symbolen mit Klasse i als nachfolgendem Symbol. Auf gleiche Art und Weise wird die Summe aller bestehenden Einträge jeder Spalte berechnet (als C im APL-Quellcode). Ci ist die durchschnittliche weiße Fläche zwischen zwei Symbolen mit Klasse i als vorhergehenden Symbolen. Die Konstante
- wird in den Zeilen 19-21 berechnet (im Code als Q dargestellt).
- In Zeile 23 wird die Reihenmatrix F berechnet. Jedes i-te Element von F ist der Durchschnittswert der Entfernungen ski, 1≤k≤N, der Sequenzen (k,i) mit den Symbolen der Klasse i als unmittelbar nachfolgende Symbole. MINF der Zeile 23 enthält das kleinste Element der Matrix F. FF ist eine Reihenmatrix, die durch das Subtrahieren jedes Elements von F durch MINF gebildet wird. Jedes i-te Element der Matrix FF ist ein geschätzter Wert eines entsprechenden bi.
- In Zeile 25 wird die Spaltenmatrix B berechnet. Jedes i-te Element von B ist der Durchschnittswert der Entfernungen sik, 1≤k≤N, der Sequenz (i,k) mit den Symbolen von Klasse i als unmittelbar vorangehende Symbole. BB ist eine Spaltenmatrix, die durch Subtrahieren jedes Elements von B durch den Wert (Q-MINF) gebildet wird. Jedes i-te Element der Matrix BB ist ein geschätzter Wert eines entsprechenden bi.
- In Zeile 27 wird eine N·N Matrix durch Verbinden von BB und FF gebildet, indem die äußere Produktfunktion von APL verwendet wird. Ein entsprechender Term in dieser neuen Matrix wird auf jeden fehlenden Eintrag in der ursprünglichen Matrix angewendet. Dadurch wird eine neue vollständige Matrix SS der Durchschnittsentfernung aller sij-Werte gebildet.
- Fig. 6 zeigt eine Auflistung des APL-Quellcodes, der in Verbindung mit den Zeilen 32 bis 39 des APL-Codes in Tabelle 3 verwendet wird. Der Code in Tabelle 4 überprüft die Matrix SS, BB und FF iterativ und ermittelt dadurch bessere Werte für bi und fi.
Claims (5)
1. Ein Verfahren zur Faksimile-Übermittlung eines Dokuments von
einem Sendeprozessor (5) zu einem Empfangsprozessor (6),
wobei jeder Prozessor eine Bibliothek mit Symbolprototypen
hat, die durch einen Identifizierungscode gekennzeichnet
werden; das Verfahren umfaßt das Anlegen der Bibliothek mit
den Symbolprototypen sowie das Abtasten des Dokuments und
das Senden des entsprechenden Identifizierungscodes eines
Prototyps, der mit dem abgetasteten Symbol übereinstimmt;
das Verfahren ist folgendermaßen gekennzeichnet:
während die Bibliothek angelegt wird, wird auf der Grundlage
der Daten (sij, Wj, cij), die von der Darstellung der
abgetasteten Symbole kommen, der Umfang der weißen Fläche
(bi, fi) auf den gegenüberliegenden Seiten des
Symbolprototyps in Richtung der Abtastung festgelegt, und darüber
hinaus wird jedem Prototyp ein Parameter mit dem entsprechenden
Code zugeordnet, der den Umfang der festgelegten weißen
Fläche (bi, fi) darstellt.
2. Ein Verfahren nach Anspruch 1, das weiterhin beinhaltet:
jedes Symbol wird im Dokument abgetastet, wobei das Symbol
als p·q Feld dargestellt wird, in dem ein Binärzustand für
ein schwarzes Pel und der entgegengesetzte Zustand für ein
weißes Pel steht; das Feld stellt den Prototyp für dieses
Symbol bereit;
die Anpassung jedes nachfolgenden Bitfeldes, das einem
bestimmten, zuvor abgetasteten Symbol entspricht, mit dem
Prototyp, der das entsprechende Symbol darstellt;
die Ermittlung des Durchschnittswerts des Bitfeldes, das
jedem bestimmten abgetasteten Symbol entspricht, um einen
verbesserten Prototyp für dieses Symbol zu erzeugen; und
das Anlegen einer Bibliothek mit verbesserten Prototypen als
Schriftart, die sich aus den Symbolen zusammensetzt.
3. Ein Verfahren nach Anspruch 2, bei dem nach Beendigung der
Dokumentabtastung die verbesserten Prototypen jedes
abgetasten Symbols zum Empfangsprozessor gesendet werden, um das
Dokument wiederherzustellen.
4. Ein Verfahren nach einem der oben genannten Ansprüche, zu
dem folgende Schritte gehören:
das Messen der Mitte-zu-Mitte-Entfernungen (cij) zwischen
benachbarten Symbolpaaren, die im Dokument abgetastet
werden;
das Berechnen des Durchschnitts der gemessenen Entfernungen
für jede Kombination von benachbarten, abgetasteten
Symbolpaaren;
das Messen der Breite (wi, wj) jedes Symbols eines solchen
Nachbarpaares; und
das Ableiten der durchschnittlichen Rand-zu-Rand-Entfernung
zwischen dem Symbolen jedes Nachbarpaares, indem die Hälfte
der Breite jedes Symbols eines Nachbarpaares vom
Durchschnitt der gemessenen Entfernungen abgezogen wird, wobei
der Umfang der weißen Fläche auf der Grundlage der
durchschnittlichen Rand-zu-Rand-Entfernungen ermittelt wird.
5. Ein Verfahren nach Anspruch 4, zu dem folgender Schritt
gehört:
das Ableiten der Rand-zu-Rand-Entfernungen für alle
Kombinationen von benachbarten Symbolpaaren, die nicht im
abgetasteten Dokument vorhanden sind, wobei die Ableitung von den
gemessenen Mitte-zu-Mitte-Entfernungen und Breiten der
Symbole von benachbarten Symbolpaaren erfolgt, die im
abgetasteten Dokument vorhanden sind.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/920,489 US4769716A (en) | 1986-10-17 | 1986-10-17 | Facsimile transmission using enhanced symbol prototypes with precalculated front and back white spaces |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3787865D1 DE3787865D1 (de) | 1993-11-25 |
DE3787865T2 true DE3787865T2 (de) | 1994-05-05 |
Family
ID=25443835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE87112542T Expired - Fee Related DE3787865T2 (de) | 1986-10-17 | 1987-08-28 | Verfahren zur Faksimile-Übertragung und -Kompression. |
Country Status (4)
Country | Link |
---|---|
US (1) | US4769716A (de) |
EP (1) | EP0263950B1 (de) |
JP (1) | JPS63108869A (de) |
DE (1) | DE3787865T2 (de) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5640607A (en) * | 1992-04-21 | 1997-06-17 | Microsoft Corporation | Method for sending bit mapped image by appending special code to text string and transmitting the text string separately from compressed residual image |
US5956419A (en) * | 1995-04-28 | 1999-09-21 | Xerox Corporation | Unsupervised training of character templates using unsegmented samples |
US5689620A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Automatic training of character templates using a transcription and a two-dimensional image source model |
US5706364A (en) * | 1995-04-28 | 1998-01-06 | Xerox Corporation | Method of producing character templates using unsegmented samples |
US5883986A (en) * | 1995-06-02 | 1999-03-16 | Xerox Corporation | Method and system for automatic transcription correction |
US5884014A (en) * | 1996-05-23 | 1999-03-16 | Xerox Corporation | Fontless structured document image representations for efficient rendering |
JP3061765B2 (ja) | 1996-05-23 | 2000-07-10 | ゼロックス コーポレイション | コンピュータベースの文書処理方法 |
US5835638A (en) * | 1996-05-30 | 1998-11-10 | Xerox Corporation | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols |
US7519221B1 (en) | 2005-02-28 | 2009-04-14 | Adobe Systems Incorporated | Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts |
US7702182B2 (en) * | 2006-02-16 | 2010-04-20 | Adobe Systems, Incorporated | Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images |
US7646921B2 (en) * | 2006-09-11 | 2010-01-12 | Google Inc. | High resolution replication of document based on shape clustering |
US7697758B2 (en) * | 2006-09-11 | 2010-04-13 | Google Inc. | Shape clustering and cluster-level manual identification in post optical character recognition processing |
US8175394B2 (en) * | 2006-09-08 | 2012-05-08 | Google Inc. | Shape clustering in post optical character recognition processing |
US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54116121A (en) * | 1978-03-01 | 1979-09-10 | Fujitsu Ltd | Production system of character train |
JPS56100565A (en) * | 1980-01-16 | 1981-08-12 | Toshiba Corp | Facsimile device |
US4463386A (en) * | 1982-05-03 | 1984-07-31 | International Business Machines Corporation | Facsimile data reduction |
US4499596A (en) * | 1982-06-28 | 1985-02-12 | International Business Machines Corporation | Adaptive facsimile compression using a dynamic extendable decision network |
US4494150A (en) * | 1982-07-13 | 1985-01-15 | International Business Machines Corporation | Word autocorrelation redundancy match facsimile compression for text processing systems |
US4499499A (en) * | 1982-12-29 | 1985-02-12 | International Business Machines Corporation | Method for identification and compression of facsimile symbols in text processing systems |
JPS60254871A (ja) * | 1984-05-31 | 1985-12-16 | Kokusai Denshin Denwa Co Ltd <Kdd> | フアクシミリ画像の符号化方法 |
-
1986
- 1986-10-17 US US06/920,489 patent/US4769716A/en not_active Expired - Lifetime
-
1987
- 1987-05-29 JP JP62132010A patent/JPS63108869A/ja active Granted
- 1987-08-28 DE DE87112542T patent/DE3787865T2/de not_active Expired - Fee Related
- 1987-08-28 EP EP87112542A patent/EP0263950B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0263950B1 (de) | 1993-10-20 |
JPH0453476B2 (de) | 1992-08-26 |
JPS63108869A (ja) | 1988-05-13 |
EP0263950A2 (de) | 1988-04-20 |
EP0263950A3 (de) | 1991-03-20 |
US4769716A (en) | 1988-09-06 |
DE3787865D1 (de) | 1993-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3716787C2 (de) | ||
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE3787865T2 (de) | Verfahren zur Faksimile-Übertragung und -Kompression. | |
DE69226846T2 (de) | Verfahren zur Bestimmung von Wortgrenzen im Text | |
DE69230282T2 (de) | Bildverarbeitungsverfahren und -vorrichtung | |
DE69421255T2 (de) | Dokumentkopierabwehrverfahren | |
DE69610243T2 (de) | Verfahren zum Trainieren einer Erkennungsanlage mit Zeichenmustern | |
DE69230629T2 (de) | Verfahren und Vorrichtung zur Bildverbesserung | |
DE68915950T2 (de) | Verfahren zum Trennen von Zeichen. | |
DE69428082T2 (de) | Verfahren zur Detektion finanzieller Beträge in binären Bildern | |
DE69331456T2 (de) | Überprüfbare optische Zeichenerkennung | |
DE69129136T2 (de) | Binärbildverarbeitung zur Dekodierung selbstaktierender Kodierungen in Markengestalt | |
DE69529210T2 (de) | Verfahren zum paaren von fingerabdrückminutiae mittels attribut-verhältnissgraphen | |
DE3689416T2 (de) | Mustermerkmalextraktion. | |
DE69724557T2 (de) | Dokumentenanalyse | |
DE69604481T2 (de) | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern | |
DE3851867T2 (de) | Zeichenerkennungsgerät. | |
DE69032344T2 (de) | Verfahren zum Messen von Neigungswinkeln | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE69721941T2 (de) | Gerät und Verfahren zum Extrahieren von Mustern | |
DE69308905T2 (de) | Verarbeiten von mit Punktmatrix- oder Tintenstrahlkopf gedrucktem Text für optische Zeichenerkennung | |
DE69423254T2 (de) | Verfahren und Gerät zur automatischen Spracherkennung von Dokumenten | |
DE69603547T2 (de) | Codierungsverfahren und Decodierungsschaltung für die Komprimierung von chinesischen Textzeichendaten | |
DE69230633T2 (de) | Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich | |
DE4005492C2 (de) | Bildcodierverfahren |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |