DE69330423T2 - Gerät und Verfahren zur Bildverarbeitung - Google Patents

Gerät und Verfahren zur Bildverarbeitung

Info

Publication number
DE69330423T2
DE69330423T2 DE69330423T DE69330423T DE69330423T2 DE 69330423 T2 DE69330423 T2 DE 69330423T2 DE 69330423 T DE69330423 T DE 69330423T DE 69330423 T DE69330423 T DE 69330423T DE 69330423 T2 DE69330423 T2 DE 69330423T2
Authority
DE
Germany
Prior art keywords
area
text
rectangle
line segments
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69330423T
Other languages
English (en)
Other versions
DE69330423D1 (de
Inventor
Akihiro Matsumoto
Tadanori Nakatsuka
Toru Niki
Kazuyuki Saito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP00269693A external-priority patent/JP3278221B2/ja
Priority claimed from JP5006034A external-priority patent/JPH06215179A/ja
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69330423D1 publication Critical patent/DE69330423D1/de
Publication of DE69330423T2 publication Critical patent/DE69330423T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Description

  • Die Erfindung betrifft ein Bildverarbeitungsverfahren und eine Bildverarbeitungsvorrichtung zum Lesen eines Dokumentbilds und Identifizieren einer Position sowie von Attributen des Dokuments.
  • Nachstehend wird ein Ablauf von Prozessen einer bekannten optischen Zeichenerkennungsvorrichtung in Übereinstimmung mit einem Ablaufdiagramm nach Fig. 47 beschrieben. In Schritt S4701 wird ein Bild durch einen Scanner gelesen, und werden Bildinformationen in ein binäres elektrisches Signal umgewandelt. Die gelesenen Daten werden in Schritt S4702 durch eine Anzeige angezeigt. In Schritt S4703 legt der Bediener einen Erkennungszielbereich in Form eines Rechtecks beliebiger Größe und Position unter Verwendung einer Zeigeeinrichtung fest. Da in japanischen Dokumenten ein Dokument mit vertikalem Schriftsatz und ein Dokument mit horizontalem Schriftsatz existieren, ist es notwendig, über ein Attribut bezüglich des vertikalen oder horizontalen Schriftsatzes, d. h. der Satzrichtung, zu entscheiden, bevor ein Zeichenextraktionsprozeß ausgeführt wird. Daher wird die Satzrichtung für einen solchen Bereich in Schritt S4704 abgeleitet. Ein Zeichenextraktionsprozeß zum Extrahieren eines Zeichenbilds für jedes Zeichen in Übereinstimmung mit dem Ergebnis der Ableitung ist in Schritt S4705 bereitgestellt. In Schritt S4706 wird ein Erkennungsprozeß ausgeführt. Das Erkennungsergebnis wird in Schritt S4707 auf einer Anzeige angezeigt, und wird in Übereinstimmung mit einer Anweisung des Bedieners bearbeitet oder beibehalten.
  • Es gibt auch einen Fall, in dem es sehr schwierig ist, die Satzrichtung in Abhängigkeit von einem Eingangsdokument abzuleiten, so daß dieses in Schritt S4704 fehlerhaft abgeleitet wird. In dem vorstehenden bekannten Beispiel gibt es jedoch in dem Fall, in dem die Satzrichtung fehlerhaft abgeleitet wurde, keine Einrichtung zum Überprüfen und Korrigieren durch den Benutzer, so daß ein Nachteil dahingehend besteht, daß der Prozeß mit der falschen Satzrichtung fortgesetzt und ein nicht korrektes Erkennungsergebnis verursacht wird.
  • Bisher gibt es eine Vorrichtung, bei der in dem Fall, in dem Bildinformationen ein Dokument mit einem komplizierten Aufbau sind derart, daß eine Spaltenfestlegung durchgeführt wurde oder eine Vielzahl von Überschriften zufällig angeordnet sind, der Bediener die Position des Dokuments in eine Vielzahl von Rechtecken aufteilt, diese bestimmt, und auch die Reihenfolge jedes Rechtecks oder die Beziehungen zu der Überschrift desselben als Attribute des Rechtecks bestimmt.
  • Bisher wird als ein Verfahren zum Aufteilen des Bereichs einer Tabelle aus den Bilddaten eines Dokuments, in welchem eine Vielzahl von Arten von Daten, wie beispielsweise ein Textkörper, eine Fotografie, eine Tabelle und dergleichen gemischt existieren, ein Verfahren zum Ermitteln aus einem Verhältnis zwischen der Fläche eines solchen Bereichs und der Anzahl von Pixeln verwendet.
  • Das vorstehende Verfahren zum Anordnen der Überschriften hat jedoch ein Problem dahingehend, daß in dem Fall eines Originals, wie beispielsweise einem Zeitungsartikel oder dergleichen, in welchem eine Überschrift so vorhanden ist, daß sie von dem Textkörper umschlossen wird, die Überschrift in den Textkörper ragt, erkannt wird, und einen sich von der inhärenten Reihenfolge unterscheidenden Satzfluß des Textkörpers stört.
  • Die vorstehende bekannte Technik für die Bereichaufteilung hat ein Problem dahingehend, daß in dem Fall, in dem ein Trenner oder dergleichen, welcher aufgrund einer komplizierten Polygonalen Linie oder dergleichen als ein Bereich verarbeitet wird, dann, wenn die Anzahl von Pixeln für den Bereich ein es umschriebenen Rechtecks zunimmt, ein solcher Bereich fehlerhaft als Tabellenbereich beurteilt wird, so daß die Genauigkeit der Bereichaufteilung abnimmt oder dergleichen.
  • Aus "Pattern Recognition", Band Nr. 23, Nr. 11, November 1990, Oxford, Großbritannien, Seiten 1141-1154, T. Akiyama und N. Hagita: "Automated Entry System for Printed Documents" ist bekannt, eine Dokumentkomponentenextraktion zum Extrahieren und Identifizieren von Textbereichen als Überschriftenbereiche und Textkörperbereiche auf der Grundlage von Projektionsprofilen und Schnittpunktzählungen zusammen mit bekannten Eigenschaften von Dokumentenkomponenten bereitzustellen.
  • Erfindungsgemäß wird ein Bildverarbeitungsverfahren mit den Schritten des Zuführens von Bildinformationen und Teilens der zugeführten Bildinformationen in eine Vielzahl von Textbereichen offenbart, gekennzeichnet durch
  • Erweitern eines Liniensegments in radialer Richtung ausgehend von einem Punkt innerhalb eines bestimmten der geteilten Textbereiche zu einem anderen der geteilten Textbereiche, der zu dem bestimmten Bereich beabstandet ist;
  • Erfassen von Orts- und Größeninformationen des bestimmten Textbereichs und des anderen Textbereichs; und
  • Unterscheiden, ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, in Übereinstimmung mit den erfaßten Orts- und Größeninformationen.
  • Weitere Gesichtspunkte der Erfindung sind in den beigefügten Ansprüchen offenbart.
  • In einem bevorzugten Ausführungsbeispiel kann das Ergebnis der Ableitung der Satzrichtung angezeigt werden, bevor ein Erkennungsprozeß in Gang gesetzt wird, und weist die Vorrichtung eine Einrichtung auf, welche in dem Fall, in dem die Ableitung fehlerhaft ist, auf einfache Art und Weise die Satzrichtung umkehren kann, so daß Vorteile dahingehend bestehen, daß keine Gefahr besteht derart, daß der Prozeß bis zu dem letzten Schritt in einem falschen Zustand fortgesetzt durchgeführt wird, und die gesamte Betriebsablaufzeit verringert sowie eine bessere Benutzerschnittstelle bereitgestellt werden kann.
  • Gemäß dem Ausführungsbeispiel werden radiale Liniensegmente ausgehend von einer Überschrift erweitert und kann dann, wenn ein Textkörperabschnitt in irgendwelchen drei oder mehr Richtungen der Richtungen nach oben, nach unten, nach links und nach rechts der Überschrift existiert, durch Festlegen der Überschrift auf die Reihenfolge über den Textkörperabschnitt auch in dem Fall eines Dokuments wie einem Zeitungsartikel oder dergleichen derart, daß die Überschrift von dem Textkörper umschlossen wird, diese korrekt angeordnet werden und wird ein Satzfluß des Textkörpers nicht gestört, so daß Vorteile dahingehend bestehen, daß ein beschwerlicher Betriebsablauf zur Korrektur durch den Benutzer unnötig wird und die Verarbeitungsprozedur vereinfacht sowie die Verarbeitungszeit verringert werden kann.
  • Gemäß dem Ausführungsbeispiel bestehen durch Ausführen von Prozessen zum Teilen eines zugeführten Bilds in Rechteckbereiche für jedes Attribut wie beispielsweise eine Figur, eine Fotografie, eine Tabelle, einen Trenner oder dergleichen, zum Erweitern radialer Liniensegmente ausgehend von einem willkürlichen Punkt in einem Bereich, der vorübergehend als ein Tabellenbereich beurteilt wurde, und zum Identifizieren unter Berücksichtigung der Anzahl von Schnittpunkten mit einem Tabellenrahmen und der Richtungen der Schnitte, daß ein solcher Bereich eine Tabelle ist, Vorteile dahingehend, daß die Genauigikeit der Tabellenaufteilung erhöht wird und die Verarbeitungslast klein ist, und daß die Tabellenaufteilung, die stark zu der Inklination ist, ausgeführt werden kann.
  • Fig. 1 ist ein Blockdiagramm, welches einen vereinfachten Aufbau einer Bildverarbeitungsvorrichtung gemäß einem Ausführungsbeispiel zeigt;
  • Fig. 2 ist ein Ablaufdiagramm, welches Bildprozesse in der Bildverarbeitungsvorrichtung des Ausführungsbeispiels 1 zeigt;
  • Fig. 3 ist ein Diagramm, welches ein Beispiel eines Markierungsprozesses zeigt;
  • Fig. 4 ist ein Diagramm, welches eine Rechteckdatenstruktur zeigt;
  • Fig. 5 besteht aus Fig. 5A und 5B, die Ablaufdiagramme eines Attributerfassungsprozesses zum Erfassen von Attributen eines Trenners und dergleichen anhand der Rechteckgröße zeigen;
  • Fig. 6 ist ein Diagramm, welches die Aufteilung anhand einer Dichte D und einer Fläche S der Attribute eines Rechtecks (Bereichs) zeigt;
  • Fig. 7 ist ein Ablaufdiagramm, welches Prozesse einer Satzrichtungserfassungseinrichtung zeigt;
  • Fig. 8 ist ein Diagramm, welches ein Beispiel eines Absatzerfassungsprozesses zeigt;
  • Fig. 9 ist ein Ablaufdiagramm, welches Prozesse einer Überschrifterfassungseinrichtung zeigt;
  • Fig. 10 ist ein Ablaufdiagramm, welches Prozesse einer Anordnungseinheit zeigt;
  • Fig. 11 ist ein Ablaufdiagramm, welches einen Prozeß zum Anordnen einer von einem Textkörper umgebenen Überschrift zeigte welcher durch die Anordnungseinheit ausgeführt wird;
  • Fig. 12 ist ein Ablaufdiagramm, welches einen Prozeß zum Anordnen einer von einem Textkörper umgebenen Überschrift zeigt, welcher durch die Anordnungseinheit ausgeführt wird;
  • Fig. 13 ist ein Ablaufdiagramm, welches einen Prozeß zum Anordnen einer von einem Textkörper umgebenen Überschrift zeigt, welche durch die Anordnungseinheit ausgeführt wird;
  • Fig. 14 ist ein Diagramm, welches ein Beispiel eines zugeführten Originals zeigt;
  • Fig. 15 ist ein Diagramm, welches Überschriften und Textkörperabschnitte zeigt, welche durch eine Bereichaufteilungseinrichtung extrahiert wurden;
  • Fig. 16 ist ein Diagramm, welches einen Zustand zeigt, in dem die von den Textkörperabschnitten umgebene Überschrift durch die Anordnungseinrichtung angeordnet wurde;
  • Fig. 17 ist ein Diagramm, welches einen Zustand zeigt, in dem die Überschriften und ein Teil der Textkörperabschnitte durch die Anordnungseinrichtung angeordnet wurden;
  • Fig. 18 ist ein Diagramm, welches einen Zustand zeigt, in dem alle Überschriften und Textkörperabschnitte durch die Anordnungseinrichtung angeordnet wurden;
  • Fig. 19 ist ein Diagramm, welches einen Überlappungsgrad der Abschnitte zeigt;
  • Fig. 20 ist ein Diagramm, welches einen Zustand der Beurteilung zeigt, ob ein Textkörperabschnitt in der oberen, unteren, linken oder rechten Richtung einer Merk-Überschrift oder dergleichen existiert;
  • Fig. 21 ist ein Diagramm, welches einen Zustand des Ermittelns eines Merkpunkts zeigt, der sich an einer Position befindet, die α% der Höhe und β% der Breite von der linken oberen Ecke der Merk-Überschrift entfernt ist;
  • Fig. 22 ist ein Diagramm, welches einen Zustand der Beurteilung dahingehend zeigt, ob ein Textkörperabschnitt in der oberen, unteren, linken oder rechten Richtung der Merk- Überschrift oder dergleichen existiert;
  • Fig. 23 ist ein Diagramm, welches einen Überlappungsgrad der Abschnitte in der vertikalen Richtung zeigt;
  • Fig. 24 ist ein Diagramm, welches einen Überlappungsgrad der Abschnitte in der horizontalen Richtung zeigt;
  • Fig. 25 ist ein Ablaufdiagramm, welches Bildprozesse zum Ermitteln eines Tabellenbereichs in der Bildverarbeitungsvorrichtung zeigt;
  • Fig. 26 ist ein Diagramm, welches eine Tabelle und Rechtecke zeigt, die Bereiche der Tabelle zeigen;
  • Fig. 27 ist ein Diagramm, welches deformierte Trenner und Rechtecke zeigt, die Bereiche der deformierten Trenner zeigen;
  • Fig. 28 ist ein Ablaufdiagramm, welches Beispiele von Prozessen einer Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 29 ist ein Diagramm, welches eine Tabelle und Rechtecke zeigt, die Bereiche der Tabelle zeigen;
  • Fig. 30 ist ein Diagramm, welches deformierte Trenner und Rechtecke zeigt, die Bereiche der deformierte Trenner zeigen;
  • Fig. 31 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 32 ist ein Diagramm, welches eine Tabelle und Rechtecke zeigt, die Bereiche der Tabelle zeigen;
  • Fig. 33 ist ein Diagramm, welches deformierte Trenner und Rechtecke zeigt, die Bereiche der deformierten Trenner zeigen;
  • Fig. 34 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 35 ist ein Diagramm, welches eine Tabelle und Rechtecke zeigt, die Bereiche der Tabelle zeigen;
  • Fig. 36 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 37 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 38 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 39 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 40 ist ein Ablaufdiagramm, welches ein Beispiel von Prozessen der Tabellenbereich-Identifikationseinrichtung zeigt;
  • Fig. 41 ist ein Blockdiagramm, welches den Aufbau einer Bildverarbeitungsvorrichtung zum Unterscheiden und Ermitteln der Satzrichtung zeigt;
  • Fig. 42 ist ein Ablaufdiagramm, welches den Ablauf eines Satzrichtungbeurteilungsprozesses zeigt;
  • Fig. 43 ist ein Diagramm zum Erklären von Projektionskomponenten eines Zeichenbilds;
  • Fig. 44 ist ein Diagramm, welches ein Beispiel der Anzeige von Bilddaten auf einer Anzeige zeigt;
  • Fig. 45 ist ein Diagramm, welches ein Anzeigebeispiel einer Satzrichtungsmarke zeigt;
  • Fig. 46 ist ein Diagramm, welches ein Anzeigebeispiel einer Satzrichtungsmarke zeigt; und
  • Fig. 47 ist ein Ablaufdiagramm für eine Prozedur zum Ausführen von Bildprozessen durch Ermitteln der Satzrichtung in einer bekannten Vorrichtung.
  • (Ausführungsbeispiel 1)
  • Fig. 1 ist ein Blockdiagramm, welches den Aufbau einer Bildverarbeitungsvorrichtung gemäß dem Ausführungsbeispiel zeigt.
  • In dem Diagramm bezeichnet das Bezugszeichen 101 eine Bilddaten-Eingabeeinheit zum Eingeben von Bilddaten, die durch einen Scanner gelesen werden, oder Bilddaten, die von einem Host-Computer übertragen werden; 102 eine zentrale Verarbeitungseinheit (CPU) zum Ausführen einer Steuerung der Vorrichtung in Übereinstimmung mit in einer Speichereinheit (MEM) 103 gespeicherten Steuerprogrammen und Rechenoperationen eines Prozesses jedes Abschnitts; und 103 die Speichereinheit zum Speichern der Steuerprogramme für in Ablaufdiagrammen gezeigten Prozesse, welche noch zu beschreiben sind, und verschiedener Arten von Daten. Die Speichereinheit 103 beinhaltet ein ROM und ein RAM. Das Bezugszeichen 104 bezeichnet eine Ausgabeeinheit zum Ausgeben des Ergebnisses des Rechenoperationsprozesses, des Ergebnisses des Bildprozesses und der Bilddaten; 105 eine Bereichaufteileinrichtung zum Ausführen eines gesamten Bereichaufteilungsprozesses; 106 eine Bildausdünneinrichtung zum Ausdünnen des zugeführten Bilds; 107 eine Markiereinrichtung zum Markieren von Pixeln, die ausgedünnt wurden, sowie zum Erstellen anfänglicher Rechteckdaten; 108 eine Attributerfassungseinrichtung zum Erfassen von Attributen in einem Bereich eines Trenners, einer Tabelle, einer Figur oder dergleichen; 109 eine Satzrichtungerfassungseinrichtung zum Erfassen der Satzrichtung von Sätzen, die eine vertikale Schrift, eine horizontale Schrift oder dergleichen anzeigt; 111 eine Überschrifterfassungseinrichtung zum Erfassen einer Überschrift; und 111 eine Anordnungseinheit zum Anordnen der Absätze bzw. Abschnitte und Überschriften von Sätzen.
  • Fig. 2 ist ein Ablaufdiagramm, welches Bildprozesse in der Bildverarbeitungsvorrichtung gemäß dem Ausführungsbeispiel zeigt. Ein Steuerprogramm zum Ausführung der Bildprozesse ist in der Speichereinheit 103 gespeichert und wird durch die CPU 102 ausgeführt.
  • Schritt S201
  • Zunächst wird ein Originalbild von der Bildeingabeeinheit 101 zugeführt.
  • Schritt S202
  • In der Bildausdünnungseinrichtung 106 wird daraufhin die ODER-Verknüpfung von m Punkten (in der vertikalen Richtung) · n Punkten (in der horizontalen Richtung) für das Originalbild erhalten, und werden (m · n) Pixel bis auf einen Pixel neu ausgedünnt und die Bilddaten nach Abschluß des Ausdünnungsprozesses in der Speichereinheit 103 gespeichert.
  • Wenn ein schwarzer Pixel des Umfangs zumindest eines Punktes in den (m · n) Pixeln in dem Originalbild existiert, wird das ausgedünnte Bild schwarz.
  • Schritt S203
  • Die Markiereinrichtung 107 führt eine Verarbeitung zum Hinzufügen von Markierungen zu den schwarzen Pixeln des ausgedünnten Bilds in der Speichereinheit 103 in jeder Zeile, zum Hinzufügen derselben Markierung zu den Pixeln, die sich in der vertikalen, horizontalen oder schrägen Richtung anschließen, und zum gleichzeitigen Nachverfolgen eines Rechtecks durch.
  • In dem Fall eines in Fig. 3 gezeigten Beispiels wird eine Markierung 1 zu einem Pixel A, welcher zuerst erfaßt wird, hinzugefügt, werden Koordinaten (Xa, Ya) des Pixels A als ein Anfangs- und ein Endpunkt des Rechtecks als der Markierung 1 angenommen, und wird die Anzahl von Pixeln auf 1 festgelegt. Dieselbe Markierung 1 wie die des Pixels wird zu einer Rechteckmarkierung zum Unterscheiden eines Rechtecks hinzugefügt, und die vorstehenden Daten werden als Rechteckdaten (Fig. 4) in der Speichereinheit 103 gespeichert. Nachdem die Markierungsdaten des Pixels A gespeichert wurden, wird ein Suchvorgang nach Markierungen in der X-Richtung ausgeführt. In Fig. 3 wird, da der neben dem Pixel A liegende Pixel ein weißer Pixel ist, ein nächster schwarzer Pixel B markiert.
  • Eine Markierung 2, die von dem Pixel A unterschieden werden kann, wird zu dem Pixel B hinzugefügt, wobei Pixel, die sich in der Richtung nach links fortsetzen, nicht existieren (da die Zeile, die derzeit verarbeitet wird, die erste Zeile ist, gibt es keinen Pixel, der ausgehend von der oberen Position kontinuierlich ist). Koordinaten (Xb, Yb) des Pixels B werden als Anfangs- und Endpunkte des Rechtecks angenommen, und die Anzahl von Pixeln wird auf 1 festgelegt. Dieselbe Markierung 2 wie die des Pixels wird zu der Rechteckmarkierung zum Unterscheiden des Rechtecks hinzugefügt, und die vorstehenden Daten werden ebenfalls als Rechteckdaten (Fig. 4) in der Speichereinheit 103 gespeichert.
  • Auf eine zu dem Vorstehenden vergleichbare Art und Weise schreitet nach dem Abschluß der Markierung der ersten Zeile die Verarbeitungsroutine zu der zweiten Zeile fort.
  • Ein erster schwarzer Pixel C, der durch den Suchvorgang zum Markieren der zweiten Zeile aufgefunden wird, ist ausgehend von der oberen Positionen mit dem Pixel A der Markierung 1 kontinuierlich. Daher wird dieselbe Pixelmarkierung 1 wie die des Pixels A zu dem schwarzen Pixel C hinzugefügt. "1" entsprechend der Anzahl von Pixeln des Pixels C wird zu der Anzahl von Pixeln für die Rechteckdaten der Rechteckmarkierung 1 hinzugefügt, so daß die gesamte Anzahl von Pixeln gleich 2 ist, und die Rechteckmarkierung ohne Änderung auf 1 gehalten wird. Nur der Endpunkt der Rechteckkoordinaten wird von (Xa, Ya) auf (Xa, Yc) aktualisiert (die Koordinaten des Anfangspunkts werden nicht verändert).
  • Da ein nächster Pixel D mit dem Pixel C ausgehend von der linken Position kontinuierlich ist, wird dieselbe Markierung 1 wie die des Pixels C hinzugefügt. "1" wird zu der Anzahl von Pixeln für die Rechteckdaten der Rechteckmarkierung 1 hinzugefügt, so daß die gesamte Anzahl von Pixeln gleich drei ist. Die Rechteckmarkierung wird ohne Änderung auf 1 belassen. Nur der Endpunkt der Rechteckkoordinaten wird von (Xa, Yc) auf (Xd, Yc) aktualisiert (die Y-Koordinate des Endpunkts wird nicht verändert).
  • In diesem Beispiel ist der Pixel D auch mit dem Pixel B in der schrägen Richtung und mit dem Pixel C kontinuierlich. Daher wird die Markierung des Pixels B von der Markierung 2 auf dieselbe Markierung 1 wie die des Pixels D geändert. Die Anzahl von Pixeln der Rechteckmarkierung 2 wird zu der Anzahl von Pixeln der Rechteckdaten der Rechteckmarkierung 1 hinzugefügt, so daß die gesamte Anzahl von Pixeln gleich 4 ist. Die Rechteckmarkierung wird ohne Änderung auf 1 belassen. Die X- und Y-Koordinaten nur des Endpunkts der Rechteckkoordinaten werden von (Xd, Yc) auf (Xb, Yd) als Maximalwerte von vier Punkten A bis D aktualisiert. In Bezug auf die Rechteckdaten der Rechteckmarkierung 2 wird die Rechteckmarkierung auf 0 gesetzt und dadurch ungültig gemacht.
  • Nachdem die Prozesse der zweiten Zeile wie vorstehend beschrieben beendet worden sind, schreitet die Verarbeitungsroutine zu der dritten Zeile fort.
  • Da der erste Pixel E der dritten Zeile schräg kontinuierlich mit dem Pixel C ist, wird dieselbe Pixelmarkierung 1 wie die des Pixels C hinzugefügt. "1" wird zu der Anzahl von Pixeln für die Rechteckdaten der Rechteckmarkierung 1 addiert, so daß die Gesamtanzahl von Pixeln gleich 5 ist. Die Rechteckmarkierung wird ohne Änderung auf 1 belassen. Der Anfangspunkt der Rechteckkoordinaten wird von (Xa, Ya) auf den Minimalwert (Xe, Ya) von fünf Punkten aktualisiert, und der Endpunkt wird von (Xb, Yd) auf den Maximalwert (Xb, Ye) von fünf Punkten aktualisiert.
  • Die Markierung und die Nachverfolgung des Rechtecks werden im Folgenden auf eine zu dem vorstehenden Verfahren ähnliche Art und Weise ausgeführt.
  • Schritt S204
  • In der Attributerfassungseinrichtung 108 werden nach dem Ende der Markierung und der Nachverfolgung des Rechtecks die Attribute des Rechtecks, wie beispielsweise das einem Textkörper bzw. Inhaltsbereich entsprechende Rechteck, das einer Figur, einem Foto, einer Tabelle oder dergleichen entsprechende Rechteck, das einem Trenner entsprechende Rechteck und dergleichen unter Verwendung einer Breite W des Rechtecks, einer Höhe H, einer Fläche S und der Anzahl von Pixeln für die Fläche, d. h. einer Pixeldichte D, unterschieden (diese Werte von W, H, S und D können auf einfache Art und Weise durch Berechnen unter Verwendung der Anzahl von Pixeln der Rechteckdaten, der Anfangs- und der Endpunkte sowie der Koordinaten erhalten werden).
  • Nachstehend wird der Prozeß zum Erfassen der Attribute in Schritt S204 unter Bezugnahme auf das Ablaufdiagramm der Fig. 5A und 5B im Einzelnen beschrieben.
  • Nachdem das Rechteck durch den Markierungsprozeß (Schritt S203) gesucht wurde (Schritt S502), schreitet die Verarbeitungsroutine zu Prozessen derart fort, daß die Attribute jedes Rechtecks unter Verwendung der in der Speichereinheit 103 gespeicherten Daten beurteilt werden, die Attributinformationen auf eine Rechteckmarkierung wie in Fig. 4 gezeigt festgelegt werden, und die in der Speichereinheit 103 gespeicherten Daten geändert werden. Wenn die Breite W, welche aus den Koordinaten des Anfangs- und des Endpunkts des Rechtecks erhalten wird, gleich oder kleiner als ein Schwellenwert Tw&sub1; ist, und die Höhe H gleich oder größer als ein Wert ist, der zweimal so groß wie ein Schwellenwert Tw der Breite W (Schritt S503) ist, oder wenn die Breite W größer als der Schwellenwert Tw&sub1; ist und die Höhe H gleich oder größer als ein Wert ist, der dreimal so groß wie der Schwellenwert Tw ist (Schritt S504), wird ein solches Rechteck als ein Trenner betrachtet, welcher vertikal ausgedehnt ist, wird die Rechteckmarkierung in den Rechteckdaten auf -3 geändert, und wird die das Rechteck bildende Pixelmarkierung getrennt von der Rechteckmarkierung so belassen, wie sie ist (Schritt S514).
  • Die Beurteilung, in welcher die Breite und die Höhe ausgetauscht werden, wird ebenfalls auf eine zu dem Vorstehenden ähnliche Art und Weise ausgeführt (Schritte S505 und S506). Die Rechteckmarkierung der Rechteckdaten, welche in den vorstehenden Schritten als ein horizontal ausgedehnter Trenner beurteilt wurden, wird auf -3 geändert.
  • Wie in Fig. 6 gezeigt ist, werden die Rechteckdaten, in welchen die Pixeldichte D gleich oder kleiner als ein Schwellenwert Td&sub1; (Schritt S507) ist, als ein deformierter Trenner betrachtet, wie beispielsweise ein hakenförmiger Trenner oder dergleichen, und wird die Rechteckmarkierung auf -3 geändert (Schritt S514).
  • Die Sechteckdaten, in welchen die Fläche S größer als ein Schwellenwert Ts&sub1; (Schritt S508) ist, werden als Tabelle betrachtet, solange die Pixeldaten D kleiner sind als ein Schwellenwert Td&sub2; (Schritt S509 in Fig. 5B), und die Rechteckmarkierung wird auf -4 geändert (Schritt S515). Wenn die Pixeldichte D gleich oder größer als der Schwellenwert Td&sub2; ist, werden die Rechteckdaten als Figur oder Fotografie betrachtet, und wird die Rechteckmarkierung auf -5 geändert (Schritt S516 in Fig. 5B).
  • Das Rechteck, in welchem die Pixeldichte D der Rechteckdaten, in welchen die Fläche S gleich oder kleiner als der Schwellenwert Ts&sub1; und gleich oder größer als der Schwellenwert Ts&sub2; ist (Schritt S510), gleich oder größer als ein Schwellenwert Td&sub3; (Schritt S511) ist, oder das Rechteck, in welchem sowohl die Breite W als auch die Höhe H gleich oder größer als ein Schwellenwert Tw&sub4; sind und die Pixeldichte D gleich oder größer als ein Schwellenwert Td&sub5; (Schritt S513) ist, wird ebenfalls als eine Figur oder Fotografie betrachtet, und die Rechteckmarkierung wird auf -5 geändert.
  • Ferner wird, wenn die Fläche 5 gleich oder kleiner als der Schwellenwert Ts&sub1; und gleich oder größer als der Schwellenwert Ts&sub2; (Schritt S510) ist, das Rechteck, in welchem die Pixeldichte D kleiner als ein Schwellenwert Td&sub4; (Schritt S512) ist, als Tabelle betrachtet, und wird die Rechteckmarkierung auf -4 geändert (Schritt S515).
  • Wie vorstehend erwähnt wurde, werden das der Figur, der Fotografie, der Tabelle oder dergleichen entsprechende Rechteck, das dem Trenner entsprechende Rechteck und dergleichen erfaßt, und werden die verbleibenden Rechtecke als Textkörper betrachtet und die Rechteckmarkierung wie sie ist auf derselben Pixelmarkierung belassen (Schritt S517).
  • Schritt S205
  • Die Satzrichtung des Textkörpers wird nachfolgend durch die Satzrichtungerfassungseinrichtung 109 erfaßt. In dem Fall von horizontal geschriebenen Sätzen kann das als Textkörper verbleibende Rechteck leicht zu einem horizontal ausgedehnten Rechteck werden, in welchem die Pixel in der horizontalen Richtung ausgedünnt wurden. In dem Fall von vertikal geschriebenen Sätzen kann das als Textkörper verbleibende Rechteck leichter zu einem Rechteck werden, das vertikal ausgedehnt ist.
  • Daher werden die Mittelwerte (w und h) der Breite W und der Höhe H des Rechtecks des Textkörpers berechnet (Schritt S701 in Fig. 7). In dem Fall, indem die mittlere Breite w größer als die mittlere Höhe h ist, wird das Rechteck als Sätze betrachtet, in welchen die Anzahl von horizontal geschriebenen Sätzen groß ist, und wird die mittlere Höhe h auf die Zeichengröße eines Zeichens festgelegt (Schritte S702 und S703 in Fig. 7). Demgegenüber wird in dem Fall, in dem die mittlere Höhe h größer als die mittlere Breite w ist, das Rechteck als Sätze betrachtet, in welchen die Anzahl vertikal geschriebener Sätze groß ist, und wird die mittlere Höhe auf die Zeichengröße eines Zeichens festgelegt (Schritte S702 und S710 in Fig. 7).
  • Darauffolgend wird ein Histogramm eines Rechtecks in der zu der Satzrichtung entgegengesetzten Richtung ermittelt (Schritt S704 in Fig. 7). Der Ort, an dem es gleich oder kleiner ist als ein Schwellenwert Tk aus der Form einer Randverteilung, wird als ein Absatztrenner betrachtet (Schritte S705 und S712 in Fig. 7). Ein Histogramm des Rechtecks wird in derselben Richtung wie der Satzrichtung für jeden Absatz ermittelt (Schritte S708 und S715 in Fig. 7). Die Länge kontinuierlicher schwarzer Pixel wird auf die Zeichengröße eines Zeichens in dem Absatz aus der Form der Randverteilung festgelegt, und die Länge kontinuierlicher weißer Pixel wird als Zeilenabstand erfaßt (Schritte S709 und S716 in Fig. 7 und Fig. 8).
  • Informationen zum Unterscheiden, ob die Sätze die horizontal geschriebenen Sätze oder die vertikal geschriebenen Sätze sind, werden zusammen mit den Rechteckdaten in der Speichereinheit 103 gespeichert.
  • Schritt S206
  • Darauffolgend erfaßt die Überschrifterfassungseinrichtung 110 eine Überschrift mittels der Satzrichtung und der Zeichengröße.
  • Wenn der Fall der vertikal geschriebenen Sätze betrachtet wird, wie in Fig. 9 als Beispiel gezeigt, werden die Rechtecke, in welchen die Breite W um den Schwellenwert Tm&sub1; mal oder mehr größer als die Zeichengröße w ist (d. h. W ist größer als (w · Tm&sub1;), aus den Rechtecken des Textkörpers ermittelt und als Kandidaten von Überschriftrechtecken erfaßt (Schritt S905 in Fig. 9)
  • Ferner wird dann, wenn die Höhe H des Rechtecks kleiner als ein Wert ist, der Tm&sub2; mal so groß wie die Zeichengröße ist (Schritt S906 in Fig. 9), davon ausgegangen, daß die horizontal geschriebenen Zeichen kontinuierlich sind, so daß ein solches Rechteck auf eine Überschrift festgelegt wird (Schritt S908 in Fig. 9).
  • Es gibt einen Fall, in dem ein Rechteck, zu dem die Zeichen des Textkörpers kombiniert sind, in dem Rechteck enthalten ist, welches aus der Größe des Rechtecks wie vorstehend erwähnt als Überschrift festgelegt ist. Daher wird das Rechteck, in welchem ein Abstand DBH zwischen dem Rechteck des Textkörpers und dem Rechteck der Überschrift kürzer als ein Schwellenwert T&sub1; (Schritt S907 in Fig. 9) ist, aus der Überschrift in den Textkörper korrigiert (Schritt S909 in Fig. 9).
  • Ferner wird aus den Rechtecken des Textkörpers, welche durch die vorstehenden Prozesse verbleiben, das Rechteck, in welchem weder das Rechteck des Textkörpers noch das Rechteck der Überschrift in dem Bereich der Zeichengröße w existieren, auf eine Überschrift als ein isoliertes Rechteck festgelegt (Schritte S910 bis S913 in Fig. 9).
  • Schritt S207
  • Die Überschriften und Textkörperabschnitte werden sodann durch die Anordnungseinheit 111 angeordnet.
  • Nachstehend wird der Anordnungsprozeß im Einzelnen beschrieben. Fig. 10 ist ein detailliertes Ablaufdiagramm betreffend Schritt S207. Zunächst wird geprüft, ob es eine von dem Textkörper umschlossene Überschrift gibt oder nicht. Falls JA, wird eine solche Überschrift zunächst angeordnet (Schritt S1001). Der Prozeß in Schritt S1001 wird unter Bezugnahme auf Fig. 11 noch im Einzelnen beschrieben.
  • Danach wird unter Verwendung des Ergebnisses der vorstehend erwähnten Erfassung der Satzrichtung (Schritt S205) geprüft, ob die Sätze die vertikal geschriebenen Sätze oder die horizontal geschriebenen Sätze sind (Schritt S1002). Im Fall der vertikalen Schreibrichtung werden die Überschriften und Absätze, die sich in der horizontalen Richtung an nahezu derselben Position wie der des obersten Bereichs unter den Überschriften und Absätzen befinden, die noch nicht angeordnet sind, in dieselbe Gruppe zusammengefaßt (Schritt S1003). Wenn die Überschriften und Absätze, die zu derselben Höhe gehören, ermittelt sind, werden sie sequentiell von rechts angeordnet und in Reihenfolge gebracht (Schritt S1004). Danach wird, wenn alle Überschriften und Absätze in Reihenfolge gebracht sind, Schritt S207 beendet und folgt Schritt S208 (Schritt S1005). Wenn es irgendwelche weiteren Überschriften und Absätze gibt, die noch nicht in Reihenfolge gebracht sind, wird die Verarbeitungsroutine zu Schritt S1003 zurückgeführt, und werden dieselben auf eine zu der Vorstehenden ähnliche Art und Weise in Reihenfolge gebracht (Schritt S1005).
  • Wenn desgleichen in Schritt S1002 beurteilt wird, daß die Schreibrichtung die horizontale Schreibrichtung ist, werden die Überschriften und Absätze, die sich an nahezu derselben Position in der vertikalen Richtung befinden wie der Position des am weitesten links liegenden Bereichs unter den Überschriften und Absätzen, die nicht angeordnet sind, in dieselbe Gruppe zusammengefaßt (Schritt s1006). Wenn die Überschriften und Absätze, die zu derselben Gruppe gehören, ermittelt sind, werden sie sequentiell von oben her angeordnet und in Reihenfolge gebracht (Schritt S1007). Wenn alle Überschriften und Absätze wie vorstehend erwähnt in Reihenfolge gebracht sind, ist Schritt S207 beendet und folgt Schritt S208 (Schritt S1008). Wenn irgendwelche weiteren Überschriften und Absätze vorhanden sind, die noch nicht in Reihenfolge gebracht sind, wird die Verarbeitungsroutine zu Schritt S1006 zurückgeführt, und werden diese ebenso in Reihenfolge gebracht (Schritt S1008).
  • Nachstehend wird eine Erklärung unter Verwendung eines Ausführungsbeispiels gegeben. Fig. 14 zeigt ein zugeführtes Original 1401. Fig. 15 zeigt Überschriften und Textkörperabschnitte, die durch die vorstehend erwähnte Bereichaufteilungseinrichtung (Schritte S202 bis S206) aus dem zugeführten Original 1401 herausgenommen wurden. In Fig. 15 bezeichnet das Bezugszeichen 1501 einen Gesamtzustand der Überschriften und Textkörperabschnitte entsprechend dem zugeführten Original 1401. Durch ausgezogene Linien gezeigte Bereiche 1502 und 1503 geben Überschriften an. Durch durchbrochene Linien gezeigte Bereiche 1504 bis 1507 geben Textkörperabschnitte an. Fig. 16 zeigt einen Zustand, in welchem in Schritt S1001 beurteilt wird, daß die Überschrift 1503 von dem Textkörper umschlossen wird, so daß Nr. 1 der Überschrift 1503 zugewiesen wird. Es ist ebenfalls möglich, eine Anordnung derart vorzusehen, daß die Daten in jeder Phase in Fig. 14 bis 16 von der Ausgabeeinheit 104 ausgegeben, angezeigt, durch den Bediener überprüft, ein fehlerhafter Abschnitt korrigiert und korrekte Daten erneut zugeführt bzw. eingegeben werden.
  • Wenn in Schritt S1002 die vertikale Schreibrichtung festgestellt wird, folgt Schritt S1003. In Schritt S1003 wird zunächst die Überschrift oder der Textkörperabschnitt, der sich an der obersten Position befindet, aus den nicht in Reihenfolge gebrachten Überschriften und Textkörperabschnitten geholt. In Fig. 16 befindet sich der Textkörperabschnitt 1504 an der obersten Position. Nachfolgend werden die Überschriften und Textkörperabschnitte, die zu derselben Gruppe wie der des Textkörperabschnitts 1504 gehören, herausgenommen zunächst wird geprüft, ob der Textkörperabschnitt 1504 und die Überschrift 1502 zu derselben Gruppe gehören oder nicht. Fig. 19 ist ein Diagramm zum Erklären eines solchen Beurteilungsprozesses. In Fig. 19 bezeichnen die Bezugszeichen H1502 und H1504 Höhen der Überschrift 1502 bzw. des Textkörperabschnitts 1504. H0 bezeichnet eine Überlappung in der horizontalen Richtung des Textkörperabschnitts 1504 und der Überschrift 1502. In dem Beispiel ist H0 = H1502. Auf der Grundlage dieser Werte wird die Urteilsbildung über dieselbe Gruppe wie folgt ausgeführt. Wenn die nachstehende Beziehung
  • (Länge der Überlappung in der horizontalen Richtung zweier Bereiche)/(Höhe des Bereichs mit einer kleineren Höhe in den beiden Bereichen) > (Schwellenwert γ)
  • erfüllt ist, wird dies so verstanden, daß die beiden Bereiche zu derselben Gruppe gehören. Der Schwellenwert γ liegt innerhalb eines Bereichs von 0,0 bis 1,0 und ist hier auf γ = 0,8 festgelegt.
  • In dem in Fig. 19 gezeigten Beispiel wird, da
  • H0/H1502 > γ
  • ist, entschieden, daß der Textkörperabschnitt 1504 und die Überschrift 1502 zu derselben Gruppe gehören. Durch Ausführen von Unterscheidungen über dieselbe Gruppe in Bezug auf den Textkörperabschnitt 1504 und die Textkörperabschnitte 1505 bis 1507 auf vergleichbare Art und Weise wird bekannt, daß diese nicht zu derselben Gruppe gehören, so daß Schritt S1003 beendet wird.
  • In Schritt S1004 werden die Überschrift 1502 und der Textkörperabschnitt 1504, welche in Schritt S1003 so beurteilt wurden, daß die sie zu derselben Gruppe gehören, von rechts sequentiell angeordnet. Die Punkte in den Ecken oben rechts werden verglichen, und Nr. 2 wird der auf der am weitesten rechts befindlichen Seite plazierten Überschrift 1502 zugewiesen. Nr. 3 wird darauffolgend dem Textkörperabschnitt 1504 zugewiesen. Die zu vergleichenden Punkte sind nicht auf die Punkte in den rechten oberen Ecken beschränkt, sondern es können auch Schwerpunkte oder andere Punkte verwendet werden, so lange es möglich ist, zu beurteilen, welcher Bereich sich auf der rechten Seite befindet. Fig. 17 zeigt einen Zustand, in welchem in Schritt S1004 sequentiell in Übereinstimmung mit der Reihenfolge ausgehend von der rechten Seite Nr. 2 der Überschrift zugewiesen ist und Nr. 3 dem Textkörperabschnitt 1504 zugewiesen ist. Da die Textkörperabschnitte 1505 bis 1507 noch nicht in Reihenfolge gebracht sind, wird die Verarbeitungsroutine von Schritt S1005 zu Schritt S1003 zurückgeführt, und werden die Prozesse wiederholt.
  • In Schritt S1003 werden die Textkörperabschnitte 1505 bis 1507 in dieselbe Gruppe gestellt. In Schritt S1004 wird in Übereinstimmung mit der Reihenfolge ausgehend Von der rechten Seite Nr. 4 dem Textkörperabschnitt 1505 zugewiesen, Nr. 5 dem Textkörperabschnitt 1506 zugewiesen, und Nr. 6 dem Textkörperabschnitt 1507 zugewiesen.
  • Wenn alle Überschriften und Textkörperabschnitte in Reihenfolge gebracht sind, schreitet die Verarbeitungsroutine von Schritt S1005 zu dem nächsten Schritt S208 fort. Fig. 18 zeigt einen Zustand, in welchem Schritt S207 beendet ist und alle Überschriften und Textkörperabschnitte in Reihenfolge gebracht sind.
  • Nachstehend wird der Prozeß in Schritt S1001 im Einzelnen beschrieben. Fig. 11 ist ein Ablaufdiagramm, das den Prozeß in Schritt S1001 im Einzelnen zeigt.
  • In dem ersten Schritt S1101 wird einem Überschriftenbereich Aufmerksamkeit geschenkt und dessen Zentrum ermittelt. In dem Beispiel des zugeführten Originals 1401, wie in Fig. 15 gezeigt, gibt es zwei Überschriftenbereiche der Überschriften 1502 und 1503. Nun wird der ersten Überschrift 1503 Aufmerksamkeit geschenkt. Da der Bereich ein Rechteck ist, befindet sich das Zentrum an einer Position, an der die Breite und die Höhe in zwei Teile unterteilt werden. Ein solches Zentrum ist durch das Bezugszeichen 2001 in Fig. 20 dargestellt.
  • In Schritt S1102 werden Liniensegmente ausgehend von dem Zentrum 2001 in die Richtungen nach oben, nach unten, nach links und nach rechts erweitert bzw. erstreckt und wird geprüft, ob diese die Textkörperabschnitte schneiden oder nicht. In Fig. 20 ist das Liniensegment, welches ausgehend von dem Zentrum 2001 nach oben erstreckt ist, durch ein Liniensegment 2002 gezeigt. Ebenso ist das sich nach unten erstreckende Liniensegment durch das Bezugszeichen 2003 gezeigt, ist das sich nach links erstreckende Liniensegment durch das Bezugszeichen 2004 gezeigt, und ist das sich nach rechts erstreckende Liniensegment durch das Bezugszeichen 2005 dargestellt. Wie Fig. 20 offenkundig entnehmbar ist, schneidet das Liniensegment 2002 den Textkörperabschnitt 1504. Auf vergleichbare Art und Weise schneidet das Liniensegment 2003 den Textkörperabschnitt 1506, schneidet das Liniensegment 2005 den Textkörperabschnitt 1505, und schneidet das Liniensegment 2004 den Textkörperabschnitt 1507.
  • In Schritt S1103 schreitet, da die von dem Zentrum ausgehenden Liniensegmente in zumindest drei der Richtungen nach oben, nach unten, nach links und nach rechts die Textkörperabschnitte schneiden, die Verarbeitungsroutine zu Schritt S1104 fort. Falls die von dem Zentrum ausgehenden Liniensegmente in nur zwei oder weniger der Richtungen nach oben, nach unten, nach links und nach rechts die Textkörperabschnitte schneiden, schreitet die Verarbeitungsroutine zu Schritt S1105 fort.
  • In Schritt S1104 wird die Merk-Überschrift angeordnet. Da bislang noch keine der Überschriften angeordnet ist, wird Nr. 1 der Überschrift 1503 zugewiesen.
  • In Schritt S1105 wird geprüft, ob alle Überschriften beurteilt sind oder nicht. Wenn es irgendwelche anderen Überschriften gibt, wird die Verarbeitungsroutine zu Schritt S1101 zurückgeführt, und werden zu den vorstehend erwähnten vergleichbare Prozesse ausgeführt. Wenn alle Überschriften beurteilt sind, folgt Schritt S1002. In dem Beispiel des zugeführten Originals wird, da die Überschrift 1502 noch nicht unterschieden ist, die Verarbeitungsroutine zu Schritt S1101 zurückgeführt.
  • Auf im wesentlichen dieselbe Art und Weise wie in dem Fall der Überschrift 1503 wird das Zentrum ermittelt (Schritt S1101), werden die Liniensegmente ausgehend von dem Zentrum in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt, und wird geprüft, ob sie die Textkörperabschnitte schneiden oder nicht (Schritt S1102). Wie ebenfalls offenkundig der Fig. 15 entnehmbar ist, schneiden, da ausgehend von der Überschrift 1502 kein Textkörperabschnitt in der Richtung nach oben und nach rechts existiert, die von dem Zentrum der Überschrift 1502 ausgehenden Liniensegmente in den Richtungen nach oben und nach rechts die Textkörperabschnitte nicht. Daher schreitet die Verarbeitungsroutine von Schritt S1103 zu Schritt S1105 fort. Das heißt, die Überschrift 1502 wird nicht angeordnet. Da alle Überschriften bereits in Schritt S1105 beurteilt wurden, sind alle Prozesse in Schritt S1101 beendet, und folgt Schritt S1102. Fig. 16 zeigt das Ergebnis bis zu dieser Phase.
  • Wie vorstehend erwähnt wurde, werden in Schritt S207 alle Überschriften und Textkörperabschnitte angeordnet bzw. in Reihenfolge gebracht. Fig. 18 zeigt einen Zustand, in welchem die Prozesse bis Schritt S207 in dem Beispiel des zugeführten Originals 1401 beendet worden sind,
  • Schritt S208
  • Schließlich werden die Rechteckdaten verschiedener Arten von Bereichen, die wie vorstehend erhalten wurden, aus der Ausgabeeinheit 104 zusammen mit den Bilddaten ausgegeben.
  • Fig. 12 ist ein Ablaufdiagramm, das Prozesse derart zeigt, daß in dem Prozeß zum Anordnen der von dem Textkörperabschnitt umschlossenen Überschrift bei der Beurteilung in dem vorangehend beschriebenen Beispiel (Ablaufdiagramm in Fig. 11) dahingehend, ob sich das Rechteck auf die von dem Textkörperabschnitt umschlossene Überschrift bezieht oder nicht, ein willkürlicher Punkt in der Schlagzeile anstelle des Zentrums 2001 verwendet wird. Nachstehend wird eine Erklärung unter Bezugnahme auf das in Fig. 12 gezeigte Ablaufdiagramm gegeben.
  • In dem ersten Schritt S1201 wird einem Überschriftenbereich und einem willkürlichen Punkt in der Schlagzeile Aufmerksamkeit geschenkt. Es wird nun angenommen, daß ein willkürlicher Punkt auf die α% der Höhe und β% der Breite ausgehend von der linken oberen Ecke gesetzt ist. Der Wert von jedem α und β liegt innerhalb eines Bereichs von 0 bis 100%, und vorbestimmte Werte werden in dem RAM gehalten. In dem Beispiel des zugeführten Originals 1401, wie in Fig. 15 gezeigt, gibt es zwei Bereiche der Überschriften 1502 und 1503. Hier wird zunächst der Überschrift 1503 Aufmerksamkeit geschenkt. Ein willkürlicher Punkt in der Überschrift 1503 wird aufgegriffen und als Merkpunkt verwendet. Fig. 21 ist ein Diagramm zum Erklären eines Zustands, in welchem ein willkürlicher Punkt, der sich an der α% der Höhe und β% der Breite ausgehend von der linken oberen Ecke befindet, erhalten wird. In Fig. 21 bezeichnet H die Höhe der Überschrift 1503, bezeichnet Hα α % der Höhe ausgehend von der linken oberen Ecke, zeigt W die Breite der Überschrift 1503, und gibt Wβ β% der Breite ausgehend von der linken oberen Ecke an. Ein Merkpunkt 2101 wird wie vorstehend erwähnt erhalten. Es wird nun angenommen, daß α gleich 40% und β gleich 25% ist.
  • In Schritt S2102 werden Liniensegmente ausgehend von dem Merkpunkt 2101 nacheinander nach oben, nach unten, nach links und nach rechts erstreckt und wird geprüft, ob sie die Textkörperabschnitte jeweils schneiden oder nicht. In Fig. 22 ist das sich, ausgehend von dem Merkpunkt 2101 nach oben erstreckende Liniensegment durch ein Liniensegment 2201 gezeigt. Auf vergleichbare Art und Weise ist das sich nach unten erstreckende Liniensegment durch 2202 gezeigt, ist das sich nach links erstreckende Liniensegment durch 2203 gezeigt, und ist das sich nach rechts erstreckende Liniensegment durch 2204 gezeigt. Wie der Fig. 22 offenkundig entnehmbar ist, schneidet das Liniensegment 2201 den Textkörperabschnitt 1504. Ebenso schneidet das Liniensegment 2202 den Textkörperabschnitt 1506, schneidet das Liniensegment 2204 den Textkörperabschnitt 1505, und schneidet das Liniensegment 2203 den Textkörperabschnitt 1507.
  • In Schritt S1203 schreitet, da die sich von dem Merkpunkt 2101 ausgehend erstreckenden Liniensegmente in zumindest drei der Richtungen nach oben, nach unten, nach links und nach rechts schneiden, die Verarbeitungsroutine zu Schritt S1204 fort. Falls die sich von dem Merkpunkt 2101 ausgehend erstreckenden Liniensegmente in nur zwei der Richtungen nach oben, nach unten, nach links oder nach rechts den Textkörperabschnitt schneiden, folgt Schritt S1205.
  • In Schritt S1204 wird die Merk-Überschrift angeordnet. Da hier keine der Überschriften angeordnet ist, wird Nr. 1 der Überschrift 1503 zugewiesen.
  • Es wird nun eine Prüfung durchgeführt, um zu ermitteln, ob in Schritt S1205 alle Überschriften beurteilt wurden oder nicht. Falls es irgendwelche anderen Überschriften gibt, wird die Verarbeitungsroutine zu Schritt S1201 zurückgeführt, und werden Prozesse vergleichbar zu den vorstehend erwähnten ausgeführt. Nachdem alle Überschriften beurteilt wurden, folgt Schritt S1002. In dem Beispiel des zugeführten Originals 1401 wird, da die Überschrift 1502 noch nicht beurteilt ist, die Verarbeitungsroutine zu Schritt S1201 zurückgeführt.
  • Auf im wesentlichen dieselbe Art und Weise wie in dem Fall der Überschrift 1503 wird ein Merkpunkt erhalten (Schritt S1201), werden Liniensegmente ausgehend von dem Merkpunkt nach oben, nach unten, nach links und nach rechts erstreckt, und wird geprüft, ob sie die Textkörperabschnitte schneiden oder nicht (Schritt S1202). Wie der Fig. 15 ebenfalls offenkundig entnehmbar ist, schneiden, da ausgehend von der Überschrift 1502 kein Textkörperabschnitt in der Richtung nach oben und nach rechts existiert, die von dem Zentrum der Überschrift 1502 ausgehenden Liniensegmente in den Richtungen nach oben und nach rechts die Textkörperabschnitte nicht. Daher schreitet die Verarbeitungsroutine von Schritt S1203 zu Schritt S1205 fort. Das heißt, die Überschrift 1502 wird nicht angeordnet. In Schritt S1205 sind, da alle Überschriften bereits beurteilt wurden, alle Prozesse in Schritt S1001 beendet, und folgt Schritt S1002. Fig. 16 zeigt das Ergebnis bis zu dieser Phase.
  • Wie vorstehend erwähnt wurde, werden in Schritt S207 alle Überschriften und Textkörperabschnitte angeordnet bzw. in Reihenfolge gebracht. Fig. 18 zeigt einen Zustand, in welchem die Prozesse bis Schritt S207 in dem Beispiel von Fig. 14 beendet worden sind.
  • Die von Schritt S1101 verschiedenen Prozesse sind zu denjenigen des ersten Ausführungsbeispiels vergleichbar. Der Aufbau einer Bildverarbeitungsvorrichtung gemäß einem zweiten Ausführungsbeispiel ist ähnlich dem des in Fig. 1 gezeigten ersten Ausführungsbeispiels. Gemäß der vorstehenden Beschreibung werden ein Betriebsablauf und Wirkungen erhalten, die zu denjenigen des vorstehend erwähnten ersten Ausführungsbeispiels ähnlich sind.
  • Fig. 13 ist ein Ablaufdiagramm, das Prozesse zeigt, in welchen die Verarbeitungsinhalte in Schritten S1305 und S1306 zusätzlich zu dem Prozeß in Schritt S1001 in Fig. 10 zum Anordnen der von dem Textkörper umschlossenen Überschrift hinzugefügt sind und in welchen Überlappungsgrade mit den Textkörperabschnitten in den Richtungen nach oben, nach unten, nach links und nach rechts der Merk-Überschrift unterschieden werden und dann, wenn Textkörperabschnitte, in welchen der Überlappungsgrad gleich oder größer als ein Schwellenwert ist, in drei oder mehr Richtungen vorhanden sind, die Merk- Überschrift angeordnet wird.
  • Nachstehend wird eine Erklärung unter Bezugnahme auf ein in Fig. 13 gezeigtes Ablaufdiagramm gegeben.
  • In dem ersten Schritt S1301 wird einem Überschriftbereich Aufmerksamkeit geschenkt und sein Zentrum ermittelt. In dem Beispiel des zugeführten Originals 1401, wie in Fig. 15 gezeigt, gibt es zwei Überschriftbereiche der Überschriften 1502 und 1503. Zunächst wird der Überschrift 1503 Aufmerksamkeit geschenkt. Da der Bereich ein Rechteck ist, befindet sich das Zentrum an einer Position, an welcher die Breite und die Höhe in zwei gleiche Teile unterteilt sind. Ein solches Zentrum ist durch ein Bezugszeichen 2001 in Fig. 20 gezeigt.
  • In Schritt S1302 werden Liniensegmente ausgehend von dem Zentrum 2001 nach oben, nach unten, nach links und nach rechts erstreckt und wird geprüft, ob sie die Textkörperabschnitte schneiden oder nicht. In Fig. 20 ist das sich ausgehend von dem Zentrum 2001 nach oben erstreckende Liniensegment durch das Liniensegment 2002 gezeigt. Auf vergleichbare Art und Weise ist das sich nach unten erstreckende Liniensegment durch 2003 gezeigt, ist das sich nach links erstreckende Liniensegment durch 2004 gezeigt, und ist das sich nach rechts erstreckende Liniensegment durch 2005 gezeigt. Wie der Fig. 20 offenkundig entnehmbar ist, schneidet das Liniensegment 2002 den Textkörperabschnitt 1504. Ebenso schneidet das Liniensegment 2003 den Textkörperabschnitt 1506, schneidet das Liniensegment 2005 den Textkörperabschnitt 1505, und schneidet das Liniensegment 2004 den Textkörperabschnitt 1507.
  • In Schritt S1303 schreitet, da die sich ausgehend von dem Zentrum erstreckenden Liniensegmente die Textkörperabschnitte in drei oder mehr der Richtungen nach oben, nach unten, nach links oder nach rechts wie vorstehend erwähnt schneiden, die Verarbeitungsroutine zu Schritt S1304 fort. Falls die sich ausgehend von dem Zentrum erstreckenden Liniensegmente die Textkörperabschnitte in nur zwei oder weniger der Richtungen nach oben, nach unten, nach links und nach rechts schneiden, folgt Schritt S1307.
  • In Schritt S1304 werden in Bezug auf die sich in den Richtungen nach oben und nach unten der Überschrift befindenden Textkörperabschnitte Überlappungsgrade in der zu der Überschrift vertikalen Richtung untersucht. Ebenso werden in Bezug auf die sich in den Richtungen nach links und nach rechts befindenden Textkörperabschnitte Überlappungsgrade in der zu der Überschrift horizontalen Richtung jeweils beurteilt. Wenn der Überlappungsgrad mit dem sich in Aufwärtsrichtung der Überschrift 1503 befindenden Textkörperabschnitt 1504 beurteilt wird, wie in Fig. 23 gezeigt, wird eine Überlappung zwischen der Breite W1503 der Überschrift 1503 und der Breite W1504 des Textkörperabschnitts 1504 durch WO angegeben. In dem Beispiel ist WO = W1503. Auf der Grundlage dieser Werte werden die Überlappungsgrade wie folgt in Schritt S1305 beurteilt. Wenn die nachstehende Beziehung
  • (Länge der Überlappung in der vertikalen Richtung zwischen zwei Bereichen)/(Breite eines Bereichs einer kleineren Breite in den beiden Bereichen) > (Schwellenwert γ)
  • erfüllt ist, ist der Überlappungsgrad gleich oder größer als der Schwellenwert. Der Schwellenwert γ liegt innerhalb eines Bereichs von 0,0 bis 1,0 und ist hier auf γ = 0,8 festgelegt.
  • In dem in Fig. 23 gezeigten Beispiel ist, da
  • W0/W1503 > γ
  • ist, der Überlappungsgrad zwischen dem Textkörperabschnitt 1504 und der Überschrift 1503 gleich oder größer als der Schwellenwert.
  • Auf vergleichbare Art und Weise ist auch der Überlappungsgrad zwischen der Überschrift 1503 und dem sich unter der Überschrift 1503 befindenden Textkörperabschnitt 1506 ebenfalls gleich oder größer als der Schwellenwert. Auf eine zu dem Vorstehenden vergleichbare Art und Weise wird der Überlappungsgrad zwischen der Überschrift 1503 und dem sich links von der Überschrift 1503 befindenden Textkörperabschnitt 1507 beurteilt. Wie in Fig. 24 gezeigt, ist die Höhe der Überschrift 1503 durch H1503 gezeigt, ist die Höhe des Textkörperabschnitts 1507 durch H1507 gezeigt, und ist der Überlappungsgrad zwischen der Überschrift 1503 und dem Textkörperabschnitt 1507 durch H0 gezeigt. In diesem Beispiel ist H0 = H1503. In Schritt S1305 werden die Überlappungsgrade auf der Grundlage dieser Werte wie folgt beurteilt. Wenn die nachstehende Beziehung
  • (Länge der Überlappung in der horizontalen Richtung zwischen zwei Bereichen)/(Höhe des Bereichs einer kleineren Höhe in den beiden Bereichen) > Schwellenwert γ)
  • erfüllt ist, ist der Überlappungsgrad gleich oder größer als der Schwellenwert. Der Schwellenwert liegt jedoch innerhalb eines Bereichs von 0,0 bis 1,0 und ist hier auf 0,8 festgelegt.
  • In den in Fig. 24 gezeigten Beispiel ist, da
  • H0/H1503 > γ
  • ist, der Überlappungsgrad zwischen dem Textkörperabschnitt 1507 und der Überschrift 1503 gleich oder größer als der Schwellenwert. Auf vergleichbare Art und Weise ist der Überlappungsgrad zwischen der Überschrift 1503 und dem Textkörperabschnitt 1505, der sich auf der rechten Seite derselben befindet, ebenfalls gleich oder größer als der Schwellenwert.
  • Wie vorstehend erwähnt wurde, schreitet in dem Beispiel von Fig. 14, da die Textkörperabschnitte, in welchen der Überlappungsgrad gleich oder größer als der Schwellenwert ist, in drei oder mehr Richtungen existieren, die Verarbeitungsroutine zu Schritt S1306 fort.
  • In Schritt S1306 wird die Merk-Überschrift angeordnet. Da hier noch keine der Überschriften angeordnet ist, wird Nr. 1 der Überschrift 1503 zugewiesen. Es wird geprüft, ob alle Überschriften geprüft worden sind oder nicht. Wenn es irgendwelche weiteren Überschriften gibt, wird die Verarbeitungsroutine zu Schritt S1301 zurückgeführt, und werden Prozesse vergleichbar zu den vorstehend erwähnten ausgeführt. Nachdem alle Überschriften geprüft worden sind, folgt Schritt S1002.
  • In dem Beispiel des zugeführten Originals 1401 wird, da die Überschrift 1502 noch nicht geprüft ist, die Verarbeitungsroutine zu Schritt S1301 zurückgeführt. Auf im wesentlichen dieselbe Art und Weise wie in dem Fall der Überschrift 1503 wird das Zentrum ermittelt (Schritt S1301), werden Liniensegmente ausgehend von dem Zentrum nach oben, nach unten, nach links und nach rechts erstreckt, und wird jeweils geprüft, ob sie die Textkörperabschnitte schneiden oder nicht (Schritt S1302) . Wie der Fig. 15 ebenfalls offenkundig entnehmbar ist, schneiden, da kein Textkörperabschnitt in den Richtungen nach oben und rechts der Überschrift 1502 existiert, die sich ausgehend von dem Zentrum der Überschrift 1502 nach oben und nach rechts erstreckenden Liniensegmente die Textkörperabschnitte nicht. Daher schreitet die Verarbeitungsroutine von Schritt S1303 zu Schritt S1307 fort. Das heißt, die Überschrift 1502 wird nicht angeordnet.
  • In Schritt S1307 sind, da alle Überschriften geprüft wurden, alle Prozesse in Schritt S1001 beendet, und folgt Schritt S1002. Fig. 16 zeigt die Ergebnisse bis zu dieser Phase.
  • Wie vorstehend erwähnt wurde, werden in Schritt S207 alle Überschriften und Textkörperabschnitte angeordnet bzw. in Reihenfolge gebracht. Fig. 18 zeigt einen Zustand, nachdem die Prozesse bis Schritt S207 in dem Beispiel von Fig. 14 beendet wurden.
  • (Ausführungsbeispiel 2)
  • In diesem Ausführungsbeispiel wird nun eine Erklärung in Bezug auf ein Beispiel gegeben, in welchem radiale Liniensegmente ausgehend von dem Rechteck erstreckt werden, dessen Attribut als Tabelle bestimmt wurde, und ein Tabellenbereich aus der Anzahl von Schnittpunkten mit dem Tabellenrahmen identifiziert wird. Der Aufbau einer Vorrichtung gemäß dem zweiten Ausführungsbeispiel ist zu dem des ersten Ausführungsbeispiels ähnlich.
  • Fig. 2 ist ein Ablaufdiagramm, welches Bildprozesse in der Bildverarbeitungsvorrichtung gemäß dem zweiten Ausführungsbeispiel zeigt. Steuerprogramme zum Ausführen der Bildprozesse wurden in der Speichereinheit 103 gespeichert. In dem Ablaufdiagramm sind dieselben Verarbeitungsschritte wie diejenigen in dem Ausführungsbeispiel 1 mit denselben Bezugszeichen bezeichnet, so daß ihre Beschreibungen hier weggelassen werden.
  • Schritt S209
  • Ein Tabellenbereich wird durch einen Tabellenbereichidentifikator 112 identifiziert. Fig. 28 ist ein Ablaufdiagramm zum Erklären eines Prozesses zum Identifizieren eines Tabellenbereichs in Schritt S209 im Einzelnen.
  • Fig. 26 ist ein Diagramm zum Erklären des Schritts S209 in dem Fall einer Tabelle. Das Bezugszeichen 2601 bezeichnet einen Rechteckbereich; 2602 einen Tabellenrahmen; 2603 ein Zeichen oder dergleichen in der Tabelle; 2604 ein Zentrum (Merkpunkt) des Rechteckbereichs 2601; und 2605 bis 2608 Liniensegmente, die sich ausgehend von dem Merkpunkt 2604 jeweils nach oben, nach unten, nach links und nach rechts erstrecken.
  • Auf vergleichbare Art und Weise ist Fig. 27 ein Diagramm zum Erklären des Schritts S209 in dem Fall eines deformierten Trenners. Das Bezugszeichen 2701 bezeichnet einen Rechteckbereich; 2702 einen deformierten Trenner; 2703 ein Zeichen oder dergleichen in dem deformierten Trenner; 2704 ein Zentrum (Merkpunkt) des Rechteckbereichs 2701; und 2705 bis 2708 Liniensegmente, die sich ausgehend von dem Merkpunkt 2604 jeweils nach oben, nach unten, nach links und nach rechts erstrecken.
  • Nachstehend wird nun eine Erklärung in Bezug auf den Fall einer Tabelle unter Bezugnahme auf ein Ablaufdiagramm gemäß Fig. 28 und Fig. 26 gegeben.
  • In dem Ausführungsbeispiel wird angenommen, daß ein Zentrum an einem willkürlichen Merkpunkt in dem Rechteckbereich, der als eine Tabelle ermittelt wurde, festgelegt wird und insgesamt vier Liniensegmente einzeln in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellenidentifikationseinrichtung zum Identifizieren des Rechteckbereichs als Tabelle in dem Fall, in dem ein (oder mehrere) Merkpunkt(e) derart vorhanden ist (sind), daß zumindest eines der sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen dreimal oder öfter schneidet, oder zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in anderen Fällen als dem vorstehenden Fall verwendet.
  • Zunächst wird in Schritt S2801 das Zentrum des Rechteckbereichs ermittelt und als Merkpunkt festgelegt.
  • Die Position, an welcher sowohl die Breite als auch die Höhe in zwei gleiche Teile unterteilt wird, wird als das Zentrum festgelegt, und der Merkpunkt 2604 wird erhalten.
  • In Schritt S2802 werden Liniensegmente nacheinander ausgehend von dem Merkpunkt 2604 nach oben, nach unten, nach links und nach rechts erstreckt, und wird die Anzahl von Schnittpunkten mit dem Tabellenrahmen gezählt. In Fig. 26 ist das sich ausgehend von dem Merkpunkt 2604 nach oben erstreckende Liniensegment durch ein Liniensegment 2605 angegeben. Auf vergleichbare Art und Weise ist das sich nach unten erstreckende Liniensegment durch 2606 gezeigt, ist das sich nach links erstreckende Liniensegment durch 2607 gezeigt, und ist das sich nach rechts erstreckende Liniensegment durch 2608 gezeigt.
  • Die Anzahl von Schnittpunkten mit dem Tabellenrahmen ist gleich drei im Fall des Liniensegments 2605, drei im Fall des Liniensegments 2606, zwei im Fall des Liniensegments 2607, und eins im Fall des Liniensegments 2608.
  • In Schritt S2803 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht. Da die Liniensegmente 2605 und 2606 den Tabellenrahmen dreimal oder öfter schneiden, folgt Schritt S2804. Falls es kein Liniensegment gibt, welches den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S2805.
  • In Schritt S2804 wird der Rechteckbereich als ein Tabellenbereich identifiziert, und Schritt S210 folgt.
  • Nachstehend wird eine Erklärung in Bezug auf den Fall eines deformierten Trenners unter Bezugnahme auf ein Ablaufdiagramm gemäß Fig. 28 und Fig. 27 gegeben.
  • Zunächst wird in Schritt S2801 das Zentrum des Rechteckbereichs ermittelt und als Merkpunkt festgelegt. Die Position, an welcher sowohl die Breite als auch die Höhe in zwei gleiche Teile unterteilt wird, wird als das Zentrum festgelegt, und der Merkpunkt 2704 wird erhalten.
  • In Schritt S2802 werden Liniensegmente ausgehend Von dem Merkpunkt 2704 nach oben, nach unten, nach links und nach rechts erstreckt, und wird die Anzahl von Schnittpunkten mit dem Tabellenrahmen (deformierter Trenner) gezählt. In Fig. 27 ist das sich ausgehend von dem Merkpunkt 2704 nach oben erstreckende Liniensegment durch ein Liniensegment 2705 angegeben. Auf vergleichbare Art und Weise ist das sich nach unten erstreckende Liniensegment durch 2706 gezeigt, ist das sich nach links erstreckende Liniensegment durch 2707 gezeigt, und ist das sich nach rechts erstreckende Liniensegment durch 2708 gezeigt.
  • Die Anzahl von Schnittpunkten mit dem Tabellenrahmen ist gleich eins im Fall des Liniensegments 2705, eins im Fall des Liniensegments 2706, eins im Fall des Liniensegments 2707, und eins im Fall des Liniensegments 2708.
  • In Schritt S2803 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht. Da keines der Liniensegmente den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S2805.
  • In Schritt S2805 wird der Rechteckbereich als ein Bereich eines deformierten Trenners identifiziert, und Schritt S205 folgt .
  • Schritt S210
  • Schließlich werden die Rechteckdaten verschiedener Arten von Bereichen, die wie vorstehend erwähnt erhalten wurden, aus der Ausgabeeinheit 104 zusammen mit den Bilddaten ausgegeben.
  • Fig. 31 ist ein Ablaufdiagramm zum Erklären eines Beispiels, in welchem eine Vielzahl von Merkpunkten in dem Rechteckbereich in dem Prozeß zum Identifizieren des Tabellenbereichs in Schritt S209 festgelegt werden.
  • Fig. 29 ist ein Diagramm zum Erklären des Schritts S209 in dem Fall einer Tabelle. Das Bezugszeichen 2901 bezeichnet einen Rechteckbereich; 2902 einen Tabellenrahmen; 2903 ein Zeichen oder dergleichen in der Tabelle; 2904 bis 2906 willkürliche Merkpunkte in dem Rechteckbereich; und 2907 bis 2912 Liniensegmente, die sich ausgehend von den Merkpunkten 2904, 2905 und 2906 jeweils nach oben, nach unten, nach links und nach rechts erstrecken.
  • Auf vergleichbare Art und Weise ist Fig. 30 ein Diagramm zum Erklären des Schritts S209 in dem Fall eines deformierten Trenners. Das Bezugszeichen 3001 bezeichnet einen Rechteckbereich; 3002 einen deformierten Trenner; 3003 ein Zeichen oder dergleichen in dem deformierten Trenner; 3004 bis 3006 willkürliche Merkpunkte in dem Rechteckbereich; und 3007 bis 3012 Liniensegmente, die sich ausgehend von den Merkpunkten 3004, 3005 und 3006 jeweils nach oben, nach unten, nach links und nach rechts erstrecken.
  • Nachstehend wird eine Erklärung in Bezug auf den Fall einer Tabelle unter Bezugnahme auf Fig. 29 und das Ablaufdiagramm gemäß Fig. 31 gegeben.
  • In dem Ausführungsbeispiel werden drei willkürliche Merkpunkte des Rechteckbereichs, der als eine Tabelle beurteilt wurde, ermittelt und insgesamt 12 Liniensegmente erstreckt. Das heißt, es wird angenommen, daß für jeden Merkpunkt jeweils insgesamt vier Liniensegmente einzeln nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellen-Identifikationseinrichtung zum Identifizieren des Rechteckbereichs als eine Tabelle in dem Fall, in dem zwei oder mehr Merkpunkte derart, daß zumindest eines der sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen dreimal oder öfter schneidet, existieren, und zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in dem anderen als dem vorstehenden Fall verwendet.
  • In dem ersten Schritt S3101 werden drei Merkpunkte in dem Rechteckbereich festgelegt. Der Punkt, an welchem sowohl die Breite als auch die Höhe in 1/4 unterteilt werden, wird als Merkpunkt 2904 festgelegt. Der Punkt, an welchem ausgehend von dem Punkt an der linken oberen Ecke sowohl die Breite als auch die Höhe in 1/2 unterteilt werden, wird als Merkpunkt 2905 festgelegt. Der Punkt, an welchem sowohl die Breite als auch die Höhe in 3/4 unterteilt werden, wird als Merkpunkt 2906 festgelegt.
  • Die Anzahl (NTA) von identifizierten Tabellenbereich-Merkpunkten wird in dem nächsten Schritt S3102 aus NTA = 0 festgelegt.
  • In Schritt S3103 werden Liniensegmente ausgehend von dem Merkpunkt 2904 nach oben, nach unten, nach links und nach rechts erstreckt, und wird jeweils die Anzahl von Schnittpunkten mit dem Tabellenrahmen gezählt. In Fig. 29 sind die sich ausgehend von dem Merkpunkt 2904 nach oben und unten erstreckenden Liniensegmente durch das Liniensegment 2907 gezeigt. Die sich nach links und nach rechts erstreckenden Liniensegmente sind durch das Liniensegment 2910 gezeigt.
  • Die Anzahl von Schnittpunkten mit dem Tabellenrahmen ist gleich zwei in dem Fall des sich nach oben erstreckenden Liniensegments, vier in dem Fall des sich nach unten erstreckenden Liniensegments, zwei in dem Fall des sich nach links erstreckenden Liniensegments, und eins in dem Fall des sich nach rechts erstreckenden Liniensegments.
  • In Schritt S3104 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht. Da das sich nach unten erstreckende Liniensegment den Tabellenrahmen dreimal oder öfter schneidet, schreitet die Verarbeitungsroutine zu Schritt S3105 fort. Falls es kein Liniensegment gibt, welches den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S3106.
  • In Schritt S3105 wird "1" zu der Anzahl (NTA) identifizierter Tabellenrahmen-Merkpunkte addiert, und es folgt Schritt S3106.
  • (Die Anzahl identifizierter Tabellenrahmen-Merkpunkte) = 0 + 1 = 1
  • In Schritt S3106 wird geprüft, ob die Prozesse für alle Merkpunkte ausgeführt worden sind oder nicht. Da die Merkpunkte 2905 und 2906 verbleiben, wird die Verarbeitungsroutine zu Schritt S3101 zurückgeführt. Prozesse ähnlich denjenigen für den Merkpunkt 2904 werden auch für die Merkpunkte 2905 und 2906 ausgeführt. Wie der Fig. 29 offenkundig entnehmbar ist, ist dann, wenn die Prozesse für alle Merkpunkte beendet sind,
  • (die Anzahl identifizierter Tabellenrahmen-Merkpunkte) = 3.
  • Da die Prozesse bezüglich aller Merkpunkte beendet sind, folgt Schritt S3107.
  • In Schritt S3107 wird geprüft, ob (die Anzahl identifizierter Tabellenrahmen-Merkpunkte) gleich oder größer als 2 ist oder nicht. Da sie gleich oder größer als 2 ist, folgt Schritt 3108.
  • In Schritt 3108 wird der Rechteckbereich als Tabellenbereich identifiziert, und Schritt S205 folgt.
  • Nachstehend wird nun eine Erklärung in Bezug auf den Fall eines deformierten Trenners unter Bezugnahme auf Fig. 30 und das Ablaufdiagramm gemäß Fig. 31 gegeben.
  • In dem ersten Schritt S3101 werden drei Merkpunkte in dem Rechteckbereich festgelegt. Der Punkt, an welchem ausgehend von dem Punkt an der linken oberen Ecke sowohl die Breite als auch die Höhe in 1/4 unterteilt werden, wird als Merkpunkt 3004 festgelegt, der Punkt, an welchem sowohl die Breite als auch die Höhe in 1/2 unterteilt werden, wird als Merkpunkt 3005 festgelegt, und der Punkt, an welchem sowohl die Breite als auch die Höhe in 3/4 unterteilt werden, wird als Merkpunkt 3006 festgelegt.
  • In Schritt S3102 wird (die Anzahl identifizierter Tabellenbereich-Merkpunkte) auf 0 gesetzt.
  • In Schritt S3103 werden Liniensegmente ausgehend von dem Merkpunkt 3004 nach oben, nach unten, nach links und nach rechts erstreckt, und wird jeweils die Anzahl von Schnittpunkten mit dem Tabellenrahmen gezählt. In Fig. 31 sind die sich ausgehend von dem Merkpunkt 3004 nach oben und nach unten erstreckenden Liniensegmente durch das Liniensegment 3007 gezeigt. Die sich nach links und nach rechts erstreckenden Liniensegmente sind durch das Liniensegment 3010 gezeigt.
  • Die Anzahl von Schnittpunkten mit dem Tabellenrahmen ist jeweils gleich eins in dem Fall des sich nach oben erstreckenden Liniensegments, eins in dem Fall des sich nach unten erstreckenden Liniensegments, eins in dem Fall des sich nach links erstreckenden Liniensegments, und eins in dem Fall des sich nach rechts erstreckenden Liniensegments.
  • In Schritt S3104 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht. Da keines der sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S3106.
  • In Schritt S3106 wird geprüft, ob die Prozesse für alle Merkpunkte ausgeführt worden sind oder nicht. Da die Merkpunkte 3005 und 3006 verbleiben, wird die Verarbeitungsroutine zu Schritt S3103 zurückgeführt. Prozesse ähnlich denjenigen für den Merkpunkt 3004 werden auch für die Merkpunkte 3005 und 3006 ausgeführt. Wie der Fig. 30 offenkundig entnehmbar ist, ist dann, wenn die Prozesse für alle Merkpunkte beendet sind,
  • (die Anzahl identifizierter Tabellenrahmen-Merkpunkte) = 0.
  • Da die Prozesse über alle Merkpunkte beendet sind, folgt Schritt S3107.
  • In Schritt S3107 wird geprüft, ob (die Anzahl identifizierter Tabellenrahmen-Merkpunkte) gleich oder größer als 2 ist oder nicht. Da sie kleiner als 2 ist, folgt Schritt 3109.
  • In Schritt 3109 wird der Rechteckbereich als Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Fig. 34 ist ein Ablaufdiagramm zum Erklären eines Beispiels im Einzelnen, in welchem eine Vielzahl von sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten in dem Tabellenbereich-Identifikationsprozeß in Schritt S209 festgelegt werden.
  • Fig. 32 ist ein Diagramm zum Erklären des Schritts S209 in dem Fall der Tabelle. Das Bezugszeichen 3201 bezeichnet einen Rechteckbereich; 3202 einen Tabellenrahmen; 3203 ein Zeichen oder dergleichen in der Tabelle; 3204 ein Zentrum (Merkpunkt) in dem Rechteckbereich; 3205 bis 3207 Liniensegmente, die sich ausgehend von dem Merkpunkt 3204 nach oben erstrecken; 3208 bis 3210 Liniensegmente, die sich ausgehend von dem Merkpunkt 3204 nach unten erstrecken; 3211 bis 3213 Liniensegmente, die sich ausgehend von dem Merkpunkt 3204 nach links erstrecken; und 3214 bis 3216 Liniensegmente, die sich ausgehend von dem Merkpunkt 3204 nach rechts erstrecken.
  • Auf vergleichbare Art und Weise ist Fig. 33 ein Diagramm zum Erklären des Schritts S209 in dem Fall eines deformierten Trenners. Das Bezugszeichen 3301 bezeichnet einen Rechteckbereich; 3302 einen deformierten Trenner; 3303 ein Zeichen oder dergleichen in dem deformierten Trenner; 3304 ein Zentrum (Merkpunkt) in dem Rechteckbereich; 3305 bis 3307 Liniensegmente, die sich ausgehend von dem Merkpunkt 3304 nach oben erstrecken; 3308 bis 3310 Liniensegmente, die sich ausgehend von dem Merkpunkt 3304 nach unten erstrecken; 3311 bis 3313 Liniersegmente, die sich ausgehend von dem Merkpunkt 3304 nach links erstrecken; und 3314 bis 3316 Liniensegmente, die sich ausgehend von dem Merkpunkt 3304 nach rechts erstrecken.
  • Nachstehend wird nun eine Erklärung in Bezug auf den Fall einer Tabelle unter Bezugnahme auf Fig. 32 und das Ablaufdiagramm gemäß Fig. 23 gegeben.
  • In dem Ausführungsbeispiel wird angenommen, daß ein Zentrum auf einen willkürlichen Merkpunkt des Rechteckbereichs, der als eine Tabelle beurteilt wurde, festgelegt wird und insgesamt 12 Liniensegmente erstreckt werden, das heißt, drei Liniensegmente jeweils in jeder der Richtungen nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellen-Identifikationseinrichtung zum Identifizieren des Rechteckbereichs als eine Tabelle in dem Fall, in dem ein (oder mehr) Merkpunkte derart, daß unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmente die Liniensegmente den Tabellenrahmen dreimal oder öfter schneiden, existieren, und zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in dem anderen als dem vorstehenden Fall verwendet.
  • In dem ersten Schritt S3401 wird das Zentrum des Rechteckbereichs ermittelt und auf einen Merkpunkt festgelegt.
  • Die Position, an welcher sowohl die Breite als auch die Höhe in 1/2 unterteilt werden, entspricht dem Zentrum, und der Merkpunkt 3204 wird erhalten.
  • In dem nächsten Schritt S3402 werden insgesamt 12 Liniensegmente erstreckt, das heißt, es werden ausgehend von dem Merkpunkt 3204 jeweils drei Liniensegmente in jeder der Richtungen nach oben, nach unten, nach links und nach rechts erstreckt. Die Anzahl von Schnittpunkten mit dem Tabellenrahmen wird jeweils gezählt. Wie der Fig. 32 offenkundig entnehmbar ist, ist die Anzahl von Schnittpunkten mit dem Tabellenrahmen jeweils gleich drei in dem Fall jedes der Liniensegmente 3205, 3206 und 3207, drei in dem Fall jedes der Liniensegmente 3208, 3209 und 3210, zwei in dem Fall jedes der Liniensegmente 3211, 3212 und 3213, zwei in dem Fall des Liniensegments 3214, und eins in dem Fall jedes der Liniensegmente 3215 und 3216.
  • In Schritt S3403 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht.
  • Da die Liniensegmente 3205, 3206, 3207, 3208, 3209 und 3210 den Tabellenrahmen jeweils dreimal oder öfter schneiden, schreitet die Verarbeitungsroutine zu Schritt S3404 fort. Wenn es kein Liniensegment gibt, welches den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S3405.
  • In Schritt S3404 wird der Rechteckbereich als ein Tabellenbereich identifiziert, und Schritt S210 folgt.
  • Nachstehend wird nun eine Erklärung in Bezug auf den Fall eines deformierten Trenners unter Bezugnahme auf Fig. 33 und das Ablaufdiagramm gemäß Fig. 34 gegeben.
  • In dem ersten Schritt S3401 wird das Zentrum des Rechteckbereichs ermittelt und auf den Merkpunkt festgelegt.
  • Die Position, an welcher sowohl die Breite als auch die Höhe in 1/2 unterteilt werden, entspricht dem Zentrum, und der Merkpunkt 3304 wird erhalten.
  • In dem nächsten Schritt S3402 werden insgesamt 12 Liniensegmente erstreckt, das heißt, es werden ausgehend von dem Merkpunkt 3304 jeweils drei Liniensegmente in jeder der Richtungen nach oben, nach unten, nach links und nach rechts erstreckt. Die Anzahl von Schnittpunkten mit dem Tabellenrahmen wird jeweils gezählt. Wie der Fig. 33 offenkundig entnehmbar ist, ist die Anzahl von Schnittpunkten mit dem Tabellenrahmen gleich eins in dem Fall jedes der Liniensegmente 3305, 3306 und 3307, eins in dem Fall jedes der Liniensegmente 3308, 3309 und 3310, eins in dem Fall jedes der Liniensegmente 3311, 3312 und 3313, und eins in dem Fall jedes der Liniensegmente 3314, 3315 und 3316.
  • In Schritt S3403 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht. Da es kein Liniensegment gibt, welches den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S3405.
  • In Schritt S3405 wird der Rechteckbereich als ein Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Fig. 36 ist ein Ablaufdiagramm zum Erklären des Tabellenbereich-Identifikationsprozesses in Schritt S209 im Einzelnen und zeigt ein Beispiel, in welchem ein Merkpunkt außerhalb des Tabellenrahmens in dem Bereichrechteck erhalten wird (Schritt S1701).
  • Fig. 35 ist ein Diagramm zum Erklären des Schritts S209 in dem Fall einer Tabelle. Das Bezugszeichen 3501 bezeichnet einen Rechteckbereich; 3502 ein Zentrum des Rechteckbereichs 3501; 3503 acht Punkte in der Nähe des Zentrums 3502; 3504 einen linken oberen Punkt unter den acht Punkten in der Nähe des Zentrums 3502; 3505 einen Punkt genau über dem Zentrum 3502 unter den acht Punkten in der Nähe des Zentrums 3502 (der Punkt 3505 entspricht dem Merkpunkt); und 3506 bis 3509 Liniensegmente, die sich ausgehend von dem Merkpunkt 3505 jeweils nach oben, nach unten, nach links und nach rechts erstrecken. Ein schwarzer Kreis bezeichnet den Pixel, der zu dem Tabellenrahmen gehört. Ein weißer Kreis bezeichnet einen nicht zu dem Tabellenrahmen gehörenden Pixel.
  • Die ein Zeichen oder dergleichen in der Tabelle bildenden schwarzen Pixel sind hier weggelassen.
  • Nachstehend wird nun eine Erklärung in Bezug auf den Fall einer Tabelle unter Bezugnahme auf Fig. 35 und das Ablaufdiagramm gemäß Fig. 36 gegeben.
  • In dem Ausführungsbeispiel wird nun angenommen, daß ein willkürlicher Merkpunkt, der nicht zu dem Tabellenrahmen in dem Rechteckbereich gehört, welcher als Tabelle beurteilt wurde, ermittelt wird, und insgesamt vier Liniensegmente einzeln in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellen-Identifikationseinrichtung zum Identifizieren des Rechteckbereichs als eine Tabelle in dem Fall, in dem einer oder mehrere Merkpunkte derart, daß zumindest eines der sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen dreimal oder öfter schneidet, existieren, und zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in dem anderen als dem vorstehenden Fall verwendet.
  • In dem ersten Schritt S3601 wird ein Merkpunkt außerhalb des Tabellenrahmens in dem Rechteckbereich ermittelt.
  • Zunächst wird das Zentrum als Merkpunkt ermittelt und geprüft, ob das Zentrum zu dem Tabellenrahmen gehört oder nicht. Falls NEIN, wird das Zentrum als der Merkpunkt festgelegt. Wenn das Zentrum zu dem Tabellenrahmen gehört, werden ausgehend von dem linken oberen Punkt acht Punkte in der Nähe des Zentrums sequentiell im Uhrzeigersinn geprüft. Der Punkt, der nicht zu dem Tabellenrahmen gehört, wird als der Merkpunkt festgelegt. Wenn ein solcher Punkt aus diesen acht Punkten nicht herausgefunden wird, werden nachfolgend die außerhalb dieser acht Punkte existierenden Punkte geprüft.
  • Zunächst wird das Zentrum ermittelt.
  • Die Position, an welcher sowohl die Breite als auch die Höhe in 1/2 unterteilt werden, entspricht dem Zentrum, so daß das Zentrum 3502 erhalten wird.
  • Nun wird geprüft, ob das Zentrum zu dem Tabellenrahmen gehört oder nicht. Wie der Fig. 35 offenkundig entnehmbar ist, gehört das Zentrum 3502 zu dem Tabellenrahmen. Da es zu dem Tabellenrahmen gehört, werden acht Punkte in der Nähe des Zentrums untersucht. Zunächst wird geprüft, ob der ausgehend von dem Zentrum 3502 linke obere Punkt 3504 zu dem Tabellenrahmen gehört oder nicht. Der nahe liegende Punkt 3504 gehört zu dem Tabellenrahmen, wie der Fig. 35 offenkundig entnehmbar ist. Darauffolgend wird der nächste der acht nahe liegenden Punkte im Uhrzeigersinn geprüft. Das heißt, der nächste zu untersuchende Punkt ist der nahe liegende Punkt 3505.
  • Wie der Fig. 35 offenkundig entnehmbar ist, wird, da der nahe liegende Punkt 3505 nicht zu dem Tabellenrahmen gehört, der nahe liegende Punkt 3505 als der Merkpunkt festgelegt, und folgt Schritt S2802.
  • In Schritt S2582 werden ausgehend von dem Merkpunkt 3505 Liniensegmente nach oben, nach unten, nach links und nach rechts erstreckt, und wird jeweils die Anzahl von Schnittpunkten mit dem Tabellenrahmen gezählt. In Fig. 35 ist das sich ausgehend von dem Merkpunkt 3505 nach oben erstreckende Liniensegment durch das Liniensegment 3506 gezeigt. Auf vergleichbare Art und Weise ist das sich nach unten erstreckende Liniensegment durch 3507 gezeigt. Das sich nach links erstreckende Liniensegment ist durch 3508 gezeigt. Das sich nach rechts erstreckende Liniensegment ist durch 3509 gezeigt.
  • Die Anzahl von Schnittpunkten mit dem Tabellenrahmen ist gleich 2 in dem Fall des Liniensegments 3506, drei in dem Fall des Liniensegments 3507, zwei in dem Fall des Liniensegments 3508, und eins in dem Fall des Liniensegments 3509.
  • In Schritt S2803 wird geprüft, ob es unter den sich nach oben, nach unten, nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen dreimal oder öfter schneiden, gibt oder nicht. Da das Liniensegment 3507 den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S2805. Falls es kein Liniensegment gibt, welches den Tabellenrahmen dreimal oder öfter schneidet, folgt Schritt S2806.
  • In Schritt S2805 wird der Rechteckbereich als ein Tabellenbereich identifiziert, und Schritt S210 folgt.
  • In Schritt S2806 wird der Rechteckbereich als ein Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Wenn in Schritt S210 ein Bild zugeführt wird, wird geprüft, ob es sich um ein Mehrfachwertbild handelt oder nicht. In dem Fall des Mehrfachwertbilds wird dieses in ein binäres Bild umgewandelt, so daß der Bereichaufteilungsprozeß auch in dem Fall ausgeführt werden kann, in dem das zugeführte Bild bzw. Eingangsbild ein Mehrfachwertbild, wie beispielsweise ein Farbbild oder dergleichen, ist.
  • Wenn das Bild in Schritt S201 zugeführt wird, ist es ebenfalls möglich, eine Anordnung derart zu treffen, daß dann, wenn die Anzahl von Pixeln des zugeführten Bilds so groß ist, daß eine ziemlich lange Verarbeitungszeit benötigt wird, die Verarbeitungsgeschwindigkeit durch Ausführen eines Bildausdünnungsprozesses zum Ausdünnen des Bilds von m Punkten (in der vertikalen Richtung) · n Punkten (in der horizontalen Richtung) in einen Pixel erhöht werden kann.
  • Bei der Erfassung des Trenners oder dergleichen in Schritt S203 ist es ebenfalls möglich, die weitere Klassifizierung der Bereichattribute durch Unterscheiden der Rechteckmarkierung auf der Grundlage eines Unterschieds zwischen der vertikalen/horizontalen Richtung des Trenners, eines Unterschieds zwischen den Schwellenwerten dann, wenn die Figur, die Tabelle oder dergleichen erhalten wird, oder dergleichen auszuführen.
  • Wenn der Tabellenbereich in Schritt S209 identifiziert wird, kann der Tabellenbereich-Identifikationsprozeß ohne Ausführen eines Prozesses derart, daß die Anzahl von Liniensegmenten, welche in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt sind, gleichmäßig in den Richtungen nach oben, nach unten, nach links und nach rechts verteilt sind, durchgeführt werden.
  • Demgegenüber kann bei der Tabellenbereichidentifikation in Schritt S209 in dem Fall, in dem es eine Vielzahl von Merkpunkten gibt, der Tabellenbereich-Identifikationsprozeß ahne Ausführen eines Prozesses derart, daß die Anzahl von Liniensegmenten, welche nach oben, nach unten, nach links und nach rechts erstreckt sind, für jeden Merkpunkt gleichmäßig verteilt sind, durchgeführt werden.
  • (Ausführungsbeispiel 3)
  • In diesem Ausführungsbeispiel wird nun eine Erklärung in Bezug auf ein Beispiel gegeben, in welchem radiale Liniensegmente ausgehend von dem Rechteckbereich erstreckt werden, der als Tabelle beurteilt wurde, und der Tabellenbereich auf der Grundlage der Anzahl von Schnittpunkten mit dem Tabellenrahmen und der Richtung identifiziert wird. Der Aufbau einer Vorrichtung gemäß dem dritten Ausführungsbeispiel ist zu dem des Ausführungsbeispiels 1 ähnlich.
  • Ein Ablaufdiagramm, das Bildprozesse in der Bildverarbeitungsvorrichtung gemäß dem Ausführungsbeispiel zeigt, ist zu dem in dem Ausführungsbeispiel 2 beschriebenen Ablaufdiagramm gemäß Fig. 25 ähnlich.
  • Schritt S209
  • Nachfolgend wird ein Tabellenbereich identifiziert. Fig. 37 ist ein Ablaufdiagramm zum Erklären des Tabellenbereich- Identifikationsprozesses in Schritt S209 im Einzelnen. In Fig. 37 sind Verarbeitungsschritte, die zu denjenigen in Fig. 28 ähnlich sind, mit denselben Bezugszeichen bezeichnet, so daß ihre Beschreibungen hier weggelassen werden.
  • In dem Ausführungsbeispiel wird nun angenommen, daß ein Zentrum an einem willkürlichen Merkpunkt in dem Rechteckbereich, der als eine Tabelle beurteilt wurde, gesetzt wird und insgesamt vier Liniensegmente einzeln nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellen-Identifikationseinrichtung zum Identifizieren des Rechteckbereichs als Tabelle in dem Fall, in dem ein (oder mehrere) Merkpunkt(e) derart vorhanden ist (sind), daß zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet und zumindest eines der sich nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet, und zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in anderen als solch einem Fall verwendet.
  • In Schritt S3703 wird geprüft, ob zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da beide der Liniensegmente 2605 und 2606 den Tabellenrahmen zweimal oder öfter schneiden, folgt Schritt S3704, Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3706.
  • In Schritt S3704 wird geprüft, ob zumindest eines der sich nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da das Liniensegment 2605 den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3705. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3706.
  • In Schritt S3706 wird der Rechteckbereich als ein Tabellenbereich identifiziert, und Schritt S210 folgt.
  • Nachstehend wird eine Erklärung in Bezug auf den Fall eines deformierten Trenners gegeben.
  • In Schritt S3703 wird geprüft, ob zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da keines der Liniensegmente 2705 und 2706 den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3706.
  • In Schritt S3706 wird der Rechteckbereich als ein Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Schritt S210
  • Schließlich werden die Rechteckdaten verschiedener Arten von Bereichen, die wie vorstehend erwähnt erhalten wurden, aus der Ausgabeeinheit 104 zusammen mit den Bilddaten ausgegeben.
  • Fig. 38 ist ein Ablaufdiagramm zum Erklären eines Beispiels im Einzelnen, in welchem eine Vielzahl von Merkpunkten in dem Rechteckbereich in dem Tabellenbereich-Identifikationsprozeß in Schritt S209 erhalten werden.
  • In dem Prozeß in Fig. 38 sind Verarbeitungsschritte, die zu denjenigen in dem Ablaufdiagramm gemäß Fig. 31 in dem Ausführungsbeispiel 2 ähnlich sind, mit denselben Bezugszeichen bezeichnet, so daß ihre Beschreibungen hier weggelassen werden.
  • Nachstehend wird eine Erklärung in Bezug auf den Fall einer Tabelle unter Bezugnahme auf Fig. 29 und das Ablaufdiagramm gemäß Fig. 38 gegeben.
  • In diesem Prozeß wird nun angenommen, daß drei willkürliche Merkpunkte in dem Rechteckbereich, der als eine Tabelle beurteilt wurde, ermittelt werden und insgesamt 12 Liniensegmente erstreckt werden, das heißt, für jeden Merkpunkt jeweils insgesamt vier Liniensegmente einzeln nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellen-Identifikationseinrichtung zum Identifizieren des Rechteckbereichs als eine Tabelle in dem Fall, in dem zwei oder mehr Merkpunkte derart, daß zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet und zumindest eines der sich nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet, existieren, und zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in dem anderen als dem vorstehenden Fall verwendet.
  • In Schritt S3804 wird geprüft, ob zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da beide der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneiden, folgt Schritt S1205. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3807.
  • In Schritt S3805 wird geprüft, ob zumindest eines der sich nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da das sich nach links erstreckende Liniensegment den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3806. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3807.
  • In Schritt S3806 wird "1" zu der Anzahl identifizierter Tabellenbereich-Merkpunkte addiert.
  • (Die Anzahl identifizierter Tabellenbereich-Merkpunkte) = 0 + 1 = 1
  • In Schritt S3807 wird geprüft, ob die Prozesse für alle Merkpunkte durchgeführt worden sind oder nicht. Da die Merkpunkte 2905 und 2906 noch verbleiben, wird die Verarbeitungsroutine zu Schritt S3805 zurückgeführt. Prozesse ähnlich denjenigen für den Merkpunkt 2905 werden auch für die Merkpunkte 2905 und 2906 ausgeführt. Wie der Fig. 29 offenkundig entnehmbar ist, ist dann, wenn die Prozesse für alle Merkpunkte beendet sind,
  • (die Anzahl identifizierter Tabellenbereich-Merkpunkte) = 3.
  • Da die Prozesse bezüglich aller Merkpunkte beendet worden sind, folgt Schritt S3808.
  • In Schritt S3808 wird geprüft, ob (die Anzahl identifizierter Tabellenbereich-Merkpunkte) gleich oder größer als 2 ist oder nicht. Da sie gleich oder größer als 2 ist, folgt Schritt 3809.
  • In Schritt 3809 wird der Rechteckbereich als Tabellenbereich identifiziert, und Schritt S210 folgt.
  • Nachstehend wird nun eine Erklärung in Bezug auf den Fall eines deformierten Trenners gegeben.
  • In Schritt S3804 wird geprüft, ob zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da beide der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen nicht zweimal oder öfter schneiden, folgt Schritt S3807.
  • In Schritt S3807 wird geprüft, ob die Prozesse für alle Merkpunkte ausgeführt worden sind oder nicht. Da die Merkpunkte 3005 und 3006 noch verbleiben, wird die Verarbeitungsroutine zu Schritt S3803 zurückgeführt. Prozesse ähnlich denjenigen für den Merkpunkt 3004 werden auch für die Merkpunkte 3005 und 3006 ausgeführt. Wie der Fig. 30 offenkundig entnehmbar ist, ist dann, wenn die Prozesse für alle Merkpunkte beendet sind,
  • (die Anzahl identifizierter Tabellenbereich-Merkpunkte) = 0.
  • Da die Prozesse bezüglich aller Merkpunkte beendet worden sind, folgt Schritt S3808.
  • In Schritt S3808 wird geprüft, ob (die Anzahl identifizierter Tabellenbereich-Merkpunkte) gleich oder größer als 2 ist. Da sie nicht gleich oder größer als 2 ist, folgt Schritt 3810.
  • In Schritt 3810 wird der Rechteckbereich als Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Fig. 39 ist ein Ablaufdiagramm zum Erklären eines Beispiels im Einzelnen, in welchem in dem Tabellenbereich-Identifikationsprozeß in Schritt S209 eine Vielzahl von Liniensegmenten in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt werden.
  • In dem Prozeß in Fig. 39 sind Verarbeitungsschritte ähnlich denjenigen in dem Ablaufdiagramm von Fig. 34 in dem Ausführungsbeispiel 2 mit denselben Bezugszeichen bezeichnet, so daß ihre Beschreibungen hier weggelassen werden.
  • In Schritt S3903 wird geprüft, ob es unter den sich nach oben und nach unten erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen zweimal oder öfter schneiden, gibt oder nicht. Da alle Liniensegmente den Tabellenrahmen zweimal oder öfter schneiden, folgt Schritt S3904. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3906.
  • In Schritt S3904 wird geprüft, ob es unter den sich nach links und nach rechts erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen zweimal oder öfter schneiden, gibt oder nicht. Da die Liniensegmente 3211, 3212, 3213 und 3214 jeweils den Tabellenrahmen zweimal oder öfter schneiden, folgt Schritt S3905. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3906.
  • In Schritt S3905 wird der Rechteckbereich als ein Tabellenbereich identifiziert, und Schritt S210 folgt.
  • Nachstehend wird eine Erklärung in Bezug auf den Fall eines deformierten Trenners gegeben.
  • In Schritt S3905 wird geprüft, ob es unter den sich nach oben und nach unten erstreckenden Liniensegmenten Liniensegmente, die den Tabellenrahmen zweimal oder öfter schneiden, gibt oder nicht. Da es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S3906.
  • In Schritt S3906 wird der Rechteckbereich als ein Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Fig. 40 ist ein Ablaufdiagramm zum Erklären des Tabellenbereich-Identifikationsprozesses in Schritt S209 im Einzelnen und zeigt ein Beispiel, in welchem ein Merkpunkt außerhalb des Tabellenrahmens in dem Bereichrechteck erhalten wird (Schritt S3601).
  • In dem Prozeß gemäß Fig. 40 sind Verarbeitungsschritte ähnlich zu denjenigen, die in dem Ablaufdiagramm von Fig. 28 des Ausführungsbeispiels 2 gezeigt sind, mit denselben Bezugszeichen bezeichnet, so daß ihre Beschreibungen hier weggelassen werden.
  • In dem Ausführungsbeispiel wird angenommen, daß ein willkürlicher Merkpunkt, der nicht zu dem Tabellenrahmen in dem Rechteckbereich gehört, welcher als Tabelle beurteilt wurde, ermittelt wird, und insgesamt vier Liniensegmente einzeln jeweils nach oben, nach unten, nach links und nach rechts erstreckt werden. Es wird eine Tabellenidentifikationseinrichtung zum Identifizieren des Rechteckbereichs als eine Tabelle in dem Fall, in dem ein oder mehrere Merkpunkte derart, daß zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet und zumindest eines der sich nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet, existieren, und zum Identifizieren des Rechteckbereichs als einen deformierten Trenner in dem anderen als solch einem Fall verwendet.
  • In Schritt S4003 wird geprüft, ob zumindest eines der sich nach oben und nach unten erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da beide der Liniensegmente 3506 und 3507 den Tabellenrahmen zweimal oder öfter schneiden, folgt Schritt S4004. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S4006.
  • In Sehritt S4004 wird geprüft, ob zumindest eines der sich nach links und nach rechts erstreckenden Liniensegmente den Tabellenrahmen zweimal oder öfter schneidet. Da das Liniensegment 3507 den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S4005. Falls es kein Liniensegment gibt, welches den Tabellenrahmen zweimal oder öfter schneidet, folgt Schritt S4006.
  • In Schritt S4005 wird der Rechteckbereich als ein Tabellenbereich identifiziert, und Schritt S210 folgt.
  • In Schritt S906 wird der Rechteckbereich als ein Bereich eines deformierten Trenners identifiziert, und Schritt S210 folgt.
  • Wenn in Schritt S201 das Bild zugeführt wird, wird geprüft, ob es sich um ein Mehrfachwertbild handelt oder nicht. Durch Umwandeln des Mehrfachwertbilds in das binäre Bild kann der Bereichaufteilungsprozeß auch in dem Fall ausgeführt werden, in dem das zugeführte Bild ein Mehrfachwertbild, wie beispielsweise ein Farbbild oder dergleichen, ist.
  • Bei der Zufuhr des Bilds in Schritt S201 kann dann, wenn die Anzahl von Pixeln des zugeführten Bilds so groß ist, daß eine lange Verarbeitungszeit benötigt wird, die Verarbeitungsgeschwindigkeit durch Ausführen des Bildausdünnungsprozesses zum Ausdünnen des Bilds von m Punkten (in der vertikalen Richtung) · n Punkten (in der horizontalen Richtung) in einen Pixel erhöht werden.
  • Bei der Erfassung des Trenners oder dergleichen in Schritt S203 können die Bereichattribute durch Unterscheiden der Rechteckmarkierung anhand eines Unterschieds zwischen der vertikalen und der horizontalen Richtung des Trenners, eines Unterschieds zwischen den Schwellenwerten einer Figur, Tabelle oder dergleichen, weiter in Einzelheiten klassifiziert werden, wenn sie ermittelt sind, oder dergleichen.
  • Wenn der Tabellenbereich in Schritt S209 identifiziert wird, kann der Tabellenbereich-Identifikationsprozeß auch ohne Verwendung eines Verfahrens, durch welches die Anzahl von Liniensegmenten, welche in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt sind, gleichmäßig in den Richtungen nach oben, nach unten, nach links und nach rechts verteilt sind, durchgeführt werden.
  • Bei der Identifikation des Tabellenbereichs in Schritt S209 kann in dem Fall, in dem es eine Vielzahl von Merkpunkten gibt, der Tabellenbereich-Identifikationsprozeß ohne Verwendung eines Verfahrens derart, daß die Anzahl von Liniensegmenten, welche in die Richtungen nach oben, nach unten, nach links und nach rechts erstreckt sind, für jeden Merkpunkt gleichmäßig verteilt sind, durchgeführt werden.
  • Bei der abschließenden Ausgabe in Schritt S210 können auch nur die Bilddaten des notwendigen Bereichs unter Bezugnahme auf die Rechteckdaten verschiedener Arten von Bereichen ausgegeben werden. Der Speicherbereich kann weiter reduziert werden, und die Verarbeitungszeit kann weiter reduziert werden.
  • (Ausführungsbeispiel 4)
  • Nachstehend wird nun ein Ausführungsbeispiel eines Prozesses zum Beurteilen der Satzrichtung eines Dokuments aus den Bilddaten des zugeführten Dokuments und zum Melden an den Bediener beschrieben. Fig. 41 ist ein Blockdiagramm, welches den Aufbau einer Bildverarbeitungsvorrichtung gemäß dem Ausführungsbeispiel zeigt. In Fig. 41 bezeichnet das Bezugszeichen 4101 eine Abtasteinrichtung bzw. einen Scanner zum Aufstrahlen des Lichts auf das Bildoriginal, zum Lesen des reflektierten Lichts, und zum Umwandeln desselben in ein elektrisches Signal; 4102 eine Scanner-Schnittstellenschaltung zum Umwandeln des durch den Scanner 4101 erhaltenen elektrischen Signals in ein binäres digitales Signal und zum Übertragen desselben an ein weiteres Bauelement der Vorrichtung; 4103 eine Zeigeeinrichtung zum Eingeben der Koordinaten in einem Fenster einer Anzeige; 4104 eine Zeigeeinrichtungs-Schnittstellenschaltung zum Übertragen des Signals von der Zeigeeinrichtung 4103 zu einem weiteren Bauelement der Vorrichtung;
  • 4105 eine zentrale Verarbeitungseinheit bzw. CPU zum Ausführen einer Steuerung der gesamten Vorrichtung, eines Zeichenextraktionsprozesses, und eines Erkennungsprozesses in Übereinstimmung mit den in einem Festspeicher bzw. ROM gespeicherten Programmen; 4106 ein ROM zum Speichern eines Steuerprogramms für Prozesse, die durch die CPU 4105 wie in noch zu beschreibenden Ablaufdiagrammen gezeigt ausgeführt werden, verschiedenen Arten von Verarbeitungsprogrammen, eines Erkennungswörterbuchs oder dergleichen; 4107 einen Speicher mit wahlfreiem Zugriff bzw. RAM, welcher als Arbeitsbereich für einen Prozeß zum Entwickeln eines Zeichenbilds oder einen Prozeß zum Erkennen eines Zeichens verwendet wird; 4108 eine Anzeige zum Anzeigen des zugeführten Bilds und des Erkennungsergebnisses; 4109 eine Anzeige-Schnittstellenschaltung; und 4110 einen CPU-Bus zum Verbinden der Bauelemente der Vorrichtung.
  • Fig. 42 ist ein Ablaufdiagramm, das einen Ablauf von Prozessen in dem Ausführungsbeispiel zeigt. In Schritt S4201 wird das Bild durch die Scanner-Schnittstellenschaltung 4102 aus dem Scanner 4101 ausgelesen und werden die Bildinformationen in das binäre elektrische Signal umgewandelt. Die gelesenen Daten werden in Schritt S4202 auf der Anzeige 4108 angezeigt. Ein Bereich als ein zu erkennendes Ziel wird durch den Bediener unter Verwendung der Zeigeeinrichtung 4103 in Schritt S4202 festgelegt. Da das Dokument mit vertikaler Satzrichtung und das Dokument mit horizontaler Satzrichtung als japanische Dokumente vorliegen, ist es notwendig, die Satzrichtung zu ermitteln, bevor der Erkennungsprozeß ausgeführt wird. In Schritt S4204 wird die Satzrichtung für den Erkennungszielbereich durch ein noch zu beschreibendes Verfahren abgeleitet, werden die Satzrichtungsinformationen dahingehend, ob die Satzrichtung die vertikale Satzrichtung oder die horizontale Satzrichtung ist, ermittelt, und werden in Schritt S4205 die Satzrichtungsinformationen in dem RAM 4107 gehalten. In Schritt S4206 wird eine Satzrichtungsmarke 452 an der linken unteren Ecke des Zielbereichs auf der Anzeige 4108 wie in einem Anzeigebeispiel gemäß Fig. 45 gezeigt in Übereinstimmung mit den Satzrichtungsinformationen angezeigt. Der Bediener beurteilt die Ableitung der Satzrichtung durch die Vorrichtung durch Betrachten der Marke 452. Wenn der Anzeigeinhalt der Satzrichtung korrekt ist, klickt der Bediener mittels der Zeigeeinrichtung 4103 auf einen Erkennungsschalter bzw. -button. Wenn in Schritt S4207 ermittelt wird, daß auf den Erkennungsschalter geklickt wurde, folgt Schritt S4210. Der Zeichenextraktionsprozeß zum Extrahieren des Zeichenbilds für jedes Zeichen wird in Schritt S4210 durchgeführt. Der Erkennungsprozeß wird in Schritt S4211 ausgeführt. Das Erkennungsergebnis wird in Schritt S4212 auf der Anzeige angezeigt und in Übereinstimmung mit einer Anweisung des Bedieners bearbeitet oder beibehalten.
  • Es ist jedoch sehr schwierig, die Satzrichtung in Abhängigkeit von dem zugeführten Dokument abzuleiten, so daß nicht immer eine korrekte Ableitung der Satzrichtung erfolgt. Daher klickt dann, wenn die Satzrichtung nicht korrekt abgeleitet ist, der Bediener unter Verwendung der Zeigeeinrichtung 4103 auf die Satzrichtungsmarke auf der Anzeige. Infolgedessen werden die Satzrichtungsinformationen in Schritt S4209 umgekehrt. Der Umkehrprozeß gibt vor, daß ein Dokument mit horizontaler Satzrichtung in ein Dokument mit vertikaler Satzrichtung geändert wird, oder daß ein Dokument mit vertikaler Satzrichtung in ein Dokument mit horizontaler Satzrichtung geändert wird. In Übereinstimmung mit den umgekehrten Satzrichtungsinformationen wird in Schritt S4209 die Satzrichtungsmarke erneut angezeigt. Danach wird die Verarbeitungsroutine zu Schritt S4205 zurückgeführt, und werden danach Prozesse auf eine zu den vorstehend erwähnten vergleichbare Art und Weise ausgeführt.
  • Nachstehend wird nun ein Verfahren zum Ableiten der Satzrichtung, welches in Schritt S4204 in dem Ausführungsbeispiel ausgeführt wird, unter Bezugnahme auf Fig. 43 beschrieben. Für die Bilddaten wird eine x-Achse in der horizontalen Richtung festgelegt, und die Projektionskomponente der schwarzen Pixel auf die x-Achse nimmt einen Wert P(x) an. Hierzu vergleichbar wird in der vertikalen Richtung eine y-Achse festgelegt, und die Projektionskomponente auf die y-Achse nimmt einen Wert P(y) an. Ein schattierter Abschnitt in Fig. 43 zeigt die Größe der Projektionskomponente.
  • Eine Verteilung von P(x) und P(y) wird durch die folgende Gleichung berechnet:
  • Sx = 1/nΣ(P(x) - )²
  • worin einen Mittelwert von P(x) dieses Intervalls bezeichnet, die Summe aller Projektionskomponenten in diesem Intervall ermittelt wird und n die Anzahl von Daten in diesem Intervall angibt.
  • Auf vergleichbare Art und Weise wird auch eine Verteilung von P(y) berechnet:
  • Sy = 1/mΣ(P(Y) - )²
  • worin den Mittelwert von P(y) in diesem Intervall bezeichnet und m die Anzahl von Daten in diesem Intervall angibt.
  • Die Satzrichtung wird unter Verwendung von Sx und Sy abgeleitet. Das heißt, da die Verteilung der Projektionskomponente für die Richtung entlang der Satzrichtung groß ist, wird dann, wenn
  • Sx > Sy
  • ist, abgeleitet, daß die Satzrichtung die horizontale Richtung ist. Im anderen Fall wird abgeleitet, daß die Satzrichtung die vertikale Richtung ist.
  • Fig. 44 bis 46 zeigen Anzeigebeispiele der Bilddaten und der Satzrichtungsmarke. Fig. 44 zeigt ein Beispiel in dem Fall, in dem die Bilddaten auf der Anzeige 4108 angezeigt werden. Das Bezugszeichen 441 bezeichnet ein Fenster zum Anzeigen des Bilds. "Erkennen" 442 zeigt einen Erkennungsschalter an zum Anweisen der Ausführung der Erkennung. Fig. 45 ist ein Diagramm, das einen Zustand zeigt, in welchem ein Erkennungszielbereich 451 durch die Zeigeeinrichtung 4103 festgelegt wurde. Wenn der Erkennungszielbereich festgelegt ist, ist die Satzrichtung bald abgeleitet, und wird das Ergebnis der Ableitung durch die Satzrichtungsmarke 452 angezeigt. Die Marke 452 zeigt den horizontalen Satz an. Das Bezugszeichen 461 in Fig. 46 bezeichnet eine Satzrichtungsmarke. In diesem Fall jedoch ist die Ableitung der Satzrichtung falsch.
  • Die Erfindung ist wirkungsvoll, ohne das Ableitungsverfahren der Satzrichtung zu beschränken. Die Erfindung ist nicht durch die Ausgestaltung, Anzeigeposition, Farbe oder dergleichen der Satzrichtungsmarke beschränkt. Da eine Einrichtung zum Umkehren der Satzrichtungsinformationen bereitgestellt ist, ist es ferner möglich, ein Verfahren zu verwenden, mittels dem ein Druckschalter einer Maus doppelt angeklickt wird, die Marke aufgegriffen (gezogen) und gedreht wird, oder dergleichen.

Claims (16)

1. Bildverarbeitungsverfahren, umfassend die Schritte des Zuführens (S201) von Bildinformationen und Teilens (S202 bis S206) der zugeführten Bildinformationen in eine Vielzahl von Textbereichen,
gekennzeichnet durch
Erweitern (S1302) eines Liniensegments (2002) in radialer Richtung ausgehend von einem Punkt (2001) innerhalb eines bestimmten (1503) der geteilten Textbereiche zu einem anderen (1504) der geteilten Textbereiche, der zu dem bestimmten Bereich beabstandet ist;
Erfassen (S1304) von Orts- und Größeninformationen (Wo; Ho) des bestimmten Textbereichs und des anderen Textbereichs;
und
Unterscheiden (S1305), ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, in Übereinstimmung mit den erfaßten Orts- und Größeninformationen.
2. Verfahren nach Anspruch 1, bei dem die Bildinformationen Punktinformationen umfassen.
3. Verfahren nach einem der vorangehenden Ansprüche, bei dem der Unterscheidungsschritt ein Unterscheiden, ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, durch Berechnen eines Überlappungsgrads aus den erfaßten Orts- und Größeninformationen umfaßt.
4. Verfahren nach einem der vorangehenden Ansprüche, bei dem der bestimmte Bereich und der andere Textbereich einem Überschriftbereich (1503) bzw. einem Inhaltbereich (1504) entsprechen.
5. Verfahren nach einem der vorangehenden Ansprüche, bei dem die Größeninformationen eine Länge (Wo) entlang einer vorbestimmten Richtung umfassen.
6. Bildverarbeitungsvorrichtung, umfassend
eine Zufuhreinrichtung (101) zum Zuführen von Bildinformationen und eine Teileinrichtung (105) zum Teilen der zugeführten Bildinformationen in eine Vielzahl von Textbereichen,
gekennzeichnet durch
eine Liniensegmenterweiterungseinrichtung zum Erweitern eines Liniensegments (2002) in radialer Richtung ausgehend von einem Punkt (2001) innerhalb eines bestimmten (1503) der geteilten Textbereiche zu einem anderen (1504) der geteilten Textbereiche, der zu dem bestimmten Bereich beabstandet ist;
Eine Erfassungseinrichtung zum Erfassen von Orts- und Größeninformationen (Wo; Ho) des bestimmten Textbereichs und des anderen Textbereichs; und
Eine Unterscheidungseinrichtung zum Unterscheiden, ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, in Übereinstimmung mit den erfaßten Orts- und Größeninformationen.
7. Vorrichtung nach Anspruch 6, bei der die Bildinformationen Punktinformationen umfassen.
8. Vorrichtung nach einem der Ansprüche 6 oder 7, bei der die Unterscheidungseinrichtung zum Unterscheiden, ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, durch Berechnen eines Überlappungsgrads aus den erfaßten Orts- und Größeninformationen betreibbar ist.
9. Vorrichtung nach einem der Ansprüche 6 bis 8, bei der der bestimmte Bereich und der andere Textbereich einem Überschriftbereich bzw. einem Inhaltbereich entsprechen.
10. Vorrichtung nach einem der Ansprüche 6 bis 9, bei der die Größeninformationen eine Länge entlang einer vorbestimmten Richtung umfassen.
11. Speichermedium (103), speichernd in einem Computer verwendbare Anweisungen zum Veranlassen eines Prozessors, eine Bildverarbeitung durchzuführen, wobei die Anweisungen Anweisungen zum Veranlassen des Prozessors, Bildinformationen zuzuführen, und Veranlassen des Prozessors, die zugeführten Bildinformationen in eine Vielzahl von Textbereichen zu teilen, umfassen, gekennzeichnet durch
Veranlassen des Prozessors, ein Liniensegment in radialer Richtung ausgehend von einem Punkt innerhalb eines bestimmten der geteilten Textbereiche zu einem anderen der geteilten Textbereiche, der zu dem bestimmten Bereich beabstandet ist, zu erweitern;
Veranlassen des Prozessors, Orts- und Größeninformationen des bestimmten Textbereichs und des anderen Textbereichs zu erfassen; und
Veranlassen des Prozessors, zu unterscheiden, ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, in Übereinstimmung mit den erfaßten Orts- und Größeninformationen.
12. Speichermedium nach Anspruch 11, bei dem die Bildinformationen Punktinformationen umfassen.
13. Speichermedium nach Anspruch 11, bei dem die Unterscheidung ferner die Unterscheidung, ob der bestimmte Textbereich und der andere Textbereich in einer gleichen Gruppe enthalten sind, durch Berechnen eines Überlappungsgrads aus den erfaßten Orts- und Größeninformationen beinhaltet.
14. Speichermedium nach Anspruch 11, bei dem der bestimmte Bereich und der andere Textbereich einem Überschriftbereich bzw. einem Inhaltbereich entsprechen.
15. Speichermedium nach Anspruch 11, bei dem die Größeninformationen eine Länge entlang einer vorbestimmten Richtung umfassen.
16. Computerprogramm, umfassend in einen Prozessor implementierbare Anweisungen zum Ausführen eines Verfahrens nach einem der Ansprüche 1 bis 5.
DE69330423T 1993-01-11 1993-12-31 Gerät und Verfahren zur Bildverarbeitung Expired - Fee Related DE69330423T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP00269693A JP3278221B2 (ja) 1993-01-11 1993-01-11 画像処理方法及び装置
JP5006034A JPH06215179A (ja) 1993-01-18 1993-01-18 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
DE69330423D1 DE69330423D1 (de) 2001-08-16
DE69330423T2 true DE69330423T2 (de) 2002-05-16

Family

ID=26336147

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69332750T Expired - Fee Related DE69332750T2 (de) 1993-01-11 1993-12-31 Gerät und Verfahren zur Bildverarbeitung
DE69330423T Expired - Fee Related DE69330423T2 (de) 1993-01-11 1993-12-31 Gerät und Verfahren zur Bildverarbeitung

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69332750T Expired - Fee Related DE69332750T2 (de) 1993-01-11 1993-12-31 Gerät und Verfahren zur Bildverarbeitung

Country Status (3)

Country Link
US (1) US6125204A (de)
EP (2) EP0606780B1 (de)
DE (2) DE69332750T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07322252A (ja) 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
EP0750271A3 (de) * 1995-06-19 1997-06-11 Canon Kk Verfahren und Gerät zur Bildverarbeitung
US6393150B1 (en) * 1998-12-04 2002-05-21 Eastman Kodak Company Region-based image binarization system
JP4450888B2 (ja) * 1999-05-28 2010-04-14 富士通株式会社 帳票認識方法
JP2004272822A (ja) * 2003-03-12 2004-09-30 Seiko Epson Corp 文字認識装置および文字認識方法並びにコンピュータプログラム
JP3982454B2 (ja) * 2003-05-27 2007-09-26 ソニー株式会社 携帯型電子機器、ウェブページ処理方法およびプログラム
CN101226596B (zh) * 2007-01-15 2012-02-01 夏普株式会社 文档图像处理装置以及文档图像处理方法
CN101226595B (zh) * 2007-01-15 2012-05-23 夏普株式会社 文档图像处理装置以及文档图像处理方法
CN101354703B (zh) * 2007-07-23 2010-11-17 夏普株式会社 文档图像处理装置和文档图像处理方法
US10410386B2 (en) * 2017-09-15 2019-09-10 Konica Minolta Laboratory U.S.A., Inc. Table cell validation
CN110135428B (zh) * 2019-04-11 2021-06-04 北京航空航天大学 图像分割处理方法和装置
USD971408S1 (en) * 2021-03-03 2022-11-29 Johnson & Johnson Consumer Inc. Oral screening device

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3005206C2 (de) * 1980-02-12 1983-01-05 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Verfahren zur automatischen Zeichenerkennung
US4907283A (en) * 1987-03-13 1990-03-06 Canon Kabushiki Kaisha Image processing apparatus
US5185813A (en) * 1988-01-19 1993-02-09 Kabushiki Kaisha Toshiba Document image processing apparatus
JPH083839B2 (ja) * 1988-10-04 1996-01-17 富士写真フイルム株式会社 放射線照射野認識方法
JPH02201588A (ja) * 1989-01-31 1990-08-09 Toshiba Corp 文字読取装置
JP2840306B2 (ja) * 1989-08-02 1998-12-24 キヤノン株式会社 画像処理装置の領域処理方法
JPH0388087A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置
JP2719202B2 (ja) * 1989-09-21 1998-02-25 株式会社リコー 線図形特徴抽出及び認識方法
JPH03263258A (ja) * 1990-03-14 1991-11-22 Mitsubishi Electric Corp 文書編集支援装置
US5048099A (en) * 1990-05-21 1991-09-10 Eastman Kodak Company Polygon-based method for automatic extraction of selected text in a digitized document
JP3001966B2 (ja) * 1990-11-30 2000-01-24 株式会社リコー 文字認識用辞書の作成方法
US5231663A (en) * 1991-03-18 1993-07-27 Earl Joseph G Image processing system
US5245674A (en) * 1991-07-30 1993-09-14 Xerox Corporation Image processing using distance as a function of direction
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features

Also Published As

Publication number Publication date
EP0898240A1 (de) 1999-02-24
EP0606780A2 (de) 1994-07-20
DE69332750T2 (de) 2003-10-16
EP0898240B1 (de) 2003-03-05
US6125204A (en) 2000-09-26
EP0606780B1 (de) 2001-07-11
DE69332750D1 (de) 2003-04-10
DE69330423D1 (de) 2001-08-16
EP0606780A3 (de) 1995-01-18

Similar Documents

Publication Publication Date Title
CN110516208B (zh) 一种针对pdf文档表格提取的系统及方法
DE69231923T2 (de) System mit Annäherungsmittel zur Erkennung von graphischen Elementen in einer Zeichnung
DE3650554T2 (de) Speicherungs- und Wiederauffindungsverfahren für Bilddaten
DE69610230T2 (de) Verfahren und Gerät zur Bildverarbeitung
DE69432585T2 (de) Verfahren und Gerät zur Auswahl von Text und/oder Non-Text-Blöcken in einem gespeicherten Dokument
DE69333694T2 (de) Verfahren und Anordnung zur Bildverarbeitung
DE69723220T2 (de) Gerät und Verfahren zur Extrahierung von Tabellengeraden innerhalb normaler Dokumentbilder
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE69532847T2 (de) System zur Seitenanalyse
DE69624433T2 (de) Gerät und Verfahren zur Extrahierung von Titeln aus Dokumentbildern
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE3722444C2 (de) Verfahren und Vorrichtung zum Erzeugen von Entwurfsmusterdaten
DE3210814C2 (de) Verfahren zum Bestimmen einer optimalen Schwelle für die Umsetzung eines Videosignals in ein Binärsignal und Schaltungsanordnung zur Durchführung des Verfahrens
DE69330423T2 (de) Gerät und Verfahren zur Bildverarbeitung
DE69230631T2 (de) Verfahren zum Vergleichen von Wortgestalten
DE60308944T2 (de) Layoutanalyse eines handschriftlichen Dokuments für Freiform-Eingabe mit digitaler Tinte
DE60303202T2 (de) System und verfahren zum identifizieren und extrahieren von zeichenketten aus erfassten bilddaten
DE3716787C2 (de)
DE10317917B4 (de) System und Verfahren zum Umgrenzen und Klassifizieren von Regionen innerhalb einer graphischen Abbildung
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE4216893C2 (de) Dateneingabeverfahren
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE69428475T2 (de) Verfahren und Gerät zur automatischen Spracherkennung
DE68922772T2 (de) Verfahren zur Zeichenkettenermittlung.
DE68928703T2 (de) Buchstabenerkennungsvorrichtung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee