DE4216893A1 - Verfahren zur eingabe von zeichendaten - Google Patents

Verfahren zur eingabe von zeichendaten

Info

Publication number
DE4216893A1
DE4216893A1 DE4216893A DE4216893A DE4216893A1 DE 4216893 A1 DE4216893 A1 DE 4216893A1 DE 4216893 A DE4216893 A DE 4216893A DE 4216893 A DE4216893 A DE 4216893A DE 4216893 A1 DE4216893 A1 DE 4216893A1
Authority
DE
Germany
Prior art keywords
data
image information
character
format
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE4216893A
Other languages
English (en)
Other versions
DE4216893C2 (de
Inventor
Masayuki Tsuchiya
Toshihiko Matsuda
Hitoshi Suzuki
Hiroshi Fujise
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Publication of DE4216893A1 publication Critical patent/DE4216893A1/de
Application granted granted Critical
Publication of DE4216893C2 publication Critical patent/DE4216893C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

Die vorliegende Erfindung betrifft die Verarbeitung von auf eine Rechnung oder einen Listenbeleg geschriebenen Zeichendaten mittels eines Computers und insbesondere ein Verfahren zur Eingabe von Zeichendaten mittels eines op­ tischen Klarschriftlesers (der im folgenden mit OCR be­ zeichnet wird) ohne Verwendung eines speziellen Formu­ lars.
Bisher werden OCRs üblicherweise dazu verwendet, auf Rechnungen oder Listenbelegen vorhandene Zeichendaten einzugeben. Für OCRs wird ein spezieller Listenbeleg ver­ wendet, so daß zum Zeitpunkt der Eingabe das Format aus­ geblendet werden kann, um ausschließlich die Zeichendaten zu lesen (wobei das Format in diesem Fall Ränder, gezo­ gene Linien und Eintragungsraum-Namen umfaßt und diese Ränder, Linien, Eintragungsraum-Namen und die Beziehungen zwischen den Eintragungsräumen normalerweise vorhanden sind). Es ist außerdem ein System entwickelt worden, in dem die auf einem Listenbeleg vorhandenen Zeichen gelesen werden können, ohne daß ein solcher spezieller Listenbe­ leg verwendet wird.
Beispielsweise werden in dem aus der JP S60-1 60 486-A bekannten System Musterdaten, die einer Zeichenzeile entsprechen und in auf einem Listenbeleg vorhandene Zeichenränder eingepaßt sind, in einem Spei­ cher gespeichert, außerdem wird anhand der Zeichenrandda­ ten ein Zeichenrandmuster aus dem Speicher erfaßt, um in bezug auf jedes Zeichen ein Zeichenmuster "herauszu­ schneiden", wodurch eine Zeichenerkennung ausgeführt wird. Dieses herkömmliche System hat die im folgenden be­ schriebenen Probleme zur Folge.
Obwohl in diesem System kein spezieller Listenbeleg mehr erforderlich ist, können Zeichendaten, die nicht von Rän­ dern umgeben sind, unterstrichene Zeichendaten und Zei­ chendaten, die sich innerhalb von an den Ecken abgerunde­ ten Rändern befinden, also Zeichendaten, die in normalen Listenbelegen üblicherweise angetroffen werden, nicht korrekt erkannt werden. Ferner muß die Erkennung für jede Zeile ausgeführt werden, falls ein Eingabebereich wie im Fall von normalen Listenbelegen mehrere Zeilen enthält.
Außerdem müssen das Problem, daß ein Listenbeleg bei sei­ ner Eingabe verschoben oder leicht gedreht oder falsch ausgerichtet ist und das Problem, daß die Randlinien eines Listenbelegs verschoben sind, wenn der Listenbeleg in Kopie verwendet wird, gelöst werden.
Bisher sind die Werte von Summen-Räumen oder dergleichen auf einem Listenbeleg direkt von dem Beleg gelesen wor­ den, wobei es jedoch notwendig ist, daß der Benutzer durch Rechnen bestätigt, ob diese Werte richtig gelesen worden sind. Außerdem muß die Übereinstimmung in einer Gruppe von besonderen Datenelementen wie etwa von Kunden­ namen und Kundenkodes oder von Produktnamen und Pro­ duktkodes, die mittels Kodes aufeinander bezogen sind, geprüft werden.
Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Verfahren zur Eingabe von Zeichendaten zu schaffen, mit dem sowohl auf herkömmlichen Listenbelegen oder Rechnun­ gen befindliche Zeichendaten, die nicht von Rändern umge­ ben sind, die unterstrichen sind oder die sich innerhalb von an den Ecken abgerundeten Rändern befinden, als auch Daten in einer speziellen OCR-Form in einen Computer ein­ gegeben werden können.
Es ist eine weitere Aufgabe der vorliegenden Erfindung, ein Verfahren zur Eingabe von Zeichendaten zu schaffen, mit dem eine Kopie eines Listenbelegs verwendet werden kann, indem eine eventuelle Verschiebung des Formates des kopierten Listenbelegs korrigiert wird, und mit dem ein bei der Eingabe des Listenbelegs erzeugter Positions- oder Ausrichtungsfehler des Listenbelegs korrigiert wird.
Es ist eine weitere Aufgabe der vorliegenden Erfindung, ein Verfahren zur Eingabe von Zeichendaten zu schaffen, mit dem die auf einer Rechnung oder einem Listenbeleg aufgezeichneten Daten geprüft werden können.
Diese Aufgaben werden gemäß einem Aspekt der vorliegenden Erfindung gelöst durch ein Verfahren, das die folgenden Schritte umfaßt: Lesen von Bildinformation bezüglich ei­ nes Formulars, das nur ein Format aufweist und auf dem keine Daten vorhanden sind, von einer Eingabeeinheit zur Eingabe von Bildinformation, Erzeugen einer Feldinforma­ tion, die die Eingabebereiche festlegt, indem ein Zei­ chenmuster und ein Randmuster des in der gelesenen Bildinformation enthaltenen Formats erkannt wird, Spei­ chern des Zeichenmusters, des Randmusters und der einge­ gebenen Feldinformation als erste Information, Lesen ei­ ner Bildinformation bezüglich einer Seite des gleichen, jedoch Daten enthaltenden Formulars von der Eingabeein­ heit und Unterscheiden des Formats und der Daten dieser Bildinformation auf der Grundlage der ersten Information, um ein Zeichenmuster eines jeden Datenabschnittes zu er­ kennen und um eine zweite Information zu bilden, die die einem jeden Eingabebereich entsprechenden Daten umfaßt.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Verfahren zur Eingabe von Zeichendaten geschaf­ fen, das die folgenden Schritte umfaßt: Lesen von Bildin­ formation bezüglich eines Formulars, das nur ein Format aufweist und auf dem keine Daten vorhanden sind, von ei­ ner Eingabeeinheit zur Eingabe von Bildinformation, Er­ zeugen einer die Eingabebereiche festlegenden Feldinfor­ mation durch Erkennen eines Zeichenmusters und eines Randmusters des in der gelesenen Bildinformation enthal­ tenden Formats, Speichern des Zeichenmusters, des Randmu­ sters und der Eingabe-Feldinformation als erste Informa­ tion, Lesen der Bildinformation bezüglich einer Seite des gleichen, jedoch Daten enthaltenden Formulars von der Eingabeeinheit und Korrigieren eines Positionsfehlers und/oder eines Ausrichtungsfehlers der Bildinformation bezüglich der die Daten enthaltenden Formularseite auf der Grundlage der ersten Information, um eine Abweichung der Bildinformation bezüglich der die Daten enthaltenden Formularseite in bezug auf die Bildinformation der Formu­ larseite, die das Format, jedoch keine Daten enthält, zu korrigieren.
Gemäß einem weiteren Aspekt der Erfindung wird ein Ver­ fahren zur Eingabe von Zeichendaten geschaffen, das die folgenden Schritte umfaßt: Erzeugen wenigstens einer Ver­ arbeitungsprozedur bezüglich eines Formats und von in ei­ nem Formular vorhandenen Daten, die eine zweite Informa­ tion darstellen, entsprechend den Format-Ausdrücken durch die Bezugnahme auf die erste Information, Speichern von durch diese Verarbeitung der zweiten Information erhalte­ ner Information als dritter Information und Anzeigen sowohl der zweiten als auch der dritten Information.
Die Information bezüglich der Formularseite, die nur ein Format und keinerlei Zeichendaten enthält, wird als Bildinformation gelesen, wobei das Format des Formulars als Formatinformation erzeugt wird. Die Zeichendatenein­ gabebereich-Information wird anhand dieser Formatinforma­ tion gebildet. Die Formatinformation und die Zeichenda­ teneingabebereich-Information bilden die erste Informa­ tion. Die in dem Formular vorhandenen Zeichendaten, die solche Zeichendaten umfassen können, die in einer übli­ chen Rechnung, in einem üblichen Listenbeleg oder der­ gleichen angetroffen werden und nicht von Rändern umgeben sind, werden auf der Grundlage der ersten Information ge­ lesen, so daß die nicht von Rändern umgebenen Zeichenda­ ten, unterstrichene Zeichendaten und Zeichendaten, die von an den Ecken abgerundeten Rändern umgeben sind, ein­ gegeben werden können. Das bedeutet, daß Daten auf einer normalen Rechnung oder einem normalen Listenbeleg mittels einer OCR-Eingabeeinheit in einen Computer eingegeben werden können.
Außerdem können erfindungsgemäß ein bei der Eingabe eines Formulars in die Eingabeeinheit auftretender Positions­ fehler und/oder ein Ausrichtungsfehler des die Zeichenda­ ten enthaltenden Formulars ebenso wie ein Verschreibungsfehler des Formulars korrigiert werden, so daß die Bedie­ nungsperson nicht darauf achten muß, bei der Eingabe des Formulars einen Positionsfehler oder einen Ausrichtungs­ fehler des Formulars zu verhindern.
Ferner wird bezüglich der zweiten Information eine Verar­ beitungsprozedur geschaffen; diese Verarbeitung wird so ausgeführt, daß eine Zwischensumme und die Gesamtsumme von in die Eingabebereiche geschriebenen Werten (Eingabedaten), Ergebnisse einer Steuerberechnung (z B. der Addition einer Verbrauchssteuer) und die Eingabedaten angezeigt werden können, wodurch es möglich ist, die Richtigkeit der eingegebenen Zeichendaten sofort zu prü­ fen.
Weitere Aufgaben, Merkmale und Vorteile der Erfindung sind in den Unteransprüchen, die sich auf eine besondere Ausführungsform der vorliegenden Erfindung beziehen, an­ gegeben.
Die Erfindung wird im folgenden anhand einer bevorzugten Ausführungsform mit Bezug auf die Zeichnungen näher er­ läutert; es zeigt
Fig. 1 ein Blockschaltbild einer Ausführungsform der vorliegenden Erfindung;
Fig. 2 ein Flußdiagramm einer Zeichendatenverarbei­ tung gemäß der Ausführungsform der vorliegen­ den Erfindung;
Fig. 3 ein Diagramm des Hauptablaufs der Verarbei­ tung gemäß der Ausführungsform der vorliegen­ den Erfindung;
Fig. 4 ein Flußdiagramm einer Vorbereitungsverarbei­ tung gemäß der Ausführungsform der vorliegen­ den Erfindung;
Fig. 5 eine Darstellung von gespeicherten Ergebnis­ sen der Erkennung von Rändern und von Zeichen bezüglich eines Formats gemäß der Ausfüh­ rungsform der vorliegenden Erfindung;
Fig. 6 eine Darstellung einer gespeicherten Feldin­ formation, d. h. der Ergebnisse der Erkennung von Zeichendaten-Eingabebereichen, gemäß der Ausführungsform der vorliegenden Erfindung;
Fig. 7 eine Darstellung eines Beispiels für die Grö­ ßenangabe eines Zeichendaten-Eingabebereichs;
Fig. 8 ein Flußdiagramm der Feldverarbeitungsproze­ dur gemäß der Ausführungsform der vorliegen­ den Erfindung;
Fig. 9 eine Darstellung eines Beispiels für den In­ halt einer Datei, in der erkannte Zeichenda­ ten gemäß der Ausführungsform der vorliegen­ den Erfindung gespeichert sind;
Fig. 10 eine Darstellung eines Beispiels für die De­ finition der Verarbeitung einer Wissensdaten­ bank gemäß der Ausführungsform der vorliegen­ den Erfindung;
Fig. 11 eine Darstellung eines Beispiels der Verar­ beitung zur Anzeige von "Kanji"-Daten (d. h. von japanischen Ideogrammen) unter Verwen­ dung einer Hauptdatei gemäß der Ausführungs­ form der vorliegenden Erfindung;
Fig. 12 ein Flußdiagramm einer Verarbeitung gemäß der Ausführungsform der vorliegenden Erfindung, die ausgeführt wird, wenn eine Rechnung oder ein Listenbeleg eingegeben wird, auf dem Zei­ chendaten vorhanden sind;
Fig. 13 ein Flußdiagramm eines Beispiels einer Bild­ korrekturverarbeitung und einer Zeichenda­ tenerkennungsverarbeitung gemäß der Ausfüh­ rungsform der vorliegenden Erfindung;
Fig. 14 eine schematische Darstellung von Beispielen eines Bildes und einer Bildinformation gemäß der Ausführungsform der vorliegenden Erfin­ dung;
Fig. 15 eine schematische Darstellung eines Beispiels eines Fehlers bei der Eingabe eines Formu­ lars;
Fig. 16 ein Flußdiagramm eines Beispiels einer For­ matkorrekturverarbeitung gemäß der Ausfüh­ rungsform der vorliegenden Erfindung;
Fig. 17 eine schematische Darstellung eines Beispiels einer Bezugslinie, die in der Formatkorrek­ turverarbeitung gemäß der Ausführungsform der vorliegenden Erfindung verwendet wird;
Fig. 18 eine schematische Darstellung eines Beispiels eines Verfahrens zur Bestimmung der Korrek­ turwerte in der Formatkorrekturverarbeitung gemäß der Ausführungsform der vorliegenden Erfindung;
Fig. 19 eine schematische Darstellung von Beispielen von Eingabebereichen, in denen gezogene Li­ nien gemäß der Ausführungsform der vorliegen­ den Erfindung vorhanden sind;
Fig. 20 eine schematische Darstellung eines Beispiels einer Verarbeitung zum Entnehmen von Zeichen­ daten durch Beseitigen der Linieninformation aus den Bilddaten gemäß der Ausführungsform der vorliegenden Erfindung;
Fig. 21A ein Flußdiagramm gemäß der Ausführungsform der vorliegenden Erfindung; und
Fig. 21B ein weiteres Flußdiagramm gemäß der Ausfüh­ rungsform der vorliegenden Erfindung.
Fig. 1 ist eine Darstellung des Gesamtaufbaus eines In­ formationsverarbeitungssystems, in dem die vorliegende Erfindung angewendet wird. Das in Fig. 1 gezeigte Infor­ mationsverarbeitungssystem umfaßt einen Bedienerplatz 1, einen mit dem Bedienerplatz 1 verbundenen Prozessor 2, eine mit dem Prozessor 2 über einen Übertragungsweg 9 verbundene Steuereinrichtung 4, eine mit der Steuerein­ richtung 4 verbundene und von dieser gesteuerte Eingabe­ einheit 3, eine mit dem Übertragungsweg 9 verbundene Steuereinrichtung 6, eine mit der Steuereinrichtung 6 verbundene und von dieser gesteuerte Speicherplattenein­ heit 5, eine mit dem Übertragungsweg 9 verbundene und zur Ausführung der Verarbeitung des Prozessors dienende Ver­ arbeitungseinheit 7 und eine mit dem Übertragungsweg 9 verbundene und zum Speichern von Daten verwendete Daten­ einheit 8.
Die Verarbeitungseinheit 7 besitzt einen Gesamtsteuerab­ schnitt 7A, einen Rechnung/Listenbeleg-Eingabeabschnitt 7B, einen Rechnung/Listenbeleg-Erkennungsabschnitt 7C, einen Zeichendaten-Erkennungsabschnitt 7D, einen Feldver­ arbeitungsabschnitt 7E, einen Bildanzeigeabschnitt 7F und einen Datenspeicherabschnitt 7G. Die Dateneinheit 8 um­ faßt einen Formatinformation-Speicherbereich 8A, einen Feldinformation-Speicherbereich 8B, einen Zeichendaten- Speicherbereich 8C, einen Bilddaten-Speicherbereich 8D, einen Feldverarbeitungsprozedur-Speicherabschnitt 8E, einen Arbeitsbereich 8F und eine Wissensbasis 8G.
Wenn der Gesamtsteuerabschnitt 7A vom Prozessor 2 gerufen wird, speichert er ein Bild, das von der Eingabeeinheit 3 in den Rechnung/Listenbeleg-Eingabeabschnitt 7B eingege­ ben worden ist, im Bilddaten-Speicherbereich 8D.
Wenn eine Rechnung oder ein Listenbeleg, auf dem keine Zeichendaten vorhanden sind, eingegeben wird, veranlaßt der Gesamtsteuerabschnitt 7A den Rechnung/Listenbeleg-Er­ kennungsabschnitt 7C dazu, gezogene Linien und Zeichen entsprechend dem Format der Bilddaten zu erkennen, die im Bilddaten-Speicherbereich 8D auf der Grundlage einer in der Speicherplatteneinheit 5 vorhandenen Wissensbasis ge­ speichert sind, um die erkannte Formatinformation im For­ matinformation-Speicherbereich 8A zu speichern. Der Rech­ nung/Listenbeleg-Erkennungsabschnitt 7C legt die Zeichen­ daten-Eingabebereiche fest, bereitet die Feldverarbei­ tungsprozeduren vor und speichert die Eingabebereiche und die Feldverarbeitungsprozeduren im Feldinformation- Speicherbereich 8B bzw. im Feldverarbeitungsprozedur- Speicherabschnitt 8E.
Die Speicherplatteneinheit 5 enthält Dateien, die dem Formatinformation-Speicherbereich 8A, dem Feldinforma­ tion-Speicherbereich 8B, dem Zeichendaten-Speicherbereich 8C, dem Bilddaten-Speicherbereich 8D, dem Feldverarbei­ tungsprozedur-Speicherabschnitt 8E bzw. der Wissensbasis 8G entsprechen. Nach der Verarbeitung in der Dateneinheit 8 werden in den entsprechenden Dateien der Speicherplat­ teneinheit 5 die jeweiligen Datenklassen gespeichert. Wenn in der jeweiligen Datei gespeicherte Daten verwendet werden, werden sie in den entsprechenden Speicherbereich der Dateneinheit 8 eingelesen, um verarbeitet zu werden. Um der Erleichterung der Erläuterung willen wird der Speichervorgang von Daten aus dem jeweiligen Speicherbe­ reich in die Speicherplatteneinheit 5 und der Lesevorgang von Daten aus der Speicherplatteneinheit 5 in den jewei­ ligen Speicherbereich in der folgenden Beschreibung nicht jedesmal explizit erwähnt.
Wenn eine Rechnung oder ein Listenbeleg, auf dem Zeichen­ daten vorhanden sind, von der Eingabeeinheit 3 als Bild eingegeben wird, wird dieses eingegebene Bild im Bildda­ ten-Speicherbereich 8D vom Rechnung/Listenbeleg-Erken­ nungsabschnitt 7C temporär gespeichert. Dann werden auf­ grund eines Befehls vom Zeichendaten-Erkennungsabschnitt 7D Zeichen erkannt, indem die Zeichendaten entsprechend der Formatinformation im Formatinformation-Speicherbe­ reich 8A und der Feldinformation im Feldinformation- Speicherbereich 8B unter Verwendung des Arbeitsbereichs 8F aus den Bilddaten entnommen werden. Die erkannten Zei­ chen werden im Zeichendaten-Speicherbereich 8C gespei­ chert. Der Feldverarbeitungsabschnitt 7E führt eine Feld­ verarbeitung entsprechend den im Feldverarbeitungsproze­ dur-Speicherabschnitt 8E gespeicherten Feldverarbeitungs­ prozeduren bezüglich der im Zeichendaten-Speicherbereich 8C gespeicherten Zeichendaten aus und zeigt die Ergeb­ nisse der Feldverarbeitung und die im Zeichendaten- Speicherbereich 8C gespeicherten Zeichendaten oder die im Bilddaten-Speicherbereich 8D gespeicherten Bilddaten mit­ tels des Bildanzeigeabschnittes 7F als Bild an. Die er­ kannten Daten können unter Verwendung der von der Bedie­ nungsperson ausgeführten Prüfungs- und Korrekturverarbei­ tung und der Feldverarbeitung automatisch korrigiert wer­ den. Danach speichert der Datenspeicherabschnitt 7G diese Datenklassen in einer von der Speicherplatteneinheit 5 oder von einer Bedienungsperson bezeichneten Hauptdatei.
In Fig. 2 ist der Ablauf der Operationen gezeigt, wenn Zeichendaten eingegeben werden. Ein Beleg 201, auf dem keine (individuellen) Zeichendaten vorhanden sind, wird von einer Leseeinheit wie etwa einem Fernkopierer oder einem Bildleser eingegeben (Schritt 202). Zu diesem Zeit­ punkt kann eine fehlerhafte Ausrichtung der eingegebenen Bilddaten korrigiert werden. Alternativ kann eine Dis­ kette (Floppy Disk, im folgenden mit FD bezeichnet) ein­ gelegt werden, auf der eine ein Belegformat dokumentie­ rende Textverarbeitungsspezifikation aufgezeichnet ist.
Im Schritt 203 werden anhand des eingegebenen Bildes oder einer Dokumentations-FD Zeichen und Linien auf dem Beleg erkannt. Die Positionen und die Namen der Eingabefelder werden anhand der Zeichenreihen und der Linien erkannt. Die Ergebnisse dieser Bestimmung werden als Bild, wie es etwa durch das Anzeigebeispiel 204 dargestellt ist, zu­ sammen mit den bestimmten Eingabefeldern (Eingabebereiche sind schraffiert dargestellt) angezeigt. Im Schritt 205 kann die Bedienungsperson eine Prüfung und gegebenenfalls eine Korrektur ausführen.
Im Schritt 206 werden anhand der Inhalte der Zeichenrei­ hen und der Positionen und der Namen der Felder die Be­ ziehungen zwischen den Feldern und den Feldeigenschaften erkannt, um Feldverarbeitungsprozeduren vorzubereiten. Diese Feldverarbeitungsprozeduren werden ausgeführt, um anhand der in einigen der Felder (Eingabebereichen) vor­ handenen und erkannten Zeichendaten solche Zeichendaten zu bilden, die in andere Felder aufgenommen werden sol­ len, und um die Eignung der in die anderen Felder aufzu­ nehmenden Zeichendaten zu verifizieren.
Die Information bezüglich der anhand des Bildes erkannten Zeichenreihen und Linien wird im Formatinformation- Speicherbereich 8A gespeichert, während die gebildeten Informationspositionen und -namen im Feldinformation- Speicherbereich 8B gespeichert werden. Die gebildeten Feldverarbeitungsprozeduren werden im Feldverarbeitungs­ prozedur-Speicherabschnitt 8E gespeichert. Damit ist die Vorbereitungsverarbeitung abgeschlossen.
Die oben beschriebene Zeichen- und Linienerkennungsverar­ beitung und die Feldverarbeitungsprozedur-Erzeugungsver­ arbeitung sind im wesentlichen gleich der Vorverarbei­ tung, der Erkennungsverarbeitung der physikalischen Struktur und der Listenbeleg-Erzeugungsverarbeitung, wie sie aus der vom Anmelder der vorliegenden Erfindung ein­ gereichten JP H2-1 75 246-A bekannt sind.
Nun wird eine Verarbeitung zur Eingabe eines Listenbele­ ges beschrieben, auf dem Zeichendaten vorhanden sind.
Im Schritt 211 wird eine Belegseite 210, auf der Zeichen­ daten vorhanden sind, eingegeben, ferner werden ein Aus­ richtungsfehler und/oder ein Positionsfehler der eingege­ benen Bilddaten korrigiert. Im Schritt 212 werden die Zeichendaten erkannt, indem auf der Grundlage der For­ matinformation und der Feldinformation, die im Formatin­ formation-Speicherbereich 8A und im Feldinformation- Speicherbereich 8B gespeichert sind, aus den Bilddaten lediglich die Zeichendaten "herausgeschnitten" werden. Im Schritt 213 werden die erkannten ("herausgeschnittenen") Zeichendaten im Zeichendaten-Speicherbereich 8C gespei­ chert. Im Schritt 214 wird entsprechend den im Feldverar­ beitungsprozedur-Speicherabschnitt 8E gespeicherten Feld­ verarbeitungsprozeduren eine Feldverarbeitung bezüglich der erkannten Zeichendaten ausgeführt. In diesem Beispiel werden die in den Koderäumen des Beleges 210 aufgezeich­ neten Zeichen A100, B200 gelesen, außerdem werden die die durch die Kodes A100 bzw. B200 bezeichneten Ausdrücke "Äpfel" bzw. "Orangen" (oder, wie in der Zeichnung darge­ stellt, die entsprechenden japanischen Ideogramme ("Kanji"-Daten) und phonetischen Symbole ("Katakana"-Da­ ten)) in diejenigen Felder eingetragen, die den Artikel­ räumen entsprechen, die aufgrund der Verarbeitung den Kodes A100 bzw. B200 zugeordnet worden sind. Dann werden die Einheiten-Preise (Stückpreis oder Kilopreis oder dergleichen) der durch A100 bzw. B200 bezeichneten Äpfel und Orangen abgerufen, anschließend werden diese Einhei­ ten-Preise mit den in den Mengenräumen vorhandenen Zahlen multipliziert. Die Ergebnisse dieser Berechnung werden in die den Summenräumen entsprechenden Felder eingegeben. Die Zahlen 2000 und 1000 in den Summenräumen werden ad­ diert, anschließend wird bezüglich der Summe 3000 ein Verbrauchssteuerbetrag 90 errechnet und in ein dem Ver­ brauchssteuer-Raum entsprechendes Feld eingegeben. An­ schließend werden die Summe 3000 und der berechnete Ver­ brauchssteuerbetrag addiert, schließlich wird der dadurch erhaltene Wert 3090 in das dem Endsummenraum entspre­ chende Feld eingegeben. Dann werden die Ausdrücke "Äpfel" und "Orangen" (bzw. die entsprechenden japanischen Kanji- und Katakana-Daten) und die Summen 2000, 1000, 90 und 3090, die durch die Feldverarbeitung bezüglich der er­ kannten Zeichendaten-Positionen A100 und B200 erhalten worden sind, in die Artikelräume und die Summenräume ein­ getragen, wie durch das Anzeigebeispiel 215 dargestellt ist.
Die angezeigten Daten werden von der Bedienungsperson be­ stätigt, anschließend wird im Schritt 216 ein Eintra­ gungsbefehl ausgeführt. Durch den Eintragungsbefehl wer­ den die erkannten Zeichendaten-Positionen A100 und B200, die Ausdrücke "Äpfel" und "Orangen" (bzw. die entspre­ chenden japanischen Kanji- und Katakana-Daten) und die Summen 2000, 1000, 90 und 3090, die durch die Feldverar­ beitung erhalten worden sind, in einer Benutzer-Hauptda­ tei 217 gespeichert.
Nun ist die Verarbeitung von der Eingabe bis zur endgül­ tigen Datenspeicherung beschrieben worden. Wie in Fig. 3 gezeigt, umfaßt dieser Gesamtprozeß die Vorbereitungsver­ arbeitung 301, in der Datenfelder (Eingabebereiche) fest­ gelegt und Feldverarbeitungsprozeduren erzeugt werden, und eine Listenbeleg-Eingabeverarbeitung 302, in der eine Rechnung oder ein Listenbeleg, auf denen Daten vorhanden sind, gelesen wird und eine Zeichenerkennung und eine Feldverarbeitung der erkannten Zeichen ausgeführt werden.
In Fig. 4 ist der Ablauf der Vorbereitungsverarbeitung 301 gezeigt. Im Schritt 401 der Eingabeverarbeitung wird von einer Fernkopierereinheit (Fax) 410 oder einem Bild­ leser 411 ein Formular, auf dem keine Zeichendaten vor­ handen sind, eingegeben. Anstatt der Eingabe von der Fernkopierereinheit 410 oder vom Bildleser 411 kann eine Dokumentations-FD, auf der das Format einer Rechnung und/oder eines Listenbeleges aufgezeichnet sind, einge­ legt werden. Wenn von der Fernkopierereinheit oder vom Bildleser ein Formular eingegeben wird, in dem keine Zei­ chendaten vorhanden sind, wird ein Ausrichtungsfehler der eingegebenen Bilddaten korrigiert. Die Verarbeitung be­ züglich dieser Ausrichtungsfehler-Korrektur ist gleich derjenigen, wie sie aus der vom Anmelder der vorliegenden Erfindung früher eingereichten JP H2-1 75 246-A bekannt ist.
Im Schritt 402 der Bildspeicherungsverarbeitung werden die bezüglich ihrer Ausrichtung korrigierten Bilddaten im Arbeitsbereich temporär gespeichert. Diese Verarbeitung ist in dem Fall, in dem eine Dokumentations-FD eingelegt wird, nicht notwendig.
Im Schritt 403 der Rand- und Zeichenerkennungsverarbei­ tung werden anhand der Bilddaten oder der Daten einer Do­ kumentations-FD gezogene Linien und Zeichen erkannt, an­ schließend werden die Ergebnisse dieser Verarbeitung im Formatinformation-Speicherbereich 8A gespeichert. Diese Verarbeitung zur Erkennung von Linien und Zeichen anhand der Bilddaten ist ebenfalls gleich derjenigen der JP H2- 1 75 246-A. Die Formationsinformation gemäß dieser Ausfüh­ rungsform entspricht TAL1, 3, 4, 5 der obenerwähnten frü­ heren Anmeldung. Danach werden die Ergebnisse der Linien­ und Zeichenerkennung als Bild auf dem Bildschirm des Be­ dienerplatzes 1 angezeigt. Wenn diese Ergebnisse korri­ giert werden müssen, wird eine Korrekturverarbeitung 404 ausgeführt, anschließend geht die Verarbeitung weiter zum Schritt 405 der Zeichendatenbereich-Erkennungsverarbei­ tung. Wenn die Ergebnisse nicht korrigiert werden müssen, geht die Verarbeitung direkt weiter zum Schritt 405 der Zeichendatenbereich-Erkennungsverarbeitung.
Im Schritt 405 der Zeichendatenbereich-Erkennungsverar­ beitung werden auf der Grundlage der Formatinformation im Formatinformation-Speicherbereich und der Wissensdaten­ bank der Wissensbasis 8G die Zeichendatenbereiche festge­ legt. Die Ergebnisse dieser Festlegung werden als Feldin­ formation dargestellt. Diese Verarbeitung zur Festlegung der Zeichendatenbereiche ist wiederum gleich der entspre­ chenden Verarbeitung der obenerwähnten früheren Anmel­ dung, in der A350 in Fig. 103 der Feldinformation der vorliegenden Ausführungsform entspricht. Die gebildete Feldinformation wird im Feldinformation-Speicherbereich 8B gespeichert und auf dem Bildschirm des Bedienerplatzes 1 angezeigt. Wenn diese Information korrigiert werden muß, wird eine Korrekturverarbeitung 406 ausgeführt, wo­ raufhin die Verarbeitung zum Schritt 407 der Feldverar­ beitungsprozedur-Erzeugung weitergeht. Wenn keine Korrek­ tur erforderlich ist, geht die Verarbeitung direkt zum Schritt 407 der Feldverarbeitungsprozedur-Erzeugung wei­ ter.
Im Schritt 407 der Feldverarbeitungsprozedur-Erzeugung werden unter Bezugnahme auf Namen, Beziehungen und Merk­ male der Felder (Zeichendaten-Eingabebereiche), die an­ hand der Feldinformation im Feldinformation-Speicherbe­ reich 8B und anhand der Wissensdatenbank der Wissensbasis 8G erzeugt worden sind, die notwendigen Feldverarbei­ tungsprozeduren erzeugt. Die Feldverarbeitungsprozeduren umfassen beispielsweise eine Verarbeitungsprozedur, in der die Einheiten-Preise und die Mengen, die auf die Ar­ tikelnamen bezogen sind, für die Felder mit dem Namen "Summe" ausgelesen werden, um die Berechnung "Preis× Menge" auszuführen und die Werte der Rechenergebnisse in die Felder "Summe" einzugeben, und eine Verarbeitungspro­ zedur, in der die in die Felder mit dem Namen "Summe" eingegebenen Werte für ein Feld mit dem Namen "Verbrauchssteuer" gelesen und addiert werden, die Be­ rechnung "Gesamtsumme×0,03" ausgeführt wird und der durch diese Berechnung erhaltene Wert in das Feld "Verbrauchssteuer" eingetragen wird (wobei eventuell die Stellen hinter dem Dezimalpunkt nicht dargestellt wer­ den). Diese Verarbeitung zur Erzeugung der Feldverarbei­ tungsprozeduren ist wiederum gleich der entsprechenden Verarbeitung aus der obenerwähnten früheren Anmeldung. Die erzeugten Verarbeitungsprozeduren werden im Feldver­ arbeitungsprozedur-Speicherabschnitt 8E gespeichert und auf dem Bildschirm des Bedienerplatzes 1 angezeigt. Gege­ benenfalls werden sie durch eine Korrekturverarbeitung 408 korrigiert. Wenn keine Korrektur erforderlich ist, geht die Verarbeitung direkt zum Schritt 409 der Erzeu­ gung von Zeichendaten-Erkennungsparametern weiter.
Im Schritt 409 der Erzeugung von Zeichendaten-Erkennungs­ parametern werden die für die Erkennung der Zeichendaten erforderlichen Zeichendaten-Erkennungsparameter anhand der Feldinformation im Feldinformation-Speicherbereich 8E erzeugt und im Zeichendatenerkennungsparameter-Teil 415 des Feldinformation-Speicherbereichs 8A gespeichert. Wenn ein eingegebener Listenbeleg, auf dem Zeichendaten vor­ handen sind, eingegeben wird, dienen diese Zeichenerken­ nungsparameter dazu, die Art des Formats des eingegebenen Listenbelegs zu bestimmen. In Fig. 5 ist ein Beispiel des Gehaltes der im Formatinformation-Speicherbereich 8A ge­ speicherten Formatinformation gezeigt. Ein Beleg 501 ist so beschaffen, daß er Linien 507 bis 509 und Zeichen 504 bis 506 umfaßt. Diese Linien und Zeichen werden durch die Linieninformation 502 und durch die Zeicheninformation 503, die im Formatinformation-Speicherbereich 8A gespei­ chert sind, getrennt dargestellt. Die Linieninformation umfaßt die Koordinaten, die die linke obere Position und die rechte untere Position der Linien darstellen, die Zeicheninformation umfaßt die Koordinaten, die die linke obere Position und die rechte untere Position der Zeichen darstellen, und die für diese Zeichen wesentlichen Kodes.
In Fig. 6 ist ein Beispiel des Gehaltes der Feldinforma­ tion gezeigt, die durch die Erkennung der Zeichendaten- Eingabebereiche erzeugt wird. Die Zeichenanordnungen wer­ den mit den Daten in der Wissensdatenbank der Wissensba­ sis 8G verglichen, um die Stellen festzulegen, an denen die Eingabefelder gebildet werden.
Die so bestimmten Eingabefelder 610, 611, 612 und 613 werden zusammen mit den Linien und Zeichen in einem Bild angezeigt, wie es etwa durch das Anzeigebeispiel 603 in Fig. 6 dargestellt ist. Die Zeicheneingabefelder werden z. B. durch eine geänderte Farbe im Bild angezeigt. Die Information bezüglich der bestimmten Felder wird im Feldinformation-Speicherbereich 8B in Form der Feldinfor­ mation 604, die die linken oberen Positionen und die rechten unteren Positionen der Felder und Feldnamen um­ faßt, gespeichert.
Falls jedes Zeicheneingabefeld durch Umrandung gebildet ist, wird die Größe des Feldes entsprechend der Umrandung festgesetzt, so daß zwischen dem Feld und jedem Rand ein Einpunkt-Abstand vorgesehen ist, wie in Fig. 7 gezeigt ist, wodurch die Zeichen an jeder Position innerhalb der jeweiligen Umrandung erkannt werden können. Wenn die Zei­ chen nicht von Rändern umgeben sind, wird die Größe eines jeden Eingabefeldes auf einen Wert festgelegt, der durch die Multiplikation der Größe der Zeichenanordnung mit ei­ nem bestimmten Wert erhalten wird.
In Fig. 8 ist ein Beispiel der Verarbeitung zur Ausfüh­ rung der Feldverarbeitungsprozeduren, die durch die Feld­ verarbeitungsprozedur-Erzeugung 407 von Fig. 4 erzeugt worden sind, gezeigt. Zunächst werden im Schritt 801 vor­ her erkannte Zeichendaten aus dem Zeichendaten-Speicher­ bereich 8C in den Arbeitsbereich 8F geholt. Im Schritt 802 wird das gleiche Format wie dasjenige des eingegebe­ nen Formulars auf der Grundlage der im Formatinformation- Speicherbereich 8A gespeicherten Formatinformation als Bild angezeigt. Im Schritt 803 wird die Feldverarbeitung der in den Arbeitsbereich 8F geholten Zeichendaten ausge­ führt. Im Schritt 804 werden die Ergebnisse der Feldver­ arbeitung zusammen mit den erkannten Zeichendaten in ei­ nem Bild angezeigt. Im Beispiel des in Fig. 2 gezeigten Beleges sind die erkannten Zeichen in den Koderäumen durch "A100, B200" und in den Mengenräumen durch "10, 20" gegeben, während die Ergebnisse der Feldverarbeitung in den Summenräumen durch "2000, 1000", im Verbrauchssteuer- Raum durch "90" und im Endsummenraum durch "3090" gegeben sind. Diese werden kombiniert angezeigt, wie dies durch das Anzeigebeispiel 215 von Fig. 2 dargestellt ist. Da­ nach prüft die Bedienungsperson im Schritt 805, ob die erkannten Zeichen ("A100, B200" in den Koderäumen, "10, 20" in den Mengenräumen usw.) in Ordnung sind. Wenn sie korrigiert werden müssen, geht die Verarbeitung weiter zum Schritt 806, in dem die erkannten Zeichen korrigiert werden. Die Verarbeitung des Schrittes 803 und der nach­ folgenden Schritte wird dann auf der Grundlage der korri­ gierten Zeichen wiederholt. Wenn die erkannten Zeichen in Ordnung sind, ist der Prozeß der Feldverarbeitung been­ det.
In Fig. 9 sind die Gehalte einer die erkannten Zeichenda­ ten enthaltenden Datei 904 gezeigt. Diese Datei enthält die Positionsnamen 901 (die durch die Namen der Zeichen­ datenbereiche gegeben sind) und Zeichendaten 902 und ist in einen Datenabschnitt und einen Einzelheiten-Abschnitt unterteilt. Die Zeichendaten im Einzelheiten-Abschnitt werden durch aufeinanderfolgende Anordnung der Reihen, wie dies in Fig. 9 gezeigt ist, gespeichert.
In Fig. 10 sind die Gehalte der Verarbeitung der erzeug­ ten Felder gezeigt. Die Verarbeitungsgehalte werden in der Wissensdatenbank der Wissensbasis 8G entsprechend den gezeigten Ausdrücken gespeichert. In dieser Ausführungs­ form wird wiederum die gleiche Verarbeitung ausgeführt, wie sie bereits in der erwähnten früheren Anmeldung be­ schrieben worden ist. Das heißt, daß aus der Feldinforma­ tion im Feldinformation-Speicherbereich 8B Namen, Posi­ tionen, Beziehungen und Merkmale der Felder erkannt wer­ den und Verarbeitungsprozeduren durch Abfragen der Wis­ sensdatenbank erzeugt werden. Die Gehalte der Verarbei­ tung umfassen beispielsweise die Verarbeitung der Berech­ nung numerischer Werte wie etwa Einheitspreis×Menge und Gesamtsumme×0,03 (wobei im Ergebnis eventuell die Stel­ len hinter dem Dezimalpunkt nicht dargestellt werden), und eine Referenzverarbeitung zum Auffinden eines Kunden­ namens durch Suchen in einer Kunden-Hauptdatei mittels ei­ nes Kundenkodes oder zum Finden eines Produktnamens durch Suchen in einer Produkt-Hauptdatei mittels eines Pro­ duktkodes.
In Fig. 11 ist ein Beispiel für den Fall der Ausführung einer Referenzverarbeitung gezeigt. Ein in diesem Bei­ spiel verwendeter Verkaufsbeleg enthält die folgenden Po­ sitionen: einen Kundenkode 1101, einen Kundennamen 1102, einen Artikelkode 1103, einen Artikelnamen 1104 und eine Summe 1105. Der Kundenkode 1101, der Artikelkode 1103 und die Summe 1105 werden durch alphanumerische Zeichen dar­ gestellt, während der Kundenname 1101 und der Artikelname 1104 wie in der Zeichnung dargestellt z. B. durch Kanji- und/oder Katakana-Zeichen dargestellt werden. In dem in dieser Ausführungsform verwendeten Zeichenerkennungssy­ stem können Ausdrücke in Form von Kanji- oder Katakana- Daten nicht erkannt werden. Um diesen Mangel zu kompen­ sieren, sind einerseits die Dateinamen, auf die Bezug ge­ nommen wird, in der Wissensbasis gespeichert, anderer­ seits wird die Information in dieser Datei abgefragt, um die entsprechenden Kanji- oder Katakana-Daten anzuzeigen. Beispielsweise wird für einen Kundenkode (A10) 1106 ein Kundenkode (A10) 1109 einer Kunden-Hauptdatei 1108 ge­ sucht, anschließend wird der entsprechende Kundenname "Tokio-Warenhaus" (in Form von Kanji-Daten) 1110 als Kun­ denname ("Tokio-Warenhaus") 1107 dargestellt. Im gezeig­ ten Beispiel wird ein Formular eingegeben, in dem ein Kundenkode (A10) enthalten ist und als Kundenname 1102 der Ausdruck "Hitachi-Warenhaus" (in Form von Kanji-Da­ ten) eingetragen ist, wobei jedoch unter dem Kundenkode (A10) als Kundenname der Ausdruck "Tokio-Warenhaus" 1107 gespeichert ist. Anhand des (in Form von Kanji-Daten dar­ gestellten) Kundennamens im Anzeigebild kann die Bedie­ nungsperson erkennen, daß der im Formular vorhandene Kun­ denkode (A10) fehlerhaft ist. Bezüglich eines Artikel­ kodes (A1000) 1111 wird in einer Kundenprodukt-Hauptdatei 1113 auf einen Produktkode (A1000) Bezug genommen, wo­ raufhin der Ausdruck "Äpfel" (in Form von Kanji-Daten) im Artikelnamenraum 1112 angezeigt wird.
Da die Feldverarbeitungsprozedur auf diese Weise erzeugt wird, ist eine sofortige Prüfung möglich, ob die auf dem Beleg vorhandenen Daten in Ordnung sind oder ob die Zei­ chen richtig erkannt worden sind, indem ohne Erkennung von Kanji-Daten Kanji-Datendateien erstellt werden, die den Kundenkodes und den Artikelkodes entsprechen, wobei diese Dateien anhand der erkannten alphanumerischen Zei­ chen abgefragt werden, um Kanji-Informationen zu bilden, und wobei ein Kanji-Daten enthaltendes Bild angezeigt wird.
Nun wird der Prozeßablauf zur Eingabe einer Rechnung oder eines Listenbeleges, auf dem Daten vorhanden sind, mit Bezug auf Fig. 12 beschrieben. In Fig. 12 sind Einzelhei­ ten der Listenbeleg-Eingabeverarbeitung 302 von Fig. 3 gezeigt. Zunächst wird im Schritt 1201 der Eingabeverar­ beitung eine Rechnung oder ein Listenbeleg, auf dem Zei­ chendaten vorhanden sind, als Bild von einer Fernkopie­ rereinheit 410 oder von einem Bildleser 411 eingegeben, ferner wird ein Ausrichtungsfehler der eingegebenen Bild­ daten korrigiert. Diese Bilddaten werden vorrübergehend im Bilddaten-Speicherbereich 8D gespeichert. Dann werden im Schritt 1202 der Bildkorrekturverarbeitung ein Positi­ onsfehler und/oder ein Ausrichtungsfehler des Formulars und ein Fehler bezüglich der Anzahl der Leerstellen kor­ rigiert. Im Schritt 1203 der Zeichendaten-Erkennungsver­ arbeitung werden Teile von Linien aus den korrigierten Bilddaten beseitigt, indem die Linieninformation der vor­ her erzeugten und im Formatinformation-Speicherbereich 8A gespeicherten Formatinformation verwendet wird, so daß unter Verwendung von Feldinformation lediglich die zu er­ kennenden Zeichendaten entnommen werden. Die erkannten Zeichendaten werden im Zeichendaten-Speicherbereich 8C gespeichert.
Dann wird im Feldverarbeitungsschritt 1204 die Feldverar­ beitung der im Zeichendaten-Speicherbereich 8C gespei­ cherten Zeichendaten entsprechend den vorher erzeugten Feldverarbeitungsprozeduren ausgeführt. Die erkannten Zeichendaten und die Ergebnisse der Feldverarbeitung die­ ser Zeichendaten werden im Bildanzeigeschritt 1205 als Bild angezeigt, um von der Bedienungsperson geprüft zu werden. Wenn bei der Prüfung durch die Bedienungsperson festgestellt wird, daß ein erkanntes Zeichen fehlerhaft ist und korrigiert werden muß, geht der Prozeß weiter zum Korrekturverarbeitungsschritt 1206, um die Korrektur aus­ zuführen. Dann kehrt der Prozeß zum Feldverarbeitungs­ schritt 1204 zurück, um die nachfolgenden Schritte zu wiederholen. Wenn keine Korrektur erforderlich ist, geht die Verarbeitung direkt zum nächsten Schritt 1207 der Hauptdatei-Eintragungsverarbeitung weiter. Im Schritt der Hauptdatei-Eintragungsverarbeitung 1207 werden die einge­ gebenen Bilddaten, die erkannten Zeichendaten und die durch die Feldverarbeitung erhaltenen Zeichendaten so kombiniert, wie sie in dem Anzeigebeispiel 215 von Fig. 2 dargestellt und als Endeingabedaten in die Hauptdatei 217 eingetragen sind.
In Fig. 13 sind Einzelheiten der Bildkorrekturverarbei­ tung 1202 und der Zeichendaten-Erkennungsverarbeitung 1203 von Fig. 12 gezeigt. Zunächst werden im Schritt 1301 in der Bilddatei der Speicherplatteneinheit 5 gespei­ cherte Bilddaten in Form eines Binärbildes, wie es in Fig. 14 gezeigt ist, in den Bilddaten-Speicherbereich 8D der Dateneinheit eingegeben. Die Daten im Bilddaten- Speicherbereich 8D, die in dem Bild schwarzen Punkten entsprechen, erhalten den Binärwert "1", während die Da­ ten im Bilddaten-Speicherbereich 8D, die weißen Punkten entsprechen, den Binärwert "0" erhalten.
Im Schritt 1302 wird das Format des Bildes in Längs- und in Querrichtung korrigiert. Ein Formular, wie es in einer (in Fig. 4 gezeigten) Vorbereitungsstufe verwendet wird, und ein Formular, auf dem Zeichendaten vorhanden sind, stimmen nicht immer überein. Wenn ein Formular 1501, wie es in Fig. 15 gezeigt ist, auf dem keine Zeichendaten vorhanden sind und das in einer Vorbereitungsstufe ver­ wendet wird, das Formular zum Zeitpunkt der Zeichenein­ gabe, die beispielsweise durch Kopieren der Zeichen aus­ geführt wird, darstellt, werden die Koordinaten (x, y) in der linken oberen Ecke der linierten Ränder des Formulars 1501 normalerweise an eine hiervon verschiedene Position verschoben, so daß nun die Koordinaten der linken oberen Ecke 1504 der linierten Ränder des Formulars 1504 durch (x1, y1) gegeben sind.
Diese Verschiebung wird durch einen Prozeß, wie er in Fig. 16 gezeigt ist, korrigiert. Zunächst wird in einem Schritt 1601 eine Bezugslinie gesetzt. Für diese Bezugs­ linie wird eine Linie gewählt, die sich am äußersten obe­ ren Rand und am äußersten linken Rand des Bildes befin­ det. In dem in Fig. 17 gezeigten Beispiel eines Beleges 1701 wird die Linie 1702 als Bezugslinie verwendet. Als Information zum Festlegen dieser Bezugslinie wird die Li­ nieninformation in der Formatinformation verwendet. Nach dem Setzen der Bezugslinie wird auf der Grundlage der linken oberen Koordinaten und der rechten unteren Koordi­ naten der festgelegten Bezugslinie eine Punktumwandlung ausgeführt, wie in Fig. 18 gezeigt ist. Wenn die festge­ legte Bezugslinie eine Linie 1801 ist, lauten die linken oberen Koordinaten 1802 dieser Linie (x1, y1) und die rechten unteren Koordinaten (x2, y2), während die Dicke der Linie durch z gegeben ist; in diesem Fall wird die Anzahl der Punkte, die der Länge bzw. der Dicke der Linie entspricht, durch die folgenden Gleichungen erhalten, wo­ bei α und β die Größe 1805 der Punkte, d. h. den Durchmes­ ser in x-Richtung bzw. in y-Richtung darstellen:
Anzahl der Längenpunkte = (x2-x1)/α
Anzahl der Dickenpunkte = z/β.
Dann wird im Schritt 1602 eine Linie gesucht, die die gleiche Länge und die gleiche Dicke wie diese Bezugslinie besitzt und sich am äußersten oberen Rand und am äußer­ sten linken Rand des Bildes befindet. Die Differenz zwi­ schen der durch Suchen gefundenen Startposition (linke obere Ecke) der Linie und der Startposition (linke obere Ecke) der Bezugslinie wird im Schritt 1603 ermittelt. Im Schritt 1604 werden die Daten im Bilddaten-Speicherbe­ reich 8D korrigiert. Eine durchgezogene Linie 1809 gibt das Ende von eingegebenen Bilddaten an, während eine un­ terbrochene Linie 1808 ein Beispiel eines geeigneten En­ des der Bilddaten darstellt. In diesem Beispiel werden die eingegebenen Bilddaten in der nach links weisenden Richtung um a und in der nach oben weisenden Richtung um b korrigiert. Die unterbrochene Linie 1810 gibt ein wei­ teres Beispiel für ein geeignetes Ende der Bilddaten an. In diesem Beispiel werden die eingegebenen Bilddaten in der nach rechts weisenden Richtung um c und in der nach unten weisenden Richtung um d korrigiert. Hierbei stellen die Werte a und b bzw. c und d Korrekturwerte dar.
Nachdem die Korrektur des Formulars beendet ist, werden Teile der Linien beseitigt. In einigen Fällen sind Lini­ endaten in dem als Feldinformation erzeugten Zeichenein­ gabebereich enthalten. Beispielsweise kann eine gezogene Randlinie wie im Falle der in Fig. 19 gezeigten Linie 1901 an der Ecke abgerundet sein. Wenn in diesem Fall ein Zeichenbereich im Inneren der Ränder als Eingabebereich 1904 festgesetzt wird, nähert sich dieser Zeichenbereich dem Rand bis auf den Abstand S an, so daß bei der Verwen­ dung dieses Bereichs Schwierigkeiten entstehen können. Aus diesem Grund wird ein Zeicheneingabebereich so fest­ gesetzt, wie er durch den Zeicheneingabebereich 1902 dar­ gestellt wird, wodurch der Bereich mit abgerundeter Ecke der Linie 1901 beseitigt wird. Die Daten im gerundeten Bereich der Linie sind in dem in der Tabelle 1909 gezeig­ ten Formlar als Formatinformation enthalten, wie dies be­ reits aus der obenerwähnten früheren Anmeldung JP H2- 1 75 246-A bekannt ist. In den Summenräumen normaler Belege sind üblicherweise Flächenunterteilungslinien 1908 vorge­ sehen, um die Eintragung der Ziffern zu erleichtern. Sol­ che Linien befinden sich innerhalb der Linien 1906 und ferner innerhalb des Zeicheneingabebereichs 1907. Daher ist es erforderlich, solche Linien zu entfernen.
In Fig. 20 ist ein Verfahren zur Entfernung von Linien gezeigt. Im Schritt 2002 werden Punkte auf der Grundlage der gesamten in der Formatinformation enthaltenen Li­ nieninformation umgewandelt. Dieses Umwandlungsverfahren gleicht demjenigen von Fig. 18. Im Schritt 2004 wird eine vorher korrigierte Bildtabelleninformation auf der Grund­ lage der Linieninformation, die bereits einer Punktum­ wandlung unterzogen worden ist, umgewandelt. Nach der Beendigung der Linienentfernung werden im Schritt 1304 von Fig. 13 die Daten der Zeichenbereiche entnommen, wo­ raufhin im Schritt 1305 die Zeichenarten erkannt werden. Die Datenentnahme aus den Zeichenbereichen wird so ausge­ führt, daß die Position, die Breite und die Länge eines jeden Feldes anhand der Feldinformation 604 im Feldinfor­ mation-Speicherbereich 8B einer Punktumwandlung unterwor­ fen werden und daß die Daten innerhalb dieser Grenzen im Schritt 2008 ausgeschnitten werden. Die Bildinformation 2009 entspricht den ausgeschnittenen Daten. Die Zeichen werden auf der Grundlage dieser ausgeschnittenen Daten im Schritt 1305 von Fig. 13 identifiziert. Die identifizier­ ten Zeichen werden im Schritt 1306 in der Datei für er­ kannte Zeichendaten im Zeichendaten-Speicherbereich 8C gespeichert.
Die Fig. 21A und 21B zeigen Beispiele der Anwendung des erfindungsgemäßen Verfahrens auf das in Fig. 1 gezeigte Informationsverarbeitungssystem. Die Einzelheiten dieses Verfahrens sind von der Art, wie sie oben beschrieben worden sind; im folgenden wird der Gesamtablauf dieses Verfahrens beschrieben.
Der in Fig. 21A gezeigte Prozeß stellt eine Vorberei­ tungsstufe dar. Der in Fig. 21B gezeigte Prozeß stellt einen Prozeß dar, in dem die Daten von einem Formular, etwa einer Rechnung oder einem Listenbeleg, auf dem Zei­ chendaten vorhanden sind, tatsächlich eingegeben werden.
Zunächst wird der Prozeß der Vorbereitungsstufe beschrie­ ben. In der Vorbereitungsstufe wird das Format eines For­ mulars, auf dem Zeichendaten vorhanden sind, gelesen, wo­ bei die Leerstellen dieses Formulars, in die Zeichendaten eingetragen werden sollen, erkannt werden. Ferner werden anhand besonderer Zeichendaten Feldverarbeitungsprozedu­ ren zum Erzeugen weiterer Zeichendaten erstellt.
Zunächst wird im Schritt 2102 Information bezüglich der Eintragungsseite eines Formulars, auf dem keine Daten vorhanden sind, von der Eingabeeinheit 3 wie etwa einer Fernkopierereinheit oder einem Bildleser in Form von Bilddaten eingegeben. Die eingegebenen Bilddaten werden im Schritt 2103 im Bilddaten-Speicherbereich 8D gespei­ chert. Im Schritt 2104 werden die in diesen Bilddaten enthaltenen Linien und Ränder und die das Format betref­ fenden Zeichen gelesen und erkannt, um eine Linieninfor­ mation und eine Zeicheninformation wie etwa die in Fig. 5 gezeigte Information zu erzeugen. Die erzeugte Linienin­ formation und die erzeugte Zeicheninformation wird als Formatinformation im Formatinformation-Speicherbereich 8A gespeichert und gleichzeitig als Bild, etwa als Bild des Belegs 201 von Fig. 2, auf dem Anzeigebildschirm des Be­ dienerplatzes 1 angezeigt.
Das als Bild eingegebene Format wird dahingehend geprüft, ob das Format des eingegebenen Formulars richtig wieder­ gegeben wird (Schritt 2105). Wenn keine Korrektur erfor­ derlich ist, geht die Verarbeitung direkt zum nächsten Schritt 2107 weiter. Wenn eine Korrektur erforderlich ist, wird im Schritt 2106 eine Korrekturverarbeitung aus­ geführt, anschließend geht die Verarbeitung weiter zum Schritt 2107. Im Schritt 2107 wird die Wissensdatenbank der Wissensbasis 8G aufgesucht, werden Eingabebereiche (Felder), in denen Zeichendaten erfaßt werden sollen, an­ hand der Zeichen und Linien im vorher erkannten Format festgelegt und wird die Information, die diese Bereiche darstellt, als Feldinformation wie etwa diejenige von Fig. 6 im Feldinformation-Speicherbereich 8B gespeichert. Die festgelegten Eingabebereiche werden im Beleg 201 auf dem Anzeigebildschirm als schraffierte Bereiche ange­ zeigt, wie sie etwa in dem Anzeigebeispiel 204 von Fig. 2 gezeigt sind. Die angezeigten Eingabebereiche werden da­ hingehend geprüft, ob sie richtig festgelegt worden sind (Schritt 2108). Wenn keine Korrektur erforderlich ist, geht die Verarbeitung direkt zum nächsten Schritt 2110 weiter. Wenn eine Korrektur erforderlich ist, wird im Schritt 2109 eine Korrekturverarbeitung ausgeführt, wo­ raufhin die Verarbeitung zum Schritt 2110 weitergeht.
Im Schritt 2110 wird die Wissensdatenbank der Wissensba­ sis 8G aufgesucht, wird die Beziehung zwischen den in den vorher festgelegten Eingabebereichen vorhandenen Datenpo­ sitionen anhand der im Format enthaltenen Zeichen erkannt und werden Feldverarbeitungsprozeduren, mit denen auf der Grundlage der in die besonderen Eingabebereiche eingetra­ genen Daten in andere Bereiche einzutragende Daten er­ zeugt werden, vorbereitet. Die vorbereiteten Feldverar­ beitungsprozeduren werden im Feldverarbeitungsprozedur- Speicherbereich 8E gespeichert und als Bild angezeigt, damit überprüft werden kann, ob eine Korrektur erforder­ lich ist (Schritt 2111). Wenn keine Korrektur erforder­ lich ist, geht die Verarbeitung direkt zum nächsten Schritt 2113 weiter. Wenn eine Korrektur erforderlich ist, wird im Schritt 2112 eine Korrekturverarbeitung aus­ geführt, woraufhin die Verarbeitung zum nächsten Schritt 2113 weitergeht. Im Schritt 2113 werden Parameter für die Erkennung von Zeichendaten in den Eingabebereichen er­ zeugt und im Feldinformation-Speicherbereich 8B gespei­ chert. Diese Parameter werden dazu verwendet, Feldinfor­ mation aus dem Format auszublenden.
Durch den Schritt 2113 ist der Vorbereitungsprozeß abge­ schlossen.
Nun wird mit Bezug auf Fig. 21B der Prozeß zum Lesen von Zeichendaten von einem Formular (Rechnung/Listenbeleg), in den tatsächlich Zeichendaten eingetragen worden sind, beschrieben.
Im Schritt 2114 werden Daten auf einer Formularseite, auf der Zeichendaten vorhanden sind (wobei das Formular durch den Vorbereitungsprozeß bereits verarbeitet worden ist) als Bilddaten von der Fernkopierereinheit oder dem Bild­ leser wie im Vorbereitungsprozeß eingegeben. Das eingege­ bene Bild wird im Bilddaten-Speicherbereich 8D gespei­ chert (Schritt 2115). Im Schritt 2116 wird die Linienin­ formation in der Formatinformation aufgesucht und eine Bezugslinie daraus ausgewählt. Die eingegebenen Bilddaten werden durchsucht, um eine Linie zu finden, deren Länge und deren Dicke mit der Länge bzw. der Dicke der Bezugs­ linie übereinstimmt und die sich an einer ähnlichen Posi­ tion im Bild befindet (Schritt 2117). Die Position der gefundenen Linie und die Position der Bezugslinie werden miteinander verglichen, anschließend werden die räumliche Differenz zwischen ihnen und ein Ausrichtungskorrektur­ wert berechnet (Schritt 2118). Im Schritt 2119 werden die Bilddaten auf der Grundlage der berechneten räumlichen Differenz korrigiert, um diese räumliche Differenz zu be­ seitigen.
Nach Abschluß der Korrektur der räumlichen Differenz des Formulars werden aus diesen Bilddaten unter Bezugnahme auf die Formatinformation Linien gelöscht (Schritt 2120), außerdem werden in den Eingabebereichen vorhandene Zei­ chendaten aus den Bilddaten, aus denen die Linien ent­ fernt worden sind, entnommen, indem auf die Feldinforma­ tion Bezug genommen wird (Schritt 2121). Die entnommenen Zeichendaten werden erkannt (Schritt 2123) und im Zei­ chendaten-Speicherbereich gespeichert (Schritt 2123). An­ schließend wird das in der Vorbereitungsstufe gelesene Format in einer Form wie etwa derjenigen des in Fig. 2 gezeigten Beleges 201 angezeigt (Schritt 2125), außerdem wird bezüglich der erkannten Zeichendaten auf der Grund­ lage der im Feldverarbeitungsprozedur-Speicherabschnitt 8E gespeicherten Feldverarbeitungsprozeduren eine Feld­ verarbeitung ausgeführt (Schritt 2126). Die durch die Feldverarbeitung erhaltenen Daten werden in die entspre­ chenden Eingabebereiche eingegeben und mit den erkannten Zeichendaten und dem Format kombiniert, um als Formular wie etwa demjenigen des in Fig. 2 gezeigten Anzeigebei­ spiels 215 angezeigt zu werden (Schritt 2127).
Die in einem Bild angezeigten Zeichen (die im Schritt 2122 erkannt wurden) werden daraufhin geprüft, ob eine Korrektur erforderlich ist (Schritt 2128). Wenn keine Korrektur erforderlich ist, geht die Verarbeitung direkt weiter zum Schritt 2130. Wenn jedoch eine Korrektur er­ forderlich ist, wird eine solche Korrekturverarbeitung im Schritt 2129 ausgeführt, anschließend werden der Schritt 2126 und die nachfolgenden Schritte wiederholt. Im Schritt 2130 werden die erkannten Zeichendaten und die durch die Feldverarbeitung erhaltenen Daten zusammen mit dem in der Vorbereitungsstufe eingegebenen Format in die Hauptdatei eingegeben, ferner wird geprüft, ob ein weite­ rer Listenbeleg eingegeben werden soll. Wenn ein weiterer Beleg vorliegt, werden die Verarbeitung des Schrittes 2114 und die nachfolgenden Schritte für diesen weiteren Beleg wiederholt. Wenn kein Beleg mehr vorliegt, ist die Eingabeprozedur beendet.
Gemäß dieser Ausführungsform wird das Format eines Formu­ lars erkannt, werden diejenigen Linienmuster und Zeichen­ muster voneinander unterschieden, die in der Bildinforma­ tion, die in die Eingabebereiche eingetragene Eingabeda­ ten und Zeichenmuster enthält, das Format bilden, und werden die Zeichenmuster in den Eingabebereichen erkannt. Durch dieses Verfahren können Zeichendaten, die auf einer üblichen Rechnung, einem Beleg oder dergleichen vorhanden sind und nicht umrandet sind, unterstrichene Zeichendaten und solche Zeichendaten, die von an den Ecken abgerunde­ ten Rändern umgeben sind, ebenso in einen Computer einge­ geben werden wie Zeichen in einer für einen OCR geeigne­ ten, speziellen Form. In den Bilddaten kann ein Positi­ onsfehler des Formulars korrigiert werden, so daß die Be­ dienungsperson nicht darauf achten muß, einen solchen Po­ sitionsfehler des Formulars zum Zeitpunkt der Bildeingabe zu vermeiden.
Außerdem wird eine vorher gewählte Verarbeitung bezüglich des Formats des Formulars mit Bezug auf die auf dem For­ mular vorhandenen Zeichendaten ausgeführt, wobei die Er­ gebnisse dieser Verarbeitung angezeigt werden und somit die Möglichkeit geschaffen wird, die Eignung der vorhan­ denen Zeichendaten zu prüfen.

Claims (13)

1. Verfahren zur Eingabe von Zeichendaten für ein Informationsverarbeitungssystem, das die folgenden Schritte umfaßt:
Lesen (2114) von Bildinformation bezüglich eines Formulars (210), auf dem Daten vorhanden sind, von einer Eingabeeinheit (3) zur Eingabe von Bildinformation; und
Erkennen (2122) von Zeichenmustern von Daten, die in der Bildinformation enthalten sind,
gekennzeichnet durch die folgenden Schritte:
Lesen (2102) von Bildinformation bezüglich eines Formulars (201), das nur ein Format aufweist und auf dem keine Daten vorhanden sind, von der Eingabeeinheit (3) zur Eingabe von Bildinformation;
Erzeugen (2104) von Information, die mehrere Ein­ gabebereiche (610 bis 613) vorschreibt, in die Daten ein­ getragen werden können, indem Zeichenmuster und Randmu­ ster des Formats anhand der gelesenen Bildinformation er­ kannt werden; und
Unterscheiden (2121) des Formats und der Daten in der Bildinformation bezüglich des Daten enthaltenden und von der Eingabeeinheit (3) gelesenen Formulars (210) auf der Grundlage der erkannten Zeichenmuster und Randmuster des Formats und der die Dateneingabebereiche (610 bis 613) vorschreibenden Information, um in den jeweiligen Dateneingabebereichen (610 bis 613) Zeichenmuster zu er­ kennen.
2. Verfahren gemäß Anspruch 1, gekennzeichnet durch den folgenden Schritt:
Anzeigen (2127) der erkannten Zeichenmuster in jedem Dateneingabebereich (610 bis 613).
3. Verfahren gemäß Anspruch 2, gekennzeichnet durch die folgenden Schritte:
Erzeugen (2110) wenigstens einer Feldverarbei­ tungsprozedur für die Bezugnahme auf die erkannten Zei­ chenmuster und Randmuster des Formats und die die Daten­ eingabebereiche (610 bis 613) vorschreibende Information, um in einige der Eingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einen der anderen Einga­ bebereiche einzugebende Daten zu erzeugen und diese er­ zeugten Daten in den entsprechenden Eingabebereich ein­ zugeben; und
Ausführen (2126) der Feldverarbeitungsprozedur bezüglich der erkannten Zeichendaten für die in die ent­ sprechenden Dateneingabebereiche eingegebenen Daten.
4. Verfahren gemäß Anspruch 3, gekennzeichnet durch den folgenden Schritt:
Anzeigen (2127) der Daten, die durch Ausführen der Feldverarbeitungsprozedur bezüglich der Zeichendaten im erkannten Datenbereich erzeugt worden sind, in einem Bild des entsprechenden Eingabebereichs des Formats.
5. Verfahren gemäß Anspruch 4, gekennzeichnet durch den nach dem Lesen der Bildinformation bezüglich des Da­ ten enthaltenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For­ mulars (201).
6. Verfahren gemäß Anspruch 3, gekennzeichnet durch den nach dem Lesen der Bildinformation bezüglich des Da­ ten enthaltenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation bezüglich des keine Daten enthal­ tenden Formulars (201).
7. Verfahren gemäß Anspruch 2, gekennzeichnet durch den nach dem Lesen der Bildinformation bezüglich des Da­ ten enthaltenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers dieser Bildinformation.
8. Verfahren gemäß Anspruch 1, gekennzeichnet durch die folgenden Schritte:
Erzeugen (2110) wenigstens einer Feldverarbei­ tungsprozedur für die Bezugnahme auf die erkannten Zei­ chenmuster und Randmuster des Formats und die die Daten­ eingabebereiche (610 bis 613) vorschreibende Information, um in einige der Eingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einem der anderen Einga­ bebereiche einzugebende Daten zu erzeugen und um diese erzeugten Daten in den entsprechenden Eingabebereich ein­ zugeben; und
Ausführen (2126) der Feldverarbeitungsprozedur für die Zeichendaten im erkannten Datenbereich.
9. Verfahren gemäß Anspruch 8, gekennzeichnet durch den folgenden Schritt:
Anzeigen (2127) der Daten, die durch die Ausfüh­ rung der Feldverarbeitungsprozedur bezüglich der Zeichen­ daten im erkannten Datenbereich erzeugt worden sind, in einem Bild des entsprechenden Eingabebereichs des For­ mats.
10. Verfahren gemäß Anspruch 8, gekennzeichnet durch den nach dem Lesen der Bildinformation bezüglich des Da­ ten enthaltenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers dieser Bildinformation.
11. Verfahren gemäß Anspruch 9, gekennzeichnet durch den nach dem Lesen der Bildinformation des Daten enthal­ tenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For­ mulars (201).
12. Verfahren gemäß Anspruch 1, gekennzeichnet durch den nach dem Lesen der Bildinformation bezüglich des Da­ ten enthaltenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For­ mulars (201).
13. Ein Verfahren zur Eingabe von Zeichendaten für ein Informationsverarbeitungssystem, das die folgenden Schritte umfaßt:
Lesen (2114) von Bildinformation bezüglich eines Daten enthaltenden Formulars (210) von einer Eingabeein­ heit (3) für die Eingabe von Bildinformation; und
Erkennen (2122) von Zeichenmustern von in der Bildinformation enthaltenen Daten,
gekennzeichnet durch die folgenden Schritte:
Lesen (2102) von Bildinformation bezüglich eines Formulars (201), das nur ein Format aufweist und keine Daten enthält, von der Eingabeeinheit (3) zur Eingabe von Bildinformation;
Erzeugen (2104) von Information, die mehrere Ein­ gabebereiche (610 bis 613), in die Daten eingetragen wer­ den sollen, vorschreibt, indem Zeichenmuster und Randmu­ ster des Formats in der Bildinformation erkannt werden;
Anzeigen (2104, 2107) der erkannten Zeichenmuster und Randmuster des Formats und der Mehrzahl der Eingabe­ bereiche (610 bis 613), in die Daten eingetragen werden sollen, in einem Bild;
Prüfen (2105, 2108), ob in den angezeigten Zei­ chenmustern und Randmustern des Formats und in den mehre­ ren Eingabebereichen (610 bis 613) Fehler vorhanden sind, und
Korrigieren (2106, 2109) der Zeichenmuster und der Randmuster und der Mehrzahl der Eingabebereiche (610 bis 613), falls Fehler vorhanden sind;
Erzeugen/Anzeigen (2110) wenigstens einer Feld­ verarbeitungsprozedur für die Bezugnahme auf die erkann­ ten Zeichenmuster und Randmuster des Formats und die die Dateneingabebereiche (610 bis 613) vorschreibende Infor­ mation, um in einige der Dateneingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einen der anderen Bereiche einzugebende Daten zu erzeugen und um diese erzeugten Daten in den entsprechenden Eingabebe­ reich einzugeben;
Prüfen (2111), ob in der angezeigten Feldverar­ beitungsprozedur Fehler vorhanden sind, und
Korrigieren (2112) der Feldverarbeitungsprozedur, falls Fehler vorhanden sind;
Lesen (2114) der Bildinformation bezüglich des Daten enthaltenden Formulars (210) von der Eingabeeinheit (3);
Korrigieren (2119) eines Positions- und/oder ei­ nes Ausrichtungsfehlers der Bildinformation bezüglich des Daten enthaltenden Formulars (210) in bezug auf die Bildinformation bezüglich des keine Daten enthaltenden Formulars (201);
Unterscheiden (2121) des Formats und der Daten in der Bildinformation bezüglich des Daten enthaltenden For­ mulars (210) auf der Grundlage der erkannten Zeichenmu­ ster und Randmuster des Formats und der die Dateneingabe­ bereiche (610 bis 613) vorschreibenden Information, um in jedem Dateneingabebereich (610 bis 613) gleiche Muster zu erkennen;
Ausführen (2126) der Feldverarbeitungsprozedur bezüglich der erkannten Zeichendaten;
Anzeigen (2127) der erkannten Zeichendaten und der durch die Feldverarbeitungsprozedur erhaltenen Daten in einem Bild durch die Kombination von Datenklassen be­ züglich des Formats;
Prüfen (2128), ob in den in einem Bild angezeig­ ten Zeichendaten Fehler vorhanden sind,
Korrigieren (2129) der Zeichendaten, falls Fehler vorhanden sind, und anschließend
Wiederholen der Feldverarbeitungsprozedur (2126) bezüglich der korrigierten Zeichendaten; und
Speichern (2130) der erkannten Zeichendaten und der durch die Feldverarbeitungsprozedur erhaltenen Daten in einer Speichereinrichtung (5) durch die Kombination dieser Datenklassen bezüglich des Formats, falls in den angezeigten Zeichendaten keine Fehler mehr vorhanden sind.
DE4216893A 1991-05-21 1992-05-21 Dateneingabeverfahren Expired - Fee Related DE4216893C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3115857A JPH04343190A (ja) 1991-05-21 1991-05-21 文字データ入力方式

Publications (2)

Publication Number Publication Date
DE4216893A1 true DE4216893A1 (de) 1992-11-26
DE4216893C2 DE4216893C2 (de) 1994-12-15

Family

ID=14672863

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4216893A Expired - Fee Related DE4216893C2 (de) 1991-05-21 1992-05-21 Dateneingabeverfahren

Country Status (4)

Country Link
US (1) US5857034A (de)
JP (1) JPH04343190A (de)
KR (1) KR100228321B1 (de)
DE (1) DE4216893C2 (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4307577A1 (en) * 1992-03-10 1993-09-23 Hitachi Ltd Document information processing system for FAX transmissions - has information stored and used with databank of stored information to provide correct code data for generating transmission
DE4308291A1 (de) * 1993-03-16 1994-09-22 Assem Audi & Co Gmbh Verfahren und Vorrichtung zur vorgangsbezogenen Erstellung und Bearbeitung von Dokumenten
US5666549A (en) * 1992-03-10 1997-09-09 Hitachi, Ltd. Method and system for processing a document transmitted via facsimile in an initially input form stored in a knowledge base
US6559968B1 (en) 1998-06-19 2003-05-06 Canon Kabushiki Kaisha Copying selected regions of documents
DE4409198B4 (de) * 1994-03-17 2008-07-17 Areva Np Gmbh Einrichtung zur fotografischen Dokumentation einer Anlage

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3547025B2 (ja) * 1994-08-23 2004-07-28 株式会社リコー 情報抽出方法
DE69638207D1 (de) 1995-07-31 2010-08-05 Fujitsu Ltd Prozessor und Verarbeitungsverfahren für Dokumente
CN100538724C (zh) * 1995-07-31 2009-09-09 富士通株式会社 数据媒体处理装置及数据媒体处理方法
US7519558B2 (en) 1997-08-27 2009-04-14 Ballard Claudio R Biometrically enabled private secure information repository
US8024269B1 (en) 1997-08-27 2011-09-20 Datatreasury Corporation Remote image capture with centralized processing and storage
JP3574584B2 (ja) * 1998-12-16 2004-10-06 富士通株式会社 表画像処理装置及びそのプログラム記憶媒体
US6760490B1 (en) * 2000-09-28 2004-07-06 International Business Machines Corporation Efficient checking of key-in data entry
US7475333B2 (en) 2001-06-01 2009-01-06 Sap Ag Defining form formats with layout items that present data of business application
US7234105B2 (en) * 2001-09-20 2007-06-19 Sap Ag Methods and systems for providing a document with interactive elements to retrieve information for processing by business applications
US7171615B2 (en) 2002-03-26 2007-01-30 Aatrix Software, Inc. Method and apparatus for creating and filing forms
US7979348B2 (en) * 2002-04-23 2011-07-12 Clearing House Payments Co Llc Payment identification code and payment system using the same
WO2004107257A1 (ja) * 2003-05-30 2004-12-09 Fujitsu Limited 帳票処理プログラム、方法及び装置
US8725607B2 (en) 2004-01-30 2014-05-13 The Clearing House Payments Company LLC Electronic payment clearing and check image exchange systems and methods
JP4919028B2 (ja) * 2006-03-03 2012-04-18 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
US7711191B2 (en) * 2006-12-21 2010-05-04 Michael John Kosek Electronic transaction processing server with automated transaction evaluation
FR2924834B1 (fr) * 2007-12-10 2010-12-31 Serensia Procede et systeme ameliores de saisie assistee notamment pour outils de gestion informatique
US11295308B1 (en) 2014-10-29 2022-04-05 The Clearing House Payments Company, L.L.C. Secure payment processing
US11694168B2 (en) 2015-07-01 2023-07-04 The Clearing House Payments Company L.L.C. Real-time payment system, method, apparatus, and computer program
US11042882B2 (en) 2015-07-01 2021-06-22 The Clearing House Payments Company, L.L.C. Real-time payment system, method, apparatus, and computer program
US11436577B2 (en) 2018-05-03 2022-09-06 The Clearing House Payments Company L.L.C. Bill pay service with federated directory model support
US11861302B2 (en) 2019-02-04 2024-01-02 Aatrix Software, Inc. AUF XML specification compiler
SG10201904175UA (en) * 2019-05-09 2020-12-30 Mastercard International Inc Methods and systems for facilitating message format discovery in online transaction processing
JP6960646B6 (ja) * 2021-03-23 2021-12-01 株式会社 YSK e−com 読取システム、読取プログラムおよび読取方法
JP6994727B1 (ja) * 2021-03-23 2022-01-14 株式会社 YSK e-com 読取システム、読取プログラムおよび読取方法
US11829701B1 (en) * 2022-06-30 2023-11-28 Accenture Global Solutions Limited Heuristics-based processing of electronic document contents

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4020462A (en) * 1975-12-08 1977-04-26 International Business Machines Corporation Method and apparatus for form removal from contour compressed image data
DE3128794A1 (de) * 1981-07-21 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann.
DE3414455A1 (de) * 1983-04-26 1984-10-31 Peter-Michael 6057 Dietzenbach Wollang Verfahren und vorrichtung zum lesen und speichern von information
EP0262462A2 (de) * 1986-09-30 1988-04-06 Siemens Aktiengesellschaft Verfahren zum Interpretieren formularhafter Dokumente
WO1989011703A1 (en) * 1988-05-20 1989-11-30 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5771072A (en) * 1980-10-20 1982-05-01 Sharp Corp Electronic computer
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
JPS63155386A (ja) * 1986-12-19 1988-06-28 Ricoh Co Ltd 帳票デ−タ読取装置
US5040226A (en) * 1988-05-31 1991-08-13 Trw Financial Systems, Inc. Courtesy amount read and transaction balancing system
JPH02201588A (ja) * 1989-01-31 1990-08-09 Toshiba Corp 文字読取装置
US5140650A (en) * 1989-02-02 1992-08-18 International Business Machines Corporation Computer-implemented method for automatic extraction of data from printed forms
IL91220A (en) * 1989-08-04 1995-03-30 Ibm Israel Compression of information
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
US5258855A (en) * 1991-03-20 1993-11-02 System X, L. P. Information processing methodology
US5293429A (en) * 1991-08-06 1994-03-08 Ricoh Company, Ltd. System and method for automatically classifying heterogeneous business forms

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4020462A (en) * 1975-12-08 1977-04-26 International Business Machines Corporation Method and apparatus for form removal from contour compressed image data
DE3128794A1 (de) * 1981-07-21 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann.
DE3414455A1 (de) * 1983-04-26 1984-10-31 Peter-Michael 6057 Dietzenbach Wollang Verfahren und vorrichtung zum lesen und speichern von information
EP0262462A2 (de) * 1986-09-30 1988-04-06 Siemens Aktiengesellschaft Verfahren zum Interpretieren formularhafter Dokumente
WO1989011703A1 (en) * 1988-05-20 1989-11-30 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4307577A1 (en) * 1992-03-10 1993-09-23 Hitachi Ltd Document information processing system for FAX transmissions - has information stored and used with databank of stored information to provide correct code data for generating transmission
US5666549A (en) * 1992-03-10 1997-09-09 Hitachi, Ltd. Method and system for processing a document transmitted via facsimile in an initially input form stored in a knowledge base
DE4307577C2 (de) * 1992-03-10 2000-12-28 Hitachi Ltd Verfahren und Vorrichtung zur Dokumentenverarbeitung
DE4308291A1 (de) * 1993-03-16 1994-09-22 Assem Audi & Co Gmbh Verfahren und Vorrichtung zur vorgangsbezogenen Erstellung und Bearbeitung von Dokumenten
DE4308291C2 (de) * 1993-03-16 1998-02-26 Assem Audi & Co Gmbh Verfahren und Vorrichtung zur vorgangsbezogenen Erstellung und Bearbeitung von Dokumenten
DE4409198B4 (de) * 1994-03-17 2008-07-17 Areva Np Gmbh Einrichtung zur fotografischen Dokumentation einer Anlage
US6559968B1 (en) 1998-06-19 2003-05-06 Canon Kabushiki Kaisha Copying selected regions of documents

Also Published As

Publication number Publication date
KR920022125A (ko) 1992-12-19
DE4216893C2 (de) 1994-12-15
JPH04343190A (ja) 1992-11-30
US5857034A (en) 1999-01-05
KR100228321B1 (ko) 1999-11-01

Similar Documents

Publication Publication Date Title
DE4216893C2 (de) Dateneingabeverfahren
DE4091841C2 (de) Verfahren zum Erzeugen einer Formulardarstellung und Bildschirm-Formularerzeugungssystem
DE3650554T2 (de) Speicherungs- und Wiederauffindungsverfahren für Bilddaten
DE3855468T2 (de) Rechnersystem für fortschrittliche finanzielle Anwendungen
DE69123083T2 (de) Dokumentverarbeitung
DE3856404T2 (de) Datenverwaltungssystem
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE3411939C2 (de)
DE68926068T2 (de) Dokumentenverarbeitungssystem
DE69302003T2 (de) Dateneingabeanlage
DE69602364T2 (de) Rechnersystem um semantische objektmodelle von existierenden relationellen datenbanksystemen herzustellen
DE69026252T2 (de) Verfahren und Vorrichtung zum elektronischen Datenaustausch
DE3588084T2 (de) Bildverarbeitungssystem
EP1669852B1 (de) Verfahren und Computerprogramm zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei
DE69127672T2 (de) Zielorientiertes elektronisches Formblattsystem
DE69434405T2 (de) Verfahren zur Erzeugung eines visuellen Entwurfs
EP1902407B1 (de) System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung
DE69032585T2 (de) Elektronisches Dateispeicherungssystem
DE68928068T2 (de) Verfahren und Apparat zum Formatieren von Dokumenten
DE60310881T2 (de) Methode und Benutzerschnittstelle für das Bilden einer Darstellung von Daten mit Meta-morphing
DE69515476T2 (de) Verfahren und system zum überprüfen von druckaufträgen für anwendungen mit kurzen druckvorgängen
DE68928254T2 (de) Datenverarbeitungsgerät
DE69425480T2 (de) Dokumentaufbereitungsapparat
DE60123730T2 (de) Gerät und Verfahren zur Bestimmung des Formats von Dokumenten
DE102012025350A1 (de) Verarbeitungn eines elektronischen Dokuments

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8125 Change of the main classification

Ipc: G06K 9/62

D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee