DE4216893A1 - Verfahren zur eingabe von zeichendaten - Google Patents
Verfahren zur eingabe von zeichendatenInfo
- Publication number
- DE4216893A1 DE4216893A1 DE4216893A DE4216893A DE4216893A1 DE 4216893 A1 DE4216893 A1 DE 4216893A1 DE 4216893 A DE4216893 A DE 4216893A DE 4216893 A DE4216893 A DE 4216893A DE 4216893 A1 DE4216893 A1 DE 4216893A1
- Authority
- DE
- Germany
- Prior art keywords
- data
- image information
- character
- format
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Description
Die vorliegende Erfindung betrifft die Verarbeitung von
auf eine Rechnung oder einen Listenbeleg geschriebenen
Zeichendaten mittels eines Computers und insbesondere ein
Verfahren zur Eingabe von Zeichendaten mittels eines op
tischen Klarschriftlesers (der im folgenden mit OCR be
zeichnet wird) ohne Verwendung eines speziellen Formu
lars.
Bisher werden OCRs üblicherweise dazu verwendet, auf
Rechnungen oder Listenbelegen vorhandene Zeichendaten
einzugeben. Für OCRs wird ein spezieller Listenbeleg ver
wendet, so daß zum Zeitpunkt der Eingabe das Format aus
geblendet werden kann, um ausschließlich die Zeichendaten
zu lesen (wobei das Format in diesem Fall Ränder, gezo
gene Linien und Eintragungsraum-Namen umfaßt und diese
Ränder, Linien, Eintragungsraum-Namen und die Beziehungen
zwischen den Eintragungsräumen normalerweise vorhanden
sind). Es ist außerdem ein System entwickelt worden, in
dem die auf einem Listenbeleg vorhandenen Zeichen gelesen
werden können, ohne daß ein solcher spezieller Listenbe
leg verwendet wird.
Beispielsweise werden in dem aus der
JP S60-1 60 486-A bekannten System Musterdaten, die einer
Zeichenzeile entsprechen und in auf einem Listenbeleg
vorhandene Zeichenränder eingepaßt sind, in einem Spei
cher gespeichert, außerdem wird anhand der Zeichenrandda
ten ein Zeichenrandmuster aus dem Speicher erfaßt, um in
bezug auf jedes Zeichen ein Zeichenmuster "herauszu
schneiden", wodurch eine Zeichenerkennung ausgeführt
wird. Dieses herkömmliche System hat die im folgenden be
schriebenen Probleme zur Folge.
Obwohl in diesem System kein spezieller Listenbeleg mehr
erforderlich ist, können Zeichendaten, die nicht von Rän
dern umgeben sind, unterstrichene Zeichendaten und Zei
chendaten, die sich innerhalb von an den Ecken abgerunde
ten Rändern befinden, also Zeichendaten, die in normalen
Listenbelegen üblicherweise angetroffen werden, nicht
korrekt erkannt werden. Ferner muß die Erkennung für jede
Zeile ausgeführt werden, falls ein Eingabebereich wie im
Fall von normalen Listenbelegen mehrere Zeilen enthält.
Außerdem müssen das Problem, daß ein Listenbeleg bei sei
ner Eingabe verschoben oder leicht gedreht oder falsch
ausgerichtet ist und das Problem, daß die Randlinien
eines Listenbelegs verschoben sind, wenn der Listenbeleg
in Kopie verwendet wird, gelöst werden.
Bisher sind die Werte von Summen-Räumen oder dergleichen
auf einem Listenbeleg direkt von dem Beleg gelesen wor
den, wobei es jedoch notwendig ist, daß der Benutzer
durch Rechnen bestätigt, ob diese Werte richtig gelesen
worden sind. Außerdem muß die Übereinstimmung in einer
Gruppe von besonderen Datenelementen wie etwa von Kunden
namen und Kundenkodes oder von Produktnamen und Pro
duktkodes, die mittels Kodes aufeinander bezogen sind,
geprüft werden.
Es ist daher eine Aufgabe der vorliegenden Erfindung, ein
Verfahren zur Eingabe von Zeichendaten zu schaffen, mit
dem sowohl auf herkömmlichen Listenbelegen oder Rechnun
gen befindliche Zeichendaten, die nicht von Rändern umge
ben sind, die unterstrichen sind oder die sich innerhalb
von an den Ecken abgerundeten Rändern befinden, als auch
Daten in einer speziellen OCR-Form in einen Computer ein
gegeben werden können.
Es ist eine weitere Aufgabe der vorliegenden Erfindung,
ein Verfahren zur Eingabe von Zeichendaten zu schaffen,
mit dem eine Kopie eines Listenbelegs verwendet werden
kann, indem eine eventuelle Verschiebung des Formates des
kopierten Listenbelegs korrigiert wird, und mit dem ein
bei der Eingabe des Listenbelegs erzeugter Positions-
oder Ausrichtungsfehler des Listenbelegs korrigiert wird.
Es ist eine weitere Aufgabe der vorliegenden Erfindung,
ein Verfahren zur Eingabe von Zeichendaten zu schaffen,
mit dem die auf einer Rechnung oder einem Listenbeleg
aufgezeichneten Daten geprüft werden können.
Diese Aufgaben werden gemäß einem Aspekt der vorliegenden
Erfindung gelöst durch ein Verfahren, das die folgenden
Schritte umfaßt: Lesen von Bildinformation bezüglich ei
nes Formulars, das nur ein Format aufweist und auf dem
keine Daten vorhanden sind, von einer Eingabeeinheit zur
Eingabe von Bildinformation, Erzeugen einer Feldinforma
tion, die die Eingabebereiche festlegt, indem ein Zei
chenmuster und ein Randmuster des in der gelesenen
Bildinformation enthaltenen Formats erkannt wird, Spei
chern des Zeichenmusters, des Randmusters und der einge
gebenen Feldinformation als erste Information, Lesen ei
ner Bildinformation bezüglich einer Seite des gleichen,
jedoch Daten enthaltenden Formulars von der Eingabeein
heit und Unterscheiden des Formats und der Daten dieser
Bildinformation auf der Grundlage der ersten Information,
um ein Zeichenmuster eines jeden Datenabschnittes zu er
kennen und um eine zweite Information zu bilden, die die
einem jeden Eingabebereich entsprechenden Daten umfaßt.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung
wird ein Verfahren zur Eingabe von Zeichendaten geschaf
fen, das die folgenden Schritte umfaßt: Lesen von Bildin
formation bezüglich eines Formulars, das nur ein Format
aufweist und auf dem keine Daten vorhanden sind, von ei
ner Eingabeeinheit zur Eingabe von Bildinformation, Er
zeugen einer die Eingabebereiche festlegenden Feldinfor
mation durch Erkennen eines Zeichenmusters und eines
Randmusters des in der gelesenen Bildinformation enthal
tenden Formats, Speichern des Zeichenmusters, des Randmu
sters und der Eingabe-Feldinformation als erste Informa
tion, Lesen der Bildinformation bezüglich einer Seite des
gleichen, jedoch Daten enthaltenden Formulars von der
Eingabeeinheit und Korrigieren eines Positionsfehlers
und/oder eines Ausrichtungsfehlers der Bildinformation
bezüglich der die Daten enthaltenden Formularseite auf
der Grundlage der ersten Information, um eine Abweichung
der Bildinformation bezüglich der die Daten enthaltenden
Formularseite in bezug auf die Bildinformation der Formu
larseite, die das Format, jedoch keine Daten enthält, zu
korrigieren.
Gemäß einem weiteren Aspekt der Erfindung wird ein Ver
fahren zur Eingabe von Zeichendaten geschaffen, das die
folgenden Schritte umfaßt: Erzeugen wenigstens einer Ver
arbeitungsprozedur bezüglich eines Formats und von in ei
nem Formular vorhandenen Daten, die eine zweite Informa
tion darstellen, entsprechend den Format-Ausdrücken durch
die Bezugnahme auf die erste Information, Speichern von
durch diese Verarbeitung der zweiten Information erhalte
ner Information als dritter Information und Anzeigen
sowohl der zweiten als auch der dritten Information.
Die Information bezüglich der Formularseite, die nur ein
Format und keinerlei Zeichendaten enthält, wird als
Bildinformation gelesen, wobei das Format des Formulars
als Formatinformation erzeugt wird. Die Zeichendatenein
gabebereich-Information wird anhand dieser Formatinforma
tion gebildet. Die Formatinformation und die Zeichenda
teneingabebereich-Information bilden die erste Informa
tion. Die in dem Formular vorhandenen Zeichendaten, die
solche Zeichendaten umfassen können, die in einer übli
chen Rechnung, in einem üblichen Listenbeleg oder der
gleichen angetroffen werden und nicht von Rändern umgeben
sind, werden auf der Grundlage der ersten Information ge
lesen, so daß die nicht von Rändern umgebenen Zeichenda
ten, unterstrichene Zeichendaten und Zeichendaten, die
von an den Ecken abgerundeten Rändern umgeben sind, ein
gegeben werden können. Das bedeutet, daß Daten auf einer
normalen Rechnung oder einem normalen Listenbeleg mittels
einer OCR-Eingabeeinheit in einen Computer eingegeben
werden können.
Außerdem können erfindungsgemäß ein bei der Eingabe eines
Formulars in die Eingabeeinheit auftretender Positions
fehler und/oder ein Ausrichtungsfehler des die Zeichenda
ten enthaltenden Formulars ebenso wie ein Verschreibungsfehler
des Formulars korrigiert werden, so daß die Bedie
nungsperson nicht darauf achten muß, bei der Eingabe des
Formulars einen Positionsfehler oder einen Ausrichtungs
fehler des Formulars zu verhindern.
Ferner wird bezüglich der zweiten Information eine Verar
beitungsprozedur geschaffen; diese Verarbeitung wird so
ausgeführt, daß eine Zwischensumme und die Gesamtsumme
von in die Eingabebereiche geschriebenen Werten
(Eingabedaten), Ergebnisse einer Steuerberechnung (z B.
der Addition einer Verbrauchssteuer) und die Eingabedaten
angezeigt werden können, wodurch es möglich ist, die
Richtigkeit der eingegebenen Zeichendaten sofort zu prü
fen.
Weitere Aufgaben, Merkmale und Vorteile der Erfindung
sind in den Unteransprüchen, die sich auf eine besondere
Ausführungsform der vorliegenden Erfindung beziehen, an
gegeben.
Die Erfindung wird im folgenden anhand einer bevorzugten
Ausführungsform mit Bezug auf die Zeichnungen näher er
läutert; es zeigt
Fig. 1 ein Blockschaltbild einer Ausführungsform der
vorliegenden Erfindung;
Fig. 2 ein Flußdiagramm einer Zeichendatenverarbei
tung gemäß der Ausführungsform der vorliegen
den Erfindung;
Fig. 3 ein Diagramm des Hauptablaufs der Verarbei
tung gemäß der Ausführungsform der vorliegen
den Erfindung;
Fig. 4 ein Flußdiagramm einer Vorbereitungsverarbei
tung gemäß der Ausführungsform der vorliegen
den Erfindung;
Fig. 5 eine Darstellung von gespeicherten Ergebnis
sen der Erkennung von Rändern und von Zeichen
bezüglich eines Formats gemäß der Ausfüh
rungsform der vorliegenden Erfindung;
Fig. 6 eine Darstellung einer gespeicherten Feldin
formation, d. h. der Ergebnisse der Erkennung
von Zeichendaten-Eingabebereichen, gemäß der
Ausführungsform der vorliegenden Erfindung;
Fig. 7 eine Darstellung eines Beispiels für die Grö
ßenangabe eines Zeichendaten-Eingabebereichs;
Fig. 8 ein Flußdiagramm der Feldverarbeitungsproze
dur gemäß der Ausführungsform der vorliegen
den Erfindung;
Fig. 9 eine Darstellung eines Beispiels für den In
halt einer Datei, in der erkannte Zeichenda
ten gemäß der Ausführungsform der vorliegen
den Erfindung gespeichert sind;
Fig. 10 eine Darstellung eines Beispiels für die De
finition der Verarbeitung einer Wissensdaten
bank gemäß der Ausführungsform der vorliegen
den Erfindung;
Fig. 11 eine Darstellung eines Beispiels der Verar
beitung zur Anzeige von "Kanji"-Daten (d. h.
von japanischen Ideogrammen) unter Verwen
dung einer Hauptdatei gemäß der Ausführungs
form der vorliegenden Erfindung;
Fig. 12 ein Flußdiagramm einer Verarbeitung gemäß der
Ausführungsform der vorliegenden Erfindung,
die ausgeführt wird, wenn eine Rechnung oder
ein Listenbeleg eingegeben wird, auf dem Zei
chendaten vorhanden sind;
Fig. 13 ein Flußdiagramm eines Beispiels einer Bild
korrekturverarbeitung und einer Zeichenda
tenerkennungsverarbeitung gemäß der Ausfüh
rungsform der vorliegenden Erfindung;
Fig. 14 eine schematische Darstellung von Beispielen
eines Bildes und einer Bildinformation gemäß
der Ausführungsform der vorliegenden Erfin
dung;
Fig. 15 eine schematische Darstellung eines Beispiels
eines Fehlers bei der Eingabe eines Formu
lars;
Fig. 16 ein Flußdiagramm eines Beispiels einer For
matkorrekturverarbeitung gemäß der Ausfüh
rungsform der vorliegenden Erfindung;
Fig. 17 eine schematische Darstellung eines Beispiels
einer Bezugslinie, die in der Formatkorrek
turverarbeitung gemäß der Ausführungsform der
vorliegenden Erfindung verwendet wird;
Fig. 18 eine schematische Darstellung eines Beispiels
eines Verfahrens zur Bestimmung der Korrek
turwerte in der Formatkorrekturverarbeitung
gemäß der Ausführungsform der vorliegenden
Erfindung;
Fig. 19 eine schematische Darstellung von Beispielen
von Eingabebereichen, in denen gezogene Li
nien gemäß der Ausführungsform der vorliegen
den Erfindung vorhanden sind;
Fig. 20 eine schematische Darstellung eines Beispiels
einer Verarbeitung zum Entnehmen von Zeichen
daten durch Beseitigen der Linieninformation
aus den Bilddaten gemäß der Ausführungsform
der vorliegenden Erfindung;
Fig. 21A ein Flußdiagramm gemäß der Ausführungsform
der vorliegenden Erfindung; und
Fig. 21B ein weiteres Flußdiagramm gemäß der Ausfüh
rungsform der vorliegenden Erfindung.
Fig. 1 ist eine Darstellung des Gesamtaufbaus eines In
formationsverarbeitungssystems, in dem die vorliegende
Erfindung angewendet wird. Das in Fig. 1 gezeigte Infor
mationsverarbeitungssystem umfaßt einen Bedienerplatz 1,
einen mit dem Bedienerplatz 1 verbundenen Prozessor 2,
eine mit dem Prozessor 2 über einen Übertragungsweg 9
verbundene Steuereinrichtung 4, eine mit der Steuerein
richtung 4 verbundene und von dieser gesteuerte Eingabe
einheit 3, eine mit dem Übertragungsweg 9 verbundene
Steuereinrichtung 6, eine mit der Steuereinrichtung 6
verbundene und von dieser gesteuerte Speicherplattenein
heit 5, eine mit dem Übertragungsweg 9 verbundene und zur
Ausführung der Verarbeitung des Prozessors dienende Ver
arbeitungseinheit 7 und eine mit dem Übertragungsweg 9
verbundene und zum Speichern von Daten verwendete Daten
einheit 8.
Die Verarbeitungseinheit 7 besitzt einen Gesamtsteuerab
schnitt 7A, einen Rechnung/Listenbeleg-Eingabeabschnitt
7B, einen Rechnung/Listenbeleg-Erkennungsabschnitt 7C,
einen Zeichendaten-Erkennungsabschnitt 7D, einen Feldver
arbeitungsabschnitt 7E, einen Bildanzeigeabschnitt 7F und
einen Datenspeicherabschnitt 7G. Die Dateneinheit 8 um
faßt einen Formatinformation-Speicherbereich 8A, einen
Feldinformation-Speicherbereich 8B, einen Zeichendaten-
Speicherbereich 8C, einen Bilddaten-Speicherbereich 8D,
einen Feldverarbeitungsprozedur-Speicherabschnitt 8E,
einen Arbeitsbereich 8F und eine Wissensbasis 8G.
Wenn der Gesamtsteuerabschnitt 7A vom Prozessor 2 gerufen
wird, speichert er ein Bild, das von der Eingabeeinheit 3
in den Rechnung/Listenbeleg-Eingabeabschnitt 7B eingege
ben worden ist, im Bilddaten-Speicherbereich 8D.
Wenn eine Rechnung oder ein Listenbeleg, auf dem keine
Zeichendaten vorhanden sind, eingegeben wird, veranlaßt
der Gesamtsteuerabschnitt 7A den Rechnung/Listenbeleg-Er
kennungsabschnitt 7C dazu, gezogene Linien und Zeichen
entsprechend dem Format der Bilddaten zu erkennen, die im
Bilddaten-Speicherbereich 8D auf der Grundlage einer in
der Speicherplatteneinheit 5 vorhandenen Wissensbasis ge
speichert sind, um die erkannte Formatinformation im For
matinformation-Speicherbereich 8A zu speichern. Der Rech
nung/Listenbeleg-Erkennungsabschnitt 7C legt die Zeichen
daten-Eingabebereiche fest, bereitet die Feldverarbei
tungsprozeduren vor und speichert die Eingabebereiche und
die Feldverarbeitungsprozeduren im Feldinformation-
Speicherbereich 8B bzw. im Feldverarbeitungsprozedur-
Speicherabschnitt 8E.
Die Speicherplatteneinheit 5 enthält Dateien, die dem
Formatinformation-Speicherbereich 8A, dem Feldinforma
tion-Speicherbereich 8B, dem Zeichendaten-Speicherbereich
8C, dem Bilddaten-Speicherbereich 8D, dem Feldverarbei
tungsprozedur-Speicherabschnitt 8E bzw. der Wissensbasis
8G entsprechen. Nach der Verarbeitung in der Dateneinheit
8 werden in den entsprechenden Dateien der Speicherplat
teneinheit 5 die jeweiligen Datenklassen gespeichert.
Wenn in der jeweiligen Datei gespeicherte Daten verwendet
werden, werden sie in den entsprechenden Speicherbereich
der Dateneinheit 8 eingelesen, um verarbeitet zu werden.
Um der Erleichterung der Erläuterung willen wird der
Speichervorgang von Daten aus dem jeweiligen Speicherbe
reich in die Speicherplatteneinheit 5 und der Lesevorgang
von Daten aus der Speicherplatteneinheit 5 in den jewei
ligen Speicherbereich in der folgenden Beschreibung nicht
jedesmal explizit erwähnt.
Wenn eine Rechnung oder ein Listenbeleg, auf dem Zeichen
daten vorhanden sind, von der Eingabeeinheit 3 als Bild
eingegeben wird, wird dieses eingegebene Bild im Bildda
ten-Speicherbereich 8D vom Rechnung/Listenbeleg-Erken
nungsabschnitt 7C temporär gespeichert. Dann werden auf
grund eines Befehls vom Zeichendaten-Erkennungsabschnitt
7D Zeichen erkannt, indem die Zeichendaten entsprechend
der Formatinformation im Formatinformation-Speicherbe
reich 8A und der Feldinformation im Feldinformation-
Speicherbereich 8B unter Verwendung des Arbeitsbereichs
8F aus den Bilddaten entnommen werden. Die erkannten Zei
chen werden im Zeichendaten-Speicherbereich 8C gespei
chert. Der Feldverarbeitungsabschnitt 7E führt eine Feld
verarbeitung entsprechend den im Feldverarbeitungsproze
dur-Speicherabschnitt 8E gespeicherten Feldverarbeitungs
prozeduren bezüglich der im Zeichendaten-Speicherbereich
8C gespeicherten Zeichendaten aus und zeigt die Ergeb
nisse der Feldverarbeitung und die im Zeichendaten-
Speicherbereich 8C gespeicherten Zeichendaten oder die im
Bilddaten-Speicherbereich 8D gespeicherten Bilddaten mit
tels des Bildanzeigeabschnittes 7F als Bild an. Die er
kannten Daten können unter Verwendung der von der Bedie
nungsperson ausgeführten Prüfungs- und Korrekturverarbei
tung und der Feldverarbeitung automatisch korrigiert wer
den. Danach speichert der Datenspeicherabschnitt 7G diese
Datenklassen in einer von der Speicherplatteneinheit 5
oder von einer Bedienungsperson bezeichneten Hauptdatei.
In Fig. 2 ist der Ablauf der Operationen gezeigt, wenn
Zeichendaten eingegeben werden. Ein Beleg 201, auf dem
keine (individuellen) Zeichendaten vorhanden sind, wird
von einer Leseeinheit wie etwa einem Fernkopierer oder
einem Bildleser eingegeben (Schritt 202). Zu diesem Zeit
punkt kann eine fehlerhafte Ausrichtung der eingegebenen
Bilddaten korrigiert werden. Alternativ kann eine Dis
kette (Floppy Disk, im folgenden mit FD bezeichnet) ein
gelegt werden, auf der eine ein Belegformat dokumentie
rende Textverarbeitungsspezifikation aufgezeichnet ist.
Im Schritt 203 werden anhand des eingegebenen Bildes oder
einer Dokumentations-FD Zeichen und Linien auf dem Beleg
erkannt. Die Positionen und die Namen der Eingabefelder
werden anhand der Zeichenreihen und der Linien erkannt.
Die Ergebnisse dieser Bestimmung werden als Bild, wie es
etwa durch das Anzeigebeispiel 204 dargestellt ist, zu
sammen mit den bestimmten Eingabefeldern (Eingabebereiche
sind schraffiert dargestellt) angezeigt. Im Schritt 205
kann die Bedienungsperson eine Prüfung und gegebenenfalls
eine Korrektur ausführen.
Im Schritt 206 werden anhand der Inhalte der Zeichenrei
hen und der Positionen und der Namen der Felder die Be
ziehungen zwischen den Feldern und den Feldeigenschaften
erkannt, um Feldverarbeitungsprozeduren vorzubereiten.
Diese Feldverarbeitungsprozeduren werden ausgeführt, um
anhand der in einigen der Felder (Eingabebereichen) vor
handenen und erkannten Zeichendaten solche Zeichendaten
zu bilden, die in andere Felder aufgenommen werden sol
len, und um die Eignung der in die anderen Felder aufzu
nehmenden Zeichendaten zu verifizieren.
Die Information bezüglich der anhand des Bildes erkannten
Zeichenreihen und Linien wird im Formatinformation-
Speicherbereich 8A gespeichert, während die gebildeten
Informationspositionen und -namen im Feldinformation-
Speicherbereich 8B gespeichert werden. Die gebildeten
Feldverarbeitungsprozeduren werden im Feldverarbeitungs
prozedur-Speicherabschnitt 8E gespeichert. Damit ist die
Vorbereitungsverarbeitung abgeschlossen.
Die oben beschriebene Zeichen- und Linienerkennungsverar
beitung und die Feldverarbeitungsprozedur-Erzeugungsver
arbeitung sind im wesentlichen gleich der Vorverarbei
tung, der Erkennungsverarbeitung der physikalischen
Struktur und der Listenbeleg-Erzeugungsverarbeitung, wie
sie aus der vom Anmelder der vorliegenden Erfindung ein
gereichten JP H2-1 75 246-A bekannt sind.
Nun wird eine Verarbeitung zur Eingabe eines Listenbele
ges beschrieben, auf dem Zeichendaten vorhanden sind.
Im Schritt 211 wird eine Belegseite 210, auf der Zeichen
daten vorhanden sind, eingegeben, ferner werden ein Aus
richtungsfehler und/oder ein Positionsfehler der eingege
benen Bilddaten korrigiert. Im Schritt 212 werden die
Zeichendaten erkannt, indem auf der Grundlage der For
matinformation und der Feldinformation, die im Formatin
formation-Speicherbereich 8A und im Feldinformation-
Speicherbereich 8B gespeichert sind, aus den Bilddaten
lediglich die Zeichendaten "herausgeschnitten" werden. Im
Schritt 213 werden die erkannten ("herausgeschnittenen")
Zeichendaten im Zeichendaten-Speicherbereich 8C gespei
chert. Im Schritt 214 wird entsprechend den im Feldverar
beitungsprozedur-Speicherabschnitt 8E gespeicherten Feld
verarbeitungsprozeduren eine Feldverarbeitung bezüglich
der erkannten Zeichendaten ausgeführt. In diesem Beispiel
werden die in den Koderäumen des Beleges 210 aufgezeich
neten Zeichen A100, B200 gelesen, außerdem werden die die
durch die Kodes A100 bzw. B200 bezeichneten Ausdrücke
"Äpfel" bzw. "Orangen" (oder, wie in der Zeichnung darge
stellt, die entsprechenden japanischen Ideogramme
("Kanji"-Daten) und phonetischen Symbole ("Katakana"-Da
ten)) in diejenigen Felder eingetragen, die den Artikel
räumen entsprechen, die aufgrund der Verarbeitung den
Kodes A100 bzw. B200 zugeordnet worden sind. Dann werden
die Einheiten-Preise (Stückpreis oder Kilopreis oder
dergleichen) der durch A100 bzw. B200 bezeichneten Äpfel
und Orangen abgerufen, anschließend werden diese Einhei
ten-Preise mit den in den Mengenräumen vorhandenen Zahlen
multipliziert. Die Ergebnisse dieser Berechnung werden in
die den Summenräumen entsprechenden Felder eingegeben.
Die Zahlen 2000 und 1000 in den Summenräumen werden ad
diert, anschließend wird bezüglich der Summe 3000 ein
Verbrauchssteuerbetrag 90 errechnet und in ein dem Ver
brauchssteuer-Raum entsprechendes Feld eingegeben. An
schließend werden die Summe 3000 und der berechnete Ver
brauchssteuerbetrag addiert, schließlich wird der dadurch
erhaltene Wert 3090 in das dem Endsummenraum entspre
chende Feld eingegeben. Dann werden die Ausdrücke "Äpfel"
und "Orangen" (bzw. die entsprechenden japanischen Kanji-
und Katakana-Daten) und die Summen 2000, 1000, 90 und
3090, die durch die Feldverarbeitung bezüglich der er
kannten Zeichendaten-Positionen A100 und B200 erhalten
worden sind, in die Artikelräume und die Summenräume ein
getragen, wie durch das Anzeigebeispiel 215 dargestellt
ist.
Die angezeigten Daten werden von der Bedienungsperson be
stätigt, anschließend wird im Schritt 216 ein Eintra
gungsbefehl ausgeführt. Durch den Eintragungsbefehl wer
den die erkannten Zeichendaten-Positionen A100 und B200,
die Ausdrücke "Äpfel" und "Orangen" (bzw. die entspre
chenden japanischen Kanji- und Katakana-Daten) und die
Summen 2000, 1000, 90 und 3090, die durch die Feldverar
beitung erhalten worden sind, in einer Benutzer-Hauptda
tei 217 gespeichert.
Nun ist die Verarbeitung von der Eingabe bis zur endgül
tigen Datenspeicherung beschrieben worden. Wie in Fig. 3
gezeigt, umfaßt dieser Gesamtprozeß die Vorbereitungsver
arbeitung 301, in der Datenfelder (Eingabebereiche) fest
gelegt und Feldverarbeitungsprozeduren erzeugt werden,
und eine Listenbeleg-Eingabeverarbeitung 302, in der eine
Rechnung oder ein Listenbeleg, auf denen Daten vorhanden
sind, gelesen wird und eine Zeichenerkennung und eine
Feldverarbeitung der erkannten Zeichen ausgeführt werden.
In Fig. 4 ist der Ablauf der Vorbereitungsverarbeitung
301 gezeigt. Im Schritt 401 der Eingabeverarbeitung wird
von einer Fernkopierereinheit (Fax) 410 oder einem Bild
leser 411 ein Formular, auf dem keine Zeichendaten vor
handen sind, eingegeben. Anstatt der Eingabe von der
Fernkopierereinheit 410 oder vom Bildleser 411 kann eine
Dokumentations-FD, auf der das Format einer Rechnung
und/oder eines Listenbeleges aufgezeichnet sind, einge
legt werden. Wenn von der Fernkopierereinheit oder vom
Bildleser ein Formular eingegeben wird, in dem keine Zei
chendaten vorhanden sind, wird ein Ausrichtungsfehler der
eingegebenen Bilddaten korrigiert. Die Verarbeitung be
züglich dieser Ausrichtungsfehler-Korrektur ist gleich
derjenigen, wie sie aus der vom Anmelder der vorliegenden
Erfindung früher eingereichten JP H2-1 75 246-A bekannt
ist.
Im Schritt 402 der Bildspeicherungsverarbeitung werden
die bezüglich ihrer Ausrichtung korrigierten Bilddaten im
Arbeitsbereich temporär gespeichert. Diese Verarbeitung
ist in dem Fall, in dem eine Dokumentations-FD eingelegt
wird, nicht notwendig.
Im Schritt 403 der Rand- und Zeichenerkennungsverarbei
tung werden anhand der Bilddaten oder der Daten einer Do
kumentations-FD gezogene Linien und Zeichen erkannt, an
schließend werden die Ergebnisse dieser Verarbeitung im
Formatinformation-Speicherbereich 8A gespeichert. Diese
Verarbeitung zur Erkennung von Linien und Zeichen anhand
der Bilddaten ist ebenfalls gleich derjenigen der JP H2-
1 75 246-A. Die Formationsinformation gemäß dieser Ausfüh
rungsform entspricht TAL1, 3, 4, 5 der obenerwähnten frü
heren Anmeldung. Danach werden die Ergebnisse der Linien
und Zeichenerkennung als Bild auf dem Bildschirm des Be
dienerplatzes 1 angezeigt. Wenn diese Ergebnisse korri
giert werden müssen, wird eine Korrekturverarbeitung 404
ausgeführt, anschließend geht die Verarbeitung weiter zum
Schritt 405 der Zeichendatenbereich-Erkennungsverarbei
tung. Wenn die Ergebnisse nicht korrigiert werden müssen,
geht die Verarbeitung direkt weiter zum Schritt 405 der
Zeichendatenbereich-Erkennungsverarbeitung.
Im Schritt 405 der Zeichendatenbereich-Erkennungsverar
beitung werden auf der Grundlage der Formatinformation im
Formatinformation-Speicherbereich und der Wissensdaten
bank der Wissensbasis 8G die Zeichendatenbereiche festge
legt. Die Ergebnisse dieser Festlegung werden als Feldin
formation dargestellt. Diese Verarbeitung zur Festlegung
der Zeichendatenbereiche ist wiederum gleich der entspre
chenden Verarbeitung der obenerwähnten früheren Anmel
dung, in der A350 in Fig. 103 der Feldinformation der
vorliegenden Ausführungsform entspricht. Die gebildete
Feldinformation wird im Feldinformation-Speicherbereich
8B gespeichert und auf dem Bildschirm des Bedienerplatzes
1 angezeigt. Wenn diese Information korrigiert werden
muß, wird eine Korrekturverarbeitung 406 ausgeführt, wo
raufhin die Verarbeitung zum Schritt 407 der Feldverar
beitungsprozedur-Erzeugung weitergeht. Wenn keine Korrek
tur erforderlich ist, geht die Verarbeitung direkt zum
Schritt 407 der Feldverarbeitungsprozedur-Erzeugung wei
ter.
Im Schritt 407 der Feldverarbeitungsprozedur-Erzeugung
werden unter Bezugnahme auf Namen, Beziehungen und Merk
male der Felder (Zeichendaten-Eingabebereiche), die an
hand der Feldinformation im Feldinformation-Speicherbe
reich 8B und anhand der Wissensdatenbank der Wissensbasis
8G erzeugt worden sind, die notwendigen Feldverarbei
tungsprozeduren erzeugt. Die Feldverarbeitungsprozeduren
umfassen beispielsweise eine Verarbeitungsprozedur, in
der die Einheiten-Preise und die Mengen, die auf die Ar
tikelnamen bezogen sind, für die Felder mit dem Namen
"Summe" ausgelesen werden, um die Berechnung "Preis×
Menge" auszuführen und die Werte der Rechenergebnisse in
die Felder "Summe" einzugeben, und eine Verarbeitungspro
zedur, in der die in die Felder mit dem Namen "Summe"
eingegebenen Werte für ein Feld mit dem Namen
"Verbrauchssteuer" gelesen und addiert werden, die Be
rechnung "Gesamtsumme×0,03" ausgeführt wird und der
durch diese Berechnung erhaltene Wert in das Feld
"Verbrauchssteuer" eingetragen wird (wobei eventuell die
Stellen hinter dem Dezimalpunkt nicht dargestellt wer
den). Diese Verarbeitung zur Erzeugung der Feldverarbei
tungsprozeduren ist wiederum gleich der entsprechenden
Verarbeitung aus der obenerwähnten früheren Anmeldung.
Die erzeugten Verarbeitungsprozeduren werden im Feldver
arbeitungsprozedur-Speicherabschnitt 8E gespeichert und
auf dem Bildschirm des Bedienerplatzes 1 angezeigt. Gege
benenfalls werden sie durch eine Korrekturverarbeitung
408 korrigiert. Wenn keine Korrektur erforderlich ist,
geht die Verarbeitung direkt zum Schritt 409 der Erzeu
gung von Zeichendaten-Erkennungsparametern weiter.
Im Schritt 409 der Erzeugung von Zeichendaten-Erkennungs
parametern werden die für die Erkennung der Zeichendaten
erforderlichen Zeichendaten-Erkennungsparameter anhand
der Feldinformation im Feldinformation-Speicherbereich 8E
erzeugt und im Zeichendatenerkennungsparameter-Teil 415
des Feldinformation-Speicherbereichs 8A gespeichert. Wenn
ein eingegebener Listenbeleg, auf dem Zeichendaten vor
handen sind, eingegeben wird, dienen diese Zeichenerken
nungsparameter dazu, die Art des Formats des eingegebenen
Listenbelegs zu bestimmen. In Fig. 5 ist ein Beispiel des
Gehaltes der im Formatinformation-Speicherbereich 8A ge
speicherten Formatinformation gezeigt. Ein Beleg 501 ist
so beschaffen, daß er Linien 507 bis 509 und Zeichen 504
bis 506 umfaßt. Diese Linien und Zeichen werden durch die
Linieninformation 502 und durch die Zeicheninformation
503, die im Formatinformation-Speicherbereich 8A gespei
chert sind, getrennt dargestellt. Die Linieninformation
umfaßt die Koordinaten, die die linke obere Position und
die rechte untere Position der Linien darstellen, die
Zeicheninformation umfaßt die Koordinaten, die die linke
obere Position und die rechte untere Position der Zeichen
darstellen, und die für diese Zeichen wesentlichen Kodes.
In Fig. 6 ist ein Beispiel des Gehaltes der Feldinforma
tion gezeigt, die durch die Erkennung der Zeichendaten-
Eingabebereiche erzeugt wird. Die Zeichenanordnungen wer
den mit den Daten in der Wissensdatenbank der Wissensba
sis 8G verglichen, um die Stellen festzulegen, an denen
die Eingabefelder gebildet werden.
Die so bestimmten Eingabefelder 610, 611, 612 und 613
werden zusammen mit den Linien und Zeichen in einem Bild
angezeigt, wie es etwa durch das Anzeigebeispiel 603 in
Fig. 6 dargestellt ist. Die Zeicheneingabefelder werden
z. B. durch eine geänderte Farbe im Bild angezeigt. Die
Information bezüglich der bestimmten Felder wird im
Feldinformation-Speicherbereich 8B in Form der Feldinfor
mation 604, die die linken oberen Positionen und die
rechten unteren Positionen der Felder und Feldnamen um
faßt, gespeichert.
Falls jedes Zeicheneingabefeld durch Umrandung gebildet
ist, wird die Größe des Feldes entsprechend der Umrandung
festgesetzt, so daß zwischen dem Feld und jedem Rand ein
Einpunkt-Abstand vorgesehen ist, wie in Fig. 7 gezeigt
ist, wodurch die Zeichen an jeder Position innerhalb der
jeweiligen Umrandung erkannt werden können. Wenn die Zei
chen nicht von Rändern umgeben sind, wird die Größe eines
jeden Eingabefeldes auf einen Wert festgelegt, der durch
die Multiplikation der Größe der Zeichenanordnung mit ei
nem bestimmten Wert erhalten wird.
In Fig. 8 ist ein Beispiel der Verarbeitung zur Ausfüh
rung der Feldverarbeitungsprozeduren, die durch die Feld
verarbeitungsprozedur-Erzeugung 407 von Fig. 4 erzeugt
worden sind, gezeigt. Zunächst werden im Schritt 801 vor
her erkannte Zeichendaten aus dem Zeichendaten-Speicher
bereich 8C in den Arbeitsbereich 8F geholt. Im Schritt
802 wird das gleiche Format wie dasjenige des eingegebe
nen Formulars auf der Grundlage der im Formatinformation-
Speicherbereich 8A gespeicherten Formatinformation als
Bild angezeigt. Im Schritt 803 wird die Feldverarbeitung
der in den Arbeitsbereich 8F geholten Zeichendaten ausge
führt. Im Schritt 804 werden die Ergebnisse der Feldver
arbeitung zusammen mit den erkannten Zeichendaten in ei
nem Bild angezeigt. Im Beispiel des in Fig. 2 gezeigten
Beleges sind die erkannten Zeichen in den Koderäumen
durch "A100, B200" und in den Mengenräumen durch "10, 20"
gegeben, während die Ergebnisse der Feldverarbeitung in
den Summenräumen durch "2000, 1000", im Verbrauchssteuer-
Raum durch "90" und im Endsummenraum durch "3090" gegeben
sind. Diese werden kombiniert angezeigt, wie dies durch
das Anzeigebeispiel 215 von Fig. 2 dargestellt ist. Da
nach prüft die Bedienungsperson im Schritt 805, ob die
erkannten Zeichen ("A100, B200" in den Koderäumen, "10,
20" in den Mengenräumen usw.) in Ordnung sind. Wenn sie
korrigiert werden müssen, geht die Verarbeitung weiter
zum Schritt 806, in dem die erkannten Zeichen korrigiert
werden. Die Verarbeitung des Schrittes 803 und der nach
folgenden Schritte wird dann auf der Grundlage der korri
gierten Zeichen wiederholt. Wenn die erkannten Zeichen in
Ordnung sind, ist der Prozeß der Feldverarbeitung been
det.
In Fig. 9 sind die Gehalte einer die erkannten Zeichenda
ten enthaltenden Datei 904 gezeigt. Diese Datei enthält
die Positionsnamen 901 (die durch die Namen der Zeichen
datenbereiche gegeben sind) und Zeichendaten 902 und ist
in einen Datenabschnitt und einen Einzelheiten-Abschnitt
unterteilt. Die Zeichendaten im Einzelheiten-Abschnitt
werden durch aufeinanderfolgende Anordnung der Reihen,
wie dies in Fig. 9 gezeigt ist, gespeichert.
In Fig. 10 sind die Gehalte der Verarbeitung der erzeug
ten Felder gezeigt. Die Verarbeitungsgehalte werden in
der Wissensdatenbank der Wissensbasis 8G entsprechend den
gezeigten Ausdrücken gespeichert. In dieser Ausführungs
form wird wiederum die gleiche Verarbeitung ausgeführt,
wie sie bereits in der erwähnten früheren Anmeldung be
schrieben worden ist. Das heißt, daß aus der Feldinforma
tion im Feldinformation-Speicherbereich 8B Namen, Posi
tionen, Beziehungen und Merkmale der Felder erkannt wer
den und Verarbeitungsprozeduren durch Abfragen der Wis
sensdatenbank erzeugt werden. Die Gehalte der Verarbei
tung umfassen beispielsweise die Verarbeitung der Berech
nung numerischer Werte wie etwa Einheitspreis×Menge und
Gesamtsumme×0,03 (wobei im Ergebnis eventuell die Stel
len hinter dem Dezimalpunkt nicht dargestellt werden),
und eine Referenzverarbeitung zum Auffinden eines Kunden
namens durch Suchen in einer Kunden-Hauptdatei mittels ei
nes Kundenkodes oder zum Finden eines Produktnamens durch
Suchen in einer Produkt-Hauptdatei mittels eines Pro
duktkodes.
In Fig. 11 ist ein Beispiel für den Fall der Ausführung
einer Referenzverarbeitung gezeigt. Ein in diesem Bei
spiel verwendeter Verkaufsbeleg enthält die folgenden Po
sitionen: einen Kundenkode 1101, einen Kundennamen 1102,
einen Artikelkode 1103, einen Artikelnamen 1104 und eine
Summe 1105. Der Kundenkode 1101, der Artikelkode 1103 und
die Summe 1105 werden durch alphanumerische Zeichen dar
gestellt, während der Kundenname 1101 und der Artikelname
1104 wie in der Zeichnung dargestellt z. B. durch Kanji-
und/oder Katakana-Zeichen dargestellt werden. In dem in
dieser Ausführungsform verwendeten Zeichenerkennungssy
stem können Ausdrücke in Form von Kanji- oder Katakana-
Daten nicht erkannt werden. Um diesen Mangel zu kompen
sieren, sind einerseits die Dateinamen, auf die Bezug ge
nommen wird, in der Wissensbasis gespeichert, anderer
seits wird die Information in dieser Datei abgefragt, um
die entsprechenden Kanji- oder Katakana-Daten anzuzeigen.
Beispielsweise wird für einen Kundenkode (A10) 1106 ein
Kundenkode (A10) 1109 einer Kunden-Hauptdatei 1108 ge
sucht, anschließend wird der entsprechende Kundenname
"Tokio-Warenhaus" (in Form von Kanji-Daten) 1110 als Kun
denname ("Tokio-Warenhaus") 1107 dargestellt. Im gezeig
ten Beispiel wird ein Formular eingegeben, in dem ein
Kundenkode (A10) enthalten ist und als Kundenname 1102
der Ausdruck "Hitachi-Warenhaus" (in Form von Kanji-Da
ten) eingetragen ist, wobei jedoch unter dem Kundenkode
(A10) als Kundenname der Ausdruck "Tokio-Warenhaus" 1107
gespeichert ist. Anhand des (in Form von Kanji-Daten dar
gestellten) Kundennamens im Anzeigebild kann die Bedie
nungsperson erkennen, daß der im Formular vorhandene Kun
denkode (A10) fehlerhaft ist. Bezüglich eines Artikel
kodes (A1000) 1111 wird in einer Kundenprodukt-Hauptdatei
1113 auf einen Produktkode (A1000) Bezug genommen, wo
raufhin der Ausdruck "Äpfel" (in Form von Kanji-Daten) im
Artikelnamenraum 1112 angezeigt wird.
Da die Feldverarbeitungsprozedur auf diese Weise erzeugt
wird, ist eine sofortige Prüfung möglich, ob die auf dem
Beleg vorhandenen Daten in Ordnung sind oder ob die Zei
chen richtig erkannt worden sind, indem ohne Erkennung
von Kanji-Daten Kanji-Datendateien erstellt werden, die
den Kundenkodes und den Artikelkodes entsprechen, wobei
diese Dateien anhand der erkannten alphanumerischen Zei
chen abgefragt werden, um Kanji-Informationen zu bilden,
und wobei ein Kanji-Daten enthaltendes Bild angezeigt
wird.
Nun wird der Prozeßablauf zur Eingabe einer Rechnung oder
eines Listenbeleges, auf dem Daten vorhanden sind, mit
Bezug auf Fig. 12 beschrieben. In Fig. 12 sind Einzelhei
ten der Listenbeleg-Eingabeverarbeitung 302 von Fig. 3
gezeigt. Zunächst wird im Schritt 1201 der Eingabeverar
beitung eine Rechnung oder ein Listenbeleg, auf dem Zei
chendaten vorhanden sind, als Bild von einer Fernkopie
rereinheit 410 oder von einem Bildleser 411 eingegeben,
ferner wird ein Ausrichtungsfehler der eingegebenen Bild
daten korrigiert. Diese Bilddaten werden vorrübergehend
im Bilddaten-Speicherbereich 8D gespeichert. Dann werden
im Schritt 1202 der Bildkorrekturverarbeitung ein Positi
onsfehler und/oder ein Ausrichtungsfehler des Formulars
und ein Fehler bezüglich der Anzahl der Leerstellen kor
rigiert. Im Schritt 1203 der Zeichendaten-Erkennungsver
arbeitung werden Teile von Linien aus den korrigierten
Bilddaten beseitigt, indem die Linieninformation der vor
her erzeugten und im Formatinformation-Speicherbereich 8A
gespeicherten Formatinformation verwendet wird, so daß
unter Verwendung von Feldinformation lediglich die zu er
kennenden Zeichendaten entnommen werden. Die erkannten
Zeichendaten werden im Zeichendaten-Speicherbereich 8C
gespeichert.
Dann wird im Feldverarbeitungsschritt 1204 die Feldverar
beitung der im Zeichendaten-Speicherbereich 8C gespei
cherten Zeichendaten entsprechend den vorher erzeugten
Feldverarbeitungsprozeduren ausgeführt. Die erkannten
Zeichendaten und die Ergebnisse der Feldverarbeitung die
ser Zeichendaten werden im Bildanzeigeschritt 1205 als
Bild angezeigt, um von der Bedienungsperson geprüft zu
werden. Wenn bei der Prüfung durch die Bedienungsperson
festgestellt wird, daß ein erkanntes Zeichen fehlerhaft
ist und korrigiert werden muß, geht der Prozeß weiter zum
Korrekturverarbeitungsschritt 1206, um die Korrektur aus
zuführen. Dann kehrt der Prozeß zum Feldverarbeitungs
schritt 1204 zurück, um die nachfolgenden Schritte zu
wiederholen. Wenn keine Korrektur erforderlich ist, geht
die Verarbeitung direkt zum nächsten Schritt 1207 der
Hauptdatei-Eintragungsverarbeitung weiter. Im Schritt der
Hauptdatei-Eintragungsverarbeitung 1207 werden die einge
gebenen Bilddaten, die erkannten Zeichendaten und die
durch die Feldverarbeitung erhaltenen Zeichendaten so
kombiniert, wie sie in dem Anzeigebeispiel 215 von Fig. 2
dargestellt und als Endeingabedaten in die Hauptdatei 217
eingetragen sind.
In Fig. 13 sind Einzelheiten der Bildkorrekturverarbei
tung 1202 und der Zeichendaten-Erkennungsverarbeitung
1203 von Fig. 12 gezeigt. Zunächst werden im Schritt 1301
in der Bilddatei der Speicherplatteneinheit 5 gespei
cherte Bilddaten in Form eines Binärbildes, wie es in
Fig. 14 gezeigt ist, in den Bilddaten-Speicherbereich 8D
der Dateneinheit eingegeben. Die Daten im Bilddaten-
Speicherbereich 8D, die in dem Bild schwarzen Punkten
entsprechen, erhalten den Binärwert "1", während die Da
ten im Bilddaten-Speicherbereich 8D, die weißen Punkten
entsprechen, den Binärwert "0" erhalten.
Im Schritt 1302 wird das Format des Bildes in Längs- und
in Querrichtung korrigiert. Ein Formular, wie es in einer
(in Fig. 4 gezeigten) Vorbereitungsstufe verwendet wird,
und ein Formular, auf dem Zeichendaten vorhanden sind,
stimmen nicht immer überein. Wenn ein Formular 1501, wie
es in Fig. 15 gezeigt ist, auf dem keine Zeichendaten
vorhanden sind und das in einer Vorbereitungsstufe ver
wendet wird, das Formular zum Zeitpunkt der Zeichenein
gabe, die beispielsweise durch Kopieren der Zeichen aus
geführt wird, darstellt, werden die Koordinaten (x, y) in
der linken oberen Ecke der linierten Ränder des Formulars
1501 normalerweise an eine hiervon verschiedene Position
verschoben, so daß nun die Koordinaten der linken oberen
Ecke 1504 der linierten Ränder des Formulars 1504 durch
(x1, y1) gegeben sind.
Diese Verschiebung wird durch einen Prozeß, wie er in
Fig. 16 gezeigt ist, korrigiert. Zunächst wird in einem
Schritt 1601 eine Bezugslinie gesetzt. Für diese Bezugs
linie wird eine Linie gewählt, die sich am äußersten obe
ren Rand und am äußersten linken Rand des Bildes befin
det. In dem in Fig. 17 gezeigten Beispiel eines Beleges
1701 wird die Linie 1702 als Bezugslinie verwendet. Als
Information zum Festlegen dieser Bezugslinie wird die Li
nieninformation in der Formatinformation verwendet. Nach
dem Setzen der Bezugslinie wird auf der Grundlage der
linken oberen Koordinaten und der rechten unteren Koordi
naten der festgelegten Bezugslinie eine Punktumwandlung
ausgeführt, wie in Fig. 18 gezeigt ist. Wenn die festge
legte Bezugslinie eine Linie 1801 ist, lauten die linken
oberen Koordinaten 1802 dieser Linie (x1, y1) und die
rechten unteren Koordinaten (x2, y2), während die Dicke
der Linie durch z gegeben ist; in diesem Fall wird die
Anzahl der Punkte, die der Länge bzw. der Dicke der Linie
entspricht, durch die folgenden Gleichungen erhalten, wo
bei α und β die Größe 1805 der Punkte, d. h. den Durchmes
ser in x-Richtung bzw. in y-Richtung darstellen:
Anzahl der Längenpunkte = (x2-x1)/α
Anzahl der Dickenpunkte = z/β.
Anzahl der Dickenpunkte = z/β.
Dann wird im Schritt 1602 eine Linie gesucht, die die
gleiche Länge und die gleiche Dicke wie diese Bezugslinie
besitzt und sich am äußersten oberen Rand und am äußer
sten linken Rand des Bildes befindet. Die Differenz zwi
schen der durch Suchen gefundenen Startposition (linke
obere Ecke) der Linie und der Startposition (linke obere
Ecke) der Bezugslinie wird im Schritt 1603 ermittelt. Im
Schritt 1604 werden die Daten im Bilddaten-Speicherbe
reich 8D korrigiert. Eine durchgezogene Linie 1809 gibt
das Ende von eingegebenen Bilddaten an, während eine un
terbrochene Linie 1808 ein Beispiel eines geeigneten En
des der Bilddaten darstellt. In diesem Beispiel werden
die eingegebenen Bilddaten in der nach links weisenden
Richtung um a und in der nach oben weisenden Richtung um
b korrigiert. Die unterbrochene Linie 1810 gibt ein wei
teres Beispiel für ein geeignetes Ende der Bilddaten an.
In diesem Beispiel werden die eingegebenen Bilddaten in
der nach rechts weisenden Richtung um c und in der nach
unten weisenden Richtung um d korrigiert. Hierbei stellen
die Werte a und b bzw. c und d Korrekturwerte dar.
Nachdem die Korrektur des Formulars beendet ist, werden
Teile der Linien beseitigt. In einigen Fällen sind Lini
endaten in dem als Feldinformation erzeugten Zeichenein
gabebereich enthalten. Beispielsweise kann eine gezogene
Randlinie wie im Falle der in Fig. 19 gezeigten Linie
1901 an der Ecke abgerundet sein. Wenn in diesem Fall ein
Zeichenbereich im Inneren der Ränder als Eingabebereich
1904 festgesetzt wird, nähert sich dieser Zeichenbereich
dem Rand bis auf den Abstand S an, so daß bei der Verwen
dung dieses Bereichs Schwierigkeiten entstehen können.
Aus diesem Grund wird ein Zeicheneingabebereich so fest
gesetzt, wie er durch den Zeicheneingabebereich 1902 dar
gestellt wird, wodurch der Bereich mit abgerundeter Ecke
der Linie 1901 beseitigt wird. Die Daten im gerundeten
Bereich der Linie sind in dem in der Tabelle 1909 gezeig
ten Formlar als Formatinformation enthalten, wie dies be
reits aus der obenerwähnten früheren Anmeldung JP H2-
1 75 246-A bekannt ist. In den Summenräumen normaler Belege
sind üblicherweise Flächenunterteilungslinien 1908 vorge
sehen, um die Eintragung der Ziffern zu erleichtern. Sol
che Linien befinden sich innerhalb der Linien 1906 und
ferner innerhalb des Zeicheneingabebereichs 1907. Daher
ist es erforderlich, solche Linien zu entfernen.
In Fig. 20 ist ein Verfahren zur Entfernung von Linien
gezeigt. Im Schritt 2002 werden Punkte auf der Grundlage
der gesamten in der Formatinformation enthaltenen Li
nieninformation umgewandelt. Dieses Umwandlungsverfahren
gleicht demjenigen von Fig. 18. Im Schritt 2004 wird eine
vorher korrigierte Bildtabelleninformation auf der Grund
lage der Linieninformation, die bereits einer Punktum
wandlung unterzogen worden ist, umgewandelt. Nach der
Beendigung der Linienentfernung werden im Schritt 1304
von Fig. 13 die Daten der Zeichenbereiche entnommen, wo
raufhin im Schritt 1305 die Zeichenarten erkannt werden.
Die Datenentnahme aus den Zeichenbereichen wird so ausge
führt, daß die Position, die Breite und die Länge eines
jeden Feldes anhand der Feldinformation 604 im Feldinfor
mation-Speicherbereich 8B einer Punktumwandlung unterwor
fen werden und daß die Daten innerhalb dieser Grenzen im
Schritt 2008 ausgeschnitten werden. Die Bildinformation
2009 entspricht den ausgeschnittenen Daten. Die Zeichen
werden auf der Grundlage dieser ausgeschnittenen Daten im
Schritt 1305 von Fig. 13 identifiziert. Die identifizier
ten Zeichen werden im Schritt 1306 in der Datei für er
kannte Zeichendaten im Zeichendaten-Speicherbereich 8C
gespeichert.
Die Fig. 21A und 21B zeigen Beispiele der Anwendung des
erfindungsgemäßen Verfahrens auf das in Fig. 1 gezeigte
Informationsverarbeitungssystem. Die Einzelheiten dieses
Verfahrens sind von der Art, wie sie oben beschrieben
worden sind; im folgenden wird der Gesamtablauf dieses
Verfahrens beschrieben.
Der in Fig. 21A gezeigte Prozeß stellt eine Vorberei
tungsstufe dar. Der in Fig. 21B gezeigte Prozeß stellt
einen Prozeß dar, in dem die Daten von einem Formular,
etwa einer Rechnung oder einem Listenbeleg, auf dem Zei
chendaten vorhanden sind, tatsächlich eingegeben werden.
Zunächst wird der Prozeß der Vorbereitungsstufe beschrie
ben. In der Vorbereitungsstufe wird das Format eines For
mulars, auf dem Zeichendaten vorhanden sind, gelesen, wo
bei die Leerstellen dieses Formulars, in die Zeichendaten
eingetragen werden sollen, erkannt werden. Ferner werden
anhand besonderer Zeichendaten Feldverarbeitungsprozedu
ren zum Erzeugen weiterer Zeichendaten erstellt.
Zunächst wird im Schritt 2102 Information bezüglich der
Eintragungsseite eines Formulars, auf dem keine Daten
vorhanden sind, von der Eingabeeinheit 3 wie etwa einer
Fernkopierereinheit oder einem Bildleser in Form von
Bilddaten eingegeben. Die eingegebenen Bilddaten werden
im Schritt 2103 im Bilddaten-Speicherbereich 8D gespei
chert. Im Schritt 2104 werden die in diesen Bilddaten
enthaltenen Linien und Ränder und die das Format betref
fenden Zeichen gelesen und erkannt, um eine Linieninfor
mation und eine Zeicheninformation wie etwa die in Fig. 5
gezeigte Information zu erzeugen. Die erzeugte Linienin
formation und die erzeugte Zeicheninformation wird als
Formatinformation im Formatinformation-Speicherbereich 8A
gespeichert und gleichzeitig als Bild, etwa als Bild des
Belegs 201 von Fig. 2, auf dem Anzeigebildschirm des Be
dienerplatzes 1 angezeigt.
Das als Bild eingegebene Format wird dahingehend geprüft,
ob das Format des eingegebenen Formulars richtig wieder
gegeben wird (Schritt 2105). Wenn keine Korrektur erfor
derlich ist, geht die Verarbeitung direkt zum nächsten
Schritt 2107 weiter. Wenn eine Korrektur erforderlich
ist, wird im Schritt 2106 eine Korrekturverarbeitung aus
geführt, anschließend geht die Verarbeitung weiter zum
Schritt 2107. Im Schritt 2107 wird die Wissensdatenbank
der Wissensbasis 8G aufgesucht, werden Eingabebereiche
(Felder), in denen Zeichendaten erfaßt werden sollen, an
hand der Zeichen und Linien im vorher erkannten Format
festgelegt und wird die Information, die diese Bereiche
darstellt, als Feldinformation wie etwa diejenige von
Fig. 6 im Feldinformation-Speicherbereich 8B gespeichert.
Die festgelegten Eingabebereiche werden im Beleg 201 auf
dem Anzeigebildschirm als schraffierte Bereiche ange
zeigt, wie sie etwa in dem Anzeigebeispiel 204 von Fig. 2
gezeigt sind. Die angezeigten Eingabebereiche werden da
hingehend geprüft, ob sie richtig festgelegt worden sind
(Schritt 2108). Wenn keine Korrektur erforderlich ist,
geht die Verarbeitung direkt zum nächsten Schritt 2110
weiter. Wenn eine Korrektur erforderlich ist, wird im
Schritt 2109 eine Korrekturverarbeitung ausgeführt, wo
raufhin die Verarbeitung zum Schritt 2110 weitergeht.
Im Schritt 2110 wird die Wissensdatenbank der Wissensba
sis 8G aufgesucht, wird die Beziehung zwischen den in den
vorher festgelegten Eingabebereichen vorhandenen Datenpo
sitionen anhand der im Format enthaltenen Zeichen erkannt
und werden Feldverarbeitungsprozeduren, mit denen auf der
Grundlage der in die besonderen Eingabebereiche eingetra
genen Daten in andere Bereiche einzutragende Daten er
zeugt werden, vorbereitet. Die vorbereiteten Feldverar
beitungsprozeduren werden im Feldverarbeitungsprozedur-
Speicherbereich 8E gespeichert und als Bild angezeigt,
damit überprüft werden kann, ob eine Korrektur erforder
lich ist (Schritt 2111). Wenn keine Korrektur erforder
lich ist, geht die Verarbeitung direkt zum nächsten
Schritt 2113 weiter. Wenn eine Korrektur erforderlich
ist, wird im Schritt 2112 eine Korrekturverarbeitung aus
geführt, woraufhin die Verarbeitung zum nächsten Schritt
2113 weitergeht. Im Schritt 2113 werden Parameter für die
Erkennung von Zeichendaten in den Eingabebereichen er
zeugt und im Feldinformation-Speicherbereich 8B gespei
chert. Diese Parameter werden dazu verwendet, Feldinfor
mation aus dem Format auszublenden.
Durch den Schritt 2113 ist der Vorbereitungsprozeß abge
schlossen.
Nun wird mit Bezug auf Fig. 21B der Prozeß zum Lesen von
Zeichendaten von einem Formular (Rechnung/Listenbeleg),
in den tatsächlich Zeichendaten eingetragen worden sind,
beschrieben.
Im Schritt 2114 werden Daten auf einer Formularseite, auf
der Zeichendaten vorhanden sind (wobei das Formular durch
den Vorbereitungsprozeß bereits verarbeitet worden ist)
als Bilddaten von der Fernkopierereinheit oder dem Bild
leser wie im Vorbereitungsprozeß eingegeben. Das eingege
bene Bild wird im Bilddaten-Speicherbereich 8D gespei
chert (Schritt 2115). Im Schritt 2116 wird die Linienin
formation in der Formatinformation aufgesucht und eine
Bezugslinie daraus ausgewählt. Die eingegebenen Bilddaten
werden durchsucht, um eine Linie zu finden, deren Länge
und deren Dicke mit der Länge bzw. der Dicke der Bezugs
linie übereinstimmt und die sich an einer ähnlichen Posi
tion im Bild befindet (Schritt 2117). Die Position der
gefundenen Linie und die Position der Bezugslinie werden
miteinander verglichen, anschließend werden die räumliche
Differenz zwischen ihnen und ein Ausrichtungskorrektur
wert berechnet (Schritt 2118). Im Schritt 2119 werden die
Bilddaten auf der Grundlage der berechneten räumlichen
Differenz korrigiert, um diese räumliche Differenz zu be
seitigen.
Nach Abschluß der Korrektur der räumlichen Differenz des
Formulars werden aus diesen Bilddaten unter Bezugnahme
auf die Formatinformation Linien gelöscht (Schritt 2120),
außerdem werden in den Eingabebereichen vorhandene Zei
chendaten aus den Bilddaten, aus denen die Linien ent
fernt worden sind, entnommen, indem auf die Feldinforma
tion Bezug genommen wird (Schritt 2121). Die entnommenen
Zeichendaten werden erkannt (Schritt 2123) und im Zei
chendaten-Speicherbereich gespeichert (Schritt 2123). An
schließend wird das in der Vorbereitungsstufe gelesene
Format in einer Form wie etwa derjenigen des in Fig. 2
gezeigten Beleges 201 angezeigt (Schritt 2125), außerdem
wird bezüglich der erkannten Zeichendaten auf der Grund
lage der im Feldverarbeitungsprozedur-Speicherabschnitt
8E gespeicherten Feldverarbeitungsprozeduren eine Feld
verarbeitung ausgeführt (Schritt 2126). Die durch die
Feldverarbeitung erhaltenen Daten werden in die entspre
chenden Eingabebereiche eingegeben und mit den erkannten
Zeichendaten und dem Format kombiniert, um als Formular
wie etwa demjenigen des in Fig. 2 gezeigten Anzeigebei
spiels 215 angezeigt zu werden (Schritt 2127).
Die in einem Bild angezeigten Zeichen (die im Schritt
2122 erkannt wurden) werden daraufhin geprüft, ob eine
Korrektur erforderlich ist (Schritt 2128). Wenn keine
Korrektur erforderlich ist, geht die Verarbeitung direkt
weiter zum Schritt 2130. Wenn jedoch eine Korrektur er
forderlich ist, wird eine solche Korrekturverarbeitung im
Schritt 2129 ausgeführt, anschließend werden der Schritt
2126 und die nachfolgenden Schritte wiederholt. Im
Schritt 2130 werden die erkannten Zeichendaten und die
durch die Feldverarbeitung erhaltenen Daten zusammen mit
dem in der Vorbereitungsstufe eingegebenen Format in die
Hauptdatei eingegeben, ferner wird geprüft, ob ein weite
rer Listenbeleg eingegeben werden soll. Wenn ein weiterer
Beleg vorliegt, werden die Verarbeitung des Schrittes
2114 und die nachfolgenden Schritte für diesen weiteren
Beleg wiederholt. Wenn kein Beleg mehr vorliegt, ist die
Eingabeprozedur beendet.
Gemäß dieser Ausführungsform wird das Format eines Formu
lars erkannt, werden diejenigen Linienmuster und Zeichen
muster voneinander unterschieden, die in der Bildinforma
tion, die in die Eingabebereiche eingetragene Eingabeda
ten und Zeichenmuster enthält, das Format bilden, und
werden die Zeichenmuster in den Eingabebereichen erkannt.
Durch dieses Verfahren können Zeichendaten, die auf einer
üblichen Rechnung, einem Beleg oder dergleichen vorhanden
sind und nicht umrandet sind, unterstrichene Zeichendaten
und solche Zeichendaten, die von an den Ecken abgerunde
ten Rändern umgeben sind, ebenso in einen Computer einge
geben werden wie Zeichen in einer für einen OCR geeigne
ten, speziellen Form. In den Bilddaten kann ein Positi
onsfehler des Formulars korrigiert werden, so daß die Be
dienungsperson nicht darauf achten muß, einen solchen Po
sitionsfehler des Formulars zum Zeitpunkt der Bildeingabe
zu vermeiden.
Außerdem wird eine vorher gewählte Verarbeitung bezüglich
des Formats des Formulars mit Bezug auf die auf dem For
mular vorhandenen Zeichendaten ausgeführt, wobei die Er
gebnisse dieser Verarbeitung angezeigt werden und somit
die Möglichkeit geschaffen wird, die Eignung der vorhan
denen Zeichendaten zu prüfen.
Claims (13)
1. Verfahren zur Eingabe von Zeichendaten für ein
Informationsverarbeitungssystem, das die folgenden
Schritte umfaßt:
Lesen (2114) von Bildinformation bezüglich eines Formulars (210), auf dem Daten vorhanden sind, von einer Eingabeeinheit (3) zur Eingabe von Bildinformation; und
Erkennen (2122) von Zeichenmustern von Daten, die in der Bildinformation enthalten sind,
gekennzeichnet durch die folgenden Schritte:
Lesen (2102) von Bildinformation bezüglich eines Formulars (201), das nur ein Format aufweist und auf dem keine Daten vorhanden sind, von der Eingabeeinheit (3) zur Eingabe von Bildinformation;
Erzeugen (2104) von Information, die mehrere Ein gabebereiche (610 bis 613) vorschreibt, in die Daten ein getragen werden können, indem Zeichenmuster und Randmu ster des Formats anhand der gelesenen Bildinformation er kannt werden; und
Unterscheiden (2121) des Formats und der Daten in der Bildinformation bezüglich des Daten enthaltenden und von der Eingabeeinheit (3) gelesenen Formulars (210) auf der Grundlage der erkannten Zeichenmuster und Randmuster des Formats und der die Dateneingabebereiche (610 bis 613) vorschreibenden Information, um in den jeweiligen Dateneingabebereichen (610 bis 613) Zeichenmuster zu er kennen.
Lesen (2114) von Bildinformation bezüglich eines Formulars (210), auf dem Daten vorhanden sind, von einer Eingabeeinheit (3) zur Eingabe von Bildinformation; und
Erkennen (2122) von Zeichenmustern von Daten, die in der Bildinformation enthalten sind,
gekennzeichnet durch die folgenden Schritte:
Lesen (2102) von Bildinformation bezüglich eines Formulars (201), das nur ein Format aufweist und auf dem keine Daten vorhanden sind, von der Eingabeeinheit (3) zur Eingabe von Bildinformation;
Erzeugen (2104) von Information, die mehrere Ein gabebereiche (610 bis 613) vorschreibt, in die Daten ein getragen werden können, indem Zeichenmuster und Randmu ster des Formats anhand der gelesenen Bildinformation er kannt werden; und
Unterscheiden (2121) des Formats und der Daten in der Bildinformation bezüglich des Daten enthaltenden und von der Eingabeeinheit (3) gelesenen Formulars (210) auf der Grundlage der erkannten Zeichenmuster und Randmuster des Formats und der die Dateneingabebereiche (610 bis 613) vorschreibenden Information, um in den jeweiligen Dateneingabebereichen (610 bis 613) Zeichenmuster zu er kennen.
2. Verfahren gemäß Anspruch 1, gekennzeichnet durch
den folgenden Schritt:
Anzeigen (2127) der erkannten Zeichenmuster in jedem Dateneingabebereich (610 bis 613).
Anzeigen (2127) der erkannten Zeichenmuster in jedem Dateneingabebereich (610 bis 613).
3. Verfahren gemäß Anspruch 2, gekennzeichnet durch
die folgenden Schritte:
Erzeugen (2110) wenigstens einer Feldverarbei tungsprozedur für die Bezugnahme auf die erkannten Zei chenmuster und Randmuster des Formats und die die Daten eingabebereiche (610 bis 613) vorschreibende Information, um in einige der Eingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einen der anderen Einga bebereiche einzugebende Daten zu erzeugen und diese er zeugten Daten in den entsprechenden Eingabebereich ein zugeben; und
Ausführen (2126) der Feldverarbeitungsprozedur bezüglich der erkannten Zeichendaten für die in die ent sprechenden Dateneingabebereiche eingegebenen Daten.
Erzeugen (2110) wenigstens einer Feldverarbei tungsprozedur für die Bezugnahme auf die erkannten Zei chenmuster und Randmuster des Formats und die die Daten eingabebereiche (610 bis 613) vorschreibende Information, um in einige der Eingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einen der anderen Einga bebereiche einzugebende Daten zu erzeugen und diese er zeugten Daten in den entsprechenden Eingabebereich ein zugeben; und
Ausführen (2126) der Feldverarbeitungsprozedur bezüglich der erkannten Zeichendaten für die in die ent sprechenden Dateneingabebereiche eingegebenen Daten.
4. Verfahren gemäß Anspruch 3, gekennzeichnet durch
den folgenden Schritt:
Anzeigen (2127) der Daten, die durch Ausführen der Feldverarbeitungsprozedur bezüglich der Zeichendaten im erkannten Datenbereich erzeugt worden sind, in einem Bild des entsprechenden Eingabebereichs des Formats.
Anzeigen (2127) der Daten, die durch Ausführen der Feldverarbeitungsprozedur bezüglich der Zeichendaten im erkannten Datenbereich erzeugt worden sind, in einem Bild des entsprechenden Eingabebereichs des Formats.
5. Verfahren gemäß Anspruch 4, gekennzeichnet durch
den nach dem Lesen der Bildinformation bezüglich des Da
ten enthaltenden Formulars (210) ausgeführten, folgenden
Schritt:
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For mulars (201).
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For mulars (201).
6. Verfahren gemäß Anspruch 3, gekennzeichnet durch
den nach dem Lesen der Bildinformation bezüglich des Da
ten enthaltenden Formulars (210) ausgeführten, folgenden
Schritt:
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation bezüglich des keine Daten enthal tenden Formulars (201).
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation bezüglich des keine Daten enthal tenden Formulars (201).
7. Verfahren gemäß Anspruch 2, gekennzeichnet durch
den nach dem Lesen der Bildinformation bezüglich des Da
ten enthaltenden Formulars (210) ausgeführten, folgenden
Schritt:
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation.
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation.
8. Verfahren gemäß Anspruch 1, gekennzeichnet durch
die folgenden Schritte:
Erzeugen (2110) wenigstens einer Feldverarbei tungsprozedur für die Bezugnahme auf die erkannten Zei chenmuster und Randmuster des Formats und die die Daten eingabebereiche (610 bis 613) vorschreibende Information, um in einige der Eingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einem der anderen Einga bebereiche einzugebende Daten zu erzeugen und um diese erzeugten Daten in den entsprechenden Eingabebereich ein zugeben; und
Ausführen (2126) der Feldverarbeitungsprozedur für die Zeichendaten im erkannten Datenbereich.
Erzeugen (2110) wenigstens einer Feldverarbei tungsprozedur für die Bezugnahme auf die erkannten Zei chenmuster und Randmuster des Formats und die die Daten eingabebereiche (610 bis 613) vorschreibende Information, um in einige der Eingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einem der anderen Einga bebereiche einzugebende Daten zu erzeugen und um diese erzeugten Daten in den entsprechenden Eingabebereich ein zugeben; und
Ausführen (2126) der Feldverarbeitungsprozedur für die Zeichendaten im erkannten Datenbereich.
9. Verfahren gemäß Anspruch 8, gekennzeichnet durch
den folgenden Schritt:
Anzeigen (2127) der Daten, die durch die Ausfüh rung der Feldverarbeitungsprozedur bezüglich der Zeichen daten im erkannten Datenbereich erzeugt worden sind, in einem Bild des entsprechenden Eingabebereichs des For mats.
Anzeigen (2127) der Daten, die durch die Ausfüh rung der Feldverarbeitungsprozedur bezüglich der Zeichen daten im erkannten Datenbereich erzeugt worden sind, in einem Bild des entsprechenden Eingabebereichs des For mats.
10. Verfahren gemäß Anspruch 8, gekennzeichnet durch
den nach dem Lesen der Bildinformation bezüglich des Da
ten enthaltenden Formulars (210) ausgeführten, folgenden
Schritt:
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation.
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation.
11. Verfahren gemäß Anspruch 9, gekennzeichnet durch
den nach dem Lesen der Bildinformation des Daten enthal
tenden Formulars (210) ausgeführten, folgenden Schritt:
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For mulars (201).
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For mulars (201).
12. Verfahren gemäß Anspruch 1, gekennzeichnet durch
den nach dem Lesen der Bildinformation bezüglich des Da
ten enthaltenden Formulars (210) ausgeführten, folgenden
Schritt:
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For mulars (201).
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers dieser Bildinformation in bezug auf die Bildinformation des keine Daten enthaltenden For mulars (201).
13. Ein Verfahren zur Eingabe von Zeichendaten für
ein Informationsverarbeitungssystem, das die folgenden
Schritte umfaßt:
Lesen (2114) von Bildinformation bezüglich eines Daten enthaltenden Formulars (210) von einer Eingabeein heit (3) für die Eingabe von Bildinformation; und
Erkennen (2122) von Zeichenmustern von in der Bildinformation enthaltenen Daten,
gekennzeichnet durch die folgenden Schritte:
Lesen (2102) von Bildinformation bezüglich eines Formulars (201), das nur ein Format aufweist und keine Daten enthält, von der Eingabeeinheit (3) zur Eingabe von Bildinformation;
Erzeugen (2104) von Information, die mehrere Ein gabebereiche (610 bis 613), in die Daten eingetragen wer den sollen, vorschreibt, indem Zeichenmuster und Randmu ster des Formats in der Bildinformation erkannt werden;
Anzeigen (2104, 2107) der erkannten Zeichenmuster und Randmuster des Formats und der Mehrzahl der Eingabe bereiche (610 bis 613), in die Daten eingetragen werden sollen, in einem Bild;
Prüfen (2105, 2108), ob in den angezeigten Zei chenmustern und Randmustern des Formats und in den mehre ren Eingabebereichen (610 bis 613) Fehler vorhanden sind, und
Korrigieren (2106, 2109) der Zeichenmuster und der Randmuster und der Mehrzahl der Eingabebereiche (610 bis 613), falls Fehler vorhanden sind;
Erzeugen/Anzeigen (2110) wenigstens einer Feld verarbeitungsprozedur für die Bezugnahme auf die erkann ten Zeichenmuster und Randmuster des Formats und die die Dateneingabebereiche (610 bis 613) vorschreibende Infor mation, um in einige der Dateneingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einen der anderen Bereiche einzugebende Daten zu erzeugen und um diese erzeugten Daten in den entsprechenden Eingabebe reich einzugeben;
Prüfen (2111), ob in der angezeigten Feldverar beitungsprozedur Fehler vorhanden sind, und
Korrigieren (2112) der Feldverarbeitungsprozedur, falls Fehler vorhanden sind;
Lesen (2114) der Bildinformation bezüglich des Daten enthaltenden Formulars (210) von der Eingabeeinheit (3);
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers der Bildinformation bezüglich des Daten enthaltenden Formulars (210) in bezug auf die Bildinformation bezüglich des keine Daten enthaltenden Formulars (201);
Unterscheiden (2121) des Formats und der Daten in der Bildinformation bezüglich des Daten enthaltenden For mulars (210) auf der Grundlage der erkannten Zeichenmu ster und Randmuster des Formats und der die Dateneingabe bereiche (610 bis 613) vorschreibenden Information, um in jedem Dateneingabebereich (610 bis 613) gleiche Muster zu erkennen;
Ausführen (2126) der Feldverarbeitungsprozedur bezüglich der erkannten Zeichendaten;
Anzeigen (2127) der erkannten Zeichendaten und der durch die Feldverarbeitungsprozedur erhaltenen Daten in einem Bild durch die Kombination von Datenklassen be züglich des Formats;
Prüfen (2128), ob in den in einem Bild angezeig ten Zeichendaten Fehler vorhanden sind,
Korrigieren (2129) der Zeichendaten, falls Fehler vorhanden sind, und anschließend
Wiederholen der Feldverarbeitungsprozedur (2126) bezüglich der korrigierten Zeichendaten; und
Speichern (2130) der erkannten Zeichendaten und der durch die Feldverarbeitungsprozedur erhaltenen Daten in einer Speichereinrichtung (5) durch die Kombination dieser Datenklassen bezüglich des Formats, falls in den angezeigten Zeichendaten keine Fehler mehr vorhanden sind.
Lesen (2114) von Bildinformation bezüglich eines Daten enthaltenden Formulars (210) von einer Eingabeein heit (3) für die Eingabe von Bildinformation; und
Erkennen (2122) von Zeichenmustern von in der Bildinformation enthaltenen Daten,
gekennzeichnet durch die folgenden Schritte:
Lesen (2102) von Bildinformation bezüglich eines Formulars (201), das nur ein Format aufweist und keine Daten enthält, von der Eingabeeinheit (3) zur Eingabe von Bildinformation;
Erzeugen (2104) von Information, die mehrere Ein gabebereiche (610 bis 613), in die Daten eingetragen wer den sollen, vorschreibt, indem Zeichenmuster und Randmu ster des Formats in der Bildinformation erkannt werden;
Anzeigen (2104, 2107) der erkannten Zeichenmuster und Randmuster des Formats und der Mehrzahl der Eingabe bereiche (610 bis 613), in die Daten eingetragen werden sollen, in einem Bild;
Prüfen (2105, 2108), ob in den angezeigten Zei chenmustern und Randmustern des Formats und in den mehre ren Eingabebereichen (610 bis 613) Fehler vorhanden sind, und
Korrigieren (2106, 2109) der Zeichenmuster und der Randmuster und der Mehrzahl der Eingabebereiche (610 bis 613), falls Fehler vorhanden sind;
Erzeugen/Anzeigen (2110) wenigstens einer Feld verarbeitungsprozedur für die Bezugnahme auf die erkann ten Zeichenmuster und Randmuster des Formats und die die Dateneingabebereiche (610 bis 613) vorschreibende Infor mation, um in einige der Dateneingabebereiche eingegebene Zeichendaten zu verarbeiten, um in wenigstens einen der anderen Bereiche einzugebende Daten zu erzeugen und um diese erzeugten Daten in den entsprechenden Eingabebe reich einzugeben;
Prüfen (2111), ob in der angezeigten Feldverar beitungsprozedur Fehler vorhanden sind, und
Korrigieren (2112) der Feldverarbeitungsprozedur, falls Fehler vorhanden sind;
Lesen (2114) der Bildinformation bezüglich des Daten enthaltenden Formulars (210) von der Eingabeeinheit (3);
Korrigieren (2119) eines Positions- und/oder ei nes Ausrichtungsfehlers der Bildinformation bezüglich des Daten enthaltenden Formulars (210) in bezug auf die Bildinformation bezüglich des keine Daten enthaltenden Formulars (201);
Unterscheiden (2121) des Formats und der Daten in der Bildinformation bezüglich des Daten enthaltenden For mulars (210) auf der Grundlage der erkannten Zeichenmu ster und Randmuster des Formats und der die Dateneingabe bereiche (610 bis 613) vorschreibenden Information, um in jedem Dateneingabebereich (610 bis 613) gleiche Muster zu erkennen;
Ausführen (2126) der Feldverarbeitungsprozedur bezüglich der erkannten Zeichendaten;
Anzeigen (2127) der erkannten Zeichendaten und der durch die Feldverarbeitungsprozedur erhaltenen Daten in einem Bild durch die Kombination von Datenklassen be züglich des Formats;
Prüfen (2128), ob in den in einem Bild angezeig ten Zeichendaten Fehler vorhanden sind,
Korrigieren (2129) der Zeichendaten, falls Fehler vorhanden sind, und anschließend
Wiederholen der Feldverarbeitungsprozedur (2126) bezüglich der korrigierten Zeichendaten; und
Speichern (2130) der erkannten Zeichendaten und der durch die Feldverarbeitungsprozedur erhaltenen Daten in einer Speichereinrichtung (5) durch die Kombination dieser Datenklassen bezüglich des Formats, falls in den angezeigten Zeichendaten keine Fehler mehr vorhanden sind.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3115857A JPH04343190A (ja) | 1991-05-21 | 1991-05-21 | 文字データ入力方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4216893A1 true DE4216893A1 (de) | 1992-11-26 |
DE4216893C2 DE4216893C2 (de) | 1994-12-15 |
Family
ID=14672863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4216893A Expired - Fee Related DE4216893C2 (de) | 1991-05-21 | 1992-05-21 | Dateneingabeverfahren |
Country Status (4)
Country | Link |
---|---|
US (1) | US5857034A (de) |
JP (1) | JPH04343190A (de) |
KR (1) | KR100228321B1 (de) |
DE (1) | DE4216893C2 (de) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4307577A1 (en) * | 1992-03-10 | 1993-09-23 | Hitachi Ltd | Document information processing system for FAX transmissions - has information stored and used with databank of stored information to provide correct code data for generating transmission |
DE4308291A1 (de) * | 1993-03-16 | 1994-09-22 | Assem Audi & Co Gmbh | Verfahren und Vorrichtung zur vorgangsbezogenen Erstellung und Bearbeitung von Dokumenten |
US5666549A (en) * | 1992-03-10 | 1997-09-09 | Hitachi, Ltd. | Method and system for processing a document transmitted via facsimile in an initially input form stored in a knowledge base |
US6559968B1 (en) | 1998-06-19 | 2003-05-06 | Canon Kabushiki Kaisha | Copying selected regions of documents |
DE4409198B4 (de) * | 1994-03-17 | 2008-07-17 | Areva Np Gmbh | Einrichtung zur fotografischen Dokumentation einer Anlage |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3547025B2 (ja) * | 1994-08-23 | 2004-07-28 | 株式会社リコー | 情報抽出方法 |
DE69638207D1 (de) | 1995-07-31 | 2010-08-05 | Fujitsu Ltd | Prozessor und Verarbeitungsverfahren für Dokumente |
CN100538724C (zh) * | 1995-07-31 | 2009-09-09 | 富士通株式会社 | 数据媒体处理装置及数据媒体处理方法 |
US7519558B2 (en) | 1997-08-27 | 2009-04-14 | Ballard Claudio R | Biometrically enabled private secure information repository |
US8024269B1 (en) | 1997-08-27 | 2011-09-20 | Datatreasury Corporation | Remote image capture with centralized processing and storage |
JP3574584B2 (ja) * | 1998-12-16 | 2004-10-06 | 富士通株式会社 | 表画像処理装置及びそのプログラム記憶媒体 |
US6760490B1 (en) * | 2000-09-28 | 2004-07-06 | International Business Machines Corporation | Efficient checking of key-in data entry |
US7475333B2 (en) | 2001-06-01 | 2009-01-06 | Sap Ag | Defining form formats with layout items that present data of business application |
US7234105B2 (en) * | 2001-09-20 | 2007-06-19 | Sap Ag | Methods and systems for providing a document with interactive elements to retrieve information for processing by business applications |
US7171615B2 (en) | 2002-03-26 | 2007-01-30 | Aatrix Software, Inc. | Method and apparatus for creating and filing forms |
US7979348B2 (en) * | 2002-04-23 | 2011-07-12 | Clearing House Payments Co Llc | Payment identification code and payment system using the same |
WO2004107257A1 (ja) * | 2003-05-30 | 2004-12-09 | Fujitsu Limited | 帳票処理プログラム、方法及び装置 |
US8725607B2 (en) | 2004-01-30 | 2014-05-13 | The Clearing House Payments Company LLC | Electronic payment clearing and check image exchange systems and methods |
JP4919028B2 (ja) * | 2006-03-03 | 2012-04-18 | 富士ゼロックス株式会社 | 画像処理装置および画像処理プログラム |
US7711191B2 (en) * | 2006-12-21 | 2010-05-04 | Michael John Kosek | Electronic transaction processing server with automated transaction evaluation |
FR2924834B1 (fr) * | 2007-12-10 | 2010-12-31 | Serensia | Procede et systeme ameliores de saisie assistee notamment pour outils de gestion informatique |
US11295308B1 (en) | 2014-10-29 | 2022-04-05 | The Clearing House Payments Company, L.L.C. | Secure payment processing |
US11694168B2 (en) | 2015-07-01 | 2023-07-04 | The Clearing House Payments Company L.L.C. | Real-time payment system, method, apparatus, and computer program |
US11042882B2 (en) | 2015-07-01 | 2021-06-22 | The Clearing House Payments Company, L.L.C. | Real-time payment system, method, apparatus, and computer program |
US11436577B2 (en) | 2018-05-03 | 2022-09-06 | The Clearing House Payments Company L.L.C. | Bill pay service with federated directory model support |
US11861302B2 (en) | 2019-02-04 | 2024-01-02 | Aatrix Software, Inc. | AUF XML specification compiler |
SG10201904175UA (en) * | 2019-05-09 | 2020-12-30 | Mastercard International Inc | Methods and systems for facilitating message format discovery in online transaction processing |
JP6960646B6 (ja) * | 2021-03-23 | 2021-12-01 | 株式会社 YSK e−com | 読取システム、読取プログラムおよび読取方法 |
JP6994727B1 (ja) * | 2021-03-23 | 2022-01-14 | 株式会社 YSK e-com | 読取システム、読取プログラムおよび読取方法 |
US11829701B1 (en) * | 2022-06-30 | 2023-11-28 | Accenture Global Solutions Limited | Heuristics-based processing of electronic document contents |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4020462A (en) * | 1975-12-08 | 1977-04-26 | International Business Machines Corporation | Method and apparatus for form removal from contour compressed image data |
DE3128794A1 (de) * | 1981-07-21 | 1983-05-05 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann. |
DE3414455A1 (de) * | 1983-04-26 | 1984-10-31 | Peter-Michael 6057 Dietzenbach Wollang | Verfahren und vorrichtung zum lesen und speichern von information |
EP0262462A2 (de) * | 1986-09-30 | 1988-04-06 | Siemens Aktiengesellschaft | Verfahren zum Interpretieren formularhafter Dokumente |
WO1989011703A1 (en) * | 1988-05-20 | 1989-11-30 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5771072A (en) * | 1980-10-20 | 1982-05-01 | Sharp Corp | Electronic computer |
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
JPS63155386A (ja) * | 1986-12-19 | 1988-06-28 | Ricoh Co Ltd | 帳票デ−タ読取装置 |
US5040226A (en) * | 1988-05-31 | 1991-08-13 | Trw Financial Systems, Inc. | Courtesy amount read and transaction balancing system |
JPH02201588A (ja) * | 1989-01-31 | 1990-08-09 | Toshiba Corp | 文字読取装置 |
US5140650A (en) * | 1989-02-02 | 1992-08-18 | International Business Machines Corporation | Computer-implemented method for automatic extraction of data from printed forms |
IL91220A (en) * | 1989-08-04 | 1995-03-30 | Ibm Israel | Compression of information |
JP2713622B2 (ja) * | 1989-11-20 | 1998-02-16 | 富士通株式会社 | 表形式文書読取装置 |
US5258855A (en) * | 1991-03-20 | 1993-11-02 | System X, L. P. | Information processing methodology |
US5293429A (en) * | 1991-08-06 | 1994-03-08 | Ricoh Company, Ltd. | System and method for automatically classifying heterogeneous business forms |
-
1991
- 1991-05-21 JP JP3115857A patent/JPH04343190A/ja active Pending
-
1992
- 1992-05-20 US US07/885,775 patent/US5857034A/en not_active Expired - Fee Related
- 1992-05-21 KR KR1019920008596A patent/KR100228321B1/ko not_active IP Right Cessation
- 1992-05-21 DE DE4216893A patent/DE4216893C2/de not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4020462A (en) * | 1975-12-08 | 1977-04-26 | International Business Machines Corporation | Method and apparatus for form removal from contour compressed image data |
DE3128794A1 (de) * | 1981-07-21 | 1983-05-05 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann. |
DE3414455A1 (de) * | 1983-04-26 | 1984-10-31 | Peter-Michael 6057 Dietzenbach Wollang | Verfahren und vorrichtung zum lesen und speichern von information |
EP0262462A2 (de) * | 1986-09-30 | 1988-04-06 | Siemens Aktiengesellschaft | Verfahren zum Interpretieren formularhafter Dokumente |
WO1989011703A1 (en) * | 1988-05-20 | 1989-11-30 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4307577A1 (en) * | 1992-03-10 | 1993-09-23 | Hitachi Ltd | Document information processing system for FAX transmissions - has information stored and used with databank of stored information to provide correct code data for generating transmission |
US5666549A (en) * | 1992-03-10 | 1997-09-09 | Hitachi, Ltd. | Method and system for processing a document transmitted via facsimile in an initially input form stored in a knowledge base |
DE4307577C2 (de) * | 1992-03-10 | 2000-12-28 | Hitachi Ltd | Verfahren und Vorrichtung zur Dokumentenverarbeitung |
DE4308291A1 (de) * | 1993-03-16 | 1994-09-22 | Assem Audi & Co Gmbh | Verfahren und Vorrichtung zur vorgangsbezogenen Erstellung und Bearbeitung von Dokumenten |
DE4308291C2 (de) * | 1993-03-16 | 1998-02-26 | Assem Audi & Co Gmbh | Verfahren und Vorrichtung zur vorgangsbezogenen Erstellung und Bearbeitung von Dokumenten |
DE4409198B4 (de) * | 1994-03-17 | 2008-07-17 | Areva Np Gmbh | Einrichtung zur fotografischen Dokumentation einer Anlage |
US6559968B1 (en) | 1998-06-19 | 2003-05-06 | Canon Kabushiki Kaisha | Copying selected regions of documents |
Also Published As
Publication number | Publication date |
---|---|
KR920022125A (ko) | 1992-12-19 |
DE4216893C2 (de) | 1994-12-15 |
JPH04343190A (ja) | 1992-11-30 |
US5857034A (en) | 1999-01-05 |
KR100228321B1 (ko) | 1999-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4216893C2 (de) | Dateneingabeverfahren | |
DE4091841C2 (de) | Verfahren zum Erzeugen einer Formulardarstellung und Bildschirm-Formularerzeugungssystem | |
DE3650554T2 (de) | Speicherungs- und Wiederauffindungsverfahren für Bilddaten | |
DE3855468T2 (de) | Rechnersystem für fortschrittliche finanzielle Anwendungen | |
DE69123083T2 (de) | Dokumentverarbeitung | |
DE3856404T2 (de) | Datenverwaltungssystem | |
EP1665132B1 (de) | Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten | |
DE3411939C2 (de) | ||
DE68926068T2 (de) | Dokumentenverarbeitungssystem | |
DE69302003T2 (de) | Dateneingabeanlage | |
DE69602364T2 (de) | Rechnersystem um semantische objektmodelle von existierenden relationellen datenbanksystemen herzustellen | |
DE69026252T2 (de) | Verfahren und Vorrichtung zum elektronischen Datenaustausch | |
DE3588084T2 (de) | Bildverarbeitungssystem | |
EP1669852B1 (de) | Verfahren und Computerprogramm zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei | |
DE69127672T2 (de) | Zielorientiertes elektronisches Formblattsystem | |
DE69434405T2 (de) | Verfahren zur Erzeugung eines visuellen Entwurfs | |
EP1902407B1 (de) | System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung | |
DE69032585T2 (de) | Elektronisches Dateispeicherungssystem | |
DE68928068T2 (de) | Verfahren und Apparat zum Formatieren von Dokumenten | |
DE60310881T2 (de) | Methode und Benutzerschnittstelle für das Bilden einer Darstellung von Daten mit Meta-morphing | |
DE69515476T2 (de) | Verfahren und system zum überprüfen von druckaufträgen für anwendungen mit kurzen druckvorgängen | |
DE68928254T2 (de) | Datenverarbeitungsgerät | |
DE69425480T2 (de) | Dokumentaufbereitungsapparat | |
DE60123730T2 (de) | Gerät und Verfahren zur Bestimmung des Formats von Dokumenten | |
DE102012025350A1 (de) | Verarbeitungn eines elektronischen Dokuments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8125 | Change of the main classification |
Ipc: G06K 9/62 |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |