-
DETAILLIERTE BESCHREIBUNG
DER ERFINDUNG
-
GEBIET DER ERFINDUNG
-
Die
Erfindung betrifft allgemein eine Bildabtastvorrichtung und ein
optisches Zeichenerkennungsverfahren und insbesondere eine Bildabtastvorrichtung
und ein Zeichenerkennungsverfahren, die Bildzeichen irgend eines
Bereichs eines Dokuments durch das optische Abtasten erkennen können und
die diese Zeicheninformation als Zeichenkodedaten in eine Anwendungssoftware,
die in einem Personalcomputer geladen ist, eingeben können.
-
In
dieser Beschreibung bezeichnet der Ausdruck "Dokument" gedruckte Sachen wie Bücher, Magazine,
Zeitungen, Broschüren,
Visitenkarten etc. Und der Ausdruck "Zeichenerkennung", der in dieser Beschreibung verwendet
wird, bedeutet nicht nur die Erkennung gewöhnlicher Zeichen, wie "kana", "katakana", "kanji" und "alphanumerisch" sondern auch die
Erkennung jeglichen Symbolkodes, wie Barkode, der durch einen Computer
erkannt und in Zeichendaten umgewandelt werden kann.
-
STAND DER TECHNIK
-
In
irgend einer konventionellen Zeichenerkennungsvorrichtung für gedruckte
Dinge (die hier nachher als Dokument bezeichnet werden), die einen Personalcomputer
und einen Flachbettscanner oder einen Einzelblatteinzugscanner (die
hier nachher einfach als Scanner bezeichnet werden) verwendet, werden
die folgenden Operationen benötigt,
um gedruckte Zeichen zu erkennen.
-
Operation 1... Abtasten des Dokuments
-
Zuerst
wird ein Dokument in einen Scanner gelegt und das Dokument wird
abgetastet.
-
Operation 2... Zeichenerkennung
-
Das
Abbildungsbild eines gesamten Dokuments, das von diesem Scanner
gesendet wird, wird durch eine Zeichenerkennungssoftware entwickelt und
auf einer Kathodenstrahlröhrenanzeige
eines Personalcomputers angezeigt. Nach dem Bezeichnen des Bereichs,
wo Zeichen erkannt werden sollen (dieser Bereich wird hier später "vorgesehener Bereich" genannt), durch
eine Maus bei einer Zeichenerkennungssoftware, werden die Abbildungsbilddaten
des "vorgesehenen
Bereichs" durch
das Verwenden der Zeichenerkennungssoftware in Textdaten (Zeichenkodedaten)
umgewandelt und wieder auf der Kathodenstrahlenröhrenanzeige dargestellt.
-
Operation 3... Korrektur
-
Das
Ergebnis der Erkennung durch diese Zeichenerkennungssoftware wird
mit einer Tastatur durch das Vergleichen der Abbildungsbilddaten
des Dokuments, das in dieser Zeichenerkennungssoftware dargestellt
wird, mit Textdaten, bei denen es sich um Ergebnisse der Erkennung
handelt, korrigiert.
-
Operation 4... Kopieren oder Einfügen der
korrigierten Textdaten in eine Anwendungssoftware
-
Im
nächsten
Schritt werden die korrigierten Textdaten unter Verwendung einer
Maus kopiert und in eine Anwendungssoftware, wie eine Textverarbeitung
oder eine Tabellenkalkulation, eingefügt.
-
Wiederholung der Operation
-
Wenn
mehr als ein Dokument erkannt werden soll, sollten die Operationen
1 bis 4 wiederholt werden. Wenn mehr als ein "vorgesehener Bereich" in einem Dokument erkannt werden soll,
sollte die Operation 2 bis 4 wiederholt werden.
-
In
diesem konventionellen Zeichenerkennungssystems müssen zu
verwendende Teile von einer Zeichenerkennungssoftware ausgeschnitten oder
kopiert und in eine Anwendungssoftware, wie eine Textverarbeitung
oder eine Tabellenkalkulation, eingefügt werden, in der die Textdaten,
umgewandelte Zeichenkodes, verwendet werden. Mit anderen Worten,
mit dieser konventionellen Technik kann der Zeichenkode, der aus
den Bilddaten umgewandelt wurde, nicht gleichzeitig an einem benötigten Platz der
Anwendungssoftware, wie einer Textverarbeitung oder einer Tabellenkalkulation,
verwendet werden, wenn diese arbeiten.
-
Um
die oben erwähnten
Probleme zu lösen, wurde
ein Beispiel des Stands der Technik in der Offenbarung der nicht
geprüften
japanischen Patentveröffentlichung
Nr. 7-28801 gefunden, in der Ergebnisse der Zeichenerkennung
eines benötigten
Teils von Bilddaten durch die Verwendung einer anderen Anwendungssoftware
direkt verwendet werden können.
Das heißt,
es werden in diesem Stand der Technik Bilddaten, die Zeichen einschließen, angezeigt und
ein bezeichneter Teil der angezeigten Zeichen wird in einen Zeichenkode
umgewandelt, und dieser Zeichenkode wird an eine Anwendungssoftware
für das
Editieren eines Dokuments oder eine Datenverarbeitung übertragen.
-
Die
US-A-4 906 843 offenbart
eine in der Hand haltbare Einheit, die als eine Mauszeigevorrichtung,
ein in der Hand haltbarer Scanner oder eine Digitalisiervorrichtung
(digitizing puck) verwendet werden kann. Die in der Hand haltbare
Vorrichtung wird mit dem PC über
eine Schnittstellenkarte verbunden.
-
DAS VON DER VORLIEGENDEN ERFINDUNG
ZU LÖSENDE
PROBLEM
-
Dokumentgrößen für eine Zeichenerkennung,
die von sich auf dem Markt befindlichen Scannern verwendet werden,
liegen typischerweise im Format A4 (gelegentlich im Format A3) vor
und sie werden nacheinander abgetastet, und eine Seite des Dokuments
wird von einem Ende zum anderen Ende abgetastet.
-
Das
tatsächlich
abzutastende Dokument variiert jedoch in der Größe von der Größe einer
Visitenkarte oder der Größe eines
Buches bis zur Größe einer
Zeitung. Daneben sind in vielen Fällen die abzutastenden und
zu erkennenden Zeichen nicht alle Zeichen des Dokuments, sondern
ein Teil des Dokuments oder der Zeichen, die abgetastet werden sollen,
sind im Dokument verteilt.
-
Bei
einem Verfahren zur Zeichenerkennung des Stands der Technik, von
dem ein Beispiel in der nicht geprüften
japanischen Patentveröffentlichung Nr. 7-28801 angegeben
ist, werden zuerst Bilddaten, die Zeichen einschließen, auf
einem Kathodenstrahlmonitor eines Computers angezeigt.
-
Als
zweites muss der Teil, der aus den angezeigten Bilddaten auszuschneiden
ist, bezeichnet werden, und danach werden Zeichen in den ausgeschnittenen
Bilddaten erkannt und in Zeichenkodedaten umgewandelt, die dann
an die Anwendungssoftware übermittelt
werden müssen.
-
Somit
ist es mit diesem konventionellen Zeichenerkennungssystem, wenn
einzugebende Zeichen in einem Dokument verteilt sind, nicht möglich, nur
einen notwendigen Teil dieser Zeichen getrennt von einem anderen
Teil von Zeichen, die nicht eingegeben werden müssen, abzutasten. Mit anderen Worten,
es wird beim konventionellen Zeichenerkennungssystem das gesamte
Dokument, das den nicht notwendigen Teil der Zeichen einschließt, abgetastet, und
somit ist dieses konventionelle System klarerweise nicht effizient.
-
Daneben
kann dieses konventionelle Zeichenerkennungssystem nicht so verwendet
werden, dass nur der notwendige Teil eines Dokuments passend abgetastet
und erkannt wird, und dass die Ergebnisse des Erkennens in eine
Anwendungssoftware, wie eine Textverarbeitung übertragen werden, während wir
das Dokument lesen.
-
Daneben
werden im Stand der Technik die Bilddaten, nachdem sie in eine Zeichenerkennungssoftware
hereingenommen wurden, auf einem Kathodenstrahlanzeigemonitor angezeigt,
und Teile, die zu erkennen sind, werden durch eine Zeigevorrichtung, wie
eine Maus, bezeichnet, damit die Eingabe der Zeichen in eine Anwendungssoftware
möglich
gemacht wird. Somit werden beim Stand der Technik zu viele Operationen
benötigt,
um eine direkte Eingabe der bevorzugten Zeichen in die Anwendungssoftware vorzunehmen.
-
Das
andere Problem beim Stand der Technik ist das, dass wir die Ergebnisse
der umgewandelten Zeichenkodedaten nicht prüfen können, bevor sie in die Zeichenerkennungssoftware
hereingenommen werden, und somit können wir nicht von Hand das umgewandelte
Ergebnis der Bilddaten an Ort und Stelle bestätigen, korrigieren oder ändern.
-
Die
vorliegende Erfindung zielt darauf, dieses Problem des Stands der
Technik zu lösen,
und sie liefert einen Scanner und ein optisches Zeichenerkennungsverfahren,
bei denen nur ein "vorgesehener
Bereich" des Dokuments
abgetastet werden kann, und bei denen Zeichen dieses Bereichs im
Hintergrund einer Anwendungssoftware erkannt werden können, und
die Ergebnisse der Erkennung direkt in diese Anwendungssoftware
eingegeben werden können.
-
LÖSUNG
GEMÄSS
DER ERFINDUNG
-
Um
die Aufgabe zu lösen,
liefert die Erfindung eine Bildabtastvorrichtung gemäß Anspruch
1 und ein Verfahren gemäß Anspruch
7.
-
Die
vorliegende Erfindung liefert ein Verfahren, das einen Teil von
Zeichen, die von einen Dokument zu nehmen sind, auswählen und
bestätigen kann,
und das die Zeichen im Hintergrund einer Anwendungssoftware erkennen
kann und das die Ergebnisse der Erkennung direkt in die Anwendungssoftware
eingeben kann.
-
Die
Bildabtastvorrichtung der vorliegenden Erfindung umfasst: einen
Bildsensor, der Zeicheninformation auf einem Dokument als Bildinformation übernimmt,
indem er optisch Zeichen auf diesem Dokument abtastet, einen Ausgabeteil,
der die Bildinformation, die durch das Abtasten der Zeichen mit
dem Bildsensor erhalten wurde, ausgibt, einen Eingabeteil, der die
Ergebnisse der Zeichenerkennung der Bildinformation, die vom Ausgabeteil
ausgegeben werden, eingibt, einen Anzeigeteil, der die Ergebnisse
der Zeichenerkennung, die durch diesen Eingabeteil eingegeben werden,
anzeigt. Diese Bildabtastvorrichtung ist auf einem Dokument bewegbar,
um so willentlich den benötigten
Erkennungsbereich der Zeicheninformation dieses Dokuments zu bezeichnen.
-
Und
die Umwandlungsergebnisse des Zeichenbildes, das durch das Abtasten
der Zeichen auf diesem Dokument erhalten wurde, können von
Hand durch das Anzeigen der Ergebnisse der Zeichenerkennung auf
diesem Anzeigeteil bestätigt
werden.
-
Das
optische Zeichenerkennungssystem der vorliegenden Erfindung besteht
aus einer Bildabtastvorrichtung und einem Personalcomputer. Die Bildabtastvorrichtung
umfasst einen Bildsensor, der optisch Zeichen auf einem Dokument
abtastet und Zeicheninformation auf diesem Dokument als Bildinformation übernimmt,
einen Ausgabeteil, der die Bildinformation, die durch das Abtasten
von Zeichen auf einem Dokument mit diesem Bildsensor erhalten wurde,
an einen Personalcomputer ausgibt, einen Eingabeteil, der von diesem
Personalcomputer die Ergebnisse der Zeichenerkennung der Bildinformation,
die von diesem Ausgabeteil ausgegeben werden, eingibt, einen Anzeigeteil,
der die Ergebnisse der Zeichenerkennung, die von diesem Eingabeteil
eingegeben werden, anzeigt, und einen Bedienteil, der arbeitet,
um zu bestimmen, ob die Ergebnisse der Zeichenerkennung bestätigt werden
sollen oder nicht.
-
Die
Bildabtastvorrichtung der vorliegenden Erfindung ist über ein
Dokument bewegbar, um willentlich den zu erkennenden Bereich unter
der Zeicheninformation auf dem Dokument zu bezeichnen.
-
Und
es können
die Umwandlungsergebnisse der Zeicheninformation auf dem Dokument
von Hand bestätigt
werden, indem man auf die Ergebnisse der Zeichenerkennung des bezeichneten
Bereichs dieses Dokuments schaut, das auf dem Anzeigeteil angezeigt
wird, und wobei nach dem Bestätigen
der Umwandlungsergebnisse durch das Bedienen des Bedienteils das
Bestätigungssignal
an einen Computer übertragen
wird. Dieser Computer sollte mit mindestens einer Anwendungssoftware
und einer Zeichenerkennungssoftware geladen sein, die die Bildinformation,
die von diesem Ausgabeteil der Bildabtastvorrichtung ausgegeben
wird, erkennt. Und wenn die Bildinformation, die von diesem Bildsensor
abgetastet wird, in den Computer eingegeben wird, werden die Ergebnisse
dieser Zeichenerkennungssoftware an die Bildabtastvorrichtung übertragen.
Wenn das Signal des Bestätigens
der Umwandlungsergebnisse von dieser Bildabtastvorrichtung an diesen Computer übertragen
wird, werden die bestätigten Zeichendaten
in die bezeichnete Position der Anwendungssoftware eingegeben.
-
Nachfolgend
wird hier das Verfahren der Dateneingabe der vorliegenden Erfindung,
das ist die Sequenz des Verfahrens der Dateneingabe in Anwendungssoftware,
wie eine Textverarbeitung, eine Tabellenkalkulation, eine Datenbanksoftware
etc., beschrieben.
-
Wenn
eine Bildabtastvorrichtung, die über ein
Dokument bewegt werden kann, Zeichen auf einem Dokument abtastet,
um so willentlich Bereiche, die unter der Zeicheninformation dieses
Dokuments erkannt werden sollen, zu bezeichnen, werden die Bilddaten,
die durch das Abtasten erhalten werden, an einen Personalcomputer übertragen.
Danach übernimmt
der Personalcomputer die Bilddaten, und die Zeichenerkennungssoftware,
die im Hintergrund der Anwendungssoftware arbeitet, die die Dateneingabe
handhabt, wird diese Bilddaten als Zeichen erkennen, und entsprechende
Zeichenkodedaten werden in einem Bitmap-Format an die Bildabtastvorrichtung übertragen.
-
Wenn
die Bildabtastvorrichtung die Zeichenkodedaten empfängt, werden
die Zeichen auf einem Anzeigeteil der Bildabtastvorrichtung angezeigt. Wenn
die angezeigten Zeichen bestätigt
werden als solche, die abgetastet werden sollten, wird ein Signal,
das die Beendigung des korrekten Abtastens angibt, an den Personalcomputer
gesandt.
-
Wenn
dieser Personalcomputer dieses Signal empfängt, das die Beendigung der
korrekten Abtastung angibt, werden die Zeichenkodedaten in die Anwendungssoftware
eingegeben.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 ist
ein Funktionsblockdiagramm, das eine Ausführungsform eines optischen
Zeichenerkennungssystems der vorliegenden Erfindung zeigt.
-
2 ist
ein schematisches Diagramm eines optischen Zeichenerkennungssystems,
das in 1 gezeigt ist.
-
3 ist
eine Aufsicht, die die Struktur der in 1 gezeigten
Abtastvorrichtungsmaus zeigt.
-
4 ist
eine linke Seitenansicht, die die Struktur der Abtastvorrichtungsmaus
zeigt, die in 1 gezeigt ist.
-
5 ist
ein Sequenzdiagramm, das den Fluss des Verfahrens des in 1 gezeigten
optischen Erkennungssystems zeigt.
-
6 ist
ein Blockdiagramm, das eine andere Ausführungsform der vorliegenden
Erfindung zeigt, bei der Textdaten der Zeichenerkennung direkt in
eine Anwendungssoftware eingegeben werden.
-
7 ist
eine perspektivische Ansicht einer anderen Ausführungsform der Bildabtastvorrichtung der
vorliegenden Erfindung.
-
BEVORZUGTE AUSFÜHRUNGSFORM
DER VORLIEGENDEN ERFINDUNG
-
Unter
Bezug auf die angefügten
Zeichnungen werden nachfolgend eine Ausführungsform einer Bildabtastvorrichtung
und eines optischen Abtastverfahrens gemäß der vorliegenden Erfindung
beschrieben.
-
Betrachtet
man die 2, so ist dort ein schematisches
Diagramm eines optischen Zeichenerkennungssystems gemäß der vorliegenden Erfindung
gezeigt, in der eine Bildabtastvorrichtung die Form einer Abtastvorrichtungsmaus
annimmt.
-
In 2 ist
der Personalcomputer 10 ein konventioneller Computer, der
mit einem Betriebssystem, wie Windows 98 von Microsoft,
läuft,
das mit dem universellen seriellen Bus (der nachfolgend als USB
bezeichnet wird) umgehen kann, das ist ein Bus für eine bidirektionale Kommunikation
hoher Geschwindigkeit.
-
Der
Personalcomputer 10 kann mit einer Anwendungssoftware,
wie einer Textverarbeitung, einer Tabellenkalkulation, einer Datenbanksoftware
etc. laufen, und daneben läuft
er mit einer Zeichenerkennungssoftware im Hintergrund der Anwendungssoftware.
-
Mit
anderen Worten, während
eine Zeichenerkennungssoftware im Personalcomputer 10 läuft, kann
der Bediener des Computers den Ablauf der Zeichenerkennungssoftware
nicht sehen, sondern er sieht nur den Ablauf der Anwendungssoftware,
und die Zeichen, die mit der Zeichenerkennungssoftware erkannt werden,
werden in die Anwendungssoftware eingegeben, als ob sie mit einer
Tastatur eingegeben werden.
-
Der
Personalcomputer 10 ist mit einer Kathodenstrahlröhrenanzeige
oder einer LCD-Anzeige (Flüssigkristallanzeige)
und mit einer Tastatur verbunden. Daneben weist der Personalcomputer 10 einen
USB-Anschluss auf, und eine Abtastvorrichtungsmaus 20 ist
mit diesem USB-Anschluss
des Computers durch ein USB-Kabel 50 verbunden. Somit ist
es durch das Verbinden der Abtastvorrichtungsmaus 20 durch
den USB mit dem Personalcomputer möglich, eine bidirektionale
Kommunikation zwischen der Abtastvorrichtungsmaus und dem Computer
auszuführen,
und der Computer 10 kann die Abtastvorrichtungsmaus 20 mit
Leistung versorgen.
-
Die
Abtastvorrichtungsmaus 20 hat zwei vereinigte Teile, die
verschiedene Funktionen aufweisen. Die eine Funktion ist eine Mausfunktion,
die als eine Zeigevorrichtung des Personalcomputers 10 wirkt,
und die andere ist eine Abtastfunktion, die Dokumente optisch abtastet
und Bilddaten ausgibt. Die Abtastvorrichtungsmaus 20 weist
an ihrem Boden einen Bildsensor auf, um Dokumente optisch abzutasten,
und sie kann sich über
jeden Platz auf einem Dokument bewegen.
-
Somit
können
durch das Bewegen der Abtastvorrichtungsmaus 20 zu einem "vorgesehenen Bereich", wo wir eine Zeichenerkennung
ausführen wollen,
die notwendige Teile der Zeichen eines Dokuments abgetastet werden.
-
Die
Abtastvorrichtungsmaus 20 überträgt die abgetasteten Bilddaten
des "vorgesehenen
Bereichs" eines
Dokuments an den Personalcomputer 10 durch das USB-Kabel 50.
Wenn der Personalcomputer 10 die Bilddaten empfängt, wird
die Zeichenerkennungssoftware die Bilddaten erkennen, und die Ergebnisse
der Zeichenkodeerkennung werden durch das USB-Kabel 50 an die Maus 20 übertragen. Wenn
die Abtastvorrichtungsmaus diesen Zeichenkode empfängt, werden
die entsprechenden Zeichen auf der LCD 26 angezeigt.
-
Somit
können,
da die Ergebnisse der Zeichenerkennung eines abgetasteten Bereich
nahezu in Echtzeit auf der LCD 26 gezeigt werden, die Ergebnisse
der Erkennung bestätigt
werden, sobald die Abtastung erfolgt. Somit kann, während die
Abtastung ausgeführt
wird, die Position (der Anfangspunkt oder der Endpunkt der Abtastung)
des "vorgesehenen
Bereichs" eingestellt
werden. Darüber
hinaus kann die Position des "vorgesehenen
Bereichs", wenn
es notwendig ist, geändert
werden, und ein Einstellpunkt (binärer Schwellwert) kann passend
eingestellt werden, während
die Bilddaten übernommen werden.
-
Mit
anderen Worten, in dieser Ausführungsform
der vorliegenden Erfindung kann unter Verwendung des Vorteils einer
Zeichenerkennungstechnik höherer
Geschwindigkeit durch die verbesserte Leistung von Personalcomputern
und unter Verwendung des Vorteils einer Datenübertragung hoher Geschwindigkeit
mittels USB, der Anfangspunkt und der Endpunkt der Zeichenerkennung
auf einem Dokument mit dem Anzeigeteil 26 geprüft werden,
indem der Scanner leicht bewegt wird, wenn der "vorgesehene Bereich" bezeichnet wird. Somit ist es möglich, in
dieser Stufe den "vorgesehenen
Bereich" wieder zu
bezeichnen, wenn der Anfangspunkt und/oder Endpunkt der Abtastung
nicht passend ist. Und wenn eine Sprachsynthetisiersoftware im Personalcomputer 10 geladen
ist, so ist es möglich,
die Erkennungsergebnisse zu kennen, indem die Sprache ausgegeben
wird, ohne den Anzeigeteil 26 zu prüfen.
-
Wenn
die Bezeichnung des "vorgesehenen Bereichs" bestätigt wird,
und wenn die Bestätigung durch
das Betätigen
der Abtastvorrichtungsmaus 20 festgelegt wird, werden die
Ergebnisse der Erkennung direkt an eine Cursorposition einer Textverarbeitungssoftware
oder einer Tabellenkalkulationssoftware, die auf dem Personalcomputer 10 läuft, eingegeben.
In diesem Moment werden bei der Ausführungsform der vorliegenden
Erfindung die ursprünglichen
Bilddaten der Ergebnisse der Zeichenerkennung, die an diese Anwendungssoftware
gesendet wurden, auf dem Personalcomputer 10 gezeigt, um eine
einfache Art der Korrektur einer möglicherweise falschen Erkennung
auf dieser Anwendungssoftware zu erhalten. Somit kann sogar wenn
irgend ein falscher Teil bei den Ergebnissen der Erkennung gefunden
wird, der falsch erkannte Teil auf der Anwendungssoftware leicht
mit einer Tastatur unter Bezug auf die Bilddaten korrigiert werden.
-
Wenn
eine Spracherkennungssoftware, wie sie in der nicht geprüften
japanischen Patentveröffentlichung
Nr. 7-83353 beschrieben ist, geladen ist, um den falsch
erkannten Teil auf der Anwendungssoftware mit Sprache zu ändern, können selbst
unerfahrene Benutzer des Computers
10 den falsch erkannten
Teil leicht ändern.
-
In 1 ist
ein Funktionsblockdiagramm des Personalcomputers 10 und
der Abtastvorrichtungsmaus 20, die in 2 beschrieben
sind, gezeigt. Betrachtet man die 1, so umfasst
die Abtastvorrichtungsmaus 20 eine Maus und eine Bildsensorschaltung 22,
eine Schnittstellenschaltung 24, eine LCD 26 und
eine USB-Mikrosteuerung 28. In der Ausführungsform der vorliegenden
Erfindung kann die Abtastvorrichtungsmaus 20 die abgetasteten
Bilddaten speichern, aber gewöhnlicherweise
ist die Abtastvorrichtungsmaus 20 mit einem Computer verbunden, und
sie gibt abgetastete Bilddaten mit hoher Geschwindigkeit in Echtzeit
an den Personalcomputer 10 aus, ohne diese Bilddaten zu
speichern.
-
Die
Maus- und die Bildsensorschaltung 22 umfassen eine Maus,
die als Zeigevorrichtung eines Personalcomputers arbeitet, und einen
Bildsensor, der ein Bild auf einem Dokument als Bilddaten übernimmt.
Die Maus- und die Bildsensorschaltung 22 weisen auch eine
Positionssensorschaltung auf, die ein Positionssignal der Maus als
Positionssignal der Abtastvorrichtung verwendet. Die Maus- und die Bildsensorschaltung 22 sind
mit einer Schnittstellenschaltung 24 verbunden, und Positionsinformation, die
durch die Maus detektiert wird, und Bilddaten, die durch den Bildsensor übernommen
wurden, werden an die Schnittstellenschaltung 24 als serielle
Daten ausgegeben. Die Maus- und die Bildsensorschaltung 22 führen auch
das Übertragen
eines Steuersignals an die Schnittstellenschaltung 24 und
das Empfangen eines Steuersignals von der Schnittstellenschaltung 24 aus.
-
Die
Schaltung 24 ist eine Schnittstellenschaltung zwischen
der Maus und der Bildsensorschaltung 22, der LCD 26 und
der USB-Mikrosteuerung 28. Die Schnittstellenschaltung 24 überträgt eine
Positionsinformation, die durch eine Maus detektiert wird, an die
USB-Mikrosteuerung 28 in Echtzeit, und wenn die Schnittstellenschaltung 24 Signale
des Beginnens und des Endens für
das Abtasten und ein Signal der Bestätigung empfängt, wird sie solche Signale
an die Maus- und
die Bildsensorschaltung 22 übertragen. Wenn die Schnittstellenschaltung 24 Steuerdaten
empfängt,
die Zeichen auf der LCD 26 durch die USB-Mikrosteuerung 28 anzeigt,
wird sie die Steuerdaten (FCC) an die LCD 26 übertragen.
Mit diesen Steuerdaten werden die entsprechenden Zeichen auf der
LCD 26 gezeigt.
-
Die
USB-Mikrosteuerung 28 ist eine Steuerschaltung, die einen
Steuerteil, der die Abtastvorrichtungsmaus 20 insgesamt
steuert, und einen USB-Steuerteil umfasst, um Daten durch den USB
zu senden und zu empfangen. Die USB-Mikrosteuerung 28 ist
mit einem USB-Treiber des Personalcomputers 10 durch das
USB-Kabel 50 verbunden,
und sie überträgt Bilddaten,
die durch den Bildsensor übernommen
wurden, an den Personalcomputer 10. Wenn die USB-Mikrosteuerung 28 Zeichenkodedaten
vom Personalcomputer 10 empfängt, wird sie Steuerdaten an die
Schnittstellenschaltung 24 ausgeben, um Zeichen auf der
LCD 26 darzustellen.
-
Der
Personalcomputer 10 umfasst einen USB-Treiber 12 der
Kernschicht, der auf der OS-Ebene (Ebene des Betriebssystems) gesteuert
wird, und eine Benutzerschnittstelle 14 der Benutzerschicht, die
auf der Ebene der Anwendungssoftware gesteuert wird. In der Schnittstelle 14 der
Figur ist ein Fluss des Zeichenerkennungsverfahrens von Bilddaten
gezeigt.
-
In
der Benutzerschnittstelle 14 der betreffenden Figur werden
zuerst Bilddaten, die durch den USB-Treiber von der Abtastvorrichtungsmaus 20 empfangen
werden, übernommen
(140), und als zweites werden sie in Bilddaten, wie Bitmap
(BMP) etc. umgewandelt (142), und schließlich wird
eine japanische Zeichenerkennung ausgeführt (144).
-
Im
Verfahren (144) werden Bilddaten, die von der Abtastvorrichtungsmaus 20 empfangen
werden, nacheinander in Zeichenkodedaten japanischer Zeichen umgewandelt
und in der Datei gespeichert (146). Die Zeichenkodedaten,
die in der Datei gespeichert sind, werden als LCD-Übertragungsdaten
nahezu in Echtzeit im Bitmap-Format verarbeitet (148), und
sie werden an die Abtastvorrichtungsmaus 20 durch den USB-Treiber 12 übertragen.
Als Ergebnis werden die Bilddaten, die durch die Abtastvorrichtungsmaus 20 abgetastet
werden, in Zeichendaten in Echtzeit durch den Personalcomputer 10 umgewandelt,
und die Ergebnisse der Umwandlung werden auf der LCD 26 nahezu
zur gleichen Zeit, zu der die Abtastung erfolgt, gezeigt.
-
Die 3 und 4 zeigen
eine Aufsicht und eine Seitenansicht der Abtastvorrichtungsmaus, die
in den 1 und 2 gezeigt ist. Wie in der Figur
gezeigt ist, sind in der Abtastvorrichtungsmaus 20 eine
Abtastvorrichtung 30, die innen einen Bildsensor aufeist,
eine Walze 32, ein Mausball 34 und eine Steuerschaltung 36,
die die ganze Abtastvorrichtungsmaus 20 steuert, angeordnet.
Der Scanner 30, die Walze 32 und die Kugel 34 in 3 entsprechen
der Maus- und der Bildsensorschaltung 22. Und die Steuerschaltung 36 in 3 entspricht
der Schnittstellenschaltung 24 und der USB-Mikrosteuerung 28.
-
Der
Scanner 30 ist ein Abbildungsbildsensor des Kontakttyps,
und eine Lichtquelle ist mit dem Bildsensor im Scanner 30 verbunden.
Der Scanner 30 hat einen sehr empfindlichen Bildsensor
mit mehr als 400 dpi, um so komplizierte Kanji-Buchstaben zu erkennen.
-
Die
Abtastvorrichtungsmaus 20 weist die LCD 26 an
ihrer Oberseite ihrer oberen Oberfläche auf, und 2 oder 3 Maustasten 44 sind
auch auf der oberen Oberfläche
der Abtastvorrichtungsmaus 20 angeordnet. Die linke Taste 40 dient
zum Starten der Abtastung, und die rechte Taste 42 dient
zur Bestätigung
der auf der LCD 26 dargestellten Zeichen. Auf den linken
und rechten Seiten der Oberfläche
der Abtastvorrichtungsmaus 20 sind Anzeigen 46a, 46b aufgedruckt,
um den Abtastbereich anzuzeigen. Mit diesen Anzeigen auf der Abtastvorrichtungsmaus 20 wird
es leicht sein, einen Abtastort auf einem Dokument einzustellen.
-
4 ist
eine Konstruktionsansicht der Abtastvorrichtungsmaus 20,
die ihre linke Seite zeigt.
-
Wie
in 4 gezeigt ist, weist die Abtastvorrichtungsmaus 20 eine
sanfte Neigung auf ihrem vorderen Teil auf, so dass man leichter
auf die LCD 26 sehen kann, und sie weist eine Rundung auf
der Rückseite
auf, so dass sie sicherer gefasst werden kann. Die Walze 32 ist
etwas höher
als die Kugel 34 angeordnet, um einen Einfluss der Walze 32 auf
die Funktion der Kugel 34 zu verhindern.
-
Obwohl
es nicht speziell beschrieben ist, können wir durch den Personalcomputer 10 wählen, welche
Sprache, Japanisch oder Englisch, abgetastet werden soll, oder welche
Eingabe, Zeichen oder Bild, verwendet werden soll, etc. Diese Auswahl
kann auch durch eine Steuertaste, die in der Abtastvorrichtungsmaus 20 angeordnet
ist, eingestellt werden, oder wir können beide dieser Mittel, den
Personalcomputer oder die Steuertaste, verwenden.
-
Statt
den Anzeigen 46a, 46b kann ein Fenster, das die
Breite des Scanners 30 aufweist, ausgebildet werden, durch
das das Dokument von oben gesehen werden kann, um so leicht die
Position einzustellen, um den "vorgesehenen
Bereich" abzutasten.
-
Unter
Bezug auf die 3 und 4 wird hier
nachfolgend der Betrieb der Abtastvorrichtungsmaus 20 beschrieben.
-
Während die
Abtasttaste 40 nach unten gedrückt wird, erfolgt die Abtastung.
Wenn die Abtastungsstarttaste 40 gedrückt wird, wird die Abtastvorrichtungsmaus
Licht von einer (nicht gezeigten) Lichtquelle auf die Dokumentenoberfläche werfen, und
der Scannersensor 30 wird beginnen, Bilder abzutasten.
-
Da
der Scanner 30 rechtwinklig zum Dokument angeordnet ist,
werden Bilddaten durch das Bewegen der Abtastvorrichtungsmaus 20 in
der Richtung des Pfeils 100 der 2 übernommen.
Die übernommenen
Bilddaten werden an die Steuerschaltung 36 ausgegeben und
an den Personalcomputer 10 gemäß dem USB-Protokoll durch das USB-Kabel 50 übertragen.
Wenn die Steuerschaltung 36 Zeichenkodedaten vom Personalcomputer 10 empfängt, wird
sie auch entsprechende Buchstaben aus einem eingebauten Speicher
heraus nehmen und sie auf der LCD 26 anzeigen.
-
In
diesem Moment werden "Linien,
die den Beginn und das Ende des "erkannten
Textes" angeben", auf der LCD 26 dargestellt.
Die Anzeige der Zeichen auf der LCD 26 steht in Bezug zur
Abtastrichtung des Scanners 30. Um es konkret zu sagen, so
werden, wenn sich der Scanner 30 von links nach rechts
bewegt, Zeichen auf der LCD, nämlich
Ergebnisse der Zeichenerkennung, zuerst auf der rechten Seite der
LCD 26 erscheinen.
-
Und
wenn die erkannten Zeichen zunehmen, werden die dargestellten Zeichen
zunehmen und sich vom rechten Ende zum linken Ende bewegen. Somit
braucht es, nachdem das erste erkannte Zeichen angezeigt wird, eine
gewisse Zeit, bevor es verschwindet.
-
Somit
ist es möglich,
die Abtastposition leicht zu bestätigen. Somit wird die Angabe
und die Bestätigung
des "vorgesehenen
Bereichs" leicht
ausgeführt
werden. Mit anderen Worten, wir können leicht die Startposition
und die Endposition der Eingabe von Hand bestimmen, während wir
die Aufmerksamkeit auf das Dokument lenken.
-
Nachdem
die Zeichen, die auf der LCD 26 gezeigt sind, bestätigt werden,
und der Knopf 42 für das
Bestätigen
der Abtastung niedergedrückt
wird, wird die Steuerschaltung 36 das Niederdrücken des Knopfes 42 detektieren
und den Personalcomputer 10 durch das USB-Kabel 50 benachrichtigen,
dass das Bestätigungs-
und Festlegungsverfahren der Zeichenkodedaten vollendet worden ist.
Wenn der Personalcomputer 10 diese Nachricht empfängt, werden
die Zeichenkodedaten direkt in die ablaufende Anwendungssoftware
eingegeben.
-
Bei
der vorangehenden Beschreibung des Abtastverfahrens erfolgt die
Abtastung, während
die Abtaststarttaste 40 niedergedrückt wird, wobei jedoch auch
eine andere Ausführungsform,
wie sie hier später
beschrieben wird, möglich
ist. Das heißt,
wenn der Startknopf für
die Abtastung einmal gedrückt
ist, geht die Abtastvorrichtungsmaus 20 in einen Abtastmodus,
und wenn die Abtastungstaste nochmals gedrückt wird, wird der Abtastungsmodus
verlassen. In diesem Fall geht die Walze 32 hinunter zur
Position, wo sie ein Dokument berührt, mit dem ersten Druck der
Starttaste 40 für
die Abtastung, und die Walze 32 wird zurück in die
ursprüngliche
Position beim zweiten Drücken
gehen. Statt der Starttaste 40 oder der oben erwähnten Bestätigungstaste 42 können wir
die Maustaste 44 verwenden, um die Abtastung zu starten
und um Zeichen zu bestätigen.
-
5 zeigt
einen Fluss einer Verfahrenssequenz im Personalcomputer 10 und
der Abtastvorrichtungsmaus 20. In dieser Figur werden sich
Erläuterungen
der Verfahren 200, 202, 204, 206 und 210 überlappen,
so dass hier ein Beispiel des Verfahrens 208 angegeben
wird, in welchem eine erkannte Textdatei von Zeichen an eine Anwendungssoftware
ausgegeben wird, nachdem die Bilddatei im Verfahren 206 erkannt
worden ist.
-
Wenn
die Textdatei der Zeichenerkennung ausgegeben wird, wird sie in
eine Anwendungssoftware des Typs MS-Word eingegeben, indem die Windows-Funktion "Win-Exec()" verwendet wird.
Die Syntax von "WinExec()" ist folgende:
UNIT
WinExec(LPCSTR IpCmdLine, //address of command line UNIT nCmdShow,
//window style for application).
-
Hier
steht LPCSTR IpCmdLine für
einen Busname der Ausführungsdatei
der Anwendungssoftware "WinWord(MS-WORD)", und durch das Ändern dieses
Teils kann jede Anwendungsdatei bezeichnet werden.
-
In
der Ausführungsform
der vorliegenden Erfindung werden Textkodedaten, bei denen es sich
um Zeichenkodedaten handelt, in die Anwendungssoftware durch ein
japanisches zeichenerkennungsverfahren eingegeben, ohne ihre Form
zu ändern.
-
Bei
der konventionellen Weise der Eingabe von Daten unter Verwendung
einer Tastatur empfängt
das Betriebssystem die eingegebenen Daten und bringt sie in eine
Kodeform, die für
die Anwendungssoftware geeignet ist, wohingegen in der Ausführungsform
der vorliegenden Erfindung mehrere Windows-Funktionen für das Eingeben von Daten verwendet
werden, wie das oben erwähnt
wurde. In der Ausführungsform
der vorliegenden Erfindung wird auch statt eines einzelnen Zeichens
ein Block von Zeichen oder eine Zeile von Zeichen zur selben Zeit
in die Anwendungssoftware mit der Textform eingegeben. Mit diesem
Eingabeverfahren ist es möglich,
Daten in die Anwendungssoftware mit einer Textform einzugeben, die
schneller als jedes andere Verfahren, einschließlich der Eingabe über die
Tastatur, ist.
-
Übrigens
muss in dieser Ausführungsform der
vorliegenden Erfindung ein Busname einer Ausführungsdatei geändert werden,
wenn die Anwendungssoftware geändert
wird, und der Bediener muss wissen, welche Anwendungssoftware verwendet
wird. In 6 ist eine Ausführungsform,
die diesen Punkt verbessert, gezeigt, und es ist ein Fluss zur Verarbeitung
von Daten im Personalcomputer 10 gezeigt.
-
Das
Betriebssystem 600 ist eine Basissoftware, die die Operationen
der Hardware und Software insgesamt verwaltet und steuert. Um es
konkret zu sagen, so gibt das Betriebssystem 600, wenn
es die Bilddaten empfängt,
die von der Abtastvorrichtungsmaus 20 gesendet werden,
die Bilddaten an die Zeichenerkennungssoftware 610 aus,
die im Hintergrund abläuft.
-
Auch
steuert das Betriebssystem 600 das System so, dass der
Abtastkode, der von der Tastatur 17 eingegeben wird, an
den IMM (Input Method Manager, Eingabeverfahrensmanager) 630 gegeben wird
und dort in einen Zeichenkode umgewandelt und auf dem Anzeigemonitor 15 angezeigt
wird.
-
Im
Betriebssystem 600 wird der IME (Input Method Editor, Eingabeverfahrenseditor) 620 durch den
IMM 630 gerufen und wandelt Abtastkode, der von der Tastatur 17 eingegeben
wird, in die japanische Sprache oder eine andere asiatisch Sprache des
2 Byte Systems um. Im Fall von Englisch wird der Abtastkode, der
von der Tastatur 17 eingegeben wird, durch den IMM 630 in
Zeichenkode umgewandelt.
-
Somit
greift in einer japanischen Version von Windows 98, wenn
Zeichenkode in die Anwendungssoftware 640 eingegeben wird,
der IMM 630 in das Betriebssystem 600, die Zeichenerkennungssoftware 610,
die japanische Kana-Kanji-Umwandlungssoftware
IME 620 und die Anwendungssoftware 640 ein.
-
Somit
können
wir Zeichenkode der Textdatei der Zeichenerkennungssoftware 610 unter
Verwendung des IMM 630 direkt in die Anwendungssoftware eingeben.
In diesem Verfahren wird eine Nachricht WN_ME_REPORT verwendet,
um den Zeichenblock oder die Zeichenzeile auf einmal zu befördern, und eine
Nachricht WN_CHAR oder WN_IME_CHAR wird für das getrennte Befördern einzelner
Zeichen verwendet. Somit müssen
wir durch die Verwendung des IMM 630 die Ausführungsdatei
für irgend
eine Anwendungssoftware nicht ändern.
Der IMM wird im Systemordner von Windows mit dem Namen vom IMM oder
WINNLS gespeichert.
-
Obwohl
eine Ausführungsform
der vorliegenden Erfindung hier vorher für einen Fall beschrieben wurde,
bei dem eine Bildabtastvorrichtung auf eine Abtastvorrichtungsmaus
angewandt wird, ist die vorliegende Erfindung nicht speziell auf
eine Abtastvorrichtungsmaus beschränkt.
-
7 zeigt
eine perspektivische Ansicht einer anderen Ausführungsform einer Bildabtastvorrichtung
für die vorliegende
Erfindung. Die in 7 gezeigte Bildabtastvorrichtung 70 ist
eine Flachbettbildabtastvorrichtung, die Zeichen eines vorgesehenen
Bereichs durch das Platzieren des Scanners über dem vorgesehenen Bereich
erkennen kann. Es sollte verständlich
sein, dass das in 1 gezeigte Funktionsblockdiagramm
auch in der hier beschriebenen Ausführungsform angewandt werden
kann.
-
7(a) zeigt eine Aufsicht auf die Bildabtastvorrichtung 70.
Wie in 7(a) gezeigt ist, besitzt die
Bildabtastvorrichtung 70 die Größe einer Postkarte und weist
eine rechteckige Form auf und besitzt ein Flüssigkristallfolienanzeigefeld 72 der
japanischen Sprache auf ihrer oberen Oberfläche, das die Ergebnisse der
Erkennung darstellt. Es gibt eine Abtaststarttaste 73 unten
links von dem Flüssigkristallfolienanzeigefeld
der japanischen Sprache.
-
Der
Kontaktbildsensor 74 weist eine Struktur auf, in der eine
Lichtquelle und ein Bildsensor vereinigt sind, und er ist auf einem
verschiebbaren Teil 75a, 75b angeordnet. Die verschiebbaren
Teile 75a, 75b sind so an den Schienen 76a, 76b befestigt, dass
sie gleiten. Der Kontaktbildsensor 74 ist mit dem Befestigungsteil 84 auch
am Riemen 78 befestigt, der zwischen der Antriebsrolle 80 und
der freien Rolle 82 gedehnt ist. Wenn sich somit die Antriebsrolle 80 im Uhrzeigersinn
dreht, bewegt sich der Kontaktbildsensor 74 in der Richtung
des Pfeils 700a, und wenn sich die Antriebsrolle 80 im
Gegenuhrzeigersinn dreht, bewegt sich der Kontaktbildsensor 74 in
der Richtung des Pfeils 700b.
-
Um
es konkret zu sagen, so beginnt, wenn die Taste 73 niedergedrückt wird,
der Kontaktbildsensor 74, der sich unten links befindet,
sich in der Richtung des Pfeils 700a durch das Drehen der
Antriebsrolle 80 im Uhrzeigersinn zu bewegen, und er beginnt einen
Entwurf, der sich gerade unter dem Scanner befindet, abzutasten.
Die Bewegungsdistanz des Bildsensors 74 wird durch einen
(nicht gezeigten) Kodierer, der an der Seite des Sensors platziert
ist, digitalisiert. Die Abtastung in der vertikalen Richtung erfolgt
durch ein elektrisches Signal im Sensor. Sowohl die vertikalen als
auch die horizontalen digitalisierten Signale werden an die Bildsensorschaltung 20 (siehe 1) übertragen.
-
Die
Bildabtastvorrichtung 70 der vorliegenden Ausführungsform
ist auch mit dem Personalcomputer 10 durch ein USB-Kabel
verbunden, und das folgende Verfahren ist praktisch das gleiche
wie das der Abtastvorrichtungsmaus.
-
Im
Fall der Abtastvorrichtungsmaus 20 wird ein Scanner von
Hand über
den Abtastbereich eines Dokuments bewegt, wobei jedoch im Fall der
Bildabtastvorrichtung 70 der Scanner auf ein Dokument gesetzt
wird, und sich der Kontaktbildsensor 74 für eine Abtastung
bewegt. Somit kann die Bildabtastvorrichtung 70 den "vorgesehenen Bereich" in stabiler Weise
abtasten.
-
Die
Ausführungsform
der vorliegenden Erfindung wurde im Fall eines Systems, das Windows 98 verwendet,
beschrieben, mit dem die vorliegenden Erfindung bevorzugt angewandt
wird. Es sollte jedoch verständlich
sein, dass ein Betriebssystem, das auf die vorliegende Erfindung
anwendbar ist, nicht auf Windows 98 beschränkt ist,
und dass das Konzept der vorliegenden Erfindung auf ein anderes
Betriebssystem, wie Windows CE, Macintosh OS und etc. angewandt
werden kann.
-
DIE WIRKUNG DER ERFINDUNG
-
Wie
oben ausgeführt
wurde, ist es durch das Anwenden der vorliegenden Erfindung möglich, eine Zeichenerkennung
eines benötigten
Teils eines Dokuments leicht von Hand auszuführen, gerade wie wenn man einen
Stift benutzt. Und durch das Ablaufenlassen einer Zeichenerkennungssoftware
im Hintergrund der Anwendungssoftware können Zeichenkodedaten erkannter
Zeichen direkt in diese Anwendungssoftware eingegeben werden.
-
Somit
können
durch das Anwenden der vorliegenden Erfindung Zeichen in einem Dokument, während man
es betrachtet, in Zeichenkodedaten umgewandelt werden, gerade so
wie das Eingeben von Zeichen mit einer Tastatur, und somit wird
der Arbeitsaufwand für
die Zeicheneingabe drastisch reduziert werden.