DE4000671A1 - Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer - Google Patents
Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computerInfo
- Publication number
- DE4000671A1 DE4000671A1 DE4000671A DE4000671A DE4000671A1 DE 4000671 A1 DE4000671 A1 DE 4000671A1 DE 4000671 A DE4000671 A DE 4000671A DE 4000671 A DE4000671 A DE 4000671A DE 4000671 A1 DE4000671 A1 DE 4000671A1
- Authority
- DE
- Germany
- Prior art keywords
- microfilm
- computer
- data
- information
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012015 optical character recognition Methods 0.000 claims abstract description 6
- 238000005070 sampling Methods 0.000 claims 2
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Die vorliegende Erfindung bezieht sich auf den Einsatz von Mikrofilm als
Speichermedium für Computerdaten, und insbesondere auf die Verwen
dung von Mikrofilm für die Dateneingabe in ein Datenverarbeitungs
system.
Im Laufe der Entwicklung von Datenspeicher- und -abrufsystemen mit
hoher Speicherdichte sind digitale Datenverarbeitungssysteme, die
magnetische oder optische Komponenten für die digitale Speicherung als
Teil eines Gesamtsystems enthalten können, erweitert und verfeinert
worden.
Bei Abrufsystemen dieser Art kann das Problem auftreten, daß das zur
Erzeugung der Informationen verwendete Equipment nach einiger Zeit
nicht mehr erhältlich ist, so daß die gespeicherten Informationen nicht
mehr abgerufen werden können und damit praktisch verloren sind.
Unter direkt lesbaren Speichermedien sind Medien zu verstehen, auf
denen Informationen gespeichert werden können, die der Benutzer lesen
und verstehen kann, ohne daß die Daten zunächst in eine andere Form
gebracht werden müssen, während für elektronische Medien ein Com
putersystem oder ein elektronisches System erforderlich ist, mit dessen
Hilfe die Informationen aus dem Medium ausgelesen, verarbeitet und in
einer direkt lesbaren Form sichtbar gemacht werden.
Ein Beispiel für ein direkt lesbares Medium ist Papier. Auf Papier
gespeicherte Informationen können direkt abgelesen werden, ohne daß
die Daten zunächst verarbeitet oder in eine andere Form umgewandelt
werden müssen. Jedoch läßt dieses Medium viel zu wünschen übrig, da
es viel Platz braucht und hohe Speicherkosten mit sich bringt, und es
außerdem schwierig ist, auf diesem Medium Informationen schnell aufzu
finden und dieses Medium für Archivzwecke aufzubewahren. Darüber
hinaus besteht die Gefahr, daß durch die Alterung und den Zerfall des
Papiers Informationen verlorengehen.
Mikrofilm jedoch hat sich als Speichermedium bewährt. Auf Mikrofilm in
direkt lesbarer Form gespeicherte Informationen lassen sich archivieren,
wenn geeignete Arten von Mikrofilm verwendet werden, und die Informa
tionen lassen sich dabei für eine unbegrenzte Zeit aufbewahren. Außer
dem sind die auf Mikrofilm direkt lesbar gespeicherten Informationen
auch mittels einfachster Geräte, wie beispielsweise einem Vergrößerungs
glas, stets wieder auffindbar.
Mikrofilm läßt sich auf optischem Wege und schneller als die meisten
anderen Speichermedien leicht und problemlos kopieren. Dabei werden
Original und Kopierfilm in Kontakt gebracht und die beiden Filme
gemeinsam belichtet. Dieser Vorgang entspricht einer parallelen Über
tragung großer Datenmengen in einem elektronischen System, wie sie
jedoch bis heute praktisch noch nicht durchführbar ist.
Bislang gab es keine Möglichkeit, direkt lesbare Medien als Speicher
medium in einem Computer zu verwenden. Bei jedem direkt lesbaren
Medium muß eine Bedienungsperson die Information zunächst in einen
Computer eintippen. Die Daten können aber auch in elektronisch les
barer Form sowohl auf Magnetband als auch auf Papier oder dergleichen
gespeichert werden. Eine solche doppelte Aufzeichnung ist jedoch teuer
und wirft Lagerprobleme auf.
Gemäß der vorliegenden Erfindung wird direkt lesbarer Mikrofilm in
Archivqualität sowohl für die Speicherung als auch für den Abruf von
Computerdaten eingesetzt. Die Originaldaten werden dabei in einen
Computer Output Microfilmer (COM) eingegeben, der die Daten in direkt
lesbarer Form auf Mikrofilm in Archivqualität ausgibt. Wenn nötig, kön
nen die Daten von einem Computer Input Microfilmer (CIM) abgerufen
werden, der die in direkt lesbarer Form als alphanumerische Zeichen
gespeicherten Informationen in Computerdaten umsetzt, beispielsweise in
einen ASCII oder EBCDIC Code.
Ein bevorzugtes Ausführungsbeispiel der Erfindung wird nachfolgend
anhand der Zeichnung im einzelnen näher beschrieben. Es zeigen
Fig. 1 ein Blockdiagramm, das den erfindungsgemäßen Einsatz eines
Computer Input Microfilmers in einem Computersystem veran
schaulicht;
Fig. 2 ein Blockdiagramm des Computer Input Microfilmers;
Fig. 3 eine schematische Darstellung der Filmabtasteinrichtung; und
Fig. 4 ein Flußdiagramm des in dem Computer Input Microfilmer
verwendeten OCR (Zeichenerkennungs)-Prinzips.
Fig. 1 zeigt ein kombiniertes Blockdiagramm eines erfindungsgemäßen
Systems. Dabei erzeugt ein Datenverarbeitungscomputer 2 große Mengen
an Daten, die zu speichern sind und später wieder abgerufen werden
müssen. Wieweit es nützlich ist, Daten in einem Computersystem zu
speichern, hängt von deren Alter ab. Es ist wenig ratsam, "ältere"
Daten in einem Computer zu speichern, da sie nur selten benötigt
werden. Solche älteren Daten werden als "Archivdaten" bezeichnet; sie
dürfen zwar nicht verlorengehen, müssen aber nur selten abgerufen
werden.
Solche Daten werden entweder on-line oder aber off-line über Magnet
band in einen Computer Output Microfilmer 4 eingegeben, der diese
Daten in direkt lesbaren Zeichen auf Mikrofilm 6 schreibt oder ausgibt.
Bei dem Computer Output Microfilmer 4 kann es sich beispielsweise um
einen Kodak KOMSTAR IV Microimage Processor handeln, einem waren
zeichenrechtlich geschützten, von der Eastman Kodak Company herge
stellten Gerät. Es sind aber auch andere COMs verwendbar, beispiels
weise der Datagraphix DATA-MASTER, NCR 6500 oder weitere im Handel
erhältliche COMs. Das COM System muß dabei nur die Bedingung erfül
len, daß die Daten in einer einheitlichen lesbaren Schriftform auf Mikro
film übertragen werden. Es ist jedoch in der Praxis kaum möglich, ein
COM zu finden, das mehrere Schriftformen ausdrucken kann. Ein
COM-System, bei dem nur ein einziger Verkleinerungsmaßstab vorgese
hen ist, ist kostengünstiger als ein Gerät, bei dem mehrere Verkleine
rungsmaßstäbe möglich sind, denn dadurch werden auch die Kosten und
die Komplexität des noch zu beschreibenden Computer Input Microfilm
Lesegerätes höher. Eine stärkere Verkleinerung würde jedoch zu einer
dichteren Datenspeicherung führen. Wichtig ist vor allen Dingen, daß
der beim COM vorgesehene Verkleinerungsmaßstab dem Verkleinerungs
maßstab des CIM-Systems entspricht.
Die auf dem Mikrofilm gespeicherten Informationen müssen auf jeden Fall
direkt lesbar sein. Dies bedeutet, daß die Informationen aus alphanume
rischen Zeichen bestehen, die aussehen wie die Buchstaben auf diesem
Blatt. Die Daten oder Informationen liegen nicht in digitaler Form vor.
Wären sie digital, so würden sie als binäre Daten gespeichert und auf
dem Film als eine Folge kleiner Punkte aufgezeichnet. Solche Punkte
wären sehr klein (etwa von der Größe der Punkte, die verwendet wer
den, um Daten auf einer optischen Speicherplatte aufzuzeichnen). Die
Daten wären nicht lesbar, es sei denn, man benutzte ein besonderes
Lesegerät, das die Punkte abtasten und die Informationen in entspre
chende für die Verarbeitung in einem Computer geeignete Signale
umwandeln würde.
Der von dem COM ausgegebene Mikrofilm wird in einem Mikrofilmarchiv
10 gespeichert. Dabei kann es sich um eine manuelle oder eine automa
tische Vorrichtung handeln, wie beispielsweise den von Eastman Kodak
hergestellten und im KODAK IMAGE MANAGEMENT SYSTEM verwendeten
Auto Loader. Die auf dem Mikrofilm befindlichen Informationen können
nun entweder mittels eines üblichen Mikrofilm-Lesegerätes oder mittels
eines vollautomatischen Abrufsystems wieder aufgefunden und ausge
lesen werden.
Wenn die auf dem Mikrofilm 8 enthaltenen, archivierten Informationen
benötigt werden, so können sie vom Computer abgerufen werden. Das
gewünschte Mikrofilmstück 8 läßt sich manuell oder automatisch auffin
den. Der ausgewählte Mikrofilm, bei dem es sich um Rollfilm oder Micro
fiche handeln kann, wird dem Computer Input Microfilm Reader 12 zuge
leitet. Der nachstehend noch näher beschriebene Computer Input Micro
film Reader 12 liest die direkt lesbaren Informationen aus und wandelt
sie in den jeweils geeigneten Computercode um. Die nun in Form von
Computerdaten vorliegenden Informationen werden über Leitung 14 wie
der in den Computer 2 zurückgespeist.
Der in den Fig. 2 und 3 dargestellte Computer Input Microfilm Reader
12 wandelt die auf dem Mikrofilm 8 in Form direkt lesbarer Zeichen
gespeicherten Informationen in Computerdaten um. Dazu wird der Mikro
film 8 in eine Mikrofilm-Transportvorrichtung 16 eingelegt. Diese
besteht aus mechanischen Einrichtungen und elektronischen Steuer
mitteln, wie sie erforderlich sind, um den Mikrofilm 8 in der Abtastvor
richtung 18 zu positionieren. Die Mikrofilm-Transportvorrichtung 16
wird durch Befehle der Bedienungsperson oder des Computers in Gang
gesetzt und positioniert den gewünschten Abschnitt des Mikrofilms 8 der
Abtastvorrichtung 18. Bei der bevorzugten Ausführungsform der Erfin
dung liefert das Computersystem die für die Positionierung erforder
lichen Informationen. Das Computersystem besitzt dazu einen Daten
index, mit dessen Hilfe der Ort, an dem sich die gewünschten Daten
befinden, dem CIM mitgeteilt wird. Bei einer möglichen Ausführungsform
der Erfindung kann der Mikrofilm 8 die Form eines Mikrofiche besitzen.
In diesem Fall können Transportvorrichtungen für die richtige Positio
nierung des Films verwendet werden, wie sie beispielsweise in den US-
Patentschriften 45 40 257, 44 93 540, 44 87 488, 44 87 487 und 44 83
600 beschrieben werden. Liegt der Mikrofilm in Form von Rollfilm vor,
dann sind Transportvorrichtungen geeignet, wie sie beispielsweise in
den US-Patentschriften 37 43 400, 39 41 978, 37 08 677 und 38 02 771
beschrieben werden.
Die Abtastvorrichtung 18 enthält eine Lichtquelle 36, wobei mit der dazu
erforderlichen Beleuchtungsoptik 38 und einer Abbildungsoptik 40 auf
einem Sensor 22, beispielsweise einer linearen CCD-Anordnung, ein Bild
des Mikrofilms 8 erzeugt wird.
Die Lichtquelle 36 ist eine Lampe. Die Beleuchtungsoptik 38 dient dazu,
das Licht zu kollimieren und auf den Film 8 zu lenken. Außerdem kön
nen an dieser Stelle unerwünschte Komponenten aus dem Licht ausgefil
tert werden, beispielsweise Infrarotanteile des von einer Wolframlicht
quelle abgegebenen Lichts.
Mittels der Beleuchtungsoptik 38 wird sichergestellt, daß die Licht
energie auf der Oberfläche des abzutastenden Filmbereichs gleichmäßig
verteilt wird. Das für die Beleuchtung verwendete Licht kann auch
durch Diffusion konditioniert werden, wenn durch Kratzer verursachte
Störungen unterdrückt werden sollen. Auf dem Film wird jeweils ein
linien- oder schlitzförmiger Bereich beleuchtet, der der Form der CCD-
Anordnung 22 entspricht. Das Licht fällt durch den Film 8 hindurch;
dort, wo eine hohe Dichte vorliegt, fällt nur wenig Licht durch den
Film, während dort, wo der Film eine geringe Dichte besitzt, mehr Licht
durch ihn hindurchgelangt.
Das durch den Film hindurchfallende Licht gelangt zu der Abbildungs
optik 40, die auf der Oberfläche der linearen CCD-Anordnung 22 ein
Bild erzeugt. Die hellen und dunklen Bereiche des Filmbildes erscheinen
nun als Intensitätsunterschiede des auf einzelne lichtempfindliche Punkte
der linearen CCD-Anordnung 22 auftreffenden Lichts. Die CCD-Anord
nung 22 wandelt die Energie des auftreffenden Lichts in ein analoges
Signal um. Die Höhe der erzeugten elektrischen Energie ist proportional
der Energie des Lichts, das auf die CCD-Anordnung 22 fällt. Das so
erhaltene analoge Signal wird der CCD-Analog-Elektronik 42 übermittelt.
Die CCD-Analog-Elektronik 42 enthält alle Takt- und Steuerfunktionen,
die für den Betrieb der CCD-Anordnung erforderlich sind und durch
die ein Ausgangssignal erzeugt wird, das dem Lichteingang entspricht.
Diese Takt- und Steuerfunktionen übermitteln das von der CCD-Anord
nung gelieferte analoge Signal in einer geordneten Weise, bei der das
Verhältnis zwischen den auf dem Film enthaltenen Informationen und
dem elektrischen Signal unverändert bleibt.
Die CCD-Analog-Elektronik 42 übernimmt die in der CCD-Anordnung
vorhandene elektrische Energie und wandelt sie in Spannung um. Dem
gemäß ist die erzeugte Spannung direkt proportional dem Licht, das auf
die photoempfindIichen Punkte (nicht dargestellt) der CCD-Anordnung
22 fällt. Das Ausgangssignal der CCD-Anordnung wird verstärkt, so
daß ein entsprechender Ausgang erhalten wird, und gefiltert, um
Rauschen auszuschließen, und dann dem Analog-Digitalwandler 44
übermittelt.
Der Analog-Digitalwandler 44 wandelt das von der CCD-Analog-Elektro
nik 42 empfangene Ausgangsspannungssignal in eine Anzahl digitaler
Signale um. Diese digitalen Signale stellen die Größe der Eingangsspan
nung während einer bestimmten Zeit in Form einer binären Zahl dar.
Die binäre Zahl ist demnach der Lichtenergie proportional, die auf die
photoempfindlichen Punkte der CCD-Anordnung aufgetroffen ist. Dem
entsprechend ist die Energie des auf die photoempfindlichen Punkte
auftreffenden Lichts direkt proportional der Dichte des Films 8, d. h.
die binäre Zahl gibt die Dichte an einem bestimmten Punkt des Films an.
Dieser Abtastvorgang wird für jede Zeile der Filmoberfläche wiederholt.
Die jeweils nächste Abtastung beginnt damit, daß der Film oder aber die
CCD-Anordnung zur nächsten abzutastenden Zeile bewegt wird. Auch
das Bild kann bewegt werden, wobei ein Spiegel (nicht dargestellt)
benutzt wird. Lösungen dieser Art werden beispielsweise in dem US-
Patent 32 137 beschrieben, während in den US-Patenten 37 53 240 und
41 90 899 Abtastmechanismen beschrieben werden, die besonders für die
Abtastung von Microfiches geeignet sind.
Das, wie erwähnt, vom Sensor 22 erzeugte elektronische Signal stellt
das Mikrofilmbild analog dar. Es besteht eine Übereinstimmung zwischen
dem Spannungsausgang des Sensors und der Energie des auf ihn fallen
den Lichts. Diese Übereinstimmung wird bei jedem der einzelnen als
photoempfindliche Punkte bezeichneten Elemente, aus denen der Sensor
22 besteht, beibehalten. Die photoempfindlichen Punkte messen die Dich
te sehr kleiner Bereiche des Mikrofilms. Jeder dieser Bereiche stellt ein
Bildelement oder "Pixel" dar. Durch Messung dieser Pixels kann, wie
oben beschrieben, eine vollständige elektronische Darstellung des auf
dem Mikrofilm aufgezeichneten Bildes erhalten werden.
Ein Analog-Digitalwandler 44, der die analoge Darstellung des Mikrofilm
bildes in digitale Bilddaten umsetzt, übermittelt die digitalen Bilddaten
der Bildverarbeitungselektronik 26, die das Bild aufbereitet, indem sie
das Rauschen vermindert, die Kanten verstärkt und das Bild quanti
siert. Eine solche Aufbereitung erleichtert die optische Zeichenerken
nung in der OCR-(Optical Character Recoginition) Algorithmus-Einheit
30. Durch die Bildquantisierung werden die digitalen Daten in ein Bit-
Muster umgewandelt, d. h. in ein digitales Bild, in dem jedes Pixel
durch ein Bit dargestellt wird.
Die OCR-Algorithmus-Einheit 30 setzt die von der Bildverarbeitungselek
tronik 26 gelieferten digitalen Bilddaten in Computercodes um. Die Algo
rithmus-Einheit muß folgende Funktionen übernehmen: (1) Sie muß die
Zeichenzeilen auffinden, die in der digitalen Darstellung des Bildes ent
halten sind; (2) dann muß sie die Zeichen auffinden, die in den Zeilen
enthalten sind; (3) und schließlich muß sie die gefundenen Zeichen
identifizieren.
Fig. 4 zeigt ein Flußdiagramm für das zugrundeliegende OCR-Verfah
ren. Das Verfahren beginnt mit einem Bit-Musterbild in Block 62, das
ein Abbild der Informationen darstellt. Diese bestehen aus den Zeichen
oder dem Textmaterial des Bildes, die die verwertbaren Informationen
enthalten, die ursprünglich Teil des Mikrofilmbildes waren. Die Algo
rithmus-Einheit liest aus dem Bit-Muster die direkt lesbaren Zeichen
heraus und wandelt diese Zeichen oder das Textmaterial in computer
lesbare Codes, wie z. B. ASCII oder EDCDIC, um.
Dabei muß entweder eine Bedienungsperson oder der den Computer
Input Microfilm Reader 12 steuernde Computer der Ein- oder Auslese
einheit die erforderlichen Formatangaben liefern.
Bei der bevorzugten Ausführungsform der Erfindung sind diese Format
angaben im Computer gespeichert, und zwar als Teil des Indexes für
die auf dem Mikrofilm aufgezeichneten Daten.
Der Computer Input Microfilm Reader 12 erhält entweder von einer
Bedienungsperson oder vom Steuercomputer Informationen über den Ort
auf dem Mikrofilm, an dem sich die auszulesenden Daten befinden. Eine
solche Positions- oder Formatinformation (Block 64, Fig. 4) wird von
der OCR-Algorithmus-Einheit 30 dazu verwendet, die Genauigkeit des
Algorithmus zu verbessern. Informationen, mit denen die auszulesende
Schriftart identifiziert wird (Block 66), werden ebenfalls geliefert.
Durch diese Informationen über die Schriftart wird die Genauigkeit des
Algorithmus wesentlich erhöht.
Die Algorithmus-Einheit 30 findet gemäß Block 68 aufgrund der geliefer
ten Informationen die Zeichenzeilen in dem Bit-Musterbild. Die Algorith
mus-Einheit "weiß", oder wird dahin gelenkt, wo sie wahrscheinlich die
Daten findet. Außerdem wird die Stelle angegeben, an der sich in dem
Bit-Musterbild grafische Elemente, wie Kästen, Linien, Symbole, Brief
köpfe usw. befinden. Diese Informationen über den Ort, an dem sich
Daten und grafische Elemente befinden, ermöglicht es der Algorithmus-
Einheit 30, grafische Elemente auszusparen. Es ist durchaus üblich, daß
solche Elemente bei einem Computer Output Microfilmer (COM) 6 ver
wendet werden. Sie können auf dem Filmbild entweder direkt auf dem
Film angebracht werden, wobei das gleiche Abbildungssystem benutzt
wird wie auch für den Text, oder sie können speziell unter Verwendung
einer Diamaske auf dem Film angebracht werden. Solche grafischen Ele
mente dienen dazu, die Lesbarkeit zu verbessern. Es wäre nachteilig,
wenn sie auf dem Mikrofilm entfernt würden.
Wie bereits erwähnt, benutzt die Algorithmus-Einheit 30 in der vorlie
genden Ausführungsform Informationen, die ihr zuvor übermittelt wur
den. Durch solche Informationen könnten beispielsweise die Abstände
zwischen den Zeichen bei der jeweils verwendeten Schriftart angegeben
werden. Solche Informationen dienen dazu, die Zeichen in jeder Zeile
aufzufinden, wie in Block 70 angedeutet. Aufgrund von Daten über die
Schriftart liest die Algorithmus-Einheit in jeder Zeile das gesuchte
Zeichen aus (Block 70). Gemäß Zeichenformblock 72 wird mittels Daten
über die Schriftart die Erkennungsgenauigkeit erhöht. Dies ist ins
besondere dann wichtig, wenn Zeichen extrem nahe beieinander stehen
oder sich sogar berühren. Die Schriftartangaben sind wichtig, da es
für eine Algorithmus-Einheit schwierig ist, zwei sich berührende Zei
chen zu erkennen oder festzustellen, ob ein unterbrochenes Zeichen aus
einem oder zwei Zeichen besteht. Wenn der vorgesehene Abstand zwi
schen den Zeichen bekannt ist, so kann dadurch die Genauigkeit des
Verfahrens wesentlich erhöht werden.
Sobald die Algorithmus-Einheit 30 die Zeichen aufgefunden hat, wandelt
sie das Bit-Muster des Zeichens in den entsprechenden Computercode
um (Block 74, Fig. 4). Das von der Algorithmus-Einheit 30 durch
geführte Verfahren läßt sich mit dem Lesevorgang vergleichen, bei dem
der Leser eine Anzahl von Formen vor sich hat, die beispielsweise ein
bestimmtes Tier, wie etwa eine Katze, darstellen. Sobald die Schriftart
bekannt ist, wird die Zahl der möglichen Entsprechungen für jedes
Muster wesentlich reduziert. Ist jedoch die Schriftart nicht bekannt, so
muß die Algorithmus-Einheit jedesmal herausfinden, ob das vorliegende
Muster ein Buchstabe in einer Reihe unterschiedlicher Schriftarten ist.
Dies macht die Erkennung schwierig, da die Unterschiede von einer
Schriftart zur anderen beträchtlich sein können. Außerdem muß die
Algorithmus-Einheit auch "beschädigte" Zeichen bewältigen, die zusätz
liche Merkmale aufweisen, wie sie beispielsweise durch Schmutz entste
hen, oder fehlende Merkmale, die durch andere Fehler verursacht sein
können. Ist ein Zeichen erkannt, so wird ihm der entsprechende Com
putercode zugeordnet.
Die OCR-Algorithmus-Einheit 30 hat gegenüber den meisten anderen
OCR-Anwendungen den wesentlichen Vorteil, daß sie zunächst Infor
mationen über die Anordnung der Zeichen und die Formen (Schriftart)
dieser Zeichen erhält. Da die Algorithmus-Einheit keine Formen berück
sichtigen muß, die zu nicht verwendeten Schriftarten gehören, kann sie
auch unzulänglich geformte Zeichen besser verarbeiten.
Es ist zu beachten, daß diese Vorteile nur dadurch erzielt werden, daß
der gesamte Vorgang in einer "geschlossenen Schleife" abläuft. Der
Computer Output Microfilmer 16 erzeugt Bilder mit einer begrenzten
Anzahl von Schriftarten. Der Computer Input Microfilmer 12 ist so
gestaltet, daß er die vom COM erzeugten Schriftarten lesen kann. Bei
dieser Systemlösung stellen alle Schritte oder Stationen Teile des
gleichen Systems dar. Deshalb kann der Benutzer auf Mikrofilm drucken
und dann die Informationen zu einem späteren Zeitpunkt zuverlässig
abrufen.
Damit werden Schwierigkeiten vermieden, wie sie bei dem Versuch auf
treten, Informationen auf Mikrofilmbildern von Belegen aufzufinden.
Belege bestehen aus Papier, auf dem Informationen gespeichert sind.
Die mikroverfilmten Belege stammen aus unbekannten Quellen und weisen
Schriftarten und -größen auf, die mit dem gerade verwendeten System
nicht kompatibel sind.
Das Auffinden von Informationen auf Belegen, die aus einer unbekann
ten Quelle stammen, wirft unter anderem folgende Probleme auf: Mit
großer Wahrscheinlichkeit begegnet man dabei den verschiedensten
Schriftarten. Die Belege selbst unterscheiden sich stark, und die
Informationen erscheinen nicht immer in der gleichen Form. Außerdem
kann Mikrofilm, der nicht aus einem COM-System stammt, Unterschiede
bezüglich des Orts aufweisen, an dem sich das Bild auf dem Film befin
det. Wird ein Beleg photographisch auf Mikrofilm abgebildet, so wird
dabei nicht die Passgenauigkeit erreicht, die bei einem mit COM erzeug
ten Bild erzielbar ist.
Wie in Fig. 2 dargestellt, liefert die OCR-Algorithmus-Einheit 30 als
Ausgang des Computer Input Microfilm Reader 12 die Computercodes,
die den Textzeichen entsprechen, die sich ursprünglich auf dem Mikro
film 8 befanden. Diese von der OCR-Algorithmus-Einheit 30 erzeugten
Computercodes werden der Computerschnittstelle 46 übermittelt. Die
Computerschnittstelle 46 formatiert die Computercodes in die geeigneten
Datenblocks, die dem Computersystem 2 übermittelt werden. Die Com
puterschnittstelle 22 implementiert außerdem die erforderlichen Steuer
und Dialogfunktionen.
Mit der Vorrichtung gemäß der vorliegenden Erfindung kann direkt les
barer Mikrofilm als Speichermedium für die Sicherung von Computer
daten verwendet werden. Außerdem ermöglicht der Einsatz eines Com
puter Input Microfilm Readers im System die rasche Eingabe von Daten
aus dem Mikrofilmarchiv, ohne daß eine Bedienungsperson die Daten
über eine Tastatur eingeben muß.
Die Erfindung ist vor allem für den Abruf und die Speicherung von
Informationen geeignet und erhöht die Kompatibilität von Mikrofilm mit
elektronischen Büro- und Computersystemen.
Durch die Verwendung von Mikrofilm für die Datenspeicherung wird
außerdem die Gefahr verringert, daß Daten durch Vandalismus ver
lorengehen. Anders als magnetische Speichermedien, die gelöscht oder
verändert werden können, stellt Mikrofilm ein dauerhaftes Speicher
medium dar. Beim Computervandalismus, durch den Daten gelöscht oder
verfälscht werden können, spricht man auch oft von einem Virus.
Claims (9)
1. Vorrichtung zum Lesen direkt lesbarer Daten, die in einer bekann
ten Schriftart und -größe auf Mikrofilm aufgezeichnet sind,
gekennzeichnet durch
- - eine Lichtquelle, die einen Lichtstrahl aussendet,
- - eine Mikrofilmtransportvorrichtung, die den Mikrofilm relativ zu der Lichtquelle in eine Stellung bewegt, in der das gewünschte Bild abgetastet werden kann und eine seitenweise Abtastung mög lich ist,
- - Mittel, mit denen der Lichtstrahl aufgefangen und in Zeilenform auf den Mikrofilm gelenkt wird,
- - Abtastmittel, auf denen der zeilenförmige Lichtstrahl aufgefangen wird, nachdem er durch den Mikrofilm gefallen ist, und in Zeilen richtung unter Erzeugung eines analogen Signals abgetastet wird,
- - einen Analog-Digitalwandler zum Umwandeln des analogen Signals in ein digitales Signal,
- - eine Optical Character Recognition (OCR) Algorithmus-Einheit, die Buchstaben aus dem Mikrofilm ausliest und
- - eine Computerschnittstelle zum Umwandeln dieser ausgelesenen Buchstaben in einen computer-lesbaren Code.
2. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß der computer
lesbare Code ein ASCII-Code ist.
3. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß der computer
lesbare Code ein ECDIC-Code ist.
4. Datenabrufsystem, gekennzeichnet durch
- - ein Computersystem, aus dem ein Benutzer Informationen ent nehmen kann,
- - einen Computer Output Microfilmer, mit dem Computerdaten in direkt lesbare Zeichen umwandelbar und auf Mikrofilm ausdruck bar sind,
- - Archivmittel zum Speichern von Mikrofilmbildern, die vom Com puter Output Microfilmer erzeugt werden, und von informations kennzeichnenden Adressen der in diesen Archivmitteln gespeicher ten Bilder,
- - Mittel mit denen sich ein ausgewähltes Bild nach Anforderung aus den Archivmitteln abrufen läßt,
- - einen Computer Input Microfilmer, mit dem die direkt lesbaren Zeichen auf dem Mikrofilm in Computercodes umgewandelt werden, und
- - eine Computerschnittstelle, mit der die Computercodes in das Computersystem übertragen werden.
5. Gerät zum Lesen direkt lesbarer Daten, die in einer bekannten
Schriftart und -form auf Mikrofilm aufgezeichnet sind, gekenn
zeichnet durch
- - Abtastmittel zum Abtasten eines ausgewählten Teils des Mikrofilms und zum Erzeugen eines anlogen Signals,
- - einen Analog-Digital-Wandler zum Umwandeln des analogen Signals in ein digitales Signal,
- - eine OCR-Algorithmus-Einheit, die Buchstaben aus dem Mikrofilm ausliest, und
- - eine Computerschnittstelle, die die ausgelesenen Buchstaben in einen computer-lesbaren Code umwandelt.
6. Gerät nach Anspruch 5, dadurch gekennzeichnet, daß die Abtast
mittel aus einer zweidimensionalen CCD-Anordnung bestehen.
7. Gerät nach Anspruch 5, dadurch gekennzeichnet, daß die Abtast
mittel aus einem Lichtpunktabtaster bestehen.
8. Datenabrufsystem nach Anspruch 4, dadurch gekennzeichnet, daß
die Archivmittel Indexmittel aufweisen, die Informationen über den
Ort enthalten, an dem sich die archivierten Daten auf dem Mikrofilm
befinden.
9. Archivierungsmittel nach Anspruch 8, dadurch gekennzeichnet, daß
die Indexmittel Informationen bezüglich des Formats der auf den
Archivierungsmitteln gespeicherten Mikrofilmbilder enthalten.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29611689A | 1989-01-12 | 1989-01-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE4000671A1 true DE4000671A1 (de) | 1990-07-19 |
Family
ID=23140687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4000671A Withdrawn DE4000671A1 (de) | 1989-01-12 | 1990-01-11 | Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE4000671A1 (de) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2695496A1 (fr) * | 1992-09-04 | 1994-03-11 | Renault | Procédé et dispositifs de détermination d'itinéraires routiers. |
DE4408327A1 (de) * | 1994-03-11 | 1995-09-28 | Sietec Systemtechnik Gmbh & Co | Verfahren und Gerät zur elektronischen Archivierung der von einem Rechner aufbereiteten Dokumente |
DE102006014043A1 (de) * | 2006-03-27 | 2007-10-04 | OCé PRINTING SYSTEMS GMBH | Verfahren und Vorrichtung zum Archivieren von Druckbildern |
DE102008022162A1 (de) | 2008-01-14 | 2009-07-23 | Cybercity Gmbh | Verfahren und Gerät für den Zugriff auf Mikroformen |
CN109583405A (zh) * | 2018-12-06 | 2019-04-05 | 中国银行股份有限公司 | 一种信息录入方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2738586A1 (de) * | 1976-08-31 | 1978-03-02 | Kenneth Mason Holdings Ltd | Datenverarbeitungseinheit zum verarbeiten gedruckter daten |
DE3939366A1 (de) * | 1989-11-29 | 1991-06-06 | Ingo Roehrer | Verfahren und vorrichtung zum optischen erfassen von auf ebenen datentraegern gespeicherten informationen |
-
1990
- 1990-01-11 DE DE4000671A patent/DE4000671A1/de not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2738586A1 (de) * | 1976-08-31 | 1978-03-02 | Kenneth Mason Holdings Ltd | Datenverarbeitungseinheit zum verarbeiten gedruckter daten |
DE3939366A1 (de) * | 1989-11-29 | 1991-06-06 | Ingo Roehrer | Verfahren und vorrichtung zum optischen erfassen von auf ebenen datentraegern gespeicherten informationen |
Non-Patent Citations (1)
Title |
---|
A.J. ATRUBIN u.a. "Two-Level Character Recognition", in: IBM Technical Disclosure Bulletin, Vol. 23, No. 8, 01/81, S. 3663/3664 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2695496A1 (fr) * | 1992-09-04 | 1994-03-11 | Renault | Procédé et dispositifs de détermination d'itinéraires routiers. |
DE4408327A1 (de) * | 1994-03-11 | 1995-09-28 | Sietec Systemtechnik Gmbh & Co | Verfahren und Gerät zur elektronischen Archivierung der von einem Rechner aufbereiteten Dokumente |
US5940584A (en) * | 1994-03-11 | 1999-08-17 | Oce Printing Systems Gmbh | Method and apparatus for electronically filing documents prepared by a computer |
DE102006014043A1 (de) * | 2006-03-27 | 2007-10-04 | OCé PRINTING SYSTEMS GMBH | Verfahren und Vorrichtung zum Archivieren von Druckbildern |
DE102008022162A1 (de) | 2008-01-14 | 2009-07-23 | Cybercity Gmbh | Verfahren und Gerät für den Zugriff auf Mikroformen |
US8500003B2 (en) | 2008-01-14 | 2013-08-06 | Cybercity Gmbh | Method and device for accessing microforms |
CN109583405A (zh) * | 2018-12-06 | 2019-04-05 | 中国银行股份有限公司 | 一种信息录入方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3033193C2 (de) | ||
DE4202579C2 (de) | System zur Bearbeitung von Dokumenten | |
DE2523112C2 (de) | Vorrichtung zum Bearbeitung von Daten tragenden Schriftstücken | |
DE3250064C2 (de) | Tintenstrahl-Aufzeichnungsgerät | |
DE3336961C2 (de) | ||
DE2743864A1 (de) | Optoelektronische leseeinrichtung | |
DE2034962B2 (de) | Gerat zum Bearbeiten bei Post amtern aufgegebener Poststucke | |
DE10159877A1 (de) | Vorrichtung, die beide Seiten eines Photos abtastet und die auf der Rückseite des Photos gefundene Informationen dem Photo zuordnet | |
DE1282341B (de) | ||
DE4000671A1 (de) | Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer | |
DE2814738A1 (de) | Informationsspeicher- und -wiedergewinnungsanordnung | |
DE19942902A1 (de) | Gruppenbildabzug und Drucksystem zum Herstellen von Gruppenbildabzügen | |
US4419426A (en) | Method for the visual inspection of the reproduction quality of drawing elements and elements for the execution of the method | |
DE1264829B (de) | Verfahren zur Guetebestimmung von Druckzeichen und Anordnung zur Durchfuehrung des Verfahrens | |
DE2238661A1 (de) | Speicher- und wiederausgabesystem fuer daten | |
DE1213724B (de) | Aufnahmevorrichtung fuer Reproduktionen | |
EP0205087B1 (de) | Vorrichtung zur elektronischen Aufnahme von Bildern | |
EP0935877B1 (de) | Verfahren und vorrichtung zur herstellung von positivbildern | |
DE10152535B4 (de) | Gerät zum Abtasten von Reflektions- und Transmissionsdaten von einem photographischen Bild | |
DE4114343A1 (de) | Verfahren zum erkennen der lage eines fotografischen filmes | |
DE3112494A1 (de) | Verfahren und geraet zur edv compatiblen visuellen erfassung von belegen etc. | |
DE10106162A1 (de) | Selbstbedienungs-Datenstation und Verfahren zum Verarbeiten von Transaktionsformularen | |
DE2518727A1 (de) | Vorrichtung fuer ein verfahren zur herstellung von photographischen kopien | |
EP0024352A1 (de) | Einrichtung zum Prüfen und Kopieren von Dokumenten | |
DE4235470A1 (de) | Verfahren und Vorrichtung zur zweiseitigen Verfilmung von Dokumenten auf Planfilm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G06K 17/00 |
|
8130 | Withdrawal |