DE4000671A1 - Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer - Google Patents

Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer

Info

Publication number
DE4000671A1
DE4000671A1 DE4000671A DE4000671A DE4000671A1 DE 4000671 A1 DE4000671 A1 DE 4000671A1 DE 4000671 A DE4000671 A DE 4000671A DE 4000671 A DE4000671 A DE 4000671A DE 4000671 A1 DE4000671 A1 DE 4000671A1
Authority
DE
Germany
Prior art keywords
microfilm
computer
data
information
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE4000671A
Other languages
English (en)
Inventor
Roger Roy Adams Morton
Wesley John Micket
Wayne Kenneth Shaffer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of DE4000671A1 publication Critical patent/DE4000671A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

Die vorliegende Erfindung bezieht sich auf den Einsatz von Mikrofilm als Speichermedium für Computerdaten, und insbesondere auf die Verwen­ dung von Mikrofilm für die Dateneingabe in ein Datenverarbeitungs­ system.
Im Laufe der Entwicklung von Datenspeicher- und -abrufsystemen mit hoher Speicherdichte sind digitale Datenverarbeitungssysteme, die magnetische oder optische Komponenten für die digitale Speicherung als Teil eines Gesamtsystems enthalten können, erweitert und verfeinert worden.
Bei Abrufsystemen dieser Art kann das Problem auftreten, daß das zur Erzeugung der Informationen verwendete Equipment nach einiger Zeit nicht mehr erhältlich ist, so daß die gespeicherten Informationen nicht mehr abgerufen werden können und damit praktisch verloren sind.
Unter direkt lesbaren Speichermedien sind Medien zu verstehen, auf denen Informationen gespeichert werden können, die der Benutzer lesen und verstehen kann, ohne daß die Daten zunächst in eine andere Form gebracht werden müssen, während für elektronische Medien ein Com­ putersystem oder ein elektronisches System erforderlich ist, mit dessen Hilfe die Informationen aus dem Medium ausgelesen, verarbeitet und in einer direkt lesbaren Form sichtbar gemacht werden.
Ein Beispiel für ein direkt lesbares Medium ist Papier. Auf Papier gespeicherte Informationen können direkt abgelesen werden, ohne daß die Daten zunächst verarbeitet oder in eine andere Form umgewandelt werden müssen. Jedoch läßt dieses Medium viel zu wünschen übrig, da es viel Platz braucht und hohe Speicherkosten mit sich bringt, und es außerdem schwierig ist, auf diesem Medium Informationen schnell aufzu­ finden und dieses Medium für Archivzwecke aufzubewahren. Darüber hinaus besteht die Gefahr, daß durch die Alterung und den Zerfall des Papiers Informationen verlorengehen.
Mikrofilm jedoch hat sich als Speichermedium bewährt. Auf Mikrofilm in direkt lesbarer Form gespeicherte Informationen lassen sich archivieren, wenn geeignete Arten von Mikrofilm verwendet werden, und die Informa­ tionen lassen sich dabei für eine unbegrenzte Zeit aufbewahren. Außer­ dem sind die auf Mikrofilm direkt lesbar gespeicherten Informationen auch mittels einfachster Geräte, wie beispielsweise einem Vergrößerungs­ glas, stets wieder auffindbar.
Mikrofilm läßt sich auf optischem Wege und schneller als die meisten anderen Speichermedien leicht und problemlos kopieren. Dabei werden Original und Kopierfilm in Kontakt gebracht und die beiden Filme gemeinsam belichtet. Dieser Vorgang entspricht einer parallelen Über­ tragung großer Datenmengen in einem elektronischen System, wie sie jedoch bis heute praktisch noch nicht durchführbar ist.
Bislang gab es keine Möglichkeit, direkt lesbare Medien als Speicher­ medium in einem Computer zu verwenden. Bei jedem direkt lesbaren Medium muß eine Bedienungsperson die Information zunächst in einen Computer eintippen. Die Daten können aber auch in elektronisch les­ barer Form sowohl auf Magnetband als auch auf Papier oder dergleichen gespeichert werden. Eine solche doppelte Aufzeichnung ist jedoch teuer und wirft Lagerprobleme auf.
Gemäß der vorliegenden Erfindung wird direkt lesbarer Mikrofilm in Archivqualität sowohl für die Speicherung als auch für den Abruf von Computerdaten eingesetzt. Die Originaldaten werden dabei in einen Computer Output Microfilmer (COM) eingegeben, der die Daten in direkt lesbarer Form auf Mikrofilm in Archivqualität ausgibt. Wenn nötig, kön­ nen die Daten von einem Computer Input Microfilmer (CIM) abgerufen werden, der die in direkt lesbarer Form als alphanumerische Zeichen gespeicherten Informationen in Computerdaten umsetzt, beispielsweise in einen ASCII oder EBCDIC Code.
Ein bevorzugtes Ausführungsbeispiel der Erfindung wird nachfolgend anhand der Zeichnung im einzelnen näher beschrieben. Es zeigen
Fig. 1 ein Blockdiagramm, das den erfindungsgemäßen Einsatz eines Computer Input Microfilmers in einem Computersystem veran­ schaulicht;
Fig. 2 ein Blockdiagramm des Computer Input Microfilmers;
Fig. 3 eine schematische Darstellung der Filmabtasteinrichtung; und
Fig. 4 ein Flußdiagramm des in dem Computer Input Microfilmer verwendeten OCR (Zeichenerkennungs)-Prinzips.
Fig. 1 zeigt ein kombiniertes Blockdiagramm eines erfindungsgemäßen Systems. Dabei erzeugt ein Datenverarbeitungscomputer 2 große Mengen an Daten, die zu speichern sind und später wieder abgerufen werden müssen. Wieweit es nützlich ist, Daten in einem Computersystem zu speichern, hängt von deren Alter ab. Es ist wenig ratsam, "ältere" Daten in einem Computer zu speichern, da sie nur selten benötigt werden. Solche älteren Daten werden als "Archivdaten" bezeichnet; sie dürfen zwar nicht verlorengehen, müssen aber nur selten abgerufen werden.
Solche Daten werden entweder on-line oder aber off-line über Magnet­ band in einen Computer Output Microfilmer 4 eingegeben, der diese Daten in direkt lesbaren Zeichen auf Mikrofilm 6 schreibt oder ausgibt. Bei dem Computer Output Microfilmer 4 kann es sich beispielsweise um einen Kodak KOMSTAR IV Microimage Processor handeln, einem waren­ zeichenrechtlich geschützten, von der Eastman Kodak Company herge­ stellten Gerät. Es sind aber auch andere COMs verwendbar, beispiels­ weise der Datagraphix DATA-MASTER, NCR 6500 oder weitere im Handel erhältliche COMs. Das COM System muß dabei nur die Bedingung erfül­ len, daß die Daten in einer einheitlichen lesbaren Schriftform auf Mikro­ film übertragen werden. Es ist jedoch in der Praxis kaum möglich, ein COM zu finden, das mehrere Schriftformen ausdrucken kann. Ein COM-System, bei dem nur ein einziger Verkleinerungsmaßstab vorgese­ hen ist, ist kostengünstiger als ein Gerät, bei dem mehrere Verkleine­ rungsmaßstäbe möglich sind, denn dadurch werden auch die Kosten und die Komplexität des noch zu beschreibenden Computer Input Microfilm Lesegerätes höher. Eine stärkere Verkleinerung würde jedoch zu einer dichteren Datenspeicherung führen. Wichtig ist vor allen Dingen, daß der beim COM vorgesehene Verkleinerungsmaßstab dem Verkleinerungs­ maßstab des CIM-Systems entspricht.
Die auf dem Mikrofilm gespeicherten Informationen müssen auf jeden Fall direkt lesbar sein. Dies bedeutet, daß die Informationen aus alphanume­ rischen Zeichen bestehen, die aussehen wie die Buchstaben auf diesem Blatt. Die Daten oder Informationen liegen nicht in digitaler Form vor. Wären sie digital, so würden sie als binäre Daten gespeichert und auf dem Film als eine Folge kleiner Punkte aufgezeichnet. Solche Punkte wären sehr klein (etwa von der Größe der Punkte, die verwendet wer­ den, um Daten auf einer optischen Speicherplatte aufzuzeichnen). Die Daten wären nicht lesbar, es sei denn, man benutzte ein besonderes Lesegerät, das die Punkte abtasten und die Informationen in entspre­ chende für die Verarbeitung in einem Computer geeignete Signale umwandeln würde.
Der von dem COM ausgegebene Mikrofilm wird in einem Mikrofilmarchiv 10 gespeichert. Dabei kann es sich um eine manuelle oder eine automa­ tische Vorrichtung handeln, wie beispielsweise den von Eastman Kodak hergestellten und im KODAK IMAGE MANAGEMENT SYSTEM verwendeten Auto Loader. Die auf dem Mikrofilm befindlichen Informationen können nun entweder mittels eines üblichen Mikrofilm-Lesegerätes oder mittels eines vollautomatischen Abrufsystems wieder aufgefunden und ausge­ lesen werden.
Wenn die auf dem Mikrofilm 8 enthaltenen, archivierten Informationen benötigt werden, so können sie vom Computer abgerufen werden. Das gewünschte Mikrofilmstück 8 läßt sich manuell oder automatisch auffin­ den. Der ausgewählte Mikrofilm, bei dem es sich um Rollfilm oder Micro­ fiche handeln kann, wird dem Computer Input Microfilm Reader 12 zuge­ leitet. Der nachstehend noch näher beschriebene Computer Input Micro­ film Reader 12 liest die direkt lesbaren Informationen aus und wandelt sie in den jeweils geeigneten Computercode um. Die nun in Form von Computerdaten vorliegenden Informationen werden über Leitung 14 wie­ der in den Computer 2 zurückgespeist.
Der in den Fig. 2 und 3 dargestellte Computer Input Microfilm Reader 12 wandelt die auf dem Mikrofilm 8 in Form direkt lesbarer Zeichen gespeicherten Informationen in Computerdaten um. Dazu wird der Mikro­ film 8 in eine Mikrofilm-Transportvorrichtung 16 eingelegt. Diese besteht aus mechanischen Einrichtungen und elektronischen Steuer­ mitteln, wie sie erforderlich sind, um den Mikrofilm 8 in der Abtastvor­ richtung 18 zu positionieren. Die Mikrofilm-Transportvorrichtung 16 wird durch Befehle der Bedienungsperson oder des Computers in Gang gesetzt und positioniert den gewünschten Abschnitt des Mikrofilms 8 der Abtastvorrichtung 18. Bei der bevorzugten Ausführungsform der Erfin­ dung liefert das Computersystem die für die Positionierung erforder­ lichen Informationen. Das Computersystem besitzt dazu einen Daten­ index, mit dessen Hilfe der Ort, an dem sich die gewünschten Daten befinden, dem CIM mitgeteilt wird. Bei einer möglichen Ausführungsform der Erfindung kann der Mikrofilm 8 die Form eines Mikrofiche besitzen. In diesem Fall können Transportvorrichtungen für die richtige Positio­ nierung des Films verwendet werden, wie sie beispielsweise in den US- Patentschriften 45 40 257, 44 93 540, 44 87 488, 44 87 487 und 44 83 600 beschrieben werden. Liegt der Mikrofilm in Form von Rollfilm vor, dann sind Transportvorrichtungen geeignet, wie sie beispielsweise in den US-Patentschriften 37 43 400, 39 41 978, 37 08 677 und 38 02 771 beschrieben werden.
Die Abtastvorrichtung 18 enthält eine Lichtquelle 36, wobei mit der dazu erforderlichen Beleuchtungsoptik 38 und einer Abbildungsoptik 40 auf einem Sensor 22, beispielsweise einer linearen CCD-Anordnung, ein Bild des Mikrofilms 8 erzeugt wird.
Die Lichtquelle 36 ist eine Lampe. Die Beleuchtungsoptik 38 dient dazu, das Licht zu kollimieren und auf den Film 8 zu lenken. Außerdem kön­ nen an dieser Stelle unerwünschte Komponenten aus dem Licht ausgefil­ tert werden, beispielsweise Infrarotanteile des von einer Wolframlicht­ quelle abgegebenen Lichts.
Mittels der Beleuchtungsoptik 38 wird sichergestellt, daß die Licht­ energie auf der Oberfläche des abzutastenden Filmbereichs gleichmäßig verteilt wird. Das für die Beleuchtung verwendete Licht kann auch durch Diffusion konditioniert werden, wenn durch Kratzer verursachte Störungen unterdrückt werden sollen. Auf dem Film wird jeweils ein linien- oder schlitzförmiger Bereich beleuchtet, der der Form der CCD- Anordnung 22 entspricht. Das Licht fällt durch den Film 8 hindurch; dort, wo eine hohe Dichte vorliegt, fällt nur wenig Licht durch den Film, während dort, wo der Film eine geringe Dichte besitzt, mehr Licht durch ihn hindurchgelangt.
Das durch den Film hindurchfallende Licht gelangt zu der Abbildungs­ optik 40, die auf der Oberfläche der linearen CCD-Anordnung 22 ein Bild erzeugt. Die hellen und dunklen Bereiche des Filmbildes erscheinen nun als Intensitätsunterschiede des auf einzelne lichtempfindliche Punkte der linearen CCD-Anordnung 22 auftreffenden Lichts. Die CCD-Anord­ nung 22 wandelt die Energie des auftreffenden Lichts in ein analoges Signal um. Die Höhe der erzeugten elektrischen Energie ist proportional der Energie des Lichts, das auf die CCD-Anordnung 22 fällt. Das so erhaltene analoge Signal wird der CCD-Analog-Elektronik 42 übermittelt.
Die CCD-Analog-Elektronik 42 enthält alle Takt- und Steuerfunktionen, die für den Betrieb der CCD-Anordnung erforderlich sind und durch die ein Ausgangssignal erzeugt wird, das dem Lichteingang entspricht. Diese Takt- und Steuerfunktionen übermitteln das von der CCD-Anord­ nung gelieferte analoge Signal in einer geordneten Weise, bei der das Verhältnis zwischen den auf dem Film enthaltenen Informationen und dem elektrischen Signal unverändert bleibt.
Die CCD-Analog-Elektronik 42 übernimmt die in der CCD-Anordnung vorhandene elektrische Energie und wandelt sie in Spannung um. Dem­ gemäß ist die erzeugte Spannung direkt proportional dem Licht, das auf die photoempfindIichen Punkte (nicht dargestellt) der CCD-Anordnung 22 fällt. Das Ausgangssignal der CCD-Anordnung wird verstärkt, so daß ein entsprechender Ausgang erhalten wird, und gefiltert, um Rauschen auszuschließen, und dann dem Analog-Digitalwandler 44 übermittelt.
Der Analog-Digitalwandler 44 wandelt das von der CCD-Analog-Elektro­ nik 42 empfangene Ausgangsspannungssignal in eine Anzahl digitaler Signale um. Diese digitalen Signale stellen die Größe der Eingangsspan­ nung während einer bestimmten Zeit in Form einer binären Zahl dar. Die binäre Zahl ist demnach der Lichtenergie proportional, die auf die photoempfindlichen Punkte der CCD-Anordnung aufgetroffen ist. Dem­ entsprechend ist die Energie des auf die photoempfindlichen Punkte auftreffenden Lichts direkt proportional der Dichte des Films 8, d. h. die binäre Zahl gibt die Dichte an einem bestimmten Punkt des Films an.
Dieser Abtastvorgang wird für jede Zeile der Filmoberfläche wiederholt. Die jeweils nächste Abtastung beginnt damit, daß der Film oder aber die CCD-Anordnung zur nächsten abzutastenden Zeile bewegt wird. Auch das Bild kann bewegt werden, wobei ein Spiegel (nicht dargestellt) benutzt wird. Lösungen dieser Art werden beispielsweise in dem US- Patent 32 137 beschrieben, während in den US-Patenten 37 53 240 und 41 90 899 Abtastmechanismen beschrieben werden, die besonders für die Abtastung von Microfiches geeignet sind.
Das, wie erwähnt, vom Sensor 22 erzeugte elektronische Signal stellt das Mikrofilmbild analog dar. Es besteht eine Übereinstimmung zwischen dem Spannungsausgang des Sensors und der Energie des auf ihn fallen­ den Lichts. Diese Übereinstimmung wird bei jedem der einzelnen als photoempfindliche Punkte bezeichneten Elemente, aus denen der Sensor 22 besteht, beibehalten. Die photoempfindlichen Punkte messen die Dich­ te sehr kleiner Bereiche des Mikrofilms. Jeder dieser Bereiche stellt ein Bildelement oder "Pixel" dar. Durch Messung dieser Pixels kann, wie oben beschrieben, eine vollständige elektronische Darstellung des auf dem Mikrofilm aufgezeichneten Bildes erhalten werden.
Ein Analog-Digitalwandler 44, der die analoge Darstellung des Mikrofilm­ bildes in digitale Bilddaten umsetzt, übermittelt die digitalen Bilddaten der Bildverarbeitungselektronik 26, die das Bild aufbereitet, indem sie das Rauschen vermindert, die Kanten verstärkt und das Bild quanti­ siert. Eine solche Aufbereitung erleichtert die optische Zeichenerken­ nung in der OCR-(Optical Character Recoginition) Algorithmus-Einheit 30. Durch die Bildquantisierung werden die digitalen Daten in ein Bit- Muster umgewandelt, d. h. in ein digitales Bild, in dem jedes Pixel durch ein Bit dargestellt wird.
Die OCR-Algorithmus-Einheit 30 setzt die von der Bildverarbeitungselek­ tronik 26 gelieferten digitalen Bilddaten in Computercodes um. Die Algo­ rithmus-Einheit muß folgende Funktionen übernehmen: (1) Sie muß die Zeichenzeilen auffinden, die in der digitalen Darstellung des Bildes ent­ halten sind; (2) dann muß sie die Zeichen auffinden, die in den Zeilen enthalten sind; (3) und schließlich muß sie die gefundenen Zeichen identifizieren.
Fig. 4 zeigt ein Flußdiagramm für das zugrundeliegende OCR-Verfah­ ren. Das Verfahren beginnt mit einem Bit-Musterbild in Block 62, das ein Abbild der Informationen darstellt. Diese bestehen aus den Zeichen oder dem Textmaterial des Bildes, die die verwertbaren Informationen enthalten, die ursprünglich Teil des Mikrofilmbildes waren. Die Algo­ rithmus-Einheit liest aus dem Bit-Muster die direkt lesbaren Zeichen heraus und wandelt diese Zeichen oder das Textmaterial in computer­ lesbare Codes, wie z. B. ASCII oder EDCDIC, um.
Dabei muß entweder eine Bedienungsperson oder der den Computer Input Microfilm Reader 12 steuernde Computer der Ein- oder Auslese­ einheit die erforderlichen Formatangaben liefern.
Bei der bevorzugten Ausführungsform der Erfindung sind diese Format­ angaben im Computer gespeichert, und zwar als Teil des Indexes für die auf dem Mikrofilm aufgezeichneten Daten.
Der Computer Input Microfilm Reader 12 erhält entweder von einer Bedienungsperson oder vom Steuercomputer Informationen über den Ort auf dem Mikrofilm, an dem sich die auszulesenden Daten befinden. Eine solche Positions- oder Formatinformation (Block 64, Fig. 4) wird von der OCR-Algorithmus-Einheit 30 dazu verwendet, die Genauigkeit des Algorithmus zu verbessern. Informationen, mit denen die auszulesende Schriftart identifiziert wird (Block 66), werden ebenfalls geliefert. Durch diese Informationen über die Schriftart wird die Genauigkeit des Algorithmus wesentlich erhöht.
Die Algorithmus-Einheit 30 findet gemäß Block 68 aufgrund der geliefer­ ten Informationen die Zeichenzeilen in dem Bit-Musterbild. Die Algorith­ mus-Einheit "weiß", oder wird dahin gelenkt, wo sie wahrscheinlich die Daten findet. Außerdem wird die Stelle angegeben, an der sich in dem Bit-Musterbild grafische Elemente, wie Kästen, Linien, Symbole, Brief­ köpfe usw. befinden. Diese Informationen über den Ort, an dem sich Daten und grafische Elemente befinden, ermöglicht es der Algorithmus- Einheit 30, grafische Elemente auszusparen. Es ist durchaus üblich, daß solche Elemente bei einem Computer Output Microfilmer (COM) 6 ver­ wendet werden. Sie können auf dem Filmbild entweder direkt auf dem Film angebracht werden, wobei das gleiche Abbildungssystem benutzt wird wie auch für den Text, oder sie können speziell unter Verwendung einer Diamaske auf dem Film angebracht werden. Solche grafischen Ele­ mente dienen dazu, die Lesbarkeit zu verbessern. Es wäre nachteilig, wenn sie auf dem Mikrofilm entfernt würden.
Wie bereits erwähnt, benutzt die Algorithmus-Einheit 30 in der vorlie­ genden Ausführungsform Informationen, die ihr zuvor übermittelt wur­ den. Durch solche Informationen könnten beispielsweise die Abstände zwischen den Zeichen bei der jeweils verwendeten Schriftart angegeben werden. Solche Informationen dienen dazu, die Zeichen in jeder Zeile aufzufinden, wie in Block 70 angedeutet. Aufgrund von Daten über die Schriftart liest die Algorithmus-Einheit in jeder Zeile das gesuchte Zeichen aus (Block 70). Gemäß Zeichenformblock 72 wird mittels Daten über die Schriftart die Erkennungsgenauigkeit erhöht. Dies ist ins­ besondere dann wichtig, wenn Zeichen extrem nahe beieinander stehen oder sich sogar berühren. Die Schriftartangaben sind wichtig, da es für eine Algorithmus-Einheit schwierig ist, zwei sich berührende Zei­ chen zu erkennen oder festzustellen, ob ein unterbrochenes Zeichen aus einem oder zwei Zeichen besteht. Wenn der vorgesehene Abstand zwi­ schen den Zeichen bekannt ist, so kann dadurch die Genauigkeit des Verfahrens wesentlich erhöht werden.
Sobald die Algorithmus-Einheit 30 die Zeichen aufgefunden hat, wandelt sie das Bit-Muster des Zeichens in den entsprechenden Computercode um (Block 74, Fig. 4). Das von der Algorithmus-Einheit 30 durch­ geführte Verfahren läßt sich mit dem Lesevorgang vergleichen, bei dem der Leser eine Anzahl von Formen vor sich hat, die beispielsweise ein bestimmtes Tier, wie etwa eine Katze, darstellen. Sobald die Schriftart bekannt ist, wird die Zahl der möglichen Entsprechungen für jedes Muster wesentlich reduziert. Ist jedoch die Schriftart nicht bekannt, so muß die Algorithmus-Einheit jedesmal herausfinden, ob das vorliegende Muster ein Buchstabe in einer Reihe unterschiedlicher Schriftarten ist. Dies macht die Erkennung schwierig, da die Unterschiede von einer Schriftart zur anderen beträchtlich sein können. Außerdem muß die Algorithmus-Einheit auch "beschädigte" Zeichen bewältigen, die zusätz­ liche Merkmale aufweisen, wie sie beispielsweise durch Schmutz entste­ hen, oder fehlende Merkmale, die durch andere Fehler verursacht sein können. Ist ein Zeichen erkannt, so wird ihm der entsprechende Com­ putercode zugeordnet.
Die OCR-Algorithmus-Einheit 30 hat gegenüber den meisten anderen OCR-Anwendungen den wesentlichen Vorteil, daß sie zunächst Infor­ mationen über die Anordnung der Zeichen und die Formen (Schriftart) dieser Zeichen erhält. Da die Algorithmus-Einheit keine Formen berück­ sichtigen muß, die zu nicht verwendeten Schriftarten gehören, kann sie auch unzulänglich geformte Zeichen besser verarbeiten.
Es ist zu beachten, daß diese Vorteile nur dadurch erzielt werden, daß der gesamte Vorgang in einer "geschlossenen Schleife" abläuft. Der Computer Output Microfilmer 16 erzeugt Bilder mit einer begrenzten Anzahl von Schriftarten. Der Computer Input Microfilmer 12 ist so gestaltet, daß er die vom COM erzeugten Schriftarten lesen kann. Bei dieser Systemlösung stellen alle Schritte oder Stationen Teile des gleichen Systems dar. Deshalb kann der Benutzer auf Mikrofilm drucken und dann die Informationen zu einem späteren Zeitpunkt zuverlässig abrufen.
Damit werden Schwierigkeiten vermieden, wie sie bei dem Versuch auf­ treten, Informationen auf Mikrofilmbildern von Belegen aufzufinden. Belege bestehen aus Papier, auf dem Informationen gespeichert sind. Die mikroverfilmten Belege stammen aus unbekannten Quellen und weisen Schriftarten und -größen auf, die mit dem gerade verwendeten System nicht kompatibel sind.
Das Auffinden von Informationen auf Belegen, die aus einer unbekann­ ten Quelle stammen, wirft unter anderem folgende Probleme auf: Mit großer Wahrscheinlichkeit begegnet man dabei den verschiedensten Schriftarten. Die Belege selbst unterscheiden sich stark, und die Informationen erscheinen nicht immer in der gleichen Form. Außerdem kann Mikrofilm, der nicht aus einem COM-System stammt, Unterschiede bezüglich des Orts aufweisen, an dem sich das Bild auf dem Film befin­ det. Wird ein Beleg photographisch auf Mikrofilm abgebildet, so wird dabei nicht die Passgenauigkeit erreicht, die bei einem mit COM erzeug­ ten Bild erzielbar ist.
Wie in Fig. 2 dargestellt, liefert die OCR-Algorithmus-Einheit 30 als Ausgang des Computer Input Microfilm Reader 12 die Computercodes, die den Textzeichen entsprechen, die sich ursprünglich auf dem Mikro­ film 8 befanden. Diese von der OCR-Algorithmus-Einheit 30 erzeugten Computercodes werden der Computerschnittstelle 46 übermittelt. Die Computerschnittstelle 46 formatiert die Computercodes in die geeigneten Datenblocks, die dem Computersystem 2 übermittelt werden. Die Com­ puterschnittstelle 22 implementiert außerdem die erforderlichen Steuer­ und Dialogfunktionen.
Mit der Vorrichtung gemäß der vorliegenden Erfindung kann direkt les­ barer Mikrofilm als Speichermedium für die Sicherung von Computer­ daten verwendet werden. Außerdem ermöglicht der Einsatz eines Com­ puter Input Microfilm Readers im System die rasche Eingabe von Daten aus dem Mikrofilmarchiv, ohne daß eine Bedienungsperson die Daten über eine Tastatur eingeben muß.
Die Erfindung ist vor allem für den Abruf und die Speicherung von Informationen geeignet und erhöht die Kompatibilität von Mikrofilm mit elektronischen Büro- und Computersystemen.
Durch die Verwendung von Mikrofilm für die Datenspeicherung wird außerdem die Gefahr verringert, daß Daten durch Vandalismus ver­ lorengehen. Anders als magnetische Speichermedien, die gelöscht oder verändert werden können, stellt Mikrofilm ein dauerhaftes Speicher­ medium dar. Beim Computervandalismus, durch den Daten gelöscht oder verfälscht werden können, spricht man auch oft von einem Virus.

Claims (9)

1. Vorrichtung zum Lesen direkt lesbarer Daten, die in einer bekann­ ten Schriftart und -größe auf Mikrofilm aufgezeichnet sind, gekennzeichnet durch
  • - eine Lichtquelle, die einen Lichtstrahl aussendet,
  • - eine Mikrofilmtransportvorrichtung, die den Mikrofilm relativ zu der Lichtquelle in eine Stellung bewegt, in der das gewünschte Bild abgetastet werden kann und eine seitenweise Abtastung mög­ lich ist,
  • - Mittel, mit denen der Lichtstrahl aufgefangen und in Zeilenform auf den Mikrofilm gelenkt wird,
  • - Abtastmittel, auf denen der zeilenförmige Lichtstrahl aufgefangen wird, nachdem er durch den Mikrofilm gefallen ist, und in Zeilen­ richtung unter Erzeugung eines analogen Signals abgetastet wird,
  • - einen Analog-Digitalwandler zum Umwandeln des analogen Signals in ein digitales Signal,
  • - eine Optical Character Recognition (OCR) Algorithmus-Einheit, die Buchstaben aus dem Mikrofilm ausliest und
  • - eine Computerschnittstelle zum Umwandeln dieser ausgelesenen Buchstaben in einen computer-lesbaren Code.
2. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß der computer­ lesbare Code ein ASCII-Code ist.
3. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß der computer­ lesbare Code ein ECDIC-Code ist.
4. Datenabrufsystem, gekennzeichnet durch
  • - ein Computersystem, aus dem ein Benutzer Informationen ent­ nehmen kann,
  • - einen Computer Output Microfilmer, mit dem Computerdaten in direkt lesbare Zeichen umwandelbar und auf Mikrofilm ausdruck­ bar sind,
  • - Archivmittel zum Speichern von Mikrofilmbildern, die vom Com­ puter Output Microfilmer erzeugt werden, und von informations­ kennzeichnenden Adressen der in diesen Archivmitteln gespeicher­ ten Bilder,
  • - Mittel mit denen sich ein ausgewähltes Bild nach Anforderung aus den Archivmitteln abrufen läßt,
  • - einen Computer Input Microfilmer, mit dem die direkt lesbaren Zeichen auf dem Mikrofilm in Computercodes umgewandelt werden, und
  • - eine Computerschnittstelle, mit der die Computercodes in das Computersystem übertragen werden.
5. Gerät zum Lesen direkt lesbarer Daten, die in einer bekannten Schriftart und -form auf Mikrofilm aufgezeichnet sind, gekenn­ zeichnet durch
  • - Abtastmittel zum Abtasten eines ausgewählten Teils des Mikrofilms und zum Erzeugen eines anlogen Signals,
  • - einen Analog-Digital-Wandler zum Umwandeln des analogen Signals in ein digitales Signal,
  • - eine OCR-Algorithmus-Einheit, die Buchstaben aus dem Mikrofilm ausliest, und
  • - eine Computerschnittstelle, die die ausgelesenen Buchstaben in einen computer-lesbaren Code umwandelt.
6. Gerät nach Anspruch 5, dadurch gekennzeichnet, daß die Abtast­ mittel aus einer zweidimensionalen CCD-Anordnung bestehen.
7. Gerät nach Anspruch 5, dadurch gekennzeichnet, daß die Abtast­ mittel aus einem Lichtpunktabtaster bestehen.
8. Datenabrufsystem nach Anspruch 4, dadurch gekennzeichnet, daß die Archivmittel Indexmittel aufweisen, die Informationen über den Ort enthalten, an dem sich die archivierten Daten auf dem Mikrofilm befinden.
9. Archivierungsmittel nach Anspruch 8, dadurch gekennzeichnet, daß die Indexmittel Informationen bezüglich des Formats der auf den Archivierungsmitteln gespeicherten Mikrofilmbilder enthalten.
DE4000671A 1989-01-12 1990-01-11 Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer Withdrawn DE4000671A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US29611689A 1989-01-12 1989-01-12

Publications (1)

Publication Number Publication Date
DE4000671A1 true DE4000671A1 (de) 1990-07-19

Family

ID=23140687

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4000671A Withdrawn DE4000671A1 (de) 1989-01-12 1990-01-11 Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer

Country Status (1)

Country Link
DE (1) DE4000671A1 (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2695496A1 (fr) * 1992-09-04 1994-03-11 Renault Procédé et dispositifs de détermination d'itinéraires routiers.
DE4408327A1 (de) * 1994-03-11 1995-09-28 Sietec Systemtechnik Gmbh & Co Verfahren und Gerät zur elektronischen Archivierung der von einem Rechner aufbereiteten Dokumente
DE102006014043A1 (de) * 2006-03-27 2007-10-04 OCé PRINTING SYSTEMS GMBH Verfahren und Vorrichtung zum Archivieren von Druckbildern
DE102008022162A1 (de) 2008-01-14 2009-07-23 Cybercity Gmbh Verfahren und Gerät für den Zugriff auf Mikroformen
CN109583405A (zh) * 2018-12-06 2019-04-05 中国银行股份有限公司 一种信息录入方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2738586A1 (de) * 1976-08-31 1978-03-02 Kenneth Mason Holdings Ltd Datenverarbeitungseinheit zum verarbeiten gedruckter daten
DE3939366A1 (de) * 1989-11-29 1991-06-06 Ingo Roehrer Verfahren und vorrichtung zum optischen erfassen von auf ebenen datentraegern gespeicherten informationen

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2738586A1 (de) * 1976-08-31 1978-03-02 Kenneth Mason Holdings Ltd Datenverarbeitungseinheit zum verarbeiten gedruckter daten
DE3939366A1 (de) * 1989-11-29 1991-06-06 Ingo Roehrer Verfahren und vorrichtung zum optischen erfassen von auf ebenen datentraegern gespeicherten informationen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A.J. ATRUBIN u.a. "Two-Level Character Recognition", in: IBM Technical Disclosure Bulletin, Vol. 23, No. 8, 01/81, S. 3663/3664 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2695496A1 (fr) * 1992-09-04 1994-03-11 Renault Procédé et dispositifs de détermination d'itinéraires routiers.
DE4408327A1 (de) * 1994-03-11 1995-09-28 Sietec Systemtechnik Gmbh & Co Verfahren und Gerät zur elektronischen Archivierung der von einem Rechner aufbereiteten Dokumente
US5940584A (en) * 1994-03-11 1999-08-17 Oce Printing Systems Gmbh Method and apparatus for electronically filing documents prepared by a computer
DE102006014043A1 (de) * 2006-03-27 2007-10-04 OCé PRINTING SYSTEMS GMBH Verfahren und Vorrichtung zum Archivieren von Druckbildern
DE102008022162A1 (de) 2008-01-14 2009-07-23 Cybercity Gmbh Verfahren und Gerät für den Zugriff auf Mikroformen
US8500003B2 (en) 2008-01-14 2013-08-06 Cybercity Gmbh Method and device for accessing microforms
CN109583405A (zh) * 2018-12-06 2019-04-05 中国银行股份有限公司 一种信息录入方法及系统

Similar Documents

Publication Publication Date Title
DE3033193C2 (de)
DE4202579C2 (de) System zur Bearbeitung von Dokumenten
DE2523112C2 (de) Vorrichtung zum Bearbeitung von Daten tragenden Schriftstücken
DE3250064C2 (de) Tintenstrahl-Aufzeichnungsgerät
DE3336961C2 (de)
DE2743864A1 (de) Optoelektronische leseeinrichtung
DE2034962B2 (de) Gerat zum Bearbeiten bei Post amtern aufgegebener Poststucke
DE10159877A1 (de) Vorrichtung, die beide Seiten eines Photos abtastet und die auf der Rückseite des Photos gefundene Informationen dem Photo zuordnet
DE1282341B (de)
DE4000671A1 (de) Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer
DE2814738A1 (de) Informationsspeicher- und -wiedergewinnungsanordnung
DE19942902A1 (de) Gruppenbildabzug und Drucksystem zum Herstellen von Gruppenbildabzügen
US4419426A (en) Method for the visual inspection of the reproduction quality of drawing elements and elements for the execution of the method
DE1264829B (de) Verfahren zur Guetebestimmung von Druckzeichen und Anordnung zur Durchfuehrung des Verfahrens
DE2238661A1 (de) Speicher- und wiederausgabesystem fuer daten
DE1213724B (de) Aufnahmevorrichtung fuer Reproduktionen
EP0205087B1 (de) Vorrichtung zur elektronischen Aufnahme von Bildern
EP0935877B1 (de) Verfahren und vorrichtung zur herstellung von positivbildern
DE10152535B4 (de) Gerät zum Abtasten von Reflektions- und Transmissionsdaten von einem photographischen Bild
DE4114343A1 (de) Verfahren zum erkennen der lage eines fotografischen filmes
DE3112494A1 (de) Verfahren und geraet zur edv compatiblen visuellen erfassung von belegen etc.
DE10106162A1 (de) Selbstbedienungs-Datenstation und Verfahren zum Verarbeiten von Transaktionsformularen
DE2518727A1 (de) Vorrichtung fuer ein verfahren zur herstellung von photographischen kopien
EP0024352A1 (de) Einrichtung zum Prüfen und Kopieren von Dokumenten
DE4235470A1 (de) Verfahren und Vorrichtung zur zweiseitigen Verfilmung von Dokumenten auf Planfilm

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: G06K 17/00

8130 Withdrawal