-
Die Erfindung betrifft ein Verfahren zum computergestützten Verarbeiten von Dokumenten in einem Informationsverarbeitungsgerät mit einer Anzeigeeinheit und einem Bedienmechanismus. Weiterhin betrifft die Erfindung ein Computerprogramm und ein Informationsverarbeitungsgerät zur Durchführung des Verfahrens.
-
Menschen sind es gewohnt, Papierdokumente physisch zu betrachten und separat weitere Dokumente in anderen Medien, zum Beispiel ein Textdokument in einer Textverarbeitungsanwendung zu betrachten. Für Entscheidungen und Aufgaben von Mitarbeitern an digital unterstützten Arbeitsplätzen ist es sehr zeitverschwendend, zusammenhängende Dokumente einzeln und separat in den mittlerweile stark ansteigenden Informationsinseln zu finden. Dokumente sind dabei zum Teil in Papierform in Akten, zum Teil in E-Mails und zum Teil in Dateien zu finden.
-
Der Erfindung liegt daher die Aufgabe zugrunde, eine einheitliche Betrachtungsmöglichkeit von Dokumenten über all diese Informationsinseln hinweg mit schnellen Suchmöglichkeiten zu schaffen.
-
Die Lösung dieser Aufgabe erfolgt mit einem Verfahren mit den Merkmalen des Patentanspruchs 1 oder 2. Weiterhin wird die Aufgabe mit einem Computerprogramm mit den Merkmalen des Patentanspruchs 9 und mit einem Informationsverarbeitungsgerät mit den Merkmalen des Patentanspruchs 11 gelöst. Vorteilhafte Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben.
-
Bei einem Verfahren zum Verarbeiten von Dokumenten in einem Informationsverarbeitungsgerät, insbesondere einem Computer, mit einer Anzeigeeinheit und einem Bedienmechanismus werden erfindungsgemäß die zu verarbeitenden Dokumente gespeichert, aus jedem zu verarbeitenden Dokument wird eine Bilddatei erzeugt, die als Bild in der Anzeigeeinheit darstellbar ist, aus jeder Bilddatei werden mit einem optischen Zeichenerkennungsprogramm Zeichen innerhalb der Bilddatei erkannt und die gefundenen Zeichen werden einschließlich ihrer Positionsdaten in Dateien gespeichert, die den Bilddateien zugeordnet sind. Weiterhin wird erfindungsgemäß bei Darstellung einer Bilddatei auf der Anzeigeeinheit ein von einem Nutzer auf der Anzeigeeinheit bewegbarer Bedienmechanismus auf seine Position überwacht und bei Übereinstimmung der Position mit den gespeicherten Positionsdaten eines Zeichens die diesen Positionsdaten zugeordneten Zeichen optisch hervorgehoben. Bei Auswahl des optisch hervorgehobenen Zeichens mit dem Bedienmechanismus wird nach den so definierten Zeichen in den gespeicherten Dateien gesucht.
-
Mit diesem Verfahren sollen Anwender oder Benutzer bei der Verwendung dieses digitalen Datenverarbeitungsprogramms die Möglichkeit erhalten, direkt aus einer Dokumentendarstellung einen gewünschten Begriff auszusuchen und eine Suche nach gleichen oder ähnlichen Begriffen in anderen Dokumenten auslösen und auf diese Weise ähnliche Dokumente finden und darstellen können. In praktischer Bedeutung bedeutet dies, dass ein Unternehmen alle seine Papierbelege, Ausdrucke, E-Mails und Dateien in digitaler, auswertbarer Form mit digitalen Vorschaugrafiken speichert. Dies entspricht dem ersten oben angegebenen Schritt. Der Anwender kann aus der Vorschau oder bildlichen Darstellung des Dokuments durch Anklicken oder Touch oder eine andere Form der Bedienung einen Begriff, eine Rechnungsnummer oder ähnliches auswählen. Das digitale Datenverarbeitungsprogramm bietet dann alle dazu passenden Dokumente als Ergebnis an. Das digitale Datenverarbeitungsprogramm durchsucht dabei alle anderen Dateien nach diesen Zeichen und zeigt diese bevorzugt dann als Vorschau oder in anderer Zusammenstellung an. Die Dateien werden über dieses Verfahren interaktiv und effizient für die tägliche Arbeit nutzbar. Wesentlicher Vorteil der Erfindung ist, dass mit dem erfindungsgemäßen Verfahren auch die oftmals nur als Bilddateien vorhandenen Dokumente, die als Bilddaten gespeichert sind, zum Beispiel gescannte Papierblätter, mit in die Datenverarbeitung einbezogen werden. Dies erfolgt dadurch, dass mit einem optischen Zeichenerkennungsprogramm, einer sogenannten OCR-Software, für alle digitalen Bilddateien eine ergänzende Erkennung der Textdokumente einschließlich der Speicherung der Positionsdaten der einzelnen Texte und Zeichen erfolgt, damit diese Texte und Zeichen für eine Suche in anderen Dokumenten beziehungsweise Dateien genutzt werden können.
-
Die Suche erfolgt dabei in den mit Hilfe der OCR-Software erstellten Dateien, in denen die Zeichen und Texte erkannt und gespeichert sind. Bei der Suche können bevorzugt Randbedingungen wie die Festlegung erfolgen, dass Groß- und Kleinschreibung berücksichtigt oder ignoriert wird oder ob Wortstämme berücksichtigt werden und dadurch die Suche erweitert wird oder andere typische Suchparameter berücksichtigt werden. Wenn in einer solchen Datei ein übereinstimmender Text gefunden worden ist, so wird dann die zugehörige und über Verknüpfungen identifizierbare Bilddatei angezeigt, wobei dann in der Bilddatei über die zugehörige, mit der OCR-Software erzeugte Datei und die gespeicherten Positionsdaten der entsprechende Begriff auch wieder optisch hervorgehoben werden kann, beispielsweise farbig hinterlegt wird.
-
Ein weiterer Aspekt der Erfindung, für den ebenfalls Schutz beansprucht wird, besteht in der Ausführung des Verfahrens mit den Verfahrensschritten, die starten, wenn der Bediener ein Zeichen auswählt und dieses hinterlegt wird und auf vorher erzeugte und für das Informationsverarbeitungsgerät abrufbare Bilddateien zur Darstellung der Dokumente und mit diesen verknüpften, mit einer OCR-Software erzeugten Dateien mit darin gespeicherten Zeichen und Positionsdaten zurückgreift.
-
In einer bevorzugten Ausführungsform der Erfindung erfolgt die Speicherung der Dokumente internetbasiert. Bevorzugt werden die Dateien in einer Cloud gespeichert. Alternativ können die Dateien auch stationär in dem Informationsverarbeitungsgerät oder Computer gespeichert sein, das der Benutzer nutzt oder können in einem zugehörigen Netzwerk oder einem Server gespeichert sein.
-
Die Speicherung der Bilddaten erfolgt bevorzugt in einem standardisierten Bitmap-Format. Grundsätzlich sind jedoch auch andere Formate möglich.
-
Die in dem Verfahren für die gefundenen Zeichen erfassten Positionsdaten umfassen bevorzugt die Position, die Höhe und auch die Breite der gefundenen Zeichen. Damit kann ein Koordinatenraum aufgespannt werden, der später im Verfahren mit der Position des Bedienmechanismus verglichen wird. Alternativ sind auch andere Positionsdaten denkbar, beispielsweise eine Vektor-Darstellung, mit der sich ebenfalls ein Koordinatenraum darstellen lässt.
-
In einer bevorzugten Ausführungsform der Erfindung werden bei Darstellung einer Bilddatei auf der Anzeigeeinheit parallel über zugeordnete Referenzwerte die gespeicherten Zeichen und deren Positionsdaten aufgerufen. Alternativ sind diese Dateien bereits unmittelbar miteinander verknüpft. In einer Ausgestaltung der Erfindung werden in dem Verfahren die Dateien nicht vollständig, sondern nur die beim Benutzer erste anzuzeigende Seite der Datei dargestellt, um dadurch die Geschwindigkeit des Verfahrens zu erhöhen.
-
In einer anderen bevorzugten Ausgestaltung der Erfindung wird der Bedienmechanismus durch Bewegen eines Mauszeigers realisiert. Alternativ kann auch ein Joystick oder ein Touchscreen als Bedienmechanismus verwendet werden.
-
In einer Weiterbildung der Erfindung wird nach Durchführung der Suche in den übrigen Dateien eine Ergebnisliste erzeugt und dem Benutzer dargestellt. Bevorzugt kann der Benutzer dann aus der Ergebnisliste ein Dokument auswählen und sich anzeigen lassen und in diesem Dokument wird dann wieder über den Vergleich mit der Datei mit den darin gespeicherten Zeichen und Positionsdaten der Suchbegriff optisch hervorgehoben. Dadurch ist für den Benutzer eine noch schnellere Zuordnung und Einordnung des gefundenen Dokuments möglich und der Bedienkomfort wird weiter erhöht.
-
Ein weiterer Aspekt der Erfindung besteht in der Bereitstellung eines Computerprogramms zur Durchführung des Verfahrens auf einem Computer und in gespeicherter Form als Computerprogrammprodukt zur Durchführung des Verfahrens.
-
Ein weiterer Aspekt der Erfindung besteht in der Bereitstellung eines Informationsverarbeitungsgeräts zum Verarbeiten von digitalen Dokumenten mit einer Anzeigeeinheit und mit einem Bedienmechanismus und einem dem Informationsverarbeitungsgerät zugeordneten Speicher, wobei in dem Speicher für jedes zu verarbeitende Dokument eine Bilddatei gespeichert ist, jeder Bilddatei eine weitere Datei zugeordnet ist, in der die mit einem optischen Zeichenerkennungsprogramm gefundenen Zeichen und deren Positionen gespeichert sind, wobei erfindungswesentlich ein Bedienmechanismus zur Bewegung auf der Anzeigeeinheit vorgesehen ist und die Position des Bedienmechanismus mit Hilfe eines Positionsüberwachungsmechanismus überwacht wird und der Positionsüberwachungsmechanismus derart ausgelegt ist, dass bei Übereinstimmung der Position des Bedienmechanismus mit den gespeicherten Positionsdaten eines Zeichens die diesen Positionsdaten zugeordneten Zeichen optisch hervorgehoben werden und dass ein Suchmechanismus vorgesehen und derart ausgelegt ist, dass bei Auswahl des optisch hervorgehobenen Zeichens mit dem Bedienmechanismus nach den so definierten Zeichen in dem Speicher nach den dort gespeicherten Dateien gesucht wird, die dieses Zeichen enthalten.
-
Mit einem solchen Informationsverarbeitungsgerät kann das oben beschriebene Verfahren durchgeführt werden. Weitere vorteilhafte Ausgestaltungen des Informationsverarbeitungsgerätes beziehungsweise Computers ergeben sich auch aus der obigen Beschreibung des Verfahrens.
-
Die einzige Figur der Anmeldung zeigt einen schematischen Ablaufplan, in dem die Verarbeitung der Daten, die Speicherung der Daten, die Darstellung der Daten und die Benutzerinteraktion dargestellt sind.
-
Das Verfahren erfolgt automatisiert in einem Informationsverarbeitungsgerät, insbesondere einem Computer, der beispielsweise ein Destop-Computer, ein Laptop, ein Notebook, ein mobiles Endgerät oder jede andere Art von Computer sein kann. Die Erfindung ist zur primären Nutzung an einem bestimmten Informationsverarbeitungsgerät oder Computer vorgesehen, an dem sich insbesondere auch eine Anzeigeeinheit, insbesondere ein Bildschirm befindet, auf dem für einen Benutzer ein Dokument dargestellt wird. Hier wird einheitlich von darzustellenden Dokumenten gesprochen, da es sich in der realen Welt um Textdokumente, Rechnungen und oftmals Papierinformationen handelt, die jedoch im Zusammenhang mit der Darstellung auf dem Computer selbstverständlich als digitale Dateien vorliegen. Bei dem erfindungsgemäßen Verfahren steht ein bestimmter Computer beziehungsweise ein Informationsverarbeitungsgerät im Mittelpunkt, an dem der Benutzer arbeitet. Diesem Informationsverarbeitungsgerät ist eine Anzeigeeinheit, insbesondere ein Bildschirm zugeordnet, auf dem das Dokument oder die Dokumente dargestellt werden. Weiterhin ist diesem Informationsverarbeitungsgerät ein Bedienmechanismus zugeordnet, mit dem der Benutzer auf der Anzeigeeinheit agieren kann und bestimmte Elemente oder Zeichen der dargestellten Dokumente auswählen kann. Dies kann beispielsweise eine Maus mit einem Mauszeiger oder ein Touchmechanismus sein, wenn die Anzeigeeinheit einen entsprechend berührungsempfindlichen Bildschirm hat. Auch andere Bedienmechanismen sind denkbar. Die Datenspeicherung kann lokal auf einem physikalisch vorhandenen Speicher des entsprechenden Informationsverarbeitungsgeräts oder auch übergeordnet auf einem Server erfolgen oder auch in internetbasierenden Speichermedien, zum Beispiel einer Cloud.
-
In der Figur sind in der linken Spalte die Schritte dargestellt, die in den Bereich „Datenverarbeitung“ fallen, in der zweiten Spalte die Schritte, die in den Bereich „Datenspeicherung“ fallen, in der dritten Spalte die Schritte, die in den Bereich der Darstellung auf der „Anzeigeeinheit“ fallen und in der ganz rechten Spalte die Schritte, die in den Bereich „Benutzerinteraktion“ fallen, also typischerweise solche, bei denen ein Benutzer den Bedienmechanismus betätigt.
-
Im Schritt 1 erfolgt ein Dateiimport im Rahmen der Datenverarbeitung. Die zu verarbeitenden Dateien oder Dokumente erreichen über verschiedene Importwege physikalische oder virtuelle Speicher, auf die das Informationsverarbeitungsgerät zugreifen kann. Typischerweise werden die Dateien mit einer Serversoftware auf verschiedenen Datenspeichertechnologien gespeichert. In dem mit 3 bezeichneten Schritt wird zu jedem Dokument mittels Softwarebibliotheken eine bildliche Darstellung pro Seite in einem standardisierten Bitmap-Format erzeugt. Damit ist eine Dokumentenvorschau mit Bilddateien möglich. Die Bilddateien werden von der Serversoftware gespeichert. Ebenso werden Verwaltungsinformationen der Bilddateien, insbesondere der Dateiname, eine eindeutige Identifikationsnummer und eine Seitennummer in einer elektronischen Datenbank abgelegt. Diese Speicherung erfolgt in dem mit 3.1 bezeichneten Schritt.
-
In dem mit 4 gekennzeichneten Schritt wird eine Texterkennung durchgeführt. Die Serversoftware übergibt die Bilddateien jeder Seite an eine Softwarebibliothek für eine optische Zeichenerkennung (OCR). Die optische Zeichenerkennung wandelt die sonst nur für Menschen lesbaren Texte in digital zu verarbeitende Texte um. Eine OCR-Software-Bibliothek verarbeitet die Bitmap-Datei und übergibt als Ergebnis die auf jeder Seite gefundenen Texte, die entweder einzelne Zeichen oder Wörter sein können, sowie deren Position, Höhe und Breite auf der Bitmap zurück. Aus diesen Angaben ergibt sich im späteren Verfahren ein Koordinatenraum. Diese Textdateien und die zugehörigen Positionsdaten legt die Serversoftware im Schritt 4.1 im Datenspeicher ab. Im Schritt 5 werden die Dokumente als Bilddaten auf der Anzeigeeinheit dargestellt. Dies erfolgt insbesondere dann, wenn ein Benutzer eine Datei auf der Anzeigeeinheit anfordert. Die Serversoftware ruft dann auf Basis eines eindeutigen Referenzwerts die Bilddaten für jede Seite der Datei sowie auch die entsprechenden, bei der Texterkennung erhaltenen Text- und Positionsdaten aus dem Datenspeicher ab. Je nach Ausführungsform kann dabei die gesamte Datei des Dokuments mit mehreren Seiten oder zunächst auch nur die erste anzuzeigende Seite aufgerufen werden, um die Verarbeitungsgeschwindigkeit zu erhöhen. Im mit 6 bezeichneten Schritt erfolgt dann die Benutzerinteraktion, wobei der Benutzer seinen Bedienmechanismus nutzt, um auf der Bilddatei bestimmte Bereiche anzuzeigen. Beispielsweise kann dazu der Mauszeiger über die Dokumentenvorschau bewegt werden. Die Bewegung bzw. die aktuelle Position des Bedienmechanismus, also seine Bildschirmkoordinaten, werden mit den parallel gespeicherten Text und Positionsdaten verglichen. Dazu müssen gegebenenfalls Umrechnungen erfolgen, damit die Positionsdaten des Bedienmechanismus mit den Positionsdaten der gespeicherten Texte korrespondieren. Diese Überwachung der Position des Bedienmechanismus ist im Schritt 7 im Rahmen der Datenverarbeitung dargestellt. Ein für die Erfindung wesentlicher Schritt erfolgt in diesem Schritt 7 und dem dann folgenden Schritt 8, nämlich dass sich durch die Koordinaten der Texte und der Höhe und Breite ein Koordinatenraum für den digital verarbeitbaren Text ergibt, der sich als bildliche Darstellung im gleichen Koordinatenraum in der Dokumentenvorschau befindet. Es wird nun der Bedienmechanismus überwacht und die Position des Bedienmechanismus, also zum Beispiel des Mauszeigers, mit den Koordinatenräumen der Texte dieser Bilddatei abgeglichen. Befindet sich die Position des Bedienmechanismus innerhalb des Koordinatenraums eines Textes, gilt dies als Übereinstimmung und damit als Treffer. Der so erhaltene Treffer wird dann optisch hervorgehoben und der entsprechend in diesem Koordinatenraum vorhandene Text markiert. Beispielsweise kann so dass Wort „Rechnung“ farbig markiert werden. Im Schritt 9 kann nun bei einem so gefundenen Treffer der Benutzer mit Hilfe des Bedienmechanismusses, zum Beispiel durch Einfachklick oder Doppelklick, mit der Maus oder durch ein Antippen über den Touchscreen den zum Koordinatenbereich passenden Text für eine Weiterverwendung markieren und damit weitere Verfahrensschritte starten. Entsprechend wird dies im Schritt 10 in der Datenverarbeitung registriert. Im Schritt 11 erfolgt dann die Durchführung der Suche im Datenspeicher. Das Computerprogramm bzw. die Serversoftware erhält den Aufruf, mit dem Suchbegriff alle Dateien zu finden, in dessen Texten der Suchbegriff gefunden wurde. Das Ziel ist es, dass nicht explizit die Seite oder die Koordinaten gefundener Texte anderer Dateien stimmen müssen, sondern lediglich die Existenz des Suchbegriffs auch in anderen übereinstimmenden Dateien. Das Computerprogramm vergleicht auf Basis von Einstellungen des Benutzers den Suchbegriff mit den Texten der übrigen Dateien. Einstellungen beeinflussen das Suchergebnis, beispielsweise eine Suche, die Groß- und Kleinschreibung ignoriert oder Schreibfehler toleriert. Ebenso können Strategien, wie die Stammformreduktion den Abgleich der Texte beeinflussen. Zur Durchführung dieser Suche werden im Schritt 12 aus dem Datenspeicher die Texte und Positionsdaten aller Dateien geliefert. Die Suche erfolgt in allen Texten unabhängig von den Positionsdaten. Im Schritt 13 wird dann eine Ergebnisliste erzeugt, die die gefundenen Bilddateien aufführt. Das Ergebnis ist von den oben unter 11 beschriebenen Sucheinstellungen abhängig. In dem mit 14 bezeichneten Schritt werden die Ergebnisse dargestellt. Dies kann entweder eine Liste der Dateinamen sein oder auch die bildliche Darstellung der gefundenen Bilddateien, die im Schritt 3 erzeugt wurden. Im Schritt 15 kann der Benutzer dann aus der Ergebnisliste eine Datei auswählen und diese vollständig oder auch größer darstellen lassen. Bevorzugt werden dann hierzu auch wieder die zugehörigen Zeichen aus der Texterkennung geladen und das Suchwort wird hervorgehoben markiert.
-
Alle in der vorstehenden Beschreibung und in den Ansprüchen genannten Merkmale sind in einer beliebigen Auswahl mit den Merkmalen des unabhängigen Anspruchs kombinierbar. Die Offenbarung der Erfindung ist somit nicht auf die beschriebenen bzw. beanspruchten Merkmalskombinationen beschränkt, vielmehr sind alle im Rahmen der Erfindung sinnvollen Merkmalskombinationen als offenbart zu betrachten.