DE112017003926T5 - System and method for monitoring electronic documents - Google Patents
System and method for monitoring electronic documents Download PDFInfo
- Publication number
- DE112017003926T5 DE112017003926T5 DE112017003926.6T DE112017003926T DE112017003926T5 DE 112017003926 T5 DE112017003926 T5 DE 112017003926T5 DE 112017003926 T DE112017003926 T DE 112017003926T DE 112017003926 T5 DE112017003926 T5 DE 112017003926T5
- Authority
- DE
- Germany
- Prior art keywords
- electronic document
- data
- electronic
- value
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
Abstract
Ein System und ein Verfahren zum Überwachen elektronischer Dokumente. Das Verfahren beinhaltet das Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument mindestens teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.A system and method for monitoring electronic documents. The method includes analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.
Description
Querverweis auf verwandte AnmeldungenCross-reference to related applications
Diese Anmeldung beansprucht die Priorität der vorläufigen
Technischer BereichTechnical part
Die vorliegende Offenbarung bezieht sich allgemein auf die Überwachung von Dateien in Datensystemen und insbesondere auf das Identifizieren von Auffälligkeiten in elektronischen Dokumenten.The present disclosure relates generally to the monitoring of files in data systems, and more particularly to the identification of abnormalities in electronic documents.
Hintergrundbackground
Aufgrund des rasanten technologischen Wachstums in den letzten Jahrzehnten ist die Kommunikation zwischen Menschen auf der ganzen Welt immer schneller und bequemer geworden. Daher können Transaktionen, die zuvor über Tage oder Wochen abgewickelt wurden, nun in Sekundenschnelle abgeschlossen werden. Ein Unternehmen kann jetzt Tausende oder Millionen Transaktionen pro Jahr abschließen. Einige dieser Transaktionen können wichtige Großtransaktionen sein.Due to rapid technological growth in recent decades, communication between people around the world has become faster and more convenient. As a result, transactions previously completed over days or weeks can now be completed in seconds. A business can now complete thousands or millions of transactions each year. Some of these transactions can be major transactions.
Da Unternehmen zunehmend auf Technologien angewiesen sind, um Daten zu verwalten, die sich auf Vorgänge beziehen, wie etwa Rechnungs- und Bestelldaten, sind geeignete Systeme für die ordnungsgemäße Verwaltung und Validierung von Daten für den Erfolg von entscheidender Bedeutung. Insbesondere für große Unternehmen kann die von Unternehmen täglich genutzte Datenmenge überwältigend sein. Dementsprechend sind eine manuelle Überprüfung und Validierung solcher Daten bestenfalls nicht praktikabel. Unterschiede zwischen Aufzeichnungsunterlagen können jedoch zu erheblichen Problemen für die Unternehmen führen, wie zum Beispiel Fehler bei der ordnungsgemäßen Meldung von Gewinnen an die Steuerbehörden.As companies increasingly rely on technologies to manage data related to operations, such as billing and ordering data, appropriate systems for the proper management and validation of data are critical to success. Especially for large companies, the amount of data that companies use every day can be overwhelming. Accordingly, manual verification and validation of such data is at best impractical. Differences between records, however, can cause significant problems for companies, such as errors in the proper reporting of profits to the tax authorities.
Daher ist es für Unternehmen äußerst wünschenswert, Auffälligkeiten in den Unternehmensunterlagen schnell zu erkennen und zu beheben. Dieses Problem kann besonders schwierig sein, wenn ein Unternehmen mehrere Anbieter zur Bereitstellung von Dienstleistungen und Waren verwendet, da Datensätze von verschiedenen Anbietern unterschiedliche Informationen enthalten können, anders formatiert sein können, Fehler oder plötzliche Preisänderungen enthalten können und dergleichen. Ferner kann das Erkennen von Auffälligkeiten eine Herausforderung darstellen, wenn Unternehmensdatensätze in unstrukturierten Datenformaten empfangen werden. Beispielsweise werden Rechnungen häufig als Bilddateien empfangen, die einen Rechnungsscan zeigen.Therefore, it is highly desirable for businesses to quickly identify and resolve issues in their corporate records. This problem can be particularly difficult when a company uses multiple providers to provide services and goods because records from different providers may contain different information, may be otherwise formatted, may include errors or sudden price changes, and the like. Furthermore, detecting abnormalities can be challenging when receiving business records in unstructured data formats. For example, invoices are often received as image files that show a bill scan.
Es gibt einige Lösungen zum automatischen Erkennen von Informationen in gescannten Dokumenten (z. B. Rechnungen und Quittungen) oder anderen unstrukturierten elektronischen Dokumenten (z. B. unstrukturierten Textdateien). Solche Lösungen stehen häufig vor der Herausforderung, Zeichen und andere Merkmale elektronischer Dokumente genau zu identifizieren und zu erkennen. Darüber hinaus führt eine inhaltliche Verschlechterung der eingegebenen unstrukturierten elektronischen Dokumente typischerweise zu höheren Fehlerraten. Infolgedessen sind bestehende Bilderkennungstechniken unter idealen Umständen (d. h. sehr klare Bilder) nicht vollständig genau, und ihre Genauigkeit nimmt oft drastisch ab, wenn die Eingabebilder weniger klar sind. Darüber hinaus können fehlende oder anderweitig unvollständige Daten zu Fehlern bei der späteren Verwendung der Daten führen. Viele bestehende Lösungen können fehlende Daten nicht identifizieren, es sei denn, ein Feld in einem strukturierten Datensatz ist unvollständig.There are some solutions for automatically detecting information in scanned documents (eg, invoices and receipts) or other unstructured electronic documents (eg, unstructured text files). Such solutions often face the challenge of accurately identifying and recognizing characters and other features of electronic documents. In addition, content degradation of the input unstructured electronic documents typically results in higher error rates. As a result, existing image recognition techniques are not completely accurate under ideal circumstances (i.e., very clear images), and their accuracy often decreases dramatically when the input images are less clear. In addition, missing or otherwise incomplete data can lead to errors in the subsequent use of the data. Many existing solutions can not identify missing data unless a field in a structured record is incomplete.
Außerdem können bestehende Bilderkennungslösungen möglicherweise einige oder alle Sonderzeichen nicht genau identifizieren (z. B. „!“, „@“, „#“, „$“,„©", „%“, „&“ usw. Beispielsweise können einige vorhandene Bilderkennungslösungen einen in einem gescannten Beleg enthaltenen Strich ungenau als Zahl „1“ identifizieren. Als ein anderes Beispiel können einige bestehende Bilderkennungslösungen keine Sonderzeichen wie das Dollarzeichen, das Yen-Symbol usw. erkennen.Also, existing image recognition solutions may not be able to pinpoint some or all special characters (for example, "!", "@", "#", "$", "©", "%", "&" etc.) Image recognition solutions may incorrectly identify a line contained in a scanned document as a number "1." As another example, some existing image recognition solutions may not recognize special characters such as the dollar sign, the yen symbol, and so on.
Ferner können solche Lösungen vor Herausforderungen stehen, wenn erkannte Informationen für die spätere Verwendung aufbereitet werden. Insbesondere erzeugen viele dieser Lösungen entweder eine Ausgabe in einem unstrukturierten Format oder können nur eine strukturierte Ausgabe erzeugen, wenn die eingegebenen elektronischen Dokumente speziell für die Erkennung durch ein Bilderkennungssystem formatiert sind. Die resultierende unstrukturierte Ausgabe kann normalerweise nicht effizient verarbeitet werden. Eine solche unstrukturierte Ausgabe kann insbesondere Duplikate enthalten und kann Daten enthalten, die vor der Verwendung einer nachfolgenden Verarbeitung bedürfen.Furthermore, such solutions can be challenging if recognized information is prepared for later use. In particular, many of these solutions either produce an output in an unstructured format or can only produce a structured output if the input electronic documents are formatted specifically for recognition by an image recognition system. The resulting unstructured output usually can not be processed efficiently. In particular, such unstructured output may contain duplicates and may include data that requires subsequent processing prior to use.
Es wäre daher vorteilhaft, eine Lösung bereitzustellen, die die Mängel des Standes der Technik überwindet.It would therefore be advantageous to provide a solution that overcomes the deficiencies of the prior art.
Zusammenfassung Summary
Es folgt eine Zusammenfassung mehrerer beispielhafter Ausführungsformen der Offenbarung. Diese Zusammenfassung wird zur Erleichterung für den Leser bereitgestellt, um ein grundlegendes Verständnis solcher Ausführungsformen zu vermitteln, und definiert nicht den Umfang der Offenbarung vollständig. Diese Zusammenfassung ist kein umfassender Überblick über alle in Betracht gezogenen Ausführungsformen und soll weder Schlüssel- oder kritische Elemente aller Ausführungsformen identifizieren, noch den Umfang einiger oder aller Aspekte abgrenzen. Ihr einziger Zweck ist es, einige Konzepte einer oder mehrerer Ausführungsformen in einer vereinfachten Form als Auftakt für die ausführlichere Beschreibung darzustellen, die später präsentiert wird. Der Einfachheit halber kann der Begriff „einige Ausführungsformen“ hierin verwendet werden, um sich auf eine einzelne Ausführungsform oder mehrere Ausführungsformen der Offenbarung zu beziehen.The following is a summary of several exemplary embodiments of the disclosure. This summary is provided to the convenience of the reader to provide a basic understanding of such embodiments, and does not fully define the scope of the disclosure. This summary is not a comprehensive overview of all contemplated embodiments and is not intended to identify key or critical elements of all embodiments, nor to limit the scope of some or all aspects. Its sole purpose is to present some concepts of one or more embodiments in a simplified form as a prelude to the more detailed description presented later. For the sake of simplicity, the term "some embodiments" may be used herein to refer to a single embodiment or multiple embodiments of the disclosure.
Bestimmte hierin offenbarte Ausführungsformen umfassen ein Verfahren zum Überwachen elektronischer Dokumente. Das Verfahren umfasst: Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument mindestens teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.Certain embodiments disclosed herein include a method for monitoring electronic documents. The method comprises: analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.
Bestimmte hierin offenbarte Ausführungsformen umfassen auch ein nichtflüchtiges computerlesbares Medium, auf dem Anweisungen gespeichert sind, um eine Verarbeitungsschaltung zur Durchführung eines Verfahrens zu veranlassen, wobei das Verfahren aufweist: Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument zumindest teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.Certain embodiments disclosed herein also include a non-transitory computer-readable medium having stored thereon instructions for causing a processing circuit to perform a method, the method comprising: analyzing a first electronic document to determine at least one transaction parameter, wherein the first electronic document contains at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.
Bestimmte hierin offenbarte Ausführungsformen umfassen auch ein System zum Überwachen elektronischer Dokumente. Das System weist auf: eine Verarbeitungsschaltung; und einen Speicher, wobei der Speicher Anweisungen enthält, die, wenn sie von der Verarbeitungsschaltung ausgeführt werden, das System so konfigurieren, dass: ein erstes elektronisches Dokument analysiert wird, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument zumindest teilweise unstrukturierte Daten enthält; eine Vorlage für das erste elektronische Dokument erstellt wird, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Daten der erstellten Vorlage mit Daten verglichen werden, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.Certain embodiments disclosed herein also include a system for monitoring electronic documents. The system includes: a processing circuit; and a memory, the memory including instructions that, when executed by the processing circuitry, configure the system to: analyze a first electronic document to determine at least one transaction parameter, the first electronic document at least partially unstructured data contains; creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.
Figurenlistelist of figures
Der hierin offenbarte Gegenstand wird in den Ansprüchen am Ende der Beschreibung besonders hervorgehoben und ausdrücklich beansprucht. Die vorstehenden und andere Ziele, Merkmale und Vorteile der offenbarten Ausführungsformen werden aus der folgenden detaillierten Beschreibung in Verbindung mit den beigefügten Zeichnungen ersichtlich werden.
-
1 ist ein Netzwerkdiagramm, das zur Beschreibung der verschiedenen offenbarten Ausführungsformen verwendet wird. -
2 ist ein schematisches Diagramm eines Validierungssystems gemäß einer Ausführungsform. -
3 ist ein Flussdiagramm, das ein Verfahren zum Überwachen elektronischer Dokumente gemäß einer Ausführungsform darstellt. -
4 ist ein Flussdiagramm, das ein Verfahren zum Erstellen eines Datensatzes basierend auf mindestens einem elektronischen Dokument gemäß einer Ausführungsform darstellt. -
5 ist ein Flussdiagramm, das ein Verfahren zum Identifizieren von Auffälligkeiten gemäß einer Ausführungsform basierend auf einer Vorlage darstellt, die für ein elektronisches Eingabedokument erstellt wurde.
-
1 FIG. 10 is a network diagram used to describe the various disclosed embodiments. FIG. -
2 FIG. 12 is a schematic diagram of a validation system according to an embodiment. FIG. -
3 FIG. 10 is a flowchart illustrating a method of monitoring electronic documents according to an embodiment. FIG. -
4 FIG. 10 is a flow chart illustrating a method of creating a data set based on at least one electronic document according to an embodiment. -
5 FIG. 10 is a flowchart illustrating a method for identifying abnormalities according to an embodiment based on a template created for an input electronic document.
Detaillierte BeschreibungDetailed description
Es ist wichtig anzumerken, dass die hierin offenbarten Ausführungsformen nur Beispiele für die vielen vorteilhaften Verwendungen der innovativen Lehren hierin sind. Im Allgemeinen beschränken Aussagen, die in der Beschreibung der vorliegenden Anmeldung gemacht werden, nicht notwendigerweise eine der verschiedenen beanspruchten Ausführungsformen. Darüber hinaus können einige Aussagen auf einige erfinderische Merkmale zutreffen, jedoch nicht auf andere. Sofern nichts anderes angegeben ist, können Singularelemente im Allgemeinen im Plural stehen und umgekehrt, ohne dass die Allgemeinheit dadurch beeinträchtigt wird. In den Zeichnungen beziehen sich gleiche Zahlensymbole in mehreren Ansichten auf gleiche Teile.It is important to note that the embodiments disclosed herein are only examples of the many beneficial uses of the innovative teachings herein. In general, statements made in the description of the present application do not necessarily limit one of the various claimed embodiments. In addition, some statements may apply to some inventive features, but not to others. Unless otherwise stated, In general, singular elements can be plural and vice versa, without affecting the general public. In the drawings, like numerals refer to like parts in several views.
Die verschiedenen offenbarten Ausführungsformen umfassen ein Verfahren und ein System zum Überwachen elektronischer Dokumente. Die hierin offenbarten Ausführungsformen können verwendet werden, um Auffälligkeiten in den überwachten elektronischen Dokumenten zu erkennen und zu korrigieren. In einer Ausführungsform wird ein Datensatz basierend auf einem ersten elektronischen Eingabedokument erstellt. Das elektronische Eingabedokument enthält Daten einer Transaktion und kann unstrukturierte Daten enthalten. Eine Vorlage für Transaktionsattribute wird basierend auf dem Datensatz des elektronischen Eingabedokuments erstellt. Daten der Vorlage, die für das elektronische Eingabedokument erstellt wurde, werden mit Daten von zweiten elektronischen Probendokumenten verglichen. Basierend auf dem Vergleich können eine oder mehrere Auffälligkeiten in Datenwerten identifiziert werden. Es kann eine Warnung ausgegeben werden, die auf die Auffälligkeiten hinweist.The various disclosed embodiments include a method and system for monitoring electronic documents. The embodiments disclosed herein may be used to detect and correct for abnormalities in the monitored electronic documents. In one embodiment, a record is created based on a first electronic input document. The electronic input document contains data of a transaction and may contain unstructured data. A template for transaction attributes is created based on the record of the electronic input document. Data from the template created for the electronic input document is compared with data from second electronic sample documents. Based on the comparison, one or more abnormalities in data values can be identified. A warning can be issued indicating the abnormalities.
Die offenbarten Ausführungsformen ermöglichen eine automatische Erkennung von Auffälligkeiten beispielsweise in neu eingegangenen Rechnungen. Insbesondere umfassen die offenbarten Ausführungsformen das Bereitstellen strukturierter Datensatzvorlagen für elektronische Dokumente, wodurch ein effizienter und genauer Vergleich von Daten ermöglicht wird, die in elektronischen Dokumenten enthalten sind, die unstrukturiert, halbstrukturiert sind oder denen sonst eine bekannte Struktur fehlt. Ferner ermöglichen die für die elektronischen Dokumente erstellten Vorlagen effizientere Vergleiche bestimmter Datensätze, da Vergleiche auf Vergleiche zwischen bestimmten Feldern der Vorlagen beschränkt sein können. Beispielsweise können Daten in einem „Zeit“-Feld einer Vorlage mit Daten in „Zeit“-Feldern anderer Vorlagen verglichen werden, ohne dass ein Vergleich mit anderen Daten erforderlich ist.The disclosed embodiments enable automatic detection of abnormalities, for example, in newly received invoices. In particular, the disclosed embodiments include providing structured record templates for electronic documents, thereby enabling efficient and accurate comparison of data contained in electronic documents that are unstructured, semi-structured, or otherwise lacking a known structure. Furthermore, the templates created for the electronic documents allow for more efficient comparisons of particular records since comparisons may be limited to comparisons between certain fields of the templates. For example, data in a "time" field of one template can be compared to data in "time" fields of other templates, without the need for comparison with other data.
Das Unternehmenssystem
Die von dem Unternehmenssystem
Die Datenbank
Die Datenquellen
In einer Ausführungsform ist die Überwachung
Basierend auf dem Vergleich ist die Überwachung
In einer Ausführungsform ist die Überwachung
Die elektronische Dokumentenüberwachung
Die Verwendung strukturierter Vorlagen zum Erkennen von Auffälligkeiten ermöglicht eine effizientere und genauere Identifizierung von Auffälligkeiten als beispielsweise durch Verwendung unstrukturierter Daten. Insbesondere können Teile eines eingegebenen elektronischen Dokuments nur mit entsprechenden Teilen von elektronischen Probendokumenten (z. B. in bestimmten Feldern einer strukturierten Vorlage enthaltenen Teilen) verglichen werden, wodurch die zu vergleichende Datenmenge sowie falsche positive Ergebnisse infolge des Vergleichs nicht zusammenhängender Daten reduziert werden. Darüber hinaus benötigen aus elektronischen Dokumenten extrahierte und in Vorlagen organisierte Daten weniger Speicher als beispielsweise Bilder gescannter Dokumente.The use of structured templates to detect abnormalities enables more efficient and accurate identification of abnormalities than, for example, by using unstructured data. In particular, parts of an input electronic document can only be compared to corresponding parts of electronic sample documents (eg, parts contained in certain fields of a structured template), thereby reducing the amount of data to be compared and false positives due to the comparison of non-contiguous data. In addition, data extracted from electronic documents and organized into templates require less memory than, for example, images of scanned documents.
Basierend auf der Vorlage, die für das eingegebene elektronische Dokument erstellt wurde, kann die Überwachung
In noch einer anderen Ausführungsform kann die Überwachung
Das eingegebene elektronische Dokument kann als vollständig bestimmt werden, wenn zum Beispiel ein oder mehrere vorbestimmte erforderliche Felder der Vorlage Daten enthalten. Beispielsweise kann das elektronische Eingabedokument vollständig sein, wenn mindestens eine Zeit, eine Verkäufer-ID und ein Preisfeld der für das elektronische Eingabedokument erstellten Vorlage Daten enthalten. The input electronic document may be determined to be complete if, for example, one or more predetermined required fields of the template contain data. For example, if at least one time, a seller ID, and a price field of the template created for the electronic input document contain data, the electronic input document may be complete.
Es sei darauf hingewiesen, dass die Ausführungsformen, die hierin oben mit Bezug auf
Die Verarbeitungsschaltung
Der Speicher
In einer anderen Ausführungsform ist der Speicher
Der Massenspeicher
Der OCR-Prozessor
Die Netzwerkschnittstelle
Es sollte verstanden werden, dass die hierin beschriebenen Ausführungsformen nicht auf die in
Bei
In einer Ausführungsform umfasst
Bei
Bei
Das Erstellen von Vorlagen aus elektronischen Dokumenten ermöglicht aufgrund der strukturierten Natur der erstellten Vorlagen eine schnellere Verarbeitung. Abfrage- und Manipulationsoperationen können beispielsweise bei strukturierten Datensätzen effizienter ausgeführt werden als bei Datensätzen, denen eine solche Struktur fehlt. Beim Organisieren von Informationen aus elektronischen Dokumenten in strukturierte Datensätze kann der zum Speichern von Informationen, die in elektronischen Dokumenten enthalten sind, erforderliche Speicherplatz erheblich reduziert werden. Elektronische Dokumente sind häufig Bilder, die mehr Speicherplatz benötigen als Datensätze, die die gleichen Informationen enthalten. Beispielsweise können Datensätze, die Daten aus 100.000 elektronischen Bilddokumenten darstellen, als Datensätze in einer Textdatei gespeichert werden. Die Größe einer solchen Textdatei wäre erheblich geringer als die Größe der 100.000 Bilder.Creating templates from electronic documents allows faster processing due to the structured nature of the templates created. For example, query and manipulation operations can be performed more efficiently on structured datasets than datasets lacking such a structure. When organizing information from electronic documents into structured records, the space required to store information contained in electronic documents can be significantly reduced. Electronic documents are often images that require more memory than data sets that contain the same information. For example, records representing data from 100,000 electronic image documents can be stored as records in a text file. The size of such a text file would be considerably smaller than the size of the 100,000 images.
Bei
Die Daten der erstellten Vorlage können mit entsprechenden Daten der Gruppe von elektronischen Probendokumenten direkt verglichen werden oder können mit einem oder mehreren repräsentativen Daten für die Gruppe von elektronischen Probendokumenten verglichen werden. Die repräsentativen Daten können einen Durchschnitt, eine Standardabweichung, einen Median, einen Modus und dergleichen enthalten, sind jedoch nicht darauf beschränkt.The data of the created template may be directly compared with corresponding data of the set of electronic sample documents or may be compared to one or more representative data for the group of electronic sample documents. The representative data may include, but is not limited to, an average, standard deviation, median, mode, and the like.
Die Daten der Vorlage für ein eingegebenes elektronisches Dokument können mit Daten einer oder mehrerer ausgewählter Gruppen von elektronischen Probendokumenten (z. B. einer aus einer Datenbank von elektronischen Probendokumenten ausgewählten Gruppe) verglichen werden, wodurch Auffälligkeiten in Bezug auf verschiedene normale Probendatenwerte identifiziert werden können. Zum Beispiel können Daten des eingegebenen elektronischen Dokuments mit einer ersten Gruppe von elektronischen Probendokumenten, die Transaktionen zeigen, die sich auf einen bestimmten Verkäufer beziehen, und mit einer zweiten Gruppe von elektronischen Probendokumenten verglichen werden, die Transaktionen für dasselbe Produkt zeigen.The input electronic document template data may be compared to data from one or more selected groups of electronic sample documents (eg, a group selected from a database of electronic sample documents), whereby abnormalities with respect to various normal sample data values may be identified. For example, data of the input electronic document may be compared with a first group of electronic sample documents showing transactions relating to a particular seller and a second group of electronic sample documents showing transactions for the same product.
Das Identifizieren von Auffälligkeiten in einem eingegebenen elektronischen Dokument auf der Grundlage von Daten von elektronischen Probendokumenten wird weiter unten unter Bezugnahme auf
Wenn bei S350 eine oder mehrere Auffälligkeiten identifiziert werden, wird eine Warnung erzeugt. Die Warnung kann die identifizierten Auffälligkeiten und das auffällige elektronische Eingabedokument anzeigen. Die Warnung kann zum Beispiel an das Unternehmenssystem
In
Als nicht einschränkendes Beispiel wird eine elektronische Rechnung erhalten, die den Kauf von Kakaobohnen durch eine Süßwarenfirma veranschaulicht. Es wird ein Datensatz mit einem für die Kakaobohnen bezahlten Betrag von 340 USD, einem Zeitstempel vom 9. Februar 2016 und dem Verkäufernamen „Bean Harvesters, Inc.“ erstellt. Der Datensatz wird analysiert, um die Transaktionsparameter im Datensatz zu bestimmen. Eine Vorlage mit den ermittelten Transaktionsparametern wird erstellt. Die Vorlage enthält die Felder „Kaufpreis“, „Kaufdatum“ und „Verkäufername“, wobei jedes Feld die jeweiligen Transaktionsparameter enthält, die sich auf den Preis von 340 USD beziehen, das Datum vom 9. Februar 2016 und den Namen „Bean Harvesters, Inc.“.By way of non-limiting example, an electronic bill is presented which illustrates the purchase of cocoa beans by a confectionery company. A record will be created with an amount of 340 USD paid for the cocoa beans, a time stamp dated 9 February 2016 and the seller's name "Bean Harvesters, Inc.". The record is analyzed to determine the transaction parameters in the record. A template with the determined transaction parameters is created. The template contains the "Purchase Price," "Purchase Date" and "Seller Name" fields, with each field containing the respective transaction parameters, which are related to the price of $ 340, the date of February 9, 2016 and the name "Bean Harvesters, Inc . ".
Der Preis von 340 USD wird mit einem Durchschnittspreis von 125 USD verglichen, der mit einer Gruppe elektronischer Probendokumente verbunden ist, die Käufe von Bean Harvesters im Dezember 2015 und Januar 2016 anzeigen. Die elektronischen Probendokumente enthalten Kaufpreise von 114 USD, 117 USD, 125 USD, 133 USD bzw. 136 USD. Auf der Grundlage des Vergleichs wird festgestellt, dass der Preis des Kaufs am 9. Februar 2016 über einem Schwellenwert von 100 USD vom Durchschnittspreis abweicht und dass daher ein ungewöhnlicher Preis festgestellt wurde. Es wird eine Warnmeldung generiert, die angibt, dass die Rechnung vom 9. Februar 2016 ungewöhnlich ist, und sie wird zur Überprüfung gesendet.The price of $ 340 is compared to an average price of $ 125 associated with a group of electronic sample documents showing purchases by Bean Harvesters in December 2015 and January 2016. The electronic sample documents include purchase prices of $ 114, $ 117, $ 125, $ 133 and $ 136, respectively. Based on the comparison, it is found that the price of the purchase on February 9, 2016 above a threshold of $ 100 deviates from the average price and therefore an unusual price was determined. A warning message is generated stating that the 9 February 2016 invoice is unusual and will be sent for review.
Bei
Bei
Bei
In einer weiteren Ausführungsform wird geprüft, ob die extrahierten Datenteile vollständig sind. Wenn beispielsweise der Händlername identifiziert werden kann, dessen Adresse jedoch fehlt, ist das Schlüsselfeld für die Händleradresse unvollständig. Es wird versucht, die fehlenden Schlüsselfeldwerte zu vervollständigen. Dieser Versuch kann die Abfrage externer Systeme und Datenbanken, die Korrelation mit zuvor analysierten Rechnungen oder eine Kombination davon umfassen. Beispiele für externe Systeme und Datenbanken können Geschäftsverzeichnisse, UPC-Datenbanken (Universal Product Code), Paketübermittlungs- und -verfolgungssysteme usw. sein. In einer Ausführungsform führt
Bei
Bei
In einer beispielhaften Implementierung kann jede abgerufene Gruppe von elektronischen Probendokumenten elektronische Dokumente enthalten, die sich auf denselben Händler beziehen, auf dieselbe Art von gekauften Waren oder Dienstleistungen, auf die Verwendung derselben Zahlungsmethode (z. B. einer bestimmten Kreditkartennummer), Zeiträumen, auf eine Kombination davon (zum Beispiel elektronische Dokumente, die die Käufe desselben Händlers in der ersten Woche jedes Monats anzeigen) und dergleichen. Der Vergleich von Daten eines eingegebenen elektronischen Dokuments mit Daten von elektronischen Probendokumenten, die gemeinsame Parameter verwenden, kann eine erhöhte Effizienz beim Erkennen von Auffälligkeiten ermöglichen, wenn der gemeinsame Parameter wahrscheinlich konsistente Probendaten anzeigt. Es kann zum Beispiel erwartet werden, dass Käufe desselben Händlers konsistent um den gleichen Preis liegen, so dass, wenn frühere Käufe von einem bestimmten Händler einen Durchschnittspreis von 1000 USD für das Unternehmen haben, ein Kaufpreis von 1400 USD von diesem Händler auf eine Auffälligkeit hinweisen kann. Die Daten des eingegebenen elektronischen Dokuments können mit Daten von mehreren Gruppen von elektronischen Probendokumenten verglichen werden, wodurch Auffälligkeiten in Bezug auf verschiedene potentielle Quellen von Auffälligkeiten und damit ein vollständigerer Satz von Auffälligkeiten für das elektronische Eingabedokument identifiziert werden kann.In an exemplary implementation, each retrieved set of electronic sample documents may contain electronic documents related to the same merchant, the same type of purchased goods or services, the use of the same payment method (eg, a particular credit card number), periods of time Combination thereof (for example, electronic documents indicating the same dealer's purchases in the first week of each month) and the like. Comparing data from an input electronic document with data from electronic sample documents using common parameters may allow for increased efficiency in detecting abnormalities when the common parameter is likely to indicate consistent sample data. For example, it can be expected that purchases from the same merchant will be consistently at the same price, so if previous purchases from a particular merchant have an average price of $ 1,000 for the company, a purchase price of $ 1,400 from that merchant will indicate an abnormality can. The data of the input electronic document can be compared with data from several groups of electronic sample documents, which can identify abnormalities regarding various potential sources of abnormalities and thus a more complete set of abnormalities for the electronic input document.
Zu diesem Zweck kann
Bei dem optionalen Schritt
Bei
Bei
Jede Auffälligkeit wird auf der Grundlage einer Abweichung eines Transaktionsparameters des eingegebenen elektronischen Dokuments von den Transaktionsparametern einer der Gruppen elektronischer Probendokumente über der Schwelle identifiziert. Die Schwelle kann ein Wert sein (z. B. eine Zahl, ein Wort, ein Zeichen usw.), ein Anteil und dergleichen. Die Abweichung kann basierend auf einer Abweichung von einem der Werte von einem der elektronischen Probendokumente bestimmt werden oder kann auf der Grundlage einer Abweichung von einem durchschnittlichen oder anderweitig repräsentativen Wert für die elektronischen Probendokumente bestimmt werden. Beispielsweise kann für durchschnittlich 2000 pro Monat bestellte Wassermelonen, wie in „Anzahl“-Feldern der elektronischen Probendokumente angegeben, eine Vorlage eines elektronischen Dokuments, die 10.000 Wassermelonen in einem „Mengen“-Feld angibt, eine Abweichung und somit eine Auffälligkeit anzeigen.Each conspicuousness is identified based on a deviation of a transaction parameter of the input electronic document from the transaction parameters of one of the groups of electronic sample documents above the threshold. The threshold may be a value (eg, a number, a word, a character, etc.), a share, and the like. The deviation may be determined based on a deviation from one of the values of one of the electronic sample documents, or may be determined based on a deviation from an average or otherwise representative value for the electronic sample documents. For example, for an average of 2000 watermelons ordered per month, as indicated in "number" fields of the electronic sample documents, a template of an electronic document indicating 10,000 watermelons in a "quantity" field may indicate a discrepancy and thus a conspicuousness.
Es sollte verstanden werden, dass jegliche Bezugnahme auf ein Element hierin unter Verwendung einer Bezeichnung wie „erste“, „zweite“ usw. die Menge oder Reihenfolge dieser Elemente im Allgemeinen nicht einschränkt. Vielmehr werden diese Bezeichnungen hier allgemein als zweckmäßige Methode zur Unterscheidung zwischen zwei oder mehr Elementen oder Instanzen eines Elements verwendet. Ein Verweis auf das erste und das zweite Element bedeutet also nicht, dass dort nur zwei Elemente verwendet werden dürfen oder dass das erste Element in gewisser Weise vor dem zweiten Element stehen muss. Sofern nicht anders angegeben, umfasst ein Satz von Elementen ein oder mehrere Elemente.It should be understood that any reference to an element herein using a term such as "first," "second," etc. generally does not limit the amount or order of those elements. Rather, these terms are generally used herein as a convenient method of distinguishing between two or more elements or instances of an element. A reference to the first and second elements therefore does not mean that only two elements may be used there, or that the first element must in some way be in front of the second element. Unless otherwise stated, a set of elements includes one or more elements.
Wie hierin verwendet, bedeutet der Ausdruck „mindestens einer von“ gefolgt von einer Auflistung von Elementen, dass jedes der aufgelisteten Elemente einzeln verwendet werden kann, oder es kann eine beliebige Kombination von zwei oder mehr der aufgelisteten Elemente verwendet werden. Wenn zum Beispiel beschrieben wird, dass ein System „mindestens eines von A, B und C“ umfasst, kann das System nur A enthalten; B allein; C allein; A und B in Kombination; B und C in Kombination; A und C in Kombination; oder A, B und C in Kombination.As used herein, the term "at least one of" followed by a list of elements means that each of the listed elements may be used individually, or any combination of two or more of the listed elements may be used. For example, when it is described that a system includes "at least one of A, B and C", the system can only contain A; B alone; C alone; A and B in combination; B and C in combination; A and C in combination; or A, B and C in combination.
Die verschiedenen hierin offenbarten Ausführungsformen können als Hardware, Firmware, Software oder eine beliebige Kombination davon implementiert werden. Darüber hinaus ist die Software vorzugsweise als ein Anwendungsprogramm implementiert, das auf einer Programmspeichereinheit oder einem computerlesbaren Medium, das aus Teilen oder bestimmten Geräten und/oder einer Kombination von Geräten besteht, konkret verkörpert ist. Das Anwendungsprogramm kann auf eine Maschine mit einer geeigneten Architektur hochgeladen und von dieser ausgeführt werden. Vorzugsweise ist die Maschine auf einer Computerplattform implementiert, die Hardware aufweist, wie beispielsweise eine oder mehrere zentrale Verarbeitungseinheiten („CPUs“), einen Speicher und Eingabe-/Ausgabeschnittstellen. Die Computerplattform kann auch ein Betriebssystem und einen Mikrobefehlscode enthalten. Die verschiedenen hier beschriebenen Verfahren und Funktionen können entweder Teil des Mikrobefehlscodes oder Teil des Anwendungsprogramms sein oder eine beliebige Kombination davon, die von einer CPU ausgeführt werden kann, unabhängig davon, ob ein solcher Computer oder Prozessor explizit gezeigt wird oder nicht. Zusätzlich können verschiedene andere periphere Einheiten mit der Computerplattform verbunden sein, beispielsweise eine zusätzliche Datenspeichereinheit und eine Druckeinheit. Darüber hinaus ist ein nichtflüchtiges computerlesbares Medium ein beliebiges computerlesbares Medium mit Ausnahme eines transitorischen Ausbreitungssignals.The various embodiments disclosed herein may be implemented as hardware, firmware, software, or any combination thereof. Moreover, the software is preferably implemented as an application program concretely embodied on a program storage device or computer readable medium consisting of parts or particular devices and / or a combination of devices. The application program can be uploaded to and executed by a machine with a suitable architecture. Preferably, the machine is implemented on a computer platform that includes hardware, such as one or more central processing units ("CPUs"), memory, and input / output interfaces. The computer platform may also include an operating system and a microcode. The various methods and functions described herein may be either part of the microcode or part of the application program, or any combination thereof that may be executed by a CPU, whether or not such computer or processor is explicitly shown. In addition, various other peripheral units may be connected to the computer platform, such as an additional data storage unit and a printing unit. In addition, a non-transitory computer readable medium is any computer readable medium except a transitory propagation signal.
Alle hier zitierten Beispiele und Konditionale sind für pädagogische Zwecke gedacht, um den Leser beim Verständnis der vom Erfinder zur Förderung des Standes der Technik beigetragenen Prinzipien der offenbarten Ausführungsform und der Konzepte zu unterstützen und sind ohne Beschränkung auf solche speziell genannten Beispiele und Bedingungen auszulegen. Darüber hinaus sollen alle hierin enthaltenen Aussagen, die Prinzipien, Aspekte und Ausführungsformen der offenbarten Ausführungsformen sowie spezifische Beispiele davon aufführen, sowohl strukturelle als auch funktionale Äquivalente davon umfassen. Außerdem ist beabsichtigt, dass solche Äquivalente sowohl gegenwärtig bekannte Äquivalente als auch in der Zukunft entwickelte Äquivalente umfassen, d. h. alle entwickelten Elemente, die unabhängig von der Struktur die gleiche Funktion erfüllen.All examples and conditions cited herein are for educational purposes to assist the reader in understanding the principles of the disclosed embodiment and concepts contributed by the inventor to promote the prior art, and are to be construed without limitation to such specific examples and conditions. In addition, all statements contained herein, embodying principles, aspects, and embodiments of the disclosed embodiments, as well as specific examples thereof, are intended to encompass both structural and functional equivalents thereof. In addition, it is intended that such equivalents include both currently known equivalents and equivalents developed in the future, i. H. all developed elements that perform the same function regardless of the structure.
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- US 62371234 [0001]US 62371234 [0001]
- US 15361934 [0001]US 15361934 [0001]
Claims (19)
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662371234P | 2016-08-05 | 2016-08-05 | |
US62/371,234 | 2016-08-05 | ||
US15/361,934 US20170154385A1 (en) | 2015-11-29 | 2016-11-28 | System and method for automatic validation |
US15/361,934 | 2016-11-28 | ||
PCT/US2017/045338 WO2018027054A1 (en) | 2016-08-05 | 2017-08-03 | Sytem and method for monitoring electronic documents |
Publications (1)
Publication Number | Publication Date |
---|---|
DE112017003926T5 true DE112017003926T5 (en) | 2019-04-18 |
Family
ID=61074187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE112017003926.6T Withdrawn DE112017003926T5 (en) | 2016-08-05 | 2017-08-03 | System and method for monitoring electronic documents |
Country Status (4)
Country | Link |
---|---|
CN (1) | CN109791560A (en) |
DE (1) | DE112017003926T5 (en) |
GB (1) | GB2568416A (en) |
WO (1) | WO2018027054A1 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009157592A (en) * | 2007-12-26 | 2009-07-16 | Canon It Solutions Inc | Abnormal transaction detector |
US20100161616A1 (en) * | 2008-12-16 | 2010-06-24 | Carol Mitchell | Systems and methods for coupling structured content with unstructured content |
US20120221448A1 (en) * | 2011-02-24 | 2012-08-30 | Vision InfoSoft Corporation | Method and system for detecting and addressing invoicing anomalies |
-
2017
- 2017-08-03 GB GB1902676.4A patent/GB2568416A/en not_active Withdrawn
- 2017-08-03 WO PCT/US2017/045338 patent/WO2018027054A1/en active Application Filing
- 2017-08-03 DE DE112017003926.6T patent/DE112017003926T5/en not_active Withdrawn
- 2017-08-03 CN CN201780060466.2A patent/CN109791560A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN109791560A (en) | 2019-05-21 |
WO2018027054A8 (en) | 2019-03-21 |
WO2018027054A1 (en) | 2018-02-08 |
GB201902676D0 (en) | 2019-04-17 |
GB2568416A (en) | 2019-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112016005443T5 (en) | System and method for automatic validation | |
US11062132B2 (en) | System and method for identification of missing data elements in electronic documents | |
US11138372B2 (en) | System and method for reporting based on electronic documents | |
US20170169292A1 (en) | System and method for automatically verifying requests based on electronic documents | |
US20170323157A1 (en) | System and method for determining an entity status based on unstructured electronic documents | |
EP3494495A1 (en) | System and method for completing electronic documents | |
US20180025225A1 (en) | System and method for generating consolidated data for electronic documents | |
US20180046663A1 (en) | System and method for completing electronic documents | |
DE112017003926T5 (en) | System and method for monitoring electronic documents | |
DE202018000271U1 (en) | Server device for processing transaction data | |
DE112017002535T5 (en) | Provide real-time analysis based on unstructured electronic documents | |
DE112016006434T5 (en) | SYSTEM AND METHOD FOR MAINTAINING DATA INTEGRITY | |
US20170323106A1 (en) | System and method for encrypting data in electronic documents | |
US20170169519A1 (en) | System and method for automatically verifying transactions based on electronic documents | |
DE112017002569T5 (en) | System and method for determining the status of a unit based on unstructured electronic documents | |
EP3494496A1 (en) | System and method for reporting based on electronic documents | |
WO2017201292A1 (en) | System and method for encrypting data in electronic documents | |
DE112017002533T5 (en) | System and method for generating historical data records on unstructured electronic documents | |
EP3417383A1 (en) | Automatic verification of requests based on electronic documents | |
US20170193609A1 (en) | System and method for automatically monitoring requests indicated in electronic documents | |
EP3458971A1 (en) | System and method for automatically monitoring requests indicated in electronic documents | |
WO2019140056A1 (en) | System and method for generating a reissue probability score for a transaction evidence | |
EP3430584A1 (en) | System and method for automatically verifying transactions based on electronic documents | |
EP3494531A1 (en) | System and method for generating consolidated data for electronic documents | |
EP3491554A1 (en) | Matching transaction electronic documents to evidencing electronic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |