DE112017003926T5 - System and method for monitoring electronic documents - Google Patents

System and method for monitoring electronic documents Download PDF

Info

Publication number
DE112017003926T5
DE112017003926T5 DE112017003926.6T DE112017003926T DE112017003926T5 DE 112017003926 T5 DE112017003926 T5 DE 112017003926T5 DE 112017003926 T DE112017003926 T DE 112017003926T DE 112017003926 T5 DE112017003926 T5 DE 112017003926T5
Authority
DE
Germany
Prior art keywords
electronic document
data
electronic
value
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112017003926.6T
Other languages
German (de)
Inventor
Noam Guzman
Isaac SAFT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vatbox Ltd
Original Assignee
Vatbox Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/361,934 external-priority patent/US20170154385A1/en
Application filed by Vatbox Ltd filed Critical Vatbox Ltd
Publication of DE112017003926T5 publication Critical patent/DE112017003926T5/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists

Abstract

Ein System und ein Verfahren zum Überwachen elektronischer Dokumente. Das Verfahren beinhaltet das Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument mindestens teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.A system and method for monitoring electronic documents. The method includes analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.

Description

Querverweis auf verwandte AnmeldungenCross-reference to related applications

Diese Anmeldung beansprucht die Priorität der vorläufigen US-Anmeldung Nr. 62/371 234 , eingereicht am 5. August 2016. Diese Anmeldung ist auch eine Teilfortführung der am 28. November 2016 eingereichten US-Anmeldung Nr. 15/361 934 , die jetzt anhängig ist. Der Inhalt der oben genannten Anmeldungen wird hiermit durch Bezugnahme aufgenommen.This application claims the priority of the provisional U.S. Application No. 62 / 371,234 , filed on August 5, 2016. This application is also a continuation of the submission filed on November 28, 2016 U.S. Application No. 15 / 361,934 which is now pending. The content of the above applications is hereby incorporated by reference.

Technischer BereichTechnical part

Die vorliegende Offenbarung bezieht sich allgemein auf die Überwachung von Dateien in Datensystemen und insbesondere auf das Identifizieren von Auffälligkeiten in elektronischen Dokumenten.The present disclosure relates generally to the monitoring of files in data systems, and more particularly to the identification of abnormalities in electronic documents.

Hintergrundbackground

Aufgrund des rasanten technologischen Wachstums in den letzten Jahrzehnten ist die Kommunikation zwischen Menschen auf der ganzen Welt immer schneller und bequemer geworden. Daher können Transaktionen, die zuvor über Tage oder Wochen abgewickelt wurden, nun in Sekundenschnelle abgeschlossen werden. Ein Unternehmen kann jetzt Tausende oder Millionen Transaktionen pro Jahr abschließen. Einige dieser Transaktionen können wichtige Großtransaktionen sein.Due to rapid technological growth in recent decades, communication between people around the world has become faster and more convenient. As a result, transactions previously completed over days or weeks can now be completed in seconds. A business can now complete thousands or millions of transactions each year. Some of these transactions can be major transactions.

Da Unternehmen zunehmend auf Technologien angewiesen sind, um Daten zu verwalten, die sich auf Vorgänge beziehen, wie etwa Rechnungs- und Bestelldaten, sind geeignete Systeme für die ordnungsgemäße Verwaltung und Validierung von Daten für den Erfolg von entscheidender Bedeutung. Insbesondere für große Unternehmen kann die von Unternehmen täglich genutzte Datenmenge überwältigend sein. Dementsprechend sind eine manuelle Überprüfung und Validierung solcher Daten bestenfalls nicht praktikabel. Unterschiede zwischen Aufzeichnungsunterlagen können jedoch zu erheblichen Problemen für die Unternehmen führen, wie zum Beispiel Fehler bei der ordnungsgemäßen Meldung von Gewinnen an die Steuerbehörden.As companies increasingly rely on technologies to manage data related to operations, such as billing and ordering data, appropriate systems for the proper management and validation of data are critical to success. Especially for large companies, the amount of data that companies use every day can be overwhelming. Accordingly, manual verification and validation of such data is at best impractical. Differences between records, however, can cause significant problems for companies, such as errors in the proper reporting of profits to the tax authorities.

Daher ist es für Unternehmen äußerst wünschenswert, Auffälligkeiten in den Unternehmensunterlagen schnell zu erkennen und zu beheben. Dieses Problem kann besonders schwierig sein, wenn ein Unternehmen mehrere Anbieter zur Bereitstellung von Dienstleistungen und Waren verwendet, da Datensätze von verschiedenen Anbietern unterschiedliche Informationen enthalten können, anders formatiert sein können, Fehler oder plötzliche Preisänderungen enthalten können und dergleichen. Ferner kann das Erkennen von Auffälligkeiten eine Herausforderung darstellen, wenn Unternehmensdatensätze in unstrukturierten Datenformaten empfangen werden. Beispielsweise werden Rechnungen häufig als Bilddateien empfangen, die einen Rechnungsscan zeigen.Therefore, it is highly desirable for businesses to quickly identify and resolve issues in their corporate records. This problem can be particularly difficult when a company uses multiple providers to provide services and goods because records from different providers may contain different information, may be otherwise formatted, may include errors or sudden price changes, and the like. Furthermore, detecting abnormalities can be challenging when receiving business records in unstructured data formats. For example, invoices are often received as image files that show a bill scan.

Es gibt einige Lösungen zum automatischen Erkennen von Informationen in gescannten Dokumenten (z. B. Rechnungen und Quittungen) oder anderen unstrukturierten elektronischen Dokumenten (z. B. unstrukturierten Textdateien). Solche Lösungen stehen häufig vor der Herausforderung, Zeichen und andere Merkmale elektronischer Dokumente genau zu identifizieren und zu erkennen. Darüber hinaus führt eine inhaltliche Verschlechterung der eingegebenen unstrukturierten elektronischen Dokumente typischerweise zu höheren Fehlerraten. Infolgedessen sind bestehende Bilderkennungstechniken unter idealen Umständen (d. h. sehr klare Bilder) nicht vollständig genau, und ihre Genauigkeit nimmt oft drastisch ab, wenn die Eingabebilder weniger klar sind. Darüber hinaus können fehlende oder anderweitig unvollständige Daten zu Fehlern bei der späteren Verwendung der Daten führen. Viele bestehende Lösungen können fehlende Daten nicht identifizieren, es sei denn, ein Feld in einem strukturierten Datensatz ist unvollständig.There are some solutions for automatically detecting information in scanned documents (eg, invoices and receipts) or other unstructured electronic documents (eg, unstructured text files). Such solutions often face the challenge of accurately identifying and recognizing characters and other features of electronic documents. In addition, content degradation of the input unstructured electronic documents typically results in higher error rates. As a result, existing image recognition techniques are not completely accurate under ideal circumstances (i.e., very clear images), and their accuracy often decreases dramatically when the input images are less clear. In addition, missing or otherwise incomplete data can lead to errors in the subsequent use of the data. Many existing solutions can not identify missing data unless a field in a structured record is incomplete.

Außerdem können bestehende Bilderkennungslösungen möglicherweise einige oder alle Sonderzeichen nicht genau identifizieren (z. B. „!“, „@“, „#“, „$“,„©", „%“, „&“ usw. Beispielsweise können einige vorhandene Bilderkennungslösungen einen in einem gescannten Beleg enthaltenen Strich ungenau als Zahl „1“ identifizieren. Als ein anderes Beispiel können einige bestehende Bilderkennungslösungen keine Sonderzeichen wie das Dollarzeichen, das Yen-Symbol usw. erkennen.Also, existing image recognition solutions may not be able to pinpoint some or all special characters (for example, "!", "@", "#", "$", "©", "%", "&" etc.) Image recognition solutions may incorrectly identify a line contained in a scanned document as a number "1." As another example, some existing image recognition solutions may not recognize special characters such as the dollar sign, the yen symbol, and so on.

Ferner können solche Lösungen vor Herausforderungen stehen, wenn erkannte Informationen für die spätere Verwendung aufbereitet werden. Insbesondere erzeugen viele dieser Lösungen entweder eine Ausgabe in einem unstrukturierten Format oder können nur eine strukturierte Ausgabe erzeugen, wenn die eingegebenen elektronischen Dokumente speziell für die Erkennung durch ein Bilderkennungssystem formatiert sind. Die resultierende unstrukturierte Ausgabe kann normalerweise nicht effizient verarbeitet werden. Eine solche unstrukturierte Ausgabe kann insbesondere Duplikate enthalten und kann Daten enthalten, die vor der Verwendung einer nachfolgenden Verarbeitung bedürfen.Furthermore, such solutions can be challenging if recognized information is prepared for later use. In particular, many of these solutions either produce an output in an unstructured format or can only produce a structured output if the input electronic documents are formatted specifically for recognition by an image recognition system. The resulting unstructured output usually can not be processed efficiently. In particular, such unstructured output may contain duplicates and may include data that requires subsequent processing prior to use.

Es wäre daher vorteilhaft, eine Lösung bereitzustellen, die die Mängel des Standes der Technik überwindet.It would therefore be advantageous to provide a solution that overcomes the deficiencies of the prior art.

Zusammenfassung Summary

Es folgt eine Zusammenfassung mehrerer beispielhafter Ausführungsformen der Offenbarung. Diese Zusammenfassung wird zur Erleichterung für den Leser bereitgestellt, um ein grundlegendes Verständnis solcher Ausführungsformen zu vermitteln, und definiert nicht den Umfang der Offenbarung vollständig. Diese Zusammenfassung ist kein umfassender Überblick über alle in Betracht gezogenen Ausführungsformen und soll weder Schlüssel- oder kritische Elemente aller Ausführungsformen identifizieren, noch den Umfang einiger oder aller Aspekte abgrenzen. Ihr einziger Zweck ist es, einige Konzepte einer oder mehrerer Ausführungsformen in einer vereinfachten Form als Auftakt für die ausführlichere Beschreibung darzustellen, die später präsentiert wird. Der Einfachheit halber kann der Begriff „einige Ausführungsformen“ hierin verwendet werden, um sich auf eine einzelne Ausführungsform oder mehrere Ausführungsformen der Offenbarung zu beziehen.The following is a summary of several exemplary embodiments of the disclosure. This summary is provided to the convenience of the reader to provide a basic understanding of such embodiments, and does not fully define the scope of the disclosure. This summary is not a comprehensive overview of all contemplated embodiments and is not intended to identify key or critical elements of all embodiments, nor to limit the scope of some or all aspects. Its sole purpose is to present some concepts of one or more embodiments in a simplified form as a prelude to the more detailed description presented later. For the sake of simplicity, the term "some embodiments" may be used herein to refer to a single embodiment or multiple embodiments of the disclosure.

Bestimmte hierin offenbarte Ausführungsformen umfassen ein Verfahren zum Überwachen elektronischer Dokumente. Das Verfahren umfasst: Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument mindestens teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.Certain embodiments disclosed herein include a method for monitoring electronic documents. The method comprises: analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.

Bestimmte hierin offenbarte Ausführungsformen umfassen auch ein nichtflüchtiges computerlesbares Medium, auf dem Anweisungen gespeichert sind, um eine Verarbeitungsschaltung zur Durchführung eines Verfahrens zu veranlassen, wobei das Verfahren aufweist: Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument zumindest teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.Certain embodiments disclosed herein also include a non-transitory computer-readable medium having stored thereon instructions for causing a processing circuit to perform a method, the method comprising: analyzing a first electronic document to determine at least one transaction parameter, wherein the first electronic document contains at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.

Bestimmte hierin offenbarte Ausführungsformen umfassen auch ein System zum Überwachen elektronischer Dokumente. Das System weist auf: eine Verarbeitungsschaltung; und einen Speicher, wobei der Speicher Anweisungen enthält, die, wenn sie von der Verarbeitungsschaltung ausgeführt werden, das System so konfigurieren, dass: ein erstes elektronisches Dokument analysiert wird, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument zumindest teilweise unstrukturierte Daten enthält; eine Vorlage für das erste elektronische Dokument erstellt wird, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Daten der erstellten Vorlage mit Daten verglichen werden, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.Certain embodiments disclosed herein also include a system for monitoring electronic documents. The system includes: a processing circuit; and a memory, the memory including instructions that, when executed by the processing circuitry, configure the system to: analyze a first electronic document to determine at least one transaction parameter, the first electronic document at least partially unstructured data contains; creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document.

Figurenlistelist of figures

Der hierin offenbarte Gegenstand wird in den Ansprüchen am Ende der Beschreibung besonders hervorgehoben und ausdrücklich beansprucht. Die vorstehenden und andere Ziele, Merkmale und Vorteile der offenbarten Ausführungsformen werden aus der folgenden detaillierten Beschreibung in Verbindung mit den beigefügten Zeichnungen ersichtlich werden.

  • 1 ist ein Netzwerkdiagramm, das zur Beschreibung der verschiedenen offenbarten Ausführungsformen verwendet wird.
  • 2 ist ein schematisches Diagramm eines Validierungssystems gemäß einer Ausführungsform.
  • 3 ist ein Flussdiagramm, das ein Verfahren zum Überwachen elektronischer Dokumente gemäß einer Ausführungsform darstellt.
  • 4 ist ein Flussdiagramm, das ein Verfahren zum Erstellen eines Datensatzes basierend auf mindestens einem elektronischen Dokument gemäß einer Ausführungsform darstellt.
  • 5 ist ein Flussdiagramm, das ein Verfahren zum Identifizieren von Auffälligkeiten gemäß einer Ausführungsform basierend auf einer Vorlage darstellt, die für ein elektronisches Eingabedokument erstellt wurde.
The subject matter disclosed herein is particularly pointed out and expressly claimed in the claims at the end of this specification. The foregoing and other objects, features and advantages of the disclosed embodiments will become apparent from the following detailed description taken in conjunction with the accompanying drawings.
  • 1 FIG. 10 is a network diagram used to describe the various disclosed embodiments. FIG.
  • 2 FIG. 12 is a schematic diagram of a validation system according to an embodiment. FIG.
  • 3 FIG. 10 is a flowchart illustrating a method of monitoring electronic documents according to an embodiment. FIG.
  • 4 FIG. 10 is a flow chart illustrating a method of creating a data set based on at least one electronic document according to an embodiment.
  • 5 FIG. 10 is a flowchart illustrating a method for identifying abnormalities according to an embodiment based on a template created for an input electronic document.

Detaillierte BeschreibungDetailed description

Es ist wichtig anzumerken, dass die hierin offenbarten Ausführungsformen nur Beispiele für die vielen vorteilhaften Verwendungen der innovativen Lehren hierin sind. Im Allgemeinen beschränken Aussagen, die in der Beschreibung der vorliegenden Anmeldung gemacht werden, nicht notwendigerweise eine der verschiedenen beanspruchten Ausführungsformen. Darüber hinaus können einige Aussagen auf einige erfinderische Merkmale zutreffen, jedoch nicht auf andere. Sofern nichts anderes angegeben ist, können Singularelemente im Allgemeinen im Plural stehen und umgekehrt, ohne dass die Allgemeinheit dadurch beeinträchtigt wird. In den Zeichnungen beziehen sich gleiche Zahlensymbole in mehreren Ansichten auf gleiche Teile.It is important to note that the embodiments disclosed herein are only examples of the many beneficial uses of the innovative teachings herein. In general, statements made in the description of the present application do not necessarily limit one of the various claimed embodiments. In addition, some statements may apply to some inventive features, but not to others. Unless otherwise stated, In general, singular elements can be plural and vice versa, without affecting the general public. In the drawings, like numerals refer to like parts in several views.

Die verschiedenen offenbarten Ausführungsformen umfassen ein Verfahren und ein System zum Überwachen elektronischer Dokumente. Die hierin offenbarten Ausführungsformen können verwendet werden, um Auffälligkeiten in den überwachten elektronischen Dokumenten zu erkennen und zu korrigieren. In einer Ausführungsform wird ein Datensatz basierend auf einem ersten elektronischen Eingabedokument erstellt. Das elektronische Eingabedokument enthält Daten einer Transaktion und kann unstrukturierte Daten enthalten. Eine Vorlage für Transaktionsattribute wird basierend auf dem Datensatz des elektronischen Eingabedokuments erstellt. Daten der Vorlage, die für das elektronische Eingabedokument erstellt wurde, werden mit Daten von zweiten elektronischen Probendokumenten verglichen. Basierend auf dem Vergleich können eine oder mehrere Auffälligkeiten in Datenwerten identifiziert werden. Es kann eine Warnung ausgegeben werden, die auf die Auffälligkeiten hinweist.The various disclosed embodiments include a method and system for monitoring electronic documents. The embodiments disclosed herein may be used to detect and correct for abnormalities in the monitored electronic documents. In one embodiment, a record is created based on a first electronic input document. The electronic input document contains data of a transaction and may contain unstructured data. A template for transaction attributes is created based on the record of the electronic input document. Data from the template created for the electronic input document is compared with data from second electronic sample documents. Based on the comparison, one or more abnormalities in data values can be identified. A warning can be issued indicating the abnormalities.

Die offenbarten Ausführungsformen ermöglichen eine automatische Erkennung von Auffälligkeiten beispielsweise in neu eingegangenen Rechnungen. Insbesondere umfassen die offenbarten Ausführungsformen das Bereitstellen strukturierter Datensatzvorlagen für elektronische Dokumente, wodurch ein effizienter und genauer Vergleich von Daten ermöglicht wird, die in elektronischen Dokumenten enthalten sind, die unstrukturiert, halbstrukturiert sind oder denen sonst eine bekannte Struktur fehlt. Ferner ermöglichen die für die elektronischen Dokumente erstellten Vorlagen effizientere Vergleiche bestimmter Datensätze, da Vergleiche auf Vergleiche zwischen bestimmten Feldern der Vorlagen beschränkt sein können. Beispielsweise können Daten in einem „Zeit“-Feld einer Vorlage mit Daten in „Zeit“-Feldern anderer Vorlagen verglichen werden, ohne dass ein Vergleich mit anderen Daten erforderlich ist.The disclosed embodiments enable automatic detection of abnormalities, for example, in newly received invoices. In particular, the disclosed embodiments include providing structured record templates for electronic documents, thereby enabling efficient and accurate comparison of data contained in electronic documents that are unstructured, semi-structured, or otherwise lacking a known structure. Furthermore, the templates created for the electronic documents allow for more efficient comparisons of particular records since comparisons may be limited to comparisons between certain fields of the templates. For example, data in a "time" field of one template can be compared to data in "time" fields of other templates, without the need for comparison with other data.

1 zeigt ein beispielhaftes Netzwerkdiagramm 100, das zum Beschreiben der verschiedenen offenbarten Ausführungsformen verwendet wird. In dem beispielhaften Netzwerkdiagramm 100 sind eine elektronische Dokumentenüberwachung 120, ein Unternehmenssystem 130, eine Datenbank 140 und mehrere Datenquellen 150-1 bis 150-N (im Folgenden lediglich zur Vereinfachung einzeln als Datenquelle 150 und gemeinsam als Datenquellen 150 bezeichnet) über ein Netzwerk 110 kommunikativ verbunden. Das Netzwerk 110 kann ein drahtloses, zellulares oder drahtgebundenes Netzwerk, ein lokales Netzwerk (LAN), ein WAN (Wide Area Network), ein Metro Area Network (MAN), das Internet, das World Wide Web (WWW), ähnliche Netzwerke und Kombinationen hiervon sein, ist jedoch nicht darauf beschränkt. 1 shows an exemplary network diagram 100 , which is used to describe the various disclosed embodiments. In the example network diagram 100 are an electronic document surveillance 120 , a business system 130 , a database 140 and multiple data sources 150 - 1 to 150 N (hereinafter for the sake of simplicity, as a data source in the following 150 and together as data sources 150 designated) over a network 110 communicatively connected. The network 110 may be a wireless, cellular or wired network, a local area network (LAN), a wide area network (WAN), a metro area network (MAN), the Internet, the World Wide Web (WWW), similar networks and combinations thereof, but is not limited to this.

Das Unternehmenssystem 130 ist einem Unternehmen zugeordnet und kann Daten speichern, die sich auf Käufe beziehen, die von dem Unternehmen oder Vertretern des Unternehmens getätigt werden, sowie Daten, die sich auf das Unternehmen selbst beziehen. Das Unternehmen kann ein Unternehmen sein, ist aber nicht darauf beschränkt, dessen Angestellte Waren und Dienstleistungen erwerben können, die im Ausland der Mehrwertsteuer unterliegen. Das Unternehmenssystem 130 kann ein Server, eine Datenbank, ein Unternehmensressourcenplanungssystem, ein Kundenbeziehungsverwaltungssystem oder ein beliebiges anderes System, das relevante Daten speichert, sein, ist aber nicht darauf beschränkt.The company system 130 is associated with a company and may store data related to purchases made by the company or its representatives, as well as data relating to the company itself. The enterprise may be, but is not limited to, a company whose employees may purchase goods and services subject to VAT abroad. The company system 130 For example, but not limited to, a server, a database, a corporate resource planning system, a customer relationship management system, or any other system storing relevant data.

Die von dem Unternehmenssystem 130 gespeicherten Daten können elektronische Dokumente enthalten, sind jedoch nicht darauf beschränkt, (z. B. eine Bilddatei, die beispielsweise einen Scan einer Rechnung, eine Textdatei, eine Tabellendatei usw. zeigt). Jedes elektronische Dokument kann beispielsweise eine Rechnung, einen Steuerbeleg, einen Kaufnummerndatensatz, eine MwSt.-Rückforderungsanforderung und dergleichen enthalten. In jedem elektronischen Dokument enthaltene Daten können strukturiert, halbstrukturiert, unstrukturiert oder eine Kombination davon sein. Die strukturierten oder halbstrukturierten Daten können in einem Format vorliegen, das von der Überwachung 120 für elektronische Dokumente nicht erkannt wird, und können daher als unstrukturierte Daten behandelt werden.The of the enterprise system 130 stored data may include, but is not limited to, electronic documents (eg, an image file showing, for example, a scan of an invoice, a text file, a spreadsheet file, etc.). Each electronic document may include, for example, an invoice, a tax receipt, a purchase number record, a VAT reclaim request, and the like. Data contained in each electronic document may be structured, semi-structured, unstructured or a combination thereof. The structured or semi-structured data may be in a format that is subject to surveillance 120 is not recognized for electronic documents and can therefore be treated as unstructured data.

Die Datenbank 140 kann Vorlagen speichern, die für elektronische Dokumente erstellt wurden, sowie historische Daten, die sich auf Probendaten beziehen, und Auffälligkeitsdaten, die Abweichungen von Probendaten angeben, die von der Überwachung 120 für elektronische Dokumente identifiziert werden.Database 140 can store templates created for electronic documents, as well as historical data related to sample data and abnormality data indicating deviations from sample data from monitoring 120 be identified for electronic documents.

Die Datenquellen 150 speichern mindestens elektronische Dokumente, die als Nachweis für die Bewilligungsanfragen verwendet werden können. Die Datenquellen 150 können Server oder Geräte von Händlern, Steuerbehörden-Server, Abrechnungsserver, eine einem Unternehmen zugeordnete Datenbank und dergleichen umfassen, sind jedoch nicht darauf beschränkt. Als ein nicht einschränkendes Beispiel kann die Datenquelle 150-1 ein Händlerserver sein, der Bilddateien speichert, die Rechnungen für Transaktionen zeigen, die von einem Händler ausgeführt wurden, der dem Händlerserver zugeordnet ist.The data sources 150 store at least electronic documents that can be used as proof of grant requests. The data sources 150 may include, but are not limited to, resellers' servers or devices, tax authority servers, billing servers, a database associated with a business, and the like. As a non-limiting example, the data source 150 - 1 a merchant server storing image files showing invoices for transactions made by a merchant associated with the merchant server.

In einer Ausführungsform ist die Überwachung 120 für elektronische Dokumente so konfiguriert, dass sie eine Vorlage auf der Grundlage von Transaktionsparametern erstellt, die unter Verwendung einer Bildverarbeitung eines ersten elektronischen Eingabedokuments identifiziert werden, das Informationen angibt, die sich auf eine Transaktion beziehen. Jede Vorlage enthält ein oder mehrere Felder und entsprechende Schlüsselwerte, die im analysierten elektronischen Dokument identifiziert wurden. Zu diesem Zweck kann die Überwachung 120 für elektronische Dokumente so konfiguriert sein, dass sie das eingegebene elektronische Dokument beispielsweise von einer der Datenquellen 150 oder dem Unternehmenssystem 130 abruft. Die Überwachung 120 für elektronische Dokumente ist so konfiguriert, dass sie Daten der erstellten Vorlage mit Daten von elektronischen Dokumenten einer zweiten Probe vergleicht. Die Daten der zweiten elektronischen Probendokumente können in Vorlagen enthalten sein, die für die elektronischen Probendokumente erstellt wurden. Somit kann der Vergleich in Bezug auf Daten bestimmter Felder in den Vorlagen vorgenommen werden.In one embodiment, the monitoring is 120 for electronic documents like that configured to create a template based on transaction parameters identified using image processing of a first electronic input document indicating information related to a transaction. Each template contains one or more fields and corresponding key-values identified in the analyzed electronic document. For this purpose, the monitoring 120 for electronic documents to be configured to retrieve the input electronic document from, for example, one of the data sources 150 or the enterprise system 130 retrieves. The supervision 120 for electronic documents is configured to compare data of the created template with data from electronic documents of a second sample. The data of the second electronic sample documents may be included in templates created for the electronic sample documents. Thus, the comparison can be made with respect to data of certain fields in the templates.

Basierend auf dem Vergleich ist die Überwachung 120 für elektronische Dokumente konfiguriert, Auffälligkeiten in Datenwerten des elektronischen Eingabedokuments zu identifizieren. Beispielsweise kann eine Auffälligkeit ein ungewöhnlicher Wert für den in den elektronischen Eingabedokumenten angegebenen Preis sein, verglichen mit den in den elektronischen Probendokumenten angegebenen Preisen. Die Auffälligkeiten können durch Bestimmen von Abweichungen von Datenwerten des eingegebenen elektronischen Dokuments von beispielsweise Durchschnittswerten der elektronischen Probendokumente über einem Schwellenwert identifiziert werden. Die Schwelle kann eine vorbestimmte Schwelle sein und kann ein Schwellenwert sein (eine Zahl, ein Zeichen oder ein Wort) oder kann ein Schwellenwertanteil sein (z. B. plus oder minus 5 % des Durchschnitts).Based on the comparison is the monitoring 120 for electronic documents configured to identify abnormalities in data values of the electronic input document. For example, an abnormality may be an unusual value for the price specified in the electronic input documents compared to the prices given in the electronic sample documents. The abnormalities may be identified by determining deviations of data values of the input electronic document from, for example, average values of the electronic sample documents above a threshold. The threshold may be a predetermined threshold and may be a threshold (a number, a character or a word) or may be a threshold proportion (eg, plus or minus 5% of the average).

In einer Ausführungsform ist die Überwachung 120 für elektronische Dokumente konfiguriert, Datensätze basierend auf elektronischen Dokumenten zu erstellen, die Daten enthalten, denen zumindest teilweise eine bekannte Struktur fehlt (z. B. unstrukturierte Daten, halbstrukturierte Daten oder strukturierte Daten mit einer unbekannten Struktur). Zu diesem Zweck kann die Überwachung 120 für elektronische Dokumente ferner konfiguriert sein, eine optische Zeichenerkennung (OCR) oder eine andere Bildverarbeitung zu verwenden, um Daten in dem elektronischen Dokument zu bestimmen. Die elektronische Dokumentenüberwachung 120 kann daher einen Erkennungsprozessor (z. B. den Erkennungsprozessor 235, 2) enthalten oder kommunikativ damit verbunden sein.In one embodiment, the monitoring is 120 for electronic documents, to create records based on electronic documents that contain data that at least partially lacks a known structure (eg, unstructured data, semi-structured data, or structured data having an unknown structure). For this purpose, the monitoring 120 for electronic documents, further configured to use optical character recognition (OCR) or other image processing to determine data in the electronic document. The electronic document monitoring 120 Therefore, a recognition processor (eg, the recognition processor 235 . 2 ) or communicate with it.

Die elektronische Dokumentenüberwachung 120 ist konfiguriert, die erzeugten Datensätze zu analysieren, um Transaktionsparameter zu identifizieren, die sich auf Transaktionen beziehen, die in den elektronischen Dokumenten angegeben sind. Basierend auf den Transaktionsparametern der erstellten Datensätze ist die Überwachung für elektronische Dokumente so konfiguriert, dass für jedes analysierte elektronische Dokument eine Vorlage erstellt wird. Jede Vorlage ist ein strukturierter Datensatz mit den identifizierten Transaktionsparametern für eine Transaktion.The electronic document monitoring 120 is configured to analyze the generated records to identify transaction parameters related to transactions specified in the electronic documents. Based on the transaction parameters of the created records, electronic document monitoring is configured to create a template for each analyzed electronic document. Each template is a structured record containing the identified transaction parameters for a transaction.

Die Verwendung strukturierter Vorlagen zum Erkennen von Auffälligkeiten ermöglicht eine effizientere und genauere Identifizierung von Auffälligkeiten als beispielsweise durch Verwendung unstrukturierter Daten. Insbesondere können Teile eines eingegebenen elektronischen Dokuments nur mit entsprechenden Teilen von elektronischen Probendokumenten (z. B. in bestimmten Feldern einer strukturierten Vorlage enthaltenen Teilen) verglichen werden, wodurch die zu vergleichende Datenmenge sowie falsche positive Ergebnisse infolge des Vergleichs nicht zusammenhängender Daten reduziert werden. Darüber hinaus benötigen aus elektronischen Dokumenten extrahierte und in Vorlagen organisierte Daten weniger Speicher als beispielsweise Bilder gescannter Dokumente.The use of structured templates to detect abnormalities enables more efficient and accurate identification of abnormalities than, for example, by using unstructured data. In particular, parts of an input electronic document can only be compared to corresponding parts of electronic sample documents (eg, parts contained in certain fields of a structured template), thereby reducing the amount of data to be compared and false positives due to the comparison of non-contiguous data. In addition, data extracted from electronic documents and organized into templates require less memory than, for example, images of scanned documents.

Basierend auf der Vorlage, die für das eingegebene elektronische Dokument erstellt wurde, kann die Überwachung 120 für elektronische Dokumente so konfiguriert sein, dass sie die zu vergleichenden elektronischen Probendokumente abruft. Das Abrufen der elektronischen Probendokumente kann das Suchen in dem Unternehmenssystem 130 basierend auf Daten in der Vorlage des elektronischen Eingabedokuments umfassen. Als nicht einschränkendes Beispiel können, wenn Daten in der Vorlage des elektronischen Eingabedokuments einen Kauf von einem bestimmten Verkäufer anzeigen, die elektronischen Probendokumente durch Suchen in Bezug auf den Verkäufer abgerufen werden. Wenn in einem anderen nicht einschränkenden Beispiel Daten in der Vorlage des eingegebenen elektronischen Dokuments einen Kauf eines bestimmten Warentyps anzeigen, können die elektronischen Probendokumente durch Suchen in Bezug auf den Warentyp abgerufen werden.Based on the template that was created for the entered electronic document, the monitoring 120 for electronic documents to be configured to retrieve the electronic sample documents to be compared. Retrieving the electronic sample documents may be searching in the enterprise system 130 based on data in the template of the electronic input document. As a non-limiting example, when data in the template of the electronic input document indicates a purchase from a particular seller, the electronic sample documents may be retrieved by searching for the seller. In another non-limiting example, if data in the template of the input electronic document indicates a purchase of a particular commodity type, the electronic sample documents may be retrieved by searching for the commodity type.

In noch einer anderen Ausführungsform kann die Überwachung 120 für elektronische Dokumente ferner konfiguriert sein, das eingegebene elektronische Dokument basierend auf der erstellten Vorlage für das eingegebene elektronische Dokument zu validieren. Die Validierung kann umfassen, ist jedoch nicht beschränkt auf, das Bestimmen, ob jedes der eingegebenen elektronischen Dokumente vollständig ist.In yet another embodiment, the monitoring 120 for electronic documents, further configured to validate the input electronic document based on the created template for the input electronic document. The validation may include, but is not limited to, determining whether each of the input electronic documents is complete.

Das eingegebene elektronische Dokument kann als vollständig bestimmt werden, wenn zum Beispiel ein oder mehrere vorbestimmte erforderliche Felder der Vorlage Daten enthalten. Beispielsweise kann das elektronische Eingabedokument vollständig sein, wenn mindestens eine Zeit, eine Verkäufer-ID und ein Preisfeld der für das elektronische Eingabedokument erstellten Vorlage Daten enthalten. The input electronic document may be determined to be complete if, for example, one or more predetermined required fields of the template contain data. For example, if at least one time, a seller ID, and a price field of the template created for the electronic input document contain data, the electronic input document may be complete.

Es sei darauf hingewiesen, dass die Ausführungsformen, die hierin oben mit Bezug auf 1 beschrieben wurden, in Bezug auf ein Unternehmenssystem 130 lediglich zur Vereinfachung und ohne Einschränkung der offenbarten Ausführungsformen beschrieben sind. Mehrere Unternehmenssysteme können gleichermaßen verwendet werden, ohne vom Umfang der Offenbarung abzuweichen. Verschiedene Gruppen von Probendokumenten können für verschiedene Unternehmen verwendet werden, wodurch die Genauigkeit und Sicherheit der Datenvergleiche sichergestellt wird.It should be noted that the embodiments described hereinabove with reference to FIG 1 described in relation to a business system 130 are described for simplicity and without limitation of the disclosed embodiments. Multiple enterprise systems may be equally used without departing from the scope of the disclosure. Different groups of sample documents can be used for different companies, ensuring the accuracy and security of data comparisons.

2 ist ein beispielhaftes schematisches Diagramm der elektronischen Dokumentenüberwachung 120 gemäß einer Ausführungsform. Die elektronische Dokumentenüberwachung 120 umfasst eine Verarbeitungsschaltung 210, die mit einem Speicher 215, einem Massenspeicher 220 und einer Netzwerkschnittstelle 240 gekoppelt ist. In einer Ausführungsform kann die Überwachung 120 für elektronische Dokumente einen Prozessor für eine optische Zeichenerkennung (OCR) 230 enthalten. Die Komponenten der elektronischen Dokumentenüberwachung 120 können über einen Bus 250 kommunikativ verbunden sein. 2 is an exemplary schematic diagram of electronic document monitoring 120 according to one embodiment. The electronic document monitoring 120 includes a processing circuit 210 that with a memory 215 , a mass storage 220 and a network interface 240 is coupled. In one embodiment, the monitoring 120 for electronic documents an optical character recognition (OCR) processor 230 contain. The components of electronic document monitoring 120 can over a bus 250 be communicatively connected.

Die Verarbeitungsschaltung 210 kann als eine oder mehrere Hardwarelogikkomponenten und -schaltungen realisiert sein. Beispielsweise und ohne Einschränkung umfassen veranschaulichende Typen von Hardwarelogikkomponenten, die verwendet werden können, feldprogrammierbare Gate-Arrays (FPGAs), anwendungsspezifische integrierte Schaltungen (ASICs), anwendungsspezifische Standardprodukte (ASSPs), System-on-a-Chip-Systeme (SOCs), Allzweck-Mikroprozessoren, Mikrocontroller, digitale Signalprozessoren (DSPs) und dergleichen oder beliebige andere Hardwarelogikkomponenten, die Berechnungen oder andere Manipulationen von Informationen durchführen können.The processing circuit 210 may be implemented as one or more hardware logic components and circuits. By way of example and not limitation, illustrative types of hardware logic components that may be used include field programmable gate arrays (FPGAs), application specific integrated circuits (ASICs), application specific standard products (ASSPs), system on a chip systems (SOCs), general purpose Micro-processors, microcontrollers, digital signal processors (DSPs) and the like or any other hardware logic components that can perform calculations or other manipulations of information.

Der Speicher 215 kann flüchtig (z. B. RAM usw.), nichtflüchtig (z. B. ROM, Flash-Speicher usw.) oder eine Kombination davon sein. In einer Konfiguration können computerlesbare Anweisungen zum Implementieren einer oder mehrerer hierin offenbarter Ausführungsformen in dem Massenspeicher 220 gespeichert sein.The memory 215 may be volatile (eg, RAM, etc.), non-volatile (eg, ROM, flash memory, etc.), or a combination thereof. In one configuration, computer-readable instructions for implementing one or more embodiments disclosed herein in the mass storage 220 be saved.

In einer anderen Ausführungsform ist der Speicher 215 zum Speichern von Software konfiguriert. Software soll im Allgemeinen so verstanden werden, dass sie jede Art von Anweisungen bedeutet, ob als Software, Firmware, Middleware, Mikrocode, Hardwarebeschreibungssprache oder auf andere Weise bezeichnet. Anweisungen können Code enthalten (z. B. im Quellcode-Format, Binärcode-Format, ausführbarem Code-Format oder einem anderen geeigneten Code-Format). Die Anweisungen veranlassen, wenn sie von einem oder mehreren Prozessoren ausgeführt werden, die Verarbeitungsschaltung 210, die verschiedenen hierin beschriebenen Verfahren auszuführen. Im Einzelnen veranlassen die Anweisungen, wenn sie ausgeführt werden, die Verarbeitungsschaltung 210, elektronische Dokumente zu überwachen, wie es hierin erörtert ist.In another embodiment, the memory is 215 configured to store software. Software should generally be understood to mean any type of instructions, whether referred to as software, firmware, middleware, microcode, hardware description language, or otherwise. Instructions may include code (eg, in source code format, binary code format, executable code format, or any other suitable code format). The instructions, when executed by one or more processors, cause the processing circuitry 210 to carry out the various methods described herein. Specifically, the instructions, when executed, cause the processing circuitry 210 to monitor electronic documents as discussed herein.

Der Massenspeicher 220 kann ein Magnetspeicher, ein optischer Speicher und dergleichen sein und kann beispielsweise als Flash-Speicher oder andere Speichertechnologie, CD-ROM, Digital Versatile Disks (DVDs) oder ein beliebiges anderes Medium, das verwendet werden kann, realisiert werden, um die gewünschten Informationen zu speichern.The mass storage 220 may be a magnetic memory, an optical memory, and the like, and may be implemented, for example, as flash memory or other storage technology, CD-ROMs, digital versatile disks (DVDs), or any other medium that may be used to provide the desired information to save.

Der OCR-Prozessor 230 kann, ist jedoch nicht darauf beschränkt, einen Merkmals- und/oder Mustererkennungsprozessor (RP) 235 enthalten, der ausgestaltet ist, Muster, Merkmale oder beides in unstrukturierten Datensätzen zu identifizieren. Insbesondere ist der OCR-Prozessor 230 in einer Ausführungsform dazu ausgelegt, zumindest Zeichen in den unstrukturierten Daten zu identifizieren. Die identifizierten Zeichen können verwendet werden, um einen Datensatz zu erstellen, der Daten enthält, die zur Verifizierung einer Anfrage erforderlich sind.The OCR processor 230 may, but is not limited to, a feature and / or pattern recognition processor (RP). 235 which is designed to identify patterns, features, or both in unstructured datasets. In particular, the OCR processor 230 in one embodiment, configured to identify at least characters in the unstructured data. The identified characters can be used to create a record containing data needed to verify a request.

Die Netzwerkschnittstelle 240 ermöglicht es der elektronischen Dokumentenüberwachung 120, mit dem Unternehmenssystem 130, der Datenbank 140, den Datenquellen 150 oder einer Kombination davon zu kommunizieren, um beispielsweise elektronische Dokumente abzurufen und zu empfangen, Daten zu speichern und Benachrichtigungen zu senden und dergleichen.The network interface 240 enables electronic document monitoring 120 , with the enterprise system 130 , the database 140 , the data sources 150 or a combination thereof, for example, to retrieve and receive electronic documents, store data and send notifications, and the like.

Es sollte verstanden werden, dass die hierin beschriebenen Ausführungsformen nicht auf die in 2 dargestellte spezifischen Architekturen beschränkt sind, und andere Architekturen können gleichermaßen verwendet werden, ohne vom Umfang der offenbarten Ausführungsformen abzuweichen.It should be understood that the embodiments described herein are not limited to those described in U.S. Pat 2 are limited to specific architectures, and other architectures may equally be used without departing from the scope of the disclosed embodiments.

3 ist ein beispielhaftes Flussdiagramm 300, das ein Verfahren zum Überwachen elektronischer Dokumente gemäß einer Ausführungsform darstellt. In einer Ausführungsform kann das Verfahren von der Überwachung 120 für elektronische Dokumente ausgeführt werden. 3 is an exemplary flowchart 300 , which is a method for monitoring electronic documents according to an embodiment. In one embodiment, the method may be of monitoring 120 for electronic documents.

Bei S310 wird ein Datensatz basierend auf einem elektronischen Eingabedokument mit Informationen erstellt, die sich auf eine Transaktion beziehen. Das elektronische Eingabedokument kann unstrukturierte Daten, halbstrukturierte Daten, strukturierte Daten mit einer Struktur, die nicht vorhergesehen oder nicht angekündigt ist, oder eine Kombination davon enthalten, ist jedoch nicht darauf beschränkt. In einer beispielhaften Implementierung kann das elektronische Eingabedokument eine elektronische Rechnung sein. Der Datensatz kann zum Beispiel einen Transaktionsbetrag von 100 USD, einen Zeithinweis, der das Datum vom 1. Januar 2016 angibt, und einen Namen eines Lieferanten „ABC Shipping Co.“ enthalten. at S310 A record is created based on an electronic input document with information related to a transaction. The electronic input document may include, but is not limited to, unstructured data, semi-structured data, structured data having a structure that is not foreseen or unannounced, or a combination thereof. In an exemplary implementation, the electronic input document may be an electronic invoice. For example, the record may include a transaction amount of $ 100, a time stamp indicating the date of January 1, 2016, and a name of a supplier, "ABC Shipping Co."

In einer Ausführungsform umfasst S310 das Analysieren des eingegebenen elektronischen Dokuments unter Verwendung einer optischen Zeichenerkennung (OCR), um Daten in dem eingegebenen elektronischen Dokument zu ermitteln, Schlüsselfelder in den Daten zu identifizieren, Werte in den Daten zu identifizieren oder eine Kombination davon. Das Erstellen von Datensätzen basierend auf elektronischen Dokumenten wird hierin weiter unten unter Bezugnahme auf 4 beschrieben.In one embodiment S310 analyzing the input electronic document using optical character recognition (OCR) to determine data in the input electronic document, identifying key fields in the data, identifying values in the data, or a combination thereof. The creation of records based on electronic documents will be described herein below with reference to 4 described.

Bei S320 wird der Datensatz des eingegebenen elektronischen Dokuments analysiert. In einer Ausführungsform kann das Analysieren des Eingabedatensatzes das Bestimmen von Transaktionsparametern umfassen, ist jedoch nicht darauf beschränkt, wie zum Beispiel mindestens eine Entitätskennung (z. B. eine Verbraucherunternehmenskennung, eine Händlerunternehmenskennung oder beides), Informationen in Bezug auf die Transaktion (z. B. Datum, Uhrzeit, Preis, Art der verkauften Ware oder Dienstleistung usw.) oder beides. In einer beispielhaften Implementierung umfassen die bestimmten Transaktionsparameter mindestens einen Transaktionsbetrag (z. B. einen Preis, eine Menge oder beides), einen Zeithinweis und eine Lieferantenkennung (z. B. einen Namen oder eine Identifikationsnummer). Beispielsweise können die Transaktionsparameter den Transaktionsbetrag, den Zeithinweis und den Namen des Lieferanten enthalten.at S320 the record of the entered electronic document is analyzed. In one embodiment, analyzing the input data set may include, but is not limited to, determining transaction parameters, such as at least one entity identifier (eg, a consumer business identifier, a merchant company identifier, or both), information related to the transaction (e.g. Date, time, price, type of goods or services sold, etc.) or both. In an exemplary implementation, the determined transaction parameters include at least one transaction amount (eg, a price, an amount, or both), a time indication, and a vendor identifier (eg, a name or an identification number). For example, the transaction parameters may include the transaction amount, the time reference, and the name of the supplier.

Bei S330 wird eine Vorlage basierend auf dem Datensatz des eingegebenen elektronischen Dokuments erstellt. Die Vorlage kann eine Datenstruktur sein, die eine Vielzahl von Feldern umfasst, ist aber nicht darauf beschränkt. Die Felder können die identifizierten Transaktionsparameter enthalten. Die Felder können vordefiniert sein.at S330 A template is created based on the record of the input electronic document. The template may be a data structure that includes, but is not limited to, a variety of fields. The fields may contain the identified transaction parameters. The fields can be predefined.

Das Erstellen von Vorlagen aus elektronischen Dokumenten ermöglicht aufgrund der strukturierten Natur der erstellten Vorlagen eine schnellere Verarbeitung. Abfrage- und Manipulationsoperationen können beispielsweise bei strukturierten Datensätzen effizienter ausgeführt werden als bei Datensätzen, denen eine solche Struktur fehlt. Beim Organisieren von Informationen aus elektronischen Dokumenten in strukturierte Datensätze kann der zum Speichern von Informationen, die in elektronischen Dokumenten enthalten sind, erforderliche Speicherplatz erheblich reduziert werden. Elektronische Dokumente sind häufig Bilder, die mehr Speicherplatz benötigen als Datensätze, die die gleichen Informationen enthalten. Beispielsweise können Datensätze, die Daten aus 100.000 elektronischen Bilddokumenten darstellen, als Datensätze in einer Textdatei gespeichert werden. Die Größe einer solchen Textdatei wäre erheblich geringer als die Größe der 100.000 Bilder.Creating templates from electronic documents allows faster processing due to the structured nature of the templates created. For example, query and manipulation operations can be performed more efficiently on structured datasets than datasets lacking such a structure. When organizing information from electronic documents into structured records, the space required to store information contained in electronic documents can be significantly reduced. Electronic documents are often images that require more memory than data sets that contain the same information. For example, records representing data from 100,000 electronic image documents can be stored as records in a text file. The size of such a text file would be considerably smaller than the size of the 100,000 images.

Bei S340 werden Daten der erstellten Vorlage für das elektronische Eingabedokument mit Daten verglichen, die mehreren elektronischen Probendokumenten zugeordnet sind, um eine oder mehrere Auffälligkeiten in dem elektronischen Eingabedokument zu identifizieren. Die Auffälligkeiten können ungewöhnliche Datenwerte in der Vorlage sein, die für das elektronische Eingabedokument erstellt wurde. Jedes der elektronischen Probendokumente enthält Daten einer Transaktion. In einer beispielhaften Implementierung enthalten die elektronischen Probendokumente Bilder, die gescannte Rechnungen für frühere Transaktionen eines Unternehmens zeigen.at S340 For example, data from the created electronic input document template is compared to data associated with multiple electronic sample documents to identify one or more abnormalities in the electronic input document. The abnormalities can be unusual data values in the template created for the electronic input document. Each of the electronic sample documents contains data of a transaction. In an exemplary implementation, the electronic sample documents contain images that show scanned bills for a company's past transactions.

Die Daten der erstellten Vorlage können mit entsprechenden Daten der Gruppe von elektronischen Probendokumenten direkt verglichen werden oder können mit einem oder mehreren repräsentativen Daten für die Gruppe von elektronischen Probendokumenten verglichen werden. Die repräsentativen Daten können einen Durchschnitt, eine Standardabweichung, einen Median, einen Modus und dergleichen enthalten, sind jedoch nicht darauf beschränkt.The data of the created template may be directly compared with corresponding data of the set of electronic sample documents or may be compared to one or more representative data for the group of electronic sample documents. The representative data may include, but is not limited to, an average, standard deviation, median, mode, and the like.

Die Daten der Vorlage für ein eingegebenes elektronisches Dokument können mit Daten einer oder mehrerer ausgewählter Gruppen von elektronischen Probendokumenten (z. B. einer aus einer Datenbank von elektronischen Probendokumenten ausgewählten Gruppe) verglichen werden, wodurch Auffälligkeiten in Bezug auf verschiedene normale Probendatenwerte identifiziert werden können. Zum Beispiel können Daten des eingegebenen elektronischen Dokuments mit einer ersten Gruppe von elektronischen Probendokumenten, die Transaktionen zeigen, die sich auf einen bestimmten Verkäufer beziehen, und mit einer zweiten Gruppe von elektronischen Probendokumenten verglichen werden, die Transaktionen für dasselbe Produkt zeigen.The input electronic document template data may be compared to data from one or more selected groups of electronic sample documents (eg, a group selected from a database of electronic sample documents), whereby abnormalities with respect to various normal sample data values may be identified. For example, data of the input electronic document may be compared with a first group of electronic sample documents showing transactions relating to a particular seller and a second group of electronic sample documents showing transactions for the same product.

Das Identifizieren von Auffälligkeiten in einem eingegebenen elektronischen Dokument auf der Grundlage von Daten von elektronischen Probendokumenten wird weiter unten unter Bezugnahme auf 5 beschrieben.Identifying anomalies in an input electronic document based on data from electronic Sample documents will be discussed below with reference to 5 described.

Wenn bei S350 eine oder mehrere Auffälligkeiten identifiziert werden, wird eine Warnung erzeugt. Die Warnung kann die identifizierten Auffälligkeiten und das auffällige elektronische Eingabedokument anzeigen. Die Warnung kann zum Beispiel an das Unternehmenssystem 110, 1, oder ein Benutzergerät gesendet werden, das einem Unternehmen zugeordnet ist. Wenn in einigen Implementierungen S340 zu einem Nullwert geführt hat (d. h. wenn keine Auffälligkeiten festgestellt wurden), wird möglicherweise keine Warnung erzeugt.If one or more abnormalities are identified in S350, a warning is generated. The alert can indicate the identified abnormalities and the conspicuous electronic input document. For example, the warning may be sent to the enterprise system 110 . 1 , or a user device that is associated with a company. If in some implementations S340 has led to a null value (that is, if no abnormalities have been detected), a warning may not be generated.

In S360 wird geprüft, ob zusätzliche elektronische Eingabedokumente auf Auffälligkeiten analysiert werden sollen, und wenn dies der Fall ist, wird die Ausführung mit S310 fortgesetzt. Andernfalls wird die Ausführung beendet. Bei einigen Implementierungen können elektronische Eingabedokumente in Echtzeit auf Auffälligkeiten überwacht werden, wenn sie empfangen werden, so dass Auffälligkeiten identifiziert werden und Alarme fast unmittelbar nach dem Empfang neuer elektronischer Eingabedokumente erzeugt werden.In S360 A check is made as to whether additional electronic input documents should be analyzed for abnormalities, and if so, the execution is called S310 continued. Otherwise the execution is terminated. In some implementations, electronic input documents can be monitored in real-time for abnormalities as they are received, so that abnormalities are identified and alarms are generated almost immediately after receipt of new electronic input documents.

Als nicht einschränkendes Beispiel wird eine elektronische Rechnung erhalten, die den Kauf von Kakaobohnen durch eine Süßwarenfirma veranschaulicht. Es wird ein Datensatz mit einem für die Kakaobohnen bezahlten Betrag von 340 USD, einem Zeitstempel vom 9. Februar 2016 und dem Verkäufernamen „Bean Harvesters, Inc.“ erstellt. Der Datensatz wird analysiert, um die Transaktionsparameter im Datensatz zu bestimmen. Eine Vorlage mit den ermittelten Transaktionsparametern wird erstellt. Die Vorlage enthält die Felder „Kaufpreis“, „Kaufdatum“ und „Verkäufername“, wobei jedes Feld die jeweiligen Transaktionsparameter enthält, die sich auf den Preis von 340 USD beziehen, das Datum vom 9. Februar 2016 und den Namen „Bean Harvesters, Inc.“.By way of non-limiting example, an electronic bill is presented which illustrates the purchase of cocoa beans by a confectionery company. A record will be created with an amount of 340 USD paid for the cocoa beans, a time stamp dated 9 February 2016 and the seller's name "Bean Harvesters, Inc.". The record is analyzed to determine the transaction parameters in the record. A template with the determined transaction parameters is created. The template contains the "Purchase Price," "Purchase Date" and "Seller Name" fields, with each field containing the respective transaction parameters, which are related to the price of $ 340, the date of February 9, 2016 and the name "Bean Harvesters, Inc . ".

Der Preis von 340 USD wird mit einem Durchschnittspreis von 125 USD verglichen, der mit einer Gruppe elektronischer Probendokumente verbunden ist, die Käufe von Bean Harvesters im Dezember 2015 und Januar 2016 anzeigen. Die elektronischen Probendokumente enthalten Kaufpreise von 114 USD, 117 USD, 125 USD, 133 USD bzw. 136 USD. Auf der Grundlage des Vergleichs wird festgestellt, dass der Preis des Kaufs am 9. Februar 2016 über einem Schwellenwert von 100 USD vom Durchschnittspreis abweicht und dass daher ein ungewöhnlicher Preis festgestellt wurde. Es wird eine Warnmeldung generiert, die angibt, dass die Rechnung vom 9. Februar 2016 ungewöhnlich ist, und sie wird zur Überprüfung gesendet.The price of $ 340 is compared to an average price of $ 125 associated with a group of electronic sample documents showing purchases by Bean Harvesters in December 2015 and January 2016. The electronic sample documents include purchase prices of $ 114, $ 117, $ 125, $ 133 and $ 136, respectively. Based on the comparison, it is found that the price of the purchase on February 9, 2016 above a threshold of $ 100 deviates from the average price and therefore an unusual price was determined. A warning message is generated stating that the 9 February 2016 invoice is unusual and will be sent for review.

4 ist ein beispielhaftes Flussdiagramm S310, das ein Verfahren zum Erzeugen eines Datensatzes basierend auf einem elektronischen Dokument gemäß einer Ausführungsform darstellt. 4 is an exemplary flowchart S310 , which illustrates a method for generating a data set based on an electronic document according to an embodiment.

Bei S410 wird das elektronische Dokument erhalten. Das Abrufen des elektronischen Dokuments kann das Empfangen des elektronischen Dokuments (z. B. Empfangen eines gescannten Bildes) oder das Abrufen des elektronischen Dokuments (z. B. Abrufen des elektronischen Dokuments von einem Verbraucherunternehmenssystem, einem Händlerunternehmenssystem oder einer Datenbank) einschließen, ist jedoch nicht darauf beschränkt.at S410 the electronic document is received. However, retrieving the electronic document may include receiving the electronic document (e.g., receiving a scanned image) or retrieving the electronic document (eg, retrieving the electronic document from a consumer enterprise system, a merchant company system, or a database) not limited to this.

Bei S420 wird das elektronische Dokument analysiert. Die Analyse kann die Verwendung einer optischen Zeichenerkennung (OCR) umfassen, um Zeichen in dem elektronischen Dokument zu bestimmen.at S420 the electronic document is analyzed. The analysis may include the use of optical character recognition (OCR) to determine characters in the electronic document.

Bei S430 werden basierend auf der Analyse Schlüsselfelder und -werte im elektronischen Dokument identifiziert. Das Schlüsselfeld kann den Namen und die Adresse des Händlers, das Datum, die Währung, die verkaufte Ware oder Dienstleistung, eine Transaktionskennung, eine Rechnungsnummer usw. enthalten, ist jedoch nicht darauf beschränkt. Ein elektronisches Dokument kann unnötige Details enthalten, die nicht als Schlüsselwerte betrachtet werden. Als Beispiel kann ein Logo des Händlers nicht erforderlich sein und ist daher kein Schlüsselwert. In einer Ausführungsform kann eine Liste von Schlüsselfeldern vordefiniert sein, und Datenelemente, die mit den Schlüsselfeldern übereinstimmen können, werden extrahiert. Dann wird ein Reinigungsprozess ausgeführt um sicherzustellen, dass die Informationen genau dargestellt sind. Wenn die OCR beispielsweise zu Daten führen würde, die als „1211212005“ dargestellt sind, konvertiert der Reinigungsprozess diese Daten in 12/12/2005. Wenn als weiteres Beispiel ein Name als „Mo$den“ dargestellt ist, ändert sich dies in „Mosden“. Der Reinigungsprozess kann unter Verwendung externer Informationsressourcen wie Wörterbüchern, Kalendern und dergleichen durchgeführt werden.at S430 Identify key fields and values in the electronic document based on the analysis. The key field may include, but is not limited to, the name and address of the merchant, date, currency, merchandise or service being sold, a transaction identifier, an invoice number, and so forth. An electronic document can contain unnecessary details that are not considered key-values. As an example, a logo of the merchant may not be required and is therefore not a key value. In one embodiment, a list of key fields may be predefined, and data items that may correspond to the key fields are extracted. Then a cleaning process is performed to ensure that the information is accurately presented. For example, if the OCR would result in data represented as "1211212005," the cleaning process will convert that data to 12/12/2005. As another example, if a name is represented as "Mo $ den", it changes to "Mosden." The cleaning process may be performed using external information resources such as dictionaries, calendars, and the like.

In einer weiteren Ausführungsform wird geprüft, ob die extrahierten Datenteile vollständig sind. Wenn beispielsweise der Händlername identifiziert werden kann, dessen Adresse jedoch fehlt, ist das Schlüsselfeld für die Händleradresse unvollständig. Es wird versucht, die fehlenden Schlüsselfeldwerte zu vervollständigen. Dieser Versuch kann die Abfrage externer Systeme und Datenbanken, die Korrelation mit zuvor analysierten Rechnungen oder eine Kombination davon umfassen. Beispiele für externe Systeme und Datenbanken können Geschäftsverzeichnisse, UPC-Datenbanken (Universal Product Code), Paketübermittlungs- und -verfolgungssysteme usw. sein. In einer Ausführungsform führt S430 zu einem vollständigen Satz der vordefinierten Schlüsselfelder und ihrer jeweiligen Werte.In a further embodiment, it is checked whether the extracted data parts are complete. For example, if the merchant name can be identified but its address is missing, the key field for the merchant address is incomplete. An attempt is made to complete the missing key field values. This experiment may involve querying external systems and databases, correlating with previously analyzed invoices, or a combination thereof. Examples of external systems and databases may include business directories, universal product code (UPC) databases, and tracking systems and so on. In one embodiment S430 to a complete set of predefined key fields and their respective values.

Bei S440 wird ein strukturierter Datensatz erstellt. Der strukturierte Datensatz enthält die identifizierten Schlüsselfelder und -werte.at S440 a structured record is created. The structured record contains the identified key fields and values.

5 ist ein beispielhaftes Flussdiagramm S340, das ein Verfahren zum Identifizieren von Auffälligkeiten basierend auf einer Vorlage darstellt, die für ein elektronisches Eingabedokument gemäß einer Ausführungsform erstellt wurde. 5 is an exemplary flowchart S340 , which illustrates a method for identifying anomalies based on a template created for an electronic input document according to an embodiment.

Bei S510 werden elektronische Probendokumente oder Vorlagen für elektronische Probendokumente abgerufen. Die elektronischen Probendokumente können basierend auf Daten abgerufen werden, die in einem oder mehreren Feldern der Vorlage angegeben sind, die für das elektronische Eingabedokument erstellt wurde.at S510 electronic sample documents or templates for electronic sample documents are retrieved. The electronic sample documents can be retrieved based on data specified in one or more fields of the template created for the electronic input document.

In einer beispielhaften Implementierung kann jede abgerufene Gruppe von elektronischen Probendokumenten elektronische Dokumente enthalten, die sich auf denselben Händler beziehen, auf dieselbe Art von gekauften Waren oder Dienstleistungen, auf die Verwendung derselben Zahlungsmethode (z. B. einer bestimmten Kreditkartennummer), Zeiträumen, auf eine Kombination davon (zum Beispiel elektronische Dokumente, die die Käufe desselben Händlers in der ersten Woche jedes Monats anzeigen) und dergleichen. Der Vergleich von Daten eines eingegebenen elektronischen Dokuments mit Daten von elektronischen Probendokumenten, die gemeinsame Parameter verwenden, kann eine erhöhte Effizienz beim Erkennen von Auffälligkeiten ermöglichen, wenn der gemeinsame Parameter wahrscheinlich konsistente Probendaten anzeigt. Es kann zum Beispiel erwartet werden, dass Käufe desselben Händlers konsistent um den gleichen Preis liegen, so dass, wenn frühere Käufe von einem bestimmten Händler einen Durchschnittspreis von 1000 USD für das Unternehmen haben, ein Kaufpreis von 1400 USD von diesem Händler auf eine Auffälligkeit hinweisen kann. Die Daten des eingegebenen elektronischen Dokuments können mit Daten von mehreren Gruppen von elektronischen Probendokumenten verglichen werden, wodurch Auffälligkeiten in Bezug auf verschiedene potentielle Quellen von Auffälligkeiten und damit ein vollständigerer Satz von Auffälligkeiten für das elektronische Eingabedokument identifiziert werden kann.In an exemplary implementation, each retrieved set of electronic sample documents may contain electronic documents related to the same merchant, the same type of purchased goods or services, the use of the same payment method (eg, a particular credit card number), periods of time Combination thereof (for example, electronic documents indicating the same dealer's purchases in the first week of each month) and the like. Comparing data from an input electronic document with data from electronic sample documents using common parameters may allow for increased efficiency in detecting abnormalities when the common parameter is likely to indicate consistent sample data. For example, it can be expected that purchases from the same merchant will be consistently at the same price, so if previous purchases from a particular merchant have an average price of $ 1,000 for the company, a purchase price of $ 1,400 from that merchant will indicate an abnormality can. The data of the input electronic document can be compared with data from several groups of electronic sample documents, which can identify abnormalities regarding various potential sources of abnormalities and thus a more complete set of abnormalities for the electronic input document.

Zu diesem Zweck kann S510 in einer Ausführungsform das Suchen auf der Grundlage von Daten in der Vorlage für ein eingegebenes elektronisches Dokument in einer oder mehreren Datenquellen für die elektronischen Probendokumente umfassen, mit denen das eingegebene elektronische Dokument verglichen werden soll. Als nicht einschränkendes Beispiel kann eine Händler-Identifizierungsnummer „12345“, die in einem „Händler-ID“-Feld der Vorlage des eingegebenen elektronischen Dokuments angegeben ist, als Suchabfrage verwendet werden, um die elektronischen Probendokumente auf der Grundlage von beispielsweise Metadaten der elektronischen Probendokumente zu finden, die die Händleridentifikationsnummer „12345“ enthalten. Als Ergebnis werden nur Daten elektronischer Probendokumente für Transaktionen, die denselben Händler betreffen, mit dem eingegebenen elektronischen Dokument verglichen.For this purpose can S510 in one embodiment, searching based on data in the template for an input electronic document in one or more data sources for the electronic sample documents with which the input electronic document is to be compared. As a non-limiting example, a merchant identification number "12345" indicated in a "Merchant ID" field of the submission of the input electronic document may be used as a search query to retrieve the electronic specimen documents based on, for example, metadata of the electronic specimen documents to find the merchant identification number "12345". As a result, only data of electronic sample documents for transactions concerning the same merchant is compared with the input electronic document.

Bei dem optionalen Schritt S520 kann eine Vorlage für jedes elektronische Probendokument erstellt werden. Jede Vorlage ist ein strukturiertes elektronisches Dokument mit den im elektronischen Probendokument angegebenen Transaktionsparametern. Das Erstellen von Vorlagen für elektronische Probendokumente kann die Einsparung von Rechenressourcen ermöglichen, da die Vorlagen beim Speichern weniger Speicher benötigen als die ursprünglichen elektronischen Probendokumente, beispielsweise Bilddateien.In the optional step S520 a template can be created for each electronic sample document. Each template is a structured electronic document with the transaction parameters specified in the electronic sample document. Creating electronic sample document templates can save on computational resources because the templates require less memory to save than the original electronic sample documents, such as image files.

Bei S530 werden Daten des eingegebenen elektronischen Dokuments mit Daten jeder Gruppe von elektronischen Probendokumenten verglichen. Der Vergleich von Daten der erstellten Vorlagen der elektronischen Probendokumente mit Daten des eingegebenen elektronischen Dokuments ermöglicht einen effizienteren Vergleich von Daten als beispielsweise durch Vergleich von unstrukturierten oder auf andere Weise unorganisierten Daten. Insbesondere können Daten in Bezug auf bestimmte Felder der Vorlagen verglichen werden, anstatt beispielsweise alle Daten des eingegebenen elektronischen Dokuments mit allen Daten der Gruppen von elektronischen Probendokumenten. In einer beispielhaften Implementierung können Daten, die in einem „Preis“-Feld, in einem „Mengen“-Feld oder in beiden angezeigt werden, des eingegebenen elektronischen Dokuments mit entsprechenden Daten der elektronischen Probendokumente verglichen werden. Die entsprechenden Daten können Daten enthalten, die in entsprechenden Feldern der Vorlagen für die elektronischen Probendokumente angegeben sind, oder Daten, die ansonsten repräsentativ für die elektronischen Probendokumente sind (z. B. Durchschnittswerte, am häufigsten auftretende Werte, Mittelwerte und dergleichen). Zu diesem Zweck kann S530 das Auswählen eines oder mehrerer repräsentativer Werte der elektronischen Probendokumente zum Vergleich mit einem oder mehreren entsprechenden Werten der Vorlage des elektronischen Eingabedokuments auf der Grundlage der Felder einschließlich der entsprechenden Werte des eingegebenen elektronischen Dokuments umfassen.at S530 Data of the input electronic document is compared with data of each group of electronic sample documents. The comparison of data of the created templates of the electronic sample documents with data of the input electronic document enables a more efficient comparison of data than for example by comparing unstructured or otherwise unorganized data. In particular, data relative to particular fields of the templates may be compared rather than, for example, all data of the input electronic document with all data of the groups of electronic sample documents. In an exemplary implementation, data displayed in a "Price" field, in a "Quantity" field, or both, of the input electronic document may be compared to corresponding data of the electronic sample documents. The corresponding data may include data indicated in corresponding fields of the electronic sample document templates or data otherwise representative of the electronic sample documents (eg, averages, most frequently occurring values, averages, and the like). For this purpose, S530 may include selecting one or more representative values of the electronic sample documents for comparison with one or more corresponding values of the template of the electronic input document based on the fields including the corresponding values of the input electronic document.

Bei S540 können basierend auf dem Vergleich eine oder mehrere Auffälligkeiten identifiziert werden. Die Auffälligkeiten können basierend auf einem oder mehreren Schwellenwerten identifiziert werden, und unterschiedliche Schwellenwerte können angewendet werden, z. B. verschiedene verglichene Transaktionsparameter (z. B. kann ein Schwellenwert für den Preis von einem Schwellenwert für die Menge abweichen). Wenn der Vergleich keine Abweichungen oberhalb der jeweiligen Schwellenwerte ergab, kann S540 zu einem Nullwert führen (d. h., der keine Auffälligkeit anzeigt). at S540 Based on the comparison, one or more abnormalities can be identified. The abnormalities may be identified based on one or more thresholds, and different thresholds may be applied, e.g. For example, different compared transaction parameters (eg, a price threshold may differ from a threshold for the quantity). If the comparison did not show any deviations above the respective thresholds, S540 may result in a null value (ie indicating no abnormality).

Jede Auffälligkeit wird auf der Grundlage einer Abweichung eines Transaktionsparameters des eingegebenen elektronischen Dokuments von den Transaktionsparametern einer der Gruppen elektronischer Probendokumente über der Schwelle identifiziert. Die Schwelle kann ein Wert sein (z. B. eine Zahl, ein Wort, ein Zeichen usw.), ein Anteil und dergleichen. Die Abweichung kann basierend auf einer Abweichung von einem der Werte von einem der elektronischen Probendokumente bestimmt werden oder kann auf der Grundlage einer Abweichung von einem durchschnittlichen oder anderweitig repräsentativen Wert für die elektronischen Probendokumente bestimmt werden. Beispielsweise kann für durchschnittlich 2000 pro Monat bestellte Wassermelonen, wie in „Anzahl“-Feldern der elektronischen Probendokumente angegeben, eine Vorlage eines elektronischen Dokuments, die 10.000 Wassermelonen in einem „Mengen“-Feld angibt, eine Abweichung und somit eine Auffälligkeit anzeigen.Each conspicuousness is identified based on a deviation of a transaction parameter of the input electronic document from the transaction parameters of one of the groups of electronic sample documents above the threshold. The threshold may be a value (eg, a number, a word, a character, etc.), a share, and the like. The deviation may be determined based on a deviation from one of the values of one of the electronic sample documents, or may be determined based on a deviation from an average or otherwise representative value for the electronic sample documents. For example, for an average of 2000 watermelons ordered per month, as indicated in "number" fields of the electronic sample documents, a template of an electronic document indicating 10,000 watermelons in a "quantity" field may indicate a discrepancy and thus a conspicuousness.

Es sollte verstanden werden, dass jegliche Bezugnahme auf ein Element hierin unter Verwendung einer Bezeichnung wie „erste“, „zweite“ usw. die Menge oder Reihenfolge dieser Elemente im Allgemeinen nicht einschränkt. Vielmehr werden diese Bezeichnungen hier allgemein als zweckmäßige Methode zur Unterscheidung zwischen zwei oder mehr Elementen oder Instanzen eines Elements verwendet. Ein Verweis auf das erste und das zweite Element bedeutet also nicht, dass dort nur zwei Elemente verwendet werden dürfen oder dass das erste Element in gewisser Weise vor dem zweiten Element stehen muss. Sofern nicht anders angegeben, umfasst ein Satz von Elementen ein oder mehrere Elemente.It should be understood that any reference to an element herein using a term such as "first," "second," etc. generally does not limit the amount or order of those elements. Rather, these terms are generally used herein as a convenient method of distinguishing between two or more elements or instances of an element. A reference to the first and second elements therefore does not mean that only two elements may be used there, or that the first element must in some way be in front of the second element. Unless otherwise stated, a set of elements includes one or more elements.

Wie hierin verwendet, bedeutet der Ausdruck „mindestens einer von“ gefolgt von einer Auflistung von Elementen, dass jedes der aufgelisteten Elemente einzeln verwendet werden kann, oder es kann eine beliebige Kombination von zwei oder mehr der aufgelisteten Elemente verwendet werden. Wenn zum Beispiel beschrieben wird, dass ein System „mindestens eines von A, B und C“ umfasst, kann das System nur A enthalten; B allein; C allein; A und B in Kombination; B und C in Kombination; A und C in Kombination; oder A, B und C in Kombination.As used herein, the term "at least one of" followed by a list of elements means that each of the listed elements may be used individually, or any combination of two or more of the listed elements may be used. For example, when it is described that a system includes "at least one of A, B and C", the system can only contain A; B alone; C alone; A and B in combination; B and C in combination; A and C in combination; or A, B and C in combination.

Die verschiedenen hierin offenbarten Ausführungsformen können als Hardware, Firmware, Software oder eine beliebige Kombination davon implementiert werden. Darüber hinaus ist die Software vorzugsweise als ein Anwendungsprogramm implementiert, das auf einer Programmspeichereinheit oder einem computerlesbaren Medium, das aus Teilen oder bestimmten Geräten und/oder einer Kombination von Geräten besteht, konkret verkörpert ist. Das Anwendungsprogramm kann auf eine Maschine mit einer geeigneten Architektur hochgeladen und von dieser ausgeführt werden. Vorzugsweise ist die Maschine auf einer Computerplattform implementiert, die Hardware aufweist, wie beispielsweise eine oder mehrere zentrale Verarbeitungseinheiten („CPUs“), einen Speicher und Eingabe-/Ausgabeschnittstellen. Die Computerplattform kann auch ein Betriebssystem und einen Mikrobefehlscode enthalten. Die verschiedenen hier beschriebenen Verfahren und Funktionen können entweder Teil des Mikrobefehlscodes oder Teil des Anwendungsprogramms sein oder eine beliebige Kombination davon, die von einer CPU ausgeführt werden kann, unabhängig davon, ob ein solcher Computer oder Prozessor explizit gezeigt wird oder nicht. Zusätzlich können verschiedene andere periphere Einheiten mit der Computerplattform verbunden sein, beispielsweise eine zusätzliche Datenspeichereinheit und eine Druckeinheit. Darüber hinaus ist ein nichtflüchtiges computerlesbares Medium ein beliebiges computerlesbares Medium mit Ausnahme eines transitorischen Ausbreitungssignals.The various embodiments disclosed herein may be implemented as hardware, firmware, software, or any combination thereof. Moreover, the software is preferably implemented as an application program concretely embodied on a program storage device or computer readable medium consisting of parts or particular devices and / or a combination of devices. The application program can be uploaded to and executed by a machine with a suitable architecture. Preferably, the machine is implemented on a computer platform that includes hardware, such as one or more central processing units ("CPUs"), memory, and input / output interfaces. The computer platform may also include an operating system and a microcode. The various methods and functions described herein may be either part of the microcode or part of the application program, or any combination thereof that may be executed by a CPU, whether or not such computer or processor is explicitly shown. In addition, various other peripheral units may be connected to the computer platform, such as an additional data storage unit and a printing unit. In addition, a non-transitory computer readable medium is any computer readable medium except a transitory propagation signal.

Alle hier zitierten Beispiele und Konditionale sind für pädagogische Zwecke gedacht, um den Leser beim Verständnis der vom Erfinder zur Förderung des Standes der Technik beigetragenen Prinzipien der offenbarten Ausführungsform und der Konzepte zu unterstützen und sind ohne Beschränkung auf solche speziell genannten Beispiele und Bedingungen auszulegen. Darüber hinaus sollen alle hierin enthaltenen Aussagen, die Prinzipien, Aspekte und Ausführungsformen der offenbarten Ausführungsformen sowie spezifische Beispiele davon aufführen, sowohl strukturelle als auch funktionale Äquivalente davon umfassen. Außerdem ist beabsichtigt, dass solche Äquivalente sowohl gegenwärtig bekannte Äquivalente als auch in der Zukunft entwickelte Äquivalente umfassen, d. h. alle entwickelten Elemente, die unabhängig von der Struktur die gleiche Funktion erfüllen.All examples and conditions cited herein are for educational purposes to assist the reader in understanding the principles of the disclosed embodiment and concepts contributed by the inventor to promote the prior art, and are to be construed without limitation to such specific examples and conditions. In addition, all statements contained herein, embodying principles, aspects, and embodiments of the disclosed embodiments, as well as specific examples thereof, are intended to encompass both structural and functional equivalents thereof. In addition, it is intended that such equivalents include both currently known equivalents and equivalents developed in the future, i. H. all developed elements that perform the same function regardless of the structure.

ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • US 62371234 [0001]US 62371234 [0001]
  • US 15361934 [0001]US 15361934 [0001]

Claims (19)

Verfahren zum Überwachen elektronischer Dokumente, aufweisend: Analysieren eines ersten elektronischen Dokuments, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument mindestens teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.A method of monitoring electronic documents, comprising: Analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and Comparing data of the created template with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document. Verfahren nach Anspruch 1, wobei das Bestimmen des mindestens einen Transaktionsparameters ferner aufweist: Identifizieren von mindestens einem Schlüsselfeld und mindestens einem Wert in dem ersten elektronischen Dokument; Erstellen eines Datensatzes basierend auf dem ersten elektronischen Dokument, wobei der erstellte Datensatz das mindestens eine Schlüsselfeld und den mindestens einen Wert enthält; und Analysieren des erstellten Datensatzes, wobei der mindestens eine Transaktionsparameter basierend auf der Analyse bestimmt wird.Method according to Claim 1 wherein determining the at least one transaction parameter further comprises: identifying at least one key field and at least one value in the first electronic document; Creating a record based on the first electronic document, wherein the created record includes the at least one key field and the at least one value; and analyzing the created dataset, wherein the at least one transaction parameter is determined based on the analysis. Verfahren nach Anspruch 2, wobei das Identifizieren des mindestens einen Schlüsselfeldes und des mindestens einen Werts ferner aufweist: Analysieren des ersten elektronischen Dokuments, um Daten in dem ersten elektronischen Dokument zu bestimmen; und Extrahieren von mindestens einem Teil der bestimmten Daten basierend auf einer vorbestimmten Liste von Schlüsselfeldern, wobei der mindestens eine Teil der ermittelten Daten mit mindestens einem Schlüsselfeld der vorbestimmten Liste von Schlüsselfeldern übereinstimmt.Method according to Claim 2 wherein identifying the at least one key field and the at least one value further comprises: analyzing the first electronic document to determine data in the first electronic document; and extracting at least a portion of the determined data based on a predetermined list of key fields, wherein the at least one portion of the determined data matches at least one key field of the predetermined list of key fields. Verfahren nach Anspruch 3, wobei das Analysieren des ersten elektronischen Dokuments ferner aufweist: Durchführen einer optischen Zeichenerkennung an dem ersten elektronischen Dokument.Method according to Claim 3 wherein analyzing the first electronic document further comprises: performing optical character recognition on the first electronic document. Verfahren nach Anspruch 1, wobei das Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, ferner aufweist: Vergleichen eines ersten Werts des mindestens einen Transaktionsparameters mit einem zweiten Wert, der den mehreren zweiten elektronischen Dokumenten zugeordnet ist, wobei eine Auffälligkeit identifiziert wird, wenn die Differenz zwischen dem ersten Wert und dem zweiten Wert mindestens einen Schwellenwert erfüllt.Method according to Claim 1 wherein comparing data of the created template with data associated with a plurality of second electronic documents further comprises: comparing a first value of the at least one transaction parameter with a second value associated with the plurality of second electronic documents identifying an abnormality if the difference between the first value and the second value satisfies at least one threshold. Verfahren nach Anspruch 5, wobei der zweite Wert zum Vergleich basierend auf dem Feld der Vorlage ausgewählt wird, das den ersten Wert enthält.Method according to Claim 5 , wherein the second value is selected for comparison based on the field of the template containing the first value. Verfahren nach Anspruch 1, ferner aufweisend: Erzeugen eines Alarms, der die identifizierte mindestens eine Auffälligkeit angibt.Method according to Claim 1 , further comprising: generating an alarm indicating the identified at least one abnormality. Verfahren nach Anspruch 1, wobei der mindestens eine Transaktionsparameter einen Transaktionsbetrag, einen Zeithinweis und eine Lieferantenkennung enthält, wobei die mindestens eine Auffälligkeit einen ungewöhnlichen Wert des Transaktionsbetrags im Vergleich zu in den zweiten elektronischen Dokumenten angegebenen Transaktionsbeträgen enthält.Method according to Claim 1 wherein the at least one transaction parameter includes a transaction amount, a time indication, and a vendor identifier, wherein the at least one abnormality includes an unusual value of the transaction amount compared to transaction amounts specified in the second electronic documents. Verfahren nach Anspruch 1, wobei jedes elektronische Dokument eine elektronische Rechnung ist.Method according to Claim 1 where each electronic document is an electronic invoice. Nichtflüchtiges computerlesbares Medium, auf dem Anweisungen gespeichert sind, um eine Verarbeitungsschaltung zur Durchführung eines Verfahrens zu veranlassen, wobei das Verfahren aufweist: Analysieren eines ersten elektronischen Dokuments zum Bestimmen mindestens eines Transaktionsparameters, wobei das erste elektronische Dokument zumindest teilweise unstrukturierte Daten enthält; Erstellen einer Vorlage für das erste elektronische Dokument, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Vergleichen von Daten der erstellten Vorlage mit Daten, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.A non-transitory computer readable medium having instructions stored thereon for causing a processing circuit to perform a method, the method comprising: analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; Creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and comparing data of the created template with data associated with a plurality of second electronic documents by at least one of Identify conspicuousness in the first electronic document. System zum Validieren einer durch ein elektronisches Dokument dargestellten Transaktion, aufweisend: eine Verarbeitungsschaltung; und einen Speicher, wobei der Speicher Anweisungen enthält, die, wenn sie von der Verarbeitungsschaltung ausgeführt werden, das System so konfigurieren, dass: ein erstes elektronisches Dokument analysiert wird, um mindestens einen Transaktionsparameter zu bestimmen, wobei das erste elektronische Dokument zumindest teilweise unstrukturierte Daten enthält; eine Vorlage für das erste elektronische Dokument erstellt wird, wobei die erstellte Vorlage ein strukturierter Datensatz ist, der den bestimmten mindestens einen Transaktionsparameter enthält; und Daten der erstellten Vorlage mit Daten verglichen werden, die mehreren zweiten elektronischen Dokumenten zugeordnet sind, um mindestens eine Auffälligkeit in dem ersten elektronischen Dokument zu identifizieren.A system for validating a transaction represented by an electronic document, comprising: a processing circuit; and a memory, the memory including instructions that, when executed by the processing circuitry, configure the system to: analyzing a first electronic document to determine at least one transaction parameter, the first electronic document containing at least partially unstructured data; creating a template for the first electronic document, wherein the created template is a structured data set containing the determined at least one transaction parameter; and Data of the created template are compared with data associated with a plurality of second electronic documents to identify at least one abnormality in the first electronic document. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Identifizieren von mindestens einem Schlüsselfeld und mindestens einem Wert in dem ersten elektronischen Dokument; Erstellen, basierend auf dem ersten elektronischen Dokument, eines Datensatzes, wobei der erstellte Datensatz das mindestens eine Schlüsselfeld und den mindestens einen Wert enthält; und Analysieren des erstellten Datensatzes, wobei der mindestens eine Transaktionsparameter auf der Grundlage der Analyse bestimmt wird.System after Claim 11 wherein the system is further configured to: identify at least one key field and at least one value in the first electronic document; Creating, based on the first electronic document, a record, the created record including the at least one key field and the at least one value; and analyzing the created record, wherein the at least one transaction parameter is determined based on the analysis. System nach Anspruch 12, wobei das System ferner konfiguriert ist zum: Analysieren des ersten elektronischen Dokuments, um Daten in dem ersten elektronischen Dokument zu bestimmen; und Extrahieren, basierend auf einer vorbestimmten Liste von Schlüsselfeldern, mindestens eines Teils der bestimmten Daten, wobei der mindestens eine Teil der bestimmten Daten mit mindestens einem Schlüsselfeld der vorgegebenen Liste von Schlüsselfeldern übereinstimmt.System after Claim 12 wherein the system is further configured to: analyze the first electronic document to determine data in the first electronic document; and extracting, based on a predetermined list of key fields, at least a portion of the determined data, wherein the at least a portion of the determined data matches at least one key field of the predetermined list of key fields. System nach Anspruch 13, wobei das System ferner konfiguriert ist zum: Durchführen einer optischen Zeichenerkennung an dem ersten elektronischen Dokument.System after Claim 13 wherein the system is further configured to: perform optical character recognition on the first electronic document. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Vergleichen eines ersten Wertes des mindestens einen Transaktionsparameters mit einem zweiten Wert, der den mehreren zweiten elektronischen Dokumenten zugeordnet ist, wobei eine Auffälligkeit erkannt wird, wenn die Differenz zwischen dem ersten Wert und dem zweiten Wert mindestens einen Schwellenwert erfüllt.System after Claim 11 wherein the system is further configured to: compare a first value of the at least one transaction parameter to a second value associated with the plurality of second electronic documents, wherein an abnormality is detected when the difference between the first value and the second value is at least one Threshold met. System nach Anspruch 15, wobei der zweite Wert zum Vergleich basierend auf dem Feld der Vorlage ausgewählt wird, das den ersten Wert enthält.System after Claim 15 , wherein the second value is selected for comparison based on the field of the template containing the first value. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Abrufen der mehreren zweiten elektronischen Dokumente basierend auf dem mindestens einen Transaktionsparameter.System after Claim 11 wherein the system is further configured to: retrieve the plurality of second electronic documents based on the at least one transaction parameter. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Erzeugen eines Alarms, der die identifizierte mindestens eine Auffälligkeit anzeigt.System after Claim 11 wherein the system is further configured to: generate an alert indicating the identified at least one abnormality. System nach Anspruch 11, wobei der mindestens eine Transaktionsparameter einen Transaktionsbetrag, einen Zeithinweis und eine Lieferantenkennung umfasst, wobei die mindestens eine Auffälligkeit einen ungewöhnlichen Wert des Transaktionsbetrags im Vergleich zu in den zweiten elektronischen Dokumenten angegebenen Transaktionsbeträgen enthält.System after Claim 11 wherein the at least one transaction parameter comprises a transaction amount, a time indication, and a vendor identifier, wherein the at least one abnormality includes an unusual value of the transaction amount compared to transaction amounts specified in the second electronic documents.
DE112017003926.6T 2016-08-05 2017-08-03 System and method for monitoring electronic documents Withdrawn DE112017003926T5 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662371234P 2016-08-05 2016-08-05
US62/371,234 2016-08-05
US15/361,934 US20170154385A1 (en) 2015-11-29 2016-11-28 System and method for automatic validation
US15/361,934 2016-11-28
PCT/US2017/045338 WO2018027054A1 (en) 2016-08-05 2017-08-03 Sytem and method for monitoring electronic documents

Publications (1)

Publication Number Publication Date
DE112017003926T5 true DE112017003926T5 (en) 2019-04-18

Family

ID=61074187

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112017003926.6T Withdrawn DE112017003926T5 (en) 2016-08-05 2017-08-03 System and method for monitoring electronic documents

Country Status (4)

Country Link
CN (1) CN109791560A (en)
DE (1) DE112017003926T5 (en)
GB (1) GB2568416A (en)
WO (1) WO2018027054A1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157592A (en) * 2007-12-26 2009-07-16 Canon It Solutions Inc Abnormal transaction detector
US20100161616A1 (en) * 2008-12-16 2010-06-24 Carol Mitchell Systems and methods for coupling structured content with unstructured content
US20120221448A1 (en) * 2011-02-24 2012-08-30 Vision InfoSoft Corporation Method and system for detecting and addressing invoicing anomalies

Also Published As

Publication number Publication date
CN109791560A (en) 2019-05-21
WO2018027054A8 (en) 2019-03-21
WO2018027054A1 (en) 2018-02-08
GB201902676D0 (en) 2019-04-17
GB2568416A (en) 2019-05-15

Similar Documents

Publication Publication Date Title
DE112016005443T5 (en) System and method for automatic validation
US11062132B2 (en) System and method for identification of missing data elements in electronic documents
US11138372B2 (en) System and method for reporting based on electronic documents
US20170169292A1 (en) System and method for automatically verifying requests based on electronic documents
US20170323157A1 (en) System and method for determining an entity status based on unstructured electronic documents
EP3494495A1 (en) System and method for completing electronic documents
US20180025225A1 (en) System and method for generating consolidated data for electronic documents
US20180046663A1 (en) System and method for completing electronic documents
DE112017003926T5 (en) System and method for monitoring electronic documents
DE202018000271U1 (en) Server device for processing transaction data
DE112017002535T5 (en) Provide real-time analysis based on unstructured electronic documents
DE112016006434T5 (en) SYSTEM AND METHOD FOR MAINTAINING DATA INTEGRITY
US20170323106A1 (en) System and method for encrypting data in electronic documents
US20170169519A1 (en) System and method for automatically verifying transactions based on electronic documents
DE112017002569T5 (en) System and method for determining the status of a unit based on unstructured electronic documents
EP3494496A1 (en) System and method for reporting based on electronic documents
WO2017201292A1 (en) System and method for encrypting data in electronic documents
DE112017002533T5 (en) System and method for generating historical data records on unstructured electronic documents
EP3417383A1 (en) Automatic verification of requests based on electronic documents
US20170193609A1 (en) System and method for automatically monitoring requests indicated in electronic documents
EP3458971A1 (en) System and method for automatically monitoring requests indicated in electronic documents
WO2019140056A1 (en) System and method for generating a reissue probability score for a transaction evidence
EP3430584A1 (en) System and method for automatically verifying transactions based on electronic documents
EP3494531A1 (en) System and method for generating consolidated data for electronic documents
EP3491554A1 (en) Matching transaction electronic documents to evidencing electronic

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee