DE112017002535T5 - Bereitstellen von Analysen in Echtzeit basierend auf unstrukurierten elektronischen Dokumenten - Google Patents

Bereitstellen von Analysen in Echtzeit basierend auf unstrukurierten elektronischen Dokumenten Download PDF

Info

Publication number
DE112017002535T5
DE112017002535T5 DE112017002535.4T DE112017002535T DE112017002535T5 DE 112017002535 T5 DE112017002535 T5 DE 112017002535T5 DE 112017002535 T DE112017002535 T DE 112017002535T DE 112017002535 T5 DE112017002535 T5 DE 112017002535T5
Authority
DE
Germany
Prior art keywords
transaction
analysis
electronic document
template
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112017002535.4T
Other languages
English (en)
Inventor
Noam Guzman
Isaac SAFT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vatbox Ltd
Original Assignee
Vatbox Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/361,934 external-priority patent/US20170154385A1/en
Application filed by Vatbox Ltd filed Critical Vatbox Ltd
Publication of DE112017002535T5 publication Critical patent/DE112017002535T5/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Ein System und ein Verfahren zum Erzeugen von Analysen basierend auf unstrukturierten elektronischen Dokumenten. Das Verfahren umfasst das Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktlonsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.

Description

  • QUERVERWEIS ZU ÄHNLICHEN ANMELDUNGEN
  • Diese Anmeldung beansprucht den Nutzen der provisorischen US-Anmeldung Nr. 62/337,885 , die am 18. Mai 2016 eingereicht wurde. Diese Anmeldung ist auch eine „Continuation-in-Part“ der am 28. November 2016 eingereichten US-Patentanmeldung Nr. 15/361,934 , die jetzt anhängig ist. Der Inhalt der oben genannten Patentanmeldungen wird hiermit durch Bezugnahme aufgenommen.
  • TECHNISCHES GEBIET
  • Die vorliegende Offenbarung bezieht sich im Allgemeinen auf das Bereitstellen von Rückerstattungsanalysen und insbesondere auf das Bereitstellen von Rückerstattungsanalysen basierend auf elektronischen Dokumenten.
  • HINTERGRUND
  • Kunden können Bestellungen für Dienste, wie Reisen und Unterkünfte, von Händlern in Echtzeit über das Web aufgeben. Diese Bestellungen können unverzüglich erhalten und bearbeitet werden. Aber Zahlungen für die Bestellungen erfordern gewöhnlich mehr Zeit und insbesondere, um sicherzustellen, dass das Geld überwiesen wird. Aus diesem Grund ersuchen Händler die Kunden gewöhnlich, Gewährleistungen für die Zahlung in Echtzeit zu bieten, wenn die Bestellung aufgegeben wird. Zum Beispiel kann ein Kunde Kreditkarteninformationen nach einer Zahlung eingeben und der Händler kann die Kreditkarteninformationen in Echtzeit überprüfen, bevor er den Verkauf autorisiert. Das Überprüfungssystem umfasst gewöhnlich das Bestimmen, ob die zur Verfügung gestellten Informationen gültig sind (d. h. dass eine Kreditkartennummer, das Ablaufdatum, der PIN-Code und/oder der Kundenname mit den bekannten Informationen übereinstimmen).
  • Nach Erhalt dieser Bestätigungen kann eine Kaufbestellung für den Kunden erzeugt werden. Die Kaufbestellung bietet den Nachweis der Bestellung als solche, zum Beispiel einen Kaufpreis, die bestellten Waren und/oder Dienstleistungen und dergleichen. Später kann eine Rechnung für die Bestellung erstellt werden. Während die Kaufbestellung gewöhnlich verwendet wird, um anzugeben, welche Produkte angefordert werden, bzw. eine Schätzung oder ein Angebot des Preises, wird die Rechnung gewöhnlich verwendet, um darauf hinzuweisen, welche Produkte tatsächlich zur Verfügung gestellt wurden, sowie den endgültigen Preis für die Produkte. Häufig weicht der Kaufpreis, wie er in der Rechnung für die Bestellung angeführt wird, vom Kaufpreis ab, wie er in der Kaufbestellung angeführt wird. Wenn ein Gast zum Beispiel in einem Hotel anfänglich drei Übernachtungen bucht, aber schlussendlich vier Nächte bleibt, kann der Gesamtpreis der Kaufbestellung einen anderen Gesamtpreis als die nachfolgende Rechnung aufweisen. Fälle, bei denen der Gesamtpreis der Rechnung vom Gesamtpreis der Kaufbestellung abweicht, sind schwer nachvollziehbar, insbesondere in großen Unternehmen, die täglich viele Buchungen entgegennehmen (z. B. in einer großen Hotelkette, die hunderte oder tausende Hotels in einem gegebenen Land verwaltet). Die Unterschiede können zu Fehlern in der Buchführung der Unternehmen führen.
  • Nachdem Unternehmen vermehrt auf Technologien angewiesen sind, um Daten in Bezug auf Operationen, wie Rechnungsstellung und Kaufbestelldaten, zu verwalten, sind geeignete Systeme für die entsprechende Verwaltung und Sammlung von Daten zu einem entscheidenden Erfolgsfaktor geworden. Insbesondere für große Gesellschaften kann die Datenmenge, die von Geschäften täglich verwendet werden, überwältigend sein. Dementsprechend erweist sich die manuelle Überprüfung und Sammlung solcher Daten bestenfalls als unpraktisch.
  • Es gibt einige Lösungen für die automatische Informationserfassung in gescannten Dokumenten (z. B. Rechnungen und Belege) oder anderen unstrukturierten elektronischen Dokumenten (z. B. unstrukturierte Textdateien). Solche Lösungen stehen oft vor der Herausforderung, Zeichen und andere Merkmale von elektronischen Dokumenten genau zu identifizieren und zu erkennen. Ferner kann eine Verschlechterung des Inhalts der eingehenden unstrukturierten elektronischen Dokumente typischerweise zu höheren Fehlerraten führen. Unter idealen Umständen sind folglich bestehende Bilderkennungstechniken nicht gänzlich präzise (d. h. sehr klare Bilder) und ihre Präzision verschlechtert sich wesentlich, je unschärfer die eingegeben Bilder sind. Darüber hinaus können fehlende oder anderweitig unvollständige Daten zu Fehlern bei der folgenden Datennutzung führen. Viele bestehende Lösungen können fehlende Daten nicht identifizieren, es sei denn, ein Feld in einem strukturierten Datensatz wird beispielsweise unvollständig gelassen.
    Außerdem sind bestehende Bilderkennungslösungen möglicherweise nicht in der Lage, einige oder alle Sonderzeichen (z. B. „!“, „@“, „#“, „$“, „©“. „%“, „&“ etc.) genau zu identifizieren. Zum Beispiel identifizieren einige bestehende Bilderkennungslösungen möglicherweise einen in einem gescannten Beleg beinhalteten Strich als die Zahl „1“. Ein weiteres Beispiel ist, dass einige bestehende Bilderkennungslösungen Sonderzeichen, wie das Dollar-Zeichen, das Yen-Zeichen, etc. nicht identifizieren können.
  • Solche Lösungen können ferner Schwierigkeiten haben, die erkannten Informationen für die nachfolgende Nutzung aufzubereiten. Insbesondere erzeugen viele solcher Lösungen eine Ausgabe in einem unstrukturierten Format, oder sie können nur strukturierte Ausgaben erzeugen, wenn die eingegebenen elektronischen Dokumente für die Erkennung durch ein Bilderkennungssystem spezifisch formatiert sind. Das unstrukturierte Ausgabeergebnis kann typischerweise nicht effizient verarbeitet werden. Im Speziellen kann eine solche unstrukturierte Ausgabe Duplikate und Daten beinhalten, welche eine nachfolgende Verarbeitung vor der Nutzung erfordert. Aus diesem Grund beauftragen Unternehmen gewöhnlich Wirtschaftsprüfungsgesellschaften für die manuelle Überprüfung von gescannten Belegen und anderen unstrukturierten elektronischen Dokumenten. Diese Gesellschaften sind allerdings oft unerschwinglich teuer und die Tätigkeit ist stets für menschliche Fehler anfällig.
  • Daher würde es vorteilhaft sein, eine Lösung bereitzustellen, die diese Unzulänglichkeiten beim derzeitigen Stand der Technik beheben.
  • ZUSAMMENFASSUNG
  • Eine Zusammenfassung von mehreren beispielhaften Ausführungsformen der Offenbarung folgt. Diese Zusammenfassung dient dem besseren Verständnis für den Leser, um grundlegende Kenntnisse dieser Ausführungsformen zu bieten, und sie definiert nicht den gesamten Umfang der Offenbarung. Diese Zusammenfassung ist keine ausführliche Übersicht aller vorgesehenen Ausführungsformen und ist weder dazu bestimmt, wichtige oder entscheidende Elemente aller Ausführungsformen zu identifizieren, noch den Anwendungsbereich jeder oder aller Aspekte einzuschränken. Ihr einziger Zweck ist es, einige Konzepte von einigen oder mehreren Ausführungsformen in vereinfachter Form als eine Einleitung zur detaillierteren Beschreibung, die danach präsentiert wird, vorzustellen. Der Einfachheit halber kann der Begriff „einige Ausführungsformen“ hierin verwendet werden, um Bezug auf eine einzige Ausführungsform oder mehrere Ausführungsformen der Offenbarung zu nehmen.
  • Bestimmte, hierin offenbarte Ausführungsformen umfassen ein Verfahren zum Erzeugen von Analysen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten. Das Verfahren umfasst: Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktionsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.
  • Bestimmte, hierin offenbarte Ausführungsformen umfassen auch ein nicht-flüchtiges computerlesbares Medium, das darauf Befehle gespeichert hat, die bewirken, dass eine Verarbeitungsschaltung ein Verfahren ausführt, wobei das Verfahren Folgendes umfasst: Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktionsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.
  • Bestimmte, hierin offenbarte Ausführungsformen umfassen auch ein System zum Erzeugen von Analysen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten. Das System umfasst: eine Verarbeitungsschaltung; und einen Arbeitsspeicher, wobei der Arbeitsspeicher Befehle umfasst, die, wenn sie von der Verarbeitungsschaltung ausgeführt werden, das System konfigurieren zum: Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktionsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest die Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.
  • Figurenliste
  • Der hierin offenbarte Gegenstand wird in den Ansprüchen am Ende der Spezifikation hervorgehoben und klar beansprucht. Das Vorstehende und andere Objekte, Eigenschaften und Vorteile der offenbarten Ausführungsformen werden anhand der folgenden detaillierten Beschreibung in Verbindung mit den begleitenden Zeichnungen deutlicher verständlich.
    • 1 ist eine Netzwerk-Darstellung, die verwendet wird, um die verschiedenen offenbarten Ausführungsformen zu beschreiben.
    • 2 ist eine schematische Darstellung eines Dokumentenanalysators gemäß einer Ausführungsform.
    • 3 ist ein Fließschema, das ein Verfahren zum Erzeugen von Analysen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten gemäß einer Ausführungsform darstellt.
    • 4 ist ein Fließschema, dass ein Verfahren zum Erstellen eines Datensatzes basierend auf zumindest einem elektronischen Dokument gemäß einer Ausführungsform darstellt.
  • DETAILLIERTE BESCHREIBUNG
  • Es ist zu beachten, dass die hierin offenbarten Ausführungsformen nur Beispiele der zahlreichen vorteilhaften Nutzungen der innovativen Lehren hierin sind. Im Allgemeinen schränken in der Spezifikation der vorliegenden Anmeldung getätigte Aussagen nicht notwendigerweise eine der zahlreichen beanspruchten Ausführungsformen ein. Ferner finden einige Aussagen für erfinderische Funktionen Anwendung, aber für andere möglicherweise nicht. Sofern nichts anderes angeführt wird, können einzelne Elemente im Allgemeinen in der Mehrzahl sein und umgekehrt und das ohne Einschränkung der Allgemeinheit. In den Zeichnungen beziehen sich gleiche Nummern auf gleiche Teile in den verschiedenen Ansichten.
  • Die verschiedenen offenbarten Ausführungsformen umfassen ein Verfahren und System zum Erzeugen von Analysen basierend auf elektronischen Dokumenten. In einer Ausführungsform wird zumindest ein Datensatz basierend auf elektronischen Dokumenten erstellt, die Transaktionsinformationen in Bezug auf ein Unternehmen enthalten. Ein Template der Transaktionsattribute wird basierend auf jedem elektronischen Dokumentdatensatz erstellt. Die Templates sind strukturierte Datensätze, die basierend auf zumindest teilweise unstrukturierten Daten, welche mittels maschineller Bildgebung der elektronischen Dokumente erzeugt werden, erstellt werden.
  • Basierend auf den erstellten Templates wird ein Land von jeder Transaktion, das von einem der Templates angegeben wird, bestimmt. Zumindest ein Transaktionsanalyseregelsatz wird basierend auf den bestimmten Ländern erhalten. Basierend auf den erstellten Templates und dem zumindest einen Unternehmensparameter werden Analysen unter Verwendung des zumindest einen Transaktionsanalyseregelsatzes erzeugt. Die Unternehmensparameter können in Bezug auf ein basierend auf den Transaktionsparametern in den erstellten Templates identifizierten Unternehmen erhalten werden. Basierend auf den Analysen kann eine Meldung bereitgestellt werden, die eine Möglichkeit für eine Mehrwertsteuer-Rückerstattung angibt.
  • 1 zeigt eine beispielhafte Netzwerk-Darstellung 100, die verwendet wird, um die verschiedenen offenbarten Ausführungsformen zu beschrieben. In der beispielhaften Netzwerk-Darstellung 100 sind ein Dokumentenanalysator 120, ein Untemehmenssystem 130, eine Datenbank 140 und eine Vielzahl von Web-Quellen 150-1 bis 150-N (nachstehend der Einfachheit halber einzeln als eine Web-Quelle 150 und gemeinsam als Web-Quellen 150 bezeichnet) über ein Netzwerk 110 kommunikativ verbunden. Das Netzwerk 110 kann ohne Einschränkungen ein kabelloses, mobiles oder verkabeltes Netzwerk, ein lokales Netzwerk (LAN), ein Weitbereichsnetzwerk (WAN), Metrobereichsnetzwerk (MAN), das Internet, das weltweite Netz (WWW), ähnliche Netzwerke und eine Kombination davon sein.
  • Das Unternehmenssystem 130 ist mit einem Unternehmen verbunden und kann Daten in Bezug auf Transaktionen speichern, die das Unternehmen oder Vertreter des Unternehmens betreffen, sowie Daten in Bezug auf das Unternehmen selbst. Das Unternehmen kann ohne Einschränkungen ein Unternehmen sein, wie eine Gesellschaft, deren Mitarbeiter Waren und Dienstleistungen entsprechend ihren Rollen und Verantwortungen kaufen können. Das Unternehmenssystem 130 kann ohne Einschränkungen ein Server, eine Datenbank, ein Planungssystem von Unternehmensressourcen, ein Verwaltungssystem für Kundenbeziehungen oder jedes andere System sein, das entsprechende Daten speichert.
  • Die vom Unternehmenssystem 130 gespeicherten Daten können ohne Einschränkungen elektronische Dokumente (z. B. eine Bilddatei, die beispielsweise ein Scan einer Rechnung zeigt, eine Textdatei, eine Arbeitsblattdatei, etc.), Unternehmensparameter oder beides umfassen. Jedes elektronische Dokument kann z. B. eine Rechnung, ein Steuerbeleg, ein Kaufnummernnachweis etc. sein. Daten, die in zumindest einigen der elektronischen Dokumenten beinhaltet sind, sind zumindest teilweise unstrukturiert, derart, dass die Daten möglicherweise strukturiert, halbstrukturiert, unstrukturiert oder eine Kombination davon sein können. Die strukturierten oder halbstrukturierten Daten können in einem Format sein, das vom Dokumentenanalysator 120 nicht erkannt wird, und aus diesem Grund werden sie möglicherweise als unstrukturierte Daten gehandhabt.
  • Die Unternehmensparameter können ohne Einschränkungen ein Land der Gründung (z. B. ein Gründungsland), einen Hinweis darauf, ob es sich beim Unternehmen um ein Privatunternehmen oder ein börsennotiertes Unternehmen handelt, ob das Unternehmen Niederlassungen hat, ob das Unternehmen im Besitz eines anderen Unternehmens steht, eine Kombination davon, und dergleichen umfassen.
  • Jedes elektronische Dokument kann mit einer das Unternehmen betreffenden Transaktion in Verbindung stehen. Daher können die elektronischen Dokumente zumindest dem Unternehmen bei der Transaktion entstandenen Kosten und andere diesbezügliche Informationen angeben. Als Beispiel kann ein elektronisches Dokument eine Art von gekaufter Ware oder Dienstleistung (z. B. ein Aufenthalt in einem Hotel), eine Transaktionszeit, einen Einheitspreis, eine Menge, einen Käufer, einen Lieferanten (z. B. einen Verkäufer oder Hersteller), Angaben zum Lieferanten (z. B. Name, Händlerregistrierungsnummer etc.), Kombinationen davon und dergleichen angeben.
  • Die Datenbank 140 speichert zumindest Analysen in Verbindung mit einer Vielzahl von Unternehmen, die vom Dokumentenanalysator 120 erzeugt werden. Die Datenbank 140 kann auch Meldungen speichern, die vom Dokumentenanalysator 120 erzeugt werden.
  • Zumindest einige der Web-Quellen 150 speichern zumindest Regeln in Bezug auf Rückerstattungen der Mehrwertsteuer (MwSt.). Die Web-Quellen 150 können ohne Einschränkungen Steuerbehördenserver, Buchhaltungsserver und dergleichen umfassen.
  • In einer Ausführungsform ist der Dokumentenanalysator 120 konfiguriert, um Templates basierend auf Transaktionsparametern zu erstellen, die unter Verwendung von maschineller Bildverarbeitung von zumindest teilweise unstrukturierten elektronischen Dokumenten, welche Informationen in Bezug auf Transaktionen angeben, identifiziert wurden. In einer weiteren Ausführungsform kann ein Dokumentenanalysator 120 konfiguriert sein, um die elektronischen Dokumente beispielsweise von einem Unternehmenssystem 130 abzurufen. Alternativ oder kollektiv können elektronische Dokumente von Kundengeräten (nicht dargestellt) abgerufen werden, die von Mitarbeitern oder anderen Vertretern des Unternehmens verwendet werden. Basierend auf den erstellten Templates erzeugt der Dokumentenanalysator 120 Analysen für das Unternehmen und kann ferner Meldungen erzeugen, die die Möglichkeit für MwSt.-Rückerstattungen für Transaktionen angeben, welche in den elektronischen Dokumenten angegeben werden.
  • Jedes Template ist ein strukturierter Datensatz, der die identifizierten Transaktionsparameter für eine Transaktion beinhaltet. Die Transaktionsparameter geben Informationen in Verbindung mit der Transaktion an, die im elektronischen Dokument angegeben werden, wie beispielsweise und ohne Einschränkungen, eine Art von gekaufter Ware oder Dienstleistung (z. B. ein Aufenthalt in einem Hotel), eine Transaktionszeit, einen Einheitspreis, eine Menge, einen Käufer, einen Lieferanten (z. B. einen Verkäufer oder Hersteller), Angaben zum Lieferanten (z. B. Name, Händlerregistrierungsnummer etc.) und dergleichen.
  • In einer Ausführungsform ist der Dokumentenanalysator 120 konfiguriert, um Datensätze basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten zu erstellen, einschließlich Daten, die zumindest teilweise eine nicht bekannte Struktur aufweisen (z. B. unstrukturierte Daten, halbstrukturierte Daten oder strukturierte Daten mit einer unbekannten Struktur). Dazu kann der Dokumentenanalysator 120 in einer weiteren Ausführungsform weiter konfiguriert werden, um eine optische Zeichenerkennung (OCR) oder andere Bildverarbeitung zu verwenden, damit Daten im elektronischen Dokument verarbeitet werden können. Der Dokumentenanalysator 120 kann ferner einen Erkennungsprozessor (z. B. Erkennungsprozessor 235, 2) umfassen oder kommunikativ mit ihm verbunden sein. Basierend auf den Datensätzen ist der Dokumentenanalysator 120 konfiguriert, um die Templates zu erstellen.
  • In einer anderen Ausführungsform kann der Dokumentenanalysator 120 ferner konfiguriert werden, um jedes elektronische Dokument basierend auf seinem jeweiligen Template zu überprüfen. Die Überprüfung kann ohne Einschränkungen Bestimmen, ob jedes elektronische Dokument vollständig und korrekt ist.
  • Jedes elektronische Dokument kann als vollständig festgelegt werden, wenn beispielsweise eine oder mehrere vorbestimmte Meldeanforderungen erfüllt sind (z. B. für einen Kauf können entsprechende Anforderungen Arten von gekauften Waren oder Dienstleistungen, den Gesamtpreis, die Menge, den Lieferanten etc. umfassen).
  • Jedes elektronische Dokument kann basierend auf Daten als korrekt festgelegt werden, die in zumindest einer externen Quelle gespeichert sind. Die zumindest eine externe Quelle kann ohne Einschränkungen ein oder mehrere Web-Quellen oder andere Datenquellen (nicht dargestellt) umfassen. Zum Beispiel kann ein Händler-Server eines Händlers, der der Verkäufer in einer Transaktion war, für Metadaten in Bezug auf das in Verbindung mit der Transaktion stehende elektronische Dokument abgefragt werden und die über die Abfrage erhaltenen Metadaten können mit den Daten des Templates für das elektronische Dokument verglichen werden. Die über die Abfrage erhaltenen Metadaten können beispielsweise einen Preis der Transaktion, einen Transaktionsidentifikator und dergleichen umfassen, welche mit den Daten in den entsprechenden Feldern des Templates, das für die Transaktion erstellt wurde, verglichen werden.
  • In einer Ausführungsform ist der Dokumentenanalysator 120 konfiguriert, um Unternehmensparameter in Verbindung mit einem Unternehmen zu erhalten, das von den Transaktionsparametern der erstellten Templates angegeben wird. Die Unternehmensparameter können vom Unternehmenssystem 130, einer Datenquelle (z. B. eine der Web-Quellen 150) und dergleichen bezogen werden. In einer weiteren Ausführungsform können die Unternehmensparameter in Bezug auf ein Unternehmen, das für alle Templates gleich ist, erhalten werden. Wenn zum Beispiel jedes der erstellten Templates ein „Käufer“-Feld mit dem gleichen Unternehmensnamen umfasst (d. h. wenn der Käufer für jede Transaktion der gleiche ist), können die Unternehmensparameter von einer Datenquelle abgerufen werden, die mit dem Käuferunternehmen in Verbindung steht.
  • In einer Ausführungsform ist der Dokumentenanalysator 120 basierend auf den erstellten Templates konfiguriert, um zumindest das eine Land zu bestimmen, in dem eine Transaktion, die das Unternehmen betrifft, stattgefunden hat. In einer weiteren Ausführungsform kann jedes Land in einem „Ort (Land)“-Feld von einem der erstellten Templates angegeben werden.
  • Für jedes bestimmte Land ist der Dokumentenanalysator 120 in einer Ausführungsform konfiguriert, um einen Transaktionsanalysedatensatz zu erhalten. Jeder Transaktionsanalysedatensatz kann ein MwSt.-Rückerstattungsdatensatz sein, der für das Bestimmen, ob eine Transaktion für eine MwSt.-Rückerstattung berechtigt ist, einer Erfolgswahrscheinlichkeit basierend auf den elektronischen Dokumenten und den Transaktionsparametern oder beiden, verwendet wird. In einer weiteren Ausführungsform kann der Dokumentenanalysator 120 konfiguriert sein, um jeden Transaktionsanalysedatensatz von einer der Web-Quellen 150 abzurufen. In noch einer weiteren Ausführungsform wird jeder Transaktionsanalysedatensatz von einer der Web-Quellen 150 erhalten, die mit einem der bestimmten Länder in Verbindung steht. Die Web-Quellen 150 können beispielsweise Steuerbehördenserver umfassen, die mit einer Vielzahl von Ländern verbunden sind, und Transaktionsanalysedatensätze können von Steuerbehördenserver von Orten von Transaktionen, die in den Templates angegeben werden, erhalten werden.
  • In einer Ausführungsform ist der Dokumentenanalysator 120 konfiguriert, um zumindest eine Analyse basierend auf den Templates und den Unternehmensparametern zu erzeugen. In einer weiteren Ausführungsform ist der Dokumentenanalysator 120 konfiguriert, um einen der Transaktionsanalysedatensätze bei den Transaktionsparametern von jedem Template und den Unternehmensparametern zu verwenden. Jeder angewandte Transaktionsanalysedatensatz wird bei Transaktionsparameter eines Templates verwendet, das das Land des Transaktionsanalysedatensatzes angibt.
  • In einer Ausführungsform gibt die Analyse Informationen in Bezug auf eine mögliche MwSt.-Rückerstattung für die Transaktionen oder für jede Transaktion an und kann ohne Einschränkungen einen möglichen Betrag der MwSt.-Rückerstattung, die in Bezug auf jede Transaktion erhalten werden kann, einen Gesamtbetrag von möglichen MwSt.-Rückerstattungen für zumindest eine Gruppe der Transaktionen, eine Erfolgswahrscheinlichkeit zum Erhalt einer MwSt.-Rückerstattung unter Verwendung jedes analysierten elektronischen Dokuments und dergleichen umfassen. In einer weiteren Ausführungsform kann die Analyse beispielsweise in einer Datenbank (z. B. die Datenbank 140) gespeichert, an ein Unternehmenssystem 130 gesendet, zur Anzeige auf ein Benutzergerät (nicht dargestellt) gesendet werden, eine Kombination davon, und dergleichen.
  • In einer anderen Ausführungsform kann das Erzeugen von Analysen ferner das Vergleichen der Unternehmensparameter und der Transaktionsparameter jedes Templates mit einer Vielzahl von vorbestimmten Sätzen an Unternehmensparametern und Transaktionsparametern, die mit bekannten MwSt.-Rückerstattungserfolgsereignissen in Verbindung stehen, umfassen. In einer weiteren Ausführungsform kann basierend auf dem Vergleich eine Erfolgswahrscheinlichkeit für die Rückerstattung jeder Transaktion bestimmt werden.
  • Als nicht-einschränkendes Beispiel ruft ein Dokumentenanalysator 120 gescannte Rechnungen von einem Unternehmenssystem eines Unternehmens ab, um Informationen in Bezug auf mögliche MwSt.-Rückerstattungen zu erhalten. Die gescannten Rechnungen werden analysiert und strukturierte Datensatz-Templates werden basierend auf der Analyse erstellt. Unternehmensparameter, die darauf hinweisen, dass das Unternehmen ein Pharmaunternehmen ist, und dass das Unternehmen in Deutschland gegründet wurde, werden vom Unternehmenssystem 130 abgerufen. Ein Land wird für jede Transaktion basierend auf Transaktionsparametern in einem „Ort“-Feld jedes Templates bestimmt. Der Dokumentenanalysator 120 ruft MwSt.-Rückerstattungsregeln von einem Steuerbehördenserver in Verbindung mit jedem bestimmten Land ab. Basierend auf den MwSt.-Rückerstattungsregeln, den Unternehmensparametern und den erstellten Templates können Analysen, die auf die MwSt.-Rückerstattungen hinweisen, für zumindest einige der in den elektronischen Dokumenten angegebenen Transaktionen erhalten werden, und dass $ 50.000 USD für die Transaktionen rückerstattet werden können.
  • Es ist zu beachten, dass die hierin oben in Bezug auf 1 beschriebenen Ausführungsformen, in Bezug auf ein Unternehmenssystem 130 vorwiegend der Einfachheit halber und ohne Einschränkungen bzgl. der offenbarten Ausführungsformen beschrieben wurden. Mehrere Unternehmenssysteme können gleichermaßen ohne Abweichung vom Anwendungsbereich der Offenbarung verwendet werden.
  • 2 ist eine beispielhafte schematische Darstellung des Dokumentenanalysators 120 gemäß einer Ausführungsform. Der Dokumentenanalysator 120 umfasst eine Verarbeitungsschaltung 210, die an einen Arbeitsspeicher 215, einen Speicher 220 und eine Netzwerk-Schnittstelle 240 gekoppelt ist. In einer Ausführungsform kann der Dokumentenanalysator 120 einen optischen Zeichenerkennungsprozessor (OCR) 230 umfassen. In einer anderen Ausführungsform können die Komponenten des Dokumentenanalysators 120 über einen Bus 250 kommunikativ verbunden sein.
  • Die Verarbeitungsschaltung 210 kann als eine oder mehrere Hardware-Logik-Komponenten und -Schaltungen realisiert werden. Zum Beispiel und ohne Einschränkungen können illustrative Arten von Hardware-Logik-Komponenten feldprogrammierbare Gate-Arrays (FPGAs), anwendungsspezifische integrierte Schaltungen (ASICs), anwendungsspezifische Standardprodukte (ASSPs), Systeme auf einem Chip (SOCs), Mehrzweck-Mikroprozessoren, Mikrocontroller, Digitalsignalverarbeiter (DSPs) und dergleichen sein, oder alle andere Hardware-Logik-Komponenten, die Rechnungen oder andere Informationsverarbeitungen ausführen können.
  • Der Arbeitsspeicher 215 kann flüchtig (z. B. RAM etc.), nicht flüchtig (z. B. ROM, Flash-Speicher etc.) oder eine Kombination davon sein. In einer Ausführungsform können computerlesbare Befehle zum Umsetzen von einer oder mehreren hierin offenbarten Ausführungsformen im Speicher 220 gespeichert werden.
  • In einer anderen Ausführungsform kann der Arbeitsspeicher 215 zum Speichern von Software konfiguriert sein. Mit Software ist im weiteren Sinne jede Art von Befehlen gemeint, sei sie als Software, Firmware, Middleware, Mikrocode, Hardware-Beschreibungssprache oder anders bezeichnet. Befehle können Codes umfassen (z. B. in einem Quellcode-Format, Binärcode-Format, Format eines ausführbaren Codes oder jedes andere geeignete Code-Format). Die Befehle, wenn sie von einem oder mehreren Prozessoren ausgeführt werden, bewirken, dass die Verarbeitungsschaltung 210 die hierin beschriebenen unterschiedlichen Prozesse ausführt. Insbesondere bewirken die Befehle, wenn sie ausgeführt werden, dass die Verarbeitungsschaltung 210 Analysen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten, wie hierin erläutert, erzeugt.
  • Der Speicher 220 kann ein magnetischer Speicher, optischer Speicher und dergleichen sein, und kann beispielsweise als ein Flash-Speicher oder andere Speichertechnologie, CD-ROM, vielseitige digitale Disketten (DVDs) oder jedes andere Medium realisiert sein, das verwendet werden kann, um die gewünschten Informationen zu speichern.
  • Der OCR-Prozessor 230 kann ohne Einschränkungen einen Merkmal- und/oder Mustererkennungsprozessor (RP) 235 umfassen, der konfiguriert ist, um Muster, Merkmale oder beide in zumindest teilweise unstrukturierten Datensätzen zu identifizieren. Insbesondere ist der OCR-Prozessor 230 in einer Ausführungsform konfiguriert, um zumindest Zeichen in den unstrukturierten Daten zu identifizieren. Die identifizierten Zeichen können verwendet werden, um einen Datensatz zu erstellen, der Daten umfasst, die für das Analysieren von Transaktionen und das Erzeugen von Empfehlungen basierend auf diesen erforderlich sind.
  • Mit der Netzwerk-Schnittstelle 240 kann der Dokumentenanalysator 120 mit dem Unternehmenssystem 130, der Datenbank 140 oder beiden für Zwecke, wie beispielsweise zum Erhalten von elektronischen Dokumenten, Speichern von Transaktionsverlaufsaufzeichnungen, Erhalten von Transaktionsverlaufsaufzeichnungen, Senden von Empfehlungen und dergleichen, kommunizieren.
  • Es sollte verstanden werden, dass sich die hierin beschriebenen Ausführungsformen nicht auf die spezifische, in 2 dargestellte Architektur beschränken, und andere Architekturen können gleichermaßen verwendet werden, ohne vom Anwendungsbereich der offenbarten Ausführungsformen abzuweichen.
  • 3 ist ein beispielhaftes Fließschema 300, das ein Verfahren zum Erzeugen von Analysen basierend auf elektronischen Dokumenten gemäß einer Ausführungsform darstellt. In einer Ausführungsform wird das Verfahren durch den Dokumentenanalysator 120 ausgeführt. In einer anderen Ausführungsform kann die Analyse eine MwSt.-Rückerstattungsanalyse für Transaktionen sein, die in den elektronischen Dokumenten angegeben werden.
  • In S310 wird ein Datensatz für jedes elektronische Dokument, das Informationen in Verbindung mit einer Transaktion umfasst, erstellt. Jedes elektronische Dokument gibt zumindest teilweise unstrukturierte Daten einer Transaktion, an der das Unternehmen beteiligt ist, an und kann ohne Einschränkungen unstrukturierte Daten, halbstrukturierte Daten, strukturierte Daten mit einer unerwarteten oder unangekündigten Struktur oder eine Kombination davon umfassen. In einer Ausführungsform kann S310 ferner das Analysieren jedes elektronischen Dokuments unter Verwendung von optischer Zeichenerkennung (OCR) umfassen, um Daten im elektronischen Dokument zu erfassen, indem Schlüsselfelder in den Daten identifiziert werden, Werte in den Daten identifiziert werden oder eine Kombination davon. Das Erstellen von Datensätzen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten wird hierin nachstehend in Bezug auf 4 weiter beschrieben.
  • In S320 werden die Datensätze analysiert. In einer Ausführungsform kann das Analysieren jedes Datensatzes ohne Einschränkungen das Bestimmen von Transaktionsparametern umfassen, wie, ohne Einschränkungen, zumindest einen Unternehmensidentifikator (z. B. einen Kundenunternehmensidentifikator, einen Händlerunternehmensidentifikator oder beide), Informationen in Bezug auf die Transaktion (z. B. ein Datum, eine Uhrzeit, einen Preis, eine Art von verkauften Waren oder Dienstleistungen etc.) oder beide. In einer weiteren Ausführungsform kann das Analysieren jedes Datensatzes ferner das Identifizieren der Transaktion basierend auf dem Datensatz umfassen.
  • In S330 wird ein Template basierend auf jedem analysierten Datensatz erstellt. Das Template kann ohne Einschränkungen eine Datenstruktur sein, die eine Vielzahl an Feldern umfasst. Die Felder können die identifizierten Transaktionsparameter umfassen. Die Felder können vordefiniert sein.
  • Das Erstellen von Templates von elektronischen Dokumenten ermöglicht eine schnellere Verarbeitung aufgrund der strukturierten Art der erstellten Templates. So können beispielsweise Abruf- und Verarbeitungsoperationen bei strukturierten Datensätzen effizienter als bei Datensätzen ausgeführt werden, die diese Struktur nicht aufweisen. Ferner kann durch das Organisieren von Informationen von elektronischen Dokumenten in strukturierte Datensätze die für das Speichern der in den elektronischen Dokumenten beinhalteten Informationen erforderliche Speichermenge wesentlich reduziert werden. Elektronische Dokumente sind oft Bilder, die mehr Speicherplatz erfordern als Datensätze, die die gleichen Informationen enthalten. Dementsprechend können Datensätze, die Daten von 100.000 elektronischen Bilddokumenten darstellen, als Datenaufzeichnungen in einer Textdatei gespeichert werden. Eine Größe einer solchen Textdatei würde wesentlich weniger sein als die Größe der 100.000 Bilder.
  • In S340 wird zumindest ein Unternehmensparameter erhalten. In einer Ausführungsform wird der zumindest eine Unternehmensparameter von einem mit der Einrichtung in Verbindung stehenden Unternehmenssystem abgerufen. In einer anderen Ausführungsform kann S340 das Identifizieren des Unternehmens basierend auf den Templates und das Abrufen des zumindest einen Unternehmensparameters basierend auf dem identifizierten Unternehmen umfassen. Das identifizierte Unternehmen kann ein Unternehmen sein, das unter allen Templates gleich ist.
  • In S350 wird basierend auf den erstellten Templates zumindest ein Ort bestimmt. Jeder bestimmte Ort wird in zumindest einem der erstellten Templates angegeben. In einer Ausführungsform kann S350 das Identifizieren eines Transaktionsparameters in einem „Ort“-Feld von jedem Template umfassen, wo der identifizierte Transaktionsparameter auf den Ort einer Transaktion hinweist.
  • In S360 wird basierend auf dem bestimmten, zumindest einem Ort zumindest ein Transaktionsanalyseregelsatz erhalten. Jeder Transaktionsanalyseregelsatz kann von einer Datenquelle (z. B. eine der Web-Quellen 150, 1), die mit einem der bestimmten Orte in Verbindung steht, erhalten werden. Zum Beispiel kann jeder bestimmte Ort ein Land sein und jeder Transaktionsanalyseregelsatz kann ein MwSt.-Rückerstattungsanforderungsregelsatz sein, der von einem Steuerbehördenserver entsprechend einem der Länder abgerufen wird.
  • In S370 werden Analysen basierend auf dem zumindest einen Unternehmensparameter und den erstellten Templates erzeugt. In einer weiteren Ausführungsform ist der Dokumentenanalysator 120 konfiguriert, um einen der Transaktionsanalysedatensätze bei den Transaktionsparametern von jedem Template und den Unternehmensparametern zu verwenden. Jeder angewandte Transaktionsanalysedatensatz wird bei Transaktionsparameter eines Templates verwendet, dass das Land des Transaktionsanalysedatensatzes angibt.
  • In einer Ausführungsform gibt die Analyse Informationen in Bezug auf eine mögliche MwSt.-Rückerstattung für die Transaktionen oder für jede Transaktion an und kann ohne Einschränkungen einen möglichen Betrag der MwSt.-Rückerstattung, die in Bezug auf jede Transaktion erhalten werden kann, einen Gesamtbetrag von möglichen MwSt.-Rückerstattungen für zumindest eine Gruppe der Transaktionen, eine Erfolgswahrscheinlichkeit zum Erhalt einer MwSt.-Rückerstattung unter Verwendung jedes analysierten elektronischen Dokuments und dergleichen umfassen.
  • In einer Ausführungsform kann das Erzeugen von zumindest einigen der Analysen das Vergleichen des zumindest einen Unternehmensparameters und der Transaktionsparameter jedes Templates mit einer Vielzahl von vorbestimmten Sätzen an Unternehmensparametern und Transaktionsparametern, die mit bekannten MwSt.-Rückerstattungsergebnissen in Verbindung stehen, umfassen. Der Vergleich kann verwendet werden, um z. B. eine Erfolgswahrscheinlichkeit der MwSt.-Rückerstattung für jede Transaktion basierend auf dem zumindest einen Unternehmensparameter und den Transaktionsparametern der Transaktion zu bestimmen, zum Beispiel basierend auf einem Anteil an erfolgreichen MwSt.-Rückerstattungen, bei denen Unternehmens- und Transaktionsparameter den bestimmten Unternehmens- und Transaktionsparameter über einer vorbestimmten Schwelle entsprechen. Als nicht einschränkendes Beispiel kann der Vergleich für eine Reiseagentur in Italien mit Parametern von anderen Reiseagenturen in der Europäischen Union erfolgen.
  • In S380 kann die erzeugte Analyse bereitgestellt werden. In einer Ausführungsform kann das Bereitstellen von Analysen ohne Einschränkungen das Speichern der Analysen in einer Datenbank, das Senden der Analyse an ein Unternehmenssystem, das Senden der Analysen zur Anzeige auf einem Benutzergerät oder eine Kombination davon umfassen.
  • 4 ist ein beispielhaftes Fließschema S310, das ein Verfahren zum Erstellen eines Datensatzes basierend auf einem elektronischen Dokument gemäß einer Ausführungsform darstellt.
  • In S410 wird das elektronische Dokument erhalten. Das Erhalten des elektronischen Dokuments kann ohne Einschränkungen das Empfangen des elektronischen Dokuments (z. B. Empfangen eines gescannten Bildes) oder das Abrufen des elektronischen Dokuments (z. B. Abrufen des elektronischen Dokuments von einem Kundenunternehmenssystems, einem Händlerunternehmenssystems oder einer Datenbank) umfassen.
  • In S420 wird das elektronische Dokument analysiert. Die Analyse kann ohne Einschränkungen das Verwenden einer optischen Zeichenerkennung (OCR) umfassen, um Zeichen im elektronischen Dokument zu bestimmen.
  • In S430 werden Schlüsselfelder und Werte im elektronischen Dokument basierend auf der Analyse identifiziert. Das Schlüsselfeld kann ohne Einschränkungen den Namen und die Adresse des Händlers, Datum, Währung, verkaufte Waren oder Dienste, einen Transaktionsidentifikator, eine Rechnungsnummer und so weiter umfassen. Ein elektronisches Dokument kann unnötige Details umfassen, die nicht als Schlüsselwerte gelten. So kann ein Logo des Händlers nicht erforderlich sein und stellt somit keinen Schlüsselwert dar. In einer Ausführungsform kann eine Liste an Schlüsselfeldern vordefiniert werden und Datenteile, die den Schlüsselfeldern möglicherweise entsprechen, können extrahiert werden. Dann wird ein Bereinigungsprozess ausgeführt, um sicherzustellen, dass die Informationen korrekt dargestellt werden. Wenn die OCR zu Daten führt, die als „1211212005“ dargestellt werden, würde der Bereinigungsprozess diese Daten in 12/12/2005 konvertieren. Ein weiteres Beispiel ist, wenn der Name als „Mo$den“ dargestellt wird, wird er zu „Mosden“ geändert. Der Bereinigungsprozess kann unter Verwendung von externen Informationsressourcen, wie Wörterbücher, Kalender und dergleichen, ausgeführt werden.
  • In einer weiteren Ausführungsform wird kontrolliert, ob die extrahierten Datenteile vollständig sind. Wenn der Händlername beispielsweise identifiziert werden kann, aber seine Adresse fehlt, dann ist das Schlüsselfeld für die Händleradresse unvollständig. Ein Versuch zum Vervollständigen der fehlenden Schlüsselfeldwerte wird gestartet. Dieser Versuch kann das Abrufen externer Systeme und Datenbanken, eine Korrelation mit zuvor analysierten Rechnungen oder eine Kombination davon umfassen. Beispiele für externe Systeme und Datenbanken kann Unternehmensverzeichnisse, Universal-Produkt-Code (UPC)-Datenbanken, Paketversand- und Tracking-Systeme und so weiter umfassen. In einer Ausführungsform resultiert S430 in einem kompletten Satz der vordefinierten Schlüsselfelder und deren jeweiligen Werten.
  • In S440 wird ein strukturierter Datensatz erzeugt. Der erzeugte Datensatz umfasst die identifizierten Schlüsselfelder und -werte.
  • In S450 wird bestimmt, ob strukturierte Datensätze für zusätzliche Transaktionen zu erstellen sind und wenn das so ist, geht die Ausführung mit S410 weiter; andernfalls endet die Ausführung.
  • Es sollte verstanden werden, dass jeder Verweis hierin auf ein Element, das eine Bezeichnung wie „erstes“, „zweites“ und so weiter verwendet, nicht prinzipiell die Menge oder Reihenfolge dieser Elemente einschränkt. Vielmehr werden diese Bezeichnungen hierin im Allgemeinen als eine zweckmäßige Methode zum Unterscheiden zwischen zwei oder mehreren Elementen oder Instanzen eines Elements verwendet. Folglich bedeutet der Verweis zu ersten und zweiten Elementen nicht, dass dort nur zwei Elemente eingesetzt werden oder dass das erste Element dem zweiten Element in einem Bereich vorangehen muss. Wenn ebenfalls nicht anderweitig angeführt, umfasst ein Elementesatz ein oder mehrere Elemente.
  • Wie hierin verwendet, bedeutet der Ausdruck „zumindest einer von“ gefolgt von einer Auflistung an Elementen, dass jedes der gelisteten Elemente einzeln verwendet werden kann oder jede Kombination aus zwei oder mehreren der gelisteten Elemente verwendet werden kann. Wenn zum Beispiel ein System beschrieben wird, das „zumindest eines von A, B und C“ umfasst, kann das System A allein; B allein; C allein; A und B als Kombination; B und C als Kombination; A und C als Kombination; oder A, B und C als Kombination umfassen.
  • Die unterschiedlichen, hierin offenbarten Ausführungsformen können als Hardware, Firmware, Software oder jede Kombination davon umgesetzt werden. Darüber hinaus wird die Software vorzugsweise als ein Anwendungsprogramm umgesetzt, das konkret auf einer Programmspeichereinheit oder einem computerlesebaren Medium bestehend aus Teilen, oder aus bestimmten Geräten und/oder einer Kombination aus Geräten, enthalten ist. Das Anwendungsprogramm kann auf eine Maschine mit einer geeigneten Architektur hochgeladen und von ihr ausgeführt werden. Vorzugsweise ist die Maschine auf einer Computer-Plattform umgesetzt, die eine Hardware aufweist, derart, dass eine oder mehrere zentrale Verarbeitungseinheiten („CPUs“), einen Arbeitsspeicher, und Eingangs-/Ausgangsschnittstellen aufweist. Die Computer-Plattform kann auch ein Betriebssystem und einen Mikrobefehlscode umfassen. Die unterschiedlichen, hierin beschriebenen Prozesse und Funktionen können entweder Teil des Mikrobefehlscodes oder Teil des Anwendungsprogramms oder eine Kombination davon sein, die von einer CPU ausgeführt werden kann, unerheblich, ob ein solcher Computer oder Prozessor explizit angezeigt wird oder nicht. Außerdem können verschiedene andere periphere Einheiten mit der Computer-Plattform verbunden werden, wie eine zusätzliche Datenspeichereinheit und eine Druckeinheit. Ferner ist ein nicht-flüchtiges computerlesbares Medium jedes computerlesbare Medium mit Ausnahme eines temporären Ausbreitungssignals.
  • Alle Beispiele und bedingten Formulierungen hierin dienen pädagogischen Zwecken, um den Leser beim Verständnis der Prinzipien der offenbarten, vom Erfinder beigetragenen Ausführungsformen und Konzepte zu helfen, um die Technik zu fördern und sie sind ohne Einschränkungen bzgl. der spezifisch angeführten Beispiele und Bedingungen auszulegen. Weiters sind alle Aussagen hierin, die Prinzipien, Aspekte und Ausführungsformen der offenbarten Ausführungsformen sowie spezifische Beispiele davon anführen, so aufzufassen, dass sie sowohl strukturelle wie auch funktionelle Äquivalente davon beinhalten. Zusätzlich ist vorgesehen, dass solche Äquivalente sowohl derzeit bekannte Äquivalente sowie in der Zukunft entwickelte Äquivalente umfasst, d. h. alle entwickelten Elemente, die unabhängig von der Struktur die gleiche Funktion ausführen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 62337885 [0001]
    • US 15361934 [0001]

Claims (20)

  1. Verfahren zum Erzeugen von Analysen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten, umfassend: Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktionsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.
  2. Verfahren nach Anspruch 1, wobei das Bestimmen des zumindest einen Transaktionsparameters für jedes elektronische Dokument ferner umfasst: Identifizieren von zumindest einem Schlüsselfeld und zumindest einem Wert im elektronischen Dokument; Erstellen eines Datensatzes basierend auf dem elektronischen Dokument, wobei der erstellte Datensatz das zumindest eine Schlüsselfeld und den zumindest einen Wert umfasst; und Analysieren des erstellten Datensatzes, wobei der zumindest eine Transaktionsparameter basierend auf der Analyse bestimmt wird.
  3. Verfahren nach Anspruch 2, wobei das Identifizieren des zumindest einen Schlüsselfelds und des zumindest einen Werts ferner umfasst: Analysieren des elektronischen Dokuments, um Daten im elektronischen Dokument zu bestimmen; und Extrahieren von zumindest einem Teil der bestimmten Daten basierend auf einer vorbestimmten Liste an Schlüsselfeldern, wobei der zumindest eine Teil der bestimmten Daten zumindest einem Schlüsselfeld der vorbestimmten Liste an Schlüsselfeldern entspricht.
  4. Verfahren nach Anspruch 1, wobei das Erhalten des zumindest einen Transaktionsanalysenregelsatzes ferner umfasst: Bestimmen von zumindest einem Ort basierend auf den erstellten Templates; und Abrufen eines des zumindest einen Transaktionsanalysenregelsatzes von einer Datenquelle, die mit jedem bestimmten Ort verbunden ist.
  5. Verfahren nach Anspruch 4, wobei jedes Template ein Ortsfeld umfasst, wobei das Bestimmen des zumindest einen Orts ferner umfasst: Identifizieren eines Transaktionsparameters in jedem Template, der einen Ort im Ortsfeld des Templates angibt, wobei der bestimmte, zumindest eine Ort jeden eindeutig identifizierten Ortstransaktionsparameter umfasst.
  6. Verfahren nach Anspruch 1, ferner umfassend zumindest eines von: Senden der erzeugten, zumindest einen Analyse an ein Unternehmenssystem, Senden der erzeugten, zumindest einen Analyse an ein Kundengerät und Speichern der erzeugten zumindest einen Analyse in einem Speicher.
  7. Verfahren nach Anspruch 1, ferner umfassend: Identifizieren eines in den erstellten Templates angeführten Unternehmens; und Erhalten des zumindest einen Unternehmensparameters basierend auf dem identifizierten Unternehmen.
  8. Verfahren nach Anspruch 1, wobei die zumindest eine Analyse zumindest eine Möglichkeit für eine Mehrwertsteuer-Rückerstattung jeder Transaktion angibt.
  9. Verfahren nach Anspruch 1, wobei das Erzeugen der zumindest einen Analyse ferner umfasst: Vergleichen der Transaktionsparameter jedes Templates mit einer Vielzahl von vorbestimmten Transaktionsparametersätzen, wobei die Analysen basierend auf dem Vergleich erzeugt werden.
  10. Nicht-flüchtiges, computerlesbares Medium, das darauf Befehle gespeichert hat, die bewirken, dass eine Verarbeitungsschaltung einen Prozess ausführt, wobei der Prozess Folgendes umfasst: Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktionsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.
  11. System zum Überprüfen des Erzeugens von Analysen basierend auf zumindest teilweise unstrukturierten elektronischen Dokumenten, umfassend: eine Verarbeitungsschaltung; und einen Arbeitsspeicher, wobei der Arbeitsspeicher Befehle beinhaltet, die, wenn sie von der Verarbeitungsschaltung ausgeführt werden, das System konfigurieren zum: Analysieren einer Vielzahl von elektronischen Dokumenten, um zumindest einen Transaktionsparameter für jedes elektronische Dokument zu bestimmen, wobei zumindest eines der analysierten elektronischen Dokumente zumindest teilweise unstrukturierte Daten umfasst; Erstellen eines Templates für jedes analysierte elektronische Dokument, wobei jedes Template ein strukturierter Datensatz ist, der den bestimmten, zumindest einen Transaktionsparameter für das jeweilige elektronische Dokument umfasst; Erhalten von zumindest einem Transaktionsanalysenregelsatz basierend auf den erstellten Templates, wobei jeder Transaktionsanalysenregelsatz zumindest Anforderungen für das Erhalten einer Transaktionsrückerstattung definiert; und Erzeugen von zumindest einer Analyse basierend auf dem zumindest einen Transaktionsanalysenregelsatz, den erstellten Templates und zumindest einem Unternehmensparameter.
  12. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Identifizieren von zumindest einem Schlüsselfeld und zumindest einem Wert im elektronischen Dokument; Erstellen eines Datensatzes basierend auf dem elektronischen Dokument, wobei der erstellte Datensatz das zumindest eine Schlüsselfeld und den zumindest einen Wert umfasst; und Analysieren des erstellten Datensatzes, wobei der zumindest eine Transaktionsparameter basierend auf der Analyse bestimmt wird.
  13. System nach Anspruch 12, wobei das System ferner konfiguriert ist zum: Analysieren des elektronischen Dokuments, um Daten im elektronischen Dokument zu bestimmen; und Extrahieren von zumindest einem Teil der bestimmten Daten basierend auf einer vorbestimmten Liste an Schlüsselfeldern, wobei der zumindest eine Teil der bestimmten Daten zumindest einem Schlüsselfeld der vorbestimmten Liste an Schlüsselfeldern entspricht.
  14. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Bestimmen von zumindest einem Ort basierend auf den erstellten Templates; und Abrufen eines des zumindest einen Transaktionsanalysenregelsatzes von einer Datenquelle, die mit jedem bestimmten Ort verbunden ist.
  15. System nach Anspruch 14, wobei jedes Template ein Ortsfeld umfasst, wobei das System ferner konfiguriert ist zum: Identifizieren eines Transaktionsparameters in jedem Template, der einen Ort im Ortsfeld des Templates angibt, wobei der bestimmte, zumindest eine Ort jeden eindeutig identifizierten Ortstransaktionsparameter umfasst.
  16. System von Anspruch 11, wobei das System ferner konfiguriert ist, um zumindest eines der Folgenden auszuführen: Senden der erzeugten, zumindest einen Analyse an ein Unternehmenssystem, Senden der erzeugten, zumindest einen Analyse an ein Kundengerät und Speichern der erzeugten, zumindest einen Analyse in einem Speicher.
  17. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Identifizieren eines in den erstellten Templates angeführten Unternehmens; und Erhalten des zumindest einen Unternehmensparameters basierend auf dem identifizierten Unternehmen.
  18. System nach Anspruch 11, wobei die zumindest eine Analyse zumindest eine Möglichkeit für eine Mehrwertsteuer-Rückerstattung jeder Transaktion angibt.
  19. System nach Anspruch 11, wobei das System ferner konfiguriert ist zum: Vergleichen der Transaktionsparameter jedes Templates mit einer Vielzahl von vorbestimmten Transaktionsparametersätzen, wobei die Analysen basierend auf dem Vergleich erzeugt werden.
  20. System nach Anspruch 11, ferner umfassend: einen optischen Zeichenerkennungsprozessor, wobei das System ferner konfiguriert ist zum: Analysieren der Vielzahl an elektronischen Dokumenten mit dem optischen Zeichenerkennungsprozessor, um Daten in den elektronischen Dokumenten zu identifizieren, wobei der zumindest eine Transaktionsparameter von jedem elektronischen Dokument basierend auf den identifizierten Daten des elektronischen Dokuments bestimmt wird.
DE112017002535.4T 2016-05-18 2017-05-16 Bereitstellen von Analysen in Echtzeit basierend auf unstrukurierten elektronischen Dokumenten Withdrawn DE112017002535T5 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662337885P 2016-05-18 2016-05-18
US62/337,885 2016-05-18
US15/361,934 US20170154385A1 (en) 2015-11-29 2016-11-28 System and method for automatic validation
US15/361,934 2016-11-28
PCT/US2017/032854 WO2017201012A1 (en) 2016-05-18 2017-05-16 Providing analytics in real-time based on unstructured electronic documents

Publications (1)

Publication Number Publication Date
DE112017002535T5 true DE112017002535T5 (de) 2019-03-07

Family

ID=60325603

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112017002535.4T Withdrawn DE112017002535T5 (de) 2016-05-18 2017-05-16 Bereitstellen von Analysen in Echtzeit basierend auf unstrukurierten elektronischen Dokumenten

Country Status (4)

Country Link
CN (1) CN109154949A (de)
DE (1) DE112017002535T5 (de)
GB (1) GB2565014A (de)
WO (1) WO2017201012A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966015B (zh) * 2021-02-01 2023-08-15 杭州博联智能科技股份有限公司 大数据分析处理和存储方法、装置、设备及介质
US12001446B2 (en) 2022-04-12 2024-06-04 Thinking Machine Systems Ltd. System and method for extracting data from invoices and contracts

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090112743A1 (en) * 2007-10-31 2009-04-30 Mullins Christine M System and method for reporting according to eu vat related legal requirements
US20100161616A1 (en) * 2008-12-16 2010-06-24 Carol Mitchell Systems and methods for coupling structured content with unstructured content
CN102654874A (zh) * 2011-03-02 2012-09-05 顾菊林 单据数据管理方法及系统
GB2530653A (en) * 2013-02-27 2016-03-30 Vatbox Ltd A web-based system and methods thereof for value-added tax reclaim processing

Also Published As

Publication number Publication date
WO2017201012A1 (en) 2017-11-23
GB2565014A (en) 2019-01-30
CN109154949A (zh) 2019-01-04
GB201818559D0 (en) 2018-12-26

Similar Documents

Publication Publication Date Title
DE112016005443T5 (de) System und Verfahren zur automatischen Validierung
US11062132B2 (en) System and method for identification of missing data elements in electronic documents
DE112014001016T5 (de) Web-basiertes System und Verfahren zur Verarbeitung der Mehrwertsteuerrückerstattung
DE112014001006T5 (de) System und Verfahren hierfür zur Endverbraucherkaufidentifikation und zur Rückforderung von Mehrwertsteuer
US11138372B2 (en) System and method for reporting based on electronic documents
US20190236128A1 (en) System and method for generating a notification related to an electronic document
US20170169292A1 (en) System and method for automatically verifying requests based on electronic documents
US20180011846A1 (en) System and method for matching transaction electronic documents to evidencing electronic documents
DE102019109289A1 (de) System und Verfahren zur Erkennung des potenziellen Betrugs seitens des Kassierers, sowie das Verfahren zur Bildung des Warenauszugs fürs Training des künstlichen Neuronennetzes
US20170323157A1 (en) System and method for determining an entity status based on unstructured electronic documents
EP3494495A1 (de) System und verfahren zur fertigstellung von elektronischen dokumenten
DE112017002535T5 (de) Bereitstellen von Analysen in Echtzeit basierend auf unstrukurierten elektronischen Dokumenten
US20180025225A1 (en) System and method for generating consolidated data for electronic documents
DE112016006434T5 (de) System und verfahren zur aufrechterhaltung der datenintegrität
US20180046663A1 (en) System and method for completing electronic documents
DE202018000271U1 (de) Server-Vorrichtung zur Verarbeitung von Transaktionsdaten
DE112017002533T5 (de) System und Verfahren zur Erzeugung von historischen Datensätzen auf unstrukturierten elektronischen Dokumenten
DE112017002569T5 (de) System und Verfahren zur Bestimmung des Status einer Einheit auf der Basis von unstrukturierten elektronischen Dokumenten
DE112014003558T5 (de) System und Verfahren zur Gutschrifterstellung für Benutzer über eine Mehrwertsteuerrückerstattung
DE112017003926T5 (de) System und Verfahren zur Überwachung elektronischer Dokumente
US20180025438A1 (en) System and method for generating analytics based on electronic documents
US20180025224A1 (en) System and method for identifying unclaimed electronic documents
US20170169519A1 (en) System and method for automatically verifying transactions based on electronic documents
WO2018027158A1 (en) System and method for generating consolidated data for electronic documents
WO2018027130A1 (en) System and method for reporting based on electronic documents

Legal Events

Date Code Title Description
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee