DE112015005985T5 - Klassifizierung und speicherung von dokumenten - Google Patents

Klassifizierung und speicherung von dokumenten Download PDF

Info

Publication number
DE112015005985T5
DE112015005985T5 DE112015005985.7T DE112015005985T DE112015005985T5 DE 112015005985 T5 DE112015005985 T5 DE 112015005985T5 DE 112015005985 T DE112015005985 T DE 112015005985T DE 112015005985 T5 DE112015005985 T5 DE 112015005985T5
Authority
DE
Germany
Prior art keywords
document
features
documents
collection
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112015005985.7T
Other languages
English (en)
Inventor
Cayden Meyer
Joel Christopher Onofrio
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of DE112015005985T5 publication Critical patent/DE112015005985T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Ein Verfahren enthält ein Definieren einer Vielzahl von bekannten Dokumententypen, ein Erhalten einer Sammlung von zuvor klassifizierten Dokumenten, die mit einem der bekannten Dokumnetentypen assoziiert sind, und ein Extrahieren vom Merkmalen aus jedem Dokument aus der Sammlung von zuvor klassifizierten Dokumententypen, um Merkmalsinformation zu definieren. Das Verfahren enthält auch ein Erhalten eines betrachteten Dokuments, das mit einem Anwender assoziiert ist, ein Extrahiern von einem oder mehreren Merkmalen aus dem betrachteten Dokument, ein Vergleichen des einen oder der mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation, ein Assoziieren des betrachteten Dokumnets mit einem der bekannten Dokumententypen basierend auf dem Vergleich und ein Senden des Dokuments zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Speicherort, der mit dem Anwender assoziiert ist und nur Dokumente des jeweiligen bekannten Dokumententyps, der mit dem betrachteten Doklument assouziiert ist, enthält.

Description

  • HINTERGRUND
  • Anwender von Computervorichtungen empfangen oft Dokumente durch verschiedene Kanäle. Beispielsweise können Dokumente als Anhänge an Email-Nachrichten, durch ein Herunterladen der Dokumente von einem Internetort oder durch Aufnehmen eines Bilds von dem Dokument unter Verwendung einer Kamera empfangen werden. Der Prozess eines manuellen Sortierens dieser Dokumente und eines Transferierens von ihnen zu einem Speichersystem kann zeitaufwendig sein. Aus diesem Grund werden viele Dokumente nicht auf logische und nützliche Weise gespeichert und können nicht lokalisiert werden, wenn sie benötigt werden.
  • ZUSAMMENFASSUNG
  • Die Offenbarung betrifft allgemein eine Klassifizierung und Speicherung von Dokumenten.
  • Ein Aspekt der offenbarten Ausfühungsformen besteht in einem Verfahren, das folgendes enthält: Definieren einer Vielzahl von bekannten Dokumententypen, Erhalten einer Sammlung von zuvor klassifizierten Dokumenten, die jeweils mit einem jeweiligen Dokumententyp von der Vielzahl von bekannten Dokumententypen assoziiert sind, und Extrahieren von Merkmalen aus jedem Dokument von der Sammlung von zuvor klassifizierten Dokumenten, um Merkmalsinformation zu definieren, die aus der Sammlung von zuvor klassifizierten Dokumenten extrahierte Merkmale beschreibt. Das Verfahren enthält auch ein Erhalten eines betrachteten Dokuments, das mit einem Anwender assoziiert ist, ein Extrahieren von einem oder mehreren Merkmalen aus dem betrachteten Dokument, ein Vergleichen des einen oder der mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation, ein Assoziieren des betarchteten Dokuments mit einem der bekannten Dokumententypen basierend auf dem Vergleich des einen oder der mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation und ein Senden des Dokuments zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Speicherort, der mit dem Anwender assoziiert ist und nur Dokumente des jeweiligen bekannten Dokumententyps enthält, der mit dem betrachteten Dokument assoziiert ist.
  • Ein weiterer Aspekt der offenbarten Ausführungsformen besteht in einer Vorrichtung, die einen Speicher und einen Prozessor enthält. Der Prozessor ist konfiguriert, um Anweisungen auszuführen, die im Speicher gespeichert sind, um eine Vielzahl von bekannten Dokumententypen zu definieren, eine Sammlung von zuvor klassifizierten Dokumenten zu erhalten, die jeweils mit einem jeweiligen Dokumententyp aus der Vielzahl von bekannten Dokumententypen assoziiert sind, und Merkmale aus jedem Dokument aus der Sammlung von zuvor klassifizierten Dokumenten zu extrahieren, um Merkmalsinformatlon zu definieren, die Merkmale beschreibt, die aus der Sammlung von zuvor klassifizierten Dokumenten extrahiert sind. Der Prozessor ist auch konfiguriert, um Anweisungen auszuführen, die im Speicher gespeichert sind, um ein betrachtetes Dokument zu erhalten, das mit einein Anwender assoziiert ist, eine oder mehrere Merkmale aus dem betrachteten Dokument zu extrahieren, das eine oder die mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation zu vergleichen, das betrachtete Dokument mit einem der bekannten Dokumententypen basierend auf dem Vergleich des einen oder der mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation zu assoziieren und das Dokument zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Speicherort zu senden, der mit dem Anwender assoziiert ist und nur Dokumente des jeweiligen bekannten Dokumententyps enthält, der mit dem betrachteten Dokument assoziiert ist.
  • Ein weiterer Aspekt der beschriebenen Ausführungsformen besteht in einem Verfahren, das folgendes enthält: Erhalten eine Dokuments, das mit einem Anwender assoziiert ist, und Extrahieren von einem oder mehreren Merkmalen aus dem Dokument. Das Verfahren enthält auch ein Vergleichen des einen oder der mehreren Merkmale aus dem Dokument mit Empfangs-Merkmalsinformation, die Merkmale beschreibt, die aus einer Sammlung von Kaufbelegen extrahiert sind, und ein Bestimmen, dass das Dokument eine Kaufbeleg ist, basierend auf dem Vergleich von einem oder mehreren Merkmalen aus dem Dokument mit der Empfangs-Merkmalsinformation. Das Verfahren enthält auch ein Senden des Dokuments zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Empfangs-Speicherort, der mit dem Anwender assoziiert ist.
  • Ein weiterer Aspekt der offenbarten Ausführungsformen besteht in einer Vorrichtung, die einen Speicher und einen Prozessor enthält. Der Prozessor ist konfiguriert, um ein Dokument zu erhalten, das mit einem Anwender assoziiert ist, ein oder mehrere Merkmale aus dem Dokument zu extrahieren, das eine oder die mehreren Merkmale aus dem Dokument mit Empfangs-Mermalsinformation zu vergleichen, die aus einer Sammlung von Kaugfbelegen extrahierte Merkmale beschreibt, und das Dokument zu einem Cloud-Speichersystem zur Speichherung bei einem bestimmten Empfangs-Speicherort zu senden, der mit dem Anwender assoziiert ist.
  • Variationen bei diesen und anderen Aspekten der offenbarten Ausführungsformen werden hierin nachfolgend in zusätzlichem Detail diskutiert.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Beschreibung hierin nimmt Bezug auf die beigefügten Zeichnungen, wobei sich gleiche Bezugszeichen in allen der mehreren Ansichten auf gleiche Teile beziehen und wobei:
  • 1 ein Blockdiagramm ist, das ein Beispiel einer Umgebung zeigt, in welcher ein System zur Klassifizierung und Speicherung von Dokumenten implementiert werden kann;
  • 2 ein Blockdiagramm ist, das ein Beispiel einer Hardwarekonfiguration für einen Servercomputer zeigt;
  • 3 ein Blockdiagramm ist, das ein System zum Definieren eines Merkmalsdepots unter Verwendung einer Sammlung von zuvor klkassifizierten Dokumenten zeigt;
  • 4 ein Blockdiagramm ist, das ein System zum Identifizieren und Speichern unklassifizierter Dokumente unter Verwendung eines Merkmalsdepots zeigt;
  • 5 ein Ablaufdiagramm ist, das ein Beispiel eines Prozesses zum Definieren des Merkmalsdepots zeigt; und
  • 6 ein Ablaufdiagramm ist, das ein Beispiel eines Prozesses zum Identifizieren und Speichern unklassifizierter Dokumente zeigt.
  • DETAILLIERTE BESCHREIBUNG
  • Gemäß den Verfahren, Systemen, Vorrichtungen und Computerprogrammen, die hierin diskutiert sind, werden Dokumente basierend auf Merkmale in den Dokumenten automatisch klassifiziert und bei bestimmten Speicherorten basierend darauf gespeichert, wie sie klassifiziert sind. Die Lehren hierin können auf Sammlungen von unklassifizierten Dokumenten angewendet werden, die mit einem bestimmten Anwender assoziiert sind, wie beispielsweise Dokumenten, die an Email-Nachrichten angehängt sind, und Fotografien, die in einer Sammlung gespeichert sind, die mit einem Anwender assoziiert ist.
  • 1 zeigt ein Beispiel einer Umgebung 100, in welcher ein System zur Klassifizierung und Speicherung von Dokumenten implementiert werden kann. Die Umgebung 100 kann ein Anwendersystem 110, ein oder mehrere zusätzliche Anwendersysteme 120 und einen Anwendungshostingdienst 130 enthalten. Das Anwendersystem 110 und die zusätzlichen Anwendersysteme 120 stellen jeweils eine große Anzahl (z. B. Millionen) von Systemen dar, die in der Umgebung 100 enthalten sein können, wobei jedes System eine oder mehrere Anwendungen verwenden bzw. nutzen kann, die durch den Anwendungshostingdienst 130 zur Verfügung gestellt werden. Das Anwendersystem 110 und die zusätzlichen Anwendersysteme 120 können jeweils irgendeine Art von Computer oder Computervorrichtung sein, wie beispielsweise elf Desktop-Computer, ein Laptop-Computer, ein Tablet-Computer oder ein Smartphone (ein computerfähiges Mobiltelefon). Der Anwendungshostingdienst 130 kann unter Verwendung von einem oder mehreren Servercomputern 132 implementiert sein. Das Anwendersystem 110, die zusätzlichen Anwendersysteme 120 und der Anwendungshostingdienst 130 können jeweils als einzelnes System, mehrere Systeme, verteilte Systeme oder in irgendeiner anderen Form implementiert sein.
  • Die Systeme, Dienste, Server und andere Computervorrichtungen, die hier beschrieben sind, sind über ein Netzwerk 150 in Kommunikationsverbindung. Das Netzwerk 150 kann ein oder mehrere Kommunikationsnetzwerke von irgendeinem geeigneten Typ in irgendeiner Kombination sein, einschließlich drahtloser Netzwerke, verdrahteter Netzwerke, lokaler Netze, Weitverkehrsnetze, zellularer Datennetze und Internet.
  • Der Anwendungshostingdienst 130 kann einer definierten Gruppe von Anwendern einschließlich Bedienpersonen bzw. Betreibern, die mit dem Anwendersystem 110 und den zusätzichen Anwendersystemen 120 assoziiert sind, einen Zugriff auf eine oder mehrere gehostete Anwendungen zur Verfügung stellen. Eine der gehosteten Anwendungen ist ein Cloud-Speicherdienst, der zulässt, dass Anwender auf elektronische Dokumente von allen Typen zugreifen, diese speichern, organisieren und speichern. Der Cloud-Speicherdienst implementiert Anwenderkonten, so dass bei dem Cloud-Speicherdienst durch den Anwender gespeicherte Dokumente mit dem Anwender assoziiert sind, der als der Besitzer des Dokuments angesehen wird. Der Cloud-Speicherdienst implementiert auch eine anwenderspezifische Zugriffssteuerung, die zulässt, dass der Anwender anderen Anwendern einen Zugriff auf Dokumente gewährt (z. B. „gemeinsam nutzen”). Die gehosteten Anwendungen können auch ein elektronisches Mailsystem und ein Fotospeichersystem enthalten. In Bezug auf irgendeine der gehosteten Anwendungen kann der Anwendungshostingdienst betreibbar sein, um Information zu dem Anwendersystem 110 zu senden, die dann, wenn sie durch das Anwendersystem 110 interpretiert wird, veranlasst, dass das Anwendersystem 110 einen Schnittstellenbildschirm der jeweiligen gehosteten Anwendung zur Ausgabe auf einer Anzeigvorrichtung ausgibt, die mit diesem Anwendersystem 110 assoziiert ist.
  • 2 ist ein Blockdiagramm eines Beispiels einer Hardwarekonfiguration für den einen oder die mehreren Servercomputer 132 der 1. Dieselbe Hardwarekonfiguration oder eine ähnliche Hardwarekonfiguration kann verwendet werden, um das Anwendersystem 110 und die zusätzlichen Anwendersysteme 120 zu implementiern. Jeder Servercomputer 132 kann eine CPU 210 enthalten. Die CPU 210 kann eine herkömmliche zentrale Verarbeitungseinheit sein. Altenativ kann die CPU 210 irgendein anderer Typ von Vorrichtung sein, oder mehrere Vorrichtungen, die Information, die jetzt existiert oder in Zukunft entwickelt wird, manipulieren oder verarbeiten kann. Obwohl die offenbarten Beispiele mit einem einzigen Prozessor ausgeführt werden können, wie es gezeigt ist, z. B. der CPU 210, können Vorteile bezüglich der Geschwindigkeit und der Effizienz unter Verwendung von mehr als einem Prozessor erreicht werden.
  • Jeder Servercomputer 132 kann einen Speicher 220 enthalten, wie beispielsweise eine Direktzugriffsspeichervorrichtung (RAM). Irgendein anderer geeigneter Typ von Speichervorrichtung kann auch als Speicher 220 verwendet werden. Der Speicher kann Code und Daten 222 enthalten, auf die durch die CPU 210 unter Verwendung eines Busses 230 zugegriffen werden kann. Der Speicher kann weiterhin ein oder mehrere Anwendungsprogramme 224 und ein Betriebssystem 226 enthalten. Die Anwendungsprogramme 224 können Softwarekomponenten in der Form von computerausführbaren Programmanweisungen enthalten, die veranlassen, dass die CPU 210 die Operationen und Verfahren, die hier beschrieben sind, durchführen.
  • Eine Speichervorrichtung 240 kann optional in der Form von irgendeinem computerlesbaren Medium vorgesehen sein, wie beispielsweise einem Festplattenlaufwerk, einer Speichervorrichtung, einem Flash-Laufwerk oder einem optischen Laufwerk. Eine oder mehrere Eingabevorrichtungen 250, wie beispielsweise eine Tastatur, eine Maus oder eine gestenempfindliche Eingabevorrichtung, empfangen Anwendereingaben und können Signale oder Daten, die die Anwendereingabe anzeigen, zur CPU 210 ausgeben. Eine oder mehrere Ausgabevorrichtungen können vorgesehen sein, wie beispielsweise eine Anzeigevorrichtung 260. Die Anzeigevorrichtung 260, wie beispielsweise eine Flüssigkristallanzeige (LCD) oder eine Kathodenstrahlröhre (CRT), lässt zu, dass einem Anwender eine Ausgabe präsentiert wird, wie beispielsweise in Antwort auf ein Empfangen eines Videosignals.
  • Obwohl 2 die CPU 210 und den Speicher 220 jedes Servercomputers 132 derart zeigt, dass sie in eine einzige Einheit integriert sind, können andere Konfigurationen verwendet werden. Die Operationen der CPU 210 können über mehrere Maschinen verteilt sein (wobei jede Maschine einen oder mehrere Prozessoren hat), die direkt oder über ein lokales oder ein anderes Netz gekoppelt sein können. Der Speicher 220 kann über mehrere Maschinen verteilt sein, wie beispielsweise als netzwerkbasierter Speicher oder Speicher in mehreren Maschinen. Obwohl er hier als einzelner Bus gezeigt ist, kann der Bus 320 von jedem der Servercomputer 132 aus mehreren Bussen zusammengesetzt sein. Weiterhin kann die Speichervorrichtung 240 direkt mit den anderen Komponenten des jeweiligen Servercomputers 132 gekoppelt sein, oder auf sie kann über ein Netzwerk zugegriffen werden, und sie kann eine einzige integrierte Einheit umfassen, wie beispielsweise eine Speicherkarte, oder mehrere Einheiten, wie beispielsweise mehrere Speicherkarten. Der eine oder die mehreren Servercomputer kann oder können in einer weiten Vielfalt von Konfigurationen implementiert sein.
  • 3 ist ein Blockdiagramm, das ein System 300 zeigt, in welchem eine Sammlung von Dokumenten 310 als eine Eingabe zu einem Merkmalsklassifizierer 320 zur Verfügung gestellt wird, der ein Merkmalsdeopot 330 als eine Ausgabe definiert. Im System 300 ist eine Vielzahl von bekannten Dokumententypen definiert. Als ein Beispiel kann einer der bekannten Dokumententypen Kaufbelegen entsprechen (d. h. Schriftstücken, die eine Bezahlung für Güter oder Dienste bestätigen). Als ein weiteres Beispiel kann ein weiterer der bekannten Dokumententypen Rechnungen, Rechnungsstellungen oder ähnlichen Dokumenten entsprechen. Andere Dokumententypen können verwendet werden.
  • Die Dokumente in einer Sammlung von Dokumenten 310 können von vielen variierten Typen sein. Die Dokumente aus der Sammlung von Dokumenten 310 enthalten Text und/oder Ziffern in Form von codierten Zeichen oder Bildern von Zeichen. Als ein Beispiel können die Dokumente aus der Sammlung von Dokumenten 310 in irgendeinem einer Anzahl von wohlbekannten alphanumerischen elektronischen Dokumentenformaten gespeichert sein, die Text enthalten, der in einem Schema codiert ist, das Zeichen darstellt, die Buchstaben und Zahlen enthalten, wie beispielsweise dem ASCII-Zeichen-Codierschema. Als ein weiteres Beispiel können die Dokumente aus der Sammlung von Dokumenten 310 Bilder (z. B. Rasterbilder oder Vektorbilder) sein, die alphanumerische Zeichen enthalten.
  • Jedes Dokument aus der Sammlung von Dokumenten 310 wird klassifiziert, bevor es zum Merkmalsklassifizierer 320 geliefert wird. Dokumente werden beispielsweise dadurch klassifiziert, dass sie mit einem jeweiligen Dokumententyp aus der Vielzahl von bekannten Dokumententypen assoziiert werden. Beispielsweise kann jedes der Dokumente durch einen Anwender vor der Zeit, zu welcher die Sammlung von Dokumenten 310 zum Merkmalsklassifizierer 320 als eine Eingabe geliefert wird, manuell mit einem der bekannten Dokumententypen assoziiert werden. Bei einer Implementierung könnte einem Anwender ein Schnittstellenbildschirm (z. B. ein Dialogfeld) präsentiert werden, der eine Liste von zwei oder mehr bekannten Dokumententypen aus der Vielzahl von Dokumententypen enthält und eine Anwendereingabe in der Form einer Auswahl von einem der Dokumententypen aus der Liste anfordert. Als ein weiteres Beispiel könnte dem Anwender ein Schnittstellenbildschirm präsentiert werden, der einen einzigen Dokumententyp aus der Vielzahl von Dokumententypen identifiziert und eine Anwendereingabe anfordert, die identifiziert, ob das aktuell angezeigte Dokument dem identifizierten einzigen Dokumententyp entspricht. Andere Verfahren zum Klassifizieren der Dokumente können verwendet werden, um jedes der Dokumente mit einem der bekannten Dokumententypen vor der Zeit zu assoziieren, zu welcher die Sammlung von Dokumenten 310 zum Merkmalsklassifizierer 320 geliefert wird.
  • Der Merkmalsklassifizierer 320 extrahiert ein oder mehrere Merkmale aus jedem Dokument aus der Vielzahl von Dokumenten und codiert die Merkmale als Merkmalsinformation, die die Merkmale aus dem Dokument beschreibt. Durch Identifizieren von Merkmalen in den Dokumenten aus der Sammlung von Dokumenten 310 können Muster identifiziert werden, die zulassen, dass unklassifizierte Dokumente basierend auf dem Vorhandensein und/oder Nichtvorhandensein von bestimmten Mustern in ihnen klassifiziert werden.
  • Die Merkmale der Dokumente, die durch den Merkmalsklassifizierer 320 identifiziert und extrahiert werden, enthalten substantielle Merkmale, Formatierungsmerkmale und andere Aspekte oder Charakteristiken der Dokumente oder Teilbereiche der Dokumente, die als eine Basis zum Klassifizieren und Identifizieren von Dokumenten verwendet werden können. Beispielsweise können die Merkmale alphanumerische textbasierte Merkmale sein, die wenigstens eines von einer Textgröße, einer Textschriftart, einer Textpositionierung oder einem substantiellen Textinhalt enthalten. Für Dokumente in bildbasierten Dateiformaten kann eine optische Zeichenerkennung verwendet werden, um bildbasierte Textelemente in codierte Zeichen umzuwandeln, um substantielle Textinhaltsmerkmale zu extrahieren.
  • Die Ausgabe des Merkmalsklassifizierers 320 ist Merkmalsinformation, die in dem Merkmalsdepot 330 für eine spätere Verwendung gespeichert wird. Die Merkmalsinformation enthält Information, die ein Merkmal identifiziert und zulässt, dass ähnliche Merkmale daran angepasst werden, sowie Information, die die Dokumentenklassifizierung identifiziert, dass das Merkmal darin gefunden wurde. Somit kann die Merkmalsinformation aus dem Merkmalsdepot verwendet werden, um Merkmale in unklassifizierten Dokumenten an bekannte Merkmale anzupassen, und diese Anpassungen zeigen daher eine Verbundenheit eines unklkassifizierten Douments mit einem oder mehreren der bekannten Dokumententypen an, wie es hierin weiter erklärt werden wird.
  • Bei einer Implementierung kann der Merkmalsklassifizierer 320 Maschinenlerntechniken als eine Basis zum Extrahieren und Klassifizieren von Merkmalen verwenden. Bei einer weiteren Implementierung kann der Merkmalsklassifizierer 320 ein Maschinenlernen und ein Schablonieren als eine Basis zum Extrahieren und Klassifizieren von Merkmalen verwenden.
  • 4 ist ein Blockdiagramm, das ein System 400 zeigt, in welchem ein oder mehrere unklassifizierte Dokumente 410 durch einen Dokumentenidentifizierer 420 unter Verwendung des Merkmalsdepots 330 klassifiziert und gespeichert werden, das auch dem Dokumentenidentifizierer 420 als eine Eingabe verfügbar ist.
  • Die unklassifizierten Dokumente 410 werden durch den Dokumentenidentifizierer 420 als Eingaben erhalten. Die unklassifizierten Dokumente 410 können von vielen variierten Typen sein, wie es in Bezug auf die Dokumente aus der Sammlung von Dokumenten 310 erklärt ist. Die unklassifizierten Dokumente 410 können in einer Anzahl von unterschiedlichen Arten erhalten werden. Bei einigen Implementierungen werden die unklassifizierten Dokumente 410 aus einer Sammlung von Dokumenten erhalten, die mit einem Anwender assoziiert sind, wie beispielsweise derart, dass sie auf einer Vorrichtung gespeichert sind, die im Besitz eines Anwenders ist, oder derart, dass sie bei einem Server unter Verwendung eines Kontos gespeichert sind, das mit einem Anwender assoziiert ist, wie beispielsweise eines Email-Kontos.
  • Bei einem Beispiel sind unklassifizierte Dokumente 410 Anhänge an Email-Nachrichten. Bei diesem Beispiel kann ein Erhalten von unklassifizierten Dokumenten 410 ein Zugreifen auf eine oder mehrere Email-Nachrichten enthalten, die bei einem Server für elektronische Mails gespeichert sind und mit einem Konto für elektronische Mails assoziiert sind, das mit einem Anwender assoziiert ist (z. B. im Besitz von dem Anwender ist oder primär durch den Anwender kontrolliert wird). Die Nachrichten, auf die zugegriffen ist, können Nachrichten sein, die bei dem Server für elektronische Mails über ein Protokoll, wie beispielsweise das SMTP-Protokoll, empfangen werden, wobei der Anwender als der Empfänger der Nachrichten identifiziert wird. Eine Softwarekomponente kann die Nachrichten überwachen, die bei dem Server für elektronische Mails empfangen werden, und Email-Anhänge zu einem Ort senden, der für den Dokumentenidentifizierer 420 zugreifbar ist, zur Speicherung als unklassifizierte Dokumente 410, bis sie durch den Dokumentenidentifizierer 420 erhalten und verarbeitet werden. Bei einigen Implementierungen werden die Email-Nachrichten mit den Email-Anhängen so gesendet, dass die Inhalte der Nachrichten selbst beim Klassifizieren der Anhänge verwendet werden können. Somit kann das System 400 die Email-Nachrichten und/oder Email-Anhänge ohne Initiierung eines Klassifizierungsprozesses durch den Anwender automatisch verarbeiten.
  • Bei einem weiteren Beispiel sind die unklassifizierten Dokumente 410 Fotografien. Bei diesem Beispiel kann ein Erhalten der unklassifizierten Dokumente 410 ein Zugreifen auf Fotografien enthalten, die mit dem Anwender assoziiert sind. Die Fotografien können Teil einer Sammlung von Fotografien sein, die bei einer Vorrichtung gespeichert sind, die mit dem Anwender assoziiert ist, oder bei einem cloud-basierten Speichersystem bei einem Ort gespeichert sind, der mit dem Anwender assoziiert ist. Die Sammlung von Fotografien kann überwacht werden, wie beispielsweise durch eine Softwarekomponente, und neu hinzugefügte Fotografien können zu einem Ort gesendet werden, der durch den Dokumentenidentifizierer 420 zugreifbar ist, zur Speicherung als unklassifizierte Dokumente 410, bis sie durch den Dokumentenidentifizierer 410 erhalten und verarbeitet werden. Somit kann das System 400 neu aufgenommene oder gespeicherte Bilder ohne Initiierung eines Klassifizierungsprozesses durch den Anwender automatisch verarbeiten.
  • Der Dokumentenidentifizierer 420 extrahiert Merkmale aus den unklassifizierten Dokumenten 410. Dies kann auf die Weise durchgeführt werden, die in Bezug auf den Merkmalsklassifizierer 320 beschrieben ist. Der Dokumentenidentifizierer 420 verwendet dann das Merkmalsdepot 330, um zu bestimmen, ob jedes der betrachteten Dokumente einem der bekannten Dokumententypen entspricht, indem die extrahierten Merkmale mit der Merkmalsinformation verglichen werden. Beispielsweise kann der Dokumentenidentifizierer 420 ein betrachtetes Dokument aus den unklassifizierten Dokumenten 410 auswählen, ein oder mehrere Merkmale aus dem betrachteten Dokument extrahieren und das eine oder die mehreren extrahierten zu den Merkmalen, die aus dem betrachteten Dokument extrahiert sind, mit der Merkmalsinformation, die im Merkmalsdepot 330 gespeichert ist, vergleichen. Dieser Vergleich kann unter Verwendung bekannter Techniken, wie beispielsweise Maschinenlern- und/oder Musteranpassungstechniken, durchgeführt werden. Das Ergebnis dieses Vergleichs kann eine Identifikation von einem oder mehreren der bekannten Dokumententypen sein, auf die das betrachtete Dokument bezogen ist.
  • Bei einer Implementierung wird eine Punktzahl für das betrachtete Dokument in Bezug auf jeden von mehrere der bekannten Dokumententypen bestimmt, wobei jede Punktzahl eine Wahrscheinlichkeit darstellt, dass das betrachtete Dokument diesem bestimmten Dokumententyp entspricht (d. h. derselbe Typ von Dokument ist). Einer der bekannten Dokumententypen kann basierend auf dieser Punktzahl ausgewählt werden. Ein einfaches Beispiel eines Algorithmus zum Auswählen von einem der bekannten Dokumententypen wählt einfach den bekannten Dokumententyp mit dem höchsten Rang aus. Andere Algorithmen können verwendet werden, um einen der bekannten Dokumententypen auszuwählen.
  • Bei einigen Implementierungen wird eine Bestimmung diesbezüglich durchgeführt, ob das Ergebnis als gültig oder ungültig angesehen wird. Eine solche Bestimmung kann auf der Basis von einem oder mehreren individuellen Tests durchgeführt werden. Ein solcher Test kann bestimmen, ob die Punktzahl für den Dokumententyp mit dem höchsten Rang einen Schwellenwert übersteigt. Wenn die Punktzahl für den Dokumententyp mit dem höchsten Rang den Schwellenwert nicht übersteigt, wird bestimmt, dass das Ergebnis ungültig ist. Ein weiterer solcher Test kann bestimmen, ob die zwei Dokumententypen mit dem höchsten Rang sich um weniger als einen Schwellenwert unterscheiden (z. B. ein Fehlerspielraum). Wenn die zwei Dokumententypen mit dem höchsten Rang sich um weniger als den Schwellenwert unterscheiden, wird bestimmt, dass das Ergebnis ungültig ist. Wenn der Prozess ein gültiges Ergebnis produziert, wird das betrachtete Dokument mit dem bekannten Dokumententyp assoziiert. Diese Assoziation kann ohne Anwendereingabe, die den bekannten Dokumententyp auswählt, automatisch durchgeführt werden. Der Dokumentenidentifizierer 420 veranlasst dann, dass das betrachtete Dokument mit dem bekannten Dokumententyp assoziiert wird. Wenn der Prozess kein gültiges Ergebnis produziert, assoziiert der Dokumentenidentifizierer 420 das betrachtete Dokument nicht automatisch mit dem bekannten Dokumententyp. Bei einigen Implementierungen kann der Dokumentenidentifizierer 420 dann den Anwender auffordern, das betrachtete Dokument durch Auswählen von einem der bekannten Dokumententypen aus einer Liste oder durch Erzeugen eines neuen Dokumententyps manuell zu klassifizieren.
  • Nachdem das betrachtete Dokument mit dem bekannten Dokumententyp assoziiert ist, veranlasst der Dokumentenidentifizierer 420, dass das betrachtete Dokument in Assoziation mit dem bekannten Dokumententyp gespeichert wird. Bei einem Beispiel enthält ein Speichern des betrachteten Dokuments in Assoziation mit dem bekannten Dokumententyp ein Transferieren des betrachteten Dokuments zu einem Doklumenten-Speichersystem 430 zur Speicherung auf eine Weise, die zulässt, dass das betrachtete Dokument auf der Basis seines Dokumententyps lokalisiert und wiedergewonnen wird. Bei einer Implementierung veranlasst der Dokumentenidentifizierer 420 eine Speicherung des betrachteten Dokuments bei dem Dokumenten-Speichersystem 430 automatisch ohne Anwendereingabe. Bei einer weiteren Implementierung veranlasst der Dokumentenidentifizierer 420 eine Anzeige einer Schnittstelle zu dem Anwender, die den Anwender fragt, ob das betrachtete Dokument bei dem Dokumenten-Speichersystem 430 gespeichert werden sollte.
  • Ein Beispiel eines Speicherns des betrachteten Dokuments in Assoziation mit seinem Dokumententyp enthält ein Speichern des betrachteten Dokuments bei einem bestimmten Speicherort bei dem Dokumenten-Speichersystem 430, der nur Dokumente vom demselben Dokumententyp enthält. Der bestimmte Speicherort kann ein Ordner in einer hierarchischen Speicherstruktur sein, der nur Dokumente von einem einzigen Dokumententyp speichert. Nichthierarchische Speicherstrukturen können auch verwendet werden, um zu veranlassen, dass Dokumente von demselben bekannten Dokumententyp zusammen gespeichert werden. Beispielsweise kann eine solches System Metadaten für das betrachtete Dokument speichern, die den Dokumententyp des Dokuments identifizieren. Diese Metadaten können durch das Dokumenten-Speichersystem 430 verwendet werden, um eine Anzeige oder eine ordnerbasierte Sammlung oder eine kriterienbasierte Sammlung, die nur Dokumente von einen einzigen spezifizierten Dokumententyp enthält, zu definieren und zu veranlassen.
  • Bei einer Implementierung ist das Dokumenten-Speichersystem 430 ein Cloud-Speichersystem, das Dokumente von jedem bekannten Dokumententyp bei einem bestimmten Speicherort speichert, der mit dem Anwender assoziiert ist und nur Dokumente des jeweiligen bekannten Dokumententyps enthält, der mit dem betrachteten Dokument assoziiert ist. Der bestimmte Speicherort kann mittels eines Anwenderkontos mit dem Anwender assoziiert sein, das dem Anwender wenigstens eine teilweise Kontrolle über den bestimmten Speicherort überlässt. Die dem Anwender zur Verfügung gestellte Kontrolle kann die Fähigkeit enthalten, eine Zugriffssteuerung einzustellen, um anderen einen Zugriff auf den bestimmten Speicherort zu verweigern oder zu gewähren.
  • Das System 400 kann auf Dokumente von vielen Typen angewendet werden. Bei einer Implementierung entspricht einer der bekannten Dokumententypen Kaufbelegen und enthält das Merkmalsdepot 330 klassifizierte Merkmale von Kaufbelegen, die nützlich zum Bestimmen sind, ob ein betrachtetes Dokument ein Kaufbeleg ist.
  • Als ein Beispiel könnte ein Anwender eine oder mehrere Email-Nachrichten empfangen, die Kaufbelege enthalten, und zwar entweder im Körper der Email-Nachricht selbst oder als ein Anhang in einem Format, wie beispielsweise einem Bild-Dateiformat, einem Textverarbeitungsdokumenten-Dateiformat oder einem anwendungsunabhängigen Dokumentenanzeige-Dateiformat, wie beispielsweise als das PDF-Dateiformat. Diese Dokumente werden durch den Dokumentenidentifizierer 420 verarbeitet und irgendwelche Dokumente, die als Kaufbelege identifiziert sind, werden bei dem Dokumenten-Speichersystem 430 gespeichert, wie beispielsweie durch Veranlassen, dass eine Kopie der Dokumente bei dem Dokumenten-Speichersystem 430 erzeugt wird. Obwohl die zuvor angegebenen Beispiele sich alle mit Situationen beschäftigen, in welchen Merkmale in einem Dokument anzeigen, dass das Dokument selbst von einem bekannten Typ ist, sollte es verstanden werden, dass Merkmale in einer Email-Nachricht verarbeitet werden können, um zu bestimmen, dass ein Anhang an der Email-Nachricht einem bekannten Dokumententyp entspricht, in welchem Fall der Anhang basierend auf den Merkmalen in der Email-Nachricht klassifiziert wird, und der Anhang kann dann bei dem Dokumenten-Speichersystem 430 gespeichert werden.
  • Als ein weiteres Beispiel könnte ein Anwender eine Kamera verwenden, um Fotografien von einem oder mehreren Kaufbelegen zu machen und diese Fotografien in einer Sammlung von Bildern zu speichern, die ebenso andere Typen von Bildern enthält. Der Dokumentenidentifizierer 420 verarbeitet diese Bilder, wie es zuvor beschrieben ist. Eine optische Zeichenerkennung kann verwendet werden, um Text von den Bildern zu dem Zweck einer Merkmalsklassifizierung zu identifizieren und zu extrahieren. Der Dokumentenidentifizierer 420 veranlasst auf ein Bestimmen hin, dass wenigstens einige der Dokumente Verkaufsbelege sind, dass diese Dokumente bei dem Dokumenten-Speichersystem 430 gespeichert werrden.
  • 5 ist ein Ablaufdiagramm, das ein Beispiel eines Prozesses 500 zum Definieren eines Merkmalsdepots, wie beispielsweise des Merkmalsdepots 330, zeigt. Die in Verbindung mit dem Prozess 500 beschriebenen Operationen können bei einem oder mehrerne Computern durchgeführt werden, wie beispielsweise bei einem oder mehreren Servercomputern 132 des Anwendungshostingdienstes 130, oder bei dem Anwendersystem 110. Wenn eine Operation derart beschrieben wird, dass sie durch einen oder mehrere Computer durchgeführt wird, wird sie beendet, wenn sie durch einen allein arbeitenden Computer durchgeführt wird, oder durch mehrere Computer, die zusammenarbeiten. Die in Verbindung mt dem Prozess 500 beschriebenen Operationen können als ein nichtflüchtiges computerlesbares Speichermedium verkörpert sein, das durch einen oder mehrere Prozessoren ausführbare Programmanweisungen enthält, die dann, wenn sie ausgeführt werden, veranlassen, dass der eine oder die mehreren Prozessoren die Operationen durchführen. Beispielsweise können die in Verbindung mit dem Prozess 500 beschriebenen Operationen bei dem Speicher 220 von einem der Servercomputer 132 zur Ausführung durch die CPU 210 davon gespeichert sein.
  • Bei einer Operation 510 werden Dokumente von bekannten Typen erhalten. Die bei der Operation 510 erhaltenen Dokumente können Dokumente sein, die zuvor klassifiziert wurden, wie beispielsweie durch einen manuellen Prozess. Bei einer Operation 520 werden die Dokumente, die bei der Operation 510 erhalten wurden, klassifiziert, wie beispielsweise durch Liefern dieser Dokumente zu einem Merkmalsklassifizierungssystem, das in Bezug auf den Merkmalsklassifizierer 320 beschrieben ist. Bei einer Operation 530 wird Information, die die Merkmale darstellt, die bei der Operation 520 extrahiert und klassifiziert wurden, gespeichert. Dies kann beispielsweise durchgeführt werden, wie es in Bezug auf eine Speicherung von Merkmalsinformation bei dem Merkmalsdepot 330 beschrieben ist.
  • 6 ist ein Ablaufdiagramm, das ein Beispiel eines Prozesses 600 zum Identifizieren und Speichern unklassifizierter Dokumente zeigt. Die in Verbindung mit dem Prozzess 600 beschriebenen Operationen können bei einem oder mehreren Computer durchgeführt werden, wie beispielsweie bei einem oder mehreren Servercomputern 132 des Anwendungshostingdienstes 130 oder bei dem Anwendersystem 110. Wenn eine Operation derart beschrieben wird, dass sie durch einen oder mehrere Computer durchgeführt wird, wird sie beendet, wenn die durch einen Computer durchgeführt wird, der allein arbeitet, oder durch mehrere Computer, die zusammenarbeiten. Die in Verbindung mit dem Prozess 600 beschriebenen Operationen können als ein nichtflüchtiges comlputerlesbares Speichermedium verkörpert sein, das durch einen oder mehrere Prozessoren ausführbare Anweisungen enthält, die dann, wenn sie ausgeführt werden, veranlassen, dass der eine oder die mehreren Prozessoren die Operationen durchführen. Beispielsweise können die in Verbindung mit dem Prozess 600 beschriebenen Operationen bei dem Speicher 220 von einem der Servercomputer 132 zur Ausführung durch die CPU 210 davon gespeichert sein.
  • Bei einer Operation 610 werden unklassifizierte Dokumente erhalten. Dies kann auf eine Weise durchgeführt werden, die in Bezug auf unklassifizierte Dokumente 410 beschrieben ist. Bei einer Operation 620 werden die Dokumente, die bei der Operation 610 erhalten wurden, zu einem Merkmalsextraktionssystem geliefert, das Merkmale extrahiert, die als eine Basis zum Identifizieren der Dokumente verwendet werden können. Bei einer Operation 630 erfolgt für jedes der Dokumente eine Bestimmung bezüglich der Wahrscheinlichkeit, dass das Dokument einem bekannten Dokumententyp entspricht. Die Operationen 620 und 630 können durchgeführt werden, wie es in Bezug auf den Dokumentenidentifizierer 420 beschrieben ist. Bei einer Opeartion 640 wird eine Bestimmung durchgeführt, ob die Bestimmung des Dokumententyps bei der Operation 630 gültig ist. Dies kann durch Analysieren der Wahrscheinlichkeiten durchgeführt werden, die bei der Operation 630 berechnet sind, unter Verwendung von einer oder mehreren Regeln, wie es zuvor beschrieben ist. Wenn die Bestimmung nicht gültig ist, wird der bei der Operation 630 identifizierte Dokumententyp nicht als eine Basis zum Speichern des Dokuments verwendet. An dieser Stelle endet der Prozess oder kann der Anwender alternativ aufgefordert werden, Information einzugeben, die zum richtigen Identifizieren und Speichern des Dokuments verwendet werden kann. Wenn die Operation 640 bestimmt, dass der bei der Operation 630 identifizierte Dokumententyp gültig ist, wird das Dokument in Assoziation mit dem Dokumententyp bei einer Operation 650 gespeichert. Dies kann beispielsweise auf eine Weise durchgeführt werden, die in Bezug auf das Dokumenten-Speichersystem 430 beschrieben ist.
  • Die vorangehende Beschreibung beschreibt nur einige beispielhafte Implementierungen der beschriebenen Techniken. Andere Implementierungen sind verfügbar. Beispielsweise sind die bestimmte Bennennung der Komponenten, eine Großschreibung von Ausdrücken, die Attribute, Datenstrukturen oder irgendein anderer Programmierungs- oder Strukturaspekt nicht obligatorisch oder signifikant und die Mechanismen, die die Erfindung oder ihre Merkmale implementieren, können andere Namen, Formate oder Protokolle haben. Ferner kann das System über eine Kombination von Hardware und Software implementiert sein, wie es beschrieben ist, oder gänzlich in Hardwareelementen. Ebenso ist eine bestimmte Teilung einer Funktionalität zwischen den verschiedenen Systemkomponenten, die hierin beschrieben sind, lediglich beispielhaft und nicht obligatorisch; durch eine einzelne Systemkomponente durchgeführte Funktionen können stattdessen durch mehrere Komponenten durchgeführt werden und durch mehrere Komponenten durchgeführte Funktionen können stattdessen durch einen einzelene Komponente durchgeführt werden.
  • Die Worte „Beispiel” oder „beispielhaft” werden hierin derart verwendet, dass sie bedeuten, als Beispiel, Fall oder Illustration zu dienen. Jeder Aspekt oder Entwurf, der hierin als „Beispiel” oder „beispielhaft” beschrieben ist, ist nicht notwendigerweise als bevorzugt oder vorteilhaft gegenüber anderen Aspekten oder Entwürfen auszulegen. Vielmehr ist beabsichtigt, dass eine Verwendung der Worte „Beispiel” oder „beispielhaft” Konzepte auf eine konkrete Art und Weise präsentieren. Wie er in dieser Anmeldung verwendet ist, ist für den Ausdruck „oder” beabsichtigt, dass er eher ein einschließliches „oder” als ein ausschließliches „oder” bedeutet. Das bedeutet, dass, solange es nicht anders spezifiziert ist oder es aus dem Zusammenhang klar ist, beabsichtigt ist, dass „X enthält A oder B” irgendeine der natürlichen einschließlichen Permutationen bedeutet. Das bedeutet, dass dann, wenn X A enthält; X B enthält; oder X sowohl A als auch B enthält, dann „X enthält A oder B” unter irgendeinem der vorangehenden Fälle erfüllt ist. Zusätzlich sollten die Artikel „ein” oder „eine”, wie sie in dieser Anmeldung und den beigefügten Ansprüchen verwendet sind, allgemein derart ausgelegt sein, dass sie „ein oder mehrere” bedeuten, solange es nicht anders spezifiziert ist oder aus dem Zusammenhang klar ist, dass er auf eine Singularform gerichtet ist. Darüber hinaus ist mit der durchgehenden Verwendung des Ausdrucks „eine Ausführungsform” oder „eine einzelne Ausführungsform” oder „eine Implementierung” oder „eine einzelene Implementierung” nicht beabsichtigt, dass er dieselbe Ausführungsform oder Implementierung bedeutet, solange es nicht so beschrieben ist.
  • Die Implementierungen der Computervorrichtungen (z. B. Clients und Server), die hierin beschrieben sind, können in Hardware, Software oder irgendeiner Kombination davon realisiert werden. Die Hardware kann beispielsweise Computer, IP-(intellectual property = geistiges Eigentum)Kerne, anwendungsspezifische integrierte Schaltungen (ASICs), programmierbare Logikanordnungen, optische Prozessoren, programmierbare Logiksteuerungen, Mikrocode, Mikrosteuerungen, Server, Mikroprozessoren, digitale Signalprozessoren oder irgendeine ander geeignete Schaltung enthalten. In den Ansprüchen sollte der Ausdruck „Prozessor” derart verstanden werden, dass er irgendetwas der vorangehenden Hardware, entweder einzeln oder in Kombination, umfasst. Die Ausdrücke „Signal” und „Daten” werden austauschbar verwendet. Ferner müssen Teilbereiche von jedem der Clients und jedem der Server, die hierin beschrieben sind, nicht notwendigerweise auf dieselbe Weise implementiert sein.
  • Operationen, die derart beschrieben sind, dass sie durch einen einzigen Prozessor, Computer oder eine einzige Vorrichtung durchgeführt werden, können über eine Anzahl von unterschiedlichen Prozessoren, Computern oder Vorrichtungen verteilt werden. Gleichermaßen können Operationen, die derart beschrieben sind, dass sie durch unterschiedliche Prozessoren, Computer und Vorrichtungen durchgeführt werden, in einigen Fällen durch einen einzigen Prozessor, Computer oder eine einzige Vorrichtung durchgeführt werden.
  • Obwohl Merkmale oben derart beschrieben oder beansprucht sein können, dass sie in bestimmten Kombinationen agieren, kann oder können ein oder mehrere Merkmale in einigen Fällen aus der Kombination entfernt werden, und die Kombination kann auf eine Unterkombination oder Variation einer Unterkombination gerichtet werden.
  • Die hierin beschriebenen Systeme, wie beispielsweise Clientcomputer und Servercomputer, können unter Verwendung von universellen Computern/Prozessoren mit einem Computerprogramm implementiert sein, das dann, wenn es ausgeführt wird, irgendeines der jeweiligen Verfahren, Algorithmen und/oder Anweisungen, die hierin beschrieben sind, ausführen. Zusätzlich oder alternativ können beispielsweie universelle Computer/Prozessoren verwendet werden, die spezialisierte Hardware zum Ausführen von irgendeinem der Verfahren, Algorithmen und/oder Anweisungen, die hierin beschrieben sind, enthalten können.
  • Einige Teilbereiche der obigen Beschreibung enthalten eine Offenbarung, die in Bezug auf Algorithmen und symbolische Darstellung von Operationen an Information präsentiert ist. Diese algorithmischen Beschreibungen und Darstellungen sind die Mittel, die von Fachleuten auf dem dem Gebiet der Datenverarbeitung verwendet werden, um das Wesen ihrer Arbeit anderen Fachleuten auf dem Gebiet am effektivsten zu vermitteln. Diese Operationen werden, während sie funktionell oder logisch beschrieben sind, derart verstanden, dass sie durch Computerprogramme implementiert sind. Weiterhin hat es sich manchmal auch als angenehm erwiesen, sich, ohne Verlust an Allgemeinheit, auf diese Anordnungen von Operationen als Module oder durch Funktionsnamen zu beziehen. Es sollte beachtet werden, dass die Prozessschritte und Anweisungen von Implementierungen dieser Offenbarung in Software, Firmware oder Hardware verkörpert sein könnten, und dann, wenn sie in Software verkörpert sind, heruntergeladen werden könnten, um sich auf verschieden Plattformen zu befinden und von diesen aus betrieben zu werden, die durch Echtzeit-Netzwerkbetriebssysteme verwendet werden.
  • Solange es nicht spezifisch anders angegeben ist, wie es aus der obigen Diskussion offensichtlich ist, wird es eingesehen, dass in der Beschreibung durchgehend Diskussionen unter Verwendung von Ausdrücken, wie beispielsweise „Verarbeiten” oder „Berechnen mittels Computer” oder „Berechnen” oder „Bestimmen” oder „Anzeigen” oder ähnliches, sich auf die Aktion und die Prozesse eines Computersystems oder einer ähnlichen elektronischen Computervorrichtung, die Daten manipuliert und transformiert, die als physikalische (elektronische) Größen innerhalb der Computersystemspeicher oder -register oder einem anderen solchen Informationsspeicher, Sende- oder Anzeigevorrichtungen dargestellt sind, beziehen.
  • Wenigstens eine Implementierung dieser Offenbarung bezieht sich auf eine Vorrichtung zum Durchführen der Operation hierin. Diese Vorrichtung kann speziell für die erforderlichen Zwecke aufgebaut sein oder sie kann einen Universalcomputer umfassen, der durch ein Computerprogramm selektiv aktiviert oder rekonfiguriert wird, das auf einem computerlesbaren Speichermedium gespeichert ist, auf das durch den Computer zugegriffen werden kann.
  • Alles oder ein Teilbereich der Ausführungsformen der Offenbarung kann die Form eines Computerprogrammprodukts annehmen, das beispielsweise von einem nichtflüchtigen computernutzbaren oder computerlesbaren Medium aus zugreifbar ist. Das Computerprogramm kann, wenn es ausgeführt wird, irgendeine der jeweiligen Techniken, Algorithmen und/oder Anweisungen, die hierin beschrieben sind, ausführen. Ein nichtflüchtiges computernutzbares oder computerlesbares Medium kann irgendeine Vorrichtung sein, die beispielsweise konkret das Programm zur Verwendung durch einen Prozessor oder in Kombination mit diesem enthalten, speichern, kommunizieren oder transportieren kann. Das nichtflüchtige Medium kann beispielsweise irgendein Typ von Platte sein, einschließlich Floppy-Disks, optischer Platten, CD-ROMs, magneto-optischer Platten, Nurlesespeicher (ROMs), Direktzugriffsspeicher (RAMs), EPROMs, EEPROMs, magnetischer oder optischer Karten, anwendungsspezifischer Schaltungen (ASICs) oder irgendeines anderen Typs von Medien, die zum konkreten Enthalten, Speichern, Kommunizieren oder Transportieren elektronischer Anweisungen geeignet sind.
  • Es ist zu verstehen, dass die Offenabrung nicht auf die offenabrten Ausführungsformen zu beschränken ist, sondern, im Gegegnteil, beabsichtigt ist, verschiedene Modifikationen und äquivalente Anordnungen zu umfassen, die innerhalb des Schutzumfangs der beigefügten Ansprüche enthalten sind.

Claims (20)

  1. Verfahren, umfassend: Definieren einer Vielzahl von bekannten Dokumententypen; Erhalten einer Sammlung von zuvor klassifizierten Dokumenten, die jeweils mit einem jeweiligen Dokumententyp aus der Vielzahl von Dokumententypen assoziiert sind; Extrahieren von Merkmalen aus jedem Dokument aus der Sammlung von zuvor klassifizierten Dokumenten, um Merkmalsinformation zu definieren, die Merkmale beschreibt, die aus der Sammlung von von zuvor klassifizierten Dokumenten extrahiert sind; Erhalten eines betrachteten Dokuments, das mit einem Anwender assoziiert ist; Extrahieren von einem oder mehreren Merkmalen aus dem betrachteten Dokument; Vergleichen des einen oder der mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation; Assoziieren des betrachteten Dokuments mit einem der bekannten Dokumententypen basierend auf dem Vergleich des einen oder der mehreren Merkmale aus dem betrachteten Dokumengt mit der Merkmalsinformation; und Senden des Dokuments zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Speicherort, der mit dem Anwender assoziiert ist und nur Dokumente des jeweiligen bekannten Dokumententyps enthält, der mit dem betrachteten Dokument assoziiert ist.
  2. Verfahren nach Anspruch 1, wobei das betrachtete Dokument ein Anhang an einer Email-Nachricht ist.
  3. Verfahren nach Anspruch 1, wobei ein Erhalten des betrachteten Dokuments ein Zugreifen auf eine Email-Nachricht mit einem Email-Anhang und ein Speichern einer Kopie des Email-Anhangs als das betrachtete Dokument enthält.
  4. Verfahren nach Anspruch 1, wobei das betrachtete Dokument eine Fotografie ist.
  5. Verfahren nach Anspruch 4, wobei ein Erhalten des betrachteten Dokuments ein Zugreifen auf eine Sammlung von Fotografien, die mit dem Anwender assoziiert sind, und ein Speichern einer Kopie von einer der Fotografien aus der Sammlung von Fotografien als das betrachtete Dokument enthält.
  6. Vorrichtung, umfassend: einen Speicher; und einen Prozessor, der konfiguriert ist, um Anweisungen auszuführen, die im Speicher gespeichert sind, um: eine Vielzahl von bekannten Dokumententypen zu definieren; eine Sammlung von zuvor klassifizierten Dokumenten zu erhalten, die jeweils mit einem jeweiligen Dokumententyp aus der Vielzahl von bekannten Dokumententypen assoziiert sind; Merkmale aus jedem Dokument aus der Sammlung von zuvor klassifizierten Dokumenten zu extrahieren, um Merkmalsinformation zu definieren, die Merkmale beschreibt, die aus der Sammlung von zuvor klassifizierten Dokumenten extrahiert sind; ein betrachtetes Dokument zu erhalten, das mit einem Anwende assoziiert ist; ein oder mehrere Merkmale aus dem betrachteten Dokument zu extrahieren; das eine oder die mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation zu vergleichen; das betrachtete Dokument mit einem der bekannten Dokumententypen basierend auf dem Vergleich des einen oder der mehreren Merkmale aus dem betrachteten Dokument mit der Merkmalsinformation zu assoziieren; und das Dokument zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Speicherort zu senden, der mit dem Anwender assoziiert ist und nur Dokumente des jeweiligen bekannten Dokumententyps enthält, der mit dem betrachteten Dokument assoziiert ist.
  7. Vorrichtung nach Anspruch 6, wobei das betrachtete Dokument ein Anhang an einer Email-Nachricht ist.
  8. Vorrichtung nach Anspruch 6, wobei ein Erhalten des betrachteten Dokuments ein Zugreifen auf eine Email-Nachricht mit einem Email-Anhang und ein Speichern einer Kopie des Email-Anhangs als das betrachtete Dokument enthält.
  9. Vorrichtung nach Anspruch 6, wobei das betrachtete Dokument eine Fotografie ist.
  10. Vorrichtung nach Anspruch 9, wobei ein Erhalten des betrachteten Dokuments ein Zugreifen auf eine Sammlung von Fotografien, die mit dem Anwender assoziiert sind, und ein Speichern einer Kopie von einer der Fotografien aus der Sammlung von Fotografien als das betrachtete Dokument enthält.
  11. Vorrichtung nach Anspruch 6, wobei das eine oder die mehreren Merkmale alphanumerische textbasierte Merkmale sind, die wenigstens eines von Textgröße, Textschriftart, Textpositionierung oder substantiellem Textinhalt enthalten.
  12. Verfahren, umfassend: Erhalten eines Dokuments, das mit einem Anwender assoziiert ist; Extrahieren von einem oder mehreren Merkmalen aus dem Dokument; Vergleichen des einen oder der mehreren Merkmale aus dem Dokument mit Empfangs-Merkmalsinformation, die Merkmale beschreibt, die aus einer Sammlung von Kaufbelegen extrahiert sind; Bestimmen, dass das Dokument ein Kaufbeleg ist, basierend auf dem Vergleich von einem oder mehreren Merkmalen aus dem Dokument mit der Empfangs-Merkmalsinformation; und Senden des Dokuments zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Empfangs-Speicherort, der mit dem Anwender assoziiert ist.
  13. Verfahren nach Anspruch 12, wobei das Dokument ein Anhang an einer Email-Nachricht ist und ein Erhalten des Dokuments ein Zugreifen auf eine oder mehrere Email-Nachrichten und ein Speichern von Kopien von einem oder mehreren Anhängen aus der einen oder den mehreren Email-Nachrichten als das eine oder die mehreren Dokumente enthält.
  14. Verfahren nach Anspruch 12, wobei das eine oder die mehreren Dokumente Fotografien sind und ein Erhalten des Dokuments ein Zugreifen auf eine Sammlung von Fotografien, die mit dem Anwender assoziiert sind, und ein Speichern von Kopien von einer oder mehreren Fotografien aus der Sammlung von Fotografien als das eine oder die mehreren Dokumente enthält.
  15. Verfahren nach Anspruch 12, wobei das eine oder die mehreren Merkmale alphanumerische textbasierte Merkmale sind, die wenigstens eines von Textgröße, Textschriftart, Textpositionierung oder substantiellem Textinhalt enthalten.
  16. Vorrichtung, umfassend: einen Speicher; und einen Prozessor, der konfiguriert ist, um Anweisungen auszuführen, die im Speicher gespeichert sind, um: ein Dokument zu erhalten, das mit einem Anwender assoziiert ist; ein oder mehrere Merkmale aus dem Dokument zu extrahieren; das eine oder die mehreren Merkmale aus dem Dokument mit Empfangs-Merkmalsinformation zu vergleichen, die Merkmale beschreibt, die aus einer Sammlung von Kaufbelegen extrahiert sind; zu bestimmen, dass das Dokument ein Kaufbeleg ist, basierend auf dem Vergleich von einem oder mehreren Merkmalen aus dem Dokument mit der Empfangs-Merkmalsinformation; und das Dokument zu einem Cloud-Speichersystem zur Speicherung bei einem bestimmten Empfangs-Speicherort, der mit dem Anwender assoziiert ist, zu senden.
  17. Vorrichtung nach Anspruch 16, wobei das Dokument ein Anhang an einer Email-Nachricht ist und das eine oder die mehreren Dokumente Fotografien sind.
  18. Vorrichtung nach Anspruch 17, wobei ein Erhalten des Dokuments ein Zugreifen auf eine oder mehrere Email-Nachrichten und ein Speichern von Kopien von einem oder mehreren Anhängen aus der einen oder den mehreren Email-Nachrichten als das eine oder die mehreren Dokumente enthält.
  19. Vorrichtung nach Anspruch 17, wobei ein Erhalten des Dokuments ein Zugreifen auf eine Sammlung von Fotografien, die mit dem Anwender assoziiert sind, und ein Speichern von Kopien von einer oder mehreren Fotografien aus der Sammlung von Fotografien als das eine oder die mehreren Dokumente enthält.
  20. Vorrichtung nach Anspruch 16, wobei das eine oder die mehreren Merkmale alphanumerische textbasierte Merkmale sind, die wenigstens eines von Textgröße, Textschriftart, Textpositionierung oder substantiellem Textinhalt enthalten.
DE112015005985.7T 2015-01-19 2015-11-06 Klassifizierung und speicherung von dokumenten Pending DE112015005985T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/599,793 2015-01-19
US14/599,793 US9870420B2 (en) 2015-01-19 2015-01-19 Classification and storage of documents
PCT/US2015/059535 WO2016118215A1 (en) 2015-01-19 2015-11-06 Classification and storage of documents

Publications (1)

Publication Number Publication Date
DE112015005985T5 true DE112015005985T5 (de) 2017-10-05

Family

ID=54705810

Family Applications (2)

Application Number Title Priority Date Filing Date
DE202015009283.7U Active DE202015009283U1 (de) 2015-01-19 2015-11-06 Klassifizierung und Speicherung von Dokumenten
DE112015005985.7T Pending DE112015005985T5 (de) 2015-01-19 2015-11-06 Klassifizierung und speicherung von dokumenten

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE202015009283.7U Active DE202015009283U1 (de) 2015-01-19 2015-11-06 Klassifizierung und Speicherung von Dokumenten

Country Status (5)

Country Link
US (1) US9870420B2 (de)
CN (1) CN107209771A (de)
DE (2) DE202015009283U1 (de)
GB (1) GB2550777B (de)
WO (1) WO2016118215A1 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10389663B2 (en) * 2015-04-23 2019-08-20 Microsoft Technology Licensing, Llc Automatic uploading of attachments to group cloud storage at send time
US9594776B2 (en) * 2015-05-05 2017-03-14 Microsoft Technology Licensing, Llc Dynamic, parameterized image resource selection
US11379618B2 (en) * 2017-06-01 2022-07-05 International Business Machines Corporation Secure sensitive personal information dependent transactions
US20190384686A1 (en) * 2018-06-15 2019-12-19 Microsoft Technology Licensing, Llc System for Ranking Electronic Application User Actions
CN109002483A (zh) * 2018-06-22 2018-12-14 平安科技(深圳)有限公司 文档管理方法、装置、计算机设备及存储介质
CN109542910B (zh) * 2018-12-03 2022-10-28 中国电波传播研究所(中国电子科技集团公司第二十二研究所) 一种海量海杂波数据分类存储方法
JP7409061B2 (ja) * 2019-12-13 2024-01-09 富士フイルムビジネスイノベーション株式会社 文書管理装置及び文書管理プログラム
US11516186B1 (en) * 2020-03-04 2022-11-29 Amazon Technologies, Inc. Offboard storage of non-sensitive objects for network-based hardware security modules
EP4120097A1 (de) * 2021-07-15 2023-01-18 Open Text SA ULC Systeme und verfahren zur intelligenten automatischen ablage von dokumenten in einem inhaltsverwaltungssystem
US11893031B2 (en) 2021-07-15 2024-02-06 Open Text Sa Ulc Systems and methods for intelligent automatic filing of documents in a content management system

Family Cites Families (161)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1327407C (en) 1988-11-29 1994-03-01 Chander Kasiraj Method for providing an object activity history
US5579471A (en) 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US6006239A (en) 1996-03-15 1999-12-21 Microsoft Corporation Method and system for allowing multiple users to simultaneously edit a spreadsheet
DE69719269T2 (de) 1996-08-01 2003-10-30 Ibm Absicherung der Unteilbarkeit für eine Ansammlung von transaktionellen Arbeitsschritten in einem Arbeitsflussverwaltungssystem
US6453352B1 (en) 1997-07-14 2002-09-17 Electronic Data Systems Corporation Integrated electronic commerce system and method
US6119165A (en) 1997-11-17 2000-09-12 Trend Micro, Inc. Controlled distribution of application programs in a computer network
US6415373B1 (en) 1997-12-24 2002-07-02 Avid Technology, Inc. Computer system and process for transferring multiple high bandwidth streams of data between multiple storage units and multiple applications in a scalable and reliable manner
US8479122B2 (en) 2004-07-30 2013-07-02 Apple Inc. Gestures for touch sensitive input devices
US6314105B1 (en) 1998-05-19 2001-11-06 Cisco Technology, Inc. Method and apparatus for creating and dismantling a transit path in a subnetwork
FR2781582B1 (fr) 1998-07-21 2001-01-12 Technical Maintenance Corp Systeme de telechargement d'objets ou de fichiers pour mise a jour de logiciels
US20050131992A1 (en) 2003-12-11 2005-06-16 Eric Goldstein System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
US6507845B1 (en) 1998-09-14 2003-01-14 International Business Machines Corporation Method and software for supporting improved awareness of and collaboration among users involved in a task
US6317722B1 (en) 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
AU2935800A (en) 1999-02-11 2000-09-14 Signifile B.V. Electronic document storage and retrieval system and method
US6614804B1 (en) 1999-03-22 2003-09-02 Webtv Networks, Inc. Method and apparatus for remote update of clients by a server via broadcast satellite
FI109319B (fi) 1999-12-03 2002-06-28 Nokia Corp Päätelaitteelle välitettävän elektronisen informaation suodattaminen
AU2602101A (en) 1999-12-23 2001-07-03 Accenture Llp A method for controlling data collection, manipulation and storage on a network with service assurance capabilities
US8701027B2 (en) 2000-03-16 2014-04-15 Microsoft Corporation Scope user interface for displaying the priorities and properties of multiple informational items
US6687735B1 (en) 2000-05-30 2004-02-03 Tranceive Technologies, Inc. Method and apparatus for balancing distributed applications
US7219302B1 (en) 2000-07-19 2007-05-15 Everez Systems Limited System and method for organizing, managing, and manipulating desktop objects with an activity-oriented user interface
US6711557B1 (en) 2000-08-14 2004-03-23 Adobe Systems Incorporated Client-based background update monitoring
US7047309B2 (en) 2000-08-23 2006-05-16 International Business Machines Corporation Load balancing and dynamic control of multiple data streams in a network
EP1532543A4 (de) 2000-09-11 2008-04-16 Agami Systems Inc Speichersystem mit partitionierten migrierbaren metadaten
US20020112116A1 (en) 2000-11-17 2002-08-15 Nelson Mark Edward Methods, systems, and computer program products for storing data in collections of tagged data pieces
US6590568B1 (en) 2000-11-20 2003-07-08 Nokia Corporation Touch screen drag and drop input technique
US7660902B2 (en) 2000-11-20 2010-02-09 Rsa Security, Inc. Dynamic file access control and management
US7783972B2 (en) 2001-01-08 2010-08-24 Enfocus NV Ensured workflow system and method for editing a consolidated file
US7030861B1 (en) 2001-02-10 2006-04-18 Wayne Carl Westerman System and method for packing multi-touch gestures onto a hand
US20020167538A1 (en) 2001-05-11 2002-11-14 Bhetanabhotla Murthy N. Flexible organization of information using multiple hierarchical categories
US7945600B1 (en) 2001-05-18 2011-05-17 Stratify, Inc. Techniques for organizing data to support efficient review and analysis
US7711771B2 (en) 2001-05-25 2010-05-04 Oracle International Corporation Management and synchronization application for network file system
US20030208490A1 (en) 2001-06-15 2003-11-06 Jean-Jacques Larrea System and method for data storage, control and access
US8990712B2 (en) 2011-08-24 2015-03-24 Z124 Unified desktop triad control user interface for file manager
JP3726263B2 (ja) * 2002-03-01 2005-12-14 ヒューレット・パッカード・カンパニー 文書分類方法及び装置
JP2003298991A (ja) 2002-03-29 2003-10-17 Fuji Photo Film Co Ltd 画像整理方法および装置並びにプログラム
AU2003228631A1 (en) 2002-04-19 2003-11-03 Lenin Babu Document management system
JP2004220569A (ja) 2002-12-25 2004-08-05 Casio Comput Co Ltd データファイル記憶装置、データファイル記憶プログラム及びデータファイル記憶方法
JP2004213129A (ja) 2002-12-27 2004-07-29 Fuji Photo Film Co Ltd 画像分類方法および装置並びにプログラム
US7627552B2 (en) 2003-03-27 2009-12-01 Microsoft Corporation System and method for filtering and organizing items based on common elements
US7536386B2 (en) 2003-03-27 2009-05-19 Microsoft Corporation System and method for sharing items in a computer system
US20050033777A1 (en) 2003-08-04 2005-02-10 Moraes Mark A. Tracking, recording and organizing changes to data in computer systems
US20080126476A1 (en) 2004-08-04 2008-05-29 Nicholas Frank C Method and System for the Creating, Managing, and Delivery of Enhanced Feed Formatted Content
US8346739B1 (en) * 2004-08-27 2013-01-01 Affiliated Computer Services, Inc. Segmenting documents among multiple data repositories
US8504565B2 (en) 2004-09-09 2013-08-06 William M. Pitts Full text search capabilities integrated into distributed file systems— incrementally indexing files
US20060059174A1 (en) 2004-09-16 2006-03-16 International Business Machines Corporation Apparatus, system, and method for locating an application compatible with a file
US7630400B2 (en) 2005-01-20 2009-12-08 International Business Machines Corporation Controlling software distribution or file transfer
US7323999B2 (en) 2005-03-11 2008-01-29 International Business Machines Corporation Automatic subscriptions to shared repositories with notifications reflecting accesses by important other users and keywords stored in a personal interest profile
US20060229932A1 (en) 2005-04-06 2006-10-12 Johnson & Johnson Services, Inc. Intelligent sales and marketing recommendation system
US20140236722A1 (en) 2005-04-08 2014-08-21 Marshall Feature Recognition Llc System And Method For Accessing Electronic Data Via An Image Search Engine
US7620902B2 (en) 2005-04-20 2009-11-17 Microsoft Corporation Collaboration spaces
WO2007085083A1 (en) 2006-01-27 2007-08-02 Titan Digital Corporation Event structured file system (esfs)
EP1847952A1 (de) 2006-04-21 2007-10-24 Yahoo!, Inc. Suchverfahren und Suchgerät
US20100198802A1 (en) * 2006-06-07 2010-08-05 Renew Data Corp. System and method for optimizing search objects submitted to a data resource
US8270490B2 (en) 2006-07-06 2012-09-18 Canon Kabushiki Kaisha Motion vector detection apparatus, motion vector detection method, image encoding apparatus, image encoding method, and computer program
US7756821B2 (en) 2006-11-02 2010-07-13 Microsoft Corporation Virtual deletion in merged file system directories
US7956847B2 (en) 2007-01-05 2011-06-07 Apple Inc. Gestures for controlling, manipulating, and editing of media files using touch sensitive devices
US20080177623A1 (en) 2007-01-24 2008-07-24 Juergen Fritsch Monitoring User Interactions With A Document Editing System
US8132111B2 (en) 2007-01-25 2012-03-06 Samuel Pierce Baron Virtual social interactions
WO2008097810A2 (en) 2007-02-02 2008-08-14 Veoh Networks, Inc. Indicator-based recommendation system
US20080270398A1 (en) 2007-04-30 2008-10-30 Landau Matthew J Product affinity engine and method
US8522258B1 (en) 2007-06-15 2013-08-27 At&T Mobility Ii Llc Event handling system
US7904303B2 (en) 2007-08-24 2011-03-08 Yahoo! Inc. Engagement-oriented recommendation principle
WO2009032710A2 (en) 2007-08-29 2009-03-12 Nirvanix, Inc. Filing system and method for data files stored in a distributed communications network
US8285700B2 (en) 2007-09-07 2012-10-09 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US7827299B2 (en) 2007-09-11 2010-11-02 International Business Machines Corporation Transitioning between historical and real time data streams in the processing of data change messages
US9020913B2 (en) 2007-10-25 2015-04-28 International Business Machines Corporation Real-time interactive authorization for enterprise search
US8467955B2 (en) 2007-10-31 2013-06-18 Microsoft Corporation Map-centric service for social events
US8645827B2 (en) 2008-03-04 2014-02-04 Apple Inc. Touch event model
US8676001B2 (en) 2008-05-12 2014-03-18 Google Inc. Automatic discovery of popular landmarks
US8418084B1 (en) 2008-05-30 2013-04-09 At&T Intellectual Property I, L.P. Single-touch media selection
US8671112B2 (en) * 2008-06-12 2014-03-11 Athenahealth, Inc. Methods and apparatus for automated image classification
US20090327975A1 (en) 2008-06-27 2009-12-31 Stedman Roy W Multi-Touch Sorting Gesture
KR100972104B1 (ko) 2008-06-27 2010-07-23 주식회사 켐트로닉스 이동 터치 감지 방법, 장치 및 그 방법을 실행하는프로그램이 기록된 기록매체
US8169414B2 (en) 2008-07-12 2012-05-01 Lim Seung E Control of electronic games via finger angle using a high dimensional touchpad (HDTP) touch user interface
US9251286B2 (en) 2008-07-15 2016-02-02 International Business Machines Corporation Form attachment metadata generation
US8520979B2 (en) 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
US8644688B2 (en) 2008-08-26 2014-02-04 Opentv, Inc. Community-based recommendation engine
JP5329884B2 (ja) 2008-09-18 2013-10-30 株式会社東芝 携帯可能電子装置および携帯可能電子装置におけるデータ処理方法
JP5199003B2 (ja) 2008-09-25 2013-05-15 株式会社日立製作所 管理装置及び計算機システム
CA2739582A1 (en) 2008-10-14 2010-04-22 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US8624836B1 (en) 2008-10-24 2014-01-07 Google Inc. Gesture-based small device input
KR20100052676A (ko) 2008-11-11 2010-05-20 삼성전자주식회사 컨텐츠 앨범화 장치 및 그 방법
US20100131523A1 (en) * 2008-11-25 2010-05-27 Leo Chi-Lok Yu Mechanism for associating document with email based on relevant context
US20100161441A1 (en) 2008-12-24 2010-06-24 Comcast Interactive Media, Llc Method and apparatus for advertising at the sub-asset level
US8298087B1 (en) 2009-01-02 2012-10-30 Nintendo Of America Inc. Recommendation engine for electronic game shopping channel
US8196047B2 (en) 2009-01-20 2012-06-05 Microsoft Corporation Flexible visualization for services
US9405752B2 (en) 2009-02-13 2016-08-02 T-Mobile Usa, Inc. System and method for automatically presenting a media file on a mobile device based on relevance to a user
US20100241971A1 (en) 2009-03-20 2010-09-23 Thomas Zuber System and method for interactively collaborating within a secure online social networking community
US9215423B2 (en) 2009-03-30 2015-12-15 Time Warner Cable Enterprises Llc Recommendation engine apparatus and methods
US10984397B2 (en) 2009-03-31 2021-04-20 Ebay Inc. Application recommendation engine
US20110044512A1 (en) 2009-03-31 2011-02-24 Myspace Inc. Automatic Image Tagging
US8260489B2 (en) 2009-04-03 2012-09-04 Certusview Technologies, Llc Methods, apparatus, and systems for acquiring and analyzing vehicle data and generating an electronic representation of vehicle operations
US8396287B2 (en) 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
US8555173B2 (en) 2009-05-31 2013-10-08 Linkedin Corporation Recommendation engine
AU2010264023A1 (en) 2009-06-03 2012-02-02 The Information Company Private Limited A method and system for directory management
US8433993B2 (en) 2009-06-24 2013-04-30 Yahoo! Inc. Context aware image representation
US8880544B2 (en) 2009-06-26 2014-11-04 Simplivity Corporation Method of adapting a uniform access indexing process to a non-uniform access memory, and computer system
US8285681B2 (en) 2009-06-30 2012-10-09 Commvault Systems, Inc. Data object store and server for a cloud storage environment, including data deduplication and data management across multiple cloud storage sites
US8407613B2 (en) 2009-07-13 2013-03-26 Apple Inc. Directory management on a portable multifunction device
US8670597B2 (en) 2009-08-07 2014-03-11 Google Inc. Facial recognition with social network aiding
US8429565B2 (en) 2009-08-25 2013-04-23 Google Inc. Direct manipulation gestures
US8571331B2 (en) 2009-11-30 2013-10-29 Xerox Corporation Content based image selection for automatic photo album generation
US8238671B1 (en) 2009-12-07 2012-08-07 Google Inc. Scene classification for place recognition
US8189964B2 (en) 2009-12-07 2012-05-29 Google Inc. Matching an approximately located query image against a reference image set
US8719939B2 (en) * 2009-12-31 2014-05-06 Mcafee, Inc. Malware detection via reputation system
US8423046B2 (en) 2010-02-22 2013-04-16 Google Inc. Network performance server
KR20110128567A (ko) 2010-05-24 2011-11-30 삼성전자주식회사 사용자 인터페이스에 포함되는 오브젝트의 제어 방법 및 상기 방법이 채용된 장치
US8323048B2 (en) 2010-08-03 2012-12-04 Ideal Industries, Inc. Conduit connector with two housings for connection to flexible conduit
US20120072449A1 (en) 2010-09-17 2012-03-22 Microsoft Corporation Object instance versioning
US9323442B2 (en) 2010-09-30 2016-04-26 Apple Inc. Managing items in a user interface
US9031957B2 (en) 2010-10-08 2015-05-12 Salesforce.Com, Inc. Structured data in a business networking feed
US8903770B2 (en) 2010-10-15 2014-12-02 Salesforce.Com, Inc. Methods and apparatus for discontinuing the following of records in an on-demand database service environment
EP2458512A1 (de) 2010-11-29 2012-05-30 Deutsche Telekom AG Mobiler Datenspeicher
EP2458548A1 (de) 2010-11-30 2012-05-30 France Telecom System und Verfahren zur Implementierung von dynamischen Zugriffssteuerungsregeln für persönliche Cloudinformationen
US8464184B1 (en) 2010-11-30 2013-06-11 Symantec Corporation Systems and methods for gesture-based distribution of files
US8412731B2 (en) 2010-12-09 2013-04-02 International Business Machines Corporation File management method and system
US20120233227A1 (en) 2010-12-09 2012-09-13 International Business Machines Corporation File attachment retrieval
WO2012092025A2 (en) 2010-12-27 2012-07-05 Google Inc. Social network collaboration space
GB2500356A (en) 2011-01-20 2013-09-18 Box Inc Real time notification of activities that occur in a web-based collaboration environment
KR101842690B1 (ko) 2011-01-27 2018-03-28 구글 엘엘씨 소셜 네트워크 내의 콘텐트 액세스 제어
US20120213404A1 (en) 2011-02-18 2012-08-23 Google Inc. Automatic event recognition and cross-user photo clustering
US8468164B1 (en) 2011-03-09 2013-06-18 Amazon Technologies, Inc. Personalized recommendations based on related users
WO2012131429A1 (en) 2011-03-29 2012-10-04 Yogesh Chunilal Rathod A method and system for dynamically publishing, sharing, communication and subscribing
CA2772903A1 (en) 2011-03-31 2012-09-30 Wideorbit Inc. Systems and methods for importing media file email attachments
WO2013085564A2 (en) 2011-04-12 2013-06-13 Arcode Corporation Methods and systems to filter and display electronic messages
CN102750541B (zh) * 2011-04-22 2015-07-08 北京文通科技有限公司 一种文档图像分类识别方法及装置
US9646291B2 (en) * 2011-05-11 2017-05-09 Visa International Service Association Electronic receipt manager apparatuses, methods and systems
US20120290926A1 (en) 2011-05-12 2012-11-15 Infinote Corporation Efficient document management and search
US8332424B2 (en) 2011-05-13 2012-12-11 Google Inc. Method and apparatus for enabling virtual tags
US9058612B2 (en) 2011-05-27 2015-06-16 AVG Netherlands B.V. Systems and methods for recommending software applications
JP5689174B2 (ja) 2011-05-27 2015-03-25 株式会社日立製作所 ファイル来歴記録システム、ファイル来歴管理装置及びファイル来歴記録方法
US8788947B2 (en) 2011-06-14 2014-07-22 LogMeln, Inc. Object transfer method using gesture-based computing device
US20130006986A1 (en) * 2011-06-28 2013-01-03 Microsoft Corporation Automatic Classification of Electronic Content Into Projects
US9978040B2 (en) 2011-07-08 2018-05-22 Box, Inc. Collaboration sessions in a workspace on a cloud-based content management system
US20130024464A1 (en) 2011-07-20 2013-01-24 Ness Computing, Inc. Recommendation engine that processes data including user data to provide recommendations and explanations for the recommendations to a user
US8458174B1 (en) 2011-09-02 2013-06-04 Google Inc. Semantic image label synthesis
US8887035B2 (en) 2011-09-21 2014-11-11 Facebook, Inc. Capturing structured data about previous events from users of a social networking system
US9286641B2 (en) 2011-10-19 2016-03-15 Facebook, Inc. Automatic photo capture based on social components and identity recognition
KR101812657B1 (ko) 2011-11-22 2018-01-31 삼성전자주식회사 컨텍스트 정보에 기초한 애플리케이션 추천 시스템 및 방법
KR20130065802A (ko) 2011-11-30 2013-06-20 삼성전자주식회사 키워드를 이용한 애플리케이션 추천 시스템 및 방법
US8891907B2 (en) 2011-12-06 2014-11-18 Google Inc. System and method of identifying visual objects
US8417000B1 (en) 2011-12-12 2013-04-09 Google Inc. Determining the location at which a photograph was captured
KR101895536B1 (ko) 2011-12-29 2018-10-25 삼성전자주식회사 어플리케이션 사용에 따른 어플리케이션 추천 서버 및 단말, 그리고 어플리케이션 추천 방법
WO2013130588A1 (en) * 2012-02-29 2013-09-06 Construcs, Inc. Synchronizing local clients with a cloud-based data storage system
US8950009B2 (en) 2012-03-30 2015-02-03 Commvault Systems, Inc. Information management of data associated with multiple cloud services
US20140019317A1 (en) 2012-04-05 2014-01-16 Lemon, Inc. Transaction managing system
US9626381B2 (en) 2012-06-19 2017-04-18 International Business Machines Corporation Photo album creation based on social media content
KR101984154B1 (ko) 2012-07-16 2019-05-30 삼성전자 주식회사 터치 및 제스처 입력을 이용한 단말의 제어 방법 및 그 단말
US20140068443A1 (en) 2012-08-28 2014-03-06 Private Group Networks, Inc. Method and system for creating mnemonics for locations-of-interests
US9002962B2 (en) 2012-12-10 2015-04-07 Dropbox, Inc. Saving message attachments to an online content management system
US8612470B1 (en) 2012-12-28 2013-12-17 Dropbox, Inc. Application recommendation using stored files
US9934241B2 (en) * 2013-03-05 2018-04-03 Hightail, Inc. System and method for cloud-based read-only folder synchronization
US9122681B2 (en) * 2013-03-15 2015-09-01 Gordon Villy Cormack Systems and methods for classifying electronic information using advanced active learning techniques
US20140316808A1 (en) 2013-04-23 2014-10-23 Lexmark International Technology Sa Cross-Enterprise Electronic Healthcare Document Sharing
US20150032480A1 (en) * 2013-07-26 2015-01-29 Bank Of America Corporation Use of e-receipts to determine insurance valuation
JP6265644B2 (ja) * 2013-07-31 2018-01-24 キヤノン株式会社 文書管理プログラム、情報処理装置
US9628507B2 (en) * 2013-09-30 2017-04-18 Fireeye, Inc. Advanced persistent threat (APT) detection center
CN103559175B (zh) * 2013-10-12 2016-08-10 华南理工大学 一种基于聚类的垃圾邮件过滤系统及方法
US20150193521A1 (en) 2014-01-09 2015-07-09 Google Inc. Methods for Generating an Activity Stream
US9507791B2 (en) * 2014-06-12 2016-11-29 Google Inc. Storage system user interface with floating file collection
US10078781B2 (en) 2014-06-13 2018-09-18 Google Llc Automatically organizing images

Also Published As

Publication number Publication date
GB2550777B (en) 2021-09-01
US20160210347A1 (en) 2016-07-21
GB201713183D0 (en) 2017-10-04
DE202015009283U1 (de) 2017-01-19
US9870420B2 (en) 2018-01-16
CN107209771A (zh) 2017-09-26
GB2550777A (en) 2017-11-29
WO2016118215A1 (en) 2016-07-28

Similar Documents

Publication Publication Date Title
DE112015005985T5 (de) Klassifizierung und speicherung von dokumenten
DE10308014B4 (de) System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt
DE102019000675A1 (de) Nutzen eines modells auf der basis eines tiefen neuronalen netzwerks zum identifizieren von visuell ähnlichen digitalen bildern auf der basis von nutzer-ausgewählten visuellen eigenschaften
DE112019000744T5 (de) Nicht überwachte domänenübergreifende Abstandsmetrikanpassung mit Merkmalsübertragungsnetz
DE112016005555T5 (de) CAPTCHA-Aufgaben auf Bildbasis
DE202015009255U1 (de) Automatische Bildorganisation
DE102016010744A1 (de) Modifizieren von zumindest einem Attribut von einem Bild mit zumindest einem Attribut, das von einem anderen Bild extrahiert wurde
DE102017011262A1 (de) Themenverknüpfung und Markierung für dichte Bilder
DE212017000257U1 (de) Systeme zum Anwenden eines Layouts auf Dokumente
DE102016014798A1 (de) Genaues Vorhersagen einer Etikettrelevanz bei einer Bildabfrage
DE112011102043T5 (de) Objekterfassungsmetadaten
DE10317234A1 (de) Systeme und Verfahren für eine verbesserte Genauigkeit von einem extrahierten digitalen Inhalt
DE202020101701U1 (de) Trainieren neuronaler Netze unter Verwendung von Datenvermehrungsstrategien
DE102011005579A1 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Speichermedium
DE102012102797A1 (de) Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf einem Mobilfunkgerät
DE102012218966A1 (de) Verfahren und System zum Kennzeichnen von durch Dinge im Internet der Dinge erzeugten Originaldaten
DE212017000237U1 (de) Suche und Abruf von strukturierten Informationskarten
DE102017005964A1 (de) Techniken zum Auswählen von Objekten in Bildern
DE112020006402T5 (de) Maschinelle lernmodelle basierend auf veränderter daten sowie systeme und verfahren zum trainieren und deren verwendung
DE112012005307T5 (de) Verfahren, Computerprogramm und Computer zum Erkennen von Gemeinschaften in einem sozialen Medium
CH712988A1 (de) Verfahren zum Durchsuchen von Daten zur Verhinderung von Datenverlust.
DE102019125937A1 (de) Informationsverarbeitungsverfahren und elektronische Vorrichtung
EP3767532A1 (de) Bestimmen einer verteil- und/oder sortierinformation zum automatisierten verteilen und/oder sortieren einer sendung
DE102012025351B4 (de) Verarbeitung eines elektronischen Dokuments
DE102014111571A1 (de) Speichersystem und Verfahren zum Verwalten eines Datenobjektspeichers in einem Speichersystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R083 Amendment of/additions to inventor(s)
R081 Change of applicant/patentee

Owner name: GOOGLE LLC (N.D.GES.D. STAATES DELAWARE), MOUN, US

Free format text: FORMER OWNER: GOOGLE INC., MOUNTAIN VIEW, CALIF., US

R082 Change of representative

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016000000

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0016000000

Ipc: G06F0016930000