DE202013100073U1 - Benutzerprofilerstellung zum Schätzen der Druckleistung - Google Patents

Benutzerprofilerstellung zum Schätzen der Druckleistung Download PDF

Info

Publication number
DE202013100073U1
DE202013100073U1 DE202013100073.6U DE202013100073U DE202013100073U1 DE 202013100073 U1 DE202013100073 U1 DE 202013100073U1 DE 202013100073 U DE202013100073 U DE 202013100073U DE 202013100073 U1 DE202013100073 U1 DE 202013100073U1
Authority
DE
Germany
Prior art keywords
user
users
role
roles
quota
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE202013100073.6U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of DE202013100073U1 publication Critical patent/DE202013100073U1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)
  • Facsimiles In General (AREA)

Abstract

System zum Berechnen eines Referenzverhaltens für einen neuen Benutzer, umfassend: einen Merkmalextraktor zum Extrahieren von Merkmalen aus Nutzungsdaten, die für Benutzer einer zugehörigen Reihe von gemeinsamen Geräten erfasst werden, eine Rollenzuordnungskomponente, um einem neuen Benutzer basierend auf Merkmalen, die aus den Nutzungsdaten des neuen Benutzers extrahiert werden, ein Benutzerrollenprofil zuzuordnen, wobei das Benutzerrollenprofil den neuen Benutzer mit wenigstens einer aus einer Reihe von Rollen verbindet, wobei die Rollenzuordnungskomponente ein Modell anwendet, das mit Hilfe von Merkmalen eingelernt wird, die aus den Nutzungsdaten einer ursprünglichen Reihe von Benutzern extrahiert werden; eine Benutzerkontingentkomponente zum Berechnen eines Referenzverhaltens für den neuen Benutzer basierend auf dem Benutzerrollenprofil und den Referenzverhalten für Rollen in der Reihe von Rollen; und einen Prozessor, der wenigstens eines aus Merkmalextraktor, Rollenzuordnungskomponente und Benutzerkontingentkomponente implementiert.

Description

  • Allgemeiner Stand der Technik
  • Die exemplarische Ausführungsform betrifft ein System zur Förderung ökologischen Verhaltens durch Benutzer von Verbrauchsmaterialien oder Dienstleistungen, wie etwa Benutzern von gemeinsamen elektromechanischen Geräten. Sie findet insbesondere Anwendung in Verbindung mit einem Netzwerkdrucksystem, in dem mehrere gemeinsame Drucker für Benutzer zum Drucken von Druckaufträgen zur Verfügung stehen, und wird mit besonderer Bezugnahme darauf beschrieben.
  • Zur Verbesserung von Abläufen, sowohl im Hinblick auf Umweltauswirkungen als auch auf Kosten, haben Organisationen, wie etwa Unternehmen, Regierungsorganisationen, Schulen, Wohnanlagen und dergleichen, den Versuch gestartet, ein umweltbewussteres Verhalten in zahlreichen Ablaufbereichen zu fördern. Benutzer jedoch dazu zu bewegen, ihre Gewohnheiten zu ändern, um zu einem kollektiven Ziel beizutragen, ist eine komplexe Angelegenheit, sowohl bei der Arbeit als auch in der Gesellschaft insgesamt.
  • Die US-Patentschriften Nr. 20110273739 und 20120033250 offenbaren ein „Personal Assessment Tool” [persönliches Bewertungs-Tool] (PAT), das hilft, den Benutzern ihr individuelles Druckverhalten bewusst zu machen. Ziel ist es, Benutzer dazu zu bewegen, nur das zu drucken, was für die Unterstützung ihrer Arbeitsaufgabe wirklich notwendig ist, und weniger zu verbrauchen (und zu verschwenden). Ein Merkmal dieses Tools ist die Einfachheit, mit der es den Benutzern Rückmeldung über deren Leistung in Bezug auf ihr Druckverhalten gibt. Die Leistungsrückmeldung wird als Punktzahl gegeben, die durch Vergleichen des beobachteten Verhaltens des Benutzers mit einem Referenzverhalten berechnet wird, wobei beide in verbrauchten Papierbogen über einen gegebenen Zeitraum ausgedrückt werden können.
  • Ein Problem bei diesem Ansatz besteht in der Festlegung einer Bezugsbasis, mit der das aktuelle Verhalten eines Benutzers verglichen werden kann. Eine Lösung ist es, das individuelle Referenzverhalten eines Benutzers aus seinem individuellen Durchschnittsverhalten der Vergangenheit zu berechnen. Um jedoch ein aussagekräftiges Referenzverhalten für einen Benutzer zu berechnen, ist eine signifikante Menge an historischen Daten über das Druckverhalten des Benutzers erforderlich, damit das Verhalten repräsentativ ist. Das Druckverhalten eines Benutzers kann erheblich variieren, je nach saisonalen Änderungen in der Arbeitsaufgabe des Benutzers. Zudem kann es sein, dass für neue Angestellte solche Daten lediglich für einen kurzen Zeitraum verfügbar und nicht sehr repräsentativ sind. Ein weiteres Problem bei diesem Ansatz besteht darin, dass Benutzer mit einem anfangs schlechten Referenzverhalten (jene, die viel mehr drucken als für die Ausführung ihrer Arbeitsaufgaben wirklich notwendig ist) insofern einen Vorteil gegenüber jenen Benutzern mit einem anfangs besseren Druckverhalten haben, als es für diese leichter ist, deutliche Verbesserungen zu zeigen und so mehr Vorteile zu erlangen, die durch verschiedenste Boni für Benutzer, die Verbesserungen zeigen, gewährt werden.
  • Alternative Möglichkeiten zum Berechnen des Referenzverhaltens können in Betracht gezogen werden, um diese Probleme zu lösen, zum Beispiel durch Heranziehen des durchschnittlichen Verbrauchs, der innerhalb einer Organisation oder unter Leuten, die die gleiche Arbeitsrolle wie der betreffende Benutzer innehaben, beobachtet wird. Beide Ansätze sind problematisch. Im ersten Fall ist das Referenzverhalten möglicherweise nicht repräsentativ, da die Leute je nach Rolle und Tätigkeit einen sehr unterschiedlichen Druckbedarf haben können, was in unterschiedlichen Referenzverhalten widergespiegelt werden sollte. Der zweite Fall ist nur dann anwendbar, wenn die einzelnen Benutzer sehr genau festgelegte und definierbare Arbeitsrollen innehaben.
  • Das vorliegende System ermöglicht das Festlegen von angemessenen Referenzverhalten für Benutzer, die einen unterschiedlichen Verbrauchsbedarf aufgrund von Unterschieden in ihren Arbeitsaufgaben haben.
  • Aufnahme durch Verweis
  • Folgende Verweise, deren Offenbarungen hierin durch Verweis in deren Gesamtheit aufgenommen werden, werden angeführt:
    Bei den Folgenden geht es im Allgemeinen darum, Benutzer dazu zu bringen, fundierte Entscheidungen in Bezug auf das Drucken zu treffen: US-Patentschrift Nr. 20110273739 , veröffentlicht am 10. November 2011, mit dem Titel „SYSTEM AND METHOD FOR PROVIDING ENVIRONMENTAL FEEDBACK TO USERS OF SHARED PRINTERS”, von Maria Antonietta Grasso, et al.; US-Patentschrift Nr. 20110310428 , veröffentlicht am 22. Dezember 2011, mit dem Titel „SYSTEM AND METHOD FOR ENABLING AN ENVIRONMENTALLY INFORMED PRINTER CHOICE AT JOB SUBMISSION TIME”, von Victor Ciriza, et al.; US-Patentschrift Nr. 20120033250 , veröffentlicht am 9. Februar 2012, mit dem Titel „VIRTUAL PRINTING CURRENCY FOR PROMOTING ENVIRONMENTAL BEHAVIOR OF DEVICE USERS”, von Maria Antonietta Grasso, et al.; und US-Patentschrift Nr. 20090138878 , veröffentlicht am 28. Mai 2009, mit dem Titel „ENERGY-AWARE PRINT JOB MANAGEMENT”, von Christer E. Fernstrom, et al.
  • Kurzdarstellung
  • In einem Aspekt der Erfindung umfasst ein System zum Berechnen eines Referenzverhaltens für einen neuen Benutzer einen Merkmalextraktor zum Extrahieren von Merkmalen aus Nutzungsdaten, die für Benutzer einer zugehörigen Reihe von gemeinsamen Geräten erfasst werden. Eine Rollenzuordnungskomponente wird bereitgestellt, um einem neuen Benutzer basierend auf Merkmalen, die aus den Nutzungsdaten des neuen Benutzers extrahiert werden, ein Benutzerrollenprofil zuzuordnen. Das Benutzerrollenprofil verbindet den Benutzer mit wenigstens einer aus einer Reihe von Rollen, wobei die Rollenzuordnungskomponente ein Modell anwendet, das mit Hilfe von Merkmalen eingelernt wird, die aus den Nutzungsdaten einer ursprünglichen Reihe von Benutzern extrahiert werden. Eine Benutzerkontingentkomponente berechnet ein Referenzverhalten für den neuen Benutzer basierend auf dem Benutzerrollenprofil und den Referenzverhalten für Rollen in der Reihe von Rollen. Ein Prozessor implementiert wenigstens eines aus Merkmalextraktor, Rollenzuordnungskomponente und Benutzerkontingentkomponente.
  • Kurzdarstellung der Zeichnungen
  • 1 ist ein funktionales Blockdiagramm eines Systems zum Berechnen und Verwenden eines Benutzerkontingents gemäß einem Aspekt der exemplarischen Ausführungsform;
  • 2 ist ein Ablaufdiagramm, das den Betrieb des erfindungsgemäßen Systems veranschaulicht;
  • 3 ist ein Ablaufdiagramm, das den Betrieb der betrieblichen Gliederung aus 2 veranschaulicht, wo Rollen für eine Untermenge von Benutzern bekannt sind;
  • 4 ist ein Ablaufdiagramm, das den Betrieb der betrieblichen Gliederung aus 2 veranschaulicht, wo Rollen für eine Untermenge von Benutzern nicht bekannt sind;
  • 5 veranschaulicht eine exemplarische grafische Benutzeroberfläche für die Anzeige eines personalisierten Benutzerkontingents;
  • 6 zeigt Kontingente, die für unterschiedliche Rollen und Benutzer berechnet sind, und die Abweichung der Benutzer von deren Kontingenten in Form einer Punktzahl;
  • 7 zeigt Kontingente, die für unterschiedliche Rollen und Benutzer berechnet sind, und die Abweichung der Benutzer von deren Kontingenten in Form einer Punktzahl;
  • 8 zeigt eine relative Punktzahl, die für unterschiedliche Benutzer berechnet ist, und die Abweichung der Benutzer von deren Kontingenten; und
  • 9 zeigt eine relative Punktzahl, die für unterschiedliche Benutzer berechnet ist, und die Abweichung der Benutzer von deren Kontingenten.
  • Detaillierte Beschreibung
  • Aspekte der exemplarischen Ausführungsform betreffen ein System zum Schätzen des Referenzverhaltens eines Gerätebenutzers, und das es ermöglicht, eine angemessenere und vergleichbarere Leistungspunktzahl für den Benutzer zu berechnen.
  • Die exemplarische Ausführungsform wird in Form eines Netzwerkdrucksystems beschrieben, in dem Druckaufträge wahlweise von jedem Benutzerarbeitsplatz an eines von einer Gruppe gemeinsamer Geräte ausgegeben werden können. Die Netzwerkgeräte sind üblicherweise Drucker, Kopierer oder Multifunktionsgeräte (MFDs), wie etwa solche mit Druck-, Kopier- und optionaler Fax- und E-Mail-Funktion. Die tatsächliche Nutzung der gemeinsamen Geräte jedes Benutzers kann ermittelt werden und eine Punktzahl berechnet werden, mit einer Kostenfunktion, die auf der Gerätenutzung basiert, hauptsächlich auf Verbrauchsmaterialien, die zum Ausführen der Aufträge, die vom Benutzer an die Geräte gesendet werden, verwendet werden. Im Fall eines Drucknetzwerks können die Verbrauchsmaterialien als die Anzahl verwendeter Druckträgerbogen oder als sonstige quantifizierbare Maßeinheit von Verbrauchsmaterialien, die zum Drucken verwendet werden, berechnet werden. Die Kostenfunktion kann neben dem Papierverbrauch auch noch andere Faktoren mit einbeziehen, die gewählt werden können, um das Benutzerverhalten zu beeinflussen, während diese ihre erforderlichen Arbeitsaufgaben weiterhin effizient ausführen können.
  • Das exemplarische System findet Anwendung in einem „Personal Assessment Tool” [persönlichem Bewertungs-Tool] (PAT), wie in den oben genannten US-Patentschriften Nr. 20110273739 und 20120033250 beschrieben. Ein derartiges Tool kann Informationen über das Verhalten eines Individuums und dessen Auswirkungen auf die Umwelt über eine Benutzeroberfläche liefern, die einfach zu verstehen ist. Das exemplarische PAT-System kann ebenfalls verwendet werden, um Ziele für den Benutzer festzulegen, und es kann einen Vergleich mit dem Verhalten anderer Benutzer ermöglichen, was mit der Zeit zu Verbesserungen im Verhalten führen kann.
  • Zum Ermitteln der Auswirkungen des Druckverhaltens des Benutzers auf die Umwelt berechnet das PAT Kosten für jede Aktion (Druckauftrag), die in einer virtuellen Währung definiert werden, den so genannten Grünen Punkten (GP). In einer exemplarischen Ausführungsform sind die Kosten einer Aktion gleich der Anzahl von verwendeten Bogen plus einer Strafe. Die Kosten eines Druckauftrags können hauptsächlich abhängig sein von der Anzahl der bedruckten Bogen, da die Auswirkungen auf die Umwelt vorwiegend durch das Druckvolumen bestimmt werden. Die Druckkostenformel fügt jedoch auch Strafkosten für besonders umweltschädigendes Verhalten hinzu. Dem Benutzer kann eine bestimmte Anzahl von grünen Punkten innerhalb eines gegebenen Zeitraums zugeteilt werden, die basierend auf dem Druckergebrauch gemäß der Kostenfunktion verbraucht wird. Jedoch versteht sich, dass die grüne Währung auch auf die Verwendung anderer gemeinsamer Hilfsmittel (wie etwa Geräten oder Dienstleistungen) anwendbar ist, wo Benutzer entscheiden können, wie viel sie das jeweilige Hilfsmittel gebrauchen.
  • Die berechneten Kosten von jeder Aktion werden dann verwendet, um den durchschnittlichen Monatsverbrauch des Benutzers zu berechnen, der im bestehenden System als Referenzverhalten des Benutzers für die Bereitstellung eines personalisierten Kontingents dient. Für die darauf folgenden Monate basiert das Ziel des Benutzers auf dem personalisierten Kontingent, mit der Erwartung, dass der Benutzer versuchen wird, weniger zu verbrauchen. Der GP-Verbrauch des Benutzers wird somit ständig mit seinem personalisierten GP-Kontingent verglichen. Die Differenz zwischen dem persönlichen Kontingent des Benutzers und seinem tatsächlichen Verbrauch, die so genannte GP-Ersparnis oder Punktzahl, wird dann verwendet, um dem Benutzer eine Rückmeldung anzuzeigen und um materielle oder immaterielle Belohnungen bereitzustellen.
  • Das vorliegende System, welches das PAT-System aufnehmen kann, außer wie beschrieben, stellt ein alternatives Verfahren zum Schätzen der Referenzverhalten von Benutzern bereit, welches die Notwendigkeit umgeht, historische Druckprotokolle für jeden Benutzer über einen ausgedehnten Zeitraum zu sammeln. Dies ermöglicht es beispielsweise den Benutzern, eine Rückmeldung zu erhalten, ohne 12 Monate lang auf gesammelte Daten warten zu müssen. Es bietet auch die Möglichkeit, für das Referenzverhalten eines Benutzers das Verhalten anderer Benutzer mit ähnlichen Rollen innerhalb der Organisation mit einzubeziehen. Somit profitieren Benutzer mit unerwünschtem Anfangsverhalten nicht automatisch gegenüber anderen mit ähnlichen Rollen, die hinsichtlich ihres Verbrauchs sorgsamer sind.
  • Kurz ausgedrückt, wird im exemplarischen System ein Benutzerrollenprofil erzeugt, das hilft, Benutzer mit dem gleichen/ähnlichen Verhalten zu identifizieren, und das Muster oder Gruppen verwendet, denen ein Benutzer angehört, um das Referenzverhalten zu berechnen, das als das persönliche Kontingent des Benutzers dienen kann. Dies hilft, Abhängigkeiten von Zeit und außerordentlichen Ereignissen zu vermeiden. Benutzerrollenprofile können ebenso helfen, das Verhalten jedes Benutzers dahingehend zu beurteilen, ob er umweltfreundlich ist oder nicht, und ob er sich verbessert oder verschlechtert, nicht nur in Bezug auf das eigene Verhalten des Benutzers sondern auch im Vergleich zu anderen.
  • Im System werden historische Druckprotokolle einer ursprünglichen Reihe von Benutzern erfasst und verwendet, um eine Merkmalreihe zu bilden, aus der ein Merkmalprofil für jeden Erstbenutzer extrahiert werden kann. Die Druckprotokolle werden jeweils mit Anmerkungen gemäß der Rolle des Erstbenutzers, oder wenn Benutzer mehrere Rollen innehaben, der dem Druckprotokoll zugehörigen Rolle versehen. Durch Verwenden des Merkmalprofils kann dem Benutzer ein Rollenprofil zugeordnet werden, das verwendet wird, um das Kontingent des Benutzers zu ermitteln. Anstelle der Kontingentschätzformel des PAT-Systems gemäß dem Stand der Technik (das den historischen durchschnittlichen Monatsverbrauch eines Benutzers verwendet) sind das aktuelle Kontingent und die Punktzahl des Benutzers repräsentativer für die Gruppe, der der Benutzer angehört, wodurch ein besserer Vergleich und eine bessere Beurteilung des Benutzerverhaltens, einschließlich für neue Benutzer, für die keine umfassenden historischen Druckprotokolle verfügbar sind, ermöglicht werden.
  • Der Begriff „Drucker”, wie hierin verwendet, umfasst im weitesten Sinne verschiedenste Drucker, Kopierer, Buchdruckmaschinen oder Multifunktionsmaschinen, xerografische oder sonstige, wenn nicht anders definiert, die einen Druckauftrag für jeden beliebigen Zweck ausführen.
  • Ein „Druckernetzwerk”, wie hierin verwendet, umfasst eine Vielzahl gemeinsamer Geräte, die für einen oder mehrere Arbeitsplätze, wie etwa Personal Computer, zugänglich sind.
  • Der Begriff „Druckträger” betrifft im Allgemeinen einen materiellen Bogen Papier, Kunststoff oder sonstiges geeignetes materielles Druckträgersubstrat für Bilder, egal ob zugeschnitten oder in Bahnenform zugeführt.
  • Ein „Druckauftrag” umfasst im Allgemeinen ein „Druckobjekt”, das aus einem oder mehreren Dokumentenbildern in einem geeigneten Format besteht, das vom Drucker erkannt wird, zum Beispiel Postscript, zusammen mit einem „Auftragsticket”, das Informationen über den Druckauftrag liefert, die verwendet werden, um zu kontrollieren, wie der Auftrag verarbeitet wird. Das vorliegende Verfahren kann Merkmale basierend auf dem Druckobjekt und/oder auf den Informationen, die aus dem Auftragsticket extrahiert werden, extrahieren.
  • Benutzerrollenprofil
  • Es kann angenommen werden, dass es eine Anzahl R von unterschiedlichen Rollen (Arbeitsaufgaben) in einer Organisation, wie etwa einem Unternehmen, gibt, die Personen (Benutzern) in der Organisation zugeordnet werden können. Jede Rolle mag den Benutzer dazu veranlassen, wenigstens einige Druckaufträge während eines gegebenen Bewertungszeitraums, wie etwa eine Woche oder ein Monat, zu drucken. Es ist jedoch anzunehmen, dass die verschiedenen Rollen jeweils ein unterschiedliches Kontingent (ein Rollenkontingent) aufgrund des unterschiedlichen Druckbedarfs der einzelnen Rollen haben. Personalisierte Kontingente für individuelle Benutzer in der Organisation werden basierend auf dem (den) Kontingent(en) der Rollen berechnet, die sie in der Organisation innehaben.
  • Jeder Benutzer in der Organisation kann eine einzelne Rolle oder eine probabilistische Verteilung auf alle Rollen (das Rollenprofil des Benutzers) haben. Für einen gegebenen Benutzer mit den prognostizierten Rollenwahrscheinlichkeiten p1, p2, ... pR für die Rollen R = 1 bis R kann das persönliche Kontingent des Benutzers q in Abhängigkeit von den Rollenwahrscheinlichkeiten berechnet werden, zum Beispiel mi Hilfe eines gewichteten Mittelwertes der Rollenkontingente q1, q2, ... qR:
    Figure DE202013100073U1_0002
  • In dieser Formel wird angenommen, dass die Rollenwahrscheinlichkeiten auf einen vorausbestimmten Wert addiert werden, zum Beispiel p1 + p2+ ... pR = 1
  • Für jede Rolle wird ein Rollenkontingent qR zugeordnet, das für jede Rolle unterschiedlich sein kann, um der Tatsache Rechnung zu tragen, dass unterschiedliche Rollen einen unterschiedlichen Druckbedarf haben können, um die Rolle erfolgreich zu erfüllen. Die Rollenkontingente q1, q2, ... qR können vom Organisationspersonal beschlossen werden. In anderen Ausführungsformen basiert das Kontingent für jede Rolle wenigstens zum Teil auf historischen Nutzungsdaten für eine Reihe von Benutzern, die diese Rolle ausüben. Das Rollenkontingent kann in einer messbaren Menge eines verwendeten Verbrauchsmaterials, wie etwa Papierbogen oder gedruckte Seiten, ausgedrückt werden.
  • Das Rollenkontingent kann auf vielerlei Arten ermittelt werden. Zum Beispiel kann das Rollenkontingent das durchschnittliche Druckvolumen für alle Benutzer in einer Gruppe sein, die eine gegebene Rolle innehaben, oder von dieser Menge abhängig sein. In einer Ausführungsform werden die Rollen der Erstbenutzer manuell zugeordnet, zum Beispiel von einem Administrator, oder von den Angestellten angesetzt. Zum Beispiel können Rollen aus einer vorausbestimmten Reihe oder Hierarchie von Benutzern anteilsmäßig zugeordnet werden. Zum Beispiel können sie aus einer Vielzahl von Rollen ausgewählt werden, wie etwa (Administration, Forschung, Management, Verkauf usw.). Das Rollenkontingent kann dann basierend auf diesen Informationen als die durchschnittliche Anzahl von Bogen (oder sonstigen geeigneten Maßeinheit), die ein Benutzer mit ausschließlich dieser Rolle in einem gegebenen Zeitraum verbrauchen würde, berechnet werden.
  • Die personalisierten Kontingente, die mit Hilfe der Rollenkontingente berechnet werden, müssen kein festes Limit für die Anzahl von Drucken darstellen, die der Benutzer innerhalb eines Messzeitraums generieren darf, sondern können verwendet werden, um einen Bezugspunkt festzulegen, mit dem Benutzer ihre Leistung vergleichen können. Jedem Benutzer in der Organisation kann sein jeweiliges Kontingent zugeordnet werden. In manchen Ausführungsformen kann anstelle eines personalisierten Kontingents eine Anzahl von Einheiten oder „Punkten” zugeordnet werden, die Benutzerkonten für jeden Bewertungszeitraum in Mengen zugeschrieben werden, die vom jeweiligen Benutzerkontingent abhängen. Wenn in manchen Ausführungsformen das Kontingent in der Anzahl von Bogen bestimmt wird, kann man für jeden Bogen einen Punkt vergeben. Die Einheiten werden dann gemäß einer Kostenfunktion verbraucht, wobei nicht nur die Anzahl von Bogen/gedruckten Seiten mit einbezogen wird, sondern auch andere Faktoren, die dazu bestimmt sind, das Benutzerverhalten zu ändern, wie etwa einer oder mehrere aus Folgendem: ob das gleiche oder ein ähnliches Dokument vom Benutzer in einem vorhergehenden Druckauftrag bereits gedruckt wurde (was man als Wiederholungsdruck bezeichnet und anders behandelt als das Erstellen mehrerer Kopien des gleichen Dokuments in ein und demselben Druckauftrag, was als Teil der Arbeitsaufgabe betrachtet werden kann, zum Beispiel für die Verteilung an andere), ob der Benutzer beidseitiges (vorne und hinten) oder einseitiges (nur vorne) Bedrucken gewählt hat, Art des Auftrags, (mögliches Bestrafen des Benutzers für das Drucken von Dokumenttypen, die üblicherweise nicht gedruckt werden sollten (wie etwa E-Mail oder PowerPoint-Präsentationen), und dergleichen, zum Beispiel mit Hilfe einer Kostenfunktion, wie zum Beispiel in der US-Patentschrift Nr. 20120033250 offenbart.
  • Rollenwahrscheinlichkeiten p1 + p2+ ... pR von Benutzern in der Organisation können mittels unterschiedlicher Verfahren berechnet werden. In einem Verfahren wird ein überwachtes Lernverfahren angewandt. Dabei wird angenommen, dass es eine vorausbestimmte Reihe von Benutzerrollen gibt und dass jedem von einer Untermenge der Benutzer (zum Beispiel eine ursprüngliche Reihe von Benutzern) eine oder mehrere dieser Rollen zugeordnet werden. In einem anderen Verfahren wird ein unüberwachter Lernansatz angewandt. Dieses Verfahren ist für jenen Fall geeignet, wo eine A-priori-Festlegung der Rollen für die Benutzer schwierig ist.
  • 1 veranschaulicht ein exemplarisches System 10 zum Bestimmen eines Referenzverhaltens q für jeden von einem oder mehreren Benutzern in einer Reihe von Benutzern in einer Organisation, in der Benutzer unterschiedliche Rollen haben. Das System 10 ist beschrieben in Form von Benutzern eines Drucknetzwerks, in dem Benutzer Druckaufträge, die auf einen Druckträger zu drucken sind, ausgeben, obwohl auch andere Verwendungen für das System in Betracht gezogen werden, wie etwa zur Überwachung der Nutzung anderer Materialien und/oder Dienstleistungen und dergleichen.
  • Das System 10 kann auf jedem beliebigen geeigneten Rechnergerät bzw. -geräten 12 gehostet werden, wie etwa einem Druckserver eines Drucknetzwerks 14 oder dergleichen. Benutzer 16, 18, 20 des Drucknetzwerks 14 geben ihre Druckaufträge 22, 24, 26 von den jeweiligen Client-Rechnergeräten 28, 30, 32, wie etwa PCs, Laptops oder dergleichen aus, um auf einem oder mehreren Druckern 34 im Drucknetzwerk 14 zu drucken. Drucker 34 können vom Rechnergerät 12 oder einem eigenen Druckserver gesteuert werden. Die Daten 36 von den Druckaufgaben 22, 24, die von einer ursprünglichen Reihe von Benutzern 16, 18 ausgegeben werden, werden über einen Zeitraum vom System 10 erfasst und im Speicher 38 des Systems 10 oder einem fernzugänglichen Speicher gespeichert. Die Daten 36 können von den Client-Rechnergeräten 28, 30, den Druckern 34, einem Druckserver, der Druckaufträge zu den Druckern leitet, einer Kombination davon oder von einem sonstigen Speichergerät erfasst werden. Rollenkontingente 40 und individuelle Benutzerkontingente 42, die vom System 10 generiert werden, können zum Beispiel an die Client-Geräte 28, 30, 32, an eine Datenbank 44, die auf einem Fernspeicher gespeichert ist, ausgegeben und/oder lokal im Systemspeicher 38 gespeichert werden. Den individuellen Konten 46 der Benutzer kann das jeweilige Kontingent jedes Bewertungszeitraums (wie etwa monatlich) gutgeschrieben werden und die Konten können verringert werden, sobald der Benutzer Druckaufträge druckt. Das System 10 kann mit externen Geräten 28, 30, 32, 34, 44 via eine oder mehrere Netzwerkschnittstellen 47, 48 über ein verdrahtetes oder drahtloses Netzwerk 50 kommunizieren, wie etwa ein lokales Netzwerk oder ein Weitverkehrsnetz, wie etwa Internet.
  • Wie zu verstehen sein wird, empfängt das System 10, während lediglich zwei Erstbenutzer 16, 18 in 1 veranschaulicht sind, im Allgemeinen historische Druckauftragsdaten 36 von einer viel größeren Gruppe von Erstbenutzern, wie etwa wenigstens zehn oder wenigstens zwanzig Erstbenutzern. Ferner deckt in einer Ausführungsform die ursprüngliche Reihe von Benutzern alle Rollen in einer Reihe von Rollen ab, wie etwa wenigstens zwei, oder wenigstens drei, oder wenigstens vier, oder wenigstens zehn Rollen innerhalb einer Organisation, wobei jede von wenigstens einigen der Rollen mit einer Vielzahl von Benutzern verbunden ist. Die Druckauftragsdaten 36 können vorverarbeitet werden, um Verzerrung zu verringern, zum Beispiel durch Eliminieren von geringvolumigen Benutzern aus der Datenreihe 36.
  • Ein Speicher 38, oder ein eigener Speicher, speichert Anweisungen 60 für die Durchführung des exemplarischen Verfahrens, die von einem Computerprozessor 62 ausgeführt werden, der mit dem Speicher kommunikativ verbunden ist. Die exemplarischen Anweisungen 60 umfassen einen Merkmalextraktor 64, einen optionalen Merkmalselektor 66, einen Modellgenerator, wie etwa eine Gruppierungskomponente 68 oder Klassifikationskomponente 70, eine Rollenzuordnungskomponente 72, eine Rollenkontingentkomponente 74, eine Benutzerkontingentkomponente 76 und optional eine Punktbewertungskomponente 78 und ein persönliches Bewertungs-Tool (PAT) 80.
  • Von jedem Druckauftrag 22, 24, 26 wird angenommen, dass er eine Reihe von Attributen aufweist, wie etwa Dokumenttyp (Word, Excel, PowerPoint, PDF, E-Mail usw.); Dokumentlänge, zum Beispiel in Seiten; Dokumententextinhalt, zum Beispiel Titel, Schlagwörter und dergleichen; Datum und Zeit der Ausgabe; Farbe oder Schwarz-Weiß (monochrom); einseitig oder beidseitig; und so weiter, die aus den Druckauftragsdaten extrahiert werden können. Der Merkmalextraktor 64 berechnet Merkmale 82 basierend auf diesen Attributen für jeden der ursprünglichen Reihe von Benutzern 16, 18, für die es genug Druckauftragsdaten 36 gibt. Es kann sein, dass manche dieser Attribute für die Kennzeichnung der Benutzerrollen nicht nützlich sind, weshalb nur die unterscheidendsten Attribute gespeichert und zum Generieren der Merkmale 82 herangezogen werden müssen. In einer Ausführungsform evaluiert der Merkmalselektor 66 die möglichen Merkmale, um die unterscheidendsten darunter zu identifizieren, wodurch weniger nützliche ignoriert werden können. In anderen Ausführungsformen wählt ein Administrator oder Systemdesigner jene Merkmale, die es zu verwenden gilt. Die Gruppierungskomponente 68, die im unüberwachten Lernverfahren eingesetzt wird, gruppiert die Erstbenutzer 16, 18 in Gruppen 84, basierend auf deren jeweiligen Reihen von Merkmalen. Jede Gruppe kann als einer andersartigen Rolle entsprechend betrachtet werden. Folglich können, wo Bezug auf Rollenwahrscheinlichkeiten und Rollenkontingente genommen wird, diese als die jeweiligen Wahrscheinlichkeiten und Kontingente für Gruppen in dieser Ausführungsform umfassend betrachtet werden.
  • Im überwachten Lernverfahren werden die Rollen (Rollenprofile) 84 von den Erstbenutzern 16, 18 vom System 10 empfangen. Die Klassifikationskomponente 70 lernt ein Klassifikationsmodell 86 basierend auf den Druckauftragsmerkmalen (Merkmalprofilen) für diese Benutzer und deren jeweils bekannten Rollenprofile 84 mit Hilfe jedes beliebigen geeigneten Klassifikationslernverfahrens. Das trainierte Modell 86 ist somit für die Ausgabe eines individuellen Rollenprofils, für einen neuen Benutzer basierend auf dem Merkmalprofil des Benutzers, konfiguriert.
  • Die Rollenkontingentkomponente 74 berechnet ein Kontingent qr 40 für jede Rolle/Gruppe in der Reihe von Rollen/Gruppen 84, zum Beispiel basierend auf der Nutzung der Benutzer, die dieser Rolle/Gruppe zugeordnet sind. Zum Beispiel berechnet sich das Rollenkontingent aus den Druckauftragsdaten jener Benutzer, die diese Rolle innehaben, zum Beispiel als Durchschnittsverbrauch (zum Beispiel die durchschnittliche Anzahl gebrauchter Bogen oder gedruckter Seiten) von dieser Gruppe von Benutzern (oder berechnet mit Hilfe einer Kostenfunktion wie oben beschrieben). Wo ein Erstbenutzer zwei oder mehrere Rollen hat, kann der Verbrauch zwischen den Rollen aufgeteilt werden, zum Beispiel basierend auf den Rollenwahrscheinlichkeiten, zum Beispiel der Anteil seiner Zeit, die er jeder Rolle beimisst, oder ein sonstiges geeignetes Verfahren für die Zuteilung.
  • In anderen Ausführungsformen werden die Rollenkontingente qr manuell zugeordnet, zum Beispiel basierend zum Teil auf Beobachtungen des Verbrauchs durch Benutzer, die eine gegebene Rolle innehaben.
  • Die Rollenzuordnungskomponente 72 ordnet ein Rollenprofil 88, das aus Rollenwahrscheinlichkeiten pr für eine oder mehrere Rollen besteht, einem neuen Benutzer 20 (oder bestehenden Benutzer 16, 18) basierend auf Merkmalen, die aus deren verfügbaren Druckauftragsdaten 36 extrahiert werden, zu. Im unüberwachten Fall prognostiziert die Rollenzuordnungskomponente 72 (welche die Gruppierungskomponente 68 sein oder diese heranziehen kann) die Gruppenwahrscheinlichkeiten (das heißt Rollenwahrscheinlichkeiten) für einen neuen Benutzer basierend auf extrahierten Merkmalen von einer Auswahl von Druckaufträgen. Dazu kann das Gruppierungsmodell 86 (das die Parameter der Gruppen speichert) verwendet werden, das von der Gruppierungskomponente generiert wird. Im überwachten Fall wird das Klassifikationsmodell 86 von der Rollenzuordnungskomponente 72 verwendet, um eine Zuordnung der Rollen zu berechnen.
  • Die Benutzerkontingentkomponente 76 berechnet ein persönliches Kontingent q für den Benutzer basierend auf dem Rollenprofil 88 des Benutzers, das von der Rollenzuordnungskomponente 72 ausgegeben wird, und den jeweiligen Rollenkontingenten qr 40, zum Beispiel mit Hilfe von Gleichung 1 oben. Das Benutzerkontingent q, das für einen Monat oder jedweden sonstigen vorausbestimmten Bewertungszeitraum sein kann, kann dem Benutzer in einer Benutzeroberfläche angezeigt, von der Punktbewertungskomponente 78 zum Berechnen einer Punktzahl basierend auf der tatsächlichen Nutzung für den Monat verwendet, zum Bereitstellen von Belohnungen für das Einhalten des Kontingents oder für einen unter dem Kontingent liegenden Verbrauch verwendet, oder für eine Kombination daraus verwendet werden, wie in der US-Patentschrift Nr. 20120033250 beschrieben. In einer Ausführungsform generiert das PAT 80 eine Benutzeroberfläche zum Anzeigen des Benutzerkontingents, der Punktzahl und/oder sonstiger Informationen auf dem Client-Gerät des Benutzers und kann zur Gänze oder zum Teil auf dem Client-Gerät gehostet werden.
  • Das Rechnergerät 12 kann ein PC, wie etwa ein Desktop, ein Laptop, Palmtop, tragbarer digitaler Assistent (PDA), Servercomputer, Mobiltelefon, Tablet-Computer, Pager, eine Kombination daraus, oder ein sonstiges Rechnergerät sein, das in der Lage ist, Anweisungen für die Durchführung des exemplarischen Verfahrens auszuführen.
  • Der Speicher 38 kann jede Art von nichtflüchtigem computerlesbarem Medium darstellen, wie etwa Direktzugriffsspeicher (RAM), Nur-Lese-Speicher (ROM), Magnetplatte oder -band, optische Platte, Flash-Speicher oder holografischer Speicher. In einer Ausführungsform umfasst der Speicher 38 eine Kombination aus Direktzugriffsspeicher und Nur-Lese-Speicher. In manchen Ausführungsformen können der Prozessor 62 und der Speicher 38 in einem einzelnen Chip kombiniert sein. Die Netzwerkschnittstelle (E/A) 47, 48, ermöglicht es dem Computer, mit anderen Geräten über ein Computernetzwerk 50 zu kommunizieren, wie etwa ein lokales Netzwerk (LAN) oder Weitverkehrsnetz (WAN), oder das Internet, und kann einen Modulator/Demodulator (MODEM), einen Router, ein Kabel und/oder Ethernet-Anschluss umfassen.
  • Der digitale Prozessor 62 kann unterschiedlich ausgeführt sein, wie etwa in Form eines Einzelkernprozessors, eines Doppelkernprozessors (oder noch allgemeiner in Form eines Mehrkernprozessors), eines digitalen Prozessors und kooperierenden Mathekoprozessors, eines Digitalreglers oder dergleichen. Der digitale Prozessor 62 führt neben der Steuerung des Betriebs des Computers 12 Anweisungen aus, die im Speicher 38 für die Durchführung des Verfahrens gespeichert sind, das in einer oder mehreren der 24 kurz dargestellt ist. Hardwarekomponenten 38, 47, 48, 62 des Systems kommunizieren via Daten-/Steuerbus 89.
  • Der Begriff „Software”, wie hierin verwendet, soll jede beliebige Sammlung oder Reihe von Anweisungen umfassen, die von einem Computer oder sonstigen digitalen System ausgeführt werden können, so dass der Computer oder ein sonstiges digitales System konfiguriert werden kann, um die Aufgabe auszuführen, die Ziel der Software ist. Der Begriff „Software”, wie hierin verwendet, soll derartige Anweisungen umfassen, die im Speichermedium, wie etwa RAM, einer Festplatte, optischen Platte und so weiter, gespeichert sind, und er soll ebenso so genannte „Firmware” umfassen, was Software ist, die auf einem ROM oder dergleichen gespeichert ist. Derartige Software kann auf verschiedene Arten organisiert sein und Softwarekomponenten umfassen, die als Bibliotheken, internetbasierte Programme, die auf einem Fernserver oder dergleichen gespeichert sind, Quellcode, interpretierter Code, Objektcode, direkt ausführbarer Code und so weiter organisiert sind. Es wird in Betracht gezogen, dass die Software einen Code auf Systemebene aufruft oder eine andere Software abruft, die sich auf einem Server oder sonstigen Ort befindet, um bestimmte Funktionen auszuführen.
  • Wie man verstehen wird, ist 1 ein funktionales Blockdiagramm auf höchster Ebene von lediglich einem Teil der Komponenten, die in einem Computersystem 10 integriert sind. Da die Konfiguration und der Betrieb von programmierbaren Computern allgemein bekannt sind, werden diese nicht weiter beschrieben.
  • 2 veranschaulicht den exemplarischen Betrieb zum Berechnen und Verwenden eines Benutzerkontingents, das mit dem System aus 1 ausgeführt wird.
  • Das Verfahren beginnt bei S100.
  • Bei S102 werden Druckvorgänge für eine ursprüngliche Reihe von Benutzern beobachtet, zum Beispiel durch Erfassen von Druckauftragsprotokollen 36. Diese können von den Druckern selbst, von Rechnergeräten des Benutzers oder von einem Server, der die Daten sammelt, erfasst werden. Für jeden Druckauftrag erhält man eine Reihe von Attributen, von denen genaue Beispiele weiter unten angeführt werden. In manchen Ausführungsformen können diese Attribute aus den Druckaufträgen als Attributvektor oder „Signatur” zum Zeitpunkt des Druckens extrahiert werden. Die Attribute können den Zeitpunkt des Druckauftrags, Typ, Inhalt, einseitig vs. beidseitig, verwendeten Drucker, Papiertyp, die Wahl zwischen Farbe und Schwarz-Weiß, Bedruckungsgrad (wie viel der Seite mit Tinte oder Toner bedeckt ist), Kosten, die eines oder mehrere dieser Attribute mit einbeziehen, und so weiter betreffen. Die rohen oder vorverarbeiteten Daten 36 werden vom System empfangen und im Speicher 38 gespeichert.
  • Bei S104 werden von einem Merkmalextraktor 64 Merkmale aus den Druckauftragsprotokollen extrahiert. Exemplarische Merkmale, die basierend auf den Druckauftragsprotokoll-Attributen berechnet werden, umfassen Merkmale für jeden Benutzer. Als Beispiel können diese aus Folgenden gewählt werden:
    • 1. a) Anzahl von gedruckten Bogen, b) Anzahl von gedruckten Druckaufträgen, c) durchschnittliche Anzahl von Bogen pro Druckauftrag, pro vorausbestimmten Zeitraum (zum Beispiel pro Stunde, pro Tag, pro Woche des Monats, pro Woche des Jahres, pro Monat des Jahres usw.);
    • 2. a) Anzahl von gedruckten Bogen, b) Anzahl von gedruckten Druckaufträgen, c) durchschnittliche Anzahl von Bogen pro Druckauftrag, pro vorausbestimmten Auftragstyp für jeden einer vorausbestimmten Reihe von Auftragstypen (zum Beispiel ausgewählt aus E-Mail; Tabellenkalkulation, wie etwa Excel; Grafiken; PDF; PowerPoint; RTF; Text; Zeichenprogramm, wie etwa Visio oder Chemdraw; Webseite; Word oder Sonstiges);
    • 3. a) Anzahl von gedruckten Bogen, b) Anzahl von gedruckten Druckaufträgen, c) durchschnittliche Anzahl von Bogen pro Druckauftrag, pro Drucker, für jeden von einer Reihe von Druckern;
    • 4. Textinhaltsmerkmalen, wie etwa Worthäufigkeiten von jedem einer ausgewählten Reihe von Wörtern, die aus dem Titel oder Inhalt des gedruckten Dokuments extrahiert werden.
  • Die Merkmalwerte können jeweils auf einen Bereich von 0–1 normiert werden und die Merkmalvektoren können ebenfalls normiert werden, so dass die Werte 1 ergeben.
  • Bei S106 wird ein Rollenprognostizierungsmodell 86 (Klassifikationsmodell oder Gruppierungsmodell) gelernt, basierend auf den extrahierten Merkmalen aus den Benutzerdaten der bestehenden Benutzer, und im überwachten Fall, den Rollen (Rollenprofilen) der Erstbenutzer, zum Beispiel mittels Modellgenerator 68 oder 70.
  • Bei S108 wird das Referenzverhalten (Kontingent) q für einen neuen (oder bestehenden) individuellen Benutzer 32 mittels Komponente 76 bestimmt. Wie mit Bezug auf 3 und 4 näher beschrieben, kann dies das Anwenden des gelernten Modells 86 auf Merkmale umfassen, die aus Druckauftragsdaten für den neuen Benutzer extrahiert werden, um das Profil des neuen Benutzers zu prognostizieren, und zwar im Hinblick auf wahrscheinliche Rollen/Gruppen (zum Beispiel ausgedrückt als eine Wahrscheinlichkeit für jede Rolle). Das Benutzerkontingent wird dann basierend auf vorausbestimmten Rollen-/Gruppenkontingenten und dem Benutzerprofil ermittelt.
  • Bei S110 kann die Leistungspunktzahl des Benutzers mit Hilfe der Punktbewertungskomponente 78 als die absolute und/oder relative Differenz zwischen seinem tatsächlichen Verhalten und seinem Referenzverhalten, wie bei S108 berechnet, berechnet werden.
  • Sobald die Berechnung erfolgt ist, kann das Referenzverhalten auch als Basis für die Festlegung von Druckkontrollregeln herangezogen werden, die ein festes Druckverbrauchslimit für die Benutzer einführen.
  • Bei S112 wird eine grafische Darstellung 90 des Benutzerkontingents und/oder der Leistungspunktzahl vom persönlichen Bewertungs-Tool 80 generiert und ausgegeben, um dem Benutzer auf dem Anzeigegerät 92 (zum Beispiel Computermonitor, LED- oder LCD-Bildschirm oder dergleichen) des Client-Gerätes 32 des Benutzers angezeigt zu werden. Die grafische Anzeige kann mit jedem ausgeführten Druckauftrag oder weniger häufig aktualisiert werden. Ein Vergleich mit anderen Benutzern mit dem gleichen (oder ähnlichen) Rollenprofil kann bereitgestellt und auf der Benutzeroberfläche angezeigt werden.
  • Das Verfahren endet bei S114.
  • Das Referenzverhalten (S108) für jeden individuellen Benutzer kann auf verschiedene Arten berechnet werden, je nachdem, ob es vorausbestimmte Rollen gibt.
  • Sind Rollen vorausbestimmt und für eine Untermenge von Benutzern verfügbar, kann ein überwachtes Lernverfahren angewandt werden. In diesem Fall werden zuerst Referenzverhaltensmodelle entsprechend diesen Benutzerrollen aus der Reihe von Druckaufträgen gelernt, die von allen entsprechenden Benutzern ausgegeben werden. Das beobachtete Verhalten jedes individuellen Benutzers wird dann analysiert und die Wahrscheinlichkeiten für die Zugehörigkeit zu jeder der einzelnen Rollen, die seinem beobachteten Druckverhalten zugeordnet werden, werden ermittelt. Dann wird das Gesamtreferenzverhalten des Benutzers als gewichtete Summe der entsprechenden Rollenreferenzverhalten berechnet, wobei die Gewichte die Wahrscheinlichkeiten sind, dass der Benutzer zu jener Rolle gehört. 3 veranschaulicht diesen Fall im Detail.
  • Sind Rollen nicht vorausbestimmt und für eine Untermenge von Benutzern verfügbar, wird ein unüberwachtes Lernverfahren angewandt. In diesem Fall wird das individuelle Referenzverhalten des Benutzers basierend auf dem Verhalten ähnlicher Benutzer ermittelt. Im Speziellen werden Druckaufträge basierend auf Merkmalen, die aus den Druckauftragsdaten extrahiert werden, gruppiert, um Gruppen von (Benutzern, Merkmalen) zu erhalten. Als Beispiel können die Merkmale das Auftreten eines Wortes im Titel oder dem Körper des Dokuments umfassen. Das beobachtete Verhalten jedes individuellen Benutzers wird dann analysiert und der Anteil der Aufträge, die zu jeder dieser Gruppen gehören, die seinem beobachteten Druckverhalten zugeordnet werden, wird ermittelt. Das Referenzverhalten für jeden individuellen Benutzer wird dann als gewichtete Summe der entsprechenden Gruppen bestimmt. 4 veranschaulicht diesen Fall im Detail.
  • Nähere Details des Systems werden nun beschrieben.
  • Fall des überwachten Lernens
  • Überwachtes Lernen oder Klassifikation setzt voraus, dass eine Trainingsreihe mit vorausbestimmten Klassen oder Kategorien verfügbar ist. Für die Benutzerprofilerstellung werden die Trainingsdaten aus den Druckprotokollen gewonnen und die Klassen werden gemäß den Benutzerrollen im Unternehmen festgelegt.
  • Für eine Mehrklassenklassifikation sind mehrere bekannte Algorithmen verfügbar, von denen einer oder mehrere von der Klassifikationskomponente 70 verwendet werden können. Beispielhafte Lernalgorithmen umfassen die Stützvektormethode (SVM), die mit Sequential Minimal Optimization (SMO) gekoppelt werden kann, logistische Regression (LR) und die lineare Diskriminanzanalyse nach Fisher (FLD). Der LR-Algorithmus verwendet eine Algorithmus mit gewichteten kleinsten Quadraten, das heißt, die Prognose basiert auf der Erstellung einer Regressionsgeraden als Ausgleichsgerade durch die Datenpunkte mittels Minimieren einer gewichteten Summe der Quadrate der Abstände zur Ausgleichsregressionsgeraden. Im Gegensatz dazu versucht die SVM die Eingabevariablen zu modellieren, indem die Trennfläche – so genannte Hyperebene – gefunden wird, um eine Klassifikation der Eingabevariablen zu erreichen: Ist keine Trennung innerhalb einer großen Anzahl von Eingabevariablen möglich, findet der SVM-Algorithmus immer noch eine Trennfläche zur Klassifikation, indem die Eingabevariablen durch Erhöhen der Dimensionalität des Raumes der Eingabevariablen mathematisch umgewandelt werden. Die FLD versucht, die Dimensionalität zu verringern, während so viele Klassenunterscheidungsinformationen wie möglich bewahrt werden. Die Klassifikatorrichtigkeit, wie etwa Fehlerrate, Genauigkeit, Trefferquote, Fläche unter der Grenzwertoptimierungskurve (ROC-Kurve), Ausführungszeit, eine Kombination daraus, oder dergleichen kann verwendet werden, um den passendsten Klassifikator, der den gewählten Merkmaltypen zugeordnet wird, auszuwählen. Relevante Parameter des Klassifikators können zum Beispiel durch Evaluieren der Fehlerrate des Klassifikators an einer gekennzeichneten Trainingsreihe ausgewählt werden.
  • 3 veranschaulicht eine Ausführungsform des überwachten Lernverfahrens im Detail. Der Betrieb umfasst eine Trainingsphase, eine Kontingentschätzungsphase basierend auf einer Prognose der Rolle für einen Benutzer und eine Punktbewertungsphase, die die Berechnung von grünen Punkten umfassen kann.
  • Wie für die Ausführungsform aus 2 werden Druckprotokolle erfasst (S202) und verwendet (mittels Merkmalextraktor 64), um eine Reihe von Merkmalen 82 für jeden Benutzer in einer bestehenden (ursprünglichen) Reihe von Benutzern zu berechnen (S204). Die Rollen für jeden der bestehenden Benutzer werden ebenfalls erfasst (S206). Die Benutzerrollen können nach Management festgelegt werden. Zum Beispiel können einem Benutzer 50% seiner Zeit der Managementrolle und 50% der administrativen Rolle zugeordnet werden. Die Rollenverteilungen können auf Beobachtung der Menge von Zeit, die Benutzer für jede Rolle aufwenden, oder auf Befragung der Benutzer darüber, wie viel Zeit sie für jede Rolle aufwenden, basieren. Benutzern mit der gleichen Aufgabenbeschreibung kann die gleiche Verteilung von Rollen zugeordnet werden. Oder die Rollenverteilungen können identifiziert werden, indem man die Druckaufträge von den Benutzern mit entsprechenden Rollenkennzeichnungen versehen lässt, der Benutzer kann dann den Rollen zugeordnet werden, proportional zur Anzahl der Bogen seiner Druckaufträge, die er jeder Rolle zuteilt.
  • Wo eine große Anzahl möglicher Rollenklassifikationsmerkmale verfügbar ist, kann es wünschenswert sein, die diskriminativsten Merkmale zu identifizieren (S208). Um festzustellen, wie diskriminativ Merkmale für die Benutzerrollenklassifikation sind, kann ein statistischer Hypothesentest verwendet werden, wie etwa die studentsche t-Verteilung. Jene Merkmale, die gemäß dem Test zwischen einer gegebenen Rolle und anderen Rollen nicht signifikant unterschiedlich sind, brauchen nicht weiter mit einbezogen werden. Wie zu verstehen sein wird, könnte das Klassifikatormodell die diskriminativsten Merkmale lernen, ohne diese unbedingt auszuwählen. Die diskriminativsten Merkmale jedoch im Vorhinein auszuwählen, kann helfen, die Berechnungszeit zu verringern.
  • Bei S210 wird ein Klassifikatormodell mit Hilfe der (diskriminativsten) Merkmale für jeden der Erstbenutzer (berechnet bei S204) und ihrer jeweils zugeordneten/ermittelten Rollen gelernt. Zum Beispiel kehrt ein Mehrklassenklassifikator ein Klassifikationsmodell durch Umkehren seines Parametervektors um. Die Modellparameter 86 werden für zukünftige Prognosen einer Benutzerrolle basierend auf den Merkmalen jenes Benutzers gespeichert.
  • Bei S212 wird ein rollenbasiertes Referenzverhalten (zum Beispiel ein Kontingent) qr für jede der vorausbestimmten Rollen basierend auf dem Verbrauch der Benutzer mit eben dieser Rolle berechnet. Das rollenbasierte Referenzverhalten kann aus den Merkmalvektoren (oder Druckprotokollen) für die Benutzer mit einer gegebenen Rolle berechnet werden. Dies schließt die Lernphase ab, die wiederholt werden kann und das Klassifikationsmodell 86 und/oder die Referenzverhalten können jederzeit aktualisiert werden.
  • In der Kontingentschätzungsphase wird ein neuer (oder bestehender) Benutzer 20, der ein personalisiertes Kontingent q erhalten soll, in das System eingeführt. Das Benutzermerkmalprofil wird berechnet, zum Beispiel basierend auf den lediglich diskriminativsten Merkmalen (identifiziert in der Trainingsphase). Die Zuteilungswahrscheinlichkeit des Benutzers für jede Rolle pr wird mit Hilfe des Klassifikatormodells berechnet. Zum Beispiel werden bei S214 Druckprotokolle für den neuen Benutzer erfasst. Bei S216 wird ein Merkmalprofil (zum Beispiel als Vektor) basierend auf den Druckprotokollen des neuen Benutzers für die diskriminativsten Merkmale berechnet. Bei S218 werden die Rollenwahrscheinlichkeiten des neuen Benutzers durch Anwenden des trainierten Klassifikatormodells 86 auf den Merkmalvektor des Benutzers prognostiziert. Der Klassifikator gibt eine Wahrscheinlichkeit pr für jede Rolle aus. Bei S220 wird das Kontingent qr für jede Rolle, die bei S210 berechnet wurde, vom Speicher abgerufen und bei S222 wird das Kontingent des neuen Benutzers berechnet, basierend auf den abgerufenen Rollenkontingenten und den Rollenwahrscheinlichkeiten des neuen Benutzers pr, zum Beispiel mit der Gleichung 1.
  • Sobald das Kontingent q des Benutzers geschätzt wurde, kann es im Speicher 44 gespeichert und in der Punktbewertung des Benutzerverhaltens eingesetzt werden. Zum Beispiel kann die tatsächliche Nutzung berechnet (S224) und die Punktzahl des Benutzers als die Differenz zwischen dem Kontingent q des Benutzers und der tatsächlichen Nutzung berechnet (S226) werden, wobei optional Strafmerkmale, wie in der US-Patentschrift Nr. 20120033250 beschrieben, mit einbezogen werden.
  • Fall des unüberwachten Lernens
  • Im Gegensatz zum Fall des überwachten Lernens setzt unüberwachtes Lernen nicht voraus, dass die Rollen von wenigstens einigen der Benutzer im Unternehmen bekannt sind. In diesem Fall werden die Drucknutzungsmuster, die Benutzer mit ähnlichem Druckverhalten anzeigen, automatisch identifiziert, so dass Benutzer in Gruppen gruppiert werden können, wobei jede Gruppe frei einer Rolle entspricht.
  • Im Fall des unüberwachten Lernens bestehen die Eingabedaten ausschließlich aus den Benutzermerkmalen, die aus den Druckprotokollen 36 der Benutzer extrahiert werden. Die Protokolle werden zum Erstellen der Benutzermerkmale wie im überwachten Fall herangezogen, doch hier werden die Merkmalvektoren in den unüberwachten Lernalgorithmus eingegeben, was zu Gruppen mit ähnlichen Merkmalvektoren führt. Ein Kontingent qr wird für jede der Gruppen berechnet und für die Berechnung eines Kontingents für einen zukünftigen neuen Benutzer gespeichert. Sobald ein neuer Benutzer mit seinem Merkmalvektor zum System hinzugefügt wird, ordnet der Gruppierungsalgorithmus mit den gespeicherten Parametern des Modells den Benutzer einer Gruppe zu oder verteilt ihn probabilistisch auf alle Gruppen. Nachdem die Gruppenwahrscheinlichkeiten pr des Benutzers bekannt sind, lässt sich das persönliche Kontingent erhalten. Zum Berechnen der Punktzahl des Benutzers wird der tatsächliche Verbrauch des Benutzers mit dem persönlichen Kontingent, das für den Benutzer erhalten wurde, verglichen.
  • 4 veranschaulicht den Betrieb des unüberwachten Lernens gemäß einer Ausführungsform. Der Betrieb beginnt bei S400.
  • Wie für die Ausführungsform aus 2 und 3 werden Druckprotokolle 36 erfasst (S302) und herangezogen (mittels Merkmalextraktor 64), um Merkmale 82 für jeden Benutzer (S304) in einer bestehenden Reihe von Benutzern 16, 18 zu berechnen. Bei S306 wird ein Gruppierungsalgorithmus 68 verwendet, um die Erstbenutzer basierend auf der Ähnlichkeit ihrer Merkmale in Gruppen zu gruppieren. Benutzer 16, 18 können einer einzelnen Gruppe basierend auf dem Abstand vom Merkmalvektor des Benutzers zur Gruppenmitte (wie zum Beispiel durch einen mittleren Merkmalvektor für jede Gruppe dargestellt) oder zwei oder mehreren oder allen Gruppen probabilistisch zugeordnet werden. Die Parameter des Gruppierungsalgorithmus, wie etwa die mittleren Merkmalvektoren der Gruppe, werden für zukünftige Prognosen gespeichert.
  • Bei S308 wird ein Referenzverhalten (zum Beispiel ein Kontingent) qr für jede der Gruppen basierend auf dem Verbrauch der Benutzer, die dieser Gruppe (analog einer Rolle) zugeordnet sind, berechnet. Im Speziellen kann das rollenbasierte Referenzverhalten qr aus den Merkmalvektoren (oder Druckprotokollen) für die Benutzer mit gegebenen Gruppenzuordnung berechnet werden. Dies schließt die Lernphase ab, die wiederholt werden kann und die Parameter des Gruppierungsalgorithmus und/oder die Referenzverhalten können jederzeit aktualisiert werden.
  • In der Kontingentschätzungsphase wird ein neuer (oder bestehender) Benutzer 20, der ein personalisiertes Kontingent q erhalten soll, in das System eingeführt. Basierend auf Merkmalen, die aus den Druckaufträgen des Benutzers extrahiert werden, wird die Wahrscheinlichkeit der Zuteilung des Benutzers zu jeder Rolle mit Hilfe der Parameter des Gruppierungsalgorithmus berechnet. Zum Beispiel werden bei S310 Druckprotokolle für den neuen Benutzer erfasst. Bei S312 wird ein Merkmalvektor 82 basierend auf den Druckprotokollen des neuen Benutzers für die ausgewählten Merkmale berechnet. Bei S314 werden die Rollenwahrscheinlichkeiten pr des neuen Benutzers durch Anwenden der Parameter des Gruppierungsalgorithmus auf den Merkmalvektor 82 des Benutzers prognostiziert. Bei S316 wird das Kontingent qr für jede Rolle, die bei S308 berechnet wurde, vom Speicher abgerufen und bei S318 wird das Kontingent des neuen Benutzers berechnet, basierend auf den abgerufenen Rollenkontingenten und den Rollenwahrscheinlichkeiten des neuen Benutzers, zum Beispiel mit der Gleichung 1.
  • Sobald das Kontingent des Benutzers geschätzt wurde, kann in der Punktbewertung des Benutzerverhaltens eingesetzt werden. Zum Beispiel kann die tatsächliche Nutzung berechnet (S320) und die Punktzahl des Benutzers als die Differenz zwischen dem Kontingent des Benutzers und der tatsächlichen Nutzung berechnet (S322) werden, wobei optional Strafmerkmale, wie in der US-Patentschrift Nr. 20120033250 beschrieben, mit einbezogen werden. Das Verfahren endet bei S324.
  • Ein geeigneter Gruppierungsalgorithmus kann angewandt werden (in S306), um vorausbestimmte Rollen (Verhaltensgruppen oder -klassen) durch Gruppieren von Benutzern und Merkmalen, die tendenziell zusammen auftreten, zu erhalten. Beispiele für Gruppierungsalgorithmen umfassen Nicht-negative Matrix-Faktorisierung (NMF), Probabilistic Latent Semantic Analysis (PLSA) und Latent Dirichlet Allocation (LDA). Siehe zum Beispiel Lee, „Algorithms for nonnegative matrix factorization", Advances in Neural Information Processing Systems, 13: 556–562, 2001; Hofmann, „Unsupervised learning by probabilistic latent semantic analysis", Machine Learning, 42(1/2): 177–196, 2001; und Blei, et al., „Latent dirichlet allocation", J. Machine Learning Res., 3: 993–1022, 2003, für eine Diskussion dieser Techniken.
  • Was geeignete Merkmale für die Gruppierung betrifft, haben sich Wortvorkommen im Titel des gedruckten Dokuments in einigen Fällen als nützliche Merkmale für die Erstellung homogener Benutzergruppen erwiesen. Alternativ dazu können Wörter auch aus dem Inhalt des Dokuments extrahiert werden. Es kann eine Reihe von Wörtern identifiziert werden, die für die Unterscheidung zwischen Rollen nützlich sind. Die Häufigkeiten dieser Wörter in jedem vom Benutzer gedruckten Dokument können berechnet und kumuliert werden, um einen Merkmalwert entsprechend jedem Wort bereitzustellen. Merkmalvektoren können normiert werden, so dass die Werte 1 ergeben.
  • Als Beispiel kann beim PLSA-Algorithmus ein Mischmodell verwendet werden, bei dem die Wahrscheinlichkeit eines Wortes w, das einem Benutzer u zugeordnet wird, als Summe über eine Reihe von Klassen z mit der Wahrscheinlichkeit des Wortes, das einer Klasse zugeordnet wird, und der Wahrscheinlichkeit der Klasse, die einem Benutzer zugeordnet wird, ausgedrückt wird:
    Figure DE202013100073U1_0003
    wobei θ und π (und optional auch die Anzahl N von Gruppen) zu lernende Parameter sind, zum Beispiel via Log-Likelihood-Maximization, die die Werte der Parameter optimiert. Dies kann mittels Expectation Maximization angenähert werden. Im Expectation-Schritt wird die Wahrscheinlichkeit, dass das Auftreten von Wort w eines Benutzers u durch die Gruppe z erklärt werden kann, aufgrund aktueller Werte der Parameter berechnet.
  • Figure DE202013100073U1_0004
  • Im Maximization-Schritt werden die Parameter neu geschätzt, basierend auf den im Expectation-Schritt berechneten Wahrscheinlichkeiten.
    Figure DE202013100073U1_0005
    wobei n(u, w)P(z|d, w) angibt, wie oft Wort w mit Thema z verbunden wird, und
    Figure DE202013100073U1_0006
    wobei n(u, w)P(z|u, w) angibt, wie oft Benutzer u mit Thema z verbunden wird.
  • Die zwei Schritte werden bis zur Konvergenz oder bis ein Stoppkriterium erfüllt ist wiederholt.
  • Die Anzahl von Gruppen kann vorausbestimmt sein, zum Beispiel in Form einer exakten Anzahl von Gruppen oder in Form einer maximalen und/oder minimalen Anzahl von Gruppen. In anderen Ausführungsformen kann mit dem Gruppierungsalgorithmus eine optimale Anzahl von Gruppen ausgewählt werden. Die Anzahl der Gruppen kann zum Teil von der Anzahl der Benutzer abhängen. Im Allgemeinen beträgt die Anzahl der Gruppen weniger als 50% von der Anzahl der zu gruppierenden Benutzer.
  • Sobald Gruppen identifiziert wurden, kann das Verfahren ähnlich dem überwachten Fall sein.
  • Der Betrieb, der in einer der 24 veranschaulicht wird, kann in ein Computerprogrammprodukt implementiert werden, das auf einem Computer ausgeführt werden kann. Das Computerprogrammprodukt kann ein nichtflüchtiges computerlesbares Speichermedium umfassen, auf dem ein Steuerprogramm registriert (gespeichert) ist, wie etwa eine Diskette, Festplatte oder dergleichen. Gänge Formen nichtflüchtiger computerlesbarer Medien umfassen zum Beispiel Floppy-Disks, flexible Magnetplatten, Festplatten, Magnetband, oder jedes sonstige Magnetspeichermedium, CD-ROM, DVD, oder jedes sonstige optische Medium, einen RAM, einen PROM, einen EPROM, einen Flash-EPROM, oder sonstigen Speicherchip oder -kassette, oder jedes sonstige materielle Medium, das ein Computer lesen und verwenden kann.
  • Alternativ dazu kann der Betrieb in flüchtige Medien implementiert werden, wie etwa eine übertragbare Trägerwelle, in der das Steuerprogramm als Datensignal unter Verwendung eines Übertragungsmediums ausgeführt ist, wie etwa Schall- oder Lichtwellen, wie etwa jene, die bei Funkwellen- und Infrarotdatenkommunikationen und dergleichen generiert werden.
  • Das exemplarische System kann auf einem oder mehreren Universalcomputern, Spezialcomputer(n), einem programmierten Mikroprozessor oder Mikrocontroller und peripheren integrierten Schaltungselementen, einer ASIC oder sonstigen integrierten Schaltung, einem digitalen Signalprozessor, einer festverdrahteten elektronischen oder logischen Schaltung, wie etwa eine Schaltung aus diskreten Bauteilen, einer programmierbaren Logikschaltung, wie etwa eine PLD, PLA, ein FPGA, Grafikkarte CPU (GPU), oder PAL oder dergleichen implementiert werden. Im Allgemeinen kann jedes Gerät, das in der Lage ist, einen endlichen Automaten zu implementieren, der wiederum in der Lage ist, das in einer der 24 gezeigte Ablaufdiagramm zu implementieren, verwendet werden, um das exemplarische betriebliche Verfahren zu implementieren.
  • 5 veranschaulicht ein Beispiel einer grafischen Benutzeroberfläche 90, die dem Benutzer angezeigt werden kann. Die Benutzeroberfläche zeigt in grünen Punkten die Kosten der Druckaufträge des Benutzers für jeden der vorhergehenden drei oder vier Monate und liefert einen Vergleich mit anderen Benutzern für einen ausgewählten Monat. Der Verbrauch kann ebenso nach Dokumentenkategorie, wie etwa E-Mails, PDF, Word, PowerPoint usw. heruntergebrochen werden. Das verbleibende Benutzerkontingent kann wie in der Darstellung in Form von Blütenblättern einer Blume angezeigt werden.
  • Während des exemplarische betriebliche Verfahrens in Form von Gerätebenutzern beschrieben wurde, wird man verstehen, dass das System auch auf die Nutzung einer Dienstleistung durch eine Gemeinschaft von Benutzern anwendbar ist. Wie im Fall der Gerätenutzung können die Benutzer der Dienstleistung(en) gruppiert/kategorisiert werden und die Menge jedes individuellen Benutzers kann mit Hilfe des Durchschnitts seiner Gruppe (oder einer Mischung daraus, bei weichen Methoden) normiert werden. Die Klassifikation/Gruppierung der Benutzer wird aus einer Beschreibung ihrer Nutzung der Dienstleistung gelernt, die üblicherweise mittels Dienstleistungsprotokollen bereitgestellt wird.
  • Ohne zu beabsichtigen, den Umfang der exemplarischen Ausführungsform einzuschränken, veranschaulicht das folgende Beispiel die Anwendung des Systems auf Daten für eine bestehende Forschungsorganisation.
  • BEISPIEL
  • Experimentdaten
  • Zuerst wurden Druckprotokolle über einen Zeitraum von mehreren Monaten für eine bestehende Reihe von Benutzern erfasst. Im Laufe über eines Jahres wurden mehr als 45.000 Druckaktionen von 169 einzelnen Benutzern ausgeführt.
  • Tabelle 1 listet eine Reihe von Attributen auf, die aus den Druckprotokollen extrahiert wurden, die Art der Daten und eine kurze Erklärung. Diese Attribute wurden mit SQL-Abfragen von einer Druckprotokolldatenbank abgerufen. Tabelle 1: Druckprotokollattribute
    Name Art Erklärung
    Benutzername Zeichenfolge Benutzername (zum Beispiel E-Mail-Adresse, Name des Benutzers oder sonstige individuelle ID)
    Jahr Datum Jahr, in dem der Druckauftrag erfolgte
    Monat Datum Monat, in dem der Druckauftrag erfolgte
    Tag Datum Tag des Monats, an dem der Druckauftrag erfolgte
    Stunde Datum Stunde des Tages, in der der Druckauftrag erfolgte
    Minute Datum Minute der Stunde, in der der Druckauftrag erfolgte
    Woche Datum Woche des Jahres, in der der Druckauftrag erfolgte
    Wochentag Datum Tag der Woche, an dem der Druckauftrag erfolgte
    Monatswoche Datum Woche des Monats, in der der Druckauftrag erfolgte
    Anwendungsname Zeichenfolge Art der Anwendung des gedruckten Dokuments (zum Beispiel PDF, PowerPoint, Text usw.)
    Drucker Zeichenfolge Druckername (oder sonstige individuelle ID für den Drucker, auf dem der Auftrag erfolgte)
    Wiederdruck boolesch wenn wiedergedrucktes Dokument, dann 1, sonst 0
    beidseitig boolesch wenn Druckmodus beidseitig, dann 1, sonst 0
    Seitenanzahl numerisch Anzahl der Seiten pro Druck
    Bogenanzahl numerisch Anzahl der Bogen pro Druck
    Kosten numerisch Kosten pro Druck
    Dokumentenname Zeichenfolge Titel des Dokuments
  • Die Daten wurde etwas vorverarbeitet, um Verzerrung zu verringern. Zum Beispiel wurden Benutzer mit einer sehr geringen Druckaktivität aus der Datenreihe ausgeschlossen. Solche Benutzer waren im Allgemeinen befristete Angestellte, Besucher oder virtuelle Maschinen. Um diese Benutzer herauszunehmen, wurde ein Grenzwert für die Anzahl von Tagen (10) mit Druckaktivität festgelegt. Somit wurden Benutzer mit weniger als 10 Tagen Aktivität herausgenommen.
  • Rollen wurden den verbleibenden Benutzern manuell zugeordnet. In der exemplarischen Ausführungsform wurden die Benutzer mit 5 Kategorien (Rollen) gekennzeichnet, die von Administratoren bis zu Managern und Forschern reichten. Andere Benutzer, die nicht in diese vorausbestimmten Rollen passten, wurden aus der Datenreihe entfernt. Die daraus resultierende Datenreihe umfasste 5 Rollen und 122 Benutzer. Jedem Benutzer wurde eine Rolle in diesem Beispiel zugeordnet.
  • Nachdem man die Attribute von jeder Druckaktion hatte (siehe Tabelle 1), bestand der nächste Schritt (S208) darin, zu beschließen, welche Merkmale für den Klassifikator 70 zu berechnen sind. In der exemplarischen Ausführungsform wurden so viele Merkmale wie möglich erhalten und getestet, um zu sehen, wie diskriminativ sie waren (in Bezug auf eine gegebene Rolle). Die ursprüngliche Liste von berechneten Merkmalen war Folgende:
    • 1. #Bogen, #Druckaufträge, durchschnittliche #von Bogen pro Druckauftrag pro unterschiedlichem Zeitraum:
    • a) pro Woche des Jahres;
    • b) pro Monat des Jahres;
    • c) pro Wochentag;
    • d) pro Woche des Monats;
    • e) pro Stunde;
    • f) pro Tagintervall (Aufteilung in 6 Intervalle);
    • g) pro Stundenintervall (Aufteilung in 6 Intervalle);
    • 2. #Bogen, #Druckaufträge, durchschnittliche #von Bogen pro Druckauftrag pro Art der Anwendung des gedruckten Dokuments:
    • a) E-Mail;
    • b) MS Excel;
    • c) Grafik;
    • d) Sonstige;
    • e) PDF;
    • f) MS PowerPoint;
    • g) RTF;
    • g) Text;
    • h) Visio;
    • i) Web;
    • j) MS Word;
    • 3. #Bogen, #Drucke, durchschnittliche #von Bogen pro Druck pro Drucker (24 Drucker insgesamt).
  • Dies lieferte insgesamt 288 Merkmale für jeden Benutzer.
  • Etwas Vorverarbeitung wurde mit den extrahierten Merkmalen durchgeführt. Im Speziellen wurden Ausreißer entfernt und Merkmalwerte normiert. Datennormierung ist nützlich, insbesondere wenn die Datenskala unterschiedlich ist, wie sie es in diesem Fall ist: die Anzahl von Bogen pro Stunde unterscheidet sich von einer Anzahl von Bogen pro Tag. Durch die Normierung wurden alle Merkmale innerhalb des Bereiches [0, 1] skaliert. Jedoch löst es nicht das Ausreißerproblem, welches durch Fixieren der Extremwerte unter Anwendung einer winsorisierenden Methode teilweise verringert wird, wobei Werte, die größer sind als der festgelegte obere Grenzwert, durch den oberen Grenzwert ersetzt werden. In diesem Fall wurde der festgelegte Bereich in Perzentilen der Originalverteilung angegeben (95. Perzentil).
  • Um zu identifizieren, wie diskriminativ Merkmale für die Klassifikation der Benutzerrollen sind, wurde ein statistischer Hypothesentest verwendet. Die studentsche t-Verteilung wurde für jedes Merkmal durchgeführt, indem der Mittelwert einer Rolle berechnet und mit dem Mittelwert der anderen Rollen verglichen wurde. Die Entscheidung, ob die Hypothese zu verwerfen ist oder nicht, erfolgte nach folgender Regel:
    Figure DE202013100073U1_0007
    wobei t die Student-Statistik,
    α das Signifikanzniveau (0,05 in der exemplarischen Ausführungsform),
    n die Anzahl von Benutzern mit einer ersten Rolle i,
    m die Anzahl von Benutzern mit einer anderen Rolle als i ist.
  • Basierend auf den Ergebnissen wurde daraus geschlossen, dass der Tag der Woche, an dem der Druck erfolgte, der Name des verwendeten Druckers und die Art des gedruckten Dokuments nützliche Indikatoren für die Benutzerrolle sind, wobei die Art des gedruckten Dokuments besonders informativ ist. Wie man erwarten kann, neigen Benutzer, denen eine „Assistenten”-Rolle zugeordnet ist, dazu, deutlich mehr E-Mails und MS Excel Dateien zu drucken, da ihre Arbeit mit der Durchführung administrativer Aufgaben zusammenhängt, während „Forscher” dazu neigen, mehr PDF und MS Word Dateien zu drucken, wahrscheinlich weil sie Artikel und Abhandlungen lesen/schreiben.
  • Nach der t-Verteilung wurden die unterscheidendsten Merkmalgruppen erfasst. Eine der Gruppen ist die Anwendungsart. Üblicherweise hängen Dokumenttyp und Dokumentname eng zusammen, weshalb als weiteres Merkmal Dokumenttitel hinzugefügt wurde. Dieses Merkmal berechnete Titelworthäufigkeiten für jeden Benutzer, aber ignorierte, wo möglich, Informationen über den Dokumenttyp. Die Wortmerkmale wurden auf folgende Weise berechnet:
    Jede Titelzeichenfolge wird in Wörter aufgeteilt, einschließlich Wortspaltung, wenn der Fall von niedriger auf höher übergeht („einsZwei” wird gespaltet in „einsZwei”). Dokumenterweiterungen (alles, was nach dem letzten Punkt folgt) werden entfernt. Nichtalphabetische Symbole werden entfernt, ebenso Wörter mit nur einem Buchstaben. Alle Wörter werden auf Kleinbuchstaben gesetzt. Stoppwörter werden entfernt unter der Verwendung einer englischen und französischen Stoppwörterliste aus Tom Diethes „Short course: Adaptive modelling of complex data", 2009. Danach wurde eine Liste mit den häufigsten Wörtern (Top 1000) in den Daten erstellt. Das Verfahren umfasste dann das Berechnen und Normieren der Worthäufigkeiten für jeden Benutzer und das Erstellen einer dünnbesetzten Matrix mit Worthäufigkeiten, wobei jede Zeile einem Benutzer und jede Spalte einem Wort aus der Top 1000-Liste entspricht.
  • Um die diskriminativsten Wörter zu identifizieren, wurde ein Hypothesentest über die mittlere Gleichwertigkeit durchgeführt, damit man sehen konnte, welche Wörter die unterscheidendsten für jede Rolle sind, und damit evaluiert werden konnte, ob die Wortmerkmale für die Klassifikation nützlich sind. Die sortierten Top-Wörter nach dem Student-t-Wert, der beim Hypothesentest berechnet wurde, wurden für jede Rolle identifiziert (in diesem Fall die 30 signifikantesten Wörter, die jede Rolle beschreiben). Aus einem Rückblick auf diese Wörter ist ersichtlich, dass die für jede Rolle erscheinenden Wörter insofern sinnvoll sind, als „Assistenten” Dokumente mit Titeln drucken, die Wörter enthalten, wie etwa: Diagramm, Prozess, Personal, intern, Notiz und Pläne, während bei „Forschern” zu den signifikantesten Wörtern Veröffentlichung, Arbeit, Abhandlung und Vortrag gehören. Diese Analyse legt nahe, dass Wortmerkmale für die Unterscheidung verschiedener Rollen ebenso nützlich sind.
  • Wie man verstehen wird, können die Wörter, die zum Generieren der Wortmerkmale herangezogen werden, aus dem Dokument selbst extrahiert werden, zum Beispiel aus der ersten Zeile, der ersten Seite, dem ersten Absatz oder dergleichen, insbesondere wenn die Organisation ein Dokumentenmanagementsystem verwendet, in dem keine Dokumententitel verwendet werden oder diese nicht so informativ sind.
  • Nachdem eine Reihe diskriminativer Merkmale ausgewählt wurden, besteht der nächste Schritt darin, Trainingsdaten zu erhalten, um das Modell zu erhalten, welches persönliche Kontingente und Punktzahlen berechnen wird.
  • 1. Überwachtes Lernen
  • In diesem Beispiel wurde ein überwachtes Lernverfahren für die Erstellung eines Klassifikatormodells 86 angewandt, um Rollenwahrscheinlichkeiten für einen neuen Benutzer zuzuordnen. Nachdem das Modell erstellt wurde, wurde eine Testreihe von Druckauftragsdaten an das System gesendet, um die Rollen der Benutzer zu prognostizieren. Das Modell 86 gibt die Wahrscheinlichkeiten für jede Rolle aus. Dann wird jede der Wahrscheinlichkeiten mit dem durchschnittlichen Verbrauch der entsprechenden Rolle multipliziert. Um das individuelle Kontingent zu erhalten, werden die Multiplikationsergebnisse addiert. Die Punktzahl des Benutzers wird dann als relative Differenz zwischen dem personalisierten Kontingent und dem tatsächlichen Verbrauch des Benutzers berechnet. Ist diese negativ, hat der Benutzer das Kontingent überzogen, ist sie positiv, kann das Verhalten des Benutzers als umweltfreundlich betrachtet werden.
  • Um einen geeigneten Algorithmus für Mehrklassenklassifikation auszuwählen, wurden die Stützvektormethode mit Sequential Minimal Optimization (SMO), logistische Regression und die lineare Diskriminanzanalyse nach Fisher als Klassifikatoren nach deren Klassifikationsrichtigkeit evaluiert. Regularisierungsparameter wurden für die SVM und FLD-Fälle eingestellt. Durch Ausführen einer Kreuzvalidierung für die SVM wurden ein Regularisierungsparameter von C = 5 und eine geeignete Kernel-Funktion – normierter polynomieller Kernel, identifiziert. Dies verringerte die Fehlerrate. Es können jedoch ebenfalls ein linearer Kernel oder RBF-Kernel verwendet werden und ein Regularisierungsparameter von C = 1 bis 50. Für die FLD wurde ein Regularisierungsparameter von 2 identifiziert, obwohl Werte von 0,1 bis 2,2 ebenfalls verwendet werden könnten.
  • Zum Vergleich der verschiedenen überwachten Klassifikatoren wurden die Daten in Trainings- und Testdaten im Verhältnis von 3:1 aufgeteilt. Somit waren in den Trainingsdaten 78 Benutzer, während in den Testdaten 39 Benutzer waren.
  • Eine Stichprobewiederholung wurde angewandt und der mittlere und der Median und das Minimum des Klassifikationsfehlers wurden für jede Methode gefunden (siehe Tabelle 2). Tabelle 2: Klassifikationsfehler
    Methode Fehlerminimum (%) Fehlermedian (%)
    SMO 23,08 41,54
    Logistisch 34,15 56,10
    FLD 30,07 50,24
  • Für die Beispieldaten legt dies nahe, dass die SVM mit SMO die beste Leistung liefert. Der relativ hohe Fehlerwert ist auf eine sehr geringe Datenstichprobe zurückzuführen (für diesen Fall gibt es lediglich 122 Beispiele), folglich sind jedes Mal, wenn die Trainings- und Testreihe zufällig aufgeteilt wird, die Ergebnisse stark von der speziellen Aufteilung abhängig. Auch wenn der erhaltene SMO-Medianklassifikationsfehler nicht sehr niedrig ist, ist er immer noch niedriger als er es durch Prognostizieren von nur einer dominanten Rolle sein würde.
  • Um die Schätzung des Kontingents zu erhalten und um ihre Richtigkeit zu messen, wurde eine Bootstrap-Methode gemäß der Methode von Wehrens, et al., „The Bootstrap: a tutorial", Chemometrics and Intelligent Laboratory Systems, 54(1): 35–52, 2000, angewandt. Die Anzahl von Unterstichproben wurde so gewählt, dass sie die gleiche ist wie die Anzahl von Benutzern in der Datenreihe. Zum Messen der Richtigkeit wurde das Konfidenzintervall gewählt. Die Schätzung von Kontingent und Punktzahl sind die Mediane von sowohl Kontingenten als auch Punktzahlen, die in jeder Iteration erhalten werden.
  • 2. Unüberwachtes Lernen
  • Hier wurde angenommen, dass es keine Möglichkeit gibt, A-priori-Rollen zu erhalten. In diesem Verfahren wird die Merkmalauswahl weggelassen, da es nicht möglich ist, unterscheidendste Merkmale für jede Rolle anzugeben. Jedoch wurde basierend auf der obigen Beobachtung, dass der Dokumententitel ein sehr diskriminatives Merkmal sein kann, dieser als ein Merkmal für unüberwachtes Lernen ausgewählt. Folglich wird für den unüberwachten Fall ein Sack voller Wörter verwendet, um die Merkmalmatrix der häufigsten Wörter zu berechnen, die die Häufigkeiten von jedem Wort für jeden Benutzer enthält. Das Modell ordnet das Kontingent und die Punktzahl dem Benutzer basierend auf dem Durchschnitt der tatsächlichen Verbrauche ähnlicher Benutzer zu.
  • Probabilistic Latent Semantic Analysis (PLSA) wurde zum Glätten der Daten verwendet, da die beobachteten Daten Kookkurenzen diskreter Variablen entsprechen. In diesem Fall gibt es zwei Parameter einzustellen: die Anzahl von Gruppen und die Anzahl nächstgelegener Nachbarn. Die Entscheidung erfolgte durch Versuchen mehrerer Werte und durch Vergleichen der Ergebnisse der überwachten Klassifikation. Der Vergleich zeigte, dass geeignete Werte 5 Gruppen und 15 nächstgelegene Nachbarn sind. Jedoch können eine tiefere Analyse und Kreuzvalidierung angewandt werden, um die geeignetsten Werte zu erhalten. Die Kreuzvalidierung kann mit den Daten für die neuen Benutzer erfolgen.
  • Ergebnisse
  • 6 zeigt das persönliche Kontingent für jeden Benutzer im überwachten Fall. Rollen sind als 1–5 identifiziert.
  • 7 zeigt das persönliche Kontingent für jeden Benutzer und die absolute Punktzahl (gepunktete Linie) im unüberwachten Fall.
  • 8 und 9 zeigen die relativen Punktzahlen der Benutzer. Die relativen Punktzahlen werden mit der folgenden Formel berechnet: (Verbrauch-Kontingent)/Kontingent. Wenn also (1) der Verbrauch des Benutzers größer ist als das Kontingent des Benutzers, ist der Ergebniswert > 0, das heißt, der Benutzer hat mehr verbraucht als erwartet; wenn (2) der Verbrauch gleich groß ist wie das Kontingent, ist der Ergebniswert = 0, der Benutzer hat so viel verbraucht wie erwartet; und wenn (3) der Verbrauch geringer ist als das Kontingent, ist der Ergebnis < 0, der Benutzer hat weniger verbraucht als erwartet.
  • Benutzer können basierend auf deren relativen Punktzahlen (und dem zugehörigen Konfidenzintervall) klassifiziert werden und basierend auf deren relativen Punktzahlen eine Rückmeldung erhalten, wie etwa „schlecht”, „gut”, „ausgezeichnet”.
  • Die Ergebnisse zeigten, dass die Leistung der besten Ausgangsmerkmale (der Name des verwendeten Druckers und die Art des gedruckten Dokuments) verbessert werden könnte, indem die Matrix von Worthäufigkeiten für jeden Benutzer als Merkmal hinzugefügt wird. Der beste überwachte Klassifikator, Stützvektormethode mit Sequential Minimal Optimization, übertraf logistische Regression und die lineare Diskriminanzanalyse nach Fisher. Probabilistic Latent Semantic Analysis wurde für das unüberwachte Lernen ausgewählt. Es ermöglicht die Entdeckung unbeobachteter Muster, in diesem Fall, Benutzer mit ähnlichem Druckverhalten. Aufgrund mangelnder Trainingsproben kann der Prognosefehler beachtlich schwanken, die Kontingent- und Punktzahlschätzungen können aber dennoch verwendet werden, indem deren Konfidenzbereich berücksichtigt wird. Bootstrap-Methoden liefern Konfidenzintervalle mit einer sinnvollen Menge von Stichproben (ungefähr 100 Bootstrap-Stichproben).
  • Die Ergebnisse zeigen, dass das exemplarische betriebliche Verfahren die Berechnung der persönlichen Kontingente und Punktzahlen für die Benutzer verbessert, wodurch eine verbesserte Rückmeldung zu deren Druckverhalten gegeben werden kann. Das überwachte Modell kann angewandt werden, wenn Benutzerrollen festgelegt sind, während das unüberwachte Modell ohne gekennzeichnete Daten angewandt werden kann. Durch Anwenden jener Modelle können Punktzahlen berechnet werden, die das erwartete Verhalten jedes Benutzers besser widerspiegeln.
  • Nach der Berechnung kann das daraus resultierende Referenzverhalten ebenfalls als Basis für die Festlegung von Druckkontrollregeln herangezogen werden, die ein festes Druckverbrauchslimit für die Benutzer einführen. Diese Regeln und die entsprechenden Limits werden gegenwärtig von einem Administrator manuell festgelegt, was eine schwierige und zeitaufwendige Aufgabe darstellt.
  • Man wird verstehen, dass Abwandlungen des oben Offenbarten und weitere Merkmale und Funktionen oder Alternativen davon in viele andere verschiedene Systeme und Anwendungen kombiniert werden können. Verschiedene vorliegend unvorhergesehene oder unvorausgesehene Alternativen, Änderungen, Abweichungen oder Verbesserungen darin können folglich vom Fachmann durchgeführt werden und sind ebenso im Umfang der folgenden Ansprüche enthalten.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 20110273739 [0003, 0007, 0020]
    • US 20120033250 [0003, 0007, 0020, 0035, 0046, 0075, 0082]
    • US 20110310428 [0007]
    • US 20090138878 [0007]
  • Zitierte Nicht-Patentliteratur
    • Lee, „Algorithms for nonnegative matrix factorization”, Advances in Neural Information Processing Systems, 13: 556–562, 2001 [0083]
    • Hofmann, „Unsupervised learning by probabilistic latent semantic analysis”, Machine Learning, 42(1/2): 177–196, 2001 [0083]
    • Blei, et al., „Latent dirichlet allocation”, J. Machine Learning Res., 3: 993–1022, 2003 [0083]
    • Tom Diethes „Short course: Adaptive modelling of complex data”, 2009 [0105]
    • Wehrens, et al., „The Bootstrap: a tutorial”, Chemometrics and Intelligent Laboratory Systems, 54(1): 35–52, 2000 [0114]

Claims (6)

  1. System zum Berechnen eines Referenzverhaltens für einen neuen Benutzer, umfassend: einen Merkmalextraktor zum Extrahieren von Merkmalen aus Nutzungsdaten, die für Benutzer einer zugehörigen Reihe von gemeinsamen Geräten erfasst werden, eine Rollenzuordnungskomponente, um einem neuen Benutzer basierend auf Merkmalen, die aus den Nutzungsdaten des neuen Benutzers extrahiert werden, ein Benutzerrollenprofil zuzuordnen, wobei das Benutzerrollenprofil den neuen Benutzer mit wenigstens einer aus einer Reihe von Rollen verbindet, wobei die Rollenzuordnungskomponente ein Modell anwendet, das mit Hilfe von Merkmalen eingelernt wird, die aus den Nutzungsdaten einer ursprünglichen Reihe von Benutzern extrahiert werden; eine Benutzerkontingentkomponente zum Berechnen eines Referenzverhaltens für den neuen Benutzer basierend auf dem Benutzerrollenprofil und den Referenzverhalten für Rollen in der Reihe von Rollen; und einen Prozessor, der wenigstens eines aus Merkmalextraktor, Rollenzuordnungskomponente und Benutzerkontingentkomponente implementiert.
  2. System nach Anspruch 1, wobei die Nutzungsdaten Druckauftragsdaten umfassen und die Reihe von zugehörigen Geräten eine Reihe von Druckern umfasst.
  3. System nach Anspruch 1, ferner umfassend eine Komponente zum Einlernen des Modells.
  4. System nach Anspruch 1, ferner umfassend eine Komponente zum Berechnen des Referenzverhaltens für jede Rolle in der Reihe von Rollen basierend auf Nutzungsdaten für Benutzer in der ursprünglichen Reihe von Benutzern, die der jeweiligen Rolle zugeordnet sind.
  5. System nach Anspruch 1, ferner umfassend einen Merkmalselektor zum Identifizieren von Merkmalen, die zwischen Rollen unterscheiden.
  6. System nach Anspruch 1, ferner umfassend eine Punktbewertungskomponente zum Berechnen einer Punktzahl für den neuen Benutzer basierend auf dem Referenzverhalten für den neuen Benutzer und einem tatsächlichen Verhalten für den neuen Benutzer.
DE202013100073.6U 2012-12-21 2013-01-08 Benutzerprofilerstellung zum Schätzen der Druckleistung Expired - Lifetime DE202013100073U1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261740616P 2012-12-21 2012-12-21
US61/740,616 2012-12-21

Publications (1)

Publication Number Publication Date
DE202013100073U1 true DE202013100073U1 (de) 2014-04-01

Family

ID=50490159

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202013100073.6U Expired - Lifetime DE202013100073U1 (de) 2012-12-21 2013-01-08 Benutzerprofilerstellung zum Schätzen der Druckleistung

Country Status (2)

Country Link
US (1) US20140180651A1 (de)
DE (1) DE202013100073U1 (de)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140355043A1 (en) * 2013-06-03 2014-12-04 Hewlett-Packard Development Company, L.P. Print production management
US9216591B1 (en) 2014-12-23 2015-12-22 Xerox Corporation Method and system for mutual augmentation of a motivational printing awareness platform and recommendation-enabled printing drivers
DE102015118139A1 (de) * 2015-04-20 2016-10-20 Océ Printing Systems GmbH & Co. KG Verfahren und Vorrichtung zur Sequenzierung von Druckaufträgen
US10241732B2 (en) 2016-08-30 2019-03-26 Ricoh Company, Ltd. Processing print jobs with a single sheet job model
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
US11023463B2 (en) 2016-09-26 2021-06-01 Splunk Inc. Converting and modifying a subquery for an external data system
US10977260B2 (en) 2016-09-26 2021-04-13 Splunk Inc. Task distribution in an execution node of a distributed execution environment
US10353965B2 (en) * 2016-09-26 2019-07-16 Splunk Inc. Data fabric service system architecture
US11567993B1 (en) 2016-09-26 2023-01-31 Splunk Inc. Copying buckets from a remote shared storage system to memory associated with a search node for query execution
US11604795B2 (en) 2016-09-26 2023-03-14 Splunk Inc. Distributing partial results from an external data system between worker nodes
US11232100B2 (en) 2016-09-26 2022-01-25 Splunk Inc. Resource allocation for multiple datasets
US10795884B2 (en) 2016-09-26 2020-10-06 Splunk Inc. Dynamic resource allocation for common storage query
US11550847B1 (en) 2016-09-26 2023-01-10 Splunk Inc. Hashing bucket identifiers to identify search nodes for efficient query execution
US11321321B2 (en) 2016-09-26 2022-05-03 Splunk Inc. Record expansion and reduction based on a processing task in a data intake and query system
US11222066B1 (en) 2016-09-26 2022-01-11 Splunk Inc. Processing data using containerized state-free indexing nodes in a containerized scalable environment
US11314753B2 (en) 2016-09-26 2022-04-26 Splunk Inc. Execution of a query received from a data intake and query system
US11663227B2 (en) 2016-09-26 2023-05-30 Splunk Inc. Generating a subquery for a distinct data intake and query system
US11281706B2 (en) 2016-09-26 2022-03-22 Splunk Inc. Multi-layer partition allocation for query execution
US11599541B2 (en) 2016-09-26 2023-03-07 Splunk Inc. Determining records generated by a processing task of a query
US11294941B1 (en) 2016-09-26 2022-04-05 Splunk Inc. Message-based data ingestion to a data intake and query system
US11126632B2 (en) 2016-09-26 2021-09-21 Splunk Inc. Subquery generation based on search configuration data from an external data system
US20180089324A1 (en) 2016-09-26 2018-03-29 Splunk Inc. Dynamic resource allocation for real-time search
US10956415B2 (en) 2016-09-26 2021-03-23 Splunk Inc. Generating a subquery for an external data system using a configuration file
US10984044B1 (en) 2016-09-26 2021-04-20 Splunk Inc. Identifying buckets for query execution using a catalog of buckets stored in a remote shared storage system
US11243963B2 (en) 2016-09-26 2022-02-08 Splunk Inc. Distributing partial results to worker nodes from an external data system
US11586627B2 (en) 2016-09-26 2023-02-21 Splunk Inc. Partitioning and reducing records at ingest of a worker node
US11620336B1 (en) 2016-09-26 2023-04-04 Splunk Inc. Managing and storing buckets to a remote shared storage system based on a collective bucket size
US11580107B2 (en) 2016-09-26 2023-02-14 Splunk Inc. Bucket data distribution for exporting data to worker nodes
US10726009B2 (en) 2016-09-26 2020-07-28 Splunk Inc. Query processing using query-resource usage and node utilization data
US11416528B2 (en) 2016-09-26 2022-08-16 Splunk Inc. Query acceleration data store
US11106734B1 (en) 2016-09-26 2021-08-31 Splunk Inc. Query execution using containerized state-free search nodes in a containerized scalable environment
US11860940B1 (en) 2016-09-26 2024-01-02 Splunk Inc. Identifying buckets for query execution using a catalog of buckets
US11461334B2 (en) 2016-09-26 2022-10-04 Splunk Inc. Data conditioning for dataset destination
US11003714B1 (en) 2016-09-26 2021-05-11 Splunk Inc. Search node and bucket identification using a search node catalog and a data store catalog
US11269939B1 (en) 2016-09-26 2022-03-08 Splunk Inc. Iterative message-based data processing including streaming analytics
US11562023B1 (en) 2016-09-26 2023-01-24 Splunk Inc. Merging buckets in a data intake and query system
US11442935B2 (en) 2016-09-26 2022-09-13 Splunk Inc. Determining a record generation estimate of a processing task
US11615104B2 (en) 2016-09-26 2023-03-28 Splunk Inc. Subquery generation based on a data ingest estimate of an external data system
US11874691B1 (en) 2016-09-26 2024-01-16 Splunk Inc. Managing efficient query execution including mapping of buckets to search nodes
US10776355B1 (en) 2016-09-26 2020-09-15 Splunk Inc. Managing, storing, and caching query results and partial query results for combination with additional query results
US11250056B1 (en) 2016-09-26 2022-02-15 Splunk Inc. Updating a location marker of an ingestion buffer based on storing buckets in a shared storage system
US11163758B2 (en) 2016-09-26 2021-11-02 Splunk Inc. External dataset capability compensation
US11593377B2 (en) 2016-09-26 2023-02-28 Splunk Inc. Assigning processing tasks in a data intake and query system
EP3519967A4 (de) 2016-09-29 2020-06-03 Hewlett-Packard Development Company, L.P. Vorhersage von komponentendefekten
CN108198116A (zh) * 2016-12-08 2018-06-22 同方威视技术股份有限公司 用于安检中被检人员分级的方法及装置
AU2017410367B2 (en) * 2017-04-20 2020-09-10 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for learning-based group tagging
US11921672B2 (en) 2017-07-31 2024-03-05 Splunk Inc. Query execution at a remote heterogeneous data store of a data fabric service
US11989194B2 (en) 2017-07-31 2024-05-21 Splunk Inc. Addressing memory limits for partition tracking among worker nodes
US11151137B2 (en) 2017-09-25 2021-10-19 Splunk Inc. Multi-partition operation in combination operations
US10896182B2 (en) 2017-09-25 2021-01-19 Splunk Inc. Multi-partitioning determination for combination operations
US10901669B2 (en) 2017-11-08 2021-01-26 Ricoh Company, Ltd. Mechanism to predict print performance using print metadata
US11334543B1 (en) 2018-04-30 2022-05-17 Splunk Inc. Scalable bucket merging for a data intake and query system
CN111723617B (zh) * 2019-03-20 2023-10-27 顺丰科技有限公司 动作识别的方法、装置、设备及存储介质
WO2020220216A1 (en) 2019-04-29 2020-11-05 Splunk Inc. Search time estimate in data intake and query system
US11715051B1 (en) 2019-04-30 2023-08-01 Splunk Inc. Service provider instance recommendations using machine-learned classifications and reconciliation
US11494380B2 (en) 2019-10-18 2022-11-08 Splunk Inc. Management of distributed computing framework components in a data fabric service system
US11922222B1 (en) 2020-01-30 2024-03-05 Splunk Inc. Generating a modified component for a data intake and query system using an isolated execution environment image
US11704313B1 (en) 2020-10-19 2023-07-18 Splunk Inc. Parallel branch operation using intermediary nodes

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090138878A1 (en) 2007-11-26 2009-05-28 Xerox Corporation Energy-aware print job management
US20110273739A1 (en) 2010-05-04 2011-11-10 Xerox Corporation System and method for providing environmental feedback to users of shared printers
US20110310428A1 (en) 2010-06-21 2011-12-22 Xerox Corporation System and method for enabling an environmentally informed printer choice at job submission time
US20120033250A1 (en) 2010-08-06 2012-02-09 Xerox Corporation Virtual printing currency for promoting environmental behavior of device users

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7623256B2 (en) * 2004-12-17 2009-11-24 Xerox Corporation Automated job redirection and organization management
US7567946B2 (en) * 2005-03-14 2009-07-28 Xerox Corporation Method, apparatus, and article of manufacture for estimating parameters of a probability model on shared device usage probabilistic semantic analysis
US7865089B2 (en) * 2006-05-18 2011-01-04 Xerox Corporation Soft failure detection in a network of devices
JP4159583B2 (ja) * 2006-05-26 2008-10-01 シャープ株式会社 複合機、及び該複合機を複数備えた情報取得システム
US8005786B2 (en) * 2007-09-20 2011-08-23 Microsoft Corporation Role-based user tracking in service usage
US20120310745A1 (en) * 2011-05-31 2012-12-06 Yahoo! Inc. System for managing advertisements and promotions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090138878A1 (en) 2007-11-26 2009-05-28 Xerox Corporation Energy-aware print job management
US20110273739A1 (en) 2010-05-04 2011-11-10 Xerox Corporation System and method for providing environmental feedback to users of shared printers
US20110310428A1 (en) 2010-06-21 2011-12-22 Xerox Corporation System and method for enabling an environmentally informed printer choice at job submission time
US20120033250A1 (en) 2010-08-06 2012-02-09 Xerox Corporation Virtual printing currency for promoting environmental behavior of device users

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Blei, et al., "Latent dirichlet allocation", J. Machine Learning Res., 3: 993-1022, 2003
Hofmann, "Unsupervised learning by probabilistic latent semantic analysis", Machine Learning, 42(1/2): 177-196, 2001
Lee, "Algorithms for nonnegative matrix factorization", Advances in Neural Information Processing Systems, 13: 556-562, 2001
Tom Diethes "Short course: Adaptive modelling of complex data", 2009
Wehrens, et al., "The Bootstrap: a tutorial", Chemometrics and Intelligent Laboratory Systems, 54(1): 35-52, 2000

Also Published As

Publication number Publication date
US20140180651A1 (en) 2014-06-26

Similar Documents

Publication Publication Date Title
DE202013100073U1 (de) Benutzerprofilerstellung zum Schätzen der Druckleistung
Conley et al. Inference with “difference in differences” with a small number of policy changes
Zhou et al. Income stratification among occupational classes in the United States
US20160216923A1 (en) System and method for the creation and management of user-annotations associated with paper-based processes
CN109558429A (zh) 基于互联网大数据的人才服务双向推荐方法及系统
Brazill-Boast et al. A large-scale application of project prioritization to threatened species investment by a government agency
Taddy Measuring political sentiment on Twitter: Factor optimal design for multinomial inverse regression
DE112011104487T5 (de) Verfahren und System zur prädiktiven Modellierung
DE102011075235A1 (de) System und Verfahren zum Bereitstellen von Umweltrückinformation für Anwender von gemeinsam genutzten Druckern
DE112016001902T5 (de) Schätzen von Rechenressourcen für die Ausführung von Data-Mining-Diensten
Shash et al. The effect of contractor size on mark-up size decision in Saudi Arabia
US8879103B2 (en) System and method for highlighting barriers to reducing paper usage
DE102019107591A1 (de) Anzeigesystem, programm und speichermedium
DE112021000645T5 (de) Verfahren und System zum Optimieren eines Ziels mit diskreten Bedingungen
Chen Estimating latent group structure in time-varying coefficient panel data models
Bachmann et al. Decomposing the ins and outs of cyclical unemployment
Ismail et al. Acquirer's return and the choice of acquisition targets: does acquisition experience matter?
Seiyaibo Carl MADAWA PhD et al. Environmental cost disclosure and corporate profitability: evidence from Nigerian oil and gas firms
Meng et al. Fine-grained job salary benchmarking with a nonparametric dirichlet process–based latent factor model
US8577757B2 (en) Inventory management system in a print-production environment
Avent-Holt The class dynamics of income shares: effects of the declining power of unions in the US airline industry, 1977–2005
Gerard et al. Bounds on treatment effects in regression discontinuity designs under manipulation of the running variable, with an application to unemployment insurance in Brazil
Schoefer et al. Productivity, place, and plants: Revisiting the measurement
DE102017208626A1 (de) Liquide Belegschafts-Plattform
Collins et al. The influence of varying information load on inferred attribute non-attendance

Legal Events

Date Code Title Description
R207 Utility model specification

Effective date: 20140508

R150 Utility model maintained after payment of first maintenance fee after three years
R157 Lapse of ip right after 6 years