WO2013107727A1 - Verfahren zur zusammenstellung von dokumenten - Google Patents

Verfahren zur zusammenstellung von dokumenten Download PDF

Info

Publication number
WO2013107727A1
WO2013107727A1 PCT/EP2013/050645 EP2013050645W WO2013107727A1 WO 2013107727 A1 WO2013107727 A1 WO 2013107727A1 EP 2013050645 W EP2013050645 W EP 2013050645W WO 2013107727 A1 WO2013107727 A1 WO 2013107727A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
document
data
record
documents
Prior art date
Application number
PCT/EP2013/050645
Other languages
English (en)
French (fr)
Inventor
Dorian SELZ
Felix HÜRLIMANN
Original Assignee
Nektoon Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nektoon Ag filed Critical Nektoon Ag
Publication of WO2013107727A1 publication Critical patent/WO2013107727A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Definitions

  • the present invention relates to a method for the compilation of documents in the context of a knowledge management, in which a central data processing unit is assigned a database system with data records, wherein the data processing unit produces links between individual data records, in particular user data records and document data records, and thus allocates documents to a user.
  • DE 698 05 437 T2 discloses an information management system in which user data records and documents are each assigned metadata which can be compared with one another. In the case of match of keywords and the like, the system can infer here whether an assignment of a document to a user makes sense and accordingly either assigns it or not.
  • Another solution is known from GB 2 327 787 A, according to which the users are divided into different user concepts, so that it can be ascertained which documents promise to be of interest to a particular user concept and these are then assigned to the corresponding user concepts.
  • this is a much coarser classification of users who are not served individually but rather in categories of this information management system.
  • a database system is set up in which data sets are created both for users and for documents. It is also possible to include topic records and keywords as information stored in the database. It is now intended, in contrast to the prior art, to calculate a relative weighting for similar data sets, by means of which a selection of documents for a user can be made. In this case, there is a relative weighting of both the user data sets with each other, as well as the topic data sets among each other, the document data records among themselves and the keywords.
  • a relative weighting On the basis of such a relative weighting, it can be determined which user data record, which document, which topic data record and which catchword is the most important, that is which should have the greatest influence on the distribution of information in the context of knowledge management. It is also envisaged that links can be established between dissimilar data records, for example between a user and a topic or even between a topic and a document, and finally between a document and a tag, whereby these links should also receive a relative weighting.
  • a relative weighting between a document and a keyword is then very large if the keyword has a high significance for the respective document.
  • a rather marginalized topic may be characterized by a different keyword that has less relevance to the document, and thus this link also receives a lower relative weighting.
  • the relevant keywords are selected and linked by means of a semantic search method from the document in question.
  • a semantic search method In addition to the semantic search method, if necessary, too an additional probabilistic approach may be used to further enhance the result of the keyword search.
  • references can be resolved in the document via a reference database.
  • the selection of keywords for a document then leads as a further information to a categorization of the respective document in a topic, so that a link of the document with one or more subject data sets can be performed.
  • the user may also reject the document in response to a suggestion of a document, hence an association of that document, thereby providing feedback to the system from which the system learns for future decisions. For example, if the user regularly rejects the publication of a particular author, the system will recognize a scheme and give that author less weight in future selections. Conversely, the user can accept or even recommend a document, which also influences later decisions of the system. However, the possibilities of feedback to the system are much larger than this example, so comments, sub-topics and other signals can also be incorporated from third-party systems.
  • a possible approach is to adapt the weighting of the link between the user record and the topic record, as well as between subject record and document record, the degree of adaptation preferably being dependent on the relative weight of the user data record. sentence is dependent.
  • the relative weight of the user record results from its activity in the database system, as well as other activities and the reputation of a user on social media or other networks - including the network considered here - such that a user following many other users on social media whose tweets are subscribed to and so on, are given a greater relative weighting in his document selections than other users who are only occasionally active and whose selections are of lesser relevance to other users.
  • the activity of a user in the social media is evaluated by means of utilities, which provide the data processing unit with the necessary data.
  • new topic data sets takes place essentially on suggestion of users, as well as on the basis of the evaluation of search questions of the users.
  • the complete hit list of the search depending on the relative weighting of the individual documents, is linked with the topic and then further differentiation of the weighting takes place as the system is used.
  • new documents can be fed into the system both from external databases or tracked via crawlers on the Internet and inserted into the database system.
  • the information to be provided is made available to a user in the present system optionally via an RSS reader, by e-mail, in a software-as-a-service environment or else via an integrated software application. This is not an exhaustive list after any number of other ways of providing the information are conceivable.
  • FIG. 1 shows the data structure in the database system according to the invention, which is distributed over a total of four levels 10, 20, 30, 40.
  • a user data record 11 is created for each user in a first user level 10, and a relative weighting is obtained from the data processing device.
  • a data set is then provided with a high relative weighting if it is represented as a large circle, with a small relative weighting if it is represented as a small circle.
  • the user data record provided with the reference numeral 11 is a user data record 11 having a high relative weighting, which can also be deduced from the fact that in each case user links 12 to the neighboring user data records are present. So this is a relatively central personality, For example, a forum leader, whose assessment of relevant documents so promises to have a certain weight.
  • theme data sets 21 are provided, which in turn have a relative weighting each other.
  • the subject data record provided with the reference numeral 21 is connected via a link 13 in the theme layer 20 with the previously considered user record 1 1, wherein the relative weighting of the link 13 in the theme layer 20, which in turn is represented by the line thickness, is very high.
  • the theme data record provided with the reference numeral 21 is thus a topic which is of high interest to the user who is connected to the user data record 11.
  • neighboring topics are also of relevance to the user in question, who are connected via topic links 22 to the topic data record 21 within the topic level 20. Although these topics are of minor relevance to the user but have a certain relevance for the user, a link is also realized between the latter and the user data record 11.
  • the user data record 1 1 will therefore be mainly documents to the thematic data set 21, and associated with great relevance, other documents from the neighboring, also associated with the user record 1 1 topic areas.
  • the individual documents are included.
  • a document level may exist for each individual topic data set or also generally for all subject data records.
  • important, ie relatively high-weighted documents which are linked to the topic data record 21 via a relatively high-weighted link 23.
  • Such highly weighted documents of a theme data set which in turn is of high interest to the user, are presented to the user in each case.
  • the individual keywords 41 are now listed as the lowest level, which may also be linked to each other.
  • Keyword association 42 it is possible for the data processing unit to facilitate the association between individual keyworded documents on a topic.
  • the assignment of keywords 41 to a document data record 31 via a link 33 takes place on the basis of an evaluation of the document which is assigned to the respective document data record 31 by a semantic evaluation supplemented by a probability analysis, if the one or other word is of particular relevance to the document is and this characterizes.
  • the relative weighting of the individual data sets 1 1, 21, 31, 41 is calculated here in different ways.
  • a weighting of a user data record 1 1 can be made, for example, on account of a prominent position in the social media available for obtaining information, a weighting of document data sets 31, for example by an evaluation by the users.
  • the relative weighting of each data set 1 1, 21, 31, 41 is constantly recalculated and adjusted based essentially on user behavior.
  • FIG. 2 shows the data flow in the knowledge management system according to the invention.
  • a knowledge management system has a number of data sources 50, which include, for example, the Internet, an intranet, or external databases.
  • data sources 50 include, for example, the Internet, an intranet, or external databases.
  • crawlers 51 or also by a conventional import 52 external data sources 50 the information They are fed into the system in the form of documents by being fed to the native API (Application Programming Interface).
  • native API Application Programming Interface
  • the documents are prepared and ultimately "fingerprints" are created for both the documents and the users, based on these user profiles 61 and the document profiles 62, it is then decided which document is made available to the user and, when the decision has been made, the documents are forwarded via an API 64 in the user-preferred way to the data sinks 70.
  • This may be, for example, an RSS reader 71, E-mail.
  • a preparation of the information is in principle feasible for any conceivable information environment and claimed within the scope of the invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Bekannte Systeme zum Wissensmanagement nehmen sowohl eine Bewertung der Nutzer als auch eine Bewertung der Dokumente vor, die in angeschlossenen Datenbanken vorgehalten werden. Hierdurch entsteht mithin jedoch keine Zuordnung, welche den Bedürfnissen des einzelnen Nutzers entspricht, vielmehr wird auf den Durchschnitt der gesamten Nutzerschaft abgestellt. Dies soll die vorliegende Erfindung verbessern. Dies gelingt dadurch, dass sowohl für den einzelnen Nutzer als auch für die bereitgestellten Dokumente jeweils ein „Fingerabdruck" erstellt wird, indem eine relative Gewichtung der Nutzer bzw. Dokumente, und eine relative Gewichtung von Verknüpfungen zwischen diesen berechnet und bei der Zuordnung ausgewertet wird. Das Nutzerverhalten beeinflusst dabei sowohl die Gewichtung des Dokuments als auch seine persönlichen Vorlieben, so dass die Nutzerinteraktionen sich sowohl auf die Bereitstellung von Nachrichten für den Nutzer selbst, als auch für andere niederschlägt.

Description

VERFAHREN ZUR ZUSAMMENSTELLUNG
VON DOKUMENTEN Die vorliegende Erfindung betrifft ein Verfahren zur Zusammenstellung von Dokumenten im Rahmen eines Wissensmanagements, bei dem einer zentralen Datenverarbeitungseinheit ein Datenbanksystem mit Datensätzen zugeordnet ist, wobei die Datenverarbeitungseinheit Verknüpfungen zwischen einzelnen Datensätzen, insbesondere Nutzerdatensätzen und Dokumentdatensätzen, herstellt und so einem Nutzer Dokumente zuordnet.
Ein derartiges Verfahren ist bereits aus der deutschen Offenlegungsschrift DE 102 15 494 A1 bekannt. Dort ist vorgesehen, dass innerhalb eines Computersystems sowohl Informationen über aufgefundene Dokumente, als auch über die Nutzer des Systems gespeichert werden, wobei vonseiten des Systems eine Bewertung der in dem System geführten Dokumente durchgeführt wird. Die Nutzer können hierbei eine Bewertung der Dokumente vornehmen und damit Einfluss auf die systemseitig bewerteten Dokumente nehmen. Umgekehrt werden auch die Nutzer mithilfe sogenannter„Belohnungspunkte" bewertet, so dass deren Bewertungen wiederum gewichtet werden können. Ein sehr aktiver Nutzer wird aufgrund dieser Belohnungspunkte mit seiner Bewertung eines Dokumentes mehr Gewicht haben, als jemand, der das System eher gelegentlich nutzt.
Es sind auch zahlreiche weitere Ansätze zur Gestaltung eines derartigen Wis- Sensmanagementsystems bekannt. So ist beispielsweise aus der DE 698 05 437 T2 ein Informationsmanagementsystem bekannt, bei welchem Nutzerdatensätzen und Dokumenten jeweils Metadaten zugeordnet sind, welche gegeneinander abgeglichen werden können. Bei Übereinstimmung von Schlagworten und ähnlichem kann das System hierbei darauf zurückschließen, ob eine Zuordnung eines Do- kuments zu einem Nutzer sinnvoll ist und diese dementsprechend entweder zuordnen oder nicht. Eine weitere Lösung ist aus der GB 2 327 787 A bekannt, wonach die Nutzer in verschiedene Nutzerkonzepte eingeteilt werden, so dass festgestellt werden kann, welche Dokumente einem bestimmten Nutzerkonzept interessant zu sein versprechen und diese dann den entsprechenden Nutzerkonzepten zugeordnet werden. Es handelt sich hierbei allerdings um eine deutlich gröbere Einteilung der Nutzer, welche nicht individuell sondern vielmehr in Kategorien von diesem Informationsmanagementsystem bedient werden.
Eine weitere Lösung sieht die US-Patentanmeldung 201 1 /0154209 A1 vor, bei der ebenfalls eine Kategorisierung bzw. Indizierung der Dokumente erfolgt und schließlich anhand eines Nutzerprofils entschieden wird, welche Dokumente dem Nutzer zur Verfügung gestellt werden und welche für eine Zurverfügungstellung nicht in Betracht gezogen werden. Insoweit lässt sich klar feststellen, dass der Stand der Technik durchaus bereits mit dem Problem des Wissensmanagements konfrontiert gewesen ist, welches sich im Wesentlichen der Fragestellung annimmt, wie einem Nutzer möglichst lediglich die für ihn interessanten Informationen aus einer Fülle von zur Verfügung stehenden Informationen, beispielsweise aus dem Internet, zur Verfügung gestellt, ausgewählt und gegebenenfalls auch aufbereitet werden kann.
Aufgrund der stark ansteigenden Fülle von Informationen, welche insbesondere im Internet verfügbar sind, wächst mit der Zeit deutlich der Aufwand für das Wiederauffinden von Informationen, welche gegebenenfalls zuvor bereits einmal gefun- den worden sind. Dabei hat der einzelne Nutzer ganz eigene Vorstellungen davon, welche Dokumente und Informationsquellen von Interesse sind und welche Dokumente für die Zwecke des Nutzers uninteressant sind. Während sich ein Nutzer für ein Themengebiet stark interessiert und er demgemäß dort sehr viele interessante Dokumente abrufen würde, sind allgemein als interessant gekennzeichnete Dokumente aus anderen Bereichen für denselben Nutzer nicht von Interesse. Insoweit tragen bereits einige Nutzerkonzepte aus dem Stand der Technik der Problemstellung bereits Rechnung, indem eine Auswahl von Dokumenten auf den Nutzer zugeschnitten wird. Allerdings wird es bereits an dieser Stelle schwierig, wenn Dokumente das gesuchte Thema lediglich am Rande streifen, aber aufgrund anderer Aspekte als sehr Interessant erscheinen, beispielsweise weil sämtliche Veröffentlichungen eines Autors für den Benutzer von besonderem Interesse sind oder aus anderen Erwägungsgründen heraus.
Insoweit muss festgestellt werden, dass der Stand der Technik kein System zum Wissensmanagement kennt, welches eine intelligente Auswahl an Dokumenten für einen Nutzer treffen kann und dabei sowohl die allgemeine Relevanz eines Dokumentes als auch die Wünsche des jeweiligen Nutzers berücksichtigt. Aufgrund der vorliegenden Erfindung ist es Aufgabe der Erfindung, ein derartiges System zum Wissensmanagement, mithin ein Verfahren zur Zusammenstellung von Dokumenten im Rahmen eines Wissensmanagements, zu schaffen.
Gelöst wird diese Aufgabe durch ein Verfahren gemäß den Merkmalen des An- Spruchs 1 . Weitere, sinnvolle Ausgestaltungen eines derartigen Verfahrens können den Unteransprüchen entnommen werden.
Erfindungsgemäß ist hierbei vorgesehen, dass unter Verwendung einer zentralen Datenverarbeitungseinheit ein Datenbanksystem aufgebaut wird, in welchem Da- tensätze sowohl für Nutzer, als auch für Dokumente angelegt werden. Darüber hinaus ist es möglich, auch Themendatensätze und Schlagworte als in der Datenbank gespeicherte Informationen aufzunehmen. Es ist nunmehr im Unterschied zum Stand der Technik vorgesehen, für gleichartige Datensätze eine relative Gewichtung zu berechnen, anhand deren eine Auswahl von Dokumenten für einen Nutzer getroffen werden kann. Es erfolgt hierbei eine relative Gewichtung sowohl der Nutzerdatensätze untereinander, als auch der Themendatensätze untereinander, der Dokumentdatensätze untereinander und der Schlagworte. Aufgrund einer derartigen relativen Gewichtung kann festgestellt werden, welcher Nutzerdatensatz, welches Dokument, welcher Themendatensatz und welches Schlagwort das wichtigste ist, welches also den größten Einfluss auf die Verteilung von Informationen im Rahmen des Wissensmanagements haben soll. Ebenfalls ist vorgesehen, dass zwischen ungleichartigen Datensätzen Verknüpfungen hergestellt werden können, also beispielsweise zwischen einem Nutzer und einem Thema oder auch zwischen einem Thema und einem Dokument sowie schließlich zwischen einem Dokument und einem Schlagwort, wobei diese Ver- knüpfungen ebenfalls eine relative Gewichtung erhalten sollen. So ist also im Beispiel eine relative Gewichtung zwischen einem Dokument und einem Schlagwort dann sehr groß, wenn das Schlagwort eine hohe Bedeutung für das jeweilige Dokument hat. Ein eher am Rande behandeltes Thema wird möglicherweise durch ein anderes Schlagwort charakterisiert, welches eine geringere Relevanz für das Dokument besitzt und damit diese Verknüpfung auch eine geringere relative Gewichtung erhält.
Aufgrund dieser relativen Gewichtung der einzelnen Datensätze untereinander ist es nicht länger erforderlich, vom Nutzer eine Ja/Nein-Entscheidung bezüglich eines Themas verlangen zu müssen, vielmehr wird sich durch das Nutzerverhalten ein Thema als unwichtiger oder als wichtiger herausstellen und demgemäß aufgrund der sich so einstellenden Gewichtungen bei unwichtigeren Themen nur noch die wichtigsten Dokumente herausgesucht und an den Nutzer weitergeleitet werden, bei wichtigeren Themen gegebenenfalls auch unwichtigere Dokumente, also mit geringerer relativer Gewichtung dem Nutzer zur Verfügung gestellt werden. Mit einigem Vorteil ist es hierdurch auch möglich, dass der Nutzer hochrelevante Dokumente angrenzender Themenbereiche erhält, nachdem diese aufgrund der Gewichtung, welche auch durch andere Nutzer beeinflusst werden kann, in dem fraglichen Themenkomplex höher priorisiert werden.
In dem Moment, in welchem ein Dokument neu in das Datenbanksystem aufgenommen wird, was beispielsweise durch Einspeisung aus einer fremden Datenbank erfolgen kann, aber auch durch andere Verfahren, wie durch den Einsatz von Crawlern, welche beliebige Datenquellen, insbesondere das Internet, nach Infor- mationen durchsuchen, oder durch das direkte Einstellen der Dokumente durch einen Nutzer, werden mittels eines semantischen Suchverfahrens aus dem fraglichen Dokument die relevanten Schlagworte herausgesucht und mit diesem verknüpft. Ergänzend zu dem semantischen Suchverfahren kann bedarfsweise auch eine zusätzliche Wahrscheinlichkeitsbetrachtung eingesetzt werden, um das Ergebnis der Schlagwortsuche noch weiter zu verbessern.
Alternativ zu dieser Schlagwortsuche ist es im Rahmen der Erfindung ohne Weite- res möglich, die Klassifizierung des Dokuments anhand beliebiger weiterer Quellen oder auch über externe Dienste zu realisieren. Etwa können über eine Referenzdatenbank Referenzen im Dokument aufgelöst werden.
Die Auswahl von Schlagworten zu einem Dokument führt dann als eine weitere Information zu einer Kategorisierung des jeweiligen Dokumentes in eine Thematik, so dass auch eine Verknüpfung des Dokumentes mit einem oder mehreren Themendatensätzen vollzogen werden kann.
Verantwortlich für die Zuordnung eines Dokumentes zu einem Nutzer sind im Wesentlichen die Verknüpfungen zwischen Nutzer und Themendatensatz und Dokument und Themendatensatz, welche charakterisieren, inwieweit ein Thema für einen Nutzer von Relevanz ist und inwieweit ein Dokument von Relevanz für diesen Themenbereich ist. Aufgrund einer Auswertung dieser beiden relativen Gewichtungen wird eine Entscheidung vonseiten der Datenverarbeitungseinheit vorgenommen, welche Dokumente dem Nutzer vorgeschlagen werden und bei welchen dies nicht der Fall sein soll.
Der Nutzer kann als Reaktion auf einen Vorschlag eines Dokumentes, mithin einer Zuordnung dieses Dokumentes, das Dokument auch ablehnen, wodurch eine Rückmeldung an das System erfolgt, aus der das System für zukünftige Entscheidungen lernt. Lehnt beispielsweise der Nutzer regelmäßig die Veröffentlichung eines bestimmten Autors ab, so wird das System hierin eine Systematik erkennen und diesem Autor bei künftigen Auswahlen ein geringeres Gewicht geben. Umgekehrt kann der Nutzer ein Dokument allerdings auch annehmen oder gar empfeh- len, wobei ebenfalls eine Beeinflussung späterer Entscheidungen des Systems vorgenommen wird. Die Möglichkeiten der Rückmeldungen an das System sind jedoch wesentlich größer als dieses Beispiel, so können auch Kommentare, Subthemen und weitere Signale auch aus Drittsystemen einfließen. Im Falle einer derartigen Ablehnung, Annahme oder Empfehlung eines Dokumentes ist als eine mögliche Vorgehensweise vorgesehen, dass die Gewichtung der Verknüpfung zwischen Nutzerdatensatz und Themendatensatz, sowie zwischen Themendatensatz und Dokumentendatensatz angepasst werden wird, wobei der Grad der Anpassung vorzugsweise von dem relativen Gewicht des Nutzerdaten- satz abhängig ist. Das relative Gewicht des Nutzerdatensatzes ergibt sich aufgrund seiner Aktivität in dem Datenbanksystem, sowie anderen Aktivitäten und dem Ansehen eines Nutzers in den sozialen Medien oder anderen Netzwerken - inklusive des hier betrachteten Netzwerks - so dass ein Nutzer, dem in den sozialen Medien viele andere Nutzer folgen, dessen Tweets abboniert werden und dergleichen mehr, bei seinen Dokumentauswahlen eine größere relative Gewichtung erfährt, als andere Nutzer, die nur gelegentlich aktiv sind und deren Auswahlen für andere Nutzer nur von geringerer Relevanz sind.
Die Aktivität eines Nutzers in den sozialen Medien wird mithilfe von Dienstpro- grammen ausgewertet, welche der Datenverarbeitungseinheit die erforderlichen Daten zur Verfügung stellen.
Die Erstellung neuer Themendatensätze erfolgt im Wesentlichen auf Vorschlag von Nutzern, sowie aufgrund der Auswertung von Suchfragen der Nutzer. So wird bei der neuen Hinzunahme eines Themas für dieses Thema zunächst die komplette Trefferliste der Suche, je nach relativer Gewichtung der einzelnen Dokumente, mit dem Thema verknüpft und dann im weiteren Verlauf der Benutzung des Systems eine weitere Ausdifferenzierung der Gewichtung erfolgen. Wie bereits dargelegt, können neue Dokumente sowohl aus fremden Datenbanken in das System eingespeist werden oder auch mithilfe von Crawlern im Internet aufgespürt und in das Datenbanksystem eingefügt werden. Umgekehrt wird nach Auswertung der Informationen und nach einer Zuordnung der jeweiligen Doku- mente zu einem Nutzer in dem vorliegenden System die bereitzustellende Information wahlweise über einen RSS-Reader, per E-Mail, in einer Software-as-a- service-Umgebung oder auch über eine integrierte Software-Applikation zur Verfügung gestellt. Es handelt sich hierbei nicht um eine abschließende Aufzählung, nachdem beliebig viele weitere Möglichkeiten Zurverfügungstellung der Informationen denkbar sind.
Die vorstehend beschriebene Erfindung wird im Folgenden anhand eines Ausführungsbeispiels näher erläutert.
Es zeigen ein Datenbanksystem, dessen Datensätze in vier verschiedene, untereinander verknüpfte Ebenen unterteilt sind, in einer schematischen Darstellung, sowie das Daten banksystem gemäß Figur 1 in einer schematischen Darstellung, die den Informationsfluss im Datenbanksystem darstellen soll.
Figur 1 zeigt die Datenstruktur im erfindungsgemäßen Datenbanksystem, welche auf insgesamt vier Ebenen 10, 20, 30, 40 verteilt angeordnet ist. So wird in einer ersten Nutzerebene 10 für jeden Nutzer ein Nutzerdatensatz 1 1 angelegt, und von der Datenverarbeitungseinrichtung eine relative Gewichtung erhalten. In der Darstellung der Figur 1 ist jeweils ein Datensatz dann mit einer hohen relativen Gewichtung versehen, wenn er als großer Kreis, mit einer kleinen relativen Gewichtung, wenn er als kleiner Kreis dargestellt ist. Bei dem mit dem Bezugszeichen 1 1 versehenen Nutzerdatensatz handelt es sich um einen Nutzerdatensatz 1 1 mit einer hohen relativen Gewichtung, was sich auch daraus ableiten lässt, dass jeweils Nutzerverknüpfungen 12 zu den benachbarten Nutzerdatensätzen vorhanden sind. Es handelt sich hierbei also um eine relativ zentrale Persönlichkeit, bei- spielsweise einen Forenleiter, dessen Einschätzung bezüglich relevanter Dokumente also ein gewisses Gewicht zu haben verspricht.
In einer zweiten Ebene, welche die Themenebene 20 darstellt, sind wiederum Themendatensätze 21 vorgesehen, welche ihrerseits wieder eine relative Gewichtung untereinander besitzen. Der mit dem Bezugszeichen 21 versehene Themendatensatz ist über eine Verknüpfung 13 in die Themenebene 20 mit dem zuvor betrachteten Nutzerdatensatz 1 1 verbunden, wobei die relative Gewichtung der Verknüpfung 13 in die Themenebene 20, die sich wiederum durch die Strichdicke darstellt, sehr hoch ist. Es handelt sich bei dem mit dem Bezugszeichen 21 versehenen Themendatensatz damit um ein Thema, welches für den Nutzer, welcher mit dem Nutzerdatensatz 1 1 verbunden ist, von hohem Interesse ist.
Es hat sich gezeigt, dass auch benachbarte Themen für den fraglichen Nutzer von Relevanz sind, die über Themenverknüpfungen 22 mit dem Themendatensatz 21 innerhalb der Themenebene 20 verbunden sind. Nachdem diese Themen zwar von untergeordneter Relevanz für den Nutzer sind, aber eine gewisse Relevanz für den Nutzer aufweisen, ist auch zwischen diesem und dem Nutzerdatensatz 1 1 eine Verknüpfung realisiert. Dem Nutzerdatensatz 1 1 werden also hauptsächlich Dokumente zu dem Themendatensatz 21 , und bei großer Relevanz auch andere Dokumente aus den benachbarten, ebenfalls mit dem Nutzerdatensatz 1 1 verknüpften Themengebieten zugeordnet werden.
In der nächsten Ebene, der Dokumentenebene 30, sind die einzelnen Dokumente enthalten. Je nach Realisierung kann eine Dokumentenebene für jeden einzelnen Themendatensatz, oder auch allgemein für sämtliche Themendatensätze vorhanden sein. Im vorliegenden Fall ist aus der Gesamtheit der Dokumente, welche in der Dokumentenebene 30 angesiedelt sind, eine gewisse Auswahl von wichtigen, also relativ hoch gewichteten Dokumenten vorhanden, welche über eine relativ ebenfalls hoch gewichtete Verknüpfung 23 mit dem Themendatensatz 21 verbunden sind. Derartige, hoch gewichtete Dokumente eines Themendatensatzes, welcher seinerseits wiederum für den Nutzer von hohem Interesse ist, werden dem Nutzer in jedem Fall vorgelegt. In einer vierten Ebene, nämlich der Schlagwortebene 40, sind nunmehr als unterste Ebene die einzelnen Schlagworte 41 aufgeführt, welche ebenfalls untereinander verknüpft verbunden sein können. Über eine derartige Schlagwortverknüpfung 42 ist es für die Datenverarbeitungseinheit möglich, die Zuordnung zwischen einzelnen mit Schlagworten versehenen Dokumenten zu einem Thema zu erleichtern. Die Zuordnung von Schlagworten 41 zu einem Dokumentdatensatz 31 über eine Verknüpfung 33 erfolgt aufgrund einer Auswertung des Dokumentes, welches dem jeweiligen Dokumentdatensatz 31 zugeordnet ist, durch eine semantische Auswer- tung, ergänzt durch eine Wahrscheinlichkeitsbetrachtung, ob das eine oder andere Wort von besonderer Relevanz für das Dokument ist und dieses charakterisiert.
Die relative Gewichtung der einzelnen Datensätze 1 1 , 21 , 31 , 41 wird hierbei auf unterschiedliche Art und Weise berechnet. So kann eine Gewichtung eines Nut- zerdatensatzes 1 1 etwa aufgrund einer prominenten Stellung in den zur Informationsgewinnung zur Verfügung stehenden sozialen Medien vorgenommen werden, eine Gewichtung von Dokumentdatensätzen 31 beispielsweise durch eine Bewertung seitens der Nutzer. In jedem Fall wird die relative Gewichtung jedes Datensatzes 1 1 , 21 , 31 , 41 ständig neu berechnet und im Wesentlichen aufgrund des Nutzerverhaltens angepasst.
Aufgrund dieses Systems von relativen Gewichtungen sowohl der einzelnen Datensätze 1 1 , 21 , 31 , 41 als auch der Verbindungen zwischen diesen einzelnen Datensätzen 1 1 , 21 , 31 , 41 ist es ermöglicht, eine für den Nutzer besonders inte- ressante Auswahl von Dokumenten zu treffen, welche nicht notwendigerweise in einem Themenbereich erschöpft bleibt, sondern welche auch die Relevanz von Dokumenten benachbarter Themenkreise berücksichtigen lässt.
Figur 2 zeigt den Datenfluss in dem erfindungsgemäßen Wissensmanagement- System. Zunächst verfügt ein derartiges Wissensmanagementsystem über eine Reihe von Datenquellen 50, welche beispielsweise das Internet, ein Intranet, oder auch externe Datenbanken umfassen. Mithilfe von Crawlern 51 oder auch durch einen herkömmlichen Import 52 externer Datenquellen 50 werden die Informatio- nen in Form von Dokumenten in das System eingespeist, indem sie der systemeigenen API (Application Programming Interface) zugeführt werden. Mit verschiedenen Auswertemitteln 63, welche beispielsweise die semantische Auswertung, Profiler, Content Directories oder auch Provider Directors umfasst, werden die Dokumente aufbereitet und letzten Endes sogenannte„Fingerabdrücke" sowohl für die Dokumente als auch für die Nutzer erstellt. Aufgrund dieser Nutzerprofile 61 und der Dokumentenprofile 62 wird dann entschieden, welchem Nutzer welches Dokument zur Verfügung gestellt wird. Nach erfolgter Entscheidung werden die Dokumente über eine API 64 auf dem vom Nutzer bevorzugten Weg zu den Datensenken 70 weitergeschleust. Hierbei kann es sich beispielsweise um einen RSS-Reader 71 , E-Mails 72, eine Software-as-a-service-Umgebung 73 oder auch um eine integrierte Software-Applikation 74 handeln. Eine Aufbereitung der Informationen ist prinzipiell für jede denkbare Informationsumgebung realisierbar und im Rahmen der Erfindung mit beansprucht.
Vorstehend beschrieben ist somit ein Verfahren zur Zusammenstellung von Dokumenten im Rahmen eines Wissensmanagements, bei welchem aufgrund von relativen Gewichtungen von Verknüpfungen sowie relativen Gewichtungen von verwendeten Datensätzen ein „Fingerabdruck" sowohl der Dokumente, welche den Nutzern zugeordnet werden sollen, als auch den Nutzern selbst erstellt wird, welche ein individuelles Eingehen auf die Bedürfnisse der Nutzer ermöglicht und gleichzeitig eine sinnvolle und intelligente Auswahl von Dokumenten für den Nutzer ermöglicht.
BEZUGSZE ICH EN LISTE Nutzerebene
Nutzerdatensatz
Nutzerverknüpfung
Verknüpfung in die Themenebene
Themenebene
Themendatensatz
Themenverknüpfung
Verknüpfung in die Dokumentenebene
Dokumentenebene
Dokumentdatensatz
Dokumentenverknüfung
Verknüpfung in die Schlagwortebene
Schlagwortebene
Schlagwort
Schlagwortverknüfung
Datenquellen
Crawler
Import
API
Nutzerprofile
Dokumentenprofile
Auswertemittel
API
Datensenken
RSS-Reader
E-Mails
Software-as-a-service-Umgebung
integrierte Software-Applikation

Claims

PAT E N TA N S P R Ü C H E
Verfahren zur Zusammenstellung von Dokumenten im Rahmen eines Wissensmanagements, bei dem einer zentralen Datenverarbeitungseinheit ein Datenbanksystem mit Datensätzen (11 , 21 , 31 , 41 ) zugeordnet ist, wobei die Datenverarbeitungseinheit Verknüpfungen zwischen einzelnen Datensätzen (11,21,31,41) herstellt und so einem Nutzer Dokumente zuordnet,
dadurch gekennzeichnet, dass die Datenverarbeitungseinheit für gleichartige Datensätze (11 , 21 , 31 , 41 ) und für Verknüpfungen (13, 23, 33) zwischen ungleichartigen Datensätzen (11,21,31,41) eine relative Gewichtung berechnet und anhand dieser Gewichtungen über eine Zuordnung von Dokumenten zu einem Nutzer entscheidet.
Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass eine Verknüpfung zwischen jeweils einen Nutzer identifizierenden Nutzerdatensätzen (11) und jeweils ein Themengebiet beschreibenden Themendatensätzen (21) hergestellt wird.
Verfahren gemäß Anspruch 2, dadurch gekennzeichnet, dass eine Verknüpfung zwischen jeweils einem Themendatensatz (21) und einem ein Dokument identifizierenden Dokumentdatensatz (31) hergestellt wird.
Verfahren gemäß Anspruch 3, dadurch gekennzeichnet, dass eine Verknüpfung zwischen jeweils einem Dokumentdatensatz (31) und einem Schlagwort (41) hergestellt wird.
Verfahren gemäß Anspruch 4, dadurch gekennzeichnet, dass im Falle einer Neuaufnahme eines Dokumentdatensatzes (31) in das Datenbanksystem das zu dem Dokumentdatensatz (31) gehörende Dokument mittels eines semantischen Suchverfahrens, sowie vorzugsweise unter Zugrundelegung einer Wahrscheinlichkeitsbetrachtung, geeignete Verknüpfungen (33) zwi- sehen dem Dokumentdatensatz (31 ) und einem oder mehreren Schlagworten (41 ) hergestellt werden.
Verfahren gemäß einem der Ansprüche 4 oder 5, dadurch gekennzeichnet, dass eine Verknüpfung (23) zwischen einem Dokumentdatensatz (31 ) und einem Themendatensatz (21 ) aufgrund einer Auswertung der mit dem Dokumentdatensatz (31 ) verknüpften Schlagworte (41 ) hergestellt wird.
Verfahren gemäß einem der Ansprüche 3 bis 6, dadurch gekennzeichnet, dass ein Dokument einem Nutzer je nach Gewichtung der Verknüpfungen (13) zwischen Nutzerdatensatz (1 1 ) und Themendatensatz (21 ) und zwischen Themendatensatz (21 ) und Dokumentdatensatz (31 ) entweder zugeordnet oder nicht zugeordnet wird.
Verfahren gemäß Anspruch 7, dadurch gekennzeichnet, dass ein Nutzer, dessen Nutzerdatensatz (1 1 ) ein Dokument zugeordnet wurde, dieses Dokument ablehnen, annehmen oder empfehlen kann, wobei die Entscheidungen des Nutzers von der Datenverarbeitungseinheit aufgezeichnet und - vorzugsweise neben anderen Signalen wie etwa der Verweildauer eines Nutzers auf dem Dokument, Shares, Referenzen in Sozialen Netzwerken, Gewichtung des Nutzers innerhalb der Plattform - im Hinblick auf spätere Zuordnungen ausgewertet und berücksichtigt werden.
Verfahren gemäß Anspruch 8, dadurch gekennzeichnet, dass aufgrund einer Ablehnung, Annahme und/oder Empfehlung eines Dokuments - vorzugsweise neben anderen Signalen wie etwa der Verweildauer eines Nutzers auf dem Dokument, Shares, Referenzen in Sozialen Netzwerken, Gewichtung des Nutzers innerhalb der Plattform - die Gewichtung der Verknüpfungen zwischen Nutzerdatensatz (1 1 ) und Themendatensatz (21 ) sowie zwischen Themendatensatz (21 ) und Dokumentdatensatz (31 ) angepasst werden.
Verfahren gemäß Anspruch 9, dadurch gekennzeichnet, dass ein Grad der Anpassung der Gewichtungen von Verknüpfungen (13) zwischen Nutzerda- tensatz (1 1 ) und Themendatensatz (21 ) sowie zwischen Themendatensatz (21 ) und Dokumentdatensatz (31 ) von der relativen Gewichtung des Nutzerdatensatzes (1 1 ) abhängig ist. 1 1 . Verfahren gemäß Anspruch 10, dadurch gekennzeichnet, dass die relative Gewichtung eines Nutzerdatensatzes (1 1 ) aufgrund von Aktivitäten auf dem Datenbanksystem, sowie vorzugsweise auch mithilfe von Dienstprogrammen ausgewerteter Aktivitäten und Bewertungen des zugehörigen Nutzers in sozialen Medien und dessen Grad der Vernetzung, berechnet wird.
12. Verfahren gemäß einem der Ansprüche 2 bis 1 1 , dadurch gekennzeichnet, dass ein Themendatensatz (21 ) auf Vorschlag eines Nutzers oder aufgrund einer Suchanfrage eines Nutzers von der Datenverarbeitungseinheit erstellt wird.
13. Verfahren gemäß einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass neue Dokumente aus fremden Datenbanken (50) eingespeist oder mithilfe von Crawlern (51 ) im Internet aufgespürt und in das Datenbanksystem hinzugefügt werden.
14. Verfahren gemäß einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die einem Nutzer zugeordneten Dokumente diesem über einen RSS-Reader (71 ), per E-Mail (72), in einer Software-as-a-service- Umgebung (73), oder über integrierte Software-Applikationen (74) zur Verfü- gung gestellt werden.
PCT/EP2013/050645 2012-01-20 2013-01-15 Verfahren zur zusammenstellung von dokumenten WO2013107727A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102012100470A DE102012100470A1 (de) 2012-01-20 2012-01-20 Verfahren zur Zusammenstellung von Dokumenten
DE102012100470.6 2012-01-20

Publications (1)

Publication Number Publication Date
WO2013107727A1 true WO2013107727A1 (de) 2013-07-25

Family

ID=47715985

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2013/050645 WO2013107727A1 (de) 2012-01-20 2013-01-15 Verfahren zur zusammenstellung von dokumenten

Country Status (2)

Country Link
DE (1) DE102012100470A1 (de)
WO (1) WO2013107727A1 (de)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216434A1 (en) * 2004-03-29 2005-09-29 Haveliwala Taher H Variable personalization of search results in a search engine
WO2006071931A2 (en) * 2004-12-29 2006-07-06 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US20070239680A1 (en) * 2006-03-30 2007-10-11 Oztekin Bilgehan U Website flavored search
WO2007135436A1 (en) * 2006-05-24 2007-11-29 Icom Limited Content engine
US20100293057A1 (en) * 2003-09-30 2010-11-18 Haveliwala Taher H Targeted advertisements based on user profiles and page profile

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPO710597A0 (en) 1997-06-02 1997-06-26 Knowledge Horizons Pty. Ltd. Methods and systems for knowledge management
US6424968B1 (en) 1997-10-21 2002-07-23 British Telecommunications Public Limited Company Information management system
DE10215494A1 (de) 2002-04-09 2003-11-06 Bayer Ag Computersystem für das Wissensmanagement
DE102004052469A1 (de) * 2004-02-18 2005-09-15 Siemens Ag Verfahren zur Qualitätsbewertung von elektronisch gespeicherten, insbesondere medizinischen, Wissensdaten

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100293057A1 (en) * 2003-09-30 2010-11-18 Haveliwala Taher H Targeted advertisements based on user profiles and page profile
US20050216434A1 (en) * 2004-03-29 2005-09-29 Haveliwala Taher H Variable personalization of search results in a search engine
WO2006071931A2 (en) * 2004-12-29 2006-07-06 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US20070239680A1 (en) * 2006-03-30 2007-10-11 Oztekin Bilgehan U Website flavored search
WO2007135436A1 (en) * 2006-05-24 2007-11-29 Icom Limited Content engine

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ROSARIO B: "Latent Semantic Indexing: An overview", 21 April 2000 (2000-04-21), pages 1 - 16, XP007920047, Retrieved from the Internet <URL:http://people.ischool.berkeley.edu/~rosario/projects/LSI.pdf> *

Also Published As

Publication number Publication date
DE102012100470A1 (de) 2013-07-25

Similar Documents

Publication Publication Date Title
LU101105B1 (de) Verfahren zur automatisierten Erstellung eines an eine vorgegebene Person gerichteten Phishing-Dokuments
DE112018004946B4 (de) Kognitive datenanonymisierung
DE69933187T2 (de) Dokumentensuchverfahren und Dienst
DE10034694B4 (de) Verfahren zum Vergleichen von Suchprofilen sowie dessen Verwendung
Kessler et al. Democratisation through international migration? Explorative thoughts on a novel research agenda
DE102012025349B4 (de) Bestimmung eines Ähnlichkeitsmaßes und Verarbeitung von Dokumenten
DE112012006749T5 (de) Suchmethode
WO2013107727A1 (de) Verfahren zur zusammenstellung von dokumenten
DE19651788A1 (de) Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken
Baumüller Managing cultural diversity–An empirical examination of cultural networks and organizational structures as governance mechanisms in multinational corporations
Lablans et al. Strategies for biobank networks: Classification of different approaches for locating samples and an outlook on the future within the BBMRI-ERIC
DE102012025351B4 (de) Verarbeitung eines elektronischen Dokuments
WO2001042947A2 (de) Verfahren, computerprogramm, vorrichtung und system zum übermitteln von inhalten, insbesondere von werbung
Dietrich et al. Social Origin, Life Course Events and Delayed Vocational Training of Formally Low-Qualified Individuals
Schulz Technocracy and freedom. The utopias of digital control in the history of political thought
DE102022001690A1 (de) System zur Zusammenführung von Daten mit einem Speicherwerk eines Rechners
DE102022126561A1 (de) Datenbanksystem zur Erfassung von innerhalb einer Organisation vorhandenen Kompetenzen
DE102020216127A1 (de) Computer-implementiertes Verfahren zur Verwaltung von Datensätzen zum Trainieren von künstlicher Intelligenz
DE102019131639A1 (de) Verfahren zum Bereitstellen eines Erklärungsdatensatzes für ein KI-Modul, Computerlesbares Speichermedium, Vorrichtung und System
Nissen et al. Design of a Methodology to Support Technology Selection for the Virtualization of Consulting Services
Burri Wie junge Kohorten individualisiert alternsgerecht führen
DE102023002583A1 (de) Verfahren zu Betreiben eines Managementsystems sowie Managementsystem
Gaupp et al. Vocational Training Without a Secondary School Certificate: Results of a longitudinal study.
DE102020109953A1 (de) Verfahren und Computersystem zur Bestimmung der Relevanz eines Textes
DE102017007331A1 (de) Verfahren zur Mensch-Maschine-Interaktion in Bewertungssysemen

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13704370

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 13704370

Country of ref document: EP

Kind code of ref document: A1