EP1977349A2

EP1977349A2 - Verfahren zum computergestützten bearbeiten von quelldatenelementen, system und computerprogrammprodukt

Info

Publication number: EP1977349A2
Application number: EP07702737A
Authority: EP
Inventors: Michael Berthold
Original assignee: Universitaet Konstanz
Current assignee: Universitaet Konstanz
Priority date: 2006-01-13
Filing date: 2007-01-12
Publication date: 2008-10-08
Also published as: US20090157655A1; DE102006001840A1; WO2007082695A2; DE102006001840B4; WO2007082695A3

Abstract

Zusammengefaßt betrifft die vorliegende Erfindung Verfahren zum computergestützten Bearbeiten von Quelldatenelementen (32-40, 46-54) einer Quelldatenmenge (20) mit den Schritten: Eingeben zumindest eines Nachfragedatenelements, insbesondere eines Suchstrings; Ermitteln einer gewichteten Verknüpfung (42, 44, 60) des Nachfragedatenelements mit zumindest einem Quelldatenelement (34, 38, 40) der Quelldatenmenge (20), insbesondere mit zumindest einem Trefferstring der Quelldatenmenge (20); und Ausgeben des zumindest einen Quelldatenelements (34, 38, 40) entsprechend eines Gewichts (w12, w13, w34) der gewichteten Verknüpfung (42, 44, 60), bevorzugt einer Trefferwahrscheinlichkeit des Nachfragedatenelements mit dem zumindest einen Quelldatenelement (34, 38, 40), wobei das Gewicht (w12, w13, w34) der gewichteten Verknüpfung (42, 44, 60) aufgrund zumindest einer assoziativen Verknüpfung (42, 44, 60) ermittelt wird sowie ein weiteres Verfahren, ein System und ein Computerprogrammprodukt.

Description

"Verfahren zum computergestützten Bearbeiten von Quelldatenelementen, System und Computerprogrammprodukt"

Beschreibung

Die vorliegende Erfindung betrifft ein Verfahren zum computergestützten Bearbeiten von Quelldatenelementen einer Quelldatenmenge, ein System zum Bearbeiten von Quelldatenbankelementen einer Quelldatenbank und ein

Computerprogrammprodukt.

Viele Firmen und Forschungseinrichtungen erzeugen und verarbeiten eine Vielzahl von Informationen. Diese Informationen werden regelmäßig in Datenbanksystemen, welche bevorzugt miteinander vernetzt sind, abgespeichert. Moderne Speichertechnologie und die Kreativität von Forschern setzen im wesentlichen keine Grenzen an die Menge der gespeicherten Information. Um die Forschungs- und Entwicklungstätigkeit von Mitarbeitern bestmöglich zu unterstützen, ist es vielfach notwendig, die innerhalb und auch außerhalb einer Firma und/oder einer Forschungseinrichtung verstreuten, delokalisierten Informationen und/oder Daten möglichst vollständig und in einfacher Weise zur Verfügung zu stellen bzw. möglich zu machen. Dies ist insbesondere notwendig, um neue Erkenntnisse bzw. neue Arbeitsweisen zu ermöglichen. Beispielsweise sollen allen Mitarbeitern, insbesondere denen im Bereich Forschung und Entwicklung, Resultate von Experimenten, Erkenntnisse von Kollegen, Publikationen, usw. in einfacher und übersichtlicher Weise zur Verfügung gestellt werden. Wiederholungen von Experimenten oder vorhersehbare Mißerfolge sollten möglichst vermieden werden.

Beispielhaft soll in Forschungsabteilungen von Herstellern von Pharmazeutika unnötige oder doppelte Arbeit vermieden werden. Um neue, noch nicht bekannte Medikamente, welche beispielsweise keine negativen Nebenwirkungen aufweisen, zu entwickeln bzw. neu herzustellen, sind eine Vielzahl verschiedener Informationen notwendig, welche miteinander kombiniert werden können. Derzeit basiert die Entwicklung stark auf Experten mit langer Erfahrung und hoffentlich dem richtigen Wissen zum richtigen Zeitpunkt. Die Informationsquellen, welche Experten aufbauen, sind in der Regel über einen Konzern verteilt, vielfach auch über das Internet. Beispiele dafür sind Versuchsprotokolle, Patentinformationen, wissenschaftliche Publikationen, experimentelle und biologische Informationen bzw. Daten über metabolische Pfade bzw. Stoffwechsel pfade bzw. -wege. Ferner könnte bereichsübergreifende Zusammenarbeit von Experten eine vielversprechende Informationsquelle sein. Hinreichend bekannt ist beispielsweise große Informationsquellen zu erstellen, welche auf komplexer Datenbasistechnologie fundieren.

Es ist eine Aufgabe der Erfindung, einen möglichst vollständigen Zugang zu vorhandenen Informationen bzw. Daten bereitzustellen und die vorhandenen Informationen bzw. Daten in einfacher und effektiver Weise zu durchsuchen.

Diese Aufgabe wird gelöst anhand des Verfahrens gemäß Anspruch 1 , des Verfahrens gemäß Anspruch 21 , das System gemäß Anspruch 22 und das Computerprogrammprodukt gemäß Anspruch 33. Bevorzugte Ausführungsvarianten bzw. -formen sind Gegenstand der abhängigen Ansprüche.

Gemäß einem Aspekt der vorliegenden Erfindung umfaßt ein Verfahren zum computergestützten Bearbeiten von Quelldatenelementen einer Quelldatenmenge die Schritte:

Eingeben zumindest eines Nachfragedatenelements, insbesondere eines Suchstrings,

Ermitteln einer gewichteten Verknüpfung des Nachfragedatenelements mit zumindest einem Quelldatenelement der Quelldatenmenge, insbesondere mit ^'zumindest einem Trefferstring der Quelldatenmenge und Ausgeben des zumindest einen Quelldatenelements entsprechend eines Gewichts der gewichteten Verknüpfung, bevorzugt einer Trefferwahrscheinlichkeit des Nachfragedatenelements mit dem zumindest einen Quelldatenelement, wobei das Gewicht der gewichteten Verknüpfung aufgrund zumindest einer assoziativen Verknüpfung ermittelt wird.

Die gewichtete Verknüpfung kann eine assoziative Verknüpfung sein und umgekehrt, wobei jeder assoziativen Verknüpfung bzw. jeder gewichteten Verknüpfung ein Gewicht zugeordnet ist. Eine assoziative Verknüpfung zwischen zwei Elementen, beispielsweise dem Nachfragedatenelement und dem Quelldatenelement besteht entweder aus einer direkten, stark gewichteten Verbindung oder aus einer Summe von gewichteten Pfaden, welche zwei oder mehr Elemente miteinander verbinden. Folglich kann eine assoziative Verknüpfung eine direkte Verknüpfung oder eine aggregierte, d.h. eine indirekte, verkettete, usw. Verknüpfung zwischen zwei Elementen sein. Eine assoziative Verknüpfung kann eine Kombination von direkten und aggregierten Verknüpfungen sein.

Insbesondere können diese Verknüpfungen bzw. Verbindungen zwischen Informationen aus unterschiedlichen Datenquellen beispielsweise sehr unterschiedlichen Typs sein bzw. die Informationen aus unterschiedlichen Datenquellen auch (sehr) unterschiedlich verknüpft werden. Beispielsweise können die assoziativen Verknüpfungen zusätzlich zu rein numerischen Gewichten ein oder mehrere weitere Annotationen bzw. Informationen für jede Verbindung enthalten, die Informationen zum Ursprung, zur Art und/oder zur Qualität der Verknüpfung tragen. Insbesondere können dadurch mehrere Verknüpfungen zwischen zwei Datenquellelementen bestehen, die sich aufgrund dieser Annotationen unterscheiden und/oder identifizieren lassen.

In anderen Worten können Verbindungen zwischen zwei Elementen (z.B. Krankheit und Gen) existieren, die einmal beispielsweise aus einem Genexpressionexperiment stammen und einmal beispielsweise aus einem Artikel. In beiden Fällen wird vorteilhafterweise zwischen denselben Elementen eine eigene Verbindung bzw. Verknüpfungen geknüpft. Eine Verbindung bzw. Verknüpfung verweist beispielsweise auf Text, die andere Verbindung bzw. Verknüpfung verweist beispielsweise auf experimentelle Daten.

Vorteilhafterweise kann können erfindungsgemäß Verbindungen zwischen Informationen geknüpft werden.

Das Nachfragedatenelement kann ein oder mehrere Suchstring(s), beispielsweise ein Wort, mehrere Wörter, ein Satz, eine oder mehrere chemische Formel(n), eine oder mehrere Gensequenz(en), usw. sein. Das Nachfragedatenelement kann weitere Suchparameter, insbesondere weitere frei wählbare bzw. offene Suchparameter, sogenannte "Wildcards" umfassen.

Das oder die Quelldatenelement(e) kann ein Trefferstring, beispielsweise ein Wort, ein Satz, eine chemische Formel, eine Gensequenz, usw. sein.

In anderen Worten kann eine assoziative Verknüpfung zwischen dem Nachfragedatenelement und einem oder mehreren Quelldatenelementen ermittelt werden und insbesondere das Gewicht dieser assoziativen Verknüpfung ermittelt werden. Insbesondere wird der Ausdruck "das Gewicht der gewichteten Verknüpfung aufgrund einer assoziativen Verknüpfung" zu ermitteln im Sinne dieser Erfindung derart verwendet, daß jeder gewichteten Verknüpfung ein Gewicht zugeordnet ist und das Gewicht der gewichteten Verknüpfung anhand einer oder mehrerer assoziativer Verknüpfung(en) bestimmt, beispielsweise aus einer Tabelle entnommen oder berechnet wird. Zum bestimmen des Gewichts der gewichteten

Verknüpfung(en) wird beispielsweise auch der Kontext, wie zum Beispiel positive und/oder negative Markierungen während der interaktiven Navigation mit einbezogen.

Vorteilhafterweise basiert die Verbindung zwischen dem Nachfragedatenelement und dem Quelldatenelement bzw. der Quelldatenmenge nicht auf Indizes. Vielmehr erfolgt die Verbindung des Nachfragedatenelements mit dem Quelldatenelement anhand der assoziativen Verknüpfung und stellt keine Indexverknüpfung eines Suchstrings mit einer Quelldatenmenge dar. Erfindungsgemäß wird daher davon abgewichen, Indizes mit der Quelldatenmenge zu erzeugen. Vielmehr muß das Nachfragedatenelement, d.h. das Suchstring, nicht mit dem Quelldatenelement, d.h. den Trefferstring, übereinstimmen. Das Trefferstring kann anhand einer anders gearteten Verknüpfung, der assoziativen Verknüpfung, mit den Nachfragedatenelementen verbunden sein, wobei der assoziativen Verknüpfung ein Gewicht zugeordnet ist. Beispielsweise kann als Nachfragedatenelement das Suchstring "Gen A" verwendet werden. Das Quelldatenelement kann beispielsweise das Trefferstring "Protein B" sein. Obwohl das Nachfragedatenelement und das Quelldatenelement verschieden voneinander sind, wird bei Benutzung des erfindungsgemäßen Verfahrens aufgrund der Eingabe des Nachfragedatenelements "Gen A" das Quelldatenelement "Protein B" ausgegeben, da eine assoziative Verknüpfung zwischen dem Nachfragedatenelement "Gen A" und dem Quelldatenelement "Protein B" vorhanden ist, wobei sich die assoziative Verknüpfung beispielsweise darauf begründet, daß das Protein B durch das Gen A synthetisiert werden kann. Bei einer herkömmlichen Indexverknüpfung hingegen wäre ein Treffer nur möglich, wenn das Quelldatenelement ebenfalls "Gen A" wäre.

Vorteilhafterweise können die Informationen nach wie vor in entsprechenden Datenbanken vorliegen, es wird lediglich eine neue Verbindung zwischen den Informationsbausteinen bzw. der einzelnen Einträge der Datenbanken erstellt. Assoziationen können anhand automatischer Analyse durch spezielle Lösewerkzeuge, das heißt anhand spezieller Algorithmen, welche auf einen oder mehreren Computern ablaufen können, gebildet werden. Vorteilhafterweise können nachträglich weitere Analysewerkzeuge sowie Informationsquellen hinzugefügt werden.

Ferner müssen von einem Benutzer gerade nicht spezielle Anfragen, sondern lediglich bereits vorhandene Informationen, z.B. Genbezeichnungen, die in einem Experiment auftauchen, eingegeben werden und es werden Beziehungen zu diesen Eingaben erstellt und ausgegeben.

Das Ermitteln der gewichteten Verknüpfung des Nachfragedatenelements mit zumindest einem Quelldatenelement kann hierbei das Berechnen der Verknüpfungen in Echtzeit umfassen. Es ist auch möglich, daß die Verknüpfung lediglich abgefragt wird, d.h. die Verknüpfung schon vorher hinterlegt war.

Eine gewichtete Verknüpfung im Sinne dieser Erfindung ist eine assoziative Verknüpfung, insbesondere eine direkte Verknüpfung, welcher ein Gewicht zugewiesen ist.

Das Ausgeben des zumindest einen Quelldatenelements entsprechend seiner gewichteten Verknüpfung umfaßt insbesondere, falls zu einem oder mehreren Nachfragedatenelementen ein oder mehrere Quelldatenelemente gefunden wurden, diese Quelldatenelemente gemäß ihrer Rangordnung auszugeben. Die Rangordnung bestimmt sich hierbei anhand der gewichteten Verknüpfung. Beispielsweise kann die gewichtete Verknüpfung in Prozent angegeben sein. Insbesondere kann die gewichtete Verknüpfung als Bruchteil eines möglichen Maximalwertes einer gewichteten Verknüpfung angegeben sein. In anderen Worten wird bei einer sehr starken Verknüpfung das entsprechende Quelldatenelement in seiner Hierarchie weiter oben angeordnet, als ein Quelldatenelement mit einer schwachen Verknüpfung. Beispielsweise kann eine assoziative Verknüpfung zwischen dem Nachfragedatenelement "Gen A" und dem Quelldatenelement "Protein B" einen Wert von 0,9 aufweisen, und eine assoziative Verknüpfung zwischen dem Nachfragedatenelement "Gen A" und einem Quelldatenelement "Protein C" einen Wert von 0,2. Bei Ausgabe der Quelldatenelemente ist das Quelldatenelement "Protein B" ranghöher als das Quelldatenelement "Protein C".

Vorteilhafterweise kann aufgrund des erfindungsgemäßen Verfahrens Information zur Verfügung gestellt werden, ohne daß notwendigerweise eine klar definierte Anfrage formuliert werden muß. Insbesondere können möglicherweise wichtige, aber durch die Anfrage nicht registrierte Informationen extrahiert werden. Wie oben beispielhaft ausgeführt, ist es möglich anhand einer nicht näher formulierten Nachfrage damit assoziierte Informationen zur Verfügung zu stellen. Weiterhin vorteilhafterweise können auch Verbindungen zwischen Informationsquellen (innerhalb und gegebenenfalls auch außerhalb einer Firma) bereitgestellt werden.

Anhand des Verfahrens werden folglich nicht große Informationsdatenbanken modelliert, sondern Beziehungen zwischen allen Informationsquellen, d.h. eine Vielzahl möglicher Quelldatenmengen bzw. einer Vielzahl möglicher Quelldatenelemente, erstellt. Insbesondere können auch externe bzw. fremde Datenbanken und/oder Datenbankstrukturen mit einbezogen werden, d.h. mit assoziativen Verknüpfungen versehen werden. Informationen fremder bzw. externer Datenbankstrukturen können mittels assoziativer Verknüpfungen mit bestehenden, internen Datenstrukturen, d.h. Quelldatenmengen verbunden werden.

Vorzugsweise wird eine Referenzdatenmenge mit Referenzdatenelementen bereitgestellt und für jedes Referenzdatenelement eine gewichtige Verknüpfung mit zumindest einem Quelldatenelement der Quelldatenmenge generiert.

Insbesondere kann die Referenzdatenmenge gleich der Quelldatenmenge sein, d.h. die Referenzdatenmenge ist identisch mit der Quelldatenmenge. In anderen Worten kann lediglich eine Datenmenge bereitgestellt werden, welche sowohl die Quelldatenmenge als auch die Referenzdatenmenge darstellt. Die einzelnen Elemente dieser Datenmenge können anhand von assoziativen Verknüpfungen miteinander verknüpft sein.

Die gewichtete Verknüpfung ist hierbei eine assoziative Verknüpfung. In anderen Worten wird vorteilhafterweise keine Indizierung der Referenzdatenelemente mit den Quelldatenelementen bzw. der Quelldatenmenge erstellt. Vielmehr werden zwischen den Referenzdatenelementen und den Quelldatenelementen gewichtige Verknüpfungen, insbesondere assoziative Verknüpfungen, bereitgestellt. Die Referenzdatenmenge kann dabei ein oder mehrere Referenzdatenelemente umfassen. Die Quelldatenmenge kann ein oder mehrere Quelldatenelemente umfassen. Für jedes Referenzdatenelement kann jeweils eine Verknüpfung mit jedem Quelldatenelement hergestellt werden. Es kann auch für eine Vielzahl von Referenzdatenelementen eine gemeinsame gewichtige Verknüpfung mit einem Quelldatenelement hergestellt werden.

Vorzugsweise wird während des Schritts des Ermitteins der gewichteten Verknüpfung(en) des Nachfragedatenelements mit dem zumindest einen Quelldatenelement zumindest ein Referenzdatenelement ermittelt, welches dem Nachfragedatenelementen entspricht und die Verknüpfung(en) des zumindest einen Referenzdatenelements mit dem zumindest einem Quelldatenelement dem Nachfragedatenelement zugeordnet.

Wird lediglich eine Datenmenge bereitgestellt, deren Elemente untereinander anhand von assoziativen Verknüpfungen miteinander verknüpft sind, kann für jedes

Nachfragedatenelement zumindest ein Element der Datenmenge ermittelt werden welches dem Nachfragedatenelementen entspricht und die Verknüpfung(en) des zumindest einen Elements der einzigen Datenmenge mit weiteren Elementen der einzigen Datenmenge dem Nachfragedatenelement zugeordnet werden. In anderen Worten kann lediglich die Quelldatenmenge bereitgestellt werden, wobei assoziative

Verknüpfungen zwischen Quelldatenelementen bestehen. Für jedes

Nachfragedatenelement wird zumindest ein Quelldatenelement ermittelt, welches beispielsweise mit dem Nachfragedatenelement identisch sein kann. Die mit diesem

Quelldatenelement verknüpften weiteren Quelldatenelemente können entsprechend des Gewichts ihrer gewichteten Verknüpfungen ausgegeben werden.

In anderen Worten werden vorzugsweise alle Verknüpfungen zwischen den Referenzdatenelementen und dem Quelldatenelementen vorab erstellt, wobei die Verknüpfungen sowohl automatisch als auch manuell kontinuierlich erweiterbar sind. Nach Eingabe eines Nachfragedatenelements wird das Nachfragedatenelement mit den Referenzdatenelementen der Referenzdatenmenge verglichen und zumindest ein Referenzdatenelement ausgewählt, welches dem Nachfragedatenelement entspricht. Alle Verknüpfungen des ausgewählten Referenzdatenelements bzw. der ausgewählten Referenzdatenelemente werden dem eingegebenen Nachfragedatenelementen zugeordnet. In anderen Worten werden auch alle Quelldatenelemente, welche mit den ausgewählten Referenzdatenelementen durch assoziative Verknüpfung(en) verknüpft sind, dem Nachfragedatenelement zugeordnet. Ausgegeben werden die Quelldatenelemente entsprechend der gewichteten Verknüpfungen mit dem Referenzdatenelement bzw. den Referenzdatenelementen, wobei die Ausgabe der Quelldatenelemente hierarchisch anhand der gewichteten Verknüpfung bzw. der Verknüpfungen mit den Referenzdatenelement(en) angeordnet sind.

Besonders bevorzugt ist das Referenzdatenelement mit dem Nachfragedatenelement identisch.

Weiterhin vorzugsweise ist jedem Quelldatenelement ein Zusatzdatenelement einer Zusatzdatenmenge zugeordnet. Das Quelldatenelement kann ein Bestandteil des Zusatzdatenelements, beispielsweise ein Wort eines Textes bzw. einer Webseite sein.

Das Zusatzdatenelement kann beispielsweise ein Text, eine wissenschaftliche Veröffentlichung, ein Buch, ein Teil eines Buches, eine Webpage oder eine digitale Datei, beispielsweise eine PDF-Datei sein.

Wie bereits oben ausgeführt kann vorteilhafterweise eine Indizierung eines oder mehrerer Zusatzdatenelemente, beispielsweise einer Webseite oder eines Textes vermieden werden. Vielmehr ist es nicht notwendig, daß das Suchstring in dem

Zusatzdatenelement, beispielsweise der Webseite bzw. dem Text enthalten sein muß, wie dies herkömmlicherweise der Fall sein muß. Beispielsweise kann nach

Eingabe des Suchstrings "Gen A" als Ausgabe das Trefferstring "Gen B" und ein Text angegeben werden, welcher lediglich das Trefferstring "Gen B" beinhaltet, aber nicht das Suchstring "Gen A", da eine assoziative Verknüpfung zwischen dem

Suchstring "Gen A" und dem Trefferstring "Gen B" existiert. Mit einer herkömmlichen Suchmaschine wäre diese Ausgabe nicht möglich gewesen.

Besonders bevorzugt wird bei der Ausgabe eines jedes Quelldatenelements das Zusatzdatenelement bereitgestellt. In anderen Worten kann bei der Ausgabe des Quelldatenelements, d.h. eines Trefferstrings, beispielsweise eines Worts bzw. einer Formel bzw. eines anderen Trefferstrings einer Webpage bzw. eines Textes bzw. eines anderen Datengebildes sein, das ganze Datengebilde bzw. eine Angabe über die Identität des ganzen Datengebildes mit ausgegeben werden. Es ist auch möglich, daß lediglich ein Hinweis, beispielsweise ein Link auf dieses Datengebilde zur Verfügung gestellt wird. Herkömmlicherweise kann der Trefferstring und die Webadresse der Webpage, auf welcher der Trefferstring verfügbar ist, bereitgestellt werden. Analog kann auch eine Datei bzw. ein Link zu dieser Datei bereitgestellt werden.

Weiterhin vorteilhafterweise kann durch die Modellierung der Zusammenhänge zwischen Nachfragedatenelementen und/oder Quelldatenelementen und/oder Referenzdatenelementen, welche auch als Informationsentities bezeichnet sein können, und die Verknüpfungen mit den zugrunde liegenden Zusatzdatenelementen, d.h. in den Informationsquellen, ein Benutzer nicht nur die Ergebnisse der Assoziationen sehen, sondern auch den Assoziationsprozess selbst verstehen. Vorteilhafterweise wird also nicht eine große Informationsdatenbank modelliert, sondern eine Beziehung zwischen allen vorhandenen Informationsquellen.

Weiterhin bevorzugt werden zumindest zwei Nachfragedatenelemente eingegeben, für jedes Nachfragedatenelement jeweils ein Quelldatenelement ermittelt und die Quelldatenelemente entsprechend der Gewichten ihrer gewichteten Verknüpfungen mit den zugehörigen Nachfragedatenelementen ausgegeben. Die zwei oder mehreren Nachfragedatenelement können mit einem einzigen Quelldatenelement verknüpft sein.

Insbesondere können zwei oder mehrere Nachfragedatenelemente eingegeben werden. Beispielsweise kann sowohl das Nachfragedatenelement "Haus" als auch das ^" Nachfragedatenelement "Bauen" eingegeben werden. Das zugehörige Quelldatenelement kann beispielsweise das Trefferstring "Handwerker" sein. Ebenso, wie bereits oben ausgeführt, sind die Nachfragedatenelemente nicht identisch mit dem Quelldatenelement. Es kann jedoch eine assoziative Verknüpfung zwischen dem Nachfragedatenelement "Haus" und dem Nachfragedatenelement "Bauen" bestehen, welche mit dem Trefferstring "Handwerker" verbunden ist und somit der Eingabe der Suchstrings "Haus" und "Bauen" das Trefferstring "Handwerker" zugeordnet sein.

Beispielsweise kann ein Nachfragedatenelement auch das Suchstring "Gen G1" sein, das zweite Nachfragedatenelement kann auch das Suchstring "Gen G2" sein. Es kann ferner dem Suchstring "Gen G1" eine assoziative Verknüpfung mit dem Trefferstring, das heißt dem Quelldatenelement "Protein P1" zugeordnet sein. In anderen Worten kann die Referenzdatenmenge das Referenzdatenelement "Gen G1" aufweisen und eine assoziative Verknüpfung zwischen dem Referenzdatenelement "Gen G1 " und dem Quelldatenelement "Protein P1" bestehen. Ferner kann dem zweiten Nachfragedatenelement, d.h. dem zweiten Suchstring "Gen G2" eine assoziative Verknüpfung mit einem Quelldatenelement "Protein P2" zugeordnet sein. Erfindungsgemäß werden sowohl das Quelldatenelement "Protein P1" als auch das Quelldatenelement "Protein P2" ausgegeben. Hierbei werden die Quelldatenelemente hierarchisch nacheinander ausgegeben, wobei beispielsweise als erstes das Quelldatenelement mit dem größeren Wert der assoziativen Verknüpfung ausgegeben wird. Es kann beispielsweise auch dem Nachfragedatenelement "Gen G1" eine assoziative Verknüpfung mit einem Quelldatenelement "Protein P12" zugeordnet sein. Ferner kann dem Nachfragedatenelement "Gen G2" eine assoziative Verknüpfung mit dem Quelldatenelement "Protein P12" zugeordnet sein. Folglich besteht eine assoziative Verknüpfung zwischen dem Quelldatenelement "Protein P12" und Referenzdatenelement "Gen G1" sowie dem Referenzdatenelement "Gen G2". In diesem Fall wird ebenso das Quelldatenelement "Protein P12" ausgegeben, wobei die Position in der Hierarchie, in welcher das Trefferstring "Protein P12" ausgegeben wird, aus den assoziativen Verknüpfungen mit dem Referenzdatenelement "Gen G1" und dem Rererenzdatenelement "Gen G2" bestimmt wird.

Werden zwei oder mehr Nachfragedatenelemente eingegeben und weist zumindest ein Nachfragedatenelement eine Verknüpfung zu einem Quelldatenelement auf, zu 5 welchem kein weiteres Nachfragedatenelement eine Verknüpfung aufweist, kann bei der Ausgabe dieses Quelldatenelements ebenfalls ein entsprechender Hinweis über die einzige Verknüpfung mit ausgegeben werden.

Das Nachfragedatenelement wird nicht direkt mit dem Quelldatenelement verknüpft, 10 sondern das dem Nachfragedatenelement entsprechende Referenzdatenelement. Die Verknüpfung dieses Referenzdatenelements mit dem Quelldatenelement wird jedoch einer direkten Verknüpfung des Nachfragedatenelements mit dem Quelldatenelement gleichgesetzt.

15 Weiterhin vorzugsweise wird für jedes Quelldatenelement, welches Verknüpfungen mit mehreren Nachfragedatenelementen aufweist, jeweils eine Verknüpfung mit jedem Element aus der Menge der Permutationen der Nachfragedatenelemente, welche mit dem Quelldatenelement verknüpft sind, generiert.

20 Anders ausgedrückt kann ein Quelldatenelement mit N Referenzdatenelementen R₁ bis R_N verknüpft sein. In diesem Fall wird vorzugsweise eine Verknüpfung zwischen dem Quelldatenelement und jedem Referenzdatenelement Ri bis R_N bereitgestellt.

Ferner wird eine gemeinsame Verknüpfung für alle zwei-Tupel der

^'• Referenzdatenelemente R₁ bis RN, d.h. für die Paare der Referenzdatenelemente

25 (R1 , R2), (R1 , R3), (R1 , R4) ... (R_N-i, RN) sowie für alle drei-Tupel, vier-Tupel (N-

1 )-Tupel und N-Tupel bereitgestellt.

Vorzugsweise können ein oder mehrere Quelldatenelement(e) und/oder assoziative ^: Verknüpfung(en) visuell dargestellt werden. Hierbei können die Quelldatenelemente 30 und gegebenenfalls die Verknüpfungen zwischen den Quelldatenelementen angezeigt werden. In anderen Worten kann die durchsuchbare Datenstruktur bzw. das durchsuchbare Netzwerk dargestellt werden. Es ist insbesondere möglich, daß die assoziativen Verknüpfungen und die Werte der Gewichte dargestellt werden.

Bevorzugt wird zumindest ein Quelldatenelement vorbestimmt und dem zumindest einen vorbestimmten Quelldatenelement ein positives oder ein negatives Potential zugeordnet. Besonders bevorzugt können einen Vielzahl, insbesondere alle

Quelldatenelemente und/oder assoziative Verknüpfung(en) visuell dargestellt werden, die Quelldatenelemente einzeln und/oder gruppiert von einem Benutzer gegebenenfalls visuell angewählt bzw. ausgewählt werden und den gewählten

Quelldatenelementen jeweils positive oder negative Potentiale bzw. Aktivitäten zugeordnet werden.

Befinden sich zwischen den zwei anhand einer assoziativen Verknüpfung miteinander verbundenen Elementen weitere Elemente, beispielsweise weitere Quelldatenelemente, können diese Elemente mit einem negativen Potential, d.h. einer negativen Aktivierung versehen sein und zu einer Abschwächung dieser assoziativen Verknüpfung, d.h. zu einem geringeren Gewicht der gewichteten Verknüpfung führen.

Vorzugsweise ist das Vorbestimmen des zumindest einen Quelldatenelements und das Zuordnen des positiven oder negativen Potentials von einem Benutzer manuell durchführbar. Beispielsweise kann bzw. können ein oder mehrere

Quelldatenelemente und/oder assoziative Verknüpfungen von dem Benutzer ausgewählt werden und entsprechende Potentiale zugeordnet werden. Insbesondere kann bzw. können ein oder mehrere Quelldatenelemente und/oder assoziative Verknüpfungen von dem Benutzer aufgrund der visuellen Darstellung ausgewählt werden, indem beispielsweise Quelldatenelement(e) und/oder assoziative

Verknüpfung(en) auf einem Computerbildschirm ausgewählt werden. Insbesondere kann der Benutzer daher die heranzuziehende Quelldatenmenge, d.h. die relevanten

Quelldatenelemente in einfacher Weise interaktiv bestimmen, einschränken bzw. spezifizieren.

Besonders bevorzugt ist das Vorbestimmen des zumindest einen Quelldatenelements und das Zuordnen des positiven oder negativen Potentials durch den Benutzer vor Eingabe des zumindest einen Nachfragedatenelements durchführbar ist. Somit ist es in einfacher Weise möglich, daß der Benutzer bereits vor der ersten Anfrage die Quelldatenelemente genau spezifiziert. Nach der ersten Anfrage kann der Benutzer weitere Quelldatenelemente und/oder assoziative Verknüpfungen bestimmen und so weiter.

Vorzugsweise kann jedem Referenzdatenelement bzw. jedem Quelldatenelement ein Potential zugeordnet werden. Das Potential kann positiv oder negativ sein. Wird beispielsweise einem Quelldatenelement ein positives Potential zugeordnet, können alle mit dem Quelldatenelement verknüpften weiteren Quelldatenelemente zur Ausgabe herangezogen werden. Wird analog einem Referenzdatenelement ein positives Potential zugeordnet, können alle mit dem Referenzdatenelement verknüpften Quelldatenelemente und alle weiteren mit diesen Quelldatenelementen verknüpften Quelldatenelemente zur Ausgabe herangezogen werden. Wird einem Quelldatenelement ein negatives Potential zugeordnet, können alle mit dem Quelldatenelement direkt verknüpften weiteren Quelldatenelemente nicht zur Ausgabe herangezogen werden. Alle darüber hinausgehenden, mit den weiteren Quelldatenelementen verknüpfte Quelldatenelemente können jedoch zur Ausgabe herangezogen werden. In anderen Worten können durch negative Potentiale einzelne Quelldatenelemente bei der Suche ausgeschlossen werden. Wird beispielsweise bei der Suche bzw. dem Ermitteln der Verknüpfungen die Menge der Quelldatenelemente entlang eines Weges über die Verknüpfungen zwischen den Quelldatenelementen durchgeführt, ist dieser Weg an einem Quelldatenelement mit negativem Potential blockiert. Direkte Verknüpfungen dieser ausgeschlossenen Quelldatenelemente mit weiteren Quelldatenelementen, welche kein negatives Potential aufweisen, können ausgeschlossen werden, d.h. diese Quelldatenelemente (ohne negative Potential) sind über die Quelldatenelemente mit negativem Potential nicht zu erreichen. Eine Verknüpfung der Quelldatenelemente ohne negativem Potential mit weiteren Quelldatenelemente, beispielsweise ebenfalls ohne negativem Potential, ist jedoch weiterhin möglich. Folglich können diese Quelldatenelemente ohne negativem Potential gegebenenfalls auf anderem Weg erreicht werden. In anderen Worten können die negativen Potentiale einzelner Quelldatenelemente auch andere Quelldatenelemente, denen kein negatives Potential zugeordnet ist, beeinflussen. Ist beispielsweise ein erstes Quelldatenelementen mit einem zweiten Quelldatenelement, welches negatives Potential aufweist, verknüpft, kann dieses negative Potential des zweiten Quelldatenelements automatisch auch in alle weiteren Verknüpfungen des ersten Quelldatenelements einfließen. Beispielsweise können die Gewichte aller weiteren direkten und/oder indirekten Verknüpfungen des ersten Quelldatenelements verringert werden oder vom Betrag gleich bleiben, jedoch wird das Vorzeichen des Gewichts geändert, d.h. negativ gemacht. Insbesondere kann eine Verknüpfung eines Quelldatenelements erschwert werden bzw. das Gewicht einer gewichteten Verknüpfung klein sein, da dieses Quelldatenelement über direkte und/oder indirekte assoziative Verknüpfungen mit großem Gewicht mit Quelldatenelement(en) mit negativem Potential verknüpft ist.

Belegen ausgewählter Quelldatenelemente mit negativem Potential kann sich daher darin äußern, daß alle direkten Verknüpfungen von Quelldatenelementen mit negativem Potential beim Ermitteln der Verknüpfungen ausgeschlossen werden. Eine direkte Verknüpfungen eines Quelldatenelements Qj mit negativem Potential kann eine Verknüpfungen mit dem Gewicht w,_j- zwischen dem Quelldatenelement Qi mit negativem Potential und einem weiteren Quelldatenelement Qj sein.

Die Ausgabe ist weiterhin vorteilhafterweise keine statische Liste von Anfrageergebnissen, sondern eine visuelle Repräsentation von möglichen Assoziationen, d.h. Verbindungen die durch die Analysewerkzeuge im Lauf der Zeit aufgebaut wurden.

Besonders bevorzugt wird bei dem Ermittelten der gewichteten Verknüpfung(en) des Nachfragedatenelements mit zumindest einem Quelldatenelement in einem Iterationsschritt

für jedes Nachfragedatenelement ein erstes Quelldatenelement ermittelt, für jedes erste Quelldatenelement eine gewichtete Verknüpfung mit einem weiteren Quelldatenelement ermittelt, jedes erste Quelldatenelement als Nachfragedatenelement definiert und jedes weitere Quelldatenelement als erstes Quelldatenelement definiert.

In anderen Worten wird für jedes Nachfragedatenelement ein erstes Quelldatenelement, wie oben beschrieben, ermittelt, d.h. für jedes Nachfragedatenelement ein Referenzdatenelement der Referenzdatenquelle ermittelt und die Verknüpfung des Referenzdatenelements mit dem ersten Quelldatenelement dem Nachfragedatenelement zugeordnet. Weiter kann das erste Quelldatenelement mit einem oder mehreren weiteren Quelldatenelementen verknüpft sein. Das weitere (direkt mit dem ersten Quelldatenelement verknüpfte) Quelldatenelement wird anschließend als erstes Quelldatenelement definiert, d.h. eine Verknüpfung zwischen dem Referenzdatenelement und dem weiteren Quelldatenelement hergestellt, wobei die Verknüpfung des Referenzdatenelements und des weiteren Quelldatenelements die Verknüpfung des Referenzdatenelements mit dem ersten Quelldatenelement ersetzt. Der Wert der gewichteten Verknüpfung des Referenzdatenelements mit dem weiteren Quelldatenelement kann beispielsweise dem Wert der Verknüpfung des ersten Quelldatenelements mit dem weiteren Quelldatenelement entsprechen. Der Wert der gewichteten Verknüpfung des Referenzdatenelements mit dem weiteren Quelldatenelement kann auch aufgrund der Verknüpfung des Referenzdatenelements mit dem ersten Quelldatenelement und der Verknüpfung des ersten Quelldatenelements mit dem weiteren Quelldatenelement bestimmt bzw. ermittelt, insbesondere berechnet werden. Bei der Ausgabe des zu dem Nachfragedatenelement gehörigen Quelldatenelements kann folglich nunmehr das als erstes Quelldatenelement definierte weitere Quelldatenelement verwendet werden.

Besonders bevorzugt wird der Iterationsschritt wiederholt.

Vorzugsweise wird das oder die erste(n) Quelldatenelement(e) nach dem letzten Iterationsschritt ausgegeben. Bevorzugt wird jedes erste Quelldatenelement entsprechend des Gewichts seiner gewichteten Verknüpfung ausgegeben wird. Besonders bevorzugt wird hierbei das/die Nachfragedatenelement(e) bereits vor dem Iterationsschritt ausgegeben.

Weiterhin vorzugsweise wird für jedes weitere Quelldatenelement, welches Verknüpfungen mit mehreren ersten Quelldatenelementen aufweist, jeweils eine Verknüpfung mit jedem Element aus der Menge der Permutationen der ersten Quelldatenelemente, welche mit dem weiteren Quelldatenelement verknüpft sind, generiert.

Die Referenzdatenmenge und die Quelldatenmenge kann beispielsweise in Form von Schichten aufgebaut sein. In einer ersten Schicht sind die Referenzdatenelemente der Referenzdatenmenge angeordnet. In einer nächsten Schicht sind eine Vielzahl von Quelldatenelementen der Quelldatenmenge angeordnet. Die Referenzdatenelemente sind durch assoziative Verknüpfungen mit den Quelldatenelementen verknüpft, insbesondere direkt verknüpft. In einer weiteren Schicht können weitere Quelldatenelemente angeordnet sein, wobei die Quelldatenelemente der verschiedenen Schichten miteinander durch assoziative Verknüpfung verknüpft sind. Ferner kann eine beliebige Anzahl weiterer Schichten von Quelldatenelementen folgen, wobei die Quelldatenelemente der verschiedenen Schichten miteinander durch assoziative Verknüpfung verknüpft sind. Quelldatenelemente in weiteren Schichten weisen keine direkte Verknüpfung mit Referenzdatenelementen auf. Wird ein Nachfragedatenelement eingegeben, wird für dieses Nachfragedatenelement ein Referenzdatenelement bestimmt bzw. ermittelt. Das Referenzdatenelement befindet sich in der Schicht der Menge der Referenzdatenelemente. Das Referenzdatenelement ist mit zumindest einem Quelldatenelement der an die Schicht der Referenzdatenelemente angrenzende Schicht der Quelldatenelemente direkt verbunden. Dieses Quelldatenelement wird als erstes Quelldatenelement bezeichnet. Das erste Quelldatenelement befindet sich in der ersten Schicht der Quelldatenelemente. Das erste Quelldatenelement ist mittels einer assoziativen Verknüpfung mit einem weiteren Queildatenelement der an die erste Schicht der Quelldatenelemente angrenzenden Schicht verknüpft. Ebenso können alle Quelldatenelemente dieser Schicht mit den Quelldatenelementen der darauffolgenden Schicht verknüpft sein, usw..

Wird das erfindungsgemäße Verfahren iterativ durchgeführt, können Verknüpfungen des Referenzdatenelements mit Quelldatenelementen in tieferen Schichten, d.h. weiter von der Schicht der Referenzdatenelemente entfernten Schichten Quelldatenelementen ermittelt bzw. bestimmt werden. In jedem Iterationsschritt können Verknüpfungen zu Quelldatenelementen in einer tiefer gelegenen Schicht bestimmt werden. Folglich können vorteilhafterweise ausgehend von einem Nachfragedatenelement, bzw. einem dem Nachfragedatenelement entsprechenden Referenzdatenelement eine Vielzahl von Quelldatenelementen aus verschiedenen Schichten bestimmt werden bzw. ein Quelldatenelement ausgegeben werden, welche(s) keine direkte Verknüpfung(en) mit dem Referenzdatenelement bzw. dem entsprechend zugeordneten Nachfragedatenelement aufweist.

Vorzugsweise wird jedes erste Quelldatenelement entsprechend seiner gewichteten Verknüpfung, mit dem zugehörigen Nachfragedatenelement ausgegeben.

Bevorzugt ist die Quelldatenmenge erweiterbar, besonders bevorzugt werden anhand von zusätzlichen Quelldatenelementen und/oder zusätzlichen Zusatzdatenelementen der Referenzdatenmenge zusätzliche Referenzdatenelemente hinzugefügt und gewichtete Verknüpfungen zwischen den zusätzlichen Quelldatenelementen und den entsprechenden zusätzlichen Referenzdatenelementen generiert. Insbesondere können anhand verbesserter Analysemethoden oder manuell auch neue gewichtete Verknüpfungen zwischen bestehenden Referenzdatenelementen und bestehenden Quelldatenelementen hinzugefügt werden bzw. die Werte, d.h. Gewichte bereits bestehender gewichteter Verknüpfungen verändert werden. Die Quelldatenmenge kann hierbei entweder durch beliebige Benutzer und/oder besondere Benutzer mit vordefinierten Zugriffsrechten beispielsweise einem Administrator, erweitert werden. Beispielsweise kann ein Benutzer ein zusätzliches Zusatzdatenelement in Form einer Internetseite oder einer Veröffentlichung, wie insbesondere einer wissenschaftlichen Veröffentlichung zur Verfügung stellen und beispielsweise die entsprechenden Dateien an einen Administrator weitergeben oder einen Link zu diesen Dateien bereitstellen.

Vorzugsweise werden gewichtete Verknüpfungen zwischen den zusätzlichen Quelldatenelementen mit den bereits vorhandenen Referenzdatenelementen generiert und/oder gewichtete Verknüpfungen zwischen den zusätzlichen Referenzdatenelementen und den bereits vorhandenen Quelldatenelementen generiert.

Aufgrund der Zusatzdatenelemente und/oder der zusätzlichen Quelldatenelemente können weitere Referenzdatenelemente bereitgestellt werden. Beispielsweise können die Referenzdatenelemente im wesentlichen den Quelldatenelementen entsprechen. Von den neu zugefügten, zusätzlichen Quelldatenelementen und/oder neu zugefügten, zusätzlichen Zusatzdatenelementen können zu den neuen, zusätzlichen Referenzdatenelementen und gegebenenfalls den bereits bestehenden Referenzdatenelementen assoziative Verknüpfungen erstellt werden. Die assoziativen Verknüpfungen können hierbei manuell oder automatisch generiert werden. Beispielsweise können bei dem Bereitstellen der zusätzlichen Quelldatenelemente und/oder der zusätzlichen Zusatzdatenelemente solche Verknüpfungen bereits bereitgestellt werden. Die assoziativen Verknüpfungen können aber auch anhand verschiedener mathematischer Algorithmen und/oder verschiedener Schwellwerte und/oder verschiedener Ausschlußkriterien, usw. automatisch generiert werden. Beispielsweise kann ein Benutzer des erfindungsgemäßen Verfahrens zusätzliche Informationen in Form von Computerdateien, Webpages, usw. zur Verfügung stellen. Ein Administrator kann die Dateien und/oder die Webpages mit den bereits vorhandenen Quelldatenelementen und/oder Zusatzdatenelementen verknüpfen bzw. hinzufügen und anhand eines Computerprogramms die assoziativen Verknüpfungen, welche neu hinzugefügt werden, erstellen, um die neuen, zusätzlichen Daten in die bereits bestehende Datenstruktur einzupflegen.

Vorzugsweise kann durch das Einbinden neuer Analysewerkzeuge und/oder neuer Informationsquellen auch die Komplexität des entstehenden Informationsnetzwerks beliebig und kontinuierlich ausgebaut werden. Die Möglichkeit der manuellen Nachbearbeitung von assoziativen Verknüpfungen, beispielsweise durch Korrektur oder Neueingabe solcher assoziativer Verknüpfungen, ermöglicht die sukzessive Modellierung und damit Speicherung von Experten wissen, ohne daß dabei Informationen im allgemeinen verloren gehen.

Weiterhin vorzugsweise wird das Gewicht w^ der gewichteten Verknüpfung zwischen einem Referenzdatenelement R,- und einem Quelldatenelement Q,- anhand der Häufigkeit des Vorkommens des Referenzdatenelements R,- und des Quelldatenelements Q_j jeweils in einem Zusatzdatenelement folgendermaßen berechnet:

)

wobei

f(^Rι _>Q_j) die Häufigkeit des gemeinsamen Vorkommens des Referenzdatenelements R,- und des Quelldatenelements Q,- in dem Zusatzdatenelement,

f_ρ(Ri) die Häufigkeit des Vorkommens des Referenzdatenelements R,- in der

Gesamtmenge aller Zusatzdatenelemente und Z_Q (QJ ) die Häufigkeit des Vorkommens des Quelldatenelements Q/ in der Gesamtmenge aller Zusatzdatenelemente darstellt.

Das Zusatzdatenelement kann beispielsweise ein Text sein. Das Referenzdatenelement ist ein Suchstring, welches beispielsweise in dem Text vorkommt. Das Quelldatenelement Q, ist ein Trefferstring, welches beispielsweise in dem Text vorkommt. Der Ausdruck f(R_it Qj) stellt die Häufigkeit des gemeinsamen Vorkommens des Trefferstrings und des Suchstrings in dem Text dar. Der Ausdruck fo(Ri) ist die Häufigkeit des Vorkommens des Suchstrings in der gesamten Menge aller Zusatzdatenelemente. Dies kann z.B. die Gesamtmenge aller zu durchsuchenden Texte sein. Analog repräsentiert fo(Qj) die Häufigkeit des Vorkommens des Trefferstrings in der Gesamtmenge aller zu durchsuchenden Texte.

Vorzugsweise wird das Gewicht w,_j- der gewichteten Verknüpfung zwischen einem Referenzdatenelement R,- und einem Quelldatenelement Q, folgendermaßen berechnet:

\{x -. R₁ (X) ≥ Θ A QJ {X) ≥ Θ\

VV.. = ^•

|{x : A₁(Jc) ≥ 0j + |{* : ß_y (Jc) ≥ öj

wobei

|{χ : /?,.(*) > 0 Λ 0,.(Jc) ≥ ö| die Häufigkeit eines gleichzeitigen Auftretens des Referenzdatenelements Ri, beispielsweise eines Gens A, und des Quelldatenelements Q,, beispielsweise eines Gens B, in einem Experiment Jc beschreibt, wobei die Häufigkeit des Referenzdatenelements R, und des Quelldatenelements Qy je größer als ein Schwellwert θ ist,

|{Jc : 7?.(Jc) > <9}| die Häufigkeit eines alleinigen Auftretens des Referenzdatenelements /?,-, beispielsweise eines Gens A, in dem Experiment x beschreibt, wobei die Häufigkeit des Referenzdatenelements /?, größer als der Schwellwert θ ist, und

|{jc : O,_y(.x) > 0| die Häufigkeit eines alleinigen Auftretens des

Quelldatenelements Q/, beispielsweise eines Gens B, in dem Experiment x beschreibt, wobei die Häufigkeit des Quelldatenelements Qy größer als der Schwellwert θ ist.

Die Häufigkeit kann beispielsweise der Quotient aus gemessener Anzahl von Experimenten sein, in welchen dieses Gen mit einem Meßwert größer als ein Schwellwert nachgewiesen wurde, über die Gesamtanzahl der Experimente sein. Insbesondere gilt das Gen in Einzelexperimenten als nachgewiesen, wenn ein vorbestimmter bzw. vorbestimmbarer Schwellwert Θ überschritten wird.

Gemäß einem weiteren Aspekt der vorliegenden Erfindung umfaßt ein Verfahren zum Bearbeiten von Quelldatenelementen in einer Quelldatenmenge die Schritte:

Eingeben mehrerer Nachfragedatenelemente, insbesondere mehrerer voneinander getrennter Suchstrings,

Ermitteln einer gemeinsamen gewichteten Verknüpfung sämtlicher Nachfragedatenelemente mit zumindest einem Quelldatenelement der Quelldatenmenge insbesondere mit zumindest einem Trefferstring der Quelldatenmenge und - Ausgeben des zumindest einem Quelldatenelements entsprechend eines Gewichts der gemeinsamen gewichteten Verknüpfung mit den Nachfragedatenelementen, bevorzugt einer Trefferwahrscheinlichkeit der Nachfragedatenelemente mit dem zumindest einen Quelldatenelement, wobei

das Gewicht der Verknüpfung aufgrund einer assoziativen Verknüpfung ermittelt wird. Gemäß einem weiteren Aspekt der vorliegenden Erfindung umfaßt ein System zum Bearbeiten von Quelldatenbankelementen einer Quelldatenbank:

- eine Eingabeeinrichtung, welche zum Eingeben zumindest eines Nachfragedatenelements, insbesondere eines Suchstrings ausgelegt ist, eine Mikroprozessoreinrichtung, welche zum Ermitteln einer gewichteten Verknüpfung des Nachfragedatenelements mit zumindest einem Quelldatenbankelement, insbesondere mit zumindest einem Trefferstring der Quelldatenbank ausgelegt ist und eine Ausgabeeinrichtung, welche zum Ausgeben des zumindest einen Quelldatenbankelements entsprechend eines Gewichts der gewichteten Verknüpfung, bevorzugt einer Trefferwahrscheinlichkeit des Nachfragedatenelements mit dem zumindest einem Quelldatenbankelement ausgelegt ist, wobei

die Mikroprozessoreinrichtung weiterhin ausgelegt ist, das Gewicht der Verknüpfung aufgrund zumindest einer assoziativen Verknüpfung zu ermitteln.

Vorzugsweise weist das System weiterhin eine Referenzdatenbank mit Referenzdatenbankelementen auf und

die Mikroprozessoreinrichtung ist ausgelegt, für jedes Referenzdatenbankelement eine gewichtete Verknüpfung mit zumindest einem Quelldatenbankelement der Quelldatenbank zu generieren.

Weiterhin vorzugsweise ist die Mikroprozessoreinrichtung ausgelegt:

während des Schritts des Ermitteln der Verknüpfung(en) des Nachfragedatenelements mit dem zumindest einen Quelldatenbankelement zumindest ein Referenzdatenbankelement zu ermitteln, welches dem Nachfragedatenelement entspricht und die Verknüpfung(en) des zumindest einen Referenzdatenbankelements mit dem zumindest einen Quelldatenbankelement dem Nachfragedatenelement zuzuordnen.

Besonders bevorzugt umfaßt das System weiterhin einen Zusatzdatenbank, und jedem Quelldatenbankelement ist ein Zusatzdatenbankelement zugeordnet.

Weiterhin vorzugsweise ist die Ausgabeeinrichtung ausgelegt, bei der Ausgabe eines jeden Quelldatenbankelements das Zusatzdatenbankelement bereitzustellen.

Bevorzugt sind die Quelldatenbank anhand zusätzlicher Quelldatenbankelemente und/oder die Zusatzdatenbank anhand zusätzlicher Zusatzdatenbankelemente erweiterbar.

Besonders bevorzugt ist die Mikroprozessoreinrichtung ausgelegt, anhand der zusätzlichen Quelldatenbankelemente und/oder der zusätzlichen Zusatzdatenbankelemente zusätzliche Referenzdatenbankelemente zu generieren und gewichtete Verknüpfungen zwischen den zusätzlichen Quelldatenbankelementen und den entsprechenden Referenzdatenbankelementen zu generieren.

Vorzugsweise ist die Eingabeeinrichtung und/oder die Ausgabeeinrichtung ausgelegt, daß ein oder mehrere Quelldatenelement(e) und/oder assoziative Verknüpfung(en) visuell dargestellt werden.

Weiterhin vorzugsweise ist die Eingabeeinrichtung ausgelegt, zumindest ein Quelldatenelement vorzubestimmen und dem zumindest einen Quelldatenelement ein positives oder ein negatives Potential zuzuordnen.

Bevorzugt ist die Eingabeeinrichtung ausgelegt, daß das Vorbestimmen des zumindest einen Quelldatenelements (62) und das Zuordnen des positiven oder negativen Potentials von einem Benutzer manuell durchführbar ist.

Besonders bevorzugt ist die Eingabeeinrichtung ausgelegt, daß das Vorbestimmen des zumindest einen Quelldatenelements (62) und das Zuordnen des positiven oder negativen Potentials durch den Benutzer vor Eingabe des zumindest einen Nachfragedatenelements durchführbar ist.

In anderen Worten stellt die Eingabeeinrichtung in Verbindung mit der Ausgabeeinrichtung eine interaktive Benutzerschnittstelle dar, mittels der der Benutzer die Quelldatenelemente und/oder die assoziativen Verknüpfungen modifizieren kann und die Ausgabe explorieren kann.

Insbesondere gelten die obigen Ausführungen zu dem Verfahren in analoger Weise auch für das erfindungsgemäße System.

Gemäß einem weiteren Aspekt der vorliegenden Erfindung veranlaßt ein Computerprogrammprodukt, welches, wenn es in den Speicher einer Datenverwaltungseinrichtung, wie z.B. eines Computers, geladen ist, die Datenverarbeitungseinrichtung, das erfindungsgemäße Verfahren auszuführen.

Die vorliegende Erfindung wird anhand nachfolgender Zeichnungen beispielhaft beschrieben. Identische Bezugszeichen in verschiedenen Figuren bezeichnen gleiche Bestandteile. Die Erfindung ist nicht auf die beispielhaft beschriebenen Ausführungsformen beschränkt. Vielmehr sind Kombinationen einzelner Merkmale nachfolgend beschriebener Ausführungsformen bzw. -Varianten untereinander möglich. Die Erfindung ist nicht auf die beispielhaft beschriebenen Ausführungsformen beschränkt.

Es zeigt

Figur 1 : ein Flußdiagramm einer Ausführungsvariante eines bevorzugten Verfahrens der Erfindung; Figur 2: eine schematische Ansicht einer Ausführungsform eines bevorzugten

Systems der Erfindung;

Figur 3: eine weitere schematische Ansicht gemäß Figur 2; Figur 4: eine weitere schematische Ansicht gemäß Figur 3; Figur 5: eine weitere schematische Ansicht einer weiteren bevorzugten

Ausführungsform der Erfindung; Figur 6: eine schematische Ansicht gemäß Figur 5; Figur 7: eine schematische Ansicht gemäß Figur 5; Figur 8: eine schematische Ansicht gemäß Figur 5 und Figur 9: eine schematische Ansicht gemäß einer weiteren bevorzugten

Ausführungsform der vorliegenden Erfindung; Figur 10: eine schematische Ansicht eines Computersystems.

Zur nachfolgenden Beschreibung der Figuren werden eine Vielzahl von Fachbegriffen verwendet, welche kurz erläutert werden.

Ein Objekt (englisch: entity) kann ein Knoten in einem Netzwerk sein.

Eine Verknüpfung (englisch: link) kann eine Verbindung, insbesondere eine assoziative Verbindung, zwischen zwei Objekten sein. In der Beschreibung der vorliegenden Erfindung werden die Begriffe "Link", "Verknüpfung" und "Verbindung" synonym verwendet.

Gewicht (englisch: weight) kann die Stärke einer Verknüpfung bzw. einer Assoziation sein, welche einer Verknüpfung zugeordnet ist. Eine Assoziation entspricht einer assoziativen Verknüpfung, wie oben beschrieben.

Ein Zeiger (englisch: reference) kann einer Verknüpfung zugeordnet sein. Jede Verknüpfung kann einen oder auch mehrere Zeiger aufweisen, die auf eine Originalquelle zeigen, welche zum Einführen der Verknüpfung diente. Eine Zusammenfassung dieser Quelle kann als Zusatz zu dem Zeiger bzw. den Zeigern hinzugefügt sein, beispielsweise wenn die ursprüngliche Quelle nicht mehr zur Verfügung steht bzw. entfernt wurde. Beispielsweise kann ein Zeiger eine URL bzw. eine Adresse im World Wide Web darstellen.

Eine Erläuterung (englisch: annotation) kann zusätzlich zu jeder Verknüpfung angeführt sein, um weitere Informationen, insbesondere eine Beschreibung der Verknüpfungen und/oder der Objekte, eine Begründung bzw. einen Ursprung der Verknüpfung, usw., zur Verfügung zu stellen. Erläuterungen werden regelmäßig manuell von einem Benutzer eingeführt bzw. editiert.

Eine Aktivität (englisch: activity) kann ein Objekt beschreiben. Insbesondere kann jedes Objekt als Knoten eines Netzwerks ein bestimmtes Aktivitätsniveau aufweisen. Beispielsweise kann die Aktivität in Form eines negativen oder positiven Potentials dargestellt sein. Die Aktivitäten können beispielsweise interaktiv von einem Benutzer bestimmt bzw. verändert werden.

Eine Beschreibung (englisch: label) definiert den Kontext einer Verknüpfung. Eine Beschreibung kann auch eine Beziehung zu einer Instanz oder eine Ontologie sein.

Eine Analyseeinrichtung (englisch: analysis engine) kreiert Verknüpfungen mit entsprechenden Gewichten und Zeigern aufgrund einer oder mehrerer Informationsquellen. Im wesentlichen ist eine Analyseeinrichtung ein Agent zum Extrahieren von Informationen, anhand welcher Verknüpfungen erstellt werden.

Figur 1 zeigt ein Flußdiagramm einer bevorzugten Ausführungsvariante des erfindungsgemäßen Verfahrens. In einem ersten Schritt S1 wird ein

Nachfragedatenelement Nj beispielsweise das Suchstring "Gen A" eingegeben. Die

Eingabe kann beispielsweise mittels einer Tastatur in eine

Datenverarbeitungsanlage, beispielsweise einen Computer, erfolgen. Hierbei kann der Zugriff zu einer nachgelagerten Datenstruktur direkt erfolgen. Die Eingabe kann aber auch über ein Terminal erfolgen. Hierbei kann das Terminal über ein Netzwerk mit der nachgelagerten Datenstruktur verbunden sein. Alternativ kann die Eingabe aber auch per E-Mail, SMS oder auf anderem Wege an die nachgelagerte Daten struktur übergeben werden.

In dem Schritt S2 wird dem Nachfragedatenelement Ni ein Referenzdatenelement Rj einer Referenzdatenmenge zugeordnet. In anderen Worten umfaßt die Referenzdatenmenge eine Vielzahl von Einträgen und in dem hier gewählten Beispiel wird ein Eintrag gesucht, welcher dem Suchstring "Gen A" identisch oder zumindest ähnlich ist. Wird ein solcher Eintrag in der Referenzdatenmenge gefunden, so wird das entsprechende Referenzdatenelement Rj dem Nachfragedatenelement Nj zugeordnet.

Das Referenzdatenelement Rj, welches beispielsweise dem Suchstring "Gen A" entspricht, weist beispielhaft zumindest eine Verknüpfung mit einem Quelldatenelement Q_j auf. Beispielsweise kann das die Referenzdatenelement R₁ die assoziative Verknüpfung mit dem Gewicht Wy mit dem Quelldatenelement Q_j aufweisen. Das Quelldatenelement Qj kann beispielsweise das Trefferstring "Gen B" sein. Als Ausgabe, beispielsweise an einem Monitor des Eingabecomputers, bzw. des Terminals, bzw. als E-Mail oder SMS dient der Trefferstring "Gen B". Weiterhin kann eine Zusatzinformation zu dem Trefferstring bereitgestellt werden.

In dem Schritt S5 wird beispielsweise ein Zusatzdatenelement in Form einer URL mit der Adresse "www.Gen-B.com" zeitgleich oder auf Anfrage des Benutzer mit dem Trefferstring ausgegeben. Weiter kann eine beliebige andere Information ausgegeben werden, insbesondere eine wissenschaftliche Publikation, ein Ausschnitt eines Buches, eine ISBN-Nummer, PDF-Dokument, usw..

Figur 2 zeigt eine schematische Ansicht eines Systems 10 gemäß einer bevorzugten Ausführungsform der Erfindung. Das System 10 umfaßt eine Eingabeeinrichtung 12 und eine Ausgabeeinrichtung 14. Die Eingabeeinrichtung 12 und die Ausgabeeinrichtung 14 sind mit einer Datenverwaltungseinrichtung 16 verbunden. Die Datenverwaltungseinrichtung 16 kann eine lokale Einrichtung, wie beispielsweise ein Computer sein. Die Datenverwaltungseinrichtung 16 kann aber auch Bestandteil eines größeren Netzwerks sein. Insbesondere muß die Datenverwaltungseinrichtung 16 keine physikalische Verbindung mit der Eingabeeinrichtung 12 und der Ausgabeeinrichtung 14 aufweisen. Vielmehr kann die Datenverwaltungseinrichtung 16 eine dezentrale Netzwerkstruktur aufweisen. Bestandteil der Datenverwaltungseinrichtung 16 kann auch eine Datenbank, insbesondere ein Datenbankcluster sein.

Die Eingabeeinrichtung 12 und die Ausgabeeinrichtung 14 können Bestandteil eines Computers (nicht gezeigt), eines Terminals (nicht gezeigt), eines Mobiltelefons (nicht gezeigt), eines PDA (nicht gezeigt), usw. sein. Die Eingabeeinrichtung 12 und die Ausgabeeinrichtung 14 können aus einer einzigen Einheit bestehen. Beispielsweise kann ein Touchscreen als Eingabeeinrichtung 12 und Ausgabeeinrichtung 14 dienen. Das System 10 kann auch eine Vielzahl von Eingabeeinrichtungen 12 und Ausgabeeinrichtungen 14 umfassen.

Mittels der Eingabeeinrichtung 12 wird ein Suchstring an die Datenverwaltungseinrichtung 16 übergeben. Gemäß Figur 2 ist der Suchstring der Begriff "Gen A". Folglich wird mittels der Eingabeeinrichtung 12 der Begriff "Gen A" an die Datenverwaltungseinrichtung 16 übergeben, beispielsweise per SMS oder E- Mail verschickt bzw. mittels eines anderen Protokolls übertragen oder auch direkt über eine Tastatur eingegeben.

Die Datenverwaltungseinrichtung 16 umfaßt in dem in Figur 2 gezeigten Beispiel eine Referenzdatenbank 18 und eine Quelldatenbank 20. Es ist hierbei jedoch nicht notwendig, daß die Referenzdatenbank 18 und/oder die Quelldatenbank 20 jeweils aus einer physikalischen Einheit besteht. Vielmehr kann sowohl die Referenzdatenbank 18 als auch die Quelldatenbank 20 eine Vielzahl von Datenbanken umfassen bzw. eine dezentrale Datenbankstruktur sein. Die einzelnen Bestandteile der Referenzdatenbank 18 bzw. der Quelldatenbank 20 können über ein oder mehrere Netzwerke miteinander verbunden sein.

Die Referenzdatenbank 18 umfaßt beispielhaft 5 Referenzdatenbankelemente 22, 24, 26, 28, 30. Die Quelldatenbank 20 umfaßt beispielhaft 5 Quelldatenbankelemente 32, 34, 36, 38, 40. Die Referenzdatenbankelemente 22, 24, 26, 28, 30 umfassen 5 Zeichenstrings, nämlich "Gen A", "Gen B", "Protein A", "Krebs" und "Brustkrebs". Diese fünf Referenzdatenbankelementen 22 sind lediglich beispielhafte Referenzdatenbankelemente. Jede Referenzdatenbank 18 kann im wesentlichen eine beliebige Anzahl von Referenzdatenbankelementen aufweisen, welche einen im wesentlichen beliebigen Inhalt, beispielsweise eine chemische Formel, ein Zeichenstring, einen mathematischen Ausdruck, usw., umfassen können.

Ferner umfaßt die Quelldatenbank 20 fünf Quelldatenbankelemente 32, 34, 36, 38 und 40. Die Quelldatenbankelemente 32, 34, 36, 38 und 40 sind beispielhaft als Zeichenstrings angeführt.

In Figur 2 ist weiter eine Verknüpfung 42 zwischen dem Referenzdatenbankelement 22 mit dem Inhalt "Gen A" und dem Quelldatenbankelement 34 mit dem Inhalt "Gen B" eingezeichnet. Die Verknüpfung 42 weist das Gewicht w-ι₂ auf. Das Gewicht W₁₂ kann beispielsweise einen numerischen Wert, etwa 0,9 haben. Die Verknüpfung 42 ist eine assoziative Verknüpfung 42.

Ferner können noch weitere assoziative Verknüpfungen zwischen den Referenzdatenbankelementen 22, 24, 26, 28, 30 und den Quelldatenbankelementen 32, 34, 36, 38, 40 vorliegen. Der besseren Deutlichkeit wegen wurden jedoch keine weiteren Verknüpfungen eingezeichnet.

Wird über die Eingabeeinrichtung 12 das Suchstring "Gen A" an die Datenverwaltungseinrichtung 16 übergeben, wird ein Referenzdatenbankelement bestimmt, welches dem Suchstring "Gen A" entspricht. In diesem Fall wird das Referenzdatenbankelement 22 bestimmt. Das Referenzdatenbankelement 22 ist mit dem Quelldatenbankelement 34 über die Verknüpfung 42 verknüpft. Vorzugsweise wird die Verknüpfung 42 dem eingegeben Suchstring zugeordnet. Über die Ausgabeeinrichtung 14 wird daher das Quelldatenelement 34 ausgegeben. In anderen Worten erscheint auf der Ausgabeeinrichtung 14 das Trefferstring "Gen B". Ferner kann aus der Ausgabe 14 die Trefferwahrscheinlichkeit in Form des Wertes des Gewichts W₁₂ ausgegeben werden.

Figur 3 zeigt eine schematische Ansicht gemäß Figur 2, wobei ferner eine weitere Verknüpfung 44 des Referenzdatenbankelements 22 mit einem weiteren Quelldatenbankelement, dem Quelldatenbankelement 38, angegeben ist. Wird folglich der Datenverwaltungseinrichtung 16 mittels der Eingabeeinrichtung 12 das Suchstring "Gen A" übergeben, werden sowohl das Quelldatenbankelement 34 als auch das Quelldatenbankelement 38 ausgegeben. In anderen Worten wird sowohl das Trefferstring "Gen B" als auch das Trefferstring "Krebs" ausgegeben, wobei die Ausgabe hierarchisch geordnet erfolgt und das Trefferstring mit dem höheren Wert der Verknüpfung 42, 43 als erstes ausgegeben wird. Beträgt der Wert beispielsweise des Gewichts w-ι₂ der Verknüpfung 42 W1₂ = 0,9 und der Wert des Gewichts w-ι₃ der Verknüpfung 43 W₁₃ = 0,7, erfolgt die Ausgabe des Trefferstrings "Gen B" vor der Ausgabe des Trefferstrings "Krebs". Gegebenenfalls kann auch der Wert der entsprechenden Gewichte angegeben sein. Ferner können noch weitere Informationen, beispielsweise Zusatzinformationen, welche mit den entsprechenden Quelldatenbankelementen 34, 38 verknüpft sind, ausgegeben werden.

Figur 4 zeigt eine weitere schematische Ansicht eines bevorzugten Systems 10. Neben den Quelldatenbankelementen 32, 34, 36, 38, 40 sind ferner die Quelldatenbankelemente 46, 48, 50, 52, 54 angegeben. Ferner sind Verknüpfungen zwischen den Quelldatenbankelementen 32, 34, 36, 38, 40 und den Quelldatenbankelementen 46, 48, 50, 52, 54 möglich. Der besseren Deutlichkeit wegen wurde lediglich eine Verknüpfung 56 zwischen dem Quelldatenbankelement 34 und dem Quelldatenbankelement 50 sowie einer Verknüpfung 58 zwischen Quelldatenbankelement 40 und dem Quelldatenbankelement 50 eingezeichnet. Die Verknüpfung 56 hat das Gewicht w₂₅, die Verknüpfung 58 das Gewicht W₄₅. Ferner ist eine Verknüpfung 60 zwischen dem Referenzdatenbankelement 28 und dem Quelldatenbankelement 40 eingezeichnet. Die Verknüpfungen 42, 56, 58, 60 können manuell oder automatisch generiert werden. Beispielsweise kann die Verknüpfung 42 aufgrund einer wissenschaftlichen Veröffentlichung erstellt werden, in welcher sowohl das String "Gen A" als auch das String "Gen B" häufig verwendet werden. Die Verknüpfung 60 zwischen dem Referenzdatenbankelement 28 und dem Quelldatenbankelement 40 ergibt sich beispielsweise daraus, daß Brustkrebs eine Form von Krebs ist. Folglich kann das Gewicht w^ der Verknüpfung 42 beispielsweise anhand der Häufigkeit der Verwendung des Strings "Gen A" und des Strings "Gen B" in einen oder mehreren Texten erstellt werden. Das Gewicht W₃₄ der Verknüpfung 60 kann beispielsweise einen festen Wert, beispielsweise 1 ,0 aufweisen, wobei dieser Wert beispielsweise durch einen Administrator oder einen Fachmann auf dem Gebiet zugewiesen wird.

Die Quelldatenmenge kann in einer Datenbank oder verschiedenen Datenbanken gespeichert sein. Ferner stellt die Schichtform lediglich eine bevorzugte Ausführungsform dar. Beispielsweise können die Quelldatenelemente alle in einer Schicht angeordnet sein und Quelldatenelemente können mehrere Verknüpfungen aufweisen, wie dies beispielsweise für das Quelldatenelement 22 und die Verknüpfungen 42, 44 in Figur 3 dargestellt ist, und die Verknüpfungen können sukzessive verfolgt werden.

In anderen Worten besteht die Datenverwaltungseinrichtung 16 aus Knoten 22 - 40, 46 - 54 und gekennzeichneten Kanten. Jeder Knoten repräsentiert ein Objekt, welches ein Konzept des Anwendungsgebiets sein kann, z.B. eine Krankheit oder ein metabolischer Pfad bzw. ein Stoffwechselweg, oder ein benanntes Objekt, wie z.B. ein Gen, ein Protein oder ein spezifisches Ziel. Kanten repräsentieren

Verknüpfungen zwischen diesen Objekten und sind mit einem Zeiger auf die lnformationsquelle(n) oder Information über die Analyseeinrichtung, z.B. einen

Computer, gekennzeichnet, welche die Verknüpfungen aufgrund dieser Quellen erzeugte. Zusätzlich umfaßt jede Kante ein Gewicht, welches die Stärke der

Assoziation modelliert und eine Kennzeichnung, welche den Typ der Kante angibt.

Auf diese Art kann eine Verknüpfung bzw. ein Link möglicherweise auch von einer Ontologie, welche semantische Verbindungen zwischen den Knoten repräsentiert, abgeleitet werden. Wird mittels der Eingabeeinrichtung 12 sowohl das Suchstring "Gen A" als auch das Suchstring "Krebs" an die Datenverwaltungseinrichtung 16 übergeben, könnte anhand der Ausgabeeinrichtung 14 sowohl das Trefferstring "Gen B" als auch das Trefferstring "Brustkrebs" ausgegeben werden. Gemäß diesem Beispiel ist jedoch nicht möglich, dem Trefferstring "Gen B" ein Gewicht anhand beider Suchstrings zuzuordnen. Ebenso ist es nicht möglich, dem Trefferstring "Brustkrebs" ein Gewicht anhand beider Suchstrings zuzuordnen. Folglich stellen diese beiden Trefferstrings keine idealen Ergebnisse dar. Aufgrund der Verknüpfungen 56, 58 kann jedoch auch das Trefferstring "Protein A" ausgegeben werden. Hierbei kann die Trefferwahrscheinlichkeit anhand der Gewichte der Verknüpfungen 42, 56, 58, 60 bestimmt werden. Folglich kann anhand der Werte eines oder mehrerer der Gewichte W₁₂, W₃₄, W₂₅ und W₄₅ eine Trefferwahrscheinlichkeit bestimmt werden.

Vorteilhafterweise können hierdurch neue Ideen kreiert werden. Insbesondere werden nicht lediglich Fragen beantwortet, sondern aufgrund der weiteren Verknüpfung von Quelldatenbankelementen 33-40, 46-54 neue Zusammenhänge erkannt bzw. kreiert und ausgegeben, wobei implizit Zugang zu allen möglichen Daten, welche in die Datenverwaltungseinrichtung 16 eingeprägt wurden, ermöglicht ist. Vorteilhafterweise werden können interessante und insbesondere nicht offensichtliche Verbindungen zwischen Informationsquellen erstellt und erforscht werden. Durch eine weitere Verknüpfung der Quelldatenbankelemente 32 - 40, 46 - 54 mit externen Quellen, beispielsweise Webpages, Dateien, usw. können weitere Informationen zur Verfügung gestellt werden bzw. der Ursprung der Verknüpfungen selbsterklärend sein. Insbesondere wird auch Expertenerfahrung bzw. Expertenwissen eingebunden, da Verknüpfungen 42, 56, 58, 60 sowohl automatisch als auch manuell von Fachpersonen kreiert werden können. Insbesondere können den Gewichten W₁₂, w₂s, W₂₄, W₄₅ automatisch oder von Fachpersonen Werte zugeordnet werden. Die Verknüpfungen aller möglichen Kombinationen der einzelnen Quelldatenbankelemente 32-40, 46-54 können ausgehend von den Referenzdatenbankelementen 22-30 erstellt werden, wodurch beispielsweise firmenweit das Expertenwissen für alle zugangsberechtigten Personen zur Verfügung gestellt werden kann. Es können auch, insbesondere über das Internet, weitere Informationsquellen eingebunden bzw. mit der Datenverwaltungseinrichtung 16 verknüpft sein bzw. die interne Datenstruktur mit einer übergeordneten Datenverwaltungseinrichtung 16 verbunden sein.

Ferner können nicht nur Informationen auf einer Webseite gefunden werden, sondern insbesondere aufgrund der Verknüpfung der Quelldatenbank Elemente 32- 40, 46-55 untereinander auch Informationen von verschiedenen Domänen gefunden, verarbeitet und eingebunden werden. Durch die Möglichkeit, daß die Datenverwaltungseinrichtung 16 beliebig vergrößert und verwaltet werden kann, wird ein kontinuierliches, dynamisches Lernen ermöglicht, wobei kein Reset möglich ist bzw. Mechanismen nicht vergessen werden können. In anderen Worten stellt das System 10 eine Erweiterung des Wissens bzw. der Wissensbasis des Benutzers dar.

Um die Datenverwaltungseinrichtung 16 zu generieren, müssen zwischen den einzelnen Objekten, d.h. zwischen den Referenzdatenbankelementen 22 - 30 und/oder den Quelldatenbankelementen 32-40, 46-54 gewichtete Verknüpfungen erstellt werden. Es gibt zwei grundsätzliche Möglichkeiten, um Objekte und

Verknüpfungen einer Datenverwaltungseinrichtung 16 hinzuzufügen bzw. die

Verknüpfungen zwischen den bereits bestehenden Referenzdatenbankelementen 22-30 und/oder Quelldatenbankelementen 32-40, 46-54 bereitzustellen. Die

Verknüpfungen können automatisch oder manuell generiert werden, wobei die gewichteten Verknüpfungen ebenfalls automatisch oder manuell generiert werden können bzw. automatisch generierte Verknüpfungen beispielsweise auch manuell abgeändert werden können. Ebenso kann ein Teil der Verknüpfungen automatisch und ein anderer Teil der Verknüpfungen manuell generiert werden.

Zum automatischen Generieren von Verknüpfungen und Gewichten werden Analyseeinrichtung(en), beispielsweise ein oder mehrere Computer verwendet. Es können auch Verknüpfungen zwischen existierenden Knoten, wie beispielsweise den Quelldatenbankelementen 32 - 40, 46 - 54 hinzugefügt und/oder geändert werden. Jede Analyseeinrichtung kann eine bestimmte Aufgabe haben, z.B. wiederholtes Auftreten von Wörtern in Dokumenten, Korrelationen von Genen in Genexpressionsexperimenten , Strukturaktivitätsbeziehungen über die Analyse von "cell-assay" Bildern, d.h. einer großen Anzahl von Bildern oder Verbindungen zwischen Genen und Krankheiten anhand der Analyse von Patienteninformationen zu finden. Im Vergleich würde dies das Sammeln und Modellieren automatisch ableitbarer Domänen Wissens darstellen. Durch Zufügen neuer Analysemaschinen, beispielsweise neuer Algorithmen zum Erstellen bzw. Ändern von Verknüpfungen, kann das Netzwerk kontinuierlich gewartet, verbessert und erweitert werden.

Gewichte und Verknüpfungen können auch durch manuelles Eingreifen eines Benutzers hinzugefügt und/oder verändert werden. Ein Benutzer kann beispielsweise Verknüpfungen als falsch kennzeichnen oder neue Verknüpfungen mit zusätzlichen erklärenden Informationen einfügen bzw. versehen. Dieses interaktive Verbessern erlaubt es, Expertenwissen einzufangen und ermöglicht ferner sofortiges "Feedback", welches dem Datenverwaltungssytem 16 erlaubt, Expertenwissen innerhalb einer Firma bzw. innerhalb des Systems 10 zu modellieren. Manuelle Interaktion soll auf intuitive Art und Weise gehandhabt werden. Insbesondere muß ein Benutzer nicht numerische Gewichte manuell anpassen bzw. verändern oder neue Verknüpfungen zwischen abstrakten Knoten erstellen.

Folglich kann das Datenverwaltungssystem 16 sowohl durch das Hinzufügen weiterer Zusatzdaten, insbesondere weiterer Quelldatenbankelemente erweitert werden. Es ist auch möglich, die Datenverwaltungseinrichtung 16 durch Hinzufügen neuer Verknüpfungen bereits bestehender Referenzdatenelemente 22 - 30 und/oder Quelldatenbankelemente 32-40, 46-54 zu erweitern.

Figur 5 zeigt eine schematische Ansicht einer Datenverwaltungseinrichtung 16. Figur 5 kann aber auch eine beispielhafte Ausgabe einer Eingabeeinrichtung 12 darstellen, in welcher schematisch der Inhalt der Datenverwaltungseinrichtung 16 abgebildet ist. Insbesondere zeigt Figur 5 eine Vielzahl von Quelldatenbankelementen 62, sowie Verknüpfungen 64 zwischen den Quelldatenbankelementen 62. Anhand der Pfeile der Verknüpfungen 64 ist dargestellt, in welcher Richtung die Verknüpfung erfolgen kann. Ein beidseitige Pfeil stellt dar, daß eine Verknüpfung in jede Richtung erfolgen kann. Ein einseitiger Pfeil stellt dar, daß eine Verknüpfung lediglich in einer Richtung erfolgen kann. Durchgezogenen Linien stellen starke Verknüpfungen, unterbrochene Linien stellen schwache Verknüpfungen dar. In anderen Worten sind die den Verknüpfungen zugeordneten Gewichte für starke Verknüpfungen mit einem großen numerischen Wert versehen. Die Gewichte schwacher Verknüpfungen sind mit einem kleinen numerischen Wert versehen. Ein Benutzer kann die Quelldatenbankelemente 62 mit positiven oder negativen Potential belegen. Negatives Potential bedeutet, daß diese Quelldatenbankelemente 62 bei der Suche nach Verknüpfungen unterdrückt werden. Positives Potential bedeutet, daß diese Quelldatenbankelemente 62 besonders beachtet werden sollen.

Die einseitige Verknüpfung von "Sport" nach "Baseball" hat zur Folge, daß ausgehend von dem Knoten bzw. dem Quelldatenbankelement 62 "Sport" auch der Knoten bzw. das Quelldatenbankelement 62 "Baseball" aufgefunden werden kann. Ausgehend von dem Knoten 62 "Baseball" kann jedoch der Knoten 62 "Sport" nicht aufgefunden werden.

Wie in Figur 6 dargestellt, können eine oder mehrere Quelldatenbankelemente 62 mit positivem Potential belegt werden. In diesem Beispiel werden das Quelldatenbankelement 62 mit der Bezeichnung "Michael Jordan" und der Bezeichnung "Maschinenlernen" mit positivem Potential belegt. Dies kann durch Anklicken, beispielsweise mittels einer Computermaus erfolgen.

Wie in Figur 7 dargestellt ist, können auch Quelldatenbankelemente 62 mit negativem Potential belegt werden, in diesem Fall das Quelldatenbankelement 62 mit der Bezeichnung "Sport". Aufgrund der negativen Belegung des Quelldatenbankelements 62 mit der Bezeichnung "Sport" wird die Menge der möglichen Assoziationen bzw. assoziativen Verknüpfungen 64 eingeschränkt, wie dies beispielsweise Figur 8 dargestellt ist.

In anderen Worten kann eine assoziative Verknüpfung zwischen Daten aus verschiedenen Datenquellen ermöglicht werden, wobei insbesondere Daten und/oder Datenquellen unterschiedlichen Typs assoziativ verknüpft werden können. Hierbei kann die assoziative Verknüpfung der Datenquellen beispielsweise anhand einer oder mehrerer assoziativer Verknüpfungen von Daten bzw. Datenelementen, die jeweils verschieden sein können, erzeugt werden. Die Verknüpfungen können eine Vielzahl von Informationen beinhalten. Beispielsweise kann jede assoziative Verknüpfung ausgelegt sein, zumindest eine Information über die Art der Verknüpfung und/oder die Herkunft der Verknüpfung und/oder das Gewicht bzw. den Wert des Gewichts der Verknüpfung usw. enthalten. Die Verknüpfung kann daher beispielsweise eine numerische Zahl, als Beispiel eines Gewichts, umfassen. Alternativ/zusätzlich kann die Verknüpfung auch eine Speicheradresse und/oder eine Adresse eines Rechners, eines Servers, einer Datenbank, einer Datei usw. über die Herkunft der Verknüpfung enthalten. Eine solche Adresse kann auch ein herkömmlicher Link bzw. Internetlink bzw. ein Hyperlink, beispielsweise www.wikipedia.com usw. sein. Alternativ/zusätzlich kann die Verknüpfung auch Information über die Art der Verknüpfung enthalten. Dies kann ein Zahlen- und/oder ein Buchstabencode sein bzw. eine mögliche andere, praktikable Informationsart.

Folglich ist es vorteilhafterweise möglich, ausgehend von der assoziativen Verknüpfung, Rückschlüsse über die Art und den Grund der Verknüpfung zu erhalten. Die Zusatzinformation kann auch als Annotation bezeichnet werden.

Insbesondere vorteilhafterweise ist demnach eine interaktiv verfeinerte Suche in Datenbeständen nicht notwendig. Beispielsweise ist keine Internetstruktur bzw. kein "Lokal Area Net" (LAN) insbesondere kein Netz zur (ausschließlichen) Nachrichtenübermittlung vorgesehen. Demnach unterscheidet sich eine assoziative Verknüpfung dadurch, daß nicht ausschließlich eine Suchverfeinerung über Synonyme bzw. über eine vorgegebene Synonymliste vorgesehen ist. Vielmehr sind auch weitere Informationen, beispielsweise o.g. Annotationen vorhanden bzw. werden diese berücksichtigt. Demnach ist ein von dem vorgenannten Netz verschiedenes Netz bzw. eine davon verschiedene Art von Netz vorgesehen. Ebenso ist vorteilhafterweise eine Assoziationsfindung vorgesehen, die sich von der vorgenannten Suchverfeinerung durch Synonyme insbesondere dadurch unterscheidet, daß Verknüpfungen abgebildet werden, die automatisch in Daten gefunden werden und/oder automatisch verfeinert werden.

Weiterhin vorteilhafterweise ist nicht lediglich eine (beliebig komplexe) Datenbank vorgesehen, deren Inhalte anhand assoziativer Verknüpfungen verbunden werden können. Insbesondere ist es nicht notwendig, anhand von vorgegebenen Strukturen Informationen zu finden und auch nicht notwendig, ein semantisches Netz einzubeziehen. Folglich ist es vorteilhafterweise nicht notwendig, ein vorgenanntes Netz vorzugeben und/oder anhand einer Datenbank zu generieren. Somit ist es besonders vorteilhafterweise nicht notwendig, Einträge in einer Datenbank zu klassifizieren. Demnach werden vielmehr (weitere) Verknüpfungen zwischen Informationen generiert. Somit liegt besonders vorteilhafterweise keine Beschränkung der Suche auf eine genau strukturierte Datenbank vor. Vielmehr werden Informationen aus verschiedenen Datenbanken verknüpft.

Außerdem ist vorteilhafterweise kein reines Textsuch System vorgesehen. Beispielsweise ist nicht ausschließlich bzw. vorzugsweise keine Rankingfunktion vorgesehen, die z.B. verschiedene statische Ähnlichkeitsverzeichnisse verwendet bzw. versenden kann. Ebenso ist keine ausschließliche Einschränkung auf gewichtete Rankingfunktionen mit gegebenenfalls möglichen Umweg(en) über Synonyme vorgesehen. Insbesondere betreffen assoziative Verknüpfungen nicht nur das Auffinden von passenden Texten, sondern vorzugsweise die Verknüpfung von verschiedenen Informationsquellen bzw. Datenbanken.

Schließlich entspricht die assoziative Verknüpfung nicht lediglich einer "Text Summarization" und/oder einem "Retrieval System". Insbesondere beruht die assoziative Verknüpfung nicht lediglich darauf, Texte zusammenzufassen und diese Zusammenfassung anhand von vorgegebenen bzw. vorgebbaren Schlüsselwörtern anzupassen. Inbesondere basiert das vorgenannte System nicht auf einer vorgegebenen bzw. vorgebbaren Strukturierung einer Terminologie, ähnlich einer Ontologie. Vielmehr werden vorzugsweise Zusammenhänge aus Informationsquellen und/oder insbesondere nicht nur Texte extrahiert und/oder müssen weiterhin vorteilhafterweise nicht vorgegeben werden.

Weiterhin vorteilhafterweise ist die Verwendung bzw. der Sinngehalt des Begriffs "Assoziation" bzw. "assoziative Verknüpfung" nicht auf einfachen Text und/oder eine anderweitig vorgegebene Verbindung, beispielsweise Ontologie und/oder Synonyme beschränkt.

Somit umfassen Verknüpfungen vorzugsweise zu den beispielsweise numerischen Gewichten weitere lnformation(en), die beispielhaft als Annotation(en) bezeichnet wird/werden.

In anderen Worten sind einige Verknüpfungen 64 mit weiteren Informationen bzw. Annotationen belegt, wie dies ebenfalls dargestellt ist. Somit ist eine Navigation der Assoziationen, d.h. der assoziativen Verknüpfungen, auf eine Teilmenge der aktiven Elemente eingeschränkt. Die Verknüpfungen zeigen Referenzen zu der Herkunft, d.h. den Originalquellen der Informationen an. Der Benutzer kann nun mittels der Eingabeeinrichtung 12 einen Suchstring eingeben. Die möglichen assoziativen Verknüpfungen 64, welche aufgrund der Belegung mit positiven oder negativen Potentialen durchsucht und gegebenenfalls ausgewertet werden können, sind in Figur 8 dargestellt.

Figur 9 zeigt ein weiteres Beispiel für eine Datenverwaltungseinrichtung 16, wobei pharmazeutische Verknüpfungen dargestellt sind. Beispielhaft wird auch angegeben, daß bestimmte Quelldatenbankelemente 62 mit positivem Potential (Gen A, Tier N) belegt werden, sowie Quelldatenbankelemente 62 mit negativem Potential (Tier M) belegt werden, wobei Quelldatenbankelemente, welche für die gewählte Suche des Benutzer nicht von Interesse sind bzw. nicht berücksichtigt werden sollen, mit negativem Potential belegt sind. Ferner sind in Figur 9 Notizen zu den einzelnen Verknüpfungen dargestellt, welche beispielsweise die Ursache für die Verknüpfung sowie auch die Stärke des Gewichts der jeweiligen Verknüpfung beschreiben und begründen können. Ein Benutzer kann daher durch Eingabe eines oder mehrere Suchstrings und auch durch Auswählen bestimmter Quelldatenbankelemente und das Versehen derselben mit einem positiven oder einem negativen Potential gezielt neue Ideen verfolgen bzw. generieren. Daher stellt die Eingabeeinrichtung, beispielsweise eine Computermaus, in Verbindung mit der Ausgabeeinrichtung, beispielsweise einem Computermonitor, eine interaktive Benutzerschnittstelle dar, mittels der der Benutzer die Quelldatenelemente und/oder die assoziativen Verknüpfungen modifizieren kann und die Ausgabe explorieren kann.

Wie bereits oben beschrieben, können die Verknüpfungen automatisch oder durch manuelle Verfeinerung gebildet werden. Manuelle Verfeinerung kann z.B. Hinzufügen von Notizen durch einen Benutzer und/oder Einfügen von Expertenwissen in das Netzwerk umfassen und sind daher größtenteils Gegenstand eines "Interfaces", wie z.B. der Eingabeeinrichtung 12. Das automatische Zufügen bzw. Verändern von Verknüpfungen kann auf vielfältige Art durchgeführt werden:

Es können semantische Verknüpfungen hergestellt werden. Semantische Verknüpfungen sind starke Links, gewöhnlich mit einem Wert des Gewichts etwa gleich 1 ,0, welche von bekannten Strukturen, wie z.B. Ontologien oder semantischen Netzwerken abgeleitet werden. Semantische Links werden gewöhnlich von Experten kreiert. Semantische Netzwerke, welche automatisch bzw. halbautomatisch von Daten extrahiert werden können, müssen eine Komponente addieren, welche ■ eine Zuverlässig jeder Verknüpfung berechnen können und diese in ein Gewicht umwandeln können.

Syntaktische Verknüpfungen sind Verknüpfungen, die aufgrund einer Oberflächenanalyse der Daten generiert werden. Ein Beispiel dafür könnte ein "Textparser" sein, welcher Wörter zu Wortstämmen konvertiert, Bindewörter eliminiert und daraus eine Menge von "Bi- oder Trigrammen" erzeugt.

Bigramme im Sinn der Erfindung sind Auftrittswahrscheinlichkeiten von Wortpaaren. Trigramme entsprechend von Worttripeln. Die entsprechenden Objekte in einem erfindungsgemäßen System werden durch schwache Verknüpfungen verbunden. Hypothetische Verknüpfungen können durch einen Benutzer hergestellt werden, welcher Verknüpfungen aufgrund von Hypothesen oder von Vermutungen kreiert. Die Gewichte für solche Verknüpfungen sind regelmäßig gering. Diese Verknüpfungen stellen einen

Gegensatz zu Anmerkungen von Experten dar, welche regelmäßig sehr hohe Gewichte aufweisen.

Datengestützte Links umfassen in der Regel eine große Mehrheit der Netzwerkgewichte. Datengestützte Links können automatisch aus

Datenquellen generiert werden. Ein Beispiel dafür

können Genkorrelationen sein, welche von Genexpressionsdaten abgeleitet sind. Verknüpfungen werden eingeführt, wenn ein spezifischer Schwellwert oder ein Vielfachauftreten experimenteller

Daten überschritten wird. Das Gewicht der Verknüpfung reflektiert die Korrelationsstärke, welche beispielsweise in folgender Form definiert ist:

wobei

die Häufigkeit eines gleichzeitigen

Auftretens Gens g_h und des Gens g_j, in einem Experiment 3c , wobei die Häufigkeit des Gens g,, und des Gens g_j je größer als ein Schwellwert θ ist, beschreibt,

: g, (3c) > die Häufigkeit eines alleinigen Auftretens des Gens gi in dem Experiment x , mit einer Häufigkeit des Gens Q₁ größer als der Schwellwert θ , beschreibt und

: g_j (Jc) > die Häufigkeit eines alleinigen Auftretens des Gens g_j in dem Experiment x , mit einer Häufigkeit des Gens g, größer als der

Schwellwert θ beschreibt.

In mehr als 2-dimensionalen Korrelationen werden die entsprechenden Multi-Ecken eingefügt. Zusätzlich kann jeder dieser Links einen Kommentar aufweisen, welcher zu der Informationsquelle bzw. auf den

Grund des Gewichts hinweist. In diesem Beispiel kann ein Link auf die experimentellen Daten und Metainformationen (Schwellwert Θ, Datenanalyse, Zeiger auf die exakte Berechnung von Gewichten) verweisen;

kann eine Textanalyse sein, wobei Vielfachauftreten von benannten Objekten mit einem bestimmten Abstand, entsprechend der dazwischen liegenden Wörter, in einer geringen Verknüpfung resultiert. Das Gewicht hängt von dem Abstand der Wörter bzw. der Qualität des Textes ab.

können Verknüpfungen zwischen Gen- und Proteinnamen sein. Verknüpfungen zwischen Gen- und Proteinnamen können aus wissenschaftlichen Artikeln, z.B. basierend auf Bigrammanalyse, abgeleitet werden. Hierbei werden die Auftrittswahrscheinlichkeiten von

Wortpaaren innerhalb eines Satzes oder Absatzes bestimmt und in proportionale Gewichte umgerechnet. Worte, welche häufig nahe beieinander auftreten sind damit stark miteinander verbunden. Gewichte werden hierbei von dem mittleren Abstand und der mittleren Frequenz des Vorkommens in einem Dokument abgeleitet, wobei analog zu einem "TFIDF-Wert" (Term-Frequenz / inverse Dokument Frequenz) vorgegangen wird und sich das Gewicht beispielsweise in folgender Form berechnet:

wobei

f(g_>p) die Häufigkeit des gemeinsamen Vorkommens des Gens g und des Proteins p in einer wissenschaftlichen Publikation bzw. einem Text ist,

f_D(g) die Häufigkeit des Vorkommens des Gens g in der

Gesamtmenge aller wissenschaftlichen Publikationen bzw. Texte der durchsuchten Datenmenge und

f_D(p) die Häufigkeit des Vorkommens des Proteins p in der

Gesamtmenge aller wissenschaftlichen Publikationen bzw. Texte der durchsuchten Datenmenge darstellt.

Ontologische- / Thesaurus-Verknüpfungen basieren auf einer existierenden Ontologie, wobei Verknüpfungen eingefügt werden, um Objekte zu verknüpfen, welche aufgrund einer Ontologie miteinander verbunden sind.

Dies spiegelt eine 1 zu 1 Entsprechung zwischen einer Verknüpfung in der

Ontologie und einer Verknüpfung in dem Netzwerk wider. Die entsprechenden

Verknüpfungen sind starke Verknüpfungen, d.h. das entsprechende Gewicht beträgt 1 ,0, da regelmäßig kein Zweifel über die Verläßlichkeit der Information besteht. Andererseits müßte sich dies in dem Gewicht der Verknüpfung niederschlagen.

Bezugnehmend auf Figur 10 wird ein beispielhaftes System zum Implementieren der Erfindung beschrieben. Ein beispielhaftes System umfaßt eine universelle

Rechnereinrichtung in der Form einer herkömmlichen Rechnerumgebung 120 z.B. ein "personal Computer" (PC) 120, mit einer Prozessoreinheit 122, einem Systemspeicher 124 und einem Systembus 126, welcher eine Vielzahl von Systemkomponenten, unter anderem den Systemspeicher 124 und die Prozessoreinheit 122 verbindet. Die Prozessoreinheit 122 kann arithmetische, logische und/oder Kontrolloperationen durchführen, indem auf den Systemspeicher 124 zugegriffen wird. Der Systemspeicher 124 kann Informationen und/oder Instruktionen zur Verwendung in Kombination mit der Prozessoreinheit 122 speichern. Der Systemspeicher 124 kann flüchtige und nichtflüchtige Speicher, beispielsweise "random access memory" (RAM) 128 und "Nur-Lesespeicher" (ROM) 130 beinhalten. Ein Grund-Eingabe-Ausgabe-Sytem (BIOS), das die grundlegenden Routinen enthält, welche helfen, Informationen zwischen den Elementen innerhalb des PCs 120, beispielsweise während des Hochfahrens, zu transferieren, kann in dem ROM 130 gespeichert sein. Der Systembus 126 kann eine von vielen Busstrukturen sein, unter anderem ein Speicherbus oder ein Speichercontroller, ein peripherer Bus und ein lokaler Bus, welcher eine bestimmte Busarchitektur aus einer Vielzahl von Busarchitekturen verwendet.

Der PC 120 kann weiterhin ein Festplattenlaufwerk 132 zum Lesen oder Schreiben einer Festplatte (nicht gezeigt) aufweisen und ein externes Disklaufwerk 134 zum Lesen oder Schreiben einer entfernbaren Disk 136 bzw. eines entfernbaren Datenträgers. Die entfernbare Disk kann eine magnetische Disk bzw. eine magnetische Diskette für ein magnetisches Disklaufwerk bzw. Diskettenlaufwerk oder eine optische Diskette wie z.B. eine CD-ROM für ein optisches Disklaufwerk sein. Das Festplattenlaufwerk 132 und das externe Disklaufwerk 134 sind jeweils mit dem Systembus 126 über eine Festplattenlaufwerkschnittstelle 138 und eine externe Disklaufwerkschnittstelle 140 verbunden. Die Laufwerke und die zugeordneten computerlesbaren Medien stellen einen nichtflüchtigen Speicher computerlesbarer Instruktionen, Datenstrukturen, Programm-Modulen und anderer Daten für den PC 120 zur Verfügung. Die Datenstrukturen können die relevanten Daten zum Implementieren eines wie oben beschriebenen Verfahrens aufweisen. Obwohl die beispielhaft beschriebene Umgebung eine Festplatte (nicht gezeigt) und eine externe Disk 142 verwendet, ist für den Fachmann offensichtlich, daß andere Typen computerlesbarer Medien, welche computerzugreifbare Daten speichern können, in der beispielhaften Arbeitsumgebung verwendet werden können, wie z.B. magnetische Kassetten, Flash-Memory Karten, digitale Videodisketten, Random- Access-Speicher, Nur-Lesespeicher, usw..

Eine Vielzahl von Programm-Modulen, insbesondere ein Betriebssystem (nicht gezeigt) ein oder mehrere Applikationsprogramme 144, oder Programm-Module (nicht gezeigt) und Programmdaten 146, können auf der Festplatte, der externen Disk 142, dem ROM 130 oder dem RAM 128 gespeichert werden. Die Applikationsprogramme können zumindest einen Teil der Funktionalität, wie in Figur 10 gezeigt, umfassen.

Ein Benutzer kann Kommandos und Information, wie oben beschrieben, in den PC 120 anhand von Eingabevorrichtungen, wie z.B. einer Tastatur bzw. eines Keyboards 148 und einer Computermaus 150 eingeben. Andere Eingabevorrichtungen (nicht gezeigt) können ein Mikrofon und/andere Sensoren, einen Joystick, ein Spielpolster bzw. -kissen, einen Scanner oder ähnliches umfassen. Diese oder andere Eingabevorrichtungen können mit der Prozessoreinheit 122 anhand einer seriellen Schnittstelle 152 verbunden sein, welche mit dem System 126 gekoppelt ist, oder können anhand anderer Schnittstellen, wie z.B. einer parallelen Schnittstelle 154, eines Spieleports oder eines universellen seriellen Busses (USB) verbunden sein. Weiterhin kann Information mit einem Drucker 156 gedruckt werden. Der Drucker 156 und andere parallele Eingabe/Ausgabevorrichtungen können mit der Prozessoreinheit 122 durch die parallele Schnittstelle 154 verbunden sein. Ein Monitor 158 oder andere Arten von Anzeigevorrichtung(en) ist/sind mit dem Systembus 126 mittels einer Schnittstelle, wie z.B. eines VideoeingangΛausgangs 160 verbunden. Zusätzlich zu dem Monitor kann die Rechnerumgebung 120 andere periphere Ausgabevorrichtungen (nicht gezeigt) wie z.B. Lautsprecher oder akustische Ausgänge umfassen.

Die Rechnerumgebung 120 kann mit anderen elektronischen Vorrichtungen z.B. einem Computer, einem Schnurtelefon, einem schnurlosen Telefon, einem persönlichen digitalen Assistenten (PDA), einem Fernseher oder ähnlichem kommunizieren. Um zu kommunizieren, kann die Rechnerumgebung 120 in einer vernetzten Umgebung arbeiten, wobei Verbindungen zu einem oder mehreren elektronischen Vorrichtungen verwendet werden. Figur 10 stellt die mit einem "remote Computer" bzw. entfernten Computer 162 vernetzte Rechnerumgebung dar. Der entfernte Computer 162 kann eine andere Rechnerumgebung, wie z.B. ein Server, ein Router, ein Netzwerk-PC, eine gleichwertige bzw. "peer" Vorrichtung oder andere gewöhnliche Netzwerkknoten sein und kann viele oder alle der hinsichtlich der Rechnerumgebung 120 oben beschriebenen Elemente umfassen. Die logischen Verbindungen, wie sie in Figur 10 dargestellt sind, umfassen ein "local area network" (LAN) 164 und ein "wide are network" (WAN) 166. Solche Netzwerkumgebungen sind alltäglich in Büros, firmenweiten Computernetzwerken, Intranetzen und dem Internet.

Wenn eine Rechnerumgebung 120 in einer LAN-Netzwerkumgebung verwendet wird, kann die Rechnerumgebung 120 mit dem LAN 164 durch einen Netzwerkeingang/-ausgang 168 verbunden sein. Wenn die Rechnerumgebung 120 in einer WAN-Netzwerkumgebung verwendet wird, kann die Rechnerumgebung 120 ein Modem 170 oder andere Mittel zum Herstellen einer Kommunikation über das WAN 166 umfassen. Das Modem 170, welches intern und extern bezüglich der Rechnerumgebung 120 sein kann, ist mit dem Systembus 126 mittels der seriellen Schnittstelle 152 verbunden. In der Netzwerkumgebung können Programm-Module, welche relativ zu der Rechnerumgebung 120 dargestellt sind, oder Abschnitte davon in einer entfernten Speichereinrichtung gespeichert sein, welche an oder von einem entfernten Computer 162 zugreif bar bzw. systemeigen sind. Weiterhin können andere Daten, welche für das oben beschriebene Verfahren bzw. System relevant sind, auf oder von dem entfernten Computer 162 zugreifbar vorliegen.

Insbesondere kann das erfindungsgemäße Verfahren auch auf einem Grid oder Parallelrechner oder das Informationsnetzwerk im wesentlichen beliebig verteilt sein, weshalb das System beispielsweise auch einen Grid oder einen Parallelrechner umfassen kann. Bezugszeichenliste

10 System

12 Eingabeeinrichtung

14 Ausgabeeinrichtung

16 Datenverwaltungseinrichtung

18 Referenzdatenbank 20 Quelldatenbank

22 Referenzdatenbankelement

24 Referenzdatenbankelement

26 Referenzdatenbankelement

28 Referenzdatenbankelement 30 Referenzdatenbankelement

32 Quelldatenbankelement

34 Quelldatenbankelement

36 Queildatenbankelement

38 Quelldatenbankelement 40 Quelldatenbankelement

42 Verknüpfung

44 Verknüpfung

46 Quelldatenbankelement

48 Quelldatenbankelement 50 Quelldatenbankelement

52 Quelldatenbankelement

54 Quelldatenbankelement

56 Verknüpfung

58 Verknüpfung 60 Verknüpfung

62 Quelldatenbankelement

64 Verknüpfung 120 Rechnerumgebung

122 Prozessoreinheit

124 Systemspeicher 126 Systembus

128 random access memory (RAM)

130 Nur-Lesespeicher (ROM)

132 Festplattenlaufwerk

134 Disklaufwerk 136 entfern bare Disk

138 Festplattenlaufwerkschnittstelle

140 Disklaufwerkschnittstelle

142 externe Disk

144 Applikationsprogramm 146 Programmdaten

148 Tastatur

150 Computermaus

152 serielle Schnittstelle

154 parallele Schnittstelle 156 Drucker

158 Monitor

160 Videoeingang/ -ausgang

162 entfernter Computer

164 "local area network" (LAN) 166 "wide are network" (WAN)

168 Netzwerkeingang/ -ausgang

Claims

Ansprüche

1. Verfahren zum computergestützten Bearbeiten von Quelldatenelementen (32 - 40, 46 - 54) einer Quelldatenmenge (20) mit den Schritten:

Ermitteln einer gewichteten Verknüpfung (42, 44, 60) des Nachfragedatenelements mit zumindest einem

Quelldatenelement (34, 38, 40) der Quelldatenmenge (20), insbesondere mit zumindest einem Trefferstring der Quelldatenmenge (20) und

Ausgeben des zumindest einen Quelldatenelements (34, 38, 40) entsprechend eines Gewichts (wi₂, W₁₃, W₃₄) der gewichteten Verknüpfung (42, 44, 60), bevorzugt einer Trefferwahrscheinlichkeit des Nachfragedatenelements mit dem zumindest einen Quelldatenelement (34, 38, 40), wobei

das Gewicht (W₁₂, W₁₃, W₃₄) der gewichteten Verknüpfung (42, 44, 60) aufgrund zumindest einer assoziativen Verknüpfung (42, 44, 60) ermittelt wird.

2. Verfahren nach Anspruch 1 , wobei eine Referenzdatenmenge (18) mit

Referenzdatenelementen (22 - 30) bereitgestellt wird und für jedes

Referenzdatenelement (22 - 30) eine gewichtete Verknüpfung (56, 58) mit zumindest einem Quelldatenelement (32 - 40) der Quelldatenmenge generiert wird.

3. Verfahren nach Anspruch 2, wobei während des Schritts des Ermitteins der gewichteten Verknüpfung(en) (42, 44, 60) des Nachfragedatenelements mit dem zumindest einen Quelldatenelement (34, 38, 40) zumindest ein

Referenzdatenelement (22 - 30) ermittelt wird, welches dem Nachfragedatenelement entspricht und

die Verknüpfung(en) (42, 44, 60) des zumindest einen Referenzdatenelements (22 - 30) mit dem zumindest einen

Quelldatenelement (34, 38, 40) dem Nachfragedatenelement zugeordnet wird/werden.

4. Verfahren nach Anspruch 3, wobei das Referenzdatenelement (22 - 30) mit dem Nachfragedatenelement identisch ist.

5. Verfahren nach einem der vorangegangenen Ansprüche, wobei jedem Quelldatenelement (32 - 40, 46 - 54) ein Zusatzdatenelement einer Zusatzdatenmenge zugeordnet ist.

6. Verfahren nach Anspruch 5, wobei bei der Ausgabe eines jeden Quelldatenelements (32 - 40, 46 - 54) das Zusatzdatenelement bereitgestellt wird.

7. Verfahren nach einem der vorangegangenen Ansprüche, wobei zumindest zwei Nachfragedatenelemente eingegeben werden, für jedes Nachfragedatenelement jeweils ein Quelldatenelement (34, 38, 40) ermittelt wird und die Quelldatenelemente (34, 38, 40) entsprechend der Gewichte (Wi₂, W₁₃, W₃₄) ihrer gewichteten Verknüpfungen (42, 44, 60) mit den zugehörigen Nachfragedatenelementen ausgegeben werden.

8. Verfahren nach Anspruch 7, wobei für jedes Quelldatenelement (32 - 40, 46 - 54), welches Verknüpfungen mit mehreren Nachfragedatenelementen aufweist, jeweils eine Verknüpfung mit jedem Element aus der Menge der Permutationen der Nachfragedatenelemente, welche mit dem Quelldatenelement (32 - 40, 46 - 54) verknüpft sind, generiert wird.

9. Verfahren nach einem der vorangegangenen Ansprüche, wobei ein oder mehrere Quelldatenelement(e) (62) und/oder assoziative Verknüpfung(en)

(64) visuell dargestellt werden.

10. Verfahren nach einem der vorangegangenen Ansprüche, wobei zumindest ein Quelldatenelement (62) vorbestimmt wird und dem zumindest einen vorbestimmten Quelldatenelement (62) ein positives oder ein negatives

Potential zugeordnet wird.

11. Verfahren nach Anspruch 10, wobei das Vorbestimmen des zumindest einen Quelldatenelements (62) und das Zuordnen des positiven oder negativen Potentials von einem Benutzer manuell durchführbar ist.

12. Verfahren nach Anspruch 11 , wobei das Vorbestimmen des zumindest einen Quelldatenelements (62) und das Zuordnen des positiven oder negativen Potentials durch den Benutzer vor Eingabe des zumindest einen Nachfragedatenelements durchführbar ist.

13. Verfahren nach einem der vorangegangenen Ansprüche, wobei bei dem Ermitteln der gewichteten Verknüpfung(en) des Nachfragedatenelements mit zumindest einem Quelldatenelement (34, 38, 50) in einem Iterationsschritt

für jedes Nachfragedatenelement ein erstes Quelldatenelement (34, 38) ermittelt wird,

für jedes erste Quelldatenelement (34, 38) eine gewichtete Verknüpfung (56, 58) mit einem weiteren Quelldatenelement

(50) ermittelt wird,

jedes erste Quelldatenelement (34, 38) als Nachfragedatenelement definiert wird und jedes weitere Quelldatenelement (50) als erstes Quelldatenelement (50) definiert wird.

14. Verfahren nach Anspruch 13, wobei der Iterationsschritt wiederholt wird.

15. Verfahren nach einem der Ansprüche 10 bis 13, wobei jedes erste Quelldatenelement (34, 38, 50) entsprechend des Gewichts (w-ι₂, W₃₄, w₂s, W₄₅) seiner gewichteten Verknüpfung (24, 56, 58, 60) ausgegeben wird.

16. Verfahren nach einem der vorangegangenen Ansprüche, wobei die Quelldatenmenge (20) erweiterbar ist.

17. Verfahren nach Anspruch 16, wobei anhand von zusätzlichen Quelldatenelementen und/oder zusätzlichen Zusatzdatenelementen der

Referenzdatenmenge zusätzliche Referenzdatenelemente hinzugefügt werden und gewichtete Verknüpfungen zwischen den zusätzlichen Quelldatenelementen und den entsprechenden zusätzlichen Referenzdatenelementen generiert werden.

18. Verfahren nach Anspruch 17, wobei gewichtete Verknüpfungen zwischen den zusätzlichen Quelldatenelementen und den bereits vorhandenen Referenzdatenelementen (22 - 30) generiert werden und/oder gewichtete Verknüpfungen zwischen den zusätzlichen Referenzdatenelementen und den bereits vorhandenen Quelldatenelementen generiert werden.

19. Verfahren nach einem der vorangegangenen Ansprüche, wobei ein Gewicht Wj_j der gewichteten Verknüpfung zwischen einem Referenzdatenelement R, und einem Quelldatenelement Q, anhand der Häufigkeit des Vorkommens des Referenzdatenelements R, und des Quelldatenelements Q, jeweils in einem Zusatzdatenelement folgendermaßen berechnet wird:

^wv f M)ZQ (Q_J ) wobei

/(R_nQ_j) die Häufigkeit des gemeinsamen Vorkommens des Referenzdatenelements R,- und des Quelldatenelements Q₇ in dem

Zusatzdatenelement,

f_β(Rι) die Häufigkeit des Vorkommens des Referenzdatenelements R,- in der Gesamtmenge aller Zusatzdatenelemente und

Z_Q (QJ ) die Häufigkeit des Vorkommens des Quelldatenelements Q,- in der

Gesamtmenge aller Zusatzdatenelemente darstellt.

20. Verfahren nach einem der Ansprüche 1 bis 18, wobei das Gewicht wy der gewichteten Verknüpfung zwischen einem Referenzdatenelement R,- und einem Quelldatenelement Q/ folgendermaßen berechnet wird:

wobei

|{3c : Ä,.(3c) > ÖΛ ß_y (3c) > ö| die Häufigkeit eines gleichzeitigen Auftretens des Referenzdatenelements R,-, beispielsweise eines Gens A, und des Quelldatenelements Q₇, beispielsweise eines Gens B, in einem Experiment x , wobei die Häufigkeit des Referenzdatenelements R, und des

Quelldatenelements Q/ je größer als ein Schwellwert θ ist, beschreibt,

|{3c : Ä,.(3c) > ö| die Häufigkeit eines alleinigen Auftretens des

Referenzdatenelements R,-, beispielsweise eines Gens A, in dem Experiment x , wobei die Häufigkeit des Referenzdatenelements R,- größer als der

Schwellwert θ ist, beschreibt und |{jc : O._y (3c) > έ?| die Häufigkeit eines alleinigen Auftretens des

Quelldatenelements Q_j, beispielsweise eines Gens B, in dem Experiment x , wobei die Häufigkeit des Quelldatenelements Q, größer als der Schwellwert θ ist, beschreibt.

21. Verfahren zum Bearbeiten von Quelldatenelementen (32 - 40, 46 - 54) einer Quelldatenmenge (20) mit den Schritten:

- Eingeben mehrerer Nachfragedatenelemente, insbesondere mehrerer voneinander getrennter Suchstrings,

Ermitteln einer gemeinsamen gewichteten Verknüpfung sämtlicher Nachfragedatenelemente mit zumindest einem Quelldatenelement (50) der Quelldatenmenge (20) , insbesondere mit zumindest einem Trefferstring der Quelldatenmenge (20) und

Ausgeben des zumindest einen Quelldatenelements (50) entsprechend eines Gewichts der gemeinsamen gewichteten

Verknüpfung mit den Nachfragedatenelementen, bevorzugt einer Trefferwahrscheinlichkeit der Nachfragedatenelemente mit dem zumindest einen Quelldatenelement (50), wobei

das Gewicht der gewichteten Verknüpfung aufgrund einer assoziativen

Verknüpfung ermittelt wird.

22. System (10) zum Bearbeiten von Quelldatenbankelementen (32 - 40, 46 - 54) einer Quelldatenbank (20) mit:

einer Eingabeeinrichtung (12), welche zum Eingeben zumindest eines Nachfragedatenelements, insbesondere eines Suchstrings, ausgelegt ist, einer Mikroprozessoreinrichtung, welche zum Ermitteln einer gewichteten Verknüpfung (42, 44, 60) des

Nachfragedatenelements mit zumindest einem Quelldatenbankelement (34, 38, 40), insbesondere mit zumindest einem Trefferstring der Quelldatenbank (20) ausgelegt ist und

einer Ausgabeeinrichtung (14), welche zum Ausgeben des zumindest einen Quelldatenbankelements (34, 38, 40) entsprechend eines Gewichts (w-ι₂, Wi_3l W₃₄) der gewichteten Verknüpfung (42, 44, 60), bevorzugt einer Trefferwahrscheinlichkeit des Nachfragedatenelements mit dem zumindest einen Quelldatenbankelement (34, 38, 40) ausgelegt ist, wobei

die Mikroprozessoreinrichtung weiterhin ausgelegt ist, das Gewicht (w₁₂, W₁₃, W₃₄) der gewichteten Verknüpfung (42, 44, 60) aufgrund zumindest einer assoziativen Verknüpfung (42, 44, 60) zu ermitteln.

23. System (10) nach Anspruch 22, wobei das System weiterhin eine Referenzdatenbank (18) mit Referenzdatenbankelementen (22 - 30) aufweist und

die Mikroprozessoreinrichtung ausgelegt ist, für jedes

Referenzdatenbankelement (22 - 30) eine gewichtete Verknüpfung (42, 44, 60) mit zumindest einem Quelldatenbankelement (34, 38, 40) der Quelldatenbank (20) zu generieren.

24. System (10) nach Anspruch 23, wobei die Mikroprozessoreinrichtung weiterhin ausgelegt ist:

während des Schritts des Ermitteins der Verknüpfung(en) (42, 44, 60) des Nachfragedatenelements mit dem zumindest einen Quelldatenbankelement (34, 38, 40) zumindest ein Referenzdatenbankelement (22, 28) zu ermitteln, welches dem Nachfragedatenelement entspricht und

- die Verknüpfung(en) (42, 44, 60) des zumindest einen

Referenzdatenbankelements (22, 28) mit dem zumindest einen Quelldatenbankelement (34, 38, 40) dem Nachfragedatenelement zuzuordnen.

25. System (10) nach einem der Ansprüche 22 bis 24, wobei das System (10) eine Zusatzdatenbank umfaßt und jedem Quelldatenbankelement ein Zusatzdatenbankelement zugeordnet ist.

26. System (10) nach Anspruch 25, wobei die Ausgabeeinrichtung (14) ausgelegt ist, bei der Ausgabe eines jeden Quelldatenbankelements (32 -

40, 46 - 54) das Zusatzdatenbankelement bereitzustellen.

27. System (10) nach Anspruch 25 oder 26, wobei die Quelldatenbank (20) anhand zusätzlicher Quelldatenbankelemente und/oder die Zusatzdatenbank anhand zusätzlicher Zusatzdatenbankelemente erweiterbar sind.

28. System (10) nach Anspruch 27, wobei die Mikroprozessoreinrichtung ausgelegt ist, anhand der zusätzlichen Quelldatenbankelemente und/oder der zusätzlichen Zusatzdatenbankelemente zusätzliche Referenzdatenbankelemente zu generieren und gewichtete Verknüpfungen zwischen den zusätzlichen Quelldatenbankelementen und den entsprechenden Referenzdatenbankelementen zu generieren.

29. System (10) nach einem der Ansprüche 22 bis 28, wobei die die Ausgabeeinrichtung (14) ausgelegt ist, daß ein oder mehrere

Quelldatenelement(e) (62) und/oder assoziative Verknüpfung(en) (64) visuell dargestellt werden.

30. System (10) nach einem der Ansprüche 22 bis 29, wobei die Eingabeeinrichtung (12) ausgelegt ist, zumindest ein Quelldatenelement (62) vorzubestimmen und dem zumindest einen Quelldatenelement (62) ein positives oder ein negatives Potential zuzuordnen.

31. System nach Anspruch 30, wobei die Eingabeeinrichtung ausgelegt ist, daß das Vorbestimmen des zumindest einen Quelldatenelements (62) und das Zuordnen des positiven oder negativen Potentials von einem Benutzer manuell durchführbar ist.

32. System nach Anspruch 31 , wobei die Eingabeeinrichtung ausgelegt ist, daß das Vorbestimmen des zumindest einen Quelldatenelements (62) und das Zuordnen des positiven oder negativen Potentials durch den Benutzer vor Eingabe des zumindest einen Nachfragedatenelements durchführbar ist.

33. Computerprogrammprodukt, welches, wenn es in den Speicher einer Datenverarbeitungseinrichtung, wie z.B. eines Computers geladen ist, die Datenverarbeitungseinrichtung veranlaßt, ein Verfahren gemäß einem der Ansprüche 1 bis 21 auszuführen.