DE10157996B4 - Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen - Google Patents

Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen Download PDF

Info

Publication number
DE10157996B4
DE10157996B4 DE10157996A DE10157996A DE10157996B4 DE 10157996 B4 DE10157996 B4 DE 10157996B4 DE 10157996 A DE10157996 A DE 10157996A DE 10157996 A DE10157996 A DE 10157996A DE 10157996 B4 DE10157996 B4 DE 10157996B4
Authority
DE
Germany
Prior art keywords
local
catalog
catalogs
subquery
xpath
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10157996A
Other languages
English (en)
Other versions
DE10157996A1 (de
Inventor
Pedro Jose Dr. Marron
Georg Prof. Dr. Lausen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Albert Ludwigs Universitaet Freiburg
Original Assignee
Albert Ludwigs Universitaet Freiburg
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Albert Ludwigs Universitaet Freiburg filed Critical Albert Ludwigs Universitaet Freiburg
Priority to DE10157996A priority Critical patent/DE10157996B4/de
Publication of DE10157996A1 publication Critical patent/DE10157996A1/de
Application granted granted Critical
Publication of DE10157996B4 publication Critical patent/DE10157996B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Verfahren zur Integration von auf XML basierenden Katalogen anhand einer adaptiven Anfrageevaluierung zur Vermeidung
eines Rewritings
mit lokalen Katalogen,
mit einem globalen Katalog, der einem gemeinsamen Katalog der lokalen Kataloge darstellt und
mit einer auf dem globalen Katalog vorgegebenen XPath-Anfrage Q mit Subanfragen qi, Q = q1 / q2 / .... / qn,
dadurch gekennzeichnet,
daß die XPath-Anfrage auf die lokalen Kataloge angewendet wird,
wobei jede Subanfrage der XPath-Anfrage auf den lokalen Katalogen einer oder mehreren Transformationen unterworfen wird, und danach die transformierte Subanfrage ausgewertet wird, und
wobei die Zwischenergebnisse und das lokale Endergebnis der Subanfragen mittels einer oder mehrerer Fitness-Funktionen für jeden lokalen Katalog ausgewertet werden, wobei die Fitness-Funktion die Priorisierung der Ergebnisse ermöglicht, und
daß die lokalen Endergebnisse der XPath-Anfrage der lokalen Kataloge ausgewertet und als globales Endergebnis dargestellt werden.

Description

  • Die Erfindung geht aus von einem Verfahren zur adaptiven Anfrageevaluierung von auf XML (Extensible Markup Language) basierenden Katalogen nach dem Oberbegriff des Anspruchs 1.
  • Elektronische Kataloge sind eine wichtige Komponente für E-Commerce im Internet, weil sie die verschiedenen Arten von Produkten und Dienstleistungen von Anbietern auflisten, beschreiben und kategorisieren. E-Kataloge sind daher der Hauptkommunikationskanal zwischen Käufern und Informationsanbietern, deren Wichtigkeit nur von der korrekten Verwaltung der verschiedenen Gruppen und Kataloge der unterschiedlichen Anbieter sowie der transparenten Integration dieser Daten überstiegen wird.
  • Werden mehrere lokale Kataloge in einen globalen Katalog integriert auf dem eine XPath-Anfrage vorgegeben ist, so muss diese Anfrage in Begriffe der lokalen Kataloge übersetzt werden, um die erwünschte Antwort bekommen zu können. Dies wird als Rewriting bezeichnet. Die unmittelbare Anwendung der XPath-Anfrage auf einen der lokalen Kataloge würde zu keinem Ergebnis führen. Derartige Rewritings sind mit einem hohen Aufwand verbunden, da die XPath-Anfrage für jeden der lokalen Kataloge übersetzt werden muss.
  • Aus W. May: Integration of XML DATA in XpathLog, CaiSE Workshop „Data Integration over the web", Interlaken, 04. Juni 2001 ist ein Verfahren zur Integration von Daten bekannt, welches auf Lopix basiert. Die Integration erfolgt hierbei durch eine einheitliche Terminologie und ist in der Anwendung mit einem erheblichen Aufwand verbunden. Es handelt sich nicht um ein adaptives Verfahren für Anfrageevaluierungen.
  • Aus D. Guillaume: An application of XML and Xlink using a graphpartitioning method and a density map for information retrieval and knowledge discovery, in ASP Conf. Ser., Vol. 172,1999 ist eine Anwendung von XML und Xlink im Bereich der Astronomie bekannt. Diese Anwendung wird AML Astronomical Markup Language genannt. Die einzelnen AML Dokumente sind untereinander durch Links verknüpft. Die Verknüpfung von lokalen und globalen Katalogen an Hand einer adaptiven Anfrageevaluierung ist in der Druckschrift nicht beschrieben.
  • Der vorliegenden Erfindung liegt die Aufgabe zu Grunde, ein Verfahren zur Integration von auf XML basierenden Katalogen an Hand einer adaptiven Anfrageevaluierung zur Verfügung zu stellen, mit dem ein Rewriting einer auf einem globalen Katalog vorgegebenen Anfrage vermieden werden kann, wenn die Anfrage auf lokale Kataloge angewendet wird. Bei dem globalen Katalog handelt es sich um einen gemeinsamen Katalog der lokalen Kataloge.
  • Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 gelöst.
  • Die Erfindung und ihre Vorteile
  • Gegenüber dem Stand der Technik hat das erfindungsgemässe Verfahren mit den kennzeichnenden Merkmalen des Anspruchs 1 den Vorteil, dass keine lokalen Rewritings für individuelle Anfragen stattfinden, sondern eine adaptive Auswertung es ermöglicht, die gleiche Anfrage auf allen lokalen Katalogen durchzuführen, ohne dass die Qualität der Ergebnisse darunter leidet. Die Eigenschaften von XPath-Anfragen auf XML-Katalogen, die Fexibilität der Fitness-Funktion, die eine Priorisierung der Ergebnisse ermöglicht und die Natur der Begriffshierarchie, auf der Produktkataloge basieren, führt zu einer sehr effizienten Durchführung von XPath-Anfragen auf XML-basierenden Katalogen. Die lokalen Kataloge liefern dabei die richtige Antwort so als hätte ein Rewriting stattgefunden.
  • Das Verfahren basiert auf der Anwendung und Auswertung von Transformationen auf jeder der Subanfragen der ursprünglichen XPath-Anfrage und auf einem Massstab, der von der Fitness-Funktion für jede mögliche Antwort angeboten wird. Mit Hilfe der Fitness-Funktion wird eine Auswahl aus der Lösungsmenge getroffen. Für jeden lokalen Katalog liefert die XPath-Anfrage ein mit Hilfe der Fitness-Funktion bestimmtes lokales Endergebnis. Alle lokalen Endergebnisse werden als globales Endergebnis der Anfrage dargestellt. Sofern der Benutzer dies wünscht, kann eine Auswertung der lokalen Endergebnisse stattfinden. Hierzu kann eine Endergebnis-Fitness-Funktion angewendet werden.
  • Die Fitness-Funktion zur Auswertung der Zwischenergebnisse der Subanfragen kann für alle lokalen Kataloge gleich sein. Es besteht jedoch auch die Möglichkeit, für verschiedene lokale Kataloge unterschiedliche Fitness-Funktionen anzuwenden. Dadurch haben die Anbieter der lokalen Kataloge die Möglichkeit, die Anfragen der Kunden zu lenken. Die Anfragen können beispielsweise zeitlich begrenzte Angebote oder spezielle Kundenwünsche der lokalen Kataloge berücksichtigen.
  • Nach einer vorteilhaften Ausgestaltung der Erfindung sind als Transformationen der Subanfrage vorgesehen:
    Keine Transformation, Subanfrageverallgemeinerung und Subanfrageeliminierung.
  • Bei keiner Transformation wird die Anfrage genauso ausgewertet, wie sie von dem Benutzer ursprünglich spezifiziert wurde. Bei einer Subanfrageverallgemeinerung wird die Achse einer bestimmten Subanfrage folgendermassen verallgemeinert: Den Ausdrücken „child" und „parent" der ursprünglichen Achse werden auf der verallgemeinerten Achse die Ausdrücke „descendent" und „ancestor" zugeordnet. Bei einer Subanfrageeliminierung wird eine Subanfrage von der ursprünglichen XPath-Anfrage weggelassen, wenn ihre Ergebnismenge bzw. der Ausgabezusammenhang leer ist. Das ermöglicht die weitere Evaluierung der folgenden Subanfragen, so als ob die elimierte Subanfrage von dem Benutzer nicht spezifiziert worden wäre. Darüber hinaus sind weitere Transformationen möglich.
  • Um exakte Ergebnisse zu erzeugen wird jede Subanfrage qi der XPath-Anfrage Q mit Eingabezusammenhang Ci bezüglich jeder Subanfragetransformation ausgewertet. Dadurch werden die drei Ausgabenzusammenhänge Cn i+1, Cg i+1 und Ce i+1 erzeugt. Diese entsprechen der Auswertung der drei möglichen Transformationen. Der Ausgabezusammenhang Ci+1 entspricht der Vereinigung der einzelnen Ergebnisse der o.g. Ausgabezusammenhänge, die durch die Auswertung aller drei Transformationsmöglichkeiten entstanden sind: Ci+1 = Cn i+1 ∪ Cg i+1 ∪ Ce i+1.
  • Die Fitness-Funktion ordnet jedem Knoten m des Ausgabezusammenhangs Ci+1 der Subanfrage qi einen Wert vm zu, der durch die Evaluierung der vorherigen Anfragen q0...qi-1 entstanden ist. Der Knoten m aus Ci+1 ist dabei aus dem Knoten n aus Ci hervorgegangen. Ist m Teil des Ausgabezusammenhangs Cn i+1 so wird vm der Wert b1 2 + vn zugeordnet. Ist m Teil des Ausgabezusamenhangs Cg i+1 so wird vm der Wert b1+vn zugeordnet. Ist m Teil des Ausgabezusammenhangs Ce i+1 so wird vm, der Wert 1+vn zugeordnet. Dabei ist b1 eine Zahl, die die Basis der Fitness-Funktion auf einem bestimmten Niveau in der Auswertung repräsentiert. Ist ein Knoten n durch die Anwendung mehrer Strategien entstanden und beispielsweise Teil von Cn i+1 und von Cg i+1, so beinhaltet der endgültige Ausgabezusammenhang Ci+1 nur die n-Knoten, die den grössten Wert haben. Am Anfang wird der Wert der Wurzelknoten mit 1 initialisiert: vroot = 1.
  • Neben dieser Niveau-abhängigen Fitness-Funktion sind auch Knoten-abhängige Fitness-Funktionen möglich. Im oben angegebenen Beispiel wäre der Wert b1 eine Funktion von n.
  • Knoten, die als Ergebnis der Evaluierung der ursprünglichen Anfrage entstanden sind, haben einen grösseren Wert der Fitness-Funktion als die, die von der Verallgemeinerung oder Elimierung von Subanfragen erzeugt worden sind. Der Grund hierfür besteht darin, dass den ursprünglichen Anfragen der Vorzug vor anderen Transformationen gegeben werden soll, die die Absicht des Benutzers hätten abstrahieren können. Die Elimierung einer Subanfrage ist stets am niedrigsten bewertet, da eine bestimmte Subanfrage, die von dem Benutzer vorgegeben worden ist, für die Auswertung angewendet werden soll, bevor sie weggelassen wird. Ansonsten wäre die leere Anfrage stets ein Teil der Ergebnismenge. Dies ergibt keinen Sinn. Das Endergebnis der XPath-Anfrage ist daher stets der Knoten oder die Knotenmenge, deren Wert am Ende des Evaluierungsprozesses am höchsten ist.
  • Das erfindungsgemässe Verfahren hat den Vorteil, dass eine auf einem globalen Katalog gestellte Anfrage nicht für jeden lokalen Katalog übersetzt und angepasst werden muss. Daher wird der Evaluierungsprozess beschleunigt. Seine Effizienz ist unabhängig von der Anzahl der lokalen Kataloge im System. Das System arbeitet daher effizient und ist skalierbar. Auf den lokalen Katalogen können Anfragen parallel evaluiert und durchgeführt werden. Daher kann das System von einer verteilten Architektur profitieren. Die Anwendung einer Zahl als Basis des exponentiellen Teils der Definition der Fitness-Funktion, die vom Niveau abhängig ist, ermöglicht die effiziente, flexible und unabhängige Anpassung des Anfrageevaluierungsprozesses auf jeden lokalen Katalog. Falls für eine Gruppe von lokalen Katalogen dieselben Parameter der Fitness-Funktion festgelegt werden, kann ein homogenes Bewertungssystem für die Evaluierung unabhängiger Ergebenisse kostenlos geschaffen werden, das dem Benutzer die besseren Antworten seiner Anfrage zuverlässig zeigt.
  • Das Verfahren ermöglicht die effiziente Suche der richtigen Reihenfolge von Transformationsoperationen, ohne dass damit ein exponentieller Auswand verbunden ist, der bei Verfahren nach dem Stand der Technik mit entsprechenden Rewritings notwendig ist. Bei dem Verfahren nach dem Stand der Technik ist nur eine von drei Möglichkeiten eine bessere Alternative. Die Vereinigung der Ergebnisse in der nur der Knoten mit dem höchsten Wert für das Endergebnis herangezogen wird, ermöglicht die Reduzierung eines exponentiellen Suchproblems O(3n), bei dem n die Anzahl der Subanfragen ist, auf ein lineares Problem O(3·n).
  • Die Natur und Effizienz des Verfahrens befriedigt die Bedürfnisse, jede Anfrage gegen eine DTD (Document Type Definition) zu prüfen, die den Inhalt jedes lokalen Katalogs beschreiben könnte. Dieses Vorgehen führt zu weiteren Vorteilen: DTDs sind nicht mehr essentiell, was die Integration von bekannten Katalogen ohne DTD ermöglicht. Lokale Kataloge können effizienter verwaltet werden, ohne dass jedes neu hinzugefügte Element gegen eine DTD überprüft werden muss und es dürfen verschiedene Dokumentstrukturen im gleichen Katalog zusammengefasst sein, ohne dass hierzu ein spezieller Aufwand notwendig ist, um die Anfrage mit den Konzepten der anderen DTDs übersetzen zu müssen. Schließlich sei darauf hingwiesen, dass das Verfahren im Rahmen eines auf LDAP (Lightweight Directory Access Protocol) [M. Wahl, T. Howes, S. Kille. Lightweight directory access protocol (v3). RFC 2251, December 1997] basierenden XML-Prozessierungssystems beispielsweise implementiert werden kann und bereits zu vielversprechenden Ergebnissen geführt hat.
  • Weitere Vorteile und vorteilhafte Ausgestalungen der Erfindung sind der nachfolgenden Beschreibung, der Zeichnung und den Ansprüchen entnehmbar.
  • Zeichnung
  • Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt und im folgenden näher beschrieben. Es zeigen:
  • 1 Lokale Kataloge für die Firmen SESP (links) und BIGGER (rechts),
  • 2 Begriffshierarchie für SESP (links), BIGGER (rechts) und den globalen Katalog (Mitte),
  • 3 Beispiel einer klassischen XPath-Anfrage-Auswertung,
  • 4 Subanfrage Verallgemeinerungsstrategie,
  • 5 Bespiel der adaptiven Anfrageevaluierung zu der XPath-Anfrage gemäss 3.
  • Beschreibung des Ausführungsbeispiels
  • Eine Gruppe von Elektro-Firmen entschließt sich, ihre Produkte online mittels einer gemeinsamen, integrierten Webseite anzubieten. Dieses Bespiel wurde ursprünglich von Gabriel M. Kuper und Jérôme Siméon in dem Artikel „Subsumption for XML Types" in „Proceedings of the 8th International Conference on Database Theory (ICDT), London, UK, Januar 2001" beschrieben. Es wird im folgenden verwendet, um eine Anwendung des erfindungsgemäßen Verfahrens zu erörtern. Die Unterschiede bezüglich Bandbreite und Arten der Produkte der Elektro-Firmen zeigen sich in ihren individuellen Katalogen, aber es gelingt Ihnen trotzdem, sich auf einen einheitlichen Katalog zu einigen, der auf der Webseite implementiert werden soll. Die Firma SESP [http://sesp.co.uk/4.htm) z.B. verkauft nur Jammer, wie man ihrem lokalen Katalog in 1 links entnehmen kann, während die Firma BIGGER gemäß 1 rechts eine größere Auswahl an Produkten von Computern bis Jammer anbietet. Nach mehreren Besprechungen einigen sie sich darauf, daß der gemeinsame Katalog eine Kombination der individuellen Konzepte, in XML durch Tags dargestellt, haben soll, die eine allgemeine Darstellung ihres Geschäftsmodells anbietet. Sie vereinbaren, daß sie products (Produkte) haben werden, die in verschiedenen departments (Abteilungen) organisiert werden. Ferner darf jedes Produkt eine interne Beschreibung seiner Merkmale und Fähighkeiten haben, wie etwa company (Hersteller), name (Produktname), price (Preis), usw.. 2 zeigt die hierarchische Struktur des globalen Katalogs in der Mitte, des lokalen Katalogs der Firma SESP auf der linken Seite und des lokalen Katalogs der Firma BIGGER auf der rechten Seite.
  • Würden wir das klassische XPath-Modell benutzen, um eine Anfrage an den globalen Katalog zu richten, müßten wir wissen, wie man diese Anfrage in Begriffe der lokalen Kataloge übersetzt, damit wir die erwünschte Antwort bekommen könnten.
  • In unserem Beispiel ist die Anfrage Qglobal = / department/ mobile/ products/ jammer [price < 200]eine valide XPath-Anfrage, die wir an den globalen Katalog richten können, um alle Jammer im System als Ergebnis zu bekommen, deren Preis niedriger ist als 200 EUR. Ihre Auswertung im Rahmen des klassischen Modells beinhaltet die Erschaffung zweier equivalenter Anfragen QSESP und QBIGGER, und ihre Auswertung in den entsprechenden lokalen Katalogen.
  • Angenommen wir haben die Kataloge von 2, so können wir nicht einfach QSESP = QBIGGER = QGLOBAL nach SESP und BIGGER weiterleiten, weil SESP keinen department-Knoten und BIGGER keinen products-Knoten hat. Für das serielle Auswertungsmodell von XPath und die Struktur des lokalen Katalogs von SESP, das die Knoten department und mobile nicht hat, ergibt die Auswertung von Qglobal ohne Modifizierungen auf dem SESP lokalen Katalog kein Ergebnis, da der Ausgabezusammenhang C1 der / department/ Subanfrage leer ist. Das gleiche Problem findet man bei BIGGER.
  • Wir müssen aus diesem Grund QSESP = / products/ jammer [price < 200] und QBIGGER = / department/ mobile/ jammer [price < 200]setzen, wenn wir überhaupt eine Antwort von den lokalen Katalogen erhalten wollen. Das ist das klassiche Problem von Anfragerewriting in Mediatorensystemen, die in der semistrukturierten Welt die Analyse und Adaptierung der Anfrage auf eine DTD in Anspruch nehmen würde, die den Inhalt der lokalen Datensammlung beschreibt, oder, wenn dieses DTD nicht vorhanden wäre, auf die Daten selbst.
  • Wir müssen also ein Rewriting für das vorherige Beispiel finden, weil das XPath-Auswertungsmodell es so verlangt. In diesem Modell ist eine XPath-Anfrage Q die Zusammensetzung von Pfadausdrücken, die Laufoperationen auf einem Dokumentbaum ausführen, indem sie die Menge von Knoten wiedergeben, die die Anforderungen der Anfrage erfüllen. Jeder Ausdruck ist mit dem nächsten vermittels des Zeichens '/' verbunden. Formal gesehen wird eine XPath-Anfrage Q als Q = q1 /q2 /.. /qn definiert, wo jedes qi ein Pfadausdruck ist. Bei singulärer Betrachtung einer XPath-Subanfrage wird qi als 3-Tuple qi = (Ci, ωi, Ci+1 ), 1 ≤ i ≤ n geschrieben, wo Ci, eine Menge von XML-Knoten ist, die den Eingabezusammenhang (input context) bestimmen, ωi der Pfadausdruck, der auf jedem Knoten des Eingabezusammenhangs ausgewertet werden muss, und Ci+1 eine Menge von XML-Knoten, die sich als Ergebnis der Auswertung von ωi aus dem Inhalt des Eingabezusammenhangs Ci ergibt. Ci+1 wird auch Ausgabezusammenhang (output context) genannt. Im Besonderen ist Cn+1 das endgültige Ergebnis der Anfrage Q. Letzendlich wird ein Pfadausdruck ωi als 3-Tuple ωi = ai :: ei[ci] definiert, wo ai eine XPath-Achse ist, ei ein Knotenausdruck, der entweder den Namen oder den Typ des Knotens testet, und Ci ein Boolnischer Ausdruck von vorausgesetzen Bedingungen, die von allen Knoten in dem Ausgabezusammenhang erfüllt werden müssen. Wenn ωi leer ist, repräsentiert durch ωi = ε, erhält man die Auswertung von qi = (Ci, ε, Ci+1), indem der Inhalt des Eingabezusammenhangs an den Ausgabezusammenhang weitergegeben wird: Ci+1 = Ci.
  • 3 zeigt eine graphische Darstellung des Auswertungsprozesses einer klassischen XPath-Anfrage, die aus sechs Subanfragen besteht. Dieses Beispiel ist von dem Beispiel der Firmen SESP und BIGGER zu unterscheiden. Die Ovale in jedem Zusammenhang zwischen zwei Subanfragen repräsentieren die individuellen Knoten, die jede Subanfrage an dem Punkt erfüllt.
  • 5 stellt dagegen eine grafische Repräsentierung der Auswertung der Anfrage gemäß 3 dar, bei der die dunkleren Knoten die Ergebnisse der Auswertung der unveränderten Anfrage, die helleren Knoten die Auswertung der verallgemeinerten Anfrage und die weißen Knoten die Auswertung der Eliminierung der Subanfrage symbolisieren. Die Verallgemeinerung einer Subanfrage erfolgt nach den Angaben von 4.
  • Um in unserem Beispiel Qglobal = / department/ mobile/ products/ jammer [price < 200]mit dem Verfahren auszuwerten, werden auf den zwei lokalen Katalogen SESP und BIGGER folgende Operationen durchgeführt:
    Angenommen, daß mit root der Wurzel-Knoten des SESP Katalogs bezeichnet wird, dann ist der erste Schritt die Zuweisung von QSESP zu Qglobal, ohne daß irgendeine Transformation erfolgt. Dann wird q0 = / department auf dem Eingabezusammenhang C0 = {root} ausgewertet, aus dem Cn 1 = ∅ entsteht, da es keine department-Knoten als direkte Abkömmlinge von der Wurzel gibt. Der nächste Schritt ist die Evaluierung der verallgemeinerten Anfrage q0 = /department auf C0, die auch keine Ergebnisse produziert Cg 1 = ∅, da es keine department-Knoten auf dem SESP Katalog gibt. Letzendlich wird q0 = ε auf C0 ausgewertet, womit wir Ce 1 = {root} bekommen. In diesem Punkt ist νroot = 2. Der gleiche Prozeß geschieht bei der Evaluierung von q1 = /mobile, da es keine mobile Knoten im Katalog gibt. Deswegen wird C2 = {root} und νroot = 3. Auf der anderer Seite erzeugt die Auswertung von q2 = /products eine nicht-leere Menge Cn 3, da, wie man im Katalog der 1 sehen kann, products ein direkter Abkömmling der Wurzel ist. Der Wert von jedem Knoten n ∈ Cn 3 ist nach der Definition unserer Fitness-Funktion νn = 102 + 3 = 103, unter der Annahme, daß bl = 10 auf jedem Niveau, und daß alle Knoten in Cn 3 aus dem einzigen Wurzelknoten (root) in C2 entstanden sind. Die Auswertung der verallgemeinerten Anfrage q2 = // products produziert Cg 3 = Cn 3, da es keine andere products Knoten im Katalog gibt. Ferner, da der Wert der Knoten in Cn 3 höher ist, als der der Knoten in Cg 3, ergibt die Vereinigung beider Mengen nur die Knoten von Cn 3. Letzendlich erzeugt die Auswertung von q2 = ε das Ergebnis Ce 3 = {root}, mit νroot = 4.
  • Die Evaluierung von q3 = / jammer [price < 200] benutzt C3 als Eingabezusammenhang, in dem manche der Knoten, nämlich die, die die vorherige Subanfrage erfüllt haben, einen höheren Wert haben, als den der Wurzel-Knoten (root), z.B. der nur in dem Eliminierungsprozeß erzeugt worden ist. Deswegen beinhaltet Cn 4 Knoten, die direkte Abkömmlinge jammer von C3 sind, deren Preis niedriger ist als 200 EUR. Daher wird, wenn n ∈ Cn 4 und sein vorheriger Knoten m ∈ Cn3 ist, was wahrscheinlich der Fall sein wird, der Wert von n νn = 102 + 103 = 203 sein. Auf der anderen Seite, wenn ein Knoten n von der Wurzel erzeugt wird, dessen Wert νroot = 4 ist, wird, wie wir schon gesehen haben, der neue Knoten einen Wert von νn = 102 + 4 = 104 haben. Dieser Wert von νn ist geringer als der oben genannte. Als Ergebnis der Anfrage wird daher die zu νn = 203 gehörende Knotemenge ausgewählt.
  • Am Ende dieses Prozesses stellt das Ergebnis dieser Anfrage die Knotenmenge in C4 dar, deren Wert am höchsten ist. Es läßt sich leicht vom Beispiel ableiten, dass der bestmögliche Wert für jeden Knoten in C4 den Knoten entspricht, die von der Anfrage QSESP = / products/ jammer [price < 200] erzeugt worden sind, die genau dem optimalen Rewriting für den lokalen SESP Katalog entspricht.
  • Der Auswertungsprozeß für QBIGGER läuft ähnlich ab.
  • Sämtliche Merkmale können sowohl einzeln als auch in beliebiger Kombination miteinander erfindungswesentlich sein.

Claims (11)

  1. Verfahren zur Integration von auf XML basierenden Katalogen anhand einer adaptiven Anfrageevaluierung zur Vermeidung eines Rewritings mit lokalen Katalogen, mit einem globalen Katalog, der einem gemeinsamen Katalog der lokalen Kataloge darstellt und mit einer auf dem globalen Katalog vorgegebenen XPath-Anfrage Q mit Subanfragen qi, Q = q1 / q2 / .... / qn, dadurch gekennzeichnet, daß die XPath-Anfrage auf die lokalen Kataloge angewendet wird, wobei jede Subanfrage der XPath-Anfrage auf den lokalen Katalogen einer oder mehreren Transformationen unterworfen wird, und danach die transformierte Subanfrage ausgewertet wird, und wobei die Zwischenergebnisse und das lokale Endergebnis der Subanfragen mittels einer oder mehrerer Fitness-Funktionen für jeden lokalen Katalog ausgewertet werden, wobei die Fitness-Funktion die Priorisierung der Ergebnisse ermöglicht, und daß die lokalen Endergebnisse der XPath-Anfrage der lokalen Kataloge ausgewertet und als globales Endergebnis dargestellt werden.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Auswertung für alle lokalen Kataloge dieselbe Fitness-Funktion angewendet wird.
  3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Auswertung für verschiedene lokale Kataloge unterschiedliche Fitness-Funktionen angewendet werden.
  4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß eine Transformation der Subanfragen vorgesehen ist, bei der die Subanfrage der XPath-Anfrage auf dem lokalen Katalog genauso ausgewertet wird, wie sie vom Benutzer auf dem globalen Katalog ursprünglich spezifiziert wurde.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß eine Transformation der Subanfragen vorgesehen ist, bei der die Achse der Subanfrage der XPath-Anfrage auf dem globalen Katalog für den lokalen Katalog insofern verallgemeinert wird, als sich die Anfrage an einer vorangegangenen oder nachfolgenden Stelle des lokalen Katalogs findet.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß eine Transformation der Subanfragen vorgesehen ist, bei der die Subanfrage der XPath-Anfrage bei der Auswertung auf dem lokalen Katalog eliminiert wird.
  7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Fitness-Funktion jedem Knoten m eines Zwischenergebnisses, der aus einem Knoten n des vorhergehenden Zwischenergebnisses hervorgegangen ist, einen Wert vm = b1 2 + vn zuordnet, wenn keine Transformation stattgefunden hat, wobei b1 eine niveauabhängige Basis ist.
  8. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Fitness-Funktion jedem Knoten m eines Zwischenergebnisses, der aus einem Knoten n des vorhergehenden Zwischenergebnisses hervorgegangen ist, einen Wert vm = b1 + vn zuordnet, wenn als Transformation eine Verallgemeinerung stattgefunden hat, wobei b1 eine niveauabhängige Basis ist.
  9. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Fitness-Funktion jedem Knoten m eines Zwischenergebnisses, der aus einem Knoten n des vorhergehenden Zwischenergebnisses hervorgegangen ist, einen Wert vm = 1 + vn zuordnet, wenn als Transformation eine Eliminierung der Subanfrage stattgefunden hat.
  10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß als lokales Endergebnis der XPath-Anfrage auf dem lokalen Katalog die Knotenmenge ausgewählt wird, deren zugeordnete Werte der Fitness-Funktion am höchsten sind.
  11. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß zur Darstellung der lokalen Endergebnisse der lokalen Kataloge eine Endergebnis-Fitness-Funktion ausgewertet wird.
DE10157996A 2001-09-10 2001-11-23 Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen Expired - Fee Related DE10157996B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10157996A DE10157996B4 (de) 2001-09-10 2001-11-23 Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10144506.7 2001-09-10
DE10144506 2001-09-10
DE10157996A DE10157996B4 (de) 2001-09-10 2001-11-23 Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen

Publications (2)

Publication Number Publication Date
DE10157996A1 DE10157996A1 (de) 2003-04-24
DE10157996B4 true DE10157996B4 (de) 2006-04-06

Family

ID=7698489

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10157996A Expired - Fee Related DE10157996B4 (de) 2001-09-10 2001-11-23 Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen

Country Status (1)

Country Link
DE (1) DE10157996B4 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010061280A1 (de) 2010-12-16 2012-06-21 Klaus Benecke Verfahren zur Umstrukturierung von Daten sowie Computerprogramm zu seiner Ausführung

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2429095A1 (en) * 2003-05-16 2004-11-16 Cognos Incorporated System and method of data modelling

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUILLAUME, D.: An Application of XML and XLink Using a Graph-Partitioning Method and a Density Map for Information Retrieval and Knowledge Discovery, in ASP Conf.Ser., Vol. 172, 1999 *
MAY, W.: Integration of XML Data in XPathlog, Inerlaken, 4.6.2001 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010061280A1 (de) 2010-12-16 2012-06-21 Klaus Benecke Verfahren zur Umstrukturierung von Daten sowie Computerprogramm zu seiner Ausführung

Also Published As

Publication number Publication date
DE10157996A1 (de) 2003-04-24

Similar Documents

Publication Publication Date Title
DE60306186T2 (de) Verfahren und system zur anordnung von dienste in einer webdienstarchitektur
DE69805437T2 (de) Informationsmanagementsystem
DE69527926T2 (de) Ein mit Rechner durchgeführtes Verfahren und System zur Informationswiederauffindung
DE69813652T2 (de) System und Verfahren zum hierarchischen Zusammenstellen und Einordnen eines Satzes von Objekten in einem Abfragekontext
DE60015821T2 (de) System zur Verwaltung von Benutzercharakterisierenden Protokollkopfteilen
DE60004537T2 (de) In einer relationalen datenbank integriertes contextbasiertes system zur veröffentlichung und abonnierung
DE60014341T2 (de) Server, der die automatische einfügung von daten in elektronische formulare auf einem nutzer-computer ermöglicht
DE60025778T2 (de) Verfahren zum Speichern und Verwalten von Daten
EP1311989B1 (de) Verfahren zur automatischen recherche
DE112018004946T5 (de) Kognitive datenanonymisierung
DE102013222384B4 (de) Sicherheits-Screening auf Kontextgrundlage für Zugriff auf Daten
DE112016002395T5 (de) Zugriffskontrolle für Datenressourcen
DE112007001655T5 (de) System und Verfahren zum Bereitstellen eines Fernzugriffs auf Ereignisse von einem Datenbank-Zugriffssystem
DE10051021A1 (de) System, Verfahren und Computerprogramm zur Veröffentlichung interaktiver Web-Inhalte in einer statisch verknüpften Web-Hierarchie
DE112011100620T5 (de) Verfahren und system zum verwalten der lebensdauer von semantisch gekennzeichneten daten
WO2000023923A1 (de) Verfahren zur datenbankgestützten selektion von produkten für electronic-commerce-anwendungen im internet
DE10157996B4 (de) Verfahren zur adaptiven Anfrageevaluierung von auf XML basierenden Katalogen
EP1030254B1 (de) Verfahren und System zum Verwalten von Dokumenten
DE112021000573T5 (de) Hierarchische daten
Kunze et al. Repräsentation und Verknüpfung allgemeinsprachlicher und terminologischer Wortnetze in OWL
DE19959142A1 (de) Verfahren und Vorrichtung zum Übermitteln von Inhalten, insbesondere von Werbung
EP1170676A1 (de) Darstellung einer Informationsstruktur von Dokumenten des Word Wide Web
EP1051016B1 (de) Verfahren zum Auffinden einer Kontaktperson oder zum Verbindungsaufbau zu dieser Kontaktperson
DE102009037848A1 (de) Verfahren zum rechnergestützten Verarbeiten von digitalen semantisch annotierten Informationen
Scheu et al. The Olympic Games and the neglected sport: A repertory grid analysis

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8125 Change of the main classification

Ipc: G06F 944

8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee