DE102004036500A1 - Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term - Google Patents

Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term Download PDF

Info

Publication number
DE102004036500A1
DE102004036500A1 DE102004036500A DE102004036500A DE102004036500A1 DE 102004036500 A1 DE102004036500 A1 DE 102004036500A1 DE 102004036500 A DE102004036500 A DE 102004036500A DE 102004036500 A DE102004036500 A DE 102004036500A DE 102004036500 A1 DE102004036500 A1 DE 102004036500A1
Authority
DE
Germany
Prior art keywords
search
semantic
term
electronic
information units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102004036500A
Other languages
German (de)
Inventor
Jens Astor
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102004036500A priority Critical patent/DE102004036500A1/en
Publication of DE102004036500A1 publication Critical patent/DE102004036500A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The method involves generating a search domain having segmented information units, and determining an index for each segmented information unit. An electronic search query is generated by selecting a search term and the term is allocated to a predetermined semantic block. An electronic search is executed in the search domain using the search term, where the indices of the information units are searched according to the search term. Independent claims are also included for the following: (A) a computer program product with a program code unit stored in a machine readable medium for executing a method of processing an electronic search query, when executed in a computer (B) an search engine for processing an electronic search query.

Description

Verfahren sowie Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs, Elektronische Suchmaschine zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffsmethod and computer program with program code means and computer program product to process an electronic query under consideration a semantic context of a search term, electronic search engine to process an electronic query under consideration a semantic context of a search term

Die Anmeldung betrifft ein Verfahren sowie ein Computerprogramm mit Programmcode-Mitteln und ein Computerprogramm-Produkt zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs.The Application relates to a method and a computer program with Program code means and a computer program product for processing an electronic Search query under consideration a semantic context of a search term.

Die Erfindung betrifft weiterhin eine Vorrichtung zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs, d.h. eine elektronische Suchmaschine zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs.The The invention further relates to a device for processing a electronic query taking into account a semantic context of a search term, i. an electronic search engine for editing an electronic query considering a semantic Contexts of a search term.

Mit einer Bezeichnung "elektronische Suchmaschine", kurz "Suchmaschine" werden im Folgenden sowohl Suchmaschinen als auch Metasuchmaschinen umfasst.With a designation "electronic Search engine ", in short" search engine "are below includes both search engines and metasearch engines.

Aus [1] ist eine Übersicht über verschiedene deutschsprachige und internationale Suchmaschinen sowie deutschsprachige und internationale Metasuchmaschinen bekannt.Out [1] is an overview of various German-speaking and international search engines as well as German-speaking and international Metasearch engines known.

Suchmaschinen und Metasuchmaschinen [1]Search engines and metasearch engines [1]

Suchmaschinen im Allgemeinen sind Softwareprodukte, die ein Indizieren von Dokumenten, im Allgemeinen elektronisch gespeicherte Informationseinheiten, zur Generierung einer Suchmaschine zu Grunde liegenden und durchsuchbaren Dokumenten menge bzw. Datenbestands (Datenbasis) ermöglichen und über eine Benutzer-/Applikationsschnittstelle eine Suche auf Basis von vorgebbaren Suchbegriffen in einem solchen Datenbestand unterstützen.search engines in general, software products that are indexing documents, generally electronically stored information units, for generating a search engine underlying and searchable Allow document volume or database (database) and over a user / application interface performs a search based on support definable search terms in such a database.

Dabei wird im Folgenden der Begriff "Dokument" synonym mit einem Begriff "Profil" verwendet. Jedes Profil lässt sich nämlich auf Grund seiner Struktur in einem strukturierten Dokument darstellen. Umgekehrt kann jeder (semantische) Block eines Dokuments als Abschnitt eines Profils interpretiert werden.there In the following the term "document" becomes synonymous with a Term "profile" used. each Profile leaves Namely due to its structure in a structured document. Vice versa Any (semantic) block of a document can be considered a section of a document Profiles are interpreted.

Suchmaschinen im Speziellen, wie eine internationale Suchmaschine "GoogleTM" [4] oder eine deutschsprachige Suchmaschine "AltaVistaTM" [5], werden in diesem Sinn bzw. somit verwendet, um den der jeweiligen Suchmaschine zugrunde liegenden Datenbestand (Datenbasis), im Fall von Google ein WWW bzw. im Fall von AltaVista ein deutschsprachiger Teil des WWW oder eine Datenbank, nach vorgebbaren Suchbegriffen zu durchsuchen.Search engines in particular, such as an international search engine "Google TM " [4] or a German-language search engine "AltaVista TM " [5] are used in this sense or thus, to the respective search engine underlying data (database), in the case Google a WWW or in the case of AltaVista a German-speaking part of the WWW or a database to search for specifiable search terms.

In der Regel gibt ein Nutzer nach Start der Suchmaschine dieser einen oder mehrere – gegebenenfalls logisch miteinander verknüpfbare – Suchbegriffe vor, nach welchem bzw. nach welchen dann der Datenbestand (Datenbasis) der Suchmaschine, wie im Fall von Google das WWW bzw. im Fall von AltaVista der deutschsprachige Teil des WWW, durchsucht wird.In Usually a user gives this one after starting the search engine or more - if necessary Logically linked - Keywords before, after which or after which the database (database) the search engine, as in the case of Google the WWW or in the case of AltaVista the German-speaking part of the WWW, is searched.

Als Ergebnis einer solchen Suche, wie bei Google oder Alta-Vista, liefert die Suchmaschine Daten, welche mit dem vorgegebenen Suchbegriff im Zusammenhang stehen.When Result of such a search, as with Google or Alta Vista, delivers the Search engine data, which is related to the given search term stand.

Suchergebnisse können beispielsweise sein bestimmte Inhalte des WWW bzw. Inhalte des deutschsprachigen Teils des WWW, beschrieben jeweils durch eine zugehörige URL-Adresse, bestimmte Text- bzw. Bilddokumente oder auch bestimmte Verweise auf für den vorgegebenen Suchbegriff relevante Daten.search results can For example, be certain content of the WWW or content of the German-speaking Part of the WWW, each described by an associated URL, certain text or image documents or certain references on for the given search term relevant data.

Metasuchmaschinen, wie eine internationale Metasuchmaschine "MetaCrawler" [2] oder eine deutschsprachige Suchmaschine "MetaGer" [3], sind übergeordnete Suchmaschinen, unter welchen übergeordneten Suchmaschinen jeweils eine Mehrzahl von einzelnen Suchmaschinen, wie beispielsweise Google [4] und AltaVista [5], zusammengefasst sind.metasearch engines, such as an international metasearch engine "MetaCrawler" [2] or a German-language search engine "MetaGer" [3] are superordinate Search engines, under which parent Search engines each have a plurality of individual search engines, such as Google [4] and AltaVista [5] are.

In diesem Fall gibt ein Nutzer der Metasuchmaschine entsprechend vorheriger (Einzel-)Suchmaschinen, wie Google und Alta-Vista, einen Suchbegriff vor. Weiter kann der Nutzer in der Regel zusätzlich aus der Mehrzahl von den unter der Metasuchmaschine zusammengefassten Einzel-Suchmaschinen diejenige bzw. diejenigen auswählen, deren zugehörigen Datenbestand bzw. deren zugehörige Datenbestände, beispielsweise das WWW oder den deutschsprachigen Teil des WWW [4], [5], er nach dem vorgegebenen Suchbegriff durchgesucht haben möchte.In In this case, a user gives the metasearch engine accordingly (Single) search engines, such as Google and Alta Vista, a search term. Further the user can usually in addition from the majority of those summarized under the metasearch engine Single search engines select those or those whose associated Database or its associated Databases, for example, the WWW or the German-speaking part of the WWW [4], [5], he would like to search for the given search term.

Bei der Suche mittels einer Metasuchmaschine werden dann voneinander unabhängige (Einzel-)Suchen unter Verwendung der ausgewählten (Einzel-)Suchmaschinen durchgeführt und dabei deren Datenbestände nach dem vorgegebenen Suchbegriff durchsucht.at The search by means of a metasearch engine will then be mutually exclusive independent (Single) searches using the selected (single) search engines carried out and their datasets searched for the given search term.

Für die Suche übergibt die Metasuchmaschine an alle ausgewählten Einzel-Suchmaschinen den vorgegebenen Suchbegriff, meist zusammen mit Suchmaschinen-spezifischen Such- und/oder Steuerparametern.For the search passes the Metasuchmaschi ne to all selected individual search engines the given search term, usually together with search engine-specific search and / or control parameters.

Das (Gesamt-)Ergebnis einer solchen Suche unter Verwendung einer Metasuchmaschine umfasst dann die Einzel-Suchergebnisse, die von den einzelnen Suchmaschinen an die Metasuchmaschine übergeben werden.The (Total) result of such a search using a metasearch engine then includes the individual search results, passed from the individual search engines to the metasearch engine become.

Diese übergebenen Einzel-Suchergebnisse werden von der Metasuchmaschine – gegebenenfalls – nutzergerecht aufbereitet und zusammengefasst dargestellt.These handed over Individual search results are user-friendly by the metasearch engine - if applicable prepared and summarized.

Als Nachteil bei diesen Such- bzw. Metasuchmaschinen erweist sich, dass diese in der Regel eine Semantik von Suchbegriffen nicht berücksichtigen. Sie prüfen nur, ob ein gewünschter Suchbegriff in der jeweiligen Datenbasis bzw. Dokumentenmenge vorkommt, oder nicht.When Disadvantage of these search or metasearch machines proves that These usually do not consider a semantics of search terms. You check only if desired Search term occurs in the respective database or document set, or not.

Demzufolge liefert beispielsweise "Google" im Fall des Suchbegriffs "Java" nur Treffer für "Java" in Bedeutung einer Programmiersprache – jedoch keine Treffer für "Java" in Bedeutung als Bezeichnung für eine Insel – was hier eigentlich gewünscht war.As a result, For example, in the case of the search term "Java," "Google" only returns hits for "Java" in meaning Programming language - but none Results for "Java" in meaning as Designation for an island - what was actually wanted here.

Verschiedene Lösungsansätze sind hierfür aus dem Stand der Technik bekannt.Various Solutions are for this known in the art.

So verwenden Suchmaschinen, wie die Suchmaschine "Google" oder eine Suchmaschine "Askjeeves", verbesserte Verfahren, die beispielsweise eine Verlinkungshäufigkeit von Dokumenten oder statistische Assoziationen von Suchbegriffen nutzen.So use search engines, such as the search engine "Google" or a search engine "Askjeeves", improved procedures, for example, a linking frequency of documents or use statistical associations of search terms.

Dessen ungeachtet berücksichtigen die bekannten Suchmaschinen semantische Aspekte von Suchbegriffen nicht oder nur unzureichend und kennen keine semantischen Kontexte von indizierten Dokumenten.Whose regardless the well-known search engines semantic aspects of search terms not or only insufficiently and do not know any semantic contexts of indexed documents.

Dies hat in vielen Fällen die Konsequenz, dass nicht die gewünschten Suchergebnisse bzw. Dokumente gefunden werden oder diese in einer Rangreihenfolge einer Treffer- bzw. Ergebnisliste von einer die Suche durchführenden Suchmaschine zu weit nach hinten gesetzt werden.This has in many cases the consequence that not the desired search results or documents be found or ranked in a ranking order of a hit or result list of a search engine performing the search too far be set back.

Um hier verbesserte Suchergebnisse zu erhalten bzw. um eine Suche zielführender zu gestalten, müssen "geeignete" Kombinationen von in gegebenenfalls mit geeigneter logischer Verknüpfung verbundenen Suchbegriffen gefunden werden, die einen gewünschten semantischen Kontext bei einer Suche erzwingen.Around Here you will get improved search results or a more targeted search To design, must be "suitable" combinations of in optionally associated with suitable logical link search terms be found, which is a desired force semantic context in a search.

Hierzu können mehrere Suchbegriffe angegeben und mit einer Und-Verknüpfung verbunden werden. Auf diese Weise kann der nötige Kontext bei der Suchanfrage mit angegeben werden. Im Fall des Suchbeispiels nach der Insel Java könnte zusätzlich zu dem Begriff "Java" nach dem Begriff "Insel" gesucht werden. Unglücklicherweise kann auch hierbei nicht mit dem gewünschten Suchergebnis gerechnet werden. Dies liegt daran, dass auch im Kontext der Programmiersprache Java der Begriff "Insel" Verwendung findet.For this can several search terms are specified and linked with an AND link. In this way, the necessary Context can be specified in the search query. In the case of the search example after the island could Java in addition to the term "Java" is searched for the term "island". Unfortunately can not be expected here with the desired search result. This is because even in the context of the Java programming language the term "island" is used.

In vielen Fällen leidet auch eine Bedienbarkeit, eine Benutzerfreundlichkeit und eine Benutzerakzeptanz für eine Suchmaschine darunter.In many cases also suffers a usability, ease of use and a user acceptance for a search engine underneath.

Weitere bekannte Lösungsansatze zielen darauf ab, die in einer Datenbasis zusammengefassten Informationen, wie Daten und/oder Dokumente, zu strukturieren und mit hohem Detaillierungsgrad zu definieren, so dass Begriffe einer Suchanfrage gezielt mit Inhalten einer dann vorliegenden Datenstruktur verglichen werden können.Further known solution approaches aim to provide information summarized in a database, like data and / or documents, to structure and with high level of detail to define, so that terms of a query purposefully with content a then existing data structure can be compared.

Nachteilig an diesen Lösungsansätzen ist, dass eine Definition rigider Datenstrukturen nicht möglich ist, weil dies der Natur der Daten nicht entspricht oder eine Etablierung bzw. Generierung solcher Datenstrukturen bei rigiden Daten nur mit hohem Aufwand möglich ist.adversely At these solutions is that a definition of rigid data structures is not possible because of this nature the data does not correspond or an establishment or generation such data structures in rigid data only with great effort possible is.

Aus [7], welche auf eine Erfindungsmeldung der Siemens AG mit dem internen Aktenzeichen 2003e05241DE bzw. 2003P07517 DE zurückgeht, ist eine Entwicklung einer Domänenontologie bekannt.Out [7], which refers to a disclosure of the invention of Siemens AG with the internal Refers to 2003e05241DE or 2003P07517 DE is a development a domain ontology known.

Hierbei werden, wie aus [7] bekannt ist, für vorgebbare Domänen, gleich übergeordneten Klassen, wie beispielsweise die drei Domänen "Lebenslauf", "Angebot" oder "Pressemeldung", jeweils zu erwartende semantische Blöcke bzw. Kontexte defi niert, beispielsweise im Fall der Domäne "Lebenslauf" die Blöcke bzw. Kontexte "Adressdaten", "Schulausbildung", "Ausbildung", "Studium" sowie "Berufserfahrung".in this connection become, as is known from [7], for predeterminable domains, the same parent Classes, such as the three domains "Curriculum Vitae", "Offer" or "Press Release", respectively, to be expected semantic blocks or contexts defi ned, for example, in the case of the domain "CV" the blocks or Contexts "address data", "school education", "education", "study" and "work experience".

Jedem semantischen Block bzw. Kontext werden weiter Schlüsselworte, die den jeweiligen semantischen Block beschreiben, zugeordnet, beispielsweise dem semantischen Block "Adressdaten" (der Domäne "Lebenslauf") die Schlüsselwörter "Adresse", "Name", "Ort" und "Telefon".Each semantic block or context continue to be keywords, which describe the respective semantic block, for example the address data semantic block (the cv domain) contains the keywords address, name, location, and phone.

Auch ist aus [7] bekannt, Informationseinheiten wie Dokumente unter Verwendung dieser Domänenontologie bzw. unter Verwendung der Schlüsselworte der semantischen Blöcke zu segmentieren.Also is known from [7] using information units such as documents this domain ontology or using the keywords the semantic blocks to segment.

Aufgabe der vorliegenden Erfindung ist es, ein Verfahren sowie ein Computerprogramm mit Programmcode-Mitteln und ein Computerprogramm-Produkt zur Bearbeitung einer elektronischen Suchanfrage anzugeben, welche verbesserte Suchergebnisse liefern als bei obig beschriebenen Suchmaschinen zu erwarten ist.task The present invention is a method and a computer program with program code means and a computer program product for editing an electronic search query indicating improved search results deliver as expected in search engines described above.

Es ist weiterhin Aufgabe der Erfindung, eine Suchmaschine anzugeben, welche verbesserte Suchergebnisse liefert als bei obig beschriebenen Suchmaschinen zu erwarten ist.It Another object of the invention is to provide a search engine, which provides improved search results than the search engines described above is to be expected.

Diese Aufgaben werden mit einem Verfahren sowie einem Computerprogramm mit Programmcode-Mitteln und einem Computerprogramm-Produkt zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs sowie mit einer entsprechenden elektronischen Suchmaschine mit den Merkmalen gemäß dem jeweiligen unabhängigen Patentanspruch gelöst.These Tasks become with a procedure as well as a computer program with program code means and a computer program product for Processing of an electronic query under consideration a semantic context of a search term as well as a corresponding electronic one Search engine with the features according to the respective independent claim solved.

Bei dem Verfahren zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs wird ein Suchraum generiert, welcher gemäß vorgebbaren semantischen Blöcken segmentierte Informationseinheiten, insbesondere Dokumente, umfasst, durch Indizieren der segmentierten Informationseinheiten des Suchraums, wobei für jedes Segment einer segmentierten Informationseinheit ein Index ermittelt wird.at the method for processing an electronic query under Consideration of a semantic context of a search term, a search space is generated, which according to specifiable semantic blocks segmented information units, in particular documents, comprises, by Indexing the segmented information units of the search space, being for each segment of a segmented information unit is an index is determined.

Weiter wird eine elektronische Suchanfrage generiert durch Auswahl mindestens eines Suchbegriffs und Zuordnung des mindestens einen Suchbegriffs zu einem von den vorgebbaren semantischen Blöcken.Further An electronic search query is generated by selecting at least a search term and assignment of the at least one search term to one of the predefinable semantic blocks.

Ferner wird bei dem Verfahren eine elektronische Suche in dem Suchraum durchgeführt unter Verwendung des mindestens einen Suchbegriffs, wobei zumindest diejenigen Indizes nach dem mindesten einen Suchbegriff durchsucht werden, welche dem gleichen semantischen Block zugehörig sind wie die des mindestens einen Suchbegriffs.Further In the method, an electronic search is made in the search space carried out using the at least one search term, wherein at least searches those indexes for the least one search term which belong to the same semantic block as that of the at least one search term.

Die elektronische Suchmaschine zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs weist auf:

  • – eine Suchraumgenerierungseinrichtung, welche eingerichtet ist zur Generierung eines Suchraums, welcher gemäß vorgebbaren semantischen Blöcken segmentierte Informationseinheiten, insbesondere Dokumente, umfasst, durch Indizieren der segmentierten Informationseinheiten des Suchraums, wobei für jedes Segment einer segmentierten Informationseinheit ein Index ermittelt wird,
  • – eine Suchanfragegenerierungseinheit, welche eingerichtet ist zur Generierung einer elektronischen Suchanfrage durch Auswahl mindestens eines Suchbegriffs und Zuordnung des mindestens einen Suchbegriffs zu einem von den vorgebbaren semantischen Blöcken, und
  • – eine Sucheinheit, welche eingerichtet ist zur Durchführung einer elektronischen Suche in dem Suchraum unter Verwendung des mindestens einen Suchbegriffs, wobei zumindest diejenigen Indizes nach dem mindesten einen Suchbegriff durchsucht wer den, welche dem gleichen semantischen Block zugehörig sind wie die des mindestens einen Suchbegriffs.
The electronic search engine for processing an electronic search query taking into account a semantic context of a search term has:
  • A search space generating device which is set up for generating a search space which comprises segmented information units, in particular documents, in accordance with predeterminable semantic blocks, by indexing the segmented information units of the search space, an index being determined for each segment of a segmented information unit,
  • A search query generation unit which is set up to generate an electronic search query by selecting at least one search term and assigning the at least one search term to one of the predefinable semantic blocks, and
  • A search unit arranged to perform an electronic search in the search space using the at least one search term, wherein at least those indices are searched for the at least one search term associated with the same semantic block as that of the at least one search term.

Dabei wird bei der Erfindung unter einem semantischen Block ein Abschnitt bzw. ein Teil einer Informationseinheit bzw. eines Dokumentes verstanden, welcher einen gleichen semantischen Kontext aufweist, wie die semantischen Blöcke "Adressdaten", "Schulausbildung", "Ausbildung", "Studium" sowie "Berufserfahrung".there in the present invention, a portion under a semantic block or understood a part of an information unit or a document, which has a same semantic context as the semantic Blocks "Address data", "School education", "Education", "Study" and "Work experience".

Anschaulich gesehen besteht die Erfindung unter anderem aus einer semantischen Strukturierung sowie einer semantischen Extraktion von Informationseinheiten bzw. von Dokumentinhalten sowie einer entsprechenden Indizierung dieser Inhalte gemäß einer zugrunde liegenden Semantik.clear Seen, among other things, the invention consists of a semantic Structuring as well as a semantic extraction of information units or document content and corresponding indexing this content according to a underlying semantics.

So können Suchanfragen gezielt auf einen (von einem Benutzer) gewünschten semantischen Kontext gerichtet werden.So can Search queries targeted to one (by a user) desired be addressed semantic context.

Anschaulich bedeutet dies, dass – anstatt wie in der Regel bisher einen gesamten Inhalt eines Dokuments in einer einzigen Indexstruktur kontextlos abzulegen – eine Informationseinheit bzw. ein Dokument gemäß gewünschter semantischer Kontexte gegliedert und jeder dieser Kontexte getrennt indiziert wird.clear This means that - instead of like usually a whole content of a document in one single index structure without context - an information unit or a document according to the desired structured semantic contexts and separated each of these contexts is indexed.

Die Indizierung an sich kann dabei mittels herkömmlicher, klassischer Suchmaschinentechnologie erfolgen, d.h. es kann "on-top-of" gängiger Softwareprodukte aufgesetzt werden.The Indexing can be done using traditional, classic search engine technology take place, i. It can be "on-top of" popular software products be put on.

Dabei macht sich die Erfindung unter anderem drei wesentliche Aspekte zu Nutze:

  • a) Anwenden einer Heuristik: Informationen eines gleichen semantischen Kontextes liegen in Informationseinheiten bzw. Dokumenten strukturell nahe beieinander;
  • b) Ausnutzen eines impliziten semantischen Wissens eines Benutzers;
  • c) gegebenenfalls Zuhilfenahme – falls vorhanden – von Thesauri oder anderem begrifflichen Wissen.
The invention makes use, inter alia, of three essential aspects:
  • a) Applying a heuristic: Information of the same semantic context is structurally close in information units or documents;
  • b) exploiting an implicit semantic knowledge of a user;
  • (c) where appropriate, use of thesauri or other conceptual knowledge, if any sen.

Vorteilhaft an der Erfindung bzw. an der hier beschriebenen erfindungsgemäßen Vorgehensweise ist, dass diese die semantische Suche in, insbesondere teilstrukturierten, Dokumenten bestimmter Suchdomänen ermöglicht. Dadurch wird ein "Information Overload", d.h. eine Informationsüberflutung, bei Benutzern reduziert, welche Informationsüberflutung meist durch ungefilterte, i.e. ungewünschte, Informationen entsteht.Advantageous to the invention or to the inventive method described here, that this semantic search in, in particular semi-structured, Documents of certain search domains allows. This becomes an "information Overload ", i. an information overload, at Reduces the amount of information overload that is usually caused by unfiltered, i.e. unwanted, Information is created.

Die Erfindung vereinfacht hier in vorteilhafter Weise die Suche, macht sie zielführender und erhöht damit die Benutzbarkeit und die Nutzerakzeptanz gegenüber bisherigen, herkömmlichen Suchmaschinen.The Invention here advantageously simplifies the search makes you more purposeful and increases with it usability and user acceptance over previous, conventional ones Search engines.

Da die Erfindung bzw. die erfindungsgemäße Vorgehensweise auf klassische Suchmaschinentechnologie aufsetzt, d.h. sie kann "on-top-of" gängiger Softwareprodukte etabliert werden, hat sie keinen Nachteil gegenüber Verfahren anderer Suchmaschinen, sondern kann deren Nutzer stärken und gleichzeitig mehr Semantik bei Suchprozessen etablieren.There the invention or the procedure according to the invention on classical Search engine technology, i. It can be "on-top" of common software products established, it has no disadvantage compared to the procedures of other search engines, but can strengthen their users and at the same time establish more semantics in search processes.

Von weiterem Vorteil erweist sich bei der Erfindung, dass insbesondere die Berücksichtung einer Semantik bzw. eines semantischen Kontextes bei der Suche (intelligentes Suchverhalten) den Einsatz von automatisierten und/oder proaktiven Suchen, beispielsweise mittels so genannter Softwareagenten, unterstützt und/oder verbessert. Die Vernachlässigung einer Semantik hingegen verhindert oder erschwert den Einsatz von solchen automatisierten Suchen.From further advantage proves in the invention that, in particular the consideration a semantics or a semantic context in the search (intelligent Search behavior) the use of automated and / or proactive Search, for example by means of so-called software agents, supports and / or improved. Neglection Semantics, on the other hand, prevents or hampers the use of such automated searches.

Durch den durch die Erfindung möglichen bzw. verbesserten Einsatz von Software-Agenten eröffnet die Erfindung weitere Möglichkeiten. Beispielsweise kann das Ergebnis einer erfindungsgemäßen Suche als aufbereitete Eingabe für Matchmaking-Prozesse, wie sie aus [8] bekannt sind, dienen. Die bisherige Verwendung von Software-Agenten bzw. Suchagenten litt oft unter der fehlenden Semantik bei Suchanfragen bzw. Suchergebnissen.By the possible or possible by the invention improved use of software agents, the invention opens up more Options. For example, the result of a search according to the invention as prepared input for Matchmaking processes as they are known from [8] serve. The previous use of Software agents or search agents often suffered from the lack of semantics for search queries or search results.

In der Zielsetzung, nämlich einer semantischen Suche, vergleichbare, internationale Forschungsarbeiten auf dem Gebiet des "Semantic Web" [6] sehen eine semantische Aufbereitung von Webseiten durch explizite Annotation vor, d.h. die Webseiten erhalten zusätzlich Metainformation, die den semantischen Kontext der Inhalte beschreiben.In the objective, namely a semantic search, comparable international research in the field of "Semantic Web" [6] see a semantic Preparation of web pages by explicit annotation before, i. the web pages get additional Meta-information describing the semantic context of the content.

Der dafür notwendige Annotationsaufwand kann aber nicht oder nur schwer automatisiert werden.Of the necessary for this Annotation effort can not or only with difficulty automated become.

Den Autoren von Webseiten entsteht deshalb hoher zusätzlicher Aufwand bei der Erstellung und Pflege solcher annotierter Webseiten.The Authors of websites therefore creates high additional effort in the creation and Maintenance of such annotated websites.

Zusätzlich müssen die dafür notwendigen Ontologien zum Teil noch geschaffen und ebenfalls gepflegt werden.In addition, the necessary ontologies partly still created and maintained.

Man geht bei diesen Ansätzen aus der Forschung aber quasi immer von vollständigen Ontologien aus, die wesentlich komplexer sind, als die erfindungsgemäßen Dokumentenontologien, und demzufolge hohen Initialaufwand und hohen Zusatzaufwand durch Datenpflege erfordern.you goes with these approaches from the research but almost always from complete ontologies, the are much more complex than the document ontologies according to the invention, and Consequently, high initial effort and high overhead due to data maintenance require.

Die Erfindung setzt hier auf anderen Voraussetzungen auf. Sie ermöglicht deshalb eine semantische Suche, ohne explizite Annotation von Dokumenten zu fordern.The Invention here relies on other conditions. It therefore makes possible a semantic search, without explicit annotation of documents to promote.

Darüber hinaus "passt" sich die erfindungsgemäße Vorgehensweise zusätzlich an einen Benutzer an und reduziert damit den notwendigen Wartungsaufwand.In addition, the procedure according to the invention "fits" additionally to a user and thus reduces the necessary maintenance.

Das Computerprogramm mit Programmcode-Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Verfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.The Computer program with program code means is set up to all Perform steps according to the inventive method, if the program is running on a computer.

Das Computerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Verfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.The Computer program product stored on a machine-readable medium Program code means is arranged to perform all steps according to the method of the invention perform, if the program is running on a computer.

Das Computerprogramm mit Programmcode-Mitteln, eingerichtet um alle Schritte gemäß dem erfinderischen Verfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird, sowie das Computerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln, eingerichtet um alle Schritte gemäß dem erfinderischen Verfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird, sind insbesondere geeignet zur Durchführung des erfindungsgemäßen Verfahrens oder einer seiner nachfolgend erläuterten Weiterbildungen.The Computer program with program code means, set up at all Steps according to the inventive Perform proceedings, when the program is run on a computer, as well as the computer program product with program code means stored on a machine-readable carrier, arranged around all steps according to the inventive method to perform, if The program running on a computer is particular suitable for carrying out the inventive method or one of its further developments explained below.

Bevorzugte Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.preferred Further developments of the invention will become apparent from the dependent claims.

Die im Weiteren beschriebenen Weiterbildungen beziehen sich sowohl auf die Verfahren, die Suchmaschine als auch auf softwaretechnische Realisierungen.The Further developments described in the following relate to both the procedures, the search engine as well as software Realizations.

Die Erfindung und die im Weiteren beschriebenen Weiterbildungen können sowohl in Software als auch in Hardware, beispielsweise unter Verwendung einer speziellen elektrischen Schaltung, realisiert werden.The invention and hereinafter beschrie Further developments can be implemented both in software and in hardware, for example using a special electrical circuit.

Ferner ist eine Realisierung der Erfindung oder einer im Weiteren beschriebenen Weiterbildung möglich durch ein computerlesbares Speichermedium, auf welchem das Computerprogramm mit Programmcode-Mitteln gespeichert ist, welches die Erfindung oder Weiterbildung ausführt.Further is an implementation of the invention or one described below Continuing education possible by a computer-readable storage medium on which the computer program is stored with program code means, which is the invention or continuing education.

Auch kann die Erfindung oder jede im weiteren beschriebene Weiterbildung durch ein Computerprogrammerzeugnis realisiert sein, welches ein Speichermedium aufweist, auf welchem das Computerprogramm mit Programmcode-Mitteln gespeichert ist, welches die Erfindung oder Weiterbildung ausführt.Also can the invention or any further development described be realized by a computer program product, which is a Storage medium on which the computer program with program code means is stored, which performs the invention or training.

Die erfindungsgemäße Vorgehensweise ist grundsätzlich unabhängig davon einsetzbar, welche Art (Domänen oder Klassen) von Informationseinheiten bzw. Dokumenten durchsucht werden soll bzw. sollen. Sie kann auf Dokumente einer beliebigen semantischen Domäne bzw. übergeordneten Klasse angewandt werden. Beispielsweise ist das Segmentieren aus Lebensläufen, Angeboten, Nachfragen, Börsennachrichten, Pressemeldungen usw. möglich.The inventive approach is basically independently of which can be used, what kind (domains or classes) of information units or documents should be searched or should. She can Documents applied to any semantic domain or parent class become. For example, segmenting is made up of resumes, offers, Demands, stock market news, Press releases etc. possible.

In einer bevorzugten Ausgestaltung ist vorgesehen, jedem semantischen Block jeweils mindestens ein den jeweiligen semantischen Block beschreibendes Schlüsselwort zuzuordnen, unter Verwendung dessen die Informationseinheiten segmentierbar sind und/oder unter Verwendung dessen die elektronische Suchanfrage generierbar ist.In a preferred embodiment is provided, each semantic Block each at least one describing the respective semantic block keyword assign, using which the information units segmentable are and / or using the electronic query can be generated.

Zweckmäßig ist es jedem semantischen Block jeweils zwei, drei oder noch mehr den jeweiligen semantischen Block beschreibende Schlüsselwörter zuzuordnen. Dadurch kann eine Suchleistung gesteigert und ein Suchergebnis verbessert werden.Is appropriate each semantic block has two, three or even more assign descriptive keywords to each semantic block. This can improve search performance and improve search results.

Zweckmäßig und vorteilhaft ist es auch, wenn zu jedem Schlüsselwort eine Liste mit Synonymen bereitgestellt wird. Solche Synonymlisten sind bereits in gängigen Textverarbeitungsprogrammen unter dem Begriff "Thesaurus" bekannt. Darüber hinaus können zweckmäßigerweise auch unter Ausnutzung einer Hierarchiestruktur Ober- und/oder Unterbegriffe berücksichtigt werden.Practical and It is also advantageous if for each keyword a list of synonyms provided. Such Synonymlisten are already in common word processing programs the term "thesaurus" known. Furthermore can expediently also using a hierarchical structure upper and / or lower terms considered become.

Auch ist es sinnvoll, die einem semantischen Block zugeordne ten Schlüsselwörter zu aktualisieren.Also it makes sense to assign the keywords assigned to a semantic block To update.

Die Aktualisierung kann derart erfolgen, dass die einem semantischen Block zugeordneten Schlüsselwörter mit weiteren diesen semantischen Block beschreibenden Schlüsselwörtern gegebenenfalls kontinuierlich ergänzt werden.The Updating can be done in a way that is semantic Block associated with keywords possibly further continuously describing further keywords describing this semantic block added become.

Dabei können die ergänzten Schlüsselwörter unter Verwendung häufig verwendeter Suchbegriffe ermittelt werden.there can the supplemented Keywords below Use frequently used search terms are determined.

Auch kann die Aktualisierung derart erfolgen, dass die Zuordnung von mindestens einem, einem semantischen Block zugeordneten Schlüsselwort gelöscht wird, welches mindestens eine Schlüsselwort wenig oder nie, insbesondere als Suchbegriff und/oder bei der Segmentierung der Informationseinheiten und/oder bei der Generierung der elektronischen Suchanfrage, verwendet wird.Also the update can be done such that the assignment of at least one keyword associated with a semantic block deleted which is at least one keyword little or never, in particular as a search term and / or in the segmentation of the information units and / or when generating the electronic query becomes.

In einer weiteren bevorzugten Ausgestaltung ist es vorgesehen, dass bei der Generierung der elektronischen Suchanfrage zwei, drei oder noch mehr Suchbegriffe ausgewählt und zugeordnet werden.In Another preferred embodiment provides that when generating the electronic query two, three or even more keywords selected and be assigned.

Auch ist es zweckmäßig, dass der Index für ein Segment einer segmentierten Informationseinheit unter Verwendung einer Indexer-API ermittelt wird. Damit lassen sich herkömmliche Suchmechanismen in die Erfindung einbinden.Also it is appropriate that the index for a Segment of a segmented information unit using an indexer API. This can be conventional Include search mechanisms in the invention.

Gleiche gilt, wenn die elektronische Suche unter Verwendung einer Such-API ermittelt wird.Same applies when the electronic search using a search API is determined.

In einer weiteren bevorzugten Ausgestaltung ist vorgesehen, dass die Auswahl des mindestens einen Suchbegriffs unter Verwendung einer Benutzerschnittstelle, insbesondere eines Webbasierten Suchinterfaces, erfolgt.In Another preferred embodiment provides that the Selection of the at least one search term using a User interface, in particular a web-based search interface, he follows.

Hierbei kann die Benutzerschnittstelle eine strukturierte, insbesondere eine hierarchisch strukturiere, Suchmaske aufweisen, welche zumindest für einen der vorgebbaren semantischen Blöcken ein Eingabefeld und/oder ein Auswahlfeld aufweist.in this connection The user interface can be a structured, in particular have a hierarchical structure, search mask, which at least for one the predefinable semantic blocks has an input field and / or a selection field.

Unter Verwendung des Eingabefeldes und/oder des Auswahlfeldes wird dann der mindestens eine Suchbegriff ermittelt.Under Use of the input field and / or the selection field is then the determined at least one search term.

Auch kann – alternativ oder zusätzlich – vorgesehen sein, dass die Auswahl des mindestens einen Suchbegriffs unter Verwendung eines vorgebbaren Referenzprofils oder Referenzdokuments, welches gemäß den vorgebbaren semantischen Blöcken segmentiert wird, erfolgt.Also can - alternatively or additionally - provided be that selecting the at least one search term using a predefinable reference profile or reference document, which according to the specifiable semantic blocks is segmented takes place.

Hierbei wird aus den Segmenten des segmentierten Referenzprofils oder Referenzdokuments der mindestens eine Suchbegriff extrahiert, insbesondere über ein Extraktionsverfahren gemäß der Indizierung der segmentierten Informationseinheiten.in this connection is made up of segments of the segmented reference profile or reference document extracted at least one search term, in particular via a Extraction method according to the indexing the segmented information units.

Weitere Vorteile, Merkmale und Einzelheiten der Erfindung werden nachfolgend anhand von einem Ausführungsbeispiel und zu dem Ausführungsbeispiel zugehörigen Figuren näher beschrieben. Es zeigen:Further Advantages, features and details of the invention will become apparent below based on an embodiment and to the embodiment associated Figures closer described. Show it:

1 einen Ablauf des erfindungsgemäßen ontologiebasierten Verfahrens zur semantischen Indexierung und (semantische) Suche von/in Dokumenten und Profilen, 1 a sequence of the ontology-based method according to the invention for semantic indexing and (semantic) search of / in documents and profiles,

2 eine Skizze, welche eine Definition einer Ontologie einer Dokumentenstruktur(-en) und zu indizierenden semantischen Blöcke gemäß einem Ausführungsbeispiel verdeutlicht, 2 a sketch illustrating a definition of an ontology of a document structure (s) and to be indexed semantic blocks according to an embodiment,

3 eine Skizze, welche eine Fuzzy-Segmentierung von Dokumenten und eine Ex traktion von Information gemäß einem Ausführungsbeispiel verdeutlicht, 3 a sketch illustrating a fuzzy segmentation of documents and an ex traction of information according to an embodiment,

4 eine Skizze, welche eine Indizierung von Dokumenten gemäß einem Ausführungsbeispiel verdeutlicht, 4 a sketch illustrating an indexing of documents according to an embodiment,

5 eine Skizze, welche eine ontologiebasierte Suche gemäß einem Ausführungsbeispiel verdeutlicht, 5 a sketch illustrating an ontology-based search according to an embodiment,

Ausführungsbeispiel: Semantische Suche/Suchmaschine bzw. Ontologiebasiertes Verfahren zur semantischen Indexierung und (semantische) Suche von/in Dokumenten und ProfilenEmbodiment: Semantic Search / search engine or ontology-based method for semantic Indexing and (semantic) search of / in documents and profiles

Überblick (vgl. 1)Overview (cf. 1 )

Die ausführungsgemäße semantische Suche/Suchmaschine 1 bzw. das ausführungsgemäße Indizierungs- und Suchverfahren 1 enthält – wie in 1 dargestellt ist – vier wesentliche – nachfolgend im Detail beschriebene – Schritte (A) bis D) bzw. 100 bis 130), die mit unterschiedlicher Häufigkeit mehrfach durchlaufen werden.The semantic search / search engine 1 or the indexing and search method 1 according to the embodiment comprises - as in FIG 1 is shown - four essential - described in detail below - steps (A) to D) or 100 to 130 ), which are repeated several times at different frequencies.

Die Schritte sind im Einzelnen:

  • A) Definition einer Ontologie der Dokumentenstruktur(-en) und der zu indizierenden semantischen Blöcke – Schritt 100
  • B) Indizieren von Dokumenten gemäß dieser Ontologie – Schritt 110
  • C) Von einem Benutzer initiierte semantische Suche unter Verwendung der indizierten Indizes – Schritt 130
  • D) Automatische Verwaltung der Indexwörter – Schritt 140A
The steps are in detail:
  • A) Definition of an ontology of the document structure (s) and the semantic blocks to be indexed - Step 100
  • B) Index documents according to this ontology step 110
  • C) User-Initiated Semantic Search Using Indexed Indexes - Step 130
  • D) Automatic management of the index words - step 140A

A) Definition einer Ontologie der Dokumentenstruktur(-en) (vgl. 2) und der zu indizierenden semantischen Blöcke – Schritt 100 A) Definition of an ontology of the document structure (s) (cf. 2 ) and the semantic blocks to be indexed - step 100

In einem ersten, auch aus der DE 10 339 467.2 bekannten Schritt 100 wird einmalig festgelegt, welche semantischen Blöcke 300 bei der Suche in Dokumenten 310 berücksichtigt werden.In a first, also from the DE 10 339 467.2 known step 100 is determined once which semantic blocks 300 when searching in documents 310 be taken into account.

D.h., es wird eine Domänenontologie 200 entworfen, die die wesentlichen semantischen Bezüge, die sich in den Dokumenten 310 widerspiegeln, beschreibt.That is, it becomes a domain ontology 200 designed the essential semantic references that are reflected in the documents 310 reflect, describes.

Beispiel 210:example 210 :

"Lebensläufe" bestehen in der Regel aus den semantischen Blöcken 300"Zur Person", "Berufserfahrung", "Schulbildung", "Studium", "Berufsausbildung", "Praktika", "persönliche Interessen", ... ."CVs" usually consist of the semantic blocks 300 ' Personal, professional experience, school education, study, vocational training, internships, personal interests, ....

Jeder dieser Blöcke 300 lässt sich weiter (unter-(gliedern. Zum Beispiel enthält der Block "Zur Person" 301 normalerweise die (Sub-)Blöcke "Name", "Adresse" – hier beispielsweise mit noch weiterer Untergliederung in Blöcke "Strasse", "Stadt", "Postleitzahl"–, "Telefon", "E-Mail", ... . Der Block "Studium" 302 wiederum enthält die (Sub-)Blöcke "Abschluss", "Studienort", "Hochschule", "Studiengang", ... . In 2 sind hiervon nur die Blöcke "Zur Person" 301 und "Studium" 302 gezeigt.Each of these blocks 300 can be further subdivided (for example, the block "To Person" contains 301 usually the (sub-) blocks "Name", "Address" - here, for example, with further subdivision into blocks "street", "city", "postcode" -, "telephone", "e-mail", .... The block "Studium" 302 In turn, the (sub-) blocks contain "degree", "place of study", "university", "study course", .... In 2 are only the blocks "To Person" 301 and "study" 302 shown.

Je feiner eine solche Aufteilung vorgenommen wird bzw. werden kann, desto präziser kann anschließend nach semantischen Inhalten gesucht werden.ever more finely such a division is or can be made, the more precise can subsequently to search for semantic content.

Es handelt sich aber dabei aber ausschließlich um eine Strukturierung auf semantischer Ebene, d.h., die zu entwerfende Dokumentenontologie 220 beschreibt nicht die (Daten-)Struktur eines Dokuments, sondern nur welche inhaltlichen Blöcke zu erwarten sind.But it is all about a structuring on a semantic level, ie, the document ontology to be drafted 220 does not describe the (data) structure of a document, but only what content blocks are to be expected.

Diese inhaltlichen Blöcke stehen oftmals in direkter Verbin dung zum semantischen Kontext (Heuristik).These content blocks are often in direct connection to the semantic context (heuristics).

Je nach gewünschter Granularität, kann die zu entwerfende Dokumentenontologie 220 eine unterschiedlich stark verzweigte Baumhierarchie bilden. Die Knoten 225 sind darin die einzelnen semantischen Blöcke 300. Für jeden dieser Knoten 225 werden anschließend initiale Schlüsselwörter 250 definiert, die zur Identifizierung der semantischen Blöcke 300 dienen können.Depending on the desired granularity, the documentary to be designed 220 form a different branched tree hierarchy. The knots 225 they are the individual semantic blocks 300 , For each of these nodes 225 then become initial keywords 250 Defined to identify the semantic blocks 300 can serve.

Dies können entweder:

  • a) typische Schlüsselwörter 251 sein, die einen semantischen Block einleiten;
  • b) typische Schlüsselwörter 252 des Inhalts eines semantischen Blocks sein.
These can either be:
  • a) typical keywords 251 be that initiate a semantic block;
  • b) typical keywords 252 content of a semantic block.

Beispiele für den Anwendungsfall 210 "Lebensläufe" (2)

  • – semantischer Block "Zur Person" 301: a) Einleitende Schlüsselwörter 251: "Person", "Name", b) Schlüsselwörter 252 des Inhalts: "Name", "Adresse", "Telefon", "Strasse", "Wohnort", "Geburtsort/-datum",
  • – semantischer Block "Studium" 302: a) Einleitende Schlüsselwörter 251: "Studien", "Studium", "Akademischer Werdegang", "Studienzeit", ... b) Schlüsselwörter 252 des Inhalts: "Studium", "Diplom", "Magister Artium", "Universität", "Hochschule", ...
Examples of the use case 210 "CVs" ( 2 )
  • - semantic block "to person" 301 : a) Introductory keywords 251 : "Person", "Name", b) Keywords 252 of contents: "name", "address", "telephone", "street", "place of residence", "place of birth / date of birth",
  • - semantic block "Studium" 302 : a) Introductory keywords 251 : "Studies", "Studies", "Academic Career", "Study Time", ... b) Keywords 252 content: "Studium", "Diplom", "Magister Artium", "University", "Hochschule", ...

Auch hier kann man von einer baumartigen Schlüsselworthierarchie ausgehen, d.h. die Schlüsselwörter in tieferen Hierarchieebenen können oftmals nach oben in höhere Hierarchieebenen propagiert werden.Also here one can assume a tree-like key hierarchy, i.e. the keywords in deeper hierarchical levels can often higher in higher Hierarchy levels are propagated.

Beispiel: Die Schlüsselwörter "Name", "Vorname", "Geburtsname", "Familienname", ... sind bezeichnend für den semanti schen Block "Name", ebenso weisen sie aber auch auf den semantischen Block "Zur Person" 301 hin.Example: The keywords "name", "first name", "maiden name", "family name", ... are indicative of the semantic block "name", but they also point to the semantic block "to person" 301 out.

Die Definition der initialen Schlüsselwörter (2) ist ein einmaliger Vorgang, da eine automatische Verwaltung (vgl. Schritt D) 130) die Aktualität und den Umfang dieser Indexwörter sicherstellt bzw. unterstützt.The definition of the initial keywords ( 2 ) is a one-time process because automatic administration (see step D) 130 ) ensures the timeliness and scope of these index words.

Damit ist der Schritt A 100 abgeschlossen. Dokumente 310 können nun gezielt indiziert (4) werden, so dass eine semantische Suche (5, Schritt C) 120) möglich wird.This is step A 100 completed. Documents 310 can now be targeted ( 4 ), so that a semantic search ( 5 , Step C) 120 ) becomes possible.

Die aus diesem Schritt A) 100 hervorgegangenen Definitionen dienen als Konfiguration für Schritt B) 110.The from this step A) 100 resulting definitions serve as configuration for step B) 110 ,

B) Indizieren von Dokumenten gemäß dieser Ontologie (vgl. 3 und 4) – Schritt 110 B) indexing documents according to this ontology (cf. 3 and 4 ) - step 110

Schritt B) 110 ist für jedes neue oder geänderte Dokument 310 durchzuführen, das bei einer semantischen Suche berücksichtigt werden soll. Jedes Dokument 310 wird dadurch Bestandteil des Suchraums 305.Step B) 110 is for every new or changed document 310 to be considered in a semantic search. Every document 310 becomes part of the search space 305 ,

Die Dokumente 310 werden unter Verwendung des aus [7] bekannten Verfahrens mithilfe der initialen Begriffe 250 der semantischen Blöcke "fuzzy" segmentiert 350.The documents 310 be using the method known from [7] using the initial terms 250 segmented the semantic blocks "fuzzy" 350 ,

Die Informationen der dadurch gefundenen Blöcke 300 werden – wie weiter aus [7] bekannt ist – gefiltert, beispielsweise durch Rauschentfernung, Stammformbildung, Normierung, ..., und extrahiert.The information of the found blocks 300 are - as further from [7] known - filtered, for example, by noise removal, root formation, normalization, ..., and extracted.

Ergebnis dieses Schrittes B) 110 (3) ist, dass das Dokument 310 gemäß der vorher definierten semantischen Blöcke 300 segmentiert wurde, und die Inhalte der einzelnen Blöcke 300 nun als extrahierte Wortliste zur Verfügung stehen.Result of this step B) 110 ( 3 ) is that the document 310 according to the previously defined semantic blocks 300 was segmented, and the contents of each block 300 now available as an extracted word list.

Das Dokument 310 wird gemäß 4 nun für jede dieser Wortlisten einzeln dem Indexierer, beispielsweise einer Indexer-API 361, einer klassischen Suchmaschine 362 übergeben. D.h. es wird mehrfach gemäß der definierten semantischen Blöcke 300 indiziert 360.The document 310 is according to 4 now, for each of these word lists, individually to the indexer, such as an indexer API 361 , a classic search engine 362 to hand over. That is, it is repeated according to the defined semantic blocks 300 indicated 360 ,

Die dafür eingesetzte klassische Suchmaschine 362 verwaltet mehrere Indizes 365; für einen pro semantischen Block 300.The classic search engine used for this 362 manages multiple indexes 365 ; for one per semantic block 300 ,

Jedes so indizierte Dokument 310 kann nun in Suchabfragen 401, 402 (Schritt C) 120) bei der semantischen Suche 400 berücksichtigt werden (5).Each indexed document 310 can now search queries 401 . 402 (Step C) 120 ) in the semantic search 400 be taken into account ( 5 ).

C) Von einem Benutzer initiierte semantische Suche unter Verwendung der indizierten Indizes (vgl. 5) – Schritt 120 C) User-initiated semantic search using the indexed indexes (cf. 5 ) - step 120

Auf allen Dokumenten 310, die durch Schritt B) 110 indiziert wurden (vgl. Suchraum 305), kann nun eine semantische Suche 400 durchgeführt werden. Es gibt hierfür zwei Alternativen 401, 402, welche sich nicht gegenseitig ausschließen:On all documents 310 by step B) 110 were indexed (see search space 305 ), can now do a semantic search 400 be performed. There are two alternatives for this 401 . 402 that are not mutually exclusive:

Alternative 1 – Suchschnittstelle 401 Alternative 1 - Search interface 401

Den Benutzern wird eine Suchschnittstelle 410 geboten, beispielsweise ein Web-UI 410, die es ermöglicht, gemäß der Domänenontologie Suchbegriffe 411 für die verschiedenen semantischen Blöcke 300 zu definieren.The users will have a search interface 410 offered, for example a Web UI 410 , which makes it possible to search terms according to domain ontology 411 for the different semantic blocks 300 define.

Hier hat dann der Benutzer keine freie Eingabemaske – was aber auch möglich ist-, in die er dann Suchbegriffe kontextlos aufzählt, sondern eine strukturierte, unter Umständen hierarchische, Suchmaske 410, die für verschiedene semantischen Blöcke 300 unterschiedliche Eingabefelder 311 vorsieht.Here then the user has no free input mask - which is also possible - in which he then enumerates search terms contextless, but a structured, possibly hierarchical, search mask 410 which are for different semantic blocks 300 different input fields 311 provides.

Die vom Benutzer in diesen Eingabefeldern 311 genannten Begriffe werden anschließend bei der Suche 400 (i.e. Aufruf an das Such-API 363) verwendet, um in den dafür getrennt vorhandenen Indizes 365 zu suchen.The user in these input fields 311 These terms are subsequently used in the search 400 (ie call to the search API 363 ) used in the indexes that are separate for it 365 to search.

Die Suchmaschine 362 liefert somit nur Treffer, die Begriffe im gleichen semantischen Kontext/Block vorweisen, wie vom Benutzer gewünscht.The search engine 362 thus delivers only hits, the concepts in the same semantic Kon show text / block as desired by the user.

Alternative 2 – Beispieldokument 402 Alternative 2 - sample document 402

Eine andere Möglichkeit des Suchens 400 ist, anhand eines Beispieldokumentes 420 zu suchen. D.h. anstatt eine strukturierte Suchmaske 410 zu verwenden, wird von Benutzerseite – oder von einem Software-Agenten – ein Referenzprofil/dokument 420 vorgegeben, dass ebenfalls wie in Schritt B) 110 beschrieben "fuzzy" segmentiert 421 und extrahiert 421 wird.Another way of searching 400 is, based on a sample document 420 to search. That is, instead of a structured search mask 410 is used by the user side - or by a software agent - a reference profile / document 420 given that also as in step B) 110 described "fuzzy" segmented 421 and extracted 421 becomes.

Das Ergebnis der Extraktion wird als Eingabe für eine strukturierte Suchmaske bzw. Such-API 363 übernommen, und anschließend wie bei Alternative 1 gesucht.The result of the extraction is used as input for a structured search mask or search API 363 and then searched as in alternative 1.

Unabhängig von der gewählten Alternative 401, 402 können die eingegebenen oder identifizierten Suchbegriffe um weitere Begriffe aus Domänen (un-)spezifischen Thesauri 500 – sofern vorhanden – ergänzt werden.Regardless of the chosen alternative 401 . 402 The entered or identified search terms may contain additional terms from domains (non) specific thesauri 500 - if available - be supplemented.

Die Suchanfrage wird dadurch "intelligent" erweitert, indem beispielsweise Synonyme, Ober- und Unterbegriffe zu den verwendeten Suchbegriffen hinzugefügt werden, oder Begriffe aus anderen Taxonomien genutzt werden, wie zum Beispiel DIN-Tabellen oder Krankheitsklassifikationssysteme ICD-10.The The search query will be expanded to "intelligent" by: For example, synonyms, upper and lower terminology to the used Added search terms be used, or terms from other taxonomies, such as for example DIN tables or disease classification systems ICD-10.

Als Beispiele für Domänen-(un-)spezifische Thesauri sind u.a. WordNet, German-WordNet oder UMLS zu nennen.When examples for Domain (non) specific thesauri are u.a. WordNet, German-WordNet or UMLS.

D) Automatische Verwaltung der Indexwörter – Schritt 130 D) Automatic management of the index words - step 130

Das ausführungsgemäße verfahren ist umso besser, je präziser und mächtiger die Schlüsselwörter 250 der einzelnen semantischen Blöcke 300 sind, die zur "fuzzy" – Segmentierung 350 der Dokumente 310 während der Indizierungsphase (vgl. 3) dienen.The embodiment method is better, the more precise and powerful the keywords 250 the individual semantic blocks 300 are those that cause "fuzzy" segmentation 350 the documents 310 during the indexing phase (cf. 3 ) serve.

Um diese Schlüsselwörter 250 aktuell zu halten, können die von den Benutzern vorgegebenen Suchbegriffe 411 aus Schritt C) 120 kontinuierlich genutzt, und damit die Liste der Schlüsselwörter aktuell gehalten werden.To these keywords 250 keep the current search terms 411 from step C) 120 used continuously, keeping the list of keywords up-to-date.

Die häufigsten Suchbegriffe werden in die Menge der Segmentierungsbegriffe übernommen, während selten oder nie gesuchte Wörter aus der Liste der Segmentierungsbegriffe genommen werden.The common Search terms are included in the set of segmentation terms, while rarely or never searched words be taken from the list of segmentation terms.

In diesem Dokument sind folgende Schriften zitiert:

  • [1] Überblick über Metasuchmaschinen und Suchmaschinen, erhältlich am 16.05.2003 unter: http://www.heise.de/ct/tipsundtricks/cttt7.shtml#7_6;
  • [2] Internationale Metasuchmaschine "MetaCrawler", erhältlich am 16.05.2003 unter: http://www.metacrawler.com/info.metac/dog/index.htm;
  • [3] Deutschsprachige Metasuchmaschine "MetaGer", erhältlich am 16.05.2003 unter: http://meta.rrzn.uni-hannover.de/;
  • [4] Internationale Suchmaschine "Google", erhältlich am 16.05.2003 unter: http://www.google.de/;
  • [5] Deutschsprachige Suchmaschine "AltaVista", erhältlich am 16.05.2003 unter: http://de.altavista.com/.
  • [6] Überblick über das "Semantic Web", erhältlich am 20.07.2004 unter: http://www.w3.org/2001/sw/.
  • [7] Deutsche Patentanmeldung vom 27.08.2003 mit dem amtlichen Aktenzeichen 103 39 467.2
  • [8] WO 02/06974 A2
The following references are cited in this document:
  • [1] Overview of metasearch engines and search engines, available on May 16, 2003 at: http://www.heise.de/ct/tipsundtricks/cttt7.shtml#7_6;
  • [2] MetaCrawler International Metasearch Engine, available on May 16, 2003 at: http://www.metacrawler.com/info.metac/dog/index.htm;
  • [3] German-language metasearch engine "MetaGer", available on May 16, 2003 at: http://meta.rrzn.uni-hannover.de/;
  • [4] International search engine "Google", available on May 16, 2003 at: http://www.google.de/;
  • [5] German-language search engine "AltaVista", available on May 16, 2003 at: http://de.altavista.com/.
  • [6] Overview of the "Semantic Web", available on July 20, 2004 at: http://www.w3.org/2001/sw/.
  • [7] German patent application dated 27.08.2003 with the official file number 103 39 467.2
  • [8] WO 02/06974 A2

Claims (20)

Verfahren zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs, mit den Schritten: – Generierung eines Suchraums, welcher gemäß vorgebbaren semantischen Blöcken segmentierte Informationseinheiten, insbesondere Dokumente, umfasst, durch Indizieren der segmentierten Informationseinheiten des Suchraums, wobei für jedes Segment einer segmentierten Informationseinheit ein Index ermittelt wird, – Generierung einer elektronischen Suchanfrage durch Auswahl mindestens eines Suchbegriffs und Zuordnung des mindestens einen Suchbegriffs zu einem von den vorgebbaren semantischen Blöcken, – Durchführung einer elektronischen Suche in dem Suchraum unter Verwendung des mindestens einen Suchbegriffs, wobei zumindest diejenigen Indizes nach dem mindesten einen Suchbegriff durchsucht werden, welche dem gleichen semantischen Block zugehörig sind wie die des mindestens einen Suchbegriffs.Method for processing an electronic Search query under consideration a semantic context of a search term, with the steps: - Generation a search space, which according to specifiable semantic blocks segmented information units, in particular documents, comprises by indexing the segmented information units of the search space, being for each segment of a segmented information unit is an index is determined - Generation an electronic search by selecting at least one Search terms and assignment of at least one search term one of the predefinable semantic blocks, - Implementation of an electronic Search in the search space using the at least one search term, at least those indices after the at least one search term be searched, which belong to the same semantic block like the at least one search term. Verfahren nach mindestens dem voranstehenden Anspruch, – bei dem jedem semantischen Block jeweils mindestens ein den jeweiligen semantischen Block beschreibendes Schlüsselwort zugeordnet wird, unter Verwendung dessen die Informationseinheiten segmentierbar sind und/oder unter Verwendung dessen die elektronische Suchanfrage generierbar ist.Method according to at least the preceding claim, - in which each semantic block at least one respective semantic Block descriptive keyword is assigned using the information units segmentable and / or using the electronic Search query can be generated. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem jedem semantischen Block jeweils zwei, drei oder noch mehr den jeweiligen semantischen Block beschreibende Schlüsselwörter zugeordnet werden.Method according to at least one of the preceding Claims, - in which each semantic block, two, three or even more each semantic block descriptive keywords are assigned. Verfahren nach einem der vorhergehenden Ansprüche, – bei dem einem Schlüsselwort eine Liste mit Synonymen und/oder Oberbegriffen und/oder Unterbegriffen, insbesondere unter Verwendung eines Thesaurus, bereitgestellt wird.Method according to one of the preceding claims, In which a keyword is provided with a list of synonyms and / or generic terms and / or sub-terms, in particular using a thesaurus. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem die einem semantischen Block zugeordneten Schlüsselwörter aktualisierbar sind.Method according to at least one of the preceding Claims, - in which the keywords associated with a semantic block are updatable. Verfahren nach mindestens dem voranstehenden Anspruch, – bei dem die Aktualisierung derart erfolgt, dass die einem semantischen Block zugeordneten Schlüsselwörter mit weiteren diesen semantischen Block beschreibenden Schlüsselwörter ergänzt werden.Method according to at least the preceding claim, - in which the update is done in such a way that the semantic block associated keywords with additional keywords describing this semantic block are added. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem die ergänzten Schlüsselwörter unter Verwendung häufig verwendeter Suchbegriffe ermittelt werden.Method according to at least one of the preceding Claims, - in which the supplemented Keywords below Use frequently used search terms are determined. Verfahren nach mindestens einem der drei voranstehenden Ansprüche, – bei dem die Aktualisierung derart erfolgt, dass die Zuordnung von mindestens einem, einen semantischen Block zugeordneten Schlüsselwort gelöscht wird, welches mindestens eine Schlüsselwort wenig oder nie, insbesondere als Suchbegriff und/oder bei der Segmentierung der Informationseinheiten und/oder bei der Generierung der elektronischen Suchanfrage, verwendet wird.Method according to at least one of the preceding three Claims, - in which the update is done in such a way that the assignment of at least a keyword associated with a semantic block is deleted, which at least one keyword little or never, especially as a search term and / or in the segmentation the information units and / or the generation of the electronic query, is used. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem bei der Generierung der elektronischen Suchanfrage zwei, drei oder noch mehr Suchbegriffe ausgewählt und zugeordnet werden.Method according to at least one of the preceding Claims, - in which when generating the electronic query two, three or even more keywords selected and be assigned. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem der Index für ein Segment einer segmentierten Informationseinheit unter Verwendung einer Indexer-API ermittelt wird.Method according to at least one of the preceding Claims, - in which the index for a segment of a segmented information unit using an indexer API. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem die elektronische Suche unter Verwendung einer Such-API ermittelt wird.Method according to at least one of the preceding Claims, - in which the electronic search is determined using a search API becomes. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem die Auswahl des mindestens einen Suchbegriffs unter Verwendung einer Benutzerschnittstelle, insbesondere eines Web-basierten Suchinterfaces, erfolgt.Method according to at least one of the preceding Claims, - in which the selection of the at least one search term using a User interface, in particular a web-based search interface, he follows. Verfahren nach dem voranstehenden Anspruch, – bei dem bei der Benutzerschnittstelle eine strukturierte, insbesondere eine hierarchisch strukturiere, Suchmaske vorgesehen ist, welche zumindest für einen der vorgebbaren semantischen Blöcke ein Eingabefeld und/oder ein Auswahlfeld aufweist.Method according to the preceding claim, - in which at the user interface a structured, in particular a Hierarchical structure, search mask is provided, which at least for one the predefinable semantic blocks has an input field and / or a selection field. Verfahren nach dem voranstehenden Anspruch, – bei dem unter Verwendung des Eingabefeldes und/oder des Auswahlfeldes der mindestens eine Suchbegriff ermittelt wird.Method according to the preceding claim, - in which using the input field and / or the selection field of the at least one search term is determined. Verfahren nach mindestens einem der voranstehenden Ansprüche, – bei dem die Auswahl des mindestens einen Suchbegriffs unter Verwendung eines vorgebbaren Referenzprofils oder Referenzdokuments, welches gemäß den vorgebbaren semantischen Blöcken segmentiert wird, erfolgt.Method according to at least one of the preceding Claims, - in which the selection of the at least one search term using a predefinable reference profile or reference document, which according to the specifiable semantic blocks is segmented takes place. Verfahren nach dem voranstehenden Anspruch, – bei dem aus den Segmenten des segmentierten Referenzprofils oder Referenzdokuments der mindestens eine Suchbegriff extrahiert wird, insbesondere über ein Extraktionsverfahren gemäß der Indizierung der segmentierten Informationseinheiten.Method according to the preceding claim, - in which from the segments of the segmented reference profile or reference document the at least one search term is extracted, in particular via a Extraction method according to the indexing the segmented information units. Computerprogramm mit Programmcode-Mitteln, um alle Schritte gemäß Anspruch 1 durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.Computer program with program code means to all Steps according to claim 1 to carry out if the program is running on a computer. Computerprogramm mit Programmcode-Mitteln gemäß Anspruch 17, – bei dem das Computerprogramm auf einem computerlesbaren Datenträger gespeichert ist.Computer program with program code means according to claim 17 - at the computer program stored on a computer-readable medium is. Computerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln, um alle Schritte gemäß Anspruch 1 durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.Computer program product with on a machine-readable carrier stored program code means to all steps according to claim 1 to carry out if the program is running on a computer. Elektronische Suchmaschine zur Bearbeitung einer elektronischen Suchanfrage unter Berücksichtigung eines semantischen Kontexts eines Suchbegriffs: – mit einer Suchraumgenerierungseinrichtung, welche eingerichtet ist zur Generierung eines Suchraums, welcher gemäß vorgebbaren semantischen Blöcken segmentierte Informationseinheiten, insbesondere Dokumente, umfasst, durch Indizieren der segmentierten Informationseinheiten des Suchraums, wobei für jedes Segment einer segmentierten Informationseinheit ein Index ermittelt wird, – mit einer Suchanfragegenerierungseinheit, welche eingerichtet ist zur Generierung einer elektronischen Suchanfrage durch Auswahl mindestens eines Suchbegriffs und Zuordnung des mindestens einen Suchbegriffs zu einem von den vorgebbaren semantischen Blöcken, – mit einer Sucheinheit, welche eingerichtet ist zur Durchführung einer elektronischen Suche in dem Suchraum unter Verwendung des mindestens einen Suchbegriffs, wobei zumindest diejenigen Indizes nach dem mindesten einen Suchbegriff durchsucht werden, welche dem gleichen semantischen Block zugehörig sind wie die des mindestens einen Suchbegriffs.Electronic search engine for processing an electronic query, taking into account a semantic context of a search term: - with a search space generating device which is adapted to generate a search space, which in accordance with predetermined semantic blocks segmented information units, in particular documents, by indexing the segmented information units of the search space, wherein an index is determined for each segment of a segmented information unit, with a search query generation unit which is set up to generate an electronic search query by selecting at least one search term and associating the at least one search notion of one of the predeterminable semantic blocks, comprising a search unit arranged to perform an electronic search in the search space using the at least one search term, wherein at least those indices are searched for the at least one search term corresponding to the same semantic block are like those of at least one search term.
DE102004036500A 2004-07-28 2004-07-28 Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term Ceased DE102004036500A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102004036500A DE102004036500A1 (en) 2004-07-28 2004-07-28 Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102004036500A DE102004036500A1 (en) 2004-07-28 2004-07-28 Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term

Publications (1)

Publication Number Publication Date
DE102004036500A1 true DE102004036500A1 (en) 2006-03-23

Family

ID=36001339

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102004036500A Ceased DE102004036500A1 (en) 2004-07-28 2004-07-28 Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term

Country Status (1)

Country Link
DE (1) DE102004036500A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007004684A1 (en) * 2007-01-25 2008-07-31 Deutsche Telekom Ag Method and data processing system for controlled query structured information stored
US8510327B2 (en) 2010-09-24 2013-08-13 International Business Machinees Corporation Method and process for semantic or faceted search over unstructured and annotated data
WO2016112832A1 (en) * 2015-01-12 2016-07-21 杏树林信息技术(北京)有限公司 Medical information search engine system and search method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1049991B1 (en) * 1998-01-29 2002-11-13 Sharp Kabushiki Kaisha Scoring of text units

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1049991B1 (en) * 1998-01-29 2002-11-13 Sharp Kabushiki Kaisha Scoring of text units

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DEPATISnet Expertensuche (http://depatisnet.dpma.d e)
DEPATISnet Expertensuche (http://depatisnet.dpma.de) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007004684A1 (en) * 2007-01-25 2008-07-31 Deutsche Telekom Ag Method and data processing system for controlled query structured information stored
US8510327B2 (en) 2010-09-24 2013-08-13 International Business Machinees Corporation Method and process for semantic or faceted search over unstructured and annotated data
US8972440B2 (en) 2010-09-24 2015-03-03 International Business Machines Corporation Method and process for semantic or faceted search over unstructured and annotated data
WO2016112832A1 (en) * 2015-01-12 2016-07-21 杏树林信息技术(北京)有限公司 Medical information search engine system and search method

Similar Documents

Publication Publication Date Title
DE69834386T2 (en) TEXT PROCESSING METHOD AND RETENTION SYSTEM AND METHOD
DE602004003361T2 (en) SYSTEM AND METHOD FOR GENERATING REFINEMENT CATEGORIES FOR A GROUP OF SEARCH RESULTS
DE60304331T2 (en) RETRIEVING CONFIRMATIVE DOCUMENTS BY POLLING IN A NATIONAL LANGUAGE
DE69933187T2 (en) Document Search and Service
EP1311989B1 (en) Automatic search method
DE69917250T2 (en) CHARACTER TRANSMISSION OVER HYPERLINKS
DE102007037646B4 (en) Computer storage system and method for indexing, searching and retrieving databases
DE10328833A1 (en) System and method for managing a synonym search
DE10231161A1 (en) Domain-specific knowledge-based meta search system and method for using the same
DE102014113870A1 (en) Identify and display relationships between candidate responses
JP2006048684A (en) Retrieval method based on phrase in information retrieval system
JP2006048686A (en) Generation method for document explanation based on phrase
DE112018006345T5 (en) GET SUPPORTING EVIDENCE FOR COMPLEX ANSWERS
JP2006048683A (en) Phrase identification method in information retrieval system
WO2009030246A1 (en) Detecting correlations between data representing information
DE60101668T2 (en) METHOD AND DEVICE FOR GENERATING AN INDEX BASED ON A FORMAT FOR A STRUCTURED DOCUMENT
WO2021032824A1 (en) Method and device for pre-selecting and determining similar documents
DE10029644A1 (en) Hypertext documents evaluation method using search engine, involves calculating real relevance value for each document based on precalculated relevance value and cross references of document
DE69933123T2 (en) ACCESS TO A SEMI-STRUCTURED DATABASE
DE10028624A1 (en) Method and device for obtaining documents
DE102004036500A1 (en) Electronic search query processing method for use in search engine e.g. Google, involves determining index for segmented information units, allocating search term to semantic block and searching indices of information units based on term
WO2010078859A1 (en) Method and system for detecting a similarity of documents
EP1030254B1 (en) Method and system to manage documents
DE10057634C2 (en) Process for processing text in a computer unit and computer unit
WO2009030248A1 (en) Detecting correlations between data representing information

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection