DE10213348A1 - System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars - Google Patents

System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars

Info

Publication number
DE10213348A1
DE10213348A1 DE10213348A DE10213348A DE10213348A1 DE 10213348 A1 DE10213348 A1 DE 10213348A1 DE 10213348 A DE10213348 A DE 10213348A DE 10213348 A DE10213348 A DE 10213348A DE 10213348 A1 DE10213348 A1 DE 10213348A1
Authority
DE
Germany
Prior art keywords
documents
search
dxn
multilingual
languages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10213348A
Other languages
English (en)
Inventor
Harsh Karandikar
Srinivas Nidamarthi
Juergen Heger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ABB Research Ltd Switzerland
Original Assignee
ABB Research Ltd Switzerland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ABB Research Ltd Switzerland filed Critical ABB Research Ltd Switzerland
Priority to DE10213348A priority Critical patent/DE10213348A1/de
Publication of DE10213348A1 publication Critical patent/DE10213348A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die Erfindung bezieht sich auf ein Verfahren und ein System zur computerunterstützten Suche von Dokumenten (D1 bis Dx) in einer multilingualen Dokumentensammlung (20), wobei die Dokumentensammlung (20) in verschiedenen Sprachen (L1 bis Ln) verfaßte Dokumente (D1 bis Dx) enthält, die in einer Datenverarbeitungseinrichtung (1) gespeichert sind. Zu den Dokumenten (D1 bis Dx) ist eine multilinguale Fachvokabularsammlung gespeichert, die wesentliche Begriffe der Dokumentensammlung (20) in den verschiedenen Sprachen (L1 bis Ln) enthält. Nach Eingabe einer Suchanfrage (11) wird die Suchanfrage (11) mittels der in den verschiedenen Sprachen (L1 bis Ln) erstellten Fachvokabularsammlung automatisch in alle anderen Sprachen (L1 bis Ln) der Dokumentensammlung (20) übersetzt.

Description

  • Die Erfindung bezieht sich auf ein System und ein Verfahren zur Informationssuche von Dokumenten in multilingualen, d. h. mehrsprachigen Wissensdatenbanken, welche beispielsweise Informationen über ein bestimmtes Arbeits- oder Fachgebiet bzw. über ein bestimmtes Wissensgebiet enthalten, aus einer Gesamtmenge von Dokumenten über dieses Wissensgebiet, wobei diese Dokumente in verschiedenen Sprachen vorliegen, mit anschließender Übersetzung der aufgefundenen Dokumente in eine vorbestimmte Sprache.
  • Die heute verwendeten Informationssysteme stellen aufgrund ihrer mehrsprachigen Konzeption besondere Ansprüche an die Informationsanalyse, Informationsaufbereitung und Informationsverarbeitung.
  • Das in den Datenbanken enthaltene Wissen über spezifische Wissensgebiete ist üblicherweise in Form von Textdokumenten vorhanden, die in elektronischer Form in Datenverarbeitungseinrichtungen, beispielsweise auf einem Benutzungsrechner oder in Computernetzwerken, insbesondere in Web- Archiven gespeichert vorliegen. Dokumente, welche nicht in elektronischer Form also in Papierform vorliegen, können durch die bekannten Verfahren zur Erkennung und Identifizierung wie beispielsweise der optischen Zeichen- bzw. Texterkennung (Optical Character Recognition) in ein durch den Computer lesbares Format gebracht werden.
  • Diese Dokumente werden in verschiedenen im Folgenden als Wissensdatenbanken bezeichneten organisatorischen Strukturen, wie beispielsweise in Dokumentendatenbanken, Textsystemen und Versionsverwaltungen gespeichert, wobei diese Wissensdatenbanken spezifische Informationen zu einem Wissensgebiet, zu einem bestimmten Teilgebiet oder Antworten auf bestimmte das Wissensgebiet betreffende Fragen enthalten.
  • Das Auffinden von Dokumenten in solchen Wissensdatenbanken, die bestimmte Bedingungen, also Suchkriterien erfüllen, wird üblicherweise durch eine Suche mit Hilfe von Suchalgorithmen realisiert, wobei das gesuchte Wissen nach vorgegebenen Stichwörtern bzw. Suchbegriffen oder durch eine geeignete Kombination von Begriffen, Schlüsselwörtern, Termen und zusammengesetzten Begriffen spezifiziert wird.
  • Die Gesamtheit der Begriffe, die ein Wissensgebiet charakterisieren und die zur Suche in diesem Wissensgebiet geeignet sind, wird als wissensgebietsspezifisches Vokabular bezeichnet. Aus diesem Vokabular wird ein sogenannter Schlüsselwortindex zur Indizierung der Dokumente gebildet.
  • Um die Suche in multilingualen Wissensdatenbanken, d. h. Wissensdatenbanken, die Dokumente enthalten, die in verschiedenen Sprachen abgefaßt sind, durchzuführen, ist es erforderlich, die Suchanfragen in den verschiedenen Sprachen zu formulieren, die für die Erstellung der Dokumenten benutzt wurden.
  • Zur Beurteilung des Ergebnisses der Suche, das den Inhalt und die Aussagekraft im Sinne der Suchanfragen betrifft, müssen die identifizierten Dokumente beurteilt werden. Dazu ist es im allgemeinen notwendig, die aufgefundenen Dokumente teilweise oder ganz zu übersetzen. Bei nicht zufriedenstellendem Suchergebnis wird die Suche (oft auch mehrfach) wiederholt, indem eine neue Suchanfrage aufgrund des Ergebnisses der vorhergehenden Suche formuliert wird oder die erste Suchanfrage modifiziert wird.
  • Die Formulierung der Suchanfragen in verschiedenen Sprachen erfordert die Übersetzung der Fachbegriffe bzw. Schlüsselwörter des jeweiligen Wissensgebietes. Für die korrekten Übersetzung dieser Fachbegriffe und Schlüsselwörter in die verschiedenen Sprachen benötigt der Ersteller der Suchanfragen beispielsweise wissensgebietspezifische Wörterbücher, da er nur selten über entsprechendes fremdsprachliches Wissen verfügt. Nach Vorliegen des Suchergebnisses ist zur Beurteilung zusätzlich eine schnelle Übersetzung der gefundenen Dokumente erforderlich.
  • Bei der Einschätzung des Aufwandes der Informationssuche in multilingualen Wissensdatenbanken ist weiterhin zu berücksichtigen, daß im allgemeinen die Suche mehrfach mit einer veränderter Formulierung der Suchanfrage solange durchgeführt wird, bis die gesuchte Information gefunden ist.
  • Insgesamt führen die geschilderten Probleme einerseits dazu, daß die Informationssuche in multilinguale Wissensdatenbanken oft nur in einer Sprache durchgeführt wird und somit das Suchergebnis nur einen begrenzten Bereich erfaßt oder es ist bei der Suche durch die Formulierung der Suchanfrage in mehreren Sprachen ein sehr hoher Arbeits- und Zeitaufwand zu erbringen.
  • Ausgehend von dem beschriebenen hohen Aufwand der Formulierung der Suchanfragen in verschiedenen Sprachen, liegt der Erfindung die Aufgabe zugrunde, ein Verfahren und ein System zur schnellen und zielgerichteten Suche von Informationen in multilingualen Wissensdatenbanken mit einer automatischer Übersetzung der Suchergebnisse anzugeben, wobei die Suchanfrage in einer vorher festgelegten Basissprache formuliert ist.
  • Diese Aufgabe wird durch ein Verfahren zur computerunterstützten Suche von Dokumenten in einer multilingualen Wissensdatenbank mit den im Anspruch 1 angegebenen Merkmalen gelöst. Ein System zur Durchführung dieses Verfahrens und vorteilhafte Ausgestaltungen sind in weiteren Ansprüchen angegeben.
  • Dazu wird ein multilinguales Vokabular erstellt, das alle wesentlichen Begriffe eines Wissensbereichs in den verschiedenen Sprachen und eine Zuordnung der Begriffe in diesen verschiedenen Sprachen enthält.
  • Das multilinguale Vokabular kann auf verschiedene Weise gebildet werden, beispielsweise durch eine Integration von Glossaren der Dokumente des Fachgebiets in den einzelnen Sprachen oder durch eine Erstellung eines Glossars in einer ausgewählten Sprache und anschließender Übersetzung diese Glossars in die anderen Sprachen.
  • Eine in einer beliebigen Sprache formulierte Suchanfrage, wird mit Hilfe des gebildeten multilingualen Vokabulars automatisch in alle anderen Sprachen übersetzt, beispielsweise als optionale Fähigkeit des Suchalgorithmus. Die damit vorliegenden "multilingualen" Suchanfragen werden dazu benutzt, Dokumente in den entsprechenden Sprachen zu suchen.
  • Die Suche erfolgt dazu direkt in den Dokumenten der Wissensdatenbank oder in einem Index, der durch eine Indexerstellung der Dokumente ermöglicht wird. Sind die entsprechenden Dokumente gefunden, werden diese, wenn sie in einer anderen Sprache als der vorbestimmten Sprache der Suchanfrage vorliegen, mittels eines automatischen Verfahrens in die Sprache übersetzt, in der die ursprüngliche Suchanfrage formuliert wurde.
  • Diese Übersetzung übernehmen maschinelle Übersetzungsprogramme, die bereits beim heutigen Stand der Technik eine für den schnellen Überblick ausreichende Übersetzungsqualität liefern, insbesondere weil sie ebenfalls das multilinguale Vokabular benutzen können und damit die Voraussetzung für die fachlich richtige Übersetzung der Terminologie gegeben ist. Alternativ dazu kann eine automatische Mitteilung, welche die aufgefundenen nicht in der vorbestimmten Sprache vorliegenden Dokumente aufweist, an weitere Datenverarbeitungseinrichtungen übermittelt werden, um daran tätige menschliche Übersetzer mit der Übersetzung der aufgefundenen Dokumente zu beauftragen, deren Tätigkeit durch das Vorliegen des fachbereichsspezifischen multilingualen Vokabulars erleichtert wird.
  • Die Vorteile der Erfindung sind weiterhin darin zu sehen, daß das Ergebnis der Suchanfrage sehr schnell zu beurteilen ist, insbesondere bei der Nutzung automatischer Übersetzungsprogramme. Da im allgemeinen eine Suchanfrage mehrfach mit veränderter Formulierung der Suchbedingung erfolgen muß, bis das gewünschte Ergebnis zur Verfügung steht, ergibt sich durch das erfindungsgemäße Verfahren eine wesentliche Verkürzung der Suchzeiten.
  • Eine weitere Beschreibung der Erfindung erfolgt nachstehend anhand eines Ausführungsbeispieles, das in den Zeichnungsfiguren näher erläutert ist.
  • Es zeigen:
  • Fig. 1 die Erstellung eines multilingualen Vokabulars,
  • Fig. 2 die Komponenten eines Systems zur Informationssuche in einer multilingualen Wissensdatenbank, und
  • Fig. 3 eine Darstellung des Verfahrensablaufs zur Informationssuche in einer multilingualen Wissensdatenbank.
  • In Fig. 1 ist die Erstellung des multilingualen Vokabulars aufgezeigt.
  • Das multilinguale Vokabular kann
    • a) durch eine Integration von Einzelvokabeln der Dokumente eines Fachgebietes in den einzelnen Sprachen gebildet werden, wobei das Fachvokabular jeweils in den Sprachen L1 bis Ln vorliegt und durch Integration und Zuordnung der Fachbegriffe das multilinguale Fachvokabular entsteht, oder
    • b) durch eine Erstellung eines Vokabulars in einer ausgewählten Sprache Lx und anschließender Übersetzung dieses Glossars in die anderen Sprachen L1 bis Ln
    gebildet werden.
  • Fig. 2 zeigt die erfindungsgemäßen Komponenten einer Datenverarbeitungseinrichtung 1 zur computerunterstützten Suche von in unterschiedlichen Sprachen L1 bis Ln verfaßten Dokumenten D1 bis Dx in einer multilingualen Wissensdatenbank 20, wobei die Datenverarbeitungseinrichtung 1 eine Eingabeeinrichtung 10, ein Modul zur Bildung des multilingualen Vokabulars 30, eine Dokumentensammlung 20, ein Suchmodul 40, ein Sortiermodul 50 sowie eine Übersetzungseinrichtung 70 und eine Prüf- und Ausgabeeinrichtung 90 aufweist.
  • Die Eingabeeinrichtung 10 ist dafür eingerichtet, eine Suchanfrage 11, die in einer vorbestimmten Basissprache Lx verfaßt ist, dem Suchmodul 40 zuzuführen.
  • Im Modul zur Bildung des multilingualen Vokabulars 30 wird das Fachvokabular aufgebaut und der Suchanfrage 11 zur Verfügung gestellt.
  • Im Suchmodul 40 wird die in einer beliebigen Sprache X formulierte Suchanfrage 11 mittels des multilingualen Vokabulars in die Sprachen L1 bis Ln übersetzt und dazu benutzt, nach den entsprechenden Dokumenten zu suchen sowie die gefundenen Dokumente einer weiteren Bearbeitung oder Ausgabe bereitzustellen.
  • Die Dokumentensammlung 20 ist eine Datenbank, ein Textsystem oder eine Versionsverwaltung, welche beispielsweise auf einem Dokumenten- oder Web- Server gespeichert ist.
  • Die zur weiteren Verarbeitung vom Suchmodul 40 bereitgestellten Dokumente D1n bis Dxn werden dem Sortiermodul 50 zugeführt, das die aufgefundenen Dokumente D1n bis Dxn nach ihrer Sprache L1 bis Ln sortiert und die nicht in der vorbestimmten Basissprache Lx vorliegenden Dokumente D1n bis Dxn der Übersetzungseinrichtung 70 bereitstellt, welche die Dokumente D1n bis Dxn in die vorbestimmte Basissprache Lx übersetzt.
  • Danach werden die aufgefundenen und gegebenenfalls in die Basissprache Lx übersetzten Dokumente D1n bis Dxn der Prüf- und Ausgabeeinrichtung 90 zugeführt. In der Prüf- und Ausgabeeinrichtung 90 werden die Suchergebnisse, also die Dokumente D1n bis Dxn nach dem Grad der Erfüllung der Suchanfrage 11 mit Methoden, wie sie beispielsweise in heute genutzten Web- Suchmaschinen eingesetzt werden, automatisch sortiert. Der Grad der Erfüllung der Suchanfrage 11 wird beispielsweise durch die Bewertung der Zahl der gefundenen Begriffe, ihrem Bezug zueinander und ihr Vorkommen im Titel oder in der Zusammenfassung des entsprechenden Dokuments bestimmt. Zur Beurteilung der Suchergebnisse werden die aufgefundenen Dokumente D1n bis Dxn entweder ausgegeben oder am Bildschirm angezeigt. Danach wird der Eingabeeinrichtung 10 eine modifizierte Suchanfrage 11 mit einer veränderten Formulierung der Suchbedingungen zu Verfügung gestellt, falls das Suchergebnis nicht zufriedenstellend war.
  • Fig. 3 zeigt den Verfahrensablauf zur computerunterstützten Suche von Dokumenten aus einer multilingualen Wissensdatenbank anhand der Verfahrensschritte 100-900. In einem ersten vorbereitenden Schritt 200 wird im Modul zur Bildung des multilingualen Vokabulars 30 das multilinguale Fachvokabular erstellt.
  • Nach der Eingabe einer in einer beliebigen Sprache Lx formulierten Suchanfrage 11 im Schritt 100 in die Eingabeeinrichtung 10, wird in einem anschließendem Schritt 300 die Suchanfrage 11 mit Hilfe des gebildeten multilingualen Vokabulars automatisch in alle anderen Sprachen L1 bis Ln übersetzt.
  • Im Schritt 400 werden die vorliegenden multilingualen Suchanfragen dazu benutzt, im Suchmodul 40 Dokumente in den entsprechenden Sprachen zu suchen.
  • Im Schritt 500 stellt das Sortiermodul 50 die ermittelten Dokumente D1n bis Dxn nach den Sprachen L1 bis Ln sortiert, bereit. Dazu werden die folgenden zwei Fälle für die aufgefundenen Dokumente D1n bis Dxn unterschieden:
    • a) Die ermittelten und bereitgestellten Dokumente D1n bis Dxn liegen nicht in der vorbestimmten Basissprache Lx vor (620) und werden demzufolge im Schritt 700 automatisch mittels eines Übersetzungsprogramms in die Basissprache Lx übersetzt und der Prüf- und Ausgabeeinrichtung 90 zugeführt, welche die Ausgabe bzw. Anzeige der ermittelten und übersetzten Dokumente D1n bis Dxn mittels der Ausgabeeinrichtung 90 im Schritt 900 realisiert
    • b) Die ermittelten und bereitgestellten Dokumente D1n bis Dxn weisen die vorbestimmte Basissprache Lx auf (610) und werden sofort der Prüf- und Ausgabeeinrichtung 90 übergeben, welche die Ausgabe bzw. Anzeige der ermittelten Dokumente D1n bis Dxn mittels der Ausgabeeinrichtung 90 im Schritt 900 realisiert.
  • Nach einer Beurteilung des Suchergebnisses durch den Benutzer im Schritt 810 kann eine neue Suchanfrage 11 mit einer veränderter Formulierung der Suchbedingungen der Eingabeeinrichtung 10 zugeführt werden und der Verfahrensablauf erneut durchlaufen werden.

Claims (17)

1. Verfahren zur computerunterstützten Suche von Dokumenten (D1 bis Dx) in einer multilingualen Dokumentensammlung (20), wobei
die Dokumentensammlung (20) in verschiedenen Sprachen (L1 bis Ln) verfaßte Dokumente (D1 bis Dx) enthält, die in einer Datenverarbeitungseinrichtung (1) gespeichert sind,
zu allen Dokumenten (D1 bis Dx) außerdem eine multilinguale Fachvokabularsammlung gespeichert ist, welche die wesentlichen Begriffe der Dokumentensammlung (20) in den verschiedenen Sprachen (L1 bis Ln) und eine Zuordnung der Begriffe in den verschiedenen Sprachen enthält, und wobei nach Eingabe einer Suchanfrage (11), die in einer der Sprachen (L1 bis Ln) verfaßt ist,
a) die Suchanfrage (11) mittels der in den verschiedenen Sprachen (L1 bis Ln) erstellten Fachvokabularsammlung automatisch in alle anderen Sprachen (L1 bis Ln) der Dokumentensammlung (20) übersetzt wird,
b) die in den verschiedenen Sprachen (L1 bis Ln) vorliegende Suchanfrage (11) zur Suche von in den verschiedenen Sprachen (L1 bis Ln) in der Dokumentensammlung (20) gespeicherten Dokumenten (D1 bis Dx) benutzt wird, und
c) die mittels der Dokumentensuche aufgefundenen Dokumente (D1n bis Dxn) zur weiteren Verarbeitung oder Ausgabe bereitgestellt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß mittels eines Sortiermoduls (50) die ermittelten Dokumente (D1n bis Dxn) nach Sprachen (L1 bis Ln) sowie nach dem Grad der Erfüllung der Suchanfrage (11) automatisch sortiert und bereitgestellt werden.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß eine automatisierte Übersetzung der ermittelten und bereitgestellten Dokumente (D1n bis Dxn) in die Sprache der Suchanfrage (11) jeweils mittels eines Übersetzungsprogramms erfolgt, soweit die Dokumente (D1n bis Dxn) nicht bereits in der Sprache der Suchanfrage (11) vorliegen, und eine Ausgabe oder Anzeige der ermittelten und gegebenenfalls übersetzten Dokumente (D1n bis Dxn) erfolgt.
4. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß eine Übersetzung der aufgefundenen Dokumente durch maschinelle Übersetzungsprogramme durchgeführt wird.
5. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, das für die Übersetzung der aufgefundenen Dokumente (D1n bis Dxn) eine automatische Mitteilung, welche die aufgefundenen nicht in der vorbestimmten Sprache vorliegenden Dokumente aufweist, an menschliche Übersetzer übermittelt wird und diese mit der Übersetzung der aufgefundenen Dokumente beauftragt werden.
6. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß nach einer Beurteilung des Suchergebnisses eine neue Suchanfrage (11) mit veränderter Formulierung der Suchbedingungen einer Eingabeeinrichtung (10) zugeführt wird und der Verfahrensablauf erneut durchlaufen wird.
7. Verfahren nach einem der vorherigen Ansprüchen, dadurch gekennzeichnet, daß die Fachvokabularsammlung des jeweiligen Dokuments (D1 bis Dx) der Dokumentensammlung (20) durch Integration und Zuordnung der Fachbegriffe in den verschiedenen Sprachen (L1 bis Ln) erstellt wird.
8. System zur computerunterstützten Suche von in unterschiedlichen Sprachen (L1 bis Ln) verfaßten Dokumenten (D1 bis Dx) in einer multilingualen Dokumentensammlung (20) einer Datenverarbeitungseinrichtung (1), wobei die Datenverarbeitungseinrichtung (1)
a) eine Eingabeeinrichtung (10) aufweist, die dafür eingerichtet ist, eine in einer der verschiedenen Sprachen (L1 bis Ln) der Dokumentensammlung (20) verfaßte Suchanfrage (11), einem Suchmodul (40) zuzuführen,
b) ein Modul zur Bildung eines multilingualen Fachvokabulars (30) aufweist, das dafür eingerichtet ist, die wesentlichen Begriffe der Dokumentensammlung (20) zu speichern, zur automatischen Übersetzung der Suchanfrage (11) die in der Dokumentensammlung verwendeten Sprachen (L1 bis Lx) zu nutzen und einem Suchmodul (40) bereitzustellen, und
c) das Suchmodul (40) dafür eingerichtet ist, die mittels der Suchanfrage (11) angeforderten Dokumente (D1n bis Dxn) aus der Dokumentensammlung (20) gezielt auszuwählen und zur weiteren Verarbeitung oder Ausgabe bereitzustellen.
9. System nach Anspruch 8, dadurch gekennzeichnet, daß die vom Suchmodul (40) aufgefundenen Dokumente (D1n bis Dxn) einem Sortiermodul (50) zugeführt werden, das dafür eingerichtet ist, die aufgefundenen Dokumente (D1n bis Dxn) nach ihrer Sprache (L1 bis Ln) zu sortieren und bereitzustellen.
10. System nach Anspruch 9, dadurch gekennzeichnet, daß die mittels dem Sortiermodul (50) aufgefundenen Dokumente (D1n bis Dxn), welche nicht in der vorbestimmten Basissprache (Lx) vorliegen, einer Übersetzungseinrichtung (70) zugeführt werden, die dafür eingerichtet ist, die Dokumente (D1 n bis Dxn) in die vorbestimmte Basissprache (Lx) zu übersetzen und einer Prüf- und Ausgabeeinrichtung (90) zuzuführen.
11. System nach Anspruch 9, dadurch gekennzeichnet, daß die vom Sortiermodul (50) in der vorbestimmten Basissprache (Lx) aufgefundenen Dokumente (D1n bis Dxn) einer Prüf- und Ausgabeeinrichtung (90) zugeführt werden, die dafür eingerichtet ist, die Dokumente (D1n bis Dxn) auszugeben oder auf einem Bildschirm anzuzeigen.
12. System nach einem der Ansprüche 8 bis 11, dadurch gekennzeichnet, daß die Eingabeeinrichtung (10) für die Eingabe einer neue Suchanfrage (11) aufgrund des Ergebnisses der vorhergehenden Suche eingerichtet ist.
13. System nach einem der Ansprüchen 8 bis 12, dadurch gekennzeichnet, daß die multilinguale Fachvokabularsammlung alle wesentlichen Begriffe eines Wissensbereichs in den verschiedenen Sprachen und eine Zuordnung der Begriffe in diesen verschiedenen Sprachen enthält.
14. System nach einem der Ansprüchen 8 bis 13, dadurch gekennzeichnet, daß das multilinguale Vokabular zur Übersetzung der aufgefundenen Dokumente (D1n bis Dxn) benutzbar ist.
15. System nach einem der Ansprüchen 8 bis 14, dadurch gekennzeichnet, daß die Dokumentensammlung (20) eine Datenbank, ein Textsystem oder eine Versionsverwaltung ist, welche auf einem Dokumenten- oder Web- Server gespeichert ist.
16. System nach einem der Ansprüchen 8 bis 15, dadurch gekennzeichnet, daß die Dokumentensammlung (20) eine Wissensdatenbank ist.
17. System nach einem der Ansprüche 6 bis 16, dadurch gekennzeichnet, daß die Prüf- und Ausgabeeinrichtung (90) dafür eingerichtet ist, die Suchergebnisse nach dem Grad der Erfüllung der Suchanfrage 11 automatisch zu sortieren.
DE10213348A 2002-03-26 2002-03-26 System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars Withdrawn DE10213348A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10213348A DE10213348A1 (de) 2002-03-26 2002-03-26 System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10213348A DE10213348A1 (de) 2002-03-26 2002-03-26 System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars

Publications (1)

Publication Number Publication Date
DE10213348A1 true DE10213348A1 (de) 2003-10-09

Family

ID=27815935

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10213348A Withdrawn DE10213348A1 (de) 2002-03-26 2002-03-26 System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars

Country Status (1)

Country Link
DE (1) DE10213348A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086024A1 (de) * 2004-02-23 2005-09-15 Roland Rupp Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung
WO2009041177A1 (ja) 2007-09-26 2009-04-02 Honda Motor Co., Ltd. 車両のスタート補助システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418951A (en) * 1992-08-20 1995-05-23 The United States Of America As Represented By The Director Of National Security Agency Method of retrieving documents that concern the same topic
WO1997008604A2 (en) * 1995-08-16 1997-03-06 Syracuse University Multilingual document retrieval system and method using semantic vector matching
DE69229204T2 (de) * 1991-08-16 1999-11-04 Xerox Corp Iteratives Verfahren zum Suchen von Satzteilen und Informationsauffindungssystem, welches dieses benützt
US20020007384A1 (en) * 1998-02-03 2002-01-17 Akira Ushioda Apparatus and method for retrieving data from a document database

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69229204T2 (de) * 1991-08-16 1999-11-04 Xerox Corp Iteratives Verfahren zum Suchen von Satzteilen und Informationsauffindungssystem, welches dieses benützt
US5418951A (en) * 1992-08-20 1995-05-23 The United States Of America As Represented By The Director Of National Security Agency Method of retrieving documents that concern the same topic
WO1997008604A2 (en) * 1995-08-16 1997-03-06 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US20020007384A1 (en) * 1998-02-03 2002-01-17 Akira Ushioda Apparatus and method for retrieving data from a document database

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086024A1 (de) * 2004-02-23 2005-09-15 Roland Rupp Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung
WO2009041177A1 (ja) 2007-09-26 2009-04-02 Honda Motor Co., Ltd. 車両のスタート補助システム

Similar Documents

Publication Publication Date Title
DE69930690T2 (de) Verfahren und Gerät um einen Index herzustellen, Benutzung von einem Index und ein Speichermedium
DE60304331T2 (de) Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
DE602004003361T2 (de) System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen
DE102013205737A1 (de) System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen
DE112018006345T5 (de) Abrufen von unterstützenden belegen für komplexe antworten
DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
DE69909360T2 (de) Verfahren und System um Dokumente über eine elektronische Datei wiederaufzufinden
DE10348920A1 (de) Computersystem und Verfahren zur mehrsprachigen assoziativen Suche
DE10213348A1 (de) System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars
EP1412875B1 (de) Verfahren zur verarbeitung von text in einer rechnereinheit und rechnereinheit
DE10213468A1 (de) Verfahren und System zur Informationssuche in multilingualen Wissensdatenbanken mit automatischer Übersetzung der Suchergebnisse
DE102016114265A1 (de) Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache
DE112004001955T5 (de) Benutzeroberflächensoftware-Entwurfssystem
DE69830524T2 (de) Verfahren und System zur Eliminierung von Mehrdeutigkeiten bei syntaktischen Wortgruppen
DE102014201540A1 (de) Verfahren und Vorrichtung zur Analyse von Texten
EP3561665B1 (de) Verfahren und vorrichtung zum rechnergestützten konfigurieren eines technischen systems
DE102023205209A1 (de) Steuereinheit zur Zuordnung von mindestens einem Element einer Vielzahl von Dokumenten und Verfahren dafür
DE10248837A1 (de) System und Verfahren zur Verarbeitung von elektronischen Dokumenten
DE102022128157A1 (de) Computerimplementiertes Verfahren zur Standardisierung von Teilenamen
DE112014002696T5 (de) Verfahren und System für effizientes Sortieren in einer relationalen Datenbank
DE102019213597A1 (de) Verfahren zum Datenabgleich einer Webseite
WO2022058194A1 (de) Verfahren zum erzeugen einer grafischen zusammenfassung, ein computerprogramm und ein system
DE10142379B4 (de) Verfahren zum Erstellen von Hyperlinks und deren Verwendung zum Aufruf von Zieldokumenten aus einem Ausgangsdokument

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8139 Disposal/non-payment of the annual fee