VERFAHREN ZUM BEREITSTELLEN VON ADRESSINFORMATION , EINE ENTSPRECHENDE VORRICHTUNG UND SOFTWARE ZUR VERWENDUNG IN EINER SOLCHEN VORRICHTUNG
[001] Die Erfindung betrifft Verfahren zum Bereitstellen von Adressinformation, um Zugang zu Dokumenten in einem multilingualen System zu ermöglichen, sowie eine entsprechende Vorrichtung und Software zur Verwendung in einer solchen Vorrichtung.
[002] Floskeln wie „Die Welt wird kleiner" kennt jeder Internetanwender. Dass es möglich ist, dank dem Internet auf der ganzen Welt einzukaufen und seine eigenen Dienstleistungen und Waren auf einer Webseite oder in einem Online Shop zu präsentieren ist auch bekannt und dass Suchmaschinen wie Froogle.com heute viele Onlineshops zusammengeschlossen haben und so Produktvergleiche ermöglichen, wissen auch sehr viele Internetanwender.
[003] Damit aber Produkte und Dienstleistungen im Internet verglichen werden können, müssen diese erst einmal gefunden werden. Wenn dann auch noch länder-, respektive sprachübergreifende Vergleiche angestellt werden sollen, so ergeben sich verschiedene Probleme, von denen im Folgenden einige aufgeführt sind:
[004] Es gibt heute keine Technologie, die es ermöglicht, sprachübergreifende Produktrecherchen durchzuführen. Dies im Wesentlichen aus zwei Gründen. Erstens kennt kaum ein Nutzer die gewünschten Begriffe in allen Landessprachen (zum Beispiel in den heute verwendeten elf vorhandenen EU Amtssprachen). Zweitens hat kaum jemand seine eigene Homepage, sowie seine Suchbegriffe, in all diesen Sprachen abgelegt.
[005] Eine Suche in englischer Sprache, wie sie häufig propagiert wird, reicht nicht aus, da ja die entsprechenden Homepages der einzelnen Hersteller oder Dienstleister auch nicht in dieser Sprache in den jeweiligen Suchmaschinen abgelegt worden sind. Eventuell sind in die entsprechenden Homepages zwar englischsprachige Seiten integriert, mit Sicherheit aber sind nicht die entsprechenden Suchbegriffe in Englisch oder gar in anderen Landessprachen abgelegt.
[006] Anhand eines einfachen Beispieles sei es hier verdeutlicht. Gesucht werden sollen alle Druckereien im EU Raum. Die EU hat im Moment die folgenden Mitgliedsstaaten: Belgien, Dänenmark, Deutschland, Griechenland, Spanien, Frankreich, Irland, Italien, Luxemburg, Niederlande, Österreich, Portugal, Finnland, Schweden, Vereinigtes Königreich. Mit der Osterweitung ab 1. Mai 2004 kommen die folgenden Staaten hinzu : Tschechische Republik, Lettland, Estland, Zypern, Littauen, Ungarn, Malta, Polen, Slowenien, Slovakei. Weitere Bewerberländer sind im Moment Bulgarien, Rumänien und die Türkei. Damit Druckereien in diesen Ländern überhaupt gefunden werden könnten, müsste nun also zum Beispiel nach dem Wort Druckerei in den folgenden Sprachen gesucht werden: Deutsch, Französisch, Belgisch, Dänisch, Griechisch, Holländisch, Spanisch, Italienisch, Portugiesisch, Finnisch, Schwedisch, Englisch, Tschechisch,
Lettisch, Estnisch, Zypriotisch, Ungarisch, Maltesisch, Polnisch, Slowenisch, Slovakisch.
[007] Selbst wenn ein Internetnutzer sich die Mühe machen würde einen Suchbegriff in alle anderen Sprachen zu übersetzen, so würde er keine brauchbaren Ergebnisse erhalten, da er zwar vielleicht Webseiten in den verschiedenen Ländern finden würde, er diese Webseiten aber nicht lesen könnte, da sie in den meisten Fällen in der jeweiligen Landessprache abgefasst sind. Diese Schwierigkeit wird besonders gravierend, wenn neben der anderen Sprache auch noch andere Schriftzeichen zum Einsatz kommen, wie zum Beispiel in (Griechenland, Israel, Saudi-Arabien, China, Japan, um einige Beispiele zu geben).
[008] Eines der Probleme, das sich aus der Globalisierung ergibt ist das der Sprachbarrieren. Besonders in Wirtschaftsräumen wie in Europa, wo viele Nationalitäten mit verschiedensten Sprachen Ihre Grenzen öffnen, um den freien Waren- und Dienstleistungsverkehr zu ermöglichen, stellen die Sprachbarrieren echte Hindernisse dar.
[009] Der vorliegenden Erfindung liegt die Aufgabe zugrunde, eine Suchmaschine anzubieten, die es dem Nutzer eines Netzwerks ermöglicht Information in dem Netzwerk zu finden, die in einer Sprache angeboten wird, die dem Nutzer nicht geläufig ist.
[0010] Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Suchverfahren anzubieten, dass sich mittels Computertechnik umsetzen lässt und das dazu geeignet ist den Waren- und Dienstleistungsverkehr zwischen Staaten mit verschiedenen Landessprachen zu unterstützen.
[0011] Diese Aufgabe wird erfindungsgemäss dadurch gelöst, dass eine Abfrage eines ersten Suchwortes in einer ersten natürlichen Sprache erfolgt, wobei dies durch das Bereitstellen einer Eingabemöglichkeit auf einem ersten Rechner erreicht wird. Das Suchworts wird über eine Kommunikationsverbindung zu einer Vorrichtung übermittelt, die mindesten eine Suchwort bereit stellt, das
eine Übersetzung des ersten Suchworts darstellt. Die Suchwörter werden in verschiedenen Sprachen von einer ersten Datenbank zur Verfügung gestellt. Es wird ein Suchlauf mit mindestens einem Suchwort durchgeführt, um Netzwerk- Dokumente zu identifizieren, die über ein Netzwerk erreichbar sind. Dieser Suchlauf wird in einer zweiten Datenbank durchgeführt. Es wird nun Adressinformation bereit gestellt, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Mittels der Adressinformation erlangt man so Zugang zu den individuellen Netzwerk-Dokumenten.
[0012] Diese Aufgabe wird erfindungsgemäss durch eine Vorrichtung gelöst, die Verarbeitungsmittel umfasst, die dazu ausgelegt sind auf eine oder mehrere der folgenden Datenbankmodule zuzugreifen :
• ein Datenbankmodul mit Suchworten in verschiedenen natürlichen Sprachen und mit Zuordnungen zu Netzwerk-Dokumenten,
• ein Datenbankmodul mit gespeicherten Dokumenten-Daten, die Information zu den Netzwerk-Dokumenten umfasst,
• ein Datenbankmodul mit Adressinformation mittels derer die Netzwerk- Dokumente über ein Netzwerk zugreifbar sind,
[0013] Zusätzlich umfasst die Vorrichtung ein Suchmodul, das nach Eingabe eines Suchworts in den Datenbankmodulen einen Suchlauf ausführt, um alle Netzwerk-Dokumente zu finden in deren gespeicherten Dokumenten-Daten das Suchwort in mindestens einer der verschiedenen natürlichen Sprachen vorkommt. Das Suchmodul stellt die gefundenen Dokumenten-Daten bereit oder markiert sie. Ein Ausgabemodul macht Adressinformation verfügbar, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Diese Adressinformation ist verwendbar, um über das Netzwerk auf die gefundenen Netzwerk-Dokumente zu zugreifen.
[0014] Diese Aufgabe wird erfindungsgemäss auch durch eine Software gelöst, die in einer entsprechenden Vorrichtung mit Rechenmittel und Datenbank zum Einsatz kommt. Die Software kontrolliert oder ruft das Abarbeiten verschiedener
Schritte hervor. Dabei findet eine Abfrage eines ersten Suchwortes in einer ersten natürlichen Sprache durch das Bereitstellen einer Eingabemöglichkeit auf einem externen Rechenmittel statt. Das erste Suchwort wird über eine Kommunikationsverbindung zu der Vorrichtung übermittelt. Dort wird mindestens ein Suchwort bereit gestellt, das eine Übersetzung des ersten Suchworts darstellt. Die Suchwörter werden zu diesem Zweck in verschiedenen Sprachen in der Datenbank zur Verfügung gestellt. Es wird ein Suchlauf mit mindestens einem Suchwort durchgeführt, um Netzwerk-Dokumente zu identifizieren, wobei der Suchlauf in der Datenbank durchgeführt wird. Adressinformation wird bereit gestellt, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Dann wird Adressinformation bereit gestellt, um so Zugang zu den individuellen Netzwerk-Dokumenten zu ermöglichen.
[0015] Weitere vorteilhafte Ausführungsformen sind den entsprechenden abhängigen Ansprüchen zu entnehmen.
[0016] Gemäss Erfindung kann zum Beispiel eine EU-weite Plattform, eventuell sogar mit Anbindung von Angeboten von Nicht-EU Staaten, aufgebaut werden, um allen in einem Wirtschaftskreislauf angeschlossenen Stellen (also Hersteller, Grosshändler/Importeur, Wiederverkäufer und Verkaufsagenten) die Möglichkeit zu bieten, ihre Produkte und Dienstleistungen selbst erfassen zu können , oder erfassen lassen zu können. Information zu den Produkten und Dienstleistungen werden dann in die jeweiligen Sprachen übersetzt, wobei dies vorzugsweise automatisch geschieht, und führen in einer bevorzugten Ausführungsform durch einfache Verlinkung auf die Original Webseite. Damit wird ein Internetanwender zur gewünschten Information geführt, egal welche Sprache er zum Suchen verwendet.
[0017] Vorzugsweise ist die Erfindung so ausgelegt, dass eine kontinuierlich wachsende Datenbank in den verschiedenen Sprachen hilft, bereits bekannte Suchbegriffe zu übersetzen und zu katalogisieren. Nicht bekannte Worte können zum Beispiel manuell übersetzt werden.
[0018] Vorzugsweise werden gefundene Webseiten nach (Treffer-) Übereinstimmung und Land sortiert angezeigt.
[0019] Vorzugsweise werden die gefundene Webseiten zusammen mit einem kurzen Beschreibungstext und einer Vorschau der Webseite angezeigt.
[0020] Weitere Einzelheiten und Vorteile der Erfindung werden im folgenden anhand von Ausführungsbeispielen und mit Bezug auf die Zeichnung beschrieben. Es zeigen:
Fig. 1 eine schematische Ansicht einer ersten Ausführungsform gemäss Erfindung; Fig. 2 eine schematische Ansicht eines Eingabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 3 eine schematische Ansicht eines Ausgabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 4 eine schematische Ansicht einer zweiten Ausführungsform gemäss Erfindung; Fig. 5 ein schematisches Flussdiagramm einer dritten Ausführungsform gemäss Erfindung; Fig. 6 ein schematisches Flussdiagramm einer vierten Ausführungsform gemäss Erfindung; Fig. 7 eine schematische Ansicht eines weiteren Eingabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 8 eine schematische Ansicht eines weiteren Ausgabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 9 ein schematisches Flussdiagramm einer möglichen Eingabeprozedur, gemäss Erfindung; Fig. 10 eine schematische Ansicht eines Eingabebildschirms einer Ausführungsform gemäss Erfindung, der zum Erfassen von Information verwendet werden kann; Fig. 11 eine schematische Ansicht eines weiteren Eingabebildschirms einer Ausführungsform gemäss Erfindung, der zum Erfassen von
Information verwendet werden kann; Fig. 12 eine schematische Ansicht einer weiteren Ausführungsform gemäss Erfindung; Fig. 13 eine schematische Ansicht einer weiteren Ausführungsform gemäss Erfindung; Fig. 14 eine schematische Ansicht einer weiteren Ausführungsform gemäss Erfindung.
Detaillierte Beschreibung:
[0021] In den Figuren sind für dieselben Elemente dieselben Bezugszeichen verwendet, wenn nicht ausdrücklich anders erwähnt.
[0022] Im Folgenden werden vorteilhafte Ausführungsformen der Erfindung beschrieben, wobei es sich um beispielhafte Ausführungsformen handelt. Diese umfassen sowohl verschiedene Ausbildungen der Gesamterfindung, als auch Baugruppen/Module und einzelne Elemente der Erfindung. Grundsätzlich lassen sich die beschriebenen Baugruppen/Module und einzelnen Elemente der verschiedenen Ausführungsformen miteinander kombinieren, respektive die Baugruppen und einzelne Elemente einzelner Ausführungsformen lassen sich durch die Baugruppen und einzelne Elemente anderer Ausführungsformen ersetzen. Die hierbei gebildeten Kombinationen können kleinere, jedem Fachmann geläufige und daher nicht weiter beschriebene Anpassungen bedingen, zum Beispiel um ein Zusammenwirken oder Ineinandergreifen der Baugruppen und einzelnen Elemente zu ermöglichen.
[0023] Eine erste Ausführungsform der Erfindung ist in Fig. 1 in schematisierter Form dargestellt. Gezeigt ist eine Vorrichtung 10, die einen ersten Rechner 11, einen zweiten Rechner 13 und eine Datenbank 14 umfasst. Die drei genannten Elemente 11, 13, 14 sind in dem gezeigten Ausführungsbeispiel über ein Netzwerk 12 miteinander verbindbar. Das Netzwerk 12 ist in Fig. 1 schematisiert dargestellt. Der zweite Rechner 13, bei dem es sich zum Beispiel um einen Datenbankserver handeln kann, und die Datenbank 14
bilden zusammen ein sogenanntes Rechenzentrum, wie in Fig. 1 durch die gestrichelte Box 15 angedeutet.
[0024] In dem Netzwerk 12 gibt es zahlreiche Webseiten und andere Informationsangebote, die im Folgenden vereinfacht als Netzwerk-Dokumente bezeichnet werden. Diese Netzwerk-Dokumente können an verschiedensten Orten, zum Beispiel auf Servern in verschiedenen Ländern angesiedelt sein. In Fig. 1 sind mehrere solche Netzwerk-Dokumente angedeutet. Ein erstes Netzwerk-Dokument ADE (zum Beispiel eine Webseite) liegt in deutscher Sprache vor, ein zweites Netzwerk-Dokument BPT (zum Beispiel eine Webseite) liegt in portugiesischer und ein drittes Netzwerk-Dokument CSE (zum Beispiel ein https Portal) liegt in schwedischer Sprache vor. Bei dem System 10 handelt es sich also um ein sogenanntes mehrsprachiges System.
[0025] Gemäss Erfindung wird nun durch die Vorrichtung 10 Adressinformation bereit gestellt, die trotz der Mehrsprachigkeit der Vorrichtung in einer natürlichen Sprache geliefert wird, die für einen Benutzer verständlich ist. Typischerweise laufen dabei die folgenden Schritte ab. Ein Benutzer des ersten Rechners 11 gibt ein Suchwort in einer ersten natürlichen Sprache in ein Suchfenster 11.3 ein, das in einem Anwendungsfenster 11.2 (Eingabemaske genannt) auf dem Bildschirm 11.1 des Rechners 11 angezeigt wird. Bei der Anwendung, die das Fenster 11.2 darstellt, kann es sich zum Beispiel um einen (HTML) Browser handeln. Zusätzlich kann der Benutzer im gezeigten Beispiel die natürliche Sprache auswählen, die er zu verwenden wünscht. Alternativ kann die Sprache vorgegeben sein, oder die Sprache kann automatisch erkannt werden. Eine solche Erkennung der Sprache kann realisiert werden, indem die eine Softwareroutine (zum Beispiel ein Applet oder Script das im Rechner 11 vorliegt oder das dem Rechner 11 temporär überspielt wird) die lokale Spracheinstellung des Rechners 11 abfragt. Die manuelle Auswahl der natürlichen Sprache erfolgt zum Beispiel über ein Fenster 11.5, das mit einem Drop-Down Menü versehen ist. Im vorliegenden Beispiel hat der Benutzer das Wort „Druckerei" eingegeben und die Deutsche Sprache ausgewählt. Durch Betätigen einer Enter-Taste oder des Such-Knopfes 11.4 wird das Suchwort „Druckerei" von dem ersten Rechner 11 über eine Kommunikationsverbindung zu dem zweiten Rechner 13
übermittelt. Die Kommunikationsverbindung verläuft in dem Beispiel über das Netzwerk 12. Zusätzlich zu dem Suchwort „Druckerei" wird eine Sprachkennung übermittelt. Vorzugsweise wird das Suchwort „Druckerei" zusammen mit der Sprachkennung in einem String übergeben.
[0026] Der zweite Rechner 13 stellt nun in dem beschriebenen Beispiel entsprechende Suchworte in verschiedenen natürlichen Sprachen bereit, die eine Übersetzung des ersten Suchworts darstellen, wie in der folgenden Tabelle 1 anhand des Suchworts „Druckerei" erläutert wird:
[0027] Die entsprechenden Suchworte in den verschiedenen Sprachen werden in einem ersten Datensatz DB1 zur Verfügung gestellt, der mit dem zweiten Rechner 13 verbindbar ist oder auf den der zweite Rechner 13 zugreifen kann. In dem gezeigten Beispiel ist dieser erste Datensatz DB1 zum Beispiel in der Datenbank 14 angesiedelt. Eine Suchmaschine führt nun Suchläufe mit dem ersten Suchwort „Druckerei" und den entsprechenden Suchwörtern „typografia", „Imprimerie", „La imprenta", „Tryckeri" und „A tipografia" durch, um treffende Netzwerk-Dokumente 12 zu identifizieren. Diese Suche wird in einem zweiten Datensatz DB2 durchgeführt, in dem zahlreiche Suchwörter samt Zuordnungen zu Netzwerk-Dokumenten gespeichert sind. In dem gezeigten Beispiel ist dieser zweite Datensatz DB2 auch in der Datenbank 14 angesiedelt.
[0028] Jedem Netzwerk-Dokument in dem Netzwerk 12, respektive jedem Netzwerk-Dokument, das über das Netzwerk 12 erreichbar ist, wurde beim Erstellen des Datensatzes DB2 eine eineindeutige Zuordnung (Identifier, ID)
zugeteilt. Diese Zuordnung können erweitert und bei Bedarf korrigiert werden. Der zweite Datensatz DB2 hat Zugang zu dieser Zuordnung. In der folgenden Tabelle 2 ist ein einfaches Beispiel einer möglichen Zuordnung dargestellt.
[0029] Wie aus der vorstehenden Tabelle 2 zu entnehmen ist, gibt es zum gegebenen Zeitpunkt drei Netzwerk-Dokumente, die den deutschen Begriff „Druckerei" betreffen. Diesen drei Netzwerk-Dokumenten wurden vorgängig die Zuordnungen ID4, ID7 und ID21 zugeteilt. Es gibt ein französischsprachiges Netzwerk-Dokument ID38, der das entsprechende Suchwort „Imprimerie" betrifft und ein portugiesisches Netzwerk-Dokument ID123, welches das Wort „A tipografia" betrifft. Insgesamt findet der zweite Rechner 13 mit Hilfe der Suchmaschine fünf Netzwerk-Dokumente (ID4, ID7, ID21, ID38, ID123), die in einem Bezug stehen mit dem Suchwort „Druckerei".
[0030] Damit ist ein erster wesentlicher Schritt gemacht, der mit konventionellen Suchmaschinen und Suchstrategien nicht möglich wäre. Eine herkömmliche Suchmaschine würde nur die Netzwerk-Dokumente finden, bei denen das Suchwort „Druckerei" in deutscher Sprache als Meta-tag abgelegt ist. Dies ist bei fremdsprachigen Dokumenten meistens nicht der Fall.
[0031] In einem weiteren Schritt wird Adressinformation bereit gestellt, die den Netzwerk-Dokumenten entspricht oder diese Netzwerk-Dokumente so kennzeichnet, dass sie durch das Netzwerk 12 hindurch auffindbar/anwählbar sind. Es wird dabei natürlich nur Adressinformation derjenigen Netzwerk- Dokumente bereit gestellt, die bei dem Durchführen der Suche gefunden wurden.
Im vorliegenden Beispiel wird Adressinformation zu den durch die Zuordnungen ID4, ID7, ID21, ID38 und ID123 gekennzeichneten Netzwerk-Dokumenten zur Verfügung gestellt, wie im Folgenden anhand eines Beispiels dargestellt:
[0032] Es handelt sich in dem gezeigten Beispiel um Adressinformation in Form von http-Adressen. Es können aber auch andere Adressformate verwendet werden, wie zum Beispiel: URL, ftp, E-mail Adressen, usw. Die den Schlüsseln (Zuordnungen, IDx) entsprechende Adressinformation kann zum Beispiel in einem dritten Datensatz DB3 bereitgestellt und gesucht werden.
[0033] Die Adressinformation zu den Zuordnungen ID4, ID7, ID21, ID38 und ID123 wird jetzt an den ersten Rechner 11 übermittelt, wobei diese Übermittlung typischerweise über das Netzwerk 12 erfolgt. Die Adressinformation kann aber auch mit anderen Mitteln übermittelt werden, wie zum Beispiel per E-mail, per Fax, per SMS, um einige Beispiele zu nennen.
[0034] In einer bevorzugten Ausführungsform wird dem Benutzer am Rechner 11 die Möglichkeit eingeräumt zu bestimmen wie und in welcher Form er die Adressinformation zu erhalten wünscht. Der Benutzer kann zum Beispiel eine oder mehrere der folgenden Versandarten auswählen. Versand an den ersten Rechner 11; einen anderen Rechner; einen Pager; ein Mobiltelefon; ein PDA; eine Faxnummer;
eine E-mail Adresse.
[0035] Als Default kann die Rücksendung an den Rechner 11 vorgesehen sein. Zu diesem Zweck kann der zweite Rechner 13 zum Beispiel der Suchanfrage, die vom Rechner 11 kommt eine spezielle SessionID zuordnen. Dadurch weiss der zweite Rechner 13 an welchen Rechner 11 die Rücksendung zu erfolgen hat.
[0036] Die Adressinformation wird nun im gezeigten Beispiel am ersten Rechner 11 bereitgestellt. Es kann zu diesem Zweck zum Beispiel ein Fenster
11.6 (Ausgabefensters genannt) auf dem Bildschirm 11.1 geöffnet werden, um dort die Adressinformation, wie in Fig. 2 angedeutet, darzustellen. Um über das Netzwerk 12 Zugang zu den individuellen Netzwerk-Dokumenten zu ermöglichen, können die http-Links hinterlegt sein, wie durch Unterstreichung der Adressinformation angedeutet ist.
[0037] In einer bevorzugten Ausführungsform wird durch Anklicken einer Adressinformation zum Beispiel ein weiteres Fenster 11.7 geöffnet, in dem Angaben zu dem entsprechenden Netzwerk-Dokument in der ersten Sprache, d.h. in der Abfragesprache Deutsch, dargestellt werden. Zu diesem Zweck kann dem Rechner 13 zusammen mit dem Suchwort auch die Sprachkennung übermittelt werden, wie weiter oben beschrieben. Anhand der Sprachkennung ist dem Rechner jederzeit bekannt welche Abfragesprache verwendet wurde und somit auch in welcher Sprache ein Netzwerk-Dokument vorzugsweise anzuzeigen oder auszugeben ist.
[0038] Ein Beispiel hierzu ist in Fig. 3 gegeben. Der Benutzer hat in dem gezeigten Beispiel auf den Link www.abprint.pt geklickt und es wird das Fenster
11.7 geöffnet. In diesem Fenster 11.7 werden Angaben in der deutschen Sprache angezeigt. Die entsprechenden Übersetzungen in den verschiedenen natürlichen Sprachen können zum Beispiel über einen vierten Datensatz DB4 zur Verfügung gestellt werden. In der Ausführungsform, bei der man durch Anklicken einer Adressinformation ein Fenster mit weiterführender Information in der ersten natürlichen Sprache angeboten bekommt (siehe das in Fig. 3 gezeigte Beispiel), kann der Link mit einem Verweis auf eine Adresse in dem vierten Datensatz DB4
hinterlegt sein. D.h. mit anderen Worten, dass es sich bei dem Link www.abprint.pt nicht um einen echten Link handelt, der direkt in das Netzwerk 12 verweist, sondern dass es sich um einen Ersatz-Link (systeminterner Link) innerhalb des Rechenzentrums 15 handelt. Dies ist aber, wie gesagt, nur eine mögliche, wenn auch besonders bevorzugte, Ausführungsform.
[0039] Eine zweite Ausführungsform der Erfindung ist in Fig. 4 in schematisierter Form dargestellt. Gezeigt ist eine Vorrichtung 10, die einen ersten Rechner 11, ein Netzwerk 12.1, 12.2 und ein Rechenzentrum 15 umfasst. Das Rechenzentrum 15 umfasst eine Schnittstelle 15.1, zum Beispiel in Form eines speziellen Rechners, einen zweiten Rechner 13 und eine Datenbank 14. Der zweite Rechner 13 und die Datenbank 14 haben keinen direkten Zugang zum Netzwerk 12, 12.2. Der zweite Rechner 13 steht über geschützte oder dedizierte Kommunikationsverbindungen 15.2 und 15.3 mit der Datenbank 14 und der Schnittstelle 15.1 in Verbindung, wie in Fig. 4 angedeutet. Das Netzwerk besteht im gezeigten Beispiel aus zwei Teilnetzen 12.1, 12.2, wie in Fig. 4 schematisiert dargestellt. Es ist eine Datenbank 14 vorgesehen, in der alle für die Durchführung des erfindungsgemässen Verfahrens notwendige Information in Form von Datensätzen abgespeichert ist.
[0040] In der Vorrichtung 10 werden die folgenden erfindungsgemässen Schritte durchgeführt, wobei zu beachten ist, dass mindestens ein Teil der Schritte parallel zu einander ablaufen kann, oder dass die Schritte auf verschiedenen Rechner (zum Beispiel Parallel-Rechnern) ausgeführt werden können. Es erfolgt ein Abfragen eines Suchwortes in einer ersten natürlichen Sprache. Dies kann, wie im Zusammenhang mit Fig. 1 beschrieben, auf dem ersten Rechner 11 erfolgen. Das eingegebene Suchwort wird von dem ersten Rechner 11 über die Netzwerke 12.1 und 12.2 und das Interface 15.1 zu dem zweiten Rechner 13 übermittelt. Dort sind die entsprechenden Suchworte in verschiedenen natürlichen Sprachen verfügbar, die eine Übersetzung des ersten Suchworts darstellen. Eine Suchmaschine führt nun Suchläufe mit dem ersten Suchwort und den entsprechenden Suchwörtern in den verschiedenen anderen Sprachen aus, um Netzwerk-Dokumente ADE, BPT, CSE, DΠ in dem Netzwerk 12.1, 12.2 zu identifizieren. Auch diese Suche wird in der Datenbank 14 durchgeführt.
Dort sind Suchwörter in den verschiedenen Sprachen samt Zuordnungen (zum Beispiel in Form von eineindeutigen Identifieren IDx) zu Netzwerk-Dokumenten ADE, Bpj, CSE, Dir gespeichert. Als Ergebnis dieser Suchläufe wird Adressinformation bereit gestellt, welche denjenigen Netzwerk-Dokumenten ADE/ BPT, CSE, Drr entspricht oder welche diejenigen Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen der Suche gefunden wurden. Diese Adressinformation wird bereit gestellt, um so Zugang zu den individuellen Netzwerk-Dokumenten ADE, BPT, CSE, DIT ZU ermöglichen.
[0041] Auch diese Ausführungsform kann, wie im Zusammenhang mit der ersten Ausführungsform angedeutet, in verschiedenster Art und Weise abgewandelt werden. So kann zum Beispiel die Anordnung oder der Aufbau des Rechenzentrums 15 oder die Ausgabe der Adressinformation anders ausgeführt werden. Die Ausgabe kann zum Beispiel, wie in Fig. 4 angedeutet, so erfolgen, dass die Adressinformation per SMS über eine Mobilfunkverbindung 16.1 an ein Mobiltelefon 16 übermittelt wird.
[0042] Unter dem Begriff Netzwerk sind Netzwerke wie zum Beispiel das Internet, aber auch Netzwerke innerhalb von Firmen zu verstehen. Es kann sich um kabel- sowie fiber-basierte Netzwerke und um kabellose Netzwerke (z.B. Wireless LANs) handeln.
[0043] Der Begriff Adressinformation beschreibt Information, die verwendet werden kann, um einen automatisierten Zugriff zu einem Netzwerk-Dokument zu erhalten. Es geht also nicht um Adressangaben im herkömmlichen Sinne (z.B. die Postadresse), sondern um Adressinformation wie zum Beispiel: http-link, https- link, url-Adresse, ftp-Adresse, E-mail-Adresse, Pager-Nummer. Diese Adressinformation unterscheidet sich von der herkömmlichen dadurch, dass sie unmittelbar verwendet werden kann, um unter Zuhilfenahme technischer Mittel (z.B. Rechner oder Mobiltelefon und Netzwerk) Zugang oder Zugriff zu einem gefundenen Netzwerk-Dokument zu erhalten. Von einem automatisierten Zugriff ist also die Rede, wenn es um einen Zugriff geht, der mittels technischer Hilfsmittel (Rechner, Mobiltelefon, etc.) automatisch aufgebaut oder
bereitgestellt wird und bei dem Information zurück geliefert wird (Webseite, WAP-Information, etc.)
[0044] Der Begriff Rechenzentrum wird verwendet, um eine logische und/oder physikalische Verknüpfung mehrere Systeme - wie zum Beispiel Rechner und Datenbanken (zum Beispiel mit den Datensätzen DB1 bis DB4) - zu beschreiben. Ein Rechenzentrum muss nicht zwingender Weise an einem Ort konzentriert sein. Es kann auch, wie zum Beispiel in Fig. 1 angedeutet, aus Systemen bestehen, die an verschiedenen Orten angesiedelt sind und die über ein Netzwerk oder eine dedizierte Kommunikationsverbindung miteinander verbindbar sind.
[0045] Im Zusammenhang mit dem Begriff Rechenzentrum ist hierin die Rede von einem geschlossenen Suchraum. Unter einem geschlossenen Suchraum ist eine Anordnung, respektive ein Aufbau zu verstehen, der einen Zugang nur durch wohl definierte Schnittestellen oder Portale ermöglicht. Änderungen in dem geschlossenen Suchraum können nur durch spezielle Personen (zum Beispiel Angestellte eines Betreibers), oder durch spezielle Interfaces oder Softwaremodule vorgenommen werden. Der Begriff „geschlossener Suchraum" soll auch andeuten, dass es sich im Gegensatz zum Internet, bei dem es sich im weitesten Sinne um ein offenes System handelt, um ein genau definiertes und kontrolliertes Umfeld handelt. Ein geschlossener Suchraum umfasst nur Zuordnungen und Informationen, die speziell erstellt wurden. Über das Netzwerk 12 kann auf den geschlossene Suchraum nicht direkt zugegriffen werden, sondern ein Zugriff erfolgt über das kontrollierte und gesicherte Durchführen von Suchläufen.
[0046] Der Begriff Datenbank wird sowohl für Datenbanken im physikalischen Sinne, als auch für die eigentliche Sammlung von Daten verwendet. Wenn im Zusammenhang mit der vorliegenden Erfindung von mehreren Datensätzen, zum Beispiel den Datensätzen DB1 bis DB4, die Rede ist, so soll das nicht heissen, dass es sich um separate Datensätze handelt. Die Datensätzen können zum Beispiel miteinander verknüpft sein. Es kann sich auch um einen einzigen Datensatz mit verschiedenen Bereichen (z.B. Spalten und Reihen oder Datenblättern) handeln.
[0047] Ein weiteres Verfahren gemäss Erfindung ist in Fig. 5 in Form eines Flussdiagramms dargestellt. Das Verfahren umfasst mindestens die folgenden Schritte, die zumindest zum Teil parallel zueinander ausgeführt werden können. In einem ersten Schritt, dargestellt durch den Block 21, erfolgt das Eingeben eines Suchwortes in einer ersten natürlichen Sprache, Zu diesem Zweck stellt ein erster Rechner (oder zum Beispiel ein Mobiltelefon oder ein PDA) eine Eingabemöglichkeit bereit. Nachdem das Suchwort von dem ersten Rechner über eine Kommunikationsverbindung zu einem zweiten Rechner übermittelt wurde (zum Beispiel als String zusammen mit einer Sprachkennung), stellt der zweite Rechner entsprechende Suchworte in verschiedenen natürlichen Sprachen bereit, wobei in einem optionalen Zwischenschritt entschieden wird in welchen Sprachen gesucht werden soll, wie durch den Block 22 angedeutet. Die entsprechenden Suchworte, die Übersetzungen des ersten Suchworts darstellen, werden aus einer Datenbank (Datensatz) 23 entnommen. Nach diesen Suchworten wird nun, wie durch den Block 24 angedeutet, in einer Datenbank (Datensatz) gesucht. Diese Vorgänge werden hier auch als Suchläufe bezeichnet. Jeder der Suchläufe wird mit einem Suchwort in einer der verschiedenen Sprachen durchgeführt. Es kann alternativ auch ein einziger Suchlauf stattfinden, der aber trotzdem mit den verschiedenen Suchworten sucht. Die Suchläufe liefern Information, die Netzwerk-Dokumente identifizieren. Aus einer eigentlichen Adressdatenbank (Address-Datensatz) werden konkrete Angaben anhand der gefundenen Ergebnisses der Suchläufe selektiert, wie durch das Symbol 25 dargestellt. Als Ergebnis wird Adressinformation in Form von Daten geliefert, wie durch den Block 26 dargestellt. Mit anderen Worten ausgedrückt werden die Ergebnisse bereit gestellt. Zu diesem Zweck kann zum Beispiel eine Liste mit Adressinformation angezeigt werden. Die Adressinformation entspricht den Netzwerk-Dokumenten, oder sie kennzeichnet diese Netzwerk-Dokumente. Die Adressinformation wird gemäss Erfindung so bereit gestellt, dass ein Zugang zu den individuellen Netzwerk-Dokumenten automatisiert möglich wird.
[0048] Ein grosser Teil der beschriebenen Schritte läuft in einem geschlossenen System ab, wie in Fig. 5 vereinfacht durch die Box 15 dargestellt. Das geschlossene System kann zum Beispiel dem Rechenzentrum 15 in Fig. 4
entsprechen. Diese Abgrenzung gegen Aussen hat den Vorteil, dass alle wesentlichen Vorgänge in einem geschützten und wohl definierten Umfeld ablaufen. Lediglich das Eingeben des Suchwortes und die Ausgabe am Ende der Suchläufe liegen ausserhalb des geschlossenen Systems. Die Ein- und Ausgabe kann mittels einer geeigneten SessionID bewerkstelligt werden, um ein Beispiel für die Handhabung zu geben.
[0049] Ein weiteres Verfahren gemäss Erfindung ist in Fig. 6 in Form eines Flussdiagramms dargestellt. Das Verfahren umfasst mindestens die folgenden Schritte. In einem ersten Schritt, dargestellt durch den Block 21, erfolgt das Eingeben eines Suchwortes in einer ersten natürlichen Sprache. Zu diesem Zweck stellt ein erster Rechner (oder zum Beispiel ein Mobiltelefon oder ein PDA, die hierin auch der Einfachheit halber als Rechner bezeichnet werden, das sie auch einen Rechner/Prozessor aufweisen) eine Eingabemöglichkeit bereit. Nachdem das Suchwort (zum Beispiel als String zusammen mit einer Sprachkennung) von dem ersten Rechner über eine Kommunikationsverbindung zu einem zweiten Rechner übermittelt wurde, wählt der zweite Rechner einen Suchrechner aus, der im Moment am wenigsten mit Suchläufen belastet ist, wie durch den Block 28 angedeutet ist. Dadurch kann man die eingehenden Suchanfragen auf verschiedene Suchrechner verteilen, was als Lastverteilung (Load-Leveling) bezeichnet wird. Der Suchrechner, der ausgewählt wurde, stellt die entsprechenden Suchworte in verschiedenen natürlichen Sprachen bereit, wobei in einem Zwischenschritt entschieden wird in welchen Sprachen überhaupt gesucht werden soll, wie durch den Block 22 angedeutet. Die entsprechenden Suchworte, die Übersetzungen des ersten Suchworts darstellen, werden aus einer Datenbank (Datensatz) 23 entnommen. Nach diesen Suchworten wird nun, wie durch den Block 24 angedeutet, in einer Datenbank (Datensatz) gesucht. Diese Vorgänge werden hier auch als Suchläufe bezeichnet. Jeder der Suchläufe wird mit einem Suchwort in einer der verschiedenen Sprachen durchgeführt. Es kann alternativ auch ein einziger Suchlauf stattfinden, der aber trotzdem mit den verschiedenen Suchworte sucht. Die Suchläufe liefern Information, die Netzwerk- Dokumente identifizieren. Aus einer eigentlichen Adressdatenbank (Address- Datensatz) werden die konkreten Angaben anhand der gefundenen Ergebnisses der Suchläufe selektiert, wie durch das Symbol 25 dargestellt. Als Ergebnis wird
Adressinformation in Form von Daten geliefert, wie durch den Block 26 dargestellt. Die Adressinformation entspricht den Netzwerk-Dokumenten, oder sie kennzeichnet diese Netzwerk-Dokumente. Die Adressinformation wird gemäss Erfindung so bereit gestellt, dass ein Zugang zu den individuellen Netzwerk- Dokumenten automatisiert möglich wird. Die Ausgabe kann über das Internet (Block 29), als CSV (Comma-Delimited) Datei Ausgabe (Block 30) oder als E-mail Ausgabe (Block 31) erfolgen, um nur einige Beispiele zu geben.
[0050] In Fig. 7 ist das Beispiel einer weiteren Eingabemaske 11.2 gegeben, die durch einen Anwendungssoftware (zum Beispiel einen Browser, Script, Applet) auf dem Bildschirm 11.1 eines ersten Rechners oder eines Mobiltelefons oder eines PDAs dargestellt werden kann. Die Eingabemaske 11.2 ist ähnlich aufgebaut wie die Eingabemaske 11.2 in Fig. 1. Es wird ein Eingabefenster 11.3 vorgegeben, in das ein Suchwort in einer ersten natürlichen Sprache eingegeben werden kann. Je nach Wunsch kann die Suche auf das aktuelle Land beschränkt werden, oder die Suche kann in allen verfügbaren Ländern durchgeführt werden (zum Beispiel in allen EU-Mitgliedsstaaten). Zu diesem Zweck werden entsprechende Fenster 11.9, 11.10 zum Anklicken vorgesehen. Die Suche wird durch Betätigen des Feldes 11.8 oder durch Drücken der Enter-Taste ausgelöst. Das aktuelle Land kann zum Beispiel erkannt werden in dem der Server von dem die Anfrage gestartet wird lokalisiert wird (Auflösung der Domain-Adresse). Alternativ oder zusätzlich können weitere Schaltflächen vorgesehen sein, um das Suchen in einem oder mehreren Ländern selektieren zu können. Diese Information (Länderauswahl, Sprachkennung, Suchwort, etc.) kann zum Beispiel als String übermittelt werden.
[0051] In einer weiteren Ausführungsform ist der eigentlichen Suchmaschine ein Parser und/oder Such-Distiller vorgeschaltet, der aus eingegebenen Suchbegriffen den Wortstamm ermittelt, oder der aus einer Ansammlung von Worten einzelne Suchbegriffe extrahiert und diese verknüpft. Vorzugsweise wird der Parser und/oder Such-Distiller auf einem Rechner (z.B. Rechner 13) des Rechenzentrums installiert und nicht im Client Rechner (z.B. Rechner 11).
[0052] Eine Such-Distillation kann zum Beispiel eingesetzt werden, um den grammatikalischen Wortstamm („Stemming" genannt) zu erkennen. Ein Beispiel für das sogenannte „Stemming" ist dem US-Patent US 6,466,901 zu entnehmen. Bei der Such-Distillation können zum Beispiel auch Tippfehler oder andere Fehler bei der Eingabe korrigiert werden.
[0053] Ein Parser kann eingesetzt werden, um Sätze in Bestandteile zu zerlegen.
[0054] In Fig. 8 ist ein weiteres Beispiel eines Ausgabefensters 33.1 dargestellt. Ein solches Fenster 33.1 kann zum Beispiel auf dem Bildschirm 11.1 des ersten Rechners, oder auf dem Bildschirm eines anderen Rechners angezeigt werden. Auch zu diesem Zweck kann ein Browser, ein Script oder Applet verwendet werden. Das Ausgabefenster 33.1 weist verschiedene Bereiche auf, die anhand des bereits diskutierten Suchbeispiels erläutert wird.
[0055] Eine Kopfzeile 33.2 zeigt den Suchbegriff „Druckerei" und die Anzahl der Treffer. In einer weiteren Zeile 33.3 wird der Inhalt verschiedener Spalten definiert. Die erste Spalte zeigt das Land dem ein gefundenes Netzwerk- Dokument zugeordnet wird. Der Einfachheit halber werden Kurzbezeichnungen für die Länder verwendet. Es können zum Beispiel auch Fahnen oder dergleichen angezeigt werden. Die zweite Spalte gibt eine Beschreibung wieder, die Text umfassen kann. Die Beschreibung steht in direktem Bezug zu dem gefundenen Netzwerk-Dokument und liegt in den verschiedenen Sprachen vor. Im gezeigten Beispiel werden die Beschreibungen in deutscher Sprache ausgegeben, da das Suchwort in Deutsch eingegeben war (was zum Beispiel anhand einer Sprachkennung erkannt werden kann). Neben der Beschreibung können vorzugsweise die jeweiligen Logos der entsprechenden Firmen dargestellt werden.
[0056] Vorzugsweise kann zu jedem gefundenen Netzwerk-Dokument ein Thumbnail 33.4 der wirklichen Webseite hinterlegt sein. Damit bekommt der Benutzer einen schnellen Überblick. Das Thumbnail 33.4 kann mit einem Link verknüpft sein, der direkt zu der wirklichen Webseite führt. Erst wenn der
Benutzer anhand der im Ausgabefenster 33.1 dargestellten Information ein Netzwerk-Dokument gefunden hat, das ihn interessiert, verlässt er den Suchraum und damit den Kontrollbereich des Rechenzentrums respektive der erfindungsgemässen Vorrichtung. Dies kann zum Beispiel dadurch geschehen, dass er auf das Thumbnail 33.4 klickt. Vorzugsweise wird dann eine direkte Verbindung über das Netzwerk zu einem Netzwerk-Dokument hergestellt, wobei diese direkte Verbindung in einem separaten Fenster geöffnet wird. Damit bleibt das Ergebnis einer Session weiterhin in dem Ausgabefenster sichtbar.
[0057] Im gezeigten Beispiel steht der Identifier ID4 für eine Firma „Krause CPT" mit Sitz in Deutschland. Klickt man auf das Thumbnail 33.4, so wird automatisch eine Verbindung über das Netzwerk zu der Webseite www.Krausecpt.de geöffnet und diese Webseite wird in einem weiteren Fenster auf dem Bildschirm dargestellt. Hier sei angemerkt, dass diese Webseite ausserhalb des Kontrollbereichs des Rechenzentrums liegt und daher die Verantwortung für den Inhalt zum Beispiel in den Händen der Firma „Krause CPT" liegt. Da es sich um eine Firma in Deutschland handelt, ist diese Webseite vermutlich in deutscher Sprache verfügbar. Würde der Benutzer an dieser Stelle auf das Thumbnail 33.5 klicken, so würde eine Verbindung zur Webseite www.abprint.pt der Firma „A.B. Print" in Portugal geöffnet. Diese Webseite liegt vermutlich nur in Portugiesisch vor.
[0058] Um in einem solchen Fall dem Benutzer weitere wertvolle Information anbieten zu können, kann optional eine Sammlung (zum Beispiel in Form der Tabelle 4) mit bibliografischer Information zu jedem Dokument verfügbar gemacht werden. Eine solche Sammlung kann zum Beispiel die folgenden Begriffe umfassen:
[0059] Der Sammlung (Tabelle 4) kann im gezeigten Beispiel entnommen werden, dass als Korrespondenzsprache Portugiesisch und Englisch (GB) zur Verfügung steht. Will man nun mit einem Vertreter der Firma A.B. Print in Kontakt treten, weiss man, welche Sprachen verwendet werden können.
[0060] Die Begriffe in der linken Spalte der Sammlung (Tabelle 4) können wiederum in den verschiedenen Sprachen vorliegen, so dass jemand, der die deutsche Sprache verwendet deutsche Begriffe und jemand der die polnische Sprache verwendet polnische Begriffe angezeigt bekommt. Auch in diesem Zusammenhang kann die Sprachkennung zum Einsatz kommen.
[0061] Um eine erfindungsgemässe Suchmaschine und entsprechenden Suchmöglichkeiten anbieten zu können, müssen Daten gesammelt, aufbereitet und gepflegt werden.
[0062] Ein Verfahren zum Erfassen der entsprechenden Daten (Datenerfassungsprozedur) ist in Fig. 9 anhand eines beispielhaften Flussdiagramms dargestellt. Es kann zum Beispiel in dem Eingabefenster 11.2 eine Erfassungsoption vorgesehen sein. In Fig. 7 kann zum Beispiel ein Feld 11.11 vorgesehen sein, das einen Wechsel zu einer Datenerfassungsprozedur
ermöglicht. Die Auswahl der Datenerfassungsprozedur ist in Fig. 9 durch den Block 41 dargestellt. Es werden dann entsprechende Elemente der Datenerfassungsprozedur für den Benutzer dargestellt, wie durch den Block 42 angedeutet. In der gezeigten Ausführungsform hat der Benutzer zwei Optionen. Er kann entweder den Eintrag eines neuen Netzwerk-Dokuments vornehmen, oder er kann ein bereits existierendes Netzwerk-Dokument abändern, bzw. sogar löschen, was auch als eine Änderung angesehen wird. Der Block 43 bietet eine Verzweigung, je nachdem ob eine Neuanmeldung erfolgt oder ob eine Änderung vorgenommen werden soll. Falls ein existierendes Netzwerk-Dokument geändert werden soll, werden die entsprechenden Daten aus einer Datenbank geholt, wie durch den Block 44 symbolisiert. Im nächsten Schritt, durch Block 45 dargestellt, wird dem Benutzer die Möglichkeit geboten manuell Daten einzugeben oder zu ändern. Falls bereits Daten vorhanden sind, werden diese angezeigt und können gelöscht oder überschrieben werden. Ansonsten werden leere Datenfelder vorgegeben. Insgesamt werden über die Datenfelder zum Beispiel die Informationen eingegeben, die in Tabelle 4 aufgelistet sind. Lediglich der Identifier wird automatisch generiert, da es sich um einen eineindeutigen Identifier handelt, der in der erfindungsgemässen Vorrichtung nur einmal vorkommt. In diesem Zusammenhang ist angemerkt, dass es sich bei der Zuordnung und Verwendung von eineindeutigen Identifiern für jedes Netzwerk- Dokument um eine bevorzugte Ausführungsform handelt. Netzwerk-Dokument können aber auch mit anderen Mittel gekennzeichnet und verwaltet werden.
[0063] In einem weiteren Schritt, Block 46, werden die Daten in eine Datenbank geschrieben. Eventuell werden jetzt in einem optionalen Schritt zu den neu eingetragenen Suchworten, je nach Ausführungsform der Erfindung, Verknüpfungen erstellt oder ergänzt.
[0064] Bei dem Schritt 47 handelt es sich um einen optionalen Schritt, der zur Anwendung kommt wenn es mehrere Datenbanken gleichen Inhalts (Shadows) gibt. In diesem Fall werden die Daten der verschiedenen Server im Schritt 47 aktualisiert.
[0065] In der Fig. 10 ist ein mögliches Eingabefenster gezeigt, dass verwendet werden kann, um im Rahmen einer Datenerfassungsprozedur Information zu einem Netzwerk-Dokument zu sammeln. Im Wesentlichen entspricht die Information, die über das Eingabefenster abgefragt wird der Information, die in Tabelle 4 aufgelistet ist. Es ist jedoch anzumerken, dass es sich um ein Beispiel handelt. Im gezeigten Beispiel hat Jemand einen Teil der abgefragten Information zur Firma A.B. Print eingetragen. Damit das Netzwerk- Dokument der Firma A.B. Print im Netzwerk durch die erfindungsgemässe Suche gefunden werden kann, ist es notwendig, dass zu dem Netzwerk-Dokument mindestens ein Suchwort in einer der verfügbaren natürlichen Sprachen vorgegeben wird. Im Beispiel wurden mehrere Suchworte in portugiesischer Sprache vorgegeben und zwar die Worte „A tipografia", „Cartas de vesita", „Prospeto" und „ROTO1", wie in Fig. 11 gezeigt. In einer zweiten Spalte kann die Sprache gewählt werden. Im Bespiel wurden die Suchbegriffe in Portugiesisch (PT) eingegeben.
[0066] Als weiterer Schritt werden nun bei der erfindungsgemässen Datenerfassungsprozedur die einzelnen Suchworte in andere natürliche Sprachen übersetzt oder es werden die einzelnen Suchworte in eine Beziehung zu bereits existierenden Übersetzungen gesetzt. Dies kann automatisch oder manuell erfolgen. In einer bevorzugten Ausführungsform sucht einen Suchroutine bereits vorhandene Begriffe und deren Übersetzung. Dadurch können gewisse Suchworte bereits automatisch übersetzt werden. Lücken bei der Übersetzung werden dann manuell ergänzt.
[0067] Um ein problemloses Übersetzen zu ermöglichen, wird in einer bevorzugten Ausführungsform die Möglichkeit angeboten Marken (Warenzeichen) von anderen Worten zu unterscheiden. In Fig. 11 wird das ermöglicht, indem der Benutzer durch anklicken eines Knopfes diejenigen Worte markiert, die er als Marke behandelt wissen will. Im gezeigten Beispiel handelt es sich bei dem Wort „ROTO1" um eine Marke. Die so markierten Suchworte werden nicht in andere Sprachen übersetzt sondern bleiben in der eingegebenen Fassung. Es ist auch denkbar Worte die nicht übersetzt werden sollen durch Sonderzeichen bei der Eingabe zu markieren, zum Beispiel $ROTOl$ oder $A.B.Print$.
[0068] In einer weiteren bevorzugten Ausführungsform wird die Möglichkeit geboten zu einer Marke einen Rechtshinweis hinzuzufügen. Damit kann zu einer Marke der Inhaber der Marke angeben werden. Zur Marke „ROTO1" kann zum Beispiel durch das Anklicken der Marke in einem Fenster die folgende Information gezeigt werden: >>Die Marke ROTO1 ist eine eingetragene Marke der Firma A.B. Print. <<
[0069] In einer weiteren bevorzugten Ausführungsform wird die E-mail Adresse so bereit gestellt, dass man durch Anklicken der E-mail Adresse automatisch ein Eingabefenster öffnet, das es einem ermöglicht eine E-mail abzufassen und an die E-mail Adresse zu versenden. Dieser Dienst kann optional von dem Betreiber des Rechenzentrums angeboten werden. Ein derartiger E-mail Versand kann anonym erfolgen, um bei einer ersten Anfragen keine kritische oder vertrauliche Information preisgeben zu müssen. In diesem Fall kann das Rechenzentrum einen temporären E-mail Account einrichten, der zum Beispiel mit einer SessionID in Zusammenhang gebracht wird. Eingehende E-mails werden dann, ähnlich wie beim Inserieren in Zeitungen mittels Chiffre, an die wirkliche E-mail Adresse des Suchenden (zum Beispiel auf dem Rechner 11) gesendet.
[0070] In einer weiteren bevorzugten Ausführungsform wird im Rahmen der Datenerfassungsprozedur ein Eingabefenster angeboten, dass verwendet werden kann, um eine Beschreibung einzugeben. Die Beschreibung kann zum Beispiel Information über eine Firma (wie zum Beispiel im Fenster 11.7 in Fig. 3 gezeigt) oder Angaben über die Waren und Dienstleistungen einer Firma geben.
[0071] Je nach Ausführungsform können die Suchbegriffe entweder einzeln eingegeben werden, wie zum Beispiel in Fig. 11 gezeigt, oder sie werden automatisch aus einer Webseite (Netzwerk-Dokument) oder einem anderen Text extrahiert. Es ist auch denkbar, dass die Suchbegriffe durch Experten, oder durch ein automatisiertes Expertensystem erstellt werden. Das Expertensystem kann selbstlernend sein.
[0072] Eine weitere Ausführungsform zeichnet sich dadurch aus, dass ein Ranking Feature eingesetzt wird, um die gefundenen Netzwerk-Dokumente nach Wichtigkeit sortieren zu können (zum Beispiel über die Häufigkeit der Verwendung des Suchwortes, oder über eine Linkanalyse).
[0073] Eine schematische Darstellung einer Ausführungsform einer erfindungsgemässen Vorrichtung 50 ist in Fig. 12 gezeigt. Sobald ein Suchwort durch die Vorrichtung 50 empfangen wird (Block 51), beginnt das Abarbeiten der verschiedenen Vorgänge, wie bereits anhand verschiedener Beispiele beschrieben. Im vorliegenden Beispiel handelt es sich um ein Suchwort in italienischer Sprache, wie im Block 51 durch den Zusatz IT angedeutet. Die Vorrichtung 50 sucht nun diejenigen Suchworte in anderen Sprachen, die dem Suchwort in Italienisch entsprechen. Dieser Vorgang ist als Block 52 dargestellt. Der Vorgang kann zum Beispiel als eine Tabellen-look-up realisiert werden. Der Vorgang liefert als Ergebnis die entsprechenden Suchworte in allen verfügbaren Sprachen, wie durch die Blöcke 53.1 angedeutet. Es finden nun Suchläufe statt, die auf eine Datenbank 54 mit Dokumenten-Daten 54.1 zugreift. Die vorliegende Ausführungsform ist so realisiert, dass das deutsche Suchwort (SuchwortDE) eingesetzt wird, um in deutschsprachigen Dokumenten-Daten zu suchen. Die deutschsprachigen Dokumenten-Daten sind mit einem DE gekennzeichnet. Das italienische Suchwort (SuchwortIT) wird eingesetzt, um in italienischsprachigen Dokumenten-Daten zu suchen (mit IT gekennzeichnet) und das schwedische Suchwort (SuchwortSE) wird eingesetzt, um in schwedischsprachigen Dokumenten-Daten zu suchen (mit SE gekennzeichnet), um einige Beispiele zu nennen. Damit lässt sich der Suchaufwand reduzieren, da mit jedem Suchwort nur in einem Teil der Dokumenten-Daten 54.1 gesucht werden muss. Falls zum Beispiel keine dänischen Dokumenten-Daten vorhanden sind, so muss mit dem dänischen Suchwort nicht gesucht werden, da diese Suche kein Ergebnis liefern würde.
[0074] Jede der Dokumenten-Daten umfassen einen gesperrten Bereich 54.2, der nicht übersetzt zu werden braucht. Dieser gesperrte Bereich ist schraffiert dargestellt. In dem gesperrten Bereich 54.2 können zum Beispiel der Firmenname und der Name einer Kontaktperson stehen. Weiterhin umfassen die
Dokumenten-Daten im gezeigten Beispiel einen offenen Bereich 54.3, der übersetzt werden sollte. / [0075] Zur besseren Übersichtlichkeit liefern die verschiedenen Suchläufe, die vorzugsweise parallel zu einander ausgeführt werden, im vorliegenden Beispiel nur ein einzige Ergebnis. Nur die schwedischen Dokumenten-Daten 55 enthalten das schwedische Suchwort (SuchwortSE). Die Suchläufe stellen die Dokumenten- Daten 55 zur weiteren Bearbeitung zur Verfügung. Im gezeigten Beispiel werden die Informationen (Daten), die im gesperrten Bereich stehen direkt in eine Ausgabedarstellung 57 übernommen. Die Namen der einzelnen Rubriken (Contatti, Telefono, usw.) können in Italienisch vorgegeben werden. Da der Benutzer der Vorrichtung 50, der das Suchwort in Italienisch eingegeben hat, vermutlich kein Schwedisch kann, erfolgt gemäss Erfindung eine Umsetzung in die italienische Sprache. Zu diesem Zweck greift die gezeigte Vorrichtung 50 auf eine Datenbank 56 zu, in der die Übersetzungen verschiedenster Dokumenten- Daten vorgegeben sind. Auch zu diesem Zweck kann die Sprachkennung eingesetzt werden. Vorzugsweise sind in der Datenbank 56 nur die Übersetzungen der Daten der Dokumenten-Daten abgelegt, die in den offenen Bereichen 54.3 stehen. Die Datenbank 56 liefert im gezeigten Beispiel die italienische Übersetzung eines schwedischen Textes, der im offenen 55.3 Bereich der Dokumenten-Daten 55 steht. Die italienische Übersetzung wird in einem anderen Bereich 57.2 der Ausgabedarstellung 57 angezeigt.
[0076] Bei der Vorrichtung 50 gehören alle Element 51 bis und mit 56 zu dem geschlossenen Suchraum. Damit soll ausgerückt werden, dass diese Elemente in einem kontrollierten und genau definierten Verhältnis zueinander stehen und das unbefugte Dritte keinen Zugang zu diesen Elementen haben. Auch wenn die einzelnen Elemente an verschiedenen geographischen Orten angesiedelt sein können, so bilden sie trotzdem eine logische Einheit. Um Schutz gegen unbefugte Dritte zu erzielen, können Firewalls, geschützte Festleitungen, und/oder Verschlüsslungsprotokolle verwendet werden, um Beispiele zu geben wie der Suchraum abgesichert werden kann.
[0077] Eine schematische Darstellung einer weiteren möglichen Ausführungsform einer erfindungsgemässen Vorrichtung 60 ist in Fig. 13 gezeigt. Sobald ein Suchwort durch die Vorrichtung 60 empfangen wird (Block 61), beginnt das Abarbeiten der verschiedenen Vorgänge, wie bereits anhand verschiedener Beispiele beschrieben. Im vorliegenden Beispiel handelt es sich um ein Suchwort in französischer Sprache, wie im Block 61 durch den Zusatz FR angedeutet. Die nun beschriebene Ausführungsform ist besonders effizient, da einem Suchwort ein Schlüssel (PID) zugeordnet wird. In Fig. 13 ist ein Ausschnitt aus einer Tabelle 61.1 gezeigt, der zu jedem Schlüssel (PID) die Suchworte in den verschiedenen verfügbaren natürlichen Sprachen aufführt.
[0078] Die Schlüssel (PID) werden vorzugsweise als Nummer mit einem Sonderzeichen, z.B. #, vor und nachgestellt abgelegt. Dadurch kann über das SQL Statement Like und Contain gesucht werden und es können auch OR und AND Verknüpfungen eingesetzt werden. Der Schlüssel (PID) #57# steht als Synonym für die Suchwörter „typografia", „Imprimerie", „printering", „A tipografia", usw. Die Vorrichtung 60 liefert als Ergebnis eines Tabellen-Look-up den Schlüssel (PID) #57#, wie in Block 62 dargestellt, falls der Benutzer das Suchwort „Imprimerie" vorgegeben hat.
[0079] Nun wird ein Suchlauf gestartet, der in allen Dokumenten-Daten 64.1 einer Datenbank 63 nach dem Schlüssel (PID) #57# sucht. Bei der gezeigten Ausführungsform werden die Dokumenten-Daten 64.1 nicht ausgegeben, sondern es werden lediglich die Dokumenten-Daten markiert - zum Beispiel mit Flags - die gefunden wurden. Im gezeigten Beispiel werden zwei Dokumenten- Daten als Treffer angesehen (sie sind aus rein darstellungstechnischen Gründen durch ein X gekennzeichnet). Anstatt die Treffer zu markieren, können auch Zeiger (direkte oder indirekte) gesetzt werden, die auf die zutreffenden Dokumenten-Daten verweisen. Ein Rechnersystem 65 führt eine Ausgabeprozedur aus. Das Rechnersystem 65 kann zum Beispiel einen Rechner 65.1 und eine Datenbank 65.2 umfassen. Der Rechner nimmt nun die zu übersetzenden Worte aus offenen Bereichen 64.3 der zutreffenden Dokumenten- Daten und überträgt sie anhand der in der Datenbank 65.2 gespeicherten
Übersetzungen ins Französische (die Abfragesprache, wie zum Beispiel anhand einer Sprachkennung oder dergleichen erkennbar ist).
[0080] Die Ausgabe erfolgt im gezeigten Beispiel über ein Netzwerk 12 und von dort über eine Mobilfunkantenne 67 an ein WAP-taugliches Mobiltelefon 16.
[0081] Details einer weiteren Vorrichtung 70 sind in der Fig. 14 gezeigt. Auch bei der in Fig. 14 gewählten Darstellung handelt es sich um eine schematische Darstellung. Die Vorrichtung 70 kann zum Beispiel ein Datenbankserver 71 aufweisen, der einen Bus 81 und verschiedene Hard- und Softwarekomponenten umfasst. Um eine Verbindung mit anderen Rechnern, Mobiltelefonen oder PDAs zu ermöglichen ist eine Schnittstelle (Interface) 72 vorgesehen. Neben einer CPU 75 weist der Server 71 verschiedene Festspeicher (RAM 74 und ROM 73) auf. Die Vorrichtung wird von einer Software kontrolliert, deren verschiedene Module auf der rechten Seite des Buses 81 angeordnet sind. Die Software sitz zum Beispiel in dem ROM 73 der Vorrichtung und kontrolliert die Aktionen, die die CPU 75 ausführt oder ausführen lässt. Im Arbeitsspeicher (RAM 74) können zum Beispiel Zwischenresultate oder dergleichen abgelegt werden.
[0082] Falls ein Benutzer von einem WAP-fähigen Mobiltelefon eine Suche starten möchte, kann er zum Beispiel eine Webseite anwählen, die Zugang zu dem Rechenzentrum bietet. Es öffnet sich dann ein Eingabefenster auf dem Bildschirm des Mobiltelefons und es kann ein Suchwort eingegeben und eine Abfragesprache ausgewählt werden. Diese Schritte werden zum Beispiel durch das Eingabemodul 76 gehandhabt. Um verschiedene Anfragen verschiedener Benutzer unterscheiden zu können, kommt vorzugsweise ein Session Modul 76.1 zum Einsatz, das zum Beispiel jede aktive Session anhand einer SessionID unterscheiden kann. Das Mobiltelefon übergibt über ein Netzwerk und das Interface 72 das Suchwort und die Abfragesprache (zum Beispiel in Form einer Sprachkennung) an die Vorrichtung 70. Ein optionales Sprachmodul 76.2 kann eine automatische Spracherkennung durchführen, oder dieses Module 76.2 stellt sicher, dass eine Sprachkennung, die übermittelt wurde, innerhalb des Servers 71 entsprechend gehandhabt wird. Vom Eingabemodul 76 wird jetzt zum Beispiel das Suchwort an ein Suchwort Modul 77 übergeben. Je nach Ausführungsform
der Erfindung ermittelt das Suchwort Modul 77 entweder alle korrespondierenden Übersetzungen des Suchworts oder das Suchwort Modul 77 ermittelt einen Identifier (Schlüssel PID) zu dem Suchwort das eingegeben wurde. Rechts neben dem Server 71 sind die verschiedenen logischen Bereiche einer Datenbank angesiedelt. Durch Pfeile 85 ist jeweils angedeutet, welches Modul auf weiche Datensätze der Datenbank zugreift. Der Zugriff erfolgt in der Praxis zum Beispiel über den Bus 81 und das Interface 72, oder über ein spezielles Datenbank- Interface (nicht gezeigt).
[0083] Die korrespondierenden Übersetzungen oder den Identifier (Schlüssel PID) kann das Suchwort Modul 77 zum Beispiel aus einer Tabelle 82 holen. Diese Tabelle 82 kann zum Beispiel wie die Tabelle 61.1 ausgeführt sein. In den Ausführungsformen der Erfindung, die mehrere Übersetzungen des Suchworts verarbeitet, werden diese Suchworte und das ursprüngliche Suchwort an ein Suchmodel 78 übergeben. Dieses Suchmodul 78 führt dann Suchläufe mit den jeweiligen Suchworten in allen gewünschten oder verfügbaren Sprachen aus.
[0084] In den Ausführungsformen der Erfindung, die das Suchwort in einen Identifier (Schlüssel PID) umsetzen, übergibt das Suchwort Modul 77 dem Suchmodul 78 nur diesen Identifier (Schlüssel PID) als Suchwort. Dieses Suchmodul 78 führt dann einen Suchlauf mit dem Identifier (Schlüssel PID) aus. Dieser Ansatz ist sehr viel schneller.
[0085] Der Suchlauf oder die Suchläufe werden zum Beispiel in einer Datenbank 83 durchgeführt. Ein Trefferverarbeitungsmodul 79 verarbeitet die in der Datenbank 83 gefundenen Netzwerk-Dokumente, wie durch den Doppelpfeil 85 zwischen dem Trefferverarbeitungsmodul 79 und der Datenbank 83 angedeutet. Entweder ist das Trefferverarbeitungsmodul 79 so ausgeführt, dass es mit Kopien der wirklichen Netzwerk-Dokumenten arbeitet, oder das Trefferverarbeitungsmodul 79 arbeitet mit Zeigern oder Flags, wie bereits beschrieben. Es gibt selbstverständlich verschiedene Wege dies zu implementieren, so kann zum Bespiel das Suchmodul 78 alle Identifier (z.B. ID 123), die gefunden wurden dem Trefferverarbeitungsmodul 79 übergeben und
das Trefferverarbeitungsmodul 79 holt sich dann die entsprechenden Daten aus der Datenbank 83.
[0086] Ein Ausgabemodul 80 kennt die Abfragesprache, die in einer Session verwendet wurde, zum Beispiel da dem Server 71 die Sprachkennung zur Verfügung steht. Somit ist das Ausgabemodul 80 in der Lage zu jedem im Rahmen der Suche gefundenen Netzwerk-Dokument eine Übersetzung in die Abfragesprache aus einer Datenbank 84 zu holen, wie durch den Doppelpfeil 85 zwischen dem Modul 80 und der Datenbank 84 angedeutet. Das Ausgabemodul 80 kann auch die Aufgabe übernehmen dem Ursprung der Suchanfrage, die zum Beispiel anhand der SessionID zu erkennen ist, die Adressinformation samt den Übersetzungen zu übermitteln. Diese Übermittlung erfolgt zum Beispiel über den Bus 81, das Interface 72 und ein nicht gezeigtes Netzwerk.
[0087] Die Session bleibt vorzugsweise weiterhin für eine Zeit erhalten. Dies kann wichtig sein, falls der Benutzer im Browser zurück blättert, oder bei Ausführungsformen, wo die Adressinformation ein interner Link ist, der auf Netzwerk-Dokumente in der Vorrichtung 70 verweist.
[0088] In einer bevorzugten Ausführungsform ist das Sprachmodul 76.2 so ausgelegt, dass es eine Überprüfung eingegebener Suchworte ausführt. Hat zum Beispiel der Benutzer das Wort „car" eingegeben, als Sprache ist aber Deutsch ausgewählt, so würde das Sprachmodul 76.2 eine Meldung zurück geben, die eine Korrektur ermöglicht. Bei Suchworten, die mehrere Bedeutungen haben können, kann das Sprachmodul 76.2 zum Beispiel um genauere Angaben bitten.
[0089] In einer bevorzugten Ausführungsform ist das Ausgabemodul 80 aus ausgeführt, dass es prüft, ob zu einem Netzwerk-Dokument, das gefunden wurde eine Übersetzung in der Abfragesprache vorliegt. Falls dem nicht so ist, kann das Ausgabemodul dem Benutzer die Auswahl einer alternativen Sprache vorschlagen.
[0090] Die Kommunikation zwischen dem Rechenzentrum und dem Rechner eines Benutzers kann bevorzugt mittels ASP (Active Server Pages) Code, PHP
Code, HTML (Hypertext markup language) code oder XML (Extensible Language Markup) Code erfolgen.