WO2005086024A1 - Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung - Google Patents

Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung Download PDF

Info

Publication number
WO2005086024A1
WO2005086024A1 PCT/EP2005/001412 EP2005001412W WO2005086024A1 WO 2005086024 A1 WO2005086024 A1 WO 2005086024A1 EP 2005001412 W EP2005001412 W EP 2005001412W WO 2005086024 A1 WO2005086024 A1 WO 2005086024A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
network
address information
database
search word
Prior art date
Application number
PCT/EP2005/001412
Other languages
English (en)
French (fr)
Inventor
Roland Rupp
Original Assignee
Roland Rupp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roland Rupp filed Critical Roland Rupp
Publication of WO2005086024A1 publication Critical patent/WO2005086024A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Definitions

  • the invention relates to methods for providing address information to enable access to documents in a multilingual system, as well as a corresponding device and software for use in such a device.
  • the present invention has for its object to provide a search engine that enables the user of a network to find information in the network that is offered in a language that the user is not familiar with.
  • the present invention has for its object to provide a search method that can be implemented using computer technology and that is suitable to support the goods and services between countries with different languages.
  • This object is achieved according to the invention by querying a first search word in a first natural language, this being achieved by providing an input option on a first computer.
  • the search word is transmitted via a communication link to a device which provides at least one search word which represents a translation of the first search word.
  • the search words are made available in various languages from a first database.
  • a search is carried out with at least one search word in order to identify network documents which can be reached via a network.
  • This search is carried out in a second database. Address information is now provided which corresponds to the network documents or which identifies the network documents which were found when the search was carried out. The address information enables access to the individual network documents.
  • this object is achieved by a device which comprises processing means which are designed to access one or more of the following database modules:
  • a database module with stored document data which includes information about the network documents
  • the device comprises a search module that performs a search after entering a search word in the database modules in order to find all network documents in whose stored document data the search word occurs in at least one of the different natural languages.
  • the search module provides or marks the document data found.
  • An output module makes address information available which corresponds to the network documents or which identifies the network documents which were found when the search was carried out. This address information can be used to access the network documents found via the network.
  • this object is also achieved by software which is used in a corresponding device with computing means and database.
  • the software controls or calls the execution of various Steps out.
  • a first search word is queried in a first natural language by providing an input option on an external computing means.
  • the first search word is transmitted to the device via a communication link.
  • At least one search word is provided there, which represents a translation of the first search word.
  • the search words are made available in various languages in the database.
  • a search is carried out with at least one search word in order to identify network documents, the search being carried out in the database. Address information is provided which corresponds to the network documents or which identifies the network documents which were found when the search was carried out. Address information is then provided in order to enable access to the individual network documents.
  • an EU-wide platform possibly even with the connection of offers from non-EU countries, can be set up to give all parties connected in an economic cycle (i.e. manufacturer, wholesaler / importer, reseller and sales agent) the opportunity to be able to record their products and services themselves, or to have them recorded.
  • Information about the products and services is then translated into the respective languages, this preferably being done automatically, and in a preferred embodiment leads to a simple link to the original website. In this way, an Internet user is guided to the desired information, regardless of which language he uses to search.
  • the invention is preferably designed in such a way that a continuously growing database in the different languages helps to translate and catalog known search terms. For example, unknown words can be translated manually.
  • Found websites are preferably displayed sorted by (hit) match and country.
  • the websites found are displayed together with a brief description text and a preview of the website.
  • Figure 1 is a schematic view of a first embodiment according to the invention.
  • 2 shows a schematic view of an input screen of an embodiment according to the invention;
  • 3 shows a schematic view of an output screen of an embodiment according to the invention;
  • 4 shows a schematic view of a second embodiment according to the invention;
  • 5 shows a schematic flow diagram of a third embodiment according to the invention;
  • 6 shows a schematic flow diagram of a fourth embodiment according to the invention;
  • 7 shows a schematic view of a further input screen of an embodiment according to the invention;
  • 8 shows a schematic view of a further output screen of an embodiment according to the invention;
  • 9 shows a schematic flow diagram of a possible input procedure according to the invention;
  • 10 is a schematic view of an input screen of an embodiment according to the invention that can be used to acquire information;
  • 11 shows a schematic view of a further input screen of an embodiment according to the invention, which is used for the detection of Information can be used;
  • 12 shows a schematic view of a further embodiment according to the
  • a first embodiment of the invention is shown in Fig. 1 in a schematic form.
  • a device 10 is shown which comprises a first computer 11, a second computer 13 and a database 14.
  • the three elements 11, 13, 14 mentioned can be connected to one another via a network 12.
  • the network 12 is shown schematically in FIG. 1.
  • network documents In the network 12 there are numerous websites and other information offers, which are referred to in the following simply as network documents. These network documents can be located in a wide variety of locations, for example on servers in different countries. A number of such network documents are indicated in FIG. 1.
  • a first network document A DE (for example a website) is in German
  • a second network document B PT (for example a website) is in Portuguese
  • a third network document C SE (for example an https portal) is available in Swedish.
  • System 10 is therefore a so-called multilingual system.
  • the device 10 now provides address information which, despite the multilingualism of the device, is delivered in a natural language which is understandable for a user.
  • the following steps typically take place.
  • a user of the first computer 11 enters a search word in a first natural language into a search window 11.3, which is displayed in an application window 11.2 (called an input mask) on the screen 11.1 of the computer 11.
  • the application that represents window 11.2 can be, for example, an (HTML) browser.
  • the user can select the natural language that he wishes to use.
  • the language can be specified, or the language can be recognized automatically.
  • Such a recognition of the language can be implemented in that the one software routine (for example an applet or script that is present in the computer 11 or that is temporarily transferred to the computer 11) queries the local language setting of the computer 11.
  • Manual selection of the natural language takes place, for example, via a window 11.5, which is provided with a drop-down menu.
  • the user has entered the word "printer” and selected the German language.
  • the search word "printer” is transferred from the first computer 11 to the second computer 13 via a communication link transmitted.
  • the communication connection runs via the network 12.
  • a language identifier is transmitted.
  • the search word “print shop” is transferred together with the language identifier in a string.
  • the second computer 13 now provides corresponding search words in different natural languages, which represent a translation of the first search word, as is explained in the following table 1 using the search word “printer”:
  • first data record DB1 which can be connected to the second computer 13 or which the second computer 13 can access.
  • this first data record DB1 is located in the database 14, for example.
  • a search engine now carries out search runs with the first search word “printer” and the corresponding search words "typ culture”, “Imprimerie”, “La imprenta”, “Tryckeri” and "A tiplake” in order to identify relevant network documents 12.
  • This search is carried out in a second data record DB2, in which numerous search words including assignments to network documents are stored.
  • this second data record DB2 is also located in the database 14.
  • the second data record DB2 has access to this assignment. Table 2 below shows a simple example of a possible assignment.
  • address information is provided which corresponds to the network documents or which identifies these network documents in such a way that they can be found / selected through the network 12.
  • address information is provided for the network documents identified by the assignments ID4, ID7, ID21, ID38 and ID123, as shown below using an example:
  • address information in the form of http addresses.
  • other address formats can also be used, such as: URL, ftp, e-mail addresses, etc.
  • the address information corresponding to the keys can be provided and searched for, for example, in a third data record DB3.
  • the address information for the assignments ID4, ID7, ID21, ID38 and ID123 is now transmitted to the first computer 11, this transmission typically taking place via the network 12.
  • the address information can also be transmitted by other means, such as by e-mail, by fax, by SMS, to name a few examples.
  • the user on the computer 11 is given the opportunity to determine how and in what form he wishes to receive the address information. For example, the user can select one or more of the following shipping methods. Dispatch to the first computer 11; another computer; a pager; a mobile phone; a PDA; a fax number; an e-mail address.
  • the return to the computer 11 can be provided as a default.
  • the second computer 13 can, for example, assign a special session ID to the search query that comes from the computer 11. As a result, the second computer 13 knows which computer 11 is to be used for the return.
  • the address information is now provided on the first computer 11.
  • a window can be used for this purpose
  • the output window can be opened on the screen 11.1 in order to display the address information there, as indicated in FIG. 2.
  • the http links can be stored, as indicated by underlining the address information.
  • a further window 11.7 is opened in which information about the corresponding network document in the first language, i.e. in the query language German.
  • the language 13 can also be transmitted to the computer 13 together with the search word, as described above.
  • the computer knows at all times which query language was used and thus also in which language a network document should preferably be displayed or output.
  • FIG. 3 An example of this is given in FIG. 3.
  • This window 11.7 shows information in the German language.
  • the corresponding translations in the various natural languages can be made available, for example, via a fourth data record DB4.
  • the link with a reference to an address in the fourth data record DB4 be deposited.
  • the link www.abprint.pt is not a real link that points directly to the network 12, but is a replacement link (system-internal link) within the data center 15.
  • this is only one possible, albeit particularly preferred, embodiment.
  • a second embodiment of the invention is shown in schematic form in FIG. 4.
  • a device 10 is shown, which comprises a first computer 11, a network 12.1, 12.2 and a data center 15.
  • the data center 15 comprises an interface 15.1, for example in the form of a special computer, a second computer 13 and a database 14.
  • the second computer 13 and the database 14 have no direct access to the network 12, 12.2.
  • the second computer 13 is connected to the database 14 and the interface 15.1 via protected or dedicated communication links 15.2 and 15.3, as indicated in FIG. 4.
  • the network consists of two subnetworks 12.1, 12.2, as shown schematically in FIG. 4.
  • a database 14 is provided, in which all information necessary for carrying out the method according to the invention is stored in the form of data records.
  • a search word is queried in a first natural language. As described in connection with FIG. 1, this can take place on the first computer 11.
  • the search word entered is transmitted from the first computer 11 to the second computer 13 via the networks 12.1 and 12.2 and the interface 15.1.
  • the corresponding search words are available there in various natural languages, which represent a translation of the first search word.
  • a search engine now carries out searches with the first search word and the corresponding search words in the various other languages in order to identify network documents A DE , B PT , C SE , D ⁇ in the network 12.1, 12.2.
  • This search is also carried out in the database 14.
  • search words are stored in the different languages including assignments (for example in the form of unique identifiers IDx) to network documents A DE , Bpj, C SE , Dir.
  • address information is provided which corresponds to those network documents A D E / B PT , C SE , Drr or which identifies those network documents which were found when the search was carried out. This address information is provided in order to enable access to the individual network documents A DE , B PT , C SE , D IT .
  • This embodiment can, as indicated in connection with the first embodiment, be modified in a variety of ways.
  • the arrangement or structure of the data center 15 or the output of the address information can be carried out differently.
  • the output can, for example, as indicated in FIG. 4, take place in such a way that the address information is transmitted to a mobile phone 16 via SMS via a mobile radio connection 16.1.
  • network is understood to mean networks such as the Internet, but also networks within companies. It can be cable and fiber-based networks and wireless networks (e.g. wireless LANs).
  • address information describes information that can be used to obtain automated access to a network document. It is not about address information in the traditional sense (e.g. the postal address), but address information such as: http-link, https-link, url address, ftp address, e-mail address, pager number.
  • This address information differs from the conventional one in that it can be used directly in order to gain access or access to a found network document with the aid of technical means (eg computer or mobile phone and network). Automated access is therefore mentioned when it comes to access that is automatically set up or using technical aids (computer, mobile phone, etc.) is provided and with which information is returned (website, WAP information, etc.)
  • the term data center is used to describe a logical and / or physical link between several systems - such as computers and databases (for example with the data records DB1 to DB4).
  • a data center does not necessarily have to be concentrated in one place. As indicated in FIG. 1, for example, it can also consist of systems which are located at different locations and which can be connected to one another via a network or a dedicated communication link.
  • a closed search space is to be understood as an arrangement or structure that only allows access through well-defined interfaces or portals. Changes in the closed search space can only be made by special people (e.g. employees of an operator), or by special interfaces or software modules.
  • the term "closed search space" is also intended to indicate that, unlike the Internet, which in the broadest sense is an open system, it is a precisely defined and controlled environment.
  • a closed search space only includes assignments and information that The closed search space cannot be accessed directly via the network 12, but is accessed via the controlled and secure execution of search runs.
  • the term database is used both for databases in the physical sense and for the actual collection of data. If several data records, for example data records DB1 to DB4, are mentioned in connection with the present invention, this should not mean that they are separate data records. For example, the records can be linked together. It can also be a single data record with different areas (eg columns and rows or data sheets).
  • FIG. 5 Another method according to the invention is shown in FIG. 5 in the form of a flow chart. The method comprises at least the following steps, which can be carried out at least in part parallel to one another.
  • a search word is entered in a first natural language.
  • a first computer or for example a cell phone or a PDA provides an input option.
  • the second computer After the search word has been transmitted from the first computer via a communication connection to a second computer (for example as a string together with a language identifier), the second computer provides corresponding search words in different natural languages, an optional intermediate step being used to decide in which languages to search should be, as indicated by block 22.
  • the corresponding search words which represent translations of the first search word, are taken from a database (data record) 23. As indicated by block 24, these search words are now searched for in a database (data record).
  • These processes are also referred to as searches. Each of the searches is carried out with a search word in one of the different languages. Alternatively, a single search can take place, but still searches with the different search words.
  • the searches provide information that identifies network documents.
  • address data record address data record
  • address data record address data record
  • the results are provided.
  • a list with address information can be displayed.
  • the address information corresponds to the network documents, or it identifies these network documents. According to the invention, the address information is provided in such a way that access to the individual network documents is automatically possible.
  • FIG. 5 in simplified form by the box 15.
  • the closed system can be the data center 15 in FIG. 4 correspond.
  • This delimitation from the outside has the advantage that all essential processes take place in a protected and well-defined environment. Only the input of the search word and the output at the end of the search runs are outside the closed system. The input and output can be done using a suitable SessionID to give an example of the handling.
  • FIG. 6 Another method according to the invention is shown in FIG. 6 in the form of a flow chart.
  • the process comprises at least the following steps.
  • a search word is entered in a first natural language.
  • a first computer or for example a mobile phone or a PDA, which for the sake of simplicity is also referred to herein as a computer, which they also have a computer / processor
  • the search word for example as a string together with a voice identifier
  • the second computer selects a search computer that is currently least loaded with searches, as by block 28 is indicated.
  • the search computer that has been selected provides the corresponding search words in different natural languages, an intermediate step being used to decide in which languages to search at all, as indicated by block 22.
  • the corresponding search words which represent translations of the first search word, are taken from a database (data record) 23.
  • these search words are now searched for in a database (data record).
  • These processes are also referred to as searches. Each of the searches is carried out with a search word in one of the different languages. Alternatively, a single search run can take place, but still searches with the different search words.
  • the searches provide information that identifies network documents.
  • the actual information is selected from an actual address database (address data record) on the basis of the search results found, as represented by the symbol 25.
  • Address information is provided in the form of data, as represented by block 26.
  • the address information corresponds to the network documents, or it identifies these network documents. According to the invention, the address information is provided in such a way that automated access to the individual network documents is possible.
  • the output can take place via the Internet (block 29), as a CSV (comma-delimited) file output (block 30) or as an e-mail output (block 31), to give just a few examples.
  • a further input mask 11.2 is given, which can be displayed by an application software (for example a browser, script, applet) on the screen 11.1 of a first computer or a mobile phone or a PDA.
  • the input mask 11.2 is constructed similarly to the input mask 11.2 in FIG. 1.
  • An input window 11.3 is specified in which a search word can be entered in a first natural language. Depending on your requirements, the search can be limited to the current country or the search can be carried out in all available countries (for example in all EU member states). For this purpose, corresponding windows 11.9, 11.10 are provided for clicking on.
  • the search is triggered by pressing field 11.8 or by pressing the Enter key.
  • the current country can be recognized, for example, by locating the server from which the request is started (resolution of the domain address). Alternatively or additionally, further buttons can be provided in order to be able to select the search in one or more countries.
  • This information (country selection, language code, search word, etc.) can be transmitted as a string, for example.
  • the actual search engine is preceded by a parser and / or search distiller, which determines the word stem from the search terms entered, or which extracts individual search terms from a collection of words and links them.
  • the parser and / or search distiller is preferably installed on a computer (eg computer 13) in the data center and not in the client computer (eg computer 11).
  • Search distillation can be used, for example, to recognize the grammatical word stem (called "stemming"). An example of the so-called "stemming" can be found in US Pat. No. 6,466,901. Search distillation can also correct typing errors or other typing errors, for example.
  • a parser can be used to break sentences into parts.
  • FIG. 33.1 Another example of an output window 33.1 is shown in FIG. Such a window 33.1 can be displayed, for example, on the screen 11.1 of the first computer, or on the screen of another computer. A browser, script or applet can also be used for this purpose.
  • the output window 33.1 has different areas, which is explained on the basis of the search example already discussed.
  • a header 33.2 shows the search term "printer" and the number of hits.
  • the content of various columns is defined.
  • the first column shows the country to which a network document found is assigned. For the sake of simplicity, short names are used for the countries. For example, flags or the like can also be displayed.
  • the second column shows a description, which may include text. The description is directly related to the network document found and is available in the different languages In the example shown, the descriptions are output in German, since the search word was entered in German (which can be recognized, for example, by means of a language identifier).
  • a thumbnail 33.4 of the actual website can preferably be stored for each network document found. This gives the user a quick overview.
  • the thumbnail 33.4 can be linked to a link that leads directly to the real website. Only when the If the user has found a network document that interests him on the basis of the information displayed in the output window 33.1, he leaves the search space and thus the control area of the data center or the device according to the invention. This can be done, for example, by clicking on thumbnail 33.4.
  • a direct connection is then preferably established via the network to a network document, this direct connection being opened in a separate window. The result of a session remains visible in the output window.
  • the identifier ID4 stands for a company "Krause CPT" based in Germany. If you click on the thumbnail 33.4, a connection via the network to the website www.Krausecpt.de is automatically opened and this website becomes displayed in another window on the screen. It should be noted that this website is outside the control area of the data center and therefore the responsibility for the content lies, for example, in the hands of the "Krause CPT" company. Since this is a company in Germany, this website is probably available in German. If the user clicked on thumbnail 33.5 at this point, a connection to the website www.abprint.pt of the company “A.B. Print "opened in Portugal. This website is probably only available in Portuguese.
  • a collection for example in the form of Table 4 with bibliographic information on each document can optionally be made available.
  • Such a collection can include the following terms, for example:
  • the collection (Table 4) shows that Portuguese and English (GB) are available as the correspondence language. If you want to go with a representative of A.B. If you get in touch in print, you know which languages can be used.
  • FIG. 9 A method for acquiring the corresponding data (data acquisition procedure) is illustrated in FIG. 9 using an exemplary flow chart.
  • a detection option can be provided in the input window 11.2.
  • a field 11.11 can be provided, which is a change to a data acquisition procedure allows.
  • the selection of the data acquisition procedure is represented by block 41 in FIG. 9.
  • Corresponding elements of the data acquisition procedure for the user are then shown, as indicated by block 42.
  • the user has two options. He can either enter a new network document, or he can change or even delete an existing network document, which is also considered a change.
  • Block 43 offers a branch, depending on whether a new registration is made or whether a change is to be made.
  • block 46 the data are written to a database.
  • links may now be created or added to the newly entered search words in an optional step.
  • Step 47 is an optional step that is used when there are several databases with the same content (shadows).
  • the data of the different servers are updated in step 47.
  • FIG. 10 shows a possible input window that can be used to collect information about a network document as part of a data acquisition procedure.
  • the information that is queried via the input window essentially corresponds to the information that is listed in Table 4.
  • this is an example.
  • search words were specified in Portuguese, namely the words “A tiplake”, “Cartas de vesita”, “Prospeto” and “ROTO1", as shown in FIG. 11.
  • the language can be selected in a second column.
  • search terms were entered in Portuguese (PT).
  • the individual search words are now translated into other natural languages in the data acquisition procedure according to the invention, or the individual search words are related to existing translations. This can be done automatically or manually.
  • a search routine searches for existing terms and their translation. This means that certain search terms can already be translated automatically. Gaps in the translation are then filled in manually.
  • the possibility is offered in a preferred embodiment to distinguish brands (trademarks) from other words.
  • Fig. 11 this is made possible by the user marking, by clicking a button, those words which he wants to be treated as a mark.
  • the word "ROTO1" is a trademark.
  • the search words thus marked are not translated into other languages but remain in the input version. It is also conceivable to mark words that should not be translated with special characters when entering , for example $ ROTOl $ or $ ABPrint $.
  • the possibility is offered to add a legal notice to a brand. This means that the owner of the brand can be specified for a brand. For example, by clicking on the brand in a window, the following information can be shown for the "ROTO1" brand: >> The ROTO1 brand is a registered trademark of AB Print. ⁇
  • the e-mail address is provided in such a way that an input window is automatically opened by clicking on the e-mail address, which enables one to write an e-mail and send it to the e-mail address .
  • This service can optionally be offered by the operator of the data center.
  • Such an e-mail can be sent anonymously in order not to have to disclose critical or confidential information when making initial inquiries.
  • the data center can set up a temporary e-mail account that is associated with a session ID, for example.
  • Incoming e-mails are then sent to the real e-mail address of the searcher (for example on the computer 11), similarly to the insertion in newspapers by means of a cipher.
  • an input window is offered as part of the data acquisition procedure that can be used to enter a description.
  • the description may provide information about a company (such as shown in window 11.7 in FIG. 3) or information about a company's goods and services.
  • the search terms can either be entered individually, as shown for example in FIG. 11, or they are automatically extracted from a website (network document) or other text. It is also conceivable that the search terms are created by experts or by an automated expert system. The expert system can be self-learning. Another embodiment is characterized in that a ranking feature is used in order to be able to sort the network documents found according to their importance (for example via the frequency with which the search word is used or via a link analysis).
  • FIG. 12 A schematic representation of an embodiment of a device 50 according to the invention is shown in FIG. 12.
  • a search word is received by the device 50 (block 51)
  • the processing of the various processes begins, as already described using various examples.
  • it is a search word in Italian, as indicated in block 51 by the addition IT.
  • the device 50 now searches those search words in other languages which correspond to the search word in Italian.
  • This process is shown as block 52.
  • the process can be implemented, for example, as a table look-up.
  • the process supplies the corresponding search words in all available languages, as indicated by blocks 53.1.
  • the present embodiment is implemented in such a way that the German search word (search word DE) is used to search in German-language document data.
  • the German-language document data are marked with a DE.
  • the Italian search word (search word IT) is used to search in Italian language document data (marked IT)
  • the Swedish search word (search word SE) is used to search in Swedish language document data (marked SE), for some examples call.
  • the search effort can thus be reduced, since with each search word only a part of the document data 54.1 has to be searched. If, for example, there is no Danish document data available, the Danish search word does not have to be searched, since this search would not produce a result.
  • Each of the document data includes a locked area 54.2 that does not need to be translated.
  • This blocked area is shown hatched.
  • the blocked area 54.2 for example, the company name and the name of a contact person can be found.
  • the Document data in the example shown an open area 54.3 that should be translated.
  • the various search runs which are preferably carried out in parallel with one another, only deliver a single result in the present example. Only the Swedish document data 55 contains the Swedish search word (search word SE). The search runs make the document data 55 available for further processing.
  • search word SE Swedish search word
  • the search runs make the document data 55 available for further processing.
  • the information (data) that is in the blocked area is transferred directly to an output display 57.
  • the names of the individual categories can be specified in Italian.
  • the invention translates into the Italian language.
  • the device 50 shown accesses a database 56, in which the translations of various document data are specified.
  • the voice identifier can also be used for this purpose.
  • the database 56 provides the Italian translation of a Swedish text which is in the open 55.3 area of the document data 55.
  • the Italian translation is displayed in another area 57.2 of the output display 57.
  • all elements 51 to 56 belong to the closed search space. This is intended to explain that these elements are in a controlled and precisely defined relationship to one another and that unauthorized third parties have no access to these elements. Even if the individual elements can be located in different geographical locations, they still form a logical unit. To achieve protection against unauthorized third parties, firewalls, protected landlines, and / or encryption protocols can be used to give examples of how the search space can be secured.
  • FIG. 13 A schematic representation of a further possible embodiment of a device 60 according to the invention is shown in FIG. 13. As soon as a search word is received by the device 60 (block 61), the processing of the various processes begins, as already described using various examples.
  • FIG. 13 shows an excerpt from a table 61.1, which lists the search words for each key (PID) in the various available natural languages.
  • the keys (PID) are preferably used as a number with a special character, e.g. #, filed before and after. This means that the SQL statement can be used to search for like and contain, and OR and AND links can also be used.
  • the key (PID) # 57 # is synonymous with the search words “typ culture”, “Imprimerie”, “printering”, “A tiplake”, etc.
  • the device 60 provides the key (PID) as a result of a table look-up. # 57 #, as shown in block 62 if the user has specified the search word "Imprimerie".
  • a search is now started, which searches for all the document data 64.1 of a database 63 for the key (PID) # 57 #.
  • the document data 64.1 are not output, but only the document data that are found - for example with flags - are marked.
  • two document data are regarded as hits (they are marked with an X for purely technical reasons). Instead of marking the hits, pointers (direct or indirect) can be set that refer to the relevant document data.
  • a computer system 65 executes an output procedure.
  • the computer system 65 can comprise, for example, a computer 65.1 and a database 65.2.
  • the computer now takes the words to be translated from open areas 64.3 of the applicable document data and transfers them on the basis of those stored in the database 65.2 Translations into French (the query language, as can be recognized, for example, from a language identifier or the like).
  • the output takes place via a network 12 and from there via a mobile radio antenna 67 to a WAP-compatible mobile phone 16.
  • the illustration selected in FIG. 14 is also a schematic illustration.
  • the device 70 can have, for example, a database server 71, which comprises a bus 81 and various hardware and software components.
  • An interface 72 is provided in order to enable a connection to other computers, mobile telephones or PDAs.
  • the server 71 has various read-only memories (RAM 74 and ROM 73).
  • the device is controlled by software, the various modules of which are arranged on the right side of the bus 81.
  • the software resides in the device's ROM 73 and controls the actions that the CPU 75 performs or has performed.
  • intermediate results or the like can be stored in the working memory (RAM 74).
  • a user wants to start a search from a WAP-compatible mobile phone, he can, for example, select a website that offers access to the data center. An input window then opens on the screen of the mobile phone and a search word can be entered and a query language can be selected. These steps are handled by the input module 76, for example.
  • a session module 76.1 is preferably used, which can distinguish, for example, each active session by means of a session ID.
  • the mobile telephone transmits the search word and the query language (for example in the form of a speech identifier) to the device 70 via a network and the interface 72.
  • An optional speech module 76.2 can carry out an automatic speech recognition, or this module 76.2 ensures that a speech identifier which transmitted, is handled accordingly within the server 71.
  • the search word is now, for example, transferred from the input module 76 to a search word module 77.
  • the search word module 77 either determines all corresponding translations of the search word or the search word module 77 determines an identifier (key PID) for the search word that was entered.
  • the various logical areas of a database are located to the right of the server 71. Arrows 85 indicate which module is accessing soft data records in the database. In practice, access takes place, for example, via bus 81 and interface 72, or via a special database interface (not shown).
  • the search word module 77 can fetch the corresponding translations or the identifier (key PID) from a table 82, for example.
  • This table 82 can, for example, be designed like table 61.1.
  • these search words and the original search word are passed to a search model 78.
  • This search module 78 then carries out searches with the respective search words in all desired or available languages.
  • the search word module 77 transfers only this identifier (key PID) to the search module 78 as a search word.
  • This search module 78 then carries out a search with the identifier (key PID). This approach is much faster.
  • the search run or the search runs are carried out, for example, in a database 83.
  • a hit processing module 79 processes the network documents found in the database 83, as indicated by the double arrow 85 between the hit processing module 79 and the database 83.
  • the hit processing module 79 is designed to work with copies of the actual network documents, or the hit processing module 79 works with pointers or flags, as already described.
  • the search module 78 can transfer all identifiers (eg ID 123) that were found to the hit processing module 79 and hit processing module 79 then fetches the corresponding data from database 83.
  • An output module 80 knows the query language that was used in a session, for example because the language identifier is available to the server 71.
  • the output module 80 is thus able to get a translation into the query language from a database 84 for each network document found in the search, as indicated by the double arrow 85 between the module 80 and the database 84.
  • the output module 80 can also take on the task of transmitting the address information, including the translations, to the origin of the search query, which can be recognized, for example, by the session ID. This transmission takes place, for example, via the bus 81, the interface 72 and a network, not shown.
  • the session is preferably retained for a time. This may be important if the user browses back in the browser, or in embodiments where the address information is an internal link that references network documents in device 70.
  • the language module 76.2 is designed such that it carries out a check of entered search words. For example, if the user has entered the word "car", but German is selected as the language, the language module 76.2 would return a message that enables correction. For search words that can have multiple meanings, the language module 76.2 can, for example, change ask for more details.
  • the output module 80 is designed to check whether there is a translation in the query language for a network document that was found. If this is not the case, the output module can suggest to the user the selection of an alternative language.
  • the communication between the data center and the computer of a user can preferably by means of ASP (Active Server Pages) code, PHP Code, HTML (Hypertext markup language) code or XML (Extensible Language Markup) code.
  • ASP Active Server Pages
  • PHP Code PHP Code
  • HTML Hypertext markup language
  • XML Extensible Language Markup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

Vorrichtung (70), die Verarbeitungsmittel (71) umfasst, die dazu ausgelegt sind auf eine oder mehrere der folgenden Datenbankmodule (82, 83, 84) zuzugreifen: - ein Datenbankmodul (82) mit Suchworten in verschiedenen natürlichen Sprachen und mit Zuordnungen zu Netzwerk-Dokumenten, - ein Datenbankmodul (83) mit gespeicherten Dokumenten-Daten, die Information zu den Netzwerk-Dokumenten umfasst, - ein Datenbankmodul (84) mit Adressinformation mittels derer die Netzwerk-Dokumente über ein Netzwerk zugreifbar sind, Die Vorrichtung umfasst weiterhin ein Suchmodul (76), das nach Eingabe eines Suchworts in den Datenbankmodulen (82, 83) einen Suchlauf ausführt, um alle Netzwerk-Dokumente zu finden in deren gespeicherten Dokumenten-Daten das Suchwort in mindestens einer der verschiedenen natürlichen Sprachen vorkommt. Das Suchmodul (76) stellt die gefundenen Dokumenten-Daten bereit oder markiert sie. Ein Ausgabemodul (80) macht Adressinformation verfügbar, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Diese Adressinformation ist verwendbar, um über das Netzwerk auf die gefundenen Netzwerk-Dokumente zu zugreifen.

Description

VERFAHREN ZUM BEREITSTELLEN VON ADRESSINFORMATION , EINE ENTSPRECHENDE VORRICHTUNG UND SOFTWARE ZUR VERWENDUNG IN EINER SOLCHEN VORRICHTUNG
[001] Die Erfindung betrifft Verfahren zum Bereitstellen von Adressinformation, um Zugang zu Dokumenten in einem multilingualen System zu ermöglichen, sowie eine entsprechende Vorrichtung und Software zur Verwendung in einer solchen Vorrichtung.
[002] Floskeln wie „Die Welt wird kleiner" kennt jeder Internetanwender. Dass es möglich ist, dank dem Internet auf der ganzen Welt einzukaufen und seine eigenen Dienstleistungen und Waren auf einer Webseite oder in einem Online Shop zu präsentieren ist auch bekannt und dass Suchmaschinen wie Froogle.com heute viele Onlineshops zusammengeschlossen haben und so Produktvergleiche ermöglichen, wissen auch sehr viele Internetanwender.
[003] Damit aber Produkte und Dienstleistungen im Internet verglichen werden können, müssen diese erst einmal gefunden werden. Wenn dann auch noch länder-, respektive sprachübergreifende Vergleiche angestellt werden sollen, so ergeben sich verschiedene Probleme, von denen im Folgenden einige aufgeführt sind:
[004] Es gibt heute keine Technologie, die es ermöglicht, sprachübergreifende Produktrecherchen durchzuführen. Dies im Wesentlichen aus zwei Gründen. Erstens kennt kaum ein Nutzer die gewünschten Begriffe in allen Landessprachen (zum Beispiel in den heute verwendeten elf vorhandenen EU Amtssprachen). Zweitens hat kaum jemand seine eigene Homepage, sowie seine Suchbegriffe, in all diesen Sprachen abgelegt.
[005] Eine Suche in englischer Sprache, wie sie häufig propagiert wird, reicht nicht aus, da ja die entsprechenden Homepages der einzelnen Hersteller oder Dienstleister auch nicht in dieser Sprache in den jeweiligen Suchmaschinen abgelegt worden sind. Eventuell sind in die entsprechenden Homepages zwar englischsprachige Seiten integriert, mit Sicherheit aber sind nicht die entsprechenden Suchbegriffe in Englisch oder gar in anderen Landessprachen abgelegt.
[006] Anhand eines einfachen Beispieles sei es hier verdeutlicht. Gesucht werden sollen alle Druckereien im EU Raum. Die EU hat im Moment die folgenden Mitgliedsstaaten: Belgien, Dänenmark, Deutschland, Griechenland, Spanien, Frankreich, Irland, Italien, Luxemburg, Niederlande, Österreich, Portugal, Finnland, Schweden, Vereinigtes Königreich. Mit der Osterweitung ab 1. Mai 2004 kommen die folgenden Staaten hinzu : Tschechische Republik, Lettland, Estland, Zypern, Littauen, Ungarn, Malta, Polen, Slowenien, Slovakei. Weitere Bewerberländer sind im Moment Bulgarien, Rumänien und die Türkei. Damit Druckereien in diesen Ländern überhaupt gefunden werden könnten, müsste nun also zum Beispiel nach dem Wort Druckerei in den folgenden Sprachen gesucht werden: Deutsch, Französisch, Belgisch, Dänisch, Griechisch, Holländisch, Spanisch, Italienisch, Portugiesisch, Finnisch, Schwedisch, Englisch, Tschechisch, Lettisch, Estnisch, Zypriotisch, Ungarisch, Maltesisch, Polnisch, Slowenisch, Slovakisch.
[007] Selbst wenn ein Internetnutzer sich die Mühe machen würde einen Suchbegriff in alle anderen Sprachen zu übersetzen, so würde er keine brauchbaren Ergebnisse erhalten, da er zwar vielleicht Webseiten in den verschiedenen Ländern finden würde, er diese Webseiten aber nicht lesen könnte, da sie in den meisten Fällen in der jeweiligen Landessprache abgefasst sind. Diese Schwierigkeit wird besonders gravierend, wenn neben der anderen Sprache auch noch andere Schriftzeichen zum Einsatz kommen, wie zum Beispiel in (Griechenland, Israel, Saudi-Arabien, China, Japan, um einige Beispiele zu geben).
[008] Eines der Probleme, das sich aus der Globalisierung ergibt ist das der Sprachbarrieren. Besonders in Wirtschaftsräumen wie in Europa, wo viele Nationalitäten mit verschiedensten Sprachen Ihre Grenzen öffnen, um den freien Waren- und Dienstleistungsverkehr zu ermöglichen, stellen die Sprachbarrieren echte Hindernisse dar.
[009] Der vorliegenden Erfindung liegt die Aufgabe zugrunde, eine Suchmaschine anzubieten, die es dem Nutzer eines Netzwerks ermöglicht Information in dem Netzwerk zu finden, die in einer Sprache angeboten wird, die dem Nutzer nicht geläufig ist.
[0010] Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Suchverfahren anzubieten, dass sich mittels Computertechnik umsetzen lässt und das dazu geeignet ist den Waren- und Dienstleistungsverkehr zwischen Staaten mit verschiedenen Landessprachen zu unterstützen.
[0011] Diese Aufgabe wird erfindungsgemäss dadurch gelöst, dass eine Abfrage eines ersten Suchwortes in einer ersten natürlichen Sprache erfolgt, wobei dies durch das Bereitstellen einer Eingabemöglichkeit auf einem ersten Rechner erreicht wird. Das Suchworts wird über eine Kommunikationsverbindung zu einer Vorrichtung übermittelt, die mindesten eine Suchwort bereit stellt, das eine Übersetzung des ersten Suchworts darstellt. Die Suchwörter werden in verschiedenen Sprachen von einer ersten Datenbank zur Verfügung gestellt. Es wird ein Suchlauf mit mindestens einem Suchwort durchgeführt, um Netzwerk- Dokumente zu identifizieren, die über ein Netzwerk erreichbar sind. Dieser Suchlauf wird in einer zweiten Datenbank durchgeführt. Es wird nun Adressinformation bereit gestellt, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Mittels der Adressinformation erlangt man so Zugang zu den individuellen Netzwerk-Dokumenten.
[0012] Diese Aufgabe wird erfindungsgemäss durch eine Vorrichtung gelöst, die Verarbeitungsmittel umfasst, die dazu ausgelegt sind auf eine oder mehrere der folgenden Datenbankmodule zuzugreifen :
• ein Datenbankmodul mit Suchworten in verschiedenen natürlichen Sprachen und mit Zuordnungen zu Netzwerk-Dokumenten,
• ein Datenbankmodul mit gespeicherten Dokumenten-Daten, die Information zu den Netzwerk-Dokumenten umfasst,
• ein Datenbankmodul mit Adressinformation mittels derer die Netzwerk- Dokumente über ein Netzwerk zugreifbar sind,
[0013] Zusätzlich umfasst die Vorrichtung ein Suchmodul, das nach Eingabe eines Suchworts in den Datenbankmodulen einen Suchlauf ausführt, um alle Netzwerk-Dokumente zu finden in deren gespeicherten Dokumenten-Daten das Suchwort in mindestens einer der verschiedenen natürlichen Sprachen vorkommt. Das Suchmodul stellt die gefundenen Dokumenten-Daten bereit oder markiert sie. Ein Ausgabemodul macht Adressinformation verfügbar, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Diese Adressinformation ist verwendbar, um über das Netzwerk auf die gefundenen Netzwerk-Dokumente zu zugreifen.
[0014] Diese Aufgabe wird erfindungsgemäss auch durch eine Software gelöst, die in einer entsprechenden Vorrichtung mit Rechenmittel und Datenbank zum Einsatz kommt. Die Software kontrolliert oder ruft das Abarbeiten verschiedener Schritte hervor. Dabei findet eine Abfrage eines ersten Suchwortes in einer ersten natürlichen Sprache durch das Bereitstellen einer Eingabemöglichkeit auf einem externen Rechenmittel statt. Das erste Suchwort wird über eine Kommunikationsverbindung zu der Vorrichtung übermittelt. Dort wird mindestens ein Suchwort bereit gestellt, das eine Übersetzung des ersten Suchworts darstellt. Die Suchwörter werden zu diesem Zweck in verschiedenen Sprachen in der Datenbank zur Verfügung gestellt. Es wird ein Suchlauf mit mindestens einem Suchwort durchgeführt, um Netzwerk-Dokumente zu identifizieren, wobei der Suchlauf in der Datenbank durchgeführt wird. Adressinformation wird bereit gestellt, welche den Netzwerk-Dokumenten entspricht oder welche die Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden. Dann wird Adressinformation bereit gestellt, um so Zugang zu den individuellen Netzwerk-Dokumenten zu ermöglichen.
[0015] Weitere vorteilhafte Ausführungsformen sind den entsprechenden abhängigen Ansprüchen zu entnehmen.
[0016] Gemäss Erfindung kann zum Beispiel eine EU-weite Plattform, eventuell sogar mit Anbindung von Angeboten von Nicht-EU Staaten, aufgebaut werden, um allen in einem Wirtschaftskreislauf angeschlossenen Stellen (also Hersteller, Grosshändler/Importeur, Wiederverkäufer und Verkaufsagenten) die Möglichkeit zu bieten, ihre Produkte und Dienstleistungen selbst erfassen zu können , oder erfassen lassen zu können. Information zu den Produkten und Dienstleistungen werden dann in die jeweiligen Sprachen übersetzt, wobei dies vorzugsweise automatisch geschieht, und führen in einer bevorzugten Ausführungsform durch einfache Verlinkung auf die Original Webseite. Damit wird ein Internetanwender zur gewünschten Information geführt, egal welche Sprache er zum Suchen verwendet.
[0017] Vorzugsweise ist die Erfindung so ausgelegt, dass eine kontinuierlich wachsende Datenbank in den verschiedenen Sprachen hilft, bereits bekannte Suchbegriffe zu übersetzen und zu katalogisieren. Nicht bekannte Worte können zum Beispiel manuell übersetzt werden. [0018] Vorzugsweise werden gefundene Webseiten nach (Treffer-) Übereinstimmung und Land sortiert angezeigt.
[0019] Vorzugsweise werden die gefundene Webseiten zusammen mit einem kurzen Beschreibungstext und einer Vorschau der Webseite angezeigt.
[0020] Weitere Einzelheiten und Vorteile der Erfindung werden im folgenden anhand von Ausführungsbeispielen und mit Bezug auf die Zeichnung beschrieben. Es zeigen:
Fig. 1 eine schematische Ansicht einer ersten Ausführungsform gemäss Erfindung; Fig. 2 eine schematische Ansicht eines Eingabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 3 eine schematische Ansicht eines Ausgabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 4 eine schematische Ansicht einer zweiten Ausführungsform gemäss Erfindung; Fig. 5 ein schematisches Flussdiagramm einer dritten Ausführungsform gemäss Erfindung; Fig. 6 ein schematisches Flussdiagramm einer vierten Ausführungsform gemäss Erfindung; Fig. 7 eine schematische Ansicht eines weiteren Eingabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 8 eine schematische Ansicht eines weiteren Ausgabebildschirms einer Ausführungsform gemäss Erfindung; Fig. 9 ein schematisches Flussdiagramm einer möglichen Eingabeprozedur, gemäss Erfindung; Fig. 10 eine schematische Ansicht eines Eingabebildschirms einer Ausführungsform gemäss Erfindung, der zum Erfassen von Information verwendet werden kann; Fig. 11 eine schematische Ansicht eines weiteren Eingabebildschirms einer Ausführungsform gemäss Erfindung, der zum Erfassen von Information verwendet werden kann; Fig. 12 eine schematische Ansicht einer weiteren Ausführungsform gemäss Erfindung; Fig. 13 eine schematische Ansicht einer weiteren Ausführungsform gemäss Erfindung; Fig. 14 eine schematische Ansicht einer weiteren Ausführungsform gemäss Erfindung.
Detaillierte Beschreibung:
[0021] In den Figuren sind für dieselben Elemente dieselben Bezugszeichen verwendet, wenn nicht ausdrücklich anders erwähnt.
[0022] Im Folgenden werden vorteilhafte Ausführungsformen der Erfindung beschrieben, wobei es sich um beispielhafte Ausführungsformen handelt. Diese umfassen sowohl verschiedene Ausbildungen der Gesamterfindung, als auch Baugruppen/Module und einzelne Elemente der Erfindung. Grundsätzlich lassen sich die beschriebenen Baugruppen/Module und einzelnen Elemente der verschiedenen Ausführungsformen miteinander kombinieren, respektive die Baugruppen und einzelne Elemente einzelner Ausführungsformen lassen sich durch die Baugruppen und einzelne Elemente anderer Ausführungsformen ersetzen. Die hierbei gebildeten Kombinationen können kleinere, jedem Fachmann geläufige und daher nicht weiter beschriebene Anpassungen bedingen, zum Beispiel um ein Zusammenwirken oder Ineinandergreifen der Baugruppen und einzelnen Elemente zu ermöglichen.
[0023] Eine erste Ausführungsform der Erfindung ist in Fig. 1 in schematisierter Form dargestellt. Gezeigt ist eine Vorrichtung 10, die einen ersten Rechner 11, einen zweiten Rechner 13 und eine Datenbank 14 umfasst. Die drei genannten Elemente 11, 13, 14 sind in dem gezeigten Ausführungsbeispiel über ein Netzwerk 12 miteinander verbindbar. Das Netzwerk 12 ist in Fig. 1 schematisiert dargestellt. Der zweite Rechner 13, bei dem es sich zum Beispiel um einen Datenbankserver handeln kann, und die Datenbank 14 bilden zusammen ein sogenanntes Rechenzentrum, wie in Fig. 1 durch die gestrichelte Box 15 angedeutet.
[0024] In dem Netzwerk 12 gibt es zahlreiche Webseiten und andere Informationsangebote, die im Folgenden vereinfacht als Netzwerk-Dokumente bezeichnet werden. Diese Netzwerk-Dokumente können an verschiedensten Orten, zum Beispiel auf Servern in verschiedenen Ländern angesiedelt sein. In Fig. 1 sind mehrere solche Netzwerk-Dokumente angedeutet. Ein erstes Netzwerk-Dokument ADE (zum Beispiel eine Webseite) liegt in deutscher Sprache vor, ein zweites Netzwerk-Dokument BPT (zum Beispiel eine Webseite) liegt in portugiesischer und ein drittes Netzwerk-Dokument CSE (zum Beispiel ein https Portal) liegt in schwedischer Sprache vor. Bei dem System 10 handelt es sich also um ein sogenanntes mehrsprachiges System.
[0025] Gemäss Erfindung wird nun durch die Vorrichtung 10 Adressinformation bereit gestellt, die trotz der Mehrsprachigkeit der Vorrichtung in einer natürlichen Sprache geliefert wird, die für einen Benutzer verständlich ist. Typischerweise laufen dabei die folgenden Schritte ab. Ein Benutzer des ersten Rechners 11 gibt ein Suchwort in einer ersten natürlichen Sprache in ein Suchfenster 11.3 ein, das in einem Anwendungsfenster 11.2 (Eingabemaske genannt) auf dem Bildschirm 11.1 des Rechners 11 angezeigt wird. Bei der Anwendung, die das Fenster 11.2 darstellt, kann es sich zum Beispiel um einen (HTML) Browser handeln. Zusätzlich kann der Benutzer im gezeigten Beispiel die natürliche Sprache auswählen, die er zu verwenden wünscht. Alternativ kann die Sprache vorgegeben sein, oder die Sprache kann automatisch erkannt werden. Eine solche Erkennung der Sprache kann realisiert werden, indem die eine Softwareroutine (zum Beispiel ein Applet oder Script das im Rechner 11 vorliegt oder das dem Rechner 11 temporär überspielt wird) die lokale Spracheinstellung des Rechners 11 abfragt. Die manuelle Auswahl der natürlichen Sprache erfolgt zum Beispiel über ein Fenster 11.5, das mit einem Drop-Down Menü versehen ist. Im vorliegenden Beispiel hat der Benutzer das Wort „Druckerei" eingegeben und die Deutsche Sprache ausgewählt. Durch Betätigen einer Enter-Taste oder des Such-Knopfes 11.4 wird das Suchwort „Druckerei" von dem ersten Rechner 11 über eine Kommunikationsverbindung zu dem zweiten Rechner 13 übermittelt. Die Kommunikationsverbindung verläuft in dem Beispiel über das Netzwerk 12. Zusätzlich zu dem Suchwort „Druckerei" wird eine Sprachkennung übermittelt. Vorzugsweise wird das Suchwort „Druckerei" zusammen mit der Sprachkennung in einem String übergeben.
[0026] Der zweite Rechner 13 stellt nun in dem beschriebenen Beispiel entsprechende Suchworte in verschiedenen natürlichen Sprachen bereit, die eine Übersetzung des ersten Suchworts darstellen, wie in der folgenden Tabelle 1 anhand des Suchworts „Druckerei" erläutert wird:
Figure imgf000011_0001
[0027] Die entsprechenden Suchworte in den verschiedenen Sprachen werden in einem ersten Datensatz DB1 zur Verfügung gestellt, der mit dem zweiten Rechner 13 verbindbar ist oder auf den der zweite Rechner 13 zugreifen kann. In dem gezeigten Beispiel ist dieser erste Datensatz DB1 zum Beispiel in der Datenbank 14 angesiedelt. Eine Suchmaschine führt nun Suchläufe mit dem ersten Suchwort „Druckerei" und den entsprechenden Suchwörtern „typografia", „Imprimerie", „La imprenta", „Tryckeri" und „A tipografia" durch, um treffende Netzwerk-Dokumente 12 zu identifizieren. Diese Suche wird in einem zweiten Datensatz DB2 durchgeführt, in dem zahlreiche Suchwörter samt Zuordnungen zu Netzwerk-Dokumenten gespeichert sind. In dem gezeigten Beispiel ist dieser zweite Datensatz DB2 auch in der Datenbank 14 angesiedelt.
[0028] Jedem Netzwerk-Dokument in dem Netzwerk 12, respektive jedem Netzwerk-Dokument, das über das Netzwerk 12 erreichbar ist, wurde beim Erstellen des Datensatzes DB2 eine eineindeutige Zuordnung (Identifier, ID) zugeteilt. Diese Zuordnung können erweitert und bei Bedarf korrigiert werden. Der zweite Datensatz DB2 hat Zugang zu dieser Zuordnung. In der folgenden Tabelle 2 ist ein einfaches Beispiel einer möglichen Zuordnung dargestellt.
Figure imgf000012_0001
[0029] Wie aus der vorstehenden Tabelle 2 zu entnehmen ist, gibt es zum gegebenen Zeitpunkt drei Netzwerk-Dokumente, die den deutschen Begriff „Druckerei" betreffen. Diesen drei Netzwerk-Dokumenten wurden vorgängig die Zuordnungen ID4, ID7 und ID21 zugeteilt. Es gibt ein französischsprachiges Netzwerk-Dokument ID38, der das entsprechende Suchwort „Imprimerie" betrifft und ein portugiesisches Netzwerk-Dokument ID123, welches das Wort „A tipografia" betrifft. Insgesamt findet der zweite Rechner 13 mit Hilfe der Suchmaschine fünf Netzwerk-Dokumente (ID4, ID7, ID21, ID38, ID123), die in einem Bezug stehen mit dem Suchwort „Druckerei".
[0030] Damit ist ein erster wesentlicher Schritt gemacht, der mit konventionellen Suchmaschinen und Suchstrategien nicht möglich wäre. Eine herkömmliche Suchmaschine würde nur die Netzwerk-Dokumente finden, bei denen das Suchwort „Druckerei" in deutscher Sprache als Meta-tag abgelegt ist. Dies ist bei fremdsprachigen Dokumenten meistens nicht der Fall.
[0031] In einem weiteren Schritt wird Adressinformation bereit gestellt, die den Netzwerk-Dokumenten entspricht oder diese Netzwerk-Dokumente so kennzeichnet, dass sie durch das Netzwerk 12 hindurch auffindbar/anwählbar sind. Es wird dabei natürlich nur Adressinformation derjenigen Netzwerk- Dokumente bereit gestellt, die bei dem Durchführen der Suche gefunden wurden. Im vorliegenden Beispiel wird Adressinformation zu den durch die Zuordnungen ID4, ID7, ID21, ID38 und ID123 gekennzeichneten Netzwerk-Dokumenten zur Verfügung gestellt, wie im Folgenden anhand eines Beispiels dargestellt:
Figure imgf000013_0001
[0032] Es handelt sich in dem gezeigten Beispiel um Adressinformation in Form von http-Adressen. Es können aber auch andere Adressformate verwendet werden, wie zum Beispiel: URL, ftp, E-mail Adressen, usw. Die den Schlüsseln (Zuordnungen, IDx) entsprechende Adressinformation kann zum Beispiel in einem dritten Datensatz DB3 bereitgestellt und gesucht werden.
[0033] Die Adressinformation zu den Zuordnungen ID4, ID7, ID21, ID38 und ID123 wird jetzt an den ersten Rechner 11 übermittelt, wobei diese Übermittlung typischerweise über das Netzwerk 12 erfolgt. Die Adressinformation kann aber auch mit anderen Mitteln übermittelt werden, wie zum Beispiel per E-mail, per Fax, per SMS, um einige Beispiele zu nennen.
[0034] In einer bevorzugten Ausführungsform wird dem Benutzer am Rechner 11 die Möglichkeit eingeräumt zu bestimmen wie und in welcher Form er die Adressinformation zu erhalten wünscht. Der Benutzer kann zum Beispiel eine oder mehrere der folgenden Versandarten auswählen. Versand an den ersten Rechner 11; einen anderen Rechner; einen Pager; ein Mobiltelefon; ein PDA; eine Faxnummer; eine E-mail Adresse.
[0035] Als Default kann die Rücksendung an den Rechner 11 vorgesehen sein. Zu diesem Zweck kann der zweite Rechner 13 zum Beispiel der Suchanfrage, die vom Rechner 11 kommt eine spezielle SessionID zuordnen. Dadurch weiss der zweite Rechner 13 an welchen Rechner 11 die Rücksendung zu erfolgen hat.
[0036] Die Adressinformation wird nun im gezeigten Beispiel am ersten Rechner 11 bereitgestellt. Es kann zu diesem Zweck zum Beispiel ein Fenster
11.6 (Ausgabefensters genannt) auf dem Bildschirm 11.1 geöffnet werden, um dort die Adressinformation, wie in Fig. 2 angedeutet, darzustellen. Um über das Netzwerk 12 Zugang zu den individuellen Netzwerk-Dokumenten zu ermöglichen, können die http-Links hinterlegt sein, wie durch Unterstreichung der Adressinformation angedeutet ist.
[0037] In einer bevorzugten Ausführungsform wird durch Anklicken einer Adressinformation zum Beispiel ein weiteres Fenster 11.7 geöffnet, in dem Angaben zu dem entsprechenden Netzwerk-Dokument in der ersten Sprache, d.h. in der Abfragesprache Deutsch, dargestellt werden. Zu diesem Zweck kann dem Rechner 13 zusammen mit dem Suchwort auch die Sprachkennung übermittelt werden, wie weiter oben beschrieben. Anhand der Sprachkennung ist dem Rechner jederzeit bekannt welche Abfragesprache verwendet wurde und somit auch in welcher Sprache ein Netzwerk-Dokument vorzugsweise anzuzeigen oder auszugeben ist.
[0038] Ein Beispiel hierzu ist in Fig. 3 gegeben. Der Benutzer hat in dem gezeigten Beispiel auf den Link www.abprint.pt geklickt und es wird das Fenster
11.7 geöffnet. In diesem Fenster 11.7 werden Angaben in der deutschen Sprache angezeigt. Die entsprechenden Übersetzungen in den verschiedenen natürlichen Sprachen können zum Beispiel über einen vierten Datensatz DB4 zur Verfügung gestellt werden. In der Ausführungsform, bei der man durch Anklicken einer Adressinformation ein Fenster mit weiterführender Information in der ersten natürlichen Sprache angeboten bekommt (siehe das in Fig. 3 gezeigte Beispiel), kann der Link mit einem Verweis auf eine Adresse in dem vierten Datensatz DB4 hinterlegt sein. D.h. mit anderen Worten, dass es sich bei dem Link www.abprint.pt nicht um einen echten Link handelt, der direkt in das Netzwerk 12 verweist, sondern dass es sich um einen Ersatz-Link (systeminterner Link) innerhalb des Rechenzentrums 15 handelt. Dies ist aber, wie gesagt, nur eine mögliche, wenn auch besonders bevorzugte, Ausführungsform.
[0039] Eine zweite Ausführungsform der Erfindung ist in Fig. 4 in schematisierter Form dargestellt. Gezeigt ist eine Vorrichtung 10, die einen ersten Rechner 11, ein Netzwerk 12.1, 12.2 und ein Rechenzentrum 15 umfasst. Das Rechenzentrum 15 umfasst eine Schnittstelle 15.1, zum Beispiel in Form eines speziellen Rechners, einen zweiten Rechner 13 und eine Datenbank 14. Der zweite Rechner 13 und die Datenbank 14 haben keinen direkten Zugang zum Netzwerk 12, 12.2. Der zweite Rechner 13 steht über geschützte oder dedizierte Kommunikationsverbindungen 15.2 und 15.3 mit der Datenbank 14 und der Schnittstelle 15.1 in Verbindung, wie in Fig. 4 angedeutet. Das Netzwerk besteht im gezeigten Beispiel aus zwei Teilnetzen 12.1, 12.2, wie in Fig. 4 schematisiert dargestellt. Es ist eine Datenbank 14 vorgesehen, in der alle für die Durchführung des erfindungsgemässen Verfahrens notwendige Information in Form von Datensätzen abgespeichert ist.
[0040] In der Vorrichtung 10 werden die folgenden erfindungsgemässen Schritte durchgeführt, wobei zu beachten ist, dass mindestens ein Teil der Schritte parallel zu einander ablaufen kann, oder dass die Schritte auf verschiedenen Rechner (zum Beispiel Parallel-Rechnern) ausgeführt werden können. Es erfolgt ein Abfragen eines Suchwortes in einer ersten natürlichen Sprache. Dies kann, wie im Zusammenhang mit Fig. 1 beschrieben, auf dem ersten Rechner 11 erfolgen. Das eingegebene Suchwort wird von dem ersten Rechner 11 über die Netzwerke 12.1 und 12.2 und das Interface 15.1 zu dem zweiten Rechner 13 übermittelt. Dort sind die entsprechenden Suchworte in verschiedenen natürlichen Sprachen verfügbar, die eine Übersetzung des ersten Suchworts darstellen. Eine Suchmaschine führt nun Suchläufe mit dem ersten Suchwort und den entsprechenden Suchwörtern in den verschiedenen anderen Sprachen aus, um Netzwerk-Dokumente ADE, BPT, CSE, DΠ in dem Netzwerk 12.1, 12.2 zu identifizieren. Auch diese Suche wird in der Datenbank 14 durchgeführt. Dort sind Suchwörter in den verschiedenen Sprachen samt Zuordnungen (zum Beispiel in Form von eineindeutigen Identifieren IDx) zu Netzwerk-Dokumenten ADE, Bpj, CSE, Dir gespeichert. Als Ergebnis dieser Suchläufe wird Adressinformation bereit gestellt, welche denjenigen Netzwerk-Dokumenten ADE/ BPT, CSE, Drr entspricht oder welche diejenigen Netzwerk-Dokumente kennzeichnet, die bei dem Durchführen der Suche gefunden wurden. Diese Adressinformation wird bereit gestellt, um so Zugang zu den individuellen Netzwerk-Dokumenten ADE, BPT, CSE, DIT ZU ermöglichen.
[0041] Auch diese Ausführungsform kann, wie im Zusammenhang mit der ersten Ausführungsform angedeutet, in verschiedenster Art und Weise abgewandelt werden. So kann zum Beispiel die Anordnung oder der Aufbau des Rechenzentrums 15 oder die Ausgabe der Adressinformation anders ausgeführt werden. Die Ausgabe kann zum Beispiel, wie in Fig. 4 angedeutet, so erfolgen, dass die Adressinformation per SMS über eine Mobilfunkverbindung 16.1 an ein Mobiltelefon 16 übermittelt wird.
[0042] Unter dem Begriff Netzwerk sind Netzwerke wie zum Beispiel das Internet, aber auch Netzwerke innerhalb von Firmen zu verstehen. Es kann sich um kabel- sowie fiber-basierte Netzwerke und um kabellose Netzwerke (z.B. Wireless LANs) handeln.
[0043] Der Begriff Adressinformation beschreibt Information, die verwendet werden kann, um einen automatisierten Zugriff zu einem Netzwerk-Dokument zu erhalten. Es geht also nicht um Adressangaben im herkömmlichen Sinne (z.B. die Postadresse), sondern um Adressinformation wie zum Beispiel: http-link, https- link, url-Adresse, ftp-Adresse, E-mail-Adresse, Pager-Nummer. Diese Adressinformation unterscheidet sich von der herkömmlichen dadurch, dass sie unmittelbar verwendet werden kann, um unter Zuhilfenahme technischer Mittel (z.B. Rechner oder Mobiltelefon und Netzwerk) Zugang oder Zugriff zu einem gefundenen Netzwerk-Dokument zu erhalten. Von einem automatisierten Zugriff ist also die Rede, wenn es um einen Zugriff geht, der mittels technischer Hilfsmittel (Rechner, Mobiltelefon, etc.) automatisch aufgebaut oder bereitgestellt wird und bei dem Information zurück geliefert wird (Webseite, WAP-Information, etc.)
[0044] Der Begriff Rechenzentrum wird verwendet, um eine logische und/oder physikalische Verknüpfung mehrere Systeme - wie zum Beispiel Rechner und Datenbanken (zum Beispiel mit den Datensätzen DB1 bis DB4) - zu beschreiben. Ein Rechenzentrum muss nicht zwingender Weise an einem Ort konzentriert sein. Es kann auch, wie zum Beispiel in Fig. 1 angedeutet, aus Systemen bestehen, die an verschiedenen Orten angesiedelt sind und die über ein Netzwerk oder eine dedizierte Kommunikationsverbindung miteinander verbindbar sind.
[0045] Im Zusammenhang mit dem Begriff Rechenzentrum ist hierin die Rede von einem geschlossenen Suchraum. Unter einem geschlossenen Suchraum ist eine Anordnung, respektive ein Aufbau zu verstehen, der einen Zugang nur durch wohl definierte Schnittestellen oder Portale ermöglicht. Änderungen in dem geschlossenen Suchraum können nur durch spezielle Personen (zum Beispiel Angestellte eines Betreibers), oder durch spezielle Interfaces oder Softwaremodule vorgenommen werden. Der Begriff „geschlossener Suchraum" soll auch andeuten, dass es sich im Gegensatz zum Internet, bei dem es sich im weitesten Sinne um ein offenes System handelt, um ein genau definiertes und kontrolliertes Umfeld handelt. Ein geschlossener Suchraum umfasst nur Zuordnungen und Informationen, die speziell erstellt wurden. Über das Netzwerk 12 kann auf den geschlossene Suchraum nicht direkt zugegriffen werden, sondern ein Zugriff erfolgt über das kontrollierte und gesicherte Durchführen von Suchläufen.
[0046] Der Begriff Datenbank wird sowohl für Datenbanken im physikalischen Sinne, als auch für die eigentliche Sammlung von Daten verwendet. Wenn im Zusammenhang mit der vorliegenden Erfindung von mehreren Datensätzen, zum Beispiel den Datensätzen DB1 bis DB4, die Rede ist, so soll das nicht heissen, dass es sich um separate Datensätze handelt. Die Datensätzen können zum Beispiel miteinander verknüpft sein. Es kann sich auch um einen einzigen Datensatz mit verschiedenen Bereichen (z.B. Spalten und Reihen oder Datenblättern) handeln. [0047] Ein weiteres Verfahren gemäss Erfindung ist in Fig. 5 in Form eines Flussdiagramms dargestellt. Das Verfahren umfasst mindestens die folgenden Schritte, die zumindest zum Teil parallel zueinander ausgeführt werden können. In einem ersten Schritt, dargestellt durch den Block 21, erfolgt das Eingeben eines Suchwortes in einer ersten natürlichen Sprache, Zu diesem Zweck stellt ein erster Rechner (oder zum Beispiel ein Mobiltelefon oder ein PDA) eine Eingabemöglichkeit bereit. Nachdem das Suchwort von dem ersten Rechner über eine Kommunikationsverbindung zu einem zweiten Rechner übermittelt wurde (zum Beispiel als String zusammen mit einer Sprachkennung), stellt der zweite Rechner entsprechende Suchworte in verschiedenen natürlichen Sprachen bereit, wobei in einem optionalen Zwischenschritt entschieden wird in welchen Sprachen gesucht werden soll, wie durch den Block 22 angedeutet. Die entsprechenden Suchworte, die Übersetzungen des ersten Suchworts darstellen, werden aus einer Datenbank (Datensatz) 23 entnommen. Nach diesen Suchworten wird nun, wie durch den Block 24 angedeutet, in einer Datenbank (Datensatz) gesucht. Diese Vorgänge werden hier auch als Suchläufe bezeichnet. Jeder der Suchläufe wird mit einem Suchwort in einer der verschiedenen Sprachen durchgeführt. Es kann alternativ auch ein einziger Suchlauf stattfinden, der aber trotzdem mit den verschiedenen Suchworten sucht. Die Suchläufe liefern Information, die Netzwerk-Dokumente identifizieren. Aus einer eigentlichen Adressdatenbank (Address-Datensatz) werden konkrete Angaben anhand der gefundenen Ergebnisses der Suchläufe selektiert, wie durch das Symbol 25 dargestellt. Als Ergebnis wird Adressinformation in Form von Daten geliefert, wie durch den Block 26 dargestellt. Mit anderen Worten ausgedrückt werden die Ergebnisse bereit gestellt. Zu diesem Zweck kann zum Beispiel eine Liste mit Adressinformation angezeigt werden. Die Adressinformation entspricht den Netzwerk-Dokumenten, oder sie kennzeichnet diese Netzwerk-Dokumente. Die Adressinformation wird gemäss Erfindung so bereit gestellt, dass ein Zugang zu den individuellen Netzwerk-Dokumenten automatisiert möglich wird.
[0048] Ein grosser Teil der beschriebenen Schritte läuft in einem geschlossenen System ab, wie in Fig. 5 vereinfacht durch die Box 15 dargestellt. Das geschlossene System kann zum Beispiel dem Rechenzentrum 15 in Fig. 4 entsprechen. Diese Abgrenzung gegen Aussen hat den Vorteil, dass alle wesentlichen Vorgänge in einem geschützten und wohl definierten Umfeld ablaufen. Lediglich das Eingeben des Suchwortes und die Ausgabe am Ende der Suchläufe liegen ausserhalb des geschlossenen Systems. Die Ein- und Ausgabe kann mittels einer geeigneten SessionID bewerkstelligt werden, um ein Beispiel für die Handhabung zu geben.
[0049] Ein weiteres Verfahren gemäss Erfindung ist in Fig. 6 in Form eines Flussdiagramms dargestellt. Das Verfahren umfasst mindestens die folgenden Schritte. In einem ersten Schritt, dargestellt durch den Block 21, erfolgt das Eingeben eines Suchwortes in einer ersten natürlichen Sprache. Zu diesem Zweck stellt ein erster Rechner (oder zum Beispiel ein Mobiltelefon oder ein PDA, die hierin auch der Einfachheit halber als Rechner bezeichnet werden, das sie auch einen Rechner/Prozessor aufweisen) eine Eingabemöglichkeit bereit. Nachdem das Suchwort (zum Beispiel als String zusammen mit einer Sprachkennung) von dem ersten Rechner über eine Kommunikationsverbindung zu einem zweiten Rechner übermittelt wurde, wählt der zweite Rechner einen Suchrechner aus, der im Moment am wenigsten mit Suchläufen belastet ist, wie durch den Block 28 angedeutet ist. Dadurch kann man die eingehenden Suchanfragen auf verschiedene Suchrechner verteilen, was als Lastverteilung (Load-Leveling) bezeichnet wird. Der Suchrechner, der ausgewählt wurde, stellt die entsprechenden Suchworte in verschiedenen natürlichen Sprachen bereit, wobei in einem Zwischenschritt entschieden wird in welchen Sprachen überhaupt gesucht werden soll, wie durch den Block 22 angedeutet. Die entsprechenden Suchworte, die Übersetzungen des ersten Suchworts darstellen, werden aus einer Datenbank (Datensatz) 23 entnommen. Nach diesen Suchworten wird nun, wie durch den Block 24 angedeutet, in einer Datenbank (Datensatz) gesucht. Diese Vorgänge werden hier auch als Suchläufe bezeichnet. Jeder der Suchläufe wird mit einem Suchwort in einer der verschiedenen Sprachen durchgeführt. Es kann alternativ auch ein einziger Suchlauf stattfinden, der aber trotzdem mit den verschiedenen Suchworte sucht. Die Suchläufe liefern Information, die Netzwerk- Dokumente identifizieren. Aus einer eigentlichen Adressdatenbank (Address- Datensatz) werden die konkreten Angaben anhand der gefundenen Ergebnisses der Suchläufe selektiert, wie durch das Symbol 25 dargestellt. Als Ergebnis wird Adressinformation in Form von Daten geliefert, wie durch den Block 26 dargestellt. Die Adressinformation entspricht den Netzwerk-Dokumenten, oder sie kennzeichnet diese Netzwerk-Dokumente. Die Adressinformation wird gemäss Erfindung so bereit gestellt, dass ein Zugang zu den individuellen Netzwerk- Dokumenten automatisiert möglich wird. Die Ausgabe kann über das Internet (Block 29), als CSV (Comma-Delimited) Datei Ausgabe (Block 30) oder als E-mail Ausgabe (Block 31) erfolgen, um nur einige Beispiele zu geben.
[0050] In Fig. 7 ist das Beispiel einer weiteren Eingabemaske 11.2 gegeben, die durch einen Anwendungssoftware (zum Beispiel einen Browser, Script, Applet) auf dem Bildschirm 11.1 eines ersten Rechners oder eines Mobiltelefons oder eines PDAs dargestellt werden kann. Die Eingabemaske 11.2 ist ähnlich aufgebaut wie die Eingabemaske 11.2 in Fig. 1. Es wird ein Eingabefenster 11.3 vorgegeben, in das ein Suchwort in einer ersten natürlichen Sprache eingegeben werden kann. Je nach Wunsch kann die Suche auf das aktuelle Land beschränkt werden, oder die Suche kann in allen verfügbaren Ländern durchgeführt werden (zum Beispiel in allen EU-Mitgliedsstaaten). Zu diesem Zweck werden entsprechende Fenster 11.9, 11.10 zum Anklicken vorgesehen. Die Suche wird durch Betätigen des Feldes 11.8 oder durch Drücken der Enter-Taste ausgelöst. Das aktuelle Land kann zum Beispiel erkannt werden in dem der Server von dem die Anfrage gestartet wird lokalisiert wird (Auflösung der Domain-Adresse). Alternativ oder zusätzlich können weitere Schaltflächen vorgesehen sein, um das Suchen in einem oder mehreren Ländern selektieren zu können. Diese Information (Länderauswahl, Sprachkennung, Suchwort, etc.) kann zum Beispiel als String übermittelt werden.
[0051] In einer weiteren Ausführungsform ist der eigentlichen Suchmaschine ein Parser und/oder Such-Distiller vorgeschaltet, der aus eingegebenen Suchbegriffen den Wortstamm ermittelt, oder der aus einer Ansammlung von Worten einzelne Suchbegriffe extrahiert und diese verknüpft. Vorzugsweise wird der Parser und/oder Such-Distiller auf einem Rechner (z.B. Rechner 13) des Rechenzentrums installiert und nicht im Client Rechner (z.B. Rechner 11). [0052] Eine Such-Distillation kann zum Beispiel eingesetzt werden, um den grammatikalischen Wortstamm („Stemming" genannt) zu erkennen. Ein Beispiel für das sogenannte „Stemming" ist dem US-Patent US 6,466,901 zu entnehmen. Bei der Such-Distillation können zum Beispiel auch Tippfehler oder andere Fehler bei der Eingabe korrigiert werden.
[0053] Ein Parser kann eingesetzt werden, um Sätze in Bestandteile zu zerlegen.
[0054] In Fig. 8 ist ein weiteres Beispiel eines Ausgabefensters 33.1 dargestellt. Ein solches Fenster 33.1 kann zum Beispiel auf dem Bildschirm 11.1 des ersten Rechners, oder auf dem Bildschirm eines anderen Rechners angezeigt werden. Auch zu diesem Zweck kann ein Browser, ein Script oder Applet verwendet werden. Das Ausgabefenster 33.1 weist verschiedene Bereiche auf, die anhand des bereits diskutierten Suchbeispiels erläutert wird.
[0055] Eine Kopfzeile 33.2 zeigt den Suchbegriff „Druckerei" und die Anzahl der Treffer. In einer weiteren Zeile 33.3 wird der Inhalt verschiedener Spalten definiert. Die erste Spalte zeigt das Land dem ein gefundenes Netzwerk- Dokument zugeordnet wird. Der Einfachheit halber werden Kurzbezeichnungen für die Länder verwendet. Es können zum Beispiel auch Fahnen oder dergleichen angezeigt werden. Die zweite Spalte gibt eine Beschreibung wieder, die Text umfassen kann. Die Beschreibung steht in direktem Bezug zu dem gefundenen Netzwerk-Dokument und liegt in den verschiedenen Sprachen vor. Im gezeigten Beispiel werden die Beschreibungen in deutscher Sprache ausgegeben, da das Suchwort in Deutsch eingegeben war (was zum Beispiel anhand einer Sprachkennung erkannt werden kann). Neben der Beschreibung können vorzugsweise die jeweiligen Logos der entsprechenden Firmen dargestellt werden.
[0056] Vorzugsweise kann zu jedem gefundenen Netzwerk-Dokument ein Thumbnail 33.4 der wirklichen Webseite hinterlegt sein. Damit bekommt der Benutzer einen schnellen Überblick. Das Thumbnail 33.4 kann mit einem Link verknüpft sein, der direkt zu der wirklichen Webseite führt. Erst wenn der Benutzer anhand der im Ausgabefenster 33.1 dargestellten Information ein Netzwerk-Dokument gefunden hat, das ihn interessiert, verlässt er den Suchraum und damit den Kontrollbereich des Rechenzentrums respektive der erfindungsgemässen Vorrichtung. Dies kann zum Beispiel dadurch geschehen, dass er auf das Thumbnail 33.4 klickt. Vorzugsweise wird dann eine direkte Verbindung über das Netzwerk zu einem Netzwerk-Dokument hergestellt, wobei diese direkte Verbindung in einem separaten Fenster geöffnet wird. Damit bleibt das Ergebnis einer Session weiterhin in dem Ausgabefenster sichtbar.
[0057] Im gezeigten Beispiel steht der Identifier ID4 für eine Firma „Krause CPT" mit Sitz in Deutschland. Klickt man auf das Thumbnail 33.4, so wird automatisch eine Verbindung über das Netzwerk zu der Webseite www.Krausecpt.de geöffnet und diese Webseite wird in einem weiteren Fenster auf dem Bildschirm dargestellt. Hier sei angemerkt, dass diese Webseite ausserhalb des Kontrollbereichs des Rechenzentrums liegt und daher die Verantwortung für den Inhalt zum Beispiel in den Händen der Firma „Krause CPT" liegt. Da es sich um eine Firma in Deutschland handelt, ist diese Webseite vermutlich in deutscher Sprache verfügbar. Würde der Benutzer an dieser Stelle auf das Thumbnail 33.5 klicken, so würde eine Verbindung zur Webseite www.abprint.pt der Firma „A.B. Print" in Portugal geöffnet. Diese Webseite liegt vermutlich nur in Portugiesisch vor.
[0058] Um in einem solchen Fall dem Benutzer weitere wertvolle Information anbieten zu können, kann optional eine Sammlung (zum Beispiel in Form der Tabelle 4) mit bibliografischer Information zu jedem Dokument verfügbar gemacht werden. Eine solche Sammlung kann zum Beispiel die folgenden Begriffe umfassen:
Figure imgf000022_0001
Figure imgf000023_0001
[0059] Der Sammlung (Tabelle 4) kann im gezeigten Beispiel entnommen werden, dass als Korrespondenzsprache Portugiesisch und Englisch (GB) zur Verfügung steht. Will man nun mit einem Vertreter der Firma A.B. Print in Kontakt treten, weiss man, welche Sprachen verwendet werden können.
[0060] Die Begriffe in der linken Spalte der Sammlung (Tabelle 4) können wiederum in den verschiedenen Sprachen vorliegen, so dass jemand, der die deutsche Sprache verwendet deutsche Begriffe und jemand der die polnische Sprache verwendet polnische Begriffe angezeigt bekommt. Auch in diesem Zusammenhang kann die Sprachkennung zum Einsatz kommen.
[0061] Um eine erfindungsgemässe Suchmaschine und entsprechenden Suchmöglichkeiten anbieten zu können, müssen Daten gesammelt, aufbereitet und gepflegt werden.
[0062] Ein Verfahren zum Erfassen der entsprechenden Daten (Datenerfassungsprozedur) ist in Fig. 9 anhand eines beispielhaften Flussdiagramms dargestellt. Es kann zum Beispiel in dem Eingabefenster 11.2 eine Erfassungsoption vorgesehen sein. In Fig. 7 kann zum Beispiel ein Feld 11.11 vorgesehen sein, das einen Wechsel zu einer Datenerfassungsprozedur ermöglicht. Die Auswahl der Datenerfassungsprozedur ist in Fig. 9 durch den Block 41 dargestellt. Es werden dann entsprechende Elemente der Datenerfassungsprozedur für den Benutzer dargestellt, wie durch den Block 42 angedeutet. In der gezeigten Ausführungsform hat der Benutzer zwei Optionen. Er kann entweder den Eintrag eines neuen Netzwerk-Dokuments vornehmen, oder er kann ein bereits existierendes Netzwerk-Dokument abändern, bzw. sogar löschen, was auch als eine Änderung angesehen wird. Der Block 43 bietet eine Verzweigung, je nachdem ob eine Neuanmeldung erfolgt oder ob eine Änderung vorgenommen werden soll. Falls ein existierendes Netzwerk-Dokument geändert werden soll, werden die entsprechenden Daten aus einer Datenbank geholt, wie durch den Block 44 symbolisiert. Im nächsten Schritt, durch Block 45 dargestellt, wird dem Benutzer die Möglichkeit geboten manuell Daten einzugeben oder zu ändern. Falls bereits Daten vorhanden sind, werden diese angezeigt und können gelöscht oder überschrieben werden. Ansonsten werden leere Datenfelder vorgegeben. Insgesamt werden über die Datenfelder zum Beispiel die Informationen eingegeben, die in Tabelle 4 aufgelistet sind. Lediglich der Identifier wird automatisch generiert, da es sich um einen eineindeutigen Identifier handelt, der in der erfindungsgemässen Vorrichtung nur einmal vorkommt. In diesem Zusammenhang ist angemerkt, dass es sich bei der Zuordnung und Verwendung von eineindeutigen Identifiern für jedes Netzwerk- Dokument um eine bevorzugte Ausführungsform handelt. Netzwerk-Dokument können aber auch mit anderen Mittel gekennzeichnet und verwaltet werden.
[0063] In einem weiteren Schritt, Block 46, werden die Daten in eine Datenbank geschrieben. Eventuell werden jetzt in einem optionalen Schritt zu den neu eingetragenen Suchworten, je nach Ausführungsform der Erfindung, Verknüpfungen erstellt oder ergänzt.
[0064] Bei dem Schritt 47 handelt es sich um einen optionalen Schritt, der zur Anwendung kommt wenn es mehrere Datenbanken gleichen Inhalts (Shadows) gibt. In diesem Fall werden die Daten der verschiedenen Server im Schritt 47 aktualisiert. [0065] In der Fig. 10 ist ein mögliches Eingabefenster gezeigt, dass verwendet werden kann, um im Rahmen einer Datenerfassungsprozedur Information zu einem Netzwerk-Dokument zu sammeln. Im Wesentlichen entspricht die Information, die über das Eingabefenster abgefragt wird der Information, die in Tabelle 4 aufgelistet ist. Es ist jedoch anzumerken, dass es sich um ein Beispiel handelt. Im gezeigten Beispiel hat Jemand einen Teil der abgefragten Information zur Firma A.B. Print eingetragen. Damit das Netzwerk- Dokument der Firma A.B. Print im Netzwerk durch die erfindungsgemässe Suche gefunden werden kann, ist es notwendig, dass zu dem Netzwerk-Dokument mindestens ein Suchwort in einer der verfügbaren natürlichen Sprachen vorgegeben wird. Im Beispiel wurden mehrere Suchworte in portugiesischer Sprache vorgegeben und zwar die Worte „A tipografia", „Cartas de vesita", „Prospeto" und „ROTO1", wie in Fig. 11 gezeigt. In einer zweiten Spalte kann die Sprache gewählt werden. Im Bespiel wurden die Suchbegriffe in Portugiesisch (PT) eingegeben.
[0066] Als weiterer Schritt werden nun bei der erfindungsgemässen Datenerfassungsprozedur die einzelnen Suchworte in andere natürliche Sprachen übersetzt oder es werden die einzelnen Suchworte in eine Beziehung zu bereits existierenden Übersetzungen gesetzt. Dies kann automatisch oder manuell erfolgen. In einer bevorzugten Ausführungsform sucht einen Suchroutine bereits vorhandene Begriffe und deren Übersetzung. Dadurch können gewisse Suchworte bereits automatisch übersetzt werden. Lücken bei der Übersetzung werden dann manuell ergänzt.
[0067] Um ein problemloses Übersetzen zu ermöglichen, wird in einer bevorzugten Ausführungsform die Möglichkeit angeboten Marken (Warenzeichen) von anderen Worten zu unterscheiden. In Fig. 11 wird das ermöglicht, indem der Benutzer durch anklicken eines Knopfes diejenigen Worte markiert, die er als Marke behandelt wissen will. Im gezeigten Beispiel handelt es sich bei dem Wort „ROTO1" um eine Marke. Die so markierten Suchworte werden nicht in andere Sprachen übersetzt sondern bleiben in der eingegebenen Fassung. Es ist auch denkbar Worte die nicht übersetzt werden sollen durch Sonderzeichen bei der Eingabe zu markieren, zum Beispiel $ROTOl$ oder $A.B.Print$. [0068] In einer weiteren bevorzugten Ausführungsform wird die Möglichkeit geboten zu einer Marke einen Rechtshinweis hinzuzufügen. Damit kann zu einer Marke der Inhaber der Marke angeben werden. Zur Marke „ROTO1" kann zum Beispiel durch das Anklicken der Marke in einem Fenster die folgende Information gezeigt werden: >>Die Marke ROTO1 ist eine eingetragene Marke der Firma A.B. Print. <<
[0069] In einer weiteren bevorzugten Ausführungsform wird die E-mail Adresse so bereit gestellt, dass man durch Anklicken der E-mail Adresse automatisch ein Eingabefenster öffnet, das es einem ermöglicht eine E-mail abzufassen und an die E-mail Adresse zu versenden. Dieser Dienst kann optional von dem Betreiber des Rechenzentrums angeboten werden. Ein derartiger E-mail Versand kann anonym erfolgen, um bei einer ersten Anfragen keine kritische oder vertrauliche Information preisgeben zu müssen. In diesem Fall kann das Rechenzentrum einen temporären E-mail Account einrichten, der zum Beispiel mit einer SessionID in Zusammenhang gebracht wird. Eingehende E-mails werden dann, ähnlich wie beim Inserieren in Zeitungen mittels Chiffre, an die wirkliche E-mail Adresse des Suchenden (zum Beispiel auf dem Rechner 11) gesendet.
[0070] In einer weiteren bevorzugten Ausführungsform wird im Rahmen der Datenerfassungsprozedur ein Eingabefenster angeboten, dass verwendet werden kann, um eine Beschreibung einzugeben. Die Beschreibung kann zum Beispiel Information über eine Firma (wie zum Beispiel im Fenster 11.7 in Fig. 3 gezeigt) oder Angaben über die Waren und Dienstleistungen einer Firma geben.
[0071] Je nach Ausführungsform können die Suchbegriffe entweder einzeln eingegeben werden, wie zum Beispiel in Fig. 11 gezeigt, oder sie werden automatisch aus einer Webseite (Netzwerk-Dokument) oder einem anderen Text extrahiert. Es ist auch denkbar, dass die Suchbegriffe durch Experten, oder durch ein automatisiertes Expertensystem erstellt werden. Das Expertensystem kann selbstlernend sein. [0072] Eine weitere Ausführungsform zeichnet sich dadurch aus, dass ein Ranking Feature eingesetzt wird, um die gefundenen Netzwerk-Dokumente nach Wichtigkeit sortieren zu können (zum Beispiel über die Häufigkeit der Verwendung des Suchwortes, oder über eine Linkanalyse).
[0073] Eine schematische Darstellung einer Ausführungsform einer erfindungsgemässen Vorrichtung 50 ist in Fig. 12 gezeigt. Sobald ein Suchwort durch die Vorrichtung 50 empfangen wird (Block 51), beginnt das Abarbeiten der verschiedenen Vorgänge, wie bereits anhand verschiedener Beispiele beschrieben. Im vorliegenden Beispiel handelt es sich um ein Suchwort in italienischer Sprache, wie im Block 51 durch den Zusatz IT angedeutet. Die Vorrichtung 50 sucht nun diejenigen Suchworte in anderen Sprachen, die dem Suchwort in Italienisch entsprechen. Dieser Vorgang ist als Block 52 dargestellt. Der Vorgang kann zum Beispiel als eine Tabellen-look-up realisiert werden. Der Vorgang liefert als Ergebnis die entsprechenden Suchworte in allen verfügbaren Sprachen, wie durch die Blöcke 53.1 angedeutet. Es finden nun Suchläufe statt, die auf eine Datenbank 54 mit Dokumenten-Daten 54.1 zugreift. Die vorliegende Ausführungsform ist so realisiert, dass das deutsche Suchwort (SuchwortDE) eingesetzt wird, um in deutschsprachigen Dokumenten-Daten zu suchen. Die deutschsprachigen Dokumenten-Daten sind mit einem DE gekennzeichnet. Das italienische Suchwort (SuchwortIT) wird eingesetzt, um in italienischsprachigen Dokumenten-Daten zu suchen (mit IT gekennzeichnet) und das schwedische Suchwort (SuchwortSE) wird eingesetzt, um in schwedischsprachigen Dokumenten-Daten zu suchen (mit SE gekennzeichnet), um einige Beispiele zu nennen. Damit lässt sich der Suchaufwand reduzieren, da mit jedem Suchwort nur in einem Teil der Dokumenten-Daten 54.1 gesucht werden muss. Falls zum Beispiel keine dänischen Dokumenten-Daten vorhanden sind, so muss mit dem dänischen Suchwort nicht gesucht werden, da diese Suche kein Ergebnis liefern würde.
[0074] Jede der Dokumenten-Daten umfassen einen gesperrten Bereich 54.2, der nicht übersetzt zu werden braucht. Dieser gesperrte Bereich ist schraffiert dargestellt. In dem gesperrten Bereich 54.2 können zum Beispiel der Firmenname und der Name einer Kontaktperson stehen. Weiterhin umfassen die Dokumenten-Daten im gezeigten Beispiel einen offenen Bereich 54.3, der übersetzt werden sollte. / [0075] Zur besseren Übersichtlichkeit liefern die verschiedenen Suchläufe, die vorzugsweise parallel zu einander ausgeführt werden, im vorliegenden Beispiel nur ein einzige Ergebnis. Nur die schwedischen Dokumenten-Daten 55 enthalten das schwedische Suchwort (SuchwortSE). Die Suchläufe stellen die Dokumenten- Daten 55 zur weiteren Bearbeitung zur Verfügung. Im gezeigten Beispiel werden die Informationen (Daten), die im gesperrten Bereich stehen direkt in eine Ausgabedarstellung 57 übernommen. Die Namen der einzelnen Rubriken (Contatti, Telefono, usw.) können in Italienisch vorgegeben werden. Da der Benutzer der Vorrichtung 50, der das Suchwort in Italienisch eingegeben hat, vermutlich kein Schwedisch kann, erfolgt gemäss Erfindung eine Umsetzung in die italienische Sprache. Zu diesem Zweck greift die gezeigte Vorrichtung 50 auf eine Datenbank 56 zu, in der die Übersetzungen verschiedenster Dokumenten- Daten vorgegeben sind. Auch zu diesem Zweck kann die Sprachkennung eingesetzt werden. Vorzugsweise sind in der Datenbank 56 nur die Übersetzungen der Daten der Dokumenten-Daten abgelegt, die in den offenen Bereichen 54.3 stehen. Die Datenbank 56 liefert im gezeigten Beispiel die italienische Übersetzung eines schwedischen Textes, der im offenen 55.3 Bereich der Dokumenten-Daten 55 steht. Die italienische Übersetzung wird in einem anderen Bereich 57.2 der Ausgabedarstellung 57 angezeigt.
[0076] Bei der Vorrichtung 50 gehören alle Element 51 bis und mit 56 zu dem geschlossenen Suchraum. Damit soll ausgerückt werden, dass diese Elemente in einem kontrollierten und genau definierten Verhältnis zueinander stehen und das unbefugte Dritte keinen Zugang zu diesen Elementen haben. Auch wenn die einzelnen Elemente an verschiedenen geographischen Orten angesiedelt sein können, so bilden sie trotzdem eine logische Einheit. Um Schutz gegen unbefugte Dritte zu erzielen, können Firewalls, geschützte Festleitungen, und/oder Verschlüsslungsprotokolle verwendet werden, um Beispiele zu geben wie der Suchraum abgesichert werden kann. [0077] Eine schematische Darstellung einer weiteren möglichen Ausführungsform einer erfindungsgemässen Vorrichtung 60 ist in Fig. 13 gezeigt. Sobald ein Suchwort durch die Vorrichtung 60 empfangen wird (Block 61), beginnt das Abarbeiten der verschiedenen Vorgänge, wie bereits anhand verschiedener Beispiele beschrieben. Im vorliegenden Beispiel handelt es sich um ein Suchwort in französischer Sprache, wie im Block 61 durch den Zusatz FR angedeutet. Die nun beschriebene Ausführungsform ist besonders effizient, da einem Suchwort ein Schlüssel (PID) zugeordnet wird. In Fig. 13 ist ein Ausschnitt aus einer Tabelle 61.1 gezeigt, der zu jedem Schlüssel (PID) die Suchworte in den verschiedenen verfügbaren natürlichen Sprachen aufführt.
[0078] Die Schlüssel (PID) werden vorzugsweise als Nummer mit einem Sonderzeichen, z.B. #, vor und nachgestellt abgelegt. Dadurch kann über das SQL Statement Like und Contain gesucht werden und es können auch OR und AND Verknüpfungen eingesetzt werden. Der Schlüssel (PID) #57# steht als Synonym für die Suchwörter „typografia", „Imprimerie", „printering", „A tipografia", usw. Die Vorrichtung 60 liefert als Ergebnis eines Tabellen-Look-up den Schlüssel (PID) #57#, wie in Block 62 dargestellt, falls der Benutzer das Suchwort „Imprimerie" vorgegeben hat.
[0079] Nun wird ein Suchlauf gestartet, der in allen Dokumenten-Daten 64.1 einer Datenbank 63 nach dem Schlüssel (PID) #57# sucht. Bei der gezeigten Ausführungsform werden die Dokumenten-Daten 64.1 nicht ausgegeben, sondern es werden lediglich die Dokumenten-Daten markiert - zum Beispiel mit Flags - die gefunden wurden. Im gezeigten Beispiel werden zwei Dokumenten- Daten als Treffer angesehen (sie sind aus rein darstellungstechnischen Gründen durch ein X gekennzeichnet). Anstatt die Treffer zu markieren, können auch Zeiger (direkte oder indirekte) gesetzt werden, die auf die zutreffenden Dokumenten-Daten verweisen. Ein Rechnersystem 65 führt eine Ausgabeprozedur aus. Das Rechnersystem 65 kann zum Beispiel einen Rechner 65.1 und eine Datenbank 65.2 umfassen. Der Rechner nimmt nun die zu übersetzenden Worte aus offenen Bereichen 64.3 der zutreffenden Dokumenten- Daten und überträgt sie anhand der in der Datenbank 65.2 gespeicherten Übersetzungen ins Französische (die Abfragesprache, wie zum Beispiel anhand einer Sprachkennung oder dergleichen erkennbar ist).
[0080] Die Ausgabe erfolgt im gezeigten Beispiel über ein Netzwerk 12 und von dort über eine Mobilfunkantenne 67 an ein WAP-taugliches Mobiltelefon 16.
[0081] Details einer weiteren Vorrichtung 70 sind in der Fig. 14 gezeigt. Auch bei der in Fig. 14 gewählten Darstellung handelt es sich um eine schematische Darstellung. Die Vorrichtung 70 kann zum Beispiel ein Datenbankserver 71 aufweisen, der einen Bus 81 und verschiedene Hard- und Softwarekomponenten umfasst. Um eine Verbindung mit anderen Rechnern, Mobiltelefonen oder PDAs zu ermöglichen ist eine Schnittstelle (Interface) 72 vorgesehen. Neben einer CPU 75 weist der Server 71 verschiedene Festspeicher (RAM 74 und ROM 73) auf. Die Vorrichtung wird von einer Software kontrolliert, deren verschiedene Module auf der rechten Seite des Buses 81 angeordnet sind. Die Software sitz zum Beispiel in dem ROM 73 der Vorrichtung und kontrolliert die Aktionen, die die CPU 75 ausführt oder ausführen lässt. Im Arbeitsspeicher (RAM 74) können zum Beispiel Zwischenresultate oder dergleichen abgelegt werden.
[0082] Falls ein Benutzer von einem WAP-fähigen Mobiltelefon eine Suche starten möchte, kann er zum Beispiel eine Webseite anwählen, die Zugang zu dem Rechenzentrum bietet. Es öffnet sich dann ein Eingabefenster auf dem Bildschirm des Mobiltelefons und es kann ein Suchwort eingegeben und eine Abfragesprache ausgewählt werden. Diese Schritte werden zum Beispiel durch das Eingabemodul 76 gehandhabt. Um verschiedene Anfragen verschiedener Benutzer unterscheiden zu können, kommt vorzugsweise ein Session Modul 76.1 zum Einsatz, das zum Beispiel jede aktive Session anhand einer SessionID unterscheiden kann. Das Mobiltelefon übergibt über ein Netzwerk und das Interface 72 das Suchwort und die Abfragesprache (zum Beispiel in Form einer Sprachkennung) an die Vorrichtung 70. Ein optionales Sprachmodul 76.2 kann eine automatische Spracherkennung durchführen, oder dieses Module 76.2 stellt sicher, dass eine Sprachkennung, die übermittelt wurde, innerhalb des Servers 71 entsprechend gehandhabt wird. Vom Eingabemodul 76 wird jetzt zum Beispiel das Suchwort an ein Suchwort Modul 77 übergeben. Je nach Ausführungsform der Erfindung ermittelt das Suchwort Modul 77 entweder alle korrespondierenden Übersetzungen des Suchworts oder das Suchwort Modul 77 ermittelt einen Identifier (Schlüssel PID) zu dem Suchwort das eingegeben wurde. Rechts neben dem Server 71 sind die verschiedenen logischen Bereiche einer Datenbank angesiedelt. Durch Pfeile 85 ist jeweils angedeutet, welches Modul auf weiche Datensätze der Datenbank zugreift. Der Zugriff erfolgt in der Praxis zum Beispiel über den Bus 81 und das Interface 72, oder über ein spezielles Datenbank- Interface (nicht gezeigt).
[0083] Die korrespondierenden Übersetzungen oder den Identifier (Schlüssel PID) kann das Suchwort Modul 77 zum Beispiel aus einer Tabelle 82 holen. Diese Tabelle 82 kann zum Beispiel wie die Tabelle 61.1 ausgeführt sein. In den Ausführungsformen der Erfindung, die mehrere Übersetzungen des Suchworts verarbeitet, werden diese Suchworte und das ursprüngliche Suchwort an ein Suchmodel 78 übergeben. Dieses Suchmodul 78 führt dann Suchläufe mit den jeweiligen Suchworten in allen gewünschten oder verfügbaren Sprachen aus.
[0084] In den Ausführungsformen der Erfindung, die das Suchwort in einen Identifier (Schlüssel PID) umsetzen, übergibt das Suchwort Modul 77 dem Suchmodul 78 nur diesen Identifier (Schlüssel PID) als Suchwort. Dieses Suchmodul 78 führt dann einen Suchlauf mit dem Identifier (Schlüssel PID) aus. Dieser Ansatz ist sehr viel schneller.
[0085] Der Suchlauf oder die Suchläufe werden zum Beispiel in einer Datenbank 83 durchgeführt. Ein Trefferverarbeitungsmodul 79 verarbeitet die in der Datenbank 83 gefundenen Netzwerk-Dokumente, wie durch den Doppelpfeil 85 zwischen dem Trefferverarbeitungsmodul 79 und der Datenbank 83 angedeutet. Entweder ist das Trefferverarbeitungsmodul 79 so ausgeführt, dass es mit Kopien der wirklichen Netzwerk-Dokumenten arbeitet, oder das Trefferverarbeitungsmodul 79 arbeitet mit Zeigern oder Flags, wie bereits beschrieben. Es gibt selbstverständlich verschiedene Wege dies zu implementieren, so kann zum Bespiel das Suchmodul 78 alle Identifier (z.B. ID 123), die gefunden wurden dem Trefferverarbeitungsmodul 79 übergeben und das Trefferverarbeitungsmodul 79 holt sich dann die entsprechenden Daten aus der Datenbank 83.
[0086] Ein Ausgabemodul 80 kennt die Abfragesprache, die in einer Session verwendet wurde, zum Beispiel da dem Server 71 die Sprachkennung zur Verfügung steht. Somit ist das Ausgabemodul 80 in der Lage zu jedem im Rahmen der Suche gefundenen Netzwerk-Dokument eine Übersetzung in die Abfragesprache aus einer Datenbank 84 zu holen, wie durch den Doppelpfeil 85 zwischen dem Modul 80 und der Datenbank 84 angedeutet. Das Ausgabemodul 80 kann auch die Aufgabe übernehmen dem Ursprung der Suchanfrage, die zum Beispiel anhand der SessionID zu erkennen ist, die Adressinformation samt den Übersetzungen zu übermitteln. Diese Übermittlung erfolgt zum Beispiel über den Bus 81, das Interface 72 und ein nicht gezeigtes Netzwerk.
[0087] Die Session bleibt vorzugsweise weiterhin für eine Zeit erhalten. Dies kann wichtig sein, falls der Benutzer im Browser zurück blättert, oder bei Ausführungsformen, wo die Adressinformation ein interner Link ist, der auf Netzwerk-Dokumente in der Vorrichtung 70 verweist.
[0088] In einer bevorzugten Ausführungsform ist das Sprachmodul 76.2 so ausgelegt, dass es eine Überprüfung eingegebener Suchworte ausführt. Hat zum Beispiel der Benutzer das Wort „car" eingegeben, als Sprache ist aber Deutsch ausgewählt, so würde das Sprachmodul 76.2 eine Meldung zurück geben, die eine Korrektur ermöglicht. Bei Suchworten, die mehrere Bedeutungen haben können, kann das Sprachmodul 76.2 zum Beispiel um genauere Angaben bitten.
[0089] In einer bevorzugten Ausführungsform ist das Ausgabemodul 80 aus ausgeführt, dass es prüft, ob zu einem Netzwerk-Dokument, das gefunden wurde eine Übersetzung in der Abfragesprache vorliegt. Falls dem nicht so ist, kann das Ausgabemodul dem Benutzer die Auswahl einer alternativen Sprache vorschlagen.
[0090] Die Kommunikation zwischen dem Rechenzentrum und dem Rechner eines Benutzers kann bevorzugt mittels ASP (Active Server Pages) Code, PHP Code, HTML (Hypertext markup language) code oder XML (Extensible Language Markup) Code erfolgen.

Claims

Patentansprüche:
1. Verfahren zum Bereitstellen von Adressinformation, dadurch gekennzeichnet, dass das Verfahren die folgenden Schritte umfasst: - Abfragen eines ersten Suchwortes in einer ersten natürlichen Sprache durch das Bereitstellen einer Eingabemöglichkeit (11.3) auf einem ersten Rechner (U), - Übermitteln des Suchworts von dem ersten Rechner (11) über eine Kommunikationsverbindung zu einer Vorrichtung (10; 50; 60; 70), - Bereitstellen mindesten eines Suchworts (SuchwortDE; PID), das eine Übersetzung des ersten Suchworts darstellt, wobei Suchwörter in verschiedenen Sprachen von einer ersten Datenbank (DB1) zur Verfügung gestellt werden, - Durchführen eines Suchlaufs mit mindestens einem Suchwort (SuchwortX; PID), um Netzwerk-Dokumente (ADE, BPT, CSE) ZU identifizieren, die über ein Netzwerk (12; 12.1, 12.2) erreichbar sind, wobei der Suchlauf in einer zweiten Datenbank (DB2; 54; 63; 83) durchgeführt wird, in der Suchwörter (SuchwortX; PID) samt Zuordnungen (IDx) zu Netzwerk-Dokumenten (ADE, BPT, CSE) gespeichert sind, - Bereitstellen von Adressinformation, welche den Netzwerk-Dokumenten (ADE, BPT, CSE) entspricht oder welche die Netzwerk-Dokumente (ADE, BPT, CSE) kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden, um so einen automatischen Zugang zu den individuellen Netzwerk- Dokumenten (ADE, BpT, CSE) ZU ermöglichen.
2. Verfahren nach Anspruch 1, wobei das Bereitstellen der Adressinformation geschieht, indem Adressinformation an - den ersten Rechner (11) und/oder - einen anderen Rechner und/oder - einen Pager und/oder - ein Mobiltelefon (16) und/oder - ein PDA und/oder - eine Faxnummer und/oder - eine E-mail Adresse übermittelt wird.
3. Verfahren nach Anspruch 1, wobei der erste Rechner (11) über eine Browser- Software verfügt und die Abfrage mittels der Browser-Software erfolgt indem eine Abfrageverbindung zu der Vorrichtung (10; 50; 60; 70) aufgebaut wird.
4. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, wobei ein zweiter Rechner (10; 50; 60; 71) und/oder die Datenbanken (DB1, DB2; DB3, DB4; 54, 56; 63, 65.2; 82, 83, 84) Teil eines Rechenzentrums (15; 70) sind/ist.
5. Verfahren nach Anspruch 1, wobei die Suchwörter in den verschiedenen Sprachen in der ersten Datenbank (DB1; 61.1; 82) in tabellehartiger Form gespeichert sind.
6. Verfahren nach Anspruch 1, wobei die Zuordnungen in der zweiten Datenbank (DB2; 54; 63; 83) mittels Schlüsseln (IDx) erstellt werden oder vorgegeben sind, welche die Netzwerk-Dokumente (ADE, BPT, CSE) identifizieren.
7. Verfahren nach Anspruch 7, wobei das Bereitstellen von Adressinformation geschieht indem anhand der Schlüssel (IDx) die den Schlüsseln (IDx) entsprechende Adressinformation in einer dritten Datenbank (DB3; 83) gesucht wird.
8. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, wobei die Adressinformation eine E-mail Adresse, ein Link Adresse (http, URL, ftp) oder eine Kombination von beidem ist.
9. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, wobei es sich bei den Netzwerk-Dokumenten (ADE, BPT, CSE) um Webseiten handelt, die über das Netzwerk (12; 12.1, 12.2) erreichbar sind.
10. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, wobei eine weitere Datenbank (DB4; 56; 65.2; 84) ein Teil der Vorrichtung (10; 50; 60; 70) ist und Information in verschiedenen natürlichen Sprachen zu den Netzwerk-Dokumenten (ADE, BPT, CSE) in dieser weiteren Datenbank (DB4; 56; 65.2; 84) gespeichert ist und wobei vorzugsweise Information in der ersten natürlichen Sprache verfügbar gemacht wird, wenn die Adressinformation bereitgestellt wird.
11. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, wobei durch die Datenbanken (DB1, DB2, DB3, DB4; 54, 56; 63, 65.2; 82, 83, 84) ein geschlossener Suchraum definiert wird, der nur Zuordnungen und Informationen umfasst, die speziell erstellt wurden, wobei über das Netzwerk (12; 12.1, 12.2) auf den geschlossene Suchraum nicht direkt zugegriffen werden kann, sondern ein Zugriff nur über das Durchführen von Suchläufen möglich ist.
12. Vorrichtung (10; 50; 60; 70) zum Bereitstellen von Adressinformation, die es ermöglicht auf ein Netzwerk-Dokument (ADE, BPT, CSE) über ein Netzwerk (12; 12.1, 12.2) zuzugreifen, mit - Verarbeitungsmitteln (13; 65.1; 71), die dazu ausgelegt sind auf eine oder mehrere der folgenden Datenbankmodule zuzugreifen, • ein Datenbankmodul (DB1; 23; 61.1; 82) mit Suchworten (SuchwortX; PID) in verschiedenen natürlichen Sprachen und mit Zuordnungen (IDx) zu den Netzwerk-Dokumenten (ADE, BPT, CSE), • ein Datenbankmodul (DB2; 14; 54; 63; 83) mit gespeicherten Dokumenten-Daten (54.1; 64.1), die Information zu den Netzwerk-Dokumenten (A E, BPT, CSE) umfasst, • ein Datenbankmodul (14; 25; 56; 65.2; 83, 84) mit Adressinformation mittels derer die Netzwerk-Dokumente (A E, B T, CSE) über das Netzwerk (12; 12.1, 12.2) zugreifbar sind, und wobei die Vorrichtung (10; 50; 60; 70) zusätzlich umfasst: - ein Suchmodul (77, 78), das nach Eingabe eines Suchworts in den Datenbankmodulen (DB1, DB2, DB3, DB4; 54, 56; 63, 65.2; 82, 83, 84) einen Suchlauf ausführt, um alle Netzwerk-Dokumente (ADE, BPT, CSE) zu finden in deren gespeicherten Dokumenten-Daten (54.1;
64.1) das Suchwort in mindestens einer der verschiedenen natürlichen Sprachen vorkommt, wobei das Suchmodul (77, 78) die gefundenen Dokumenten-Daten (54.1; 64.1) bereitstellt oder markiert, - ein Ausgabemodul (80) zum Bereitstellen von Adressinformation, welche den Netzwerk-Dokumenten (ADE, BPT, CSE) entspricht oder welche die Netzwerk-Dokumente (ADE/ BPT, CSE) kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden, wobei die Adressinformation verwendbar ist, um über das Netzwerk (12; 12.1, 12.2) automatisch auf die gefundenen Netzwerk-Dokumente (ADE, BPT, CSE) ZU zugreifen.
13. Vorrichtung (10; 50; 60; 70) nach Anspruch 12, dadurch gekennzeichnet, dass es sich bei den Verarbeitungsmitteln um einen Rechner, vorzugsweise um einen Datenbankserver (13; 65.1; 71) handelt.
14. Vorrichtung (10; 50; 60; 70) nach Anspruch 12, dadurch gekennzeichnet, dass es sich bei den Netzwerk-Dokumenten (ADE, BPT, CSE) um Webseiten oder WAP-Seiten handelt.
15. Vorrichtung (10; 50; 60; 70) nach Anspruch 12, dadurch gekennzeichnet, dass es sich bei dem Suchmodul (77, 78) vorzugsweise um ein Modul handelt, das einen Suchlauf ausführt und das mittels Software kontrolliert wird.
16. Vorrichtung (10; 50; 60; 70) nach Anspruch 12, dadurch gekennzeichnet, dass das Ausgabemodul (80) die Darstellung eines Ausgabefensters (11.7; 33.1; 57) auf einer Ausgabeeinheit, vorzugsweise einem Rechner (11) oder Mobiltelefon (16) oder PDA, auslöst und die Adressinformation so bereitstellt, dass sie in dem Ausgabefenster (11.7; 33.1; 57) darstellbar ist.
17. Vorrichtung (10; 50; 60; 70) nach Anspruch 12 oder 16, dadurch gekennzeichnet, dass die Vorrichtung ein Eingabemodul (76) umfasst, das die Darstellung eines Eingabefensters (11.2) auf einer Eingabeeinheit, vorzugsweise einem Rechner (11) oder Mobiltelefon oder PDA, und die Eingabe eines Suchwortes in einer natürlichen Sprache ermöglicht.
18. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, dass das Eingabemodul (76) einem Benutzer ermöglicht eine von ihm zu verwendenden Sprache anzugeben, oder eine automatische Erkennung des verwendeten Sprache durchführt.
19. Software zur Verwendung in einer Vorrichtung (10; 50; 60; 70) mit Rechenmittel (13; 65.1; 71) und einer Datenbank (DBl, DB2, DB3, DB4; 54, 56; 63, 65.2; 82, 83, 84) mit - Übersetzungen von Suchworten (SuchwortX; PID), - verschiedenen vorgegebenen Dokumenten-Daten (54.1; 64.1), die Information über Netzwerk-Dokumente (ADE, BPT, CSE) umfassen, und mit - Adressinformatϊon, die ein Zugreifen über ein Netzwerk (12; 12.1, 12.2) auf die Netzwerk-Dokumente (ADE, BPT, CSE) ermöglicht, wobei die Software dazu ausgelegt ist auf den Rechenmitteln (13; 65.1; 71) die folgenden Schritte auszuführen: - Abfragen eines ersten Suchwortes in einer ersten natürlichen Sprache durch das Bereitstellen einer Eingabemöglichkeit (11.3) auf einem externen Rechenmittel (11), - Übermitteln des ersten Suchworts von dem externen Rechenmittel (11) über eine Kommunikationsverbindung zu der Vorrichtung (10; 50; 60; 70), - Bereitstellen mindesten eines Suchworts (SuchwortX; PID), das eine Übersetzung des ersten Suchworts darstellt, wobei Suchwörter in verschiedenen Sprachen in der Datenbank (DBl) zur Verfügung gestellt werden, - Durchführen eines Suchlaufs mit mindestens einem Suchwort, um Netzwerk-Dokumente (ADE, BPT, CSE) ZU identifizieren, wobei der Suchlauf in der Datenbank (DB2; 54; 63; 83) durchgeführt wird, - Bereitstellen von Adressinformation, welche den Netzwerk-Dokumenten ( DE, BpT, CSE) entspricht oder welche die Netzwerk-Dokumente (ADE, BPT, CSE) kennzeichnet, die bei dem Durchführen des Suchlaufs gefunden wurden, - Bereitstellen der Adressinformation, um so automatischen Zugang zu den individuellen Netzwerk-Dokumenten (ADE, BPT, CSE) ZU ermöglichen.
20. Software nach Anspruch 19, dadurch gekennzeichnet, dass ein Softwaremodul (78) vorgesehen ist, das den Suchlauf ausführt.
21. Software nach Anspruch 19, dadurch gekennzeichnet, dass ein Softwaremodul (80) vorgesehen ist, das eine Darstellung eines Ausgabefensters (11.7; 33.1; 57) auf einer Ausgabeeinheit, vorzugsweise einem Rechner (11) oder Mobiltelefon (16) oder PDA, auslöst und die Adressinformation so bereitstellt, dass sie in dem Ausgabefenster (11.7; 33.1; 57) darstellbar ist.
22. Software nach Anspruch 19, dadurch gekennzeichnet, dass ein Softwaremodul (76) vorgesehen ist, das eine Darstellung eines Eingabefensters (11.2) auf einer Eingabeeinheit, vorzugsweise einem Rechner (11) oder Mobiltelefon oder PDA, und die Eingabe eines Suchwortes in einer natürlichen Sprache ermöglicht.
23. Software nach Anspruch 22, dadurch gekennzeichnet, dass das Softwaremodul (76) es einem Benutzer ermöglicht eine von ihm zu verwendenden Sprache anzugeben, oder eine automatische Erkennung des verwendeten Sprache durchführt.
PCT/EP2005/001412 2004-02-23 2005-02-11 Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung WO2005086024A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04004048 2004-02-23
EP04004048.7 2004-02-23

Publications (1)

Publication Number Publication Date
WO2005086024A1 true WO2005086024A1 (de) 2005-09-15

Family

ID=34917158

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2005/001412 WO2005086024A1 (de) 2004-02-23 2005-02-11 Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung

Country Status (1)

Country Link
WO (1) WO2005086024A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2043004A1 (de) * 2007-09-24 2009-04-01 Martin Bode Datenbanksystem und Verfahren zum Aufnehmen, Speichern und Ausgeben von Datensätzen
WO2013050526A1 (de) * 2011-10-05 2013-04-11 Jessen Timm-H Vorrichtung und verfahren zur auswahl von wirkstoffkandidaten

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002001400A1 (en) * 2000-06-28 2002-01-03 Qnaturally Systems Incorporated Method and system for translingual translation of query and search and retrieval of multilingual information on the web
DE10213348A1 (de) * 2002-03-26 2003-10-09 Abb Research Ltd System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002001400A1 (en) * 2000-06-28 2002-01-03 Qnaturally Systems Incorporated Method and system for translingual translation of query and search and retrieval of multilingual information on the web
DE10213348A1 (de) * 2002-03-26 2003-10-09 Abb Research Ltd System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LING C ET AL: "Searching heterogeneous multilingual bibliographic sources", COMPUTER NETWORKS AND ISDN SYSTEMS, NORTH HOLLAND PUBLISHING. AMSTERDAM, NL, vol. 30, no. 1-7, April 1998 (1998-04-01), pages 612 - 615, XP004121379, ISSN: 0169-7552 *
SAVOY J: "Cross-language information retrieval: experiments based on CLEF 2000 corpora", INFORMATION PROCESSING & MANAGEMENT, ELSEVIER, BARKING, GB, vol. 39, no. 1, January 2003 (2003-01-01), pages 75 - 115, XP004397214, ISSN: 0306-4573 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2043004A1 (de) * 2007-09-24 2009-04-01 Martin Bode Datenbanksystem und Verfahren zum Aufnehmen, Speichern und Ausgeben von Datensätzen
WO2013050526A1 (de) * 2011-10-05 2013-04-11 Jessen Timm-H Vorrichtung und verfahren zur auswahl von wirkstoffkandidaten

Similar Documents

Publication Publication Date Title
DE69833033T2 (de) Verfahren und system um auf information in einem netzwerk zuzugreifen
DE69636869T2 (de) Server mit automatischer Menüladefunktion
DE60110771T2 (de) Internet-browsing-steuerverfahren
DE69723432T2 (de) Informationsauffindungssystem mit einer cachedatenbank
DE69837199T2 (de) Verfahren, vorrichtung und datenträger zur intelligenten auswahl von suchwörtern in einer tastaturlosen umgebung
DE10122197A1 (de) Verfahren und System zum Zugreifen auf Information auf einem Netzwerk unter Verwendung von Nachrichten-Verknüpfungsfunktionen mit Schatten-Rückruffunktionen
DE19962192A1 (de) Verfahren und System zur Inhaltskonvertierung von elektronischen Daten für drahtlose Vorrichtungen
WO2007042245A1 (de) Suchmaschine für eine ortsbezogene suche
DE60129335T2 (de) Lokales informationsbereitstellungssystem und verfahren unter verwendung des realnamens
DE60104545T2 (de) Adressieren von fernen datenobjekten über ein rechnernetzwerk
EP1620810B1 (de) Verfahren und anordnung zur einrichtung und aktualisierung einer benutzeroberfl che zum zugriff auf informationsseiten in ein em datennetz
WO2005086024A1 (de) Verfahren zum bereitstellen von adressinformation, eine entsprechende vorrichtung und software zur verwendung in einer solchen vorrichtung
DE10303070A1 (de) Erzeugen einer Liste von Adressen in einem Server
DE10048113C2 (de) Vorrichtungen und Verfahren zum individuellen Filtern von über ein Netzwerk übertragener Informationen
DE60113831T2 (de) Adressieren von fernen datenobjekten über ein rechnernetzwerk
EP1052579A1 (de) Verfahren zum Verwalten von Lesezeichen in einem Internet-Browser
EP1236331B2 (de) Kommunikationssystem, zentraler computer, sowie verfahren zum übertragen einer url
DE10024733A1 (de) Verfahren und Vorrichtung zum Abblocken von aus einem Netzwerk anforderbaren Daten
DE69636028T2 (de) Gruppenverwaltungsgerät für Dateneinheiten
EP1094405A2 (de) Verfahren zum Erzeugen einer dynamischen Auswahlmaske für den Abruf von Daten aus einer Datenbank
DE10303066A1 (de) Unterstütztes Eingeben von Adressen
DE10303067A1 (de) Erzeugen einer Liste von Adressen in einer Indexseite
WO2002003244A2 (de) Verfahren zum suchen und wiedergeben von informationen
DE10261839A1 (de) Verfahren und Einrichtung zur Durchführung einer elektronischen Recherche
EP1260917A2 (de) Verfahren zur Suche nach Inhalten eines Rechnernetzwerks

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase
WWE Wipo information: entry into national phase

Ref document number: CR2007-009191

Country of ref document: CR