JP2003296356A - Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE - Google Patents

Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE

Info

Publication number
JP2003296356A
JP2003296356A JP2002103429A JP2002103429A JP2003296356A JP 2003296356 A JP2003296356 A JP 2003296356A JP 2002103429 A JP2002103429 A JP 2002103429A JP 2002103429 A JP2002103429 A JP 2002103429A JP 2003296356 A JP2003296356 A JP 2003296356A
Authority
JP
Japan
Prior art keywords
web page
language
user
index
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002103429A
Other languages
Japanese (ja)
Inventor
Makoto Konno
真 近野
Hiroki Murayama
裕樹 村山
Shoji Shibazaki
庄二 柴崎
Hiroaki Sano
浩明 佐能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Priority to JP2002103429A priority Critical patent/JP2003296356A/en
Publication of JP2003296356A publication Critical patent/JP2003296356A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a Web page retrieval method, a Web page retrieval system and a program for enabling a user to efficiently retrieve or browse a Web page in an optional language by a simple operation without requiring linguistic knowledge for the user. <P>SOLUTION: When a reference request of an index about prescribed keywords transmitted from client terminals 10, 11 is received, a control part 70 recognizes the optional language X specified by the user from linguistic information included in the reference request. The control part 70 reads the index of the optional language X corresponding to the prescribed keywords included in the reference request of the index by retrieving it from indexes preliminarily stored in a multilingual index storage part 60 and transmits the read index of the language X to the client terminals 10, 11 as a retrieval result. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、多言語で表記され
たWebページを検索するWebページ検索方法、We
bページ検索システム及びWebページ検索用プログラ
ムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Web page search method for searching Web pages written in multiple languages, We.
The present invention relates to a b-page search system and a web page search program.

【0002】[0002]

【従来の技術】今日の世界的なインターネット技術の普
及により、グローバルな情報収集が可能となった。しか
し、インターネット上のWebページ(ホームページ)
は、圧倒的にローカル言語で表記されている。従って、
利用者がローカル言語のWebページから情報を収集
し、その情報の内容を理解するためには、言語障壁が存
在する。このように、利用者自身がWebページで用い
られている言語を理解できない場合に、利用者の言語障
壁を最も早く、簡単に取り除くために、次のような方法
が一般に利用される。
2. Description of the Related Art The spread of today's global Internet technology has made it possible to collect information globally. However, Web pages (homepage) on the Internet
Is predominantly in local language. Therefore,
There is a language barrier for a user to collect information from a web page in a local language and understand the content of that information. Thus, in the case where the user himself / herself cannot understand the language used in the Web page, the following method is generally used in order to remove the language barrier of the user most quickly and easily.

【0003】まず、利用者が、予め閲覧したいサイトを
わかっている場合に、そのサイトのURLを入力するな
どして、サイトに直接アクセスする方法である。この場
合、利用者によってアクセスされたサイトのWebペー
ジは、利用者の端末に表示される。ここで、Webペー
ジは、ローカル言語(例えばドイツ語)で表記されてい
る。利用者は、ローカル言語のWebページを内容を理
解できないときは、翻訳ソフトウェア等を用いてローカ
ル言語のWebページを所定の言語(例えば日本語)に
機械翻訳する。利用者は、機械翻訳されたWebページ
を閲覧し、情報収集を行う。
First, when the user knows the site to be browsed in advance, the user can directly access the site by inputting the URL of the site. In this case, the web page of the site accessed by the user is displayed on the user's terminal. Here, the Web page is written in a local language (for example, German). When the user cannot understand the contents of the local language Web page, the user machine-translates the local language Web page into a predetermined language (for example, Japanese) using translation software or the like. A user browses a machine-translated Web page and collects information.

【0004】次の方法として、利用者がWebページを
翻訳しながらインターネットサーフィン(翻訳ブラウジ
ング)を行う方法である。この場合、利用者は、リンク
の張られたWebページを次々と端末に表示させて閲覧
する。このとき、利用者は、理解できないローカル言語
(例えばドイツ語)で表記されたWebページが表示さ
れると、そのWebページを翻訳ソフトウェア等を用い
て所定の言語(例えば日本語)に機械翻訳する。利用者
は、機械翻訳されたWebページを閲覧し、目的の情報
が掲載されたWebページにたどり着くまで、インター
ネットサーフィンを続行する。
The next method is a method in which a user surfs the Internet (translation browsing) while translating a Web page. In this case, the user sequentially displays the linked web pages on the terminal and browses them. At this time, when a web page written in a local language (eg, German) that cannot be understood is displayed, the user machine-translates the web page into a predetermined language (eg, Japanese) using translation software or the like. . The user browses the machine-translated Web page and continues surfing the Internet until he / she reaches the Web page on which the desired information is posted.

【0005】その他の方法として、利用者が検索サイト
にキーワード(検索語)を入力し、入力したキーワード
に基づいて、目的のWebページを検索する方法であ
る。この場合、利用者は、まず、所定の言語(例えば日
本語)のキーワードを検索サイトに入力する。入力され
たキーワードは、複数のローカル言語(例えばドイツ
語、英語)に翻訳される。ここで、ローカル言語毎に複
数のWebページ検索システム(検索エンジン)が設け
られている。各ローカル言語のWebページ検索システ
ムは、翻訳されたローカル言語(ドイツ語または英語)
の訳出語に基づいて、該当のWebページを検索する。
このようなWebページの検索方法は、多言語分散情報
検索と呼ばれる。
As another method, there is a method in which a user inputs a keyword (search word) to a search site and a target Web page is searched based on the input keyword. In this case, the user first inputs a keyword in a predetermined language (for example, Japanese) into the search site. The entered keywords are translated into multiple local languages (eg German, English). Here, a plurality of Web page search systems (search engines) are provided for each local language. Web page search system for each local language, translated local language (German or English)
The corresponding Web page is searched based on the translated word.
Such a web page search method is called multilingual distributed information search.

【0006】Webページ検索システムは、一般に、訳
出語と同じローカル言語のWebページを検索する。例
えば、訳出語がドイツ語の場合、Webページ検索シス
テムは、ドイツ語のWebページを検索する。利用者
は、検索されたローカル言語のWebページを端末に表
示させ、翻訳ソフトウェア等を用いてWebページを所
定の言語(例えば日本語)に機械翻訳する。そして、利
用者は、機械翻訳されたWebページを閲覧し、情報収
集を行う。
A web page search system generally searches a web page in the same local language as the translated word. For example, when the translation word is German, the Web page search system searches for a German Web page. The user causes the terminal to display the retrieved Web page in the local language, and uses translation software or the like to machine translate the Web page into a predetermined language (for example, Japanese). Then, the user browses the machine-translated Web page and collects information.

【0007】[0007]

【発明が解決しようとする課題】上記のような従来の方
法では、次のような課題があった。第1の方法では、閲
覧したいサイトを予め利用者がわかっていることが前提
であった。しかし、閲覧したいサイトが予めわかってい
るケースは実際には少ない。従って、利用者が情報収集
手段として頻繁に利用できる方法ではない。
The conventional method as described above has the following problems. The first method is based on the assumption that the user knows the site to be browsed in advance. However, there are actually few cases where the site you want to browse is known in advance. Therefore, it is not a method that the user can frequently use as an information collecting means.

【0008】また、第2の方法では、利用者が理解可能
な言語以外の言語によるWebページを翻訳しながらラ
ンダムに閲覧及び情報収集する。しかし、この方法の場
合、利用者は、目的の情報が掲載されたWebページに
必ずしも到達できるわけではない。また、利用者は、目
的の情報以外の情報が掲載されたWebページも翻訳し
なければならないため、Webページのブラウジング及
び翻訳の作業が非効率であった。
In the second method, a Web page in a language other than a language understandable by the user is randomly browsed and information is collected while being translated. However, in the case of this method, the user cannot always reach the Web page on which the desired information is posted. Further, since the user also has to translate a Web page on which information other than the intended information is posted, the work of browsing and translating the Web page was inefficient.

【0009】また、第3の方法では、Webページ検索
システムとして、外国の検索エンジンを使用することが
考えられる。しかし、誰もが外国の検索エンジンを利用
して簡単に情報検索できるわけではない。利用者は、次
のような最低限の言語上の知識が必要となる。すなわ
ち、ローカル言語毎の検索エンジンに入力されるのは、
訳出されたローカル言語のキーワードである。また、検
索エンジンによる検索結果も、ローカル言語で表示され
る。従って、利用者には当該ローカル言語の初歩的な知
識、例えば字引等のノウハウは必要となる。英語につい
ては、その程度の知識を持っている人は多いが、その他
の言語については、上記のような知識さえも持ち合わせ
ていない人は多い。
In the third method, it is possible to use a foreign search engine as the Web page search system. However, not everyone can easily search for information using foreign search engines. Users are required to have the following minimum language knowledge. That is, the input to the search engine for each local language is
These are the translated local language keywords. Also, the search results by the search engine are displayed in the local language. Therefore, the user is required to have a rudimentary knowledge of the local language, for example, know-how such as character drawing. Many people have that level of knowledge about English, but many do not even have the above knowledge of other languages.

【0010】また、検索エンジンの検索結果に基づくW
ebページのブラウジングについても、ローカル言語か
ら機械翻訳されたWebページのインターネットサーフ
ィンとなる。従って、上記した第2の方法による課題も
生じてしまう。
W based on the search result of the search engine
Browsing of eb pages also involves Internet surfing of Web pages machine-translated from local languages. Therefore, the problem due to the above-mentioned second method also occurs.

【0011】さらに、多言語分散情報検索においては、
キーワード(検索語)は利用者の希望する任意の言語
(例えば日本語)で入力される。一方、ローカル言語毎
の検索エンジンは、訳出されたキーワードに基づいて、
それぞれ検索を実行する。従って、各検索エンジンによ
る検索結果は、検索エンジン毎に表示される。すなわ
ち、キーワードが訳出された言語の数の分だけ検索結果
が表示される。従って、利用者は、ローカル言語毎に検
索結果を閲覧しなければならず、多大な労力がかかって
しまう。
Furthermore, in multilingual distributed information retrieval,
The keyword (search word) is input in any language desired by the user (for example, Japanese). On the other hand, the search engine for each local language, based on the translated keywords,
Perform each search. Therefore, the search result by each search engine is displayed for each search engine. That is, as many search results as the number of languages in which the keyword is translated are displayed. Therefore, the user has to browse the search results for each local language, which requires a great deal of effort.

【0012】本発明は、上記のような課題を解決するた
めになされたものであり、利用者にとって言語上の知識
が要求されず、簡単な操作で効率良く、任意の言語のW
ebページの検索及び閲覧を行うことができるWebペ
ージ検索方法、Webページ検索システム及びWebペ
ージ検索用プログラムを得ることを目的とする。
The present invention has been made to solve the above problems, and requires no language knowledge for the user, and can be efficiently operated by a simple operation in any language W.
An object is to obtain a web page search method, a web page search system, and a web page search program that can search and browse eb pages.

【0013】[0013]

【課題を解決するための手段】以上の目的を達成するた
め、本発明のWebページ検索方法は、クライアント端
末から送信された所定のキーワードについてのWebペ
ージ検索要求に受け取ると、Webページ検索要求に含
まれる言語情報から利用者によって指定された指定言語
を認識し、Webページ検索要求に含まれる所定のキー
ワードに対応する指定言語のインデックスを、予め格納
されているインデックスから検索して読み出し、読み出
した指定言語のインデックスを検索結果としてクライア
ント端末に送信することを特徴とする。
In order to achieve the above object, the web page search method of the present invention makes a web page search request when a web page search request for a predetermined keyword transmitted from a client terminal is received. The specified language specified by the user is recognized from the included language information, and the index of the specified language corresponding to the predetermined keyword included in the web page search request is searched for from the index stored in advance and read out. The index of the designated language is transmitted to the client terminal as a search result.

【0014】クライアント端末から送信されたWebペ
ージ要求を受け取ると、Webページ要求に含まれる言
語情報から利用者によって指定された指定言語を認識す
るとともに、Webページ要求に含まれるWebページ
情報から利用者によって選択されたWebページを認識
し、利用者によって選択された指定言語のWebページ
を読み出し、読み出した指定言語のWebページをクラ
イアント端末に送信するようにしてもよい。このような
構成によれば、利用者の希望する「任意の言語」のキー
ワードでWebページを検索し、「任意の言語」でWe
bページを表示させて、「任意の言語」でWebページ
を閲覧させることができる。
When the Web page request transmitted from the client terminal is received, the specified language designated by the user is recognized from the language information included in the Web page request, and the user is recognized from the Web page information included in the Web page request. The Web page selected by may be recognized, the Web page of the designated language selected by the user may be read, and the read Web page of the designated language may be transmitted to the client terminal. According to such a configuration, the Web page is searched for by the keyword of "any language" desired by the user, and the Web is searched by "any language".
By displaying page b, the web page can be browsed in "any language".

【0015】Webページ要求に含まれるWebページ
情報から利用者によって選択されたWebページを認識
し、当該Webページが予め格納されているか否かを確
認し、格納されていない場合は、Webページ情報に基
づいてWebページを収集し、収集したWebページを
言語情報から認識した指定言語に翻訳し、翻訳したWe
bページをクライアント端末に送信するようにしてもよ
い。このような構成によれば、利用者は「任意の言語」
で容易に様々なWebページの閲覧を行うことができ
る。
The Web page selected by the user is recognized from the Web page information included in the Web page request, it is confirmed whether the Web page is stored in advance, and if it is not stored, the Web page information is stored. Web pages are collected based on the above, the collected Web pages are translated into a specified language recognized from the language information, and the translated We
The page b may be transmitted to the client terminal. With such a configuration, the user can select "any language".
You can easily browse various Web pages.

【0016】言語情報で利用者によって指定された指定
言語と利用者によって検索要求されたキーワードの言語
とが異なる場合、キーワードを言語情報で指定された指
定言語に翻訳するようにしてもよい。このような構成に
よれば、利用者が入力するキーワードの言語と異なる
「任意の言語」で検索結果を得ることができるようにな
る。
When the specified language specified by the user in the language information and the language of the keyword requested by the user are different, the keyword may be translated into the specified language specified by the language information. With such a configuration, it is possible to obtain the search result in an "arbitrary language" different from the language of the keyword input by the user.

【0017】また、本発明のWebページ検索システム
は、ネットワーク(インターネット100)上のWeb
ページを多言語に翻訳する翻訳手段(翻訳サーバ30、
辞書部40)と、ネットワーク上の原語のWebページ
と翻訳された多言語のWebページとをそれぞれ関連付
けて格納するWebページ記憶手段(多言語コンテンツ
格納部50)と、Webページ記憶手段に格納された原
語及び多言語のWebページのコンテンツを基にWeb
ページの検索対象となる原語及び多言語のインデックス
を作成するインデックス作成手段(多言語インデックス
作成処理部71)と、インデックス作成手段が作成した
原語及び多言語のインデックスをそれぞれ関連付けると
ともに、原語及び多言語のインデックスをWebページ
記憶手段に格納された原語及び多言語のWebページに
言語毎に関連付けて格納するインデックス記憶手段(多
言語インデックス格納部60)と、クライアント端末
(10,11)から送信された所定のキーワードについ
てのWebページ検索要求(インデックス参照要求)に
受け取ると、Webページ検索要求に含まれる言語情報
から利用者によって指定された指定言語を認識し、We
bページ検索要求に含まれる所定のキーワードに対応す
る指定言語のインデックスを、インデックス記憶手段に
格納されているインデックスから検索して読み出し、読
み出した指定言語のインデックスを検索結果としてクラ
イアント端末に送信する検索手段(多言語検索対応処理
部72)とを備えたことを特徴とする。
Further, the web page search system of the present invention is a web page on a network (Internet 100).
Translation means for translating pages into multiple languages (translation server 30,
The dictionary unit 40), a Web page storage unit (multilingual content storage unit 50) for storing the original language Web page on the network and the translated multilingual Web page in association with each other, and the Web page storage unit. Web based on original language and multilingual Web page contents
An index creating unit (multilingual index creating processing unit 71) for creating an original language index and a multilingual index to be searched for a page is associated with the original language index and the multilingual index created by the index creating unit, and the original language and the multilingual index are associated with each other. The index is transmitted from the client terminal (10, 11) and an index storage unit (multilingual index storage unit 60) that stores the index in association with the original language and multilingual Web pages stored in the Web page storage unit for each language. When the web page search request (index reference request) for a predetermined keyword is received, the designated language designated by the user is recognized from the language information included in the web page search request, and the We
A search in which a specified language index corresponding to a predetermined keyword included in the b-page search request is searched and read from the index stored in the index storage means, and the read specified language index is transmitted to the client terminal as a search result. Means (multilingual search correspondence processing unit 72) are provided.

【0018】クライアント端末から送信されたWebペ
ージ要求を受け取ると、Webページ要求に含まれる言
語情報から利用者によって指定された指定言語を認識す
るとともに、Webページ要求に含まれるWebページ
情報から利用者によって選択されたWebページを認識
し、利用者によって選択された指定言語のWebページ
をWebページ記憶手段から読み出し、読み出した指定
言語のWebページをクライアント端末に送信するWe
bページ提供手段(多言語検索対応処理部72)を備え
た構成にしてもよい。このような構成によれば、利用者
の希望する「任意の言語」のキーワードでWebページ
を検索し、「任意の言語」でWebページを表示させ
て、「任意の言語」でWebページを閲覧させることが
できる。
When the Web page request transmitted from the client terminal is received, the designated language specified by the user is recognized from the language information included in the Web page request, and the user is recognized from the Web page information included in the Web page request. We that recognizes the web page selected by the user, reads the web page of the designated language selected by the user from the web page storage means, and transmits the read web page of the designated language to the client terminal We.
It may be configured to include a b-page providing unit (multilingual search correspondence processing unit 72). With such a configuration, the web page is searched by the keyword of "any language" desired by the user, the web page is displayed in "any language", and the web page is browsed in "any language". Can be made.

【0019】ネットワーク上のWebページを収集する
Webページ収集手段(Webページ収集部20)を備
え、Webページ提供手段は、Webページ要求に含ま
れるWebページ情報から利用者によって選択されたW
ebページを認識し、当該Webページが予めWebペ
ージ記憶手段に格納されていない場合、Webページ情
報に基づいてWebページ収集手段にWebページを収
集させ、Webページ収集手段が収集したWebページ
を翻訳手段に指定言語に翻訳させ、翻訳手段が翻訳した
Webページをクライアント端末に送信するように構成
されていてもよい。このような構成によれば、利用者は
「任意の言語」で容易に様々なWebページの閲覧を行
うことができる。
A Web page collecting unit (Web page collecting unit 20) for collecting Web pages on the network is provided, and the Web page providing unit is the W selected by the user from the Web page information included in the Web page request.
If the web page is recognized and the web page is not stored in advance in the web page storage means, the web page collection means collects the web page based on the web page information, and the web page collected by the web page collection means is translated. The means may be configured to translate into a designated language, and the web page translated by the translation means may be transmitted to the client terminal. With such a configuration, the user can easily browse various Web pages in "any language".

【0020】検索手段または翻訳手段は、言語情報で指
定された指定言語と利用者によって検索要求されたキー
ワードの言語とが異なる場合、キーワードを言語情報で
指定された指定言語に翻訳するように構成されていても
よい。このような構成によれば、利用者が入力するキー
ワードの言語と異なる「任意の言語」で検索結果を得る
ことができるようになる。
The search means or the translation means is configured to translate the keyword into the specified language specified by the language information when the specified language specified by the language information and the language of the keyword requested by the user are different. It may have been done. With such a configuration, it is possible to obtain the search result in an "arbitrary language" different from the language of the keyword input by the user.

【0021】本発明のWebページ検索用プログラム
は、クライアント端末から送信された所定のキーワード
についてのWebページ検索要求に受け取ると、Web
ページ検索要求に含まれる言語情報から利用者によって
指定された指定言語を認識する処理、及びWebページ
検索要求に含まれる所定のキーワードに対応する指定言
語のインデックスを、予め格納されているインデックス
から検索して読み出し、読み出した指定言語のインデッ
クスを検索結果としてクライアント端末に送信する処理
をコンピュータに実行させることを特徴とする。
When the Web page search program of the present invention receives a Web page search request for a predetermined keyword transmitted from the client terminal, the Web page search program
A process of recognizing a designated language designated by the user from the language information included in the page search request, and a search of an index of the designated language corresponding to a predetermined keyword included in the web page search request from the index stored in advance Then, the computer is caused to execute a process of reading out the index of the designated language as a search result and transmitting it to the client terminal.

【0022】クライアント端末から送信されたWebペ
ージ要求を受け取ると、Webページ要求に含まれる言
語情報から利用者によって指定された指定言語を認識す
るとともに、Webページ要求に含まれるWebページ
情報から利用者によって選択されたWebページを認識
する処理、及び利用者によって選択された指定言語のW
ebページを読み出し、読み出した指定言語のWebペ
ージをクライアント端末に送信する処理をもコンピュー
タに実行させるように構成されていてもよい。このよう
な構成によれば、利用者の希望する「任意の言語」のキ
ーワードでWebページを検索し、「任意の言語」でW
ebページを表示させて、「任意の言語」でWebペー
ジを閲覧させることができる。
When the Web page request transmitted from the client terminal is received, the specified language designated by the user is recognized from the language information included in the Web page request, and the user is recognized from the Web page information included in the Web page request. Process for recognizing the Web page selected by W, and W in the specified language selected by the user
The computer may also be configured to read the eb page and send the read web page in the designated language to the client terminal. With such a configuration, a web page is searched for with a keyword of "any language" desired by the user, and W is searched with "any language".
The eb page can be displayed to browse the web page in "any language".

【0023】Webページ情報から認識した利用者によ
って指定されたWebページが予め格納されているか否
かを確認する処理、格納されていない場合、Webペー
ジ情報を基にWebページを収集させる処理、及び収集
されたWebページを言語情報から認識した指定言語に
翻訳させ、翻訳されたWebページをクライアント端末
に送信する処理をもコンピュータに実行させるように構
成されていてもよい。このような構成によれば、利用者
は「任意の言語」で容易に様々なWebページの閲覧を
行うことができる。
A process of confirming whether or not a web page designated by the user recognized from the web page information is stored in advance, a process of collecting the web pages based on the web page information when not stored, and The computer may also be configured to cause the collected web page to be translated into a designated language recognized from the language information and to transmit the translated web page to the client terminal. With such a configuration, the user can easily browse various Web pages in "any language".

【0024】言語情報で利用者によって指定された指定
言語と利用者によって検索要求されたキーワードの言語
とが異なる場合、キーワードを言語情報で指定された指
定言語に翻訳する処理をもコンピュータに実行させるよ
うに構成されていてもよい。このような構成によれば、
利用者が入力するキーワードの言語と異なる「任意の言
語」で検索結果を得ることができるようになる。
When the designated language designated by the user in the language information and the language of the keyword requested by the user are different from each other, the computer is caused to execute a process of translating the keyword into the designated language designated by the language information. It may be configured as follows. According to such a configuration,
It becomes possible to obtain search results in an "arbitrary language" different from the language of the keyword entered by the user.

【0025】[0025]

【発明の実施の形態】以下、本発明の実施の一形態を図
面を参照して説明する。図1は、本発明のWebページ
検索システムの構成を示すブロック図である。図1に示
すように、Webページ検索システムは、Webページ
収集部20、翻訳サーバ30、辞書部40、多言語コン
テンツ格納部50、多言語インデックス格納部60及び
制御部70を備えている。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the Web page search system of the present invention. As shown in FIG. 1, the web page search system includes a web page collection unit 20, a translation server 30, a dictionary unit 40, a multilingual content storage unit 50, a multilingual index storage unit 60, and a control unit 70.

【0026】なお、クライアント端末10,11、We
bページ収集部20、翻訳サーバ30、辞書部40、多
言語コンテンツ格納部50、多言語インデックス格納部
60及び制御部70は、それぞれ、LANやインターネ
ット100等のネットワークで接続されている。
Note that the client terminals 10, 11 and We
The b-page collection unit 20, the translation server 30, the dictionary unit 40, the multilingual content storage unit 50, the multilingual index storage unit 60, and the control unit 70 are connected to each other via a network such as a LAN or the Internet 100.

【0027】図1に示す構成において、クライアント端
末10,11は、Webページの検索サービスを受ける
利用者側に設置されたパーソナルコンピュータ等の端末
である。クライアント端末10,11は、Webページ
を閲覧するためのWEBブラウザ10A,11Aをそれ
ぞれ備えている。
In the configuration shown in FIG. 1, the client terminals 10 and 11 are terminals such as personal computers installed on the side of a user who receives a web page search service. The client terminals 10 and 11 are provided with WEB browsers 10A and 11A for browsing Web pages, respectively.

【0028】Webページ収集部20は、インターネッ
ト100上に存在するWebページを収集する。Web
ページ収集部20は、通信処理部21及びWebページ
収集ロボット22を備えている。通信処理部21は、イ
ンターネット100上のWebページのサイトにアクセ
スしてデータ通信を行う。Webページ収集ロボット2
2は、通信処理部21を通じて実際にインターネット1
00上のWebページのデータをダウンロードして収集
する。
The Web page collection unit 20 collects Web pages existing on the Internet 100. Web
The page collection unit 20 includes a communication processing unit 21 and a web page collection robot 22. The communication processing unit 21 accesses a Web page site on the Internet 100 to perform data communication. Web page collection robot 2
2 is actually the Internet 1 through the communication processing unit 21
00 Web page data is downloaded and collected.

【0029】翻訳サーバ30は、Webページ収集部2
0が収集した原文のWebページを自動的に機械翻訳す
るサーバである。翻訳サーバ30には、辞書部40の辞
書情報を参照して原文(原語)のWebページを自動的
に機械翻訳する翻訳エンジン31が設けられている。
The translation server 30 uses the Web page collection unit 2
0 is a server that automatically machine-translates the original Web pages collected. The translation server 30 is provided with a translation engine 31 that automatically machine-translates an original sentence (original language) Web page by referring to dictionary information of the dictionary unit 40.

【0030】辞書部40は、翻訳サーバ30が原文のW
ebページを機械翻訳する際に参照される、英和辞書4
1、和英辞書42、日英以外の言語間辞書43などの各
言語間の辞書情報を備えている。なお、翻訳サーバ30
と辞書部40により翻訳手段が構成される。
In the dictionary unit 40, the W
English-Japanese dictionary 4 referred to when machine-translating eb page
1, dictionary information between languages such as a Japanese-English dictionary 42 and an inter-language dictionary 43 other than Japanese-English. The translation server 30
The dictionary unit 40 constitutes a translation means.

【0031】多言語コンテンツ格納部50は、Webペ
ージ収集部20が収集した原文(原語)のWebページ
のコンテンツ、及び翻訳サーバ30で自動的に翻訳され
たWebページのコンテンツを格納する記憶装置であ
る。多言語コンテンツ格納部50には、英語コンテンツ
51、日本語コンテンツ52、日英以外のコンテンツ5
3・・・のように、Webページがコンテンツの言語毎
の領域に分けられて格納される。
The multilingual content storage unit 50 is a storage device that stores the content of the original text (original language) Web pages collected by the Web page collection unit 20 and the content of the Web pages automatically translated by the translation server 30. is there. The multilingual content storage unit 50 has an English content 51, a Japanese content 52, and content 5 other than English and Japanese.
As shown in 3 ..., Web pages are divided and stored in regions of each content language.

【0032】多言語インデックス格納部60は、利用者
がクライアント端末10,11のWEBブラウザ10
A,11Aを操作して、多言語コンテンツ格納部50に
格納されているWebページのコンテンツを検索するた
めのインデックスを格納する。多言語インデックス格納
部60には、多言語コンテンツ格納部50にWebペー
ジが言語毎のコンテンツ51,52,53・・・に分け
られて格納されるのに対応させて、英語インデックス6
1、日本語インデックス62、日英以外のインデックス
63・・・のように言語毎のインデックスに分けられて
格納される。
The multilingual index storage unit 60 allows the user to access the WEB browser 10 of the client terminals 10 and 11.
By operating A and 11A, the index for searching the content of the Web page stored in the multilingual content storage unit 50 is stored. In the multilingual index storage unit 60, the English index 6 is associated with the Web pages being stored in the multilingual content storage unit 50 by being divided into contents 51, 52, 53, ... For each language.
1, a Japanese index 62, an index 63 other than Japanese-English, and the like are stored separately for each language.

【0033】制御部70は、Webページ検索システム
の全体制御を司る。制御部70は、多言語インデックス
作成処理部71及び多言語検索対応処理部72を備えて
いる。多言語インデックス作成処理部71は、Webペ
ージ収集部20にWebページを収集させる処理、翻訳
サーバ30にWebページのコンテンツを多言語に翻訳
させる処理、Webページの検索対象となる多言語イン
デックスを作成する処理などを制御する。多言語検索対
応処理部72は、利用者が多言語インデックスを基に多
言語コンテンツ格納部50に格納されているWebペー
ジを検索する際の処理などを制御する。
The control unit 70 controls the entire Web page search system. The control unit 70 includes a multilingual index creation processing unit 71 and a multilingual search correspondence processing unit 72. The multilingual index creation processing unit 71 creates a Web page collection unit 20 to collect Web pages, a translation server 30 to translate Web page contents into multiple languages, and creates a multilingual index to be a Web page search target. Control the processing etc. The multilingual search support processing unit 72 controls the processing when the user searches the Web page stored in the multilingual content storage unit 50 based on the multilingual index.

【0034】次に、動作について説明する。 (1)Webページの収集 図2は、本発明のWebページ検索システムによるWe
bページ収集の動作を説明するためのシーケンス図であ
る。
Next, the operation will be described. (1) Collection of Web Pages FIG. 2 shows the We by the Web page search system of the present invention.
It is a sequence diagram for explaining the operation of b page collection.

【0035】Webページ収集部20は、所定のWeb
ページ収集条件に従って、インターネット100上のW
ebページを自動的に収集する。まず、Webページ収
集部20のWebページ収集ロボット22は、予め設定
された収集スケジュールに従って稼動する(ステップS
1)。
The Web page collection unit 20 is a Web
W on the Internet 100 according to page collection conditions
Automatically collect eb pages. First, the web page collection robot 22 of the web page collection unit 20 operates according to a preset collection schedule (step S
1).

【0036】Webページ収集ロボット22は、予め設
定された収集条件の収集ターゲットサイトURL及びレ
イヤ数に従って、通信処理部21を通じてインターネッ
ト100上の当該サイトURLのWebページを提供す
るサーバにアクセスする。そして、Webページ収集ロ
ボット22は、アクセスしたサーバに対してWebペー
ジのダウンロードを要求する(ステップS2)。
The Web page collection robot 22 accesses the server providing the Web page of the site URL on the Internet 100 through the communication processing unit 21 according to the collection target site URL and the number of layers of the collection conditions set in advance. Then, the web page collection robot 22 requests the accessed server to download the web page (step S2).

【0037】Webページを提供するサーバは、Web
ページ収集部20からのダウンロードの要求に応じて、
WebページをWebページ収集部20に送出(送信)
する(ステップS3)。Webページ収集部20のWe
bページ収集ロボット22は、通信処理部21を通じて
サーバから送出されたWebページを受信すると、受信
したWebページを制御部70に送出する(ステップS
4)。このとき、Webページ収集ロボット22は、予
め設定された収集環境の格納場所のデータと、収集条件
の言語(原語)及び翻訳言語のデータとを制御部70に
送る。
The server that provides the Web page is the Web
In response to a download request from the page collection unit 20,
Sends (sends) Web pages to the Web page collection unit 20
Yes (step S3). We of the web page collection unit 20
When the b-page collecting robot 22 receives the Web page sent from the server through the communication processing unit 21, it sends the received Web page to the control unit 70 (step S).
4). At this time, the web page collection robot 22 sends the data of the preset storage location of the collection environment and the data of the collection condition language (original language) and translation language to the control unit 70.

【0038】なお、翻訳サーバ30が翻訳可能な全ての
言語に原文のWebページのコンテンツを自動的に翻訳
するように設定されている場合は、Webページ収集ロ
ボット22は、特定の翻訳言語に翻訳されるわけではな
いので、翻訳言語のデータを制御部70に送る必要はな
い。
If the translation server 30 is set to automatically translate the content of the original web page into all the translatable languages, the web page collection robot 22 translates it into a specific translated language. Therefore, it is not necessary to send the translated language data to the control unit 70.

【0039】制御部70の多言語インデックス作成処理
部71は、Webページ収集ロボット22から送出され
たWebページを受け取ると、Webページ収集ロボッ
ト22から送られた格納場所のデータ及び言語(原語)
のデータに従って、予め格納場所として設定された多言
語コンテンツ格納部50内の当該言語(原語)のコンテ
ンツを格納する領域に、新たに収集されたWebページ
を格納する(ステップS5)。例えば、新たに収集され
たWebページのコンテンツの言語(原語)が英語の場
合は、新規Webページは、多言語インデックス作成処
理部71によって、多言語コンテンツ格納部50の英語
コンテンツ51の領域に格納される。
Upon receiving the Web page sent from the Web page collection robot 22, the multilingual index creation processing unit 71 of the control unit 70 receives the data of the storage location and the language (original language) sent from the Web page collection robot 22.
According to the above data, the newly collected Web page is stored in the area for storing the content of the language (original language) in the multilingual content storage unit 50 set as the storage location in advance (step S5). For example, if the language (original language) of the content of the newly collected Web page is English, the new Web page is stored in the area of the English content 51 of the multilingual content storage unit 50 by the multilingual index creation processing unit 71. To be done.

【0040】このとき、新規Webページのコンテンツ
は、多言語インデックス作成処理部71によって多言語
コンテンツ格納部50に格納される際に、図3に示すよ
うに、当該コンテンツを管理するための管理番号と対応
付け(割り当て)られるとともに、Webページを管理
するためのWebページ管理番号と対応付け(割り当
て)られて格納される。なお、Webページ管理番号
は、当該新規WebページのURL等の情報であっても
よい。
At this time, when the content of the new Web page is stored in the multilingual content storage unit 50 by the multilingual index creation processing unit 71, as shown in FIG. 3, a management number for managing the content is displayed. Is stored in association with (assigned to) a web page management number for managing a web page. The web page management number may be information such as the URL of the new web page.

【0041】具体的には、図3に示すように、新規We
bページのコンテンツの言語が言語Xである場合、当該
言語Xのコンテンツに管理番号1が対応付けられるとと
もに、Webページ管理番号「○○○△△△×××」が
対応付けられて、多言語コンテンツ格納部50に格納さ
れる。
Specifically, as shown in FIG. 3, the new We
When the language of the content of the page b is the language X, the management number 1 is associated with the content of the language X, and the web page management number “XXXXXXXX” is associated with the management number 1. It is stored in the language content storage unit 50.

【0042】(2)Webページの翻訳 図4は、本発明のWebページ検索システムによるWe
bページ翻訳の動作を説明するためのシーケンス図であ
る。
(2) Translation of Web Page FIG. 4 shows the We by the Web page search system of the present invention.
It is a sequence diagram for explaining the operation of b page translation.

【0043】翻訳サーバ30は、制御部70の多言語イ
ンデックス作成処理部71に対して多言語コンテンツ格
納部50に新規に格納されたWebページの参照を要求
する(ステップS11)。多言語インデックス作成処理
部71は、翻訳サーバ30からの上記参照要求に応じ
て、多言語コンテンツ格納部50に新規に格納されたW
ebページを読み出して翻訳サーバ30に送出させる
(ステップS12)。
The translation server 30 requests the multilingual index creation processing unit 71 of the control unit 70 to refer to the Web page newly stored in the multilingual content storage unit 50 (step S11). The multilingual index creation processing unit 71 is newly stored in the multilingual content storage unit 50 in response to the reference request from the translation server 30.
The eb page is read and sent to the translation server 30 (step S12).

【0044】なお、多言語インデックス作成処理部71
は、多言語コンテンツ格納部50に新規にWebページ
を格納する際に、それと同時に、新規Webページを翻
訳サーバ30に送出するようにしてもよい。
Incidentally, the multilingual index creation processing unit 71.
When a new web page is newly stored in the multilingual content storage unit 50, the new web page may be sent to the translation server 30 at the same time.

【0045】多言語インデックス作成処理部71は、新
規Webページを多言語コンテンツ格納部50から翻訳
サーバ30に送出するとき、言語(原語)及び翻訳言語
のデータを翻訳サーバ30に通知する。
When sending a new Web page from the multilingual content storage unit 50 to the translation server 30, the multilingual index creation processing unit 71 notifies the translation server 30 of language (original language) and translated language data.

【0046】翻訳サーバ30において、翻訳エンジン3
1は、多言語コンテンツ格納部50から送出された新規
Webページを受け取ると、辞書部40にアクセスして
辞書情報を参照する(ステップS13)。辞書部40
は、翻訳サーバ30から辞書情報の参照要求を受ける
と、参照要求された辞書情報を翻訳サーバ30に送出す
る(ステップS14)。翻訳エンジン31は、辞書部4
0の辞書情報を参照し、多言語インデックス作成処理部
71から通知された言語(原語)及び翻訳言語のデータ
に従って、新規Webページのコンテンツを原語(翻訳
前の元の言語)から多言語(言語X,Y,Z・・・)に
自動的に機械翻訳する(ステップS15)。
In the translation server 30, the translation engine 3
When receiving the new Web page sent from the multilingual content storage unit 50, the first access the dictionary unit 40 and refers to the dictionary information (step S13). Dictionary section 40
When the dictionary information reference request is received from the translation server 30, the reference information-requested dictionary information is sent to the translation server 30 (step S14). The translation engine 31 uses the dictionary unit 4
With reference to the dictionary information of 0, the content of the new Web page is changed from the original language (original language before translation) to the multilingual (language) according to the language (original language) and translated language data notified from the multilingual index creation processing unit 71. (X, Y, Z ...) is automatically machine translated (step S15).

【0047】例えば、Webページのコンテンツの言語
(原語)が英語であり、翻訳言語のデータが日本語、ド
イツ語、フランス語、スペイン語及び中国語である。こ
の場合、翻訳サーバ30の翻訳エンジン31は、英和辞
書41、和英辞書42及び日英以外の言語間辞書43な
どの辞書情報を参照して、新規Webページを英語から
日本語、ドイツ語、フランス語、スペイン語及び中国語
に自動的に機械翻訳する。
For example, the language (original language) of the content of the Web page is English, and the translated language data is Japanese, German, French, Spanish, and Chinese. In this case, the translation engine 31 of the translation server 30 refers to dictionary information such as the English-Japanese dictionary 41, the Japanese-English dictionary 42, and the interlingual dictionary 43 other than Japanese-English to open a new Web page from English to Japanese, German, or French. Automatic machine translation into Spanish and Chinese.

【0048】翻訳サーバ30は、機械翻訳した同一We
bページの多言語のコンテンツを多言語インデックス作
成処理部71に送出する(ステップS16)。多言語イ
ンデックス作成処理部71は、翻訳サーバ30から送出
された機械翻訳された同一Webページの多言語のコン
テンツを、多言語コンテンツ格納部50内の各コンテン
ツを格納する領域に格納する(ステップS17)。上記
の例では、新規Webページのコンテンツが英語から日
本語、ドイツ語、フランス語、スペイン語及び中国語に
機械翻訳された場合は、翻訳後の同一Webページの多
言語のコンテンツは、多言語インデックス作成処理部7
1によって、多言語コンテンツ格納部50の各コンテン
ツ52,53・・・の領域にそれぞれ格納される。
The translation server 30 uses the same machine-translated We
The multilingual content of page b is sent to the multilingual index creation processing unit 71 (step S16). The multilingual index creation processing unit 71 stores the machine-translated multilingual content of the same Web page sent from the translation server 30 in the area for storing each content in the multilingual content storage unit 50 (step S17). ). In the above example, if the content of the new web page is machine-translated from English to Japanese, German, French, Spanish and Chinese, the multilingual content of the same web page after translation will be the multilingual index. Creation processing unit 7
1 is stored in the area of each content 52, 53, ... Of the multilingual content storage unit 50.

【0049】このとき、同一Webページの多言語のコ
ンテンツは、多言語インデックス作成処理部71によっ
て多言語コンテンツ格納部50に格納される際に、図3
に示すように、各コンテンツを管理するための管理番号
と対応付けられるとともに、各コンテンツのWebペー
ジ管理番号と対応付けられて格納される。図3に示すよ
うに、多言語のコンテンツに対応付けられる管理番号
は、言語毎に異なる番号である。一方、多言語のコンテ
ンツに対応付けられるWebページ管理番号は、同一の
番号である。そして、このWebページ管理番号は、多
言語のコンテンツの翻訳元であるWebページの原語の
コンテンツが格納される際に対応付けられたWebペー
ジ管理番号と同一である。
At this time, when the multilingual content of the same Web page is stored in the multilingual content storage unit 50 by the multilingual index creation processing unit 71, FIG.
As shown in (1), it is associated with the management number for managing each content, and is also associated with the Web page management number of each content and stored. As shown in FIG. 3, the management number associated with the multilingual content is different for each language. On the other hand, the Web page management numbers associated with multilingual contents are the same numbers. The web page management number is the same as the web page management number associated when the original language content of the web page that is the translation source of the multilingual content is stored.

【0050】具体的には、図3に示すように、多言語の
コンテンツの言語がそれぞれ言語Y,Z・・・である。
この場合、言語Y,Z・・・のコンテンツにそれぞれ管
理番号2,3・・・が対応付けられる。また、言語Y,
Z・・・のコンテンツに同一のWebページ管理番号
「○○○△△△×××」が対応付けられる。このWeb
ページ管理番号「○○○△△△×××」は、Webペー
ジの原語のコンテンツに対応付けられた番号である。
Specifically, as shown in FIG. 3, the languages of the multilingual contents are languages Y, Z ...
In this case, the management numbers 2, 3, ... Are associated with the contents of the languages Y, Z ,. Also, the language Y,
The same Web page management number “XXXXXXXX” is associated with the contents of Z ... This Web
The page management number "○○○ △△△ XXX" is a number associated with the content of the original language of the Web page.

【0051】このように、多言語コンテンツ格納部50
には、Webページ収集部20で収集された原文(原
語)のWebページのコンテンツと翻訳サーバ30で機
械翻訳された同一Webページの多言語のコンテンツと
が、各言語に分けられて格納されたことになる。
As described above, the multilingual content storage unit 50
The content of the original text (original language) Web pages collected by the Web page collection unit 20 and the multilingual content of the same Web page machine-translated by the translation server 30 are stored in each language. It will be.

【0052】(3)インデックスの作成 図5は、本発明のWebページ検索システムによるイン
デックス作成の動作を説明するためのシーケンス図であ
る。
(3) Creation of Index FIG. 5 is a sequence diagram for explaining the operation of creating an index by the Web page search system of the present invention.

【0053】制御部70の多言語インデックス作成処理
部71は、多言語コンテンツ格納部50に新規に格納さ
れたWebページの原語(原文)及び多言語のコンテン
ツをそれぞれ参照する(ステップS21)。多言語コン
テンツ格納部50は、多言語インデックス作成処理部7
1からの参照要求に応じて、新規に格納された原語及び
多言語のコンテンツを多言語インデックス作成処理部7
1にそれぞれ送出する(ステップS22)。
The multilingual index creation processing unit 71 of the control unit 70 respectively refers to the original language (original text) of the Web page and the multilingual content newly stored in the multilingual content storage unit 50 (step S21). The multilingual content storage unit 50 includes a multilingual index creation processing unit 7.
In response to the reference request from 1, the newly stored source language and multilingual content are stored in the multilingual index creation processing unit 7
1 (step S22).

【0054】多言語インデックス作成処理部71は、多
言語コンテンツ格納部50から送出された原語及び多言
語のコンテンツを受け取ると、それらのコンテンツを基
に原語及び多言語のインデックスを自動的に作成する
(ステップS23)。そして、多言語インデックス作成
処理部71は、作成した原語及び多言語のインデックス
を多言語インデックス格納部60に送出し、多言語イン
デックス格納部60内の当該原語及び多言語のインデッ
クスを格納する領域にそれらのインデックスを格納する
(ステップS24)。
Upon receiving the original language and the multilingual contents sent from the multilingual content storage unit 50, the multilingual index creation processing unit 71 automatically creates the original language and the multilingual indexes based on those contents. (Step S23). Then, the multilingual index creation processing unit 71 sends the created original language and multilingual index to the multilingual index storage unit 60, and stores the original language and multilingual index in the multilingual index storage unit 60. The indexes are stored (step S24).

【0055】このとき、原語及び多言語のインデックス
は、多言語インデックス作成処理部71によって多言語
インデックス格納部60に格納される際に、図3に示す
ように、各インデックスを管理するための管理番号と対
応付けられるとともに、各インデックスのWebページ
管理番号と対応付けられて格納される。ここで、図3に
示すように、原語及び多言語のインデックスに対応付け
られる管理番号は、それぞれ、各インデックスの作成元
の原語及び多言語のコンテンツに対応付けられた管理番
号である。また、原語及び多原語のインデックスに対応
付けられるWebページ管理番号は、各インデックスの
作成元の原語及び多言語のコンテンツに対応付けられた
Webページ管理番号である。
At this time, when the original language and multilingual indexes are stored in the multilingual index storage unit 60 by the multilingual index creation processing unit 71, as shown in FIG. 3, management for managing each index is performed. In addition to being associated with the number, it is stored in association with the web page management number of each index. Here, as shown in FIG. 3, the management numbers associated with the original language and the multilingual index are the management numbers associated with the original language and the multilingual content from which each index is created. Also, the web page management number associated with the original language and multi-language index is the web page management number associated with the original language and multi-language content from which each index was created.

【0056】具体的には、図3に示すように、各インデ
ックスの作成元のコンテンツの言語がそれぞれ言語X,
Y,Z・・・である。この場合、言語X,Y,Z・・・
のコンテンツに管理番号1,2,3・・・が対応付けら
れるとともに、同一のWebページ管理番号「○○○△
△△×××」が対応付けられる。このWebページ管理
番号「○○○△△△×××」は、各インデックスの作成
元の原語及び多言語のコンテンツに対応付けられたWe
bページ管理番号である。
More specifically, as shown in FIG. 3, the language of the content from which each index is created is language X, respectively.
Y, Z ... In this case, the languages X, Y, Z ...
Are associated with management numbers 1, 2, 3, ... And the same Web page management number "○○○ △
“ΔΔ ×××” is associated. This Web page management number "○○○ △△△ XXX" is associated with the original language and the multilingual content from which each index is created.
This is the page b management number.

【0057】以上のように、コンテンツとインデックス
とが言語毎に管理番号で関連付けられ、各言語の管理番
号がWebページ管理番号で関連付けられている。従っ
て、多言語のコンテンツと多言語のインデックスとは、
管理番号及びWebページ管理番号によって関連付けら
れて、多言語コンテンツ格納部50及び多言語インデッ
クス格納部60にそれぞれ格納されたことになる。
As described above, the content and the index are associated with each language by the management number, and the management number of each language is associated with the Web page management number. Therefore, multilingual content and multilingual index
It is stored in the multilingual content storage unit 50 and the multilingual index storage unit 60 in association with each other by the management number and the Web page management number.

【0058】ここまで説明した、Webページの収集、
Webページの翻訳及びインデックスの作成の処理は、
制御部70の多言語インデックス作成処理部71の制御
に基づき、全て自動で実行される。
Collection of Web pages described above,
Web page translation and index creation processing is
All are automatically executed under the control of the multilingual index creation processing unit 71 of the control unit 70.

【0059】(4)任意の言語でのWebページ検索・
表示 図6は、本発明のWebページ検索システムによる任意
の言語でのWebページ検索の動作を説明するためのシ
ーケンス図である。
(4) Web page search in any language
Display FIG. 6 is a sequence diagram for explaining the operation of Web page search in an arbitrary language by the Web page search system of the present invention.

【0060】利用者は、任意の言語X(例えば日本語)
のキーワードでWebページを検索しようとする場合、
クライアント端末10のWEBブラウザ10A(または
クライアント端末11のWEBブラウザ11A)を操作
して、Webページの検索サービスを提供する制御部7
0にアクセスして接続する。そして、利用者は、WEB
ブラウザ10Aを操作して、制御部70の検索サイト上
で任意の言語Xを指定する(ステップS31)。このよ
うに任意の言語Xが指定されると、後述するように、W
ebページの検索結果が言語Xで求められる。
The user can select any language X (for example, Japanese)
If you try to search a web page with the keyword
A controller 7 that operates the WEB browser 10A of the client terminal 10 (or the WEB browser 11A of the client terminal 11) to provide a web page search service.
Access 0 to connect. And the user is
The browser 10A is operated to specify an arbitrary language X on the search site of the control unit 70 (step S31). When an arbitrary language X is designated in this way, as will be described later, W
The search result of the eb page is obtained in language X.

【0061】次に、利用者は、WEBブラウザ10Aを
操作して、検索サイト上で言語Xの所定のキーワードを
入力する(ステップS32)。利用者は、所定のキーワ
ードを入力すると、当該キーワードについての言語Xの
インデックスの参照要求を制御部70に対して行う(ス
テップS33)。キーワードについての言語Xのインデ
ックスの参照要求には、言語Xの言語情報と言語Xのキ
ーワードの情報とが含まれている。
Next, the user operates the WEB browser 10A and inputs a predetermined keyword of the language X on the search site (step S32). When the user inputs a predetermined keyword, the user requests the control unit 70 to refer to the index of the language X for the keyword (step S33). The reference request of the language X index for the keyword includes the language information of the language X and the information of the keyword of the language X.

【0062】制御部70の多言語検索対応処理部72
は、クライアント端末10からの所定のキーワードにつ
いての言語Xのインデックスの参照要求を受けると、多
言語インデックス格納部60に格納されているキーワー
ドに対応する言語Xのインデックスを参照する(ステッ
プS34)。多言語インデックス格納部60は、多言語
検索対応処理部72からの上記参照要求に応じて、キー
ワードに対応する言語Xのインデックスを検索して読み
出す。そして、多言語インデックス格納部60は、読み
出した言語Xのインデックスを多言語検索対応処理部7
2に送出する(ステップS35)。
Multilingual search support processing unit 72 of control unit 70
When receiving a reference request for a language X index for a predetermined keyword from the client terminal 10, the server refers to the language X index corresponding to the keyword stored in the multilingual index storage unit 60 (step S34). The multilingual index storage unit 60 searches for and reads out the index of the language X corresponding to the keyword in response to the reference request from the multilingual search correspondence processing unit 72. Then, the multilingual index storage unit 60 stores the read index of the language X in the multilingual search correspondence processing unit 7.
2 (step S35).

【0063】多言語検索対応処理部72は、多言語イン
デックス格納部60から送出された言語Xのインデック
スを受け取ると、言語Xのインデックスを利用者によっ
て入力された所定のキーワードに対応する検索結果とし
てクライアント端末10に送出する(ステップS3
6)。
When the multilingual search correspondence processing unit 72 receives the index of the language X sent from the multilingual index storage unit 60, the multilingual search correspondence processing unit 72 uses the index of the language X as a search result corresponding to a predetermined keyword input by the user. It is sent to the client terminal 10 (step S3)
6).

【0064】クライアント端末10は、多言語検索対応
処理部72から送出された言語Xのインデックスを受け
取ると、言語Xのインデックスをモニタなどに表示する
(ステップS37)。利用者は、検索結果であるキーワ
ードに対応する言語Xのインデックスが画面表示される
と、言語Xのインデックスの中の一つをクリックするな
どして所定の言語XのWebページを選択する(ステッ
プS38)。
When the client terminal 10 receives the language X index sent from the multilingual search support processing unit 72, it displays the language X index on a monitor or the like (step S37). When the index of the language X corresponding to the keyword that is the search result is displayed on the screen, the user selects a web page of a predetermined language X by clicking one of the indexes of the language X (step S38).

【0065】ここで、利用者は、選択したWebページ
を言語Yで表示させたい場合、すなわちWebページを
言語Xから言語Yに切り替えたい場合、検索サイト上で
任意の言語Yを指定する(ステップS39)。クライア
ント端末10は、利用者によって選択されたWebペー
ジ情報を制御部70の多言語検索対応処理部72に送信
して、言語Yによる当該Webページを要求する(ステ
ップS40)。言語YによるWebページの要求には、
言語Yの言語情報と選択されたWebページ情報(UR
L等)とが含まれている。
Here, when the user wants to display the selected Web page in the language Y, that is, when the user wants to switch the Web page from the language X to the language Y, the user designates an arbitrary language Y on the search site (step S39). The client terminal 10 transmits the web page information selected by the user to the multilingual search support processing part 72 of the control part 70 to request the web page in the language Y (step S40). To request a web page in language Y,
Language information of language Y and selected web page information (UR
L etc.) is included.

【0066】なお、利用者は、選択したWebページを
そのままの言語Xで表示させたい場合は、言語を指定せ
ずに言語XによるWebページの要求を行う。
When the user wants to display the selected Web page in the language X as it is, the user makes a request for the Web page in the language X without specifying the language.

【0067】多言語検索対応処理部72は、クライアン
ト端末10から送信された言語YによるWebページの
要求を受け取ると、多言語コンテンツ格納部50内の言
語Yのコンテンツの領域に格納されている言語YのWe
bページを参照する(ステップS41)。このとき、多
言語検索対応処理部72は、利用者によって選択された
Webページ情報から予め設定されたWebページ管理
番号を認識する。また、多言語検索対応処理部72は、
利用者によって指定された言語Yの言語情報から言語毎
の管理番号を認識する。そして、多言語検索対応処理部
72は、認識したWebページ管理番号及び管理番号に
基づいて、言語YによるWebページの要求を多言語コ
ンテンツ格納部50に対して行う。
Upon receiving the request for the Web page in the language Y transmitted from the client terminal 10, the multilingual search support processing unit 72 receives the language stored in the content area of the language Y in the multilingual content storage unit 50. We of Y
Refer to page b (step S41). At this time, the multilingual search correspondence processing unit 72 recognizes the preset Web page management number from the Web page information selected by the user. Further, the multilingual search correspondence processing unit 72
The management number for each language is recognized from the language information of the language Y designated by the user. Then, the multilingual search correspondence processing unit 72 makes a request for the Web page in the language Y to the multilingual content storage unit 50 based on the recognized Web page management number and management number.

【0068】多言語コンテンツ格納部50は、多言語検
索対応処理部72からの上記要求に応じて、言語YのW
ebページを読み出して多言語検索対応処理部72に送
出する(ステップS42)。
The multilingual content storage unit 50, in response to the request from the multilingual search correspondence processing unit 72, outputs the W of the language Y.
The eb page is read and sent to the multilingual search correspondence processing unit 72 (step S42).

【0069】多言語検索対応処理部72は、多言語コン
テンツ格納部50から送出された言語YのWebページ
を受け取ると、言語YのWebページをクライアント端
末10に送出(送信)する(ステップS43)。クライ
アント端末10は、多言語検索対応処理部72から送出
された言語YのWebページを受け取ると、言語YのW
ebページをモニタなどに表示する(ステップS4
4)。
Upon receiving the language Y Web page sent from the multilingual content storage unit 50, the multilingual search support processing unit 72 sends (transmits) the language Y Web page to the client terminal 10 (step S43). . When the client terminal 10 receives the Web page of the language Y sent from the multilingual search support processing unit 72, the W of the language Y is received.
The eb page is displayed on a monitor or the like (step S4)
4).

【0070】このように、多言語コンテンツと多言語イ
ンデックスとが関連付けられて多言語コンテンツ格納部
50及び多言語インデックス格納部60に格納されてい
るので、利用者は、任意の言語XのキーワードでWeb
ページを検索することができ、また、任意の言語YでW
ebページを表示させて参照することができる。
As described above, since the multilingual content and the multilingual index are stored in the multilingual content storage unit 50 and the multilingual index storage unit 60 in association with each other, the user can use the keyword of any language X. Web
You can search pages, and W in any language Y
The eb page can be displayed for reference.

【0071】なお、ステップS31で利用者によって指
定された言語が言語Xの場合、ステップS32で入力さ
れるキーワードは言語Xであった。しかし、利用者によ
って指定された言語が言語Xであっても、言語X以外の
言語、例えば言語Yのキーワードが利用者によって入力
されてもよい。この場合、キーワード検索は、あくまで
指定された言語Xで実行される。従って、入力された言
語Yのキーワードを言語Xに翻訳する必要がある。そこ
で、この場合は、制御部70の多言語検索対応処理部7
2または翻訳サーバ30の翻訳エンジン31は、入力さ
れた言語Yのキーワードを言語Xに翻訳する。
When the language designated by the user in step S31 is language X, the keyword input in step S32 was language X. However, even if the language designated by the user is the language X, a keyword other than the language X, for example, a keyword of the language Y may be input by the user. In this case, the keyword search is executed only in the designated language X. Therefore, it is necessary to translate the input keyword of the language Y into the language X. Therefore, in this case, the multilingual search correspondence processing unit 7 of the control unit 70
2 or the translation engine 31 of the translation server 30 translates the input keyword of the language Y into the language X.

【0072】図7は、本発明のWebページ検索システ
ムによる任意の言語でのWebページ表示切替の動作を
説明するためのシーケンス図である。利用者がモニタな
どに表示されている言語YのWebページを言語ZのW
ebページに切り替えて表示させたい場合は、次のよう
な処理が行われる。
FIG. 7 is a sequence diagram for explaining the operation of Web page display switching in an arbitrary language by the Web page search system of the present invention. The user can change the Web page in language Y displayed on the monitor etc. to W in language Z.
When it is desired to switch to the eb page for display, the following processing is performed.

【0073】クライアント端末10は、言語YのWeb
ページをモニタなどに表示している(ステップS4
4)。このとき、利用者が、言語YのWebページを言
語ZのWebページに切り替えて表示させたい場合、検
索サイト上で任意の言語Zを指定する(ステップS4
5)。クライアント端末10は、利用者によって選択さ
れたWebページ情報を制御部70の多言語検索対応処
理部72に送信して、言語Zによる当該Webページを
要求する(ステップS46)。
The client terminal 10 is the Web of the language Y.
The page is displayed on a monitor or the like (step S4)
4). At this time, when the user wants to switch the web page of the language Y to the web page of the language Z and display the web page, the user specifies an arbitrary language Z on the search site (step S4
5). The client terminal 10 sends the web page information selected by the user to the multilingual search correspondence processing unit 72 of the control unit 70 to request the web page in the language Z (step S46).

【0074】多言語検索対応処理部72は、クライアン
ト端末10から送信された言語ZによるWebページの
要求を受け取ると、多言語コンテンツ格納部50内の言
語Zのコンテンツの領域に格納されている言語ZのWe
bページを参照する(ステップS47)。上記したよう
に、多言語検索対応処理部72は、利用者によって選択
されたWebページ情報からWebページ管理番号を認
識し、利用者によって指定された言語Zの言語情報から
言語毎の管理番号を認識する。そして、多言語検索対応
処理部72は、Webページ管理番号及び管理番号に基
づいて、言語ZによるWebページの要求を多言語コン
テンツ格納部50に対して行う。
Upon receiving the request for the Web page in the language Z transmitted from the client terminal 10, the multilingual search correspondence processing unit 72 stores the language stored in the content area of the language Z in the multilingual content storage unit 50. We of Z
Refer to page b (step S47). As described above, the multilingual search support processing unit 72 recognizes the Web page management number from the Web page information selected by the user, and acquires the management number for each language from the language information of the language Z designated by the user. recognize. Then, the multilingual search correspondence processing unit 72 makes a request for the Web page in the language Z to the multilingual content storage unit 50 based on the Web page management number and the management number.

【0075】多言語コンテンツ格納部50は、多言語検
索対応処理部72からの上記要求に応じて、言語Zの当
該Webページを読み出して多言語検索対応処理部72
に送出する(ステップS48)。多言語検索対応処理部
72は、多言語コンテンツ格納部50から送出された言
語ZのWebページを受け取ると、言語ZのWebペー
ジをクライアント端末10に送出する(ステップS4
9)。クライアント端末10は、多言語検索対応処理部
72から送出された言語ZのWebページを受け取る
と、言語ZのWebページをモニタなどに表示する(ス
テップS50)。
In response to the request from the multilingual search correspondence processing unit 72, the multilingual content storage unit 50 reads the Web page of the language Z and multilingual search correspondence processing unit 72.
(Step S48). When the multilingual search support processing unit 72 receives the Web page of the language Z sent from the multilingual content storage unit 50, it sends the Web page of the language Z to the client terminal 10 (step S4).
9). When the client terminal 10 receives the language Z web page sent from the multilingual search support processing unit 72, the client terminal 10 displays the language Z web page on a monitor or the like (step S50).

【0076】このように、利用者は、簡単な操作で容易
にWebページのコンテンツの言語を切り替えてモニタ
などに表示させることができる。
As described above, the user can easily switch the language of the content of the Web page and display it on the monitor or the like by a simple operation.

【0077】(5)任意の言語でのWebページ閲覧 図8は、本発明のWebページ検索システムによる任意
の言語でのWebページ閲覧の動作を説明するためのシ
ーケンス図である。
(5) Web Page Browsing in Arbitrary Language FIG. 8 is a sequence diagram for explaining the operation of Web page browsing in a given language by the Web page search system of the present invention.

【0078】クライアント端末10は、言語ZのWeb
ページをモニタなどに表示している(ステップS5
0)。利用者は、言語ZのWebページとリンクが張ら
れている他のWebページを閲覧(参照)したい場合、
次のような操作を行う。まず、利用者は、リンクが張ら
れた他のWebページを言語Xで表示させたい場合は、
言語Xを検索サイト上で指定する(ステップS51)。
The client terminal 10 is the Web of language Z.
The page is displayed on a monitor or the like (step S5)
0). When the user wants to browse (reference) another web page linked to the language Z web page,
Do the following: First, if the user wants to display another linked web page in language X,
The language X is designated on the search site (step S51).

【0079】次に、利用者は、現在表示されているWe
bページ上のリンクをクリックするなどして、リンクが
張られた他のWebページを選択する(ステップS5
2)。クライアント端末10は、利用者によって選択さ
れたWebページ情報を制御部70の多言語検索対応処
理部72に送信して、言語Xによる当該Webページを
要求する(ステップS46)。
Next, the user selects the We currently displayed.
Another web page with a link is selected, for example, by clicking a link on page b (step S5).
2). The client terminal 10 sends the web page information selected by the user to the multilingual search support processing part 72 of the control part 70 to request the web page in the language X (step S46).

【0080】多言語検索対応処理部72は、クライアン
ト端末10から送信された言語XによるWebページの
要求を受け取ると、このWebページの要求に含まれる
利用者によって選択されたWebページ情報からWeb
ページ管理番号を認識しようとする。しかし、この場
合、Webページが多言語コンテンツ格納部50に格納
されていないので、Webページ管理番号は存在しな
い。従って、多言語検索対応処理部72は、Webペー
ジ情報に対応するWebページ管理番号が存在しないこ
とを認識(確認)する。
Upon receiving the request for the Web page in the language X transmitted from the client terminal 10, the multilingual search support processing unit 72 outputs the Web page from the Web page information selected by the user included in the request for the Web page.
Try to recognize the page control number. However, in this case, since the web page is not stored in the multilingual content storage unit 50, the web page management number does not exist. Therefore, the multilingual search correspondence processing unit 72 recognizes (confirms) that the web page management number corresponding to the web page information does not exist.

【0081】多言語検索対応処理部72は、Webペー
ジ情報に対応するWebページ管理番号が存在しない場
合には、Webページを収集させるために、当該Web
ページ情報をWebページ収集部20に送信する(ステ
ップS54)。また、多言語検索対応処理部72は、ク
ライアント端末10から送信されたWebページの要求
に含まれる利用者によって指定された言語Xの言語情報
(言語Xを指定した情報)を翻訳サーバ30に送信する
(ステップS55)。
If the web page management number corresponding to the web page information does not exist, the multilingual search correspondence processing section 72 collects the web pages in order to collect the web pages.
The page information is transmitted to the web page collection unit 20 (step S54). In addition, the multilingual search correspondence processing unit 72 transmits to the translation server 30 the language information of the language X designated by the user included in the request for the web page transmitted from the client terminal 10 (information designating the language X). Yes (step S55).

【0082】Webページ収集部20は、多言語検索対
応処理部72から送信されたWebページ情報を受け取
る。Webページ収集ロボット22は、当該Webペー
ジ情報に基づいて、通信処理部21を通じてインターネ
ット100上の当該Webページ情報のサイトURLの
Webページを提供するサーバにアクセスする。そし
て、Webページ収集ロボット22は、アクセスしたサ
ーバに対してWebページのダウンロードを要求する
(ステップS56)。
The Web page collection unit 20 receives the Web page information transmitted from the multilingual search correspondence processing unit 72. Based on the Web page information, the Web page collection robot 22 accesses the server that provides the Web page of the site URL of the Web page information on the Internet 100 through the communication processing unit 21. Then, the web page collection robot 22 requests the accessed server to download the web page (step S56).

【0083】Webページを提供するサーバは、Web
ページ収集部20からのダウンロードの要求に応じて、
WebページをWebページ収集部20に送出する(ス
テップS57)。Webページ収集部20のWebペー
ジ収集ロボット22は、通信処理部21を通じてサーバ
から送出されたWebページを受信すると、受信したW
ebページを翻訳サーバ30に送出する(ステップS5
8)。
The server that provides the Web page is the Web
In response to a download request from the page collection unit 20,
The web page is sent to the web page collection unit 20 (step S57). When the web page collection robot 22 of the web page collection unit 20 receives the Web page sent from the server through the communication processing unit 21, the received W
The eb page is sent to the translation server 30 (step S5)
8).

【0084】翻訳サーバ30は、Webページ収集部2
0から送出されたWebページを受け取ると、当該We
bページの言語を認識する。そして、翻訳サーバ30
は、辞書部40にアクセスして辞書情報を参照する(ス
テップS59)。辞書部40は、翻訳サーバ30から辞
書情報の参照要求を受けると、参照要求された辞書情報
を翻訳サーバ30に送出する(ステップS60)。翻訳
エンジン31は、辞書部40の辞書情報を参照し、多言
語検索対応処理部72から送信された言語Xの言語情報
に従って、新規Webページのコンテンツを原語(翻訳
前の元の言語)から言語Xに自動的に機械翻訳する(ス
テップS61)。
The translation server 30 uses the Web page collection unit 2
When the Web page sent from 0 is received,
Recognize the language of page b. And the translation server 30
Accesses the dictionary unit 40 and refers to the dictionary information (step S59). Upon receiving the dictionary information reference request from the translation server 30, the dictionary unit 40 sends the reference requested dictionary information to the translation server 30 (step S60). The translation engine 31 refers to the dictionary information of the dictionary unit 40, and according to the language information of the language X transmitted from the multilingual search support processing unit 72, the content of the new Web page is changed from the original language (the original language before translation) to the language. Automatically machine translates to X (step S61).

【0085】翻訳サーバ30は、機械翻訳した言語Xの
翻訳Webページを多言語検索対応処理部72に送出す
る(ステップS62)。多言語検索対応処理部72は、
言語Xの翻訳Webページをクライアント端末10に送
出する(ステップS63)。なお、このとき、多言語検
索対応処理部72は、言語Xの翻訳Webページを多言
語コンテンツ格納部50の言語Xのコンテンツを格納す
る領域に格納するようにしてもよい。
The translation server 30 sends the machine-translated translated Web page of the language X to the multilingual search correspondence processing unit 72 (step S62). The multilingual search support processing unit 72
The translated Web page of language X is sent to the client terminal 10 (step S63). At this time, the multilingual search correspondence processing unit 72 may store the translated Web page of the language X in the area of the multilingual content storage unit 50 that stores the content of the language X.

【0086】クライアント端末10は、多言語検索対応
処理部72から送出された言語Xの翻訳Webページを
受け取ると、モニタなどに表示する(ステップS6
4)。このように、リンクが張られたWebページ(多
言語コンテンツ格納部50に予め格納されていないWe
bページ)が、利用者の希望する任意の言語Xで表示さ
れたことになる。従って、利用者は、任意の言語でWe
bページを閲覧することが可能となる。その結果、利用
者は、任意の言語でWebページをブラウジングして、
インターネットサーフィンを行うことも可能となる。
When the client terminal 10 receives the translation Web page of the language X sent from the multilingual search support processing unit 72, it displays it on the monitor or the like (step S6).
4). As described above, the linked web page (the web page that is not stored in advance in the multilingual content storage unit 50
page b) is displayed in any language X desired by the user. Therefore, the user can use We in any language.
It becomes possible to browse page b. As a result, users can browse Web pages in any language,
It is also possible to surf the internet.

【0087】以上のように、本実施の形態では、クライ
アント端末10,11から送信された所定のキーワード
についてのインデックスの参照要求に受け取ると、多言
語検索対応処理部72は、インデックスの参照要求に含
まれる言語情報から利用者によって指定された言語(例
えば言語X)を認識する。そして、多言語検索対応処理
部72は、インデックスの参照要求に含まれる所定のキ
ーワードに対応する言語Xのインデックスを、多言語イ
ンデックス格納部60から検索して読み出し、読み出し
た言語Xのインデックスを検索結果としてクライアント
端末10,11に送信する。
As described above, in the present embodiment, when receiving the index reference request for the predetermined keyword transmitted from the client terminals 10 and 11, the multilingual search correspondence processing unit 72 requests the index reference request. The language (for example, language X) designated by the user is recognized from the included language information. Then, the multilingual search correspondence processing unit 72 retrieves the index of the language X corresponding to the predetermined keyword included in the index reference request from the multilingual index storage unit 60, and retrieves the read index of the language X. As a result, it is transmitted to the client terminals 10 and 11.

【0088】かかる構成によれば、利用者の希望する任
意の言語、例えば利用者が最も得意とする言語で、当該
任意の言語に翻訳されたWebページのインデックスを
検索し、当該任意の言語のインデックスを検索結果とし
て提供することができる。従って、利用者は、言語にと
らわれずに、インターネット100上にある様々な言語
によって作成された膨大な数のWebページを検索する
ことができることになる。すなわち、Webページの検
索対象が言語にとらわれずに拡大されたことになり、利
用者の情報収集力を格段に向上させることが可能とな
る。
According to this structure, the index of the Web page translated into any language desired by the user, for example, the language in which the user is most good, is searched and the The index can be provided as a search result. Therefore, the user can search a huge number of Web pages created in various languages on the Internet 100, regardless of the language. That is, the search target of the Web page is expanded regardless of the language, and the information gathering power of the user can be significantly improved.

【0089】また、多言語検索対応処理部72は、クラ
イアント端末10,11から送信されたWebページの
要求を受け取ると、Webページの要求に含まれる言語
情報から利用者によって指定された言語(例えば言語
Y)を認識するとともに、Webページの要求に含まれ
るWebページ情報から利用者によって選択されたWe
bページを認識する。そして、多言語検索対応処理部7
2は、利用者によって選択された言語YのWebページ
を多言語コンテンツ格納部50から読み出し、読み出し
た言語YのWebページをクライアント端末10,11
に送信する。
When the multilingual search support processing unit 72 receives the request for the Web page transmitted from the client terminals 10 and 11, the language specified by the user from the language information included in the request for the Web page (for example, the language information). The language Y) is recognized and the We selected by the user from the Web page information included in the request for the Web page.
Recognize page b. Then, the multilingual search correspondence processing unit 7
2 reads the web page of the language Y selected by the user from the multilingual content storage unit 50, and reads the read web page of the language Y from the client terminals 10 and 11.
Send to.

【0090】かかる構成によれば、利用者の希望する任
意の言語のキーワードでWebページを検索し、任意の
言語でWebページを表示させて、任意の言語でWeb
ページを閲覧させることが可能となる。従って、利用者
は、Webページを閲覧する際に、Webページの検索
言語及びWebページの表示言語を容易に切り替えるこ
とができ、多言語にまたがる横断検索・閲覧の省力化、
簡素化を図ることができる。その結果、利用者の言語障
壁が取り除かれ、多言語における情報収集作業を効率良
く実行することが可能となる。
According to this structure, a Web page is searched for with a keyword in any language desired by the user, the Web page is displayed in any language, and the Web page is displayed in any language.
It is possible to browse the page. Therefore, when browsing a web page, the user can easily switch the search language of the web page and the display language of the web page, which saves labor for cross-searching and browsing in multiple languages.
It can be simplified. As a result, the language barrier of the user is removed, and it becomes possible to efficiently perform the information collection work in multiple languages.

【0091】また、多言語検索対応処理部72は、We
bページの要求に含まれるWebページ情報から利用者
によって選択されたWebページを認識し、当該Web
ページが予め多言語コンテンツ格納部50に格納されて
いるか否かを確認する。そして、多言語検索対応処理部
72は、多言語コンテンツ格納部50に格納されていな
い場合、Webページ情報に基づいてWebページをW
ebページ収集部20に収集させ、収集されたWebペ
ージを言語情報の言語に翻訳サーバ30に翻訳させる。
そして、多言語検索対応処理部72は、翻訳サーバ30
で翻訳されたWebページをクライアント端末に送信す
る。
In addition, the multilingual search support processing unit 72
The web page selected by the user is recognized from the web page information included in the request for the page b, and
It is confirmed whether or not the page is stored in the multilingual content storage unit 50 in advance. Then, if the multilingual search correspondence processing unit 72 does not store the multilingual content in the multilingual content storage unit 50, the multilingual search correspondence processing unit 72 executes the W
The eb page collecting unit 20 causes the translation server 30 to translate the collected Web pages into the language of the language information.
Then, the multilingual search correspondence processing unit 72 uses the translation server 30.
The Web page translated by is transmitted to the client terminal.

【0092】かかる構成によれば、利用者は、多言語コ
ンテンツ格納部50に予め格納されているWebページ
にとらわれずに、インターネット100上の様々なWe
bページを任意の言語で閲覧することが可能となる。
According to this structure, the user does not have to be restricted by the Web pages stored in advance in the multilingual content storage unit 50, and various We
It is possible to browse page b in any language.

【0093】さらに、言語情報で指定された言語(例え
ば言語X)と利用者によって入力されたキーワードの言
語(例えば言語Y)とが異なる場合、キーワードを言語
情報で指定された言語Xに翻訳するように構成すれば、
利用者はキーワードの言語と異なる任意の言語で検索結
果を得ることができるようになる。
Further, when the language designated by the language information (for example, language X) is different from the language of the keyword input by the user (for example, language Y), the keyword is translated into the language X designated by the language information. If you configure
The user will be able to obtain search results in any language different from the keyword language.

【0094】[0094]

【発明の効果】以上のように、本発明では、クライアン
ト端末から送信された所定のキーワードについてのWe
bページ検索要求に受け取ると、Webページ検索要求
に含まれる言語情報から利用者によって指定された指定
言語を認識し、Webページ検索要求に含まれる所定の
キーワードに対応する指定言語のインデックスを、予め
格納されているインデックスから検索して読み出し、読
み出した指定言語のインデックスを検索結果としてクラ
イアント端末に送信する。このような構成によれば、利
用者にとって言語上の知識が要求されず、簡単な操作で
効率良く、任意の言語のWebページの検索及び閲覧を
行うことができる。
As described above, according to the present invention, the We for the predetermined keyword transmitted from the client terminal is used.
When received in the b-page search request, the designated language designated by the user is recognized from the language information included in the web-page search request, and the index of the designated language corresponding to the predetermined keyword included in the web-page search request is calculated in advance. The stored index is searched and read, and the read index of the designated language is transmitted to the client terminal as a search result. With such a configuration, the user is not required to have knowledge of language, and it is possible to efficiently search and browse a Web page in an arbitrary language with a simple operation.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明のWebページ検索システムの構成を
示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a Web page search system of the present invention.

【図2】 本発明のWebページ検索システムによるW
ebページ収集の動作を説明するためのシーケンス図で
ある。
FIG. 2 is a W according to the web page search system of the present invention.
It is a sequence diagram for explaining the operation of eb page collection.

【図3】 関連付けられた多言語コンテンツと多言語イ
ンデックスの格納状態を示す図である。
FIG. 3 is a diagram showing a storage state of associated multilingual contents and a multilingual index.

【図4】 本発明のWebページ検索システムによるW
ebページ翻訳の動作を説明するためのシーケンス図で
ある。
FIG. 4 is a W according to the Web page search system of the present invention.
It is a sequence diagram for demonstrating operation | movement of eb page translation.

【図5】 本発明のWebページ検索システムによるイ
ンデックス作成の動作を説明するためのシーケンス図で
ある。
FIG. 5 is a sequence diagram for explaining an operation of creating an index by the Web page search system of the present invention.

【図6】 本発明のWebページ検索システムによる任
意の言語でのWebページ検索の動作を説明するための
シーケンス図である。
FIG. 6 is a sequence diagram for explaining a web page search operation in an arbitrary language by the web page search system of the present invention.

【図7】 本発明のWebページ検索システムによる任
意の言語でのWebページ表示切替の動作を説明するた
めのシーケンス図である。
FIG. 7 is a sequence diagram for explaining a web page display switching operation in an arbitrary language by the web page search system of the present invention.

【図8】 本発明のWebページ検索システムによる任
意の言語でのWebページ閲覧の動作を説明するための
シーケンス図である。
FIG. 8 is a sequence diagram for explaining an operation of browsing a web page in an arbitrary language by the web page search system of the present invention.

【符号の説明】[Explanation of symbols]

10,11 クライアント端末 20 Webページ収集部(Webページ収集手段) 30 翻訳サーバ(翻訳手段) 40 辞書部(翻訳手段) 50 多言語コンテンツ格納部(Webページ記憶手
段) 60 多言語インデックス格納部(インデックス記憶手
段) 70 制御部 71 多言語インデックス作成処理部(インデックス作
成手段) 72 多言語検索対応処理部(検索手段、Webページ
提供手段) 100 インターネット(ネットワーク)
10, 11 Client Terminal 20 Web Page Collection Unit (Web Page Collection Means) 30 Translation Server (Translation Means) 40 Dictionary Section (Translation Means) 50 Multilingual Content Storage (Web Page Storage Means) 60 Multilingual Index Storage (Index Storage unit 70 Control unit 71 Multilingual index creation processing unit (index creation unit) 72 Multilingual search correspondence processing unit (searching unit, Web page providing unit) 100 Internet (network)

───────────────────────────────────────────────────── フロントページの続き (72)発明者 村山 裕樹 東京都港区芝五丁目7番1号 日本電気株 式会社内 (72)発明者 柴崎 庄二 東京都港区芝五丁目7番1号 日本電気株 式会社内 (72)発明者 佐能 浩明 東京都江東区新木場一丁目18番6号 エヌ イーシーソフト株式会社内 Fターム(参考) 5B075 KK33 KK37 ND20    ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Hiroki Murayama             5-7 Shiba 5-1, Minato-ku, Tokyo NEC Corporation             Inside the company (72) Inventor Shoji Shibasaki             5-7 Shiba 5-1, Minato-ku, Tokyo NEC Corporation             Inside the company (72) Inventor Hiroaki Sano             18-6, Shinkiba, Koto-ku, Tokyo N             Within Easesoft Co., Ltd. F term (reference) 5B075 KK33 KK37 ND20

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 クライアント端末から送信された所定の
キーワードについてのWebページ検索要求に受け取る
と、 前記Webページ検索要求に含まれる言語情報から利用
者によって指定された指定言語を認識し、 前記Webページ検索要求に含まれる前記所定のキーワ
ードに対応する前記指定言語のインデックスを、予め格
納されているインデックスから検索して読み出し、 読み出した前記指定言語の前記インデックスを検索結果
として前記クライアント端末に送信することを特徴とす
るWebページ検索方法。
1. When a web page search request for a predetermined keyword transmitted from a client terminal is received, a language specified by a user is recognized from the language information included in the web page search request, and the web page is searched. An index of the specified language corresponding to the predetermined keyword included in the search request is searched and read from an index stored in advance, and the read index of the specified language is transmitted to the client terminal as a search result. A web page search method characterized by:
【請求項2】 クライアント端末から送信されたWeb
ページ要求を受け取ると、前記Webページ要求に含ま
れる言語情報から利用者によって指定された指定言語を
認識するとともに、前記Webページ要求に含まれるW
ebページ情報から前記利用者によって選択されたWe
bページを認識し、 前記利用者によって選択された前記指定言語の前記We
bページを読み出し、 読み出した前記指定言語の前記Webページを前記クラ
イアント端末に送信することを特徴とする請求項1記載
のWebページ検索方法。
2. The Web transmitted from the client terminal
When the page request is received, the specified language designated by the user is recognized from the language information included in the web page request, and the W included in the web page request is recognized.
We selected by the user from the eb page information
Recognizing page b, the We in the specified language selected by the user
The web page search method according to claim 1, wherein the page b is read, and the read web page in the designated language is transmitted to the client terminal.
【請求項3】 Webページ要求に含まれるWebペー
ジ情報から利用者によって選択されたWebページを認
識し、 当該Webページが予め格納されているか否かを確認
し、 格納されていない場合は、前記Webページ情報に基づ
いて前記Webページを収集し、 収集した前記Webページを言語情報から認識した指定
言語に翻訳し、 翻訳したWebページをクライアント端末に送信するこ
とを特徴とする請求項2記載のWebページ検索方法。
3. The web page selected by the user is recognized from the web page information included in the web page request, it is confirmed whether the web page is stored in advance, and if it is not stored, the The web page is collected based on the web page information, the collected web page is translated into a designated language recognized from language information, and the translated web page is transmitted to a client terminal. Web page search method.
【請求項4】 言語情報で利用者によって指定された指
定言語と前記利用者によって検索要求されたキーワード
の言語とが異なる場合、前記キーワードを前記言語情報
で指定された前記指定言語に翻訳することを特徴とする
請求項1から請求項3のうちのいずれか1項記載のWe
bページ検索方法。
4. When the specified language specified by the user in the language information and the language of the keyword requested by the user are different, the keyword is translated into the specified language specified by the language information. We according to any one of claims 1 to 3, characterized in that
b page search method.
【請求項5】 ネットワーク上のWebページを多言語
に翻訳する翻訳手段と、 前記ネットワーク上の原語の前記Webページと翻訳さ
れた多言語のWebページとをそれぞれ関連付けて格納
するWebページ記憶手段と、 前記Webページ記憶手段に格納された前記原語及び前
記多言語のWebページのコンテンツを基に前記Web
ページの検索対象となる原語及び多言語のインデックス
を作成するインデックス作成手段と、 前記インデックス作成手段が作成した前記原語及び前記
多言語のインデックスをそれぞれ関連付けるとともに、
前記原語及び前記多言語のインデックスを前記Webペ
ージ記憶手段に格納された前記原語及び前記多言語のW
ebページに言語毎に関連付けて格納するインデックス
記憶手段と、 クライアント端末から送信された所定のキーワードにつ
いてのWebページ検索要求に受け取ると、前記Web
ページ検索要求に含まれる言語情報から利用者によって
指定された指定言語を認識し、前記Webページ検索要
求に含まれる前記所定のキーワードに対応する前記指定
言語のインデックスを、前記インデックス記憶手段に格
納されているインデックスから検索して読み出し、読み
出した前記指定言語の前記インデックスを検索結果とし
て前記クライアント端末に送信する検索手段とを備えた
ことを特徴とするWebページ検索システム。
5. A translation unit for translating a Web page on a network into multiple languages, and a Web page storage unit for storing the original Web page on the network and the translated multilingual Web page in association with each other. , The Web based on the contents of the original language and the multilingual Web pages stored in the Web page storage means.
An index creating unit that creates an original language index and a multilingual index that are search targets of a page, and associates the original language and the multilingual index created by the index creating unit, respectively,
The original language and the multilingual index stored in the Web page storage means are stored in the original language and the multilingual W.
An index storage unit that stores the eb page in association with each language and a Web page search request for a predetermined keyword sent from the client terminal receives the Web page.
The designated language designated by the user is recognized from the language information included in the page search request, and the index of the designated language corresponding to the predetermined keyword included in the Web page search request is stored in the index storage means. And a retrieval means for transmitting the retrieved index in the designated language as a retrieval result to the client terminal.
【請求項6】 クライアント端末から送信されたWeb
ページ要求を受け取ると、前記Webページ要求に含ま
れる言語情報から利用者によって指定された指定言語を
認識するとともに、前記Webページ要求に含まれるW
ebページ情報から前記利用者によって選択されたWe
bページを認識し、前記利用者によって選択された前記
指定言語の前記WebページをWebページ記憶手段か
ら読み出し、読み出した前記指定言語の前記Webペー
ジを前記クライアント端末に送信するWebページ提供
手段を備えたことを特徴とする請求項5記載のWebペ
ージ検索システム。
6. The Web transmitted from the client terminal
When the page request is received, the specified language designated by the user is recognized from the language information included in the web page request, and the W included in the web page request is recognized.
We selected by the user from the eb page information
a web page providing means for recognizing the page b, reading the web page in the designated language selected by the user from the web page storage means, and transmitting the read web page in the designated language to the client terminal; The web page search system according to claim 5, wherein
【請求項7】 ネットワーク上のWebページを収集す
るWebページ収集手段を備え、 Webページ提供手段は、Webページ要求に含まれる
Webページ情報から利用者によって選択されたWeb
ページを認識し、当該Webページが予めWebページ
記憶手段に格納されていない場合、前記Webページ情
報に基づいて前記Webページ収集手段に前記Webペ
ージを収集させ、前記Webページ収集手段が収集した
前記Webページを翻訳手段に指定言語に翻訳させ、前
記翻訳手段が翻訳したWebページをクライアント端末
に送信することを特徴とする請求項6記載のWebペー
ジ検索システム。
7. A web page collecting means for collecting web pages on a network, wherein the web page providing means selects a web page selected by a user from web page information included in the web page request.
When the page is recognized and the web page is not stored in advance in the web page storage means, the web page collection means collects the web page based on the web page information, and the web page collection means collects the web page. 7. The web page search system according to claim 6, wherein the translation means translates the web page into a specified language, and the web page translated by the translation means is transmitted to the client terminal.
【請求項8】 検索手段または翻訳手段は、言語情報で
指定された指定言語と前記利用者によって検索要求され
たキーワードの言語とが異なる場合、前記キーワードを
前記言語情報で指定された前記指定言語に翻訳すること
を特徴とする請求項5から請求項7のうちのいずれか1
項記載のWebページ検索システム。
8. The search means or the translation means, when the designated language designated by the language information is different from the language of the keyword requested by the user, the designated language designated by the language information is the keyword. 8. The method according to any one of claims 5 to 7, characterized in that
Web page search system described in the section.
【請求項9】 クライアント端末から送信された所定の
キーワードについてのWebページ検索要求に受け取る
と、前記Webページ検索要求に含まれる言語情報から
利用者によって指定された指定言語を認識する処理、 及び前記Webページ検索要求に含まれる前記所定のキ
ーワードに対応する前記指定言語のインデックスを、予
め格納されているインデックスから検索して読み出し、
読み出した前記指定言語の前記インデックスを検索結果
として前記クライアント端末に送信する処理をコンピュ
ータに実行させるWebページ検索用プログラム。
9. A process for recognizing a designated language designated by a user from language information included in the web page search request when the web page search request for a predetermined keyword transmitted from a client terminal is received, and An index of the specified language corresponding to the predetermined keyword included in the web page search request is searched for from a pre-stored index and read out,
A Web page search program that causes a computer to execute a process of transmitting the read index in the specified language to the client terminal as a search result.
【請求項10】 クライアント端末から送信されたWe
bページ要求を受け取ると、前記Webページ要求に含
まれる言語情報から利用者によって指定された指定言語
を認識するとともに、前記Webページ要求に含まれる
Webページ情報から前記利用者によって選択されたW
ebページを認識する処理、 及び前記利用者によって選択された前記指定言語の前記
Webページを読み出し、読み出した前記指定言語の前
記Webページを前記クライアント端末に送信する処理
をコンピュータに実行させる請求項9記載のWebペー
ジ検索用プログラム。
10. We transmitted from the client terminal
Upon receiving the b-page request, the designated language specified by the user is recognized from the language information included in the web page request, and the W selected by the user from the web page information included in the web page request is recognized.
10. The computer is caused to execute a process of recognizing an eb page, a process of reading the Web page of the designated language selected by the user, and a process of transmitting the read Web page of the designated language to the client terminal. The described web page search program.
【請求項11】 Webページ情報から認識した利用者
によって指定されたWebページが予め格納されている
か否かを確認する処理、 格納されていない場合は、前記Webページ情報を基に
前記Webページを収集させる処理、 及び収集された前記Webページを言語情報から認識し
た指定言語に翻訳させ、翻訳されたWebページをクラ
イアント端末に送信する処理をコンピュータに実行させ
る請求項10記載のWebページ検索用プログラム。
11. A process of confirming whether or not a web page specified by a user recognized from the web page information is stored in advance, and when the web page is not stored, the web page is searched based on the web page information. 11. The web page search program according to claim 10, further comprising: a process of causing the computer to execute a process of collecting the web pages, translating the collected web pages into a designated language recognized from language information, and transmitting the translated web pages to a client terminal. .
【請求項12】 言語情報で利用者によって指定された
指定言語と前記利用者によって検索要求されたキーワー
ドの言語とが異なる場合、前記キーワードを前記言語情
報で指定された前記指定言語に翻訳する処理をコンピュ
ータに実行させる請求項9から請求項11のうちのいず
れか1項記載のWebページ検索用プログラム。
12. A process of translating the keyword into the designated language designated by the language information when the designated language designated by the user in the language information and the language of the keyword requested by the user are different from each other. The Web page search program according to any one of claims 9 to 11, which causes a computer to execute.
JP2002103429A 2002-04-05 2002-04-05 Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE Pending JP2003296356A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002103429A JP2003296356A (en) 2002-04-05 2002-04-05 Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002103429A JP2003296356A (en) 2002-04-05 2002-04-05 Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE

Publications (1)

Publication Number Publication Date
JP2003296356A true JP2003296356A (en) 2003-10-17

Family

ID=29389265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002103429A Pending JP2003296356A (en) 2002-04-05 2002-04-05 Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE

Country Status (1)

Country Link
JP (1) JP2003296356A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267649A (en) * 2004-03-19 2005-09-29 Microsoft Corp Method and system for coupling user interface language of software application and web site
JP2007025939A (en) * 2005-07-14 2007-02-01 Nec Corp Multilingual document retrieval device, multilingual document retrieval method and program for retrieving multilingual document
US7768955B2 (en) 2004-01-13 2010-08-03 Kt Corporation Method and device for connecting wireless internet service with string
JP2013175094A (en) * 2012-02-27 2013-09-05 Hitachi Systems Ltd Data search system and method
CN112380410A (en) * 2020-11-10 2021-02-19 北京字节跳动网络技术有限公司 Information processing method and device and electronic equipment

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7768955B2 (en) 2004-01-13 2010-08-03 Kt Corporation Method and device for connecting wireless internet service with string
JP2005267649A (en) * 2004-03-19 2005-09-29 Microsoft Corp Method and system for coupling user interface language of software application and web site
JP2007025939A (en) * 2005-07-14 2007-02-01 Nec Corp Multilingual document retrieval device, multilingual document retrieval method and program for retrieving multilingual document
JP4640593B2 (en) * 2005-07-14 2011-03-02 日本電気株式会社 Multilingual document search device, multilingual document search method, and multilingual document search program
JP2013175094A (en) * 2012-02-27 2013-09-05 Hitachi Systems Ltd Data search system and method
CN112380410A (en) * 2020-11-10 2021-02-19 北京字节跳动网络技术有限公司 Information processing method and device and electronic equipment

Similar Documents

Publication Publication Date Title
KR100341339B1 (en) Display Screen and Window Size Related Web Page Adaptation System
US6415319B1 (en) Intelligent network browser using incremental conceptual indexer
US6336116B1 (en) Search and index hosting system
US6460060B1 (en) Method and system for searching web browser history
KR101088983B1 (en) Data search system and data search method using a global unique identifier
US7788248B2 (en) Immediate search feedback
JP2006501582A (en) Bilingual annotation activated instantly by a pointer on text information of an electronic document
US20010021934A1 (en) Processing device for searching information in one language using search query in another language, and recording medium and method thereof
US20070282825A1 (en) Systems and methods for dynamic content linking
JPH11161682A (en) Device and method for retrieving information and recording medium
US6615168B1 (en) Multilingual agent for use in computer systems
JPH10187752A (en) Inter-language information retrieval backup system
JP2007503041A (en) How to cache data assets
JP3794686B2 (en) Link destination screen display system, link destination screen display program, and storage medium storing the program
JPH0981580A (en) Information retrieval device and information retrieval system using the device
JP2003296356A (en) Web PAGE RETRIEVAL METHOD, Web PAGE RETRIEVAL SYSTEM AND PROGRAM FOR RETRIEVING Web PAGE
US10255362B2 (en) Method for performing a search, and computer program product and user interface for same
JP4725876B2 (en) Data passing device
JP3647967B2 (en) Screen transition system
JPH11338791A (en) Hyper text display system, server device and terminal equipment
JP2007034464A (en) Advertising content presentation system and advertising content presentation program
JP2003186788A (en) Method and system for providing translation web site and program
JP2007025753A (en) Weblog server and weblog service providing system
JP2007087241A (en) Multilingual multilayered site creation system and multilingual multilayered site creation program
KR20010103545A (en) Storage medium, system and apparatus for Internet translation with advertisement

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040426

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20051125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071120