JP2008083878A - 情報検索装置と検索方法並びに検索プログラム - Google Patents
情報検索装置と検索方法並びに検索プログラム Download PDFInfo
- Publication number
- JP2008083878A JP2008083878A JP2006261692A JP2006261692A JP2008083878A JP 2008083878 A JP2008083878 A JP 2008083878A JP 2006261692 A JP2006261692 A JP 2006261692A JP 2006261692 A JP2006261692 A JP 2006261692A JP 2008083878 A JP2008083878 A JP 2008083878A
- Authority
- JP
- Japan
- Prior art keywords
- language
- information
- terminal
- association
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】検索キーワードとは異なる言語で記述された情報を検索することができ、さらに、検索対象の情報の記述言語の種類が多くても、検索時の検索キーワードの翻訳処理の負担がなく、検索処理の高速化が可能となる情報検索装置と検索方法並びに検索プログラムを得る。
【解決手段】検索対象となる情報に含まれる第1言語の語句を第2言語に翻訳して検索対象となる情報のインデックス情報を生成した上で、第3言語の検索キーワードを第2言語に翻訳した上で、インデックス情報を用いて検索対象となる情報を検索する手段を有してなる。
【選択図】図1
【解決手段】検索対象となる情報に含まれる第1言語の語句を第2言語に翻訳して検索対象となる情報のインデックス情報を生成した上で、第3言語の検索キーワードを第2言語に翻訳した上で、インデックス情報を用いて検索対象となる情報を検索する手段を有してなる。
【選択図】図1
Description
本発明は、情報検索技術に関するものであり、たとえば、インターネット上に存在する外国語で記述されたWebページを検索する際に適用可能な技術である。
近年、インターネット技術の高度化や通信インフラの充実を背景に、インターネットを用いた情報の配信が盛んに行われている。
たとえば、企業は、自社の商品を消費者に広告・宣伝するために、Webページ(ホームページ)を作成している。一方、消費者は、いわゆる検索サイトなどにアクセスし、検索キーワードを用いてWebページを検索して、お目当ての商品に関する情報を得ている。ここで、たとえば、検索キーワードが「コップ」の場合、検索サイトは、「コップ」の文字列を含むWebページのURL(Uniform Resource Locator)を、所定のアルゴリズムで順位付けて出力する。検索者は、表示されたURLを選択することで、このURLに対応するWebページを閲覧することができる。
たとえば、企業は、自社の商品を消費者に広告・宣伝するために、Webページ(ホームページ)を作成している。一方、消費者は、いわゆる検索サイトなどにアクセスし、検索キーワードを用いてWebページを検索して、お目当ての商品に関する情報を得ている。ここで、たとえば、検索キーワードが「コップ」の場合、検索サイトは、「コップ」の文字列を含むWebページのURL(Uniform Resource Locator)を、所定のアルゴリズムで順位付けて出力する。検索者は、表示されたURLを選択することで、このURLに対応するWebページを閲覧することができる。
従来の検索サイトは、たとえば、日本語の検索キーワードを入力すると、この日本語の検索キーワードを含むWebページ(のURL)を検索結果として提示するに止まる。すなわち、検索キーワードの言語とは異なる言語、たとえば、検索キーワードが日本語の場合に、英語や中国語のWebページ(日本語の検索キーワードを含まない)は検索の対象とはならない。したがって、検索者は、検索キーワードの言語とは異なる言語で記述されたWebページを閲覧することはできない。
そのため、国際的な物流網が整備され、外国から商品を購入することが容易な現在においてさえ、消費者は、インターネットを用いて、お目当ての商品を世界中から検索して購入することができない状況にある。一方、Webページを作成し、インターネットを通じて世界中に商品の情報を配信したい企業は、より多くの言語に翻訳したWebページを作成しなければ、世界中の消費者に商品の情報を届けることができない状況にある。
そのため、国際的な物流網が整備され、外国から商品を購入することが容易な現在においてさえ、消費者は、インターネットを用いて、お目当ての商品を世界中から検索して購入することができない状況にある。一方、Webページを作成し、インターネットを通じて世界中に商品の情報を配信したい企業は、より多くの言語に翻訳したWebページを作成しなければ、世界中の消費者に商品の情報を届けることができない状況にある。
これまでにも、検索キーワードの言語とは異なる言語で記述された情報を検索する技術は提案されている(たとえば、特許文献1,2,3,4参照)。
しかしながら、これまでの提案は、第1の言語の検索キーワードを第2の言語に翻訳し、第2の言語で記述された情報を検索し、検索結果を第1の言語に翻訳して出力するものである。すなわち、たとえば、英語で記述された情報を日本語で記述された検索キーワードで検索する場合に、検索キーワードを英訳して英語で記述された情報を検索し、検索された英語の情報を日本語に翻訳して出力するものである。
しかしながら、これまでの提案は、第1の言語の検索キーワードを第2の言語に翻訳し、第2の言語で記述された情報を検索し、検索結果を第1の言語に翻訳して出力するものである。すなわち、たとえば、英語で記述された情報を日本語で記述された検索キーワードで検索する場合に、検索キーワードを英訳して英語で記述された情報を検索し、検索された英語の情報を日本語に翻訳して出力するものである。
このような従来技術によれば、たしかに、検索キーワードとは異なる言語で記述された情報を検索することはできるが、検索の対象となる情報は予め定められた特定の言語で記述された情報に限られる。つまり、従来技術は、特定の言語で記述された情報を検索するためのものである。そのため、たとえば、中国語、韓国語、ドイツ語で記述されたWebページを日本語の検索キーワードで検索する場合、検索キーワードを日本語から中国語、韓国語、ドイツ語のそれぞれに翻訳する必要がある。
このように、従来技術によれば、検索の対象となる情報の言語の種類が多くなれば検索時の検索キーワードの翻訳処理の負担が大きくなり、その結果、検索処理の高速化を阻害する、といった問題が生じ得る。
特開平09−114852号公報
特開平11−219368号公報
特開平10−307829号公報
特開2003−076710号公報
本発明は以上のような従来の実情に鑑みてなされたもので、検索キーワードとは異なる言語で記述された情報を検索することができ、さらに、検索の対象となる情報の記述言語の種類が多くても検索時の検索キーワードの翻訳処理の負担がなく、検索処理の高速化が可能となる情報検索装置と検索方法並びに検索プログラムを提供することを目的とする。
本発明にかかる情報検索装置は、提供者の端末と検索者の端末のそれぞれと通信ネットワークを介して接続し、検索対象の情報を記憶するための情報データベースと、第1言語の語句と第2言語の語句とを関連付けて記憶している第1翻訳データベースと、第2言語の語句と第3言語の語句とを関連付けて記憶している第2翻訳データベースと、第1言語の語句を含む情報を提供者の端末から受信する手段と、提供者の端末から受信した情報に含まれる第1言語の語句と関連付けて記憶されている第2言語の語句を第1翻訳データベースから読み出す手段と、提供者の端末から受信した情報と読み出した第2言語の語句とを関連付けて情報データベースに記憶する手段と、第3言語の検索キーワードを検索者の端末から受信する手段と、受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句を第2翻訳データベースから読み出す手段と、第2翻訳データベースから読み出された第2言語の語句と関連付けて記憶されている情報を情報データベースから読み出す検索手段と、読み出された情報を検索者の端末に送信する手段と、を有してなる。
また、本発明にかかる情報検索装置が備える検索手段は、検索者の端末から受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句が第2翻訳データベースから複数読み出されたとき、読み出された複数の第2言語の語句を検索者の端末に送信し、送信した複数の第2言語の語句のうち検索者が選択した第2言語の語句を検索者の端末から受信し、この受信した第2言語の語句と関連付けて記憶されている情報を情報データベースから読み出す。
本発明によれば、検索キーワードとは異なる言語で記述された情報を検索することができる。また、検索の対象となる情報の記述言語の種類が多くても、検索時の検索キーワードの翻訳処理の負担がなく、検索処理の高速化が可能となる。
以下、図面を参照しながら、本発明にかかる情報検索装置と検索方法並びに検索プログラムの実施の形態について説明する。
(第1の実施の形態)
図1は、本発明にかかる情報検索装置(以下、「本サーバ」という)の実施の形態を示すネットワーク構成図である。本サーバ1は、通信ネットワーク(図示省略)を介して、端末2と端末3のそれぞれと接続する。
図1は、本発明にかかる情報検索装置(以下、「本サーバ」という)の実施の形態を示すネットワーク構成図である。本サーバ1は、通信ネットワーク(図示省略)を介して、端末2と端末3のそれぞれと接続する。
通信ネットワークの例としては、インターネットやLAN(Local Area Network)などのコンピュータ通信網がある。本サーバ1、端末2、端末3は、図示しない専用線、公衆交換電話網(PSTN)、無線電話網、CATV網、衛星通信網等の通信回線を介して通信ネットワークと接続している。
本サーバ1は、いわゆるWebサーバとして動作して、端末2や端末3と情報交換を行う。すなわち、後述する端末2や端末3に表示される各画面は、本サーバ1が後述する各データベース(DB)に記憶されている情報や、端末2、端末3から受信した情報をもとに作成して端末2や端末3に送信したWebページである。
ただし、本発明において、本サーバ1と端末2,3との情報交換の手段はこれに限らず、後述する情報処理が実現できる手段であればよい。
ただし、本発明において、本サーバ1と端末2,3との情報交換の手段はこれに限らず、後述する情報処理が実現できる手段であればよい。
本サーバ1では、本発明にかかる情報検索プログラム(以下、「本プログラム」という)が動作して本サーバ1内の各手段を制御することで、以下に説明する本発明にかかる情報検索方法(以下、「本方法」という)を実現する。
ここで、本プログラムを記録したコンピュータ読取可能な記録媒体(以下、「本記録媒体」という)を用いれば、図示しないコンピュータを本サーバ1と同様に機能させることができる。すなわち、図示しないコンピュータが、本記録媒体から本プログラムを読取、実行することで、本方法を実現することができる。
ここで、本プログラムを記録したコンピュータ読取可能な記録媒体(以下、「本記録媒体」という)を用いれば、図示しないコンピュータを本サーバ1と同様に機能させることができる。すなわち、図示しないコンピュータが、本記録媒体から本プログラムを読取、実行することで、本方法を実現することができる。
以下に説明する実施の形態は、外国商品検索装置としての本サーバ1が、端末2から受信した商品情報に含まれる中国語の語句を英語に翻訳して商品情報と共に記憶しておき、端末3から受信した日本語の検索キーワードを英語に翻訳し、この翻訳した英語を用いて記憶しておいた商品情報を検索する場合を例に説明する。中国語、英語、日本語は、それぞれ、第1言語、第2言語、第3言語の例である。
なお、端末2は、商品情報を提供する提供者が利用する情報処理端末であり、後述する本サーバ1との情報交換が可能となるように構成されている。また、端末3は、商品情報を検索する検索者が利用する情報処理端末であり、後述する本サーバ1との情報交換が可能となるように構成されている。
なお、端末2は、商品情報を提供する提供者が利用する情報処理端末であり、後述する本サーバ1との情報交換が可能となるように構成されている。また、端末3は、商品情報を検索する検索者が利用する情報処理端末であり、後述する本サーバ1との情報交換が可能となるように構成されている。
(本サーバ1の構成について)
本サーバ1の構成について、説明する。
本サーバ1は、端末2、端末3と通信ネットワークを介して通信することができる情報処理装置であればよく、たとえば、パーソナルコンピュータなどで実現される。
図1に示すように、本サーバ1は、記憶部11,商品情報受信部12,第1翻訳部13,商品情報登録部14,検索キーワード受信部15,第2翻訳部16,商品情報検索部17、を有してなる。
本サーバ1の構成について、説明する。
本サーバ1は、端末2、端末3と通信ネットワークを介して通信することができる情報処理装置であればよく、たとえば、パーソナルコンピュータなどで実現される。
図1に示すように、本サーバ1は、記憶部11,商品情報受信部12,第1翻訳部13,商品情報登録部14,検索キーワード受信部15,第2翻訳部16,商品情報検索部17、を有してなる。
記憶部11は、第1辞書データ、第2辞書データ、商品情報、インデックス情報を記憶する手段であり、第1辞書データを記憶している第1翻訳データベースDB1、第2辞書データを記憶している第2翻訳データベースDB2、商品情報とインデックス情報とを記憶するための商品データベースDB3、を備える。
第1辞書データとは、本サーバ1が商品情報に含まれる中国語を英語に翻訳する際に用いる情報である。図2(a)は、DB1に記憶されている第1辞書データの例を示す模式図であり、中国語の「玻璃杯」「中国」が、それぞれ、英語の「glass」「China」と関連付けて記憶されていることを示している。すなわち、たとえば、本サーバ1は、DB1を参照して、中国語「玻璃杯」から英語「glass」を読み出す、つまり、中国語「玻璃杯」を英語「glass」に翻訳することができる。
なお、本サーバ1は、DB1を参照することで、「中国語」を「英語」に翻訳するのに加えて、「英語」を「中国語」に翻訳するように構成してもよい。
なお、本サーバ1は、DB1を参照することで、「中国語」を「英語」に翻訳するのに加えて、「英語」を「中国語」に翻訳するように構成してもよい。
第2辞書データとは、本サーバ1が日本語を英語に翻訳する際に用いる情報である。図2(b)は、DB2に記憶されている第2辞書データの例を示す模式図であり、日本語の「コップ」と英語の「glass」「cup」とが関連付けて記憶されていることを示している。
DB1と同様、本サーバ1は、DB2を参照して、日本語「コップ」から英語「glass」「cup」を読み出すのに加えて、英語「glass」または「cup」から日本語「コップ」を読み出すことができるように構成してもよい。
DB1と同様、本サーバ1は、DB2を参照して、日本語「コップ」から英語「glass」「cup」を読み出すのに加えて、英語「glass」または「cup」から日本語「コップ」を読み出すことができるように構成してもよい。
商品情報とは、商品の内容を示す情報である。図3は、DB3に記憶されている商品情報の例を示す模式図である。ここでは、商品情報は、説明文(図中の「Spec.」欄)と画像情報(図中の「Image」欄)とからなり、商品情報はインデックス情報(図中の「Index」欄)と関連付けて記憶されている。
インデックス情報とは、検索キーワードを受信した際に、本サーバ1が商品情報を検索する際に用いる情報である。
なお、図中の「ID」欄に示す情報は、本サーバ1内に記憶されている商品情報ごとに付与された一意の情報であり、たとえば、本サーバ1が、商品情報をDB3に記憶する際に決定(採番など)し、商品情報およびインデックス情報と関連付けてDB3に記憶する。
インデックス情報とは、検索キーワードを受信した際に、本サーバ1が商品情報を検索する際に用いる情報である。
なお、図中の「ID」欄に示す情報は、本サーバ1内に記憶されている商品情報ごとに付与された一意の情報であり、たとえば、本サーバ1が、商品情報をDB3に記憶する際に決定(採番など)し、商品情報およびインデックス情報と関連付けてDB3に記憶する。
商品情報受信部12とは、端末2から商品情報を受信する手段である。
第1翻訳部13とは、DB1を参照して、端末2から受信した商品情報に含まれる中国語を翻訳する手段である。
商品情報登録部14とは、第1翻訳部13により翻訳された中国語をインデックス情報として、端末2から受信した商品情報と関連付けてDB3に記憶する手段である。
検索キーワード受信部15とは、端末3から日本語の検索キーワードを受信する手段である。
第2翻訳部16とは、DB2を参照して、端末3から受信した日本語の検索キーワードを英語に翻訳する手段である。
商品情報検索部17とは、第2翻訳部17により翻訳された英語と関連付けて記憶されている商品情報、すなわち、翻訳された英単語をインデックス情報に含む商品情報を、DB3から読み出して端末3に送信する手段である。
(本方法について)
本方法について説明する。
図4は、本方法の実施の形態を示すシーケンス図である。図中、[1][2][3]は、それぞれ、「第1言語(中国語)」、「第2言語(英語)」、「第3言語(日本語)」を示す。すなわち、たとえば、「商品情報[1]」とは、第1言語で記述された商品情報であることを示している。
本方法について説明する。
図4は、本方法の実施の形態を示すシーケンス図である。図中、[1][2][3]は、それぞれ、「第1言語(中国語)」、「第2言語(英語)」、「第3言語(日本語)」を示す。すなわち、たとえば、「商品情報[1]」とは、第1言語で記述された商品情報であることを示している。
先ず、提供者が、商品情報を端末2に入力する(S1)。
図5は、端末2に表示された商品情報の登録画面の例を示す模式図であり、提供者が画面P1内のフィールドF1に、商品情報を構成する説明文「玻璃杯 7.0cm×8.0cm ・・・」を入力していることを示している。また、商品情報を構成する商品画像として提供者が指定した画像I1が、画面P1内のフィールドF2に表示されていることを示している。フィールドF2に表示されている画像I1は、たとえば、端末2内の記憶装置に記憶されていて、提供者がそのファイル名などを、図示しない端末2のキーボードなどで指定することによりフィールドF2に表示される(入力される)ように構成されている。
フィールドF1とF2に入力(表示)された商品情報は、図示しない図5中に表示された送信ボタンを提供者が選択するなど、提供者の指示により、端末2から本サーバ1に送信されるように構成されている。
図5は、端末2に表示された商品情報の登録画面の例を示す模式図であり、提供者が画面P1内のフィールドF1に、商品情報を構成する説明文「玻璃杯 7.0cm×8.0cm ・・・」を入力していることを示している。また、商品情報を構成する商品画像として提供者が指定した画像I1が、画面P1内のフィールドF2に表示されていることを示している。フィールドF2に表示されている画像I1は、たとえば、端末2内の記憶装置に記憶されていて、提供者がそのファイル名などを、図示しない端末2のキーボードなどで指定することによりフィールドF2に表示される(入力される)ように構成されている。
フィールドF1とF2に入力(表示)された商品情報は、図示しない図5中に表示された送信ボタンを提供者が選択するなど、提供者の指示により、端末2から本サーバ1に送信されるように構成されている。
次に、本サーバ1は、商品情報受信部12を用いて、提供者が入力した商品情報を端末2から受信する(S2)。
次に、本サーバ1は、第1翻訳部13を用いて、受信した商品情報に含まれる中国語の語句を英語に翻訳する(S3)。図5に示した商品情報の例によれば、商品情報には中国語の語句「玻璃杯」「中国」が含まれている。したがって、本サーバ1は、DB1を参照して、「玻璃杯」「中国」のそれぞれに対応する英語の語句「glass」「China」をDB1から読み出す。なお、商品情報に含まれる中国語の語句の特定方法は、たとえば、公知の形態素解析手法を用いて行う。
次に、本サーバ1は、端末2から受信した商品情報と、DB1から読み出した英語の語句「glass」「China」とを関連付けてDB3に記憶する(S4)。すなわち、図3に示すように、DB3には、英語の語句「glass」「China」を「Index」欄に記憶すると共に、端末2から受信した商品情報、つまり、図5に示したフィールドF1とF2に入力された情報を「Spec.」欄と「Image」欄に記憶する。
以上のとおり、商品情報を端末2から受信した本サーバ1は、商品情報に含まれる中国語の単語を英語に翻訳してインデックス情報を生成した上で、商品情報と関連付けてDB3に記憶しておく。
次に、検索者による商品情報の検索について、説明する。
先ず、検索者が日本語の検索キーワードを端末3に入力する(S5)。
図6は、端末3に表示された検索キーワードの入力画面の例を示す模式図であり、検索者が、画面P21のフィールドF21に検索キーワード「コップ」を入力していることを示している。
フィールドF21に入力された検索キーワードは、検索者が画面P21のボタンB21を選択することで、端末3から本サーバ1に送信されるように構成されている。
先ず、検索者が日本語の検索キーワードを端末3に入力する(S5)。
図6は、端末3に表示された検索キーワードの入力画面の例を示す模式図であり、検索者が、画面P21のフィールドF21に検索キーワード「コップ」を入力していることを示している。
フィールドF21に入力された検索キーワードは、検索者が画面P21のボタンB21を選択することで、端末3から本サーバ1に送信されるように構成されている。
次に、本サーバ1は、検索キーワード受信部15を用いて、検索キーワードを端末3から受信する(S6)。
次に、本サーバ1は、第2翻訳部16を用いて、受信した日本語の検索キーワードを英語に翻訳、すなわち、受信した日本語の検索キーワード「コップ」と関連付けてDB2に記憶されている英語の語句「glass」「cup」を、DB2から読み出す(S7)。
次に、本サーバ1は、商品情報検索部17を用いて、DB2から読み出した語句「glass」「cup」と関連付けて記憶されている商品情報とIDとをDB3から読み出す(S8)。すなわち、本サーバ1は、DB3に記憶されている商品情報とIDのうち、「Index」欄に「glass」または「cup」が含まれる商品情報とIDを読み出す。
ここで、本サーバ1は、DB2から読み出した語句が複数の場合、いずれかの語句を検索者に指定させるように構成してもよい。すなわち、DB2から「glass」と「cup」が読み出されたとき、本サーバ1は、「glass」と「cup」のいずれかを選択させるための画面を端末3に表示させる。検索者が語句を選択すると、選択された語句を特定する情報が端末3から本サーバ1に送信され、本サーバ1は、受信した情報により検索者が選択した語句を特定する。本サーバ1は、特定した語句が「Index」欄に含まれる商品情報等をDB3から読み出す。
また、本サーバ1は、DB3から商品情報の全部、つまり、「Spec.」欄の情報と「Image」欄の情報とを読み出すように構成してもよいし、あるいは、商品情報の一部、たとえば、「Image」欄の情報のみを読み出すように構成してもよい。
以下、「Image」欄の情報のみを読み出すように構成されている場合を例に説明する。
以下、「Image」欄の情報のみを読み出すように構成されている場合を例に説明する。
本サーバ1は、読み出した商品情報とIDとを端末3に送信する(S9)。
端末3は、本サーバ1から受信した商品情報を表示する(S10)。図7は、端末3に表示された検索結果の画面例を示す模式図である。画面P22には、商品情報を構成する説明文(図3の「Spec.」欄)と画像(図3の「Image」欄)のうち、画像のみが表示されている。
端末3は、本サーバ1から受信した商品情報を表示する(S10)。図7は、端末3に表示された検索結果の画面例を示す模式図である。画面P22には、商品情報を構成する説明文(図3の「Spec.」欄)と画像(図3の「Image」欄)のうち、画像のみが表示されている。
画面P22は、画面内に表示された画像I1,I2,I3のうち、いずれかが選択される(たとえば、端末3のマウスでクリックされる)と、その画像に対応するID(画像と関連付けてDB3に記憶されていて、画像と共に本サーバ1から端末3に送信されたID)が、端末3から本サーバ1に送信されるように構成されている。すなわち、たとえば、図7の画像I1が選択されると、端末3から本サーバ1にID「G01」が送信される。
本サーバ1は、端末3から受信したIDと関連付けて記憶されている説明文(「Spec.」欄)をDB3から読み出して端末3に送信する。図8は、端末3に表示された商品の説明文の例を示す模式図であり、ここでは、説明文が画像I1と共に表示されていることを示している。画面P23に表示されている画像I1は、たとえば、端末3からIDを受信した本サーバ1が、説明文と併せてDB3から読み出して端末3に送信する。
本サーバ1は、端末3から受信したIDと関連付けて記憶されている説明文(「Spec.」欄)をDB3から読み出して端末3に送信する。図8は、端末3に表示された商品の説明文の例を示す模式図であり、ここでは、説明文が画像I1と共に表示されていることを示している。画面P23に表示されている画像I1は、たとえば、端末3からIDを受信した本サーバ1が、説明文と併せてDB3から読み出して端末3に送信する。
画面P23は、検索者が画面P23内のボタンB23を選択したとき、画面P23に表示されている画像に対応するIDが本サーバ1に送信されるように構成されている。本サーバ1は、図示しない手段を用いて、画面P23に表示された商品情報を日本語に翻訳し、その結果を端末3に表示する。すなわち、たとえば、ボタンB23が選択されてID「G01」を端末3から受信した本サーバ1は、ID「G01」と関連付けて記憶されている商品情報をDB3から読み出し、DB1を参照して、読み出した商品情報に含まれる中国語「玻璃杯」を英語「glass」に翻訳し、さらに、DB2を参照して、英語「glass」を日本語「コップ」に翻訳する。その上で、本サーバ1は、DB3から読み出した商品情報内の「玻璃杯」を「コップ」に置換し、置換後の商品情報を端末3に送信する。
この構成により、検索者は、検索キーワードの言語とは異なる言語の商品情報を検索結果として取得したときに、取得した検索結果を検索キーワードの言語に翻訳して閲覧することができる。
この構成により、検索者は、検索キーワードの言語とは異なる言語の商品情報を検索結果として取得したときに、取得した検索結果を検索キーワードの言語に翻訳して閲覧することができる。
なお、画面P23に表示された商品情報を翻訳する際に、翻訳する言語を検索者が選択できるように構成しておいてもよい。すなわち、たとえば、画面P23内のボタンB23が選択された旨を受信した本サーバ1が、翻訳する言語を検索者に選択させるための画面(たとえば、複数の言語のリストを表示し、その中から1の言語を選択できるように構成された画面)を生成して端末3に送信する。検索者が言語を選択すると、選択された言語を特定する情報が端末3から本サーバ1に送信され、本サーバ1は、画面P23に表示されていた商品情報を、検索者が選択した言語に翻訳して端末3に送信する。
この場合、本サーバ1内には、「検索者が選択可能な言語」と「英語」との間の別の辞書データが必要となる。つまり、本サーバ1は、DB1を用いて「中国語」から「英語」に翻訳した上で、前述の別の辞書データを用いて「英語」から「検索者が選択した言語」に翻訳する。
この場合、本サーバ1内には、「検索者が選択可能な言語」と「英語」との間の別の辞書データが必要となる。つまり、本サーバ1は、DB1を用いて「中国語」から「英語」に翻訳した上で、前述の別の辞書データを用いて「英語」から「検索者が選択した言語」に翻訳する。
また、本サーバ1がDB3から読み出した商品情報を翻訳するのは、検索者が指示したとき(画面P23のボタンB23が選択されたとき)に限らない。すなわち、たとえば、図4の処理S8で商品情報を検索した後に、処理S9,S10に代えて、検索した商品情報を翻訳した上で、提供者の端末に送信する。この場合、検索者は、日本語の検索キーワードを用いて、中国語で記述された商品情報を検索することができ、しかも、日本語に翻訳された商品情報を取得することができる。
以上説明した実施の形態によれば、端末2から受信した商品情報に含まれる中国語の語句を英語に翻訳し、これをインデックス情報として受信した商品情報と関連付けて記憶しておき、端末3から日本語の検索キーワードを受信した際に、この検索キーワードを英語に翻訳し、翻訳した語句をインデックス情報に含む商品情報を検索結果として端末3に送信することができる。すなわち、検索の対象となる商品情報に含まれる語句と検索キーワードとを共通の言語に翻訳して商品情報の検索に用いることで、検索キーワードの言語とは異なる言語の商品情報を検索することができる。
このように、検索対象となる情報と検索キーワードとを共通の言語に翻訳して情報の検索に用いることで、たとえ、検索対象となる情報の言語の種類が多くても、検索時の検索キーワードの翻訳は共通の言語のみで足りる。すなわち、たとえば、中国語、韓国語、ドイツ語のそれぞれの商品情報(各商品情報の提供者の異同は不問)を日本語の検索キーワードで検索する場合、商品情報の登録時に各言語から英語に翻訳されたインデックス情報が生成され、検索時には日本語の検索キーワードを中国語、韓国語、ドイツ語のそれぞれに翻訳することなく、英語にのみ翻訳することで、各言語の商品情報を検索することができる。したがって、たとえ検索対象となる情報の言語の種類が多くても、検索時の検索キーワードの翻訳処理の負担はなく、検索処理の高速化を実現することができる。
なお、以上説明した実施の形態は、商品情報を検索する場合を例に説明したが、本発明が適用可能な検索対象の情報の種類は商品等情報(商品又は役務に関する情報)に限らず、情報処理装置による検索可能な電子情報であればよく、たとえば、特許文献や論文などであってもよい。
(第2の実施の形態)
次に、本発明の別の実施の形態について、先に説明した実施の形態と異なる部分を中心に説明する。
先に説明した実施の形態は、商品情報に含まれる語句から、この商品情報を検索する際に用いるインデックス情報を生成するものであったが、本実施の形態では、商品情報とは別の情報から、この商品情報を検索する際に用いるインデックス情報を生成するものである。
次に、本発明の別の実施の形態について、先に説明した実施の形態と異なる部分を中心に説明する。
先に説明した実施の形態は、商品情報に含まれる語句から、この商品情報を検索する際に用いるインデックス情報を生成するものであったが、本実施の形態では、商品情報とは別の情報から、この商品情報を検索する際に用いるインデックス情報を生成するものである。
図9は、本実施の形態における本サーバのブロック図であり、本サーバ101が備える手段のうち、図1に示したサーバ1が備える手段と共通する手段には同一の符号を付してある。
提供者の端末102は、図1に示した端末2と同様に商品情報を本サーバ101に送信するのに加えて、インデックス情報(原語)を本サーバ101に送信する構成を備えている。一方、検索者の端末103は、図1に示した端末3と同様の構成を備えている。
提供者の端末102は、図1に示した端末2と同様に商品情報を本サーバ101に送信するのに加えて、インデックス情報(原語)を本サーバ101に送信する構成を備えている。一方、検索者の端末103は、図1に示した端末3と同様の構成を備えている。
図10は、本実施の形態における本方法の例を示すシーケンス図であり、図4に示した先の実施の形態と異なる部分について記載してある。
先ず、提供者は、商品情報と共にインデックス情報(原語)を端末102に入力する(T1)。図11は、商品情報とインデックス情報(原語)の入力画面の例を示す模式図であり、フィールドF101にインデックス情報(原語)が、フィールドF102とF103に商品情報を構成する説明文と商品画像が入力(指定)されていることを示している。
本サーバ101は、インデックス情報受信部118を用いて、端末102に入力されたインデックス情報(原語)を端末102から受信し(T2)、第1翻訳部113を用いてインデックス情報(原語)を中国語から英語に翻訳、つまり、中国語のインデックス情報と関連付けて記憶されている英語の語句をDB1から読み出す(T3)。
次に、本サーバ101は、商品情報登録部114を用いて、端末102から受信した商品情報と、第1翻訳部113で翻訳したインデックス情報とを関連付けてDB103に記憶する(T4)。
図12は、DB103に記憶された商品情報とインデックス情報の例を示す模式図であり、端末102から受信した商品情報、つまり、図11の画面P101のフィールドF102とF103に入力された情報と、F101に入力された中国語「玻璃杯」を英訳した「glass」とが関連付けて記憶されていることを示している。
図12は、DB103に記憶された商品情報とインデックス情報の例を示す模式図であり、端末102から受信した商品情報、つまり、図11の画面P101のフィールドF102とF103に入力された情報と、F101に入力された中国語「玻璃杯」を英訳した「glass」とが関連付けて記憶されていることを示している。
その後、本サーバ101は、検索者が端末103に入力した日本語の検索キーワードを受信すると、先に説明した実施の形態と同様、検索キーワードを英語に翻訳した上で、DB103内の商品情報を検索し、検索結果を端末103に送信する。
以上説明した実施の形態によれば、先に説明した実施の形態と異なり、商品情報を検索する際に用いられるインデックス情報は、商品情報の提供者自身が指定することができる。したがって、提供者は、商品情報には含まれない語句であっても、商品情報のインデックス情報として、本サーバに登録しておくことができる。
(第3の実施の形態)
次に、本発明のさらに別の実施の形態について、先に説明した実施の形態と異なる部分を中心に説明する。
これまで説明した実施の形態では、検索対象の情報は、商品情報そのものであったが、本実施の形態において検索対象の情報は、商品情報が掲載されたWebページを特定するURLである。
次に、本発明のさらに別の実施の形態について、先に説明した実施の形態と異なる部分を中心に説明する。
これまで説明した実施の形態では、検索対象の情報は、商品情報そのものであったが、本実施の形態において検索対象の情報は、商品情報が掲載されたWebページを特定するURLである。
図13は、本実施の形態における本サーバのブロック図であり、本サーバ201が備える手段のうち、図1に示したサーバ1が備える手段と共通する手段には同一の符号を付してある。
提供者の端末202は、Webページを送信可能に構成され、また、このWebページのURLを本サーバに送信するように構成されている。
一方、検索者の端末203は、検索キーワードを本サーバに送信する構成に加えて、本サーバから検索結果としてURLを受信し、このURLに対応するWebページを受信するように構成されている。
提供者の端末202は、Webページを送信可能に構成され、また、このWebページのURLを本サーバに送信するように構成されている。
一方、検索者の端末203は、検索キーワードを本サーバに送信する構成に加えて、本サーバから検索結果としてURLを受信し、このURLに対応するWebページを受信するように構成されている。
なお、図13には、本サーバ201と端末203が、URLに対応するWebページを端末202から受信する構成が示してあるが、Webページは、端末202とは別のWebサーバから受信するように構成してもよい。
図14は、本実施の形態における本方法の例を示すシーケンス図である。
先ず、提供者は、商品情報が掲載されたWebページのURLを端末202に入力する(U1)。
図15は、商品情報が掲載されたWebページの例を示す模式図である。また、図16はWebページP201のURLの入力画面の例を示す模式図であり、URL「www.glass-shop.cn」が入力されていることを示している。
図15は、商品情報が掲載されたWebページの例を示す模式図である。また、図16はWebページP201のURLの入力画面の例を示す模式図であり、URL「www.glass-shop.cn」が入力されていることを示している。
本サーバ201は、URL受信部212を用いて、端末202に入力されたURLを端末202から受信し(U2)、Webページ受信部218を用いて、このURLに対応するWebページP201を端末202に要求し(U3)、受信する(U4)。本サーバ201は、このWebページの要求・受信を、公知のHTTP(Hyper Text Transfer Protocol)の「get」コマンドなどを用いて行う。
次に、本サーバ201は、第1翻訳部213を用いて、端末202から受信したWebページP201を英語に翻訳する(U5)。すなわち、本サーバ201は、WebページP201を参照し、このWebページP201に含まれる中国語の語句を特定した上で、この特定した中国語の語句と関連付けて記憶されている英語の語句をDB1から読み出す。なお、WebページP201に含まれる中国語の語句の特定方法は、WebページP201に記述されている文字列を読み出し、たとえば、公知の形態素解析手法を用いて行う。
次に、本サーバ201は、URL登録部214を用いて、第1翻訳部213がDB1から読み出した英語の単語をインデックス情報とした上で、URL受信部212が端末202から受信したURLと共にDB203に記憶する(U6)。図17は、DB203に記憶されているURLとインデックス情報の例を示す模式図であり、端末202から受信したURL「www.glass-shop.cn」(「URL」欄)とDB1から読み出された英語の単語「glass」「China」(「Index」欄)とが関連付けて記憶されていることを示している。
次に、図4の処理S5〜S7と同様に、本サーバ201は、検索キーワード受信部15を用いて、検索者が端末203に入力した日本語の検索キーワードを受信し、第2翻訳部16を用いて、受信した検索キーワードを英語に翻訳する(U7〜U9)。
次に、本サーバ201は、URL検索部217を用いて、第2翻訳部16で翻訳した、すなわち、DB2から読み出した英語の語句を「Index」欄に含むURLをDB203から読み出し(U10)、読み出したURLを端末203に送信する(U11)。
検索者は、本サーバ201から受信したURLに対応するWebページを端末202に要求する(U12)。Webサーバとして動作している端末202は、端末203からの要求を受信すると、受信したURLに対応するWebページP201を端末203に送信し、端末203にはWebページP201が表示される(U13)。このWebページの要求・受信は、公知のHTTPなどにより実現される。
以上説明した実施の形態によれば、提供者が指定したURLを、このURLに対応するWebページに含まれる言語とは異なる言語で検索する、つまり、Webページを、このWebページに含まれる言語とは異なる言語で検索することができる。
なお、以上説明した実施の形態は、本サーバが提供者の端末からURLを受信し、このURLに対応するWebページを受信してインデックス情報を生成するものであった。これに代えて、本サーバは、提供者の端末からURLを受信することなく、たとえば、公知のいわゆるロボット型検索機能を備えるように構成してもよい。すなわち、本サーバが、自ら通信ネットワーク上に存在するWebページにアクセスし、その内容を解析してインデックス情報を生成した上で、アクセスしたWebページのURLと関連付けて記憶しておく。この構成によれば、提供者は通信ネットワーク上にWebページを公開するだけで、本サーバによる検索対象に含まれ、しかも、これまで説明したように、公開したWebページの言語とは異なる言語による検索の対象とすることができる。
1 情報検索装置
2 端末(情報の提供者)
3 端末(情報の検索者)
DB1 第1翻訳データベース
DB2 第2翻訳データベース
DB3 商品データベース
2 端末(情報の提供者)
3 端末(情報の検索者)
DB1 第1翻訳データベース
DB2 第2翻訳データベース
DB3 商品データベース
Claims (8)
- 提供者の端末と検索者の端末のそれぞれと通信ネットワークを介して接続し、
検索対象の情報を記憶するための情報データベースと、
第1言語の語句と第2言語の語句とを関連付けて記憶している第1翻訳データベースと、
第2言語の語句と第3言語の語句とを関連付けて記憶している第2翻訳データベースと、
第1言語の語句を含む情報を上記提供者の端末から受信する手段と、
上記提供者の端末から受信した情報に含まれる第1言語の語句と関連付けて記憶されている第2言語の語句を上記第1翻訳データベースから読み出す手段と、
上記提供者の端末から受信した情報と上記読み出した第2言語の語句とを関連付けて上記情報データベースに記憶する手段と、
第3言語の検索キーワードを上記検索者の端末から受信する手段と、
上記受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句を上記第2翻訳データベースから読み出す手段と、
上記第2翻訳データベースから読み出された第2言語の語句と関連付けて記憶されている情報を上記情報データベースから読み出す検索手段と、
上記読み出された情報を上記検索者の端末に送信する手段と、
を有してなることを特徴とする情報検索装置。 - 検索手段は、
検索者の端末から受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句が第2翻訳データベースから複数読み出されたとき、
上記読み出された複数の第2言語の語句を上記検索者の端末に送信し、
上記送信した複数の第2言語の語句のうち検索者が選択した第2言語の語句を上記検索者の端末から受信し、
この受信した第2言語の語句と関連付けて記憶されている情報を情報データベースから読み出す、
請求項1記載の情報検索装置。 - 情報データベースから読み出された情報に含まれる第1言語の語句と関連付けて記憶されている第2言語の語句を、第1翻訳データベースから読み出し、
上記読み出した第2言語の語句と関連付けて記憶されている第3言語の語句を、第2翻訳データベースから読み出し、
上記情報データベースから読み出された情報に含まれる第1言語の語句を、上記読み出した第3言語の語句で置換した上で、置換後の情報を検索者の端末に送信する手段、
をさらに備えた、請求項1記載の情報検索装置。 - Webサーバと検索者の端末のそれぞれと通信ネットワークを介して接続し、
URLを記憶するためのURLデータベースと、
第1言語の語句と第2言語の語句とを関連付けて記憶している第1翻訳データベースと、
第2言語の語句と第3言語の語句とを関連付けて記憶している第2翻訳データベースと、
Webページを上記Webサーバから受信し、このWebページに含まれる第1言語の語句と関連付けて記憶されている第2言語の語句を上記第1翻訳データベースから読み出す手段と、
上記受信したWebページのURLと上記読み出した第2言語の語句とを関連付けて上記URLデータベースに記憶する手段と、
第3言語の検索キーワードを上記検索者の端末から受信する手段と、
上記受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句を上記第2翻訳データベースから読み出す手段と、
上記第2翻訳データベースから読み出された第2言語の語句と関連付けて記憶されているURLを上記URLデータベースから読み出す検索手段と、
上記読み出されたURLを上記検索者の端末に送信する手段と、
を有してなることを特徴とする情報検索装置。 - 提供者の端末と検索者の端末とWebサーバのそれぞれと通信ネットワークを介して接続し、
URLを記憶するためのURLデータベースと、
第1言語の語句と第2言語の語句とを関連付けて記憶している第1翻訳データベースと、
第2言語の語句と第3言語の語句とを関連付けて記憶している第2翻訳データベースと、
URLを上記検索者の端末から受信し、このURLに対応するWebページを上記Webサーバから受信する手段と、
上記受信したWebページに含まれる第1言語の語句と関連付けて記憶されている第2言語の語句を上記第1翻訳データベースから読み出す手段と、
上記提供者の端末から受信したURLと上記読み出した第2言語の語句とを関連付けて上記URLデータベースに記憶する手段と、
第3言語の検索キーワードを上記検索者の端末から受信する手段と、
上記受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句を上記第2翻訳データベースから読み出す手段と、
上記第2翻訳データベースから読み出された第2言語の語句と関連付けて記憶されているURLを上記URLデータベースから読み出す検索手段と、
上記読み出されたURLを上記検索者の端末に送信する手段と、
を有してなることを特徴とする情報検索装置。 - 検索手段は、
検索者の端末から受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句が第2翻訳データベースから複数読み出されたとき、
上記読み出された複数の第2言語の語句を上記検索者の端末に送信し、
上記送信した複数の第2言語の語句のうち検索者が選択した第2言語の語句を上記検索者の端末から受信し、
この受信した第2言語の語句と関連付けて記憶されているURLをURLデータベースから読み出す、
請求項4または5記載の情報検索装置。 - コンピュータを、請求項1乃至6のいずれかに記載の情報検索装置として機能させることを特徴とする情報検索プログラム。
- 提供者の端末と検索者の端末のそれぞれと通信ネットワークを介して接続し、
検索対象の情報を記憶するための情報データベースと、
第1言語の語句と第2言語の語句とを関連付けて記憶している第1翻訳データベースと、
第2言語の語句と第3言語の語句とを関連付けて記憶している第2翻訳データベースと、
を備えたコンピュータにより実行される方法であって、
上記コンピュータが、
第1言語の語句を含む情報を上記提供者の端末から受信するステップと、
上記提供者の端末から受信した情報に含まれる第1言語の語句と関連付けて記憶されている第2言語の語句を上記第1翻訳データベースから読み出すステップと、
上記提供者の端末から受信した情報と上記読み出した第2言語の語句とを関連付けて上記情報データベースに記憶するステップと、
第3言語の検索キーワードを上記検索者の端末から受信するステップと、
上記受信した第3言語の検索キーワードと関連付けて記憶されている第2言語の語句を上記第2翻訳データベースから読み出すステップと、
上記第2翻訳データベースから読み出された第2言語の語句と関連付けて記憶されている情報を上記情報データベースから読み出すステップと、
上記読み出された情報を上記検索者の端末に送信するステップと、
を有してなることを特徴とする情報検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006261692A JP2008083878A (ja) | 2006-09-27 | 2006-09-27 | 情報検索装置と検索方法並びに検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006261692A JP2008083878A (ja) | 2006-09-27 | 2006-09-27 | 情報検索装置と検索方法並びに検索プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008083878A true JP2008083878A (ja) | 2008-04-10 |
Family
ID=39354719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006261692A Withdrawn JP2008083878A (ja) | 2006-09-27 | 2006-09-27 | 情報検索装置と検索方法並びに検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008083878A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383892A (zh) * | 2016-09-23 | 2017-02-08 | 广东风信子网络科技有限公司 | 一种跨境商品信息自助查询器及方法 |
CN110235125A (zh) * | 2017-02-01 | 2019-09-13 | 美国联合包裹服务公司 | 包含多语言编码数据的可索引数据库简档和用于生成其的方法 |
US10846487B2 (en) | 2018-01-26 | 2020-11-24 | Samsung Electronics Co., Ltd. | Machine translation method and apparatus |
-
2006
- 2006-09-27 JP JP2006261692A patent/JP2008083878A/ja not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383892A (zh) * | 2016-09-23 | 2017-02-08 | 广东风信子网络科技有限公司 | 一种跨境商品信息自助查询器及方法 |
CN110235125A (zh) * | 2017-02-01 | 2019-09-13 | 美国联合包裹服务公司 | 包含多语言编码数据的可索引数据库简档和用于生成其的方法 |
US11449495B2 (en) | 2017-02-01 | 2022-09-20 | United Parcel Service Of America, Inc. | Indexable database profiles comprising multi-language encoding data and methods for generating the same |
CN110235125B (zh) * | 2017-02-01 | 2023-08-11 | 美国联合包裹服务公司 | 包含多语言编码数据的可索引数据库简档及其生成方法 |
US10846487B2 (en) | 2018-01-26 | 2020-11-24 | Samsung Electronics Co., Ltd. | Machine translation method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2007202639B2 (en) | Method and apparatus for converting a document universal resource locator to a standard document identifier | |
US20140032522A1 (en) | Systems and methods for contextual searching of semantic entities | |
US20100205199A1 (en) | Intent driven search result rich abstracts | |
CN1408093A (zh) | 一种能够运行在不同格式的厂商站点上的电子购物代理 | |
CN101019119A (zh) | 基于名称的url输入 | |
CN103430177A (zh) | 用于提供内容提供者指定的url关键字导航的方法及系统 | |
AU2007215296B2 (en) | Organizing digitized content on the internet through digitized content reviews | |
CN101866342A (zh) | 生成或显示网页标注的方法和装置以及信息共享系统 | |
JPH11345201A (ja) | 情報提供システム及び情報提供ネットワークシステム | |
JP2009140170A (ja) | 情報提供方法および情報提供サーバ | |
WO2012176507A1 (ja) | 情報提供装置、情報提供方法、情報提供プログラム、情報表示プログラム、及び情報提供プログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP2007279864A (ja) | 情報提供システムおよび方法ならびにプログラム、電子商取引システムおよび方法ならびにプログラム | |
JP2007072596A (ja) | 情報共有システムおよび情報共有方法 | |
JP2013008208A (ja) | 情報提供装置、情報提供方法、情報提供プログラム、情報表示プログラム、及び情報提供プログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP2008083878A (ja) | 情報検索装置と検索方法並びに検索プログラム | |
JPH10187752A (ja) | 言語間情報検索支援システム | |
JP2007128367A (ja) | 情報検索ノウハウ管理システム | |
WO2016079849A1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP3647967B2 (ja) | 画面遷移システム | |
JP4505389B2 (ja) | 広告コンテンツ送信システム、広告コンテンツ送信方法 | |
JP2013008207A (ja) | 情報提供装置、情報提供方法、情報提供プログラム、情報表示プログラム、及び情報提供プログラムを記憶するコンピュータ読取可能な記録媒体 | |
US20080114786A1 (en) | Breaking documents | |
JP5155130B2 (ja) | カテゴリ提示装置 | |
KR20040048199A (ko) | 검색 결과와 상응하는 상세 정보를 이용한 웹 화면 변경방법 및 시스템 | |
JP4998558B2 (ja) | リンク作成プログラム、リンク作成装置及びリンク作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20091201 |