JP2004272492A - Webサイトの検索表示方法 - Google Patents
Webサイトの検索表示方法 Download PDFInfo
- Publication number
- JP2004272492A JP2004272492A JP2003060858A JP2003060858A JP2004272492A JP 2004272492 A JP2004272492 A JP 2004272492A JP 2003060858 A JP2003060858 A JP 2003060858A JP 2003060858 A JP2003060858 A JP 2003060858A JP 2004272492 A JP2004272492 A JP 2004272492A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- search
- web site
- weighting
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】インターネット上に多々存在するWEBサイトを検索して順位を付けて表示する際に、URLの順位化の精度を上げ、利用者が欲するWWWページのURL情報を困難なく取得できるようにすることを目的とする。
【解決手段】検索結果の順位化の過程において、文章容量(大きいもの)や日付(新しいもの)等の情報を単独評価するのではなく、複数の順位化要素に重み付けパラメータを設定することでURL情報の総合評価を行い、これにより検索キーワードに対するURL情報の表示順を決定する。重み付けパラメータは進化アルゴリズム(遺伝的アルゴリズム)を用いることで最適化し、検索を繰り返すたびにパラメータの精度が向上し、利用者の意図を忠実に反映したチューニングが可能となるようにする。
【選択図】 図1
【解決手段】検索結果の順位化の過程において、文章容量(大きいもの)や日付(新しいもの)等の情報を単独評価するのではなく、複数の順位化要素に重み付けパラメータを設定することでURL情報の総合評価を行い、これにより検索キーワードに対するURL情報の表示順を決定する。重み付けパラメータは進化アルゴリズム(遺伝的アルゴリズム)を用いることで最適化し、検索を繰り返すたびにパラメータの精度が向上し、利用者の意図を忠実に反映したチューニングが可能となるようにする。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、インターネット上に多々存在するWEBサイトを検索して表示する技術に関する。
【0002】
【従来の技術】
急速に膨張しているインターネットのWWWページの中から、適切なURLを探し出すことは非常に困難である。そのため、インターネットからWWWページを探し出すためのサービスとして、検索エンジン(サーチエンジン)が利用されている。検索エンジンでは、検索ロボットと呼ばれるWWWページ収集のためのプログラムが実行され、自動的にWWWページのハイパーリンクをたどりながらページの内容を保存する処理を実行している。そして、リンク構造や集められたページの内容を分析し、キーワードとそのページの場所(URL)との対応表を作成する。実際に利用者がWWWページを探すために検索用のキーワードを入力したとき、検索エンジンでは、内部に保存してある対応表を高速に検索して求められているページを提示する。これらの検索結果は、文章容量(大きいもの)や日付(新しいもの)等の情報を、単独評価することで順位化して表示するといったものである。
【0003】
また特許文献1には、自然文で与えられた検索条件を分断したキーワードで検索し、検索結果として得られたメタデータ(ページタイトルなど)から、与えられた自然文との類似度を演算し、類似度の高い順に並び替えて表示する技術が開示されている。非特許文献1には、各種の問題解決に生物の遺伝的メカニズムを適用する遺伝的アルゴリズムについて記載されている。
【0004】
【特許文献1】特開2001−52014
【0005】
【非特許文献1】「遺伝的アルゴリズムの基礎」(伊庭斉志著)オーム社
【0006】
【発明が解決しようとする課題】
以上のように、従来は単に文章容量や日付などの一種類の情報に基づいて順位付けしたURL情報を表示するだけであった。したがって、表示されたURLの順位は、必ずしも利用者が欲するURL順位とはなっていないことが多い。そのため、利用者は、何十、何百というURLを順次調べ、求めようとしているWWWページであるかを調べる必要があった。
【0007】
上記特許文献1に記載の技術では、自然文を用いて検索することができるが、検索結果が利用者の視点から好ましいものであるとは限らず、やはり利用者は検索された各URLのWEBサイトを調べなければならない場合があった。
【0008】
本発明は、URLの順位化の精度を上げ、利用者が欲するWWWページのURL情報を困難なく取得できるようにすることを目的とする。
【0009】
【課題を解決するための手段】
上記目的を達成するために、本発明は、検索結果の順位化の過程において、文章容量(大きいもの)や日付(新しいもの)等の情報を単独評価するのではなく、複数の順位化要素に重み付けパラメータを設定することでURL情報の総合評価を行い、これにより検索キーワードに対するURL情報の表示順を決定することを特徴とする。また、重み付けパラメータは進化アルゴリズム(遺伝的アルゴリズム)を用いることで最適化し、検索を繰り返すたびにパラメータの精度が向上し、利用者の意図を忠実に反映したチューニングが可能となるようにする。
【0010】
すなわち、請求項1に係る発明は、端末装置からの要求に応じてWEBサイトを検索し、検索結果を端末装置に返すWEBサイトの検索表示方法であって、与えられた検索キーワードに基づいて検索された各WEBサイトの表示順位を、順位化に用いる各要素に重み付けパラメータを設定することで、表示順序の精度向上を図ることを特徴とする。
【0011】
請求項2に係る発明は、端末装置からの要求に応じてWEBサイトを検索し、検索結果を端末装置に返すWEBサイトの検索表示方法であって、与えられた検索キーワードに基づいてWEBサイトを検索するステップと、検索されたWEBサイトに関する付加情報を取得するステップと、パラメータテーブルに格納されている重み付けパラメータ群を任意に選択するステップと、検索されたWEBサイトごとに、前記付加情報に基づいて決定したランク値を前記選択した重み付けパラメータ群に基づいて重み付けし、該重み付けした結果である総合ランク値を求めるステップと、求めた総合ランク値に基づいて、検索されたWEBサイトを順位付けするステップとを備えたことを特徴とする。
【0012】
請求項3に係る発明は、請求項2に記載のWEBサイトの検索表示方法において、前記パラメータテーブルに格納されている重み付けパラメータ群に対して遺伝的アルゴリズムを適用し、得られた重み付けパラメータ群を前記パラメータテーブルに追加または置き換えするステップをさらに備えたことを特徴とする。
【0013】
請求項4に係る発明は、請求項3に記載のWEBサイトの検索表示方法において、前記WEBサイトの順位付けに対して利用者が入力した評価値を蓄積するステップと、前記パラメータ群ごとに前記評価値の平均を求め、該評価値の平均に基づいて前記パラメータテーブルに格納されている重み付けパラメータ群を並び換えるステップと、並び換えた前記パラメータテーブルに格納されている重み付けパラメータ群に対して遺伝的アルゴリズムを適用し、得られた重み付けパラメータ群を前記パラメータテーブルに追加または置き換えするステップとをさらに備えたことを特徴とする。
【0014】
【発明の実施の形態】
以下、本発明を実施する場合の一形態を図面を参照して具体的に説明する。
【0015】
図1は、本発明に係るWEBサイトの検索表示方法を実施する一形態であるシステムの概略構成を示すブロック図である。インターネット2に、インターネット接続端末装置1、URL情報取得サーバ3、及びパラメータ評価サーバ4が接続されている。インターネット接続端末装置1は、利用者が検索キーワードを入力してWEB検索を行ったり、検索性能を評価するための端末装置である。ここでは検索キーワードを入力して検索を指示する端末装置と検索性能を評価するときの端末装置を別々に図示したが、もちろん1台の端末装置でよい。通常は、検索を指示しその検索結果を参照した利用者が、その場ですぐにその検索結果についての評価値を入力する。URL情報取得サーバ3は、インターネット接続端末装置1から入力された検索キーワードに応じたURL情報を提供するサーバである。パラメータ評価サーバ4は、インターネット接続端末装置1からの指示を受けて検索性能評価を行う。データベースサーバ6は、URL情報やパラメータ情報などの各種の情報を蓄積する。チューニングサーバ5は、データベースサーバ6のパラメータ情報をチューニングするためサーバである。
【0016】
URL情報取得サーバ3は、対象URL取得処理311、付加情報取得処理312、パラメータ取得処理313、対象URL順位化処理314、及びURL情報出力処理315を有している。対象URL取得処理311は、検索対象となるURL情報を取得するときに使用する。付加情報取得処理312は、対象サイトの付加情報(URL最新更新日、ページ全体容量、ページ内キーワード出現回数等)を取得するときに使用する。パラメータ取得処理313は、付加情報に重み付けを行うパラメータ(重み付けパラメータ)を取得するときに使用する。対象URL順位化処理314は、付加情報の重み付けにより順位化を行うときに使用する。URL情報出力処理315は、順位化されたURL情報を出力するときに使用する。
【0017】
パラメータ評価サーバ4は、評価情報取得処理411、及び評価履歴出力処理412を有している。評価情報取得処理411は、インターネット接続端末装置1から入力された、検索性能の評価情報を取得するときに使用する。評価履歴出力処理412は、取得した評価情報をデータベースサーバ6に出力するときに使用する。
【0018】
チューニングサーバ5は、評価履歴反映処理511、パラメータ取得処理512、遺伝的アルゴリズム適用処理513、及びパラメータ格納処理514を有している。評価履歴反映処理511は、重み付けパラメータの評価値履歴を重み付けパラメータの評価値に反映するときに使用する。パラメータ取得処理512は、全ての重み付けパラメータ情報(パラメータ群を一意に識別する群ID、対象パラメータの評価値、付加情報に重み付けを行う各パラメータ値)を取得するときに使用する。遺伝的アルゴリズム適用処理513は、取得した各パラメータ値をチューニングするときに使用する。パラメータ格納処理514は、チューニングされた各パラメータ値を格納するときに使用する。
【0019】
データベースサーバ6は、蓄積テーブル61、パラメータ評価履歴テーブル62、及びパラメータテーブル63を有している。蓄積テーブル61は、検索キーワードに合致するURL情報、及び、付加情報(URL更新日、ページ容量、キーワード出現回数等)を管理するためのテーブルである。蓄積テーブル61のこれらの情報は、図1では不図示の検索ロボットが収集して格納するものである。すなわち、検索ロボットはインターネット上から種々の検索キーワードとそれに対応するURL情報とページの付加情報を収集して蓄積テーブルに格納する。したがって、端末装置1からURL情報取得サーバ3に検索キーワードが与えられたとき、URL情報取得サーバ3は、その検索キーワードを蓄積テーブル61から探し出すだけで、その検索キーワードに対応するURL情報などを得ることができる。パラメータ評価履歴テーブル62は、インターネット接続端末1から利用者により入力された評価値(表示された検索結果の各サイトの表示順序に対して、その利用者が評価した評価値)を格納するテーブルである。パラメータテーブル63は、付加情報の重み付けパラメータとその評価値を管理するためのテーブルである。
【0020】
図6に、蓄積テーブル61、パラメータ評価履歴テーブル62、パラメータテーブル63のテーブルレイアウトを示す。
【0021】
蓄積テーブル61には、検索キーワード611、対象URL612、ページタイトル613、URL更新日614、ページ容量615、キーワード出現回数616等の情報を格納する。検索キーワード611には、検索ロボットにより収集した検索キーワードを格納する。対象URLは、そのキーワードに合致するURL情報を格納する。ページタイトルは、対象URLのページのタイトルを格納する。URL更新日614以降の項目には、収集されたページの付加情報を格納する。
【0022】
パラメータ評価履歴テーブル62には、パラメータ群ID621と、そのパラメータ群IDのパラメータ群を利用したURLの順位付けに対して、利用者が入力した評価値622とを、対応させて格納する。
【0023】
パラメータテーブル63の633、634、635、…の項目には、検索されたURLの順位付けを行う際の重み付けに利用するパラメータ値を格納する。これらのパラメータ値の組み合わせ(テーブル63の1行分)には、その組み合わせを特定するパラメータ群ID631が付けられている。評価値632には、対応するパラメータ群IDのパラメータ群を利用した順位付けに対して利用者が評価した評価値の平均値を格納する。なお、蓄積テーブル61中の番号614以降に示した付加情報と、パラメータテーブル63中の番号633以降に示したパラメータ値1,2,…とは、順に対応している(矢印で対応関係を図示した)。
【0024】
次に、サイト検索と検索性能評価における、インターネット接続端末装置1の画面イメージを説明する。図2は、インターネット接続端末装置1で表示される画面であり、検索キーワードを入力してURL一覧が表示される際の画面遷移イメージ、及び検索性能評価を入力して登録結果が表示される際の画面遷移イメージの画面例である。
【0025】
まず、画面71は、サイト検索を行う際に利用者が検索キーワードを入力する画面例である。711は検索キーワードの入力領域、712は検索の実行を指示する検索ボタンである。ここでは検索キーワードとして「インターネット」と入力し、検索ボタン712を押下したとする。画面72は、入力された検索キーワードをもとに取得されたURL情報を表示する画面例である。検索結果表示領域713に、検索キーワードをもとに取得されたURL情報が表示される。これらのURL情報は、後述する手順で順位付けが為されているものである。
【0026】
画面73は、検索性能評価時に利用者が評価値を入力する画面例を示す。利用者は、画面72の検索結果画面を参照し、そのURL情報の順位付けに対する評価値をリストボックス731により選択する。ここでは5段階とし、数値が大きいほど評価が高いことを示すものとする。リストボックス731で評価値を選択した後、送信ボタン732を押下することにより、端末装置1から当該入力した評価値がパラメータ評価サーバ4に送信される。画面74は、評価値のパラメータ評価サーバ4への登録が完了したことを示す画面である。なお、画面71または72が表示されるとき同時に別ウインドウで画面73を表示し、検索結果が表示されたとき利用者がすぐに評価値を入力できるようにしておくとよい。
【0027】
次に、検索キーワード入力時のURL情報の表示方法を説明する。
【0028】
図3は、URL情報取得サーバ3において、検索キーワードをもとに検索を行い、対象とするURL情報を表示するまでの手順を示すフローチャートである。インターネット接続端末装置1から入力された検索キーワードはURL情報取得サーバ3に送信され、ステップ3111において、その検索キーワードをもとに対象となる全てのURL情報を蓄積テーブル61から取得する。ステップ3112で対象URLなしと判断された場合、ステップ3113によりインターネット接続端末装置1に対して「対象データなし」の0件表示を行う。
【0029】
ステップ3112で対象URLありと判断された場合、付加情報取得処理312により、蓄積テーブル61から対象URLに対応する付加情報(URL更新日614、ページ容量615、キーワード出現回数616等)をすべて取得し、各付加情報をランク化する。ランクとは、その付加情報の重要度を示す値であり、ランクの値が大きいほど上位の順位で表示されるようになる。例えば、URL更新日であれば、「今日、URL更新されたものは、ランク100」、「昨日、URL更新されたものは、ランク99」等というようにランク化する。ステップ3131において、パラメータテーブル63からパラメータ群(パラメータ値1 633、パラメータ値2 634、パラメータ値3 635…)を取得する。取得方法に関しては、N個(パラメータテーブル63に登録されているパラメータ群の数をN個とする)のパラメータ群の中からランダムな一つを選択すればよい。
【0030】
ステップ314の対象URL順位化処理では、当該検索キーワードで検索された全対象URL情報を順位化する。具体的には、各対象URLの全付加情報(URL更新日、ページ容量、キーワード出現回数…)の各ランク値(たとえば、100、50、85…)と、それと対になる重み付けパラメータ群(パラメータ値1、パラメータ値2、パラメータ値3…)により、Σ(ランク値)×(対応するパラメータ値)で総合ランク値を求め、該総合ランク値が大きい順に順位を付ける。上記Σは、各付加情報のランク値とそれに対応するパラメータ値との積の和を取るという意味である。例えば、図6に示したように付加情報として「URL更新日」と「ページ容量」と「キーワード出現回数」があり、各付加情報のランク値が順に100,50,85であったとすると、この対象URLの総合ランク値は、100×パラメータ値1+50×パラメータ値2+85×パラメータ値3となる。このような総合ランク値に基づいて検索キーワードに合致する全URLの順位化処理を行う。最後に、ステップ315のURL情報出力処理において、順位化されたURL情報をインターネット2を介して、インターネット接続端末装置1に送信する。
【0031】
利用者は、上述したように送られてくるURL情報を参照し、その表示の順位付けに対して評価値を入力する。入力された評価値は、パラメータ群IDとともにパラメータ評価履歴テーブル62に蓄積される。順位付けに利用されるパラメータ群はランダムに選ばれるので、ある程度の回数の検索が行われれば、登録されているすべてのパラメータ群についてそれぞれ幾つかの評価値が得られることになる。ある程度の評価値が得られたら、それに基づいてパラメータのチューニングを行う。以下では、そのチューニング方法を説明する。
【0032】
図4は、チューニングサーバ5で動作する遺伝的アルゴリズムによる重み付けパラメータのチューニング実施手順を示すフローチャートである。この処理は、日次もしくは月次処理にて稼動するものとする。図4において、まずステップ5111で、パラメータ評価履歴テーブル62より、パラメータ群ID621と評価値622を全件取得する。ステップ5112では、取得したパラメータ群ごとに評価値の平均値を算出する。ステップ5113では、パラメータテーブル63の評価値632を、算出した評価値で更新する。同時に、ステップ5114では、パラメータ評価履歴テーブル62のレコードを全件削除する。
【0033】
次にステップ512のパラメータ取得処理で、パラメータテーブル63からN個のパラメータ群全てを取得し、評価値632の値が大きいものを上位とする順に並べ替えを行う。ステップ5131では、対となるパラメータ群同士で交叉処理を行う。どのパラメータ群同士を対にするかは適宜決めておけばよいが、ここでは上位1位と2位、上位3位と4位、…というように対にするものとする。次にステップ5132で、0から1を範囲とする乱数をパラメータ群のパラメータ値ごとに発生させ、ステップ5133にて突然変異確率(所定値)との比較を行う。あるパラメータ値に対して発生させた乱数が、突然変異確率以下であった場合は、突然変異を実行するものとし、ステップ5134において、対象となるパラメータ値に対して突然変異処理を行う。なお、ステップ5132〜5134の突然変異の処理は「パラメータ群の数×パラメータ群に含まれるパラメータの数」だけ繰り返すものとする。最後に、ステップ5141において、パラメータテーブル63の全パラメータ群の各パラメータ値を、取得した新パラメータ値に置き換える。
【0034】
図5は、遺伝的アルゴリズムによる交叉操作手順例と突然変異操作手順例を示す図である。
【0035】
交叉操作例51311は、パラメータ群同士の交叉操作例を示す。この例では、パラメータ群1と2の交叉ポイントがパラメータ2の位置に決定され、パラメータ群3と4の交叉ポイントがパラメータ3の位置に決定されたとする。これらの交叉ポイントは、パラメータ群ごとに乱数により決定するものとする。交叉処理により、パラメータ群1とパラメータ群2のパラメータ2が入れ替えられ、またパラメータ群3とパラメータ群4のパラメータ3が入れ替えられている。
【0036】
突然変異操作例51341は、各パラメータ値の突然変異操作例を示す。この例では、パラメータ群1のパラメータ2とパラメータ群4のパラメータ1について突然変異を行うものとし(すなわち、これらのパラメータ値の処理ではステップ5133から5134に進んだということである)、他のパラメータ値については突然変異を行わない(すなわち、これらのパラメータ値の処理ではステップ5133からステップ5134はスキップしたということである)。突然変異処理により、パラメータ群1のパラメータ2とパラメータ群4のパラメータ1については、それぞれ、ランダムな値に変更される。
【0037】
以上の交叉処理や突然変異処理によってパラメータテーブル63のパラメータ群は、より評価値が高い順位付けができるパラメータ群が自然淘汰で残っていくようにすることができる。なお、評価値が高いパラメータ群が確実に残るように、評価値の平均が所定値以上のパラメータ群については、ステップ5141で新たなものに置き換えず、パラメータテーブル63に残すようにしてもよい。また、例えばパラメータテーブル63に20組のパラメータ群があった場合、評価値の平均の順で下位の10組は捨て、上位の10組から遺伝的アルゴリズムによる処理で20組を作って置き換えたり、上位の10組は残すとともにそれら上位の10組から遺伝的アルゴリズムによる処理で10組を作り、合わせて20組とすることなどにより、自然淘汰されて、よりよいパラメータ群が残るようにしてもよい。
【0038】
【発明の効果】
以上説明したように、本発明によれば、検索エンジンでWWWページのURLを検索する際、順位化の各要素に重み付けパラメータを設定することで、複数要素の総合的な評価が可能となり、その表示順序の精度を向上させることが可能となる。また、重み付けパラメータの最適化に遺伝的アルゴリズムを用い随時パラメータ評価を行うことで、利用者の意図を忠実に反映したチューニングが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の一形態の検索エンジンの精度向上方法の構成を示すブロック図
【図2】検索キーワードを入力して、URL一覧が表示される際の画面遷移イメージ、及び、検索性能評価を入力して、登録結果が表示される際の画面遷移イメージを示す画面例を示す図
【図3】検索キーワードをもとに、対象とするURL情報を表示するまでの手順を示すフローチャート
【図4】遺伝的アルゴリズムに用いた、重み付けパラメータのチューニング実施手順を示すフローチャート
【図5】遺伝的アルゴリズムによる交叉操作手順例と突然変異操作手順例を示す図
【図6】データベースサーバの有するテーブルのテーブルレイアウト図
【符号の説明】
1…インターネット接続端末装置、2…インターネット、3…URL情報取得サーバ、4…パラメータ評価サーバ、5…チューニングサーバ、6…データベースサーバ。
【発明の属する技術分野】
本発明は、インターネット上に多々存在するWEBサイトを検索して表示する技術に関する。
【0002】
【従来の技術】
急速に膨張しているインターネットのWWWページの中から、適切なURLを探し出すことは非常に困難である。そのため、インターネットからWWWページを探し出すためのサービスとして、検索エンジン(サーチエンジン)が利用されている。検索エンジンでは、検索ロボットと呼ばれるWWWページ収集のためのプログラムが実行され、自動的にWWWページのハイパーリンクをたどりながらページの内容を保存する処理を実行している。そして、リンク構造や集められたページの内容を分析し、キーワードとそのページの場所(URL)との対応表を作成する。実際に利用者がWWWページを探すために検索用のキーワードを入力したとき、検索エンジンでは、内部に保存してある対応表を高速に検索して求められているページを提示する。これらの検索結果は、文章容量(大きいもの)や日付(新しいもの)等の情報を、単独評価することで順位化して表示するといったものである。
【0003】
また特許文献1には、自然文で与えられた検索条件を分断したキーワードで検索し、検索結果として得られたメタデータ(ページタイトルなど)から、与えられた自然文との類似度を演算し、類似度の高い順に並び替えて表示する技術が開示されている。非特許文献1には、各種の問題解決に生物の遺伝的メカニズムを適用する遺伝的アルゴリズムについて記載されている。
【0004】
【特許文献1】特開2001−52014
【0005】
【非特許文献1】「遺伝的アルゴリズムの基礎」(伊庭斉志著)オーム社
【0006】
【発明が解決しようとする課題】
以上のように、従来は単に文章容量や日付などの一種類の情報に基づいて順位付けしたURL情報を表示するだけであった。したがって、表示されたURLの順位は、必ずしも利用者が欲するURL順位とはなっていないことが多い。そのため、利用者は、何十、何百というURLを順次調べ、求めようとしているWWWページであるかを調べる必要があった。
【0007】
上記特許文献1に記載の技術では、自然文を用いて検索することができるが、検索結果が利用者の視点から好ましいものであるとは限らず、やはり利用者は検索された各URLのWEBサイトを調べなければならない場合があった。
【0008】
本発明は、URLの順位化の精度を上げ、利用者が欲するWWWページのURL情報を困難なく取得できるようにすることを目的とする。
【0009】
【課題を解決するための手段】
上記目的を達成するために、本発明は、検索結果の順位化の過程において、文章容量(大きいもの)や日付(新しいもの)等の情報を単独評価するのではなく、複数の順位化要素に重み付けパラメータを設定することでURL情報の総合評価を行い、これにより検索キーワードに対するURL情報の表示順を決定することを特徴とする。また、重み付けパラメータは進化アルゴリズム(遺伝的アルゴリズム)を用いることで最適化し、検索を繰り返すたびにパラメータの精度が向上し、利用者の意図を忠実に反映したチューニングが可能となるようにする。
【0010】
すなわち、請求項1に係る発明は、端末装置からの要求に応じてWEBサイトを検索し、検索結果を端末装置に返すWEBサイトの検索表示方法であって、与えられた検索キーワードに基づいて検索された各WEBサイトの表示順位を、順位化に用いる各要素に重み付けパラメータを設定することで、表示順序の精度向上を図ることを特徴とする。
【0011】
請求項2に係る発明は、端末装置からの要求に応じてWEBサイトを検索し、検索結果を端末装置に返すWEBサイトの検索表示方法であって、与えられた検索キーワードに基づいてWEBサイトを検索するステップと、検索されたWEBサイトに関する付加情報を取得するステップと、パラメータテーブルに格納されている重み付けパラメータ群を任意に選択するステップと、検索されたWEBサイトごとに、前記付加情報に基づいて決定したランク値を前記選択した重み付けパラメータ群に基づいて重み付けし、該重み付けした結果である総合ランク値を求めるステップと、求めた総合ランク値に基づいて、検索されたWEBサイトを順位付けするステップとを備えたことを特徴とする。
【0012】
請求項3に係る発明は、請求項2に記載のWEBサイトの検索表示方法において、前記パラメータテーブルに格納されている重み付けパラメータ群に対して遺伝的アルゴリズムを適用し、得られた重み付けパラメータ群を前記パラメータテーブルに追加または置き換えするステップをさらに備えたことを特徴とする。
【0013】
請求項4に係る発明は、請求項3に記載のWEBサイトの検索表示方法において、前記WEBサイトの順位付けに対して利用者が入力した評価値を蓄積するステップと、前記パラメータ群ごとに前記評価値の平均を求め、該評価値の平均に基づいて前記パラメータテーブルに格納されている重み付けパラメータ群を並び換えるステップと、並び換えた前記パラメータテーブルに格納されている重み付けパラメータ群に対して遺伝的アルゴリズムを適用し、得られた重み付けパラメータ群を前記パラメータテーブルに追加または置き換えするステップとをさらに備えたことを特徴とする。
【0014】
【発明の実施の形態】
以下、本発明を実施する場合の一形態を図面を参照して具体的に説明する。
【0015】
図1は、本発明に係るWEBサイトの検索表示方法を実施する一形態であるシステムの概略構成を示すブロック図である。インターネット2に、インターネット接続端末装置1、URL情報取得サーバ3、及びパラメータ評価サーバ4が接続されている。インターネット接続端末装置1は、利用者が検索キーワードを入力してWEB検索を行ったり、検索性能を評価するための端末装置である。ここでは検索キーワードを入力して検索を指示する端末装置と検索性能を評価するときの端末装置を別々に図示したが、もちろん1台の端末装置でよい。通常は、検索を指示しその検索結果を参照した利用者が、その場ですぐにその検索結果についての評価値を入力する。URL情報取得サーバ3は、インターネット接続端末装置1から入力された検索キーワードに応じたURL情報を提供するサーバである。パラメータ評価サーバ4は、インターネット接続端末装置1からの指示を受けて検索性能評価を行う。データベースサーバ6は、URL情報やパラメータ情報などの各種の情報を蓄積する。チューニングサーバ5は、データベースサーバ6のパラメータ情報をチューニングするためサーバである。
【0016】
URL情報取得サーバ3は、対象URL取得処理311、付加情報取得処理312、パラメータ取得処理313、対象URL順位化処理314、及びURL情報出力処理315を有している。対象URL取得処理311は、検索対象となるURL情報を取得するときに使用する。付加情報取得処理312は、対象サイトの付加情報(URL最新更新日、ページ全体容量、ページ内キーワード出現回数等)を取得するときに使用する。パラメータ取得処理313は、付加情報に重み付けを行うパラメータ(重み付けパラメータ)を取得するときに使用する。対象URL順位化処理314は、付加情報の重み付けにより順位化を行うときに使用する。URL情報出力処理315は、順位化されたURL情報を出力するときに使用する。
【0017】
パラメータ評価サーバ4は、評価情報取得処理411、及び評価履歴出力処理412を有している。評価情報取得処理411は、インターネット接続端末装置1から入力された、検索性能の評価情報を取得するときに使用する。評価履歴出力処理412は、取得した評価情報をデータベースサーバ6に出力するときに使用する。
【0018】
チューニングサーバ5は、評価履歴反映処理511、パラメータ取得処理512、遺伝的アルゴリズム適用処理513、及びパラメータ格納処理514を有している。評価履歴反映処理511は、重み付けパラメータの評価値履歴を重み付けパラメータの評価値に反映するときに使用する。パラメータ取得処理512は、全ての重み付けパラメータ情報(パラメータ群を一意に識別する群ID、対象パラメータの評価値、付加情報に重み付けを行う各パラメータ値)を取得するときに使用する。遺伝的アルゴリズム適用処理513は、取得した各パラメータ値をチューニングするときに使用する。パラメータ格納処理514は、チューニングされた各パラメータ値を格納するときに使用する。
【0019】
データベースサーバ6は、蓄積テーブル61、パラメータ評価履歴テーブル62、及びパラメータテーブル63を有している。蓄積テーブル61は、検索キーワードに合致するURL情報、及び、付加情報(URL更新日、ページ容量、キーワード出現回数等)を管理するためのテーブルである。蓄積テーブル61のこれらの情報は、図1では不図示の検索ロボットが収集して格納するものである。すなわち、検索ロボットはインターネット上から種々の検索キーワードとそれに対応するURL情報とページの付加情報を収集して蓄積テーブルに格納する。したがって、端末装置1からURL情報取得サーバ3に検索キーワードが与えられたとき、URL情報取得サーバ3は、その検索キーワードを蓄積テーブル61から探し出すだけで、その検索キーワードに対応するURL情報などを得ることができる。パラメータ評価履歴テーブル62は、インターネット接続端末1から利用者により入力された評価値(表示された検索結果の各サイトの表示順序に対して、その利用者が評価した評価値)を格納するテーブルである。パラメータテーブル63は、付加情報の重み付けパラメータとその評価値を管理するためのテーブルである。
【0020】
図6に、蓄積テーブル61、パラメータ評価履歴テーブル62、パラメータテーブル63のテーブルレイアウトを示す。
【0021】
蓄積テーブル61には、検索キーワード611、対象URL612、ページタイトル613、URL更新日614、ページ容量615、キーワード出現回数616等の情報を格納する。検索キーワード611には、検索ロボットにより収集した検索キーワードを格納する。対象URLは、そのキーワードに合致するURL情報を格納する。ページタイトルは、対象URLのページのタイトルを格納する。URL更新日614以降の項目には、収集されたページの付加情報を格納する。
【0022】
パラメータ評価履歴テーブル62には、パラメータ群ID621と、そのパラメータ群IDのパラメータ群を利用したURLの順位付けに対して、利用者が入力した評価値622とを、対応させて格納する。
【0023】
パラメータテーブル63の633、634、635、…の項目には、検索されたURLの順位付けを行う際の重み付けに利用するパラメータ値を格納する。これらのパラメータ値の組み合わせ(テーブル63の1行分)には、その組み合わせを特定するパラメータ群ID631が付けられている。評価値632には、対応するパラメータ群IDのパラメータ群を利用した順位付けに対して利用者が評価した評価値の平均値を格納する。なお、蓄積テーブル61中の番号614以降に示した付加情報と、パラメータテーブル63中の番号633以降に示したパラメータ値1,2,…とは、順に対応している(矢印で対応関係を図示した)。
【0024】
次に、サイト検索と検索性能評価における、インターネット接続端末装置1の画面イメージを説明する。図2は、インターネット接続端末装置1で表示される画面であり、検索キーワードを入力してURL一覧が表示される際の画面遷移イメージ、及び検索性能評価を入力して登録結果が表示される際の画面遷移イメージの画面例である。
【0025】
まず、画面71は、サイト検索を行う際に利用者が検索キーワードを入力する画面例である。711は検索キーワードの入力領域、712は検索の実行を指示する検索ボタンである。ここでは検索キーワードとして「インターネット」と入力し、検索ボタン712を押下したとする。画面72は、入力された検索キーワードをもとに取得されたURL情報を表示する画面例である。検索結果表示領域713に、検索キーワードをもとに取得されたURL情報が表示される。これらのURL情報は、後述する手順で順位付けが為されているものである。
【0026】
画面73は、検索性能評価時に利用者が評価値を入力する画面例を示す。利用者は、画面72の検索結果画面を参照し、そのURL情報の順位付けに対する評価値をリストボックス731により選択する。ここでは5段階とし、数値が大きいほど評価が高いことを示すものとする。リストボックス731で評価値を選択した後、送信ボタン732を押下することにより、端末装置1から当該入力した評価値がパラメータ評価サーバ4に送信される。画面74は、評価値のパラメータ評価サーバ4への登録が完了したことを示す画面である。なお、画面71または72が表示されるとき同時に別ウインドウで画面73を表示し、検索結果が表示されたとき利用者がすぐに評価値を入力できるようにしておくとよい。
【0027】
次に、検索キーワード入力時のURL情報の表示方法を説明する。
【0028】
図3は、URL情報取得サーバ3において、検索キーワードをもとに検索を行い、対象とするURL情報を表示するまでの手順を示すフローチャートである。インターネット接続端末装置1から入力された検索キーワードはURL情報取得サーバ3に送信され、ステップ3111において、その検索キーワードをもとに対象となる全てのURL情報を蓄積テーブル61から取得する。ステップ3112で対象URLなしと判断された場合、ステップ3113によりインターネット接続端末装置1に対して「対象データなし」の0件表示を行う。
【0029】
ステップ3112で対象URLありと判断された場合、付加情報取得処理312により、蓄積テーブル61から対象URLに対応する付加情報(URL更新日614、ページ容量615、キーワード出現回数616等)をすべて取得し、各付加情報をランク化する。ランクとは、その付加情報の重要度を示す値であり、ランクの値が大きいほど上位の順位で表示されるようになる。例えば、URL更新日であれば、「今日、URL更新されたものは、ランク100」、「昨日、URL更新されたものは、ランク99」等というようにランク化する。ステップ3131において、パラメータテーブル63からパラメータ群(パラメータ値1 633、パラメータ値2 634、パラメータ値3 635…)を取得する。取得方法に関しては、N個(パラメータテーブル63に登録されているパラメータ群の数をN個とする)のパラメータ群の中からランダムな一つを選択すればよい。
【0030】
ステップ314の対象URL順位化処理では、当該検索キーワードで検索された全対象URL情報を順位化する。具体的には、各対象URLの全付加情報(URL更新日、ページ容量、キーワード出現回数…)の各ランク値(たとえば、100、50、85…)と、それと対になる重み付けパラメータ群(パラメータ値1、パラメータ値2、パラメータ値3…)により、Σ(ランク値)×(対応するパラメータ値)で総合ランク値を求め、該総合ランク値が大きい順に順位を付ける。上記Σは、各付加情報のランク値とそれに対応するパラメータ値との積の和を取るという意味である。例えば、図6に示したように付加情報として「URL更新日」と「ページ容量」と「キーワード出現回数」があり、各付加情報のランク値が順に100,50,85であったとすると、この対象URLの総合ランク値は、100×パラメータ値1+50×パラメータ値2+85×パラメータ値3となる。このような総合ランク値に基づいて検索キーワードに合致する全URLの順位化処理を行う。最後に、ステップ315のURL情報出力処理において、順位化されたURL情報をインターネット2を介して、インターネット接続端末装置1に送信する。
【0031】
利用者は、上述したように送られてくるURL情報を参照し、その表示の順位付けに対して評価値を入力する。入力された評価値は、パラメータ群IDとともにパラメータ評価履歴テーブル62に蓄積される。順位付けに利用されるパラメータ群はランダムに選ばれるので、ある程度の回数の検索が行われれば、登録されているすべてのパラメータ群についてそれぞれ幾つかの評価値が得られることになる。ある程度の評価値が得られたら、それに基づいてパラメータのチューニングを行う。以下では、そのチューニング方法を説明する。
【0032】
図4は、チューニングサーバ5で動作する遺伝的アルゴリズムによる重み付けパラメータのチューニング実施手順を示すフローチャートである。この処理は、日次もしくは月次処理にて稼動するものとする。図4において、まずステップ5111で、パラメータ評価履歴テーブル62より、パラメータ群ID621と評価値622を全件取得する。ステップ5112では、取得したパラメータ群ごとに評価値の平均値を算出する。ステップ5113では、パラメータテーブル63の評価値632を、算出した評価値で更新する。同時に、ステップ5114では、パラメータ評価履歴テーブル62のレコードを全件削除する。
【0033】
次にステップ512のパラメータ取得処理で、パラメータテーブル63からN個のパラメータ群全てを取得し、評価値632の値が大きいものを上位とする順に並べ替えを行う。ステップ5131では、対となるパラメータ群同士で交叉処理を行う。どのパラメータ群同士を対にするかは適宜決めておけばよいが、ここでは上位1位と2位、上位3位と4位、…というように対にするものとする。次にステップ5132で、0から1を範囲とする乱数をパラメータ群のパラメータ値ごとに発生させ、ステップ5133にて突然変異確率(所定値)との比較を行う。あるパラメータ値に対して発生させた乱数が、突然変異確率以下であった場合は、突然変異を実行するものとし、ステップ5134において、対象となるパラメータ値に対して突然変異処理を行う。なお、ステップ5132〜5134の突然変異の処理は「パラメータ群の数×パラメータ群に含まれるパラメータの数」だけ繰り返すものとする。最後に、ステップ5141において、パラメータテーブル63の全パラメータ群の各パラメータ値を、取得した新パラメータ値に置き換える。
【0034】
図5は、遺伝的アルゴリズムによる交叉操作手順例と突然変異操作手順例を示す図である。
【0035】
交叉操作例51311は、パラメータ群同士の交叉操作例を示す。この例では、パラメータ群1と2の交叉ポイントがパラメータ2の位置に決定され、パラメータ群3と4の交叉ポイントがパラメータ3の位置に決定されたとする。これらの交叉ポイントは、パラメータ群ごとに乱数により決定するものとする。交叉処理により、パラメータ群1とパラメータ群2のパラメータ2が入れ替えられ、またパラメータ群3とパラメータ群4のパラメータ3が入れ替えられている。
【0036】
突然変異操作例51341は、各パラメータ値の突然変異操作例を示す。この例では、パラメータ群1のパラメータ2とパラメータ群4のパラメータ1について突然変異を行うものとし(すなわち、これらのパラメータ値の処理ではステップ5133から5134に進んだということである)、他のパラメータ値については突然変異を行わない(すなわち、これらのパラメータ値の処理ではステップ5133からステップ5134はスキップしたということである)。突然変異処理により、パラメータ群1のパラメータ2とパラメータ群4のパラメータ1については、それぞれ、ランダムな値に変更される。
【0037】
以上の交叉処理や突然変異処理によってパラメータテーブル63のパラメータ群は、より評価値が高い順位付けができるパラメータ群が自然淘汰で残っていくようにすることができる。なお、評価値が高いパラメータ群が確実に残るように、評価値の平均が所定値以上のパラメータ群については、ステップ5141で新たなものに置き換えず、パラメータテーブル63に残すようにしてもよい。また、例えばパラメータテーブル63に20組のパラメータ群があった場合、評価値の平均の順で下位の10組は捨て、上位の10組から遺伝的アルゴリズムによる処理で20組を作って置き換えたり、上位の10組は残すとともにそれら上位の10組から遺伝的アルゴリズムによる処理で10組を作り、合わせて20組とすることなどにより、自然淘汰されて、よりよいパラメータ群が残るようにしてもよい。
【0038】
【発明の効果】
以上説明したように、本発明によれば、検索エンジンでWWWページのURLを検索する際、順位化の各要素に重み付けパラメータを設定することで、複数要素の総合的な評価が可能となり、その表示順序の精度を向上させることが可能となる。また、重み付けパラメータの最適化に遺伝的アルゴリズムを用い随時パラメータ評価を行うことで、利用者の意図を忠実に反映したチューニングが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の一形態の検索エンジンの精度向上方法の構成を示すブロック図
【図2】検索キーワードを入力して、URL一覧が表示される際の画面遷移イメージ、及び、検索性能評価を入力して、登録結果が表示される際の画面遷移イメージを示す画面例を示す図
【図3】検索キーワードをもとに、対象とするURL情報を表示するまでの手順を示すフローチャート
【図4】遺伝的アルゴリズムに用いた、重み付けパラメータのチューニング実施手順を示すフローチャート
【図5】遺伝的アルゴリズムによる交叉操作手順例と突然変異操作手順例を示す図
【図6】データベースサーバの有するテーブルのテーブルレイアウト図
【符号の説明】
1…インターネット接続端末装置、2…インターネット、3…URL情報取得サーバ、4…パラメータ評価サーバ、5…チューニングサーバ、6…データベースサーバ。
Claims (4)
- 端末装置からの要求に応じてWEBサイトを検索し、検索結果を端末装置に返すWEBサイトの検索表示方法であって、
与えられた検索キーワードに基づいて検索された各WEBサイトの表示順位を、順位化に用いる各要素に重み付けパラメータを設定することで、表示順序の精度向上を図ることを特徴としたWEBサイトの検索表示方法。 - 端末装置からの要求に応じてWEBサイトを検索し、検索結果を端末装置に返すWEBサイトの検索表示方法であって、
与えられた検索キーワードに基づいてWEBサイトを検索するステップと、
検索されたWEBサイトに関する付加情報を取得するステップと、
パラメータテーブルに格納されている重み付けパラメータ群を任意に選択するステップと、
検索されたWEBサイトごとに、前記付加情報に基づいて決定したランク値を前記選択した重み付けパラメータ群に基づいて重み付けし、該重み付けした結果である総合ランク値を求めるステップと、
求めた総合ランク値に基づいて、検索されたWEBサイトを順位付けするステップと
を備えたことを特徴とするWEBサイトの検索表示方法。 - 請求項2に記載のWEBサイトの検索表示方法において、
前記パラメータテーブルに格納されている重み付けパラメータ群に対して遺伝的アルゴリズムを適用し、得られた重み付けパラメータ群を前記パラメータテーブルに追加または置き換えするステップをさらに備えたことを特徴とするWEBサイトの検索表示方法。 - 請求項3に記載のWEBサイトの検索表示方法において、
前記WEBサイトの順位付けに対して利用者が入力した評価値を蓄積するステップと、
前記パラメータ群ごとに前記評価値の平均を求め、該評価値の平均に基づいて前記パラメータテーブルに格納されている重み付けパラメータ群を並び換えるステップと、
並び換えた前記パラメータテーブルに格納されている重み付けパラメータ群に対して遺伝的アルゴリズムを適用し、得られた重み付けパラメータ群を前記パラメータテーブルに追加または置き換えするステップとを
さらに備えたことを特徴とするWEBサイトの検索表示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003060858A JP2004272492A (ja) | 2003-03-07 | 2003-03-07 | Webサイトの検索表示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003060858A JP2004272492A (ja) | 2003-03-07 | 2003-03-07 | Webサイトの検索表示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004272492A true JP2004272492A (ja) | 2004-09-30 |
Family
ID=33123231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003060858A Pending JP2004272492A (ja) | 2003-03-07 | 2003-03-07 | Webサイトの検索表示方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004272492A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100735766B1 (ko) | 2006-06-19 | 2007-07-04 | (주)수도프리미엄엔지니어링 | 사용자 중심의 순위 검색 서비스 시스템 및 그 서비스 방법 |
JP2009129104A (ja) * | 2007-11-21 | 2009-06-11 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置及びプログラム |
JP2009129103A (ja) * | 2007-11-21 | 2009-06-11 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置及びプログラム |
JP2010086180A (ja) * | 2008-09-30 | 2010-04-15 | Yahoo Japan Corp | デバイスを調整した検索方法、プログラム及びサーバ |
WO2014192736A1 (ja) * | 2013-05-28 | 2014-12-04 | Ando Yuta | 現在位置に関連したサイトページを所望条件順に携帯端末に表示する方法及びシステム |
JP2015201184A (ja) * | 2014-04-04 | 2015-11-12 | 富士通株式会社 | インフォーマル学習のための学習教材を収集する方法及び非一時的なコンピュータ可読媒体 |
-
2003
- 2003-03-07 JP JP2003060858A patent/JP2004272492A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100735766B1 (ko) | 2006-06-19 | 2007-07-04 | (주)수도프리미엄엔지니어링 | 사용자 중심의 순위 검색 서비스 시스템 및 그 서비스 방법 |
JP2009129104A (ja) * | 2007-11-21 | 2009-06-11 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置及びプログラム |
JP2009129103A (ja) * | 2007-11-21 | 2009-06-11 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置及びプログラム |
JP2010086180A (ja) * | 2008-09-30 | 2010-04-15 | Yahoo Japan Corp | デバイスを調整した検索方法、プログラム及びサーバ |
WO2014192736A1 (ja) * | 2013-05-28 | 2014-12-04 | Ando Yuta | 現在位置に関連したサイトページを所望条件順に携帯端末に表示する方法及びシステム |
JP2014232907A (ja) * | 2013-05-28 | 2014-12-11 | 雄太 安藤 | 現在位置に基づくサイトページを所望条件順に携帯端末に表示する方法及びシステム |
JP2015201184A (ja) * | 2014-04-04 | 2015-11-12 | 富士通株式会社 | インフォーマル学習のための学習教材を収集する方法及び非一時的なコンピュータ可読媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101882149B (zh) | 重排序和提高搜索结果的相关性 | |
JP4638439B2 (ja) | ウェブ検索の個人化 | |
JP5632124B2 (ja) | 格付け方法、検索結果並び替え方法、格付けシステム及び検索結果並び替えシステム | |
US8095582B2 (en) | Dynamic search engine results employing user behavior | |
JP5673336B2 (ja) | 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム | |
JP5084858B2 (ja) | サマリ作成装置、サマリ作成方法及びプログラム | |
US6850954B2 (en) | Information retrieval support method and information retrieval support system | |
JP2002334107A (ja) | 情報検索装置および方法と情報検索プログラムおよび該プログラムを記録した記録媒体 | |
JP2007034772A (ja) | Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム | |
JP2004272492A (ja) | Webサイトの検索表示方法 | |
JP2012003532A (ja) | クエリサジェスチョン提供装置及び方法 | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
JP3908634B2 (ja) | 検索支援方法および検索支援装置 | |
JP2005251157A (ja) | 情報検索システムおよび情報検索方法ならびにプログラム | |
KR101134073B1 (ko) | 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템 | |
JP2003108594A (ja) | 情報検索装置およびその方法 | |
JP2022111544A (ja) | 情報処理システム、及び情報処理方法 | |
JP2000293531A (ja) | 情報検索方法及び装置 | |
JP2004259083A (ja) | 情報検索方法、情報検索サーバ、及び情報検索プログラム | |
JP2002108912A (ja) | 検索システムおよび検索方法 | |
JP4163671B2 (ja) | データベース運用管理支援機能を有する情報検索システム及びデータベース運用管理方法 | |
JP2001229171A (ja) | 商品検索システム | |
JP5039086B2 (ja) | 評価情報入力支援装置、評価情報入力支援方法およびその方法を実行させるプログラム | |
JP2013218441A (ja) | 特徴キーワード推薦装置及び方法及びプログラム | |
KR100766911B1 (ko) | 다단 웹 사이트 검색 방법 및 시스템 |