JP2002215642A - フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体 - Google Patents

フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体

Info

Publication number
JP2002215642A
JP2002215642A JP2001014325A JP2001014325A JP2002215642A JP 2002215642 A JP2002215642 A JP 2002215642A JP 2001014325 A JP2001014325 A JP 2001014325A JP 2001014325 A JP2001014325 A JP 2001014325A JP 2002215642 A JP2002215642 A JP 2002215642A
Authority
JP
Japan
Prior art keywords
search
keyword
search result
common
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001014325A
Other languages
English (en)
Inventor
Ryosuke Okada
良介 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2001014325A priority Critical patent/JP2002215642A/ja
Publication of JP2002215642A publication Critical patent/JP2002215642A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】一般的なユーザであってもロボット型検索エン
ジンのような検索エンジンを用いてインターネット上の
膨大な数のWebページの中から目的にかなった多くの
ページを見つけ出すことができる検索技術を提供する。 【解決手段】ユーザ端末3から与えられた検索キーワー
ドを用いてインターネット上の検索エンジン2から取得
されたWebページの検索結果の少なくとも一部に関し
て各検索結果に対する適否を求める文書を作成してユー
ザに送信し、クライアントから返信された各検索結果に
対する適否データに基づいて検索結果を適合グループと
不適合グループに区分けし、適合グループに属する検索
結果に該当するWebページのテキストデータから抽出
された共通語句から新たな検索キーワード候補とするフ
ィードバック型インターネット検索技術。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネット上
で設置されている検索エンジン、特にロボット型検索エ
ンジンに検索キーワードを与えることによって情報検索
を行うインターネット検索方法、及びこの方法をコンピ
ュータに実施させるプログラムを記録した記録媒体やこ
の方法を実施するシステムに関する。
【0002】
【従来の技術】インターネット上に提供されている膨大
な数のWebページ(一般的にはHTML言語で書か
れ、HTTPでネットワーク上を伝送される電子文書で
あるが、それ以外の言語で書かれ、それ以外のプロトコ
ールで伝送される形態の電子文書も本発明では考慮され
ている)の中から、所望のWebページを探し出すため
の検索エンジンとして、ディレクトリ型検索エンジンと
ロボット型検索エンジンが代表的である。
【0003】ディレクトリ型検索エンジンは、Webペ
ージへのリンクを主題別に大分類から小分類へと階層的
に分類しているので、所望のWebページにたどり着く
にはユーザがその分類カテゴリを正しく理解しておく必
要がある。しかしながら、情報の完全な分類化は不可能
であり、分類から外れるWebページは検索対象外とな
ることから、検索対象となるWebページの母集団はか
なり限定されたものとなり、膨大な数のWebページの
中から目的にかなった多くのページを見つけ出す検索に
は向いていない。
【0004】これに対してロボット型検索エンジンは、
特殊なソフトウエアを用いて網羅的に取り込んだWeb
ページを全文検索可能な形で提供する検索サービスであ
り、検索対象となるWebページの母集団は十分に大き
なものである。適切な検索キーワードを与えることがで
きたならば、目的にかなった多くのページを見つけ出す
ことが可能となる。
【0005】
【発明が解決しようとする課題】しかしながら、検索対
象となる母集団が余りにも大きなため、常識的な検索キ
ーワードを与えるだけならヒット数が多すぎて、所望の
Webページを見つけ出すために一つずつヒットしたW
ebページを訪れてその内容をチェックするには大きな
労力を要する。しかし、効率的な検索を可能にするよう
な適切な検索キーワードを見つけ出すことは、専門のサ
ーチャーでものない限りほとんど不可能であり、一般的
なユーザがこのような検索エンジンを利用して効率よく
所望のWebページを見つけ出すことはできなかった。
【0006】上記実状に鑑み、本発明の課題は、一般的
なユーザであってもロボット型検索エンジンのような検
索エンジンを用いてインターネット上の膨大な数のWe
bページの中から目的にかなった多くのページを見つけ
出すことができる検索技術を提供することである。
【0007】
【課題を解決するための手段】上記課題を解決するた
め、本発明によるインターネット検索方法として、ユー
ザ端末から与えられた検索キーワードを用いてインター
ネット上の検索エンジンからWebページの検索結果を
取得するステップと、検索結果の少なくとも一部に関し
て各検索結果に対する適否を求める文書を作成してユー
ザに判定させるステップと、ユーザによって判定された
各検索結果に対する適否に基づいて検索結果を適合グル
ープと不適合グループに区分けするステップと、適合グ
ループに属する検索結果に該当するWebページのテキ
ストデータから共通語句を抽出するステップと、前記抽
出された共通語句から新たな候補となる検索キーワード
を生成するステップとを備えたフィードバック型インタ
ーネット検索方法が、まず提案される。
【0008】この方法では、ユーザによって与えられた
常識的な検索キーワードによって得られたWebページ
の検索結果としての各Webページが適当であるか不適
当であるか、つまいユーザの興味の対象であるかどうか
をユーザに判定してもらうための文書をユーザに与えて
その適否を判断してもらう。これにより、検索抽出され
たWebページの少なくとも一部に対する適否が得られ
るので、これに基づいてそれらのWebページを適合グ
ループと不適合グループに区分けし、適合グループのW
ebページの内容文から語句を切り出し、そこから共通
語句を見出して、これを新たな検索キーワードの候補と
する。この共通語句は、ユーザによって興味あると判定
されたWebページの内容から共通するものとして選ば
れた語句なので、この語句をさらなる検索キーワードと
して用いることで、より絞られた検索結果が得られる可
能性が増大する。ユーザ自身が追加の検索キーワードを
作るのではなく、機械的に作り出された語句から選択す
るだけなので、専門的な検索能力を持たないユーザであ
っても、より効率的な検索を実現する検索キーワードを
扱うことが可能となる。
【0009】本発明による好適な実施形態の1つでは、
前記共通語句抽出ステップにおいて、該当するWebペ
ージのテキストデータを品詞分解するとともに品詞分解
された語句のうちWebページ間での出現頻度の高い語
句が共通語句として抽出される。所望の内容を含む可能
性が高いとみなされたWebページをさらに明確に特定
するためにそれらのWebページに共通して出現頻度が
高い共通語句を抽出する際、文章を品詞分解し、名詞、
形容詞、副詞、動詞等に区分けして共通語句を抽出する
ようにしたほうが、きめのこまかい内容チェックが可能
となるので好都合である。
【0010】さらに好ましいことは、不適合グループに
属するWebページからも共通語句を抽出し、これらの
語句を排他的な検索キーワードとして用いることであ
る。簡単な例で言えば、「フランスパンの作り方」を知
りたい場合に、フランスパンというキーワードを用いた
検索結果には、パンの販売に関するページが多く含ま
れ、不適合グループに属することになるが、これから
「販売」や「価格」といった共通語句を抽出し、これら
を排他的な検索キーワードとして用いることで、そのよ
うな類似するが関心のないページが排除され、より所望
の検索結果を取得するということである。
【0011】本発明のさらに好適な実施形態において、
前記検索キーワード生成ステップにおいて、前記共通語
句抽出ステップにおいて抽出された共通語句をユーザに
よる選択のためにユーザ端末に転送するとともにユーザ
によって選択された語句に基づいて新たな検索キーワー
ドが生成され、この新たな検索キーワードが前記検索結
果取得ステップで用いられる。この方法では、ユーザは
抽出された共通語句のリストから所望の情報に関係深い
語句、あるいは場合よっては含まれていては困る語句を
選択するだけで、新たな検索キーワードが生成され、新
たな検索が行われるので、ユーザの検索作業負担が軽減
される。
【0012】本発明は上述したフィードバック型インタ
ーネット検索方法だけではなく、この方法を実施するた
めの検索システムや、この方法をコンピュータに実施さ
せるためのプログラムを記録した記録媒体及びプログラ
ム自体をも含んでいる。特に、本発明によるフィードバ
ック型インターネット検索システムは、端末から与えら
れた検索キーワードを用いてインターネット上の検索エ
ンジンからWebページの検索結果を取得する検索エン
ジンアクセス部と、各検索結果に対する適否を求める文
書を作成してクライアントに送信する検索結果適否文書
作成部と、クライアントから返信された各検索結果に対
する適否データに基づいて検索結果を適合グループと不
適合グループに区分けする検索結果区分け部と、適合グ
ループに属する検索結果に該当するWebページのテキ
ストデータから共通語句を抽出する共通語句抽出部と、
前記抽出された共通語句から新たな検索キーワードを生
成するキーワード生成部とを備えており、上述した全て
の作用・効果を実現することが可能である。さらに本発
明では、端末から与えられた検索キーワードを用いてイ
ンターネット上の検索エンジンからWebページの検索
結果を取得する機能と、各検索結果に対する適否を求め
る文書を作成してユーザに判定させる機能と、ユーザに
よって判定された各検索結果に対する適否に基づいて検
索結果を適合グループと不適合グループに区分けする機
能と、適合グループに属する検索結果に該当するWeb
ページのテキストデータから共通語句を抽出する機能
と、前記抽出された共通語句から新たな検索キーワード
を生成する機能と、をコンピュータに実現させるための
プログラムも提案されており、上述した全ての作用、効
果を得ることが可能である。本発明によるその他の特徴
及び利点は、以下図面を用いた実施例の説明により明ら
かになるだろう。
【0013】
【発明の実施の形態】図1には、本発明によるフィード
バック型インターネット検索技術を実現している検索仲
介サーバ1が機能ブロック図の形で示されている。この
検索仲介サーバ1は、この実施形態では、検索エンジン
2やユーザ端末3などと同様に、ルータ4を介してイン
ターネット5に接続されているが、ネットワークの形態
としては、インターネット5以外、イントラネットやエ
キストラネットなどを本発明から除外しているわけでは
ない。
【0014】検索エンジン2のタイプとしては、ディレ
クトリ型検索エンジンやロボット型検索エンジンあるい
はその両方を兼ね備えたものが知られているが、ここで
はロボット型検索エンジンを取り扱うことにする。現在
よく知られたロボット型検索エンジン2としては、「g
oo」(http://www.goo.ne.jp)や「InfoseekJ
apan」(http://www.infoseek.co.jp)がよく知られ
ている。
【0015】ユーザ端末3は、一般には、インターネッ
ト5にインターネットプロバイダを介して常時接続ある
いはダイアルアップ接続されたパソコンとそれに搭載さ
れたWWWブラウザ3aから構成される。ユーザが従来
のやり方でインターネット検索する場合、検索エンジン
2にアクセスして、検索キーワードを入力すると、その
キーワードを含んだ全てのページのリンクがリストアッ
プされるので、順番にリンクをたどってページの内容が
興味あるものかどうかをチェックしていくことになる。
これに対して、本発明のこの実施形態では、ユーザは一
旦検索仲介サーバ1を介して検索エンジン2にアクセス
し、得られた検索結果から抽出された共通語句のうちユ
ーザが認定したものを用いて新たな検索キーワードが作
成され、再度検索エンジン2を用いて検索を再実行す
る。もちろん、この検索仲介サーバないしは検索仲介プ
ログラムを検索エンジン2側に直接備えさせる形態を採
用しても良い。さらにには、ユーザ端末3を構成するパ
ソコンに直接この検索仲介プログラムを搭載しても良
い。
【0016】検索中継サーバ1は、本発明に関連する主
要要素として、インターネット5を介してのユーザのた
めの窓口として機能するWWWサーバ部10と、このW
WWサーバ部10から送り出したHTML文書(Web
ページ)を通じてユーザ端末3から与えられた検索キー
ワードを用いて検索エンジン2からWebページの検索
結果を取得する検索エンジンアクセス部11と、取得し
た検索結果(Webページリンクリスト)から各検索結
果に対する適否を求めるHTML文書を作成してユーザ
端末3に送信する検索結果適否文書作成部12と、ユー
ザ端末3から返信された前述の各検索結果に対する適否
データに基づいて先ほどの検索結果を適合グループと不
適合グループに区分けする検索結果区分け部13と、適
合グループ及び不適合グループに属するそれぞれの検索
結果に該当するWebページのテキストデータから共通
語句を抽出する共通語句抽出部14と、適合グループに
属する検索結果から抽出された共通語句に基づいて新た
な検索キーワードを生成するとともに、不適合グループ
に属する検索結果から抽出された共通語句基づいて排他
的な検索キーワードを生成するキーワード生成部15と
を備えている。
【0017】WWWサーバ部10には、図2で示したよ
うな、検索画面をユーザ端末3のWWWブラウザ3a画
面に作り出すHTML文書が用意されている。図面から
明らかなように、複数の検索キーワードを入力すること
ができる入力ボックスや各入力キーワード間の論理式を
規定するポップアップメニュが設けられていると共に、
使用される検索エンジンを指定するための選択ボタンも
用意されており、この検索画面はメタ検索として利用す
ることができる。ユーザが検索中継サーバ1にアクセス
してくると、まずこの検索画面のHTML文書がWWW
サーバ部10からユーザ端末3に送られる。ユーザによ
って、適当な検索キーワードが入力されるとともに使用
すべき検索エンジンが選択された後送信ボタンがクリッ
クされることで、検索キーワードと選択された検索エン
ジン名のデータがWWWサーバ部10に返される。
【0018】ユーザ端末3から送られてきた検索キーワ
ードと選択された検索エンジン名は、検索エンジンアク
セス部11に引き渡される。検索エンジンアクセス部1
1は、ユーザによって与えられた検索キーワードをもっ
て選択された検索エンジン2にアクセスして、典型的に
は図3で示すような検索結果を取得する。
【0019】取得された検索結果は検索結果適否文書作
成部12に送られ、ここで、図4に示すように、その検
索結果に対してユーザの関心に適するか適しないかを判
定してもらうための検索結果適否文書(HTML文
書)、つまり検索結果としての各Webページのタイト
ルや本文の一部の左横に適合又は不適合を選択するチェ
ックボックスを設けた文書であり、画面サイズに合わせ
てページ替え表示できるように作成されている。この検
索結果適否文書はWWWサーバ部10を通じてユーザ端
末3に送信され、ユーザによる適否チェックを受ける。
全ての検索結果に対して適否チェックを行ったかどうか
にはかかわらず、決定ボタンがクリックされると、適否
データがWWWサーバ部を介して検索結果区分け部13
に与えられる。検索結果区分け部13は、この適否チェ
ックデータに基づいて該当する検索結果としてのWeb
ページを適合グループと不適合グループとに区分けす
る。
【0020】共通語句抽出部14は、適合グループと不
適合グループのそれぞれに属する検査結果(Webペー
ジのリンクデータ)を用いてそのWebページにアクセ
スし、HTML文書を取得する。共通語句抽出部14は
それ自体は公知の単語抽出アルゴリズムを備えており、
取得したHTML文書のテキスト本文は、辞書を用いて
品詞分解され、品詞分解された単語の中から予め設定さ
れている非キーワード用語を排除して、共通語句用単語
として切り出され、出現頻度でソーティングされる。処
理対象となる全てのWebページに対する語句抽出が完
了すると、各Webページに対する出現頻度の高い語句
から順に共通語句として選び出される。
【0021】共通語句抽出部14によって得られた共通
語句はその出現頻度とともにキーワード生成部15に引
き渡される。キーワード生成部15は、それらの共通語
句と出現頻度を用いて、図5に示すようなキーワード選
択画面をHTML文書として作成し、WWWサーバ部1
0を通じてユーザ端末3に送り出す。このキーワード選
択画面には、各共通語句と出現頻度の左横に論理積用キ
ーワードとして利用することを意味する「利用」のチェ
ックボックスが設けられている適合語句領域と排他用キ
ーワードとして利用することを意味する「排他」のチェ
ックボックスが設けられている不適合領域に分かれてい
る。
【0022】適合語句領域には、前述した適合グループ
から抽出された共通語句が、不適合領域には不適合グル
ープから抽出された共通語句がリストアップされる。こ
れは、適合グループからの共通語句はユーザが所望する
ページを的確に表す可能性高く、不適合グループからの
共通語句はユーザが一部は類似するとしても所望しない
ページを的確に表す可能性が高いからである。例えば、
本物の特定自動車に関するページを探す場合、検索結果
として挙がる可能性が高い模型自動車のページは「模
型」という語句を排他的(XOR)キーワードとして選
択することにより「模型」という語句を含むページは検
索結果から省かれるので、より効率的な検索が可能にな
る。
【0023】もちろん、キーワード選択画面として、上
記実施形態の代わりに、図6に示しように、適合領域と
不適合領域の区別をせずに、ユーザによって共通語句を
「利用」又は「排他」のいずれかに選択してもうらうよ
うに構成してもよい。
【0024】いずれにしても、ユーザ端末から「利用」
「排他」のチェックデータが戻されてくると、キーワー
ド生成部15が「利用」にチェックされた共通語句はA
NDで「排他」にチェックされた共通語句はXORで検
索論理式を作成する。その際、ここでは図示されていな
い類似語辞書を用いて、類似する共通語句、例えば「カ
ー」と「自動車」、「販売」と「セール」などに対して
は、ANDの論理式ではなくORの論理式を用いるよう
にする。もちろん、前述したキーワード選択画面におい
て、ANDとしてもちいるかORとして用いるかを選択
できるように、つまり「利用」の項目を2つの分けてチ
ェックしてもらうようにしてもよい。いずれにしても、
作成された検索論理式を新たな検索キーワードとして検
索エンジンアクセス部11に引き渡し、再び検索結果を
求める。
【0025】このような検索結果から共通語句を抽出し
て再度検索キーワードを作成して検索をやり直すといっ
た一連のシーケンスを必要に応じて繰り返すことによ
り、ユーザの求める情報に適切に絞り込んだ検索結果が
得られるようになる。例えば、図4で示されている検索
結果適否文書を見てユーザが十分絞り込めたと判断した
場合、その検索結果適否文書にあるリンク先を示すUR
Lをクリックして直接そのWebページを訪れて内容を
閲覧していくとよい。
【0026】次に、この検索仲介サーバ1におけるフィ
ードバック検索の一連のシーケンスを昔のフォーミュラ
ーカーの情報を求めるユーザを例として説明する。 〔第1ステップ〕まずユーザは、検索中継サーバ1にア
クセスして、図2で示されたようなフィードバック検索
画面の検索キーワードの入力ボックスに「フォーミュラ
ーカー」を入力し、使用検索エンジンとして「goo」
を選択して、送信ボタンをクリックする。
【0027】〔第2ステップ〕検索エンジン2「go
o」対して検索キーワード「フォーミュラーカー」を与
えて得られた図3のような検索結果、ヒットした数百に
及ぶWebページの一覧から、図4で示したようなから
得られた検索結果適否文書を作成してユーザ端末3に送
信する。ユーザはこの検索結果適否文書の画面を見なが
ら、フォーミュラーカーの写真やレースレポートなどが
掲載されていそうなWebページには適合チェックを入
れ、フォーミュラーカーのラジコン模型やレーシングラ
イセンス取得などに関するWebページには不適合チェ
ックを入れる。少なくともある程度のチェックが完了す
ると決定ボタンをクリックして、適否チェックのデータ
を検索中継サーバ1に返す。
【0028】〔第3ステップ〕適否チェックデータに基
づいて、先ほどの検索結果としてのWebページを適合
グループと不適合グループに分けるとともに、それぞれ
のWebページの実際の内容を取り込んで、そのテキス
トデータから共通語句を抽出する。例えば、適合グルー
プにおける共通語句として、「フォーミュラーカー」、
「モンテカルロ」、「アイルトン・セナ」「写真」、
「歴史」、「富士スピードウエイ」、「成績」などが挙
げられ、不適合グループにおける共通語句として、「模
型」、「ラジコン」、「販売」などが挙げられる。これ
らの共通語句は、その出現頻度順に並び換えられ、ユー
ザ端末2に、図5で示すようなキーワード選択画面の形
で表示される。
【0029】〔第4ステップ〕ユーザは、キーワード選
択画面を通じて、所望の情報にマッチした肯定的なキー
ワードとして用いるべき共通語句、例えば「フォーミュ
ラーカー」と「歴史」など、を、そして排他的なキーワ
ードとして用いるべき共通語句、例えば「ラジコン」や
「模型」などを選択的にチェックして、その結果をデー
タを検索中継サーバ1に返す。
【0030】〔第5ステップ〕キーワードとして選ばれ
た共通語句から論理式を生成し、これを検索キーワード
として検索エンジン2から検索結果を取り出す。その結
果を再び、検索結果適否文書としてユーザ端末3に送り
出す。ユーザはその検索結果適否文書を見て、十分な絞
り込みが行われたと判断して各Webページを訪問する
かあるいは、さらなる絞り込みを目指して第2ステップ
以降の処理を繰り返す。
【0031】以上説明したように、本発明によるフィー
ドバック検索では、ユーザは最初に一般的な検索キーワ
ードを与えるだけで、後は、表示される検索結果に対し
て少なくとも部分的に適否チェックを行うだけで、検索
信頼度の高い検索キーワードとなるべき共通語句が表示
され、それを適当に選ぶことで、新たな検索結果が得ら
れるので、専門的なサーチ技術がなくとも、何千、何万
といった検索結果からも効率的な絞り込み検索が可能と
なる。
【0032】なお、本発明では、インターネットという
言葉はイントラネットやエクストラネットも含めた広義
の意味で用いられており、このフィードバック型インタ
ーネット検索技術がイントラネットやエクストラネット
で利用されることは当然本発明の枠内にはいる。
【0033】また、インターネット5を行き来する文書
のフォーマットしてはHTML文書以外、例えばXML
文書などを取り扱うならば、共通語句抽出処理時におい
て各語句が本来有している意味をも、例えば商品名を表
す語句であるとか、会社名を表す語句であるとか、を考
慮することができるので、本発明にとって好都合であ
る。
【図面の簡単な説明】
【図1】本発明によるフィードバック型インターネット
検索技術を実現している検索仲介サーバの模式図
【図2】フィードバック検索画面の一例を示す説明図
【図3】検索エンジンにおける検索結果の一例を示す説
明図
【図4】検索結果適否文書画面の一例を示す説明図
【図5】出現頻度順にリストアップされた共通語句を含
むキーワード選択画面の一例を示す説明図
【図6】キーワード選択画面の変形例を示す説明図
【符号の説明】
1 検索仲介サーバ 2 検索エンジン 3 ユーザ端末 4 ルータ 5 インターネット 10 WWWサーバ部 11 検索エンジンアクセス部 12 検索結果適否文書作成部 13 検索結果区分け部 14 共通語句抽出部 15 キーワード生成部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】ユーザ端末から与えられた検索キーワード
    を用いてインターネット上の検索エンジンからWebペ
    ージの検索結果を取得するステップと、 検索結果の少なくとも一部に関して各検索結果に対する
    適否を求める文書を作成してユーザに判定させるステッ
    プと、 ユーザによって判定された各検索結果に対する適否に基
    づいて検索結果を適合グループと不適合グループに区分
    けするステップと、 適合グループに属する検索結果に該当するWebページ
    のテキストデータから共通語句を抽出するステップと、 前記抽出された共通語句から新たな候補となる検索キー
    ワードを生成するステップと、 を備えたことを特徴とするフィードバック型インターネ
    ット検索方法。
  2. 【請求項2】前記共通語句抽出ステップにおいて、該当
    するWebページのテキストデータを品詞分解するとと
    もに品詞分解された語句のうちWebページ間での出現
    頻度の高い語句を共通語句として抽出することを特徴と
    する請求項1に記載のフィードバック型インターネット
    検索方法。
  3. 【請求項3】前記共通語句抽出ステップにおいて不適合
    グループに属する検索結果に該当するWebページのテ
    キストデータからも共通語句を抽出するとともに、検索
    キーワード生成ステップにおいてこの不適合グループに
    属する共通語句から排他的な検索キーワードを生成する
    ことを特徴とする請求項1又は2に記載のフィードバッ
    ク型インターネット検索方法。
  4. 【請求項4】前記検索キーワード生成ステップにおい
    て、前記共通語句抽出ステップにおいて抽出された共通
    語句をユーザによる選択のためにユーザ端末に転送する
    とともにユーザによって選択された語句に基づいて新た
    な検索キーワードが生成され、この新たな検索キーワー
    ドが前記検索結果取得ステップで用いられることを特徴
    とする請求項1〜3のいずれかに記載のフィードバック
    型インターネット検索方法。
  5. 【請求項5】端末から与えられた検索キーワードを用い
    てインターネット上の検索エンジンからWebページの
    検索結果を取得する機能と、 各検索結果に対する適否を求める文書を作成してユーザ
    に判定させる機能と、ユーザによって判定された各検索
    結果に対する適否に基づいて検索結果を適合グループと
    不適合グループに区分けする機能と、 適合グループに属する検索結果に該当するWebページ
    のテキストデータから共通語句を抽出する機能と、 前記抽出された共通語句から新たな検索キーワードを生
    成する機能と、 をコンピュータに実現させるためのプログラムを記録し
    たコンピュータ読み取り可能な記録媒体。
  6. 【請求項6】端末から与えられた検索キーワードを用い
    てインターネット上の検索エンジンからWebページの
    検索結果を取得する検索エンジンアクセス部と、 各検索結果に対する適否を求める文書を作成してクライ
    アントに送信する検索結果適否文書作成部と、 クライアントから返信された各検索結果に対する適否デ
    ータに基づいて検索結果を適合グループと不適合グルー
    プに区分けする検索結果区分け部と、 適合グループに属する検索結果に該当するWebページ
    のテキストデータから共通語句を抽出する共通語句抽出
    部と、 前記抽出された共通語句から新たな検索キーワードを生
    成するキーワード生成部と、 を備えたことを特徴とするフィードバック型インターネ
    ット検索システム。
JP2001014325A 2001-01-23 2001-01-23 フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体 Pending JP2002215642A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001014325A JP2002215642A (ja) 2001-01-23 2001-01-23 フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001014325A JP2002215642A (ja) 2001-01-23 2001-01-23 フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体

Publications (1)

Publication Number Publication Date
JP2002215642A true JP2002215642A (ja) 2002-08-02

Family

ID=18881037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001014325A Pending JP2002215642A (ja) 2001-01-23 2001-01-23 フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体

Country Status (1)

Country Link
JP (1) JP2002215642A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085628A (ja) * 2004-09-17 2006-03-30 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラム及び記憶媒体
JP2008262559A (ja) * 2007-04-10 2008-10-30 Nhn Corp ディレクトリタグ付けサービスを提供する方法及びシステム
US7536445B2 (en) 2003-02-25 2009-05-19 International Business Machines Corporation Enabling a web-crawling robot to collect information from web sites that tailor information content to the capabilities of accessing devices
US7788327B2 (en) 2002-11-28 2010-08-31 Panasonic Corporation Device, program and method for assisting in preparing email
JP2011221979A (ja) * 2010-04-02 2011-11-04 Qinghua Univ 検索支援システム、検索支援方法及び検索支援プログラム
US8135733B2 (en) 2007-12-03 2012-03-13 Pioneer Corporation Information retrieval apparatus, information retrieval method and information retrieval processing program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7788327B2 (en) 2002-11-28 2010-08-31 Panasonic Corporation Device, program and method for assisting in preparing email
US7536445B2 (en) 2003-02-25 2009-05-19 International Business Machines Corporation Enabling a web-crawling robot to collect information from web sites that tailor information content to the capabilities of accessing devices
JP2006085628A (ja) * 2004-09-17 2006-03-30 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラム及び記憶媒体
JP4520264B2 (ja) * 2004-09-17 2010-08-04 株式会社リコー 文書検索装置、文書検索方法、プログラム及び記憶媒体
JP2008262559A (ja) * 2007-04-10 2008-10-30 Nhn Corp ディレクトリタグ付けサービスを提供する方法及びシステム
JP4728364B2 (ja) * 2007-04-10 2011-07-20 エヌエイチエヌ コーポレーション ディレクトリサービス提供方法及びシステム。
US8135733B2 (en) 2007-12-03 2012-03-13 Pioneer Corporation Information retrieval apparatus, information retrieval method and information retrieval processing program
JP2011221979A (ja) * 2010-04-02 2011-11-04 Qinghua Univ 検索支援システム、検索支援方法及び検索支援プログラム

Similar Documents

Publication Publication Date Title
Görg et al. Combining computational analyses and interactive visualization for document exploration and sensemaking in jigsaw
Jansen et al. Determining the informational, navigational, and transactional intent of Web queries
US7289985B2 (en) Enhanced document retrieval
Segev et al. Context-based matching and ranking of web services for composition
US8060513B2 (en) Information processing with integrated semantic contexts
US7305389B2 (en) Content propagation for enhanced document retrieval
JP4731479B2 (ja) 検索システム及び検索方法
EP2041669B1 (en) Text categorization using external knowledge
US7861151B2 (en) Web site structure analysis
US7519588B2 (en) Keyword characterization and application
US8103682B2 (en) Method and system for fast, generic, online and offline, multi-source text analysis and visualization
US20100005087A1 (en) Facilitating collaborative searching using semantic contexts associated with information
US9251249B2 (en) Entity summarization and comparison
US20100153371A1 (en) Method and apparatus for blending search results
CN110637316B (zh) 用于预期对象识别的系统和方法
KR20040020954A (ko) 문서를 개념적으로 분류하기 위한 요약 및 클러스터링
US20040015485A1 (en) Method and apparatus for improved internet searching
JP2002245061A (ja) キーワード抽出
CN114238573A (zh) 基于文本对抗样例的信息推送方法及装置
JP2002215642A (ja) フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体
Moumtzidou et al. Discovery of environmental nodes in the web
US20220414129A1 (en) Contextual search in collaborative communications applications
JP4348145B2 (ja) 文章分類プログラム、文章分類方法および文章分類装置
Choudhary et al. Exploring the Landscape of Web Data Mining: An In-depth Research Analysis
de Mendonça et al. Recommender Systems based on Scientific Publications: A Systematic Mapping.