JP2008262442A - 検索キーデータを表示させる方法及びサーバ - Google Patents

検索キーデータを表示させる方法及びサーバ Download PDF

Info

Publication number
JP2008262442A
JP2008262442A JP2007105532A JP2007105532A JP2008262442A JP 2008262442 A JP2008262442 A JP 2008262442A JP 2007105532 A JP2007105532 A JP 2007105532A JP 2007105532 A JP2007105532 A JP 2007105532A JP 2008262442 A JP2008262442 A JP 2008262442A
Authority
JP
Japan
Prior art keywords
data
keyword
web page
server
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007105532A
Other languages
English (en)
Inventor
Yu Miyazaki
祐 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007105532A priority Critical patent/JP2008262442A/ja
Publication of JP2008262442A publication Critical patent/JP2008262442A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ドキュメントデータに関連付けられた検索キーデータを表示させる方法及びサーバを提供すること。
【解決手段】サーバ10は、検索キーDB(例えば、インデックスDB1502)から、所定のWebページのIDデータ(例えば、URLデータ)に関連付けられた前記検索キーワードを読み出し、読み出した前記検索キーワードに含まれるキーワードデータ及び前記キーワードデータの重要度を表すウェイトデータに基づいて、所定の表示領域における前記キーワードデータの大きさを表す表示データ(例えば、修正コンテンツデータ)を生成し、生成した前記表示データを端末20に送信する。
【選択図】図3

Description

本発明は、検索キーデータを表示させる方法及びサーバに関する。
従来、ユーザが、端末でWebブラウザ等において検索キーワードを入力することにより、インターネット上で公開されているドキュメントデータの中から、当該検索キーワードを含むドキュメントデータを一覧にした検索結果を表示する情報検索サービスが行われている。なお、情報検索サービスを行うWebサイトを検索サイトともいう。
このような、検索サイトは、クローラといわれるプログラムが、インターネット上のWebサイトを自動的に巡回し、Webページを含むドキュメントデータを収集する。そして、インデクサといわれるプログラムが、当該ドキュメントデータを解析し、ドキュメント中に含まれるキーワードを、当該ドキュメントデータと関連付けてデータベースに記憶する。このことにより、検索サイトは、ユーザの検索キーワードを伴う検索要求に対して、該ユーザが所望する検索キーワードを含むドキュメントデータ群のリスト、又は検索キーワードを含むドキュメントデータを端末に表示させることができる。
このような状況において、特許文献1に記載の技術によれば、検索サイトが、収集したインターネット上のドキュメントデータから、キーワード(WEB語或いは検索語)の特徴或いは使用頻度を基に、キーワードが属するカテゴリの評価値を求め、各カテゴリを表現する領域の大きさ及び背景色を含む表示属性を決定する。そして、端末には、評価値に基づいて、円の大きさ等の表示を変更して、カテゴリを表示する。このことにより、ユーザが、キーワード(WEB語或いは検索語)からなる情報の大きさを、カテゴリ単位で直感的に把握することができる。
特開2005−267095号公報
しかしながら、特許文献1に記載の技術によっても、各々のドキュメントデータが、それぞれどのようなキーワードを含むドキュメントであるかを表示する技術は開示していない。更に、ドキュメントデータ毎に含まれるキーワードの重要度を表示する技術は開示されていない。
そこで、本発明は、各々のドキュメントデータに関連付けられた検索キーデータを表示させる方法及びサーバを提供することを目的とする。
より具体的には、本発明は、次のようなものを提供する。
(1) ユーザの端末(端末20)と通信ネットワーク(通信ネットワーク30)を介して接続可能なサーバ(サーバ10)が、Webページの検索キーデータ(例えばインデックスデータ)を前記端末に表示させる方法であって、
検索キーDB(例えば、インデックスDB)から、所定のWebページのIDデータ(例えば、URLデータ)に関連付けられた前記検索キーデータを読み出すステップと、
読み出した前記検索キーデータに含まれるキーワードデータ及び前記キーワードデータの重要度を表すウェイトデータに基づいて、所定の表示領域における前記キーワードデータの大きさを示す表示データ(例えば、修正コンテンツデータ)を生成するステップと、
生成した前記表示データを前記端末に送信するステップと、を含む方法。
本発明のこのような構成によれば、前記サーバは、検索キーDB(例えば、インデックスDB)から、所定のWebページのIDデータ(例えば、URLデータ)に関連付けられた前記検索キーワードを読み出し、
読み出した前記検索キーワードに含まれるキーワードデータ及び前記キーワードデータの重要度を表すウェイトデータに基づいて、所定の表示領域における前記キーワードデータの大きさを表す表示データ(例えば、修正コンテンツデータ)を生成し、
生成した前記表示データを前記端末に送信する。
このことにより、前記サーバは、所定のWebページ中のキーワードについて、キーワードデータ毎のウェイトデータに基づいて、表示の大きさを変えた表示データを生成することができる。
その結果、前記サーバは、ユーザが表示データを参照することによって、視覚的に容易に前記Webページが含むキーワード群を知ることができると共に、文字の大きさを比較観察することによって、それぞれのキーワードの重要度を知ることができる。
(2) (1)に記載の方法であって、
前記重要度は、前記Webページに含まれる前記キーワードデータの数に基づいて決定される方法。
本発明のこのような構成によれば、前記サーバは、前記重要度を、前記Webページに含まれる前記キーワードデータの数に基づいて決定する。
このことにより、前記サーバは、所定のWebページ中の、それぞれのキーワードの出現頻度に基づいて、当該キーワードの重要度を計算することができる。
その結果、前記サーバは、それぞれのキーワードを出現頻度に基づいて、キーワード毎に大きさを変えて表示することができる。
このように、所定のWebページ毎に、所定のWebページのキーワードデータの大きさを出現頻度に基づいて変化させて、例えば出現頻度が高いほど大きく表示することで、ユーザは、所定のWebページのキーワードの重要度を、文字の大きさに応じて知ることができる。
(3) (1)に記載の方法であって、
前記重要度は、Webページ検索サービスにおいて前記Webページが参照されたクエリーキーワードデータに一致する前記キーワードデータの数に基づいて決定される方法。
本発明のこのような構成によれば、前記サーバは、前記重要度を、Webページ検索サービスにおいて前記Webページが参照されたクエリーキーワードデータに一致する前記キーワードデータの数に基づいて決定する。
このことにより、前記サーバは、所定のWebページが検索された際の、クエリーキーワードに一致するキーワードデータの出現頻度に基づいて、当該キーワードの重要度を決定することができる。
その結果、前記サーバは、それぞれのキーワードを出現頻度に基づいて、キーワード毎に大きさを変えて表示することができる。
このように、所定のWebページ毎に、所定のWebページが検索されたキーワードを重要度に基づいて表示することで、ユーザは、所定のWebページのキーワードの重要度を、文字の大きさに応じて知ることができる。
(4) (1)から(3)のいずれかに記載の方法であって、
前記検索キーDBにおいて、所定のWebページの表示データに類似する表示データを持つWebページのIDデータを前記端末に送信するステップを更に含む方法。
本発明のこのような構成によれば、前記サーバは、前記検索キーDBにおいて、所定のWebページの表示データに類似する表示データを持つWebページのIDデータを前記端末に送信する。
このことにより、前記サーバは、所定のWebページの表示データと、他のWebページの表示データとを比較して、類似する表示データを持つWebページのIDデータ(例えば、URLデータ)を特定することができる。
その結果、前記サーバは、表示データのキーワードと、該キーワードの重要度が類似するWebページの、IDデータ(例えば、URLデータ)を端末に送信して表示させることができる。
このように、ユーザは、表示された所定のWebページと類似するWebページのURLを参照することで、類似するWebページを知ることができる。
(5) (4)に記載の方法であって、
前記所定のWebページの表示データに類似する表示データを持つWebページの表示データを前記端末に送信するステップを更に含む方法。
本発明のこのような構成によれば、前記サーバは、前記所定のWebページの表示データに類似する表示データを持つWebページの表示データを前記端末に送信する。
このことにより、前記サーバは、表示データのキーワードと、該キーワードの重要度が類似するWebページの、表示データを端末に送信して表示させることができる。
このように、ユーザは、表示された所定のWebページと類似するWebページの表示データを参照することで、類似するWebページのキーワードを知ることができる。
(6) ユーザの端末(端末20)と通信ネットワーク(通信ネットワーク30)を介して接続可能であり、Webページの検索キーデータ(例えばインデックスデータ)を前記端末に表示させるサーバ(サーバ10)であって、
検索キーDB(例えば、インデックスDB)から、所定のWebページのIDデータ(例えば、URLデータ)に関連付けられた前記検索キーデータを読み出すステップと、
読み出した前記検索キーデータに含まれるキーワードデータ及び前記キーワードデータの重要度を表すウェイトデータに基づいて、所定の表示領域における前記キーワードデータの大きさを示す表示データ(例えば、修正コンテンツデータ)を生成するステップと、
生成した前記表示データを前記端末に送信するステップと、を備えるサーバ。
本発明のこのような構成によれば、前記サーバは(1)と同様の作用を有する。
本発明によれば、前記サーバは、ユーザがWebページの表示データを参照することによって、視覚的に容易に前記Webページが含むキーワード群を知ることができると共に、文字の大きさを比較観察することによって、それぞれのキーワードの重要度を知ることができる。
以下、図面を参照しながら本発明の最良の実施形態の一例について述べる。
図1は、本発明の好適な実施形態の一例に係るシステム1の全体構成を示す図である。図2は、本発明の好適な実施形態の一例に係るサーバ10及び端末20のハードウェア構成の一例を示す図である。図3は、本発明の好適な実施形態の一例に係る端末20及びサーバ10の機能ブロック図である。図4は、本発明の好適な実施形態の一例に係るWebページデータ収集処理を示すフローチャートである。図5は、本発明の好適な実施形態の一例に係るキャッシュDB1501を示す図である。図6は、本発明の好適な実施形態の一例に係るインデックスDB1502を示す図である。図7は、本発明の好適な実施形態の一例に係る修正コンテンツデータ生成処理を示すフローチャートである。図8は、本発明の好適な実施形態の一例に係る検索結果表示処理を示すフローチャートである。図9は、本発明の好適な実施形態の一例に係る検索結果のデータ及び修正コンテンツデータの表示画面を示す図である。図10は、本発明の好適な実施形態の別の例に係る検索結果のデータ及び修正コンテンツデータの表示画面を示す図である。図11は、本発明の好適な実施形態の別の例に係る検索結果のデータ及び修正コンテンツデータの表示画面を示す図である。
[システムの全体構成]
図1は、本発明の好適な実施形態の一例に係るシステム1の全体構成を示す図である。
本実施形態におけるシステム1は、サーバ10が、通信ネットワーク30を介して、端末20及びWebサイト60と接続可能な状態で構成される。
サーバ10は、テキストや画像等を含んだドキュメントデータ(例えば、インターネットやイントラネット上のWebページ)を収集し記憶する。更に、サーバ10は、ドキュメントデータを解析して、インデックスデータを作成して記憶する。そして、端末20のWebブラウザ等からのユーザの検索要求に応じて、インデックスを検索した結果と、検索結果に含まれるそれぞれのドキュメントデータのインデックスを可視化したキーワード表示データ(例えば、修正コンテンツデータ)とを送信する機能を備えている。なお、サーバ10のハードウェアの数に制限はなく、必要に応じて、1又は複数のハードウェアで構成してよい。
Webサイト60は、ドキュメントデータ(例えば、Webページデータ)を蓄積しており、通信ネットワーク30、例えば、インターネット等のネットワークを通じて、これらのデータを端末20に送信する機能を有している。なお、個人や会社のホームページ等のWebページデータ群、又はWebページデータ群を管理しているインターネット上の場所を、Webサイトという。
通信ネットワーク30は、サーバ10、Webサイト60、及び端末20を接続する。ここで、通信ネットワーク30は、有線により実現するものだけではなく、携帯電話等のように、基地局を介して一部を無線により実現するもの、アクセスポイントを介して無線LANにより実現するもの等、本発明の技術的思想に合致するものであれば様々な通信ネットワークにより実現してよい。
[サーバ10のハードウェア構成]
図2は、図1で説明した本発明の好適な実施形態の一例に係るサーバ10のハードウェア構成の一例を示す図である。サーバ10は、制御装置130を構成するCPU(Central Processing Unit)131(マルチプロセッサ構成ではCPU132等複数のCPUが追加されてもよい)、バスライン105、通信I/F120、メインメモリ170、BIOS(Basic Input Output System)180、USBポート190、I/Oコントローラ160、並びにマウス及びキーボード111等の入力装置110や表示装置140を備える。
BIOS180は、サーバ10の起動時に制御装置130が実行するブートプログラムや、サーバ10のハードウェアに依存するプログラム等を格納する。
I/Oコントローラ160には、テープドライブ151、ハードディスク153、光ディスクドライブ152、半導体メモリ154等の記憶装置150を接続することができる。
記憶装置150を構成するハードディスク153は、サーバ10がサーバとして機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、更に必要に応じて各種データベースを構成可能である。
光ディスクドライブ152としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1521を使用する。光ディスク1521から光ディスクドライブ152によりプログラム又はデータを読み取り、I/Oコントローラ160を介してメインメモリ170又はハードディスク153に提供することもできる。また、同様にテープドライブ151に対応したテープメディア1511を主としてバックアップのために使用することもできる。
サーバ10に提供されるプログラムは、ハードディスク153、光ディスク1521、又はメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ160を介して、記録媒体から読み出され、又は通信I/F120を介してダウンロードされることによって、サーバ10にインストールされ実行されてもよい。
前述のプログラムは、内部又は外部の記憶媒体に格納されてもよい。ここで、記憶装置150を構成する記憶媒体としては、ハードディスク153、光ディスク1521、又はメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク153又は光ディスクライブラリー等の記憶装置を記録媒体として使用し、通信回線を介してプログラムをサーバ10に提供してもよい。
ここで、表示装置140は、ユーザにデータの入力を受け付ける画面を表示したり、サーバ10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
ここで、入力装置110は、ユーザによる入力の受け付けを行うものであり、マウス及びキーボード111等により構成してよい。
また、通信I/F120は、サーバ10を専用ネットワーク又は公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F120は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
以上の例は、サーバ10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより上記で説明した機能を実現することもできる。従って、本発明において一実施形態として説明したサーバにより実現される機能は、上述の方法を当該コンピュータにより実行することにより、或いは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
[端末20のハードウェア構成]
ここでユーザの端末20は、上述のサーバ10と同様の構成を備えてよい。端末20は、PC(Personal Computer)20aの他、携帯電話機20b、及びPDA(Personal Data Assistant)20c、等のいわゆるコンピュータ以外の通信端末であってもよい。
[システムの機能構成]
図3は、本発明の好適な実施形態の一例に係る端末20及びサーバ10の機能ブロック図である。
端末20は、入力部21、送受信部22、制御部23、及び表示部24により構成される。入力部21は、マウス及びキーボード211等の入力装置210を含んで構成し、ユーザの入力を受け付ける機能を有している。又、送受信部22は、通信I/F220を含んで構成し、データをサーバ10に送信する機能、及びサーバ10からデータを受信する機能を有している。更に、制御部23は、CPU231を含む制御装置230を含んで構成し、端末20を制御する機能を有している。そして、表示部24は、表示装置240を含んで構成し、データを表示する機能を有している。
サーバ10は、送受信部12、制御部13、及び記憶部15により構成される。送受信部12は、通信I/F120を含んで構成し、端末20からデータを受信する機能、及び端末20へデータを送信する機能を有している。又、制御部13は、CPU131を含む制御装置130を含んで構成し、サーバ10を制御する機能を有している。更に、記憶部15は、ハードディスク153等を含む記憶装置150を含んで構成し、データを記憶する機能を有している。
サーバ10の制御部13は、クローラ部1301、インデクサ部1302、インデックス取得部1303、ページ情報挿入部1304、検索部1305、タグ情報追加部1306、及びインデックス反映部1307を有している。クローラ部1301は、通信ネットワーク30を介して、Webページ等のドキュメントデータを収集する。なお、クローラとは一般的に検索ロボットともいわれ、通信ネットワーク30を通じて、Webサイト60からWebページデータを収集するプログラムである。そして、クローラが、Webサイトを探し出す手段や、対象とするWebページデータの種類は様々であり、クローラの管理者の設定により、収集されるWebページデータの種類や分野も異なる。
又、インデクサ部1302は、収集したドキュメントデータから、公知の形態素解析技術を用いて単語を抽出し、インデックスデータを作成する。そして、インデックス取得部1303は、可視化するインデックスデータを取得する。更に、ページ情報挿入部1304は、インデックスを可視化したキーワード表示データ(例えば、修正コンテンツデータ)を作成する。そして又、検索部1305は、ユーザの検索要求に応じて、インデックスを検索した結果と、検索結果に含まれるそれぞれのドキュメントデータのキーワード表示データとを送信する。そして更に、タグ情報追加部1306は、収集したドキュメントデータから、タグを抽出して、タグを可視化したキーワード表示データを作成する。そして、インデックス反映部1307は、タグを可視化したキーワード表示データをインデックスDB1502に記憶する。
サーバ10の記憶部15は、キャッシュDB1501、インデックスDB1502、及びタグDB1503により構成される。キャッシュDB1501は、クローラ部1301が収集したドキュメントデータを記憶している。又、インデックスDB1502は、ドキュメントデータのインデックス、URL、及び修正コンテンツデータ等を記憶している。そして、タグDB1503は、ドキュメントデータのタグ、及びURL等を記憶している。
[Webページデータ収集処理]
図4は、本発明の好適な実施形態の一例に係るWebページデータ収集処理を示すフローチャートである。
まず、サーバ10の制御部13が、送受信部12を介して、クローラ部1301により、Webページ等のドキュメントデータを収集する(ステップS101)。
次に、サーバ10の制御部13が、クローラ部1301により、収集したドキュメントデータを、記憶部15のキャッシュDB1501に記憶する(ステップS102)。なお、ドキュメントを識別する固有のID(例えば、URLデータ)とドキュメントデータとを関連付けて記憶してもよい。こうすることで、URLデータを基に、該URLのドキュメントデータを抽出することができる。具体的な、キャッシュDB1501の例について、図5に基づき説明する。
図5は、本発明の好適な実施形態の一例に係るキャッシュDB1501を示す図である。図5に示すように、キャッシュDB1501は、レコードにURL、及びドキュメントデータの欄を持つ。そして、1つ目のレコードには、URL「http://www.AAA.com」と該URLのWebページ(HTMLデータそのもの)が関連付けられている。同様に、2つ目のレコードには、URL「http://www.BBB.com」に該URLのWebページ(HTMLデータそのもの)が関連付けられている。
次に、図4に戻り、サーバ10の制御部13が、インデクサ部1302により、キャッシュDB1501のドキュメントデータ毎にインデックスを作成する(ステップS103)。ここでは、ドキュメントデータから形態素解析等により単語群が抽出される。そして、該単語群は、該ドキュメントデータの検索に使用するキーワード群、すなわち検索キー(以下、インデックスという)となる。形態素解析は、文を形態素(例えば、言語で意味を持つ最小単位)の列に分割し、接続詞や助詞を取り除く。形態素解析には様々な公知の手法があるが、いずれの手法を用いてもよい。
次に、サーバ10の制御部13が、インデクサ部1302により、各ドキュメントデータのインデックスを、各ドキュメントデータのURLデータと関連付けて、記憶部15のインデックスDB1502に記憶する(ステップS104)。具体的な、インデックスDB1502の例について、図6に基づき説明する。
図6は、本発明の好適な実施形態の一例に係るインデックスDB1502を示す図である。図6の(a)に示すように、インデックスDB1502は、レコードに、URL、インデックスキーワード、クエリーキーワード、及び修正コンテンツデータの欄を持つ。図6の(a)において、1つ目のレコードには、URL「http://www.AAA.com」に、インデックスキーワード「ラーメン(9)、スープ(6)、トロ肉(3)、トンコツ(2)、チェーン(2)、・・・」、クエリーキーワード「AAAラーメン(152)、AAAチェーン(130)、ラーメン(53)、トンコツラーメン(32)、・・・」、及び修正コンテンツデータ(例えば、HTMLデータ)が関連付けられている。同様に、2つ目以降のレコードにも、URLに、インデックスキーワード、クエリーキーワード、及び修正コンテンツデータが関連付けられている。
まず、インデックスDB1502のURL欄は、ドキュメントデータのURLを記憶する。又、インデックスキーワード欄は、該ドキュメントデータのインデックスのキーワード群と、各キーワードが該ドキュメントデータの中に出現した数と共に記憶する。例えば、1つ目のレコード「ラーメン(9)、スープ(6)、・・・」は、キーワード「ラーメン」が、URL「http://www.AAA.com」のドキュメントデータの中に9回出現したことを示す。同様に、キーワード「スープ」が、URL「http://www.AAA.com」のドキュメントデータの中に6回出現したことを示す。なお、キーワードがドキュメントデータの中に出現した数は、該キーワードの重要度を表す。
そして、インデックスDB1502のクエリーキーワード欄は、該ドキュメントデータが、どのような検索キーワード(以下、クエリーキーワードという)で検索されたかを、検索に用いられた回数と共に記憶する。例えば、1つ目のレコード「AAAラーメン(152)、AAAチェーン(130)、・・・」は、URL「http://www.AAA.com」のドキュメントデータが、クエリーキーワード「AAAラーメン」を用いて、152回検索されたことを示す。同様に、キーワード「AAAチェーン」を用いて、130回検索されたことを示す。ここで、検索に用いられた回数は、サーバ10において、ユーザから検索要求がある毎に更新してもよい。なお、クエリーキーワードが検索に用いられた回数は、該キーワードの重要度を表す。更に、修正コンテンツデータ欄には、修正コンテンツデータ(例えば、HTMLデータ)が記憶される。
[修正コンテンツデータ生成処理]
図7は、本発明の好適な実施形態の一例に係る修正コンテンツデータ生成処理を示すフローチャートである。
まず、サーバ10の制御部13が、インデックス取得部1303により、インデックスDB1502から、キーワードを含むレコードを読み込む(ステップS201)。
次に、サーバ10の制御部13が、ページ情報挿入部1304により、読み込んだレコード毎に、修正コンテンツデータを生成する(ステップS202)。ここで、修正コンテンツデータは、キーワードの重要度を表すデータ(以下、ウェイトデータという)に基づいて、該キーワードの大きさを示す表示データである。そして、表示データにHTML等を用いることで、大きさを含む表示データを生成できる。なお、修正コンテンツデータは、インデックスキーワード及びクエリーキーワードのいずれを用いて生成してよい。
次に、サーバ10の制御部13が、ページ情報挿入部1304により、生成した修正コンテンツデータを、インデックスDB1502に記憶する(ステップS203)。ここで、修正コンテンツデータの具体的な例について、図6に基づき説明する。
図6の(b)は、URL「http://www.AAA.com」のドキュメントデータのインデックスキーワードを用いて生成した修正コンテンツデータを表す。ここでは、図6の(a)インデックスDB1502の1つ目のレコード インデックスキーワード「ラーメン(9)、スープ(6)、トロ肉(3)、・・・」を用いている。そして、「ラーメン(9)」は「スープ(6)」よりもウェイトデータが大きいことにより、文字が大きく表示されている。又、「スープ(6)」は「トロ肉(3)」よりもウェイトデータが大きいことにより、文字が大きく表示されている。更に、キーワードの表示順位が、ウェイトデータの大きさ順に決定されている。このように、ウェイトデータの大きさにより、文字の大きさを決定することで、ドキュメントデータのインデックスキーワードを各キーワードの重要度と共に、ユーザに視覚的に分かりやすく出力することができる。
図6の(c)は、URL「http://www.BBB.com」のドキュメントデータのインデックスキーワードを用いて生成した修正コンテンツデータを表す。ここでは、図6の(a)インデックスDB1502の2つ目のレコード インデックスキーワード「ラーメン(9)、博多(5)、ネギ(5)、・・・」を用いている。各キーワードの文字の大きさはウェイトデータに基づいて決定されている。そして、キーワードの表示が、五十音順に決定されている。このように、ウェイトデータの大きさにより、文字の大きさを決定し、表示を五十音順にすることで、ドキュメントデータのインデックスキーワードを各キーワードの重要度と共に、ユーザに視覚的に分かりやすく出力することができる。
図6の(d)は、URL「http://www.AAA.com」のドキュメントデータのクエリーキーワードを用いて生成した修正コンテンツデータを表す。ここでは、図6の(a)インデックスDB1502の1つ目のレコード クエリーキーワード「AAAラーメン(152)、AAAチェーン(130)、・・・」を用いている。そして、「AAAラーメン(152)」は「AAAチェーン(130)」よりもウェイトデータが大きいことにより、文字が大きく表示されている。更に、キーワードの表示順位が、ウェイトデータの大きさ順に決定されている。このように、ウェイトデータの大きさにより、文字の大きさ及び表示順位を決定することで、ドキュメントデータのクエリーキーワードを各キーワードの重要度と共に、ユーザに視覚的に分かりやすく出力することができる。
図6の(e)は、URL「http://www.BBB.com」のドキュメントデータのクエリーキーワードを用いて生成した修正コンテンツデータを表す。ここでは、図6の(a)インデックスDB1502の2つ目のレコード インデックスキーワード「BBBラーメン(131)、博多ラーメン(82)、ネギラーメン(32)、・・・」を用いている。各キーワードの文字の大きさはウェイトデータに基づいて決定されている。そして、キーワードの表示が、五十音順に決定されている。このように、ウェイトデータの大きさにより、文字の大きさを決定し、表示を五十音順にすることで、ドキュメントデータのクエリーキーワードを各キーワードの重要度と共に、ユーザに視覚的に分かりやすく出力することができる。
[検索結果表示処理]
図8は、本発明の好適な実施形態の一例に係る検索結果表示処理を示すフローチャートである。
まず、ユーザが、端末20の入力部21により、クエリーキーワード又はURLを入力する。なお、クエリーキーワード又はURLの入力は、Webブラウザにおいて、検索用フィールドに入力するものでもよいし、表示されている文字列をキーワードとして選択するものでもよい。そして、端末20の制御部23が、送受信部22を介して、クエリーキーワード又はURLを伴う検索要求データを、サーバ10に送信する。その後、サーバ10の制御部13が、送受信部12を介して、クエリーキーワード又はURLを伴う検索要求データを受信する(ステップS301)。
次に、サーバ10の制御部13が、検索部1305により、インデックスDB1502から、クエリーキーワードと同一のインデックスキーワードを持つレコードを抽出する。又は、検索要求データのURLを含むレコードを抽出する。そして、抽出したレコード又はレコード群は、各レコードの修正コンテンツデータを含む検索結果データとなる(ステップS302)。
次に、サーバ10の制御部13が、送受信部12を介して、修正コンテンツデータを含む検索結果データを端末20に送信する(ステップS303)。
そして、端末20の制御部23が、送受信部22を介して、修正コンテンツデータを含む検索結果データを受信し、表示部24により検索結果のデータ及び修正コンテンツデータを表示する。ここで、検索結果のデータ及び修正コンテンツデータ表示の具体的な例を、図9乃至図11に基づき説明する。
図9は、本発明の好適な実施形態の一例に係る検索結果のデータ及び修正コンテンツデータ表示を示す図である。
図9に示すように、ユーザの検索要求に応じて、URL検索結果のデータ及び修正コンテンツデータが表示されている。図9において、検索フィールド(図9の(a))に、ユーザが、URL「http://www.AAA.com」を入力している。そして、検索の結果、該URL「http://www.AAA.com」のホームページが表示されている(図9の(b))。更に、「http://www.AAA.com」のドキュメントデータに含まれるインデックスキーワードを可視化した、修正コンテンツデータが表示されている(図9の(c))。このようにすることで、ユーザが、表示されているホームページ(図9の(b))に含まれるキーワードを、重要度と共に知ることができる。又、ユーザが、該ユーザの所望するデータかどうかを修正コンテンツデータを参照することで、効率的に判断することができる。
なお、図9において、タグキーワード(図9の(d))は、ドキュメントデータのタグを用いて生成した修正コンテンツデータである。このようにすることで、ユーザが、表示されているホームページ(図9の(b))に含まれるタグを、重要度と共に知ることができる。なお、タグとは、あらかじめ定められた記法によりドキュメントデータに埋め込む形で記述される付加情報であり、表示されることを前提としない情報である。例えば、Webページの制作者が、該Webページがどのような内容であるかを、タグに記述することで、サーバ10のクローラ部1301が、Webページの全文を参照することなく、該Webページが収集の対象となるか否かを判定することができる。
ここで、タグを用いる修正コンテンツデータは、サーバ10のタグ情報追加部1306が、クローラ部1301が収集したドキュメントデータからタグを抽出し、タグDB1503にURLデータと関連付けて記憶する。そして、インデックス反映部1307が、タグDB1503の各レコードのタグを用いて修正コンテンツデータを生成し、インデックスDB1502の該URLのレコードに関連付けている。
図10は、本発明の好適な実施形態の別の例に係る検索結果のデータ及び修正コンテンツデータ表示を示す図である。
図10に示すように、ユーザの検索要求に応じて、検索キーワード(クエリーキーワード)による検索結果のデータ及び修正コンテンツデータが表示されている。図10において、検索フィールド(図10の(a))に、ユーザが、「ラーメン屋」を入力している。そして、検索の結果、「ラーメン屋」のURL群と各URLのWebページの要約が表示されている(図10の(b))。更に、各URLのWebページに含まれるインデックスキーワードを可視化した、修正コンテンツデータが表示されている(図10の(c))。このようにすることで、ユーザが、各Webページ(図10の(b))に含まれるキーワードを、重要度と共に知ることができる。又、ユーザが、該ユーザの所望するデータかどうかを修正コンテンツデータを見ることで、効率的に判断することができる。なお、クエリーキーワード及びタグを用いた修正コンテンツデータを表示してもよい。
図11は、本発明の好適な実施形態の別の例に係る検索結果のデータ及び修正コンテンツデータ表示を示す図である。
図11に示すように、ユーザの検索要求に応じて、URL検索結果のデータ、修正コンテンツデータ、類似サイト一覧が表示されている。図11において、検索フィールド(図11の(a))に、ユーザが、URL「http://www.AAA.com」を入力している。そして、検索の結果、該URL「http://www.AAA.com」のホームページが表示されている(図11の(b))。更に、「http://www.AAA.com」のドキュメントデータに含まれるインデックスキーワードを可視化した、修正コンテンツデータが表示されている(図11の(c))。そして更に、「http://www.AAA.com」の修正コンテンツデータに類似したWebサイト60の一覧が表示されている(図11の(d))。
ここで、類似サイト一覧(図11の(d))は、インデックスDB1502から「http://www.AAA.com」の修正コンテンツデータに類似する修正コンテンツデータを持つURLの、URL、修正コンテンツデータ、及びホームページのサムネイルを表示している。なお、修正コンテンツデータの、類似度の判定は、重要度の高いキーワードがより多く一致するもの同士を抽出すること等により実行してよい。例えば、「http://www.AAA.com」の修正コンテンツデータ「ラーメン(9)、スープ(6)、トロ肉(3)、・・・」に対して、「http://www.KKK.com」の修正コンテンツデータ「ラーメン(8)、スープ(6)、トロ肉(2)、・・・」が抽出されている。或いは、検索クエリーがより多く一致するものを抽出すること等により実行してもよい。そして、該ホームページの縮小表示をするサムネイル(図11の(e))は、ユーザが、検索結果から、クリック等による選択ができるように構成してよい。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
本発明の好適な実施形態の一例に係るシステム1の全体構成を示す図である。 本発明の好適な実施形態の一例に係るサーバ10及び端末20のハードウェア構成の一例を示す図である。 本発明の好適な実施形態の一例に係る端末20及びサーバ10の機能ブロック図である。 本発明の好適な実施形態の一例に係るWebページデータ収集処理を示すフローチャートである。 本発明の好適な実施形態の一例に係るキャッシュDB1501を示す図である。 本発明の好適な実施形態の一例に係るインデックスDB1502を示す図である。 本発明の好適な実施形態の一例に係る修正コンテンツデータ生成処理を示すフローチャートである。 本発明の好適な実施形態の一例に係る検索結果表示処理を示すフローチャートである。 本発明の好適な実施形態の一例に係る検索結果のデータ及び修正コンテンツデータの表示画面を示す図である。 本発明の好適な実施形態の別の例に係る検索結果のデータ及び修正コンテンツデータの表示画面を示す図である。 本発明の好適な実施形態の別の例に係る検索結果のデータ及び修正コンテンツデータの表示画面を示す図である。
符号の説明
1 システム
10 サーバ
20 端末
30 通信ネットワーク
60 Webサイト
1301 クローラ部
1302 インデクサ部
1303 インデックス取得部
1304 ページ情報挿入部
1305 検索部
1306 タグ情報追加部
1307 インデックス反映部
1501 キャッシュDB
1502 インデックスDB
1503 タグDB

Claims (6)

  1. ユーザの端末と通信ネットワークを介して接続可能なサーバが、Webページの検索キーデータを前記端末に表示させる方法であって、
    検索キーDBから、所定のWebページのIDデータに関連付けられた前記検索キーデータを読み出すステップと、
    読み出した前記検索キーデータに含まれるキーワードデータ及び前記キーワードデータの重要度を表すウェイトデータに基づいて、所定の表示領域における前記キーワードデータの大きさを示す表示データを生成するステップと、
    生成した前記表示データを前記端末に送信するステップと、を含む方法。
  2. 請求項1に記載の方法であって、
    前記重要度は、前記Webページに含まれる前記キーワードデータの数に基づいて決定される方法。
  3. 請求項1に記載の方法であって、
    前記重要度は、Webページ検索サービスにおいて前記Webページが参照されたクエリーキーワードデータに一致する前記キーワードデータの数に基づいて決定される方法。
  4. 請求項1から請求項3のいずれかに記載の方法であって、
    前記検索キーDBにおいて、所定のWebページの表示データに類似する表示データを持つWebページのIDデータを前記端末に送信するステップを更に含む方法。
  5. 請求項4に記載の方法であって、
    前記所定のWebページの表示データに類似する表示データを持つWebページの表示データを前記端末に送信するステップを更に含む方法。
  6. ユーザの端末と通信ネットワークを介して接続可能であり、Webページの検索キーデータを前記端末に表示させるサーバであって、
    検索キーDBから、所定のWebページのIDデータに関連付けられた前記検索キーデータを読み出すステップと、
    読み出した前記検索キーデータに含まれるキーワードデータ及び前記キーワードデータの重要度を表すウェイトデータに基づいて、所定の表示領域における前記キーワードデータの大きさを示す表示データを生成するステップと、
    生成した前記表示データを前記端末に送信するステップと、を備えるサーバ。
JP2007105532A 2007-04-13 2007-04-13 検索キーデータを表示させる方法及びサーバ Pending JP2008262442A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007105532A JP2008262442A (ja) 2007-04-13 2007-04-13 検索キーデータを表示させる方法及びサーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007105532A JP2008262442A (ja) 2007-04-13 2007-04-13 検索キーデータを表示させる方法及びサーバ

Publications (1)

Publication Number Publication Date
JP2008262442A true JP2008262442A (ja) 2008-10-30

Family

ID=39984860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007105532A Pending JP2008262442A (ja) 2007-04-13 2007-04-13 検索キーデータを表示させる方法及びサーバ

Country Status (1)

Country Link
JP (1) JP2008262442A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011192223A (ja) * 2010-03-17 2011-09-29 Yahoo Japan Corp クライアント装置、表示方法、プログラム、情報処理装置、及び情報処理システム
JP2018513477A (ja) * 2015-05-15 2018-05-24 グーグル エルエルシー 知識パネルのコンテキスチャライジング

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269237A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 文書閲覧システム
JPH11250086A (ja) * 1998-03-03 1999-09-17 Hitachi Ltd 検索支援システム
JP2002092032A (ja) * 2000-09-12 2002-03-29 Nippon Telegr & Teleph Corp <Ntt> 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
JP2003316807A (ja) * 2002-04-23 2003-11-07 Communication Research Laboratory 情報検索装置及び情報検索ソフトウェアを格納した記憶媒体
JP2004118543A (ja) * 2002-09-26 2004-04-15 Toshiba Corp 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム
JP2004287503A (ja) * 2003-03-19 2004-10-14 Nippon Telegr & Teleph Corp <Ntt> 情報検索システム、情報検索方法、情報検索プログラムおよび情報検索プログラムを記録した記録媒体
JP2004362451A (ja) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報表示方法及びシステム及び検索キーワード情報表示プログラム
JP2006113976A (ja) * 2004-10-18 2006-04-27 Toshiba Corp コンテンツ表示装置及びコンテンツ表示方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269237A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 文書閲覧システム
JPH11250086A (ja) * 1998-03-03 1999-09-17 Hitachi Ltd 検索支援システム
JP2002092032A (ja) * 2000-09-12 2002-03-29 Nippon Telegr & Teleph Corp <Ntt> 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
JP2003316807A (ja) * 2002-04-23 2003-11-07 Communication Research Laboratory 情報検索装置及び情報検索ソフトウェアを格納した記憶媒体
JP2004118543A (ja) * 2002-09-26 2004-04-15 Toshiba Corp 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム
JP2004287503A (ja) * 2003-03-19 2004-10-14 Nippon Telegr & Teleph Corp <Ntt> 情報検索システム、情報検索方法、情報検索プログラムおよび情報検索プログラムを記録した記録媒体
JP2004362451A (ja) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報表示方法及びシステム及び検索キーワード情報表示プログラム
JP2006113976A (ja) * 2004-10-18 2006-04-27 Toshiba Corp コンテンツ表示装置及びコンテンツ表示方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011192223A (ja) * 2010-03-17 2011-09-29 Yahoo Japan Corp クライアント装置、表示方法、プログラム、情報処理装置、及び情報処理システム
JP2018513477A (ja) * 2015-05-15 2018-05-24 グーグル エルエルシー 知識パネルのコンテキスチャライジング
US10402410B2 (en) 2015-05-15 2019-09-03 Google Llc Contextualizing knowledge panels
US11720577B2 (en) 2015-05-15 2023-08-08 Google Llc Contextualizing knowledge panels

Similar Documents

Publication Publication Date Title
US8458207B2 (en) Using anchor text to provide context
CA2783344C (en) Resource search operations
JP4857075B2 (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム
US9146999B2 (en) Search keyword improvement apparatus, server and method
CN101809572B (zh) 在搜索结果页面上包括交互式元素的系统和方法
JP5264892B2 (ja) 多言語情報検索
US7769771B2 (en) Searching a document using relevance feedback
JP4962986B2 (ja) コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム
JP4962945B2 (ja) ブックマーク・タグ設定装置
US7310633B1 (en) Methods and systems for generating textual information
US20080168053A1 (en) Method for improving quality of search results by avoiding indexing sections of pages
JP2006285656A (ja) 文書検索システム、記録媒体、プログラム、および文書検索方法
JP4850882B2 (ja) Webページにリンクを挿入する方法
JP4796527B2 (ja) ドキュメント絞り込み検索装置、方法及びプログラム
JP2008262442A (ja) 検索キーデータを表示させる方法及びサーバ
JP2009282593A (ja) コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム
JP2008102773A (ja) データを共通のフォーマットに変換する方法
JP5072792B2 (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5416023B2 (ja) 閲覧端末及び方法
JP5041802B2 (ja) クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法
JP4962973B2 (ja) 検索サーバ、方法及びプログラム
JP5108707B2 (ja) 検索サーバ装置、検索方法及びプログラム
JP5063568B2 (ja) 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法
JP4920661B2 (ja) インデックス生成方法、プログラム及びサーバ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110516

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20111021

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20111125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130603