JP4436177B2 - 検索装置 - Google Patents

検索装置 Download PDF

Info

Publication number
JP4436177B2
JP4436177B2 JP2004118356A JP2004118356A JP4436177B2 JP 4436177 B2 JP4436177 B2 JP 4436177B2 JP 2004118356 A JP2004118356 A JP 2004118356A JP 2004118356 A JP2004118356 A JP 2004118356A JP 4436177 B2 JP4436177 B2 JP 4436177B2
Authority
JP
Japan
Prior art keywords
information
search
content
keyword
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004118356A
Other languages
English (en)
Other versions
JP2005301759A (ja
Inventor
修 倉井
健太郎 岡田
暁 田中
正晴 江尻
実 串田
信行 今村
紋子 菅野
聡仁 木内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
SoftBank Mobile Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Mobile Corp filed Critical SoftBank Mobile Corp
Priority to JP2004118356A priority Critical patent/JP4436177B2/ja
Publication of JP2005301759A publication Critical patent/JP2005301759A/ja
Application granted granted Critical
Publication of JP4436177B2 publication Critical patent/JP4436177B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、携帯電話端末装置等の情報端末装置からの要求に応じて着信メロディ,画像等のコンテンツに関する情報を提供する検索装置に関する。
着信待機時の着信音あるいは着信メロディあるいは待ち受け画面等のデータ(コンテンツ)をネットワーク経由でHTTPサーバ等の情報提供サーバ装置から取得して、ユーザの好みに応じたカスタマイズが可能な携帯電話端末装置が知られている(例えば特許文献1参照。)。
提供可能なコンテンツの数が増えてくると、例えばカテゴリ別,アーティスト別,曲別等といったように、ディレクトリ毎に分類し、段階的にデータの選択を行うようにする必要が生じる。ところが、携帯電話端末装置の表示画面は、パーソナル・コンピュータ等の汎用の情報処理装置と比較して、サイズ的な制約が大きく、1画面に表示できる情報が限られてしまうため、目的とするコンテンツを見つけるまでの操作回数が多くなってしまう。
このため、インターネット等のネットワーク経由で提供されている情報検索サービスをこのようなデータの検索に使うことが考えられる。このような情報検索サービスでは、予め、検索ロボットによるクローリングによって、コンテンツを提供する情報提供サーバ装置が提供するコンテンツのアドレスを収集し、コンテンツのキーワード毎にデータベースに登録しておく。
検索サービスを提供するサーバ装置は、ユーザの端末装置からキーワードが供給されると、データベース中からキーワードに該当するコンテンツのアドレス等の情報を抽出し、検索結果として端末装置に提供する(例えば非特許文献1参照。)。
特開2000−76264号(第6−7頁、第1図、第2図) SEO JAPAN、"検索エンジンって何?"、2003年、[online]、SEO JPAN、[平成16年1月9日検索]、インターネット<URL:http://www.seojapan.jp/search-engines/search-engine.html>
ところで、ユーザの利便性,携帯電話端末装置の表示能力等を考えてリンクの階層数,ページサイズ等のコンテンツの提供ルールを設定することが考えられるが、上述のような検索サービスでは、検索結果に,提供ルールを遵守しない不正なコンテンツについての情報が含まれてしまう。
このような検索結果からユーザがコンテンツを選択しようとすると、選択回数が増えてしまったり、コンテンツを取得しても携帯電話端末装置で表示できなかったりして利便性が低下してしまう。
本発明は、上述のような課題に鑑みてなされたものであり、検索結果に不正なコンテンツについての情報が含まれないようにして、利便性の低下の防止に寄与することができる検索装置を提供することを目的とする。
上述の問題を解決するために、本発明に係る検索装置は、コンテンツ表示能力を示す情報(表示能力情報)に対応させて保持している複数のコンテンツ中に,ネットワークを介して供給される携帯端末装置からの情報提供要求(HTTPリクエスト)中の拡張ヘッダ中の表示能力情報に対応するコンテンツがある場合に当該コンテンツを提供するコンテンツ提供サーバが提供するコンテンツについての検索サービスを提供する検索装置であって、コンテンツ提供サーバがコンテンツを提供する携帯端末装置の機種について,コンテンツの表示能力毎に設定された携帯端末装置の機種グループ毎に,機種グループ内の代表機種の表示能力情報を保持する代表機種表示能力保持手段と、代表機種表示能力保持手段に保持されている各代表機種の表示能力情報を順次用い,当該表示能力情報を拡張ヘッダ中に含む複数の情報提供要求を生成し,生成した情報提供要求を用いてコンテンツ提供サーバが提供するコンテンツのアドレスを示すアドレス情報と当該コンテンツに対応するキーワードを示すキーワード情報を含むインデックスデータを取得する取得手段と、検索対象とするコンテンツに対応するキーワード情報(検索キーワード)を保持するキーワード保持手段と、検索キーワード及びインデックスデータの取得時に用いた表示能力情報に対応する代表機種を示す識別情報と当該インデックスデータのアドレス情報を対応付けて保持する検索インデックスと、検索インデックスに対するアドレス情報の追加を禁止する条件(禁止条件)を示す情報(禁止条件情報)を保持する禁止条件保持手段と、禁止条件保持手段に保持されている禁止条件情報に応じて禁止条件に該当するか否かを判断する追加制御手段と、取得手段が取得したインデックスデータ中のキーワード情報を抽出し,抽出したキーワード情報がキーワード保持手段に保持されている検索キーワードに一致し,追加制御手段が禁止条件に該当しないと判断した場合に,インデックスデータ中の当該キーワード情報に対応するアドレス情報を当該検索キーワード及びインデックスデータの取得時に用いた表示能力情報に対応する代表機種を示す識別情報に対応付けて検索インデックスに追加する解析手段と、携帯端末装置からの検索キーワード及び当該携帯端末装置の表示能力を示す表示能力情報を含む検索要求中の検索キーワード及び当該表示能力情報に対応するアドレス情報を検索インデックスから抽出し,当該アドレス情報を含む検索結果を生成して当該携帯端末装置に供給する応答手段とを有し、禁止条件情報は、インデックスデータの上限サイズを示す情報,追加を許可しないキーワード(削除ワード)を示す情報のいずれかを含み、追加制御手段は、取得手段が取得したインデックスデータのサイズが上限サイズを示す情報によって特定されるサイズを超えた場合,又は,インデックスデータ中に削除ワードを示す情報に一致する情報が含まれる場合,のいずれかの場合に、禁止条件に該当すると判断することを特徴とする。
本発明では、追加制御手段が、禁止条件保持手段に保持されている禁止条件情報に応じて解析手段による検索インデックスに対するアドレス情報追加を制御することにより、禁止条件に該当するコンテンツのアドレス情報を検索インデックスに追加することを阻止することができる。このため、検索インデックスから検索した検索結果に禁止条件に該当するコンテンツのアドレス情報が含まれることがない。
これにより、検索結果に不正なコンテンツについての情報が含まれないようにして、利便性の低下の防止に寄与することができる。
本発明は、例えば異なる表示能力を有する複数の形式の携帯電話端末装置に対して着信メロディ,画像等のデータ(コンテンツ)を提供する情報提供システムに適用することができる。
(全体構成)
本発明の一実施例に係る情報提供システムは、例えば図1に示すように、インターネット等のネットワーク1経由で着信メロディ,待ち受け画面等のコンテンツを提供する情報提供サーバ群10と、情報提供サーバ群10が提供するコンテンツに関する検索サービスを提供する検索サーバ(検索装置)20と、この検索サーバ20が提供する検索サービスを利用する携帯電話端末装置50及び携帯電話端末装置60を備えている。
携帯電話端末装置50は、例えばPDC(Personal Digital cellular)方式の移動体通信ネットワークからなる移動体通信網30を介して情報提供サーバ群10及び検索サーバ20にアクセス可能となっている。また、携帯電話端末装置60は、例えばW−CDMA(Wideband-Code Division Multiple Access)方式の移動体通信ネットワークからなる移動体通信網40を介して情報提供サーバ群10及び検索サーバ20にアクセス可能となっている。
(情報提供サーバ群構成)
情報提供サーバ群10は、例えば複数の情報提供サーバ(コンテンツ提供サーバ)100,200,…から構成されている。各情報提供サーバ100(200)は、当該情報提供サーバが提供するコンテンツを格納する情報格納部110(210)と、情報格納部110(210)に格納されているコンテンツをネットワーク1経由で提供するHTTPサーバ120(220)とを備えている。
これらの情報提供サーバ100,200が提供するコンテンツは、例えば階層的に管理されており、各階層毎のインデックスから選択を行うことによって、個々のコンテンツを選択することができるようになっている。
情報提供サーバ100は、コンテンツとして、例えば着信メロディの曲データを提供する。情報格納部110には、例えば曲データを曲毎に格納する曲データ格納領域111,112,…が設けられている。各曲データ格納領域111,112,…には、同一の曲に対して携帯電話端末装置50,60の表示能力に対応する1つないし複数のデータ形式の曲データが格納されている。例えば図1中の情報提供サーバ100の曲データ格納領域111には、曲AAAに対応する40音,16音,4音(これらは同時発生数を示している。)の曲データが格納されている状態を示している。
HTTPサーバ120に対するアクセス要求中には、例えばHTTPリクエスト中の拡張ヘッダ中に、携帯電話端末装置50の音声表示能力を示す情報(例えば“x−sound:##”[##は同時発音数を示す数字])が含まれており、HTTPサーバ120は、この情報に応じて、携帯電話端末装置50,60等の音声表示能力を認識することができるようになっている。
情報提供サーバ200は、コンテンツとして、例えば待ち受け画像等の画像データを提供する。情報格納部210には、例えば画像データを画像毎に格納する画像データ格納領域211,212,…が設けられている。各画像データ格納領域211,212,…には、同一の画像に対して携帯電話端末装置50,60の表示能力に対応する1つないし複数のデータ形式の画像データが格納されている。例えば図1中の情報提供サーバ200の画像データ格納領域211には、画像BAに対応する256色,4096色(これらは同時発色数を示している。)で低画素数,中画素数の画像データと65536色で高画素数(例えば200×150画素)の画像データが格納されている状態を示している。
HTTPサーバ220に対するアクセス要求中には、例えばHTTPリクエスト中の拡張ヘッダ中に、携帯電話端末装置50の画像表示能力を示す情報(例えば“x−display:**[**は表示画素数を示す文字列]”,“x−color:$$”[$$は同時発色数を示す文字列])が含まれており、HTTPサーバ220は、これらの情報に応じて、携帯電話端末装置50,60等の画像表示能力を認識することができるようになっている。HTTPサーバ220は、画像表示能力に応じた画像データを提供するようになっている。
(検索サーバ構成)
検索サーバ20は、所定のキーワード等に従って情報提供サーバ群10が提供するコンテンツ等のアドレス,データ種別を取得するクローリング部(クローリング手段)21と、クローリング部21によって得られたアドレス,データ種別等をキーワード等に対応させて保持するDB22と、携帯電話端末装置50,60等に対して検索サービスを提供する検索サービス提供部(検索手段,世代検出手段)23等を備えている。
DB22には、例えば図2に示すように、携帯電話端末装置50,60の機種毎の表示能力を所定の機種グループ毎に保持する表示能力対応表22Aと、クローリング部21によるクローリングのパターンを定義する収集パターン22Bと、クローリング結果を保持する検索インデックス22Cと、携帯電話端末装置50,携帯電話端末装置60の世代毎の検索結果の生成に用いるテンプレート22Dとが格納されている。
また、クローリング部21は、情報提供サーバ100,200,…によるコンテンツの提供が提供ルールを遵守しているか否かを判定する提供ルール判定部(判定手段)22Aを備えている。このクローリング部21は、収集パターン22Bに応じてHTTPクライアントと同様に、情報提供サーバ100,200に対するアクセスを繰り返し(クローリング)、提供ルール判定部22Aの判定結果に応じて提供ルールを遵守しているコンテンツのアクセス結果を検索インデックス22Cに格納する。
また、検索サービス提供部23は、携帯電話端末装置50,60からの検索サービス要求に応答するフロントエンドとして機能するHTTPサーバ23Aと、HTTPサーバ23Aを介して供給されるキーワードに応じて検索インデックス22Cから該当する情報を検索し、テンプレート22Dを用いて応答メッセージを構成する応答部(検索結果生成手段)23bとを備えている。
移動体通信網30は、上述のPDC方式による第2世代(回線交換によってデータ通信を行う)及び第2.5世代(パケット交換によってデータ通信を行う)の携帯電話端末装置50に対して移動体通信サービスを提供するものであり、携帯電話端末装置50との間の通信チャネルの割り当て等の処理を行う回線交換機31と、データ通信用のパケットの交換等の処理を行うパケット交換機32と、携帯電話端末装置50との間で無線通信を行う基地局装置(BS:Base Station)33a,33b,…,33nと、BS33a〜33nの管理を行う基地局制御装置BSC34と、第2世代の携帯電話端末装置50による通信のプロトコル変換等を行うゲートウェイ装置(GW)35とを備えている。
移動体通信網40は、上述のW−CDMA方式による第3世代の携帯電話端末装置60に対して移動体通信サービスを提供するものであり、携帯電話端末装置(UE:User Equipment)60と通信を行う基地局装置(NB:NodeB)42a,42b,…,42mと、各基地局装置42a〜42mの制御を行うRNC41a,41b,…,41mとを備えている。
(携帯電話端末装置詳細)
携帯電話端末装置50は、移動体通信網30を介して通話サービス,メールサービス等を利用できる他、情報提供サーバ群10が提供するコンテンツ提供サービス及び検索サーバ20が提供する検索サービスを利用することができるようになっている。この携帯電話端末装置50は、高周波信号の処理を行う高周波(RF:Radio Frequency)部51と、MPU52と、メモリ53と、ユーザからの指示等を入力する操作キー54と、ユーザに対する表示を行う表示部55と、音声信号の符号化/復号化を行う音声CODEC56と、MIC57と、スピーカ58とを備えている。
MPU52は、例えばメモリ53に保持されている制御プログラムを実行することにより、移動体通信網30を介した通信の制御を行う通信制御部510,電子メールの送受信を行う電子メールクライアント520,上述の情報提供サービス及び検索サービスの利用時の表示等を表示するWebブラウザ530として機能する。また、メモリ53内には、着信メロディ等の音声データを保持する音声データ保持部53aと、待ち受け画面等の画像データを保持する画像データ保持部53bとが設けられている。
携帯電話端末装置60も、携帯電話端末装置50と同様に、電子メールクライアント,Webブラウザ等を備えており、情報提供サーバ100,200が提供するコンテンツを利用することができるようになっている。
上述のHTTPサーバ120は、例えば図3に示すように、ネットワーク1経由で供給された携帯電話端末装置50等からの要求を解析する要求解析部121と、提供する情報を示すアドレスを有するインデックスデータを保持するインデックス保持部122と、要求解析部121からの指示に応じて情報格納部110からコンテンツを取得するコンテンツ取得部123と、コンテンツ取得部123が取得した情報から携帯電話端末装置50,60等に対する応答をネットワーク1経由で送出する応答部124とを備えている。HTTPサーバ220も、このHTTPサーバ120と同様の構成を備えている。
インデックス保持部122に保持されているインデックスデータは、例えば図4に示すように、情報(例えば曲データ)の選択を階層的に行い得るように、階層的に分類されて構成されている。また、インデックス保持部122に保持されているインデックスデータも同様に階層的に分類されて構成されている。これらのインデックスデータは、例えばHTML(Hyper Text Markup Language)形式等のページ記述データで構成されており、例えば上位のインデックスのページ記述データ中に下位のインデックスのアドレス(URL,URI等)を示すリンクを記述することによって、階層的的なリンク構造が形成されるように構成されている。
このような階層構成のインデックスにより、ユーザは、まず、例えば総合インデックスからカテゴリを選択し、次にカテゴリ別のインデックスからアーティストを選択し、アーティスト別のインデックスから曲を選択することによって、階層的に曲データの選択を行うことができるようになっている。
ところで、カテゴリ,アーティスト,曲データ等の数が増えてくると、各階層のインデックス中の選択肢が増加してしまう。この結果、各階層のインデックス中の項目が増加し、例えばユーザがスクロールして全体を確認するといった必要が生じ、目的の曲を探すまでの手間が増加してしまう。このため、例えば階層構造を細分化することも考えられるが、階層の選択回数が増えてしまうので、ユーザの手間はあまり減少しない。
このため、この情報提供システムでは、検索サーバ20によって、情報提供サーバ100,200,…が提供する情報について、キーワード等に応じた検索サービスを提供している。
(動作概要)
以下、情報提供サーバ100の曲データ格納領域111には、曲AAAの曲データとして、例えば40音と16音のSMAF(Synthetic music Mobile Application Format)形式のデータと、4音のSMD形式のデータが格納されている場合について説明する。
クローリング部21は、例えばHTTPサーバ120が提供しているインデックスデータのリンク構造を辿って、HTTPサーバ120が提供するコンテンツ(例えば曲データ)のアドレス(URL)を取得する。クローリング部21は、まず、HTTPサーバ120から総合インデックスのデータを取得し、順次下位のインデックスを辿って、曲データのリンクの記述を探す。曲データのリンクが見つかると、クローリング部21の判定部21Aは、条件保持部(禁止条件保持手段)21Bに保持されている禁止条件に該当するか否かを判定する。この禁止条件は、コンテンツの提供ルールに従っているか否かを判定するためのものであり、判定部21Aは、当該コンテンツ(例えば曲データ)が提供ルールに従っていなければ当該リンクについての処理を終了する。提供ルールに従っている場合には、クローリング部21は、曲データのファイル名、リンクの記述中の説明等が、DB22中のキーワード(k/w)リスト22E中のキーワード(例えば“AAA”)のいずれかに該当するか判断する。キーワードに該当するリンクがあれば、このリンクに対応する所定のアドレス(例えば広告,注意等の情報を含むページ(リンク先ページ)等)を当該キーワードに対応させて検索インデックス22Cに登録する。
上述のようなクローリング動作と非同期に、検索サービス提供部23は、携帯電話端末装置50から供給された検索条件に該当するコンテンツに関する情報を検索インデックス22Cから抽出し、検索結果として携帯電話端末装置50に供給する。
(条件に応じたコンテンツに関する情報の収集)
また、この情報提供サービスでは、検索開始ページからのリンクの階層数,ページサイズ,不正なアドレス,ドメイン名,拡張子,アンカー名(<A>〜</A>で囲まれた文字列),ContentType(MIME−TYPE),<METAタグ>等により、コンテンツの提供ルールを規定しており、この提供ルールに従っていないコンテンツについては、上述の検索サービスの対象外としている。具体的には、このような提供ルール(条件)を満たしていないコンテンツについては、検索サーバ20による検索結果に含まれないようにしている。以下、具体的な動作について説明する。
クローリング部21は、例えば図5に示すように、コンテンツ提供サイトあるいは検索開始アドレス毎に、コンテンツの属性情報をコンテンツ情報テーブルとして保持している。このコンテンツ情報テーブルには、例えば属性の番号(No)と属性名と属性値とが対応付けられて保持されている。このコンテンツ情報テーブルには、属性名として、例えばコンテンツを識別するためのコンテンツID(No:1),コンテンツ名称(No:2),検索結果を表示するページのアドレス(トップURL)[結果表示用](No:3),コンテンツ紹介文(No:4),キーワードの引継ぎを行う際のアドレス[キーワード引継ぎURL](No:5),コンテンツのカテゴリ(No:6),排除キーワード(No:7),追加ワード(No:8),削除ワード(No:9),コンテンツについての情報収集を開始するアドレス[収集開始URL](No:10),コンテンツまでのインデックスの階層数の上限[収集階層数](No:11),コンテンツについての情報収集を行う上限ページ数[収集上限ページ](No:12),収集上限時間(No:13),他ホスト収集可否(No:14),収集スケジュール[収集開始時間](No:15),収集スケジュール[周期](No:16),インデック値底上げ(No:17)と、これらに対応する属性値とが保持されている。なお、判定部21Aが番号と属性名の関係を別途記憶しておけば、コンテンツ情報テーブルには、番号と属性値とを対応付けて保持しておけば足りる。さらには、“,”等の所定の区切り記号で区切った値の文字列とし、区切り記号で区切られた位置で番号を認識するようにしてもよい。
コンテンツ情報テーブル内の属性名に対応する属性値の一部には、上述の提供ルールの一部が反映されている。具体的には、例えば収集階層数(No:11)には、収集開始URL(No:10)からの階層数が定義されており、収集対象の上限ページ数(No:12),情報の収集上限時間(No:13)が定義されている。また、排除キーワード(No:7)には、検索対象から排除すべきキーワードが定義されており、削除ワード(No:9)には削除すべきワードが定義されている。これらのキーワードとワードはいずれもクローリング部21による検索対象としない。
また、条件保持部21Bには、例えば図6に示すように、検索インデックス22Cに登録し得るコンテンツの条件(許可条件)を含むテーブルが格納されている。このテーブルには、クローリング部21が取得し得るインデックスファイルの拡張子と、情報を検索インデックス22Cに登録し得るインデックスファイルのMIME−TYPEを示す文字が含まれている。このテーブルは、判定部21Aが、クローリングの制御,クローリングによって得られた情報の蓄積の制御等において適宜参照する。
さらに、条件保持部21Bには、例えばクローリング部21によるクローリング時にリンク先としてみなしてリンク先を辿るタグを定義するテーブル(図7),インデックスファイル等の中の情報の収集時に考慮すべきタグについて定義するテーブル(図8),クローリング時に考慮すべきHTTPレスポンスヘッダについて定義するテーブル(図9)等が格納されている。なお、これらの図6〜図9に示すテーブルは、同様の判定をプログラムによって実行すれば、必ずしも設ける必要はない。
また、条件保持部21Bには、例えば図10に示すように、不正なアドレス,ドメイン名等を示す不正アドレステーブルが格納されている。このテーブルには、予め解っているコンテンツの提供ルールに従っていない情報提供サーバ100,200等のアドレスを登録しておく。
(判定処理)
上述のような条件の判断は、例えば図11に示すフローチャートに従って実行される。判定部21Aは、まず、例えば情報収集対象の情報提供サーバ100,200のサーバ証明書が有効であるか否かをチェックする(S1)。なお、このS1の処理は、httpsプロトコルで情報提供サーバ群10にアクセスする際のみに実行する。
次に、判定部21Aは、ロボット検索用の定義ファイルに応じたチェックを行う(S2)。情報提供サーバ100,200は、例えば図12に示すように、クローリング部21等のロボット検索用の定義ファイル“robots.txt”を保持しており、クローリング部21からの要求に応じてこの定義ファイルを送信する。クローリング部21は、別途ユニークなユーザ・エージェント(User−Agent)名を有しており、情報提供サーバ100,200から提供された定義ファイル“robots.txt”中のUser−Agent名が自らのUser−Agent名と一致している場合にのみ、当該定義ファイル“robots.txt”中の記述に従って情報提供サーバ100,200からの情報の収集を行う。
以上の処理(収集を行う前の判断フェーズ)が終了すると、判定部21Aは、URLの正規表現によるチェックを行い(S3)、正規表現に従ったURLのみをクローリングの対象とする。URLの表現形式は標準規格として規定されており、当該標準規格に準拠していないURLは誤動作の原因にもなるため、このようなチェックを行っている。
また、判定部21Aは、URL中のファイル名の拡張子が、上述の図6中に示すテーブル中で規定された拡張子であるか否かを判定し、規定されている拡張子である場合にのみクローリングを行う(S4)。さらに、判定部21Aは、URL中のドメイン名が上述の図10に示す不正アドレステーブル中で規定されているか否かを確認し、このテーブル中で規定されていないドメイン名である場合にのみクローリングを行う(S5)。また、判定部21Aは、上述の図7及び図8に応じてアンカー名に対するチェックを行い、収集対象外として規定されているアンカー(タグ)以外についてのみクローリングを行う(S6)。また、この際、図8に示すテーブルに従って、当該アンカー内に画像ファイルに対するリンクがある場合には、収集対象としない。画像ファイルに対するリンクがある場合には広告であると見なし、情報収集を行わないようにするためである。
以上の処理(収集前にURL名を元にの判断フェーズ)が終了すると、クローリング部21は対象となるURLからの情報収集を行う(S7)。対象となるURLからの情報が得られると、判定部21Aは、まず、得られた情報のMIME−TYPEが上述の図6に登録されているか否かを判定し、登録されているMIME−TYPEの情報のみを情報収集の対象とする(S8)。次に、判定部21Aは、<META>タグによるチェックを行い、nofollow,noindex等の記述がないもののみを情報収集の対象とする(S9)。
以上のような処理により、クローリング部21の判定部21Aは、上述のように定義された許可条件に該当するコンテンツ又は禁止条件に該当しないコンテンツについての情報のみを検索インデックス22Cに登録させ、許可条件に該当しないコンテンツ又は禁止条件に該当するコンテンツについての情報は検索インデックス22Cに登録させない。このように、クローリングによる情報収集の対象を制限することにより、コンテンツの提供ルールに従っていないコンテンツが、クローリングによる情報収集の対象から除外され、検索インデックス22Cにこのようなコンテンツに関する情報が格納されることを防止することができる。
また、クローリング部21は、以上のような処理に加えて、特定の情報提供サーバ100,200あるいは開始URLからのクローリングを行う制限時間(図5中の収集上限時間(No:13),上限ページ数(No:12),他ホスト(ドメイン)への収集可否(No:14)を判断しながら、情報収集を行い、これらの制限を超えた場合に、例外処理を行って当該情報収集を終了させる。
また、クローリング部21は、上述のように収集したページ中に検索キーワードが存在するか否かを検索し、検索キーワード毎に検索インデックス22Cに登録する。この際、判定部21Aは、図5中の追加ワード(No:8)が設定されている場合には、当該ページ中に、追加ワードがなくても、当該追加ワードに対応させて検索インデックス22Cに登録する。具体的には、収集したページに「新着」,「POP」「インディーズ」等のキーワードがなくても、これらのキーワードに対応させて、当該収集したページについての情報を検索インデックス22Cに登録する。
また、判定部21Aは、図5中の削除ワード(No:9)が設定されている場合には、当該ページ中に、削除ワードがあっても、検索インデックス22Cには登録しない。具体的には、収集したページに「画像系」というキーワードがあっても、当該収集したページについての情報は検索インデックス22Cに登録しない。
また、判定部21Aは、図5中の排除キーワード(No:7)が設定されている場合には、当該ページ中に中のアンカータグ内に排除キーワードがあっても、当該アンカーの示すリンク先に対するそれ以上の情報の収集は行わない。具体的には、例えば収集してきたページ中に「<a href=“www.ddd.com”>素敵な出会いはこちら<a>」等といったリンクが存在していてもリンク先のページ(www.ddd.com)に対しては情報の収集を行わない。
また、上述の図5中の収集階層数(No:11)によって定義された最大階層数に応じたコンテンツについての情報収集は、以下のように行う。クローリング部21は、例えば図13に示すように、判定部21Aによる判定結果に応じて、コンテンツの提供ルールに従っていない不正なページ(アドレスAB)及びこのページからリンクが張られている下位のページにおいて提供されている情報を検索インデックス22Cには登録しない。例えばコンテンツの階層が所定数(n)以内であることを提供ルールの1つとした場合には、判定部21Aは、例えば図14に示すように、上述の収集パターンで定義された収集開始URLからの階層数(x)をカウントしておき(S101,S105)、階層数xがnより大きくなったら、それ以下の階層のクローリングを中止して次の収集パターンのクローリングを開始する(S106)。
また、ページサイズの上限を提供ルールとして設定する場合には、同図中のS103において、取得したページのデータのサイズを検出し、上限以上である場合には検索インデックス22Cに登録しないようにする。
上述のように、不正なアドレス,ドメイン名等を提供ルールとする場合には、例えば図14中のS102,S107においてページのデータを取得する際に、判定部21Aが、当該ページのアドレスが上述の図10に示す不正アドレステーブルに登録されているアドレスを含むものであるか否かを判定し、登録されているアドレスを含む場合にはそれ以降の処理を中止する。
例えばHTTPサーバ120が提供するページ(インデックス)が、上述の図13に示すような状態である場合に、アドレスAのページ中のリンク(アドレスAA,アドレスAB,アドレスAC,アドレスAD)についてクローリングを行うと、例えば図15に示すように、アドレスAA,アドレスAB,アドレスADのページは提供ルールに従っているため、これらのページ及びその下位層のページについてはクローリングの結果が検索インデックス22Cに登録されるが(S204,S208,S215)、アドレスACは提供ルールに従っていないためこのページ及び及びその下位層のページ中の情報については検索インデックス22Cに登録されない。
このような処理により、判定部21Aがコンテンツの提供ルールに従っているか否かを判定し、クローリング部21がこの判定結果に応じて提供ルールに従っているコンテンツについて情報を検索インデックス22Cに登録することにより、検索インデックス22Cから抽出した検索結果に、提供ルールに従っていないコンテンツについての情報が含まれてしまうことを防止することができる。
(端末装置の表示能力に応じた情報の取得)
また、この情報提供システムでは、携帯電話端末装置50,60の表示能力に応じた適切な検索結果を提供するようになっている。具体的には、上述のような動作(クローリング動作)は、携帯電話端末装置50,60の表示能力毎に行うようになっている。表示能力対応表22Aには、例えば図16に示すように、携帯電話端末装置のグループ毎に、当該グループを示す識別情報(グループID)と、当該グループ内の代表機種を示す機種名(代表)と、機種を示す機種名(機種名一覧)との対応を示す対応テーブル22AA,22AB,22ACが格納されている。これらの対応テーブル22AA,22AB,22ACは、コンテンツの種類毎に設けられている。また、携帯電話端末装置50,60の機種毎の表示能力(例えば同時発音数,対応フォーマット等)は、例えば図17に示すようなテーブルとしてDB22等に格納されている。なお、グループIDに対応する表示能力毎のコンテンツを情報格納部110,210に格納する際に、グループIDに対応するディレクトリに格納する等の方法によってグループIDとコンテンツとの対応関係がわかるようにしておけば、これらの対応テーブルを設けなくてもよい。あるいは、機種グループの代表機種と機種名一覧との対応関係が明確であれば、必ずしもグループIDを設ける必要はない。
クローリング部21は、情報提供サーバのHTTPサーバに総合インデックス等のデータを要求する際に、検索対象に応じた対応テーブルを表示能力対応表22Aから選択し、選択した対応テーブル中の機種グループ毎に代表機種の機種名と、表示能力を示す情報等を用いて生成した拡張ヘッダ(以下、単にHTTP拡張ヘッダという。)を持つHTTPリクエストを送信する。例えば曲データを提供するHTTPサーバ120の総合インデックスのアドレス(URL)が“http://meloJAM.com/index.html”である場合に、クローリング部21が生成するHTTPリクエストは、例えば“GET http://meloJAM.com/index.html HTTP/1.1 2G V-DN02 x-display: 150x120 x-color: C4096 x-sound: 4 / 6KB”となる。ここで、HTTP拡張ヘッダ中の“V-DN02”は携帯電話端末装置の機種名を示す文字であり、“2G”は携帯電話端末装置の世代を示す文字である。また、“x-sound: 4”はこの携帯電話端末装置の同時発音数(4音)を示す文字である。
また、拡張ヘッダ中の“x-display: 150x120”は表示画素数が150×120画素であることを示しており、“x-color: C4096”は、同時発色数が4096色であることを示しており、“6KB”の部分は、インデックスデータ等のページ記述データの上限値が6キロバイトであることを示している。
上述のようなクローリングは、例えば図18に示すような構成の収集パターンファイルに従って行う。この収集パターン中では、個々の収集パターン名を示す文字(例えば“PATTERN1”)と、当該収集パターンにおいてデータの収集を開始するサイトのアドレス(URL)を示す文字(例えば“http://www.aaa.co.jp/”等)と、当該収集に使用する設定を示すエージェント名を示す文字が定義されている。
また、個々のエージェント名毎に対応して、例えば図19に示すようなエージェント定義ファイル中で、エージェント名と、ブラウザのバージョンと、機種グループ毎の拡張ヘッダと、ページ上限値等を定義しておく。このテーブルは、例えば検索時に上述の表示能力対応表22Aを用いて生成するようにしてもよいが、予め作成してDB22に格納しておいてもよい。
クローリング部21は、この図19に示すエージェント定義ファイルを参照して上述のHTTPリクエストを生成し、上述の図18に示す収集パターンに従ってクローリングを行う。
また、クローリング部21は、例えば図20に示すように、上述の図18の収集パターンファイル中で規定されたエージェントに従って、HTTP拡張ヘッダ内の携帯電話端末装置の音声表示能力を示す情報“x-sound: xxx”を順次を変更してHTTPサーバ120に対するHTTPリクエストを繰り返す(S301,S303,S305,S307)。
また、クローリング部21は、各HTTPリクエストに対するHTTPサーバ120の応答(S302,S304,S306,S308)から、当該HTTPリクエストに対応するコンテンツの種類を特定し、DB22の検索インデックス22Cに登録する。
HTTPサーバ120は、上述の図16中のグループID毎あるいは図17中の端末能力毎に、上述の図4に示すインデックス情報を有しており、携帯電話端末装置の音声表示能力に応じたインデックス情報を供給するようになっている。上述の図1の例では、4音のSMD形式、16音及び40音のSMAF形式についてインデックス情報を有するが、32音のSMAF形式についてはHTTPサーバ120が提供しないためにインデックス情報も有していない。
上述のようにHTTPリクエストが供給されると(S301,S303,S305,S307)、HTTPサーバ120の要求解析部121は、HTTPリクエストの拡張ヘッダ中の“x-sound: n”に対応するグループID(“n”は同時発音数を示す文字)によって、端末側の音声表示能力を判断し、音声表示能力に対応するインデックス情報が存在すれば、応答部124にインデックス情報を送信させる(S302,S304,S308)。一方音声表示能力に対応するインデックス情報が存在しない場合には、要求解析部121は、応答部124にインデックス情報が存在しない旨の応答メッセージを送信させる(S306)。
さらに、クローリング部21は、情報提供サーバ100に存在するインデックス情報を取得し、予めDB22に登録されたキーワードに対応するファイル名,文字等が存在するか否かを調べ、キーワードに該当するものがあれば、例えば図21に示すように、検索インデックス22Cに、端末の音声表示能力を機種グループのグループID,当該機種グループに属する機種名一覧,当該コンテンツに対応する所定のアドレス(例えば広告,注意等の情報を含むページ(リンク先ページ)等)等をキーワードに対応させて登録する。
以上のような動作により、携帯電話端末装置の音声表示能力に応じた検索インデックス22Cが作成される。この検索インデックス22Cには、対応する機種名が登録されているため、検索サービスを要求する携帯電話端末装置の機種名に応じた検索結果の抽出が容易である。また、情報提供サーバ200によって提供される画像データについても、拡張ヘッダ中の画像表示能力を示す情報(“x-display: XxY”,“x-color: yyy”)を順次変化させてHTTPサーバ220にインデックス情報を要求し、上述と同様にインデックス情報中のキーワード検索を行うことにより、図21に示すように、携帯電話端末装置の画像表示能力に応じた検索インデックス22Cを作成することができる。
(検索サービス)
上述のようなクローリング動作と非同期に、検索サービス提供部23は、携帯電話端末装置50のWebブラウザ530等に対して検索サービスを提供している。
ユーザから検索サービスの利用が指示されると、Webブラウザ530は、検索サービス提供部23に対して、検索条件の入力用のデータを要求する。これに応じて、検索サービス提供部23からデータが供給されると、Webブラウザ530は、例えば図22に示すように、検索語入力画面を表示部55の表示画面に表示させる。携帯電話端末装置50の音声表示能力が32音である場合には、ユーザが、検索条件(例えば曲名「AAA」)を入力して検索を指示すると、Webブラウザ530は、検索サービス提供部23に検索条件を示す文字と当該携帯電話端末装置50の機種名“V-T08”を含む拡張ヘッダを含むHTTPリクエストを送信する(S401)。
検索サービス提供部23は、Webブラウザ530から供給されたHTTPリクエスト中の検索条件を示す文字(例えば“AAA”)と拡張ヘッダ中の機種名(例えば“V-T08”)に対応する情報を検索インデックス22Cから抽出し、ヒット件数,曲名,曲データのアドレスに対するリンク情報等を含む応答メッセージ(検索結果)を生成し、Webブラウザ530宛てに送信する(S402)。このような応答メッセージを受信すると、Webブラウザ530は同図中に示すように、検索結果に応じた検索結果一覧画面を表示する。
上述の図1に示す例では、曲データ格納領域111に携帯電話端末装置(機種名“V-T08”)の音声表示能力(8音)に対応する曲AAAの曲データがなく、クローリングによって得られた検索インデックス22Cには上述の図21に示すように機種名“V-T08”に対応する曲AAAの8音の曲データについての情報が登録されていない。このため、検索サービス提供部23が提供する検索結果は、この図22に示すように、ヒット件数が0件であり、曲AAAの曲データについての情報が含まれていない状態になる。
また、音声表示能力が40音の携帯電話端末装置(例えば機種名“V-SH53”)から、上述の図22の例と同様に曲名「AAA」を検索条件として、検索を要求した場合には、例えば図23に示すように、検索サービス提供部23に供給されるHTTPリクエストの拡張ヘッダには携帯電話端末装置の機種名“V-SH53”が含まれている(S501)。上述の図1に示す例では、曲データ格納領域111には曲AAAに対応する40音の曲データがあり、検索インデックス22Cには上述の図21に示すようにに“V-SH53”に対応する曲AAAの40音の曲データについての情報が登録されている。このため、検索サービス提供部23は、この図23に示すように、曲AAAの曲データに対応するリンク先ページのアドレス“http://meloJAM.com/cgi/abc.cgi?”とキーワードを示す情報“keyword=AAA”がリンク情報として含まれている検索結果をWebブラウザ530に提供する(S502)。
このようにリンク情報に含まれているキーワードを示す情報は、ユーザが選択したコンテンツのデータを要求する際に、GETコマンドの一部として情報提供サーバに供給される。なお、キーワードを示す“AAA”の部分は、実際には携帯電話端末装置の世代に応じたキャラクタコードでエスケープエンコード(“%xx”の形式)されている。すなわち、第2世代の携帯電話端末装置の場合には、キャラクタコードとして例えばShift−JISが用いられており、第2.5世代と第3世代の携帯電話端末装置の場合には、キャラクタコードとして例えばShift−JIS,UTF−8,EUC−JP,ISO−2022−JPの中の当該携帯電話端末装置の設定に応じたキャラクタコードが用いられる。
検索結果を確認したユーザが曲を選択すると、Webブラウザ530は、選択された曲に対応するリンク情報に応じて、対応する情報提供サーバ100にユーザが選択した曲に対応する曲データの提供を要求する(S503)。この要求(HTTPリクエスト)には、拡張ヘッダにキーワードを示す情報“keyword=AAA”と、携帯電話端末装置50の音声表示能力が40音であることを示す情報(x-sound: 40)が含まれている。
このようなHTTPリクエストを受信すると、情報提供サーバ100の要求解析部121は、インデックス保持部122からキーワード“AAA”に該当するコンテンツのアドレスを取得し、広告等の画像等の情報を有するリンク先ページのデータに、コンテンツに対するリンクの記述を付加して応答部124に送信させる(S504)。
携帯電話端末装置のWebブラウザ530は、このようなリンク先ページのデータに応じた画像を表示部55に表示させる。ユーザが、コンテンツの取得を選択すると、Webブラウザ530は、コンテンツのデータを情報提供サーバに要求する(S505)。これに応じて、情報提供サーバからコンテンツのデータ(この場合は曲AAAの40音の曲データ)が供給されると(S506)、Webブラウザ530は、供給されたデータをメモリ53に格納する。
これにより、この情報提供システムでは、検索結果として、任意のページのアドレスを提供すると共に、キーワードを情報提供サーバに引き継ぐことができるため、例えばユーザの操作負担を増加させずに広告等の情報を有するページを経由させたコンテンツの提供を行うことができる。
ところで、DB22中のテンプレート22Dには、例えば図24,図27及び図28に示すように、携帯電話端末装置の世代毎に検索結果の生成に用いるテンプレートが格納されている。各テンプレート中の変数の意味は図25に、コマンドの意味は図26に、ぞれぞれ示されている。
携帯電話端末装置の世代は、機種名に対応する世代を上述の図17に示すテーブルから取得することによって判断することができる。第2世代(2G)の携帯電話端末装置では、Webブラウザ530は、回線交換機31及びGW35経由でHTTPサーバ23Aにアクセスする。この際、Webブラウザ530は、HTTPリクエストに当該携帯電話端末装置の機種を示す識別情報を付加する。GW35は、この識別情報に対応する機種名を示す文字,解像度を示す文字等の情報を保持しており、HTTPリクエスト中の識別情報に対応する機種名を示す文字等の情報を拡張ヘッダとしてHTTPリクエストに付加する。また、第2.5世代(2.5G)の携帯電話端末装置では、Webブラウザ530は、HTTP拡張ヘッダ中に機種名を示す文字等を付加し、パケット交換機32経由でHTTPサーバ23Aにアクセスする。さらに、第3世代(3G)の携帯電話端末装置では、Webブラウザ530は、HTTP拡張ヘッダ中に機種名を示す文字等を付加し、RNC41a(41b)経由でHTTPサーバ23Aにアクセスする。従って、検索サーバ20の検索サービス提供部23は、上述の図17に示すテーブルを参照することにより、HTTP拡張ヘッダ中の機種名を示す文字に対応する世代を知ることができる。
検索サービス提供部23は、アクセス元の携帯電話端末装置が第2世代であれば、図24に示すテンプレートを用い、アクセス元の携帯電話端末装置が第2.5世代であれば、図27に示すテンプレートを用い、アクセス元の携帯電話端末装置が第3世代であれば、図28に示すテンプレートを用いて携帯電話端末装置に対する応答メッセージを生成する。
具体的には、例えば携帯電話端末装置が第2世代であり、“AAA”についての検索結果が1件である場合には、応答部23bが上述の図24に示すテンプレートを用いて生成する検索結果のデータは、例えば図29に示すようになる。このような検索結果のデータに応じて表示部55に表示される画像は、例えば図23中のS502において表示される画像のようになる。
また、携帯電話端末装置が第2.5世代であり、“AAA”についての検索結果が11件である場合には、応答部23bが生成する検索結果のデータに応じて表示部55に表示される画像は、例えば図30に示すようになる。さらに、携帯電話端末装置が第3世代であり、“AAA”についての検索結果が11件である場合には、応答部23bが生成する検索結果のデータに応じて表示部55に表示される画像は、例えば図31に示すように、各コンテンツについての説明等の情報を表示することができるようになる。
このように、携帯電話端末装置の世代に応じたテンプレートによって検索結果を生成することにより、携帯電話端末装置の表示能力に応じて、例えば携帯電話端末装置の世代毎に検索結果の表示件数,内容等を変更し、適切な検索結果を生成することができる。
なお、GW35,パケット交換機32,RNC41a(41b)と検索サービス提供部23の間では、上位プロトコルとしてTCP/IPプロトコルを用いて通信を行っている。このため、検索サービス提供部23はアクセス元のIPアドレスによって携帯電話端末装置の世代を判断することもでき、このような構成とすることもできる。
以上、曲データの場合を例に説明したが、画像データについても同様に、検索サービス提供部23は、HTTPリクエストの拡張ヘッダ中の機種名に応じて、検索インデックス22Cからのデータの抽出を行って検索結果を携帯電話端末装置に送信する。
(効果)
階層数,ページサイズ等のコンテンツの提供ルールに従っていないコンテンツが検索結果に含まれてしまうと、ユーザによる選択回数が増えてしまったり、コンテンツを取得しても表示できなかったりすることがあり、利便性を低下させてしまう。
これに対し、この情報提供システムでは、検索サーバ20の判定部21Aの判定結果に応じて、提供ルールに従っていない不正なコンテンツについての情報を検索インデックス22Cに登録していないため、この検索インデックス22Cから抽出した検索結果に不正なコンテンツについての情報が含まれることがない。このため、この情報提供システムでは、利便性の低下の防止に寄与することができる。
また、携帯電話端末装置の表示能力を考慮しないで検索を行った場合には、検索結果に携帯電話端末装置で利用できない情報が含まれてしまい、ユーザが逐一リンクを辿って当該携帯電話端末装置で表示可能なコンテンツであるか判断する必要がある。
これに対し、この情報提供システムでは、上述のように、検索サービス提供部23が、検索インデックス22Cから携帯電話端末装置の機種名に対応する曲データのみを検索結果として供給することができる。検索インデックス22Cには、所定の機種グループ内の携帯電話端末装置の機種名と利用可能なコンテンツについての情報が対応付けられて登録されているため、携帯電話端末装置で表示できるコンテンツについての情報のみを検索結果として供給することができる。
従って、この情報提供システムでは、利用可能なコンテンツを取得するまでのユーザの操作回数を低減させて、ユーザの操作負担の低減に寄与することができる。また、携帯電話端末装置で利用できない曲データにアクセスする可能性を低減させることができるため、無用なトラフィックの低減,通信料金の節約に寄与することができる。
また、この情報提供システムでは、曲データ,画像データ等のコンテンツの種類毎に設定した機種グループ毎にクローリングを行っているため、携帯電話端末装置の表示能力に応じた適切な検索インデックス22Cを生成するための情報提供サーバに対するアクセスの回数の増加を抑制することができる。
さらに、この情報提供システムでは、表示能力が同じ機種グループ毎に検索インデックス22C中のデータを生成しており、機種名自体を登録しておくことにより、別途機種グループ内の機種名のテーブルを有する場合に比較してDB22中のデータの参照回数を低減させて検索の高速化に寄与することがでできる。
また、この情報提供システムでは、表示部55に表示可能な文字数等の画像表示能力が携帯電話端末装置の世代毎に決定されているため、世代に応じたテンプレートを用いて検索結果を生成することにより、表示部55の表示能力に応じた適切な検索結果を生成することができる。
本発明の実施例1に係る情報提供システムの構成を示すブロック図である。 前記情報提供システムを構成する検索サーバの構成を示すブロック図である。 前記情報提供システムを構成する情報提供サーバの詳細な構成例を示す図である。 前記情報提供サーバのインデックス保持部に保持されているインデックスデータの構造例を示す図である。 前記情報提供システムを構成する検索サーバのクローリング部に保持されているコンテンツ情報テーブルの例を示す図である。 前記クローリング部の条件保持部に保持されている禁止条件の例を示す図である。 前記条件保持部に保持されているテーブルの例を示す図である。 前記条件保持部に保持されているテーブルの例を示す図である。 前記条件保持部に保持されているテーブルの例を示す図である。 不正ページのアドレスを保持する不正アドレステーブルの例を示す図である。 判定処理を示すフローチャートである。 ロボット検索用の定義ファイルの例を示す図である。 不正ページの例を示す図である。 前記検索サーバを構成するクローリング部の判定部による判定処理の例を示すフローチャートである。 前記クローリング部によるクローリング動作の例を示すシーケンス図である。 前記情報提供システムを構成する検索サーバのDBに保持されている表示能力対応表の例を示す図である。 前記DBに保持されている対応テーブルの例を示す図である。 前記DBに保持されている収集パターンの例を示す図である。 前記DBに保持されているエージェント定義の例を示す図である。 前記クローリング部によるクローリング動作の例を示すシーケンス図である。 前記クローリング動作によってDBに格納されるコンテンツテーブルの例を示す図である。 前記検索サーバによる検索サービスにおける動作の例を示すシーケンス図である。 前記検索サービスにおける他の動作の例を示すシーケンス図である。 前記DBに保持されているテンプレートの例を示す図である。 前記テンプレート中の変数の例を示す図である。 前記テンプレート中のコマンドの例を示す図である。 前記テンプレートの他の例を示す図である。 前記テンプレートの他の例を示す図である。 前記テンプレートを用いて生成した検索結果のデータの例を示す図である。 他の検索結果のデータによって表示される画像の例を示す図である。 他の検索結果のデータによって表示される画像の例を示す図である。
符号の説明
10 情報提供サーバ群、110,120 情報格納部、120,220 HTTPサーバ、121 要求解析部、122 インデックス保持部、123 コンテンツ取得部、124 応答部、20 検索サーバ、21 クローリング部、21A 判定部、21B 条件保持部,22 DB、22A 表示能力対応表、22B 収集パターン、22C 検索インデックス、22D テンプレート、23 検索サービス提供部、50,60 携帯電話端末装置、52 MPU、530 Webブラウザ、53 メモリ、53a 着メロデータ保持部、53b 画像データ保持部

Claims (3)

  1. コンテンツ表示能力を示す情報(表示能力情報)に対応させて保持している複数のコンテンツ中に,ネットワークを介して供給される携帯端末装置からの情報提供要求(HTTPリクエスト)中の拡張ヘッダ中の表示能力情報に対応するコンテンツがある場合に当該コンテンツを提供するコンテンツ提供サーバが提供するコンテンツについての検索サービスを提供する検索装置であって、
    前記コンテンツ提供サーバがコンテンツを提供する携帯端末装置の機種について,コンテンツの表示能力毎に設定された携帯端末装置の機種グループ毎に,機種グループ内の代表機種の前記表示能力情報を保持する代表機種表示能力保持手段と、
    該代表機種表示能力保持手段に保持されている各代表機種の表示能力情報を順次用い,当該表示能力情報を拡張ヘッダ中に含む複数の前記情報提供要求を生成し,生成した情報提供要求を用いて前記コンテンツ提供サーバが提供するコンテンツのアドレスを示すアドレス情報と当該コンテンツに対応するキーワードを示すキーワード情報を含むインデックスデータを取得する取得手段と、
    検索対象とするコンテンツに対応するキーワード情報(検索キーワード)を保持するキーワード保持手段と、
    検索キーワードと及び前記インデックスデータの取得時に用いた前記表示能力情報に対応する前記代表機種を示す識別情報と当該インデックスデータのアドレス情報を対応付けて保持する検索インデックスと、
    該検索インデックスに対するアドレス情報の追加を禁止する条件(禁止条件)を示す情報(禁止条件情報)を保持する禁止条件保持手段と、
    該禁止条件保持手段に保持されている禁止条件情報に応じて禁止条件に該当するか否かを判断する追加制御手段と、
    前記取得手段が取得したインデックスデータ中のキーワード情報を抽出し,抽出したキーワード情報が前記キーワード保持手段に保持されている検索キーワードに一致し,前記追加制御手段が禁止条件に該当しないと判断した場合に,インデックスデータ中の当該キーワード情報に対応するアドレス情報を当該検索キーワード及び前記インデックスデータの取得時に用いた前記表示能力情報に対応する前記代表機種を示す識別情報に対応付けて前記検索インデックスに追加する解析手段と、
    前記携帯端末装置からの検索キーワード及び当該携帯端末装置の表示能力を示す表示能力情報を含む検索要求中の検索キーワード及び当該表示能力情報に対応するアドレス情報を前記検索インデックスから抽出し,当該アドレス情報を含む検索結果を生成して当該携帯端末装置に供給する応答手段とを有し、
    前記禁止条件情報は、前記インデックスデータの上限サイズを示す情報,検索インデックスに対する追加を許可しないキーワード(削除ワード)を示す情報のいずれかを含み、
    前記追加制御手段は、前記取得手段が取得した前記インデックスデータのサイズが前記上限サイズを示す情報によって特定されるサイズを超えた場合,又は,前記インデックスデータ中に前記削除ワードを示す情報に一致する情報が含まれる場合,のいずれかの場合に、前記禁止条件に該当すると判断することを特徴とする検索装置。
  2. 前記取得手段によるインデックスデータの取得を禁止する条件(取得禁止条件)を示す情報(取得条件情報)を保持する取得条件保持手段と、
    該取得条件保持手段に保持されている取得条件情報に応じて取得禁止条件に該当するか否かを判断し,取得禁止条件に該当する場合に前記取得手段による前記インデックスデータの取得を行わせない取得制御手段とを備え、
    前記取得禁止条件は、不正なアドレスを示す情報,以降のインデックスデータの取得を禁止するキーワード(排除キーワード)を示す情報のいずれかを含み、
    前記取得制限手段は、前記取得手段が生成した前記情報提供要求中のアドレスが前記不正なアドレスを示す情報によって特定される条件に該当する場合,又は,前記取得手段が取得した前記インデックスデータ中に排除キーワードを示す情報に一致する情報が含まれる場合に、前記取得禁止条件に該当すると判断する
    ことを特徴とする請求項1記載の検索装置。
  3. 前記表示能力情報は、前記提供サーバ装置が提供するデータが画像データである場合の表示画素数又は表示可能色数を示す情報,又は,前記提供サーバ装置が提供するデータが曲データである場合の同時発音数を示す情報のいずれかを含むことを特徴とする請求項1記載の検索装置。
JP2004118356A 2004-04-13 2004-04-13 検索装置 Expired - Fee Related JP4436177B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004118356A JP4436177B2 (ja) 2004-04-13 2004-04-13 検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004118356A JP4436177B2 (ja) 2004-04-13 2004-04-13 検索装置

Publications (2)

Publication Number Publication Date
JP2005301759A JP2005301759A (ja) 2005-10-27
JP4436177B2 true JP4436177B2 (ja) 2010-03-24

Family

ID=35333199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004118356A Expired - Fee Related JP4436177B2 (ja) 2004-04-13 2004-04-13 検索装置

Country Status (1)

Country Link
JP (1) JP4436177B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040643A (ja) * 2006-08-03 2008-02-21 Fugaku-Bussan Co Ltd 外部機器制御システム並びにそのプログラム
JP4885892B2 (ja) * 2008-02-22 2012-02-29 株式会社ソニー・コンピュータエンタテインメント 端末装置、情報提供システム、ファイルアクセス方法およびデータ構造
WO2010041517A1 (ja) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報収集装置、検索エンジン、情報収集方法およびプログラム
JP5381659B2 (ja) * 2009-11-30 2014-01-08 富士通モバイルコミュニケーションズ株式会社 情報処理装置

Also Published As

Publication number Publication date
JP2005301759A (ja) 2005-10-27

Similar Documents

Publication Publication Date Title
JP4205955B2 (ja) 無線装置を介して個別のビデオ/オーディオウェブコンテンツを対象としてアクセスする方法及び装置
US20080242363A1 (en) System and method for generating a graphical user interface
US8346797B2 (en) Search device and information providing system
WO2011140784A1 (zh) 屏蔽移动终端访问无线网络信息的方法、移动终端和系统
JP4436177B2 (ja) 検索装置
US20080033918A1 (en) Systems, methods and computer program products for supplemental data communication and utilization
KR100556530B1 (ko) 무선 인터넷 정보 검색 방법
JP5030895B2 (ja) アクセス規制システム及びアクセス規制方法
JP2002123533A (ja) コンテンツ登録装置、コンテンツ登録方法及びコンピュータ読み取り可能な記録媒体
JP4350631B2 (ja) 検索サービス提供システム
JPWO2008143284A1 (ja) コンテンツ提供装置、コンテンツ提供方法、およびコンピュータ使用可能な記憶媒体
JP2004342044A (ja) 携帯端末のカスタマイズシステム、管理サーバ、携帯端末、並びに携帯端末のプログラム
JP2003006230A (ja) 情報検索処理方法、情報検索処理サーバ、情報提示方法、情報提示装置、プログラム及び媒体
JP4396404B2 (ja) コンテンツ提供システム、その方法、サーバおよびプログラム
JP2006107199A (ja) 検索システム
JP4346276B2 (ja) 情報検索システム、情報検索装置、情報検索方法、および情報検索プログラム
JP2006048141A (ja) 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
JP2006189978A (ja) 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
JP2005031906A (ja) 情報通信端末装置及びプロセス共有サーバ装置
KR100886763B1 (ko) 웹사이트 연결시스템 및 그 방법
JP2006189979A (ja) 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
EP2089822B1 (en) System and process for identifying addresses in a distributed data network
JP2004355291A (ja) 検索サーバ装置及び情報提供システム
JP5263759B2 (ja) 名刺情報出力装置、名刺情報出力方法、およびプログラム
JP2002189651A (ja) 使用者に応じた情報へのアクセス装置、方法、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091225

R150 Certificate of patent or registration of utility model

Ref document number: 4436177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160108

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees