JP2005301759A - Retrieval apparatus - Google Patents
Retrieval apparatus Download PDFInfo
- Publication number
- JP2005301759A JP2005301759A JP2004118356A JP2004118356A JP2005301759A JP 2005301759 A JP2005301759 A JP 2005301759A JP 2004118356 A JP2004118356 A JP 2004118356A JP 2004118356 A JP2004118356 A JP 2004118356A JP 2005301759 A JP2005301759 A JP 2005301759A
- Authority
- JP
- Japan
- Prior art keywords
- search
- information
- crawling
- content
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、携帯電話端末装置等の情報端末装置からの要求に応じて着信メロディ,画像等のコンテンツに関する情報を提供する検索装置に関する。 The present invention relates to a search device that provides information related to contents such as a ringing melody and an image in response to a request from an information terminal device such as a mobile phone terminal device.
着信待機時の着信音あるいは着信メロディあるいは待ち受け画面等のデータ(コンテンツ)をネットワーク経由でHTTPサーバ等の情報提供サーバ装置から取得して、ユーザの好みに応じたカスタマイズが可能な携帯電話端末装置が知られている(例えば特許文献1参照。)。 A mobile phone terminal device that can acquire data (contents) such as a ring tone, incoming melody, standby screen, or the like when waiting for an incoming call from an information providing server device such as an HTTP server via a network, and can be customized according to user preferences. It is known (for example, refer to Patent Document 1).
提供可能なコンテンツの数が増えてくると、例えばカテゴリ別,アーティスト別,曲別等といったように、ディレクトリ毎に分類し、段階的にデータの選択を行うようにする必要が生じる。ところが、携帯電話端末装置の表示画面は、パーソナル・コンピュータ等の汎用の情報処理装置と比較して、サイズ的な制約が大きく、1画面に表示できる情報が限られてしまうため、目的とするコンテンツを見つけるまでの操作回数が多くなってしまう。 As the number of contents that can be provided increases, it becomes necessary to classify data by directory and select data step by step, for example, by category, artist, or song. However, the display screen of the mobile phone terminal device is larger in size than the general-purpose information processing device such as a personal computer, and the information that can be displayed on one screen is limited. The number of operations to find will increase.
このため、インターネット等のネットワーク経由で提供されている情報検索サービスをこのようなデータの検索に使うことが考えられる。このような情報検索サービスでは、予め、検索ロボットによるクローリングによって、コンテンツを提供する情報提供サーバ装置が提供するコンテンツのアドレスを収集し、コンテンツのキーワード毎にデータベースに登録しておく。 For this reason, it is conceivable to use an information search service provided via a network such as the Internet for such data search. In such an information search service, content addresses provided by an information providing server device that provides content are collected in advance by crawling by a search robot and registered in the database for each content keyword.
検索サービスを提供するサーバ装置は、ユーザの端末装置からキーワードが供給されると、データベース中からキーワードに該当するコンテンツのアドレス等の情報を抽出し、検索結果として端末装置に提供する(例えば非特許文献1参照。)。
ところで、ユーザの利便性,携帯電話端末装置の表示能力等を考えてリンクの階層数,ページサイズ等のコンテンツの提供ルールを設定することが考えられるが、上述のような検索サービスでは、検索結果に,提供ルールを遵守しない不正なコンテンツについての情報が含まれてしまう。 By the way, it is conceivable to set content provision rules such as the number of link hierarchies and page size in consideration of the convenience of the user, the display capability of the mobile phone terminal, and the like. Information on illegal content that does not comply with the provision rules.
このような検索結果からユーザがコンテンツを選択しようとすると、選択回数が増えてしまったり、コンテンツを取得しても携帯電話端末装置で表示できなかったりして利便性が低下してしまう。 When the user tries to select content from such a search result, the number of selections increases, and even if the content is acquired, it cannot be displayed on the mobile phone terminal device, and convenience is reduced.
本発明は、上述のような課題に鑑みてなされたものであり、検索結果に不正なコンテンツについての情報が含まれないようにして、利便性の低下の防止に寄与することができる検索装置を提供することを目的とする。 The present invention has been made in view of the above-described problems, and provides a search device that can contribute to prevention of a decrease in convenience by preventing information on illegal content from being included in a search result. The purpose is to provide.
上述の問題を解決するために、本発明に係る検索装置は、コンテンツ提供サーバが提供するコンテンツに関する情報を収集(クローリング)するクローリング手段と、クローリング手段のクローリングに応じてコンテンツに関する情報を保持する検索インデックスと、検索インデックスに情報を登録するコンテンツの条件を保持する条件保持手段と、条件保持手段に保持されている条件に応じてクローリング手段によるクローリング又は検索インデックスに対する情報の格納を制御する制御手段とを備えることを特徴とする。条件保持手段が保持する条件には、例えばコンテンツの種類に応じた許可条件、あるいはクローリング手段が検索を開始する所定のアドレス(例えば検索開始ページのアドレス)からのリンク階層数,ページサイズのいずれかの値に応じた禁止条件等の条件が考えられる。 In order to solve the above problem, a search device according to the present invention includes a crawling unit that collects (crawling) information about content provided by a content providing server, and a search that holds information about content according to crawling by the crawling unit. An index, a condition holding unit that holds a condition of content for registering information in the search index, and a control unit that controls crawling by the crawling unit or storage of information for the search index according to the condition held in the condition holding unit; It is characterized by providing. The condition held by the condition holding means is, for example, either a permission condition according to the type of content, or the number of link hierarchies from a predetermined address (for example, the address of the search start page) or the page size from which the crawling means starts searching. A condition such as a prohibition condition according to the value of can be considered.
本発明では、制御手段が、条件保持手段に保持されている禁止条件又は許可条件に応じてクローリング手段によるクローリング又は検索インデックスに対するアドレスの格納を制御することにより、禁止条件に該当するコンテンツのアドレスを検索インデックスに格納することを阻止することができ、あるいは許可条件に該当するコンテンツのアドレスを検索インデックスに格納することができる。このため、検索インデックスから検索した検索結果に禁止条件に該当するコンテンツあるいは許可条件に該当しないコンテンツのアドレスが含まれることがない。 In the present invention, the control means controls the storage of the address for the crawling or search index by the crawling means according to the prohibition condition or permission condition held in the condition holding means, so that the address of the content corresponding to the prohibition condition is determined. It is possible to prevent storage in the search index, or it is possible to store the address of the content corresponding to the permission condition in the search index. For this reason, the search result searched from the search index does not include the address of the content corresponding to the prohibition condition or the content not corresponding to the permission condition.
これにより、検索結果に不正なコンテンツについての情報が含まれないようにして、利便性の低下の防止に寄与することができる。 Thereby, it can contribute to prevention of the fall of the convenience by not including the information about unauthorized content in a search result.
本発明は、例えば異なる表示能力を有する複数の形式の携帯電話端末装置に対して着信メロディ,画像等のデータ(コンテンツ)を提供する情報提供システムに適用することができる。 The present invention can be applied to an information providing system that provides data (contents) such as ringing melody and image to a plurality of types of mobile phone terminal devices having different display capabilities.
(全体構成)
本発明の一実施例に係る情報提供システムは、例えば図1に示すように、インターネット等のネットワーク1経由で着信メロディ,待ち受け画面等のコンテンツを提供する情報提供サーバ群10と、情報提供サーバ群10が提供するコンテンツに関する検索サービスを提供する検索サーバ(検索装置)20と、この検索サーバ20が提供する検索サービスを利用する携帯電話端末装置50及び携帯電話端末装置60を備えている。
(overall structure)
As shown in FIG. 1, for example, an information providing system according to an embodiment of the present invention includes an information providing
携帯電話端末装置50は、例えばPDC(Personal Digital cellular)方式の移動体通信ネットワークからなる移動体通信網30を介して情報提供サーバ群10及び検索サーバ20にアクセス可能となっている。また、携帯電話端末装置60は、例えばW−CDMA(Wideband-Code Division Multiple Access)方式の移動体通信ネットワークからなる移動体通信網40を介して情報提供サーバ群10及び検索サーバ20にアクセス可能となっている。
The mobile phone terminal device 50 is accessible to the information providing
(情報提供サーバ群構成)
情報提供サーバ群10は、例えば複数の情報提供サーバ(コンテンツ提供サーバ)100,200,…から構成されている。各情報提供サーバ100(200)は、当該情報提供サーバが提供するコンテンツを格納する情報格納部110(210)と、情報格納部110(210)に格納されているコンテンツをネットワーク1経由で提供するHTTPサーバ120(220)とを備えている。
(Information providing server group configuration)
The information providing
これらの情報提供サーバ100,200が提供するコンテンツは、例えば階層的に管理されており、各階層毎のインデックスから選択を行うことによって、個々のコンテンツを選択することができるようになっている。
The contents provided by these
情報提供サーバ100は、コンテンツとして、例えば着信メロディの曲データを提供する。情報格納部110には、例えば曲データを曲毎に格納する曲データ格納領域111,112,…が設けられている。各曲データ格納領域111,112,…には、同一の曲に対して携帯電話端末装置50,60の表示能力に対応する1つないし複数のデータ形式の曲データが格納されている。例えば図1中の情報提供サーバ100の曲データ格納領域111には、曲AAAに対応する40音,16音,4音(これらは同時発生数を示している。)の曲データが格納されている状態を示している。
The
HTTPサーバ120に対するアクセス要求中には、例えばHTTPリクエスト中の拡張ヘッダ中に、携帯電話端末装置50の音声表示能力を示す情報(例えば“x−sound:##”[##は同時発音数を示す数字])が含まれており、HTTPサーバ120は、この情報に応じて、携帯電話端末装置50,60等の音声表示能力を認識することができるようになっている。
During an access request to the
情報提供サーバ200は、コンテンツとして、例えば待ち受け画像等の画像データを提供する。情報格納部210には、例えば画像データを画像毎に格納する画像データ格納領域211,212,…が設けられている。各画像データ格納領域211,212,…には、同一の画像に対して携帯電話端末装置50,60の表示能力に対応する1つないし複数のデータ形式の画像データが格納されている。例えば図1中の情報提供サーバ200の画像データ格納領域211には、画像BAに対応する256色,4096色(これらは同時発色数を示している。)で低画素数,中画素数の画像データと65536色で高画素数(例えば200×150画素)の画像データが格納されている状態を示している。
The
HTTPサーバ220に対するアクセス要求中には、例えばHTTPリクエスト中の拡張ヘッダ中に、携帯電話端末装置50の画像表示能力を示す情報(例えば“x−display:**[**は表示画素数を示す文字列]”,“x−color:$$”[$$は同時発色数を示す文字列])が含まれており、HTTPサーバ220は、これらの情報に応じて、携帯電話端末装置50,60等の画像表示能力を認識することができるようになっている。HTTPサーバ220は、画像表示能力に応じた画像データを提供するようになって
During an access request to the
(検索サーバ構成)
検索サーバ20は、所定のキーワード等に従って情報提供サーバ群10が提供するコンテンツ等のアドレス,データ種別を取得するクローリング部(クローリング手段)21と、クローリング部21によって得られたアドレス,データ種別等をキーワード等に対応させて保持するDB22と、携帯電話端末装置50,60等に対して検索サービスを提供する検索サービス提供部(検索手段,世代検出手段)23等を備えている。
(Search server configuration)
The
DB22には、例えば図2に示すように、携帯電話端末装置50,60の機種毎の表示能力を所定の機種グループ毎に保持する表示能力対応表22Aと、クローリング部21によるクローリングのパターンを定義する収集パターン22Bと、クローリング結果を保持する検索インデックス22Cと、携帯電話端末装置50,携帯電話端末装置60の世代毎の検索結果の生成に用いるテンプレート22Dとが格納されている。
For example, as shown in FIG. 2, the DB 22 defines a display capability correspondence table 22 </ b> A that holds the display capability for each model of the mobile phone terminals 50 and 60 for each predetermined model group, and a crawling pattern by the
また、クローリング部21は、情報提供サーバ100,200,…によるコンテンツの提供が提供ルールを遵守しているか否かを判定する提供ルール判定部(判定手段)22Aを備えている。このクローリング部21は、収集パターン22Bに応じてHTTPクライアントと同様に、情報提供サーバ100,200に対するアクセスを繰り返し(クローリング)、提供ルール判定部22Aの判定結果に応じて提供ルールを遵守しているコンテンツのアクセス結果を検索インデックス22Cに格納する。
Further, the
また、検索サービス提供部23は、携帯電話端末装置50,60からの検索サービス要求に応答するフロントエンドとして機能するHTTPサーバ23Aと、HTTPサーバ23Aを介して供給されるキーワードに応じて検索インデックス22Cから該当する情報を検索し、テンプレート22Dを用いて応答メッセージを構成する応答部(検索結果生成手段)23bとを備えている。
The search
移動体通信網30は、上述のPDC方式による第2世代(回線交換によってデータ通信を行う)及び第2.5世代(パケット交換によってデータ通信を行う)の携帯電話端末装置50に対して移動体通信サービスを提供するものであり、携帯電話端末装置50との間の通信チャネルの割り当て等の処理を行う回線交換機31と、データ通信用のパケットの交換等の処理を行うパケット交換機32と、携帯電話端末装置50との間で無線通信を行う基地局装置(BS:Base Station)33a,33b,…,33nと、BS33a〜33nの管理を行う基地局制御装置BSC34と、第2世代の携帯電話端末装置50による通信のプロトコル変換等を行うゲートウェイ装置(GW)35とを備えている。
The
移動体通信網40は、上述のW−CDMA方式による第3世代の携帯電話端末装置60に対して移動体通信サービスを提供するものであり、携帯電話端末装置(UE:User Equipment)60と通信を行う基地局装置(NB:NodeB)42a,42b,…,42mと、各基地局装置42a〜42mの制御を行うRNC41a,41b,…,41mとを備えている。
The
(携帯電話端末装置詳細)
携帯電話端末装置50は、移動体通信網30を介して通話サービス,メールサービス等を利用できる他、情報提供サーバ群10が提供するコンテンツ提供サービス及び検索サーバ20が提供する検索サービスを利用することができるようになっている。この携帯電話端末装置50は、高周波信号の処理を行う高周波(RF:Radio Frequency)部51と、MPU52と、メモリ53と、ユーザからの指示等を入力する操作キー54と、ユーザに対する表示を行う表示部55と、音声信号の符号化/復号化を行う音声CODEC56と、MIC57と、スピーカ58とを備えている。
(Details of mobile phone terminals)
The mobile phone terminal device 50 can use a call service, a mail service, etc. via the
MPU52は、例えばメモリ53に保持されている制御プログラムを実行することにより、移動体通信網30を介した通信の制御を行う通信制御部510,電子メールの送受信を行う電子メールクライアント520,上述の情報提供サービス及び検索サービスの利用時の表示等を表示するWebブラウザ530として機能する。また、メモリ53内には、着信メロディ等の音声データを保持する音声データ保持部53aと、待ち受け画面等の画像データを保持する画像データ保持部53bとが設けられている。
The
携帯電話端末装置60も、携帯電話端末装置50と同様に、電子メールクライアント,Webブラウザ等を備えており、情報提供サーバ100,200が提供するコンテンツを利用することができるようになっている。
Similarly to the mobile phone terminal device 50, the mobile phone terminal device 60 includes an e-mail client, a Web browser, and the like, and can use contents provided by the
上述のHTTPサーバ120は、例えば図3に示すように、ネットワーク1経由で供給された携帯電話端末装置50等からの要求を解析する要求解析部121と、提供する情報を示すアドレスを有するインデックスデータを保持するインデックス保持部122と、要求解析部121からの指示に応じて情報格納部110からコンテンツを取得するコンテンツ取得部123と、コンテンツ取得部123が取得した情報から携帯電話端末装置50,60等に対する応答をネットワーク1経由で送出する応答部124とを備えている。HTTPサーバ220も、このHTTPサーバ120と同様の構成を備えている。
For example, as shown in FIG. 3, the above-described
インデックス保持部122に保持されているインデックスデータは、例えば図4に示すように、情報(例えば曲データ)の選択を階層的に行い得るように、階層的に分類されて構成されている。また、インデックス保持部122に保持されているインデックスデータも同様に階層的に分類されて構成されている。これらのインデックスデータは、例えばHTML(Hyper Text Markup Language)形式等のページ記述データで構成されており、例えば上位のインデックスのページ記述データ中に下位のインデックスのアドレス(URL,URI等)を示すリンクを記述することによって、階層的的なリンク構造が形成されるように構成されている。
As shown in FIG. 4, for example, the index data held in the
このような階層構成のインデックスにより、ユーザは、まず、例えば総合インデックスからカテゴリを選択し、次にカテゴリ別のインデックスからアーティストを選択し、アーティスト別のインデックスから曲を選択することによって、階層的に曲データの選択を行うことができるようになっている。 With such a hierarchical index, a user can select a category from, for example, a comprehensive index, then select an artist from the category-specific index, and select a song from the artist-specific index. Song data can be selected.
ところで、カテゴリ,アーティスト,曲データ等の数が増えてくると、各階層のインデックス中の選択肢が増加してしまう。この結果、各階層のインデックス中の項目が増加し、例えばユーザがスクロールして全体を確認するといった必要が生じ、目的の曲を探すまでの手間が増加してしまう。このため、例えば階層構造を細分化することも考えられるが、階層の選択回数が増えてしまうので、ユーザの手間はあまり減少しない。 By the way, as the number of categories, artists, song data, etc. increases, the choices in the index of each hierarchy increase. As a result, the number of items in the index of each hierarchy increases, and it becomes necessary for the user to scroll to check the whole, for example, and the time and effort required to search for the target song increases. For this reason, for example, it is conceivable to subdivide the hierarchical structure. However, since the number of hierarchical selections increases, the user's effort does not decrease much.
このため、この情報提供システムでは、検索サーバ20によって、情報提供サーバ100,200,…が提供する情報について、キーワード等に応じた検索サービスを提供している。
Therefore, in this information providing system, the
(動作概要)
以下、情報提供サーバ100の曲データ格納領域111には、曲AAAの曲データとして、例えば40音と16音のSMAF(Synthetic music Mobile Application Format)形式のデータと、4音のSMD形式のデータが格納されている場合について説明する。
(Overview of operation)
Hereinafter, in the song
クローリング部21は、例えばHTTPサーバ120が提供しているインデックスデータのリンク構造を辿って、HTTPサーバ120が提供するコンテンツ(例えば曲データ)のアドレス(URL)を取得する。クローリング部21は、まず、HTTPサーバ120から総合インデックスのデータを取得し、順次下位のインデックスを辿って、曲データのリンクの記述を探す。曲データのリンクが見つかると、クローリング部21の判定部21Aは、条件保持部(禁止条件保持手段)21Bに保持されている禁止条件に該当するか否かを判定する。この禁止条件は、コンテンツの提供ルールに従っているか否かを判定するためのものであり、判定部21Aは、当該コンテンツ(例えば曲データ)が提供ルールに従っていなければ当該リンクについての処理を終了する。提供ルールに従っている場合には、クローリング部21は、曲データのファイル名、リンクの記述中の説明等が、DB22中のキーワード(k/w)リスト22E中のキーワード(例えば“AAA”)のいずれかに該当するか判断する。キーワードに該当するリンクがあれば、このリンクに対応する所定のアドレス(例えば広告,注意等の情報を含むページ(リンク先ページ)等)を当該キーワードに対応させて検索インデックス22Cに登録する。
The crawling
上述のようなクローリング動作と非同期に、検索サービス提供部23は、携帯電話端末装置50から供給された検索条件に該当するコンテンツに関する情報を検索インデックス22Cから抽出し、検索結果として携帯電話端末装置50に供給する。
Asynchronously with the crawling operation as described above, the search
(条件に応じたコンテンツに関する情報の収集)
また、この情報提供サービスでは、検索開始ページからのリンクの階層数,ページサイズ,不正なアドレス,ドメイン名,拡張子,アンカー名(<A>〜</A>で囲まれた文字列),ContentType(MIME−TYPE),<METAタグ>等により、コンテンツの提供ルールを規定しており、この提供ルールに従っていないコンテンツについては、上述の検索サービスの対象外としている。具体的には、このような提供ルール(条件)を満たしていないコンテンツについては、検索サーバ20による検索結果に含まれないようにしている。以下、具体的な動作について説明する。
(Collecting information on content according to conditions)
In this information providing service, the number of link layers from the search start page, page size, invalid address, domain name, extension, anchor name (character string enclosed in <A> to </A>), Content provision rules are defined by ContentType (MIME-TYPE), <META tag>, etc., and contents that do not comply with the provision rules are excluded from the above search service. Specifically, contents that do not satisfy such provision rules (conditions) are not included in the search results by the
クローリング部21は、例えば図5に示すように、コンテンツ提供サイトあるいは検索開始アドレス毎に、コンテンツの属性情報をコンテンツ情報テーブルとして保持している。このコンテンツ情報テーブルには、例えば属性の番号(No)と属性名と属性値とが対応付けられて保持されている。このコンテンツ情報テーブルには、属性名として、例えばコンテンツを識別するためのコンテンツID(No:1),コンテンツ名称(No:2),検索結果を表示するページのアドレス(トップURL)[結果表示用](No:3),コンテンツ紹介文(No:4),キーワードの引継ぎを行う際のアドレス[キーワード引継ぎURL](No:5),コンテンツのカテゴリ(No:6),排除キーワード(No:7),追加ワード(No:8),削除ワード(No:9),コンテンツについての情報収集を開始するアドレス[収集開始URL](No:10),コンテンツまでのインデックスの階層数の上限[収集階層数](No:11),コンテンツについての情報収集を行う上限ページ数[収集上限ページ](No:12),収集上限時間(No:13),他ホスト収集可否(No:14),収集スケジュール[収集開始時間](No:15),収集スケジュール[周期](No:16),インデック値底上げ(No:17)と、これらに対応する属性値とが保持されている。なお、判定部21Aが番号と属性名の関係を別途記憶しておけば、コンテンツ情報テーブルには、番号と属性値とを対応付けて保持しておけば足りる。さらには、“,”等の所定の区切り記号で区切った値の文字列とし、区切り記号で区切られた位置で番号を認識するようにしてもよい。
For example, as illustrated in FIG. 5, the crawling
コンテンツ情報テーブル内の属性名に対応する属性値の一部には、上述の提供ルールの一部が反映されている。具体的には、例えば収集階層数(No:11)には、収集開始URL(No:10)からの階層数が定義されており、収集対象の上限ページ数(No:12),情報の収集上限時間(No:13)が定義されている。また、排除キーワード(No:7)には、検索対象から排除すべきキーワードが定義されており、削除ワード(No:9)には削除すべきワードが定義されている。これらのキーワードとワードはいずれもクローリング部21による検索対象としない。
Part of the attribute value corresponding to the attribute name in the content information table reflects a part of the provision rule described above. Specifically, for example, the number of layers to be collected (No: 11) defines the number of layers from the collection start URL (No: 10), the upper limit number of pages to be collected (No: 12), and the collection of information An upper limit time (No: 13) is defined. The exclusion keyword (No: 7) defines a keyword to be excluded from the search target, and the deletion word (No: 9) defines a word to be deleted. None of these keywords and words are to be searched by the crawling
また、条件保持部21Bには、例えば図6に示すように、検索インデックス22Cに登録し得るコンテンツの条件(許可条件)を含むテーブルが格納されている。このテーブルには、クローリング部21が取得し得るインデックスファイルの拡張子と、情報を検索インデックス22Cに登録し得るインデックスファイルのMIME−TYPEを示す文字が含まれている。このテーブルは、判定部21Aが、クローリングの制御,クローリングによって得られた情報の蓄積の制御等において適宜参照する。
Further, for example, as shown in FIG. 6, the
さらに、条件保持部21Bには、例えばクローリング部21によるクローリング時にリンク先としてみなしてリンク先を辿るタグを定義するテーブル(図7),インデックスファイル等の中の情報の収集時に考慮すべきタグについて定義するテーブル(図8),クローリング時に考慮すべきHTTPレスポンスヘッダについて定義するテーブル(図9)等が格納されている。なお、これらの図6〜図9に示すテーブルは、同様の判定をプログラムによって実行すれば、必ずしも設ける必要はない。
Further, the
また、条件保持部21Bには、例えば図10に示すように、不正なアドレス,ドメイン名等を示す不正アドレステーブルが格納されている。このテーブルには、予め解っているコンテンツの提供ルールに従っていない情報提供サーバ100,200等のアドレスを登録しておく。
In addition, the
(判定処理)
上述のような条件の判断は、例えば図11に示すフローチャートに従って実行される。判定部21Aは、まず、例えば情報収集対象の情報提供サーバ100,200のサーバ証明書が有効であるか否かをチェックする(S1)。なお、このS1の処理は、httpsプロトコルで情報提供サーバ群10にアクセスする際のみに実行する。
(Determination process)
The determination of the conditions as described above is executed according to the flowchart shown in FIG. 11, for example. First, for example, the determination unit 21A checks whether or not the server certificate of the
次に、判定部21Aは、ロボット検索用の定義ファイルに応じたチェックを行う(S2)。情報提供サーバ100,200は、例えば図12に示すように、クローリング部21等のロボット検索用の定義ファイル“robots.txt”を保持しており、クローリング部21からの要求に応じてこの定義ファイルを送信する。クローリング部21は、別途ユニークなユーザ・エージェント(User−Agent)名を有しており、情報提供サーバ100,200から提供された定義ファイル“robots.txt”中のUser−Agent名が自らのUser−Agent名と一致している場合にのみ、当該定義ファイル“robots.txt”中の記述に従って情報提供サーバ100,200からの情報の収集を行う。
Next, the determination unit 21A performs a check according to the definition file for robot search (S2). As shown in FIG. 12, for example, the
以上の処理(収集を行う前の判断フェーズ)が終了すると、判定部21Aは、URLの正規表現によるチェックを行い(S3)、正規表現に従ったURLのみをクローリングの対象とする。URLの表現形式は標準規格として規定されており、当該標準規格に準拠していないURLは誤動作の原因にもなるため、このようなチェックを行っている。 When the above processing (judgment phase before collection) ends, the determination unit 21A performs a check using a regular expression of the URL (S3), and only URLs according to the regular expression are targeted for crawling. The URL expression format is defined as a standard, and a URL that does not comply with the standard may cause a malfunction, so such a check is performed.
また、判定部21Aは、URL中のファイル名の拡張子が、上述の図6中に示すテーブル中で規定された拡張子であるか否かを判定し、規定されている拡張子である場合にのみクローリングを行う(S4)。さらに、判定部21Aは、URL中のドメイン名が上述の図10に示す不正アドレステーブル中で規定されているか否かを確認し、このテーブル中で規定されていないドメイン名である場合にのみクローリングを行う(S5)。また、判定部21Aは、上述の図7及び図8に応じてアンカー名に対するチェックを行い、収集対象外として規定されているアンカー(タグ)以外についてのみクローリングを行う(S6)。また、この際、図8に示すテーブルに従って、当該アンカー内に画像ファイルに対するリンクがある場合には、収集対象としない。画像ファイルに対するリンクがある場合には広告であると見なし、情報収集を行わないようにするためである。 Further, the determination unit 21A determines whether or not the extension of the file name in the URL is an extension specified in the table shown in FIG. Only crawling is performed (S4). Further, the determination unit 21A checks whether or not the domain name in the URL is specified in the illegal address table shown in FIG. 10, and only when the domain name is not specified in this table, crawling is performed. (S5). Further, the determination unit 21A performs a check on the anchor name according to FIGS. 7 and 8 described above, and performs crawling only for those other than the anchor (tag) that is defined as a non-collection target (S6). At this time, if there is a link to the image file in the anchor according to the table shown in FIG. If there is a link to the image file, it is regarded as an advertisement and information is not collected.
以上の処理(収集前にURL名を元にの判断フェーズ)が終了すると、クローリング部21は対象となるURLからの情報収集を行う(S7)。対象となるURLからの情報が得られると、判定部21Aは、まず、得られた情報のMIME−TYPEが上述の図6に登録されているか否かを判定し、登録されているMIME−TYPEの情報のみを情報収集の対象とする(S8)。次に、判定部21Aは、<META>タグによるチェックを行い、nofollow,noindex等の記述がないもののみを情報収集の対象とする(S9)。
When the above processing (judgment phase based on URL name before collection) is completed, the crawling
以上のような処理により、クローリング部21の判定部21Aは、上述のように定義された許可条件に該当するコンテンツ又は禁止条件に該当しないコンテンツについての情報のみを検索インデックス22Cに登録させ、許可条件に該当しないコンテンツ又は禁止条件に該当するコンテンツについての情報は検索インデックス22Cに登録させない。このように、クローリングによる情報収集の対象を制限することにより、コンテンツの提供ルールに従っていないコンテンツが、クローリングによる情報収集の対象から除外され、検索インデックス22Cにこのようなコンテンツに関する情報が格納されることを防止することができる。
Through the processing as described above, the determination unit 21A of the crawling
また、クローリング部21は、以上のような処理に加えて、特定の情報提供サーバ100,200あるいは開始URLからのクローリングを行う制限時間(図5中の収集上限時間(No:13),上限ページ数(No:12),他ホスト(ドメイン)への収集可否(No:14)を判断しながら、情報収集を行い、これらの制限を超えた場合に、例外処理を行って当該情報収集を終了させる。
In addition to the processing described above, the crawling
また、クローリング部21は、上述のように収集したページ中に検索キーワードが存在するか否かを検索し、検索キーワード毎に検索インデックス22Cに登録する。この際、判定部21Aは、図5中の追加ワード(No:8)が設定されている場合には、当該ページ中に、追加ワードがなくても、当該追加ワードに対応させて検索インデックス22Cに登録する。具体的には、収集したページに「新着」,「POP」「インディーズ」等のキーワードがなくても、これらのキーワードに対応させて、当該収集したページについての情報を検索インデックス22Cに登録する。
Further, the crawling
また、判定部21Aは、図5中の削除ワード(No:9)が設定されている場合には、当該ページ中に、削除ワードがあっても、検索インデックス22Cには登録しない。具体的には、収集したページに「画像系」というキーワードがあっても、当該収集したページについての情報は検索インデックス22Cに登録しない。
Further, when the deleted word (No: 9) in FIG. 5 is set, the determination unit 21A does not register the deleted word in the
また、判定部21Aは、図5中の排除キーワード(No:7)が設定されている場合には、当該ページ中に中のアンカータグ内に排除キーワードがあっても、当該アンカーの示すリンク先に対するそれ以上の情報の収集は行わない。具体的には、例えば収集してきたページ中に「<a href=“www.ddd.com”>素敵な出会いはこちら<a>」等といったリンクが存在していてもリンク先のページ(www.ddd.com)に対しては情報の収集を行わない。 Further, when the exclusion keyword (No: 7) in FIG. 5 is set, the determination unit 21A, even if there is an exclusion keyword in the anchor tag in the page, the link destination indicated by the anchor No further information is collected for. Specifically, for example, “<a href =“ www. ddd. Even if there is a link such as “com”> Click here for nice encounters <a> ”, no information is collected for the linked page (www.ddd.com).
また、上述の図5中の収集階層数(No:11)によって定義された最大階層数に応じたコンテンツについての情報収集は、以下のように行う。クローリング部21は、例えば図13に示すように、判定部21Aによる判定結果に応じて、コンテンツの提供ルールに従っていない不正なページ(アドレスAB)及びこのページからリンクが張られている下位のページにおいて提供されている情報を検索インデックス22Cには登録しない。例えばコンテンツの階層が所定数(n)以内であることを提供ルールの1つとした場合には、判定部21Aは、例えば図14に示すように、上述の収集パターンで定義された収集開始URLからの階層数(x)をカウントしておき(S101,S105)、階層数xがnより大きくなったら、それ以下の階層のクローリングを中止して次の収集パターンのクローリングを開始する(S106)。
In addition, information collection for content according to the maximum number of layers defined by the number of collection layers (No: 11) in FIG. 5 is performed as follows. For example, as shown in FIG. 13, the crawling
また、ページサイズの上限を提供ルールとして設定する場合には、同図中のS103において、取得したページのデータのサイズを検出し、上限以上である場合には検索インデックス22Cに登録しないようにする。
When the upper limit of the page size is set as the provision rule, the size of the acquired page data is detected in S103 in the figure, and if it is larger than the upper limit, it is not registered in the
上述のように、不正なアドレス,ドメイン名等を提供ルールとする場合には、例えば図14中のS102,S107においてページのデータを取得する際に、判定部21Aが、当該ページのアドレスが上述の図10に示す不正アドレステーブルに登録されているアドレスを含むものであるか否かを判定し、登録されているアドレスを含む場合にはそれ以降の処理を中止する。 As described above, when an illegal address, domain name, or the like is used as a provision rule, for example, when acquiring page data in S102 and S107 in FIG. It is determined whether or not an address registered in the illegal address table shown in FIG. 10 is included. If the address includes a registered address, the subsequent processing is stopped.
例えばHTTPサーバ120が提供するページ(インデックス)が、上述の図13に示すような状態である場合に、アドレスAのページ中のリンク(アドレスAA,アドレスAB,アドレスAC,アドレスAD)についてクローリングを行うと、例えば図15に示すように、アドレスAA,アドレスAB,アドレスADのページは提供ルールに従っているため、これらのページ及びその下位層のページについてはクローリングの結果が検索インデックス22Cに登録されるが(S204,S208,S215)、アドレスACは提供ルールに従っていないためこのページ及び及びその下位層のページ中の情報については検索インデックス22Cに登録されない。
For example, when the page (index) provided by the
このような処理により、判定部21Aがコンテンツの提供ルールに従っているか否かを判定し、クローリング部21がこの判定結果に応じて提供ルールに従っているコンテンツについて情報を検索インデックス22Cに登録することにより、検索インデックス22Cから抽出した検索結果に、提供ルールに従っていないコンテンツについての情報が含まれてしまうことを防止することができる。
By such processing, it is determined whether or not the determination unit 21A complies with the provision rule of the content, and the crawling
(端末装置の表示能力に応じた情報の取得)
また、この情報提供システムでは、携帯電話端末装置50,60の表示能力に応じた適切な検索結果を提供するようになっている。具体的には、上述のような動作(クローリング動作)は、携帯電話端末装置50,60の表示能力毎に行うようになっている。表示能力対応表22Aには、例えば図16に示すように、携帯電話端末装置のグループ毎に、当該グループを示す識別情報(グループID)と、当該グループ内の代表機種を示す機種名(代表)と、機種を示す機種名(機種名一覧)との対応を示す対応テーブル22AA,22AB,22ACが格納されている。これらの対応テーブル22AA,22AB,22ACは、コンテンツの種類毎に設けられている。また、携帯電話端末装置50,60の機種毎の表示能力(例えば同時発音数,対応フォーマット等)は、例えば図17に示すようなテーブルとしてDB22等に格納されている。なお、グループIDに対応する表示能力毎のコンテンツを情報格納部110,210に格納する際に、グループIDに対応するディレクトリに格納する等の方法によってグループIDとコンテンツとの対応関係がわかるようにしておけば、これらの対応テーブルを設けなくてもよい。あるいは、機種グループの代表機種と機種名一覧との対応関係が明確であれば、必ずしもグループIDを設ける必要はない。
(Acquisition of information according to the display capability of the terminal device)
Further, in this information providing system, an appropriate search result corresponding to the display capability of the mobile phone terminal devices 50 and 60 is provided. Specifically, the above-described operation (crawling operation) is performed for each display capability of the mobile phone terminal devices 50 and 60. In the display capability correspondence table 22A, for example, as shown in FIG. 16, for each group of mobile phone terminal devices, identification information (group ID) indicating the group and a model name (representative) indicating the representative model in the group. And correspondence tables 22AA, 22AB, and 22AC indicating correspondence between model names and model names (model name lists) indicating models. These correspondence tables 22AA, 22AB, and 22AC are provided for each content type. Further, the display capability (for example, the number of simultaneous pronunciations, the corresponding format, etc.) for each model of the cellular phone terminal devices 50, 60 is stored in the
クローリング部21は、情報提供サーバのHTTPサーバに総合インデックス等のデータを要求する際に、検索対象に応じた対応テーブルを表示能力対応表22Aから選択し、選択した対応テーブル中の機種グループ毎に代表機種の機種名と、表示能力を示す情報等を用いて生成した拡張ヘッダ(以下、単にHTTP拡張ヘッダという。)を持つHTTPリクエストを送信する。例えば曲データを提供するHTTPサーバ120の総合インデックスのアドレス(URL)が“http://meloJAM.com/index.html”である場合に、クローリング部21が生成するHTTPリクエストは、例えば“GET http://meloJAM.com/index.html HTTP/1.1 2G V-DN02 x-display: 150x120 x-color: C4096 x-sound: 4 / 6KB”となる。ここで、HTTP拡張ヘッダ中の“V-DN02”は携帯電話端末装置の機種名を示す文字であり、“2G”は携帯電話端末装置の世代を示す文字である。また、“x-sound: 4”はこの携帯電話端末装置の同時発音数(4音)を示す文字である。
When the crawling
また、拡張ヘッダ中の“x-display: 150x120”は表示画素数が150×120画素であることを示しており、“x-color: C4096”は、同時発色数が4096色であることを示しており、“6KB”の部分は、インデックスデータ等のページ記述データの上限値が6キロバイトであることを示している。 In addition, “x-display: 150x120” in the extension header indicates that the number of display pixels is 150 × 120 pixels, and “x-color: C4096” indicates that the number of simultaneous colors is 4096 colors. “6 KB” indicates that the upper limit of page description data such as index data is 6 kilobytes.
上述のようなクローリングは、例えば図18に示すような構成の収集パターンファイルに従って行う。この収集パターン中では、個々の収集パターン名を示す文字(例えば“PATTERN1”)と、当該収集パターンにおいてデータの収集を開始するサイトのアドレス(URL)を示す文字(例えば“http://www.aaa.co.jp/”等)と、当該収集に使用する設定を示すエージェント名を示す文字が定義されている。 The crawling as described above is performed according to a collection pattern file having a configuration as shown in FIG. 18, for example. In this collection pattern, characters (for example, “PATTERN1”) indicating individual collection pattern names and characters (for example, “http: // www. aaa.co.jp/ ”etc.) and characters indicating the agent name indicating the settings used for the collection are defined.
また、個々のエージェント名毎に対応して、例えば図19に示すようなエージェント定義ファイル中で、エージェント名と、ブラウザのバージョンと、機種グループ毎の拡張ヘッダと、ページ上限値等を定義しておく。このテーブルは、例えば検索時に上述の表示能力対応表22Aを用いて生成するようにしてもよいが、予め作成してDB22に格納しておいてもよい。
For each agent name, for example, in the agent definition file as shown in FIG. 19, the agent name, browser version, extension header for each model group, page upper limit value, etc. are defined. deep. This table may be generated, for example, using the display capability correspondence table 22A described above at the time of search, but may be created in advance and stored in the
クローリング部21は、この図19に示すエージェント定義ファイルを参照して上述のHTTPリクエストを生成し、上述の図18に示す収集パターンに従ってクローリングを行う。
The crawling
また、クローリング部21は、例えば図20に示すように、上述の図18の収集パターンファイル中で規定されたエージェントに従って、HTTP拡張ヘッダ内の携帯電話端末装置の音声表示能力を示す情報“x-sound: xxx”を順次を変更してHTTPサーバ120に対するHTTPリクエストを繰り返す(S301,S303,S305,S307)。
Further, for example, as shown in FIG. 20, the crawling
また、クローリング部21は、各HTTPリクエストに対するHTTPサーバ120の応答(S302,S304,S306,S308)から、当該HTTPリクエストに対応するコンテンツの種類を特定し、DB22の検索インデックス22Cに登録する。
Further, the crawling
HTTPサーバ120は、上述の図16中のグループID毎あるいは図17中の端末能力毎に、上述の図4に示すインデックス情報を有しており、携帯電話端末装置の音声表示能力に応じたインデックス情報を供給するようになっている。上述の図1の例では、4音のSMD形式、16音及び40音のSMAF形式についてインデックス情報を有するが、32音のSMAF形式についてはHTTPサーバ120が提供しないためにインデックス情報も有していない。
The
上述のようにHTTPリクエストが供給されると(S301,S303,S305,S307)、HTTPサーバ120の要求解析部121は、HTTPリクエストの拡張ヘッダ中の“x-sound: n”に対応するグループID(“n”は同時発音数を示す文字)によって、端末側の音声表示能力を判断し、音声表示能力に対応するインデックス情報が存在すれば、応答部124にインデックス情報を送信させる(S302,S304,S308)。一方音声表示能力に対応するインデックス情報が存在しない場合には、要求解析部121は、応答部124にインデックス情報が存在しない旨の応答メッセージを送信させる(S306)。
When the HTTP request is supplied as described above (S301, S303, S305, S307), the
さらに、クローリング部21は、情報提供サーバ100に存在するインデックス情報を取得し、予めDB22に登録されたキーワードに対応するファイル名,文字等が存在するか否かを調べ、キーワードに該当するものがあれば、例えば図21に示すように、検索インデックス22Cに、端末の音声表示能力を機種グループのグループID,当該機種グループに属する機種名一覧,当該コンテンツに対応する所定のアドレス(例えば広告,注意等の情報を含むページ(リンク先ページ)等)等をキーワードに対応させて登録する。
Further, the crawling
以上のような動作により、携帯電話端末装置の音声表示能力に応じた検索インデックス22Cが作成される。この検索インデックス22Cには、対応する機種名が登録されているため、検索サービスを要求する携帯電話端末装置の機種名に応じた検索結果の抽出が容易である。また、情報提供サーバ200によって提供される画像データについても、拡張ヘッダ中の画像表示能力を示す情報(“x-display: XxY”,“x-color: yyy”)を順次変化させてHTTPサーバ220にインデックス情報を要求し、上述と同様にインデックス情報中のキーワード検索を行うことにより、図21に示すように、携帯電話端末装置の画像表示能力に応じた検索インデックス22Cを作成することができる。
By the operation as described above, the
(検索サービス)
上述のようなクローリング動作と非同期に、検索サービス提供部23は、携帯電話端末装置50のWebブラウザ530等に対して検索サービスを提供している。
(Search service)
Asynchronously with the crawling operation as described above, the search
ユーザから検索サービスの利用が指示されると、Webブラウザ530は、検索サービス提供部23に対して、検索条件の入力用のデータを要求する。これに応じて、検索サービス提供部23からデータが供給されると、Webブラウザ530は、例えば図22に示すように、検索語入力画面を表示部55の表示画面に表示させる。携帯電話端末装置50の音声表示能力が32音である場合には、ユーザが、検索条件(例えば曲名「AAA」)を入力して検索を指示すると、Webブラウザ530は、検索サービス提供部23に検索条件を示す文字と当該携帯電話端末装置50の機種名“V-T08”を含む拡張ヘッダを含むHTTPリクエストを送信する(S401)。
When the use of the search service is instructed by the user, the
検索サービス提供部23は、Webブラウザ530から供給されたHTTPリクエスト中の検索条件を示す文字(例えば“AAA”)と拡張ヘッダ中の機種名(例えば“V-T08”)に対応する情報を検索インデックス22Cから抽出し、ヒット件数,曲名,曲データのアドレスに対するリンク情報等を含む応答メッセージ(検索結果)を生成し、Webブラウザ530宛てに送信する(S402)。このような応答メッセージを受信すると、Webブラウザ530は同図中に示すように、検索結果に応じた検索結果一覧画面を表示する。
The search
上述の図1に示す例では、曲データ格納領域111に携帯電話端末装置(機種名“V-T08”)の音声表示能力(8音)に対応する曲AAAの曲データがなく、クローリングによって得られた検索インデックス22Cには上述の図21に示すように機種名“V-T08”に対応する曲AAAの8音の曲データについての情報が登録されていない。このため、検索サービス提供部23が提供する検索結果は、この図22に示すように、ヒット件数が0件であり、曲AAAの曲データについての情報が含まれていない状態になる。
In the example shown in FIG. 1 described above, there is no song data of the song AAA corresponding to the voice display capability (8 sounds) of the mobile phone terminal device (model name “V-T08”) in the song
また、音声表示能力が40音の携帯電話端末装置(例えば機種名“V-SH53”)から、上述の図22の例と同様に曲名「AAA」を検索条件として、検索を要求した場合には、例えば図23に示すように、検索サービス提供部23に供給されるHTTPリクエストの拡張ヘッダには携帯電話端末装置の機種名“V-SH53”が含まれている(S501)。上述の図1に示す例では、曲データ格納領域111には曲AAAに対応する40音の曲データがあり、検索インデックス22Cには上述の図21に示すようにに“V-SH53”に対応する曲AAAの40音の曲データについての情報が登録されている。このため、検索サービス提供部23は、この図23に示すように、曲AAAの曲データに対応するリンク先ページのアドレス“http://meloJAM.com/cgi/abc.cgi?”とキーワードを示す情報“keyword=AAA”がリンク情報として含まれている検索結果をWebブラウザ530に提供する(S502)。
Further, when a search is requested from a mobile phone terminal device (for example, model name “V-SH53”) having a voice display capability of 40 sounds using the song name “AAA” as a search condition in the same manner as in the example of FIG. For example, as shown in FIG. 23, the extension header of the HTTP request supplied to the search
このようにリンク情報に含まれているキーワードを示す情報は、ユーザが選択したコンテンツのデータを要求する際に、GETコマンドの一部として情報提供サーバに供給される。なお、キーワードを示す“AAA”の部分は、実際には携帯電話端末装置の世代に応じたキャラクタコードでエスケープエンコード(“%xx”の形式)されている。すなわち、第2世代の携帯電話端末装置の場合には、キャラクタコードとして例えばShift−JISが用いられており、第2.5世代と第3世代の携帯電話端末装置の場合には、キャラクタコードとして例えばShift−JIS,UTF−8,EUC−JP,ISO−2022−JPの中の当該携帯電話端末装置の設定に応じたキャラクタコードが用いられる。 Information indicating the keyword included in the link information is supplied to the information providing server as a part of the GET command when requesting the data of the content selected by the user. The “AAA” part indicating the keyword is actually escape encoded (in the form of “% xx”) with a character code corresponding to the generation of the mobile phone terminal device. That is, for example, Shift-JIS is used as the character code in the case of the second generation mobile phone terminal device, and as the character code in the case of the 2.5th generation and third generation mobile phone terminal devices. For example, a character code corresponding to the setting of the mobile phone terminal device in Shift-JIS, UTF-8, EUC-JP, ISO-2022-JP is used.
検索結果を確認したユーザが曲を選択すると、Webブラウザ530は、選択された曲に対応するリンク情報に応じて、対応する情報提供サーバ100にユーザが選択した曲に対応する曲データの提供を要求する(S503)。この要求(HTTPリクエスト)には、拡張ヘッダにキーワードを示す情報“keyword=AAA”と、携帯電話端末装置50の音声表示能力が40音であることを示す情報(x-sound: 40)が含まれている。
When the user who has confirmed the search result selects a song, the
このようなHTTPリクエストを受信すると、情報提供サーバ100の要求解析部121は、インデックス保持部122からキーワード“AAA”に該当するコンテンツのアドレスを取得し、広告等の画像等の情報を有するリンク先ページのデータに、コンテンツに対するリンクの記述を付加して応答部124に送信させる(S504)。
Upon receiving such an HTTP request, the
携帯電話端末装置のWebブラウザ530は、このようなリンク先ページのデータに応じた画像を表示部55に表示させる。ユーザが、コンテンツの取得を選択すると、Webブラウザ530は、コンテンツのデータを情報提供サーバに要求する(S505)。これに応じて、情報提供サーバからコンテンツのデータ(この場合は曲AAAの40音の曲データ)が供給されると(S506)、Webブラウザ530は、供給されたデータをメモリ53に格納する。
The
これにより、この情報提供システムでは、検索結果として、任意のページのアドレスを提供すると共に、キーワードを情報提供サーバに引き継ぐことができるため、例えばユーザの操作負担を増加させずに広告等の情報を有するページを経由させたコンテンツの提供を行うことができる。 As a result, in this information providing system, an address of an arbitrary page can be provided as a search result, and keywords can be handed over to the information providing server. Therefore, for example, information such as advertisements can be displayed without increasing the operation burden on the user. It is possible to provide content via a page that the user has.
ところで、DB22中のテンプレート22Dには、例えば図24,図27及び図28に示すように、携帯電話端末装置の世代毎に検索結果の生成に用いるテンプレートが格納されている。各テンプレート中の変数の意味は図25に、コマンドの意味は図26に、ぞれぞれ示されている。
By the way, in the template 22D in the
携帯電話端末装置の世代は、機種名に対応する世代を上述の図17に示すテーブルから取得することによって判断することができる。第2世代(2G)の携帯電話端末装置では、Webブラウザ530は、回線交換機31及びGW35経由でHTTPサーバ23Aにアクセスする。この際、Webブラウザ530は、HTTPリクエストに当該携帯電話端末装置の機種を示す識別情報を付加する。GW35は、この識別情報に対応する機種名を示す文字,解像度を示す文字等の情報を保持しており、HTTPリクエスト中の識別情報に対応する機種名を示す文字等の情報を拡張ヘッダとしてHTTPリクエストに付加する。また、第2.5世代(2.5G)の携帯電話端末装置では、Webブラウザ530は、HTTP拡張ヘッダ中に機種名を示す文字等を付加し、パケット交換機32経由でHTTPサーバ23Aにアクセスする。さらに、第3世代(3G)の携帯電話端末装置では、Webブラウザ530は、HTTP拡張ヘッダ中に機種名を示す文字等を付加し、RNC41a(41b)経由でHTTPサーバ23Aにアクセスする。従って、検索サーバ20の検索サービス提供部23は、上述の図17に示すテーブルを参照することにより、HTTP拡張ヘッダ中の機種名を示す文字に対応する世代を知ることができる。
The generation of the mobile phone terminal device can be determined by acquiring the generation corresponding to the model name from the table shown in FIG. In the second generation (2G) mobile phone terminal device, the
検索サービス提供部23は、アクセス元の携帯電話端末装置が第2世代であれば、図24に示すテンプレートを用い、アクセス元の携帯電話端末装置が第2.5世代であれば、図27に示すテンプレートを用い、アクセス元の携帯電話端末装置が第3世代であれば、図28に示すテンプレートを用いて携帯電話端末装置に対する応答メッセージを生成する。
The search
具体的には、例えば携帯電話端末装置が第2世代であり、“AAA”についての検索結果が1件である場合には、応答部23bが上述の図24に示すテンプレートを用いて生成する検索結果のデータは、例えば図29に示すようになる。このような検索結果のデータに応じて表示部55に表示される画像は、例えば図23中のS502において表示される画像のようになる。 Specifically, for example, when the mobile phone terminal device is the second generation and the search result for “AAA” is one, the search generated by the response unit 23b using the template shown in FIG. The resulting data is, for example, as shown in FIG. An image displayed on the display unit 55 in accordance with such search result data is, for example, an image displayed in S502 in FIG.
また、携帯電話端末装置が第2.5世代であり、“AAA”についての検索結果が11件である場合には、応答部23bが生成する検索結果のデータに応じて表示部55に表示される画像は、例えば図30に示すようになる。さらに、携帯電話端末装置が第3世代であり、“AAA”についての検索結果が11件である場合には、応答部23bが生成する検索結果のデータに応じて表示部55に表示される画像は、例えば図31に示すように、各コンテンツについての説明等の情報を表示することができるようになる。 Further, when the mobile phone terminal device is the 2.5th generation and there are 11 search results for “AAA”, it is displayed on the display unit 55 according to the search result data generated by the response unit 23b. For example, the image is as shown in FIG. Furthermore, when the mobile phone terminal device is the third generation and there are 11 search results for “AAA”, an image displayed on the display unit 55 according to the search result data generated by the response unit 23b. For example, as shown in FIG. 31, information such as an explanation about each content can be displayed.
このように、携帯電話端末装置の世代に応じたテンプレートによって検索結果を生成することにより、携帯電話端末装置の表示能力に応じて、例えば携帯電話端末装置の世代毎に検索結果の表示件数,内容等を変更し、適切な検索結果を生成することができる。 In this way, by generating a search result using a template according to the generation of the mobile phone terminal device, the number of search results displayed and the content for each generation of the mobile phone terminal device, for example, according to the display capability of the mobile phone terminal device Etc., and appropriate search results can be generated.
なお、GW35,パケット交換機32,RNC41a(41b)と検索サービス提供部23の間では、上位プロトコルとしてTCP/IPプロトコルを用いて通信を行っている。このため、検索サービス提供部23はアクセス元のIPアドレスによって携帯電話端末装置の世代を判断することもでき、このような構成とすることもできる。
The GW 35, the
以上、曲データの場合を例に説明したが、画像データについても同様に、検索サービス提供部23は、HTTPリクエストの拡張ヘッダ中の機種名に応じて、検索インデックス22Cからのデータの抽出を行って検索結果を携帯電話端末装置に送信する。
As described above, the case of music data has been described as an example. Similarly, for image data, the search
(効果)
階層数,ページサイズ等のコンテンツの提供ルールに従っていないコンテンツが検索結果に含まれてしまうと、ユーザによる選択回数が増えてしまったり、コンテンツを取得しても表示できなかったりすることがあり、利便性を低下させてしまう。
(effect)
If content that does not comply with the content provision rules such as the number of layers and page size is included in the search results, the number of selections by the user may increase, or the content may not be displayed even if it is acquired. It will reduce the sex.
これに対し、この情報提供システムでは、検索サーバ20の判定部21Aの判定結果に応じて、提供ルールに従っていない不正なコンテンツについての情報を検索インデックス22Cに登録していないため、この検索インデックス22Cから抽出した検索結果に不正なコンテンツについての情報が含まれることがない。このため、この情報提供システムでは、利便性の低下の防止に寄与することができる。
On the other hand, in this information providing system, information on illegal content that does not comply with the provision rules is not registered in the
また、携帯電話端末装置の表示能力を考慮しないで検索を行った場合には、検索結果に携帯電話端末装置で利用できない情報が含まれてしまい、ユーザが逐一リンクを辿って当該携帯電話端末装置で表示可能なコンテンツであるか判断する必要がある。 In addition, when a search is performed without considering the display capability of the mobile phone terminal device, information that cannot be used in the mobile phone terminal device is included in the search result, and the user follows the link one by one, and the mobile phone terminal device It is necessary to determine whether the content can be displayed in
これに対し、この情報提供システムでは、上述のように、検索サービス提供部23が、検索インデックス22Cから携帯電話端末装置の機種名に対応する曲データのみを検索結果として供給することができる。検索インデックス22Cには、所定の機種グループ内の携帯電話端末装置の機種名と利用可能なコンテンツについての情報が対応付けられて登録されているため、携帯電話端末装置で表示できるコンテンツについての情報のみを検索結果として供給することができる。
On the other hand, in this information providing system, as described above, the search
従って、この情報提供システムでは、利用可能なコンテンツを取得するまでのユーザの操作回数を低減させて、ユーザの操作負担の低減に寄与することができる。また、携帯電話端末装置で利用できない曲データにアクセスする可能性を低減させることができるため、無用なトラフィックの低減,通信料金の節約に寄与することができる。 Therefore, in this information providing system, it is possible to reduce the number of user operations until obtaining usable content, thereby contributing to a reduction in the user's operation burden. Moreover, since the possibility of accessing music data that cannot be used by the mobile phone terminal device can be reduced, it is possible to contribute to the reduction of unnecessary traffic and the saving of communication charges.
また、この情報提供システムでは、曲データ,画像データ等のコンテンツの種類毎に設定した機種グループ毎にクローリングを行っているため、携帯電話端末装置の表示能力に応じた適切な検索インデックス22Cを生成するための情報提供サーバに対するアクセスの回数の増加を抑制することができる。
In addition, since this information providing system performs crawling for each model group set for each type of content such as song data and image data, an
さらに、この情報提供システムでは、表示能力が同じ機種グループ毎に検索インデックス22C中のデータを生成しており、機種名自体を登録しておくことにより、別途機種グループ内の機種名のテーブルを有する場合に比較してDB22中のデータの参照回数を低減させて検索の高速化に寄与することがでできる。
Further, in this information providing system, data in the
また、この情報提供システムでは、表示部55に表示可能な文字数等の画像表示能力が携帯電話端末装置の世代毎に決定されているため、世代に応じたテンプレートを用いて検索結果を生成することにより、表示部55の表示能力に応じた適切な検索結果を生成することができる。 Further, in this information providing system, since the image display capability such as the number of characters that can be displayed on the display unit 55 is determined for each generation of the mobile phone terminal device, a search result is generated using a template corresponding to the generation. Thus, an appropriate search result corresponding to the display capability of the display unit 55 can be generated.
10 情報提供サーバ群、110,120 情報格納部、120,220 HTTPサーバ、121 要求解析部、122 インデックス保持部、123 コンテンツ取得部、124 応答部、20 検索サーバ、21 クローリング部、21A 判定部、21B 条件保持部,22 DB、22A 表示能力対応表、22B 収集パターン、22C 検索インデックス、22D テンプレート、23 検索サービス提供部、50,60 携帯電話端末装置、52 MPU、530 Webブラウザ、53 メモリ、53a 着メロデータ保持部、53b 画像データ保持部 10 information providing server group, 110, 120 information storage unit, 120, 220 HTTP server, 121 request analysis unit, 122 index holding unit, 123 content acquisition unit, 124 response unit, 20 search server, 21 crawling unit, 21A determination unit, 21B condition holding unit, 22 DB, 22A display capability correspondence table, 22B collection pattern, 22C search index, 22D template, 23 search service providing unit, 50, 60 mobile phone terminal device, 52 MPU, 530 Web browser, 53 memory, 53a Ringtone data holding unit, 53b Image data holding unit
Claims (4)
該クローリング手段のクローリングに応じてコンテンツに関する情報を保持する検索インデックスと、
該検索インデックスに情報を登録するコンテンツの条件を保持する条件保持手段と、
該条件保持手段に保持されている条件に応じて前記クローリング手段による前記クローリング又は前記検索インデックスに対する前記情報の格納を制御する制御手段と
を備えることを特徴とする検索装置。 Crawling means for collecting (crawling) information related to the content provided by the content providing server;
A search index that holds information about the content according to crawling by the crawling means;
Condition holding means for holding a condition of contents for registering information in the search index;
A search device comprising: control means for controlling storage of the information for the crawling or the search index by the crawling means according to a condition held in the condition holding means.
前記クローリング手段は、コンテンツの表示能力毎に設定された機種グループ内の代表機種のコンテンツ表示能力を示す情報を用いて前記コンテンツに関する情報を検索し、
前記検索インデックスは、前記クローリング手段によって得られたコンテンツに関する情報を,クローリング時の機種グループ内の端末装置の機種名を示す識別情報に対応付けて保持し、
端末装置からの情報要求命令中の機種名を示す識別情報に応じて前記検索インデックス中のコンテンツに関する情報を取得する検索手段
を備えることを特徴とする請求項1記載の検索装置。 The content providing server may provide content according to information indicating content display capability in the information request command,
The crawling means searches for information related to the content using information indicating the content display capability of a representative model in the model group set for each content display capability,
The search index holds information related to the content obtained by the crawling means in association with identification information indicating the model name of the terminal device in the model group at the time of crawling,
The search device according to claim 1, further comprising search means for acquiring information related to the content in the search index in accordance with identification information indicating a model name in an information request command from a terminal device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004118356A JP4436177B2 (en) | 2004-04-13 | 2004-04-13 | Search device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004118356A JP4436177B2 (en) | 2004-04-13 | 2004-04-13 | Search device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005301759A true JP2005301759A (en) | 2005-10-27 |
JP4436177B2 JP4436177B2 (en) | 2010-03-24 |
Family
ID=35333199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004118356A Expired - Fee Related JP4436177B2 (en) | 2004-04-13 | 2004-04-13 | Search device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4436177B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008040643A (en) * | 2006-08-03 | 2008-02-21 | Fugaku-Bussan Co Ltd | External equipment control system and its program |
JP2009199463A (en) * | 2008-02-22 | 2009-09-03 | Sony Computer Entertainment Inc | Terminal device, information provision system, file access method, and data structure |
WO2010041517A1 (en) * | 2008-10-08 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Information collecting device, search engine, information collecting method and program |
JP2011118454A (en) * | 2009-11-30 | 2011-06-16 | Fujitsu Toshiba Mobile Communications Ltd | Information processing apparatus |
-
2004
- 2004-04-13 JP JP2004118356A patent/JP4436177B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008040643A (en) * | 2006-08-03 | 2008-02-21 | Fugaku-Bussan Co Ltd | External equipment control system and its program |
JP2009199463A (en) * | 2008-02-22 | 2009-09-03 | Sony Computer Entertainment Inc | Terminal device, information provision system, file access method, and data structure |
WO2010041517A1 (en) * | 2008-10-08 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Information collecting device, search engine, information collecting method and program |
JP5325229B2 (en) * | 2008-10-08 | 2013-10-23 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Information collecting apparatus, search engine, information collecting method and program |
US8676782B2 (en) | 2008-10-08 | 2014-03-18 | International Business Machines Corporation | Information collection apparatus, search engine, information collection method, and program |
JP2011118454A (en) * | 2009-11-30 | 2011-06-16 | Fujitsu Toshiba Mobile Communications Ltd | Information processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP4436177B2 (en) | 2010-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4205955B2 (en) | Method and apparatus for accessing individual video / audio web content via a wireless device | |
US8374651B2 (en) | System and method for generating a graphical user interface | |
US8346797B2 (en) | Search device and information providing system | |
JP2002202936A (en) | Information collecting server, information collecting method and recording medium | |
US20080033918A1 (en) | Systems, methods and computer program products for supplemental data communication and utilization | |
JP4436177B2 (en) | Search device | |
KR100556530B1 (en) | Method for information searching on wireless internet | |
JP5088259B2 (en) | Content prefetching method, portable terminal and SNS server | |
JP2007096570A (en) | Phone connection method | |
JP2002123533A (en) | Contents registration device, contents registration method and computer-readable recording medium | |
JP2006209222A (en) | File retrieving device | |
JP4350631B2 (en) | Search service provision system | |
US20060150116A1 (en) | Data distribution system | |
JP2004342044A (en) | Customizing system for portable terminal, management server, portable terminal and program for portable terminal | |
JP4396404B2 (en) | CONTENT PROVIDING SYSTEM, ITS METHOD, SERVER, AND PROGRAM | |
JP2003006230A (en) | Method and server for information retrieval processing, method and device for presenting information, program and medium | |
JP2007011761A (en) | Retrieval system and mobile communication terminal | |
JP2006107199A (en) | Retrieval system | |
JP4346276B2 (en) | Information search system, information search device, information search method, and information search program | |
JP2006048141A (en) | Information retrieval system, information retrieval server, information retrieval method and information retrieval program | |
JP2002215675A (en) | Information retrieval system | |
JP2005031906A (en) | Information communication terminal device and process shared server device | |
KR100886763B1 (en) | The system and method for connecting web site | |
JP2004355291A (en) | Retrieval server device and information providing system | |
EP2089822B1 (en) | System and process for identifying addresses in a distributed data network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090127 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090326 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090508 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4436177 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160108 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |