JP2005301759A - Retrieval apparatus - Google Patents

Retrieval apparatus Download PDF

Info

Publication number
JP2005301759A
JP2005301759A JP2004118356A JP2004118356A JP2005301759A JP 2005301759 A JP2005301759 A JP 2005301759A JP 2004118356 A JP2004118356 A JP 2004118356A JP 2004118356 A JP2004118356 A JP 2004118356A JP 2005301759 A JP2005301759 A JP 2005301759A
Authority
JP
Japan
Prior art keywords
search
information
crawling
content
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004118356A
Other languages
Japanese (ja)
Other versions
JP4436177B2 (en
Inventor
Osamu Kurai
修 倉井
Kentaro Okada
健太郎 岡田
Akira Tanaka
暁 田中
Masaharu Ejiri
正晴 江尻
Minoru Kushida
実 串田
Nobuyuki Imamura
信行 今村
Ayako Sugano
紋子 菅野
Akihito Kiuchi
聡仁 木内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
Vodafone KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vodafone KK filed Critical Vodafone KK
Priority to JP2004118356A priority Critical patent/JP4436177B2/en
Publication of JP2005301759A publication Critical patent/JP2005301759A/en
Application granted granted Critical
Publication of JP4436177B2 publication Critical patent/JP4436177B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval apparatus contributing to prevention of deterioration in convenience by preventing retrieval results from including information on unauthorized contents. <P>SOLUTION: A crawling part 21 performs crawling while consecutively changing an extension header to show phonetic representation capability requesting HTTP into phonetic representation capability of a representative model in each type group. A decision part 21A detects whether a providing rule of contents is followed, while the crawling part 21 registers only the crawling results following the providing rule onto a retrieve index 22C by corresponding to a name of the model in the model group. A retrieval service providing part 23 retrieves from a retrieve index 22C in accordance with retrieval conditions (a password and the like) from a portable telephone terminal 50 and the name of the model making the HTTP request. A response part 23b generates retrieval results in accordance with a template 22D to transmits them to a Web browser 530 of the portable telephone terminal 50 via an HTTP server 23A. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、携帯電話端末装置等の情報端末装置からの要求に応じて着信メロディ,画像等のコンテンツに関する情報を提供する検索装置に関する。   The present invention relates to a search device that provides information related to contents such as a ringing melody and an image in response to a request from an information terminal device such as a mobile phone terminal device.

着信待機時の着信音あるいは着信メロディあるいは待ち受け画面等のデータ(コンテンツ)をネットワーク経由でHTTPサーバ等の情報提供サーバ装置から取得して、ユーザの好みに応じたカスタマイズが可能な携帯電話端末装置が知られている(例えば特許文献1参照。)。   A mobile phone terminal device that can acquire data (contents) such as a ring tone, incoming melody, standby screen, or the like when waiting for an incoming call from an information providing server device such as an HTTP server via a network, and can be customized according to user preferences. It is known (for example, refer to Patent Document 1).

提供可能なコンテンツの数が増えてくると、例えばカテゴリ別,アーティスト別,曲別等といったように、ディレクトリ毎に分類し、段階的にデータの選択を行うようにする必要が生じる。ところが、携帯電話端末装置の表示画面は、パーソナル・コンピュータ等の汎用の情報処理装置と比較して、サイズ的な制約が大きく、1画面に表示できる情報が限られてしまうため、目的とするコンテンツを見つけるまでの操作回数が多くなってしまう。   As the number of contents that can be provided increases, it becomes necessary to classify data by directory and select data step by step, for example, by category, artist, or song. However, the display screen of the mobile phone terminal device is larger in size than the general-purpose information processing device such as a personal computer, and the information that can be displayed on one screen is limited. The number of operations to find will increase.

このため、インターネット等のネットワーク経由で提供されている情報検索サービスをこのようなデータの検索に使うことが考えられる。このような情報検索サービスでは、予め、検索ロボットによるクローリングによって、コンテンツを提供する情報提供サーバ装置が提供するコンテンツのアドレスを収集し、コンテンツのキーワード毎にデータベースに登録しておく。   For this reason, it is conceivable to use an information search service provided via a network such as the Internet for such data search. In such an information search service, content addresses provided by an information providing server device that provides content are collected in advance by crawling by a search robot and registered in the database for each content keyword.

検索サービスを提供するサーバ装置は、ユーザの端末装置からキーワードが供給されると、データベース中からキーワードに該当するコンテンツのアドレス等の情報を抽出し、検索結果として端末装置に提供する(例えば非特許文献1参照。)。
特開2000−76264号(第6−7頁、第1図、第2図) SEO JAPAN、“検索エンジンって何?”、2003年、[online]、SEO JPAN、[平成16年1月9日検索]、インターネット<URL:http://www.seojapan.jp/search-engines/search-engine.html>
When a keyword is supplied from the user's terminal device, the server device that provides the search service extracts information such as the address of the content corresponding to the keyword from the database and provides it to the terminal device as a search result (for example, non-patent) Reference 1).
JP 2000-76264 A (page 6-7, FIGS. 1 and 2) SEO JAPAN, “What is a search engine?”, 2003, [online], SEO JPAN, [Search January 9, 2004], Internet <URL: http://www.seojapan.jp/search-engines /search-engine.html>

ところで、ユーザの利便性,携帯電話端末装置の表示能力等を考えてリンクの階層数,ページサイズ等のコンテンツの提供ルールを設定することが考えられるが、上述のような検索サービスでは、検索結果に,提供ルールを遵守しない不正なコンテンツについての情報が含まれてしまう。   By the way, it is conceivable to set content provision rules such as the number of link hierarchies and page size in consideration of the convenience of the user, the display capability of the mobile phone terminal, and the like. Information on illegal content that does not comply with the provision rules.

このような検索結果からユーザがコンテンツを選択しようとすると、選択回数が増えてしまったり、コンテンツを取得しても携帯電話端末装置で表示できなかったりして利便性が低下してしまう。   When the user tries to select content from such a search result, the number of selections increases, and even if the content is acquired, it cannot be displayed on the mobile phone terminal device, and convenience is reduced.

本発明は、上述のような課題に鑑みてなされたものであり、検索結果に不正なコンテンツについての情報が含まれないようにして、利便性の低下の防止に寄与することができる検索装置を提供することを目的とする。   The present invention has been made in view of the above-described problems, and provides a search device that can contribute to prevention of a decrease in convenience by preventing information on illegal content from being included in a search result. The purpose is to provide.

上述の問題を解決するために、本発明に係る検索装置は、コンテンツ提供サーバが提供するコンテンツに関する情報を収集(クローリング)するクローリング手段と、クローリング手段のクローリングに応じてコンテンツに関する情報を保持する検索インデックスと、検索インデックスに情報を登録するコンテンツの条件を保持する条件保持手段と、条件保持手段に保持されている条件に応じてクローリング手段によるクローリング又は検索インデックスに対する情報の格納を制御する制御手段とを備えることを特徴とする。条件保持手段が保持する条件には、例えばコンテンツの種類に応じた許可条件、あるいはクローリング手段が検索を開始する所定のアドレス(例えば検索開始ページのアドレス)からのリンク階層数,ページサイズのいずれかの値に応じた禁止条件等の条件が考えられる。   In order to solve the above problem, a search device according to the present invention includes a crawling unit that collects (crawling) information about content provided by a content providing server, and a search that holds information about content according to crawling by the crawling unit. An index, a condition holding unit that holds a condition of content for registering information in the search index, and a control unit that controls crawling by the crawling unit or storage of information for the search index according to the condition held in the condition holding unit; It is characterized by providing. The condition held by the condition holding means is, for example, either a permission condition according to the type of content, or the number of link hierarchies from a predetermined address (for example, the address of the search start page) or the page size from which the crawling means starts searching. A condition such as a prohibition condition according to the value of can be considered.

本発明では、制御手段が、条件保持手段に保持されている禁止条件又は許可条件に応じてクローリング手段によるクローリング又は検索インデックスに対するアドレスの格納を制御することにより、禁止条件に該当するコンテンツのアドレスを検索インデックスに格納することを阻止することができ、あるいは許可条件に該当するコンテンツのアドレスを検索インデックスに格納することができる。このため、検索インデックスから検索した検索結果に禁止条件に該当するコンテンツあるいは許可条件に該当しないコンテンツのアドレスが含まれることがない。   In the present invention, the control means controls the storage of the address for the crawling or search index by the crawling means according to the prohibition condition or permission condition held in the condition holding means, so that the address of the content corresponding to the prohibition condition is determined. It is possible to prevent storage in the search index, or it is possible to store the address of the content corresponding to the permission condition in the search index. For this reason, the search result searched from the search index does not include the address of the content corresponding to the prohibition condition or the content not corresponding to the permission condition.

これにより、検索結果に不正なコンテンツについての情報が含まれないようにして、利便性の低下の防止に寄与することができる。   Thereby, it can contribute to prevention of the fall of the convenience by not including the information about unauthorized content in a search result.

本発明は、例えば異なる表示能力を有する複数の形式の携帯電話端末装置に対して着信メロディ,画像等のデータ(コンテンツ)を提供する情報提供システムに適用することができる。   The present invention can be applied to an information providing system that provides data (contents) such as ringing melody and image to a plurality of types of mobile phone terminal devices having different display capabilities.

(全体構成)
本発明の一実施例に係る情報提供システムは、例えば図1に示すように、インターネット等のネットワーク1経由で着信メロディ,待ち受け画面等のコンテンツを提供する情報提供サーバ群10と、情報提供サーバ群10が提供するコンテンツに関する検索サービスを提供する検索サーバ(検索装置)20と、この検索サーバ20が提供する検索サービスを利用する携帯電話端末装置50及び携帯電話端末装置60を備えている。
(overall structure)
As shown in FIG. 1, for example, an information providing system according to an embodiment of the present invention includes an information providing server group 10 for providing contents such as a ringing melody and a standby screen via a network 1 such as the Internet, and an information providing server group. 10 includes a search server (search device) 20 that provides a search service related to content provided by 10, and a mobile phone terminal device 50 and a mobile phone terminal device 60 that use the search service provided by the search server 20.

携帯電話端末装置50は、例えばPDC(Personal Digital cellular)方式の移動体通信ネットワークからなる移動体通信網30を介して情報提供サーバ群10及び検索サーバ20にアクセス可能となっている。また、携帯電話端末装置60は、例えばW−CDMA(Wideband-Code Division Multiple Access)方式の移動体通信ネットワークからなる移動体通信網40を介して情報提供サーバ群10及び検索サーバ20にアクセス可能となっている。   The mobile phone terminal device 50 is accessible to the information providing server group 10 and the search server 20 via a mobile communication network 30 including, for example, a PDC (Personal Digital cellular) mobile communication network. In addition, the mobile phone terminal device 60 can access the information providing server group 10 and the search server 20 via the mobile communication network 40 including, for example, a W-CDMA (Wideband-Code Division Multiple Access) mobile communication network. It has become.

(情報提供サーバ群構成)
情報提供サーバ群10は、例えば複数の情報提供サーバ(コンテンツ提供サーバ)100,200,…から構成されている。各情報提供サーバ100(200)は、当該情報提供サーバが提供するコンテンツを格納する情報格納部110(210)と、情報格納部110(210)に格納されているコンテンツをネットワーク1経由で提供するHTTPサーバ120(220)とを備えている。
(Information providing server group configuration)
The information providing server group 10 includes, for example, a plurality of information providing servers (content providing servers) 100, 200,. Each information providing server 100 (200) provides the information storage unit 110 (210) that stores the content provided by the information providing server and the content stored in the information storage unit 110 (210) via the network 1. HTTP server 120 (220).

これらの情報提供サーバ100,200が提供するコンテンツは、例えば階層的に管理されており、各階層毎のインデックスから選択を行うことによって、個々のコンテンツを選択することができるようになっている。   The contents provided by these information providing servers 100 and 200 are managed hierarchically, for example, and individual contents can be selected by selecting from the index for each hierarchy.

情報提供サーバ100は、コンテンツとして、例えば着信メロディの曲データを提供する。情報格納部110には、例えば曲データを曲毎に格納する曲データ格納領域111,112,…が設けられている。各曲データ格納領域111,112,…には、同一の曲に対して携帯電話端末装置50,60の表示能力に対応する1つないし複数のデータ形式の曲データが格納されている。例えば図1中の情報提供サーバ100の曲データ格納領域111には、曲AAAに対応する40音,16音,4音(これらは同時発生数を示している。)の曲データが格納されている状態を示している。   The information providing server 100 provides, for example, incoming melody song data as content. The information storage unit 110 is provided with song data storage areas 111, 112,... For storing song data for each song, for example. In each song data storage area 111, 112,..., Song data in one or more data formats corresponding to the display capability of the mobile phone terminals 50, 60 are stored for the same song. For example, the song data storage area 111 of the information providing server 100 in FIG. 1 stores song data of 40 sounds, 16 sounds, and 4 sounds (they indicate the number of simultaneous occurrences) corresponding to the song AAA. It shows the state.

HTTPサーバ120に対するアクセス要求中には、例えばHTTPリクエスト中の拡張ヘッダ中に、携帯電話端末装置50の音声表示能力を示す情報(例えば“x−sound:##”[##は同時発音数を示す数字])が含まれており、HTTPサーバ120は、この情報に応じて、携帯電話端末装置50,60等の音声表示能力を認識することができるようになっている。   During an access request to the HTTP server 120, for example, information indicating the voice display capability of the mobile phone terminal device 50 (for example, “x-sound: ##” [## indicates the number of simultaneous pronunciations) The HTTP server 120 can recognize the voice display capability of the mobile phone terminals 50, 60, etc. according to this information.

情報提供サーバ200は、コンテンツとして、例えば待ち受け画像等の画像データを提供する。情報格納部210には、例えば画像データを画像毎に格納する画像データ格納領域211,212,…が設けられている。各画像データ格納領域211,212,…には、同一の画像に対して携帯電話端末装置50,60の表示能力に対応する1つないし複数のデータ形式の画像データが格納されている。例えば図1中の情報提供サーバ200の画像データ格納領域211には、画像BAに対応する256色,4096色(これらは同時発色数を示している。)で低画素数,中画素数の画像データと65536色で高画素数(例えば200×150画素)の画像データが格納されている状態を示している。   The information providing server 200 provides, for example, image data such as a standby image as content. The information storage unit 210 is provided with image data storage areas 211, 212,... For storing image data for each image, for example. Each of the image data storage areas 211, 212,... Stores image data in one or more data formats corresponding to the display capability of the mobile phone terminal devices 50, 60 for the same image. For example, in the image data storage area 211 of the information providing server 200 in FIG. 1, an image having 256 and 4096 colors corresponding to the image BA (these indicate the number of simultaneous colors) and a low pixel number and a medium pixel number. The data and the image data of 65536 colors and the number of high pixels (for example, 200 × 150 pixels) are stored.

HTTPサーバ220に対するアクセス要求中には、例えばHTTPリクエスト中の拡張ヘッダ中に、携帯電話端末装置50の画像表示能力を示す情報(例えば“x−display:**[**は表示画素数を示す文字列]”,“x−color:$$”[$$は同時発色数を示す文字列])が含まれており、HTTPサーバ220は、これらの情報に応じて、携帯電話端末装置50,60等の画像表示能力を認識することができるようになっている。HTTPサーバ220は、画像表示能力に応じた画像データを提供するようになって   During an access request to the HTTP server 220, for example, information indicating the image display capability of the mobile phone terminal device 50 (for example, “x-display: ** [** indicates the number of display pixels” in an extension header in the HTTP request). Character string] ”,“ x-color: $$ ”($$ is a character string indicating the number of simultaneous colors)), and the HTTP server 220 determines that the mobile phone terminal device 50, An image display capability of 60 or the like can be recognized. The HTTP server 220 provides image data according to the image display capability.

(検索サーバ構成)
検索サーバ20は、所定のキーワード等に従って情報提供サーバ群10が提供するコンテンツ等のアドレス,データ種別を取得するクローリング部(クローリング手段)21と、クローリング部21によって得られたアドレス,データ種別等をキーワード等に対応させて保持するDB22と、携帯電話端末装置50,60等に対して検索サービスを提供する検索サービス提供部(検索手段,世代検出手段)23等を備えている。
(Search server configuration)
The search server 20 includes the crawling unit (crawling means) 21 for acquiring the address and data type of the content provided by the information providing server group 10 according to a predetermined keyword and the like, and the address and data type obtained by the crawling unit 21. A DB 22 is stored corresponding to a keyword and the like, and a search service providing unit (search means, generation detecting means) 23 for providing a search service to the mobile phone terminals 50, 60, and the like.

DB22には、例えば図2に示すように、携帯電話端末装置50,60の機種毎の表示能力を所定の機種グループ毎に保持する表示能力対応表22Aと、クローリング部21によるクローリングのパターンを定義する収集パターン22Bと、クローリング結果を保持する検索インデックス22Cと、携帯電話端末装置50,携帯電話端末装置60の世代毎の検索結果の生成に用いるテンプレート22Dとが格納されている。   For example, as shown in FIG. 2, the DB 22 defines a display capability correspondence table 22 </ b> A that holds the display capability for each model of the mobile phone terminals 50 and 60 for each predetermined model group, and a crawling pattern by the crawling unit 21. A collection pattern 22B to be stored, a search index 22C for holding a crawling result, and a template 22D used to generate a search result for each generation of the mobile phone terminal device 50 and the mobile phone terminal device 60 are stored.

また、クローリング部21は、情報提供サーバ100,200,…によるコンテンツの提供が提供ルールを遵守しているか否かを判定する提供ルール判定部(判定手段)22Aを備えている。このクローリング部21は、収集パターン22Bに応じてHTTPクライアントと同様に、情報提供サーバ100,200に対するアクセスを繰り返し(クローリング)、提供ルール判定部22Aの判定結果に応じて提供ルールを遵守しているコンテンツのアクセス結果を検索インデックス22Cに格納する。   Further, the crawling unit 21 includes a provision rule determination unit (determination unit) 22A that determines whether or not the provision of content by the information provision servers 100, 200,... The crawling unit 21 repeats access to the information providing servers 100 and 200 according to the collection pattern 22B (crawling), and observes the provision rules according to the determination result of the provision rule determination unit 22A. The content access result is stored in the search index 22C.

また、検索サービス提供部23は、携帯電話端末装置50,60からの検索サービス要求に応答するフロントエンドとして機能するHTTPサーバ23Aと、HTTPサーバ23Aを介して供給されるキーワードに応じて検索インデックス22Cから該当する情報を検索し、テンプレート22Dを用いて応答メッセージを構成する応答部(検索結果生成手段)23bとを備えている。   The search service providing unit 23 also functions as an HTTP server 23A functioning as a front end that responds to search service requests from the mobile phone terminals 50 and 60, and a search index 22C according to a keyword supplied via the HTTP server 23A. And a response unit (search result generating means) 23b that searches for the corresponding information and constructs a response message using the template 22D.

移動体通信網30は、上述のPDC方式による第2世代(回線交換によってデータ通信を行う)及び第2.5世代(パケット交換によってデータ通信を行う)の携帯電話端末装置50に対して移動体通信サービスを提供するものであり、携帯電話端末装置50との間の通信チャネルの割り当て等の処理を行う回線交換機31と、データ通信用のパケットの交換等の処理を行うパケット交換機32と、携帯電話端末装置50との間で無線通信を行う基地局装置(BS:Base Station)33a,33b,…,33nと、BS33a〜33nの管理を行う基地局制御装置BSC34と、第2世代の携帯電話端末装置50による通信のプロトコル変換等を行うゲートウェイ装置(GW)35とを備えている。   The mobile communication network 30 is mobile to the mobile phone terminal devices 50 of the second generation (which performs data communication by circuit switching) and the 2.5th generation (which performs data communication by packet switching) according to the above PDC method. A circuit switch 31 that provides communication services and performs processing such as allocation of communication channels with the mobile phone terminal device 50, a packet switch 32 that performs processing such as exchange of packets for data communication, and a mobile phone Base stations (BS) 33a, 33b,..., 33n that perform wireless communication with the telephone terminal device 50, a base station controller BSC 34 that manages BSs 33a to 33n, and a second-generation mobile phone And a gateway device (GW) 35 that performs protocol conversion of communication by the terminal device 50.

移動体通信網40は、上述のW−CDMA方式による第3世代の携帯電話端末装置60に対して移動体通信サービスを提供するものであり、携帯電話端末装置(UE:User Equipment)60と通信を行う基地局装置(NB:NodeB)42a,42b,…,42mと、各基地局装置42a〜42mの制御を行うRNC41a,41b,…,41mとを備えている。   The mobile communication network 40 provides a mobile communication service to the above-described third-generation mobile phone terminal device 60 using the W-CDMA system, and communicates with the mobile phone terminal device (UE: User Equipment) 60. , 42m and RNCs 41a, 41b,..., 41m for controlling the base station devices 42a to 42m.

(携帯電話端末装置詳細)
携帯電話端末装置50は、移動体通信網30を介して通話サービス,メールサービス等を利用できる他、情報提供サーバ群10が提供するコンテンツ提供サービス及び検索サーバ20が提供する検索サービスを利用することができるようになっている。この携帯電話端末装置50は、高周波信号の処理を行う高周波(RF:Radio Frequency)部51と、MPU52と、メモリ53と、ユーザからの指示等を入力する操作キー54と、ユーザに対する表示を行う表示部55と、音声信号の符号化/復号化を行う音声CODEC56と、MIC57と、スピーカ58とを備えている。
(Details of mobile phone terminals)
The mobile phone terminal device 50 can use a call service, a mail service, etc. via the mobile communication network 30, and use a content providing service provided by the information providing server group 10 and a search service provided by the search server 20. Can be done. This cellular phone terminal device 50 performs a high frequency (RF) unit 51 for processing a high frequency signal, an MPU 52, a memory 53, an operation key 54 for inputting an instruction from the user, and a display for the user. A display unit 55, an audio CODEC 56 that performs encoding / decoding of audio signals, an MIC 57, and a speaker 58 are provided.

MPU52は、例えばメモリ53に保持されている制御プログラムを実行することにより、移動体通信網30を介した通信の制御を行う通信制御部510,電子メールの送受信を行う電子メールクライアント520,上述の情報提供サービス及び検索サービスの利用時の表示等を表示するWebブラウザ530として機能する。また、メモリ53内には、着信メロディ等の音声データを保持する音声データ保持部53aと、待ち受け画面等の画像データを保持する画像データ保持部53bとが設けられている。   The MPU 52 executes, for example, a control program held in the memory 53, thereby controlling the communication via the mobile communication network 30, the communication control unit 510 that performs communication of the e-mail, and the above-described e-mail client 520. It functions as a Web browser 530 that displays a display when using the information providing service and the search service. Also, in the memory 53, an audio data holding unit 53a that holds audio data such as a ringing melody and an image data holding unit 53b that holds image data such as a standby screen are provided.

携帯電話端末装置60も、携帯電話端末装置50と同様に、電子メールクライアント,Webブラウザ等を備えており、情報提供サーバ100,200が提供するコンテンツを利用することができるようになっている。   Similarly to the mobile phone terminal device 50, the mobile phone terminal device 60 includes an e-mail client, a Web browser, and the like, and can use contents provided by the information providing servers 100 and 200.

上述のHTTPサーバ120は、例えば図3に示すように、ネットワーク1経由で供給された携帯電話端末装置50等からの要求を解析する要求解析部121と、提供する情報を示すアドレスを有するインデックスデータを保持するインデックス保持部122と、要求解析部121からの指示に応じて情報格納部110からコンテンツを取得するコンテンツ取得部123と、コンテンツ取得部123が取得した情報から携帯電話端末装置50,60等に対する応答をネットワーク1経由で送出する応答部124とを備えている。HTTPサーバ220も、このHTTPサーバ120と同様の構成を備えている。   For example, as shown in FIG. 3, the above-described HTTP server 120 includes a request analysis unit 121 that analyzes a request from the mobile phone terminal device 50 and the like supplied via the network 1, and index data having an address indicating information to be provided , The content acquisition unit 123 that acquires content from the information storage unit 110 in response to an instruction from the request analysis unit 121, and the mobile phone terminal devices 50 and 60 from the information acquired by the content acquisition unit 123 And a response unit 124 that sends out a response to the above via the network 1. The HTTP server 220 has the same configuration as that of the HTTP server 120.

インデックス保持部122に保持されているインデックスデータは、例えば図4に示すように、情報(例えば曲データ)の選択を階層的に行い得るように、階層的に分類されて構成されている。また、インデックス保持部122に保持されているインデックスデータも同様に階層的に分類されて構成されている。これらのインデックスデータは、例えばHTML(Hyper Text Markup Language)形式等のページ記述データで構成されており、例えば上位のインデックスのページ記述データ中に下位のインデックスのアドレス(URL,URI等)を示すリンクを記述することによって、階層的的なリンク構造が形成されるように構成されている。   As shown in FIG. 4, for example, the index data held in the index holding unit 122 is classified and configured hierarchically so that information (for example, song data) can be selected hierarchically. Similarly, the index data held in the index holding unit 122 is also hierarchically classified. These index data are composed of page description data in, for example, HTML (Hyper Text Markup Language) format. For example, a link indicating the address (URL, URI, etc.) of the lower index in the page description data of the upper index. Is described so that a hierarchical link structure is formed.

このような階層構成のインデックスにより、ユーザは、まず、例えば総合インデックスからカテゴリを選択し、次にカテゴリ別のインデックスからアーティストを選択し、アーティスト別のインデックスから曲を選択することによって、階層的に曲データの選択を行うことができるようになっている。   With such a hierarchical index, a user can select a category from, for example, a comprehensive index, then select an artist from the category-specific index, and select a song from the artist-specific index. Song data can be selected.

ところで、カテゴリ,アーティスト,曲データ等の数が増えてくると、各階層のインデックス中の選択肢が増加してしまう。この結果、各階層のインデックス中の項目が増加し、例えばユーザがスクロールして全体を確認するといった必要が生じ、目的の曲を探すまでの手間が増加してしまう。このため、例えば階層構造を細分化することも考えられるが、階層の選択回数が増えてしまうので、ユーザの手間はあまり減少しない。   By the way, as the number of categories, artists, song data, etc. increases, the choices in the index of each hierarchy increase. As a result, the number of items in the index of each hierarchy increases, and it becomes necessary for the user to scroll to check the whole, for example, and the time and effort required to search for the target song increases. For this reason, for example, it is conceivable to subdivide the hierarchical structure. However, since the number of hierarchical selections increases, the user's effort does not decrease much.

このため、この情報提供システムでは、検索サーバ20によって、情報提供サーバ100,200,…が提供する情報について、キーワード等に応じた検索サービスを提供している。   Therefore, in this information providing system, the search server 20 provides a search service according to a keyword or the like for information provided by the information providing servers 100, 200,.

(動作概要)
以下、情報提供サーバ100の曲データ格納領域111には、曲AAAの曲データとして、例えば40音と16音のSMAF(Synthetic music Mobile Application Format)形式のデータと、4音のSMD形式のデータが格納されている場合について説明する。
(Overview of operation)
Hereinafter, in the song data storage area 111 of the information providing server 100, for example, 40-sound and 16-sound SMAF (Synthetic music Mobile Application Format) format data and 4-sound SMD format data are stored as song AAA data. The case where it is stored will be described.

クローリング部21は、例えばHTTPサーバ120が提供しているインデックスデータのリンク構造を辿って、HTTPサーバ120が提供するコンテンツ(例えば曲データ)のアドレス(URL)を取得する。クローリング部21は、まず、HTTPサーバ120から総合インデックスのデータを取得し、順次下位のインデックスを辿って、曲データのリンクの記述を探す。曲データのリンクが見つかると、クローリング部21の判定部21Aは、条件保持部(禁止条件保持手段)21Bに保持されている禁止条件に該当するか否かを判定する。この禁止条件は、コンテンツの提供ルールに従っているか否かを判定するためのものであり、判定部21Aは、当該コンテンツ(例えば曲データ)が提供ルールに従っていなければ当該リンクについての処理を終了する。提供ルールに従っている場合には、クローリング部21は、曲データのファイル名、リンクの記述中の説明等が、DB22中のキーワード(k/w)リスト22E中のキーワード(例えば“AAA”)のいずれかに該当するか判断する。キーワードに該当するリンクがあれば、このリンクに対応する所定のアドレス(例えば広告,注意等の情報を含むページ(リンク先ページ)等)を当該キーワードに対応させて検索インデックス22Cに登録する。   The crawling unit 21 acquires the address (URL) of the content (for example, song data) provided by the HTTP server 120 by following the link structure of the index data provided by the HTTP server 120, for example. First, the crawling unit 21 acquires data of the comprehensive index from the HTTP server 120 and sequentially searches the lower index to search for a description of the link of the music data. When the song data link is found, the determination unit 21A of the crawling unit 21 determines whether the prohibition condition held in the condition holding unit (prohibition condition holding unit) 21B is satisfied. This prohibition condition is for determining whether or not the content provision rule is complied with, and the determination unit 21A ends the process for the link if the content (for example, song data) does not conform to the provision rule. If the provision rule is followed, the crawling unit 21 can select any of the keywords (for example, “AAA”) in the keyword (k / w) list 22E in the DB 22 such as the file name of the song data and the description in the link description. Judge whether it is true. If there is a link corresponding to the keyword, a predetermined address corresponding to the link (for example, a page (link destination page) containing information such as advertisements and cautions) is registered in the search index 22C in association with the keyword.

上述のようなクローリング動作と非同期に、検索サービス提供部23は、携帯電話端末装置50から供給された検索条件に該当するコンテンツに関する情報を検索インデックス22Cから抽出し、検索結果として携帯電話端末装置50に供給する。   Asynchronously with the crawling operation as described above, the search service providing unit 23 extracts information on the content corresponding to the search condition supplied from the mobile phone terminal device 50 from the search index 22C, and the mobile phone terminal device 50 as a search result. To supply.

(条件に応じたコンテンツに関する情報の収集)
また、この情報提供サービスでは、検索開始ページからのリンクの階層数,ページサイズ,不正なアドレス,ドメイン名,拡張子,アンカー名(<A>〜</A>で囲まれた文字列),ContentType(MIME−TYPE),<METAタグ>等により、コンテンツの提供ルールを規定しており、この提供ルールに従っていないコンテンツについては、上述の検索サービスの対象外としている。具体的には、このような提供ルール(条件)を満たしていないコンテンツについては、検索サーバ20による検索結果に含まれないようにしている。以下、具体的な動作について説明する。
(Collecting information on content according to conditions)
In this information providing service, the number of link layers from the search start page, page size, invalid address, domain name, extension, anchor name (character string enclosed in <A> to </A>), Content provision rules are defined by ContentType (MIME-TYPE), <META tag>, etc., and contents that do not comply with the provision rules are excluded from the above search service. Specifically, contents that do not satisfy such provision rules (conditions) are not included in the search results by the search server 20. A specific operation will be described below.

クローリング部21は、例えば図5に示すように、コンテンツ提供サイトあるいは検索開始アドレス毎に、コンテンツの属性情報をコンテンツ情報テーブルとして保持している。このコンテンツ情報テーブルには、例えば属性の番号(No)と属性名と属性値とが対応付けられて保持されている。このコンテンツ情報テーブルには、属性名として、例えばコンテンツを識別するためのコンテンツID(No:1),コンテンツ名称(No:2),検索結果を表示するページのアドレス(トップURL)[結果表示用](No:3),コンテンツ紹介文(No:4),キーワードの引継ぎを行う際のアドレス[キーワード引継ぎURL](No:5),コンテンツのカテゴリ(No:6),排除キーワード(No:7),追加ワード(No:8),削除ワード(No:9),コンテンツについての情報収集を開始するアドレス[収集開始URL](No:10),コンテンツまでのインデックスの階層数の上限[収集階層数](No:11),コンテンツについての情報収集を行う上限ページ数[収集上限ページ](No:12),収集上限時間(No:13),他ホスト収集可否(No:14),収集スケジュール[収集開始時間](No:15),収集スケジュール[周期](No:16),インデック値底上げ(No:17)と、これらに対応する属性値とが保持されている。なお、判定部21Aが番号と属性名の関係を別途記憶しておけば、コンテンツ情報テーブルには、番号と属性値とを対応付けて保持しておけば足りる。さらには、“,”等の所定の区切り記号で区切った値の文字列とし、区切り記号で区切られた位置で番号を認識するようにしてもよい。   For example, as illustrated in FIG. 5, the crawling unit 21 holds content attribute information as a content information table for each content providing site or search start address. In this content information table, for example, an attribute number (No), an attribute name, and an attribute value are associated and held. In this content information table, as an attribute name, for example, a content ID (No: 1) for identifying the content, a content name (No: 2), a page address (top URL) for displaying the search result [for result display] ] (No: 3), content introduction sentence (No: 4), address for keyword transfer [keyword transfer URL] (No: 5), content category (No: 6), exclusion keyword (No: 7) ), Additional word (No: 8), deletion word (No: 9), address for starting collection of information about content [collection start URL] (No: 10), upper limit of the number of layers of indexes up to content [collection layer Number] (No: 11), upper limit number of pages to collect information about content [collection upper limit page] (No: 12), on collection Time (No: 13), availability of other hosts (No: 14), collection schedule [collection start time] (No: 15), collection schedule [cycle] (No: 16), index value increase (No: 17) , And attribute values corresponding to these are held. If the determination unit 21A separately stores the relationship between the number and the attribute name, it is sufficient to store the number and the attribute value in association with each other in the content information table. Furthermore, it may be a character string of values delimited by a predetermined delimiter such as “,”, and the number may be recognized at a position delimited by the delimiter.

コンテンツ情報テーブル内の属性名に対応する属性値の一部には、上述の提供ルールの一部が反映されている。具体的には、例えば収集階層数(No:11)には、収集開始URL(No:10)からの階層数が定義されており、収集対象の上限ページ数(No:12),情報の収集上限時間(No:13)が定義されている。また、排除キーワード(No:7)には、検索対象から排除すべきキーワードが定義されており、削除ワード(No:9)には削除すべきワードが定義されている。これらのキーワードとワードはいずれもクローリング部21による検索対象としない。   Part of the attribute value corresponding to the attribute name in the content information table reflects a part of the provision rule described above. Specifically, for example, the number of layers to be collected (No: 11) defines the number of layers from the collection start URL (No: 10), the upper limit number of pages to be collected (No: 12), and the collection of information An upper limit time (No: 13) is defined. The exclusion keyword (No: 7) defines a keyword to be excluded from the search target, and the deletion word (No: 9) defines a word to be deleted. None of these keywords and words are to be searched by the crawling unit 21.

また、条件保持部21Bには、例えば図6に示すように、検索インデックス22Cに登録し得るコンテンツの条件(許可条件)を含むテーブルが格納されている。このテーブルには、クローリング部21が取得し得るインデックスファイルの拡張子と、情報を検索インデックス22Cに登録し得るインデックスファイルのMIME−TYPEを示す文字が含まれている。このテーブルは、判定部21Aが、クローリングの制御,クローリングによって得られた情報の蓄積の制御等において適宜参照する。   Further, for example, as shown in FIG. 6, the condition holding unit 21B stores a table including content conditions (permission conditions) that can be registered in the search index 22C. This table includes an index file extension that can be acquired by the crawling unit 21 and characters indicating MIME-TYPE of the index file whose information can be registered in the search index 22C. The determination unit 21A appropriately refers to this table in crawling control, control of accumulation of information obtained by crawling, and the like.

さらに、条件保持部21Bには、例えばクローリング部21によるクローリング時にリンク先としてみなしてリンク先を辿るタグを定義するテーブル(図7),インデックスファイル等の中の情報の収集時に考慮すべきタグについて定義するテーブル(図8),クローリング時に考慮すべきHTTPレスポンスヘッダについて定義するテーブル(図9)等が格納されている。なお、これらの図6〜図9に示すテーブルは、同様の判定をプログラムによって実行すれば、必ずしも設ける必要はない。   Further, the condition holding unit 21B includes, for example, a table (FIG. 7) that defines a tag that is regarded as a link destination at the time of crawling by the crawling unit 21 and traces the link destination, and tags to be considered when collecting information in an index file or the like. A table to be defined (FIG. 8), a table to define HTTP response headers to be considered at the time of crawling (FIG. 9), and the like are stored. The tables shown in FIGS. 6 to 9 are not necessarily provided if the same determination is executed by a program.

また、条件保持部21Bには、例えば図10に示すように、不正なアドレス,ドメイン名等を示す不正アドレステーブルが格納されている。このテーブルには、予め解っているコンテンツの提供ルールに従っていない情報提供サーバ100,200等のアドレスを登録しておく。   In addition, the condition holding unit 21B stores an illegal address table indicating illegal addresses, domain names, and the like as shown in FIG. 10, for example. In this table, the addresses of the information providing servers 100, 200, etc. that do not comply with the content provision rules that have been understood in advance are registered.

(判定処理)
上述のような条件の判断は、例えば図11に示すフローチャートに従って実行される。判定部21Aは、まず、例えば情報収集対象の情報提供サーバ100,200のサーバ証明書が有効であるか否かをチェックする(S1)。なお、このS1の処理は、httpsプロトコルで情報提供サーバ群10にアクセスする際のみに実行する。
(Determination process)
The determination of the conditions as described above is executed according to the flowchart shown in FIG. 11, for example. First, for example, the determination unit 21A checks whether or not the server certificate of the information providing servers 100 and 200 to be collected is valid (S1). The process of S1 is executed only when accessing the information providing server group 10 using the https protocol.

次に、判定部21Aは、ロボット検索用の定義ファイルに応じたチェックを行う(S2)。情報提供サーバ100,200は、例えば図12に示すように、クローリング部21等のロボット検索用の定義ファイル“robots.txt”を保持しており、クローリング部21からの要求に応じてこの定義ファイルを送信する。クローリング部21は、別途ユニークなユーザ・エージェント(User−Agent)名を有しており、情報提供サーバ100,200から提供された定義ファイル“robots.txt”中のUser−Agent名が自らのUser−Agent名と一致している場合にのみ、当該定義ファイル“robots.txt”中の記述に従って情報提供サーバ100,200からの情報の収集を行う。   Next, the determination unit 21A performs a check according to the definition file for robot search (S2). As shown in FIG. 12, for example, the information providing servers 100 and 200 hold a robot search definition file “robots.txt” for the crawling unit 21 and the like. Send. The crawling unit 21 has a unique user agent (User-Agent) name, and the User-Agent name in the definition file “robots.txt” provided from the information providing servers 100 and 200 is its own User. Only when it matches the Agent name, information is collected from the information providing servers 100 and 200 according to the description in the definition file “robots.txt”.

以上の処理(収集を行う前の判断フェーズ)が終了すると、判定部21Aは、URLの正規表現によるチェックを行い(S3)、正規表現に従ったURLのみをクローリングの対象とする。URLの表現形式は標準規格として規定されており、当該標準規格に準拠していないURLは誤動作の原因にもなるため、このようなチェックを行っている。   When the above processing (judgment phase before collection) ends, the determination unit 21A performs a check using a regular expression of the URL (S3), and only URLs according to the regular expression are targeted for crawling. The URL expression format is defined as a standard, and a URL that does not comply with the standard may cause a malfunction, so such a check is performed.

また、判定部21Aは、URL中のファイル名の拡張子が、上述の図6中に示すテーブル中で規定された拡張子であるか否かを判定し、規定されている拡張子である場合にのみクローリングを行う(S4)。さらに、判定部21Aは、URL中のドメイン名が上述の図10に示す不正アドレステーブル中で規定されているか否かを確認し、このテーブル中で規定されていないドメイン名である場合にのみクローリングを行う(S5)。また、判定部21Aは、上述の図7及び図8に応じてアンカー名に対するチェックを行い、収集対象外として規定されているアンカー(タグ)以外についてのみクローリングを行う(S6)。また、この際、図8に示すテーブルに従って、当該アンカー内に画像ファイルに対するリンクがある場合には、収集対象としない。画像ファイルに対するリンクがある場合には広告であると見なし、情報収集を行わないようにするためである。   Further, the determination unit 21A determines whether or not the extension of the file name in the URL is an extension specified in the table shown in FIG. Only crawling is performed (S4). Further, the determination unit 21A checks whether or not the domain name in the URL is specified in the illegal address table shown in FIG. 10, and only when the domain name is not specified in this table, crawling is performed. (S5). Further, the determination unit 21A performs a check on the anchor name according to FIGS. 7 and 8 described above, and performs crawling only for those other than the anchor (tag) that is defined as a non-collection target (S6). At this time, if there is a link to the image file in the anchor according to the table shown in FIG. If there is a link to the image file, it is regarded as an advertisement and information is not collected.

以上の処理(収集前にURL名を元にの判断フェーズ)が終了すると、クローリング部21は対象となるURLからの情報収集を行う(S7)。対象となるURLからの情報が得られると、判定部21Aは、まず、得られた情報のMIME−TYPEが上述の図6に登録されているか否かを判定し、登録されているMIME−TYPEの情報のみを情報収集の対象とする(S8)。次に、判定部21Aは、<META>タグによるチェックを行い、nofollow,noindex等の記述がないもののみを情報収集の対象とする(S9)。   When the above processing (judgment phase based on URL name before collection) is completed, the crawling unit 21 collects information from the target URL (S7). When information from the target URL is obtained, the determination unit 21A first determines whether or not the MIME-TYPE of the obtained information is registered in the above-described FIG. 6, and the registered MIME-TYPE is determined. Only the information of the information is targeted for information collection (S8). Next, the determination unit 21A performs a check using a <META> tag, and sets only information that has no description such as nofollow and noindex as targets of information collection (S9).

以上のような処理により、クローリング部21の判定部21Aは、上述のように定義された許可条件に該当するコンテンツ又は禁止条件に該当しないコンテンツについての情報のみを検索インデックス22Cに登録させ、許可条件に該当しないコンテンツ又は禁止条件に該当するコンテンツについての情報は検索インデックス22Cに登録させない。このように、クローリングによる情報収集の対象を制限することにより、コンテンツの提供ルールに従っていないコンテンツが、クローリングによる情報収集の対象から除外され、検索インデックス22Cにこのようなコンテンツに関する情報が格納されることを防止することができる。   Through the processing as described above, the determination unit 21A of the crawling unit 21 causes the search index 22C to register only information about content that satisfies the permission condition defined as described above or content that does not meet the prohibition condition. Information regarding content that does not fall under the above or content that falls under prohibited conditions is not registered in the search index 22C. In this way, by limiting the target of information collection by crawling, content that does not comply with the content provision rule is excluded from the target of information collection by crawling, and information related to such content is stored in the search index 22C. Can be prevented.

また、クローリング部21は、以上のような処理に加えて、特定の情報提供サーバ100,200あるいは開始URLからのクローリングを行う制限時間(図5中の収集上限時間(No:13),上限ページ数(No:12),他ホスト(ドメイン)への収集可否(No:14)を判断しながら、情報収集を行い、これらの制限を超えた場合に、例外処理を行って当該情報収集を終了させる。   In addition to the processing described above, the crawling unit 21 performs a time limit for performing crawling from a specific information providing server 100, 200 or start URL (collection upper limit time (No: 13) in FIG. 5), upper limit page. Number (No: 12), collecting information while judging whether it can be collected to another host (domain) (No: 14), and when these limits are exceeded, exception processing is performed and the information collection is terminated Let

また、クローリング部21は、上述のように収集したページ中に検索キーワードが存在するか否かを検索し、検索キーワード毎に検索インデックス22Cに登録する。この際、判定部21Aは、図5中の追加ワード(No:8)が設定されている場合には、当該ページ中に、追加ワードがなくても、当該追加ワードに対応させて検索インデックス22Cに登録する。具体的には、収集したページに「新着」,「POP」「インディーズ」等のキーワードがなくても、これらのキーワードに対応させて、当該収集したページについての情報を検索インデックス22Cに登録する。   Further, the crawling unit 21 searches whether or not a search keyword exists in the collected pages as described above, and registers the search keyword in the search index 22C for each search keyword. At this time, when the additional word (No: 8) in FIG. 5 is set, the determination unit 21A searches the search index 22C corresponding to the additional word even if there is no additional word in the page. Register with. Specifically, even if there are no keywords such as “new arrival”, “POP”, and “indie” in the collected pages, information about the collected pages is registered in the search index 22C in correspondence with these keywords.

また、判定部21Aは、図5中の削除ワード(No:9)が設定されている場合には、当該ページ中に、削除ワードがあっても、検索インデックス22Cには登録しない。具体的には、収集したページに「画像系」というキーワードがあっても、当該収集したページについての情報は検索インデックス22Cに登録しない。   Further, when the deleted word (No: 9) in FIG. 5 is set, the determination unit 21A does not register the deleted word in the search index 22C even if there is a deleted word in the page. Specifically, even if there is a keyword “image system” in the collected pages, information about the collected pages is not registered in the search index 22C.

また、判定部21Aは、図5中の排除キーワード(No:7)が設定されている場合には、当該ページ中に中のアンカータグ内に排除キーワードがあっても、当該アンカーの示すリンク先に対するそれ以上の情報の収集は行わない。具体的には、例えば収集してきたページ中に「<a href=“www.ddd.com”>素敵な出会いはこちら<a>」等といったリンクが存在していてもリンク先のページ(www.ddd.com)に対しては情報の収集を行わない。   Further, when the exclusion keyword (No: 7) in FIG. 5 is set, the determination unit 21A, even if there is an exclusion keyword in the anchor tag in the page, the link destination indicated by the anchor No further information is collected for. Specifically, for example, “<a href =“ www. ddd. Even if there is a link such as “com”> Click here for nice encounters <a> ”, no information is collected for the linked page (www.ddd.com).

また、上述の図5中の収集階層数(No:11)によって定義された最大階層数に応じたコンテンツについての情報収集は、以下のように行う。クローリング部21は、例えば図13に示すように、判定部21Aによる判定結果に応じて、コンテンツの提供ルールに従っていない不正なページ(アドレスAB)及びこのページからリンクが張られている下位のページにおいて提供されている情報を検索インデックス22Cには登録しない。例えばコンテンツの階層が所定数(n)以内であることを提供ルールの1つとした場合には、判定部21Aは、例えば図14に示すように、上述の収集パターンで定義された収集開始URLからの階層数(x)をカウントしておき(S101,S105)、階層数xがnより大きくなったら、それ以下の階層のクローリングを中止して次の収集パターンのクローリングを開始する(S106)。   In addition, information collection for content according to the maximum number of layers defined by the number of collection layers (No: 11) in FIG. 5 is performed as follows. For example, as shown in FIG. 13, the crawling unit 21 uses an illegal page (address AB) that does not comply with the content provision rule and a lower page linked from this page according to the determination result by the determination unit 21 </ b> A. The provided information is not registered in the search index 22C. For example, when one of the provision rules is that the content hierarchy is within a predetermined number (n), the determination unit 21A determines, for example, from the collection start URL defined by the above collection pattern as shown in FIG. The number of layers (x) is counted (S101, S105), and when the number of layers x becomes larger than n, crawling of the layers below it is stopped and crawling of the next collection pattern is started (S106).

また、ページサイズの上限を提供ルールとして設定する場合には、同図中のS103において、取得したページのデータのサイズを検出し、上限以上である場合には検索インデックス22Cに登録しないようにする。   When the upper limit of the page size is set as the provision rule, the size of the acquired page data is detected in S103 in the figure, and if it is larger than the upper limit, it is not registered in the search index 22C. .

上述のように、不正なアドレス,ドメイン名等を提供ルールとする場合には、例えば図14中のS102,S107においてページのデータを取得する際に、判定部21Aが、当該ページのアドレスが上述の図10に示す不正アドレステーブルに登録されているアドレスを含むものであるか否かを判定し、登録されているアドレスを含む場合にはそれ以降の処理を中止する。   As described above, when an illegal address, domain name, or the like is used as a provision rule, for example, when acquiring page data in S102 and S107 in FIG. It is determined whether or not an address registered in the illegal address table shown in FIG. 10 is included. If the address includes a registered address, the subsequent processing is stopped.

例えばHTTPサーバ120が提供するページ(インデックス)が、上述の図13に示すような状態である場合に、アドレスAのページ中のリンク(アドレスAA,アドレスAB,アドレスAC,アドレスAD)についてクローリングを行うと、例えば図15に示すように、アドレスAA,アドレスAB,アドレスADのページは提供ルールに従っているため、これらのページ及びその下位層のページについてはクローリングの結果が検索インデックス22Cに登録されるが(S204,S208,S215)、アドレスACは提供ルールに従っていないためこのページ及び及びその下位層のページ中の情報については検索インデックス22Cに登録されない。   For example, when the page (index) provided by the HTTP server 120 is in the state shown in FIG. 13 described above, crawling is performed for the links (address AA, address AB, address AC, address AD) in the page of address A. When this is done, for example, as shown in FIG. 15, the pages of address AA, address AB, and address AD comply with the provision rules, and therefore the crawling result is registered in the search index 22C for these pages and the lower layer pages. (S204, S208, S215), the address AC does not comply with the provision rule, so information in this page and its lower layers is not registered in the search index 22C.

このような処理により、判定部21Aがコンテンツの提供ルールに従っているか否かを判定し、クローリング部21がこの判定結果に応じて提供ルールに従っているコンテンツについて情報を検索インデックス22Cに登録することにより、検索インデックス22Cから抽出した検索結果に、提供ルールに従っていないコンテンツについての情報が含まれてしまうことを防止することができる。   By such processing, it is determined whether or not the determination unit 21A complies with the provision rule of the content, and the crawling unit 21 registers information on the content that complies with the provision rule according to the determination result in the search index 22C. It is possible to prevent the search result extracted from the index 22C from including information about content that does not comply with the provision rules.

(端末装置の表示能力に応じた情報の取得)
また、この情報提供システムでは、携帯電話端末装置50,60の表示能力に応じた適切な検索結果を提供するようになっている。具体的には、上述のような動作(クローリング動作)は、携帯電話端末装置50,60の表示能力毎に行うようになっている。表示能力対応表22Aには、例えば図16に示すように、携帯電話端末装置のグループ毎に、当該グループを示す識別情報(グループID)と、当該グループ内の代表機種を示す機種名(代表)と、機種を示す機種名(機種名一覧)との対応を示す対応テーブル22AA,22AB,22ACが格納されている。これらの対応テーブル22AA,22AB,22ACは、コンテンツの種類毎に設けられている。また、携帯電話端末装置50,60の機種毎の表示能力(例えば同時発音数,対応フォーマット等)は、例えば図17に示すようなテーブルとしてDB22等に格納されている。なお、グループIDに対応する表示能力毎のコンテンツを情報格納部110,210に格納する際に、グループIDに対応するディレクトリに格納する等の方法によってグループIDとコンテンツとの対応関係がわかるようにしておけば、これらの対応テーブルを設けなくてもよい。あるいは、機種グループの代表機種と機種名一覧との対応関係が明確であれば、必ずしもグループIDを設ける必要はない。
(Acquisition of information according to the display capability of the terminal device)
Further, in this information providing system, an appropriate search result corresponding to the display capability of the mobile phone terminal devices 50 and 60 is provided. Specifically, the above-described operation (crawling operation) is performed for each display capability of the mobile phone terminal devices 50 and 60. In the display capability correspondence table 22A, for example, as shown in FIG. 16, for each group of mobile phone terminal devices, identification information (group ID) indicating the group and a model name (representative) indicating the representative model in the group. And correspondence tables 22AA, 22AB, and 22AC indicating correspondence between model names and model names (model name lists) indicating models. These correspondence tables 22AA, 22AB, and 22AC are provided for each content type. Further, the display capability (for example, the number of simultaneous pronunciations, the corresponding format, etc.) for each model of the cellular phone terminal devices 50, 60 is stored in the DB 22 as a table as shown in FIG. In addition, when the contents for each display capability corresponding to the group ID are stored in the information storage units 110 and 210, the correspondence between the group ID and the contents can be understood by a method such as storing in a directory corresponding to the group ID. If so, it is not necessary to provide these correspondence tables. Alternatively, if the correspondence between the representative model of the model group and the model name list is clear, it is not always necessary to provide the group ID.

クローリング部21は、情報提供サーバのHTTPサーバに総合インデックス等のデータを要求する際に、検索対象に応じた対応テーブルを表示能力対応表22Aから選択し、選択した対応テーブル中の機種グループ毎に代表機種の機種名と、表示能力を示す情報等を用いて生成した拡張ヘッダ(以下、単にHTTP拡張ヘッダという。)を持つHTTPリクエストを送信する。例えば曲データを提供するHTTPサーバ120の総合インデックスのアドレス(URL)が“http://meloJAM.com/index.html”である場合に、クローリング部21が生成するHTTPリクエストは、例えば“GET http://meloJAM.com/index.html HTTP/1.1 2G V-DN02 x-display: 150x120 x-color: C4096 x-sound: 4 / 6KB”となる。ここで、HTTP拡張ヘッダ中の“V-DN02”は携帯電話端末装置の機種名を示す文字であり、“2G”は携帯電話端末装置の世代を示す文字である。また、“x-sound: 4”はこの携帯電話端末装置の同時発音数(4音)を示す文字である。   When the crawling unit 21 requests data such as a comprehensive index from the HTTP server of the information providing server, the crawling unit 21 selects a correspondence table corresponding to the search target from the display capability correspondence table 22A, and for each model group in the selected correspondence table. An HTTP request having an extension header (hereinafter simply referred to as an HTTP extension header) generated using the model name of the representative model and information indicating display capability is transmitted. For example, when the address (URL) of the general index of the HTTP server 120 that provides song data is “http://meloJAM.com/index.html”, the HTTP request generated by the crawling unit 21 is, for example, “GET http : //meloJAM.com/index.html HTTP / 1.1 2G V-DN02 x-display: 150x120 x-color: C4096 x-sound: 4 / 6KB ”. Here, “V-DN02” in the HTTP extension header is a character indicating the model name of the mobile phone terminal device, and “2G” is a character indicating the generation of the mobile phone terminal device. “X-sound: 4” is a character indicating the number of simultaneous pronunciations (four sounds) of the mobile phone terminal device.

また、拡張ヘッダ中の“x-display: 150x120”は表示画素数が150×120画素であることを示しており、“x-color: C4096”は、同時発色数が4096色であることを示しており、“6KB”の部分は、インデックスデータ等のページ記述データの上限値が6キロバイトであることを示している。   In addition, “x-display: 150x120” in the extension header indicates that the number of display pixels is 150 × 120 pixels, and “x-color: C4096” indicates that the number of simultaneous colors is 4096 colors. “6 KB” indicates that the upper limit of page description data such as index data is 6 kilobytes.

上述のようなクローリングは、例えば図18に示すような構成の収集パターンファイルに従って行う。この収集パターン中では、個々の収集パターン名を示す文字(例えば“PATTERN1”)と、当該収集パターンにおいてデータの収集を開始するサイトのアドレス(URL)を示す文字(例えば“http://www.aaa.co.jp/”等)と、当該収集に使用する設定を示すエージェント名を示す文字が定義されている。   The crawling as described above is performed according to a collection pattern file having a configuration as shown in FIG. 18, for example. In this collection pattern, characters (for example, “PATTERN1”) indicating individual collection pattern names and characters (for example, “http: // www. aaa.co.jp/ ”etc.) and characters indicating the agent name indicating the settings used for the collection are defined.

また、個々のエージェント名毎に対応して、例えば図19に示すようなエージェント定義ファイル中で、エージェント名と、ブラウザのバージョンと、機種グループ毎の拡張ヘッダと、ページ上限値等を定義しておく。このテーブルは、例えば検索時に上述の表示能力対応表22Aを用いて生成するようにしてもよいが、予め作成してDB22に格納しておいてもよい。   For each agent name, for example, in the agent definition file as shown in FIG. 19, the agent name, browser version, extension header for each model group, page upper limit value, etc. are defined. deep. This table may be generated, for example, using the display capability correspondence table 22A described above at the time of search, but may be created in advance and stored in the DB 22.

クローリング部21は、この図19に示すエージェント定義ファイルを参照して上述のHTTPリクエストを生成し、上述の図18に示す収集パターンに従ってクローリングを行う。   The crawling unit 21 generates the above-described HTTP request with reference to the agent definition file shown in FIG. 19, and performs crawling according to the collection pattern shown in FIG.

また、クローリング部21は、例えば図20に示すように、上述の図18の収集パターンファイル中で規定されたエージェントに従って、HTTP拡張ヘッダ内の携帯電話端末装置の音声表示能力を示す情報“x-sound: xxx”を順次を変更してHTTPサーバ120に対するHTTPリクエストを繰り返す(S301,S303,S305,S307)。   Further, for example, as shown in FIG. 20, the crawling unit 21 performs information “x−” indicating the voice display capability of the mobile phone terminal device in the HTTP extension header according to the agent defined in the collection pattern file of FIG. Sound: xxx "is changed in order, and the HTTP request to the HTTP server 120 is repeated (S301, S303, S305, S307).

また、クローリング部21は、各HTTPリクエストに対するHTTPサーバ120の応答(S302,S304,S306,S308)から、当該HTTPリクエストに対応するコンテンツの種類を特定し、DB22の検索インデックス22Cに登録する。   Further, the crawling unit 21 specifies the type of content corresponding to the HTTP request from the response (S302, S304, S306, S308) of the HTTP server 120 to each HTTP request, and registers the content type in the search index 22C of the DB 22.

HTTPサーバ120は、上述の図16中のグループID毎あるいは図17中の端末能力毎に、上述の図4に示すインデックス情報を有しており、携帯電話端末装置の音声表示能力に応じたインデックス情報を供給するようになっている。上述の図1の例では、4音のSMD形式、16音及び40音のSMAF形式についてインデックス情報を有するが、32音のSMAF形式についてはHTTPサーバ120が提供しないためにインデックス情報も有していない。   The HTTP server 120 has the index information shown in FIG. 4 for each group ID in FIG. 16 or each terminal capability in FIG. 17, and an index corresponding to the voice display capability of the mobile phone terminal device. It is designed to supply information. In the example of FIG. 1 described above, index information is included for the 4-sound SMD format, the 16-sound and 40-sound SMAF formats, but the 32-sound SMAF format does not provide index information because the HTTP server 120 does not provide it. Absent.

上述のようにHTTPリクエストが供給されると(S301,S303,S305,S307)、HTTPサーバ120の要求解析部121は、HTTPリクエストの拡張ヘッダ中の“x-sound: n”に対応するグループID(“n”は同時発音数を示す文字)によって、端末側の音声表示能力を判断し、音声表示能力に対応するインデックス情報が存在すれば、応答部124にインデックス情報を送信させる(S302,S304,S308)。一方音声表示能力に対応するインデックス情報が存在しない場合には、要求解析部121は、応答部124にインデックス情報が存在しない旨の応答メッセージを送信させる(S306)。   When the HTTP request is supplied as described above (S301, S303, S305, S307), the request analysis unit 121 of the HTTP server 120 performs group ID corresponding to “x-sound: n” in the extension header of the HTTP request. (“N” is a character indicating the number of simultaneous pronunciations) the voice display capability on the terminal side is determined, and if there is index information corresponding to the voice display capability, the response unit 124 transmits the index information (S302, S304). , S308). On the other hand, when there is no index information corresponding to the voice display capability, the request analysis unit 121 causes the response unit 124 to transmit a response message indicating that the index information does not exist (S306).

さらに、クローリング部21は、情報提供サーバ100に存在するインデックス情報を取得し、予めDB22に登録されたキーワードに対応するファイル名,文字等が存在するか否かを調べ、キーワードに該当するものがあれば、例えば図21に示すように、検索インデックス22Cに、端末の音声表示能力を機種グループのグループID,当該機種グループに属する機種名一覧,当該コンテンツに対応する所定のアドレス(例えば広告,注意等の情報を含むページ(リンク先ページ)等)等をキーワードに対応させて登録する。   Further, the crawling unit 21 acquires index information existing in the information providing server 100, checks whether there is a file name, a character, or the like corresponding to the keyword registered in the DB 22 in advance, and the one corresponding to the keyword If there is, for example, as shown in FIG. 21, in the search index 22C, the voice display capability of the terminal indicates the group ID of the model group, a list of model names belonging to the model group, and a predetermined address corresponding to the content (for example, advertisement, attention) Etc. (pages including linked pages, etc.) etc. are registered corresponding to the keywords.

以上のような動作により、携帯電話端末装置の音声表示能力に応じた検索インデックス22Cが作成される。この検索インデックス22Cには、対応する機種名が登録されているため、検索サービスを要求する携帯電話端末装置の機種名に応じた検索結果の抽出が容易である。また、情報提供サーバ200によって提供される画像データについても、拡張ヘッダ中の画像表示能力を示す情報(“x-display: XxY”,“x-color: yyy”)を順次変化させてHTTPサーバ220にインデックス情報を要求し、上述と同様にインデックス情報中のキーワード検索を行うことにより、図21に示すように、携帯電話端末装置の画像表示能力に応じた検索インデックス22Cを作成することができる。   By the operation as described above, the search index 22C corresponding to the voice display capability of the mobile phone terminal device is created. Since the corresponding model name is registered in the search index 22C, it is easy to extract the search result according to the model name of the mobile phone terminal device that requests the search service. Also, for the image data provided by the information providing server 200, the information (“x-display: XxY”, “x-color: yyy”) indicating the image display capability in the extension header is sequentially changed to change the HTTP server 220. By requesting index information and performing a keyword search in the index information as described above, a search index 22C corresponding to the image display capability of the mobile phone terminal device can be created as shown in FIG.

(検索サービス)
上述のようなクローリング動作と非同期に、検索サービス提供部23は、携帯電話端末装置50のWebブラウザ530等に対して検索サービスを提供している。
(Search service)
Asynchronously with the crawling operation as described above, the search service providing unit 23 provides a search service to the Web browser 530 and the like of the mobile phone terminal device 50.

ユーザから検索サービスの利用が指示されると、Webブラウザ530は、検索サービス提供部23に対して、検索条件の入力用のデータを要求する。これに応じて、検索サービス提供部23からデータが供給されると、Webブラウザ530は、例えば図22に示すように、検索語入力画面を表示部55の表示画面に表示させる。携帯電話端末装置50の音声表示能力が32音である場合には、ユーザが、検索条件(例えば曲名「AAA」)を入力して検索を指示すると、Webブラウザ530は、検索サービス提供部23に検索条件を示す文字と当該携帯電話端末装置50の機種名“V-T08”を含む拡張ヘッダを含むHTTPリクエストを送信する(S401)。   When the use of the search service is instructed by the user, the Web browser 530 requests the search service providing unit 23 for data for inputting search conditions. In response to this, when data is supplied from the search service providing unit 23, the Web browser 530 displays a search word input screen on the display screen of the display unit 55 as shown in FIG. When the voice display capability of the mobile phone terminal device 50 is 32 sounds, when the user inputs a search condition (for example, a song name “AAA”) and instructs the search, the Web browser 530 instructs the search service providing unit 23. An HTTP request including an extension header including the character indicating the search condition and the model name “V-T08” of the mobile phone terminal device 50 is transmitted (S401).

検索サービス提供部23は、Webブラウザ530から供給されたHTTPリクエスト中の検索条件を示す文字(例えば“AAA”)と拡張ヘッダ中の機種名(例えば“V-T08”)に対応する情報を検索インデックス22Cから抽出し、ヒット件数,曲名,曲データのアドレスに対するリンク情報等を含む応答メッセージ(検索結果)を生成し、Webブラウザ530宛てに送信する(S402)。このような応答メッセージを受信すると、Webブラウザ530は同図中に示すように、検索結果に応じた検索結果一覧画面を表示する。   The search service providing unit 23 searches for information corresponding to a character (for example, “AAA”) indicating a search condition in the HTTP request supplied from the Web browser 530 and a model name (for example, “V-T08”) in the extension header. A response message (search result) that is extracted from the index 22C and includes the number of hits, song name, link information for the song data address, etc. is generated and sent to the Web browser 530 (S402). When receiving such a response message, the Web browser 530 displays a search result list screen corresponding to the search result as shown in FIG.

上述の図1に示す例では、曲データ格納領域111に携帯電話端末装置(機種名“V-T08”)の音声表示能力(8音)に対応する曲AAAの曲データがなく、クローリングによって得られた検索インデックス22Cには上述の図21に示すように機種名“V-T08”に対応する曲AAAの8音の曲データについての情報が登録されていない。このため、検索サービス提供部23が提供する検索結果は、この図22に示すように、ヒット件数が0件であり、曲AAAの曲データについての情報が含まれていない状態になる。   In the example shown in FIG. 1 described above, there is no song data of the song AAA corresponding to the voice display capability (8 sounds) of the mobile phone terminal device (model name “V-T08”) in the song data storage area 111, and it is obtained by crawling. In the retrieved index 22C, as shown in FIG. 21 described above, information about the eight-tone music data of the music AAA corresponding to the model name “V-T08” is not registered. Therefore, as shown in FIG. 22, the search result provided by the search service providing unit 23 has a hit count of 0 and does not include information on the song data of the song AAA.

また、音声表示能力が40音の携帯電話端末装置(例えば機種名“V-SH53”)から、上述の図22の例と同様に曲名「AAA」を検索条件として、検索を要求した場合には、例えば図23に示すように、検索サービス提供部23に供給されるHTTPリクエストの拡張ヘッダには携帯電話端末装置の機種名“V-SH53”が含まれている(S501)。上述の図1に示す例では、曲データ格納領域111には曲AAAに対応する40音の曲データがあり、検索インデックス22Cには上述の図21に示すようにに“V-SH53”に対応する曲AAAの40音の曲データについての情報が登録されている。このため、検索サービス提供部23は、この図23に示すように、曲AAAの曲データに対応するリンク先ページのアドレス“http://meloJAM.com/cgi/abc.cgi?”とキーワードを示す情報“keyword=AAA”がリンク情報として含まれている検索結果をWebブラウザ530に提供する(S502)。   Further, when a search is requested from a mobile phone terminal device (for example, model name “V-SH53”) having a voice display capability of 40 sounds using the song name “AAA” as a search condition in the same manner as in the example of FIG. For example, as shown in FIG. 23, the extension header of the HTTP request supplied to the search service providing unit 23 includes the model name “V-SH53” of the mobile phone terminal device (S501). In the example shown in FIG. 1 described above, the music data storage area 111 has 40-tone music data corresponding to the music AAA, and the search index 22C corresponds to “V-SH53” as shown in FIG. The information about the 40-tone music data of the music AAA to be registered is registered. Therefore, as shown in FIG. 23, the search service providing unit 23 sets the address “http://meloJAM.com/cgi/abc.cgi?” And the keyword of the link destination page corresponding to the song data of the song AAA. The search result including the indicated information “keyword = AAA” as link information is provided to the Web browser 530 (S502).

このようにリンク情報に含まれているキーワードを示す情報は、ユーザが選択したコンテンツのデータを要求する際に、GETコマンドの一部として情報提供サーバに供給される。なお、キーワードを示す“AAA”の部分は、実際には携帯電話端末装置の世代に応じたキャラクタコードでエスケープエンコード(“%xx”の形式)されている。すなわち、第2世代の携帯電話端末装置の場合には、キャラクタコードとして例えばShift−JISが用いられており、第2.5世代と第3世代の携帯電話端末装置の場合には、キャラクタコードとして例えばShift−JIS,UTF−8,EUC−JP,ISO−2022−JPの中の当該携帯電話端末装置の設定に応じたキャラクタコードが用いられる。   Information indicating the keyword included in the link information is supplied to the information providing server as a part of the GET command when requesting the data of the content selected by the user. The “AAA” part indicating the keyword is actually escape encoded (in the form of “% xx”) with a character code corresponding to the generation of the mobile phone terminal device. That is, for example, Shift-JIS is used as the character code in the case of the second generation mobile phone terminal device, and as the character code in the case of the 2.5th generation and third generation mobile phone terminal devices. For example, a character code corresponding to the setting of the mobile phone terminal device in Shift-JIS, UTF-8, EUC-JP, ISO-2022-JP is used.

検索結果を確認したユーザが曲を選択すると、Webブラウザ530は、選択された曲に対応するリンク情報に応じて、対応する情報提供サーバ100にユーザが選択した曲に対応する曲データの提供を要求する(S503)。この要求(HTTPリクエスト)には、拡張ヘッダにキーワードを示す情報“keyword=AAA”と、携帯電話端末装置50の音声表示能力が40音であることを示す情報(x-sound: 40)が含まれている。   When the user who has confirmed the search result selects a song, the Web browser 530 provides the corresponding information providing server 100 with the song data corresponding to the song selected by the user in accordance with the link information corresponding to the selected song. A request is made (S503). This request (HTTP request) includes information “keyword = AAA” indicating a keyword in the extension header, and information (x-sound: 40) indicating that the voice display capability of the mobile phone terminal device 50 is 40 sounds. It is.

このようなHTTPリクエストを受信すると、情報提供サーバ100の要求解析部121は、インデックス保持部122からキーワード“AAA”に該当するコンテンツのアドレスを取得し、広告等の画像等の情報を有するリンク先ページのデータに、コンテンツに対するリンクの記述を付加して応答部124に送信させる(S504)。   Upon receiving such an HTTP request, the request analysis unit 121 of the information providing server 100 acquires the address of the content corresponding to the keyword “AAA” from the index holding unit 122, and a link destination having information such as an image such as an advertisement A description of the link to the content is added to the page data and sent to the response unit 124 (S504).

携帯電話端末装置のWebブラウザ530は、このようなリンク先ページのデータに応じた画像を表示部55に表示させる。ユーザが、コンテンツの取得を選択すると、Webブラウザ530は、コンテンツのデータを情報提供サーバに要求する(S505)。これに応じて、情報提供サーバからコンテンツのデータ(この場合は曲AAAの40音の曲データ)が供給されると(S506)、Webブラウザ530は、供給されたデータをメモリ53に格納する。   The web browser 530 of the mobile phone terminal device displays an image corresponding to the data of the linked page on the display unit 55. When the user selects content acquisition, the Web browser 530 requests content information from the information providing server (S505). In response to this, when content data (in this case, music data of 40 sounds of music AAA) is supplied from the information providing server (S506), the Web browser 530 stores the supplied data in the memory 53.

これにより、この情報提供システムでは、検索結果として、任意のページのアドレスを提供すると共に、キーワードを情報提供サーバに引き継ぐことができるため、例えばユーザの操作負担を増加させずに広告等の情報を有するページを経由させたコンテンツの提供を行うことができる。   As a result, in this information providing system, an address of an arbitrary page can be provided as a search result, and keywords can be handed over to the information providing server. Therefore, for example, information such as advertisements can be displayed without increasing the operation burden on the user. It is possible to provide content via a page that the user has.

ところで、DB22中のテンプレート22Dには、例えば図24,図27及び図28に示すように、携帯電話端末装置の世代毎に検索結果の生成に用いるテンプレートが格納されている。各テンプレート中の変数の意味は図25に、コマンドの意味は図26に、ぞれぞれ示されている。   By the way, in the template 22D in the DB 22, for example, as shown in FIGS. 24, 27, and 28, templates used for generating search results are stored for each generation of mobile phone terminal devices. The meaning of the variable in each template is shown in FIG. 25, and the meaning of the command is shown in FIG.

携帯電話端末装置の世代は、機種名に対応する世代を上述の図17に示すテーブルから取得することによって判断することができる。第2世代(2G)の携帯電話端末装置では、Webブラウザ530は、回線交換機31及びGW35経由でHTTPサーバ23Aにアクセスする。この際、Webブラウザ530は、HTTPリクエストに当該携帯電話端末装置の機種を示す識別情報を付加する。GW35は、この識別情報に対応する機種名を示す文字,解像度を示す文字等の情報を保持しており、HTTPリクエスト中の識別情報に対応する機種名を示す文字等の情報を拡張ヘッダとしてHTTPリクエストに付加する。また、第2.5世代(2.5G)の携帯電話端末装置では、Webブラウザ530は、HTTP拡張ヘッダ中に機種名を示す文字等を付加し、パケット交換機32経由でHTTPサーバ23Aにアクセスする。さらに、第3世代(3G)の携帯電話端末装置では、Webブラウザ530は、HTTP拡張ヘッダ中に機種名を示す文字等を付加し、RNC41a(41b)経由でHTTPサーバ23Aにアクセスする。従って、検索サーバ20の検索サービス提供部23は、上述の図17に示すテーブルを参照することにより、HTTP拡張ヘッダ中の機種名を示す文字に対応する世代を知ることができる。   The generation of the mobile phone terminal device can be determined by acquiring the generation corresponding to the model name from the table shown in FIG. In the second generation (2G) mobile phone terminal device, the Web browser 530 accesses the HTTP server 23A via the circuit switch 31 and the GW 35. At this time, the Web browser 530 adds identification information indicating the model of the mobile phone terminal device to the HTTP request. The GW 35 holds information such as a character indicating the model name corresponding to the identification information, a character indicating the resolution, and the like. The information such as the character indicating the model name corresponding to the identification information in the HTTP request is used as an extension header. Append to request. In the 2.5th generation (2.5G) mobile phone terminal device, the Web browser 530 adds a character or the like indicating the model name to the HTTP extension header, and accesses the HTTP server 23A via the packet switch 32. . Further, in the third generation (3G) mobile phone terminal device, the Web browser 530 adds a character or the like indicating the model name in the HTTP extension header, and accesses the HTTP server 23A via the RNC 41a (41b). Therefore, the search service providing unit 23 of the search server 20 can know the generation corresponding to the character indicating the model name in the HTTP extension header by referring to the table shown in FIG.

検索サービス提供部23は、アクセス元の携帯電話端末装置が第2世代であれば、図24に示すテンプレートを用い、アクセス元の携帯電話端末装置が第2.5世代であれば、図27に示すテンプレートを用い、アクセス元の携帯電話端末装置が第3世代であれば、図28に示すテンプレートを用いて携帯電話端末装置に対する応答メッセージを生成する。   The search service providing unit 23 uses the template shown in FIG. 24 if the access source mobile phone terminal device is the second generation, and uses the template shown in FIG. 27 if the access source mobile phone terminal device is the 2.5th generation. If the access source mobile phone terminal device is the third generation, a response message to the mobile phone terminal device is generated using the template shown in FIG.

具体的には、例えば携帯電話端末装置が第2世代であり、“AAA”についての検索結果が1件である場合には、応答部23bが上述の図24に示すテンプレートを用いて生成する検索結果のデータは、例えば図29に示すようになる。このような検索結果のデータに応じて表示部55に表示される画像は、例えば図23中のS502において表示される画像のようになる。   Specifically, for example, when the mobile phone terminal device is the second generation and the search result for “AAA” is one, the search generated by the response unit 23b using the template shown in FIG. The resulting data is, for example, as shown in FIG. An image displayed on the display unit 55 in accordance with such search result data is, for example, an image displayed in S502 in FIG.

また、携帯電話端末装置が第2.5世代であり、“AAA”についての検索結果が11件である場合には、応答部23bが生成する検索結果のデータに応じて表示部55に表示される画像は、例えば図30に示すようになる。さらに、携帯電話端末装置が第3世代であり、“AAA”についての検索結果が11件である場合には、応答部23bが生成する検索結果のデータに応じて表示部55に表示される画像は、例えば図31に示すように、各コンテンツについての説明等の情報を表示することができるようになる。   Further, when the mobile phone terminal device is the 2.5th generation and there are 11 search results for “AAA”, it is displayed on the display unit 55 according to the search result data generated by the response unit 23b. For example, the image is as shown in FIG. Furthermore, when the mobile phone terminal device is the third generation and there are 11 search results for “AAA”, an image displayed on the display unit 55 according to the search result data generated by the response unit 23b. For example, as shown in FIG. 31, information such as an explanation about each content can be displayed.

このように、携帯電話端末装置の世代に応じたテンプレートによって検索結果を生成することにより、携帯電話端末装置の表示能力に応じて、例えば携帯電話端末装置の世代毎に検索結果の表示件数,内容等を変更し、適切な検索結果を生成することができる。   In this way, by generating a search result using a template according to the generation of the mobile phone terminal device, the number of search results displayed and the content for each generation of the mobile phone terminal device, for example, according to the display capability of the mobile phone terminal device Etc., and appropriate search results can be generated.

なお、GW35,パケット交換機32,RNC41a(41b)と検索サービス提供部23の間では、上位プロトコルとしてTCP/IPプロトコルを用いて通信を行っている。このため、検索サービス提供部23はアクセス元のIPアドレスによって携帯電話端末装置の世代を判断することもでき、このような構成とすることもできる。   The GW 35, the packet switch 32, the RNC 41a (41b), and the search service providing unit 23 communicate with each other using the TCP / IP protocol as an upper protocol. Therefore, the search service providing unit 23 can also determine the generation of the mobile phone terminal device based on the IP address of the access source, and such a configuration can be adopted.

以上、曲データの場合を例に説明したが、画像データについても同様に、検索サービス提供部23は、HTTPリクエストの拡張ヘッダ中の機種名に応じて、検索インデックス22Cからのデータの抽出を行って検索結果を携帯電話端末装置に送信する。   As described above, the case of music data has been described as an example. Similarly, for image data, the search service providing unit 23 extracts data from the search index 22C according to the model name in the extension header of the HTTP request. The search result is transmitted to the mobile phone terminal device.

(効果)
階層数,ページサイズ等のコンテンツの提供ルールに従っていないコンテンツが検索結果に含まれてしまうと、ユーザによる選択回数が増えてしまったり、コンテンツを取得しても表示できなかったりすることがあり、利便性を低下させてしまう。
(effect)
If content that does not comply with the content provision rules such as the number of layers and page size is included in the search results, the number of selections by the user may increase, or the content may not be displayed even if it is acquired. It will reduce the sex.

これに対し、この情報提供システムでは、検索サーバ20の判定部21Aの判定結果に応じて、提供ルールに従っていない不正なコンテンツについての情報を検索インデックス22Cに登録していないため、この検索インデックス22Cから抽出した検索結果に不正なコンテンツについての情報が含まれることがない。このため、この情報提供システムでは、利便性の低下の防止に寄与することができる。   On the other hand, in this information providing system, information on illegal content that does not comply with the provision rules is not registered in the search index 22C according to the determination result of the determination unit 21A of the search server 20, and therefore the search index 22C The extracted search result does not include information on illegal content. For this reason, in this information provision system, it can contribute to prevention of the fall of convenience.

また、携帯電話端末装置の表示能力を考慮しないで検索を行った場合には、検索結果に携帯電話端末装置で利用できない情報が含まれてしまい、ユーザが逐一リンクを辿って当該携帯電話端末装置で表示可能なコンテンツであるか判断する必要がある。   In addition, when a search is performed without considering the display capability of the mobile phone terminal device, information that cannot be used in the mobile phone terminal device is included in the search result, and the user follows the link one by one, and the mobile phone terminal device It is necessary to determine whether the content can be displayed in

これに対し、この情報提供システムでは、上述のように、検索サービス提供部23が、検索インデックス22Cから携帯電話端末装置の機種名に対応する曲データのみを検索結果として供給することができる。検索インデックス22Cには、所定の機種グループ内の携帯電話端末装置の機種名と利用可能なコンテンツについての情報が対応付けられて登録されているため、携帯電話端末装置で表示できるコンテンツについての情報のみを検索結果として供給することができる。   On the other hand, in this information providing system, as described above, the search service providing unit 23 can supply only the song data corresponding to the model name of the mobile phone terminal device from the search index 22C as the search result. In the search index 22C, the model name of the mobile phone terminal device in the predetermined model group is registered in association with the information on the usable content, so only the information on the content that can be displayed on the mobile phone terminal device is registered. Can be supplied as a search result.

従って、この情報提供システムでは、利用可能なコンテンツを取得するまでのユーザの操作回数を低減させて、ユーザの操作負担の低減に寄与することができる。また、携帯電話端末装置で利用できない曲データにアクセスする可能性を低減させることができるため、無用なトラフィックの低減,通信料金の節約に寄与することができる。   Therefore, in this information providing system, it is possible to reduce the number of user operations until obtaining usable content, thereby contributing to a reduction in the user's operation burden. Moreover, since the possibility of accessing music data that cannot be used by the mobile phone terminal device can be reduced, it is possible to contribute to the reduction of unnecessary traffic and the saving of communication charges.

また、この情報提供システムでは、曲データ,画像データ等のコンテンツの種類毎に設定した機種グループ毎にクローリングを行っているため、携帯電話端末装置の表示能力に応じた適切な検索インデックス22Cを生成するための情報提供サーバに対するアクセスの回数の増加を抑制することができる。   In addition, since this information providing system performs crawling for each model group set for each type of content such as song data and image data, an appropriate search index 22C corresponding to the display capability of the mobile phone terminal is generated. The increase in the number of accesses to the information providing server can be suppressed.

さらに、この情報提供システムでは、表示能力が同じ機種グループ毎に検索インデックス22C中のデータを生成しており、機種名自体を登録しておくことにより、別途機種グループ内の機種名のテーブルを有する場合に比較してDB22中のデータの参照回数を低減させて検索の高速化に寄与することがでできる。   Further, in this information providing system, data in the search index 22C is generated for each model group having the same display capability, and a model name table in the model group is separately provided by registering the model name itself. Compared to the case, it is possible to reduce the number of times the data in the DB 22 is referenced and contribute to speeding up the search.

また、この情報提供システムでは、表示部55に表示可能な文字数等の画像表示能力が携帯電話端末装置の世代毎に決定されているため、世代に応じたテンプレートを用いて検索結果を生成することにより、表示部55の表示能力に応じた適切な検索結果を生成することができる。   Further, in this information providing system, since the image display capability such as the number of characters that can be displayed on the display unit 55 is determined for each generation of the mobile phone terminal device, a search result is generated using a template corresponding to the generation. Thus, an appropriate search result corresponding to the display capability of the display unit 55 can be generated.

本発明の実施例1に係る情報提供システムの構成を示すブロック図である。It is a block diagram which shows the structure of the information provision system which concerns on Example 1 of this invention. 前記情報提供システムを構成する検索サーバの構成を示すブロック図である。It is a block diagram which shows the structure of the search server which comprises the said information provision system. 前記情報提供システムを構成する情報提供サーバの詳細な構成例を示す図である。It is a figure which shows the detailed structural example of the information provision server which comprises the said information provision system. 前記情報提供サーバのインデックス保持部に保持されているインデックスデータの構造例を示す図である。It is a figure which shows the structural example of the index data currently hold | maintained at the index holding part of the said information provision server. 前記情報提供システムを構成する検索サーバのクローリング部に保持されているコンテンツ情報テーブルの例を示す図である。It is a figure which shows the example of the content information table hold | maintained at the crawling part of the search server which comprises the said information provision system. 前記クローリング部の条件保持部に保持されている禁止条件の例を示す図である。It is a figure which shows the example of the prohibition conditions currently hold | maintained at the condition holding part of the said crawling part. 前記条件保持部に保持されているテーブルの例を示す図である。It is a figure which shows the example of the table hold | maintained at the said condition holding part. 前記条件保持部に保持されているテーブルの例を示す図である。It is a figure which shows the example of the table hold | maintained at the said condition holding part. 前記条件保持部に保持されているテーブルの例を示す図である。It is a figure which shows the example of the table hold | maintained at the said condition holding part. 不正ページのアドレスを保持する不正アドレステーブルの例を示す図である。It is a figure which shows the example of the unauthorized address table which hold | maintains the address of an unauthorized page. 判定処理を示すフローチャートである。It is a flowchart which shows a determination process. ロボット検索用の定義ファイルの例を示す図である。It is a figure which shows the example of the definition file for a robot search. 不正ページの例を示す図である。It is a figure which shows the example of an unauthorized page. 前記検索サーバを構成するクローリング部の判定部による判定処理の例を示すフローチャートである。It is a flowchart which shows the example of the determination process by the determination part of the crawling part which comprises the said search server. 前記クローリング部によるクローリング動作の例を示すシーケンス図である。It is a sequence diagram which shows the example of the crawling operation | movement by the said crawling part. 前記情報提供システムを構成する検索サーバのDBに保持されている表示能力対応表の例を示す図である。It is a figure which shows the example of the display capability corresponding table hold | maintained at DB of the search server which comprises the said information provision system. 前記DBに保持されている対応テーブルの例を示す図である。It is a figure which shows the example of the corresponding | compatible table hold | maintained at said DB. 前記DBに保持されている収集パターンの例を示す図である。It is a figure which shows the example of the collection pattern currently hold | maintained at said DB. 前記DBに保持されているエージェント定義の例を示す図である。It is a figure which shows the example of the agent definition currently hold | maintained at said DB. 前記クローリング部によるクローリング動作の例を示すシーケンス図である。It is a sequence diagram which shows the example of the crawling operation | movement by the said crawling part. 前記クローリング動作によってDBに格納されるコンテンツテーブルの例を示す図である。It is a figure which shows the example of the content table stored in DB by the said crawling operation | movement. 前記検索サーバによる検索サービスにおける動作の例を示すシーケンス図である。It is a sequence diagram which shows the example of operation | movement in the search service by the said search server. 前記検索サービスにおける他の動作の例を示すシーケンス図である。It is a sequence diagram which shows the example of another operation | movement in the said search service. 前記DBに保持されているテンプレートの例を示す図である。It is a figure which shows the example of the template currently hold | maintained at said DB. 前記テンプレート中の変数の例を示す図である。It is a figure which shows the example of the variable in the said template. 前記テンプレート中のコマンドの例を示す図である。It is a figure which shows the example of the command in the said template. 前記テンプレートの他の例を示す図である。It is a figure which shows the other example of the said template. 前記テンプレートの他の例を示す図である。It is a figure which shows the other example of the said template. 前記テンプレートを用いて生成した検索結果のデータの例を示す図である。It is a figure which shows the example of the data of the search result produced | generated using the said template. 他の検索結果のデータによって表示される画像の例を示す図である。It is a figure which shows the example of the image displayed by the data of another search result. 他の検索結果のデータによって表示される画像の例を示す図である。It is a figure which shows the example of the image displayed by the data of another search result.

符号の説明Explanation of symbols

10 情報提供サーバ群、110,120 情報格納部、120,220 HTTPサーバ、121 要求解析部、122 インデックス保持部、123 コンテンツ取得部、124 応答部、20 検索サーバ、21 クローリング部、21A 判定部、21B 条件保持部,22 DB、22A 表示能力対応表、22B 収集パターン、22C 検索インデックス、22D テンプレート、23 検索サービス提供部、50,60 携帯電話端末装置、52 MPU、530 Webブラウザ、53 メモリ、53a 着メロデータ保持部、53b 画像データ保持部 10 information providing server group, 110, 120 information storage unit, 120, 220 HTTP server, 121 request analysis unit, 122 index holding unit, 123 content acquisition unit, 124 response unit, 20 search server, 21 crawling unit, 21A determination unit, 21B condition holding unit, 22 DB, 22A display capability correspondence table, 22B collection pattern, 22C search index, 22D template, 23 search service providing unit, 50, 60 mobile phone terminal device, 52 MPU, 530 Web browser, 53 memory, 53a Ringtone data holding unit, 53b Image data holding unit

Claims (4)

コンテンツ提供サーバが提供するコンテンツに関する情報を収集(クローリング)するクローリング手段と、
該クローリング手段のクローリングに応じてコンテンツに関する情報を保持する検索インデックスと、
該検索インデックスに情報を登録するコンテンツの条件を保持する条件保持手段と、
該条件保持手段に保持されている条件に応じて前記クローリング手段による前記クローリング又は前記検索インデックスに対する前記情報の格納を制御する制御手段と
を備えることを特徴とする検索装置。
Crawling means for collecting (crawling) information related to the content provided by the content providing server;
A search index that holds information about the content according to crawling by the crawling means;
Condition holding means for holding a condition of contents for registering information in the search index;
A search device comprising: control means for controlling storage of the information for the crawling or the search index by the crawling means according to a condition held in the condition holding means.
前記条件は、前記コンテンツの種類に応じた許可条件を含むことを特徴とする請求項1記載の検索装置。   The search apparatus according to claim 1, wherein the condition includes a permission condition according to a type of the content. 前記条件は、前記クローリング手段が検索を開始する所定のアドレスからのリンク階層数,ページサイズのいずれかの値に応じた禁止条件を含むことを特徴とする請求項1記載の検索装置。   2. The search apparatus according to claim 1, wherein the condition includes a prohibition condition corresponding to any one of a number of link hierarchies and a page size from a predetermined address at which the crawling means starts searching. 前記コンテンツ提供サーバは、情報要求命令中のコンテンツ表示能力を示す情報に応じたコンテンツを提供し得、
前記クローリング手段は、コンテンツの表示能力毎に設定された機種グループ内の代表機種のコンテンツ表示能力を示す情報を用いて前記コンテンツに関する情報を検索し、
前記検索インデックスは、前記クローリング手段によって得られたコンテンツに関する情報を,クローリング時の機種グループ内の端末装置の機種名を示す識別情報に対応付けて保持し、
端末装置からの情報要求命令中の機種名を示す識別情報に応じて前記検索インデックス中のコンテンツに関する情報を取得する検索手段
を備えることを特徴とする請求項1記載の検索装置。
The content providing server may provide content according to information indicating content display capability in the information request command,
The crawling means searches for information related to the content using information indicating the content display capability of a representative model in the model group set for each content display capability,
The search index holds information related to the content obtained by the crawling means in association with identification information indicating the model name of the terminal device in the model group at the time of crawling,
The search device according to claim 1, further comprising search means for acquiring information related to the content in the search index in accordance with identification information indicating a model name in an information request command from a terminal device.
JP2004118356A 2004-04-13 2004-04-13 Search device Expired - Fee Related JP4436177B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004118356A JP4436177B2 (en) 2004-04-13 2004-04-13 Search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004118356A JP4436177B2 (en) 2004-04-13 2004-04-13 Search device

Publications (2)

Publication Number Publication Date
JP2005301759A true JP2005301759A (en) 2005-10-27
JP4436177B2 JP4436177B2 (en) 2010-03-24

Family

ID=35333199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004118356A Expired - Fee Related JP4436177B2 (en) 2004-04-13 2004-04-13 Search device

Country Status (1)

Country Link
JP (1) JP4436177B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040643A (en) * 2006-08-03 2008-02-21 Fugaku-Bussan Co Ltd External equipment control system and its program
JP2009199463A (en) * 2008-02-22 2009-09-03 Sony Computer Entertainment Inc Terminal device, information provision system, file access method, and data structure
WO2010041517A1 (en) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション Information collecting device, search engine, information collecting method and program
JP2011118454A (en) * 2009-11-30 2011-06-16 Fujitsu Toshiba Mobile Communications Ltd Information processing apparatus

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040643A (en) * 2006-08-03 2008-02-21 Fugaku-Bussan Co Ltd External equipment control system and its program
JP2009199463A (en) * 2008-02-22 2009-09-03 Sony Computer Entertainment Inc Terminal device, information provision system, file access method, and data structure
WO2010041517A1 (en) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション Information collecting device, search engine, information collecting method and program
JP5325229B2 (en) * 2008-10-08 2013-10-23 インターナショナル・ビジネス・マシーンズ・コーポレーション Information collecting apparatus, search engine, information collecting method and program
US8676782B2 (en) 2008-10-08 2014-03-18 International Business Machines Corporation Information collection apparatus, search engine, information collection method, and program
JP2011118454A (en) * 2009-11-30 2011-06-16 Fujitsu Toshiba Mobile Communications Ltd Information processing apparatus

Also Published As

Publication number Publication date
JP4436177B2 (en) 2010-03-24

Similar Documents

Publication Publication Date Title
JP4205955B2 (en) Method and apparatus for accessing individual video / audio web content via a wireless device
US8374651B2 (en) System and method for generating a graphical user interface
US8346797B2 (en) Search device and information providing system
JP2002202936A (en) Information collecting server, information collecting method and recording medium
US20080033918A1 (en) Systems, methods and computer program products for supplemental data communication and utilization
JP4436177B2 (en) Search device
KR100556530B1 (en) Method for information searching on wireless internet
JP5088259B2 (en) Content prefetching method, portable terminal and SNS server
JP2007096570A (en) Phone connection method
JP2002123533A (en) Contents registration device, contents registration method and computer-readable recording medium
JP2006209222A (en) File retrieving device
JP4350631B2 (en) Search service provision system
US20060150116A1 (en) Data distribution system
JP2004342044A (en) Customizing system for portable terminal, management server, portable terminal and program for portable terminal
JP4396404B2 (en) CONTENT PROVIDING SYSTEM, ITS METHOD, SERVER, AND PROGRAM
JP2003006230A (en) Method and server for information retrieval processing, method and device for presenting information, program and medium
JP2007011761A (en) Retrieval system and mobile communication terminal
JP2006107199A (en) Retrieval system
JP4346276B2 (en) Information search system, information search device, information search method, and information search program
JP2006048141A (en) Information retrieval system, information retrieval server, information retrieval method and information retrieval program
JP2002215675A (en) Information retrieval system
JP2005031906A (en) Information communication terminal device and process shared server device
KR100886763B1 (en) The system and method for connecting web site
JP2004355291A (en) Retrieval server device and information providing system
EP2089822B1 (en) System and process for identifying addresses in a distributed data network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091225

R150 Certificate of patent or registration of utility model

Ref document number: 4436177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160108

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees