JP4035623B2 - Information processing apparatus and program - Google Patents

Information processing apparatus and program Download PDF

Info

Publication number
JP4035623B2
JP4035623B2 JP2006524541A JP2006524541A JP4035623B2 JP 4035623 B2 JP4035623 B2 JP 4035623B2 JP 2006524541 A JP2006524541 A JP 2006524541A JP 2006524541 A JP2006524541 A JP 2006524541A JP 4035623 B2 JP4035623 B2 JP 4035623B2
Authority
JP
Japan
Prior art keywords
information
search
target
word
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006524541A
Other languages
Japanese (ja)
Other versions
JPWO2006008919A1 (en
Inventor
毅 相良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Original Assignee
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC filed Critical University of Tokyo NUC
Application granted granted Critical
Publication of JP4035623B2 publication Critical patent/JP4035623B2/en
Publication of JPWO2006008919A1 publication Critical patent/JPWO2006008919A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Description

本発明は、例えば、WEB上のホームページ等に記載されている店舗の対象情報を効率的に検索する情報処理装置やプログラム等に関するものである。   The present invention relates to an information processing apparatus, a program, and the like for efficiently searching for store target information described on a homepage on a WEB, for example.

従来の第一の技術として、以下の技術がある。つまり、インターネット上に存在する大量のWebページから、属性に関する条件とハイパーリンクに関する条件を組み合わせて指定し、Webページの系列を検索するための問い合わせの処理方法において、Webページに関するインデックスを利用し、問い合わせに指定された条件から、未処理で、かつ他条件の処理結果に依存せずに処理結果を求めることのできる条件の処理コストと処理結果を予測し、問い合わせ処理の進行状況にあわせて最適な条件を選択し処理する操作を、問い合わせで指定された全ての条件を処理するまで繰り返し、問い合わせの条件を満たすWebページの系列を求める検索方法がある。かかる検索方法により、Webページの系列を高速に検索することができる(特許文献1参照)。   As the first conventional technique, there are the following techniques. In other words, from a large number of web pages existing on the Internet, a combination of attribute-related conditions and hyperlink-related conditions is specified, and in the query processing method for searching a series of web pages, the web page index is used. Predicts the processing cost and processing result of conditions that can be processed without depending on the processing result of other conditions from the conditions specified in the query, and is optimal according to the progress of the query processing There is a search method for obtaining a series of Web pages satisfying the inquiry condition by repeating the operation of selecting and processing a proper condition until all the conditions specified by the inquiry are processed. With this search method, it is possible to search a series of Web pages at high speed (see Patent Document 1).

従来の第二の技術として、ユーザ端末により起点として指定されたホームページから、ホームページ間に定義されたハイパーリンクもしくはユーザの検索要求に応じてホームページ間の関連性を評価することによって動的に生成するリンクの展開を行なうステップと、展開されたホームページに記述されたテキスト、HTMLタグで指定されたホームページの属性、およびホームページ内の表現から抽出されたホームページの属性の評価を繰り返しながら、ユーザ端末から指定された問い合わせ内容に応じたホームページとリンクの系列を検索結果として出力するステップとを備える検索方法がある。かかる検索方法により、あるホームページを起点に情報間の関連性を辿りながら目的のホームページに到達することと、その情報へ到達するための情報の系列自体を獲得することができる(特許文献2参照)。
また、レストラン等の特定種類の店舗を検索するホームページが存在する(非特許文献1参照)。
特開2003−203089(第1頁、第1図等) 特開2001−344283(第1頁、第1図等) ぐるなびホームページ、インターネット<URL:http://www.gnavi.co.jp/>
As a conventional second technique, from a home page specified as a starting point by a user terminal, it is dynamically generated by evaluating the relevance between home pages in response to a hyperlink defined between home pages or a user's search request Specify from the user terminal while repeatedly evaluating the step of expanding the link, the text described in the expanded home page, the home page attribute specified by the HTML tag, and the home page attribute extracted from the expression in the home page There is a search method including a step of outputting a homepage according to the inquired content and a series of links as a search result. By such a search method, it is possible to reach the target home page while tracing the relationship between the information from a certain home page, and to acquire the information sequence itself for reaching the information (see Patent Document 2). .
There is also a home page for searching for a specific type of store such as a restaurant (see Non-Patent Document 1).
Japanese Patent Laid-Open No. 2003-20389 (first page, FIG. 1 etc.) JP 2001-344283 (first page, FIG. 1 etc.) Gurunavi website, Internet <URL: http://www.gnavi.co.jp/>

しかしながら、上述した従来技術は、2以上のホームページから2以上のユーザが記載した情報を抽出して、多数のユーザの評価に基づいてレストラン等の情報を出力するものではなかった。つまり、ユーザは、多数のユーザの客観的情報に基づく、店舗等の情報を取得することができなかった。   However, the above-described conventional technology does not extract information described by two or more users from two or more home pages and output information on restaurants or the like based on the evaluations of many users. That is, the user has not been able to acquire information such as stores based on objective information of many users.

本第一の発明の情報処理装置は、2以上の検索対象を特定する情報である検索情報を受け付ける受付部と、前記検索情報により特定される2以上の検索対象の評価に関する情報である2以上の対象情報を2以上の元情報から取得する対象情報取得部と、前記2以上の検索対象の対象情報を出力する出力部を具備する情報処理装置である。
かかる構成により、多数のホームページ等の元情報から、店舗等の検索対象の評価に関する情報を収集できる情報処理装置を提供できる。
The information processing apparatus according to the first aspect of the invention is a receiving unit that receives search information that is information for specifying two or more search targets, and two or more pieces of information relating to evaluation of two or more search targets specified by the search information. The target information acquisition unit that acquires the target information from two or more pieces of original information, and the output unit that outputs the target information of the two or more search targets.
With this configuration, it is possible to provide an information processing apparatus that can collect information related to evaluation of a search target such as a store from original information such as many home pages.

本第二の発明の情報処理装置は、第一の発明の情報処理装置における出力部は、前記2以上の対象情報を要約し、2以上の要約情報を取得する要約手段と、前記2以上の要約情報を出力する要約情報出力手段を具備する。
かかる構成により、多数の元情報の要約情報を出力するので、限られた面積の表示画面を有効に利用できる。
In the information processing apparatus according to the second invention, the output unit in the information processing apparatus according to the first invention summarizes the two or more pieces of target information and obtains two or more pieces of summary information; Summary information output means for outputting summary information is provided.
With this configuration, summary information of a large number of original information is output, so that a display screen with a limited area can be used effectively.

本第三の発明の情報処理装置は、第二の発明の情報処理装置における要約手段は、前記対象情報から単語を抽出する単語抽出手段と、前記単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得手段を具備する。
かかる構成により、店舗等の検索対象の特徴を示す単語に着目して要約情報を取得することにより、好適な要約情報を得ることができる。
In the information processing apparatus of the third invention, the summarizing means in the information processing apparatus of the second invention includes a word extraction means for extracting a word from the target information, and a search target in each word extracted by the word extraction means. A search object word appearance frequency calculating means for calculating the appearance frequency for each search object, and a summary acquiring means for acquiring summary information of each search object from the target information based on the appearance frequency.
With such a configuration, it is possible to obtain suitable summary information by acquiring summary information by paying attention to a word indicating a characteristic of a search target such as a store.

なお、要約手段は、前記単語抽出手段が抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出手段と、前記検索対象毎単語出現回数算出手段が算出した検索対象毎の出現回数と前記単語全出現回数算出手段が算出した全対象情報中の出現回数との割合を算出する割合算出手段と、前記割合算出手段が算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成手段をさらに具備し、第三の発明の情報処理装置の要約取得手段は、前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得することが好適である。   The summarizing means includes a word total appearance count calculating means for calculating the number of appearances in all target information of all search targets in each word extracted by the word extracting means, and a word appearance count calculating means for each search target. A ratio calculation unit that calculates a ratio between the calculated number of appearances for each search target and the number of appearances in all target information calculated by the word total appearance number calculation unit, and a word that has a high ratio calculated by the ratio calculation unit And a word list creation means for creating a word list for each search object, wherein the summary acquisition means of the information processing device according to the third invention is configured to search each of the target information based on the word list for each search object. It is preferable to acquire the summary information of the object.

本第四の発明の情報処理装置は、上記の対象情報取得部は、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記受付部は、前記要約情報に対する指示である要約情報選択指示をも受け付け、前記受付部が要約情報選択指示を受け付けた場合に、前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する元情報取得部をさらに具備し、前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する構成である。
かかる構成により、要約情報だけでは物足りないユーザにとって、容易に元情報を取得することができ好適である。
In the information processing apparatus according to the fourth aspect of the invention, the target information acquisition unit acquires link information that is information indicating the location of the information in which the target information is described, and the reception unit receives an instruction for the summary information. When a summary information selection instruction is also received, and the reception unit receives the summary information selection instruction, based on link information of the original information in which target information that is a source of the summary information corresponding to the summary information selection instruction is described The original information acquisition unit for acquiring the original information is further provided, and the output unit further includes original information output means for outputting the original information acquired by the original information acquisition unit.
Such a configuration is suitable for a user who is not satisfied with summary information alone because the original information can be easily acquired.

本第五の発明の情報処理装置は、上記の対象情報取得部は、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記出力部は、前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力手段をさらに具備し、前記受付部は、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付け、前記受付部がリンクシンボル選択指示を受け付けた場合に、前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する元情報取得部をさらに具備し、前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する構成である。
かかる構成により、要約を読まずに元情報を取得したいユーザが、容易に元情報を取得することができ好適である。
In the information processing apparatus according to the fifth aspect of the present invention, the target information acquisition unit also acquires link information that is information indicating the location of information in which the target information is described, and the output unit corresponds to the link information Link symbol output means for outputting link symbol information as information is further provided, the accepting unit also accepts a link symbol selection instruction as an instruction for the link symbol information, and the accepting unit accepts a link symbol selection instruction A source information acquisition unit that acquires source information, which is information describing target information indicated by the link information, based on link information corresponding to the instructed link symbol information, and the output unit Is configured to include original information output means for outputting the original information acquired by the original information acquisition unit.
With such a configuration, it is preferable that a user who wants to acquire original information without reading the summary can easily acquire the original information.

本第六の発明の情報処理装置は、上記の出力部は、前記2以上の検索対象の対象情報に基づいて、前記2以上の検索対象を順位付けするランキング決定手段をさらに具備し、前記ランキング決定手段の順位付けに基づいて、前記2以上の検索対象の対象情報または/および要約情報を出力する。
かかる構成により、ユーザが欲しい店舗等の検索対象の情報が、ランキングされて出力される。したがって、ユーザが欲する情報を見やすい形態で出力できる。
In the information processing apparatus according to the sixth aspect of the present invention, the output unit further includes ranking determining means for ranking the two or more search targets based on the target information of the two or more search targets, and the ranking Based on the ranking of the determining means, the target information or / and summary information of the two or more search targets are output.
With this configuration, search target information such as stores that the user wants is ranked and output. Therefore, it is possible to output information that the user desires in an easy-to-see form.

本第七の発明の情報処理装置は、上記のランキング決定手段は、前記2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて前記2以上の検索対象を順位付けする。
かかる構成により、特に、WEB上のホームページに記載されている店舗等の評判に基づいて、店舗等をランキングする場合に好適である。
本第八の発明の情報処理装置は、前記検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を有する。
In the information processing apparatus according to the seventh aspect of the present invention, the ranking determining means determines whether the number of characters of the target information to be searched or two or more and / or whether the target information includes telephone number information, and / or The two or more search targets are ranked based on the page ranking of the original information in which the target information is described.
Such a configuration is particularly suitable for ranking stores based on the reputation of stores and the like described on a website on the WEB.
In the information processing apparatus according to the eighth aspect of the invention, the search information includes search point information that is information related to a search point, and target group information that is information for specifying a search target group.

かかる構成により、ユーザの行動特性に合致した店舗等の検索が可能である。行動特定とは、駅を中心に行動するという都会派の人達の行動特性や、おいしい店であれば、駅から徒歩数分ぐらいは歩いて行くであろう、という行動特性である。   With this configuration, it is possible to search for stores and the like that match the user's behavioral characteristics. Behavior identification is behavioral characteristics of urban people who act mainly at the station, or behavioral characteristics that if it is a delicious restaurant, they will walk about a few minutes from the station.

本第九の発明の情報処理装置は、対象情報取得部は、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している被検索対象情報群格納手段と、前記検索情報に基づいて、前記被検索対象情報群格納手段から被検索対象情報の一部または全部を取得する被検索対象情報取得手段と、前記被検索対象情報取得手段が取得した被検索対象情報の一部または全部に基づいて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得する対象情報取得手段を具備する。
かかる構成により、ユーザの要求に合致する店舗等の検索対象の絞込みが適切にできる。
In the information processing device according to the ninth aspect of the invention, the target information acquisition unit includes search target name information that is information indicating the name of the search target, telephone number information that is information indicating the telephone number of the search target, Search target information group storage means for storing a search target information group having one or more search target information having address information that is address information, and the search target information group based on the search information Based on part or all of the search target information acquired by the search target information acquisition means acquired by the search target information acquisition means for acquiring part or all of the search target information from the storage means, It comprises target information acquisition means for acquiring target information that is information relating to two or more specified search targets.
With this configuration, it is possible to appropriately narrow down search targets such as stores that match the user's request.

本第十の発明の情報処理装置は、上記の検索情報は、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範囲情報を含み、前記被検索対象情報取得手段は、前記検索情報が有する検索地点情報と前記検索対象の住所情報と前記検索範囲情報に基づいて、前記被検索対象情報群格納手段から1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得する。
かかる構成により、さらにユーザの行動特性に合致した店舗等の検索が可能である。
In the information processing apparatus of the tenth invention, the search information further includes search range information that is information for specifying a search range from the search point indicated by the search point information, and the search target information acquisition unit includes: Based on the search point information included in the search information, the address information of the search target, and the search range information, one or more search target information is selected from the search target information group storage means, and the selected search target Obtain some or all of the information.
With this configuration, it is possible to search for a store or the like that further matches the behavioral characteristics of the user.

本第十一の発明の情報処理装置は、上記の被検索対象情報取得手段は、前記検索情報が有する検索地点情報の経緯度と、前記検索対象の住所情報の経緯度を取得し、当該2つの経緯度から前記検索地点情報が示す検索地点と前記住所情報が示す前記検索対象の地点の間の距離を算出し、当該距離に基づいて、前記検索範囲情報が示す条件に合致するか否かを判断することにより、前記被検索対象情報群格納手段から1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得する。
かかる構成により、例えば、駅から徒歩10分等の検索情報である場合に、かなり正確に対象となり得る店舗等の検索対象の情報を得ることができる。
In the information processing apparatus according to the eleventh aspect of the invention, the search target information acquisition unit acquires the longitude and latitude of the search point information included in the search information and the longitude and latitude of the address information of the search target. The distance between the search point indicated by the search point information and the search target point indicated by the address information is calculated from two longitudes and latitudes, and whether or not the condition indicated by the search range information is met based on the distance Is selected, one or more search target information is selected from the search target information group storage means, and a part or all of the selected search target information is acquired.
With this configuration, for example, in the case of search information such as a 10-minute walk from a station, it is possible to obtain information about a search target such as a store that can be targeted fairly accurately.

本第十ニの発明の情報処理装置は、対象情報を取得する元になる情報である元情報は、階層化されたタグが付された情報であり、前記対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する構成である。
かかる構成により、高速に対象情報を得ることができる。
In the information processing apparatus according to the tenth aspect of the present invention, the source information that is the source from which the target information is acquired is information with a hierarchical tag, and the target information acquisition unit In the case of acquiring a plurality of pieces of target information from information, information having the same hierarchical level is acquired.
With this configuration, target information can be obtained at high speed.

本第十三の発明の情報処理装置は、上記の対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを決定し、当該決定した階層レベルの情報を取得する構成である。
かかる構成により、正確に、かつ高速に対象情報を得ることができる。
In the information processing apparatus according to the thirteenth aspect of the present invention, when the target information acquisition unit acquires a plurality of target information from a single source information, the target information acquisition unit searches for the source information, phone number information, address information, In this configuration, a hierarchy level including location information that is one or more pieces of information of a zip code is determined, and information on the determined hierarchy level is acquired.
With this configuration, target information can be obtained accurately and at high speed.

本発明によれば、店舗等の客観的な情報が適切に取得できる。   According to the present invention, objective information such as a store can be acquired appropriately.

以下、情報処理システム、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
Hereinafter, embodiments of an information processing system, an information processing apparatus, and the like will be described with reference to the drawings. In addition, since the component which attached | subjected the same code | symbol in embodiment performs the same operation | movement, re-explanation may be abbreviate | omitted.
(Embodiment 1)

図1は、本実施の形態における情報処理システムの概念図である。本情報処理システムは、情報端末11、情報処理装置12、情報格納装置13を有する。情報端末11は、いわゆるクライアント端末であり、例えば、レストラン等の対象情報を出力する端末である。対象情報とは、検索情報により特定される2以上の検索対象(レストラン等)に関する情報である。かかる対象情報は、例えば、レストラン等の評価(美味しいや、お洒落や、まずい等)に関する情報である。情報処理装置12は、情報端末11の要求に応じて対象情報を取得して、当該対象情報を情報端末11に送信する装置である。情報処理装置12は、例えば、いわゆるサーチエンジンを搭載したアプリケーションサービスプロバイダーのサーバ装置である。情報格納装置13は、例えば、レストラン等の対象情報を格納している装置である。情報格納装置13は、例えば、情報ポータルに記載されたレストラン等の評価の情報や、個人のユーザが書き込んだレストラン等の評価を示す対象情報や、個人のユーザが記録した日記などの情報を格納している。情報処理システムにおいて、通常、情報格納装置13は複数存在する。対象情報が記載されている情報を元情報と言う。元情報は、例えば、いわゆるWEBのホームページである   FIG. 1 is a conceptual diagram of an information processing system in the present embodiment. The information processing system includes an information terminal 11, an information processing device 12, and an information storage device 13. The information terminal 11 is a so-called client terminal, for example, a terminal that outputs target information such as a restaurant. The target information is information regarding two or more search targets (restaurants, etc.) specified by the search information. Such target information is, for example, information on evaluation of restaurants and the like (delicious, stylish, bad, etc.). The information processing device 12 is a device that acquires target information in response to a request from the information terminal 11 and transmits the target information to the information terminal 11. The information processing device 12 is, for example, a server device of an application service provider equipped with a so-called search engine. The information storage device 13 is a device that stores target information such as a restaurant, for example. The information storage device 13 stores, for example, information on evaluations of restaurants and the like described in an information portal, target information indicating evaluations of restaurants and the like written by individual users, and information such as diaries recorded by individual users. is doing. In an information processing system, there are usually a plurality of information storage devices 13. Information in which target information is described is referred to as original information. The original information is, for example, a so-called WEB homepage

図2は、本実施の形態における情報処理システムのブロック図である。情報端末11は、ユーザ入力受付部1101、要求送信部1102、情報受信部1103、情報出力部1104を有する。情報処理装置12は、受付部1201、対象情報取得部1202、元情報取得部1203、出力部1204、元情報受信部1205、元情報蓄積部1206、元情報格納部1207を具備する。対象情報取得部1202は、被検索対象情報群格納手段12021、被検索対象情報取得手段12022、対象情報取得手段12023を具備する。出力部1204は、ランキング決定手段12041、対象情報出力手段12042、要約手段12043、要約情報出力手段12044、元情報出力手段12045、リンクシンボル出力手段12046を具備する。要約手段12043は、単語抽出手段120431、検索対象毎単語出現回数算出手段120432、単語全出現回数算出手段120433、割合算出手段120434、単語リスト作成手段120435を具備する。情報格納装置13は、元情報格納部1301、元情報送信部1302を具備する。   FIG. 2 is a block diagram of the information processing system in the present embodiment. The information terminal 11 includes a user input reception unit 1101, a request transmission unit 1102, an information reception unit 1103, and an information output unit 1104. The information processing apparatus 12 includes a reception unit 1201, a target information acquisition unit 1202, an original information acquisition unit 1203, an output unit 1204, an original information reception unit 1205, an original information storage unit 1206, and an original information storage unit 1207. The target information acquisition unit 1202 includes a search target information group storage unit 12021, a search target information acquisition unit 12022, and a target information acquisition unit 12023. The output unit 1204 includes ranking determination means 12041, target information output means 12042, summary means 12043, summary information output means 12044, original information output means 12045, and link symbol output means 12046. The summarizing means 12043 includes a word extracting means 120431, a word appearance count calculating means 120432 for each search target, a total word appearance count calculating means 120433, a ratio calculating means 120434, and a word list creating means 120435. The information storage device 13 includes an original information storage unit 1301 and an original information transmission unit 1302.

ユーザ入力受付部1101は、ユーザから2以上の検索対象を特定する情報である検索情報を受け付ける。検索対象は、例えば、レストランや、英会話学校や、旅行先などである。検索情報とは、ユーザが欲しい情報を特定するための情報であり、いわゆる検索キーである。検索情報は、例えば、検索地点に関する情報である検索地点情報(渋谷駅などの駅名や、住所や、電話番号で特定される地域など)と、検索対象のグループを特定する情報である対象グループ情報(ラーメン[ラーメン屋という検索対象のグループを特定する情報]や、イタリヤレストランや、中華料理[中華料理屋という検索対象のグループを特定する情報]など)を有する。また、検索情報は、例えば、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範囲情報(徒歩5分以内、1km以内など)を含んでも良い。さらに、検索情報は、その他の検索キーを含んでも良い。また、ユーザ入力受付部1101は、出力されている要約情報に対する指示である要約情報選択指示をも受け付ける。要約情報は、対象情報を要約した情報である。対象情報の要約方法は種々ある。対象情報の要約方法の例については、後述する。また、ユーザ入力受付部1101は、リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付ける。リンクシンボル情報とは、対象情報が記載された元情報の所在を示す情報であるリンク情報に対応する情報である。リンクシンボル情報の具体例は、後述する。さらに、ユーザ入力受付部1101は、ユーザからの種々の指示や入力も受け付ける。検索情報等の入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。ユーザ入力受付部1101は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。   The user input receiving unit 1101 receives search information that is information for specifying two or more search targets from the user. The search target is, for example, a restaurant, an English conversation school, a travel destination, or the like. The search information is information for specifying information desired by the user, and is a so-called search key. The search information includes, for example, search point information (information such as a station name such as Shibuya Station, an address, or a region specified by a telephone number), and target group information that is information for specifying a search target group. (Ramen [information for specifying a group to be searched for ramen shop], Italian restaurant, Chinese food [information for specifying a group to be searched for Chinese restaurant] and the like). The search information may further include, for example, search range information (for example, within 5 minutes on foot, within 1 km) that is information for specifying a search range from the search point indicated by the search point information. Further, the search information may include other search keys. The user input receiving unit 1101 also receives a summary information selection instruction that is an instruction for the output summary information. The summary information is information that summarizes the target information. There are various methods for summarizing target information. An example of the target information summarization method will be described later. Further, the user input receiving unit 1101 also receives a link symbol selection instruction that is an instruction for link symbol information. The link symbol information is information corresponding to link information that is information indicating the location of the original information in which the target information is described. A specific example of link symbol information will be described later. Further, the user input receiving unit 1101 receives various instructions and inputs from the user. The search information input means may be anything such as a numeric keypad, keyboard, mouse or menu screen. The user input receiving unit 1101 can be realized by a device driver of an input unit such as a numeric keypad or a keyboard, menu screen control software, or the like.

要求送信部1102は、ユーザ入力受付部1101が受け付けた検索情報に基づいて、当該検索情報を有する要求情報を、情報処理装置12に送信する。要求情報は、検索情報に対応する検索対象の対象情報を取得する要求を示す情報である。要求情報のデータ構造は問わない。要求情報は、通常、情報処理装置12を特定する情報を含む。情報処理装置12を特定する情報とは、例えば、情報処理装置12の中の、対象情報が有するフォルダを示すURLやURI、または情報処理装置12のIPアドレス等である。要求送信部1102は、通常、無線または有線の通信手段を含むが、通信手段の変わりに放送手段でも良い。   Based on the search information received by the user input reception unit 1101, the request transmission unit 1102 transmits request information having the search information to the information processing apparatus 12. The request information is information indicating a request for acquiring target information to be searched corresponding to the search information. The data structure of request information does not matter. The request information usually includes information for specifying the information processing apparatus 12. The information specifying the information processing apparatus 12 is, for example, a URL or URI indicating a folder included in the target information in the information processing apparatus 12, an IP address of the information processing apparatus 12, or the like. The request transmission unit 1102 normally includes a wireless or wired communication unit, but may be a broadcast unit instead of the communication unit.

情報受信部1103は、要求送信部1102における要求情報の送信に基づいて、対象情報や元情報等の情報を情報処理装置12から受信する。情報受信部1103は、通常、無線または有線の通信手段で実現されるが、放送受信手段でも実現され得る。   The information reception unit 1103 receives information such as target information and original information from the information processing device 12 based on the transmission of request information in the request transmission unit 1102. The information receiving unit 1103 is normally realized by a wireless or wired communication unit, but can also be realized by a broadcast receiving unit.

情報出力部1104は、情報受信部1103が受信した対象情報や元情報等の情報を出力する。ここでの出力とは、ディスプレイへの表示、プリンタへの印字、音出力が主であるが、外部の装置への送信等を含む概念である。情報出力部1104は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。情報出力部1104は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。なお、情報端末11におけるユーザ入力受付部1101、要求送信部1102、情報受信部1103、情報出力部1104などの処理は、例えば、いわゆるWEBブラウザの処理で実現可能である。   The information output unit 1104 outputs information such as target information and original information received by the information receiving unit 1103. The output here is a concept that mainly includes display on a display, printing on a printer, sound output, and transmission to an external device. The information output unit 1104 may or may not include an output device such as a display or a speaker. The information output unit 1104 can be realized by output device driver software, or output device driver software and an output device. Note that the processing of the user input reception unit 1101, the request transmission unit 1102, the information reception unit 1103, the information output unit 1104, and the like in the information terminal 11 can be realized by, for example, a so-called WEB browser process.

受付部1201は、2以上の検索対象を特定する情報である検索情報や、その他の情報の取得指示を受け付ける。なお、検索情報は要求情報に含まれる。また、その他の情報の取得指示は、例えば、URLを含む情報である。かかるその他の情報の取得指示を受け付けた場合は、当該URLで特定される情報(例えば、ホームページ)が情報端末11に返送される。受付部1201は、通常、要求情報を受信する。ここでの受け付けとは、通常、情報端末11からの受信を言う。ただし、一般的には、ユーザが手入力した情報の受け付けや、記録媒体からの読み出しなども含んでも良い。受付部1201は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。また、受付部1201は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等でも実現され得る。   The accepting unit 1201 accepts search information that is information for specifying two or more search targets and an instruction to acquire other information. The search information is included in the request information. The other information acquisition instruction is information including a URL, for example. When receiving an instruction to acquire such other information, information (for example, a homepage) specified by the URL is returned to the information terminal 11. The receiving unit 1201 normally receives request information. The reception here usually means reception from the information terminal 11. However, in general, it may include reception of information manually input by the user and reading from a recording medium. The accepting unit 1201 is usually realized by a wireless or wired communication means, but may be realized by a means for receiving a broadcast. The receiving unit 1201 can also be realized by a device driver for input means such as a numeric keypad and a keyboard, control software for a menu screen, and the like.

対象情報取得部1202は、受付部1201が受け付けた検索情報により特定される2以上の検索対象に関する情報である対象情報を取得する。対象情報を取得する先は、2以上の情報格納装置13でも良いし、情報処理装置12の元情報格納部1207でも良い。対象情報取得部1202は、通常、MPUやメモリ等から実現され得る。対象情報取得部1202の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、対象情報を外部装置から受信する場合は、対象情報取得部1202は、無線または有線の通信手段等も含む構成で実現され得る。   The target information acquisition unit 1202 acquires target information that is information on two or more search targets specified by the search information received by the reception unit 1201. The destination from which the target information is acquired may be two or more information storage devices 13 or the original information storage unit 1207 of the information processing device 12. The target information acquisition unit 1202 can usually be realized by an MPU, a memory, or the like. The processing procedure of the target information acquisition unit 1202 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit). When the target information is received from an external device, the target information acquisition unit 1202 can be realized with a configuration including wireless or wired communication means.

元情報取得部1203は、受付部1201が要約対象情報選択指示を受け付けた場合、当該要約対象情報選択指示に対応する要約対象情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する。また、元情報取得部1203は、受付部1201がリンクシンボル選択指示を受け付けた場合に、当該リンクシンボル選択指示に対応するリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する。リンク情報は、例えば、元情報の所在を示すURLやURI等である。かかる場合、元情報取得部1203は、例えば、URLやURI等に対応するホームページを取得する。元情報取得部1203は、通常、MPUやメモリ等から実現され得る。元情報取得部1203の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、元情報を外部装置から受信する場合は、元情報取得部1203は、無線または有線の通信手段等も含む構成で実現され得る。   When the receiving unit 1201 receives a summary target information selection instruction, the source information acquisition unit 1203 is based on link information of the source information in which target information that is the basis of the summary target information corresponding to the summary target information selection instruction is described. To obtain the original information. In addition, when the reception unit 1201 receives a link symbol selection instruction, the original information acquisition unit 1203 is based on link information corresponding to link symbol information corresponding to the link symbol selection instruction, and target information indicated by the link information The original information which is information in which is described is acquired. The link information is, for example, a URL or URI indicating the location of the original information. In such a case, the original information acquisition unit 1203 acquires a home page corresponding to, for example, a URL or a URI. The original information acquisition unit 1203 can usually be realized by an MPU, a memory, or the like. The processing procedure of the original information acquisition unit 1203 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit). When the original information is received from an external device, the original information acquisition unit 1203 can be realized with a configuration including wireless or wired communication means.

出力部1204は、2以上の検索対象の対象情報を出力する。また、出力部1204は、2以上の検索対象の対象情報を要約した情報である2以上の要約対象情報を出力しても良い。また、出力部1204は、下記に説明するように、2以上の検索対象の対象情報または/および要約対象情報を、ランキングして出力しても良い。さらに、出力部1204は、元情報取得部1203が取得した元情報をも出力しても良い。出力部1204は、リンク情報に対応する情報であるリンクシンボル情報をも出力しても良い。出力とは、ここでは、通常、情報端末11への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力等を含む概念である。出力部1204は、通常、送信する情報を構成するソフトウェア、および無線または有線の通信手段で実現されるが、通信手段の変わりに放送手段でも良い。また、出力部1204は、出力部は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。出力部1204は、出力デバイスを含むと考えても含まないと考えても良い。   The output unit 1204 outputs target information for two or more search targets. The output unit 1204 may output two or more pieces of summary target information that is information obtained by summarizing two or more pieces of search target information. The output unit 1204 may rank and output two or more search target information or / and summary target information, as will be described below. Furthermore, the output unit 1204 may also output the original information acquired by the original information acquisition unit 1203. The output unit 1204 may also output link symbol information that is information corresponding to the link information. Here, the output is normally a transmission to the information terminal 11, but is a concept including display on a display, printing on a printer, sound output, and the like. The output unit 1204 is usually realized by software constituting information to be transmitted and wireless or wired communication means, but may be broadcast means instead of the communication means. The output unit 1204 can be realized by output device driver software, or output device driver software and an output device. The output unit 1204 may or may not include an output device.

元情報受信部1205は、情報格納装置13から元情報を受信する。元情報は、対象情報を含む情報である。元情報は、例えば、HTMLやコンパクトHTML(以下、適宜「C−HTML」という。)やXML等の階層化されたタグが付された情報である。元情報は、例えば、いわゆるホームページである。元情報受信部1205が元情報を受信するタイミングやトリガーは問わない。ここでは、例えば、元情報受信部1205は、所定に時刻になると、自動的に多数の情報格納装置13から、元情報を取得する。元情報受信部1205は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。   The original information receiving unit 1205 receives the original information from the information storage device 13. The original information is information including target information. The original information is information to which hierarchical tags such as HTML, compact HTML (hereinafter referred to as “C-HTML” as appropriate) and XML are attached, for example. The original information is, for example, a so-called home page. There is no limitation on the timing or trigger at which the original information receiving unit 1205 receives the original information. Here, for example, the original information receiving unit 1205 automatically acquires the original information from a large number of information storage devices 13 at a predetermined time. The original information receiving unit 1205 is usually realized by a wireless or wired communication means, but may be realized by a means for receiving a broadcast.

元情報蓄積部1206は、元情報受信部1205が受信した元情報を元情報格納部1207に蓄積する。元情報蓄積部1206は、通常、MPUやメモリ等から実現され得る。元情報蓄積部1206の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
元情報格納部1207は、元情報を格納している。元情報格納部1207は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
The original information accumulation unit 1206 accumulates the original information received by the original information reception unit 1205 in the original information storage unit 1207. The original information storage unit 1206 can be usually realized by an MPU, a memory, or the like. The processing procedure of the original information storage unit 1206 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
The original information storage unit 1207 stores original information. The original information storage unit 1207 is preferably a nonvolatile recording medium, but can also be realized by a volatile recording medium.

被検索対象情報群格納手段12021は、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している。なお、被検索対象情報は、郵便番号を示す情報である郵便番号情報を有しても良い。被検索対象情報群は、例えば、いわゆるイエローページの情報である。被検索対象情報群格納手段12021は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。   The search target information group storage unit 12021 includes search target name information that is information indicating a search target name, telephone number information that is information indicating a search target telephone number, and an address that is information indicating a search target address. A search target information group having one or more search target information having information is stored. Note that the search target information may include zip code information that is information indicating a zip code. The search target information group is, for example, so-called yellow page information. The search target information group storage unit 12021 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium.

被検索対象情報取得手段12022は、検索情報に基づいて、被検索対象情報群格納手段12021から被検索対象情報の一部または全部を取得する。被検索対象情報取得手段12022は、例えば、検索情報が有する業種の情報(例えば、「英会話学校」や「ラーメン屋」など)を有する被検索対象情報の一部または全部を取得する。被検索対象情報取得手段12022は、通常、MPUやメモリ等から実現され得る。被検索対象情報取得手段12022の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   Search target information acquisition means 12022 acquires part or all of the search target information from search target information group storage means 12021 based on the search information. The search target information acquisition unit 12022 acquires, for example, part or all of the search target information including information on the type of business that the search information has (for example, “English conversation school”, “Ramen shop”, etc.). The search target information acquisition unit 12022 can usually be realized by an MPU, a memory, or the like. The processing procedure of the search target information acquisition unit 12022 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

対象情報取得手段12023は、被検索対象情報取得手段12022が取得した被検索対象情報の一部または全部に基づいて、検索情報により特定される2以上の検索対象に関する情報である対象情報を取得する。対象情報取得手段12023は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得する。対象情報取得手段12023は、例えば、被検索対象情報取得手段12022が取得した電話番号情報と住所情報と郵便番号情報のうちの2以上の情報を含む、所定の塊の情報を取得する。所定の塊の情報とは、一段落の情報であっても、一ページの情報であっても、所定のタグ(例えば、「<tr>」)が付された情報であっても良い。対象情報取得手段12023は、通常、MPUやメモリ等から実現され得る。対象情報取得手段12023の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The target information acquisition unit 12023 acquires target information that is information on two or more search targets specified by the search information, based on part or all of the search target information acquired by the search target information acquisition unit 12022. . When acquiring a plurality of pieces of target information from one source information, the target information acquisition unit 12023 searches for one source information, and location information that is one or more of telephone number information, address information, and zip code A hierarchy level that has a predetermined relationship with the hierarchy level including is determined, and information on the determined hierarchy level is acquired. The target information acquisition unit 12023 acquires, for example, information on a predetermined block including two or more pieces of information of telephone number information, address information, and zip code information acquired by the search target information acquisition unit 12022. The predetermined lump information may be one paragraph of information, one page of information, or information with a predetermined tag (for example, “<tr>”). The target information acquisition unit 12023 can be usually realized by an MPU, a memory, or the like. The processing procedure of the target information acquisition unit 12023 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

ランキング決定手段12041は、2以上の検索対象の対象情報に基づいて、2以上の検索対象を順位付けする。ランキング決定手段12041は、例えば、全対象情報の文字数に基づいて2以上の検索対象を順位付けしても良いし、全対象情報の数(記載されている記事数)に基づいて2以上の検索対象を順位付けしても良い。ランキング決定手段12041は、2以上の検索対象の対象情報に電話番号情報が含まれるか否か、または対象情報が記載されている元情報のページランキングに基づいてランキングを決定しても良い。元情報(たとえば、WEBページ)のページランキングは、例えば、予め保持している、とする。WEBページのページランキングを決定する方法には、公知の種々の方法がある。公知の種々の方法とは、他のホームページにリンクされている数の多さによりランキングする方法等である。かかる公知の方法により、WEBページのページランキングを決定しても良い。その他、2以上の検索対象を順位付けするアルゴリズムは問わない。ランキング決定手段12041は、通常、MPUやメモリ等から実現され得る。ランキング決定手段12041の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The ranking determining unit 12041 ranks two or more search targets based on the target information of two or more search targets. For example, the ranking determination unit 12041 may rank two or more search targets based on the number of characters of all target information, or search two or more based on the number of all target information (number of articles described). You may rank the target. The ranking determination unit 12041 may determine the ranking based on whether or not the telephone number information is included in the target information of two or more search targets, or based on the page ranking of the original information in which the target information is described. The page ranking of the original information (for example, WEB page) is assumed to be held in advance, for example. There are various known methods for determining the page ranking of a WEB page. The known various methods include a ranking method based on the number of links to other home pages. The page ranking of the WEB page may be determined by such a known method. In addition, the algorithm for ranking two or more search objects is not limited. The ranking determining unit 12041 can usually be realized by an MPU, a memory, or the like. The processing procedure of the ranking determination unit 12041 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

対象情報出力手段12042は、ランキング決定手段12041の順位付けに基づいて、2以上の検索対象の対象情報を出力する。対象情報出力手段12042は、通常、上位にランキングされている検索対象に関する情報(対象情報や要約情報や検索対象の名称など)からユーザに提示されるように情報を構成し、出力する。出力とは、ここでは、通常、情報端末11への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力等を含む概念である。   The target information output unit 12042 outputs target information of two or more search targets based on the ranking of the ranking determination unit 12041. The target information output means 12042 normally configures and outputs information so that it is presented to the user from information related to the search target ranked higher (target information, summary information, search target name, etc.). Here, the output is normally a transmission to the information terminal 11, but is a concept including display on a display, printing on a printer, sound output, and the like.

要約手段12043は、2以上の対象情報を要約し、2以上の要約情報を取得する。要約の仕方は問わない。要約手段12043は、例えば、対象情報の先頭50文字を取得して、かかる文字列を要約情報とする。要約手段12043は、通常、MPUやメモリ等から実現され得る。要約手段12043の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The summarizing means 12043 summarizes two or more pieces of target information and acquires two or more pieces of summary information. It doesn't matter how to summarize. For example, the summarizing unit 12043 acquires the first 50 characters of the target information and uses the character string as summary information. The summarizing means 12043 can be usually realized by an MPU, a memory or the like. The processing procedure of the summarizing means 12043 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

要約情報出力手段12044は、要約手段12043が取得した2以上の要約情報を出力する。出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信等を含む概念である。ここでは、通常、出力とは、情報端末11への送信である。要約情報出力手段12044は、例えば、無線または有線の通信手段で実現される。   The summary information output unit 12044 outputs two or more pieces of summary information acquired by the summary unit 12043. Output is a concept that includes display on a display, printing on a printer, sound output, transmission to an external device, and the like. Here, normally, the output is transmission to the information terminal 11. The summary information output unit 12044 is realized by, for example, a wireless or wired communication unit.

元情報出力手段12045は、元情報取得部1203が取得した元情報を出力する。出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信等を含む概念である。ここでは、通常、出力とは、情報端末11への送信である。元情報出力手段12045は、例えば、無線または有線の通信手段で実現される。   The original information output unit 12045 outputs the original information acquired by the original information acquisition unit 1203. Output is a concept that includes display on a display, printing on a printer, sound output, transmission to an external device, and the like. Here, normally, the output is transmission to the information terminal 11. The original information output unit 12045 is realized by, for example, a wireless or wired communication unit.

リンクシンボル出力手段12046は、リンク情報に対応する情報であるリンクシンボル情報を出力する。リンクシンボル情報とは、例えば、レストラン等の評価情報のリンク元であることを示す文字列である「評価1」「評価2」や、レストラン等の評価情報のリンク元であることを示すイメージ(アイコン)等である。出力の概念は、上述したとおりである。リンクシンボル出力手段12046は、例えば、無線または有線の通信手段で実現される。   Link symbol output means 12046 outputs link symbol information which is information corresponding to link information. The link symbol information is, for example, an image (“Evaluation 1”, “Evaluation 2”, which is a character string indicating a link source of evaluation information such as a restaurant, or an image ( Icon). The concept of output is as described above. The link symbol output unit 12046 is realized by, for example, a wireless or wired communication unit.

単語抽出手段120431は、対象情報から単語を抽出する。単語を抽出するアルゴリズムは種々ある。例えば、単語抽出手段120431は、辞書を保持しており、かかる辞書に登録している単語を抽出する。また、単語抽出手段120431は、名詞を抽出しても良い。かかる技術は、公知の言語処理技術であるので、詳細な説明は省略する。単語抽出手段120431は、通常、MPUやメモリ等から実現され得る。単語抽出手段120431の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The word extraction unit 120431 extracts words from the target information. There are various algorithms for extracting words. For example, the word extraction unit 120431 holds a dictionary and extracts words registered in the dictionary. Moreover, the word extraction means 120431 may extract a noun. Since this technique is a known language processing technique, a detailed description thereof will be omitted. The word extraction unit 120431 can be usually realized by an MPU, a memory, or the like. The processing procedure of the word extraction means 120431 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

検索対象毎単語出現回数算出手段120432は、単語抽出手段120431が抽出した各単語における、検索対象毎の出現回数を算出する。検索対象毎単語出現回数算出手段120432は、通常、MPUやメモリ等から実現され得る。検索対象毎単語出現回数算出手段120432の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The word appearance count calculation unit 120432 for each search target calculates the number of appearances for each search target in each word extracted by the word extraction unit 120431. The word appearance count calculation means 120432 for each search target can be usually realized by an MPU, a memory, or the like. The processing procedure of the word appearance count calculating means 120432 for each search target is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

単語全出現回数算出手段120433は、単語抽出手段120431が抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する。単語全出現回数算出手段120433は、通常、MPUやメモリ等から実現され得る。単語全出現回数算出手段120433の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The total word appearance count calculating unit 120433 calculates the number of appearances in all target information of all search targets for each word extracted by the word extracting unit 120431. The word total appearance count calculating unit 120433 can be usually realized by an MPU, a memory, or the like. The processing procedure of the total word appearance count calculating unit 120433 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

割合算出手段120434は、検索対象毎単語出現回数算出手段120432が算出した検索対象毎の出現回数と単語全出現回数算出手段120433が算出した全対象情報中の出現回数との割合を算出する。割合算出手段120434は、通常、MPUやメモリ等から実現され得る。割合算出手段120434の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The ratio calculation unit 120434 calculates the ratio between the number of appearances for each search target calculated by the word appearance count calculation unit 120432 for each search target and the number of appearances in all target information calculated by the total word appearance count calculation unit 120433. The ratio calculating unit 120434 can be realized usually by an MPU, a memory, or the like. The processing procedure of the ratio calculating means 120434 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

単語リスト作成手段120435は、割合算出手段120434が算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する。単語リスト作成手段120435は、通常、MPUやメモリ等から実現され得る。単語リスト作成手段120435の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The word list creation unit 120435 creates a word list for each search target by arranging words having a high percentage calculated by the percentage calculation unit 120434. The word list creation means 120435 can usually be realized by an MPU, a memory, or the like. The processing procedure of the word list creation means 120435 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

なお、出力部1204が保持している各出力手段は、通常、物理的に一の手段で実現されている。また、出力部1204は、通常、要約情報やリンクシンボル情報などの出力対象の情報から一のファイル(例えば、HTMLで記述されたファイル)を構成し、当該ファイルを情報端末11に送信する。また、出力部1204が、対象情報、要約情報、元情報、リンクシンボル情報のうちの1以上の情報を出力する場合は、出力部1204は、例えば、かかる情報を合成して、一のファイルを構成する処理を行う。さらに具体的には、出力部1204は、2以上の検索対象(例えば、2以上のレストラン)の対象情報、要約情報、元情報、リンクシンボル情報のうちの1以上の情報からなるWEBページを構成し、出力する。   Note that each output means held by the output unit 1204 is usually realized by a single physical means. The output unit 1204 normally configures one file (for example, a file described in HTML) from information to be output such as summary information and link symbol information, and transmits the file to the information terminal 11. Further, when the output unit 1204 outputs one or more pieces of information among target information, summary information, original information, and link symbol information, the output unit 1204 synthesizes such information to create one file, for example. Perform configuration processing. More specifically, the output unit 1204 constitutes a WEB page that includes one or more information of target information, summary information, source information, and link symbol information of two or more search targets (for example, two or more restaurants). And output.

元情報格納部1301は、1以上の元情報を格納している。元情報は、検索対象の対象情報を有する。元情報は、例えば、HTMLやC−HTMLやXML等で記述されたいわゆるページである。元情報格納部1301は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。   The original information storage unit 1301 stores one or more pieces of original information. The original information includes target information to be searched. The original information is, for example, a so-called page described in HTML, C-HTML, XML, or the like. The original information storage unit 1301 is preferably a nonvolatile recording medium, but can also be realized by a volatile recording medium.

元情報送信部1302は、元情報格納部1301の元情報を送信する。元情報送信部1302が元情報を送信するトリガーやタイミングは問わない。元情報送信部1302は、例えば、情報処理装置12の要求により元情報を送信する。元情報送信部1302は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
以下、本情報処理システムの動作について説明する。まず、情報端末11の動作について図3のフローチャートを用いて説明する。
(ステップS301)ユーザ入力受付部1101は、ユーザからの入力を受け付けた否かを判断する。入力を受け付ければステップS302に行き、入力を受け付けなければステップS301に戻る。
The original information transmission unit 1302 transmits the original information of the original information storage unit 1301. The trigger and timing at which the original information transmission unit 1302 transmits the original information does not matter. For example, the original information transmission unit 1302 transmits original information in response to a request from the information processing apparatus 12. The original information transmission unit 1302 is usually realized by a wireless or wired communication unit, but may be realized by a broadcasting unit.
Hereinafter, the operation of the information processing system will be described. First, the operation of the information terminal 11 will be described using the flowchart of FIG.
(Step S301) The user input receiving unit 1101 determines whether or not an input from a user has been received. If an input is accepted, the process goes to step S302, and if no input is accepted, the process returns to step S301.

(ステップS302)ユーザ入力受付部1101は、ステップS301で受け付けた入力が検索情報であるか否かを判断する。検索情報であればステップS303に行き、検索情報でなければステップS307に飛ぶ。
(ステップS303)要求送信部1102は、ステップS301で受け付けた検索情報に基づいて、要求情報を構成する。要求情報とは、検索対象の対象情報の取得を要求する情報である。
(ステップS304)要求送信部1102は、ステップS303、ステップS308またはステップS310で構成した情報を送信する。
(ステップS305)情報受信部1103は、対象情報等の情報を情報処理装置12から受信したか否かを判断する。情報を受信すればステップS306に行き、情報を受信しなければステップS305に戻る。
(Step S302) The user input receiving unit 1101 determines whether or not the input received in step S301 is search information. If it is search information, it will go to step S303, and if it is not search information, it will jump to step S307.
(Step S303) The request transmission unit 1102 configures request information based on the search information received in step S301. The request information is information for requesting acquisition of target information to be searched.
(Step S304) The request transmission unit 1102 transmits the information configured in step S303, step S308, or step S310.
(Step S305) The information receiving unit 1103 determines whether information such as target information has been received from the information processing apparatus 12. If information is received, it will go to step S306, and if information is not received, it will return to step S305.

(ステップS306)情報出力部1104は、ステップS305で受信した情報を出力する。なお、かかる情報出力部1104は、例えば、情報受信部1103が受信したHTMLで記述されたファイルを解釈し、ページを構成して、当該ページをディスプレイに表示する。ステップS301に戻る。   (Step S306) The information output unit 1104 outputs the information received in step S305. The information output unit 1104 interprets a file described in HTML received by the information receiving unit 1103, configures a page, and displays the page on the display. The process returns to step S301.

(ステップS307)ユーザ入力受付部1101は、ステップS301で受け付けた入力が要約情報選択指示であるか否かを判断する。要約情報選択指示であればステップS308に行き、要約情報選択指示でなければステップS309に飛ぶ。   (Step S307) The user input receiving unit 1101 determines whether or not the input received in step S301 is a summary information selection instruction. If it is a summary information selection instruction, the process proceeds to step S308, and if it is not a summary information selection instruction, the process jumps to step S309.

(ステップS308)要求送信部1102は、要約情報選択指示を含む情報取得の要求を構成する。なお、構成する情報は、要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報を含む。リンク情報は、例えば、元情報の所在を示すURLやURIである。テップS304に行く。   (Step S308) The request transmission unit 1102 constitutes an information acquisition request including a summary information selection instruction. The constituent information includes link information of original information in which target information that is the basis of summary information corresponding to the summary information selection instruction is described. The link information is, for example, a URL or URI indicating the location of the original information. Go to step S304.

(ステップS309)ユーザ入力受付部1101は、ステップS301で受け付けた入力がリンクシンボル選択指示であるか否かを判断する。リンクシンボル選択指示であればステップS310に行き、リンクシンボル選択指示でなければステップS311に飛ぶ。   (Step S309) The user input receiving unit 1101 determines whether or not the input received in step S301 is a link symbol selection instruction. If it is a link symbol selection instruction, the process proceeds to step S310, and if it is not a link symbol selection instruction, the process jumps to step S311.

(ステップS310)要求送信部1102は、リンクシンボル選択指示を含む情報取得の要求を構成する。なお、構成する情報は、リンクシンボル選択指示に対応する元情報のリンク情報を含む。リンク情報は、例えば、元情報の所在を示すURLやURIである。ステップS304に行く。
(ステップS311)受け付けた入力に応じた処理を行う。かかる処理は種々ある。かかる処理は、例えば、いわゆるWEBブラウザが行う処理である。ステップS301に戻る。
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、情報処理装置12の動作について図4のフローチャートを用いて説明する。
(ステップS401)受付部1201は、情報を受け付けたか否かを判断する。情報を受け付ければステップS402に行き、情報を受け付けなければステップS401に戻る。
(Step S310) The request transmission unit 1102 constitutes an information acquisition request including a link symbol selection instruction. The constituent information includes link information of original information corresponding to the link symbol selection instruction. The link information is, for example, a URL or URI indicating the location of the original information. Go to step S304.
(Step S311) Processing according to the accepted input is performed. There are various such processes. Such processing is, for example, processing performed by a so-called WEB browser. The process returns to step S301.
In the flowchart of FIG. 3, the process ends when the power is turned off or the process is terminated.
Next, the operation of the information processing apparatus 12 will be described using the flowchart of FIG.
(Step S401) The reception unit 1201 determines whether information has been received. If the information is accepted, the process goes to step S402. If the information is not accepted, the process returns to step S401.

(ステップS402)受付部1201は、ステップS401で受け付けた情報が検索情報を含むか否かを判断する。検索情報を含む場合はステップS403に行き、検索情報を含まない場合はステップS406に飛ぶ。検索情報を含む場合とは、ここでは、上述した要求情報を受け付けた場合である。   (Step S402) The receiving unit 1201 determines whether or not the information received in step S401 includes search information. When the search information is included, the process goes to step S403, and when the search information is not included, the process jumps to step S406. The case where the search information is included is a case where the above-described request information is received.

(ステップS403)対象情報取得部1202は、ステップS401で受け付けた検索情報により特定される2以上の検索対象に関する情報である対象情報を取得する。かかる対象情報取得処理の詳細は、図5のフローチャートを用いて説明する。
(ステップS404)出力部1204は、情報端末11に送信する情報を構成する。かかる送信情報構成処理の詳細は、図6のフローチャートを用いて説明する。
(ステップS405)出力部1204は、ステップS404で構成した情報を出力する。ここでの出力は、情報端末11への送信である。ステップS401に戻る。
(Step S403) The target information acquisition unit 1202 acquires target information that is information on two or more search targets specified by the search information received in step S401. Details of the target information acquisition processing will be described with reference to the flowchart of FIG.
(Step S404) The output unit 1204 configures information to be transmitted to the information terminal 11. Details of the transmission information configuration process will be described with reference to the flowchart of FIG.
(Step S405) The output unit 1204 outputs the information configured in step S404. The output here is transmission to the information terminal 11. The process returns to step S401.

(ステップS406)受付部1201は、ステップS401で受け付けた情報が要約情報選択指示であるか否かを判断する。要約情報選択指示であればステップS407に行き、要約情報選択指示でなければステップS408に飛ぶ。
(ステップS407)元情報取得部1203は、要約対象情報選択指示に対応する要約対象情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する。ステップS405に行く。
(Step S406) The reception unit 1201 determines whether the information received in step S401 is a summary information selection instruction. If it is a summary information selection instruction, the process proceeds to step S407, and if it is not a summary information selection instruction, the process jumps to step S408.
(Step S407) The original information acquisition unit 1203 acquires the original information based on the link information of the original information in which the target information that is the source of the summary target information corresponding to the summary target information selection instruction is described. Go to step S405.

(ステップS408)受付部1201は、ステップS401で受け付けた情報がシンボル情報選択指示であるか否かを判断する。シンボル情報選択指示であればステップS408に行き、シンボル情報選択指示でなければステップS401に戻る。
(ステップS409)元情報取得部1203は、指示されたリンクシンボル情報に対するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する。ステップS405に行く。
なお、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、情報処理装置12の対象情報取得処理の動作について図5のフローチャートを用いて説明する。
(ステップS501)被検索対象情報取得手段12022は、カウンタiに1を代入する。
(Step S408) The reception unit 1201 determines whether the information received in step S401 is a symbol information selection instruction. If it is a symbol information selection instruction, the process proceeds to step S408, and if it is not a symbol information selection instruction, the process returns to step S401.
(Step S409) The original information acquisition unit 1203 acquires original information, which is information in which target information indicated by the link information is described, based on link information for the specified link symbol information. Go to step S405.
In the flowchart of FIG. 4, the process ends when the power is turned off or the process ends.
Next, the operation of the target information acquisition process of the information processing apparatus 12 will be described using the flowchart of FIG.
(Step S501) The search target information acquisition unit 12022 substitutes 1 for a counter i.

(ステップS502)被検索対象情報取得手段12022は、i番目の被検索対象情報が存在するか否かを判断する。i番目の被検索対象情報が存在すればステップS503に行き、i番目の被検索対象情報が存在しなければステップS506に飛ぶ。   (Step S502) The search target information acquisition unit 12022 determines whether or not the i-th search target information exists. If the i-th search target information exists, the process goes to step S503, and if the i-th search target information does not exist, the process jumps to step S506.

(ステップS503)被検索対象情報取得手段12022は、i番目の被検索対象情報が、検索情報の要件を満たすか否か判断する。検索情報の要件を満たせばステップS504に行き、検索情報の要件を満たさなければステップS505に飛ぶ。なお、i番目の被検索対象情報が、検索情報の要件を満たすか否かの判断方法は種々ある。例えば、i番目の被検索対象情報が、すべての検索情報を構成する情報を有する場合に、検索情報の要件を満たすかと判断しても良い。また、例えば、i番目の被検索対象情報が、検索情報を構成する情報の中の所定数の情報を有する場合に、検索情報の要件を満たすかと判断しても良い。さらに、後述するように、i番目の被検索対象情報の位置、業種の情報等に基づいて、検索情報(たとえば、「JR山手線新宿から約徒歩10分のラーメン屋」など)に合致するか否かを判断しても良い。   (Step S503) The search target information acquisition unit 12022 determines whether or not the i-th search target information satisfies the search information requirement. If the requirement for search information is satisfied, the process proceeds to step S504, and if the requirement for search information is not satisfied, the process jumps to step S505. There are various methods for determining whether or not the i-th search target information satisfies the requirements for the search information. For example, when the i-th search target information includes information constituting all search information, it may be determined whether the search information requirement is satisfied. Further, for example, when the i-th search target information includes a predetermined number of pieces of information constituting the search information, it may be determined whether the search information requirement is satisfied. Furthermore, as will be described later, based on the position of the i-th information to be searched, information on the type of business, etc., whether the search information (for example, “Ramen restaurant about a 10-minute walk from JR Yamanote Line Shinjuku”, etc.) It may be determined whether or not.

(ステップS504)被検索対象情報取得手段12022は、検索情報の要件を満たした被検索対象情報の一部または全部を取得する。かかる被検索対象情報の一部または全部は、検索キーである。被検索対象情報取得手段12022は、検索キーを一時格納する。
(ステップS505)被検索対象情報取得手段12022は、カウンタiを1、インクリメントする。ステップS502に戻る。
(ステップS506)被検索対象情報取得手段12022は、カウンタiに1を代入する。
(Step S504) The search target information acquisition unit 12022 acquires part or all of the search target information that satisfies the requirements of the search information. Part or all of the search target information is a search key. The search target information acquisition unit 12022 temporarily stores a search key.
(Step S505) The search target information acquisition unit 12022 increments the counter i by one. The process returns to step S502.
(Step S506) The search target information acquisition unit 12022 substitutes 1 for the counter i.

(ステップS507)対象情報取得手段12023は、i番目の検索キーが存在するか否かを判断する。i番目の検索キーが存在すればステップS508に行き、i番目の検索キーが存在しなければ上位関数にリターンする。
(ステップS508)対象情報取得手段12023は、カウンタjに1を代入する。
(Step S507) The target information acquisition unit 12023 determines whether or not the i-th search key exists. If the i-th search key exists, the process goes to step S508, and if the i-th search key does not exist, the process returns to the upper function.
(Step S508) The target information acquisition unit 12023 substitutes 1 for the counter j.

(ステップS509)対象情報取得手段12023は、元情報格納部1207に、j番目の元情報が存在するか否かを判断する。j番目の元情報が存在すればステップS510に行き、j番目の元情報が存在しなければステップS517に飛ぶ。   (Step S509) The target information acquisition unit 12023 determines whether or not the j-th original information exists in the original information storage unit 1207. If the j-th original information exists, the process proceeds to step S510, and if the j-th original information does not exist, the process jumps to step S517.

(ステップS510)対象情報取得手段12023は、i番目の検索キーに対応する検索対象タグが存在するか否かを判断する。検索対象タグが存在すればステップS511に行き、検索対象タグが存在しなければステップS518に飛ぶ。なお、すべての検索キーに対応する検索対象タグの初期値は、NULL(検索対象タグが存在しない)である。
(ステップS511)対象情報取得手段12023は、カウンタkに1を代入する。
(Step S510) The target information acquisition unit 12023 determines whether a search target tag corresponding to the i-th search key exists. If the search target tag exists, the process goes to step S511, and if the search target tag does not exist, the process jumps to step S518. Note that the initial value of the search target tag corresponding to all search keys is NULL (no search target tag exists).
(Step S511) The target information acquisition unit 12023 substitutes 1 for the counter k.

(ステップS512)対象情報取得手段12023は、j番目の元情報の中に、k番目の検索対象タグが存在するか否かを判断する。k番目の検索対象タグが存在すればステップS513に行き、k番目の検索対象タグが存在しなければステップS516に飛ぶ。
(ステップS513)対象情報取得手段12023は、かかる検索対象タグに対応する情報を取得する。かかる情報は、対象情報の候補となる。
(Step S512) The target information acquisition unit 12023 determines whether or not the kth search target tag exists in the jth original information. If the kth search target tag exists, the process goes to step S513, and if the kth search target tag does not exist, the process jumps to step S516.
(Step S513) The target information acquisition unit 12023 acquires information corresponding to the search target tag. Such information is a candidate for target information.

(ステップS514)対象情報取得手段12023は、ステップS513で取得した情報が、検索キーで示される条件に合致するか否かを判断する。条件に合致すればステップS515に行き、条件に合致しなければステップS521に飛ぶ。なお、検索キーで示される条件に合致するか否かは、種々のアルゴリズムにより決定され得る。例えば、ステップS513で取得した情報が、検索キーが有する2以上の情報(例えば、店舗名、住所情報、電話番号情報、郵便番号情報)のうち、1以上を含む場合に条件に合致する、と判断しても良い。また、例えば、ステップS513で取得した情報が、検索キーが有する店舗名を含み、住所情報の一部を含む場合に条件に合致する、と判断しても良い。
(ステップS515)対象情報取得手段12023は、ステップS513で取得した情報を一時格納する。かかる情報は、対象情報である。対象情報は、検索キーまたは被検索対象情報と対に格納される。
(ステップS516)対象情報取得手段12023は、カウンタjを1、インクリメントする。ステップS509に戻る。
(ステップS517)対象情報取得手段12023は、カウンタiを1、インクリメントする。ステップS507に戻る。
(Step S514) The target information acquisition unit 12023 determines whether or not the information acquired in Step S513 matches the condition indicated by the search key. If the condition is met, the process proceeds to step S515, and if the condition is not met, the process jumps to step S521. Whether or not the condition indicated by the search key is met can be determined by various algorithms. For example, if the information acquired in step S513 includes one or more of two or more pieces of information (for example, store name, address information, telephone number information, and zip code information) that the search key has, the condition is met. You may judge. Further, for example, when the information acquired in step S513 includes the store name included in the search key and includes a part of the address information, it may be determined that the condition is met.
(Step S515) The target information acquisition unit 12023 temporarily stores the information acquired in Step S513. Such information is target information. The target information is stored in a pair with the search key or the search target information.
(Step S516) The target information acquisition unit 12023 increments the counter j by 1. The process returns to step S509.
(Step S517) The target information acquisition unit 12023 increments the counter i by 1. The process returns to step S507.

(ステップS518)対象情報取得手段12023は、j番目の元情報が、検索キーで示される条件に合致する箇所があるか否かを判断する。つまり、例えば、検索キーが「店舗名」「電話番号情報」「住所情報」を有する場合、「店舗名」「電話番号情報」「住所情報」のうち、2以上の情報を含む場合に、当該箇所が条件に合致する箇所であるとする。その他、j番目の元情報が、検索キーで示される条件に合致する箇所が存在するか否かを判断するアルゴリズムは、種々のアルゴリズムが考えられる。
(ステップS519)対象情報取得手段12023は、検索キーで示される条件に合致する箇所に対応するタグを取得する。
(Step S518) The target information acquisition unit 12023 determines whether or not there is a portion where the j-th original information matches the condition indicated by the search key. That is, for example, when the search key includes “store name”, “phone number information”, and “address information”, when two or more pieces of information are included among “store name”, “phone number information”, and “address information”, It is assumed that the location matches the condition. In addition, various algorithms can be considered as an algorithm for determining whether or not there is a place where the j-th original information matches the condition indicated by the search key.
(Step S519) The target information acquisition unit 12023 acquires a tag corresponding to a location that matches the condition indicated by the search key.

(ステップS520)対象情報取得手段12023は、j番目の元情報に対応する検索タグとして、ステップS519で取得したタグを登録する。ここで、登録とは、メモリや所定のバッファに書き込むことを言う。ステップS515に行く。
(ステップS521)対象情報取得手段12023は、カウンタkを1、インクリメントする。ステップS512に戻る。
(Step S520) The target information acquisition unit 12023 registers the tag acquired in Step S519 as a search tag corresponding to the jth original information. Here, registration means writing to a memory or a predetermined buffer. Go to step S515.
(Step S521) The target information acquisition unit 12023 increments the counter k by 1. The process returns to step S512.

なお、本フローチャートにおいて、対象情報取得手段12023は、元情報のタグ構造を利用して、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する処理を行った。しかし、本フローチャートにおける処理は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する処理の一例である。例えば、まず、対象情報取得手段12023は、元情報のタグ構造木を構成し、その構造木の中に、2以上の場所情報(住所情報や電話番号情報や郵便番号情報など)を含むタグを検索タグとして登録しても良い。そして、検索時は、登録された検索タグに対応する情報のみを対象として、検索キーで示される条件に合致するか否かを判断しても良い。なお、上記で、2以上の場所情報を含むタグを検索タグとして登録するとしたが、1以上の場所情報を含むタグを検索タグとして登録しても良いし、3以上の場所情報を含むタグを検索タグとして登録しても良い。その他、対象情報取得手段12023は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する処理を行えば良く、その処理手順等は問わないことは言うまでもない。
次に、情報処理装置12の送信情報構成処理の動作について図6のフローチャートを用いて説明する。
In this flowchart, the target information acquisition unit 12023 performs processing for acquiring information of the same hierarchical level when acquiring a plurality of target information from one source information using the tag structure of the source information. It was. However, the processing in this flowchart is an example of processing for acquiring information at the same hierarchical level when a plurality of pieces of target information are acquired from one original information. For example, first, the target information acquisition unit 12023 forms a tag structure tree of original information, and includes tags including two or more pieces of location information (address information, telephone number information, postal code information, etc.) in the structure tree. You may register as a search tag. Then, at the time of searching, only information corresponding to the registered search tag may be targeted and it may be determined whether or not the condition indicated by the search key is met. In the above description, a tag including two or more place information is registered as a search tag. However, a tag including one or more place information may be registered as a search tag, or a tag including three or more place information may be registered. You may register as a search tag. In addition, when acquiring a plurality of pieces of target information from one source information, the target information acquisition unit 12023 may perform a process of acquiring information of the same hierarchical level, and it goes without saying that the processing procedure is not limited. .
Next, the operation of the transmission information configuration process of the information processing apparatus 12 will be described using the flowchart of FIG.

(ステップS601)ランキング決定手段12041は、2以上の検索対象の対象情報に基づいて、2以上の検索対象を順位付けする。かかる順位付けの処理であるランキング処理の詳細については、図7のフローチャートを用いて説明する。
(ステップS602)対象情報出力手段12042は、カウンタiに1を代入する。
(ステップS603)対象情報出力手段12042は、i番目の対象情報の見出しを構成する。見出しの構成方法は種々ある。具体的な見出しの構成方法は後述する。
(ステップS604)対象情報出力手段12042は、カウンタjに1を代入する。
(Step S601) The ranking determination unit 12041 ranks two or more search targets based on the target information of two or more search targets. The details of the ranking process, which is the ranking process, will be described with reference to the flowchart of FIG.
(Step S602) The target information output unit 12042 substitutes 1 for the counter i.
(Step S603) The target information output means 12042 constitutes the heading of the i-th target information. There are various methods for constructing headings. A specific method for configuring the headings will be described later.
(Step S604) The target information output means 12042 substitutes 1 for the counter j.

(ステップS605)リンクシンボル出力手段12046は、j番目のリンクシンボル情報を構成する。リンクシンボル情報の構成の際に、元情報の所在を示すリンク情報を使用する。リンクシンボル情報が押下された場合に、元情報取得部1203が、リンク情報を用いて元情報にアクセスするためである。
(ステップS606)要約手段12043は、要約情報を取得する。要約情報を取得する処理である要約情報取得処理の詳細については、図8のフローチャートを用いて説明する。
(Step S605) The link symbol output means 12046 constitutes the j-th link symbol information. When configuring the link symbol information, link information indicating the location of the original information is used. This is because when the link symbol information is pressed, the original information acquisition unit 1203 accesses the original information using the link information.
(Step S606) The summary unit 12043 acquires summary information. Details of the summary information acquisition process, which is a process of acquiring summary information, will be described with reference to the flowchart of FIG.

(ステップS607)対象情報出力手段12042は、1以上の要約情報を用いて要約部を構成する。なお、要約部は、出力する情報を構成する情報である。要約部の構成には、要約部の要約情報と、当該要約情報が構成された元となる元情報のリンク情報も使用される。要約情報が押下された場合に、元情報取得部1203が、リンク情報を用いて元情報にアクセスするためである。
(ステップS608)カウンタjを1、インクリメントする。
(Step S <b> 607) The target information output unit 12042 forms a summary unit using one or more pieces of summary information. The summary unit is information that constitutes information to be output. For the configuration of the summary unit, summary information of the summary unit and link information of the original information from which the summary information is configured are also used. This is because when the summary information is pressed, the original information acquisition unit 1203 accesses the original information using the link information.
(Step S608) The counter j is incremented by one.

(ステップS609)対象情報出力手段12042は、i番目の検索対象の全てのリンクシンボル情報、要約情報の処理が完了したか否か(jがラストか否か)を判断する。かかる判断は、先に抽出した要約情報の処理が完了したことにより行っても良いし、予め決められた所定数の要約情報の処理が完了したことにより行っても良い。jがラストであればステップS610に行き、jがラストでなければステップS605に戻る。
(ステップS610)対象情報出力手段12042は、カウンタiを1、インクリメントする。
(Step S609) The target information output means 12042 determines whether or not the processing of all link symbol information and summary information of the i-th search target has been completed (whether j is the last). Such a determination may be made when the processing of the summary information extracted earlier is completed, or may be performed when the processing of a predetermined number of summary information is completed. If j is the last, the process goes to step S610, and if j is not the last, the process returns to step S605.
(Step S610) The target information output means 12042 increments the counter i by 1.

(ステップS611)対象情報出力手段12042は、i番目の検索対象が存在するか否かを判断する。i番目の検索対象が存在すればステップS612に行き、i番目の検索対象が存在しなければステップS603に飛ぶ。   (Step S611) The target information output unit 12042 determines whether or not the i-th search target exists. If the i-th search target exists, the process proceeds to step S612. If the i-th search target does not exist, the process jumps to step S603.

(ステップS612)対象情報出力手段12042は、出力する情報を構成する。かかる処理は、例えば、HTMLファイルの「</HTML>」等のタグをファイルの最終行に記録することである。つまり、送信する情報を構成するための後処理である。上位関数にリターンする。
次に、情報処理装置12のランキング処理の動作について図7のフローチャートを用いて説明する。
(ステップS701)ランキング決定手段12041は、カウンタiに1を代入する。
(Step S612) The target information output unit 12042 constitutes information to be output. Such processing is, for example, recording a tag such as “</ HTML>” of the HTML file in the last line of the file. That is, it is post-processing for configuring information to be transmitted. Return to upper function.
Next, the ranking processing operation of the information processing apparatus 12 will be described with reference to the flowchart of FIG.
(Step S701) The ranking determining unit 12041 substitutes 1 for the counter i.

(ステップS702)ランキング決定手段12041は、i番目の検索対象が存在するか否かを判断する。i番目の検索対象が存在すればステップS703に行き、i番目の検索対象が存在しなければステップS713に飛ぶ。
(ステップS703)ランキング決定手段12041は、i番目の検索対象のポイント情報に0を代入する。ポイント情報とは、ランキングを決定するために利用する情報である。
(ステップS704)ランキング決定手段12041は、カウンタjに1を代入する。
(Step S702) The ranking determining unit 12041 determines whether or not the i-th search target exists. If the i-th search target exists, the process proceeds to step S703, and if the i-th search target does not exist, the process jumps to step S713.
(Step S703) The ranking determination unit 12041 substitutes 0 for the i-th search target point information. Point information is information used to determine ranking.
(Step S704) The ranking determining unit 12041 substitutes 1 for the counter j.

(ステップS705)ランキング決定手段12041は、i番目の検索対象における、j番目の対象情報が存在するか否かを判断する。j番目の対象情報が存在すればステップS706に行き、j番目の対象情報が存在しなければステップS714に飛ぶ。
(ステップS706)ランキング決定手段12041は、j番目の対象情報のデータ量を取得する。データ量とは、文字数でも、バイト数(データ長)でも、単語数でも、文章数等でも良い。
(Step S705) The ranking determining unit 12041 determines whether or not the j-th target information exists in the i-th search target. If the j-th target information exists, the process proceeds to step S706, and if the j-th target information does not exist, the process jumps to step S714.
(Step S706) The ranking determining unit 12041 acquires the data amount of the j-th target information. The data amount may be the number of characters, the number of bytes (data length), the number of words, the number of sentences, or the like.

(ステップS707)ランキング決定手段12041は、j番目の対象情報の元情報のページランクを取得する。情報処理装置12は、例えば、元情報に対応して、当該元情報のページランクを予め保持している、とする。   (Step S707) The ranking determining unit 12041 acquires the page rank of the original information of the jth target information. For example, it is assumed that the information processing apparatus 12 holds the page rank of the original information in advance corresponding to the original information.

(ステップS708)ランキング決定手段12041は、j番目の対象情報の中に、i番目の検索対象の電話番号情報が含まれるか否かを判断する。電話番号情報が含まれればステップS709に行き、電話番号情報が含まれなければステップS715に飛ぶ。
(ステップS709)ランキング決定手段12041は、電話番号フラグにONを代入する。電話番号フラグとは、i番目の検索対象の電話番号情報が含まれるか否かを示すフラグである。
(Step S708) The ranking determining unit 12041 determines whether or not the i-th search target telephone number information is included in the j-th target information. If the telephone number information is included, the process goes to step S709, and if the telephone number information is not included, the process jumps to step S715.
(Step S709) The ranking determining unit 12041 substitutes ON for the telephone number flag. The telephone number flag is a flag indicating whether or not the i-th search target telephone number information is included.

(ステップS710)ランキング決定手段12041は、ステップS706で取得したデータ量、ステップS707で取得した元情報のページランク、電話番号フラグの中の1以上の情報に基づいてポイントを算出する。具体的なポイント算出のアルゴリズムの例は、後述する。
(ステップS711)ランキング決定手段12041は、ステップS710で算出したポイントを、i番目の検索対象のポイント情報に加算する。
(ステップS712)ランキング決定手段12041は、カウンタjを1、インクリメントする。ステップS705に行く。
(ステップS713)ランキング決定手段12041は、ポイント情報をキーにして、検索対象をソートする。上位関数にリターンする。
(ステップS714)ランキング決定手段12041は、カウンタiを1、インクリメントする。ステップS702に行く。
(ステップS715)ランキング決定手段12041は、電話番号フラグにOFFを代入する。ステップS710に行く。
(Step S710) The ranking determination unit 12041 calculates points based on the data amount acquired in Step S706, the page rank of the original information acquired in Step S707, and one or more information in the telephone number flag. An example of a specific point calculation algorithm will be described later.
(Step S711) The ranking determining unit 12041 adds the point calculated in Step S710 to the point information of the i-th search target.
(Step S712) The ranking determining unit 12041 increments the counter j by 1. Go to step S705.
(Step S713) The ranking determination unit 12041 sorts the search targets using the point information as a key. Return to upper function.
(Step S714) The ranking determining unit 12041 increments the counter i by 1. Go to step S702.
(Step S715) The ranking determining unit 12041 substitutes OFF for the telephone number flag. Go to step S710.

図7のフローチャートにおいて、ランキング決定手段12041は、2以上の検索対象の対象情報の文字数、および当該対象情報に電話番号情報が含まれるか否か、および対象情報が記載されている元情報のページランキングに基づいて2以上の検索対象を順位付けした。しかし、ランキング決定手段12041は、2以上の検索対象の対象情報の文字数、電話番号情報が含まれるか否か、ページランキングのうちの1以上の情報に基づいて、2以上の検索対象を順位付けしても良い。さらに、ランキング決定手段12041は、2以上の検索対象の記事の数など、他の情報に基づいて、2以上の検索対象を順位付けしても良い。
次に、情報処理装置12の要約情報取得処理の動作について図8のフローチャートを用いて説明する。
(ステップS801)要約手段12043は、カウンタiに1を代入する。
(ステップS802)要約手段12043は、i番目の検索対象が存在するか否かを判断する。i番目の検索対象が存在すればステップS803に行き、i番目の検索対象が存在しなければ上位関数にリターンする。
(ステップS803)単語抽出手段120431は、カウンタj、kに1を代入する。
(ステップS804)単語抽出手段120431は、j番目の対象情報からk番目の単語を抽出する。
(ステップS805)検索対象毎単語出現回数算出手段120432は、i番目の検索対象の全対象情報中における、ステップS804で抽出された単語の出現回数(第一出現回数)を算出する。
(ステップS806)単語全出現回数算出手段120433は、全部の検索対象の全対象情報中における、ステップS804で抽出された単語の出現回数(第二出現回数)を算出する。
(ステップS807)割合算出手段120434は、第一出現回数の第二出現回数に対する割合を算出する。
(ステップS808)単語リスト作成手段120435は、ステップS804で抽出された単語と、ステップS807で算出された割合の情報を対にして登録(一時蓄積)する。
(ステップS809)単語抽出手段120431は、カウンタkを1、インクリメントする。
In the flowchart of FIG. 7, the ranking determination unit 12041 displays the number of characters of target information to be searched for two or more, whether the target information includes telephone number information, and the original information page on which the target information is described. Two or more search objects were ranked based on the ranking. However, the ranking determination unit 12041 ranks two or more search targets based on the number of characters of the target information of two or more search targets and whether or not the telephone number information is included, and one or more pieces of information in the page ranking. You may do it. Furthermore, the ranking determining unit 12041 may rank two or more search targets based on other information such as the number of articles to be searched for two or more.
Next, the summary information acquisition processing operation of the information processing apparatus 12 will be described with reference to the flowchart of FIG.
(Step S801) The summarizing means 12043 substitutes 1 for the counter i.
(Step S802) The summarizing means 12043 determines whether or not the i-th search target exists. If the i-th search target exists, the process goes to step S803, and if the i-th search target does not exist, the process returns to the upper function.
(Step S803) The word extraction unit 120431 assigns 1 to the counters j and k.
(Step S804) The word extraction unit 120431 extracts the kth word from the jth target information.
(Step S805) The word appearance count calculation unit 120432 for each search target calculates the number of appearances (first appearance count) of the word extracted in step S804 in all target information of the i th search target.
(Step S806) The word total appearance count calculating unit 120433 calculates the number of appearances (second appearance count) of the word extracted in step S804 in all target information of all search targets.
(Step S807) The ratio calculation means 120434 calculates the ratio of the first appearance count to the second appearance count.
(Step S808) The word list creation unit 120435 registers (temporarily accumulates) the word extracted in Step S804 and the ratio information calculated in Step S807 as a pair.
(Step S809) The word extraction means 120431 increments the counter k by 1.

(ステップS810)単語抽出手段120431は、j番目の対象情報からk番目の単語が存在するか否かを判断する。このk番目の単語とは、今まで未処理であった単語である。k番目の単語が存在すればステップS804に行き、k番目の単語が存在しなければステップS811に行く。
(ステップS811)カウンタjを1、インクリメントする。
(Step S810) The word extraction means 120431 determines whether or not the kth word exists from the jth target information. The kth word is a word that has not been processed so far. If the kth word exists, the process goes to step S804, and if the kth word does not exist, the process goes to step S811.
(Step S811) The counter j is incremented by one.

(ステップS812)単語リスト作成手段120435は、i番目の検索対象のj番目の対象情報が存在するか否かを判断する。j番目の対象情報が存在すればステップS804に行き、j番目の対象情報が存在しなければステップS813に行く。
(ステップS813)単語リスト作成手段120435は、割合の情報に基づいて、単語をソートする。かかるソートにより上位にくる単語が、検索対象特有の単語であると、例えば、考える。
(ステップS814)要約手段12043は、カウンタmに1を代入する。
(Step S812) The word list creation means 120435 determines whether or not the j-th target information of the i-th search target exists. If the j-th target information exists, the process proceeds to step S804. If the j-th target information does not exist, the process proceeds to step S813.
(Step S813) The word list creation means 120435 sorts the words based on the ratio information. For example, it is considered that the word at the top of the sort is a word unique to the search target.
(Step S814) The summarizing means 12043 substitutes 1 for the counter m.

(ステップS815)要約手段12043は、i番目の検索対象の要約情報が所定のサイズより大きいか否かを判断する。なお、各検索対象の要約情報の初期値はNULLである。所定のサイズより大きければステップS818に行き、所定のサイズ以下であればステップS816に行く。
(ステップS816)要約手段12043は、m番目の単語が入っている文章を、i番目の検索対象の全対象情報から取得し、要約情報として追記する。
(ステップS817)要約手段12043は、カウンタmを、1インクリメントする。
(ステップS818)要約手段12043は、要約情報を所定のサイズ以内になるようにカットする。カットとは、所定のサイズより先の情報を消去する処理である。
(ステップS819)要約手段12043は、カウンタiを、1インクリメントする。ステップS802に行く。
(Step S815) The summarizing means 12043 determines whether or not the i-th search target summary information is larger than a predetermined size. Note that the initial value of the summary information for each search target is NULL. If it is larger than the predetermined size, go to step S818, and if it is smaller than the predetermined size, go to step S816.
(Step S816) The summarizing means 12043 acquires the sentence containing the mth word from all the target information of the i th search target and adds it as summary information.
(Step S817) The summarizing means 12043 increments the counter m by 1.
(Step S818) The summary unit 12043 cuts the summary information so that it is within a predetermined size. Cut is a process of erasing information beyond a predetermined size.
(Step S819) The summarizing means 12043 increments the counter i by one. Go to step S802.

なお、図8のフローチャートにおいて、検索対象の特徴となる単語に着目して要約情報を取得する一アルゴリズムを示した。しかし、要約手段12043は、対象情報から単語を抽出する単語抽出手段と、単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、出現回数に基づいて、対象情報から各検索対象の要約情報を取得する要約取得手段を具備すれば良い。つまり、必ずしも、第一出現回数の第二出現回数に対する割合に基づいて単語リストを構成する必要はない。
別のアルゴリズムとして、例えば、以下のようなアルゴリズムもある。「i番目の検索対象の全対象情報に含まれる文の集合」から1文ずつ取り出し、その文に含まれる特徴単語の得点と割合でスコアリングしていく。たとえば「特製餃子がお勧め」という文に対し、「特製」が特徴単語5位(4.6ポイント)、「餃子」が特徴単語3位(5.0ポイント)だとすると、この文のスコアは9.6/単語数となる。一方、「このお店のお勧めは特製の黒豚を使用した餃子です」という文にも「特製」と「餃子」が含まれていますが、単語数が多いので前の例より低いスコアとなる。しかし、もし「黒豚」が特徴単語1位で十分にポイントが高いような場合には、こちらの文が優先的に選択されることになる。なお、特徴単語とは検索対象特有の単語であり、そのポイントとは、当該単語の検索対象の特有度合いを示す情報である。以上のように、出現回数は、上記のポイントの概念、その他の単語の出現度合いの概念を含む概念である。つまり、要約取得手段は、出現回数に基づいて、対象情報から各検索対象の要約情報を取得するような構成である。
以下、本実施の形態における情報処理システムの具体的な動作について説明する。情報処理システムの概念図は図1である。
In the flowchart of FIG. 8, an algorithm for acquiring summary information by focusing on a word that is a characteristic of a search target is shown. However, the summarizing means 12043 includes a word extracting means for extracting words from the target information, a word appearance count calculating means for each search target for calculating the number of appearances for each search target in each word extracted by the word extracting means, and an appearance count. Based on the above, it is only necessary to have summary acquisition means for acquiring the summary information of each search target from the target information. That is, it is not always necessary to construct the word list based on the ratio of the first appearance number to the second appearance number.
Another algorithm is, for example, the following algorithm. One sentence is taken out from “a set of sentences included in all target information of the i-th search target”, and scored according to the score and ratio of feature words included in the sentence. For example, if the phrase “special gyoza is recommended” is “special” is 5th in the feature word (4.6 points) and “gyoza” is 3rd in the feature word (5.0 points), the score for this sentence is 9 .6 / word count. On the other hand, the statement “Recommended for this shop is gyoza using special black pork” also contains “special” and “gyoza”, but it has a lower score than the previous example because there are many words. Become. However, if “black pig” is the first feature word and the points are high enough, this sentence will be preferentially selected. The feature word is a word specific to the search target, and the point is information indicating the degree of peculiarity of the search target of the word. As described above, the number of appearances is a concept including the concept of the above points and the concept of the appearance degree of other words. That is, the summary acquisition means is configured to acquire summary information of each search target from the target information based on the number of appearances.
Hereinafter, a specific operation of the information processing system in the present embodiment will be described. A conceptual diagram of the information processing system is shown in FIG.

情報端末11は、WEBブラウザが搭載された、例えば、パーソナルコンピュータである。情報端末11は、例えば、ラーメン屋等の対象情報を出力する端末である。情報処理装置12は、例えば、いわゆるサーチエンジンを搭載したサーバ装置である。情報格納装置13は、例えば、ラーメン屋のホームページを格納しているサーバ装置である。ホームページは、例えば、HTMLで記述されている。   The information terminal 11 is, for example, a personal computer equipped with a WEB browser. The information terminal 11 is a terminal that outputs target information such as a ramen shop, for example. The information processing device 12 is, for example, a server device equipped with a so-called search engine. The information storage device 13 is, for example, a server device that stores a ramen shop homepage. The home page is described in, for example, HTML.

図9は、情報処理装置12が、多数の情報格納装置13から受信したホームページの例を示す。かかるホームページは、上述した元情報に該当する。元情報受信部1205は、情報格納装置13からホームページを受信し、元情報蓄積部1206は、元情報受信部1205が受信した当該ホームページを元情報格納部1207に蓄積する。元情報格納部1207は、多数のホームページを格納している。   FIG. 9 shows an example of a home page received by the information processing apparatus 12 from a large number of information storage apparatuses 13. Such a home page corresponds to the original information described above. The original information reception unit 1205 receives a home page from the information storage device 13, and the original information storage unit 1206 stores the home page received by the original information reception unit 1205 in the original information storage unit 1207. The original information storage unit 1207 stores a large number of home pages.

図10は、被検索対象情報群格納手段12021が格納している被検索対象情報群である。被検索対象情報群は、「検索対象名称情報」「郵便番号情報」「住所情報」「電話番号情報」を有する。「検索対象名称情報」は、例えば、店舗名である。被検索対象情報群は、例えば、いわゆるイエローページである。   FIG. 10 shows a search target information group stored in the search target information group storage unit 12021. The search target information group includes “search target name information”, “postal code information”, “address information”, and “telephone number information”. “Search target name information” is, for example, a store name. The search target information group is, for example, a so-called yellow page.

図11は、情報ポータル管理表である。情報ポータル管理表は、信頼性の高い情報ポータルのHPのURLを管理している。かかる情報ポータル管理表に管理されているURLで識別されるホームページは、ページランクが高いホームページである。一方、情報ポータル管理表で管理されていないホームページは、ページランクが低いホームページである。なお、ページランクの情報は、ランキング決定手段12041が利用する。   FIG. 11 is an information portal management table. The information portal management table manages HP URLs of highly reliable information portals. The homepage identified by the URL managed in the information portal management table is a homepage with a high page rank. On the other hand, a homepage not managed by the information portal management table is a homepage with a low page rank. Note that the page rank information is used by the ranking determination unit 12041.

今、ユーザは、情報端末11から情報処理装置12のホームページのURLを入力し、当該ホームページにアクセスしたとする。そして、情報端末11は、レストランの検索を行うためのホームページを受信し、表示した、とする。次に、ユーザは、検索したいレストラン(ここでは、ラーメン屋)の情報を得るためにホームページのフィールドに検索情報を入力する(図12参照)。検索情報は、ここでは、「検索地点」を示す情報、「範囲」を示す情報、「キーワード」を有する。そして、ユーザは、検索情報を入力後、「検索」ボタンを押下する、とする。図12において、ユーザは、JR山手線新宿から約徒歩10分以内の場所にあるラーメン屋を検索することとなる。   Now, assume that the user inputs the URL of the home page of the information processing apparatus 12 from the information terminal 11 and accesses the home page. The information terminal 11 receives and displays a home page for searching for a restaurant. Next, the user inputs search information in a field on the homepage in order to obtain information on a restaurant (in this case, a ramen shop) to be searched (see FIG. 12). Here, the search information includes information indicating “search point”, information indicating “range”, and “keyword”. Then, it is assumed that the user presses the “Search” button after inputting the search information. In FIG. 12, the user searches for a ramen shop located within a 10-minute walk from JR Yamanote Line Shinjuku.

次に、情報端末11の要求送信部1102は、検索地点「JR山手線新宿」、範囲「約徒歩10分」、キーワード「ラーメン」を有する要求情報(図13参照)を構成し、当該要求情報を情報処理装置12に送信する。なお、図13の要求情報の「1」は検索をすることを指示する検索フラグである。また、要求情報の名称の「−」は名称が検索キーではないことを示す。   Next, the request transmission unit 1102 of the information terminal 11 configures request information (see FIG. 13) having the search point “JR Yamanote Line Shinjuku”, the range “about 10 minutes on foot”, and the keyword “ramen”. Is transmitted to the information processing apparatus 12. Note that “1” in the request information in FIG. 13 is a search flag for instructing a search. Further, “-” in the name of the request information indicates that the name is not a search key.

次に、情報処理装置12の受付部1201は、情報端末11から要求情報を受信する。要求情報は、2以上の検索対象を特定する情報である検索情報を有する。次に、被検索対象情報取得手段12022は、受信した検索情報(検索地点「JR山手線新宿」、範囲「約徒歩10分」、キーワード「ラーメン」)に基づいて、被検索対象情報群格納手段12021から被検索対象情報の一部または全部を取得する。具体的には、被検索対象情報取得手段12022は、JR山手線新宿から約徒歩10分の距離を算出する。かかる場合、例えば、被検索対象情報取得手段12022は、徒歩1分を80mとして算出し、JR山手線新宿から800m以内のラーメン店を、図10の被検索対象情報群から算出する。被検索対象情報取得手段12022は、例えば、JR山手線新宿等の多数の検索地点の住所を保持しており、かつ、住所を緯度経度に変換するための地図情報を保持している。そして、被検索対象情報取得手段12022は、JR山手線新宿の住所からJR山手線新宿の位置情報(緯度と経度)を取得する。次に、被検索対象情報取得手段12022は、図10の被検索対象情報群の住所情報から位置情報(緯度と経度)を取得する。そして、被検索対象情報取得手段12022は、JR山手線新宿の位置情報と検索対象の店舗の位置情報から距離を算出し、800m以内であるかどうか判断する。そして、被検索対象情報取得手段12022は、800m以内の店舗のレコードを図10の被検索対象情報群から取得する。次に、被検索対象情報取得手段12022は、当該取得したレコードの中から、「検索対象名称情報」の中に「ラーメン」の文字列を含むレコードを取得する。そして、かかるレコードの一部または全部が被検索対象情報である。なお、被検索対象情報の検索フローは問わない。つまり、被検索対象情報取得手段12022は、先にラーメン屋に該当するレコードを絞り込み、その後800m以内のラーメン屋の被検索対象情報を取得しても良い。また、ラーメン屋のレコードであるか否かの判断は、「検索対象名称情報」の中に「ラーメン」の文字列を含むか否かにより行なわれたが、図10の被検索対象情報は、業種の情報(ラーメン屋、イタリヤ料理屋、お寿司屋など)を保持しており、当該業種の情報に基づいて、ラーメン屋のレコードであるか否かが判断されても良い。そして、被検索対象情報取得手段12022は、図14の被検索対象情報中間表を得る。被検索対象情報中間表は、検索対象を示すレコードの集合である。   Next, the reception unit 1201 of the information processing apparatus 12 receives request information from the information terminal 11. The request information includes search information that is information for specifying two or more search targets. Next, the search target information acquisition unit 12022 is based on the received search information (search point “JR Yamanote Line Shinjuku”, range “about 10 minutes walk”, keyword “ramen”), search target information group storage unit Part or all of the search target information is acquired from 12021. Specifically, the search target information acquisition unit 12022 calculates a distance of about a 10-minute walk from Shinjuku JR Yamanote Line. In this case, for example, the search target information acquisition unit 12022 calculates a 1-minute walk as 80 m, and calculates a ramen shop within 800 m from the JR Yamanote Line Shinjuku from the search target information group in FIG. The search target information acquisition unit 12022 holds addresses of a number of search points such as JR Yamanote Line Shinjuku, and holds map information for converting the addresses into latitude and longitude. Then, the search target information acquisition unit 12022 acquires location information (latitude and longitude) of the JR Yamanote Line Shinjuku from the address of the JR Yamanote Line Shinjuku. Next, the search target information acquisition unit 12022 acquires position information (latitude and longitude) from the address information of the search target information group in FIG. Then, the search target information acquisition unit 12022 calculates the distance from the location information of the JR Yamanote Line Shinjuku and the location information of the store to be searched, and determines whether it is within 800 m. And the to-be-searched object information acquisition means 12022 acquires the record of the store within 800 m from the to-be-searched object information group of FIG. Next, the search target information acquisition unit 12022 acquires a record including the character string “ramen” in “search target name information” from the acquired records. A part or all of the record is the search target information. In addition, the search flow of search target information is not ask | required. That is, the search target information acquisition unit 12022 may first narrow down records corresponding to ramen shops and then acquire search target information of ramen shops within 800 m. Further, whether or not the record is a ramen shop record is determined by whether or not the character string “ramen” is included in the “search target name information”, but the search target information in FIG. Information on the type of business (ramen restaurant, Italian restaurant, sushi restaurant, etc.) may be held, and based on the information on the type of business, it may be determined whether the record is a ramen restaurant. Then, the search target information acquisition unit 12022 obtains the search target information intermediate table of FIG. The search target information intermediate table is a set of records indicating search targets.

次に、対象情報取得手段12023は、被検索対象情報取得手段12022が取得した図14の被検索対象情報中間表に基づいて、元情報格納部1207を検索し、対象情報を取得する。対象情報とは、図14の被検索対象情報中間表の各レコードにより特定される店舗に関する情報である。つまり、対象情報取得手段12023は、まず、被検索対象情報中間表の第1レコードの「くまもと○○ラーメン」に関して記載された情報を、元情報格納部1207の全ホームページから検索する。かかる検索は、以下のアルゴリズムで行なう。   Next, the target information acquisition unit 12023 searches the original information storage unit 1207 based on the search target information intermediate table in FIG. 14 acquired by the search target information acquisition unit 12022, and acquires target information. The target information is information related to the store specified by each record in the searched target information intermediate table in FIG. That is, the target information acquisition unit 12023 first searches the entire homepage of the original information storage unit 1207 for information described regarding “Kumamoto XX ramen” in the first record of the searched target information intermediate table. Such a search is performed by the following algorithm.

つまり、ホームページは、ここでは、HTML、XML等のタグにより階層化されたデータにより記述されている。例えば、ホームページは、HTMLで記述されている、とする。そして、対象情報取得手段12023は、ホームページからHTML構造木を構成する。HTML構造木は、例えば、図15に示すような、HTMLのタグの階層関係を示す情報である。図15において、<table>タグの下位に<tr>タグが存在し、<tr>タグの下位に<td>タグが存在することを示す。<table>タグは、表全体を指定するタグであり、<tr>タグは、表中の行(レコード)を指定するタグである。また、<td>タグは、セルを指定するタグである。かかる処理を行うのは、各店舗の情報は、HTMLタグ階層上の同じ階層に記述されていることが極めて多いからである。   That is, the home page is described here by data hierarchized by tags such as HTML and XML. For example, it is assumed that the home page is described in HTML. Then, the target information acquisition unit 12023 configures an HTML structure tree from the home page. The HTML structure tree is information indicating the hierarchical relationship of HTML tags as shown in FIG. 15, for example. FIG. 15 shows that the <tr> tag exists below the <table> tag and the <td> tag exists below the <tr> tag. The <table> tag is a tag that designates the entire table, and the <tr> tag is a tag that designates a row (record) in the table. The <td> tag is a tag for designating a cell. This process is performed because the information of each store is very often described in the same hierarchy on the HTML tag hierarchy.

次に、対象情報取得手段12023は、一のホームページ内を検索し、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む文章群を取得する。文章群は、タグに囲まれた情報であり、対象情報である。そして、対象情報取得手段12023は、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む階層のタグを取得する。ここで、対象情報取得手段12023は、<td>タグに住所情報「東京都新宿区・・・」を含むタグが存在すると検知したとする。つまり、対象情報取得手段12023は、当該一のホームページの<td>タグ内に対象情報が存在する、と判断する。なお、対象情報取得手段12023は、2以上の場所記述(住所情報等)が存在するタグを、上記の対象情報が存在するタグとして決定するアルゴリズムでも良い。そして、対象情報取得手段12023は、取得した対象情報を一時格納する。なお、対象情報を1以上の場所情報(住所情報、電話番号情報、郵便番号情報など)を含む文章群としたのは、店舗等の情報は、1以上の場所情報を含むことが多いからである。   Next, the target information acquisition means 12023 searches the one homepage, and among the address information “Shinjuku-ku, Tokyo ...” and telephone number information “03-1122-2456” of “Kumamoto XX ramen”, A sentence group including one or more pieces of information is acquired. A sentence group is information surrounded by tags and is target information. And the target information acquisition means 12023 is the tag of the hierarchy containing one or more information among address information "Shinjuku-ku, Tokyo ..." and telephone number information "03-1122-2456" of "Kumamoto XX ramen" To get. Here, it is assumed that the target information acquisition unit 12023 detects that a tag including address information “Shinjuku-ku, Tokyo ...” exists in the <td> tag. That is, the target information acquisition unit 12023 determines that the target information exists in the <td> tag of the one home page. The target information acquisition unit 12023 may be an algorithm that determines a tag having two or more place descriptions (address information, etc.) as a tag having the target information. Then, the target information acquisition unit 12023 temporarily stores the acquired target information. The reason why the target information is a text group including one or more pieces of location information (address information, telephone number information, zip code information, etc.) is because information on stores often contains one or more pieces of location information. is there.

次に、対象情報取得手段12023は、次のホームページ内を検索し、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む対象情報、および対象情報が存在する階層のタグを取得する。   Next, the target information acquisition means 12023 searches the next homepage, and among the address information “Shinjuku-ku, Tokyo ...” of the “Kumamoto OO Ramen” and the telephone number information “03-1122-2456”, Target information including one or more information, and a tag of a hierarchy in which the target information exists are acquired.

なお、対象情報取得手段12023は、ホームページ中に、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む文章群が存在しなければ、次のホームページの検索処理に移行する。   The target information acquisition means 12023 includes one or more pieces of information on address information “Shinjuku-ku, Tokyo ...” and telephone number information “03-1122-2456” of “Kumamoto XX ramen” on the homepage. If there is no sentence group to include, it moves to the search process of the next homepage.

このように、対象情報取得手段12023は、すべてのホームページから、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報(場所情報)を含む対象情報を取得する。   In this way, the target information acquisition means 12023 is one or more of “Kumamoto OO Ramen” address information “Shinjuku-ku, Tokyo ...” and telephone number information “03-1122-2456” from all websites. Target information including information (location information) is acquired.

以上の処理を、2つ目の店舗「ラーメンABC」、3つ目の店舗「ラーメンXYZ」に対しても行い、それぞれの対象情報をすべて一時格納する。なお、例えば、2つ目の店舗「ラーメンABC」の対象情報を検索する場合、1つ目の店舗情報「くまもと○○ラーメン」の対象情報検索処理の際に抽出したタグ(店舗情報が存在するであろうタグ)に対応する情報を検索し、他のタグに対応する情報は検索としないことにより、ホームページにありがちな内容とは無関係な文章(バナー広告、左右のメニューなど)を除去することができる。また、対象情報の取得速度が高速化される。3つ目の店舗「ラーメンXYZ」の対象情報を検索する場合も同様である。なお、最初に、元情報ごとに、HTML構造木を構成し、場所情報を2以上含むタグを検索対象のタグとして登録し、当該登録されたタグに対応する情報のみを対象情報の候補としても良い。   The above processing is also performed for the second store “Ramen ABC” and the third store “Ramen XYZ”, and all the target information is temporarily stored. For example, when searching for target information of the second store “Ramen ABC”, the tag (store information exists) extracted during the target information search processing of the first store information “Kumamoto OO Ramen”. Search for information that corresponds to the tag), and not search for information that corresponds to other tags, thereby removing text (banner advertisements, left and right menus, etc.) that are irrelevant to the homepage Can do. In addition, the acquisition speed of the target information is increased. The same applies when searching for the target information of the third store “Ramen XYZ”. First, for each source information, an HTML structure tree is configured, a tag including two or more location information is registered as a search target tag, and only information corresponding to the registered tag may be used as a target information candidate. good.

以上の処理により、図16に示す対象情報管理表が得られる。つまり、対象情報取得手段12023は、元情報格納部1207の全ホームページを検索し、「くまもと○○ラーメン」の対象情報である、ID「1」から「n」のnの対象情報を取得した。また、対象情報取得手段12023は、同様に、「ラーメンABC」の対象情報である、ID「n+1」から「n+m」のmの対象情報を取得した。さらに、対象情報取得手段12023は、同様に、「ラーメンXYZ」の対象情報である、ID「n+m+1」から「n+m+p」のpの対象情報を取得した。
次に、送信情報構成処理の具体的処理について説明する。
With the above processing, the target information management table shown in FIG. 16 is obtained. That is, the target information acquisition unit 12023 searches all home pages in the original information storage unit 1207, and acquires target information of IDs “1” to “n”, which are target information of “Kumamoto XX ramen”. Similarly, the target information acquisition unit 12023 acquires target information of ID “n + 1” to “n + m”, which is target information of “ramen ABC”. Furthermore, the target information acquisition unit 12023 similarly acquires target information of p of “n + m + p” from ID “n + m + 1”, which is target information of “ramen XYZ”.
Next, a specific process of the transmission information configuration process will be described.

ランキング決定手段12041は、図16の対象情報管理表のID「1」のレコードの「元情報URL」の属性値を取得し、当該属性値であるURLが図11の情報ポータル管理表に存在するか否かを判断する。例えば、図16の対象情報管理表のID「1」の元情報URL「http://www.グルメ.co.jp」は、図11の情報ポータル管理表に存在するので、ページランクを「高」とする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「1」のレコードの「対象情報」の中に電話番号情報を含むか否かを判断する。ランキング決定手段12041は、電話番号情報を含めば「1」、含まなければ「0」として、後述するランキング中間表の属性値「電話番号」をセットする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「1」のレコードの「対象情報」の文字数をカウントし、「384」を得る。そして、ランキング決定手段12041は、「ID」「検索対象名称情報」「ページランク」「電話番号」「文字数」を有するレコードを1以上有するランキング中間表を構成する。かかるランキング中間表を図17に示す。上記の処理により、図17のID「1」のレコードが構成された。   The ranking determination unit 12041 acquires the attribute value of “original information URL” of the record with ID “1” in the target information management table of FIG. 16, and the URL that is the attribute value exists in the information portal management table of FIG. Determine whether or not. For example, the original information URL “http://www.gourmet.co.jp” of ID “1” in the target information management table of FIG. 16 exists in the information portal management table of FIG. " Next, the ranking determination unit 12041 determines whether or not telephone number information is included in the “target information” of the record of ID “1” in the target information management table of FIG. The ranking determining unit 12041 sets an attribute value “telephone number” in a ranking intermediate table to be described later as “1” if the telephone number information is included and “0” otherwise. Next, the ranking determination unit 12041 counts the number of characters of “target information” in the record of ID “1” in the target information management table of FIG. 16 to obtain “384”. The ranking determining unit 12041 forms a ranking intermediate table having one or more records having “ID”, “search target name information”, “page rank”, “phone number”, and “number of characters”. Such a ranking intermediate table is shown in FIG. With the above processing, the record with ID “1” in FIG. 17 is configured.

次に、ランキング決定手段12041は、図16の対象情報管理表のID「2」のレコードの「元情報URL」の属性値を取得し、当該属性値であるURLが図11の情報ポータル管理表に存在するか否かを判断する。対象情報管理表のID「2」のレコードの元情報URL「http://abc.・・・.com」は図11の情報ポータル管理表に存在しないので、ページランクを「低」とする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「2」のレコードの「対象情報」の中に電話番号情報を含むので、電話番号「1」とする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「2」のレコードの「対象情報」の文字数をカウントし、「129」を得る。かかる処理により、図17のID「2」のレコードが構成された。ランキング決定手段12041は、図16の対象情報管理表のID「3」以降のレコードに対して以上の処理を行い、図17のランキング中間表を得る。   Next, the ranking determination unit 12041 acquires the attribute value of “original information URL” of the record of ID “2” in the target information management table of FIG. 16, and the URL that is the attribute value is the information portal management table of FIG. It is determined whether or not it exists. The original information URL “http: // abc... Com” of the record with ID “2” in the target information management table does not exist in the information portal management table of FIG. Next, the ranking determining unit 12041 sets the telephone number “1” because the telephone number information is included in the “target information” of the record of ID “2” in the target information management table of FIG. Next, the ranking determination unit 12041 counts the number of characters of “target information” in the record of ID “2” in the target information management table of FIG. 16 to obtain “129”. With this process, the record with ID “2” in FIG. 17 is configured. The ranking determining unit 12041 performs the above processing on the records after ID “3” in the target information management table of FIG. 16 to obtain the ranking intermediate table of FIG.

次に、ランキング決定手段12041は、各店舗(検索対象名称情報)ごとのポイントを図17のランキング中間表に基づいて算出する。つまり、ランキング決定手段12041は、ページランク「高」の場合は倍数を「1」とし、ページランク「低」の場合は倍数を「0.3」とし、電話番号「1」の場合は倍数を「1」とし、電話番号「0」の場合は倍数を「0.5」とする。そして、ランキング決定手段12041は、「文字数」をページランクの倍数、電話番号の倍数に掛けてポイントを算出する。そして、ランキング決定手段12041は、ポイントを四捨五入により整数にする、とする。   Next, the ranking determination means 12041 calculates points for each store (search target name information) based on the ranking intermediate table of FIG. That is, the ranking determining unit 12041 sets the multiple to “1” when the page rank is “high”, sets the multiple to “0.3” when the page rank is “low”, and sets the multiple when the page number is “1”. When the telephone number is “0”, the multiple is “0.5”. Then, the ranking determination unit 12041 calculates points by multiplying the “number of characters” by a multiple of the page rank and a multiple of the telephone number. And the ranking determination means 12041 shall make a point into an integer by rounding off.

具体的には、ランキング決定手段12041は、「くまもと○○ラーメン」のポイントを「384×1×1+129×0.3×1+・・・+291×1×1」の式により算出する。同様に、ランキング決定手段12041は、「ラーメンABC」と「ラーメンXYZ」のポイントを算出する。その結果、ランキング決定手段12041は、「くまもと○○ラーメン」のポイント「2522」、「ラーメンABC」ポイント「1529」、「ラーメンXYZ」のポイント「4211」と算出した、とする。なお、ポイント算出アルゴリズムは種々あり、他の算出式によりポイントを算出しても良いことは言うまでもない。ただし、ポイント算出において、ページランクと電話番号の有無を考慮することは好適である。ホームページの信頼性を加味した評価が可能となるからである。   Specifically, the ranking determination unit 12041 calculates the point of “Kumamoto OO Ramen” by the formula “384 × 1 × 1 + 129 × 0.3 × 1 +... + 291 × 1 × 1”. Similarly, the ranking determination unit 12041 calculates points for “ramen ABC” and “ramen XYZ”. As a result, it is assumed that the ranking determination unit 12041 calculates the point “2522” of “Kumamoto XX ramen”, the point “1529” of “ramen ABC”, and the point “4211” of “ramen XYZ”. There are various point calculation algorithms, and it goes without saying that points may be calculated using other calculation formulas. However, it is preferable to consider the page rank and presence / absence of a telephone number in the point calculation. This is because it is possible to evaluate the reliability of the website.

次に、要約情報取得処理について説明する。まず、要約手段12043は、1番目の検索対象「くまもと○○ラーメン」のすべての対象情報(図16のID「1」からID「n」までの対象情報)を読み出す。単語抽出手段120431は、すべての対象情報から単語(名詞)「塩ラーメン」等を抽出する。そして、検索対象毎単語出現回数算出手段120432は、検索対象「くまもと○○ラーメン」の全対象情報中における、単語(名詞)「塩ラーメン」の出現回数(第一出現回数)を、例えば「10」と算出する。次に、同様の処理により、他の単語の第一出現回数も算出する。   Next, summary information acquisition processing will be described. First, the summarizing means 12043 reads all target information (target information from ID “1” to ID “n” in FIG. 16) of the first search target “Kumamoto OO Ramen”. The word extraction unit 120431 extracts a word (noun) “salt ramen” or the like from all target information. Then, the word appearance count calculation means 120432 for each search target sets the number of appearances (first appearance count) of the word (noun) “salt ramen” in all target information of the search target “Kumamoto OO ramen”, for example, “10 Is calculated. Next, the number of first appearances of other words is also calculated by the same process.

次に、要約手段12043は、2番目の検索対象「ラーメンABC」のすべての対象情報(図16のID「n+1」から「n+m」までの対象情報)を読み出す。単語抽出手段120431は、すべての対象情報から単語(名詞)「特製えび入りラーメン」等を抽出する。そして、検索対象毎単語出現回数算出手段120432は、検索対象「ラーメンABC」の全対象情報中における、単語(名詞)「特製えび入りラーメン」の出現回数(第一出現回数)を、例えば「8」と算出する。次に、同様の処理により、他の単語の第一出現回数も算出する。
さらに、3番目の検索対象「ラーメンXYZ」に対しても同様の処理を行う。
Next, the summarizing means 12043 reads out all target information (target information from ID “n + 1” to “n + m” in FIG. 16) of the second search target “ramen ABC”. The word extraction unit 120431 extracts a word (noun) “special made shrimp ramen” and the like from all target information. Then, the word appearance count calculation means 120432 for each search target sets the number of appearances (first appearance count) of the word (noun) “special shrimp ramen” in all target information of the search target “ramen ABC”, for example, “8 Is calculated. Next, the number of first appearances of other words is also calculated by the same process.
Further, the same processing is performed for the third search target “ramen XYZ”.

次に、単語全出現回数算出手段120433は、「塩ラーメン」、「特製えび入りラーメン」等の単語の、全部の検索対象の全対象情報中における出現回数(第二出現回数)を算出する。そして、割合算出手段120434は、第一出現回数と第二出現回数の割合である割合の情報を算出する。さらに、単語リスト作成手段120435は、「割合」をキーにして、検索対象ごとに、単語をソートする。そして、要約手段12043は、図18の単語リスト管理表を得る。単語リスト管理表は、「検索対象名称情報」「単語」「第一出現回数」「第二出現回数」「割合」を有するレコードを1以上保持している。   Next, the total word appearance count calculating unit 120433 calculates the number of appearances (second appearance count) of all the search target information for words such as “salt ramen” and “special shrimp ramen”. Then, the ratio calculation unit 120434 calculates ratio information that is a ratio of the first appearance count and the second appearance count. Further, the word list creation unit 120435 sorts the words for each search target using the “ratio” as a key. Then, the summarizing means 12043 obtains the word list management table of FIG. The word list management table holds one or more records having “search target name information”, “word”, “first appearance count”, “second appearance count”, and “ratio”.

次に、要約手段12043は、店舗ごとに、割合の大きい単語を含む対象情報中の文章を、所定のサイズ(例えば、512byte)になるまで、図16の対象情報から文章を取得する。そして、その際、要約手段12043は、当該対象情報に対応する元情報URLも取得する。そして、要約手段12043は、図19に示す要約情報管理表を得る。要約情報管理表は、「検索対象名称情報」「要約情報」「元情報URL」を有するレコードである。「要約情報」は、対象情報から、その店舗の特徴を示す単語が高い割合で出現する文章を、所定のサイズまで抽出されたものである。
次に、対象情報出力手段12042は、上記の処理により得られた要約情報等を利用して、以下の処理により出力する情報を構成する。対象情報出力手段12042が最終的に構成する情報の例を図20に示す。
Next, the summarizing means 12043 acquires sentences from the target information of FIG. 16 until the text in the target information including words having a large ratio reaches a predetermined size (for example, 512 bytes) for each store. At that time, the summarizing means 12043 also acquires the original information URL corresponding to the target information. Then, the summarizing means 12043 obtains the summary information management table shown in FIG. The summary information management table is a record having “search target name information”, “summary information”, and “original information URL”. “Summary information” is a piece of text in which words indicating the characteristics of the store appear at a high rate from the target information to a predetermined size.
Next, the target information output unit 12042 configures information to be output by the following processing using the summary information obtained by the above processing. An example of the information finally configured by the target information output unit 12042 is shown in FIG.

つまり、対象情報出力手段12042は、ランキング1位の「ラーメンXYZ」の見出しの情報を構成する。この見出しの情報は、ランキングが1位であることを示す情報であれば何でも良い。ここでは、見出しの情報は、ランキング1位を示す数字「1」と、検索対象名称情報(店舗名)と、ポイントを切り上げした数の星(ポイント「4211」に対して星が5つ)を有する。そして、対象情報出力手段12042は、リンクシンボル情報を構成する。リンクシンボル情報は、図20において、「ラーメンXYZ」の見出し情報の直下にある「評価1」「評価2」などの情報である。そして、「評価1」等の情報はアンカーであり、1つ目の対象情報の元情報の所在を示すURLを保持している。つまり、「評価1」が押下されると1つ目の対象情報の元情報を表示することとなる。具体的には、対象情報出力手段12042は、図19の要約情報管理表のラーメンXYZの要約情報「ゴマラーメンのXYZ。」から「評価1」の文字列を構成し、元情報URL「http://www.グルメ.co.jp」をアンカーの情報として、「評価1」に付与する。文字列「評価1」の構成は、固定文字「評価」に要約情報の順番(数字)を結合して生成する。そして、図20の(1)の領域の情報の構成が完了する。   That is, the target information output means 12042 constitutes the headline information “Ramen XYZ” ranked first. The heading information may be anything as long as it is information indicating that the ranking is first. Here, the heading information includes the number “1” indicating the first ranking, the search target name information (store name), and the number of stars rounded up (5 stars for the point “4211”). Have. Then, the target information output means 12042 constitutes link symbol information. The link symbol information is information such as “evaluation 1” and “evaluation 2” directly under the heading information of “ramen XYZ” in FIG. The information such as “evaluation 1” is an anchor, and holds a URL indicating the location of the original information of the first target information. That is, when “Evaluation 1” is pressed, the original information of the first target information is displayed. Specifically, the target information output means 12042 constructs a character string of “evaluation 1” from the summary information “XYZ of sesame ramen” of the ramen XYZ in the summary information management table of FIG. 19, and the original information URL “http: // www. Gourmet.co.jp "is given to" Evaluation 1 "as anchor information. The configuration of the character string “evaluation 1” is generated by combining the order (number) of the summary information with the fixed character “evaluation”. Then, the configuration of the information in the area (1) in FIG. 20 is completed.

次に、対象情報出力手段12042は、要約手段12043が取得した要約情報を、図20の(1)の領域の下に追記する。要約情報もアンカーになっており、要約の対象である対象情報に対応する元情報の所在を示すURLが要約情報に付与されている。そして、対象情報出力手段12042は、図20の(2)の領域を得る。図20の(2)は、上述した要約部である。   Next, the target information output means 12042 adds the summary information acquired by the summarization means 12043 below the area (1) in FIG. The summary information is also an anchor, and a URL indicating the location of the original information corresponding to the target information to be summarized is given to the summary information. Then, the target information output unit 12042 obtains the area (2) in FIG. (2) in FIG. 20 is the above-described summarizing unit.

以上の処理を、ランキング2位の「くまもと○○ラーメン」、3位の「ラーメンABC」の検索対象に対して行い、対象情報出力手段12042は、図20の出力する情報を得る。なお、図20は表示イメージであり、実際は、HTMLで記述されている。
次に、出力部1204は、構成した情報(図20の情報)を、情報端末11に送信する。
次に、情報端末11は、図20の情報(HTMLで記述された情報)を受信し、当該情報を解釈実行し、図20の画面を表示する。
The above processing is performed on the search target of “Kumamoto XX ramen” in the second ranking and “Ramen ABC” in the third ranking, and the target information output unit 12042 obtains the information to be output in FIG. FIG. 20 shows a display image, which is actually described in HTML.
Next, the output unit 1204 transmits the configured information (information in FIG. 20) to the information terminal 11.
Next, the information terminal 11 receives the information in FIG. 20 (information described in HTML), interprets and executes the information, and displays the screen in FIG.

さらに、情報端末11のユーザが、例えば、リンクシンボル情報、ラーメンXYZの「評価1」をマウスで押下した、とする。すると、情報端末11は、ラーメンXYZの「評価1」に対応するURL「http://www.グルメ.co.jp」に対応するページを、情報処理装置12に検索に行き、「http://www.グルメ.co.jp」に対応するページを表示する。かかる処理は、公知技術による処理であるので詳細な説明を省略する。   Furthermore, it is assumed that the user of the information terminal 11 presses “evaluation 1” of link symbol information, ramen XYZ, with a mouse. Then, the information terminal 11 searches the information processing apparatus 12 for a page corresponding to the URL “http://www.gourmet.co.jp” corresponding to the “evaluation 1” of the ramen XYZ, and “http: // / Www. Gourmet.co.jp "is displayed. Since this process is a process according to a known technique, a detailed description thereof is omitted.

また、情報端末11のユーザが、例えば、要約情報「ゴマラーメンのXYZ。」をマウスで押下した、とする。すると、情報端末11は、要約情報「ゴマラーメンのXYZ。」に対応するURL「http://www.グルメ.co.jp」に対応するページを、情報処理装置12に検索に行き、「http://www.グルメ.co.jp」に対応するページを表示する。かかる処理も、公知技術による処理であるので詳細な説明を省略する。   Further, it is assumed that the user of the information terminal 11 presses summary information “sesame ramen XYZ” with a mouse, for example. The information terminal 11 then searches the information processing apparatus 12 for a page corresponding to the URL “http://www.gourmet.co.jp” corresponding to the summary information “XYZ of sesame ramen.” : // www. Gourmet.co.jp "is displayed. Since this process is also a process according to a known technique, detailed description thereof is omitted.

以上、本実施の形態によれば、店舗等の客観的な情報が適切に取得できる。具体的には、目的とする地点(例えば、JR山手線新宿など)から、ユーザの行動に合致した(徒歩10分など)店舗等の検索が可能となる。また、いわゆるタウンページ等の住所録情報を用いて店舗等の絞込みを行なうことにより、精度の高い店舗等の検索が可能となる。また、HTMLファイル等の構造化された情報から店舗等の情報を検索する場合に、タグ構造に基づいた情報の分割、検索を行なうことにより、不要な情報を取り出す確率を減らすことができ、また、高速に必要な情報を取得できる。特に、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得することにより不要な情報を取り出す確率を減らすことができる。かかる処理により、具体的には、例えば、WEBページの広告の情報など、ユーザが検索したい情報ではない情報を取得することを防ぎ、良好な検索結果を得ることができる。また、従来から用いられてきた距離順や新着順の情報ランキングではなく、検索対象の店舗等の記述データ量等に基づいたランキングを行なうことにより、ユーザにとって適切な情報提示が可能となる。さらに、ページランクや電話番号の有無による情報の信頼性を加味したランキングを行なうことにより、さらにユーザにとって適切な情報提示が可能となる。さらに、検索対象の各ページでの単語の出現頻度を考慮して要約情報を構成することにより、検索対象(店舗等)に特有の文書部分が切出され、適切な要約情報が構成できた。   As mentioned above, according to this Embodiment, objective information, such as a store, can be acquired appropriately. Specifically, a store or the like that matches the user's behavior (such as 10 minutes on foot) can be searched from a target point (for example, JR Yamanote Line Shinjuku). Further, by narrowing down stores using address book information such as so-called town pages, it becomes possible to search for stores with high accuracy. In addition, when searching for information such as stores from structured information such as HTML files, the probability of extracting unnecessary information can be reduced by dividing and searching information based on the tag structure. , Can get necessary information at high speed. In particular, by determining a hierarchy level having a predetermined relationship with a hierarchy level including location information that is one or more of telephone number information, address information, and postal code, and acquiring information on the determined hierarchy level The probability of extracting unnecessary information can be reduced. Specifically, for example, information that is not information that the user wants to search, such as advertisement information on a WEB page, can be prevented from being acquired, and a good search result can be obtained. In addition, information ranking appropriate for the user can be presented by performing ranking based on the description data amount of the store to be searched, etc., instead of the information ranking in the order of distance and new arrival order conventionally used. Furthermore, by performing ranking in consideration of the reliability of information depending on the page rank and presence / absence of a telephone number, it is possible to present information more appropriate for the user. Furthermore, by constructing the summary information in consideration of the appearance frequency of words on each page to be searched, a document portion specific to the search target (store or the like) is cut out, and appropriate summary information can be configured.

なお、本実施の形態において、要約手段は、対象情報から単語を抽出する単語抽出手段と、単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、出現回数に基づいて、対象情報から各検索対象の要約を取得する要約取得手段を具備した。しかし、要約手段は、対象情報の先頭、例えば、100文字を切出すだけの処理でも良い。ただし、上述した単語の出現回数を考慮した要約方法により、店舗等の検索対象の特徴を良く現した要約情報を取得できる。   In the present embodiment, the summarizing means includes a word extracting means for extracting words from the target information, and a word appearance count for each search target for calculating the number of appearances for each search target in each word extracted by the word extracting means. And a summary acquisition means for acquiring a summary of each search target from the target information based on the number of appearances. However, the summarizing means may be a process that only cuts out the beginning of the target information, for example, 100 characters. However, it is possible to acquire summary information that clearly represents the characteristics of the search target such as a store by the summarization method that takes into account the number of appearances of the word.

また、本実施の形態において、対象情報の要約がアンカーとなり、当該アンカーをマウス等で押下した場合に、対象情報の元情報にアクセスし、当該元情報を表示したが、かかることは必須ではない。つまり、出力部1204は、アンカーではない要約情報を出力するだけでも良い。   Further, in this embodiment, when the summary of the target information becomes an anchor and the anchor is pressed with a mouse or the like, the original information of the target information is accessed and the original information is displayed. However, this is not essential. . That is, the output unit 1204 may only output summary information that is not an anchor.

また、本実施の形態において、リンクシンボル出力手段12046は、リンクシンボル情報(「評価1」「評価2」など)を出力したが、リンクシンボル出力手段12046は必須ではない。つまり、リンクシンボル情報(「評価1」「評価2」など)を出力することは必須ではない。
また、本実施の形態において、2以上の検索対象を順位付けするランキング決定手段12041は必須ではない。つまり、ランキングしないで、処理した順に店舗情報等を出力しても良い。
In this embodiment, link symbol output means 12046 outputs link symbol information (such as “evaluation 1” and “evaluation 2”), but link symbol output means 12046 is not essential. That is, it is not essential to output link symbol information (such as “evaluation 1” and “evaluation 2”).
In the present embodiment, the ranking determination unit 12041 for ranking two or more search targets is not essential. That is, store information may be output in the order of processing without ranking.

また、本実施の形態において、ランキング決定手段12041は、2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて2以上の検索対象を順位付けした。しかし、かかる処理以外でランキングしても良い。例えば、ランキング決定手段12041は、2以上の検索対象が記載されているホームページの数のみに基づいて2以上の検索対象を順位付けしても良い。   Further, in the present embodiment, the ranking determination unit 12041 describes the number of characters of target information to be searched for two or more, or / and whether the target information includes telephone number information, and / or target information. Two or more search targets are ranked based on the page ranking of the source information. However, ranking may be performed other than such processing. For example, the ranking determination unit 12041 may rank two or more search targets based only on the number of home pages on which two or more search targets are described.

また、本実施の形態において、検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を有した。対象グループ情報とは、キーワード「ラーメン」等である。しかし、検索情報は、検索地点情報のみであっても良いし、他の情報(店舗の広さや営業時間の情報など)を有しても良い。
また、本実施の形態において、主として、ラーメン屋などの食事どころ(レストラン)を検索対象としたが、英会話学校や本屋等、サービスや物品を販売、レンタルする店舗等、何でも良い。
Further, in the present embodiment, the search information includes search point information that is information about the search point and target group information that is information for specifying a search target group. The target group information is a keyword “ramen” or the like. However, the search information may be only the search point information or may have other information (such as store size and business hours information).
In the present embodiment, the search target is mainly a dining place (restaurant) such as a ramen shop, but it may be anything such as an English conversation school or a bookstore, a store that sells or rents services or goods.

また、本実施の形態において、対象情報を取得する元になる情報である元情報は、階層化されたタグが付された情報であり、対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得した。しかし、対象情報取得部は、タグの階層情報を用いずに、単純な検索処理等により対象情報を検索しても良い。なお、タグの階層情報を用いて対象情報を検索した場合に、検索処理が高速化されることは言うまでもない。
また、本実施の形態において、対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと同一の階層レベルを決定し、当該決定した階層レベルの情報を取得した。しかし、対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得しても良い。例えば、図21(a)に示すように、<td>タグに電話番号情報等の場所情報が含まれている場合に、<tr>タグ以下(ここで「以下」とは、階層における下位階層、という意味である。)のタグ内の情報を切出して、当該切出した情報を検索対象としても良い。なお、図21(a)のタグ構造を有するホームページは、図21(b)のように表の各行にレストラン等の、ユーザが欲する情報が含まれている。また、例えば、表の各行のある属性値として電話番号を有したり、別の属性値として住所を有したりする。
また、例えば、図22(a)に示すように、<td>タグに電話番号情報等の場所情報が含まれている場合に、<table>タグ以下のタグ内の情報を切出して、当該切出した情報を検索対象としても良い。なお、図22(a)のタグ構造を有するホームページは、図22(b)のように表のレコード中にレストラン等の、ユーザが欲する情報が含まれている。つまり、上述した「場所情報を含む階層レベルと所定の関係にある階層レベル」とは、「場所情報を含む階層レベル」と同一の階層レベルでも良いし、「場所情報を含む階層レベル」の一つ上位の階層のレベルでも、二つ上位の階層のレベルでも良い。
また、本実施の形態において、元情報は、WEBのホームページであったが、他の情報であっても良いことは言うまでもない。
Further, in the present embodiment, the original information that is the information from which the target information is acquired is information with a layered tag, and the target information acquisition unit is configured to acquire a plurality of targets from a single source information. When acquiring information, information of the same hierarchy level was acquired. However, the target information acquisition unit may search for the target information by a simple search process or the like without using the tag hierarchy information. Needless to say, when the target information is searched using the tag hierarchy information, the search processing is speeded up.
In the present embodiment, the target information acquisition unit searches for one original information and acquires one of the telephone number information, the address information, and the zip code when acquiring a plurality of target information from one original information. The same hierarchy level as the above-described information including the location information is determined, and information on the determined hierarchy level is acquired. However, when acquiring a plurality of pieces of target information from one source information, the target information acquisition unit searches for one source information, and is a place that is one or more of telephone number information, address information, and postal code A hierarchy level having a predetermined relationship with a hierarchy level including information may be determined, and information on the determined hierarchy level may be acquired. For example, as shown in FIG. 21 (a), when location information such as telephone number information is included in the <td> tag, the <tr> tag or lower (here, “below” means a lower hierarchy in the hierarchy) It is also possible to extract the information in the tag and search for the extracted information. Note that the home page having the tag structure of FIG. 21A includes information desired by the user, such as a restaurant, in each row of the table as shown in FIG. 21B. Further, for example, a telephone number is provided as an attribute value in each row of the table, and an address is provided as another attribute value.
Also, for example, as shown in FIG. 22 (a), when location information such as telephone number information is included in the <td> tag, information in the tag below the <table> tag is cut out and the cut out It is also possible to search for information. Note that the homepage having the tag structure of FIG. 22A includes information desired by the user, such as a restaurant, in the table record as shown in FIG. 22B. That is, the above-described “hierarchy level having a predetermined relationship with the hierarchy level including the location information” may be the same hierarchy level as the “hierarchy level including the location information” or one of the “hierarchy level including the location information”. It may be the level of the upper hierarchy or the level of the upper hierarchy.
Further, in the present embodiment, the original information is the WEB home page, but it goes without saying that it may be other information.

さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、前記検索情報により特定される2以上の検索対象に関する情報である2以上の対象情報を2以上の元情報から取得する対象情報取得ステップと、前記2以上の検索対象の対象情報を出力する出力ステップを実行させるためのプログラムである。また、前記出力ステップは、前記2以上の対象情報を要約し、2以上の要約情報を取得する要約ステップと、前記2以上の要約情報を出力する要約情報出力ステップを具備しても良い。また、前記要約ステップは、前記対象情報から単語を抽出する単語抽出ステップと、前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得ステップを具備しても良い。また、前記要約ステップは、前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出ステップと、前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前記単語全出現回数算出ステップで算出した全対象情報中の出現回数との割合を算出する割合算出ステップと、前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成ステップをさらに具備し、前記要約取得ステップは、前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得しても良い。     Furthermore, the processing in the present embodiment may be realized by software. Then, this software may be distributed by software download or the like. Further, this software may be recorded on a recording medium such as a CD-ROM and distributed. This also applies to other embodiments in this specification. Note that the software that implements the information processing apparatus according to the present embodiment is the following program. In other words, this program receives a search step for receiving search information, which is information for specifying two or more search targets, and two or more pieces of target information for information related to two or more search targets specified by the search information. It is a program for executing a target information acquisition step acquired from two or more original information and an output step of outputting the target information of the two or more search targets. The output step may include a summarization step of summarizing the two or more pieces of target information and acquiring the two or more pieces of summary information, and a summary information output step of outputting the two or more pieces of summary information. In addition, the summarizing step includes a word extracting step for extracting a word from the target information, and a word appearance count calculation unit for each search target for calculating an appearance count for each search target in each word extracted in the word extraction step; You may comprise the summary acquisition step which acquires the summary information of each search object from the said object information based on the said appearance frequency. The summarizing step includes a word total appearance count calculating step for calculating the number of appearances in all target information of all search targets in each word extracted in the word extracting step, and a word appearance count calculating step for each search target. From the ratio calculation step for calculating the ratio between the number of appearances for each search target calculated in step 1 and the number of appearances in all target information calculated in the total word appearance count calculation step, and from the words with a high ratio calculated in the ratio calculation step In addition, the method further comprises a word list creation step of creating a word list for each search target, wherein the summary acquisition step acquires summary information for each search target from the target information based on the word list for each search target. May be.

さらに、前記対象情報取得ステップにおいて、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記受付ステップにおいて、前記要約情報に対する指示である要約情報選択指示をも受け付け、前記受付ステップで要約情報選択指示を受け付けた場合に、前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する元情報取得ステップをさらに実行させ、前記出力ステップは、前記元情報取得ステップで取得した元情報をも出力する元情報出力ステップをも具備しても良い。   Furthermore, in the target information acquisition step, link information that is information indicating the location of the information in which the target information is described is also acquired, and in the reception step, a summary information selection instruction that is an instruction for the summary information is also received, Source information for acquiring the original information based on link information of the original information in which the target information that is the source of the summary information corresponding to the summary information selection instruction is received when the summary information selection instruction is received in the receiving step An acquisition step may be further executed, and the output step may include an original information output step for outputting the original information acquired in the original information acquisition step.

また、上記プログラムにおいて、前記対象情報取得ステップで、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記出力ステップは、前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力ステップをさらに具備し、前記受付ステップは、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付け、前記受付ステップにおいてリンクシンボル選択指示を受け付けた場合に、前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する元情報取得ステップをさらに具備し、前記出力ステップにおいて、前記元情報取得ステップで取得した元情報をも出力する元情報出力ステップをも具備する構成でも良い。   Further, in the program, in the target information acquisition step, link information that is information indicating a location of information in which the target information is described is also acquired, and the output step is link symbol information that is information corresponding to the link information. A link symbol output step that outputs a link symbol selection instruction that is an instruction for the link symbol information. The link symbol output instruction is received when the link symbol selection instruction is received in the reception step. A source information acquisition step of acquiring source information that is information in which target information indicated by the link information is described based on link information corresponding to the link symbol information, and in the output step, the source information acquisition Source information output step that also outputs source information acquired in step It may be equipped also constitute a.

また、上記出力ステップにおいて、前記2以上の検索対象の対象情報に基づいて、前記2以上の検索対象を順位付けするランキング決定ステップをさらに具備し、前記ランキング決定ステップの順位付けに基づいて、前記2以上の検索対象の対象情報または/および要約情報を出力しても良い。   The output step further includes a ranking determination step of ranking the two or more search targets based on the target information of the two or more search targets, and based on the ranking of the ranking determination step, Two or more search target information and / or summary information may be output.

また、ランキング決定ステップにおいて、前記2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて前記2以上の検索対象を順位付けしても良い。
上記の検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を有することが好適である。
Further, in the ranking determination step, the number of characters of the two or more search target object information, and / or whether the target information includes telephone number information, and / or an original information page on which the target information is described The two or more search objects may be ranked based on the ranking.
The search information preferably includes search point information that is information about a search point and target group information that is information for specifying a search target group.

また、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納しており、前記対象情報取得ステップにおいて、前記検索情報に基づいて、被検索対象情報の一部または全部を取得する被検索対象情報取得ステップと、前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部に基づいて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得する対象情報取得ステップを具備しても良い。   Further, search target name information that is information indicating the name of the search target, telephone number information that is information indicating the telephone number of the search target, and address information that is address information that is the information indicating the address of the search target. A search target information group including one or more search target information groups, wherein in the target information acquisition step, a part or all of the search target information is acquired based on the search information; A target information acquisition step of acquiring target information that is information related to two or more search target targets specified by the search information, based on part or all of the search target information acquired in the search target information acquisition step; You may do it.

また、検索情報は、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範囲情報を含み、前記被検索対象情報取得ステップは、前記検索情報が有する検索地点情報と前記検索対象の住所情報と前記検索範囲情報に基づいて、1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得しても良い。   The search information further includes search range information that is information for specifying a search range from the search point indicated by the search point information. The search target information acquisition step includes the search point information included in the search information and the search One or more search target information may be selected based on the target address information and the search range information, and a part or all of the selected search target information may be acquired.

また、被検索対象情報取得ステップにおいて、前記検索情報が有する検索地点情報の経緯度と、前記検索対象の住所情報の経緯度を取得し、当該2つの経緯度から前記検索地点情報が示す検索地点と前記住所情報が示す前記検索対象の地点の間の距離を算出し、当該距離に基づいて、前記検索範囲情報が示す条件に合致するか否かを判断することにより、1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得しても良い。   Further, in the search target information acquisition step, the longitude and latitude of the search point information included in the search information and the longitude and latitude of the address information of the search target are acquired, and the search point indicated by the search point information from the two longitudes and latitudes One or more search target objects by calculating a distance between the search target point indicated by the address information and determining whether the search range information satisfies a condition based on the distance. Information may be selected, and some or all of the selected search target information may be acquired.

また、前記対象情報を取得する元になる情報である元情報は、階層化されたタグが付された情報であり、前記対象情報取得ステップにおいて、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得することが好適である。   Moreover, the original information which is the information from which the target information is acquired is information with a hierarchical tag, and a plurality of target information is acquired from one source information in the target information acquisition step. In some cases, it is preferable to acquire information of the same hierarchical level.

また、対象情報取得ステップにおいて、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを決定し、当該決定した階層レベルの情報を取得しても良い。
また、対象情報取得ステップにおいて、場所情報を2以上含む階層レベルを決定し、当該決定した階層レベルの情報を取得しても良い。
Also, in the target information acquisition step, when a plurality of target information is acquired from one original information, the one original information is searched, and a place that is one or more of telephone number information, address information, and zip code A hierarchy level including information may be determined, and information on the determined hierarchy level may be acquired.
Further, in the target information acquisition step, a hierarchical level including two or more pieces of location information may be determined, and information on the determined hierarchical level may be acquired.

なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。   In the above program, in a transmission step for transmitting information, a reception step for receiving information, etc., processing performed by hardware, for example, processing performed by a modem or an interface card in the transmission step (only performed by hardware). Not included) is not included.

また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。つまり、1以上の装置により、上記した処理の方法が実現されれば良い。具体的には、例えば、情報処理装置12は、被検索対象情報群格納手段12021を保持せず、他の装置が被検索対象情報群格納手段12021を保持していても良い。かかる場合、情報処理装置12は、当該他の装置を検索して、被検索対象情報を取得する。   In each of the above embodiments, each process (each function) may be realized by centralized processing by a single device (system), or by distributed processing by a plurality of devices. May be. That is, the above processing method may be realized by one or more apparatuses. Specifically, for example, the information processing apparatus 12 may not hold the search target information group storage unit 12021, and another apparatus may hold the search target information group storage unit 12021. In such a case, the information processing apparatus 12 searches for the other apparatus and acquires search target information.

また、上記情報処理システムにおいて、情報端末11と情報処理装置12が一の装置で実現されていても良い。かかる場合、情報処理装置12がユーザ入力受付部1101を保持し、出力部1204は、ディスプレイに情報を表示したり、スピーカーで音声出力したり等の処理を行う。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段(情報送信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
In the information processing system, the information terminal 11 and the information processing device 12 may be realized by a single device. In such a case, the information processing apparatus 12 holds the user input receiving unit 1101, and the output unit 1204 performs processing such as displaying information on a display or outputting sound through a speaker.
Further, in each of the above embodiments, it goes without saying that two or more communication means (such as an information transmission unit) existing in one apparatus may be physically realized by one medium.
The present invention is not limited to the above-described embodiments, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.

以上のように、本発明にかかる情報処理装置は、店舗等の客観的な情報が適切に出力できるという効果を有し、例えば、WEBにおけるサーチエンジンを有するサーバ装置等として有用である。   As described above, the information processing apparatus according to the present invention has an effect that objective information such as a store can be appropriately output, and is useful as, for example, a server apparatus having a search engine in WEB.

実施の形態における情報処理システムの概念図Conceptual diagram of an information processing system in an embodiment 同情報処理システムのブロック図Block diagram of the information processing system 同情報端末の動作について説明するフローチャートFlow chart for explaining the operation of the information terminal 同情報処理装置の動作について説明するフローチャートFlow chart for explaining the operation of the information processing apparatus 同対象情報取得処理について説明するフローチャートFlowchart explaining the target information acquisition process 同送信情報構成処理について説明するフローチャートFlowchart explaining the transmission information configuration process 同ランキング処理について説明するフローチャートFlow chart explaining the ranking process 同要約情報取得処理について説明するフローチャートFlowchart explaining the summary information acquisition process 同ホームページの例を示す図Figure showing an example of the homepage 同被検索対象情報群を示す図Figure showing the search target information group 同情報ポータル管理表を示す図Figure showing the information portal management table 同入力画面例を示す図Figure showing an example of the same input screen 同要求情報を示す図Figure showing the request information 同被検索対象情報中間表を示す図Figure showing the search target information intermediate table 同HTML構造木を示す図The figure which shows the same HTML structure tree 同対象情報管理表を示す図Figure showing the same information management table 同ランキング中間表を示す図Figure showing the same interim ranking table 同単語リスト管理表を示す図The figure which shows the same word list management table 同要約情報管理表を示す図Figure showing the summary information management table 同出力する情報の例を示す図Figure showing an example of the information to be output 同HTML構造木を示す図The figure which shows the same HTML structure tree 同HTML構造木を示す図The figure which shows the same HTML structure tree

符号の説明Explanation of symbols

11 情報端末
12 情報処理装置
13 情報格納装置
1101 ユーザ入力受付部
1102 要求送信部
1103 情報受信部
1104 情報出力部
1201 受付部
1202 対象情報取得部
1203 元情報取得部
1204 出力部
1205 元情報受信部
1206 元情報蓄積部
1207 元情報格納部
1301 元情報格納部
1302 元情報送信部
12021 被検索対象情報群格納手段
12022 被検索対象情報取得手段
12023 対象情報取得手段
12041 ランキング決定手段
12042 対象情報出力手段
12043 要約手段
12044 要約情報出力手段
12045 元情報出力手段
12046 リンクシンボル出力手段
120431 単語抽出手段
120432 検索対象毎単語出現回数算出手段
120433 単語全出現回数算出手段
120434 割合算出手段
120435 単語リスト作成手段
DESCRIPTION OF SYMBOLS 11 Information terminal 12 Information processing apparatus 13 Information storage apparatus 1101 User input reception part 1102 Request transmission part 1103 Information reception part 1104 Information output part 1201 Reception part 1202 Target information acquisition part 1203 Original information acquisition part 1204 Output part 1205 Original information reception part 1206 Original information storage unit 1207 Original information storage unit 1301 Original information storage unit 1302 Original information transmission unit 12021 Search target information group storage unit 12022 Search target information acquisition unit 12023 Target information acquisition unit 12041 Ranking determination unit 12042 Target information output unit 12043 Summary Means 12044 Summary information output means 12045 Original information output means 12046 Link symbol output means 120431 Word extraction means 120432 Word appearance count calculation means for each search target 120433 Total number of word occurrences Calculation means 120434 Ratio calculation means 120435 Word list creation means

Claims (7)

2以上の検索対象を特定する情報である検索情報を受け付ける受付部と、
2以上の情報格納装置に格納されている元情報であり、階層化されたタグが付された情報である元情報から、前記検索情報により特定される2以上の検索対象に対するユーザ評価の情報である2以上の対象情報を取得する対象情報取得部と、
前記2以上の検索対象の対象情報を出力する出力部を具備する情報処理装置であって、
前記対象情報取得部は、
一の元情報から複数の対象情報を取得する場合に、当該元情報内の同一の階層レベルの情報を取得し、
検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している被検索対象情報群格納手段と、
前記検索情報に基づいて、前記被検索対象情報群格納手段から被検索対象情報の一部または全部を取得する被検索対象情報取得手段と、
前記被検索対象情報取得手段が取得した被検索対象情報の一部または全部を用いて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得する手段であり、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを、情報を取得する階層レベルと決定し、当該決定した階層レベルの情報を取得する手段である対象情報取得手段を具備し、
前記出力部は、
前記2以上の対象情報を要約し、2以上の要約情報を取得する要約手段と、
前記2以上の要約情報を出力する要約情報出力手段を具備し、
前記要約手段は、
前記対象情報から単語を抽出する単語抽出手段と、
前記単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、
前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得手段と、
前記単語抽出手段が抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出手段と、
前記検索対象毎単語出現回数算出手段が算出した検索対象毎の出現回数と前記単語全出現回数算出手段が算出した全対象情報中の出現回数との割合を算出する割合算出手段と、
前記割合算出手段が算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成手段を具備し、
前記要約取得手段は、
前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得する情報処理装置。
A reception unit that receives search information that is information for specifying two or more search targets;
It is original information stored in two or more information storage devices, and is information of user evaluation for two or more search targets specified by the search information from the original information that is information with hierarchical tags. A target information acquisition unit that acquires two or more target information;
An information processing apparatus comprising an output unit that outputs target information of two or more search targets,
The target information acquisition unit
When acquiring multiple pieces of target information from a single source information, acquire the same hierarchical level information in the source information ,
One or more search target information including search target name information that is information indicating a search target name, telephone number information that is information indicating a search target telephone number, and address information that is information indicating a search target address A search target information group storing means for storing a search target information group having;
Search target information acquisition means for acquiring part or all of the search target information from the search target information group storage means based on the search information;
Means for acquiring target information, which is information about two or more search target targets specified by the search information, using a part or all of the search target information acquired by the search target information acquiring means; When acquiring a plurality of pieces of target information from one original information, search for one original information and display a hierarchy level including location information that is one or more of telephone number information, address information, and postal code. And a target information acquisition unit that is a unit for acquiring information of the determined hierarchy level.
The output unit is
Summarizing means for summarizing the two or more pieces of target information and obtaining two or more pieces of summary information;
Comprising summary information output means for outputting the two or more summary information;
The summarizing means includes:
Word extraction means for extracting words from the target information;
In each word extracted by the word extraction means, a word appearance count calculation means for each search target for calculating the appearance count for each search target;
Summary acquisition means for acquiring summary information of each search target from the target information based on the number of appearances;
In each word extracted by the word extracting means, a word total appearance count calculating means for calculating the number of appearances in all target information of all search targets;
A ratio calculating means for calculating a ratio between the number of appearances for each search target calculated by the word appearance count calculating means for each search target and the number of appearances in all target information calculated by the word total appearance count calculating means;
Arranged from words with a high ratio calculated by the ratio calculation means, comprising a word list creation means for creating a word list for each search target,
The summary acquisition means includes
An information processing apparatus that acquires summary information of each search target from the target information based on the word list for each search target.
前記対象情報取得部は、
対象情報が記載された元情報の所在を示す情報であるリンク情報も取得し、
前記受付部は、
前記要約情報に対する指示である要約情報選択指示をも受け付け、
前記受付部が要約情報選択指示を受け付けた場合に、
前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する元情報取得部をさらに具備し、
前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する請求項1記載の情報処理装置。
The target information acquisition unit
Also obtain link information that is the information indicating the location of the original information where the target information is written,
The reception unit
Also accept summary information selection instructions that are instructions for the summary information,
When the reception unit receives a summary information selection instruction,
Based on the link information of the original information in which the target information that is the basis of the summary information corresponding to the summary information selection instruction is provided, further comprising an original information acquisition unit that acquires the original information,
The information processing apparatus according to claim 1 , wherein the output unit further includes original information output means for outputting the original information acquired by the original information acquisition unit.
前記対象情報取得部は、
対象情報が記載された元情報の所在を示す情報であるリンク情報も取得し、
前記出力部は、
前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力手段をさらに具備し、
前記受付部は、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付け、
前記受付部がリンクシンボル選択指示を受け付けた場合に、
前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する元情報取得部をさらに具備し、
前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する請求項2記載の情報処理装置。
The target information acquisition unit
Also obtain link information that is the information indicating the location of the original information where the target information is written,
The output unit is
Link symbol output means for outputting link symbol information, which is information corresponding to the link information,
The reception unit also receives a link symbol selection instruction that is an instruction for the link symbol information,
When the reception unit receives a link symbol selection instruction,
Based on link information corresponding to the instructed link symbol information, further comprising an original information acquisition unit that acquires original information that is information in which target information indicated by the link information is described;
The information processing apparatus according to claim 2 , wherein the output unit further includes original information output means for outputting the original information acquired by the original information acquisition unit.
前記出力部は、
前記2以上の検索対象の対象情報に基づいて、前記2以上の検索対象を順位付けするランキング決定手段をさらに具備し、
前記ランキング決定手段の順位付けに基づいて、前記2以上の検索対象の対象情報または/および要約情報を出力する請求項3記載の情報処理装置。
The output unit is
Further comprising a ranking determining means for ranking the two or more search targets based on the target information of the two or more search targets;
The information processing apparatus according to claim 3 , wherein the target information or / and summary information of the two or more search targets are output based on the ranking of the ranking determination unit.
前記ランキング決定手段は、
前記2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて前記2以上の検索対象を順位付けする請求項記載の情報処理装置。
The ranking determining means includes
Based on the number of characters of the target information of the two or more search targets, and / or whether the target information includes telephone number information, and / or the page ranking of the original information in which the target information is described The information processing apparatus according to claim 4 , wherein the search targets are ranked.
コンピュータに、On the computer,
2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、A reception step for receiving search information that is information for specifying two or more search targets;
2以上の情報格納装置に格納されている元情報であり、階層化されたタグが付された情報である元情報から、前記検索情報により特定される2以上の検索対象に対するユーザ評価の情報である2以上の対象情報を取得する対象情報取得ステップと、It is original information stored in two or more information storage devices, and is information of user evaluation for two or more search targets specified by the search information from the original information that is information with hierarchical tags. A target information acquisition step of acquiring two or more target information;
前記2以上の検索対象の対象情報を出力する出力ステップを実行させるためのプログラムであって、A program for executing an output step of outputting the target information of two or more search targets,
前記対象情報取得ステップは、The target information acquisition step includes:
一の元情報から複数の対象情報を取得する場合に、当該元情報内の同一の階層レベルの情報を取得し、When acquiring multiple pieces of target information from a single source information, acquire the same hierarchical level information in the source information,
検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している記憶媒体から、前記検索情報に基づいて、被検索対象情報の一部または全部を取得する被検索対象情報取得ステップと、One or more search target information including search target name information that is information indicating a search target name, telephone number information that is information indicating a search target telephone number, and address information that is information indicating a search target address A search target information acquisition step for acquiring a part or all of the search target information based on the search information from a storage medium storing the search target information group having;
前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部を用いて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得するステップであり、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを、情報を取得する階層レベルと決定し、当該決定した階層レベルの情報を取得するステップである対象情報取得ステップを具備し、Using a part or all of the search target information acquired in the search target information acquisition step, acquiring target information that is information relating to two or more search target targets specified by the search information; When acquiring a plurality of pieces of target information from one original information, search for one original information and display a hierarchy level including location information that is one or more of telephone number information, address information, and postal code. And a target information acquisition step that is a step of acquiring information of the determined hierarchy level.
前記出力ステップは、The output step includes
前記2以上の対象情報を要約し、2以上の要約情報を取得する要約ステップと、A summarizing step of summarizing the two or more pieces of target information and obtaining two or more pieces of summary information;
前記2以上の要約情報を出力する要約情報出力ステップを具備し、A summary information output step for outputting the two or more summary information;
前記要約ステップは、The summarizing step comprises:
前記対象情報から単語を抽出する単語抽出ステップと、A word extracting step of extracting a word from the target information;
前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、In each word extracted in the word extraction step, a word appearance count calculation step for each search target for calculating the number of appearances for each search target;
前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得ステップと、A summary acquisition step of acquiring summary information of each search target from the target information based on the number of appearances;
前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出ステップと、In each word extracted in the word extraction step, a word total appearance count calculating step for calculating the number of appearances in all target information of all search targets;
前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前記単語全The number of appearances for each search object calculated in the word appearance frequency calculation step for each search object and all the words 出現回数算出ステップで算出した全対象情報中の出現回数との割合を算出する割合算出ステップと、A ratio calculating step for calculating a ratio with the number of appearances in all target information calculated in the appearance number calculating step;
前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成ステップを具備し、Arranging from the words with a high ratio calculated in the ratio calculation step, comprising a word list creation step of creating a word list for each search target,
前記要約取得ステップは、The summary acquisition step includes:
前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得するプログラム。A program for obtaining summary information of each search target from the target information based on the word list for each search target.
受付部、対象情報取得部、および出力部により実行させる情報処理方法であって、An information processing method executed by a reception unit, a target information acquisition unit, and an output unit,
前記受付部により、2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、A reception step of receiving search information, which is information for specifying two or more search targets, by the reception unit;
前記対象情報取得部により、2以上の情報格納装置に格納されている元情報であり、階層化されたタグが付された情報である元情報から、前記検索情報により特定される2以上の検索対象に対するユーザ評価の情報である2以上の対象情報を取得する対象情報取得ステップと、Two or more searches specified by the search information from the original information that is the original information stored in two or more information storage devices by the target information acquisition unit, and is the information with the hierarchized tag. A target information acquisition step of acquiring two or more pieces of target information that is user evaluation information for the target;
前記出力部により、前記2以上の検索対象の対象情報を出力する出力ステップを具備する情報処理方法であって、An information processing method comprising an output step of outputting the target information of the two or more search targets by the output unit,
前記対象情報取得ステップにおいて、In the target information acquisition step,
一の元情報から複数の対象情報を取得する場合に、当該元情報内の同一の階層レベルの情報を取得し、When acquiring multiple pieces of target information from a single source information, acquire the same hierarchical level information in the source information,
検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している記憶媒体から、前記検索情報に基づいて、被検索対象情報の一部または全部を取得する被検索対象情報取得ステップと、One or more search target information including search target name information that is information indicating a search target name, telephone number information that is information indicating a search target telephone number, and address information that is information indicating a search target address A search target information acquisition step for acquiring a part or all of the search target information based on the search information from a storage medium storing the search target information group having;
前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部を用いて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得するステップであり、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを、情報を取得する階層レベルと決定し、当該決定した階層レベルの情報を取得するステップである対象情報取得ステップを具備し、Using a part or all of the search target information acquired in the search target information acquisition step, acquiring target information that is information relating to two or more search target targets specified by the search information; When acquiring a plurality of pieces of target information from one original information, search for one original information and display a hierarchy level including location information that is one or more of telephone number information, address information, and postal code. And a target information acquisition step that is a step of acquiring information of the determined hierarchy level.
前記出力ステップは、The output step includes
前記2以上の対象情報を要約し、2以上の要約情報を取得する要約ステップと、A summarizing step of summarizing the two or more pieces of target information and obtaining two or more pieces of summary information;
前記2以上の要約情報を出力する要約情報出力ステップを具備し、A summary information output step for outputting the two or more summary information;
前記要約ステップは、The summarizing step comprises:
前記対象情報から単語を抽出する単語抽出ステップと、A word extracting step of extracting a word from the target information;
前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、In each word extracted in the word extraction step, a word appearance count calculation step for each search target for calculating the number of appearances for each search target;
前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得ステップと、A summary acquisition step of acquiring summary information of each search target from the target information based on the number of appearances;
前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出ステップと、In each word extracted in the word extraction step, a word total appearance count calculating step for calculating the number of appearances in all target information of all search targets;
前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前記単語全出現回数算出ステップで算出した全対象情報中の出現回数との割合を算出する割合算出ステップと、A ratio calculation step for calculating a ratio between the number of appearances for each search target calculated in the word appearance count calculation step for each search target and the number of appearances in all target information calculated in the word total appearance count calculation step;
前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成ステップを具備し、Arranging from the words with a high ratio calculated in the ratio calculation step, comprising a word list creation step of creating a word list for each search target,
前記要約取得ステップは、The summary acquisition step includes:
前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得する情報処理方法。An information processing method for acquiring summary information of each search target from the target information based on a word list for each search target.
JP2006524541A 2004-07-16 2005-06-28 Information processing apparatus and program Active JP4035623B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004209780 2004-07-16
JP2004209780 2004-07-16
PCT/JP2005/011786 WO2006008919A1 (en) 2004-07-16 2005-06-28 Information processing device and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006313880A Division JP2007048328A (en) 2004-07-16 2006-11-21 Information processor, information processing method and program

Publications (2)

Publication Number Publication Date
JP4035623B2 true JP4035623B2 (en) 2008-01-23
JPWO2006008919A1 JPWO2006008919A1 (en) 2008-05-01

Family

ID=35785042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006524541A Active JP4035623B2 (en) 2004-07-16 2005-06-28 Information processing apparatus and program

Country Status (2)

Country Link
JP (1) JP4035623B2 (en)
WO (1) WO2006008919A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040869A (en) * 2006-08-08 2008-02-21 Pioneer Electronic Corp Point information evaluation system, point information evaluation program
JP4957796B2 (en) * 2007-05-24 2012-06-20 富士通株式会社 Difference calculation program, difference calculation device, and difference calculation method
JP6070951B2 (en) * 2013-12-17 2017-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Apparatus and method for supporting analysis of evaluation

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207458A (en) * 1999-01-08 2000-07-28 Recruit Co Ltd Product information service system
JP2001357035A (en) * 2000-06-13 2001-12-26 Open Door:Kk Contents evaluation/retrieval system
JP3408528B1 (en) * 2001-11-20 2003-05-19 株式会社ジャストシステム Device, method and program for processing information
JP2003167990A (en) * 2001-11-30 2003-06-13 Fujitsu Ltd Commodity information collection system and method therefor
JP4808357B2 (en) * 2002-03-19 2011-11-02 三菱電機株式会社 Information collection device
JP2004185572A (en) * 2002-12-06 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> Word-of-mouth information analyzing method and apparatus

Also Published As

Publication number Publication date
WO2006008919A1 (en) 2006-01-26
JPWO2006008919A1 (en) 2008-05-01

Similar Documents

Publication Publication Date Title
JP4909334B2 (en) Service proposal apparatus and method, service proposal system, service proposal apparatus and method based on user&#39;s favorite base
US9152614B2 (en) System and method for bulk web domain generation and management
US8001135B2 (en) Search support apparatus, computer program product, and search support system
KR100952651B1 (en) Location extraction
US20130304750A1 (en) Relevancy sorting of user&#39;s browser history
US8150979B1 (en) Supporting multiple landing pages
EP2557511B1 (en) Information processing device, information processing method, information processing programme, and recording medium
CN103339597A (en) Transforming search engine queries
CN102063451A (en) Method and equipment for inputting characters by user and providing relevant search information
US10558727B2 (en) System and method for operating a browsing application
JP5269938B2 (en) Soaring word association apparatus and method
JP2011527062A (en) Homepage integrated service providing system and method
CN102063194A (en) Method, equipment, server and system for inputting characters by user
CN104376114A (en) Search result displaying method and device
JP2007072596A (en) Information sharing system and information sharing method
KR101011726B1 (en) Apparatus and method for providing snippet
KR100913733B1 (en) Method for Providing Search Result Using Template
CN107766398B (en) Method, apparatus and data processing system for matching an image with a content item
JP4035623B2 (en) Information processing apparatus and program
JP2007233862A (en) Service retrieval system and service retrieval method
KR20110050823A (en) Apparatus and method for establishing search database for knowledge node coupling structure
JP2017117021A (en) Keyword extraction device, content generation system, keyword extraction method, and program
JP6639040B2 (en) Information retrieval device and program
JP4002943B1 (en) Search optimization apparatus, method, and computer program
JP2007048328A (en) Information processor, information processing method and program

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070927

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150