JP2010198281A - Information processing apparatus, information processing method, and program - Google Patents

Information processing apparatus, information processing method, and program Download PDF

Info

Publication number
JP2010198281A
JP2010198281A JP2009041972A JP2009041972A JP2010198281A JP 2010198281 A JP2010198281 A JP 2010198281A JP 2009041972 A JP2009041972 A JP 2009041972A JP 2009041972 A JP2009041972 A JP 2009041972A JP 2010198281 A JP2010198281 A JP 2010198281A
Authority
JP
Japan
Prior art keywords
information
region
feature word
regional
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009041972A
Other languages
Japanese (ja)
Other versions
JP5371480B2 (en
Inventor
Kazutoshi Sumiya
和俊 角谷
Yong Lee
龍 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyogo Prefectural Government
Original Assignee
Hyogo Prefectural Government
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyogo Prefectural Government filed Critical Hyogo Prefectural Government
Priority to JP2009041972A priority Critical patent/JP5371480B2/en
Publication of JP2010198281A publication Critical patent/JP2010198281A/en
Application granted granted Critical
Publication of JP5371480B2 publication Critical patent/JP5371480B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem of conventional information processing apparatuses being unable to easily obtain appropriate information through searches using the names of places. <P>SOLUTION: An information processing apparatus includes: an areal feature word storage unit 101 in which areal feature words, i.e., character strings highly related to an area, and region information, i.e., information indicating regions including areas highly related to the areal feature words, are stored in association; a position information acquisition unit 102 which acquires position information, i.e., information indicating positions; an areal feature word acquisition unit 103 which acquires from the areal feature word storage unit 101 areal feature words corresponding to the region information indicating regions containing positions indicated by the position information acquired by the position information acquisition unit 102; and an areal feature word output unit 104 which outputs the areal feature words acquired by the areal feature word acquisition unit 103. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、地域に関連した情報の検索を行う際に利用可能な情報処理装置等に関するものである。   The present invention relates to an information processing apparatus that can be used when searching for information related to a region.

従来の情報処理の技術として、自動車内のユーザに対し、その位置情報に基づいて、ユーザの近傍に存在する地名を取得し、当該地名を検索クエリとして用いて検索を行うことで、地域性の高いいわゆるBlogコンテンツを抽出し、可聴化して提示するものが知られていた。(例えば、非特許文献1参照)。   As a conventional information processing technology, for a user in an automobile, a place name existing in the vicinity of the user is acquired based on the position information, and a search is performed using the place name as a search query. It has been known that a high so-called blog content is extracted, made audible, and presented. (For example, refer nonpatent literature 1).

群 宏志、外2名、"地域Blog情報の可聴化インタフェースの提案と音声化に適したテキストコンテンツの抽出手法"、DEWS2006Hiroshi Gun, 2 others, "Proposal of an audible interface for regional blog information and extraction method of text content suitable for speech", DEWS2006

しかしながら、上記のように検索対象がBlogコンテンツのように、予め限られたコンテンツである場合は良いが、検索対象をBlogコンテンツに限定せずにWEB等から検索を行う場合においては、地名は検索条件としては、検索結果を十分に絞り込み可能なものであるとはいえず、また、地名を用いた検索では、通常の検索サイト等においては、その地名を含む都道府県庁や役場等のWEBページ等が検索されることが多いため、上記のように地名を検索条件として用いた検索では、地域についての特徴的な事象に関するWEBページ等が必ずしも検索結果として得られないという課題があった。したがって、地域等について特徴的な様々な事象の情報を知りたい場合、上記のように地名を用いた検索クエリによる検索では適切な情報が得ることが困難である、という課題があった。   However, as described above, the search target may be limited content such as Blog content. However, when searching from WEB or the like without limiting the search target to Blog content, the place name is searched. As a condition, it cannot be said that the search results can be sufficiently narrowed down. In addition, in a search using a place name, a WEB page of a prefectural office or government office that contains the place name in a normal search site etc. Therefore, in the search using the place name as a search condition as described above, there is a problem that a WEB page or the like related to a characteristic event about a region cannot always be obtained as a search result. Therefore, when it is desired to know information on various events that are characteristic for a region or the like, there is a problem that it is difficult to obtain appropriate information by a search using a place name as described above.

本発明の情報処理装置は、地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納されている地域特徴語格納部と、位置を示す情報である位置情報を取得する位置情報取得部と、前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する地域特徴語取得部と、前記地域特徴語取得部が取得した地域特徴語を出力する地域特徴語出力部とを備えた情報処理装置である。   In the information processing apparatus of the present invention, a regional feature word that is a character string that is highly relevant to a region is associated with region information that is information indicating a region including a region that is highly relevant to the regional feature word. The region feature word storage unit stored in the above, the location information acquisition unit for acquiring location information that is information indicating the location, and the region information indicating the region including the location indicated by the location information acquired by the location information acquisition unit An area feature word acquisition unit that acquires an area feature word corresponding to the area feature word from the area feature word storage unit, and an area feature word output unit that outputs the area feature word acquired by the area feature word acquisition unit Device.

かかる構成により、地域に特徴的な情報を検索するために適切な文字列の情報を提供することができる。このため、例えば、ユーザが地域に特徴的な事象等を検索する際の処理を簡略化することができる。   With this configuration, it is possible to provide information on a character string suitable for searching for information characteristic of the area. For this reason, for example, it is possible to simplify processing when the user searches for an event or the like characteristic to the area.

また、本発明の情報処理装置は、前記情報処理装置において、地域を示す情報である地域情報を受け付ける地域情報受付部と、前記地域情報受付部が受け付けた地域情報を含む検索条件を用いて検索を行い、当該地域情報が示す地域に関連した情報である地域関連情報を取得する地域関連情報取得部と、前記地域関連情報取得部が取得した地域関連情報から、前記地域特徴語を抽出する地域特徴語抽出部と、前記地域特徴語抽出部が抽出した地域特徴語を、前記地域情報が示す地域を含む前記領域情報と対応付けて前記地域特徴語格納部に蓄積する地域特徴語蓄積部とを更に備えた情報処理装置である。   In the information processing apparatus of the present invention, the information processing apparatus performs a search using a region information receiving unit that receives region information that is information indicating a region, and a search condition that includes the region information received by the region information receiving unit. A region-related information acquisition unit that acquires region-related information that is information related to the region indicated by the region information, and a region that extracts the region feature word from the region-related information acquired by the region-related information acquisition unit A feature word extraction unit; a region feature word storage unit that stores the region feature words extracted by the region feature word extraction unit in the region feature word storage unit in association with the region information including the region indicated by the region information; Is an information processing apparatus.

かかる構成により、ユーザ等から受け付けた地域情報を用いて、地域特徴語を抽出して、領域情報と対応付けて、地域特徴語格納部に蓄積することができる。これにより、地域特徴語を追加していくことができる。この結果、例えば地域特徴語の辞書となるデータベース等を構築することが可能となる。   With this configuration, it is possible to extract a regional feature word using regional information received from a user or the like, and associate it with the regional information and store it in the regional feature word storage unit. Thereby, regional feature words can be added. As a result, it is possible to construct a database or the like that is a dictionary of regional feature words, for example.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域情報受付部は、複数の前記地域情報を受け付け、前記地域関連情報取得部は、前記地域情報受付部が受け付けた前記複数の地域情報をそれぞれ含む検索条件を用いて検索を行い、各地域情報が示す地域の地域関連情報をそれぞれ取得し、前記地域特徴語抽出部は、前記地域関連情報取得部が取得した一の地域情報が示す地域の地域関連情報に出現する文字列について、当該一の地域情報が示す地域の地域関連情報内における出現頻度と、前記複数の地域情報が示す複数の地域の地域関連情報内における、当該文字列と一致する文字列を含む地域関連情報の出現頻度とを用いて、前記文字列の、地域との関連の強さを示す情報である地域特徴度を算出し、当該地域特徴度が所定の条件を満たす前記文字列である地域特徴語を抽出し、前記地域特徴語蓄積部は、前記地域特徴語抽出部が抽出した地域特徴語を、前記一の地域情報が示す地域を含む前記領域情報と対応付けて前記地域特徴語格納部に蓄積する情報処理装置である。   In the information processing apparatus according to the present invention, in the information processing apparatus, the region information receiving unit receives a plurality of the region information, and the region related information acquiring unit receives the plurality of regions received by the region information receiving unit. A search is performed using a search condition that includes each region information, and each region related information indicated by each region information is acquired. The region feature word extracting unit is one region information acquired by the region related information acquiring unit. For the character string appearing in the region-related information of the region indicated by, the frequency of occurrence in the region-related information of the region indicated by the one region information and the region-related information of the plurality of regions indicated by the plurality of region information Using the appearance frequency of the region-related information including the character string that matches the character string, the region characteristic degree that is information indicating the strength of the relation of the character string to the region is calculated, and the region characteristic degree is The area feature word that is the character string that satisfies a certain condition is extracted, and the area feature word storage unit includes the area indicated by the one area information including the area feature word extracted by the area feature word extraction unit This is an information processing apparatus that accumulates in the region feature word storage unit in association with region information.

かかる構成により、地域特徴語を、ユーザ等から受け付けた地域情報を用いて取得した地域関連情報から、文字列の出現頻度を利用して抽出することができる。これにより、例えば、地域に特徴的な文字列だけを選択的に地域特徴度として蓄積していくことが可能となる。   With this configuration, it is possible to extract the region feature words from the region related information acquired using the region information received from the user or the like using the appearance frequency of the character string. As a result, for example, it is possible to selectively accumulate only character strings that are characteristic of a region as a regional feature.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域情報受付部は、複数の地域情報の位置に関する情報を更に受け付け、前記地域特徴語抽出部が複数の地域情報についてそれぞれ抽出および算出した一以上の地域特徴語およびその地域特徴度と、前記地域情報の位置に関する情報を用いて取得した複数の地域間の距離の情報とを用いて、類似する前記地域情報をクラスタリングするクラスタリング部とを更に備え、前記地域特徴語蓄積部は、前記一以上の地域特徴語と、前記クラスタリングにより一のクラスタにまとめられた地域情報が示す地域を含む領域情報とを対応付けて前記地域特徴語格納部に蓄積する情報処理装置である。   Further, in the information processing apparatus according to the present invention, in the information processing apparatus, the area information receiving unit further receives information related to positions of a plurality of area information, and the area feature word extracting unit extracts and extracts each of the plurality of area information. A clustering unit that clusters the similar regional information using the calculated one or more regional feature words and the regional feature degree thereof, and information on the distance between a plurality of regions acquired using information on the location of the regional information The regional feature word storage unit associates the one or more regional feature words with the regional information including the regions indicated by the regional information gathered into one cluster by the clustering. An information processing apparatus that accumulates in a storage unit.

かかる構成により、地域特徴語が類似する地域をまとめて構成した領域に、地域特徴語を対応付けて蓄積することができる。これにより、例えば、入力された位置情報に対応する地域に類似する地域の地域特徴語も出力することが可能となり、ユーザに、入力された位置情報に関連する地域の地域特徴語を提示することが可能となる。   With this configuration, it is possible to store the region feature words in association with the region formed by collecting the regions having similar region feature words. Thereby, for example, it is possible to output a region feature word of a region similar to the region corresponding to the input position information, and present the region feature word of the region related to the input position information to the user. Is possible.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域特徴語は、前記地域との関連の強さを示す情報である地域特徴度と対応付けられて格納されており、前記地域特徴語取得部は、前記地域特徴度に応じて前記地域特徴語を取得する情報処理装置である。   In the information processing apparatus according to the present invention, in the information processing apparatus, the regional feature word is stored in association with a regional feature degree that is information indicating the strength of association with the region. The feature word acquisition unit is an information processing apparatus that acquires the regional feature words according to the regional feature degree.

かかる構成により、例えば、領域情報が示す地域に含まれる地域との関連度の高さが高い地域特徴度を優先的に取得して出力することができる。   With this configuration, for example, it is possible to preferentially acquire and output a regional feature having a high degree of association with a region included in the region indicated by the region information.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域関連情報取得部は、前記地域情報受付部が受け付けた前記複数の地域情報をそれぞれ含む検索条件を用いて、WEBページの検索を行い、各地域情報が示す地域のWEBページの情報である地域関連情報をそれぞれ取得する情報処理装置である。   In the information processing apparatus of the present invention, in the information processing apparatus, the region-related information acquisition unit searches for a WEB page using a search condition including each of the plurality of region information received by the region information receiving unit. This is an information processing apparatus that obtains region-related information that is information on the WEB page of the region indicated by each region information.

かかる構成により、多種多様な広い範囲の情報の中から地域特徴語を抽出することができ、例えば、地域特徴語の精度、即ち抽出された地域特徴語が地域に特徴的な文字列であることを示す度合い等を向上させることができる。   With this configuration, it is possible to extract regional feature words from a wide variety of information. For example, the accuracy of the regional feature words, that is, the extracted regional feature words are character strings that are characteristic of the region. The degree of showing can be improved.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域特徴語出力部が出力した地域特徴語を含む検索条件を生成する検索条件生成部と、前記検索条件作成部が作成した検索条件を用いて検索を行い、検索結果を示す情報を取得する検索部と、前記検索部の検索結果を示す情報を出力する検索結果出力部とを更に備えた情報処理装置である。   In the information processing apparatus of the present invention, in the information processing apparatus, a search condition generation unit that generates a search condition including the region feature word output by the region feature word output unit, and a search created by the search condition creation unit The information processing apparatus further includes a search unit that performs a search using a condition and acquires information indicating a search result, and a search result output unit that outputs information indicating the search result of the search unit.

かかる構成により、ユーザ等が指定した位置情報が示す位置に応じた地域特徴語を用いて生成した検索条件を用いて適切な検索を行うことができる。これにより、地域に特徴的な情報を容易に提供することが可能となる。   With such a configuration, it is possible to perform an appropriate search using a search condition generated using an area feature word corresponding to a position indicated by position information designated by a user or the like. This makes it possible to easily provide information characteristic of the area.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域特徴語出力部は、地域特徴語取得部が取得した地域特徴語をリスト表示し、前記リスト表示された地域特徴語のうちの一以上の地域特徴語の指定を受け付ける指定受付部とを更に備え、前記検索条件生成部は、前記地域特徴語出力部が出力した地域特徴語のうちの、前記指定受付部が指定を受け付けた地域特徴語を用いて検索条件を生成する情報処理装置である。   Further, in the information processing apparatus according to the present invention, in the information processing apparatus, the regional feature word output unit displays a list of regional feature words acquired by the regional feature word acquisition unit, and among the regional feature words displayed in the list A designation receiving unit that receives designation of one or more regional feature words, wherein the search condition generation unit accepts designation from the regional feature words output by the regional feature word output unit. This is an information processing device that generates a search condition by using a local feature word.

かかる構成により、ユーザ等が、検索条件を作成する際の補助や、検索に用いられるキーワード等の提案等を行うことができる。   With such a configuration, a user or the like can assist in creating a search condition, suggest a keyword or the like used for the search, and the like.

また、本発明の情報処理装置は、前記情報処理装置において、前記領域情報は、領域の範囲を示す情報であり、前記位置情報取得部は、ユーザの存在する位置を示す情報である前記位置情報を取得し、前記地域特徴語取得部は、前記位置情報取得部が取得した位置情報が示す位置を含む範囲を示す領域情報を検出し、当該領域情報に対応づけられた地域特徴語を、前記地域特徴語格納部から取得する情報処理装置である。   Further, in the information processing apparatus according to the present invention, in the information processing apparatus, the region information is information indicating a range of the region, and the position information acquisition unit is information indicating a position where the user exists. The region feature word acquisition unit detects region information indicating a range including the position indicated by the position information acquired by the position information acquisition unit, and the region feature word associated with the region information is It is an information processing apparatus acquired from a regional feature word storage unit.

かかる構成により、ユーザの存在する位置についての地域特徴度情報を容易に取得することができる。   With this configuration, it is possible to easily acquire regional feature information about the position where the user exists.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域特徴語は、時期を示す情報である時間情報と対応付けられて地域特徴語格納部に格納されており、前記位置情報取得部は、時刻情報を更に取得し、前記地域特徴語取得部は、前記時刻情報が示す時刻を含む時間情報と対応付けられた地域特徴語であって、前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する情報処理装置である。   In the information processing apparatus of the present invention, in the information processing apparatus, the regional feature word is stored in the regional feature word storage unit in association with time information that is information indicating time, and the position information acquisition The unit further acquires time information, and the region feature word acquisition unit is a region feature word associated with time information including the time indicated by the time information, and the position information acquired by the position information acquisition unit It is the information processing apparatus which acquires the area feature word corresponding to the area information indicating the area including the position indicated by from the area feature word storage unit.

かかる構成により、時刻情報に応じた地域特徴語を選択的に取得することができる。これにより、例えば、時刻情報が示す時刻にのみ、利用可能な事象等を示す地域特徴語だけを選択的に取得したりすることが可能となる。   With this configuration, it is possible to selectively acquire regional feature words according to time information. As a result, for example, it is possible to selectively acquire only regional feature words indicating available events only at the time indicated by the time information.

また、本発明の情報処理装置は、前記情報処理装置において、前記地域特徴語は、分野を示す情報である分野情報と対応付けられて地域特徴語格納部に格納されており、前記位置情報取得部は、分野を指定する情報である分野指定情報を更に取得し、前記地域特徴語取得部は、前記分野指定情報が示す分野を含む分野情報と対応付けられた地域特徴語であって、前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する情報処理装置である。   In the information processing apparatus of the present invention, in the information processing apparatus, the regional feature word is stored in the regional feature word storage unit in association with field information that is information indicating a field, and the position information acquisition The unit further acquires field designation information that is information for designating a field, and the region feature word acquisition unit is a region feature word associated with field information including the field indicated by the field designation information, In the information processing apparatus, the local feature word corresponding to the region information indicating the region including the position indicated by the positional information acquired by the positional information acquisition unit is acquired from the regional feature word storage unit.

かかる構成により、分野指定情報に応じた地域特徴語を選択的に取得することができる。これにより,ユーザの望む分野に関する地域特徴語を選択的に取得することができる。   With this configuration, it is possible to selectively acquire regional feature words corresponding to the field designation information. As a result, it is possible to selectively acquire regional feature words related to the field desired by the user.

本発明による情報処理装置等によれば、地域に特徴的な情報を検索するために適切な情報を提供することができる。   According to the information processing apparatus and the like according to the present invention, it is possible to provide appropriate information for searching for information characteristic for a region.

また、このような情報を含む検索条件を用いた適切な検索を行うことが可能な情報処理装置等を提供することができる。   In addition, it is possible to provide an information processing apparatus or the like that can perform an appropriate search using a search condition including such information.

本発明の実施の形態における情報処理装置のブロック図Block diagram of an information processing apparatus in an embodiment of the present invention 同情報処理装置の動作について説明するフローチャートFlow chart for explaining the operation of the information processing apparatus 同情報処理装置の概念図Conceptual diagram of the information processing device 同情報処理装置の動作を説明するための、地域情報のリストを示す図The figure which shows the list of area information for demonstrating operation | movement of the information processing apparatus. 同情報処理装置の動作を説明するための、地域関連情報から抽出された地域特徴語の一例を示す図The figure which shows an example of the area feature word extracted from the area relevant information for demonstrating operation | movement of the information processing apparatus 同情報処理装置の動作を説明するための、地域範囲情報管理表の一例を示す図The figure which shows an example of the area range information management table for demonstrating operation | movement of the information processing apparatus 同情報処理装置の動作を説明するための、地域特徴語管理表の一例を示す図The figure which shows an example of the area characteristic word management table for demonstrating operation | movement of the information processing apparatus. 同情報処理装置の動作を説明するための、地域特徴語のリストの表示例を示す図The figure which shows the example of a display of the list | wrist of a regional feature word for demonstrating operation | movement of the information processing apparatus. 同情報処理装置の動作を説明するための、検索結果の表示例を示す図The figure which shows the example of a display of a search result for demonstrating operation | movement of the information processing apparatus. 同情報処理装置の変形例を示す図The figure which shows the modification of the information processing apparatus 同情報処理装置の変形例を示す図The figure which shows the modification of the information processing apparatus 本発明の実施の形態におけるコンピュータシステムの外観一例を示す模式図Schematic diagram showing an example of the appearance of a computer system in an embodiment of the present invention 本発明の実施の形態におけるコンピュータシステムの構成の一例を示す図The figure which shows an example of a structure of the computer system in embodiment of this invention

以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。   Hereinafter, embodiments of an information processing apparatus and the like will be described with reference to the drawings. In addition, since the component which attached | subjected the same code | symbol in embodiment performs the same operation | movement, description may be abbreviate | omitted again.

(実施の形態)
図1は、本実施の形態における情報処理装置1のブロック図である。
(Embodiment)
FIG. 1 is a block diagram of an information processing apparatus 1 in the present embodiment.

情報処理装置1は、地域特徴語格納部101、位置情報取得部102、地域特徴語取得部103、地域特徴語出力部104、地域情報受付部105、地域関連情報取得部106、地域特徴語抽出部107、クラスタリング部108、地域特徴語蓄積部109、検索条件生成部110、検索部111、検索結果出力部112、指定受付部113、および地域範囲情報格納部114を備えている。   The information processing apparatus 1 includes an area feature word storage unit 101, a position information acquisition unit 102, an area feature word acquisition unit 103, an area feature word output unit 104, an area information reception unit 105, an area related information acquisition unit 106, and an area feature word extraction. Unit 107, clustering unit 108, region feature word storage unit 109, search condition generation unit 110, search unit 111, search result output unit 112, designation reception unit 113, and region range information storage unit 114.

地域特徴語格納部101には、地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納され得る。ここで述べる文字列とは例えば単語である。ただし、複合語も単語と考えて良い。地域特徴語は、例えば、対応する領域情報が示す領域に含まれる地域に対する依存度が高い事象等についての文字列の情報である。また、地域特徴語は、例えば、一部の地域のみに依存して、あるいは関連して出現するような事象等を表すキーワード等の文字列の情報であってもよい。地域特徴語は、例えば、地域における関連性が高い事象についての文字列の情報である。具体的には、地域特徴語は、名産品や地域食品やお土産等の地域特有のものや、お祭りや伝統行事等のイベント、旧跡、名所、建物、方言等の言葉等である。地域特徴語は、ある地域に関するコンテンツに出現し、その他の地域に関するコンテンツには、あまり出現しない事象等である。地域特徴語は、具体的には、「ねぶた祭り」や、「おわら風の盆」、「だんじり祭り」等の地域特有の祭りの名前や、「だやい」、「よだきい」、「おおきに」等の方言等である。ここで述べる地域とは、例えば、都道府県、市、区、郡、町、村等の行政単位としての地域である。また、文化圏等によって分類した地域であってもよい。あるいは、これらの一部を組み合わせた地域、例えば、東北地方や関東地方、港湾地区等の地区や、都市等であっても良い。地域特徴語は、地名や住所等のみの情報を含まない情報であることが好ましい。ここで述べる領域とは、例えば、対応する地域特徴語同士が類似している一以上の地域により構成される領域であることが好ましい。例えば、一の領域に、二つの地域が含まれる場合、この二つの地域のそれぞれに関連性の高い地域特徴語が、類似していることが好ましい。つまり、地域特徴語の類似性の高い地域同士が、一の領域を構成することが好ましい。また、一の領域を構成する地域間の距離は短いことが好ましい。ここで述べる一の領域は、例えば、後述するクラスタリング部108により、地域特徴語の類似性等によって一のクラスタに分割された一以上の地域で構成される領域である。なお、一の領域は、一の地域のみから構成されても良い。地域特徴語に対応する領域を構成する地域が一つである場合、その地域だけが地域特徴語が類似した領域であると考えれてもよい。   The regional feature word storage unit 101 associates regional feature words that are character strings that are highly relevant to a region with region information that is information indicating regions including regions that are highly relevant to the regional feature words. Can be stored. The character string described here is, for example, a word. However, compound words can also be considered words. The regional feature word is, for example, character string information regarding an event having a high degree of dependence on the region included in the region indicated by the corresponding region information. In addition, the regional feature word may be, for example, information on a character string such as a keyword representing an event or the like that appears depending on or related to only a part of the region. The regional feature word is, for example, character string information about an event that is highly relevant in the region. Specifically, the regional characteristic words are words unique to the region such as special products, regional foods and souvenirs, events such as festivals and traditional events, historic sites, sights, buildings, dialects, and the like. An area feature word is an event that appears in content related to a certain area and does not appear much in content related to another area. Specifically, regional feature words include the names of festivals unique to the region, such as “Nebuta Festival”, “Owara Kaze no Bon”, “Danjiri Festival”, “Daidai”, “Yodakii”, “ Dialects such as “Ookini”. The region described here is, for example, a region as an administrative unit such as a prefecture, city, ward, county, town, or village. Moreover, the area classified according to the cultural sphere etc. may be sufficient. Or the area which combined these, for example, Tohoku district, Kanto district, districts, such as a port district, a city, etc. may be sufficient. The regional feature words are preferably information that does not include information such as place names and addresses. The region described here is preferably, for example, a region composed of one or more regions in which corresponding region feature words are similar. For example, when two regions are included in one region, it is preferable that region feature words that are highly relevant to each of the two regions are similar. That is, it is preferable that regions having high similarity of region feature words constitute one region. Moreover, it is preferable that the distance between the areas which comprise one area | region is short. The one region described here is, for example, a region constituted by one or more regions divided into one cluster by the clustering unit 108 described later based on the similarity of region feature words. Note that one area may be composed of only one area. When there is one region that constitutes the region corresponding to the region feature word, it may be considered that only that region is a region where the region feature word is similar.

領域情報は、領域を特定できる情報であれば良い。例えば、領域を識別可能な識別情報等であっても良い。領域情報は、領域のインデックスとなる情報であっても良い。また、領域情報は、領域の範囲を示す情報であってもよい。領域の範囲を示す情報は、領域の境界線(輪郭)を定義可能な情報と考えても良い。領域情報は、例えば、領域の境界線(輪郭)を定義する情報、例えば、領域の境界線を、緯度や経度と対応付けた座標情報やベクター情報で示す情報である。また、領域の範囲を示す情報である領域情報は、領域を構成する一以上の地域を、例えば地域名等の地域の識別情報等を用いて指定する情報であってもよい。また、この場合、当該地域に対して、当該地域の境界線を定義する情報を、図示しない格納部等に予め格納しておくことで、結果的に、当該地域により構成される領域の境界線を定義する情報が取得することが可能である。なお、領域情報は、領域の範囲、即ち、どこからどこまでの範囲が領域であるかを特定可能な情報であれば、領域内に含まれる住所や地名や駅名等を示す情報であっても良い。   The area information may be information that can identify the area. For example, identification information that can identify the region may be used. The area information may be information serving as an area index. The area information may be information indicating the area range. The information indicating the range of the region may be considered as information that can define the boundary line (contour) of the region. The area information is, for example, information that defines a boundary line (contour) of the area, for example, information that indicates the boundary line of the area with coordinate information or vector information in association with latitude and longitude. Further, the region information that is information indicating the range of the region may be information that specifies one or more regions constituting the region using, for example, region identification information such as a region name. Also, in this case, information that defines the boundary line of the area is stored in advance in a storage unit (not shown) or the like, and as a result, the boundary line of the area configured by the area Can be obtained. The area information may be information indicating an address, a place name, a station name, or the like included in the area as long as it is information that can specify the area range, that is, the range from where to where.

なお、地域特徴語は、地域との関連の強さを示す情報である地域特徴度と対応付けられて、当該地域特徴度とともに、地域特徴語格納部101に格納されていてもよい。地域との関連の強さは、ここでは、対応する領域情報が示す領域との関連の強さと考えても良い。地域特徴度は、関連の強さを示すことができる情報であれば、数値や、「高」、「低」等の値など、そのデータ形式等は問わない。また、地域特徴語は、時期を示す情報である時間情報と対応付けられて地域特徴語格納部101に格納されていてもよい。ここで述べる時期とは、季節や、時間帯や、期間等である。時間情報は、例えば、開始や終了の年月日や時刻等を示す情報である。また、地域特徴語は、地域特徴語の分野を示す情報である分野情報と対応付けられて地域特徴語格納部101に格納されていても良い。分野は、地域特徴語が属する分野であり、地域特徴語の属性と考えても良い。また、分野は地域特徴語の上位概念を示す文字列である上位語であっても良い。例えば、地域特徴語が「関さば」である場合、分野は「食品」や「海産物」等であってもよい。時間情報や、分野情報は、地域特徴語を参照して、適宜ユーザ等が入力デバイス等を介して入力するようにしても良い。また、予め時間情報や分野情報等を用意しておき、後述する地域関連情報取得部106が地域関連情報を取得する際に、当該時間情報や分野情報を検索条件に加えて検索を行うようにし、この検索により得られた地域関連情報から抽出した地域特徴語については、これらの時間情報や分野情報を対応付けるようにしても良い。なお、地域特徴語と、領域情報等が対応付けられているとは、例えば、対応付けられているこれらの情報がデータベース等の一のレコードとして管理されていることである。地域特徴語格納部101に地域特徴語や、領域情報や、地域特徴度や、分野情報や時期情報等の情報が蓄積される過程やタイミング等は問わない。例えば、記録媒体を介して入力されたこれらの情報が地域特徴語格納部101で蓄積されても良い。入力デバイスを介して入力されたこれらの情報が地域特徴語格納部101に蓄積されても良い。また、地域特徴語や、領域情報や、地域特徴度は、後述する地域特徴語蓄積部109により蓄積されても良い。地域特徴語格納部101は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。   The regional feature word may be stored in the regional feature word storage unit 101 together with the regional feature degree in association with the regional feature degree that is information indicating the strength of association with the region. Here, the strength of the relationship with the region may be considered as the strength of the relationship with the region indicated by the corresponding region information. As long as the regional feature is information that can indicate the strength of the relationship, the data format or the like such as a numerical value or a value such as “high” or “low” may be used. Further, the regional feature words may be stored in the regional feature word storage unit 101 in association with time information that is information indicating the time. The period described here is a season, a time zone, a period, or the like. The time information is, for example, information indicating the start and end date, time, and the like. Further, the regional feature word may be stored in the regional feature word storage unit 101 in association with the field information that is information indicating the field of the regional feature word. The field is a field to which the regional feature word belongs, and may be considered as an attribute of the regional feature word. The field may be a broader word that is a character string indicating a broader concept of regional feature words. For example, when the regional feature word is “Seki Saba”, the field may be “food”, “marine products”, or the like. The time information and the field information may be appropriately input by the user or the like through an input device or the like with reference to the regional feature words. In addition, time information, field information, etc. are prepared in advance, and when the region-related information acquisition unit 106 described later acquires the region-related information, the time information and the field information are added to the search condition to perform a search. The region feature words extracted from the region-related information obtained by this search may be associated with these time information and field information. The fact that the regional feature words are associated with the region information or the like means that, for example, the associated information is managed as one record such as a database. There is no limitation on the process or timing at which information such as regional feature words, regional information, regional features, field information, and time information is stored in the regional feature word storage unit 101. For example, these pieces of information input via the recording medium may be accumulated in the regional feature word storage unit 101. These pieces of information input via the input device may be accumulated in the regional feature word storage unit 101. In addition, the regional feature word, the regional information, and the regional feature degree may be accumulated by the regional feature word accumulation unit 109 described later. The regional feature word storage unit 101 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium.

位置情報取得部102は、位置を示す情報である位置情報を取得する。位置情報は、上述した領域情報が示す領域のうちの、いずれかの領域内の位置を指定可能な情報であればよい。位置情報は、例えば、緯度と経度等の座標情報である。ただし、地域名等の地域の識別情報や、住所や駅名等の情報であっても良い。位置情報取得部102は、どのように位置情報を取得しても良い。例えば、図示しない入力デバイス等を介してユーザから入力された位置情報を取得しても良い。また、位置情報取得部102は、ユーザが存在する位置を示す情報である位置情報を取得してもよい。例えば、図示しないGPS(global positioning system)等を用いて取得した座標データを位置情報として取得しても良い。また、位置情報取得部102は、位置情報に加えて、時刻を示す情報である時刻情報を更に取得するようにしても良い。時刻情報は、位置情報を取得した現在の時刻の情報であることが好ましい。なお、時刻情報は年月日の情報を含む情報であっても良い。時刻情報は、例えば、情報処理装置1の内部の時計等から取得しても良いし、NTP(Network Time Protocol)等でNTPサーバ等からネットワーク経由で取得してもよい。なお、ここではネットワーク接続を行う通信手段等の構成については説明を省略する。位置情報取得部102は、位置情報に加えて、分野を指定する情報である分野指定情報を更に取得してもよい。位置情報取得部102は、例えば、図示しない入力デバイス等を介してユーザ等が入力する分野を指定する情報を取得しても良い。位置情報等をユーザ等からテンキーやキーボードやマウス等の入力手段等を介して受け付ける場合、位置情報取得部102は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現しても良い。また、GPS等から位置情報等を取得する場合、位置情報取得部102は、例えば、MPUやメモリ等から実現され得る。位置情報取得部102の処理手順は、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。また、位置情報取得部102は、GPS等を備えていても良いし、備えていなくても良い。   The position information acquisition unit 102 acquires position information that is information indicating a position. The position information may be information that can specify the position in any one of the areas indicated by the area information described above. The position information is coordinate information such as latitude and longitude. However, it may be regional identification information such as a regional name, or information such as an address or a station name. The position information acquisition unit 102 may acquire the position information in any way. For example, you may acquire the positional information input from the user via the input device etc. which are not shown in figure. Further, the position information acquisition unit 102 may acquire position information that is information indicating a position where the user exists. For example, coordinate data acquired using a GPS (global positioning system) (not shown) may be acquired as the position information. In addition to the position information, the position information acquisition unit 102 may further acquire time information that is information indicating time. The time information is preferably information on the current time when the position information is acquired. The time information may be information including date information. The time information may be acquired from, for example, a clock inside the information processing apparatus 1 or may be acquired from an NTP server or the like via a network using NTP (Network Time Protocol) or the like. Here, the description of the configuration of communication means for performing network connection is omitted. The position information acquisition unit 102 may further acquire field designation information that is information for designating a field in addition to the position information. For example, the position information acquisition unit 102 may acquire information specifying a field input by a user or the like via an input device (not shown). When receiving position information, etc., from a user or the like via an input means such as a numeric keypad, a keyboard, or a mouse, the position information acquisition unit 102 is realized by a device driver for the input means such as a numeric keypad or a keyboard, or control software for a menu screen. You may do it. Moreover, when acquiring position information etc. from GPS etc., the position information acquisition part 102 may be implement | achieved from MPU, memory, etc., for example. The processing procedure of the position information acquisition unit 102 is realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit). Further, the position information acquisition unit 102 may or may not include a GPS or the like.

地域特徴語取得部103は、位置情報取得部102が取得した位置情報が示す位置を含む領域を示す領域情報に対応した地域特徴語を、地域特徴語格納部101から取得する。具体的には、地域特徴語取得部103は、位置情報取得部102が取得した位置情報が示す位置を含む範囲を示す領域情報を検出し、当該領域情報に対応づけられた地域特徴語を、地域特徴語格納部101から取得する。例えば、領域情報が、領域の境界線の緯度や経度の座標等を定義する情報を含むものである場合、位置情報が示す緯度や経度の座標が、地域特徴語格納部101に格納されている地域特徴語に対応付けられて領域情報のうちの、いずれかの領域情報が示す範囲に含まれているか否かを判断する。そして、いずれかの領域情報が示す範囲に含まれている場合、当該領域情報に対応する地域特徴語を、地域特徴語取得部103が地域特徴語格納部101から読み出す。また、例えば、領域情報が地域名等で構成されている場合、位置情報が示す地域名を含む領域情報に対応する地域特徴語を、地域特徴語取得部103が地域特徴語格納部101から読み出素ようにしても良い。また、地域特徴語に地域特徴度が対応付けられている場合、地域特徴語取得部103は、地域特徴度に応じて地域特徴語を取得するようにしてもよい。例えば、位置情報取得部102が取得した位置情報が示す位置を含む領域を示す領域情報に対応した地域特徴語のうちの、対応する地域特徴度が高いものから順に予め指定された所定数の地域特徴語を取得しても良い。また、対応する地域特徴度の値が、領域情報に対応した地域特徴語に対応した地域特徴度の平均以上のものだけを取得しても良い。   The region feature word acquisition unit 103 acquires from the region feature word storage unit 101 a region feature word corresponding to region information indicating a region including a position indicated by the position information acquired by the position information acquisition unit 102. Specifically, the area feature word acquisition unit 103 detects area information indicating a range including the position indicated by the position information acquired by the position information acquisition unit 102, and determines the area feature word associated with the area information. Obtained from the local feature word storage unit 101. For example, when the area information includes information defining the latitude and longitude coordinates of the boundary line of the area, the latitude and longitude coordinates indicated by the position information are stored in the area feature word storage unit 101. It is determined whether or not it is included in the range indicated by any of the region information in the region information associated with the word. If it is included in the range indicated by any region information, the region feature word acquisition unit 103 reads out the region feature word corresponding to the region information from the region feature word storage unit 101. Further, for example, when the region information is composed of region names, the region feature word acquisition unit 103 reads the region feature word corresponding to the region information including the region name indicated by the position information from the region feature word storage unit 101. You may make it appear. Further, when the regional feature word is associated with the regional feature word, the regional feature word acquisition unit 103 may acquire the regional feature word according to the regional feature degree. For example, a predetermined number of regions specified in advance from the region feature words corresponding to the region information indicating the region including the position indicated by the position information acquired by the position information acquisition unit 102 in descending order of the corresponding region feature degree A feature word may be acquired. Further, only the values of the corresponding regional feature values that are equal to or greater than the average of the regional feature values corresponding to the regional feature words corresponding to the region information may be acquired.

また、地域特徴語が時刻情報と対応付けられている場合、地域特徴語取得部103は、位置情報取得部102が取得した時刻情報が示す時刻を含む時間情報と対応付けられた地域特徴語であって、位置情報取得部102が取得した位置情報が示す位置を含む領域を示す領域情報に対応した地域特徴語を、地域特徴語格納部101から取得するようにしても良い。例えば、ある地域特徴語に対応付けられた時間情報が、3月から5月までの期間を示す情報である場合において、位置情報取得部102が取得した時刻情報が4月18日であれば、当該地域特徴語は、位置情報取得部102が取得した時刻情報が示す時刻を含む時間情報と対応付けられた地域特徴語であると判断される。   When the regional feature word is associated with the time information, the regional feature word acquisition unit 103 is the regional feature word associated with the time information including the time indicated by the time information acquired by the position information acquisition unit 102. Thus, the area feature word corresponding to the area information indicating the area including the position indicated by the position information acquired by the position information acquisition unit 102 may be acquired from the area feature word storage unit 101. For example, when the time information associated with a certain regional feature word is information indicating a period from March to May, and the time information acquired by the position information acquisition unit 102 is April 18, The regional feature word is determined to be a regional feature word associated with time information including the time indicated by the time information acquired by the position information acquisition unit 102.

また、地域特徴語が分野情報と対応付けられている場合、地域特徴語取得部103は、位置情報取得部102が取得した分野指定情報が示す分野を含む分野情報と対応付けられた地域特徴語であって、位置情報取得部102が取得した位置情報が示す位置を含む領域を示す領域情報に対応した地域特徴語を、地域特徴語格納部101から取得するようにしてもよい。例えば、ある地域特徴語に対応付けられた分野情報が、「食べ物」である場合において、位置情報取得部102が取得した分野指定情報が「食べ物」であれば、当該地域特徴語は、位置情報取得部102が取得した分野指定情報が示す分野を含む分野情報と対応付けられた地域特徴語であると判断される。   When the regional feature word is associated with the field information, the regional feature word acquisition unit 103 associates the regional feature word with the field information including the field indicated by the field designation information acquired by the position information acquisition unit 102. In this case, the area feature word corresponding to the area information indicating the area including the position indicated by the position information acquired by the position information acquisition unit 102 may be acquired from the area feature word storage unit 101. For example, when the field information associated with a certain regional feature word is “food” and the field designation information acquired by the position information acquisition unit 102 is “food”, the regional feature word is It is determined that the region feature word is associated with the field information including the field indicated by the field designation information acquired by the acquisition unit 102.

地域特徴語取得部103は、通常、MPUやメモリ等から実現され得る。地域特徴語取得部103の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The regional feature word acquisition unit 103 can be usually realized by an MPU, a memory, or the like. The processing procedure of the regional feature word acquisition unit 103 is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

地域特徴語出力部104は、地域特徴語取得部103が取得した一以上の地域特徴語を出力する。ここでの、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積や一時記憶、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。地域特徴語出力部104は、地域特徴語取得部103が取得した一以上の地域特徴語を用いてリストを構成して、地域特徴語をリスト表示してもよい。また、リスト表示する際に、地域特徴語に対応する地域特徴度に応じて地域特徴語を配列しても良い。例えば、地域特徴度の高い順、即ち、地域との関連性の高い順に、上から順に、あるいは下から順に、地域特徴語を配列しても良い。また、地域特徴語出力部104は、地域特徴語取得部103が取得した一以上の地域特徴語を図示しないメモリ等に一時記憶するようにし、ユーザが、例えば図示しない入力フィールド等に、文字を入力する毎に、入力された文字列と前方一致する地域特徴語を地域特徴度順に読み出して、いわゆるドロップダウンリスト等を構成し表示するようにしても良い。なお、ここで述べるプログラムとは、コンピュータの行う処理(演算・動作・通信など)の手順を指示したもののことである。地域特徴語出力部104は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。地域特徴語出力部104は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。また、メモリ等に地域特徴語を出力、即ち蓄積するためのMPU等を備えていても良い。   The regional feature word output unit 104 outputs one or more regional feature words acquired by the regional feature word acquisition unit 103. Here, output means display on a display, projection using a projector, printing on a printer, sound output, transmission to an external device, accumulation or temporary storage in a recording medium, other processing device or other It is a concept that includes delivery of processing results to a program or the like. The regional feature word output unit 104 may construct a list using one or more regional feature words acquired by the regional feature word acquisition unit 103 and display the list of regional feature words. Further, when displaying the list, the region feature words may be arranged according to the region feature degree corresponding to the region feature word. For example, the regional feature words may be arranged in order from the highest regional feature, that is, from the top in the descending order of the relevance to the region, or from the bottom. In addition, the regional feature word output unit 104 temporarily stores one or more regional feature words acquired by the regional feature word acquisition unit 103 in a memory (not shown) or the like, and the user inputs characters into an input field (not shown), for example. Each time it is input, the region feature words that match the input character string in the forward direction may be read out in order of the region feature degree, and a so-called drop-down list or the like may be configured and displayed. The program described here is an instruction for a procedure of processing (calculation / operation / communication) performed by a computer. The regional feature word output unit 104 may be considered as including or not including an output device such as a display or a speaker. The regional feature word output unit 104 can be implemented by output device driver software, or output device driver software and an output device. Further, an MPU or the like for outputting, that is, accumulating regional characteristic words in a memory or the like may be provided.

地域情報受付部105は、地域を示す情報である地域情報を一以上受け付ける。ここで述べる地域は、上述した地域と同様のものである。地域情報は、例えば、地域名等の地域を識別可能な情報である。地域情報は、例えば、検索用のWEBサイト(検索サイト)等で提供される検索用のプログラム等において検索のキーワードまたはその一部として利用可能な文字列の情報である。また、地域情報受付部105は、複数の地域情報の位置に関する情報を更に受け付けてもよい。複数の地域情報の位置に関する情報とは、言い換えれば、複数の地域情報がそれぞれ示す地域の位置に関する情報である。複数の地域情報の位置に関する情報は、結果的に、複数の地域間の距離を算出可能な情報であればよい。例えば、複数の地域情報が示す地域の位置を示す、緯度や経度の座標等で示す情報であっても良いし、複数の地域情報が示す地域間の距離を示す情報であってもよい。地域の位置を示す情報は、地域内のどの位置であっても良く、例えば、地域の中心と考えられる位置や重心等の位置の情報であっても良いし、地域の境界上の一の位置を示す情報であっても良い。地域の中心と考えられる位置は、例えば地域の行政の中心、例えば、都道府県庁や、役所等が存在する位置と考えても良い。ここで述べる受け付けとは、ユーザ等によるキーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。地域情報の入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。地域情報受付部105は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。   The area information receiving unit 105 receives one or more pieces of area information that is information indicating the area. The region described here is the same as the region described above. The area information is information that can identify an area such as an area name, for example. The regional information is, for example, information on a search keyword provided in a search WEB site (search site) or the like, or character string information that can be used as a part thereof. In addition, the area information receiving unit 105 may further receive information regarding the position of a plurality of area information. In other words, the information on the positions of the plurality of pieces of area information is information on the positions of the areas indicated by the pieces of area information. As a result, the information regarding the position of the plurality of area information may be information that can calculate the distance between the plurality of areas. For example, it may be information indicating the position of a region indicated by a plurality of region information, such as latitude and longitude coordinates, or may be information indicating a distance between regions indicated by a plurality of region information. The information indicating the position of the region may be any position in the region, for example, information on the position considered to be the center of the region, the position of the center of gravity, etc., or one position on the boundary of the region It may be information indicating. The position considered as the center of the area may be considered as the position where the administrative center of the area, for example, a prefectural office or a government office exists. The reception described here refers to reception of information input from an input device such as a keyboard, mouse, and touch panel by a user, reception of information transmitted via a wired or wireless communication line, an optical disk, a magnetic disk, and a semiconductor memory. It is a concept including reception of information read from a recording medium. The area information input means may be anything such as a numeric keypad, keyboard, mouse or menu screen. The area information receiving unit 105 can be realized by a device driver of input means such as a numeric keypad or a keyboard, control software for a menu screen, and the like.

地域関連情報取得部106は、地域情報受付部105が受け付けた地域情報を含む検索条件を用いて検索を行い、当該地域情報が示す地域に関連した情報である一以上の地域関連情報を取得する。地域関連情報は、例えば、地域に関連した情報を含むWEBページの情報である。WEBページの情報は、いわゆるWEBブラウザ等で閲覧やダウンロード可能な情報であれば良く、例えば、HTML形式やXML形式の情報等である。ここでの地域関連情報は、文字列の情報を含む情報である。なお、ここでは、WEB等からダウンロード可能な地域に関連した情報もWEBページの情報と考える。例えば、地域関連情報取得部106は、地域情報受付部105が受け付けた複数の地域情報をそれぞれ含む検索条件を用いて、WEBページの検索を行い、各地域情報が示す地域のWEBページの情報である地域関連情報をそれぞれ取得する。具体的には、地域関連情報取得部106は、地域情報受付部105が受け付けた地域情報を含む検索条件を構成し、当該検索条件を、予め指定された所定のWEB上の、WEBページを検索するための検索サイト等にインターネット等のネットワーク経由で送信する。そして、検索サイトが検索条件を用いて実行した検索の結果を、ネットワークを介して受信する。検索サイトとは、例えばWEBページを検索するための検索用プログラム等を提供するWEBサイトである。通常、この検索結果は、検索条件に合致する複数のWEBページ等のURL等のアドレスを示す情報であるため、この検索結果が示すWEBページの情報を、WEBサイト等からネットワーク経由で取得する。この取得した情報が地域関連情報である。通常、検索サイト等の検索結果は複数のアドレスの情報であることが多いため、地域関連情報を取得する際には、検索結果として得られたアドレス情報のうちの、検索条件に対する合致の度合いが高い予め指定された所定数のアドレス情報だけを用いることが好ましい。検索条件とは、例えば、地域情報受付部105が受け付けた地域情報を用いて構成された文字列、即ちキーワード列である。この場合、検索条件が、地域情報のみから構成されていても良い。また、検索条件は、例えば、地域情報を含む検索クエリであってもよい。例えば、地域情報をwhere節に含むSQL文であってもよい。地域関連情報取得部106は、地域情報受付部105が複数の地域情報を受け付けた場合、地域情報受付部105が受け付けた複数の地域情報をそれぞれ含む検索条件を用いて検索を行い、各地域情報が示す地域の地域関連情報をそれぞれ取得する。取得した地域関連情報は、例えば、図示しない記憶媒体等に蓄積される。なお、地域関連情報取得部106は、インターネット等のネットワークと接続された図示しない送信部や受信部等を用いて、検索条件や検索結果の送受信等を行うが、ここでは、送信部や受信部等の構成等の説明は省略する。また、地域関連情報取得部106は、必ずしもWEBページの検索を行い、各地域情報が示す地域のWEBページの情報である地域関連情報をそれぞれ取得する必要はない。例えば、地域関連情報のデータベース等が予め図示しない格納部等に用意されている場合に、当該データベースから、地域情報を含む検索条件を用いて地域関連情報を取得しても良い。地域関連情報取得部106は、通常、MPUやメモリ等から実現され得る。地域関連情報取得部106の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The region-related information acquisition unit 106 performs a search using the search condition including the region information received by the region information reception unit 105, and acquires one or more region-related information that is information related to the region indicated by the region information. . The region related information is, for example, information on a WEB page including information related to the region. The information on the WEB page may be information that can be browsed or downloaded by a so-called WEB browser or the like, for example, information in an HTML format or an XML format. Here, the region-related information is information including character string information. Note that here, information related to a region that can be downloaded from WEB or the like is also considered to be information on the WEB page. For example, the region-related information acquisition unit 106 searches for a WEB page using search conditions each including a plurality of region information received by the region information reception unit 105, and uses the information on the WEB page of the region indicated by each region information. Each area related information is acquired. Specifically, the region-related information acquisition unit 106 configures a search condition including the region information received by the region information reception unit 105, and searches the WEB page on a predetermined WEB specified in advance. To a search site or the like through a network such as the Internet. Then, the result of the search executed by the search site using the search condition is received via the network. The search site is a WEB site that provides a search program for searching a WEB page, for example. Normally, this search result is information indicating addresses such as URLs of a plurality of WEB pages that match the search conditions, and therefore the information of the WEB page indicated by the search results is acquired from the WEB site or the like via a network. This acquired information is region-related information. Usually, the search result of a search site or the like is often information of a plurality of addresses. Therefore, when acquiring region-related information, the degree of matching with the search condition in the address information obtained as a search result is It is preferred to use only a predetermined number of high pre-specified address information. The search condition is, for example, a character string configured using the area information received by the area information receiving unit 105, that is, a keyword string. In this case, the search condition may be composed only of regional information. The search condition may be a search query including area information, for example. For example, it may be an SQL sentence including the area information in the where clause. When the region information receiving unit 105 receives a plurality of pieces of area information, the region related information acquiring unit 106 performs a search using a search condition including each of the plurality of pieces of region information received by the region information receiving unit 105. Each area related information of the area indicated by is acquired. The acquired area-related information is accumulated in, for example, a storage medium (not shown). The region-related information acquisition unit 106 transmits and receives search conditions and search results using a transmission unit and a reception unit (not shown) connected to a network such as the Internet. Here, the transmission unit and the reception unit are used. The description of the configuration etc. is omitted. Further, the region-related information acquisition unit 106 does not necessarily need to search the WEB page and acquire the region-related information that is information on the WEB page of the region indicated by each region information. For example, when a region-related information database or the like is prepared in advance in a storage unit (not shown), the region-related information may be acquired from the database using a search condition including the region information. The region-related information acquisition unit 106 can usually be realized by an MPU, a memory, or the like. The processing procedure of the region-related information acquisition unit 106 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

地域特徴語抽出部107は、地域関連情報取得部106が取得した地域関連情報から、地域特徴語を抽出する。ここで、地域特徴語抽出部107は、一の地域情報に対応して取得した地域関連情報から、出現頻度の高い文字列を地域特徴語として取得しても良いが、このようにして取得した地域特徴語は、必ずしも一の地域に特徴的な文字列でないことが考えられる。例えば、他の地域について取得した地域関連情報においても、同様に出現頻度が高い文字列である場合が考えられるからである。   The region feature word extraction unit 107 extracts a region feature word from the region related information acquired by the region related information acquisition unit 106. Here, the regional feature word extraction unit 107 may obtain a character string having a high appearance frequency as a regional feature word from the regional related information obtained corresponding to one piece of regional information. It is conceivable that the regional feature word is not necessarily a character string characteristic of one region. For example, the region-related information acquired for other regions may be a character string having a high appearance frequency.

このため、例えば、地域情報受付部105が複数の地域情報を受け付け、地域関連情報取得部106が、各地域情報について、それぞれ一以上の地域関連情報を取得するようにしたうえで、地域特徴語抽出部107は、地域関連情報取得部106が取得した一の地域情報が示す地域の地域関連情報に出現する文字列について、当該一の地域情報が示す地域の地域関連情報内における出現頻度と、複数の地域情報が示す複数の地域の地域関連情報内における、当該文字列と一致する文字列を含む地域関連情報の出現頻度とを用いて、文字列の、地域との関連の強さを示す情報である地域特徴度を算出する。そして、当該地域特徴度が所定の条件を満たす文字列である地域特徴語を抽出する。ここでの文字列は、地域関連情報に出現する文字列のうちの所定の条件を満たす文字列である。例えば、特定の品詞の文字列である。なお、地域関連情報取得部106が一の地域情報が示す地域について複数の地域関連情報を取得した場合、地域特徴語抽出部107は、当該複数の地域関連情報を一の地域関連情報として扱う   For this reason, for example, the area information receiving unit 105 receives a plurality of pieces of area information, and the area related information acquisition unit 106 acquires one or more pieces of area related information for each area information. For the character string that appears in the region-related information of the region indicated by the one region information acquired by the region-related information acquisition unit 106, the extraction unit 107, the appearance frequency in the region-related information of the region indicated by the one region information, Indicates the strength of the relationship between the character string and the region using the frequency of appearance of the region related information including the character string that matches the character string in the region related information of the plurality of regions indicated by the plurality of region information. The regional feature degree which is information is calculated. Then, an area feature word that is a character string whose area feature degree satisfies a predetermined condition is extracted. The character string here is a character string that satisfies a predetermined condition among character strings that appear in the region-related information. For example, a character string with a specific part of speech. When the region-related information acquisition unit 106 acquires a plurality of pieces of region-related information for a region indicated by one piece of region information, the region feature word extraction unit 107 handles the plurality of pieces of region-related information as one piece of region-related information.

具体的には、地域特徴語抽出部107は、地域関連情報取得部106が取得した一の地域情報が示す地域の地域関連情報から、形態素解析により地域関連情報内の文字列(例えば単語)の品詞を取得し、地域関連情報内の文字列のうちの特定の品詞の文字列、例えば、名詞と形容詞の文字列のみを抽出する。形態素解析のシステムとしては、例えば、「Mecab(和布蕪)」(http://mecab.sourceforge.net/)や、「ChaSen(茶筌)」(http://chasen.naist.jp)等が利用可能である。   Specifically, the region feature word extraction unit 107 extracts a character string (for example, a word) in the region related information from the region related information of the region indicated by the one region information acquired by the region related information acquisition unit 106 by morphological analysis. Part-of-speech is acquired, and only a character string of a specific part-of-speech, for example, a character string of nouns and adjectives is extracted from the character strings in the region-related information. As a morphological analysis system, for example, “Mecab (Japanese candy)” (http://mecab.sourceforge.net/), “ChaSen” (http://chasen.naist.jp), etc. are used. Is possible.

次に、形態素解析で抽出した名詞と形容詞の文字列の中から、各地域の地域関連情報において特徴的な文字列の抽出する。この抽出には、ここでは、いわゆるtf−idfの手法を利用する。具体的には、一の地域の地域関連情報内から抽出した各文字列について、次の式を用いて地域特徴度を算出する。なお、tf−idfについては、公知技術であるので詳細な説明は省略する。tf−idfについては、例えば、http://mikilab.doshisha.ac.jp/dia/research/report/2008/1110/002/report20081110002.html」等を参考されたい。   Next, a character string characteristic in the region-related information of each region is extracted from the character strings of nouns and adjectives extracted by morphological analysis. Here, a so-called tf-idf technique is used for this extraction. Specifically, for each character string extracted from within the region-related information of one region, the region feature degree is calculated using the following formula. Since tf-idf is a known technique, detailed description thereof is omitted. For tf-idf, see, for example, http: // mikilab. doshisha. ac. jp / dia / research / report / 2008/1110/002 / report2000081110002. Please refer to “html” and the like.

Figure 2010198281
Figure 2010198281

DLCは地域特徴度(Degree of Local Characteristic)、tfは一の地域の地域関連情報内におけるある文字列の出現頻度、dfはその他の複数の地域の地域関連情報のうちの、同じ文字列を含む地域関連情報の出現頻度をそれぞれ表す。その他の複数の地域は、地域情報受付部105が受け付けた地域情報が示す地域のうちの、一の地域以外の全ての地域であることが好ましいが、その一部の地域であっても良い。なお、通常は、地域情報受付部105が受け付ける地域情報は、「prefecture(県)、city(市)、ward(区)、town(町)」等の地域レベルのうちの、一の地域レベルについての情報である。一の地域レベルの地域情報が示す地域は、通常、重複しない地域である。上記のような式を用いることで、一の地域の地域関連情報(ここでは、WEBページ)で頻出する文字列のうちの、その他の地域の地域関連情報では出現頻度が少ない、もしくは出現しない文字列ほど、地域特徴度(DLC)の値が高くなる。そして、地域レベル別に、地域特徴度の値が高いものを、その一の地域の地域特徴語として抽出する。ここでは、例えば、地域特徴度の値が、予めユーザ等が指定した閾値以上のものを地域特徴語と指定取得する。このようにすることで、一の地域において出現頻度が高く、他の地域においては出現頻度が高くない文字列を、地域特徴語として取得することが可能となる。なお、地域特徴語抽出部107は、複数の地域情報のそれぞれについても、同様に、順次地域特徴語を抽出するようにして良い。   DLC is a regional feature (Degree of Local Characteristic), tf is an appearance frequency of a character string in the region-related information of one region, and df includes the same character string of the region-related information of other regions Represents the frequency of appearance of region-related information. The plurality of other regions are preferably all regions other than the one of the regions indicated by the region information received by the region information receiving unit 105, but may be some of the regions. Normally, the area information received by the area information receiving unit 105 is one area level among the area levels such as “prefecture, city”, “ward”, and “town”. Information. A region indicated by region information at one region level is usually a region that does not overlap. Of the character strings that frequently appear in the region-related information in one region (here, the WEB page), the characters that do not appear frequently or do not appear in the region-related information in other regions by using the above formula The value of the regional feature (DLC) becomes higher as the column is reached. Then, for each regional level, those having a high regional feature value are extracted as regional feature words of that one region. Here, for example, a region feature value having a value greater than or equal to a threshold value previously designated by the user or the like is designated and acquired as a region feature word. By doing in this way, it becomes possible to acquire a character string having a high appearance frequency in one region and not having a high appearance frequency in another region as a regional feature word. Similarly, the regional feature word extraction unit 107 may sequentially extract the regional feature words for each of a plurality of pieces of regional information.

地域特徴度の算出には、tf−idfの手法を用いているが、対象としている地域のレベル(level)により、抽出される地域特徴語や地域特徴度は異なるものとなる。地域のレベルをどのようなレベルに設定するかによって、地域特徴度の計算時間と、その結果の精度に大きな影響が現れる。したがって、どのようなレベルの地域情報を用いるかは、その用途や状況等に応じて適宜選択するようにすればよい。なお、地域のレベルとは地域の階層を示す情報と考えても良い。   The tf-idf method is used to calculate the regional feature, but the extracted regional feature words and regional features differ depending on the level of the target region. Depending on what level the region level is set to, the calculation time of the region feature degree and the accuracy of the result have a great influence. Therefore, what level of regional information should be used may be appropriately selected according to its use and situation. The regional level may be considered as information indicating the regional hierarchy.

また、上述したように、通常は、地域情報受付部105が受け付ける地域情報は、「prefecture(県)、city(市)、ward(区)、town(町)」等の地域レベルのうちの、一の地域レベルについての情報であるが、地域情報受付部105は、地域レベル別に、異なる複数のレベルの地域情報を受け付けるようにしても良い。地域情報受付部105が「prefecture(県)、city(市)、ward(区)、town(町)」等の異なった地域レベル別に地域情報を受け付ける場合、地域関連情報取得部106は、地域レベル別に、地域関連情報を取得し、地域特徴語抽出部107は、地域レベル別に地域特徴度を算出するようにし、地域レベル別に、地域特徴語等を取得するようにしても良い。この場合、後述する地域特徴語蓄積部109が、地域特徴語が対応するレベルを示す情報であるレベル情報と対応付けて、地域特徴語格納部101に格納されるようにしても良いし、クラスタリング部108がレベル別の地域についてクラスタリング等を行うようにしてもよい。また、この場合、上述した位置情報取得部102が、位置情報とともに、どのレベル情報と対応付けられた地域特徴語を取得するかを指定するためのレベル指定情報等を取得するようにし、地域特徴語取得部103は、レベル指定情報により指定されたレベル情報に対応した地域特徴語の中から地域特徴語を取得するようにしても良い。あるいは、地域特徴語取得部103は、全てのレベル情報に対応した地域特徴語の中から、レベルに関係なく地域特徴語を取得するようにしても良い。ただし、地域特徴語抽出部107は、上記以外の手法により地域特徴語を抽出してもよい。地域特徴語抽出部107は、通常、MPUやメモリ等から実現され得る。地域特徴語抽出部107の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   In addition, as described above, the area information received by the area information receiving unit 105 is normally the area level such as “prefecture (city), city (city), word (ward), town (town)”, etc. Although it is information about one regional level, the regional information receiving unit 105 may receive regional information of a plurality of different levels for each regional level. When the regional information receiving unit 105 receives regional information according to different regional levels such as “prefecture, city (city), ward (town), town”, etc., the regional related information acquisition unit 106 Separately, region-related information is acquired, and the region feature word extraction unit 107 may calculate a region feature degree for each region level, and may acquire a region feature word or the like for each region level. In this case, the regional feature word storage unit 109 to be described later may be stored in the regional feature word storage unit 101 in association with level information that is information indicating the level to which the regional feature word corresponds, or clustering. The unit 108 may perform clustering or the like for each level area. Further, in this case, the position information acquisition unit 102 described above acquires level designation information for designating which level information is associated with the position information along with the position information. The word acquisition unit 103 may acquire the regional feature word from the regional feature words corresponding to the level information designated by the level designation information. Alternatively, the region feature word acquisition unit 103 may acquire the region feature words from the region feature words corresponding to all the level information regardless of the level. However, the regional feature word extraction unit 107 may extract regional feature words by a method other than the above. The regional feature word extraction unit 107 can usually be realized by an MPU, a memory, or the like. The processing procedure of the regional feature word extraction unit 107 is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

クラスタリング部108は、地域特徴語抽出部107が複数の地域情報についてそれぞれ一以上の地域特徴語およびその地域特徴度を抽出および算出した場合に、当該複数の地域情報についてそれぞれ抽出および算出した一以上の地域特徴語およびその地域特徴度と、地域情報の位置に関する情報を用いて取得した複数の地域間の距離の情報とを用いて、類似する地域情報をクラスタリングする。   When the regional feature word extraction unit 107 extracts and calculates one or more regional feature words and their regional feature degrees for each of a plurality of pieces of regional information, the clustering unit 108 extracts and calculates each of the plurality of pieces of regional information. Similar regional information is clustered using the regional feature words and their regional feature degrees, and information on the distances between a plurality of regions acquired using information on the location of the regional information.

例えば、上記のように地域特徴語抽出部107等が各地域毎に地域関連語を取得したとすると、例えば地域のレベルが細分化されすぎている場合等においては、隣接している地域や距離が近い地域間において抽出される地域特徴語が類似している場合がある。このような場合、地域特徴語が類似している複数の地域をそれぞれ個別に一の領域と考えて、地域特徴語を対応付けるよりは、このような地域を併合して構成した領域を一の領域と考えて、当該領域に対して地域特徴語を対応付ける方が、データ量等を削減する上で好ましい。また、併合した地域のうちの一方の地域についての地域特徴語を取得する際に、併合した類似する他の地域についての地域特徴語も補足的に提示されることとなる結果、一方の地域についての検索等を行う際に、その地域がどのような地域であるかをユーザが把握しやすくなるという効果がある。   For example, if the regional feature word extraction unit 107 or the like acquires regional related words for each region as described above, for example, when the level of the region is too subdivided, the adjacent region or distance There are cases where the region feature words extracted between regions close to are similar. In such a case, rather than considering each region with similar regional feature words as a single region and associating the regional feature words with each other, the region formed by merging these regions is a single region. Therefore, it is preferable to associate a region feature word with the area in order to reduce the amount of data. In addition, when acquiring regional feature words for one of the merged regions, the region feature words for other similar regions that were merged are also presented as a supplement. When performing a search or the like, there is an effect that it becomes easy for the user to grasp what kind of area the area is.

このため、クラスタリング部108は、地域特徴語が類似している地域のクラスタを作成する。ここは、例えば、重心法というクラスタリング手法が利用可能である。重心法については、「http://www.ie.reitaku−u.ac.jp/〜tak/datB/datB_clust.pdf」等を参考されたい。具体的には、まず、一の地域Gの特徴を、以下に示すようなベクトルとして定義する。   For this reason, the clustering unit 108 creates a cluster of regions where the region feature words are similar. Here, for example, a clustering method called a centroid method can be used. For the centroid method, refer to “http://www.ie.reitaku-u.ac.jp/˜tak/datB/datB_clust.pdf”. Specifically, first, the characteristics of one region G are defined as vectors as shown below.

Figure 2010198281
Figure 2010198281

ここで、/LCは、地域Gのベクトルであるとする。ここでは、このベクトルを地域特徴語ベクトルと称す。lgは、一の地域におけるある地域特徴語の地域特徴度を表す。lg〜lgは、地域情報受付部105が受け付けた複数の地域から、地域特徴語抽出部107が抽出した地域特徴語を、重複を除外して併合して得られる地域特徴語に対応して設けられたベクトルの要素であり、各要素の値は、例えば、対応する地域特徴語についての地域特徴度の値が用いられる。ただし、地域Gから抽出した地域特徴語に、併合した地域特徴語のうちの一つが含まれていない場合、地域Gの地域特徴語ベクトルにおいて、当該地域特徴語に対応する要素の値は、例えば0とする。なお、併合する地域特徴語は、各地域において抽出された地域特徴語のうちの全てでなくても良く、例えば、地域特徴度(DLC)の値が上位から所定の順位までの地域特徴語であってもよい。 Here, / LC G is assumed to be a vector of region G. Here, this vector is referred to as a regional feature word vector. lg represents the regional feature degree of a certain regional feature word in one region. lg 1 to lg n correspond to regional feature words obtained by merging the regional feature words extracted by the regional feature word extraction unit 107 from a plurality of regions received by the regional information reception unit 105 by excluding duplicates. As the value of each element, for example, the value of the regional feature degree for the corresponding regional feature word is used. However, if one of the merged regional feature words is not included in the regional feature word extracted from the regional G, the value of the element corresponding to the regional feature word in the regional feature word vector of the regional G is, for example, 0. The regional feature words to be merged may not be all of the regional feature words extracted in each region. For example, regional feature words having a regional feature value (DLC) value from the top to a predetermined rank are used. There may be.

クラスタリング部108は、二つの地域G、Gについて地域特徴語抽出部107が取得した地域特徴度を用いてそれぞれ構成した上記式で示したような地域特徴語ベクトルと、地域情報受付部105が受け付けた二つの地域G1、G2の位置に関する情報を用いて取得した二つの地域間の距離とを用いて、以下に示す式を用いて、二つの地域GとGの類似性を判定する。なお、上述したように地域特徴語ベクトル/LCG2を構成するn個のベクトルの要素は、地域特徴語ベクトル/LCG1を構成するn個のベクトルの要素に対応する地域特徴語と同じ地域特徴語についての地域特徴度であるとする。 The clustering unit 108 uses the regional feature word vectors configured by using the regional feature degrees acquired by the regional feature word extraction unit 107 for the two regions G 1 and G 2 , and the regional information reception unit 105. The similarity between the two regions G 1 and G 2 is determined using the following formula using the distance between the two regions acquired using the information on the positions of the two regions G 1 and G 2 received by To do. As described above, the n vector elements constituting the area feature word vector / LC G2 are the same area features as the area feature words corresponding to the n vector elements constituting the area feature word vector / LC G1. Suppose that it is the local feature degree about a word.

Figure 2010198281
Figure 2010198281

、w(=1−w)(0≦w,w≦1)は重み、distance(G,G)は、地域GとGとの距離である。なお、地域情報受付部105が受け付けた二つの地域G1、G2の位置に関する情報が、地域間の距離の値であれば、その値をそのまま利用し、二つの地域G、Gの位置に関する情報が、地域の位置を示す情報であれば、この位置間の距離を演算等により算出する。w、wは、試験的に値を変更して地域間の類似度を算出することで、適切と考えられる値をユーザ等が適宜判断して、予め設定しておく。上記の式の値が大きいほど、二つの地域の類似度が高いこととなる。このようにベクトルを比較して二つの地域の類似度を求める手法はベクトル空間法と呼ばれる。ただし、ここでは、二つの地域間の距離の値を要素として組み入れている点で、一般的なベクトル空間法とは異なる。このような距離の要素を加えることで、二つの地域の地域特徴語についての類似度が高くても、二つの地域の距離が大きく離れている場合、二つの地域を同じ領域としてクラスタ化しないようにすることができる。なお、距離の要素を加える必要がない場合、距離の要素は省略しても良い。 w 1 and w 2 (= 1−w 1 ) (0 ≦ w 1 , w 2 ≦ 1) are weights, and distance (G 1 , G 2 ) is a distance between the regions G 1 and G 2 . In addition, if the information regarding the positions of the two regions G1 and G2 received by the region information receiving unit 105 is a value of the distance between the regions, the value is used as it is, and the information regarding the positions of the two regions G 1 and G 2 is used. If the information is information indicating the position of the area, the distance between the positions is calculated by calculation or the like. The values of w 1 and w 2 are set in advance by appropriately determining values considered appropriate by changing the values on a trial basis and calculating the similarity between regions. The greater the value of the above equation, the higher the similarity between the two regions. This method of comparing vectors to find the similarity between two regions is called a vector space method. However, here, it differs from the general vector space method in that the value of the distance between two regions is incorporated as an element. By adding such a distance element, even if the degree of similarity of the regional feature words in the two regions is high, the two regions are not clustered as the same region if the distance between the two regions is greatly separated. Can be. If there is no need to add a distance element, the distance element may be omitted.

このような処理を、地域特徴語抽出部107が地域特徴語を抽出した複数の地域から取り出した二つの地域の組合せに対して順次実施して、二つの地域間の類似度を順次算出し、類似している地域の地域特徴度ベクトルを順次まとめていく。まとめる際には、例えば、まとめる対象となる地域特徴語ベクトルの各要素の値を平均した値を持つベクトル、即ち、重心ベクトルを、まとめた後のベクトルとして生成する。この処理を繰り返し行うことで、抽出された地域特徴語が類似する地域をクラスタに分割することができる。また、クラスタリング部108は、例えば、クラスタリングをした結果の重心ベクトルを生成し、そのベクトルにおいて値が高い要素に対応した文字列、即ち、地域特徴度の高い文字列を各クラスタの地域特徴語として取得する。あるいはクラスタリングにより一のクラスタにまとめられる一以上の地域特徴度ベクトルのそれぞれにおける、高い値の要素に対応した地域語、即ち地域特徴度の高い値に対応した地域特徴語を、重複を削除し併合して得られた地域特徴語群を、当該一のクラスタの地域特徴語として取得しても良い。地域特徴度が高いとは、地域特徴度が所定の閾値を超えた値であることや、地域特徴度の値が上位から所定の順位までの値であること等を意味する。地域特徴度は、クラスタリング部108は、クラスタに分割した地域を示す情報、即ち類似する地域を示す情報を、例えば図示しない記憶部等に一時記憶する。また、このクラスタリングされた地域情報に対応して取得された地域特徴語を一時記憶する。   Such processing is sequentially performed on the combination of two regions extracted from the plurality of regions from which the region feature word extraction unit 107 has extracted the region feature words, and the similarity between the two regions is sequentially calculated, The regional feature vectors of similar regions will be collected sequentially. At the time of grouping, for example, a vector having a value obtained by averaging the values of the elements of the region feature word vectors to be grouped, that is, a barycentric vector is generated as a vector after grouping. By repeatedly performing this process, it is possible to divide a region having similar extracted region feature words into clusters. In addition, the clustering unit 108 generates, for example, a centroid vector as a result of clustering, and a character string corresponding to an element having a high value in the vector, that is, a character string having a high regional feature is used as a regional feature word of each cluster. get. Or, in each of one or more regional feature vectors combined into one cluster by clustering, local words corresponding to high value elements, that is, regional feature words corresponding to high regional feature values are deleted and merged. The regional feature word group obtained in this way may be acquired as the regional feature word of the one cluster. High regional feature means that the regional feature is a value exceeding a predetermined threshold, the value of the regional feature is a value from a higher rank to a predetermined rank, and the like. As for the regional feature, the clustering unit 108 temporarily stores information indicating regions divided into clusters, that is, information indicating similar regions, for example, in a storage unit (not shown). In addition, the regional feature words acquired corresponding to the clustered regional information are temporarily stored.

クラスタリング部108は、通常、MPUやメモリ等から実現され得る。クラスタリング部108の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The clustering unit 108 can be usually realized by an MPU, a memory, or the like. The processing procedure of the clustering unit 108 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

地域特徴語蓄積部109は、地域特徴語抽出部107が抽出した地域特徴語を、地域情報が示す地域を含む領域情報と対応付けて地域特徴語格納部101に蓄積する。例えば、地域特徴語蓄積部109は、複数の地域情報のうちの一の地域について地域特徴語抽出部107が抽出した地域特徴語を、当該一の地域情報が示す地域を含む領域情報と対応付けて地域特徴語格納部101に蓄積する。例えば、上述したようなクラスタリングが行われない場合等においては、地域特徴語蓄積部109は、一の地域情報が示す地域の境界線等を示す情報を、後述する地域範囲情報格納部114等に地域情報と対応付けて格納されている、当該地域情報が示す地域の境界線を定義する情報等から取得し、この情報を領域情報として地域特徴語と対応付けて蓄積する。あるいは境界線等の情報の代わりに、地域情報等を領域情報として蓄積しても良い。また、上述したように、クラスタリング部108により、地域のクラスタリングが行われた場合、地域特徴語蓄積部109は、一以上の地域特徴語と、クラスタリングにより一のクラスタに分割された地域情報が示す地域を含む領域情報とを対応付けて地域特徴語格納部101に蓄積する。例えば、一のクラスタに分割された一以上の地域情報が示す地域の境界線等を示す情報を、後述する地域範囲情報格納部114等に地域情報と対応付けて格納されている、当該地域情報が示す地域の境界を定義する情報等から取得し、この情報を併合して構成した境界線の情報を領域情報として、地域間の類似度を判断する際に利用された地域特徴語と対応付けて蓄積する。なお、地域範囲情報格納部114等から地域の境界線を定義する情報を取得する代わりに、インターネット等のネットワーク経由で、国土に関する数値情報を提供している情報等を提供しているWEBページ等から地域の境界線や輪郭を示す情報を取得するようにしても良い。また、地域特徴語蓄積部109は、境界線等の情報の代わりに、一のクラスタに分割された一以上の地域の地域情報等を、一の領域情報として蓄積しても良い。また、地域特徴語蓄積部109は、上述した地域特徴語抽出部107が抽出した地域特徴語に対応した地域特徴度を、地域特徴語と対応付けて蓄積してもよい。また、図示しない受付部等を介してユーザ等からキーボード等の入力デバイスを介して入力を受け付けた時刻情報や、分野情報を、地域特徴度と対応付けて蓄積しても良い。地域特徴語蓄積部109は、通常、MPUやメモリ等から実現され得る。地域特徴語蓄積部109の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The region feature word storage unit 109 stores the region feature words extracted by the region feature word extraction unit 107 in the region feature word storage unit 101 in association with region information including the region indicated by the region information. For example, the region feature word storage unit 109 associates the region feature word extracted by the region feature word extraction unit 107 for one region of the plurality of region information with the region information including the region indicated by the one region information. Are stored in the local feature word storage unit 101. For example, in the case where clustering as described above is not performed, the regional feature word storage unit 109 stores information indicating the boundary line of the region indicated by one region information in the region range information storage unit 114 and the like described later. The information is acquired from information that defines the boundary line of the area indicated by the area information and stored in association with the area information, and this information is stored in association with the area feature word as area information. Alternatively, regional information or the like may be accumulated as region information instead of information such as a boundary line. Further, as described above, when the clustering unit 108 performs clustering of the region, the region feature word storage unit 109 indicates one or more region feature words and the region information divided into one cluster by the clustering. The region feature word storage unit 101 stores the region information including the region in association with each other. For example, the area information stored in association with the area information in the area range information storage unit 114 or the like, which will be described later, is stored in the area range information storage unit 114, which will be described later, etc. Is obtained from information that defines the boundary of the region indicated by, and the information of the boundary line formed by merging this information is used as region information and associated with the region feature word used when judging the similarity between regions Accumulate. In addition, instead of obtaining information that defines the boundary line of the region from the region range information storage unit 114 or the like, a WEB page or the like that provides information that provides numerical information about the national land via a network such as the Internet The information indicating the boundary line and outline of the area may be acquired from the information. Further, the regional feature word accumulation unit 109 may accumulate, as one area information, area information or the like of one or more areas divided into one cluster instead of information such as a boundary line. Further, the area feature word storage unit 109 may store the area feature degree corresponding to the area feature word extracted by the area feature word extraction unit 107 described above in association with the area feature word. Further, time information or field information received from a user or the like via an input device such as a keyboard via a reception unit (not shown) or the like may be stored in association with the regional feature. The regional feature word storage unit 109 can be usually realized by an MPU, a memory, or the like. The processing procedure of the regional feature word storage unit 109 is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

検索条件生成部110は、地域特徴語出力部104が出力した地域特徴語を含む検索条件を生成する。検索条件は、例えば、地域特徴語を含むキーワード列である。この場合、地域特徴語が検索条件であっても良い。また、検索条件は、例えば、地域特徴語を含む検索クエリであってもよい。検索条件は、例えば、地域特徴語をwhere節に含むSQL文である。また、検索条件生成部110は、地域特徴語出力部104が出力した地域特徴語のうちの、指定受付部113が指定を受け付けた地域特徴語を用いて検索条件を生成するようにしてもよい。例えば、地域特徴語出力部104がリスト表示した地域特徴語のうちの、後述する指定受付部113等を介してユーザにより指定された地域特徴語を用いて検索条件を生成してもよい。検索条件生成部110は、通常、MPUやメモリ等から実現され得る。検索条件生成部110の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The search condition generation unit 110 generates a search condition including the region feature word output by the region feature word output unit 104. The search condition is, for example, a keyword string including regional feature words. In this case, the local feature word may be a search condition. Further, the search condition may be, for example, a search query including an area feature word. The search condition is, for example, an SQL sentence including a region feature word in the where clause. In addition, the search condition generation unit 110 may generate a search condition using the regional feature words that the designation receiving unit 113 has received the designation out of the regional feature words output by the regional feature word output unit 104. . For example, the search condition may be generated using the regional feature words designated by the user via the designation receiving unit 113 to be described later among the regional feature words displayed as a list by the regional feature word output unit 104. The search condition generation unit 110 can usually be realized by an MPU, a memory, or the like. The processing procedure of the search condition generation unit 110 is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

検索部111は、検索条件作成部110が作成した検索条件を用いて検索を行い、検索結果を示す情報を取得する。検索部111は、インターネット等のネットワークを介して、検索条件を用いてWEBページの検索を行う。なお、検索部111がネットワークを介して検索条件の送信や検索結果の受信を行うための送信部や受信部等については、ここでは説明を省略する。検索部111が行う検索は、上述した地域関連情報取得部106が行う検索と同様である。なお、検索部111が検索結果として取得する情報は、文字列を含む情報に限るものではなく、検索条件に合致した観光名所等の位置情報等であっても良いし、検索条件に合致した画像情報等であっても良い。検索部111が検索結果として取得する情報は、WEBページのアドレスの情報等や、WEBページのコメント等を示した検索サイトによる検索結果を示すWEBページの情報であっても良い。検索部111は、通常、MPUやメモリ等から実現され得る。検索部111の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The search unit 111 performs a search using the search condition created by the search condition creation unit 110 and acquires information indicating the search result. The search unit 111 searches for a WEB page using a search condition via a network such as the Internet. Note that description of a transmission unit, a reception unit, and the like for the search unit 111 to transmit search conditions and receive search results via the network is omitted here. The search performed by the search unit 111 is the same as the search performed by the region-related information acquisition unit 106 described above. Note that the information acquired as a search result by the search unit 111 is not limited to information including a character string, and may be location information such as a tourist attraction that matches the search condition, or an image that matches the search condition. It may be information. The information acquired as a search result by the search unit 111 may be WEB page information indicating a search result by a search site indicating a WEB page address or the like, or a WEB page comment. The search unit 111 can usually be realized by an MPU, a memory, or the like. The processing procedure of the search unit 111 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

検索結果出力部112は、検索部111の検索結果を示す情報を出力する。ここで述べる出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。検索結果出力部112は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。検索結果出力部112は、出力デバイスのドライバーソフト、または、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。   The search result output unit 112 outputs information indicating the search result of the search unit 111. The output described here refers to display on a display, projection using a projector, printing on a printer, sound output, transmission to an external device, storage on a recording medium, and output to other processing devices or other programs. It is a concept including delivery of processing results. The search result output unit 112 may be considered as including or not including an output device such as a display or a speaker. The search result output unit 112 can be implemented by output device driver software, or output device driver software and an output device.

指定受付部113は、地域特徴度出力部104により、リスト表示された地域特徴語のうちの一以上の地域特徴語の指定を受け付ける。例えば、リスト表示された地域特徴語の一つを、ユーザがマウス等を用いてクリックした場合に、当該地域特徴語に対するクリックが行われたイベントを受け付けることで、地域特徴語の指定を受け付ける。地域特徴語を指定するための入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。指定受付部113は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。   The designation accepting unit 113 accepts designation of one or more regional feature words among the regional feature words displayed in a list by the regional feature degree output unit 104. For example, when the user clicks on one of the regional feature words displayed in the list using a mouse or the like, the designation of the regional feature word is accepted by accepting an event in which the region feature word is clicked. The input means for designating the regional feature words may be anything such as a numeric keypad, a keyboard, a mouse, or a menu screen. The designation receiving unit 113 can be realized by a device driver for input means such as a numeric keypad or a keyboard, control software for a menu screen, and the like.

地域範囲情報格納部114には、地域情報と、当該地域情報が示す地域の境界線(輪郭)を定義する情報とが対応付けて格納され得る。地域情報の境界線を定義する情報は、上述した領域の境界線を定義する情報と同様であるので、ここでは説明を省略する。地域範囲情報格納部114は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。   The area range information storage unit 114 can store area information and information defining a boundary line (outline) of the area indicated by the area information in association with each other. Since the information defining the boundary line of the region information is the same as the information defining the boundary line of the region described above, the description thereof is omitted here. The area range information storage unit 114 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium.

次に、情報処理装置1の動作について図2のフローチャートを用いて説明する。なお、ここでは、複数の地域情報を用いて地域特徴語を取得する場合を例に挙げて説明する。   Next, the operation of the information processing apparatus 1 will be described using the flowchart of FIG. Here, a case where a region feature word is acquired using a plurality of pieces of region information will be described as an example.

(ステップS201)地域情報受付部105は、複数の地域情報を受け付けたか否かを判断する。受け付けた場合、ステップS202に進み、受け付けていない場合、ステップS208に進む。   (Step S201) The area information receiving unit 105 determines whether a plurality of area information has been received. If accepted, the process proceeds to step S202. If not accepted, the process proceeds to step S208.

(ステップS202)地域関連情報取得部106は、ステップS201において受け付けた複数の地域情報が示す各地域にそれぞれ対応する地域関連情報を、例えば各地域情報を検索のキーワード等として用いてWEBページの検索等を行うことにより取得する。各地域に対応する地域関連情報としては、例えば、予め指定した数の地域関連情報を取得する。   (Step S202) The region-related information acquisition unit 106 searches the WEB page by using the region-related information corresponding to each region indicated by the plurality of region information received in step S201, for example, using each region information as a search keyword or the like. Acquired by performing etc. As the region-related information corresponding to each region, for example, a predetermined number of region-related information is acquired.

(ステップS203)地域特徴語抽出部107は、ステップS201において受け付けた複数の地域情報が示す各地域別に取得した地域関連情報を用いて、形態素解析により、各地域別に所定の文字列を取得する。この所定の文字列は、例えば、形容詞と名詞等の所定の品詞の文字列である。なお、ステップS202において、一の地域について複数の地域関連情報を取得した場合、当該一の地域についての複数の地域関連情報を、一の地域関連情報として扱って、形態素解析を行う。   (Step S203) The region feature word extraction unit 107 acquires a predetermined character string for each region by morphological analysis using the region-related information acquired for each region indicated by the plurality of region information received in step S201. This predetermined character string is, for example, a character string of a predetermined part of speech such as an adjective and a noun. In step S202, when a plurality of pieces of area-related information are acquired for one area, the plurality of pieces of area-related information about the one area are handled as one piece of area-related information, and morphological analysis is performed.

(ステップS204)地域特徴語抽出部107は、tf−idfの手法を用いて、ステップS201において受け付けた複数の地域情報が示す各地域別に地域特徴語を抽出する。具体的には、地域特徴語抽出部107は、ステップS203で各地域別に地域関連情報から取得した文字列のそれぞれについて、当該文字列の取得元の地域関連情報における出現頻度を算出し、当該文字列の取得元以外の残りの地域について取得した地域関連情報のうちの、当該文字列と同じ文字列を含む地域関連情報の出現頻度を算出する。ただし、ステップS202において、一の地域について複数の地域関連情報を取得した場合、当該一の地域についての複数の地域関連情報を、例えばマージ等により一の地域関連情報として扱うものとする。そして、これらの算出した出現頻度の値を、上述した式(1)に入力することで、各文字列の地域特徴度を算出する。そして、算出した地域特徴度が予め指定した所定の閾値以上である文字列を、各地域に対応した地域特徴度として抽出する。算出した地域特徴度は、例えば、抽出した値域特徴語と対応付けてメモリ等の記憶媒体等に一時記憶する。   (Step S204) The area feature word extraction unit 107 extracts area feature words for each area indicated by the plurality of area information received in step S201 using the tf-idf method. Specifically, the region feature word extraction unit 107 calculates the appearance frequency in the region-related information from which the character string is obtained for each character string acquired from the region-related information for each region in step S203, and Of the region-related information acquired for the remaining regions other than the column acquisition source, the appearance frequency of the region-related information including the same character string as the character string is calculated. However, when a plurality of pieces of area-related information are acquired for one area in step S202, the plurality of pieces of area-related information about the one area are handled as one piece of area-related information by, for example, merging. Then, by inputting these calculated appearance frequency values into the above-described equation (1), the regional feature degree of each character string is calculated. Then, a character string whose calculated regional feature degree is equal to or greater than a predetermined threshold specified in advance is extracted as a regional feature degree corresponding to each region. The calculated regional feature degree is temporarily stored in a storage medium such as a memory in association with the extracted range feature word, for example.

(ステップS205)クラスタリング部108は、ステップS204において算出した地域特徴度を用いて地域別に構成した地域特徴語ベクトルを利用して、類似する地域をクラスタリングする。具体的には、ステップS201において受け付けた複数の地域情報が示す複数の地域のそれぞれについて、式(2)に示すような地域特徴語ベクトルを構成し、二つの地域の地域特徴語ベクトルを上述した式(3)に代入することで、地域間の類似度を順次算出する。そして、算出した類似度の高い地域同士をまとめていくことで、クラスタリングを行う。また、クラスタリングされた地域についての地域特徴語ベクトルを取得する。   (Step S205) The clustering unit 108 clusters similar regions by using the region feature word vector configured for each region using the region feature degree calculated in step S204. Specifically, for each of the plurality of regions indicated by the plurality of region information received in step S201, a region feature word vector as shown in Expression (2) is configured, and the region feature word vectors of the two regions are described above. By substituting into equation (3), the similarity between regions is calculated sequentially. Then, clustering is performed by putting together the calculated regions with high similarity. In addition, a region feature word vector for the clustered region is acquired.

(ステップS206)地域特徴語蓄積部109は、ステップS205においてクラスタリングにより分割された類似する地域により構成される領域について、領域情報を取得する。例えば、各領域を構成する一以上の地域の地域情報に対応した一以上の地域範囲情報を地域範囲情報格納部114から取得し、当該一以上の地域範囲情報を結合して、領域の境界線を示す領域情報を構成する。   (Step S206) The region feature word storage unit 109 acquires region information for regions configured by similar regions divided by clustering in step S205. For example, one or more region range information corresponding to the region information of one or more regions constituting each region is acquired from the region range information storage unit 114, and the one or more region range information is combined to form a boundary line of the region Is configured.

(ステップS207)地域特徴語蓄積部109は、ステップS206において取得した領域情報と、当該領域情報が示す領域を構成する地域についてステップS204において取得された地域特徴語と、ステップS204において算出された当該地域特徴語に対応する地域特徴度とを対応付けて地域特徴語格納部101に蓄積する。なお、領域情報をクラスタリングにより取得する際に利用した地域特徴語ベクトルを構成する地域特徴度に対応する地域特徴語を、領域情報と対応付けて地域特徴語格納部101に蓄積してもよい。なお、地域特徴語蓄積部109は、ユーザ等から図示しない受付部等を介して受け付けた分野情報や時間情報等を、地域特徴語と対応付けて蓄積するようにしてもよい。そして、ステップS201に戻る。   (Step S207) The area feature word storage unit 109 acquires the area information acquired in Step S206, the area feature words acquired in Step S204 for the area constituting the area indicated by the area information, and the information calculated in Step S204. The regional feature words corresponding to the regional feature words are stored in the regional feature word storage unit 101 in association with each other. It should be noted that the area feature words corresponding to the area feature words constituting the area feature word vector used when acquiring the area information by clustering may be stored in the area feature word storage unit 101 in association with the area information. The regional feature word storage unit 109 may store field information, time information, and the like received from a user or the like via a reception unit (not shown) or the like in association with the regional feature word. Then, the process returns to step S201.

(ステップS208)位置情報取得部102は、位置情報を取得したか否かを判断する。例えば、図示しないGPS等を介して、ユーザの現在位置の位置情報を取得したか否か等を判断する。あるいは、ユーザ等により入力された位置情報があるか否かを判断してもよい。位置情報が取得されている場合、ステップS209に進み、位置情報が取得されていない場合、ステップS201に戻る。   (Step S208) The position information acquisition unit 102 determines whether position information has been acquired. For example, it is determined whether or not the position information of the current position of the user has been acquired via a GPS (not shown) or the like. Alternatively, it may be determined whether there is position information input by a user or the like. If position information has been acquired, the process proceeds to step S209. If position information has not been acquired, the process returns to step S201.

(ステップS209)位置情報取得部102は、分野指定情報を取得したか否かを判断する。例えば、ユーザ等により入力された分野指定情報を受け付けたか否かを判断する。なお、ユーザ等による分野指定情報の入力がない場合、予めデフォルトで指定されている分野指定情報を位置情報取得部102が取得するようにし、位置情報を取得したと判断するようにしても良い。予めデフォルトで指定されている分野指定情報は、例えば、全ての分野情報を指定する分野指定情報や、分野指定なしを示す分野指定情報等である。分野情報が取得できた場合、ステップS210に進み、分野指定情報が取得されていない場合、ステップS209に戻る。   (Step S209) The position information acquisition unit 102 determines whether field designation information has been acquired. For example, it is determined whether or not field designation information input by a user or the like has been received. If there is no input of field designation information by the user or the like, the position information acquisition unit 102 may acquire the field designation information designated by default in advance, and may determine that the position information has been obtained. The field designation information designated by default in advance is, for example, field designation information for designating all field information, field designation information indicating no field designation, or the like. If the field information has been acquired, the process proceeds to step S210. If the field designation information has not been acquired, the process returns to step S209.

(ステップS210)位置情報取得部102は、現在の時刻の情報である時刻情報を取得する。なお、時刻情報を地域特徴語を取得する際に利用しない場合は、当該ステップは省略して良い。   (Step S210) The position information acquisition unit 102 acquires time information that is information of the current time. Note that this step may be omitted if the time information is not used when acquiring regional feature words.

(ステップS211)地域特徴語取得部103は、ステップS208において取得した位置情報が示す位置を含む領域を示す領域情報を検出する。   (Step S211) The area feature word acquisition unit 103 detects area information indicating an area including the position indicated by the position information acquired in step S208.

(ステップS212)地域特徴語取得部103は、ステップS211において検出した領域情報に対応付けられた地域特徴語であって、ステップS209において受け付けた分野指定情報により指定される分野情報と、ステップS210により取得した時刻情報が示す時刻を含む期間を示す時間情報とに対応付けられた地域特徴語を、地域特徴語格納部101から読み出す。また、当該地域特徴語に対応付けられた地域特徴度も読み出すようにしても良い。なお、地域特徴語を取得する際に、予め指定された値より大きい地域特徴度と対応付けられた地域特徴語だけを取得するようにしても良い。   (Step S212) The area feature word acquisition unit 103 is an area feature word associated with the area information detected in step S211 and is specified by the area specification information received in step S209, and in step S210. The area feature word associated with the time information indicating the period including the time indicated by the acquired time information is read from the area feature word storage unit 101. Moreover, you may make it read also the regional feature degree matched with the said regional feature word. Note that when acquiring the regional feature words, only the regional feature words associated with the regional feature degree larger than the predesignated value may be acquired.

(ステップS213)地域特徴語出力部104は、ステップS212において取得した地域特徴語を出力する。例えば、地域特徴語出力部104は、ステップS212において取得した地域特徴語を用いてリストを構成し、当該リストを、図示しないモニタ等に表示する。また、このリストを作成する際に、対応付けられた地域特徴度の高い順に各地域特徴語を配列するようにしても良い。   (Step S213) The regional feature word output unit 104 outputs the regional feature word acquired in step S212. For example, the regional feature word output unit 104 configures a list using the regional feature words acquired in step S212, and displays the list on a monitor or the like (not shown). Further, when creating this list, the regional feature words may be arranged in descending order of the associated regional feature degree.

(ステップS214)指定受付部113は、地域特徴語出力部104が、例えばリスト表示等により出力した地域特徴語のうちの一以上の地域特徴語についての指定を受け付けたか否かを判断する。受け付けた場合、ステップS215に進み、受け付けていない場合、ステップS214に戻る。   (Step S214) The designation receiving unit 113 determines whether or not the regional feature word output unit 104 has received designation for one or more regional feature words out of the regional feature words output by, for example, list display. If accepted, the process proceeds to step S215. If not accepted, the process returns to step S214.

(ステップS215)検索条件生成部110は、ステップS214により指定を受け付けた地域特徴語を含む検索条件、具体的には,検索クエリを作成する。   (Step S215) The search condition generation unit 110 creates a search condition including the area feature word that has been designated in step S214, specifically, a search query.

(ステップS216)検索部111は、ステップS215において作成した検索条件を用いて検索を行う。例えば、ステップS215において作成した検索条件を、WEB上の検索サイト等に送信し、検索結果を取得する。   (Step S216) The search unit 111 performs a search using the search condition created in step S215. For example, the search condition created in step S215 is transmitted to a search site on the WEB and the search result is acquired.

(ステップS217)検索結果出力部112は、ステップS216において行われた検索結果を出力する。例えば、図示しないモニタ等に表示する。そして、ステップS201に戻る。   (Step S217) The search result output unit 112 outputs the search result performed in step S216. For example, it is displayed on a monitor (not shown). Then, the process returns to step S201.

なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。   In the flowchart of FIG. 2, the process is terminated by powering off or a process termination interrupt.

以下、本実施の形態における情報処理装置1の具体的な動作について説明する。   Hereinafter, a specific operation of the information processing apparatus 1 in the present embodiment will be described.

図3は、本実施の形態の情報処理装置1の概念図である。情報処理装置1は、ここでは例として、無線あるいは有線のネットワーク等と接続可能な携帯型の情報端末であるとする。携帯型の情報端末は、例えば、携帯電話や、多機能携帯電話、小型携帯コンピュータ、PDA(Personal Digital Assistant)、ナビゲーション端末等である。情報処理装置1は、例えば、無線あるいは有線のネットワーク等を介してWEBサーバ2等と接続される。また、ここでは、情報処理装置1は、位置情報を取得するための手段としてGPSを有しているものとする。   FIG. 3 is a conceptual diagram of the information processing apparatus 1 according to the present embodiment. In this example, the information processing apparatus 1 is assumed to be a portable information terminal that can be connected to a wireless or wired network. Examples of the portable information terminal include a mobile phone, a multi-function mobile phone, a small mobile computer, a PDA (Personal Digital Assistant), and a navigation terminal. The information processing apparatus 1 is connected to the WEB server 2 or the like via, for example, a wireless or wired network. Here, it is assumed that the information processing apparatus 1 has a GPS as a means for acquiring position information.

ユーザが、複数の地域情報である地域名のリストを情報処理装置1に入力すると地域情報受付部105は、当該地域名のリストを受け付ける。ここでの地域名は、例えば、市の名前、(ただし、市に属さない町村がある場合は町村の名前)であるとする。   When the user inputs a list of area names as a plurality of area information to the information processing apparatus 1, the area information receiving unit 105 receives the list of area names. The area name here is, for example, the name of a city (however, if there is a town or village that does not belong to the city, the name of the town or village).

図4は、地域情報受付部105が受け付けた地域情報である地域名のリストを示す図である。   FIG. 4 is a diagram illustrating a list of area names that are area information received by the area information receiving unit 105.

地域関連情報取得部106は、受け付けた地域名を順番に用いて、検索クエリを作成し、図示しない送信部を介して予め指定されたWEB上の検索サイト等に送信する。そして、検索サイトから検索結果として送信される、地域名に対して関連度の高いWEBページのURL等を図示しない受信部等を介して受信する。そして、このURLからWEBページを取得する。ここでは、地域関連情報取得部106は、各地域名についての検索結果のうちの、関連度の高さが上位10位までのWEBページを取得するものとする。つまり、各地域について、10のWEBページのデータ、具体的には10のHTMLファイル等を取得する。この取得したWEBページが、地域関連情報である。地域関連情報取得部106は、取得した10のWEBページを結合して、一の文書、即ち一のHTMLファイルとする。これにより、一つの地域について一の地域関連情報を得ることができる。   The region-related information acquisition unit 106 creates a search query using the received region names in order, and transmits the search query to a search site on a web designated in advance via a transmission unit (not shown). Then, the URL of the WEB page having a high degree of relevance with respect to the area name, which is transmitted as a search result from the search site, is received via a receiving unit (not shown). Then, a WEB page is acquired from this URL. Here, it is assumed that the region-related information acquisition unit 106 acquires a WEB page having the highest degree of relevance among the search results for each region name. That is, for each region, 10 WEB page data, specifically, 10 HTML files are acquired. This acquired WEB page is the region related information. The area-related information acquisition unit 106 combines the acquired 10 WEB pages into one document, that is, one HTML file. Thereby, one area related information can be obtained about one area.

次に、地域特徴語抽出部107は、地域情報受付部105が受け付けた各地域名について、当該地域名に対応して取得された地域関連情報を用いて地域特徴語を抽出する。地域特徴語抽出部107は、図4に示した各地域名に対応して取得した地域関連情報を、Mecab等を用いて形態素解析を行うことにより、当該地域関連情報に含まれる品詞が名詞と形容詞である文字列を抽出する。例えば、図4に示した「富山市」について取得された地域関連情報からは、「富山城」、「サンダーバード」、「寒ブリ」、「富山地方鉄道」、「日本海」、「ビジネスホテル」、「だやい」等の単語が検出されたとする。   Next, the region feature word extraction unit 107 extracts a region feature word for each region name received by the region information reception unit 105 using the region related information acquired corresponding to the region name. The region feature word extraction unit 107 performs morphological analysis on the region-related information acquired corresponding to each region name shown in FIG. 4 using Mecab or the like, so that the part of speech included in the region-related information is a noun and an adjective. Extract a string that is For example, from the region-related information acquired for “Toyama City” shown in FIG. 4, “Toyama Castle”, “Thunderbird”, “Kan Buri”, “Toyama Regional Railway”, “Japan Sea”, “Business Hotel” , Suppose that a word such as “daiya” is detected.

地域特徴語抽出部107は、まず地域名が「富山市」である地域について、一番目の文字列である「富山城」を取得し、「富山市」の地域関連情報内における「富山城」の出現頻度を算出する。また、「富山市」以外の地域名について取得された地域関連情報のうちの、「富山城」という文字列を含む地域関連情報の出現頻度を算出する。そして、上述した式(2)のtfに「富山城」の出現頻度を、また、dfに「富山城」という文字列を含む全ての地域関連情報の、残りの地域情報について取得した地域関連情報に対する出現頻度を代入することで、地域特徴度(DLC)を算出する。そして、この地域特徴度の値が予め指定された閾値を超える場合、この文字列「富山城」を地域特徴語として抽出する。また、閾値を超えない場合には地域特徴語として抽出しない。なお、地域特徴度が、特徴度の増加に伴って減少するような値である場合には、地域特徴度が閾値より小さくなることを、閾値を超えると解釈するものとする。ここでは、例えば閾値を超えたとすると、「富山城」という文字列が、地域特徴語として抽出される。そして、この地域特徴語と、地域名と、算出された地域特徴度とが対応付けられて、図示しない記憶媒体等に一時記憶される。   The region feature word extraction unit 107 first acquires “Toyama Castle”, which is the first character string, for the region whose region name is “Toyama City”, and “Toyama Castle” in the region related information of “Toyama City”. The appearance frequency of is calculated. In addition, the frequency of appearance of the region-related information including the character string “Toyama Castle” among the region-related information acquired for the region name other than “Toyama City” is calculated. Then, the region-related information acquired for the remaining region information of all the region-related information including the appearance frequency of “Toyama Castle” in tf of the above formula (2) and the character string “Toyama Castle” in df By substituting the appearance frequency for, the regional feature (DLC) is calculated. If the value of the regional feature value exceeds a predetermined threshold value, the character string “Toyama Castle” is extracted as a regional feature word. If the threshold is not exceeded, it is not extracted as a regional feature word. When the regional feature is a value that decreases as the feature increases, the fact that the regional feature is smaller than the threshold is interpreted as exceeding the threshold. Here, for example, if the threshold value is exceeded, the character string “Toyama Castle” is extracted as a regional feature word. Then, the regional feature word, the regional name, and the calculated regional feature degree are associated with each other and temporarily stored in a storage medium or the like (not shown).

同様にして、「富山市」の地域特徴語から取得された「サンダーバード」等の他の文字列についても、同様に、順次、地域特徴語であるか否かの判断が行われ、地域特徴語と判断された文字列は、地域名と、算出された地域特徴度とが対応付けられて、図示しない記憶媒体等に一時記憶される。ここでは、「富山市」については、「富山城」、「寒ブリ」、「富山地方鉄道」、「だやい」が地域特徴語と判断されたとする。   Similarly, for other character strings such as “Thunderbird” obtained from the regional feature word “Toyama City”, whether or not the character string is a regional feature word is sequentially determined. The character string determined as is associated with the area name and the calculated area characteristic, and is temporarily stored in a storage medium (not shown). Here, with respect to “Toyama City”, it is assumed that “Toyama Castle”, “Kan Buri”, “Toyama Regional Railway”, and “Dayai” are determined as regional feature words.

また、上記と同様の処理が、他の地域についても繰り返し行われる。   Further, the same processing as described above is repeatedly performed for other regions.

図5は、上記のような地域特徴語を抽出する処理を繰り返した結果、各地域名について取得された地域関連情報から抽出された地域特徴語の一例を示す図である。図において、「地域名」は地域名、「地域特徴語」は地域特徴語、「地域特徴度」は地域特徴度を示している。   FIG. 5 is a diagram illustrating an example of the region feature words extracted from the region-related information acquired for each region name as a result of repeating the process of extracting the region feature words as described above. In the figure, “region name” indicates a region name, “region feature word” indicates a region feature word, and “region feature degree” indicates a region feature degree.

次に、クラスタリング部108が、抽出された地域特徴語と算出された地域特徴度を利用して、地域名が示す地域のクラスタリングを行う。まず、クラスタリング部108は、各地域名別に、図5に示した地域特徴語の抽出結果に出現する全ての地域特徴語に対応する地域特徴度の値をベクトル値として有する地域特徴度ベクトルを作成する。例えば、図5に示した各地域名について取得した地域特徴語を併合したものから、重複する地域特徴語を除いた地域特徴語の数が、m個であったとすると、地域特徴度ベクトルは、m個の要素を有するm次元のベクトルとなる。なお、ある地域名についての地域特徴度ベクトルにおいて、当該地域名については存在しない地域特徴語に対応する要素の値は、「0」に設定されるものとし、地域特徴語が存在する場合には、当該地域特徴語に対応する要素の値は、当該地域特徴語に対応する地域特徴度の値が設定される。   Next, the clustering unit 108 performs clustering of the region indicated by the region name using the extracted region feature word and the calculated region feature. First, the clustering unit 108 creates, for each region name, a region feature vector having region feature values corresponding to all region feature words appearing in the region feature word extraction result shown in FIG. 5 as vector values. . For example, if the number of area feature words excluding overlapping area feature words from the merged area feature words obtained for each area name shown in FIG. 5 is m, the area feature vector is m It becomes an m-dimensional vector having an element. In the regional feature vector for a certain regional name, the value of the element corresponding to the regional characteristic word that does not exist for the regional name is set to “0”. The value of the element corresponding to the regional feature word is set to the value of the regional feature degree corresponding to the regional feature word.

例えば、図5に基づいて生成される地域特徴度ベクトル[lg1,lg2,lg3,lg4,lg5,lg6,…,lgm]において、lg1は「富山城」の地域特徴度、lg2は「寒ブリ」の地域特徴度、lg3は「富山地方鉄道」の地域特徴度、lg4は「だやい」の地域特徴度、lg5は「蜃気楼」の地域特徴度、lg6は「黒部スイカ」の地域特徴度となる。そして、「富山市」の地域特徴語ベクトルは[60,50,40,36,0,…,0]、「魚津市」の地域特徴語ベクトルは[0,48,30,32,80,0…,0]、「黒部市」の地域特徴語ベクトルは[0,40,30,28,0,75…,0]等となる。なお、本具体例の値等は、説明のためのものであり、実際の検索結果や計算結果によるものとは異なる。   For example, in the regional feature vectors [lg1, lg2, lg3, lg4, lg5, lg6,..., Lgm] generated based on FIG. , Lg3 is the regional feature of “Toyama District Railway”, lg4 is the regional feature of “Daiyi”, lg5 is the regional feature of “Maimirou”, and lg6 is the regional feature of “Kurobe Watermelon” Become. The regional feature word vector of “Toyama City” is [60, 50, 40, 36, 0,..., 0], and the regional feature word vector of “Uozu City” is [0, 48, 30, 32, 80, 0. .., 0], “Kurobe City” area feature word vectors are [0, 40, 30, 28, 0, 75. Note that the values and the like in this specific example are for explanation, and are different from those based on actual search results and calculation results.

クラスタリング部108は、これらの地域特徴語ベクトルを用いて、クラスタリングを行う。まず、複数の地域のうちの二つの地域の組合せについて、それぞれの地域語特徴ベクトルを、式(3)に代入することで、二つの地域間の類似度を順次算出する。そして、一の地域と類似度の値が、最も類似度が高いことを示す二つの地域をまとめ、地域特徴語ベクトルの重心ベクトルを、この新たにまとめた地域群の地域特徴語ベクトルとする。同様の処理を繰り返して、地域をまとめていくことで地域をクラスタに分けていくことができる。なお、クラスタリングは、例えば予め指定した閾値を超えるような類似度が得られる二つの地域(まとめた地域も含む)が存在しなくなった時点で終了しても良いし、一のクラスタリングに含まれる地域の上限や、クラスタリングにより構成されるクラスタ数等の上限等を用いて判断しても良い。   The clustering unit 108 performs clustering using these regional feature word vectors. First, the similarity between two regions is sequentially calculated by substituting the respective region word feature vectors into Equation (3) for a combination of two regions of a plurality of regions. Then, two regions having the highest similarity with one region are collected, and the center vector of the region feature word vectors is set as the region feature word vector of the newly collected region group. By repeating the same process and collecting the regions, the regions can be divided into clusters. Note that the clustering may be terminated when there are no two regions (including a grouped region) that have a similarity that exceeds a predetermined threshold value, for example, or the regions included in one clustering. It is also possible to make a determination using the upper limit or the upper limit of the number of clusters formed by clustering.

そして、クラスタリング部108は、クラスタリングが終了した時点で、各クラスタの地域特徴度を取得する。具体的には、クラスタリングによって最終的に得られる各クラスタの地域特徴語ベクトルである重心ベクトルを構成する地域特徴度が、上位から所定の順位までの地域特徴語を、各クラスタの地域特徴語として取得する。なお、各クラスタの地域特徴語の取得方法や、目的等に応じて適宜変更可能であり、例えば、重心ベクトルのうちの、地域特徴度が所定の閾値を超えるものを各クラスタの地域特徴度として取得しても良い。また、各クラスタを構成する類似する地域に対応した地域特徴語のうちの、地域特徴度が高いものから順番に所定数の地域特徴語を取得しても良い。   Then, the clustering unit 108 acquires the regional feature degree of each cluster when the clustering is completed. Specifically, the regional feature words constituting the centroid vector, which is the regional feature word vector of each cluster finally obtained by clustering, are the regional feature words from the top to the predetermined rank as regional feature words of each cluster. get. In addition, it can be appropriately changed according to the acquisition method of regional feature words of each cluster, the purpose, etc. For example, among the centroid vectors, those having a regional feature value exceeding a predetermined threshold are used as the regional feature values of each cluster. You may get it. Also, a predetermined number of regional feature words may be acquired in descending order of the regional feature degree from among the regional feature words corresponding to similar regions constituting each cluster.

ここでは、クラスタリングの結果、例えば、富山市と滑川市との組、魚津市と黒部市との組がそれぞれクラスタに分けられたとする。また、富山市と滑川市との組の地位特徴語が「富山城」、「寒ブリ」、[富山地方鉄道」、「だやい」、魚津市と黒部市との組の地域特徴語が、「蜃気楼」、「黒部スイカ」、「黒部峡谷」、「富山地方鉄道」であったとする。   Here, as a result of clustering, for example, a set of Toyama City and Namerikawa City, and a set of Uozu City and Kurobe City are each divided into clusters. In addition, the status characteristic words of the group of Toyama City and Namerikawa City are “Toyama Castle”, “Kanburi”, [Toyama Regional Railway ”,“ Daiai ”, and the local characteristic words of the pair of Uozu City and Kurobe City. , “Mirage”, “Kurobe Watermelon”, “Kurobe Gorge”, “Toyama District Railway”.

図6は、地域範囲情報格納部114に格納されている地域範囲情報を管理する地域範囲情報管理表である。地域範囲情報管理表は、「地域名」と「地域範囲情報」とを有している。「地域名」は、地域情報であり、ここでは地域情報受付部105が受け付ける地域情報と同様の地域名である。「地域範囲情報」は、地域範囲情報であり、ここでは地域の境界線を定義する複数の座標情報である。この座標情報は、緯度と経度との組み合わせた座標を示す。   FIG. 6 is a regional range information management table for managing the regional range information stored in the regional range information storage unit 114. The area range information management table includes “area name” and “area range information”. The “region name” is region information, and here is the same region name as the region information received by the region information receiving unit 105. “Region range information” is region range information, and here is a plurality of coordinate information defining a boundary line of a region. This coordinate information indicates coordinates obtained by combining latitude and longitude.

地域特徴語蓄積部109は、クラスタリングにより分割された類似する地域により構成される領域について、領域の境界線を示す領域情報を取得する。例えば、クラスタに分割された各領域を構成する一以上の地域の地域名に対応した一以上の地域範囲情報を地域範囲情報格納部114から取得し、当該一以上の地域範囲情報を結合して、一のクラスタの領域の境界線を示す領域情報を構成する。なお、地域特徴語蓄積部109は、ネットワーク上に設けられている、地域範囲情報格納部114と同様の情報を提供可能なサーバ等から、検索等により地域範囲情報を適宜取得するようにしても良い。   The region feature word storage unit 109 acquires region information indicating the boundary line of the region for regions formed by similar regions divided by clustering. For example, one or more region range information corresponding to the region names of one or more regions constituting each region divided into clusters is acquired from the region range information storage unit 114, and the one or more region range information is combined. The area information indicating the boundary line of the area of one cluster is configured. The regional feature word storage unit 109 may appropriately acquire regional range information by searching or the like from a server or the like that is provided on the network and can provide the same information as the regional range information storage unit 114. good.

地域特徴語蓄積部109は、クラスタリング部108が取得した各クラスタに対応する地域特徴語と、当該地域特徴語に対応する地域特徴度と、各クラスタに対応して構成した領域情報とを対応付けて、地域特徴語格納部101に蓄積する。なお、地域特徴語格納部101に地域特徴語を蓄積する直前等に、ユーザに、当該地域特徴語に対応した時間情報や分野情報等の入力を促すメッセージ等を表示し、ユーザ等から入力された時間情報や分野情報等を、地域特徴語に対して更に対応付けて蓄積するようにしてもよい。また、地域特徴語格納部101に蓄積されている地域特徴語について、図示しない入力受付部等を介してユーザが適宜任意のタイミングで入力した分野情報や時間情報等を対応付けて蓄積するようにしてもよい。   The region feature word storage unit 109 associates the region feature words corresponding to each cluster acquired by the clustering unit 108, the region feature degree corresponding to the region feature word, and the region information configured corresponding to each cluster. And accumulated in the local feature word storage unit 101. Note that a message or the like prompting the user to input time information or field information corresponding to the regional feature word is displayed immediately before storing the regional feature word in the regional feature word storage unit 101, and is input by the user or the like. The time information, the field information, and the like may be further stored in association with the regional feature words. In addition, as for the area feature words stored in the area feature word storage unit 101, the field information and time information input by the user at an arbitrary timing through an input reception unit (not shown) are stored in association with each other. May be.

図7は、地域特徴語格納部101に蓄積された地域特徴語等を管理する地域特徴語管理表である。地域特徴語管理表は、「領域ID」、「領域情報」、「地域特徴語」、「地域特徴度」、「時間情報」、「分野情報」という項目を有している。「領域ID」は領域を管理するために付与される識別情報である。また、「領域ID」以外の項目はそれぞれ、上述した領域情報、地域特徴語、地域特徴度、時間情報、分野情報に相当する。地域特徴語管理表の一のレコードを構成する各項目の情報は、互いに対応付けられた情報である。例えば、図7においては、「領域ID」が「001」である領域は、富山市と滑川市との組を含む領域であり、「領域ID」が「002」である領域は、魚津市と黒部市との組を含む領域である。   FIG. 7 is a regional feature word management table for managing regional feature words and the like accumulated in the regional feature word storage unit 101. The regional feature word management table has items of “region ID”, “region information”, “region feature word”, “region feature degree”, “time information”, and “field information”. The “area ID” is identification information given to manage the area. Further, items other than “area ID” correspond to the above-described area information, area feature words, area feature, time information, and field information, respectively. Information on each item constituting one record of the regional feature word management table is information associated with each other. For example, in FIG. 7, the region whose “region ID” is “001” is a region including a set of Toyama City and Namekawa City, and the region whose “region ID” is “002” is Uozu City. It is an area that includes a set with Kurobe City.

ここで、ユーザが、情報処理装置1を持って富山市に移動したとし、富山市についての検索を行うために、検索を行うための検索画面等を図示しない表示部等に表示させたとする。この検索画面等の表示をトリガーとして、情報処理装置1が有している図示しないGPSが、現在位置の情報として、(N36.42.16.27,E137.12.53.19)という座標情報を取得する。位置情報取得部102は、GPSが取得した位置情報を取得する。   Here, it is assumed that the user moves to Toyama City with the information processing apparatus 1 and displays a search screen for performing a search on a display unit or the like (not shown) in order to perform a search for Toyama City. With the display of the search screen or the like as a trigger, the GPS (not shown) that the information processing apparatus 1 has is coordinate information (N36.42.16.27, E137.12.53.19) as current position information. To get. The position information acquisition unit 102 acquires position information acquired by the GPS.

地域特徴語取得部103は図7に示した地域特徴語管理表の「領域情報」において、位置情報取得部102が取得した位置情報が示す位置が含まれる領域情報を検索する。ここでは、「領域ID」が「001」であるレコードの「領域情報」が、位置情報が示す位置を含む領域を示す領域情報として検出される。また、位置情報取得部102は、現在の時刻情報を、例えば情報処理装置1内の時刻を計時する処理部(図示せず)等から取得する。例えば、ここで取得した時刻情報は、「三月七日午前10時」という情報であったとする。また、位置情報取得部102は、予めユーザ等により指定されている分野を指定する情報を取得する。なお、ここでは、「観光」および「食べ物」という分野指定情報が予め指定されていたとする。なお、位置情報を取得する前後に、分野を指定する情報を要求する情報を、ユーザ等に対して表示するようにし、当該表示に応じてユーザから入力される分野情報を取得しても良い。このため、地域特徴語取得部103は、「領域ID」が「001」であるレコードの「地域特徴語」である「富山城」、「寒ブリ」、「富山地方鉄道」、「だやい」等のうちの、「三月七日午前10時」を含む期間を示す「時間情報」、および「観光」または「食べ物」という「分野情報」に対応付けられた地域特徴語を、地域特徴語格納部101から読み出す。「富山城」に対応した時間情報は、日にち指定なしの「午前9時から午後5時」であるため、時刻情報を含む期間を示す時間情報であると判断される。「富山地方鉄道」に対応した時間情報は、日にち指定なしの「午前5時から午後22時」であるため、時刻情報を含む期間を示す時間情報であると判断される。また、「寒ブリ」に対応した時間情報は、11月1日から2月28日であるため、時刻情報を含む期間を示す時間情報であると判断される。このように時刻情報を用いることで、例えば、現在の期間においては、ユーザが利用ができない事象についての地域特徴語の取得を行わないようにすることができる。また、「富山城」および「富山地方鉄道」の分野情報は「観光」であり、「寒ブリ」の分野情報は「食べ物」であるため、これらの分野情報は、分野指定情報が指定する分野情報であると判断される。このため、「富山城」と「富山地方鉄道」と「寒ブリ」が地域特徴語として取得される。このようにして取得された地域特徴語が、地域特徴語出力部104により図示しない記憶媒体等に一時記憶される。   The area feature word acquisition unit 103 searches for area information including the position indicated by the position information acquired by the position information acquisition unit 102 in the “area information” of the area feature word management table shown in FIG. Here, “area information” of the record whose “area ID” is “001” is detected as area information indicating an area including the position indicated by the position information. The position information acquisition unit 102 acquires the current time information from, for example, a processing unit (not shown) that measures the time in the information processing apparatus 1. For example, it is assumed that the time information acquired here is information “March 7th 10:00 am”. In addition, the position information acquisition unit 102 acquires information specifying a field that is specified in advance by a user or the like. Here, it is assumed that the field designation information “sightseeing” and “food” has been designated in advance. Before and after acquiring the position information, information requesting information specifying the field may be displayed to the user or the like, and the field information input from the user may be acquired according to the display. For this reason, the regional feature word acquisition unit 103 performs “regional feature words” “Toyama Castle”, “Kan Buri”, “Toyama District Railway”, “Daidai” of the record whose “region ID” is “001”. ”, Etc.,“ regional feature words associated with “time information” indicating a period including “10 am on March 7” and “field information” such as “tourism” or “food”. Read from the word storage unit 101. Since the time information corresponding to “Toyama Castle” is “9:00 am to 5:00 pm” without specifying a date, it is determined that the time information indicates a period including time information. Since the time information corresponding to “Toyama district railway” is “5 am to 22:00 pm” without specifying a date, it is determined that the time information indicates a period including time information. Also, since the time information corresponding to “cold bristle” is from November 1st to February 28th, it is determined as time information indicating a period including time information. By using the time information in this way, for example, it is possible to prevent the acquisition of regional feature words for events that the user cannot use during the current period. In addition, since the field information of “Toyama Castle” and “Toyama District Railway” is “Tourism” and the field information of “Kanburi” is “Food”, these field information are the fields specified by the field designation information. It is determined to be information. For this reason, “Toyama Castle”, “Toyama District Railway” and “Kanburi” are acquired as regional feature words. The regional feature words acquired in this way are temporarily stored in a storage medium (not shown) by the regional feature word output unit 104.

次に、ユーザが検索画面等の入力フィールド等に、「と」という文字を入力したとする。   Next, it is assumed that the user inputs the characters “to” in an input field or the like on a search screen or the like.

地域特徴語出力部104は、地域特徴語取得部103が読み出した地域特徴語のうちの、「と」で始まる地域特徴語を、前方一致の検索等により検索する。ここでは、「富山城」と「富山地方鉄道」とが検索される。そして、検索した地域特徴語を含むリストを構成し、入力フィールドの近傍にリスト表示する。このとき、地域特徴度の高い地域特徴語、ここでは「富山城」、が最も入力フィールドに近い位置に表示されるようにリスト表示を行う。   The area feature word output unit 104 searches for area feature words starting with “to” among the area feature words read out by the area feature word acquisition unit 103 by a forward matching search or the like. Here, “Toyama Castle” and “Toyama District Railway” are searched. Then, a list including the searched regional feature words is constructed and displayed in the vicinity of the input field. At this time, the list display is performed so that the regional feature words having high regional features, in this case “Toyama Castle”, are displayed at positions closest to the input field.

図8は地域特徴語のリストの表示例を示す図である。   FIG. 8 is a diagram showing a display example of a list of regional feature words.

なお、さらに文字が追加されると、追加された文字によって、更に地域特徴語を検索し、検索結果の地域特徴語をリスト表示するようにすればよい。   If more characters are added, the regional feature words may be further searched using the added characters, and the region feature words as a search result may be displayed as a list.

次にユーザがタッチパネル等を操作してリスト表示された地域特徴語のうちの「富山城」を選択したとすると、地域特徴語出力部104は、選択された地域特徴語を入力フィールド等に入力した画面を表示する。   Next, when the user selects “Toyama Castle” from the list of regional feature words displayed by operating the touch panel or the like, the regional feature word output unit 104 inputs the selected regional feature word into an input field or the like. Display the selected screen.

そして、ユーザが検索を行うための指示を情報処理装置1に与えると、検索条件生成部110は、選択された地域特徴語である「富山城」を含む条件情報、例えば検索クエリを作成する。作成した条件情報は、例えば、所定の検索用のWEBサイトにGETパラメータとして送信される「q=富山城」(ただし、qは検索のWEBサイトにおいて検索条件として利用される変数とする)等である。そして、検索部111は、当該条件情報を、予め指定されている検索用のWEBサイト等にネットワーク等を介して送信する。そして、WEBサイト等が送信する検索結果を示すWEBページの情報をネットワーク等を介して受信する。そして、受信した検索結果を示すWEBページを、検索結果出力部112が図示しないモニタ等に表示する。なお、検索が図示しないSQLサーバ等に対して行われる場合、例えば地域特徴語が管理されるフィールド名(項目名)が「地域特徴語」であるとすると、検索条件生成部110が生成する条件情報は、「SELECT フィールド名 FROM テーブル名 WHERE 地域特徴語='富山城';」等であってもよい。ただし、「テーブル名」は地域特徴語や検索対象となる情報等が管理されているテーブル名、「フィールド名」は、検索対象となる情報、言い換えれば検索結果として出力されうる情報が管理されているフィールド名であるとする。   Then, when the user gives an instruction for performing a search to the information processing apparatus 1, the search condition generation unit 110 creates condition information including “Toyama Castle” that is the selected regional feature word, for example, a search query. The created condition information is, for example, “q = Toyama Castle” transmitted as a GET parameter to a predetermined search WEB site (where q is a variable used as a search condition in the search WEB site), etc. is there. Then, the search unit 111 transmits the condition information to a search web site designated in advance via a network or the like. And the information of the WEB page which shows the search result which a WEB site etc. transmits is received via a network. The search result output unit 112 displays a WEB page indicating the received search result on a monitor or the like (not shown). When the search is performed on an SQL server (not shown) or the like, if the field name (item name) in which the regional feature word is managed is “local feature word”, for example, the condition generated by the search condition generating unit 110 The information may be “SELECT field name FROM table name WHERE region feature word =“ Toyama Castle ”; However, “table name” is a table name in which regional feature words and information to be searched are managed, and “field name” is information to be searched, in other words, information that can be output as a search result is managed. Field name.

図9は、検索結果出力部112による検索結果の表示例を示す図である。   FIG. 9 is a diagram illustrating a display example of search results by the search result output unit 112.

なお、ここでは、GPSにより位置情報を取得する場合について説明したが、例えば、図10に示すように、図示しないモニタ等に地図を表示して、当該地図情報上の位置についてのタッチパネル等の入力デバイスの操作により指定を受け付けた場合に、当該指定を受け付けた位置に対応する実際の地域の位置情報を受け付けるようにしても良い。このような地図を表示するための地図情報は、図示しない地図情報格納部等に格納しておくようにすればよい。また、地図情報の表示は、図示しない表示部等により行うようにすればよく、表示した地図上の位置の指定は図示しない受付部等が受け付けるようにすればよい。また、このような受付部が受け付けた地図上の位置から、位置情報取得部102等が実際の地域の座標情報を取得する処理は、WEBページ等に地図の画像を表示する技術等として公知であるのでここでは説明を省略する。   In addition, although the case where position information is acquired by GPS has been described here, for example, as shown in FIG. 10, a map is displayed on a monitor or the like (not shown), and a touch panel or the like is input for the position on the map information. When the designation is received by operating the device, the position information of the actual area corresponding to the position where the designation is accepted may be accepted. The map information for displaying such a map may be stored in a map information storage unit or the like (not shown). Further, the display of the map information may be performed by a display unit (not shown) or the like, and the designation of the displayed position on the map may be received by a reception unit (not shown) or the like. In addition, the process in which the position information acquisition unit 102 or the like acquires the coordinate information of the actual area from the position on the map received by such a reception unit is known as a technique for displaying a map image on a WEB page or the like. Since there are, description is abbreviate | omitted here.

また、地域特徴語格納部101に格納される地域特徴語に対して、地域のレベルを指定する地域レベル情報を対応付けておき、上記のように地図情報を用いて位置情報を取得する場合等に、位置の指定を受け付けるために表示された地図の縮尺を示す縮尺情報を受け付けるようにし、地域特徴語取得部103が、当該縮尺情報に応じた地域レベル情報に対応した地域特徴語の中から地域特徴語を取得するようにしても良い。   In addition, when the regional feature word stored in the regional feature word storage unit 101 is associated with the regional level information that specifies the regional level, the location information is acquired using the map information as described above. In addition, scale information indicating the scale of the displayed map is received in order to receive the designation of the position, and the regional feature word acquisition unit 103 selects from the regional feature words corresponding to the regional level information corresponding to the scale information. You may make it acquire a local feature word.

例えば、縮尺が7万5千分の1より小さい場合は、市町村レベルの地域情報を用いて抽出した地域特徴語を用いるようにし、縮尺が7万5千分の1より大きい場合は、都道府県レベルの地域情報を用いて抽出した地域特徴語を用いるようにすればよい。例えば、縮尺が小さい場合は、地図上には複数の都道府県が表示されるため、都道府県レベルの違いでしか地域を指定できない。このため、地域特徴語として都道府県レベルでの違いが分かるような地域特徴語が表示されればよく、逆にこれ以上細かいレベルでの地域特徴語が取得できても、地図上の選択位置の微妙なずれで、異なる地域特徴語が取得されてしまうため、ユーザに混乱を与える可能性がある。このため、縮尺に応じたレベルの地域特徴語が選択されるようにすることで、地図上から表示している地図の縮尺に応じた適切なレベルの地域特徴語を提示することが可能となる。なお、縮尺情報と地域レベル情報との対応関係は、例えば図示しない格納部等に縮尺情報と地域レベル情報とを対応付けた情報を格納しておくことにより管理すればよい。また、縮尺情報と地域レベル情報として同一の情報を用いるようにしても良い。   For example, when the scale is smaller than 1 / 755,000, the regional feature word extracted using the local information at the municipal level is used. When the scale is larger than 1 / 755,000, the prefecture The regional feature words extracted using the level regional information may be used. For example, when the scale is small, a plurality of prefectures are displayed on the map, so that the area can be specified only by the difference in the prefecture level. For this reason, it is only necessary to display a regional feature word that shows the difference at the prefecture level as a regional feature word. Conversely, even if a regional feature word at a finer level can be acquired, the selected location on the map Because different regional feature words are acquired with a subtle shift, there is a possibility of confusion for the user. For this reason, it is possible to present regional feature words at an appropriate level according to the scale of the map displayed from the map by selecting the regional feature words at a level corresponding to the scale. . Note that the correspondence between the scale information and the regional level information may be managed by storing information in which the scale information and the regional level information are associated with each other, for example, in a storage unit (not shown). Further, the same information may be used as the scale information and the regional level information.

また、上記具体例においては、地域特徴語出力部104が、入力フィールドに入力された文字を含む地域特徴語を表示するようにしたが、図11に示すように、地域特徴語取得部103が読み出した地域特徴語の少なくとも一部を含むリストを表示して、当該リストから地域特徴語を選択させるようにしても良い。また、地域特徴語に対応した分野情報を、地域特徴語と対応付けて表示、例えば並べて表示し、当該分野情報のひとつが選択された場合、当該分野情報に対応した分野指定情報を位置情報取得部102が取得して、当該分野指定情報に対応した地域特徴語のみを地域特徴語取得部103が再取得するようにしても良い。このようにすることで、地域特徴語の分野による絞り込みを行うことができる。   In the above specific example, the regional feature word output unit 104 displays the regional feature words including the characters input in the input field. However, as shown in FIG. A list including at least a part of the read regional feature words may be displayed, and the regional feature words may be selected from the list. Further, the field information corresponding to the area feature word is displayed in association with the area feature word, for example, displayed side by side, and when one of the field information is selected, the field designation information corresponding to the field information is acquired as the position information. The region feature word acquisition unit 103 may re-acquire only the regional feature words corresponding to the field designation information. By doing in this way, it is possible to narrow down by the field of regional feature words.

以上のように、本実施の形態によれば、位置情報が示す位置に関連性が高い文字列の情報である地域特徴語を取得して、当該地域特徴語を用いた情報検索を行うことが可能である。これにより、例えば、ユーザが現在存在している地域に関連性の高い特徴的な情報をユーザに提示することが可能となる。   As described above, according to the present embodiment, it is possible to acquire an area feature word that is information of a character string that is highly relevant to the position indicated by the position information and perform an information search using the area feature word. Is possible. Thereby, for example, it becomes possible to present to the user characteristic information highly relevant to the area where the user currently exists.

また、本実施の形態においては、ユーザ等により指定された地域に関連性の高い文字列の情報である地域特徴語を抽出して、地域特徴語格納部101に蓄積することができる。   Further, in the present embodiment, it is possible to extract regional feature words that are character string information highly relevant to the region designated by the user or the like and store them in the regional feature word storage unit 101.

また、クラスタリングにより類似している地域をまとめた領域と対応付けて地域特徴語を蓄積するようにしたことにより、ユーザ等により指定された地域に類似している地域の地域特徴語も補足的に出力することが可能となり、類似する地域において特徴的な事象の情報等も提示することが可能となる。   In addition, since the region feature words are accumulated by associating the similar regions with the clustered regions by clustering, the region feature words of the regions similar to the regions designated by the user or the like are supplementarily added. It is possible to output information, and it is also possible to present information on characteristic events in similar areas.

なお、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。   In each of the above embodiments, each process (each function) may be realized by centralized processing by a single device (system), or by distributed processing by a plurality of devices. May be.

また、上記各実施の形態において、一の装置に存在する2以上の通信手段(情報送信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。   Further, in each of the above embodiments, it goes without saying that two or more communication means (such as an information transmission unit) existing in one apparatus may be physically realized by one medium.

また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりする情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。   In the above embodiment, information related to processing executed by each component, for example, information received, acquired, selected, generated, transmitted, and received by each component. In addition, information such as threshold values, mathematical formulas, addresses, etc. used by each component in processing is retained temporarily or over a long period of time on a recording medium (not shown) even when not explicitly stated in the above description. It may be. Further, the storage of information in the recording medium (not shown) may be performed by each component or a storage unit (not shown). Further, reading of information from the recording medium (not shown) may be performed by each component or a reading unit (not shown).

また、上記各実施の形態では、情報処理装置がスタンドアロンである場合について説明したが、情報処理装置は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部や受付部は、通信回線を介して入力を受け付けたり、画面を出力したりすることになる。   Further, although cases have been described with the above embodiments where the information processing apparatus is a stand-alone, the information processing apparatus may be a stand-alone apparatus or a server apparatus in a server / client system. In the latter case, the output unit or the reception unit receives an input or outputs a screen via a communication line.

また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。   In each of the above embodiments, each component may be configured by dedicated hardware, or a component that can be realized by software may be realized by executing a program. For example, each component can be realized by a program execution unit such as a CPU reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.

なお、上記各実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納されている地域特徴語格納部と、位置を示す情報である位置情報を取得する位置情報取得部と、地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納されている地域特徴語格納部から、前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を取得する地域特徴語取得部と、前記地域特徴語取得部が取得した地域特徴語を出力する地域特徴語出力部として機能させるためのプログラムである。   The software that realizes the information processing apparatus in each of the above embodiments is a program as described below. In other words, this program associates a computer with a region feature word that is a character string highly related to a region and region information that is information indicating a region including a region that is highly related to the region feature word. Stored in the region feature word storage unit, a location information acquisition unit that acquires location information that is information indicating the location, a region feature word that is a character string highly related to the region, and the region feature word A region including the position indicated by the position information acquired by the position information acquisition unit from the region feature word storage unit in which the region information that is the information indicating the region including the region having high relevance is stored. This is a program for functioning as an area feature word acquisition unit that acquires an area feature word corresponding to the area information indicating, and an area feature word output unit that outputs the area feature word acquired by the area feature word acquisition unit.

なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。   In the program, the functions realized by the program do not include functions that can be realized only by hardware. For example, a function that can be realized only by hardware such as a modem or an interface card in an acquisition unit that acquires information or an output unit that outputs information is not included in the function realized by the program.

また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。   Further, the computer that executes this program may be singular or plural. That is, centralized processing may be performed, or distributed processing may be performed.

図12は、上記プログラムを実行して、上記実施の形態による情報処理装置を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。   FIG. 12 is a schematic diagram illustrating an example of an external appearance of a computer that executes the program and realizes the information processing apparatus according to the embodiment. The above-described embodiment can be realized by computer hardware and a computer program executed on the computer hardware.

図12において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。   In FIG. 12, a computer system 900 includes a computer 901 including a CD-ROM (Compact Disk Read Only Memory) drive 905 and an FD (Floppy (registered trademark) Disk) drive 906, a keyboard 902, a mouse 903, a monitor 904, and the like. Is provided.

図13は、コンピュータシステム900の内部構成を示す図である。図13において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。   FIG. 13 is a diagram showing an internal configuration of the computer system 900. In FIG. 13, in addition to the CD-ROM drive 905 and the FD drive 906, a computer 901 is connected to an MPU (Micro Processing Unit) 911, a ROM 912 for storing a program such as a bootup program, and the MPU 911. A RAM (Random Access Memory) 913 that temporarily stores program instructions and provides a temporary storage space, a hard disk 914 that stores application programs, system programs, and data, and an MPU 911 and a ROM 912 are interconnected. And a bus 915. The computer 901 may include a network card (not shown) that provides connection to the LAN.

コンピュータシステム900に、上記実施の形態による情報処理装置の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。   A program that causes the computer system 900 to execute the functions of the information processing apparatus according to the above-described embodiment is stored in the CD-ROM 921 or FD 922, inserted into the CD-ROM drive 905 or FD drive 906, and transferred to the hard disk 914. May be. Instead, the program may be transmitted to the computer 901 via a network (not shown) and stored in the hard disk 914. The program is loaded into the RAM 913 when executed. The program may be loaded directly from the CD-ROM 921, the FD 922, or the network.

プログラムは、コンピュータ901に、上記実施の形態による情報処理装置の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。   The program does not necessarily include an operating system (OS) or a third-party program that causes the computer 901 to execute the functions of the information processing apparatus according to the above-described embodiment. The program may include only a part of an instruction that calls an appropriate function (module) in a controlled manner and obtains a desired result. How the computer system 900 operates is well known and will not be described in detail.

本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。   The present invention is not limited to the above-described embodiment, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.

以上のように、本発明にかかる情報処理装置等は、検索を補助する情報処理装置等として適しており、特に、地域に関連した情報の検索を補助する情報処理装置等として有用である。   As described above, the information processing apparatus and the like according to the present invention are suitable as an information processing apparatus and the like that assists in searching, and are particularly useful as an information processing apparatus and the like that assists in searching for information related to a region.

1 情報処理装置
101 地域特徴語格納部
102 位置情報取得部
103 地域特徴語取得部
104 地域特徴語出力部
105 地域情報受付部
106 地域関連情報取得部
107 地域特徴語抽出部
108 クラスタリング部
109 地域特徴語蓄積部
110 検索条件生成部
111 検索部
112 検索結果出力部
113 指定受付部
114 地域範囲情報格納部
DESCRIPTION OF SYMBOLS 1 Information processing apparatus 101 Area feature word storage part 102 Location information acquisition part 103 Area feature word acquisition part 104 Area feature word output part 105 Area information reception part 106 Area related information acquisition part 107 Area feature word extraction part 108 Clustering part 109 Area feature Word accumulation unit 110 Search condition generation unit 111 Search unit 112 Search result output unit 113 Designation reception unit 114 Area range information storage unit

Claims (13)

地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納されている地域特徴語格納部と、
位置を示す情報である位置情報を取得する位置情報取得部と、
前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する地域特徴語取得部と、
前記地域特徴語取得部が取得した地域特徴語を出力する地域特徴語出力部とを備えた情報処理装置。
A region feature word that is stored in association with a region feature word that is a character string that is highly relevant to a region and region information that is a region that includes a region that is highly relevant to the region feature word A storage unit;
A position information acquisition unit that acquires position information that is information indicating a position;
An area feature word acquisition unit that acquires an area feature word corresponding to the area information indicating an area including the position indicated by the position information acquired by the position information acquisition unit from the area feature word storage unit;
An information processing apparatus comprising: an area feature word output unit that outputs the area feature word acquired by the area feature word acquisition unit.
地域を示す情報である地域情報を受け付ける地域情報受付部と、
前記地域情報受付部が受け付けた地域情報を含む検索条件を用いて検索を行い、当該地域情報が示す地域に関連した情報である地域関連情報を取得する地域関連情報取得部と、
前記地域関連情報取得部が取得した地域関連情報から、前記地域特徴語を抽出する地域特徴語抽出部と、
前記地域特徴語抽出部が抽出した地域特徴語を、前記地域情報が示す地域を含む前記領域情報と対応付けて前記地域特徴語格納部に蓄積する地域特徴語蓄積部とを更に備えた請求項1または請求項2記載の情報処理装置。
An area information receiving unit for receiving area information, which is information indicating the area;
A region-related information acquisition unit that performs a search using a search condition including the region information received by the region information reception unit, and acquires region-related information that is information related to the region indicated by the region information;
A region feature word extraction unit that extracts the region feature word from the region related information acquired by the region related information acquisition unit;
The local feature word accumulation part which accumulates the regional feature word extracted by the regional feature word extraction part in the regional feature word storage part in association with the regional information including the area indicated by the regional information. The information processing apparatus according to claim 1 or 2.
前記地域情報受付部は、複数の前記地域情報を受け付け、
前記地域関連情報取得部は、前記地域情報受付部が受け付けた前記複数の地域情報をそれぞれ含む検索条件を用いて検索を行い、各地域情報が示す地域の地域関連情報をそれぞれ取得し、
前記地域特徴語抽出部は、前記地域関連情報取得部が取得した一の地域情報が示す地域の地域関連情報に出現する文字列について、当該一の地域情報が示す地域の地域関連情報内における出現頻度と、前記複数の地域情報が示す複数の地域の地域関連情報内における、
当該文字列と一致する文字列を含む地域関連情報の出現頻度とを用いて、前記文字列の、地域との関連の強さを示す情報である地域特徴度を算出し、当該地域特徴度が所定の条件を満たす前記文字列である地域特徴語を抽出し、
前記地域特徴語蓄積部は、前記地域特徴語抽出部が抽出した地域特徴語を、前記一の地域情報が示す地域を含む前記領域情報と対応付けて前記地域特徴語格納部に蓄積する請求項2記載の情報処理装置。
The regional information receiving unit receives a plurality of the regional information,
The region-related information acquisition unit performs a search using a search condition including each of the plurality of region information received by the region information reception unit, and acquires each region-related information indicated by each region information,
The region feature word extraction unit, for a character string that appears in the region related information of the region indicated by the one region information acquired by the region related information acquisition unit, appears in the region related information of the region indicated by the one region information In the region-related information of the plurality of regions indicated by the frequency and the plurality of region information,
Using the appearance frequency of the region related information including the character string that matches the character string, the region characteristic degree that is the information indicating the strength of the relation of the character string with the region is calculated, and the region characteristic degree is Extracting a local feature word that is the character string satisfying a predetermined condition;
The region feature word storage unit stores the region feature words extracted by the region feature word extraction unit in the region feature word storage unit in association with the region information including a region indicated by the one region information. 2. The information processing apparatus according to 2.
前記地域情報受付部は、複数の地域情報の位置に関する情報を更に受け付け、
前記地域特徴語抽出部が複数の地域情報についてそれぞれ抽出および算出した一以上の地域特徴語およびその地域特徴度と、前記地域情報の位置に関する情報を用いて取得した複数の地域間の距離の情報とを用いて、類似する前記地域情報をクラスタリングするクラスタリング部とを更に備え、
前記地域特徴語蓄積部は、前記一以上の地域特徴語と、前記クラスタリングにより一のクラスタにまとめられた地域情報が示す地域を含む領域情報とを対応付けて前記地域特徴語格納部に蓄積する請求項3記載の情報処理装置。
The regional information receiving unit further receives information related to positions of a plurality of regional information,
One or more regional feature words extracted and calculated by the regional feature word extraction unit for a plurality of pieces of regional information, their regional feature degrees, and information on distances between the plurality of regions obtained using information on the location of the regional information And a clustering unit for clustering the similar regional information using
The regional feature word storage unit associates the one or more regional feature words with region information including a region indicated by the regional information grouped into one cluster by the clustering, and stores the region feature words in the regional feature word storage unit. The information processing apparatus according to claim 3.
前記地域特徴語は、前記地域との関連の強さを示す情報である地域特徴度と対応付けられて格納されており、
前記地域特徴語取得部は、前記地域特徴度に応じて前記地域特徴語を取得する請求項1記載の情報処理装置。
The regional feature word is stored in association with a regional feature degree, which is information indicating the strength of association with the region,
The information processing apparatus according to claim 1, wherein the regional feature word acquisition unit acquires the regional feature word according to the regional feature degree.
前記地域関連情報取得部は、前記地域情報受付部が受け付けた前記複数の地域情報をそれぞれ含む検索条件を用いて、WEBページの検索を行い、各地域情報が示す地域のWEBページの情報である地域関連情報をそれぞれ取得する請求項2から請求項4いずれか記載の情報処理装置。 The region-related information acquisition unit is information on a WEB page of a region indicated by each region information by performing a WEB page search using search conditions each including the plurality of region information received by the region information receiving unit. The information processing apparatus according to claim 2, wherein each area-related information is acquired. 前記地域特徴語出力部が出力した地域特徴語を含む検索条件を生成する検索条件生成部と、
前記検索条件作成部が作成した検索条件を用いて検索を行い、検索結果を示す情報を取得する検索部と、
前記検索部の検索結果を示す情報を出力する検索結果出力部とを更に備えた請求項1から請求項6いずれか記載の情報処理装置。
A search condition generation unit that generates a search condition including the region feature word output by the region feature word output unit;
A search unit that performs a search using the search condition created by the search condition creation unit and acquires information indicating a search result;
The information processing apparatus according to claim 1, further comprising: a search result output unit that outputs information indicating a search result of the search unit.
前記地域特徴語出力部は、地域特徴語取得部が取得した地域特徴語をリスト表示し、
前記リスト表示された地域特徴語のうちの一以上の地域特徴語の指定を受け付ける指定受付部とを更に備え、
前記検索条件生成部は、前記地域特徴語出力部が出力した地域特徴語のうちの、前記指定受付部が指定を受け付けた地域特徴語を用いて検索条件を生成する請求項7記載の情報処理装置。
The regional feature word output unit displays a list of regional feature words acquired by the regional feature word acquisition unit,
A designation receiving unit for accepting designation of one or more regional feature words of the list-displayed regional feature words;
The information processing according to claim 7, wherein the search condition generation unit generates a search condition by using a regional feature word that is designated by the designation receiving unit among the regional feature words output by the regional feature word output unit. apparatus.
前記領域情報は、領域の範囲を示す情報であり、
前記位置情報取得部は、ユーザの存在する位置を示す情報である前記位置情報を取得し、
前記地域特徴語取得部は、前記位置情報取得部が取得した位置情報が示す位置を含む範囲を示す領域情報を検出し、当該領域情報に対応づけられた地域特徴語を、前記地域特徴語格納部から取得する請求項1から請求項8いずれか記載の情報処理装置。
The region information is information indicating the range of the region,
The position information acquisition unit acquires the position information which is information indicating a position where the user exists,
The area feature word acquisition unit detects area information indicating a range including a position indicated by the position information acquired by the position information acquisition unit, and stores the area feature word associated with the area information. The information processing apparatus according to claim 1, wherein the information processing apparatus is acquired from a section.
前記地域特徴語は、時期を示す情報である時間情報と対応付けられて地域特徴語格納部に格納されており、
前記位置情報取得部は、時刻情報を更に取得し、
前記地域特徴語取得部は、前記時刻情報が示す時刻を含む時間情報と対応付けられた地域特徴語であって、前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する請求項1から請求項9いずれか記載の情報処理装置。
The regional feature word is stored in the regional feature word storage unit in association with time information which is information indicating time,
The position information acquisition unit further acquires time information,
The region feature word acquisition unit is a region feature word associated with time information including the time indicated by the time information, and indicates the region including the position indicated by the position information acquired by the position information acquisition unit The information processing apparatus according to claim 1, wherein a regional feature word corresponding to information is acquired from the regional feature word storage unit.
前記地域特徴語は、分野を示す情報である分野情報と対応付けられて地域特徴語格納部に格納されており、
前記位置情報取得部は、分野を指定する情報である分野指定情報を更に取得し、
前記地域特徴語取得部は、前記分野指定情報が示す分野を含む分野情報と対応付けられた地域特徴語であって、前記位置情報取得部が取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する請求項1から請求項10いずれか記載の情報処理装置。
The regional feature word is stored in the regional feature word storage unit in association with the field information that is information indicating the field,
The position information acquisition unit further acquires field designation information that is information for designating a field,
The region feature word acquisition unit is a region feature word associated with field information including a field indicated by the field specification information, and indicates a region including a position indicated by the position information acquired by the position information acquisition unit The information processing apparatus according to claim 1, wherein an area feature word corresponding to area information is acquired from the area feature word storage unit.
地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納されている地域特徴語格納部と、位置情報取得部と、地域特徴語取得部と、地域特徴語出力部とを用いて行われる情報処理方法であって、
前記位置情報取得部が、位置を示す情報である位置情報を取得する位置情報取得ステップと、
前記地域特徴語取得部が、前記位置情報取得ステップで取得した位置情報が示す位置を含む領域を示す前記領域情報に対応した地域特徴語を、前記地域特徴語格納部から取得する地域特徴語取得ステップと、
前記地域特徴語出力部が、前記地域特徴語取得ステップで取得した地域特徴語を出力する地域特徴語出力ステップとを備えた情報処理方法。
A region feature word that is stored in association with a region feature word that is a character string that is highly relevant to a region and region information that is a region that includes a region that is highly relevant to the region feature word An information processing method performed using a storage unit, a location information acquisition unit, a regional feature word acquisition unit, and a regional feature word output unit,
The position information acquisition unit acquires position information that is information indicating a position; and
The area feature word acquisition unit acquires the area feature word corresponding to the area information indicating the area including the position indicated by the position information acquired in the position information acquisition step from the area feature word storage unit. Steps,
An information processing method comprising: an area feature word output step in which the area feature word output unit outputs the area feature word acquired in the area feature word acquisition step.
コンピュータを、
地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域を含む領域を示す情報である領域情報とが対応付けられて格納されている地域特徴語格納部と、
位置を示す情報である位置情報を取得する位置情報取得部と、
地域との関連性が高い文字列である地域特徴語と、当該地域特徴語との関連性の高い地域域特徴語取得部と、
前記地域特徴語取得部が取得した地域特徴語を出力する地域特徴語出力部として機能させるためのプログラム。
Computer
A region feature word that is stored in association with a region feature word that is a character string that is highly relevant to a region and region information that is a region that includes a region that is highly relevant to the region feature word A storage unit;
A position information acquisition unit that acquires position information that is information indicating a position;
A regional feature word that is a character string that is highly relevant to the region, and a regional feature word acquisition unit that is highly relevant to the regional feature word;
A program for functioning as a regional feature word output unit that outputs a regional feature word acquired by the regional feature word acquisition unit.
JP2009041972A 2009-02-25 2009-02-25 Information processing apparatus, information processing method, and program Active JP5371480B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009041972A JP5371480B2 (en) 2009-02-25 2009-02-25 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009041972A JP5371480B2 (en) 2009-02-25 2009-02-25 Information processing apparatus, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2010198281A true JP2010198281A (en) 2010-09-09
JP5371480B2 JP5371480B2 (en) 2013-12-18

Family

ID=42822951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009041972A Active JP5371480B2 (en) 2009-02-25 2009-02-25 Information processing apparatus, information processing method, and program

Country Status (1)

Country Link
JP (1) JP5371480B2 (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011149104A1 (en) * 2010-05-28 2011-12-01 楽天株式会社 Information processing device, information processing method, information processing programme, and recording medium
JP2013025818A (en) * 2011-07-22 2013-02-04 Nhn Corp Automatic completion query providing system and method of each region
JP2013069175A (en) * 2011-09-22 2013-04-18 Nec Corp Keyword extraction system, keyword extraction method, and program
JP2013097491A (en) * 2011-10-31 2013-05-20 Dainippon Printing Co Ltd Automatic tagging device, automatic tagging method and program
JP2013120423A (en) * 2011-12-06 2013-06-17 Ntt Docomo Inc Information providing device and information providing method
JP2015026135A (en) * 2013-07-24 2015-02-05 富士通株式会社 Location estimation method, location estimation device, and location estimation program
JP2015049198A (en) * 2013-09-03 2015-03-16 株式会社 ミックウェア Terminal device, information processing method, and program
JP2015102933A (en) * 2013-11-22 2015-06-04 日本電信電話株式会社 Place-name position estimation method, place-name position estimation apparatus, and place-name position estimation program
JP2015102987A (en) * 2013-11-25 2015-06-04 日本電信電話株式会社 Place-name estimation method, place-name estimation device, and place-name estimation program
JP2017151788A (en) * 2016-02-25 2017-08-31 ヤフー株式会社 Information processing apparatus, information processing method, and information processing program
US9785718B2 (en) 2011-07-22 2017-10-10 Nhn Corporation System and method for providing location-sensitive auto-complete query
JP2017191357A (en) * 2016-04-11 2017-10-19 株式会社Nttドコモ Word determination device
JP2018088186A (en) * 2016-11-29 2018-06-07 富士通株式会社 Feature extraction method, feature extraction program, and feature extraction apparatus
JP2019095831A (en) * 2017-11-17 2019-06-20 ヤフー株式会社 Extractor, extraction method, and extraction program
JP2021149468A (en) * 2020-03-18 2021-09-27 ヤフー株式会社 Information processing apparatus, information processing method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135113A (en) * 2003-10-29 2005-05-26 Sony Corp Electronic equipment, related word extracting method, and program
JP2007293823A (en) * 2006-03-27 2007-11-08 Denso It Laboratory Inc Map display system and map display method
WO2008149408A1 (en) * 2007-06-05 2008-12-11 Hiroshima University Information search system, mobility frequency management device and area information search device used for it, program in the mobility frequency management device, program in the area information search device, and computer-readable recording medium recording the programs

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135113A (en) * 2003-10-29 2005-05-26 Sony Corp Electronic equipment, related word extracting method, and program
JP2007293823A (en) * 2006-03-27 2007-11-08 Denso It Laboratory Inc Map display system and map display method
WO2008149408A1 (en) * 2007-06-05 2008-12-11 Hiroshima University Information search system, mobility frequency management device and area information search device used for it, program in the mobility frequency management device, program in the area information search device, and computer-readable recording medium recording the programs

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200600049037; 服部峻、外2名: 'モバイル環境における実空間相応度に基づく情報ランキング手法' 情報処理学会研究報告(2005-DBS-137(II)) 第2005巻,第68号, 20050715, p.553-560, 社団法人情報処理学会 *
JPN6013018541; 服部峻、外2名: 'モバイル環境における実空間相応度に基づく情報ランキング手法' 情報処理学会研究報告(2005-DBS-137(II)) 第2005巻,第68号, 20050715, p.553-560, 社団法人情報処理学会 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9690804B2 (en) 2010-05-28 2017-06-27 Rakuten, Inc. Information processing device, information processing method, information processing program, and recording medium
JP5134162B2 (en) * 2010-05-28 2013-01-30 楽天株式会社 Information processing apparatus, information processing method, information processing program, and recording medium
WO2011149104A1 (en) * 2010-05-28 2011-12-01 楽天株式会社 Information processing device, information processing method, information processing programme, and recording medium
JP2013025818A (en) * 2011-07-22 2013-02-04 Nhn Corp Automatic completion query providing system and method of each region
US9785718B2 (en) 2011-07-22 2017-10-10 Nhn Corporation System and method for providing location-sensitive auto-complete query
JP2013069175A (en) * 2011-09-22 2013-04-18 Nec Corp Keyword extraction system, keyword extraction method, and program
JP2013097491A (en) * 2011-10-31 2013-05-20 Dainippon Printing Co Ltd Automatic tagging device, automatic tagging method and program
JP2013120423A (en) * 2011-12-06 2013-06-17 Ntt Docomo Inc Information providing device and information providing method
JP2015026135A (en) * 2013-07-24 2015-02-05 富士通株式会社 Location estimation method, location estimation device, and location estimation program
JP2015049198A (en) * 2013-09-03 2015-03-16 株式会社 ミックウェア Terminal device, information processing method, and program
JP2015102933A (en) * 2013-11-22 2015-06-04 日本電信電話株式会社 Place-name position estimation method, place-name position estimation apparatus, and place-name position estimation program
JP2015102987A (en) * 2013-11-25 2015-06-04 日本電信電話株式会社 Place-name estimation method, place-name estimation device, and place-name estimation program
JP2017151788A (en) * 2016-02-25 2017-08-31 ヤフー株式会社 Information processing apparatus, information processing method, and information processing program
JP2017191357A (en) * 2016-04-11 2017-10-19 株式会社Nttドコモ Word determination device
JP2018088186A (en) * 2016-11-29 2018-06-07 富士通株式会社 Feature extraction method, feature extraction program, and feature extraction apparatus
JP2019095831A (en) * 2017-11-17 2019-06-20 ヤフー株式会社 Extractor, extraction method, and extraction program
JP7030485B2 (en) 2017-11-17 2022-03-07 ヤフー株式会社 Extractor, extraction method, and extraction program
JP2021149468A (en) * 2020-03-18 2021-09-27 ヤフー株式会社 Information processing apparatus, information processing method, and program
JP7330919B2 (en) 2020-03-18 2023-08-22 ヤフー株式会社 Information processing device, information processing method and program

Also Published As

Publication number Publication date
JP5371480B2 (en) 2013-12-18

Similar Documents

Publication Publication Date Title
JP5371480B2 (en) Information processing apparatus, information processing method, and program
US7657504B2 (en) User interface for displaying images of sights
US7707208B2 (en) Identifying sight for a location
JP6423845B2 (en) Method and system for dynamically ranking images to be matched with content in response to a search query
CN110110173B (en) Search result ranking and presentation
US8732167B1 (en) Identifying digital resources relating to entities
JP5444115B2 (en) Data search apparatus, data search method and program
JP2017157192A (en) Method of matching between image and content item based on key word
KR20100046586A (en) Map-based web search method and apparatus
KR20110114055A (en) Semantic based searching apparatus and semantic based searching method and server for providing semantic based metadata and method for operating thereof
JP2019149145A (en) Information search system
WO2013146394A1 (en) Information processing terminal and method, and information management apparatus and method
JP2017157193A (en) Method of selecting image that matches with content based on metadata of image and content
JP2007334799A (en) Information provision program, recording medium which records the program, information provision device and information provision method
JP2007193697A (en) Information collection apparatus, information collection method and program
JP5484113B2 (en) Document image related information providing apparatus and document image related information acquisition system
JP2017191357A (en) Word determination device
JP2007004240A (en) Information processor, information processing system and program
JP5639549B2 (en) Information retrieval apparatus, method, and program
US20130007052A1 (en) Map Information Processing Apparatus, Navigation System, and Program
JP5741242B2 (en) Profile updating apparatus, control method therefor, and profile updating program
JP5084859B2 (en) Information processing apparatus, data extraction method, and program
Yoo et al. Visualization and level-of-detail of metadata for interactive exploration of sensor web
JP5843235B2 (en) WEB information processing apparatus, WEB information processing method, and program
JP2017204054A (en) Compatibility calculation device, compatibility calculation method, and computer program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130917

R150 Certificate of patent or registration of utility model

Ref document number: 5371480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250