JP2008090334A - Location analyzer, location analyzing method, its program, and recording medium - Google Patents
Location analyzer, location analyzing method, its program, and recording medium Download PDFInfo
- Publication number
- JP2008090334A JP2008090334A JP2006266834A JP2006266834A JP2008090334A JP 2008090334 A JP2008090334 A JP 2008090334A JP 2006266834 A JP2006266834 A JP 2006266834A JP 2006266834 A JP2006266834 A JP 2006266834A JP 2008090334 A JP2008090334 A JP 2008090334A
- Authority
- JP
- Japan
- Prior art keywords
- address
- location
- database
- candidate
- address information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、住所情報の一部もしくは所定の住所に存在する施設の名称からなる住所表現から、当該住所表現に対応する場所を表す情報(例えば、住所情報、緯度・経度情報等)である所在地を求める技術に関する。 The present invention is a location that is information (for example, address information, latitude / longitude information, etc.) representing a place corresponding to the address expression from an address expression consisting of part of the address information or the name of a facility existing at a predetermined address. Related to technology.
従来より、住所表現から、これに対応する所在地を求めるシステムとして、住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを、入力された住所表現をキーとして検索し、該当する住所表現を含むレコードの住所情報を所在地として出力するものがあった(特許文献1参照)。
ところで、住所表現の中には、対応する所在地が2つ以上存在するものが少なくない。例えば「日本橋」という住所情報の一部からなる住所表現に対応する所在地は東京にも大阪にも存在し、また「末広町」という住所情報の一部からなる住所表現に対応する所在地は日本全国に126箇所も存在する。 By the way, there are not a few address expressions that have two or more corresponding locations. For example, there are locations in Tokyo and Osaka that correspond to address expressions consisting of part of the address information “Nihonbashi”, and locations that correspond to address expressions consisting of part of the address information “Suehirocho” are all over Japan. There are also 126 locations.
この場合、前述した従来のシステムでは、対応する全ての所在地を候補として一覧表示するのみであり、その後は利用者が自らの判断で選択しなければならず、特に候補の数が多い場合、正しい所在地、即ち目的とする所在地を求めることが困難であったり、時間がかかったりするという問題があった。 In this case, the above-mentioned conventional system only displays a list of all the corresponding locations as candidates, and after that, the user must make a selection based on his / her own judgment. There has been a problem that it is difficult or time consuming to determine the location, that is, the target location.
本発明は、入力された住所表現に対応する所在地が2つ以上存在する場合であっても、そのうちの1つのみを自動的に選択して出力可能とすることを目的とする。 An object of the present invention is to make it possible to automatically select and output only one of the addresses even if there are two or more locations corresponding to the input address expression.
本発明では、前記課題を解決するため、住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と同一及び地理的に近い住所情報を含むレコードの数を有名度スコアとして所在地候補毎に出力し、前記出力された所在地候補のうち、有名度スコアが最も高い所在地候補を所在地に決定することを特徴とする。 In the present invention, in order to solve the above-mentioned problem, the address of only the address information or the name of the facility existing at the predetermined address and the address information registered for each record is referred to, and the record including the input address expression is recorded. The address information is output as a location candidate, and the number of records including address information identical and geographically close to the address information of the location candidate is output for each location candidate as a celebrity score. The location candidate having the highest reputation score is determined as the location.
また、本発明では、前記課題を解決するため、住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離のうちn番目に小さい距離を有名度スコアとして所在地候補毎に出力し、前記出力された所在地候補のうち、有名度スコアが最も低い所在地候補を所在地に決定することを特徴とする。 Further, in the present invention, in order to solve the above-mentioned problem, the name of the facility existing only at the address information or at the predetermined address and the database in which the address information is registered for each record are referred to, and the input address expression is included The address information of the record is output as a location candidate, and the location candidate with the nth smallest distance among the geographical distances between the address information of the location candidate and the address information of each record in the database as a celebrity score It is output every time, and among the output location candidates, the location candidate having the lowest celebrity score is determined as the location.
本発明によれば、入力された住所表現を含む所在地候補のうち、その住所情報と同一及び地理的に近い住所情報がデータベース中に数多く含まれる候補を所在地と決定する、あるいはその住所情報とデータベース中の各レコードの住所情報との間の地理的な距離のうちn番目に小さい距離が最小の候補を所在地と決定することにより、入力された住所表現に対応する所在地が2つ以上存在する場合であっても、そのうちの1つのみを自動的に選択して出力することが可能となる。 According to the present invention, among the address candidates including the input address expression, a candidate whose address information includes many address information identical and geographically close to the address information is determined as the address, or the address information and the database. When there are two or more locations corresponding to the input address expression by determining the candidate having the smallest nth smallest distance among the geographical information between the address information of each record in Even so, only one of them can be automatically selected and output.
ここで、所在地候補の住所情報を含むレコードだけでなく、これと地理的に近い住所情報を含むレコードの数を有名度スコアとし、あるいは所在地候補の住所情報とデータベース中の各レコードの住所情報との間の地理的な距離のうちn番目に小さい距離を有名度スコアとしたことにより、関連する先願(特願2006−137660:未公開)に比べ、行政区画の違いによって有名度スコアに反映されなかった情報を反映でき、より正確な有名度を得ることが可能となる。 Here, the number of records that include not only the address information of the address candidate but also the address information that is geographically close to this is used as the celebrity score, or the address information of the address candidate and the address information of each record in the database The nth smallest distance among the geographical distances between the two is used as the celebrity score, so that it is reflected in the celebrity score due to the difference in administrative divisions compared to the related prior application (Japanese Patent Application No. 2006-137660: unpublished) It is possible to reflect information that has not been made, and to obtain a more accurate reputation.
例えば、東京都の三鷹駅周辺は三鷹市と武蔵野市との境界に当たり、道路を挟んだ反対側は行政区画が異なることが多い。このような場合、先願では、道路の反対側の情報は地理的に近くにあるにも拘わらず、異なる行政区画となって有名度スコアに反映されなかった。本発明では、所在地候補の住所情報だけでなく、これと地理的に近い住所情報を用い、あるいは所在地候補の住所情報とデータベース中の各レコードの住所情報との間の地理的な距離を用いるため、行政区画に依らない有名度スコアを求めることが可能となる。 For example, the area around Mitaka Station in Tokyo is the boundary between Mitaka City and Musashino City, and the other side across the road often has different administrative divisions. In such a case, in the previous application, the information on the other side of the road was geographically close, but became a different administrative division and was not reflected in the reputation score. In the present invention, not only the address information of the address candidate but also the address information geographically close to the address candidate is used, or the geographical distance between the address information of the address candidate and the address information of each record in the database is used. It becomes possible to obtain a reputation score that does not depend on administrative divisions.
以下、本発明の実施の形態を図面により説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
<実施の形態1>
図1は本発明の所在地解析装置の実施の形態の一例を示すもので、図中、1はデータベース、2は住所表現記憶部、3は所在地候補生成部、4は所在地候補記憶部、5は所在地決定部、6は住所表現−所在地対応付け部である。
<Embodiment 1>
FIG. 1 shows an example of an embodiment of the location analysis apparatus of the present invention. In the figure, 1 is a database, 2 is an address expression storage unit, 3 is a location candidate generation unit, 4 is a location candidate storage unit, A location determination unit 6 is an address expression-location association unit.
データベース1は、住所情報とその緯度・経度情報もしくは所定の住所に存在する施設の名称とその住所情報及び緯度・経度情報をレコード毎に登録してなる少なくとも1つのデータベース、ここでは住所データベース11、店舗データベース12、駅名データベース13及びランドマークデータベース14からなる。
The database 1 is at least one database in which address information and its latitude / longitude information or the name of a facility existing at a predetermined address and its address information and latitude / longitude information are registered for each record. It consists of a
住所データベース11は、図2に示すように、住所情報とその緯度・経度情報、ここでは日本全国全ての住所情報とその緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。ここで、住所データベース11は、レコードとして日本全国に存在する番地や号までを含む住所(例えば、「東京都中央区日本橋1丁目xx番1号」、「東京都中央区日本橋1丁目xx番2号」等)を全てその緯度・経度情報とともに登録したものであっても良いし、丁目までや市町村名まで等の途中までの住所(例えば、「東京都中央区日本橋」や「東京都中央区日本橋1丁目」や「東京都中央区」)もその緯度・経度情報とともに登録されていても良い。 As shown in FIG. 2, the address database 11 stores address information and its latitude / longitude information, here, address information of all of Japan and its latitude / longitude information for each record. The part where the address information is registered is called an address field, and the part where the latitude / longitude information is registered is called a latitude / longitude field. Here, the address database 11 includes addresses including addresses and issues existing all over Japan as records (for example, “Nihonbashi 1-chome xx-1 No. 1”, “Nihonbashi 1-chome xx-2 Chuo-ku, Tokyo”). ”, Etc.) along with the latitude / longitude information, or addresses up to the middle of the street, such as“ Chuo-ku, Tokyo ”or“ Chuo-ku, Tokyo ” “Nihonbashi 1-chome” and “Chuo-ku, Tokyo”) may also be registered along with the latitude and longitude information.
店舗データベース12は、図3に示すように、所定の住所に存在する施設、ここでは店舗の名称(店舗名)とその住所情報及び緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、店舗名が登録されている部分を店舗名フィールド、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。
As shown in FIG. 3, the
駅名データベース13は、図4に示すように、所定の住所に存在する施設、ここでは駅の名称(駅名)とその住所情報及び緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、駅名が登録されている部分を駅名フィールド、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。
As shown in FIG. 4, the
ランドマークデータベース14は、図5に示すように、所定の住所に存在する施設、ここではランドマークの名称(ランドマーク名)とその住所情報及び緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、ランドマーク名が登録されている部分をランドマーク名フィールド、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。
As shown in FIG. 5, the
住所表現記憶部2は、図示しないキーボード等から直接入力され又は記憶媒体から読み出されて入力され又は通信媒体を介して他の装置等から入力された住所表現を一時的に記憶する。
The address
所在地候補生成部3は、データベース1を参照し、前記の如く入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と同一及び地理的に近い住所情報を含むレコードの数を有名度スコアとして所在地候補毎に出力するもので、より詳細には、所在地候補抽出部31と、有名度スコア計算部32とから構成されている。
The location candidate generation unit 3 refers to the database 1 and outputs the address information of the record including the address expression input as described above as a location candidate, and the same and geographically close address information as the address information of the location candidate. The number of records including “” is output as a famousness score for each location candidate, and more specifically, includes a location
所在地候補抽出部31は、入力された住所表現をキーとしてデータベース1を検索し、該当する住所表現を含む全てのレコードの住所情報及びその緯度・経度情報を所在地候補として抽出するもので、さらに詳細には、データベース選択部311と、所在地情報取得部312とから構成されている。
The location
データベース選択部311は、図6に示すような、文字列ルールとこれに対応するデータベース名及びフィールド名とを記述したデータベース選択テーブルを予め記憶して保持しており、住所表現を入力とし、入力された住所表現の文字列を前記テーブルに記述された各文字列ルールと照合し、一致する文字列ルールがあれば、前記テーブルから当該一致した文字列ルールに対応するデータベース名及びフィールド名を読み出し、選択したデータベース名及びフィールド名として所在地情報取得部312に出力する。
The
ここで、文字列ルールとは、入力された住所表現の文字列の最後に「店」という文字が存在した場合には入力された住所表現は「店舗名」であると判定するものであり、また、入力された住所表現の文字列の最後に「駅」という文字が存在した場合には入力された住所表現は「駅名」であると判定するためのものである。従って、図6に示すような、前記文字列ルールとこれに対応するデータベース名及びフィールド名とを記述したデータベース選択テーブルを参照することにより、入力された住所表現に対応するデータベース名及びフィールド名を選択して出力することが可能となる。 Here, the character string rule is to determine that the input address expression is “store name” when the character “store” exists at the end of the input address expression character string. In addition, when the character “station” is present at the end of the character string of the input address expression, the input address expression is determined to be “station name”. Accordingly, by referring to the database selection table describing the character string rule and the corresponding database name and field name as shown in FIG. 6, the database name and field name corresponding to the input address expression are obtained. It is possible to select and output.
なお、このデータベース選択部311は、所在地候補の抽出に際して、検索対象とすべきデータベースやフィールドの数を少なくするためのもので、必須の構成ではなく、計算量は多くなるが、データベース1中の全てのデータベース及び全てのフィールドに対して、入力された住所表現をキーとする検索を行うようにしても良い。
The
所在地情報取得部312は、前述の如く入力され住所表現記憶部2に一時記憶された住所表現と、データベース選択部311で選択されて出力されたデータベース名及びフィールド名とを入力とし、該住所表現をキーとしてデータベース1のうち前記選択されたデータベース名及びフィールド名に対応するデータベースのフィールドを検索し、該当する住所表現を含むレコードの住所情報及び緯度・経度情報を所在地候補として取得し、有名度スコア計算部32及び所在地候補記憶部4に出力する(但し、所在地候補記憶部4に出力する所在地候補は住所情報のみでも良い。)。
The location
有名度スコア計算部32は、所在地候補抽出部31で抽出され出力された所在地候補の住所情報及び緯度・経度情報を入力とし、該所在地候補の住所情報とデータベース1中の各レコードの住所情報との間の地理的な距離を、それらの緯度・経度情報を用いてそれぞれ計算し、当該地理的な距離が予め設定した一定の距離以下であるレコードの数を計数し、同様な処理を所在地候補毎に行い、これらを所在地候補毎の有名度スコアとして所在地決定部5に出力する。
The celebrity
ここで、所在地候補の住所情報とデータベース1中の一のレコードの住所情報との間の地理的な距離Dは、それらの緯度情報N1,N2及び経度情報E1,E2を用いて、
D={(N1−N2)2+(E1−E2)2}1/2
より計算する。
Here, the geographical distance D between the address information of the candidate location and the address information of one record in the database 1 is obtained by using the latitude information N 1 and N 2 and the longitude information E 1 and E 2. ,
D = {(N 1 −N 2 ) 2 + (E 1 −E 2 ) 2 } 1/2
Calculate more.
なお、距離Dについては、前述したように予め設定した一定の距離(の値)との大小が判定できれば足りる、つまり絶対的な距離の値を必要とするわけではないので、上記式中のルート(1/2乗)の部分の計算は省略しても良い。また、本式に関しては、緯度情報及び経度情報を用いた2点間の距離を計算する既知の公式、例えば「緯度及び経度から平面直角座標に変換し測地線長を計算する公式」(B.R.Bowring, "TOTAL INVERSE SOLUTIONS FOR THE GEODESIC AND GREAT ELLIPTIC," Survey Review, Vol.33, No.261, July 1996, pp.461-476(http://vldb.gsi.go.jp/sokuchi/surveycalc/algorithm/)参照)等を用いても良い。 As described above, the distance D is sufficient if it can be determined from the predetermined distance (value) as described above, that is, an absolute distance value is not required. Calculation of the (1/2 power) portion may be omitted. As for this formula, a known formula for calculating the distance between two points using latitude information and longitude information, for example, “formula for calculating geodesic line length by converting latitude and longitude into plane rectangular coordinates” (BRBowring , "TOTAL INVERSE SOLUTIONS FOR THE GEODESIC AND GREAT ELLIPTIC," Survey Review, Vol.33, No.261, July 1996, pp.461-476 (http://vldb.gsi.go.jp/sokuchi/surveycalc/algorithm /) See) etc. may be used.
なお、有名度スコア計算部32における具体的な計算対象は、各データベースの全てのレコードの緯度・経度フィールドである。また、この際、計算対象のデータベースを限定することにより、様々な仮定に対応する有名度スコアを得ることができる。
A specific calculation object in the famousness
例えば、店舗が多いほど有名な所在地であると仮定した場合は、店舗データベースのみを利用することにより、店舗が多い所在地候補ほど高くなる有名度スコアが得られる。 For example, if it is assumed that the number of stores is more famous, the famousness score that is higher for the location candidates with more stores can be obtained by using only the store database.
また、行政区画が多いほど有名な所在地であると仮定した場合は、住所データベースのみを利用することにより、行政区画が多い所在地候補ほど高くなる有名度スコアが得られる。 Further, when it is assumed that the location is more famous as there are more administrative districts, the use of only the address database can obtain a reputation score that increases as the location candidate has more administrative districts.
さらにまた、WEB文書での記述が多いほど有名な所在地であると仮定した場合は、(図1では取り上げなかったが)WEBページを用いた各住所の検索ヒット文書のデータベースのみを利用することにより、WEB文書での記述が多い所在地候補ほど高くなる有名度スコアが得られる。 Furthermore, if it is assumed that the location is more famous as there are more descriptions in the WEB document, it is possible to use only the search hit document database of each address using the WEB page (not shown in FIG. 1). , A famousness score that is higher for a location candidate that has more descriptions in a WEB document can be obtained.
また、有名度スコア計算部32は、所在地候補が入力されてから各レコードとの距離の計算や該当レコード数の計数等の処理を行う必要はなく、例えば、あらゆる所在地候補に対する有名度スコアを予め計算し、これを登録したデータベースを用意しておき、所在地候補が入力された際、このデータベースから該当する所在地候補の有名度スコアを読み出して出力するようにしても良い。
Further, the famousity
所在地候補記憶部4は、所在地候補生成部3(の所在地候補抽出部31の所在地情報取得部312)から出力された所在地候補を一時的に記憶する。
The location candidate storage unit 4 temporarily stores the location candidate output from the location candidate generation unit 3 (location
所在地決定部5は、所在地候補生成部3から出力された所在地候補のうち、有名度スコアが最も高い所在地候補を所在地に決定する、より詳細には、所在地候補抽出部31から出力され所在地候補記憶部4に一時記憶された所在地候補と、有名度スコア計算部32から出力された有名度スコアとを入力とし、有名度スコアが最も高い所在地候補を所在地に決定して住所表現−所在地対応付け部6に出力する。
The
住所表現−所在地対応付け部6は、入力された住所表現と所在地決定部5で決定された所在地とを対応付けて出力する、より詳細には、前述の如く入力され住所表現記憶部2に一時記憶された住所表現と、所在地決定部5から出力された所在地とを入力とし、この住所表現と所在地(の住所情報)とを対応付けて出力する。
The address expression-location associating unit 6 outputs the input address representation and the location determined by the
なお、住所表現と所在地とを対応付けて出力する必要がなく、入力された住所表現に対応する所在地だけ出力すれば良い場合には、所在地決定部5で決定した所在地を、当該所在地決定部5から直接、外部へ出力させるようにすれば良く、この場合、住所表現−所在地対応付け部6は必要ない。
In addition, when it is not necessary to output the address expression and the address in association with each other, and only the address corresponding to the input address expression needs to be output, the address determined by the
図7は本発明の所在地解析装置における処理の流れを示すもので、以下、例を挙げてその動作を詳細に説明する。 FIG. 7 shows the flow of processing in the location analysis apparatus of the present invention. Hereinafter, the operation will be described in detail with an example.
前述の如くして入力された住所表現は、住所表現記憶部2に記憶されるとともにデータベース選択部311に入力される。データベース選択部311に入力された住所表現の文字列は、データベース選択部311に予め記憶されて保持されたデータベース選択テーブル中の文字列ルールとの照合が行われ、一致した文字列ルールに対応するデータベース名及びフィールド名が選択されて、そのデータベース名及びフィールド名が所在地候補取得部312に出力される(s1)。
The address expression input as described above is stored in the address
例えば、住所表現「日本橋」が入力された場合、図8に示すように「住所データベース,住所フィールド」が出力される。また、住所表現「東京タワー」が入力された場合、図8に示すように「ランドマークデータベース,ランドマーク名フィールド」が出力される。また、住所表現「NTT横須賀店」が入力された場合、図8に示すように「店舗データベース,店舗名フィールド」が出力される。また、住所表現「東京駅」が入力された場合、図8に示すように「駅名データベース,駅名フィールド」が出力される。 For example, when the address expression “Nihonbashi” is input, “address database, address field” is output as shown in FIG. When the address expression “Tokyo Tower” is input, “landmark database, landmark name field” is output as shown in FIG. When the address expression “NTT Yokosuka store” is input, “store database, store name field” is output as shown in FIG. When the address expression “Tokyo station” is input, “station name database, station name field” is output as shown in FIG.
次に、所在地候補取得部312において、住所表現記憶部2に記憶された住所表現が読み出されて入力されるとともに、データベース選択部311で選択されて出力されたデータベース名及びフィールド名が入力されると、該住所表現をキーとしてデータベース1のうち前記選択されたデータベース名及びフィールド名に対応するデータベースのフィールドが検索され、該当する住所表現を含むレコードの住所情報及び緯度・経度情報が所在地候補として取得され、有名度スコア計算部32に出力されるとともに所在地候補記憶部4に出力され記憶される(s2)(但し、所在地候補記憶部4に出力され記憶される所在地候補は住所情報のみでも良い。)。
Next, in the address
例えば、住所表現が「日本橋」、選択されたデータベース名が「住所データベース(DB)」、選択されたフィールド名が「住所フィールド」である場合、図9に示すように「東京都中央区日本橋,35.677,139.776」と「大阪府大阪市浪速区日本橋…,34.656,135.509」とが所在地候補として取得され、出力される(図2に示した住所データベース11の場合、厳密には「東京都中央区日本橋1丁目,35.679,139.754」も所在地候補として取得され、出力されるが、ここでは説明を簡略化するため、割愛した。)。 For example, when the address expression is “Nihonbashi”, the selected database name is “address database (DB)”, and the selected field name is “address field”, as shown in FIG. 35.677, 139.776 ”and“ Nipponbashi, Naniwa-ku, Osaka City, Osaka, Japan…, 34.656, 135.509 ”are acquired and output as location candidates (in the case of the address database 11 shown in FIG. Strictly speaking, “Nihonbashi 1-chome, Chuo-ku, Tokyo, 35.679, 139.754” is also acquired and output as a location candidate, but is omitted here for the sake of simplicity.)
なお、以上の処理が「所在地候補抽出処理」である。 The above processing is “location candidate extraction processing”.
次に、有名度スコア計算部32において、所在地候補抽出部31で抽出され出力された所在地候補の住所情報及び緯度・経度情報が入力されると、該所在地候補の住所情報とデータベース1中の各レコードの住所情報との間の地理的な距離が、それらの緯度・経度情報を用いてそれぞれ計算され、当該地理的な距離が予め設定した一定の距離以下であるレコードの数が計数され、同様な処理が所在地候補毎に行われ、これらが所在地候補毎の有名度スコアとして所在地決定部5に出力される(s3)。
Next, when the address information and latitude / longitude information of the location candidate extracted and output by the location
例えば、所在地候補が「東京都中央区日本橋,35.677,139.776」である場合、データベース1中の一のレコードとの間の地理的な距離Dは、該一のレコードの緯度・経度情報が「34.123,138.654」であれば、
D={(35.677−34.123)2+(139.776−138.654)2}1/2
=1.916715941
と計算される。この計算された距離D(の値)が予め設定した一定の距離(の値)、例えば“100”と比較され、“100”以下であれば該当するレコード、即ち所在地候補「東京都中央区日本橋,35.677,139.776」の住所情報と地理的に近い住所情報を含むレコードの数として計数(+1)される。データベース1中の全てのレコードとの間で同様な距離の計算及び比較・計数が行われ、最終的な計数値が150であれば、図10に示すように「150」が有名度スコアとして出力される。また、所在地候補が「大阪府大阪市浪速区日本橋…,34.656,135.509」である場合も同様な処理が行われ、最終的な計数値が50であれば、図10に示すように「50」が有名度スコアとして出力される。
For example, when the location candidate is “Nihonbashi, Chuo-ku, Tokyo, 35.677, 139.776”, the geographical distance D between one record in the database 1 is the latitude / longitude of the one record. If the information is “34.123, 138.654”
D = {(35.677−34.123) 2 + (139.776−138.654) 2 } 1/2
= 1.916715941
Is calculated. The calculated distance D (value) is compared with a predetermined distance (value), for example, “100”, and if it is “100” or less, the corresponding record, that is, the location candidate “Nihonbashi, Chuo-ku, Tokyo” , 35.677, 139.776 ”is counted (+1) as the number of records including address information geographically close to the address information. The same distance calculation, comparison, and counting are performed with all records in the database 1. If the final count value is 150, “150” is output as the famousity score as shown in FIG. Is done. The same processing is performed when the location candidate is “Nipponbashi, Naniwa-ku, Osaka-shi, Osaka ... 34.656, 135.509”. If the final count value is 50, as shown in FIG. “50” is output as the famousness score.
なお、以上の処理が「所在地候補生成処理」である。 The above processing is “location candidate generation processing”.
次に、所在地決定部5において、所在地候補記憶部4に記憶された所在地候補が読み出されて入力されるとともに、有名度スコア計算部32で計算されて出力された有名度スコアが入力されると、有名度スコアが最も高い所在地候補が所在地に決定され、住所表現−所在地対応付け部6に出力される(s4)。
Next, in the
例えば、所在地候補が「東京都中央区日本橋」及び「大阪府大阪市浪速区日本橋…」、有名度スコアが「150」及び「50」である場合、図11に示すように「東京都中央区日本橋」が所在地として決定され、出力される。 For example, if the location candidates are “Nipponbashi, Chuo-ku, Tokyo” and “Nihonbashi, Naniwa-ku, Osaka, Osaka ...” and the celebrity scores are “150” and “50”, as shown in FIG. “Nihonbashi” is determined as the location and output.
最後に、住所表現−所在地対応付け部6において、住所表現記憶部2に記憶された住所表現が読み出されて入力されるとともに、所在地決定部5で決定されて出力された所在地が入力されると、この住所表現と所在地(の住所情報)とが対応付けて出力される(s5)。
Finally, in the address expression-location associating unit 6, the address representation stored in the address
例えば、住所表現が「日本橋」、所在地が「東京都中央区日本橋」である場合、図12に示すように「日本橋:東京都中央区日本橋」が出力される。 For example, when the address expression is “Nihonbashi” and the location is “Nihonbashi, Chuo-ku, Tokyo”, “Nihonbashi: Nihonbashi, Chuo-ku, Tokyo” is output as shown in FIG.
このように、本実施の形態によれば、入力された住所表現に対応する所在地が2つ以上存在する場合であっても、そのうちの1つのみを自動的に選択して出力することが可能となる。 Thus, according to this embodiment, even when there are two or more locations corresponding to the input address expression, only one of them can be automatically selected and output. It becomes.
なお、前述したように、住所表現と所在地とを対応付けて出力する必要がなく、入力された住所表現に対応する所在地だけ出力すれば良い場合には、所在地決定処理(s4)により決定した所在地を直接、外部へ出力すれば良く、この場合、住所表現−所在地対応付け処理(s5)は必要ない。 As described above, when it is not necessary to output the address expression and the address in association with each other, and only the address corresponding to the input address expression needs to be output, the address determined by the address determination process (s4). May be directly output to the outside, and in this case, the address expression / address associating process (s5) is not necessary.
<実施の形態2>
本発明の実施の形態2では、図13に示すように、都道府県、市区郡、町村、町大字、字・丁目の住所レベル毎に区切られた住所情報とその緯度・経度情報をレコード毎に登録してなる住所データベースを用いる。即ち、例えば、実施の形態1で説明した住所データベースにおける1つのレコードの住所情報が「東京都中央区日本橋…」であったとすると、本実施の形態における同じレコードの住所情報は「東京/都,中央/区,日本橋,…」(但し、「,」は区切りの記号、また、「/」は次の区切りの記号「,」までの文字列については住所表現中にあってもなくても良いことを示す記号である。)のように、都道府県、市区郡、町村、町大字、字・丁目の住所レベル毎に区切られて登録される。
<
In the second embodiment of the present invention, as shown in FIG. 13, the address information and the latitude / longitude information divided for each address level in prefectures, municipalities, towns, villages, town squares, and letters / chomes are recorded for each record. Use the address database registered in. That is, for example, if the address information of one record in the address database described in the first embodiment is “Nihonbashi, Chuo-ku, Tokyo ...”, the address information of the same record in the present embodiment is “Tokyo / city, "Chuo / Ku, Nihonbashi, ..." (However, "," is a delimiter symbol, and "/" is the character string up to the next delimiter symbol "," may or may not be in the address expression. As shown in FIG. 5), the registered address is divided into each prefecture, municipality, town, village, town large character, letter / chome address level.
そして、所在地候補生成部3(詳細には所在地候補抽出部31の所在地候補取得部312)では、入力された住所表現、ここでは住所情報の一部からなる住所表現をキーとして住所データベースの住所フィールドを検索し、該当する住所表現を含むレコードの住所情報を取得し、さらに前記住所表現と区切りの一致を満たすレコードの住所情報をその緯度・経度情報とともに所在地候補として出力する。
Then, in the address candidate generation unit 3 (specifically, the address
本実施の形態によれば、例えば、入力された住所表現「イラン」に対して住所情報「英国ハイランド州…」を含むレコードが抽出され所在地候補として生成されるような、住所表現を構成する文字列の単なる一致により誤った所在地候補が生成されることが少なくなる。 According to the present embodiment, for example, an address expression is configured such that a record including address information “Highland of England ...” is extracted from the input address expression “Iran” and is generated as a location candidate. It is less likely that incorrect location candidates are generated due to simple matching of character strings.
<実施の形態3>
本発明の実施の形態3では、所在地候補生成部3(詳細には所在地候補抽出部31の所在地候補取得部312)から所在地候補記憶部4に出力され記憶され、所在地決定部5に入力される所在地候補として住所情報とともに緯度・経度情報を含むことを必須とし、また、所在地決定部5から出力されて住所表現−所在地対応付け部6に入力され、住所表現−所在地対応付け部6から住所表現と対応付けられて出力される所在地として住所情報とともに緯度・経度情報を含むことを必須とすることを特徴とし、例えば、住所表現が「日本橋」、所在地が「東京都中央区日本橋,35.677,139.776」である場合、住所表現−所在地対応付け部6では、「日本橋:東京都中央区日本橋;35.677,139.776」等と出力する。
<Embodiment 3>
In the third embodiment of the present invention, the location candidate generation unit 3 (specifically, the location
本実施の形態によれば、住所表現に対応する所在地として、住所情報の他、緯度・経度情報を出力することができる。 According to the present embodiment, it is possible to output latitude / longitude information in addition to address information as the location corresponding to the address expression.
<実施の形態4>
本発明の実施の形態4では、所在地候補生成部3において、データベース1を参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報とデータベース1中の各レコードの住所情報との間の地理的な距離のうちn(nは自然数)番目に小さい距離(の値)を有名度スコアとして所在地候補毎に出力する、詳細には、有名度スコア計算部32において、所在地候補抽出部31で抽出され出力された所在地候補の住所情報及び緯度・経度情報を入力とし、該所在地候補の住所情報とデータベース1中の各レコードの住所情報との間の地理的な距離を、それらの緯度・経度情報を用いてそれぞれ計算し、該計算した地理的な距離を小さいものから大きいものへ順に並べた時に1番小さいものからn番目(例えば、100番目)の距離(の値)を決定し、同様な処理を所在地候補毎に行い、これらを所在地候補毎の有名度スコアとして所在地決定部5に出力することを特徴とする。
<Embodiment 4>
In Embodiment 4 of the present invention, the address candidate generation unit 3 refers to the database 1 and outputs the address information of the record including the input address expression as a position candidate. The nth (n is a natural number) smallest distance (value) of the geographical distance between each address in each record is output as a celebrity score for each location candidate. In the
また、所在地決定部5において、所在地候補生成部3から出力された所在地候補のうち、有名度スコアが最も低い所在地候補を所在地に決定する、より詳細には、所在地候補抽出部31から出力され所在地候補記憶部4に一時記憶された所在地候補と、有名度スコア計算部32から出力された有名度スコアとを入力とし、有名度スコアが最も低い所在地候補を所在地に決定して住所表現−所在地対応付け部6に出力することを特徴とする。
Further, the
本実施の形態によれば、各所在地候補の有名度スコアとして「0」より大きい値を必ず得ることができ(これまでの実施の形態では、計算した地理的な距離が全て一定の距離より大きい場合、有名度スコアは「0」となる。)、全ての所在地候補を相対的に比較することが可能となる。 According to the present embodiment, a value greater than “0” can always be obtained as the famousness score of each location candidate (in the previous embodiments, the calculated geographical distances are all greater than a certain distance). In this case, the famousness score is “0”), and all the location candidates can be relatively compared.
なお、これまでの説明は、所在地候補抽出部31(所在地候補抽出処理)で抽出される所在地候補の数が2つ以上であることを前提としたが、住所表現の中には対応する所在地が1つしか存在しないものもある。そこで、所在地候補抽出部31(所在地候補抽出処理)の後に、所在地候補の数が「1つ」か「1つ」より大きいかを判定する所在地候補数判定部(所在地候補数判定処理)を設けて、所在地候補の数が「1」であれば有名度スコア計算部31(有名度スコア計算処理)及び所在地決定部5(所在地決定処理)をスキップさせ、抽出した1つの所在地候補をそのまま所在地として出力し、もしくは住所表現−所在地対応付け部6(住所表現−所在地対応付け処理)で入力された住所表現と対応付けて出力させるようにしても良い(なお、所在地候補の数が「0」、即ち1つも得られなければ、所在地候補抽出部31(所在地候補抽出処理)からその旨が出力され、処理が終了することはいうまでもない。)。 The above explanation is based on the assumption that the number of location candidates extracted by the location candidate extraction unit 31 (location candidate extraction process) is two or more. Some only exist. Therefore, after the location candidate extraction unit 31 (location candidate extraction processing), a location candidate number determination unit (location candidate number determination processing) is provided for determining whether the number of location candidates is “one” or larger than “one”. If the number of location candidates is “1”, the famousness score calculation unit 31 (famousness score calculation processing) and the location determination unit 5 (location determination processing) are skipped, and the extracted one location candidate is used as the location as it is. Or may be output in association with the address expression input by the address expression-address associating unit 6 (address expression-address associating process) (note that the number of address candidates is “0”, In other words, if no one is obtained, the fact is output from the location candidate extraction unit 31 (location candidate extraction processing), and it goes without saying that the processing ends.
また、本発明は、前述したデータベースを備え又は接続された周知のコンピュータに媒体もしくは通信回線を介して、図7の流れ図に示された手順を備えるプログラムをインストールすることによっても実現可能である。 The present invention can also be realized by installing a program having the procedure shown in the flowchart of FIG. 7 through a medium or a communication line in a known computer having or connected to the database.
1:データベース、2:住所表現記憶部、3:所在地候補生成部、4:所在地候補記憶部、5:所在地決定部、6:住所表現−所在地対応付け部、31:所在地候補抽出部、32:有名度スコア計算部、311:データベース選択部、312:所在地候補取得部、s1:データベース選択処理、s2:所在地候補抽出処理、s3:有名度スコア計算処理、s4:所在地決定処理、s5:住所表現−所在地対応付け処理。 1: Database, 2: Address expression storage unit, 3: Location candidate generation unit, 4: Location candidate storage unit, 5: Location determination unit, 6: Address expression-location association unit, 31: Location candidate extraction unit, 32: Celebrity score calculation unit, 311: database selection unit, 312: location candidate acquisition unit, s1: database selection processing, s2: location candidate extraction processing, s3: celebrity score calculation processing, s4: location determination processing, s5: address expression -Location mapping process.
Claims (16)
住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなる少なくとも1つのデータベースと、
前記データベースを参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と同一及び地理的に近い住所情報を含むレコードの数を有名度スコアとして所在地候補毎に出力する所在地候補生成部と、
所在地候補生成部から出力された所在地候補のうち、有名度スコアが最も高い所在地候補を所在地に決定する所在地決定部とを備えた
ことを特徴とする所在地解析装置。 In an apparatus for obtaining a location which is information representing a place corresponding to the address expression from an address expression consisting of a part of the address information or the name of a facility existing at a predetermined address,
At least one database in which only the address information or the name of the facility existing at the predetermined address and the address information are registered for each record;
With reference to the database, the address information of the record including the input address expression is output as a location candidate, and the number of records including address information identical and geographically close to the address information of the location candidate is used as a celebrity score A location candidate generator for outputting each location candidate;
A location analysis apparatus comprising: a location determination unit that determines a location candidate having the highest celebrity score among location candidates output from the location candidate generation unit.
入力された住所表現をキーとして前記データベースを検索し、該当する住所表現を含むレコードの住所情報を所在地候補として抽出する所在地候補抽出部と、
所在地候補抽出部で抽出された所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離をそれぞれ計算し、当該地理的な距離が一定の距離以下であるレコードの数を有名度スコアとして所在地候補毎に計数する有名度スコア計算部とからなる
ことを特徴とする請求項1記載の所在地解析装置。 The location candidate generator
Searching the database using the input address expression as a key, and a candidate address extracting unit that extracts address information of a record including the corresponding address expression as a candidate address;
The geographical distance between the address information of the address candidate extracted by the address candidate extraction unit and the address information of each record in the database is calculated, and the record of the record whose geographical distance is equal to or less than a certain distance is calculated. The location analysis apparatus according to claim 1, further comprising a famousness score calculation unit that counts the number as a famousness score for each candidate location.
住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなる少なくとも1つのデータベースと、
前記データベースを参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離のうちn番目に小さい距離を有名度スコアとして所在地候補毎に出力する所在地候補生成部と、
所在地候補生成部から出力された所在地候補のうち、有名度スコアが最も低い所在地候補を所在地に決定する所在地決定部とを備えた
ことを特徴とする所在地解析装置。 In an apparatus for obtaining a location which is information representing a place corresponding to the address expression from an address expression consisting of a part of the address information or the name of a facility existing at a predetermined address,
At least one database in which only the address information or the name of the facility existing at the predetermined address and the address information are registered for each record;
With reference to the database, the address information of the record including the input address expression is output as a location candidate, and the geographical distance between the address information of the location candidate and the address information of each record in the database A location candidate generator that outputs the nth smallest distance as a celebrity score for each location candidate;
A location analysis apparatus comprising: a location determination unit that determines a location candidate having the lowest celebrity score among location candidates output from the location candidate generation unit.
入力された住所表現をキーとして前記データベースを検索し、該当する住所表現を含むレコードの住所情報を所在地候補として抽出する所在地候補抽出部と、
所在地候補抽出部で抽出された所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離をそれぞれ計算し、当該地理的な距離を小さいものから大きいものへ順に並べた時に1番小さいものからn番目の距離を有名度スコアとして所在地候補毎に決定する有名度スコア計算部とからなる
ことを特徴とする請求項3記載の所在地解析装置。 The location candidate generator
Searching the database using the input address expression as a key, and a candidate address extracting unit that extracts address information of a record including the corresponding address expression as a candidate address;
The geographical distance between the address information of the address candidate extracted by the address candidate extraction unit and the address information of each record in the database is calculated, and the geographical distances are arranged in order from the smallest to the largest. The location analysis device according to claim 3, further comprising: a famousity score calculation unit that determines, for each candidate location, the nth distance from the smallest one as a famousness score.
予め記憶された、文字列ルールとこれに対応するデータベース名及びフィールド名とを記述したデータベース選択テーブルを参照して、入力された住所表現に含まれる文字列と合致する文字列ルールに対応するデータベース名及びフィールド名を選択し、該選択したデータベース名及びフィールド名を出力するデータベース選択部と、
入力された住所表現をキーとして前記データベースのうちデータベース選択部で選択されたデータベース名及びフィールド名に対応するデータベースのフィールドを検索し、該当する住所表現を含むレコードの住所情報を所在地候補として取得する所在地情報取得部とからなる所在地候補抽出部を用いた
ことを特徴とする請求項2または4記載の所在地解析装置。 Use a database with a database name that represents the contents of the database and a field name that represents the contents of the registration information.
A database corresponding to a character string rule that matches a character string included in an input address expression with reference to a database selection table describing a character string rule and a corresponding database name and field name stored in advance A database selection unit for selecting a name and a field name and outputting the selected database name and field name;
The database field corresponding to the database name and field name selected by the database selection unit is searched from the database using the input address expression as a key, and the address information of the record including the corresponding address expression is acquired as a location candidate. The location analysis device according to claim 2 or 4, wherein a location candidate extraction unit comprising a location information acquisition unit is used.
所在地候補抽出部は、住所情報とともに緯度・経度情報も含めて所在地候補として抽出し、
有名度スコア計算部は、所在地候補抽出部で抽出された所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離を、それらの緯度・経度情報を用いて計算する
ことを特徴とする請求項2または4記載の所在地解析装置。 Using at least one database in which the address information and its latitude / longitude information or the name of the facility existing at a given address and its address information and latitude / longitude information are registered for each record,
The location candidate extraction unit extracts latitude / longitude information as well as address information as location candidates,
The celebrity score calculation unit calculates the geographical distance between the address information of the candidate location extracted by the candidate location extraction unit and the address information of each record in the database, using the latitude / longitude information thereof. The location analysis device according to claim 2 or 4, characterized in that:
所在地候補生成部は、入力された住所情報の一部からなる住所表現を含むレコードのうち、当該住所表現と区切りの一致を満たすレコードの住所情報を所在地候補として出力する
ことを特徴とする請求項1乃至6いずれか記載の所在地解析装置。 Use at least a database that registers address information separated for each address level in prefectures, cities, towns, towns, towns, large letters, and letters / chomes,
The address candidate generation unit outputs address information of a record satisfying a delimiter coincidence with the address expression among records including an address expression including a part of the input address information, as the address candidate. The location analysis apparatus according to any one of 1 to 6.
住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを備えたコンピュータを用い、
当該コンピュータが、
前記データベースを参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と同一及び地理的に近い住所情報を含むレコードの数を有名度スコアとして所在地候補毎に出力する所在地候補生成処理ステップと、
所在地候補生成処理ステップで出力された所在地候補のうち、有名度スコアが最も高い所在地候補を所在地に決定する所在地決定処理ステップとを実行する
ことを特徴とする所在地解析方法。 In a method for obtaining a location which is information representing a place corresponding to the address expression from an address expression consisting of part of the address information or the name of a facility existing at a predetermined address,
Using a computer with a database that registers only the address information or the name of the facility existing at the predetermined address and the address information for each record,
The computer
With reference to the database, the address information of the record including the input address expression is output as a location candidate, and the number of records including address information identical and geographically close to the address information of the location candidate is used as a celebrity score A candidate location generation processing step for outputting each candidate location;
A location analysis method comprising: executing a location determination processing step of determining a location candidate having the highest celebrity score as a location among the location candidates output in the location candidate generation processing step.
入力された住所表現をキーとして前記データベースを検索し、該当する住所表現を含むレコードの住所情報を所在地候補として抽出する所在地候補抽出処理ステップと、
所在地候補抽出処理ステップで抽出された所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離をそれぞれ計算し、当該地理的な距離が一定の距離以下であるレコードの数を有名度スコアとして所在地候補毎に計数する有名度スコア計算処理ステップとからなる
ことを特徴とする請求項8記載の所在地解析方法。 The location candidate generation processing step
Searching the database using the input address expression as a key, and extracting the address information of the record including the corresponding address expression as a position candidate extraction process step;
A record in which the geographical distance between the address information of the address candidate extracted in the address candidate extraction processing step and the address information of each record in the database is calculated, and the geographical distance is equal to or less than a certain distance. The location analysis method according to claim 8, further comprising: a famousity score calculation processing step of counting the number of each as a famousness score for each location candidate.
住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを備えたコンピュータを用い、
当該コンピュータが、
前記データベースを参照し、入力された住所表現を含むレコードの住所情報を所在地候補として出力するとともに、当該所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離のうちn番目に小さい距離を有名度スコアとして所在地候補毎に出力する所在地候補生成処理ステップと、
所在地候補生成処理ステップで出力された所在地候補のうち、有名度スコアが最も低い所在地候補を所在地に決定する所在地決定処理ステップとを実行する
ことを特徴とする所在地解析方法。 In a method for obtaining a location which is information representing a place corresponding to the address expression from an address expression consisting of part of the address information or the name of a facility existing at a predetermined address,
Using a computer with a database that registers only the address information or the name of the facility existing at the predetermined address and the address information for each record,
The computer
With reference to the database, the address information of the record including the input address expression is output as a location candidate, and the geographical distance between the address information of the location candidate and the address information of each record in the database A location candidate generation processing step for outputting the nth smallest distance as a celebrity score for each location candidate;
A location determination method comprising: executing a location determination processing step of determining a location candidate having the lowest celebrity score as a location among the location candidates output in the location candidate generation processing step.
入力された住所表現をキーとして前記データベースを検索し、該当する住所表現を含むレコードの住所情報を所在地候補として抽出する所在地候補抽出処理ステップと、
所在地候補抽出処理ステップで抽出された所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離をそれぞれ計算し、当該地理的な距離を小さいものから大きいものへ順に並べた時に1番小さいものからn番目の距離を有名度スコアとして所在地候補毎に決定する有名度スコア計算処理ステップとからなる
ことを特徴とする請求項10記載の所在地解析方法。 The location candidate generation processing step
Searching the database using the input address expression as a key, and extracting the address information of the record including the corresponding address expression as a position candidate extraction process step;
The geographical distance between the address information of the candidate address extracted in the candidate address extraction processing step and the address information of each record in the database is calculated, and the geographical distance is calculated in order from the smallest to the largest. The location analysis method according to claim 10, further comprising: a famousity score calculation processing step for determining, for each candidate location, the nth distance from the smallest one when arranged, as a famousness score.
予め記憶された、文字列ルールとこれに対応するデータベース名及びフィールド名とを記述したデータベース選択テーブルを参照して、入力された住所表現に含まれる文字列と合致する文字列ルールに対応するデータベース名及びフィールド名を選択し、該選択したデータベース名及びフィールド名を出力するデータベース選択処理ステップと、
入力された住所表現をキーとして前記データベースのうちデータベース選択処理ステップで選択されたデータベース名及びフィールド名に対応するデータベースのフィールドを検索し、該当する住所表現を含むレコードの住所情報を所在地候補として取得する所在地情報取得処理ステップとからなる所在地候補抽出処理ステップを用いた
ことを特徴とする請求項9または11記載の所在地解析方法。 Use a database with a database name that represents the contents of the database and a field name that represents the contents of the registration information.
A database corresponding to a character string rule that matches a character string included in an input address expression with reference to a database selection table describing a character string rule and a corresponding database name and field name stored in advance A database selection processing step of selecting a name and a field name and outputting the selected database name and field name;
Search the database field corresponding to the database name and field name selected in the database selection processing step from the database using the input address expression as a key, and acquire the address information of the record including the corresponding address expression as a location candidate. The location analysis method according to claim 9 or 11, wherein a location candidate extraction processing step including a location information acquisition processing step is used.
所在地候補抽出処理ステップは、住所情報とともに緯度・経度情報も含めて所在地候補として抽出し、
有名度スコア計算処理ステップは、所在地候補抽出処理ステップで抽出された所在地候補の住所情報と前記データベース中の各レコードの住所情報との間の地理的な距離を、それらの緯度・経度情報を用いて計算する
ことを特徴とする請求項9または11記載の所在地解析方法。 Using at least one database in which the address information and its latitude / longitude information or the name of the facility existing at a given address and its address information and latitude / longitude information are registered for each record,
In the location candidate extraction processing step, the latitude / longitude information is included together with the address information, and extracted as location candidates.
The celebrity score calculation processing step uses the geographical distance between the address information of the candidate location extracted in the candidate location extraction processing step and the address information of each record in the database, using the latitude / longitude information thereof. The location analysis method according to claim 9 or 11, characterized in that:
所在地候補生成処理ステップは、入力された住所情報の一部からなる住所表現を含むレコードのうち、当該住所表現と区切りの一致を満たすレコードの住所情報を所在地候補として出力する
ことを特徴とする請求項8乃至13いずれか記載の所在地解析方法。 Use at least a database that registers address information separated for each address level in prefectures, cities, towns, towns, towns, large letters, and letters / chomes,
The address candidate generation processing step outputs address information of a record satisfying a delimiter coincidence with the address expression out of records including an address expression made up of a part of the input address information as the address candidate. Item 14. The location analysis method according to any one of Items 8 to 13.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006266834A JP4510792B2 (en) | 2006-09-29 | 2006-09-29 | LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006266834A JP4510792B2 (en) | 2006-09-29 | 2006-09-29 | LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008090334A true JP2008090334A (en) | 2008-04-17 |
JP4510792B2 JP4510792B2 (en) | 2010-07-28 |
Family
ID=39374470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006266834A Active JP4510792B2 (en) | 2006-09-29 | 2006-09-29 | LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4510792B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4595032B1 (en) * | 2010-01-13 | 2010-12-08 | 株式会社野村総合研究所 | Address analysis apparatus and address analysis method |
JP2014235597A (en) * | 2013-06-03 | 2014-12-15 | 株式会社Nttドコモ | Specific point name determination apparatus, specific point name determination method, and specific point name determination program |
JP6031164B1 (en) * | 2015-07-24 | 2016-11-24 | 日本電信電話株式会社 | Spot determination apparatus, spot determination method, and spot determination program |
CN117312478A (en) * | 2023-11-30 | 2023-12-29 | 中国科学院空天信息创新研究院 | Address positioning method and device, electronic equipment and storage medium |
-
2006
- 2006-09-29 JP JP2006266834A patent/JP4510792B2/en active Active
Non-Patent Citations (2)
Title |
---|
CSNG200201208005, 佐藤 理史, "ワールドワイドウェブを利用した住所探索", 情報処理学会論文誌, 20010115, 第42巻 第1号, 第59頁乃至第67頁, JP, 社団法人情報処理学会 * |
JPN6010002803, 佐藤 理史, "ワールドワイドウェブを利用した住所探索", 情報処理学会論文誌, 20010115, 第42巻 第1号, 第59頁乃至第67頁, JP, 社団法人情報処理学会 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4595032B1 (en) * | 2010-01-13 | 2010-12-08 | 株式会社野村総合研究所 | Address analysis apparatus and address analysis method |
JP2011145822A (en) * | 2010-01-13 | 2011-07-28 | Nomura Research Institute Ltd | Device and method for analyzing address |
JP2014235597A (en) * | 2013-06-03 | 2014-12-15 | 株式会社Nttドコモ | Specific point name determination apparatus, specific point name determination method, and specific point name determination program |
JP6031164B1 (en) * | 2015-07-24 | 2016-11-24 | 日本電信電話株式会社 | Spot determination apparatus, spot determination method, and spot determination program |
CN117312478A (en) * | 2023-11-30 | 2023-12-29 | 中国科学院空天信息创新研究院 | Address positioning method and device, electronic equipment and storage medium |
CN117312478B (en) * | 2023-11-30 | 2024-03-22 | 中国科学院空天信息创新研究院 | Address positioning method and device, electronic equipment and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP4510792B2 (en) | 2010-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145169B (en) | Address matching method based on statistical word segmentation | |
US9235598B2 (en) | Location based full text search | |
JP5315664B2 (en) | POSITION EXPRESSION DETECTING DEVICE, PROGRAM, AND STORAGE MEDIUM | |
CN107203526B (en) | Query string semantic demand analysis method and device | |
US8429204B2 (en) | Short point-of-interest title generation | |
US20170308560A1 (en) | Location Searching with Category Indices | |
JP2010128806A (en) | Information analyzing device | |
CN110688434B (en) | Method, device, equipment and medium for processing interest points | |
US20210026893A1 (en) | System and method for improving geocoding performance | |
JP4510792B2 (en) | LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM | |
JP4510780B2 (en) | LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM | |
JP5046107B2 (en) | POI information address data update system and program | |
JP4510784B2 (en) | LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM | |
JP6106070B2 (en) | Place name estimation method, place name estimation apparatus, and place name estimation program | |
US20230118627A1 (en) | Processing apparatus and method for determining road names | |
JP4382634B2 (en) | Address analysis apparatus, address analysis method, and address analysis program | |
Zhang et al. | An automatic approach for building place-name datasets from the Web | |
JP5400813B2 (en) | Address search device and address search method | |
JP2009122886A (en) | Address analysis device and method, and its program | |
Murakami et al. | Assigning location information to display individuals on a map for Web people search results | |
Yao et al. | A novel fuzzy chinese address matching engine based on full-text search technology | |
JP6106069B2 (en) | Place name position estimation method, place name position estimation apparatus, and place name position estimation program | |
KR101576733B1 (en) | System and method for providing integrated search of address | |
CN115730154A (en) | POI data searching method, system and terminal | |
Minarčík | STUDY OF POSSIBILITIES OF WEB SERVICES FOR OBTAINING GEOGRAPHICAL COORDINATES FROM INDIRECT POSITION FROM INFORMATION IN CZECH LANGUAGE ON THE INTERNET |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100426 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100430 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4510792 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140514 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |