JP2008015981A - Device and method for analyzing location, its program, and recording medium - Google Patents

Device and method for analyzing location, its program, and recording medium Download PDF

Info

Publication number
JP2008015981A
JP2008015981A JP2006189286A JP2006189286A JP2008015981A JP 2008015981 A JP2008015981 A JP 2008015981A JP 2006189286 A JP2006189286 A JP 2006189286A JP 2006189286 A JP2006189286 A JP 2006189286A JP 2008015981 A JP2008015981 A JP 2008015981A
Authority
JP
Japan
Prior art keywords
address
location
candidates
expression
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006189286A
Other languages
Japanese (ja)
Other versions
JP4510784B2 (en
Inventor
Toru Hirano
徹 平野
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006189286A priority Critical patent/JP4510784B2/en
Publication of JP2008015981A publication Critical patent/JP2008015981A/en
Application granted granted Critical
Publication of JP4510784B2 publication Critical patent/JP4510784B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To automatically select only one location and output it even if there exist two or more location candidates corresponding to each of a plurality of inputted address expressions. <P>SOLUTION: A location candidate extraction part 41 searches a database 1 registered with only address information, or the name of a facility that exists at a specified address and its address information for every record using an inputted address expression as a key, and extracts the address information of a record included with the address expression as a location candidate. The above-described processing is repeated by the number of address expressions. A combination generation part 42 generates all combinations between a location candidate of an address expression and one of another address expression from location candidates corresponding to each of the plurality of address expressions. A distance calculation part 7 calculates a distance between location candidates in all of the combinations, and then determines a location candidate which belongs to a combination that has a shorter distance between location candidates as the location. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、住所情報の一部もしくは所定の住所に存在する施設の名称からなる住所表現から、当該住所表現に対応する場所を表す情報(例えば、住所情報、経度・緯度情報等)である所在地を求める技術に関する。   The present invention relates to a location which is information (for example, address information, longitude / latitude information, etc.) indicating a location corresponding to the address expression from an address expression consisting of part of the address information or the name of a facility existing at a predetermined address. Related to technology.

従来より、住所表現から、これに対応する所在地を求めるシステムとして、住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを、入力された住所表現をキーとして検索し、該当する住所表現を含むレコードの住所情報を所在地として出力するものがあった(特許文献1参照)。
特開2001−134579号公報
Conventionally, as a system for finding the location corresponding to this from the address expression, the address information input is a database in which only the address information or the name of the facility existing at the predetermined address and the address information is registered for each record. Is used as a key, and the address information of a record including the corresponding address expression is output as a location (see Patent Document 1).
JP 2001-134579 A

ところで、住所表現の中には、対応する所在地が2つ以上存在するものが少なくない。例えば「日本橋」という住所情報の一部からなる住所表現に対応する所在地は東京にも大阪にも存在し、また「末広町」という住所情報の一部からなる住所表現に対応する所在地は日本全国に126箇所も存在する。   By the way, there are not a few address expressions that have two or more corresponding locations. For example, there are locations in Tokyo and Osaka that correspond to address expressions consisting of part of the address information “Nihonbashi”, and locations that correspond to address expressions consisting of part of the address information “Suehirocho” are all over Japan. There are also 126 locations.

この場合、前述した従来のシステムでは、対応する全ての所在地を候補として一覧表示するのみであり、その後は利用者が自らの判断で選択しなければならず、特に候補の数が多い場合、正しい所在地、即ち目的とする所在地を求めることが困難であったり、時間がかかったりするという問題があった。   In this case, the above-described conventional system only displays a list of all the corresponding locations as candidates, and after that, the user must make a selection based on his / her own judgment. There has been a problem that it is difficult or time consuming to determine the location, that is, the target location.

本発明は、入力された複数の住所表現に対応する所在地がそれぞれ2つ以上存在する場合であっても、そのうちの1つのみをそれぞれ自動的に選択して出力可能とすることを目的とする。   An object of the present invention is to make it possible to automatically select and output only one of them, even when there are two or more locations corresponding to a plurality of input address expressions. .

本発明では、前記課題を解決するため、住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなるデータベースを参照し、入力された複数の住所表現の各々について当該住所表現を含む全てのレコードの住所情報を所在地候補として出力するとともに、一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを出力し、該出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせにおける所在地候補間の距離を求めて出力し、前記出力された複数の住所表現それぞれに対応する所在地候補のうち、前記出力された所在地候補間の距離がより小さい組み合わせに属する所在地候補を所在地に決定することを特徴とする。   In the present invention, in order to solve the above-mentioned problem, each of a plurality of input address expressions is referred to by referring to a database in which the address name only or the name of a facility existing at a predetermined address and the address information are registered for each record. Output address information of all records including the address expression as address candidates, and output all combinations of the address candidates of one address expression and the address candidates of other address expressions. The distance between the address candidates in all combinations of the address candidates of the address expression and the address candidates of the other address expressions is obtained and output, and the output among the address candidates corresponding to each of the plurality of output address expressions is output. A location candidate belonging to a combination with a smaller distance between the location candidates is determined as the location.

本発明によれば、入力された複数の住所表現それぞれに対応する所在地候補のうち、その間の距離がより小さい各候補を所在地と決定することにより、入力された複数の住所表現に対応する所在地がそれぞれ2つ以上存在する場合であっても、そのうちの1つのみを自動的かつ適切に選択して出力することが可能となる。   According to the present invention, by determining each candidate having a smaller distance among the candidate locations corresponding to each of the plurality of input address expressions, the locations corresponding to the plurality of input address expressions are determined. Even when there are two or more of them, only one of them can be automatically and appropriately selected and output.

以下、本発明の実施の形態を図面により説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

<実施の形態1>
図1は本発明の所在地解析装置の実施の形態の一例を示すもので、図中、1はデータベース、2は住所表現抽出部、3は住所表現記憶部、4は所在地候補生成部、5は所在地候補記憶部、6は組み合わせ記憶部、7は距離計算部、8は所在地決定部、9は住所表現−所在地対応付け部である。
<Embodiment 1>
FIG. 1 shows an example of an embodiment of a location analysis apparatus according to the present invention. In the figure, 1 is a database, 2 is an address expression extraction unit, 3 is an address expression storage unit, 4 is a location candidate generation unit, A location candidate storage unit, 6 is a combination storage unit, 7 is a distance calculation unit, 8 is a location determination unit, and 9 is an address expression-location association unit.

データベース1は、住所情報とその緯度・経度情報もしくは所定の住所に存在する施設の名称とその住所情報及び緯度・経度情報をレコード毎に登録してなる少なくとも1つのデータベース、ここでは住所データベース11、店舗データベース12、駅名データベース13及びランドマークデータベース14からなる。   The database 1 is at least one database in which address information and its latitude / longitude information or the name of a facility existing at a predetermined address and its address information and latitude / longitude information are registered for each record. It consists of a store database 12, a station name database 13, and a landmark database 14.

住所データベース11は、図2に示すように、住所情報とその緯度・経度情報、ここでは日本全国全ての住所情報とその緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。ここで、住所データベース11は、レコードとして日本全国に存在する番地や号までを含む住所(例えば、「東京都中央区日本橋1丁目xx番1号」、「東京都中央区日本橋1丁目xx番2号」等)を全てその緯度・経度情報とともに登録したものであっても良いし、丁目までや市町村名まで等の途中までの住所(例えば、「東京都中央区日本橋」や「東京都中央区日本橋1丁目」や「東京都中央区」)もその緯度・経度情報とともに登録されていても良い。   As shown in FIG. 2, the address database 11 stores address information and its latitude / longitude information, here, address information of all of Japan and its latitude / longitude information for each record. The part where the address information is registered is called an address field, and the part where the latitude / longitude information is registered is called a latitude / longitude field. Here, the address database 11 includes addresses including addresses and issues existing all over Japan as records (for example, “Nihonbashi 1-chome xx-1 No. 1”, “Nihonbashi 1-chome xx-2 Chuo-ku, Tokyo”). ”, Etc.) along with the latitude / longitude information, or addresses up to the middle of the street, such as“ Chuo-ku, Tokyo ”or“ Chuo-ku, Tokyo ” “Nihonbashi 1-chome” and “Chuo-ku, Tokyo”) may also be registered along with the latitude and longitude information.

店舗データベース12は、図3に示すように、所定の住所に存在する施設、ここでは店舗の名称(店舗名)とその住所情報及び緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、店舗名が登録されている部分を店舗名フィールド、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。   As shown in FIG. 3, the store database 12 is a facility in which a facility existing at a predetermined address, here a store name (store name), its address information, and latitude / longitude information is registered for each record. In the record, the part where the store name is registered is called the store name field, the part where the address information is registered is called the address field, and the part where the latitude / longitude information is registered is called the latitude / longitude field.

駅名データベース13は、図4に示すように、所定の住所に存在する施設、ここでは駅の名称(駅名)とその住所情報及び緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、駅名が登録されている部分を駅名フィールド、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。   As shown in FIG. 4, the station name database 13 is a facility in which a facility existing at a predetermined address, in this case, a station name (station name), its address information, and latitude / longitude information is registered for each record. Of these, a part where a station name is registered is called a station name field, a part where address information is registered is called an address field, and a part where latitude / longitude information is registered is called a latitude / longitude field.

ランドマークデータベース14は、図5に示すように、所定の住所に存在する施設、ここではランドマークの名称(ランドマーク名)とその住所情報及び緯度・経度情報をレコード毎に登録してなるもので、各レコードのうち、ランドマーク名が登録されている部分をランドマーク名フィールド、住所情報が登録されている部分を住所フィールド、緯度・経度情報が登録されている部分を緯度・経度フィールドと呼ぶ。   As shown in FIG. 5, the landmark database 14 is a facility in which a facility existing at a predetermined address, in this case, a landmark name (landmark name), its address information, and latitude / longitude information is registered for each record. In each record, the part where the landmark name is registered is the landmark name field, the part where the address information is registered is the address field, and the part where the latitude / longitude information is registered is the latitude / longitude field. Call.

住所表現抽出部2は、図示しない記憶媒体から読み出されて入力され又は通信媒体を介して他の装置等から入力された文書情報(テキストファイル)から、当該文書情報中に含まれる住所表現(通常、複数の住所表現)を、周知の固有表現抽出技術を用いて抽出し、住所表現記憶部3及び所在地候補生成部4に出力する。   The address expression extraction unit 2 reads address information (text file) read from a storage medium (not shown) or input from another device or the like via a communication medium (address expression included in the document information (text file)). Usually, a plurality of address expressions) are extracted using a well-known unique expression extraction technique and output to the address expression storage unit 3 and the location candidate generation unit 4.

なお、オペレータが図示しないキーボード等から、文書情報中に含まれる複数の住所表現を直接入力するようにしても良く、この場合、住所表現抽出部2は必要ない。   Note that the operator may directly input a plurality of address expressions included in the document information from a keyboard or the like (not shown). In this case, the address expression extraction unit 2 is not necessary.

住所表現記憶部3は、住所表現抽出部2から出力された複数の住所表現を一時的に記憶する。   The address expression storage unit 3 temporarily stores a plurality of address expressions output from the address expression extraction unit 2.

所在地候補生成部4は、データベース1を参照し、住所表現抽出部2から出力された複数の住所表現の各々について当該住所表現を含む全てのレコードの住所情報を所在地候補として出力するとともに、一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを出力するもので、より詳細には、所在地候補抽出部41と、組み合わせ生成部42とから構成されている。   The location candidate generation unit 4 refers to the database 1 and outputs the address information of all records including the address representation for each of the plurality of address representations output from the address representation extraction unit 2 as location candidates. This outputs all combinations of address candidates for address expressions and address candidates for other address expressions. More specifically, the address candidate extractor 41 and a combination generator 42 are included.

所在地候補抽出部41は、入力された住所表現をキーとしてデータベース1を検索し、該当する住所表現を含む全てのレコードの住所情報及びその緯度・経度情報を所在地候補として抽出し、これを住所表現の数だけ繰り返すもので、さらに詳細には、データベース選択部411と、所在地候補取得部412とから構成されている。   The address candidate extraction unit 41 searches the database 1 using the input address expression as a key, extracts address information and latitude / longitude information of all records including the corresponding address expression as address candidates, and uses this as the address expression. In more detail, the database selection unit 411 and the location candidate acquisition unit 412 are configured.

データベース選択部411は、図6に示すような、文字列ルールとこれに対応するデータベース名及びフィールド名とを記述したデータベース選択テーブルを予め記憶して保持しており、住所表現を入力とし、入力された住所表現の文字列を前記テーブルに記述された各文字列ルールと照合し、一致する文字列ルールがあれば、前記テーブルから当該一致した文字列ルールに対応するデータベース名及びフィールド名を読み出し、選択したデータベース名及びフィールド名として所在地候補取得部412に出力し、これを住所表現の数だけ繰り返す。   The database selection unit 411 stores and holds in advance a database selection table describing character string rules and corresponding database names and field names as shown in FIG. The addressed character string is compared with each character string rule described in the table, and if there is a matching character string rule, the database name and field name corresponding to the matching character string rule are read from the table. The selected database name and field name are output to the location candidate acquisition unit 412 and this is repeated for the number of address expressions.

ここで、文字列ルールとは、入力された住所表現の文字列の最後に「店」という文字が存在した場合には入力された住所表現は「店舗名」であると判定するものであり、入力された住所表現の文字列の最後に「駅」という文字が存在した場合には入力された住所表現は「駅名」であると判定するものためのものである。従って、図6に示すような、前記文字列ルールとこれに対応するデータベース名及びフィールド名とを記述したデータベース選択テーブルを参照することにより、入力された住所表現に対応するデータベース名及びフィールド名を選択して出力することが可能となる。   Here, the character string rule is to determine that the input address expression is “store name” when the character “store” exists at the end of the input address expression character string. This is for determining that the input address expression is “station name” when the character “station” exists at the end of the input address expression character string. Accordingly, by referring to the database selection table describing the character string rule and the corresponding database name and field name as shown in FIG. 6, the database name and field name corresponding to the input address expression are obtained. It is possible to select and output.

なお、このデータベース選択部411は、所在地候補の抽出に際して、検索対象とすべきデータベースやフィールドの数を少なくするためのもので、必須の構成ではなく、計算量は多くなるが、データベース1中の全てのデータベース及び全てのフィールドに対して、入力された住所表現をキーとする検索を行うようにしても良い。   The database selection unit 411 is used to reduce the number of databases and fields to be searched when extracting location candidates. This database selection unit 411 is not an indispensable component, and requires a large amount of calculation. You may make it search with respect to all the databases and all the fields by using the input address expression as a key.

所在地候補取得部412は、前述の如く抽出され住所表現記憶部3に一時記憶された複数の住所表現と、データベース選択部411で選択されて出力された各住所表現対応のデータベース名及びフィールド名とを入力とし、該住所表現をキーとしてデータベース1のうち前記選択されたデータベース名及びフィールド名に対応するデータベースのフィールドを検索し、該当する住所表現を含むレコードの住所情報及び緯度・経度情報を所在地候補として取得し、これを住所表現の数だけ繰り返して組み合わせ生成部42及び所在地候補記憶部5に出力する。   The address candidate acquisition unit 412 extracts a plurality of address expressions extracted and temporarily stored in the address expression storage unit 3 as described above, and database names and field names corresponding to each address expression selected and output by the database selection unit 411. Is input, and the field expression is searched for the database field corresponding to the selected database name and field name in the database 1 as the key, and the address information and latitude / longitude information of the record including the corresponding address expression are located. This is acquired as a candidate, and this is repeated as many times as the number of address expressions, and is output to the combination generation unit 42 and the location candidate storage unit 5.

組み合わせ生成部42は、所在地候補抽出部41で抽出された複数の住所表現それぞれに対応する所在地候補を入力とし、一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを生成し、組み合わせ記憶部6及び距離計算部7に出力する。   The combination generation unit 42 receives as input the location candidates corresponding to each of the plurality of address expressions extracted by the location candidate extraction unit 41, and all combinations of the location candidates of one address expression and the location candidates of other address expressions. Generated and output to the combination storage unit 6 and the distance calculation unit 7.

所在地候補記憶部5は、所在地候補生成部4(の所在地候補抽出部41の所在地候補取得部412)から出力された複数の住所表現それぞれに対応する所在地候補を一時的に記憶する。また、組み合わせ記憶部6は、所在地候補生成部4(の組み合わせ生成部42)から出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを一時的に記憶する。   The location candidate storage unit 5 temporarily stores location candidates corresponding to each of a plurality of address expressions output from the location candidate generation unit 4 (location candidate acquisition unit 412 of the location candidate extraction unit 41). Further, the combination storage unit 6 temporarily stores all combinations of one address expression location candidate and another address expression location candidate output from the location candidate generation unit 4 (the combination generation unit 42). .

距離計算部7は、所在地候補生成部4から出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせにおける所在地候補間の距離を求めて出力する、より詳細には、所在地候補生成部4(の所在地候補抽出部41)から出力され所在地候補記憶部5に記憶された複数の住所表現それぞれに対応する所在地候補と、所在地候補生成部4(の組み合わせ生成部42)から出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせとを入力とし、一の組み合わせにおける所在地候補間の距離Dを、それぞれの所在地候補の緯度情報N1,N2及び経度情報E1,E2を用いて計算、即ち
D={(N1−N22+(E1−E221/2
より計算し、これを各組み合わせに対して同様に行い、所在地決定部8に出力する。
The distance calculation unit 7 obtains and outputs the distance between the location candidates in all combinations of the location candidate of one address expression output from the location candidate generation unit 4 and the location candidate of another address expression. Is a location candidate corresponding to each of the plurality of address expressions output from the location candidate generation unit 4 (location candidate extraction unit 41) and stored in the location candidate storage unit 5, and a combination of the location candidate generation unit 4 (the combination generation unit 42) ) And the location candidates of one address expression and all combinations of the address candidates of other address expressions are input, and the distance D between the location candidates in one combination is the latitude information N of each location candidate. 1 and N 2 and longitude information E 1 and E 2, that is, D = {(N 1 −N 2 ) 2 + (E 1 −E 2 ) 2 } 1/2
This is calculated in the same manner for each combination and output to the location determination unit 8.

なお、後述するように、所在地決定部8では、一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせにおける所在地候補間の距離(の値)の大小が判定できれば足りる、つまり絶対的な距離の値を必要とするわけではないので、上記式中のルート(1/2乗)の部分の計算は省略しても良い。また、本式に関しては、緯度情報及び経度情報を用いた2点間の距離を計算する既知の公式、例えば「緯度及び経度から平面直角座標に変換し測地線長を計算する公式」(B.R.Bowring, "TOTAL INVERSE SOLUTIONS FOR THE GEODESIC AND GREAT ELLIPTIC," Survey Review, Vol.33, No.261, July 1996, pp.461-476(http://vldb.gsi.go.jp/sokuchi/surveycalc/algorithm/)参照)等を用いても良い。   As will be described later, the location determination unit 8 only needs to be able to determine the magnitude of the distance (value) between location candidates in all combinations of location candidates of one address expression and location candidates of other address expressions. That is, since an absolute distance value is not required, calculation of the route (1/2 power) portion in the above formula may be omitted. As for this formula, a known formula for calculating the distance between two points using latitude information and longitude information, for example, “formula for calculating geodesic line length by converting latitude and longitude into plane rectangular coordinates” (BRBowring , "TOTAL INVERSE SOLUTIONS FOR THE GEODESIC AND GREAT ELLIPTIC," Survey Review, Vol.33, No.261, July 1996, pp.461-476 (http://vldb.gsi.go.jp/sokuchi/surveycalc/algorithm /) See) etc. may be used.

所在地決定部8は、所在地候補生成部4から出力された複数の住所表現それぞれに対応する所在地候補のうち、距離計算部7から出力された所在地候補間の距離がより小さい組み合わせに属する所在地候補を所在地にそれぞれ決定する、より詳細には、所在地候補生成部4(の所在地候補抽出部41)から出力され所在地候補記憶部5に記憶された複数の住所表現それぞれに対応する所在地候補と、所在地候補生成部4(の組み合わせ生成部42)から出力され組み合わせ記憶部6に記憶された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせと、距離計算部7で計算された各組み合わせにおける所在地候補間の距離とを入力とし、複数の住所表現それぞれに対応する所在地候補のうち、所在地候補間の物理的(地理的)な距離がより小さい組み合わせに属する所在地候補を所在地(の住所情報及び緯度・経度情報)にそれぞれ決定し、住所表現−所在地対応付け部9に出力する。   The location determination unit 8 selects, from among the location candidates corresponding to each of the plurality of address expressions output from the location candidate generation unit 4, location candidates belonging to a combination with a smaller distance between the location candidates output from the distance calculation unit 7. More specifically, each location is determined, and more specifically, location candidates corresponding to each of a plurality of address expressions output from the location candidate generation unit 4 (location candidate extraction unit 41) and stored in the location candidate storage unit 5, and location candidates All combinations of one address expression location candidate and another address expression location candidate output from the generation unit 4 (the combination generation unit 42) and stored in the combination storage unit 6 are calculated by the distance calculation unit 7. The distance between location candidates in each combination is input, and among the location candidates corresponding to each of a plurality of address expressions, physical ( Respectively determine the location candidates physical) distance belongs to a smaller combination on the location (address information and the latitude and longitude information), address representation - output on the location association unit 9.

住所表現−所在地対応付け部9は、前述の如く抽出された複数の住所表現と所在地決定部8で決定された各住所表現対応の所在地とを対応付けて出力する、より詳細には、前述の如く抽出され住所表現記憶部3に一時記憶された複数の住所表現と、所在地決定部8から出力された各住所表現対応の所在地とを入力とし、複数の住所表現とその所在地(の住所情報及び緯度・経度情報)とをそれぞれ対応付けて出力する。   The address expression-location associating unit 9 outputs the plurality of address expressions extracted as described above in association with the addresses corresponding to each address expression determined by the location determining unit 8, and more specifically, as described above. The plurality of address expressions extracted as described above and temporarily stored in the address expression storage unit 3 and the location corresponding to each address expression output from the location determination unit 8 are input, and the plurality of address expressions and their addresses (address information and Latitude / longitude information) are output in association with each other.

なお、住所表現と所在地とを対応付けて出力する必要がなく、住所表現に対応する所在地だけ出力すれば良い場合には、所在地決定部8で決定した所在地を、当該所在地決定部8から直接、外部へ出力させるようにすれば良く、この場合、住所表現−所在地対応付け部9は必要ない。   In addition, when it is not necessary to output the address expression and the address in association with each other, and it is sufficient to output only the address corresponding to the address expression, the address determined by the address determining unit 8 is directly selected from the address determining unit 8. What is necessary is just to make it output to the outside, and the address expression-address matching part 9 is unnecessary in this case.

図7は本発明の所在地解析装置における処理の流れを示すもので、以下、例を挙げてその動作を詳細に説明する。   FIG. 7 shows the flow of processing in the location analysis apparatus of the present invention. Hereinafter, the operation will be described in detail with an example.

前述の如くして入力された文書情報から住所表現抽出部2で抽出され、出力された(s1)複数の住所表現は、住所表現記憶部3に記憶されるとともにデータベース選択部411に入力される。データベース選択部411に入力された住所表現の文字列は、データベース選択部411に予め記憶されて保持されたデータベース選択テーブル中の文字列ルールとの照合が行われ、一致した文字列ルールに対応するデータベース名及びフィールド名が選択されて、そのデータベース名及びフィールド名が所在地候補取得部412に出力され、この処理が住所表現の数だけ繰り返される(s2)。   The address expression extraction unit 2 extracts and outputs (s1) a plurality of address expressions from the document information input as described above, and is stored in the address expression storage unit 3 and input to the database selection unit 411. . The character string of the address expression input to the database selection unit 411 is compared with the character string rule in the database selection table stored and held in advance in the database selection unit 411, and corresponds to the matched character string rule. The database name and field name are selected, and the database name and field name are output to the location candidate acquisition unit 412. This process is repeated for the number of address expressions (s2).

例えば、入力された住所表現が「日本橋」である場合、図8に示すように「住所データベース,住所フィールド」が出力される。また、入力された住所表現が「東京タワー」である場合、図8に示すように「ランドマークデータベース,ランドマーク名フィールド」が出力される。また、入力された住所表現が「NTT…店」である場合、図8に示すように「店舗データベース,店舗名フィールド」が出力される。また、入力された住所表現が「東京駅」である場合、図8に示すように「駅名データベース,駅名フィールド」が出力される。   For example, if the input address expression is “Nihonbashi”, “address database, address field” is output as shown in FIG. If the input address expression is “Tokyo Tower”, “Landmark database, landmark name field” is output as shown in FIG. When the input address expression is “NTT ... store”, “store database, store name field” is output as shown in FIG. If the input address expression is “Tokyo station”, “station name database, station name field” is output as shown in FIG.

次に、所在地候補取得部412において、住所表現記憶部3に記憶された住所表現が読み出されて入力されるとともに、データベース選択部411で選択されて出力されたデータベース名及びフィールド名が入力されると、該住所表現をキーとしてデータベース1のうち前記選択されたデータベース名及びフィールド名に対応するデータベースのフィールドが検索され、該当する住所表現を含むレコードの住所情報及び緯度・経度情報が所在地候補として取得され、組み合わせ生成部42に出力されるとともに所在地候補記憶部5に出力され記憶され、この処理が住所表現の数だけ繰り返される(s3)。   Next, in the address candidate acquisition unit 412, the address expression stored in the address expression storage unit 3 is read and input, and the database name and field name selected and output by the database selection unit 411 are input. Then, the database field corresponding to the selected database name and field name is searched from the database 1 using the address expression as a key, and the address information and latitude / longitude information of the record including the corresponding address expression are the location candidates. And is output to the combination generation unit 42 and output to and stored in the location candidate storage unit 5, and this process is repeated for the number of address expressions (s3).

例えば、住所表現が「日本橋」、選択されたデータベース名が「住所DB(データベース)」、選択されたフィールド名が「住所フィールド」である場合、図9に示すように「東京都中央区日本橋,35.677,139.776」と「大阪府大阪市浪速区日本橋,34.656,135.509」とが所在地候補として取得され、出力される。また、住所表現が「A」、選択されたデータベース名が「…DB」、選択されたフィールド名が「…フィールド」である場合、図9に示すように「A1,34.123,138.654」と「A2,38.324,140.002」とが所在地候補として取得され、出力され、また、住所表現が「B」、選択されたデータベース名が「…DB」、選択されたフィールド名が「…フィールド」である場合、図9に示すように「B1,32.832,134.843」と「B2,34.534,135.809」とが所在地候補として取得され、出力される(なお、「A」、「B」や「A1」、「A2」、「B1」、「B2」は詳細な内容を省略した表現であって、実際には「日本橋」や「東京都中央区日本橋」と同様の文字列である。)。   For example, when the address expression is “Nihonbashi”, the selected database name is “address DB (database)”, and the selected field name is “address field”, as shown in FIG. "35.677, 139.776" and "Nihonbashi, Naniwa-ku, Osaka, 34,656, 135.509" are acquired and output as location candidates. Further, when the address expression is “A”, the selected database name is “... DB”, and the selected field name is “... Field”, “A1, 34.123, 138.654” and “A2” as shown in FIG. , 38.324, 140.002 "are acquired and output as location candidates, and the address expression is" B ", the selected database name is" ... DB ", and the selected field name is" ... field " As shown in FIG. 9, “B1,32.832,134.843” and “B2,34.534,135.809” are acquired and output as location candidates (“A”, “B”, “A1”, “A2”) , “B1” and “B2” are expressions in which detailed contents are omitted, and are actually character strings similar to “Nihonbashi” and “Nihonbashi, Chuo-ku, Tokyo”.

なお、以上の処理が「所在地候補抽出処理」である。   The above processing is “location candidate extraction processing”.

次に、組み合わせ生成部42において、所在地候補抽出部41で抽出され出力された複数の住所表現それぞれに対応する所在地候補(の住所情報及び緯度・経度情報)が入力されると、一の住所表現の所在地候補(の住所情報)と他の住所表現の所在地候補(の住所情報)との全ての組み合わせが生成され、組み合わせ記憶部6に出力され記憶されるとともに、距離計算部7に出力される(s4)。   Next, in the combination generation unit 42, when address candidates (address information and latitude / longitude information) corresponding to each of the plurality of address expressions extracted and output by the address candidate extraction unit 41 are input, one address expression All combinations of address candidates (address information) and address candidates (address information) of other address expressions are generated, output to the combination storage unit 6, stored, and output to the distance calculation unit 7. (S4).

例えば、住所表現「日本橋」の所在地候補「東京都中央区日本橋,35.677,139.776」及び「大阪府大阪市浪速区日本橋,34.656,135.509」、住所表現「A」の所在地候補「A1,34.123,138.654」及び「A2,38.324,140.002」、住所表現「B」の所在地候補「B1,32.832,134.843」及び「B2,34.534,135.809」が入力された場合、図10に示すように「東京都…,A1」、「東京都…,A2」、「東京都…,B1」、…「A2,B2」の12組の組み合わせが出力される。   For example, location candidates “Nipponbashi, Chuo-ku, Tokyo, 35.677, 139.776” and “Nihonbashi, Naniwa-ku, Osaka, 34.656, 135.509”, address candidates “A1, 34.123, 138.654”, address representation “A”. ”And“ A2, 38.324, 140.002 ”, and address candidates“ B1,32.832,134.843 ”and“ B2,34.534,135.809 ”of the address expression“ B ”are input as shown in FIG. Twelve combinations of “A1,” “Tokyo,..., A2,” “Tokyo,..., B1,” “A2, B2” are output.

なお、以上の処理が「所在地候補生成処理」である。   The above processing is “location candidate generation processing”.

次に、距離計算部7において、所在地候補記憶部5に記憶された複数の住所表現それぞれに対応する所在地候補(の住所情報及び緯度・経度情報)が読み出されて入力されるとともに、組み合わせ生成部42で生成されて出力された一の住所表現の所在地候補(の住所情報)と他の住所表現の所在地候補(の住所情報)との全ての組み合わせが入力されると、当該組み合わせにおける所在地候補間の距離が前述した如くして計算され、これらが全ての組み合わせについて同様に行われ、所在地決定部8に出力される(s5)。   Next, in the distance calculation unit 7, location candidates (address information and latitude / longitude information) corresponding to each of the plurality of address expressions stored in the location candidate storage unit 5 are read out and input, and a combination is generated. When all combinations of the address candidate (address information) of one address expression generated and output by the unit 42 and the address candidate (address information) of another address expression are input, the address candidates in the combination The distance between them is calculated as described above, these are performed in the same manner for all combinations, and are output to the location determination unit 8 (s5).

例えば、組み合わせ「東京都…,A1」については、住所情報「東京都…」を含む所在地候補の緯度・経度情報が「35.677,139.776」であり、住所情報「A1」を含む所在地候補の緯度・経度情報が「34.123,138.654」であるから、
D={(35.677−34.123)2+(139.776−138.654)21/2
=1.916715941
と計算される。他の組み合わせについても同様に計算され、各組み合わせに対応する所在地候補間の距離が、例えば図11に示すように出力される。
For example, for the combination “Tokyo ..., A1”, the latitude / longitude information of the location candidate including the address information “Tokyo ...” is “35.677, 139.776”, and the latitude / longitude of the location candidate including the address information “A1” Since the longitude information is “34.123, 138.654”
D = {(35.677−34.123) 2 + (139.776−138.654) 2 } 1/2
= 1.916715941
Is calculated. The other combinations are similarly calculated, and the distance between the location candidates corresponding to each combination is output, for example, as shown in FIG.

次に、所在地決定部8において、所在地候補記憶部5に記憶された複数の住所表現それぞれに対応する所在地候補が読み出されて入力され、組み合わせ記憶部6に記憶された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせが読み出されて入力されるとともに、距離計算部7で計算されて出力された各組み合わせにおける所在地候補間の距離が入力されると、複数の住所表現それぞれに対応する所在地候補のうち、所在地候補間の距離がより小さい組み合わせに属する所在地候補が所在地(の住所情報及び緯度・経度情報)にそれぞれ決定され、住所表現−所在地対応付け部9に出力される(s6)。   Next, in the location determination unit 8, location candidates corresponding to each of the plurality of address representations stored in the location candidate storage unit 5 are read out and input, and the location of one address representation stored in the combination storage unit 6 When all combinations of candidates and location candidates of other address expressions are read out and input, and distances between location candidates in each combination calculated and output by the distance calculation unit 7 are input, Among the address candidates corresponding to each address expression, each address candidate belonging to a combination with a smaller distance between the address candidates is determined as the address (address information and latitude / longitude information), and the address expression-location associating unit 9 (S6).

図12は所在地決定部8における処理の流れの詳細を、また、図13は所在地決定部8の処理内容の一例を示すもので、以下、これらに従ってその動作を詳細に説明する。   FIG. 12 shows details of the processing flow in the location determination unit 8, and FIG. 13 shows an example of processing contents of the location determination unit 8. The operation will be described in detail below according to these.

まず、複数の住所表現の所在地候補、所在地候補の全ての組み合わせ及び各組み合わせに対応する距離、例えば6つの所在地候補「東京都中央区日本橋,35.677,139.776」、「大阪府大阪市浪速区日本橋,34.656,135.509」、「A1,34.123,138.654」、…「B2,34.534,135.809」と、12組の組み合わせ「東京都…,A1」、「東京都…,A2」、「東京都…,B1」、…「A2,B2」と、各組み合わせの距離「1.916715941」、「2.656630385」、「5.694603937」、…「5.652021674」とが入力される(s11)と、入力された各組み合わせの距離の中から最小の距離、ここでは「0.323857994」が抽出される(s12)。   First, location candidates of multiple address expressions, all combinations of location candidates, and distances corresponding to each combination, for example, six location candidates “Nihonbashi Chuo-ku, Tokyo, 35.677, 139.776”, “Nihonbashi, Naniwa-ku, Osaka, Osaka, Japan, 34.656, 135.509 "," A1, 34.123, 138.654 ", ..." B2, 34.534, 135.809 "and 12 combinations" Tokyo ..., A1 "," Tokyo ..., A2 "," Tokyo ..., B1 " , ... “A2, B2” and the distances “1.916715941”, “2.656630385”, “5.694603937”,... “5.652021674” of each combination are input (s11), and the minimum distance among the input distances of each combination , Here, “0.323857994” is extracted (s12).

次に、入力された複数の住所表現の所在地候補の中から、前記最小の距離に対応する所在地候補の組み合わせ、ここでは「大阪府…,B2」に含まれるいずれかの所在地候補と同一のものを含む住所表現の所在地候補、ここでは所在地候補「大阪府…」を含む住所表現「日本橋」の所在地候補「東京都中央区日本橋,35.677,139.776」及び「大阪府大阪市浪速区日本橋,34.656,135.509」と、所在地候補「B2」を含む住所表現「B」の所在地候補「B1,32.832,134.843」及び「B2,34.534,135.809」とが検索される(s13)。   Next, a combination of address candidates corresponding to the minimum distance from among the input address candidates of a plurality of address expressions, which is the same as any one of the address candidates included in “Osaka Prefecture…, B2” in this case. Address candidates including address candidates, here address candidates “Nihonbashi” address candidates including address candidate “Osaka Prefecture…” “Nihonbashi, Chuo-ku, Tokyo, 35.677, 139.776” and “Nihonbashi, Naniwa-ku, Osaka, 34,656, Address candidates “B1,32.832,134.843” and “B2,34.534,135.809” of the address expression “B” including the address candidate “B2” are searched (S13).

次に、検索された住所表現の所在地候補の中から、最小の距離に対応する所在地候補の組み合わせに含まれなかった所在地候補、ここでは住所表現「日本橋」の所在地候補「東京都中央区日本橋,35.677,139.776」と、住所表現「B」の所在地候補「B1,32.832,134.843」とが削除され(s14)、さらに所在地候補の全ての組み合わせ及び各組み合わせに対応する距離の中から、前記削除された所在地候補(の住所情報)を含む所在地候補の組み合わせ及びこれに対応する距離、ここでは「東京都…,A1」及び「1.916715941」、「東京都…,A2」及び「2.656630385」、…「A2,B1」及び「7.535074319」が削除される(s15)。なお、図13では二重取消線で削除を表現した。   Next, among the address candidates of the searched address expression, the address candidates not included in the combination of address candidates corresponding to the minimum distance, here, the address candidate of the address expression “Nihonbashi” “Nihonbashi, Chuo-ku, Tokyo, 35.677, 139.776 ”and the address candidate“ B1,32.832,134.843 ”of the address expression“ B ”are deleted (s14), and all the combinations of the address candidates and the distances corresponding to each combination are deleted. A combination of address candidates including the address candidates (address information thereof) and distances corresponding thereto, here “Tokyo…, A1” and “1.916715941”, “Tokyo ..., A2” and “2.656630385”,… “A2 , B1 ”and“ 7.535074319 ”are deleted (s15). In FIG. 13, deletion is expressed by double strikethrough.

次に、全ての住所表現の所在地候補が1つになったかが判定される(s16)が、ここでは住所表現「A」の所在地候補が2つ、つまり「A1,34.123,138.654」及び「A2,38.324,140.002」であるため、s12の処理に戻り、削除されずに残った組み合わせの距離の中(但し、それまでに抽出した距離、ここでは「0.323857994」については除外する。)から最小の距離、即ち「2.874534049」が抽出される。   Next, it is determined whether or not there is one address candidate for all address expressions (s16). Here, there are two address candidates for address expression "A", that is, "A1, 34.123, 138.654" and "A2," 38.324, 140.002 ”, the process returns to the process of s12, and the minimum distance from the distances of the combinations that remain without being deleted (however, the distances extracted so far, here,“ 0.323857994 ”is excluded)). That is, “2.874534049” is extracted.

そして、s13の処理により、前記同様、入力された複数の住所表現の所在地候補の中から、前記最小の距離に対応する所在地候補の組み合わせ、ここでは「A1,B2」に含まれるいずれかの所在地候補と同一のものを含む住所表現の所在地候補、ここでは所在地候補「A1」を含む住所表現「A」の所在地候補「A1,34.123,138.654」及び「A2,38.324,140.002」が検索され、s14の処理により、検索された住所表現の所在地候補の中から、最小の距離に対応する所在地候補の組み合わせに含まれなかった所在地候補、ここでは住所表現「A」の所在地候補「A2,38.324,140.002」が削除され、さらにs15の処理により、該削除された所在地候補(の住所情報)を含む所在地候補の組み合わせ及びこれに対応する距離、ここでは「大阪府…,A2」及び「5.80010974」と、「A2,B2」及び「5.652021674」とが削除される(なお、実際には所在地候補「B2」を含むものについても同様に行われるが、既に行われているので結果は変わらない。)。   Then, by the process of s13, as described above, from among the plurality of input address candidates of the address expression, a combination of address candidates corresponding to the minimum distance, here, any address included in “A1, B2” Address candidates of address expressions including the same as the candidates, here are address candidates “A1, 34.123, 138.654” and “A2, 38.324, 140.002” of address expressions “A” including the address candidate “A1”, and s14 The address candidates that are not included in the combination of address candidates corresponding to the minimum distance among the address candidates of the address expression searched by the processing of the address expression “A” in this case, “A2, 38.324, 140.002” ”Is deleted, and a combination of location candidates including the deleted location candidate (address information thereof) and the corresponding distance, here“ Osaka , A2 ”and“ 5.80010974 ”and“ A2, B2 ”and“ 5.652021674 ”are deleted (actually, this is also performed for those including the location candidate“ B2 ”, but it has already been done. So the result will not change.)

この結果、s16の処理により、全ての住所表現の所在地候補が1つになったことが判定されることにより、削除されずに残された各住所表現の所在地候補、ここでは「大阪府大阪市浪速区日本橋,34.656,135.509」、「A1,34.123,138.654」及び「B2,34.534,135.809」が出力される(s17)。   As a result, it is determined in the process of s16 that there is one address candidate for all address expressions, so that the address candidates for each address expression remaining without being deleted, “Nanbashi Nihonbashi, 34.656, 135.509”, “A1, 34.123, 138.654” and “B2, 34.534, 135.809” are output (s17).

最後に、住所表現−所在地対応付け部9において、住所表現記憶部3に記憶された複数の住所表現が読み出されて入力されるとともに、所在地決定部8で決定されて出力された各住所表現対応の所在地が入力されると、この住所表現と所在地(の住所情報)とがそれぞれ対応付けて出力される(s7)。   Finally, in the address expression-location association unit 9, a plurality of address expressions stored in the address expression storage unit 3 are read out and input, and each address expression determined and output by the location determination unit 8 is output. When a corresponding location is input, this address expression and location (address information) are output in association with each other (s7).

例えば、複数の住所表現が「日本橋」、「A」及び「B」、各住所表現対応の所在地が「大阪府大阪市浪速区日本橋,34.656,135.509」、「A1,34.123,138.654」及び「B2,34.534,135.809」である場合、図14に示すように「日本橋:大阪府大阪市浪速区日本橋,34.656,135.509」、「A:A1,34.123,138.654」及び「B:B2,34.534,135.809」が出力される。   For example, a plurality of address expressions are “Nihonbashi”, “A”, and “B”, and addresses corresponding to each address expression are “Nipponbashi, Naniwa-ku, Osaka, 34.656, 135.509”, “A1, 34.123, 138.654”, and “B2”. , 34.534, 135.809 ", as shown in FIG. 14," Nihonbashi: Nihonbashi, Naniwa-ku, Osaka, Osaka, 34.656, 135.509 "," A: A1, 34.123, 138.654 "and" B: B2, 34.534, 135.809 " Is output.

このように、本実施の形態によれば、入力された複数の住所表現に対応する所在地がそれぞれ2つ以上存在する場合であっても、そのうちの1つのみをそれぞれ自動的に選択して出力することが可能となる。   As described above, according to this embodiment, even when there are two or more locations corresponding to a plurality of input address expressions, only one of them is automatically selected and output. It becomes possible to do.

なお、複数の住所表現が、前述したように、オペレータにより図示しないキーボード等から直接入力されたものであったり、データベースやカーナビゲーションシステムから得られたものであるような場合には、住所表現抽出処理(s1)は必要なく、また、住所表現と所在地とを対応付けて出力する必要がなく、入力された住所表現に対応する所在地だけ出力すれば良い場合には、所在地決定処理(s6)により決定した所在地を直接、外部へ出力すれば良く、この場合、住所表現−所在地対応付け処理(s7)は必要ない。   If a plurality of address expressions are input directly from a keyboard (not shown) by an operator or obtained from a database or a car navigation system, as described above, address expression extraction is performed. If the processing (s1) is not required, and it is not necessary to output the address expression and the location in association with each other, and only the location corresponding to the input address expression needs to be output, the location determination processing (s6) The determined location may be directly output to the outside. In this case, the address expression-location associating process (s7) is not necessary.

<実施の形態2>
本発明の実施の形態2では、図15に示すように、都道府県、市区郡、町村、町大字、字・丁目の住所レベル毎に区切られた住所情報をその緯度・経度情報とともにレコード毎に登録してなる住所データベースを用いる。即ち、例えば、実施の形態1で説明した住所データベースにおける1つのレコードの住所情報が「東京都中央区日本橋…」であったとすると、本実施の形態における同じレコードの住所情報は「東京/都,中央/区,日本橋,…」(但し、「,」は区切りの記号、また、「/」は次の区切りの記号「,」までの文字列については住所表現中にあってもなくても良いことを示す記号である。)のように、都道府県、市区郡、町村、町大字、字・丁目の住所レベル毎に区切られて登録される。
<Embodiment 2>
In the second embodiment of the present invention, as shown in FIG. 15, the address information divided for each address level in prefectures, municipalities, towns and villages, town large letters, and letters / chomes is displayed for each record together with the latitude / longitude information. Use the address database registered in. That is, for example, if the address information of one record in the address database described in the first embodiment is “Nihonbashi, Chuo-ku, Tokyo ...”, the address information of the same record in the present embodiment is “Tokyo / city, "Chuo / Ku, Nihonbashi, ..." (However, "," is a delimiter symbol, and "/" is the character string up to the next delimiter symbol "," may or may not be in the address expression. As shown in FIG. 5), the registered address is divided into each prefecture, municipality, town, village, town large character, letter / chome address level.

そして、所在地候補生成部4(詳細には所在地候補抽出部41の所在地候補取得部412)では、入力された住所表現、ここでは住所情報の一部からなる住所表現をキーとして住所データベースの住所フィールドを検索し、該当する住所表現を含むレコードの住所情報を取得し、さらに前記住所表現と区切りの一致を満たすレコードの住所情報をその緯度・経度情報とともに所在地候補として出力する。   Then, the address candidate generation unit 4 (specifically, the address candidate acquisition unit 412 of the address candidate extraction unit 41) uses the input address expression, here, the address expression consisting of a part of the address information as a key in the address field of the address database. , The address information of the record including the corresponding address expression is acquired, and the address information of the record satisfying the coincidence with the address expression is output together with the latitude / longitude information as a location candidate.

本実施の形態によれば、例えば、入力された住所表現「イラン」に対して住所情報「英国ハイランド州…」を含むレコードが抽出され所在地候補として生成されるような、住所表現を構成する文字列の単なる一致により誤った所在地候補が生成されることが少なくなる。   According to the present embodiment, for example, an address expression is configured such that a record including address information “Highland of England ...” is extracted from the input address expression “Iran” and is generated as a location candidate. It is less likely that incorrect location candidates are generated due to simple matching of character strings.

<実施の形態3>
本発明の実施の形態3では、距離計算部7における所在地候補の全ての組み合わせにおける所在地候補間の距離を、それらの緯度・経度情報ではなく、それらを構成する文字列の一致率から計算する。即ち、所在地候補生成部4(の組み合わせ生成部42)から出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを入力とし、一の組み合わせにおける所在地候補間の距離Dを、それぞれの所在地候補の住所情報の文字数length(add1),length(add2)と、それぞれの所在地候補の住所情報の一致した文字数match length(add1,add2)とを用いて計算、即ち
D={2×match length(add1,add2)}/{length(add1)+length(add2)}
より計算し、これを各組み合わせに対して同様に行い、所在地決定部8に出力する。
<Embodiment 3>
In the third embodiment of the present invention, distances between location candidates in all combinations of location candidates in the distance calculation unit 7 are calculated not from the latitude / longitude information but from the matching rate of the character strings constituting them. That is, all combinations of location candidates of one address expression and location candidates of other address expressions output from the location candidate generation unit 4 (the combination generation unit 42) are input, and between the location candidates in one combination The distance D is the number of characters length (add1) and length (add2) of the address information of each location candidate and the number of characters that match the address information of each location candidate. Calculate using length (add1, add2), ie D = {2 × match length (add1, add2)} / {length (add1) + length (add2)}
This is calculated in the same manner for each combination and output to the location determination unit 8.

そして、所在地決定部8では、所在地候補生成部4から出力された複数の住所表現それぞれに対応する所在地候補のうち、距離計算部7から出力された所在地候補間の距離がより小さい、ここでは文字列の一致率で表される距離がより大きい組み合わせに属する所在地候補を所在地にそれぞれ決定し、住所表現−所在地対応付け部9に出力する。   Then, the location determination unit 8 has a smaller distance between the location candidates output from the distance calculation unit 7 among the location candidates corresponding to each of the plurality of address expressions output from the location candidate generation unit 4. Location candidates belonging to a combination having a larger distance represented by the column matching rate are determined as locations, and are output to the address expression-location association unit 9.

本実施の形態によれば、所在地候補の住所情報の文字列から所在地候補間の距離を求めることができ、各データベース中の緯度・経度情報を不要とすることができる。   According to the present embodiment, the distance between the address candidates can be obtained from the character string of the address information of the address candidates, and the latitude / longitude information in each database can be made unnecessary.

<実施の形態4>
本発明の実施の形態4では、所在地決定部8における複数の住所表現それぞれに対応する所在地候補を、複数の住所表現の所在地候補同士の全ての組み合わせに対応する所在地候補間の距離の和から決定する、より詳細には、所在地候補生成部4(の所在地候補抽出部41)から出力され所在地候補記憶部5に記憶された複数の住所表現それぞれに対応する所在地候補と、所在地候補生成部4(の組み合わせ生成部42)から出力され組み合わせ記憶部6に記憶された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせと、距離計算部7で計算された各組み合わせにおける所在地候補間の距離とを入力とし、複数の住所表現それぞれに対応する所在地候補から各住所表現の所在地候補同士の全ての組み合わせを生成し、該各住所表現の所在地候補同士の組み合わせのうち、当該組み合わせに含まれる一の住所表現の所在地候補と他の住所表現の所在地候補との組み合わせのそれぞれに対応する距離計算部7から出力された所在地候補間の距離の和が最も小さい組み合わせに属する所在地候補を、複数の住所表現それぞれに対応する所在地に決定し、住所表現−所在地対応付け部9に出力する。
<Embodiment 4>
In the fourth embodiment of the present invention, the location candidates corresponding to each of the plurality of address expressions in the location determination unit 8 are determined from the sum of the distances between the location candidates corresponding to all combinations of the address candidates of the plurality of address expressions. More specifically, the location candidate corresponding to each of the plurality of address expressions output from the location candidate generation unit 4 (location candidate extraction unit 41) and stored in the location candidate storage unit 5, and the location candidate generation unit 4 ( In the combination calculation unit 42), all combinations of one address expression location candidate and another address expression location candidate stored in the combination storage unit 6 and each combination calculated by the distance calculation unit 7 Using distances between location candidates as input, generate all combinations of location candidates for each address expression from the address candidates corresponding to each of multiple address expressions. , Out of the combinations of the address candidates for each address expression, output from the distance calculation unit 7 corresponding to each of the combinations of the address candidates for one address expression and the address candidates for other address expressions included in the combination. The location candidates belonging to the combination having the smallest sum of the distances between the location candidates are determined as locations corresponding to the plurality of address representations, and are output to the address representation-location association unit 9.

図16は本実施の形態の所在地決定部8における処理内容の例を示すもので、以下、これに従ってその動作を詳細に説明する。   FIG. 16 shows an example of processing contents in the location determination unit 8 of the present embodiment, and the operation will be described in detail below according to this.

まず、入力された複数の住所表現の所在地候補から、各住所表現に対して1つ所在地候補を選択し、取り得る全ての所在地候補(の住所情報)の組を生成する。例えば、図16では、6つの所在地候補「東京都中央区日本橋,35.677,139.776」、「大阪府大阪市浪速区日本橋,34.656,135.509」、「A1,34.123,138.654」、…「B2,34.534,135.809」から、「東京都…,A1,B1」、「東京都…,A1,B2」、「東京都…,A2,B1」、…「大阪府,A2,B2」の8組の組み合わせが生成される。   First, one address candidate is selected for each address expression from a plurality of input address candidates, and a set of all possible address candidates (address information thereof) is generated. For example, in FIG. 16, there are six location candidates “Nihonbashi, Chuo-ku, Tokyo, 35.677, 139.776”, “Nihonbashi, Naniwa-ku, Osaka, Osaka, 34.656, 135.509”, “A1, 34.123, 138.654”, “B2, 34.534, From “135.809”, 8 combinations of “Tokyo, A1, B1,” “Tokyo, A1, B2,” “Tokyo, A2, B1,” “Osaka, A2, B2” are generated. Is done.

次に、生成された取り得る全ての所在地候補の各組において、その部分的な構成となる一の住所表現の所在地候補と他の住所表現の所在地候補との組み合わせを、所在地候補生成部4(の組み合わせ生成部42)で生成された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせの中から選択する。そして、選択された組み合わせの所在地候補間の距離の和を、取り得る全ての所在地候補の各組の距離とする。例えば、図16では、「東京都…,A1,B1」の組に対し、部分的な構成として、「東京都…,A1」、「東京都…,B1」及び「A1,B1」の組み合わせが選択され、「東京都…,A1,B1」の距離は、「東京都…,A1」、「東京都…,B1」及び「A1,B1」の距離の和である「11.63504974」となる。   Next, in each set of all possible location candidates generated, a combination of a location candidate of one address expression and a location candidate of another address expression, which is a partial configuration, is combined with the location candidate generation unit 4 ( The combination generation unit 42) selects from all combinations of the address candidates of one address expression and the address candidates of other address expressions. Then, the sum of the distances between the location candidates of the selected combination is set as the distance of each set of all possible location candidates. For example, in FIG. 16, a combination of “Tokyo ..., A1”, “Tokyo ..., B1” and “A1, B1” is a partial configuration with respect to the set of “Tokyo ..., A1, B1”. The selected distance of “Tokyo ... A1, B1” is “11.63504974” which is the sum of the distances of “Tokyo ..., A1”, “Tokyo ..., B1” and “A1, B1”.

そして、求められた取り得る全ての所在地候補の各組の距離のうち、最小の距離が抽出され、当該最小の距離に対応する組に属する所在地候補が、複数の住所表現それぞれに対応する所在地に決定されて出力される。図16の例では、距離「6.3882375」が抽出され、この距離に対応する組である「大阪府…,A1,B2」に属する所在地候補「大阪府大阪市浪速区日本橋,34.656,135.509」、「A1,34.123,138.654」及び「B2,34.534,135.809」が所在地として出力される。   Then, the minimum distance is extracted from the distances of all the possible combinations of possible location candidates, and the location candidates belonging to the set corresponding to the minimum distance are the locations corresponding to the plurality of address expressions. Determined and output. In the example of FIG. 16, the distance “6.3882375” is extracted, and the location candidates “Nipponbashi, Naniwa-ku, Osaka, 34.656, 135.509”, “Osaka Prefecture…, A1, B2”, which is a set corresponding to this distance, “A1, 34.123, 138.654” and “B2, 34.534, 135.809” are output as locations.

なお、本発明は、前述したデータベースを備え又は接続された周知のコンピュータに媒体もしくは通信回線を介して、図7、図12の流れ図に示された手順を備えるプログラムをインストールすることによっても実現可能である。   The present invention can also be realized by installing a program having the procedures shown in the flowcharts of FIGS. 7 and 12 via a medium or a communication line in a known computer having or connected to the database described above. It is.

本発明の所在地解析装置の実施の形態の一例を示す構成図The block diagram which shows an example of embodiment of the location analyzer of this invention 住所データベースの一例を示す説明図Explanatory diagram showing an example of the address database 店舗データベースの一例を示す説明図Explanatory drawing which shows an example of a store database 駅名データベースの一例を示す説明図Explanatory diagram showing an example of the station name database ランドマークデータベースの一例を示す説明図An explanatory diagram showing an example of a landmark database データベース選択テーブルの一例を示す説明図Explanatory drawing which shows an example of a database selection table 本発明の所在地解析装置における処理の流れ図Flow chart of processing in the location analysis apparatus of the present invention データベース選択部の入出力値の一例を示す説明図Explanatory drawing which shows an example of the input / output value of a database selection part 所在地候補取得部の入出力値の一例を示す説明図Explanatory drawing which shows an example of the input / output value of a location candidate acquisition part 組み合わせ生成部の入出力値の一例を示す説明図Explanatory drawing which shows an example of the input / output value of a combination production | generation part 距離計算部の入出力値の一例を示す説明図Explanatory drawing which shows an example of the input / output value of a distance calculation part 所在地決定部における処理の流れ図Flow chart of processing in the location determination unit 所在地決定部の処理内容の一例を示す説明図Explanatory drawing which shows an example of the processing content of a location determination part 住所表現−所在地対応付け部の入出力値の一例を示す説明図Explanatory drawing which shows an example of the input-output value of an address expression-address matching part 住所データベースの他の例を示す説明図Explanatory drawing showing another example of address database 所在地決定部の処理内容の他の例を示す説明図Explanatory drawing which shows the other example of the processing content of a location determination part.

符号の説明Explanation of symbols

1:データベース、2:住所表現抽出部、3:住所表現記憶部、4:所在地候補生成部、5:所在地候補記憶部、6:組み合わせ記憶部、7:距離計算部、8:所在地決定部、9:住所表現−所在地対応付け部、41:所在地候補抽出部、42:組み合わせ生成部、411:データベース選択部、412:所在地候補取得部、s1:住所表現抽出処理、s2:データベース選択処理、s3:所在地候補取得処理、s4:組み合わせ生成処理、s5:距離計算処理、s6:所在地決定処理、s7:住所表現−所在地対応付け処理。   1: database, 2: address expression extraction unit, 3: address expression storage unit, 4: location candidate generation unit, 5: location candidate storage unit, 6: combination storage unit, 7: distance calculation unit, 8: location determination unit, 9: Address expression-location association unit, 41: Location candidate extraction unit, 42: Combination generation unit, 411: Database selection unit, 412: Location candidate acquisition unit, s1: Address expression extraction process, s2: Database selection process, s3 : Location candidate acquisition processing, s4: combination generation processing, s5: distance calculation processing, s6: location determination processing, s7: address expression-location association processing.

Claims (18)

住所情報の一部もしくは所定の住所に存在する施設の名称からなる住所表現から、当該住所表現に対応する場所を表す情報である所在地を求める装置において、
住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなる少なくとも1つのデータベースと、
前記データベースを参照し、入力された複数の住所表現の各々について当該住所表現を含む全てのレコードの住所情報を所在地候補として出力するとともに、一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを出力する所在地候補生成部と、
所在地候補生成部から出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせにおける所在地候補間の距離を求めて出力する距離計算部と、
所在地候補生成部から出力された複数の住所表現それぞれに対応する所在地候補のうち、距離計算部から出力された所在地候補間の距離がより小さい組み合わせに属する所在地候補を所在地に決定する所在地決定部とを備えた
ことを特徴とする所在地解析装置。
In an apparatus for obtaining a location which is information representing a place corresponding to the address expression from an address expression consisting of a part of the address information or the name of a facility existing at a predetermined address,
At least one database in which only the address information or the name of the facility existing at the predetermined address and the address information are registered for each record;
With reference to the database, for each of a plurality of input address expressions, the address information of all records including the address expression is output as the address candidates, and the address candidates of one address expression and the address candidates of other address expressions A candidate location generator that outputs all combinations of
A distance calculation unit that obtains and outputs the distance between the location candidates in all combinations of the location candidate of one address expression output from the location candidate generation unit and the location candidate of another address expression;
A location determination unit that determines a location candidate that belongs to a combination with a smaller distance between the location candidates output from the distance calculation unit among the location candidates corresponding to each of the plurality of address expressions output from the location candidate generation unit; A location analysis device characterized by comprising:
所在地候補生成部は、
入力された住所表現をキーとして前記データベースを検索し、該当する住所表現を含む全てのレコードの住所情報を所在地候補として抽出し、これを住所表現の数だけ繰り返す所在地候補抽出部と、
所在地候補抽出部で抽出された複数の住所表現それぞれに対応する所在地候補から一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを生成して出力する組み合わせ生成部とからなる
ことを特徴とする請求項1記載の所在地解析装置。
The location candidate generator
Searching the database using the input address expression as a key, extracting address information of all records including the corresponding address expression as a location candidate, and repeating this as many times as the number of address expressions,
From a combination generation unit that generates and outputs all combinations of a location candidate of one address expression and a location candidate of another address expression from the address candidates corresponding to each of the plurality of address expressions extracted by the address candidate extraction unit The location analysis apparatus according to claim 1, wherein:
住所情報とその緯度・経度情報もしくは所定の住所に存在する施設の名称とその住所情報及び緯度・経度情報をレコード毎に登録してなる少なくとも1つのデータベースを用い、
所在地候補生成部は、住所情報とともに緯度・経度情報も含めて所在地候補として出力し、
距離計算部は、所在地候補生成部から出力された所在地候補の全ての組み合わせにおける所在地候補間の距離を、それらの緯度・経度情報を用いて計算する
ことを特徴とする請求項1記載の所在地解析装置。
Using at least one database in which the address information and its latitude / longitude information or the name of the facility existing at a given address and its address information and latitude / longitude information are registered for each record,
The address candidate generation unit outputs the address candidate including the latitude / longitude information together with the address information,
The location analysis unit according to claim 1, wherein the distance calculation unit calculates distances between location candidates in all combinations of location candidates output from the location candidate generation unit using the latitude / longitude information thereof. apparatus.
所在地候補生成部から出力された所在地候補の全ての組み合わせにおける所在地候補間の距離を、それらを構成する文字列の一致率から計算する距離計算部を備えた
ことを特徴とする請求項1記載の所在地解析装置。
The distance calculation part which calculates the distance between the location candidates in all the combinations of the location candidates output from the location candidate generation part from the matching rate of the character string which comprises them is provided. Location analysis device.
所在地決定部は、
距離計算部から出力された所在地候補の全ての組み合わせの所在地候補間の距離の中から最小の距離を抽出し、所在地候補生成部から出力された複数の住所表現それぞれに対応する所在地候補の中から、最小の距離に対応する所在地候補の組み合わせに含まれるいずれかの所在地候補と同一のものを含む住所表現の所在地候補を検索し、該検索された住所表現の所在地候補の中から、最小の距離に対応する所在地候補の組み合わせに含まれなかった所在地候補を削除し、所在地候補生成部及び距離計算部からそれぞれ出力された所在地候補の全ての組み合わせ及び各組み合わせに対応する距離の中から、前記削除した所在地候補を含む所在地候補の組み合わせ及びこれに対応する距離を削除し、同様な処理を全ての住所表現に対応する所在地候補が1つとなるまで繰り返して複数の住所表現それぞれに対応する所在地を決定する
ことを特徴とする請求項1記載の所在地解析装置。
The location determination department
The minimum distance is extracted from the distances between the address candidates of all combinations of the address candidates output from the distance calculation unit, and the address candidates corresponding to each of the plurality of address expressions output from the address candidate generation unit are extracted. The address candidate of the address expression including the same one of the address candidates included in the combination of address candidates corresponding to the minimum distance is searched, and the minimum distance is selected from the address candidates of the searched address expression. The location candidates that are not included in the combination of location candidates corresponding to, are deleted, and the deletion is performed from all the combinations of location candidates output from the location candidate generation unit and the distance calculation unit and the distances corresponding to each combination. Address combinations corresponding to all address expressions by deleting the combination of address candidates including the address candidates and the distance corresponding to the combination. Complement the location analyzer according to claim 1, wherein the determining the location corresponding to a plurality of address representations is repeated until one.
所在地候補生成部から出力された複数の住所表現それぞれに対応する所在地候補から各住所表現の所在地候補同士の全ての組み合わせを生成し、該各住所表現の所在地候補同士の組み合わせのうち、当該組み合わせに含まれる一の住所表現の所在地候補と他の住所表現の所在地候補との組み合わせのそれぞれに対応する距離計算部から出力された所在地候補間の距離の和が最も小さい組み合わせに属する所在地候補を、複数の住所表現それぞれに対応する所在地に決定する所在地決定部を備えた
ことを特徴とする請求項1記載の所在地解析装置。
All combinations of address candidates of each address expression are generated from the address candidates corresponding to each of the plurality of address expressions output from the address candidate generation unit, and among the combinations of the address candidates of each address expression, Multiple address candidates belonging to the combination with the smallest sum of the distances between the address candidates output from the distance calculation unit corresponding to each of the combinations of the address candidates of one address expression and the address candidates of other address expressions included The location analysis device according to claim 1, further comprising a location determination unit that determines a location corresponding to each of the address expressions.
都道府県、市区郡、町村、町大字、字・丁目の住所レベル毎に区切られた住所情報をレコード毎に登録してなるデータベースを少なくとも用い、
所在地候補生成部は、入力された住所情報の一部からなる住所表現を含むレコードのうち、当該住所表現と区切りの一致を満たすレコードの住所情報を所在地候補として出力する
ことを特徴とする請求項1乃至6いずれか記載の所在地解析装置。
Use at least a database that registers address information separated for each address level in prefectures, cities, towns, towns, towns, large letters, and letters / chomes,
The address candidate generation unit outputs address information of a record satisfying a delimiter coincidence with the address expression among records including an address expression including a part of the input address information, as the address candidate. The location analysis apparatus according to any one of 1 to 6.
複数の住所表現は、1つの文または1つの文書から抽出されたものである
ことを特徴とする請求項1乃至7いずれか記載の所在地解析装置。
The location analysis apparatus according to claim 1, wherein the plurality of address expressions are extracted from one sentence or one document.
住所情報の一部もしくは所定の住所に存在する施設の名称からなる住所表現から、当該住所表現に対応する場所を表す情報である所在地を求める方法において、
住所情報のみもしくは所定の住所に存在する施設の名称とその住所情報をレコード毎に登録してなる少なくとも1つのデータベースを備えたコンピュータを用い、
当該コンピュータが、
前記データベースを参照し、入力された複数の住所表現の各々について当該住所表現を含む全てのレコードの住所情報を所在地候補として出力するとともに、一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを出力する所在地候補生成処理ステップと、
所在地候補生成処理ステップで出力された一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせにおける所在地候補間の距離を求めて出力する距離計算処理ステップと、
所在地候補生成処理ステップで出力された複数の住所表現それぞれに対応する所在地候補のうち、距離計算処理ステップで出力された所在地候補間の距離がより小さい組み合わせに属する所在地候補を所在地に決定する所在地決定処理ステップとを実行する
ことを特徴とする所在地解析方法。
In a method for obtaining a location which is information representing a place corresponding to the address expression from an address expression consisting of part of the address information or the name of a facility existing at a predetermined address,
Using a computer with at least one database in which the address information only or the name of the facility existing at a given address and the address information are registered for each record,
The computer
With reference to the database, for each of a plurality of input address expressions, the address information of all records including the address expression is output as the address candidates, and the address candidates of one address expression and the address candidates of other address expressions Location candidate generation processing step for outputting all combinations with
A distance calculation processing step for obtaining and outputting the distance between the location candidates in all combinations of the location candidates of one address expression and the location candidates of other address expressions output in the location candidate generation processing step;
Location determination for determining a location candidate belonging to a combination having a smaller distance between the location candidates output in the distance calculation processing step from among the location candidates corresponding to each of the plurality of address expressions output in the location candidate generation processing step. And a processing step.
所在地候補生成処理ステップは、
入力された住所表現をキーとして前記データベースを検索し、該当する住所表現を含む全てのレコードの住所情報を所在地候補として抽出し、これを住所表現の数だけ繰り返す所在地候補抽出処理ステップと、
所在地候補抽出処理ステップで抽出された複数の住所表現それぞれに対応する所在地候補から一の住所表現の所在地候補と他の住所表現の所在地候補との全ての組み合わせを生成して出力する組み合わせ生成処理ステップとからなる
ことを特徴とする請求項9記載の所在地解析方法。
The location candidate generation processing step
Searching the database using the input address expression as a key, extracting address information of all records including the corresponding address expression as address candidates, and repeating this as many times as the number of address expressions,
A combination generation processing step for generating and outputting all combinations of a location candidate of one address expression and a location candidate of another address expression from the address candidates corresponding to each of the plurality of address expressions extracted in the location candidate extraction processing step. The location analysis method according to claim 9, comprising:
住所情報とその緯度・経度情報もしくは所定の住所に存在する施設の名称とその住所情報及び緯度・経度情報をレコード毎に登録してなる少なくとも1つのデータベースを用い、
所在地候補生成処理ステップは、住所情報とともに緯度・経度情報も含めて所在地候補として出力し、
距離計算処理ステップは、所在地候補生成処理ステップで出力された所在地候補の全ての組み合わせにおける所在地候補間の距離を、それらの緯度・経度情報を用いて計算する
ことを特徴とする請求項9記載の所在地解析方法。
Using at least one database in which the address information and its latitude / longitude information or the name of the facility existing at a given address and its address information and latitude / longitude information are registered for each record,
The location candidate generation processing step outputs the location candidate including the latitude / longitude information together with the address information,
The distance calculation processing step calculates distances between location candidates in all combinations of location candidates output in the location candidate generation processing step using the latitude / longitude information thereof. Location analysis method.
所在地候補生成処理ステップで出力された所在地候補の全ての組み合わせにおける所在地候補間の距離を、それらを構成する文字列の一致率から計算する距離計算処理ステップを有する
ことを特徴とする請求項9記載の所在地解析方法。
The distance calculation processing step of calculating distances between location candidates in all combinations of location candidates output in the location candidate generation processing step from a matching rate of character strings constituting them. Location analysis method for.
所在地決定処理ステップは、
距離計算処理ステップで出力された所在地候補の全ての組み合わせの所在地候補間の距離の中から最小の距離を抽出するステップと、
所在地候補生成処理ステップで出力された複数の住所表現それぞれに対応する所在地候補の中から、最小の距離に対応する所在地候補の組み合わせに含まれるいずれかの所在地候補と同一のものを含む住所表現の所在地候補を検索するステップと、
該検索された住所表現の所在地候補の中から、最小の距離に対応する所在地候補の組み合わせに含まれなかった所在地候補を削除するステップと、
所在地候補生成処理ステップ及び距離計算処理ステップでそれぞれ出力された所在地候補の全ての組み合わせ及び各組み合わせに対応する距離の中から、前記削除した所在地候補を含む所在地候補の組み合わせ及びこれに対応する距離を削除するステップと、
同様な処理を全ての住所表現に対応する所在地候補が1つとなるまで繰り返して複数の住所表現それぞれに対応する所在地を決定するステップとからなる
ことを特徴とする請求項9記載の所在地解析方法。
The location determination process step
Extracting a minimum distance from the distances between the location candidates of all combinations of location candidates output in the distance calculation processing step;
Of the address candidates corresponding to each of the plurality of address expressions output in the address candidate generation processing step, an address expression including the same address candidate as one of the address candidates included in the combination of address candidates corresponding to the minimum distance Searching for potential locations,
Deleting a candidate address not included in the candidate address combination corresponding to the smallest distance from the candidate address expressions of the searched address expression;
Among all combinations of location candidates output in the location candidate generation processing step and the distance calculation processing step and distances corresponding to each combination, combinations of location candidates including the deleted location candidates and distances corresponding thereto are obtained. A step to delete,
10. The location analysis method according to claim 9, further comprising the step of repeating the same process until the number of location candidates corresponding to all address expressions becomes one, and determining the locations corresponding to each of the plurality of address expressions.
所在地候補生成処理ステップで出力された複数の住所表現それぞれに対応する所在地候補から各住所表現の所在地候補同士の全ての組み合わせを生成し、該各住所表現の所在地候補同士の組み合わせのうち、当該組み合わせに含まれる一の住所表現の所在地候補と他の住所表現の所在地候補との組み合わせのそれぞれに対応する距離計算処理ステップで出力された所在地候補間の距離の和が最も小さい組み合わせに属する所在地候補を、複数の住所表現それぞれに対応する所在地に決定する所在地決定処理ステップを有する
ことを特徴とする請求項9記載の所在地解析方法。
All combinations of address candidates for each address expression are generated from the address candidates corresponding to each of the plurality of address expressions output in the address candidate generation processing step, and the combination among the combinations of the address candidates for each address expression The address candidates belonging to the combination with the smallest sum of the distances between the address candidates output in the distance calculation processing step corresponding to each of the address candidates of one address expression and the address candidates of other address expressions included in The location analysis method according to claim 9, further comprising a location determination processing step for determining a location corresponding to each of a plurality of address expressions.
都道府県、市区郡、町村、町大字、字・丁目の住所レベル毎に区切られた住所情報をレコード毎に登録してなるデータベースを少なくとも用い、
所在地候補生成処理ステップは、入力された住所情報の一部からなる住所表現を含むレコードのうち、当該住所表現と区切りの一致を満たすレコードの住所情報を所在地候補として出力する
ことを特徴とする請求項9乃至14いずれか記載の所在地解析方法。
Use at least a database that registers address information separated for each address level in prefectures, cities, towns, towns, towns, large letters, and letters / chomes,
The address candidate generation processing step outputs address information of a record satisfying a delimiter coincidence with the address expression out of records including an address expression made up of a part of the input address information as the address candidate. Item 15. The location analysis method according to any one of Items 9 to 14.
複数の住所表現は、1つの文または1つの文書から抽出されたものである
ことを特徴とする請求項9乃至15いずれか記載の所在地解析方法。
The location analysis method according to claim 9, wherein the plurality of address expressions are extracted from one sentence or one document.
コンピュータに、請求項9乃至16いずれか記載の所在地解析方法の各処理ステップを実行させるための所在地解析プログラム。   A location analysis program for causing a computer to execute each processing step of the location analysis method according to claim 9. 請求項17記載の所在地解析プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。   18. A computer-readable recording medium on which the location analysis program according to claim 17 is recorded.
JP2006189286A 2006-07-10 2006-07-10 LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM Active JP4510784B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006189286A JP4510784B2 (en) 2006-07-10 2006-07-10 LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006189286A JP4510784B2 (en) 2006-07-10 2006-07-10 LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM

Publications (2)

Publication Number Publication Date
JP2008015981A true JP2008015981A (en) 2008-01-24
JP4510784B2 JP4510784B2 (en) 2010-07-28

Family

ID=39072899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006189286A Active JP4510784B2 (en) 2006-07-10 2006-07-10 LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM

Country Status (1)

Country Link
JP (1) JP4510784B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101576733B1 (en) 2014-04-02 2015-12-10 주식회사 유비케어 System and method for providing integrated search of address

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149073A (en) * 2003-11-14 2005-06-09 Matsushita Electric Ind Co Ltd Data retrieval device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149073A (en) * 2003-11-14 2005-06-09 Matsushita Electric Ind Co Ltd Data retrieval device

Also Published As

Publication number Publication date
JP4510784B2 (en) 2010-07-28

Similar Documents

Publication Publication Date Title
CN110008300B (en) Method and device for determining alias of POI (Point of interest), computer equipment and storage medium
US7092817B2 (en) Map information retrieving
JP5315664B2 (en) POSITION EXPRESSION DETECTING DEVICE, PROGRAM, AND STORAGE MEDIUM
US8429204B2 (en) Short point-of-interest title generation
CN105808609B (en) Method and equipment for judging data redundancy of information points
CN107203526B (en) Query string semantic demand analysis method and device
US20080046396A1 (en) Indexing big word lists in databases
CN110688434B (en) Method, device, equipment and medium for processing interest points
JP3307843B2 (en) Map display device in hypertext structure
JPWO2010004612A1 (en) Information processing apparatus, information creation apparatus, information processing method, information creation method, information processing program, information creation program, and recording medium
JP4510792B2 (en) LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM
JP5046107B2 (en) POI information address data update system and program
JP4510780B2 (en) LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM
JP4510784B2 (en) LOCATION ANALYSIS DEVICE, LOCATION ANALYSIS METHOD, ITS PROGRAM, AND RECORDING MEDIUM
KR101590620B1 (en) Method and apparatus for poi search of linking road name
JP6106070B2 (en) Place name estimation method, place name estimation apparatus, and place name estimation program
JP3621614B2 (en) Address analysis method, apparatus, and recording medium recording address analysis program
JP4382634B2 (en) Address analysis apparatus, address analysis method, and address analysis program
CN111198955A (en) Method, device, equipment and storage medium for file searching and knowledge graph construction
JP2009122886A (en) Address analysis device and method, and its program
JP2007011438A (en) Index structure for narrowing retrieval and information retrieval device
JP5533576B2 (en) Information creating apparatus, information creating method and program
JP5400813B2 (en) Address search device and address search method
JP2019008477A (en) Discrimination program, discrimination device and discrimination method
KR101576733B1 (en) System and method for providing integrated search of address

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4510784

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350