JP2005135064A - Device, method, and program for possibly repeated person detection, and storage medium with same program stored therein - Google Patents

Device, method, and program for possibly repeated person detection, and storage medium with same program stored therein Download PDF

Info

Publication number
JP2005135064A
JP2005135064A JP2003368587A JP2003368587A JP2005135064A JP 2005135064 A JP2005135064 A JP 2005135064A JP 2003368587 A JP2003368587 A JP 2003368587A JP 2003368587 A JP2003368587 A JP 2003368587A JP 2005135064 A JP2005135064 A JP 2005135064A
Authority
JP
Japan
Prior art keywords
information
registrant
seal
duplication
possibility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003368587A
Other languages
Japanese (ja)
Other versions
JP4365664B2 (en
Inventor
Takashi Muramatsu
隆史 村松
Makoto Sasaki
誠 佐々木
Hiroshi Fujiwara
泰士 藤原
Yoji Asai
洋史 浅井
Tsuguaki Fujiwara
嗣晃 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003368587A priority Critical patent/JP4365664B2/en
Publication of JP2005135064A publication Critical patent/JP2005135064A/en
Application granted granted Critical
Publication of JP4365664B2 publication Critical patent/JP4365664B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To detect repeatedly registered person information between databases. <P>SOLUTION: A possibly repeated person detecting device 100 which detects possibly repeatedly registered person information among a plurality of pieces of registered person information includes an acquisition part 110 which acquires registered person information and seal information, a seal impression information matching part 121 which specifies seal information having the same seal impression information among acquired pieces of seal information, an identification information matching part 122 which specifies registered person information having the same identification information among the pieces of acquired registered person information and detects registered person information with possibility of repetition among the pieces of acquired registered person information, and a storage part 131 which stores the detected registered person information with the possibility of repetition. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、データベース内で重複している可能性のある登録者情報を検出するための重複可能性者検出装置、重複登録者検出方法およびそのプログラムに関する。   The present invention relates to a duplication potential person detection device, a duplicate registrant detection method, and a program thereof for detecting registrant information that may be duplicated in a database.

従来から、各自治体で地方行政の効率化等を目的として、住民記録等の登録者情報の電子データ化や自治体に対する個人や企業の申請、届け出等のオンライン化を実現する技術がある(特許文献1参照)。
特開2003−006379号公報(段落[0012]〜[0039])
Conventionally, for the purpose of improving the efficiency of local administration in each local government, there is a technology that realizes the online conversion of registrant information such as resident records, etc., and the application and notification of individuals and companies to the local government (Patent Literature) 1).
JP 2003-006379 A (paragraphs [0012] to [0039])

しかし、前記した技術では、各自治体(市町村)が合併したときに市町村の住民記録等の登録者情報の統合を、正確にかつ効率的に行う方法については検討されていない。   However, in the above-described technology, a method for accurately and efficiently integrating registrant information such as resident records of municipalities when local governments (municipalities) merge is not considered.

すなわち、各市町村の登録者情報には、現在その市町村に住所を有する者の情報のみならず、その市町村内に住所は有していない者(転出者や他の市町村の住民で固定資産のみをその市町村に持っている者)の情報も含まれており、例えば、A市の登録者情報とB町の登録者情報とを統合するとき、A市に固定資産を持つB町の住民の登録情報について、同一人物の情報でありながらA市の分とB町の分とで2つ作成される(重複登録される)おそれがある。   In other words, the registrant information for each municipality includes not only information on those who currently have an address in that municipality, but also those who do not have an address in that municipality (transferrs and residents of other municipalities, only fixed assets). For example, when registrant information of A city and B registrant information are integrated, registration of residents of B town who have fixed assets in A city There is a possibility that two pieces of information are created (duplicately registered) for the A city and the B town for the same person.

かかる重複登録をそのままにしておくと、住民税の収納の把握や、資産税の免税点の判定が正しく行われず、住民に対し誤課税を誘発するおそれがある。
そこで、各市町村の登録者情報の統合においては、どの登録者情報とどの登録者情報とが同一人物の登録者情報であるかを特定し、同一人物の登録者情報のまとめ(いわゆる名寄せ)を行い、登録者情報を整理することが重要である。
If such duplicate registration is left as it is, grasping of resident tax storage and determination of the tax exemption point of property tax may not be performed correctly, and there is a risk of inducing taxation on the resident.
Therefore, in the integration of registrant information for each municipality, specify which registrant information and which registrant information is registrant information of the same person, and summarize the registrant information of the same person (so-called name identification). It is important to do and organize registrant information.

しかし、従来技術において、同一人物の登録者情報特定は、市町村の登録者の氏名や生年月日のみで行っているため、例えば、市町村の登録者情報の氏名欄に外字(JIS(Japan Industrial Standard)のコード体系外の文字)が使われていたときや、入力ミス等があったとき、名寄せが正確に行われないという問題があった。
また、近年、住民等の少子化高齢化を背景とした市町村の合併の増加や、住民記録等の登録者情報の電子データ化が進むことを考慮すると、前記した問題が増加することが考えられる。
However, in the prior art, the registrant information of the same person is specified only by the name and date of birth of the registrant of the municipality. For example, an external character (JIS (Japan Industrial Standard) is displayed in the name field of the registrant information of the municipality. ) When characters outside the code system) were used, or when there was an input error, name identification was not performed correctly.
Considering the recent increase in the merger of municipalities against the background of the declining birthrate and aging of the population, and the progress of digitization of registrant information such as resident records, the above problems may increase. .

そこで、本発明では、前記した問題を解決し、複数の登録者情報における同一人物特定(重複可能性者検出)を正確かつ効率的に行う重複可能性者検出装置および重複可能性者検出方法等を提供することを課題とする。   Therefore, in the present invention, a duplication possibility person detection device and duplication possibility person detection method for solving the above-described problem and accurately and efficiently performing the same person identification (duplication possibility person detection) in a plurality of registrant information, etc. It is an issue to provide.

前記課題を解決するため、本発明では、重複可能性者検出装置の識別情報マッチング部が、登録者の識別情報(後記する実施の形態では、氏名・生年月日、市町村の個人番号等)によるマッチング(同定)を行い、この識別情報が同じである登録者情報を特定する。
併せて、重複可能性者検出装置の印影情報マッチング部が、各市町村に登録されている印鑑の印影情報(印鑑のイメージデータ)によるマッチングを行い、印影情報が同じである印鑑情報を特定する。
そして、印影情報が同じである印鑑情報と、識別情報が同じである登録者情報とに基づき、取得した登録者情報のなかから、重複可能性者検出部が重複の可能性のある登録者情報を検出する構成とした。
この構成によれば、重複可能性のある登録者情報の検出は、各登録者情報に含まれる氏名・生年月日と印鑑の印影情報との組み合わせで行われるので、検出された登録者情報はより重複可能性の高いものとなる。
なお、後記する実施の形態では、識別情報マッチング部が重複可能性者検出部の機能を兼ねた構成としている。
In order to solve the above-mentioned problem, in the present invention, the identification information matching unit of the duplication potential person detecting device uses the identification information of the registrant (in the embodiment described later, name, date of birth, personal number of the municipality, etc.) Matching (identification) is performed, and registrant information having the same identification information is specified.
At the same time, the imprint information matching unit of the duplication potential person detecting device performs matching based on the seal imprint information (image data of the seal stamp) registered in each municipality, and specifies the seal stamp information having the same seal stamp information.
Then, based on the seal stamp information having the same seal imprint information and the registrant information having the same identification information, from the acquired registrant information, the registrant information whose duplication possibility person detection unit may be duplicated It was set as the structure which detects.
According to this configuration, detection of registrant information that may be duplicated is performed by a combination of the name and date of birth included in each registrant information and the seal imprint information of the seal, so the detected registrant information is It will be more likely to overlap.
In the embodiment described later, the identification information matching unit also functions as a duplication possibility person detecting unit.

この発明によれば、例えば、各市町村の登録者情報を統合するとき、予めより同一人物である可能性の高い登録者情報を検出することができるので、最終的に登録者情報の管理者が、手動や目視により登録者情報が同一人物の情報であるかの判定をするときの手間を軽減することができる。すなわち、管理者はより効率良く正確に名寄せを行うことができる。また、統一後の登録者情報のデータベース等において同一人物の登録者情報が複数登録(重複登録)されることを防ぐことができる。   According to the present invention, for example, when registrant information of each municipality is integrated, it is possible to detect registrant information that is likely to be the same person in advance. Further, it is possible to reduce time and labor when determining whether the registrant information is the same person information manually or visually. That is, the administrator can perform name identification more efficiently and accurately. Further, it is possible to prevent a plurality of registrant information of the same person from being registered (duplicate registration) in the unified registrant information database.

本発明を実施するための最良の形態である重複可能性者検出装置の構成および重複可能性者検出方法について図1〜図3を用いて説明する。   The configuration of a duplication potential person detection device and the duplication possibility person detection method which are the best mode for carrying out the present invention will be described with reference to FIGS.

図1は、本発明の実施の形態である重複可能性者検出装置を含む重複可能性者検出システムの構成を示したブロック図である。
図2は、図1の重複可能性者検出装置の処理手順を示したフローチャートである。
図3は、図1の重複可能性者検出装置が登録者情報を作成する手順を概念的に説明した図である。
FIG. 1 is a block diagram showing a configuration of a duplication potential person detection system including a duplication possibility person detection device according to an embodiment of the present invention.
FIG. 2 is a flowchart showing a processing procedure of the duplication possibility person detecting device of FIG.
FIG. 3 is a diagram conceptually illustrating a procedure in which the duplication possibility person detecting device of FIG. 1 creates registrant information.

図1および図3に示すように、本発明の実施の形態である重複可能性者検出システムは、各市町村の登録者情報(住民記録および住民記録以外の情報)を格納する登録者情報記憶部201A〜201Cと、各市町村において登録している印鑑情報を格納する印鑑情報記憶部202A〜202Cと、ネットワーク3を介して登録者情報と印鑑情報を取得し、この登録者情報に含まれる登録者識別情報(氏名・生年月日)や印鑑情報を参照して、同一人物である可能性の高い登録者情報を検出する重複可能性者検出装置100とを含んで構成される。ネットワーク3は、インターネットに代表されるIPネットワークであっても良いし、LAN(Local Area Network)であってもよく、無線/有線は問わない。   As shown in FIGS. 1 and 3, the duplication possibility person detection system according to the embodiment of the present invention is a registrant information storage unit that stores registrant information (information other than resident records and resident records) of each municipality. 201A to 201C, seal stamp information storage units 202A to 202C for storing seal stamp information registered in each municipality, and registrant information and seal stamp information are acquired via the network 3, and the registrant included in this registrant information Referring to identification information (name / birth date) and seal information, it includes a duplication potential person detection device 100 that detects registrant information that is likely to be the same person. The network 3 may be an IP network represented by the Internet, or a LAN (Local Area Network), and may be wireless or wired.

まず、登録者情報記憶部201A〜201Cを説明する。ここでは、図3を用いてA市の登録者情報記憶部201Aを例として説明する。
図3(a)に示すように、登録者情報記憶部201Aは、A市の登録者情報としてA市の住民記録と、A市の住民ではない者の情報(住民記録以外の情報)とを格納する。ここで、住民記録以外の情報とは、例えば、A市に土地や建物等の固定資産を所有する者の情報や、過去にA市に住んでいた者に関する情報(履歴)等である。
First, the registrant information storage units 201A to 201C will be described. Here, the registrant information storage unit 201A in A city will be described as an example with reference to FIG.
As shown in FIG. 3A, the registrant information storage unit 201A stores resident records of A city as registrant information of A city and information (information other than resident records) of persons who are not residents of A city. Store. Here, the information other than the resident record is, for example, information on a person who owns fixed assets such as land and buildings in A city, information (history) about a person who has lived in A city in the past, and the like.

住民記録は、図3(b)に例示されるように、各市町村における個人番号、氏名、生年月日等の情報を含んで構成される。このほか、住所や電話番号の情報を含んでも良い。
また、住民記録以外の情報は、図3(c)に例示されるように、市町村の個人番号、氏名、生年月日等の項目を含んで構成される。例えば、この情報が固定資産に関する情報である場合、資産の場所(所在地)の情報を含んでいても良いし、この情報が既にA市から転出した者に関する情報(履歴)である場合には、A市に住んでいたときの住所や、既にA市から転出した者に関する情報(履歴)であることを示すフラグを含んで構成しても良い。
印鑑情報は、図3(d)に例示されるように、各市町村の個人番号(登録者の識別情報)、印鑑番号(印鑑情報の識別情報)、印影情報(イメージデータ)を含んで構成される。印鑑情報は、このほか、印鑑登録者の氏名や住所の情報やA市から転出した者の印鑑情報(履歴)を含んでいても良い。
As illustrated in FIG. 3B, the resident record includes information such as personal number, name, date of birth, etc. in each municipality. In addition, information on an address and a telephone number may be included.
The information other than the resident record includes items such as the personal number, name, date of birth, and the like of the municipality as illustrated in FIG. For example, when this information is information on fixed assets, it may include information on the location (location) of the asset, and when this information is information (history) on a person who has already moved out of A city, You may comprise including the flag which shows that it is the information (history) regarding the address when living in A city, and the person who has already moved out of A city.
As illustrated in FIG. 3D, the seal stamp information includes a personal number (identification information of the registrant), seal number (identification information of the seal information), and seal impression information (image data) of each municipality. The In addition, the seal information may include information on the name and address of the seal registrant and seal information (history) of the person transferred from A city.

重複可能性者検出装置100は、ネットワーク3を介して、登録者情報記憶部201A〜201Cから登録者情報として住民記録および住民記録以外の情報を取得し、印鑑情報記憶部202A〜202Cから印鑑情報を取得する。そして、登録者情報に含まれる登録者識別情報(氏名・生年月日)や印鑑情報に含まれる印影情報を参照して、同一人物である可能性の高い登録者情報を検出する機能を有する。   The duplication possibility person detecting device 100 acquires information other than resident records and resident records as registrant information from the registrant information storage units 201A to 201C via the network 3, and seal information from the seal information storage units 202A to 202C. To get. And it has the function to detect the registrant information with high possibility of being the same person with reference to the registrant identification information (name and date of birth) included in the registrant information and the seal imprint information included in the seal stamp information.

重複可能性者検出装置100は、ネットワーク3を介して、登録者情報記憶部201A〜201Cから各市町村の登録者情報(住民記録および住民記録以外の情報)を取得し、印鑑情報記憶部202A〜202Cから印鑑情報を取得するデータ取得部110、取得された登録者情報の登録者識別情報と印影情報に基づいて重複可能性のある(同一人物の登録者情報である可能性のある)登録者情報を検出(分別)する処理部120、処理部120で検出(分別)された登録者情報を格納する記憶部130、記憶部130に格納された情報を出力する出力部140、および処理部120へ各種情報を入力する入力部150を含んで構成される。
ここで、出力部140は、モニタ等で構成され、入力部150はキーボードやマウス等で構成される。
The duplication possibility person detecting device 100 acquires registrant information (information other than the resident record and the resident record) of each municipality from the registrant information storage units 201A to 201C via the network 3, and the seal stamp information storage units 202A to 202A Data acquisition unit 110 that acquires seal information from 202C, a registrant who may overlap based on registrant identification information and seal imprint information of the acquired registrant information (possibly registrant information of the same person) A processing unit 120 that detects (sorts) information, a storage unit 130 that stores registrant information detected (separated) by the processing unit 120, an output unit 140 that outputs information stored in the storage unit 130, and a processing unit 120 It includes an input unit 150 for inputting various information.
Here, the output unit 140 includes a monitor or the like, and the input unit 150 includes a keyboard or a mouse.

処理部120は、CPUやメモリ等から構成され、データ取得部110から取得された登録者情報の登録者識別情報と印影情報に基づいて重複可能性のある(同一人物の登録者情報である可能性のある)登録者情報を検出(分別)する機能を有する。
したがって、処理部120は、データ取得部110を介して取得した印鑑情報のなかから印影情報が同じ(または類似・近似する)印鑑情報を特定する印影情報マッチング部121と、同じくデータ取得部110を介して取得した登録者情報のうち登録者識別情報(氏名・生年月日や個人番号)が同じである登録者情報を特定して重複可能性者を検出する識別情報マッチング部122とを含んで構成される。
印影情報マッチング部121および識別情報マッチング部122の処理手順の詳細は、後記する重複可能性者検出装置100の処理手順の項で説明する。
The processing unit 120 includes a CPU, a memory, and the like, and may be duplicated based on the registrant identification information and seal imprint information of the registrant information acquired from the data acquisition unit 110 (can be registrant information of the same person). It has a function to detect (separate) registrant information.
Therefore, the processing unit 120 includes the seal stamp information matching unit 121 that specifies seal information having the same (or similar / similar) seal stamp information from the seal stamp information acquired via the data acquisition unit 110, and the data acquisition unit 110. An identification information matching unit 122 that identifies registrant information having the same registrant identification information (name, date of birth, and personal number) among the registrant information acquired via the ID and detects a potential duplicate person. Composed.
Details of processing procedures of the seal imprint information matching unit 121 and the identification information matching unit 122 will be described in the section of processing procedure of the duplication possibility person detecting device 100 described later.

記憶部130は、処理部120で処理された登録者情報のうち、重複可能性のある登録者情報を格納する重複登録可能性者情報記憶部131と、データ取得部110で取得した登録者情報から重複可能性のある登録者情報を除いた登録者情報を記憶する登録者情報記憶部132とを含んで構成される。   The storage unit 130 includes a registrant information stored in the duplication registrant information stored in the data acquisition unit 110, and a registrant information acquired in the data acquisition unit 110. And a registrant information storage unit 132 that stores registrant information excluding registrant information that may be duplicated.

重複登録可能性者情報記憶部131には、1)氏名・生年月日・印影情報が同じである登録者情報、2)氏名・生年月日が同じである登録者情報、3)印影情報のみが同じである登録者情報の三種類の情報が格納される。   In the duplicate registration possibility person information storage unit 131, 1) registrant information with the same name / birth date / imprint information, 2) registrant information with the same name / birth date, 3) only imprint information Three types of information of registrant information with the same are stored.

重複登録可能性者情報記憶部131に格納される登録者情報は、1)氏名・生年月日・印影情報が同じである登録者情報については、各市町村の個人番号、印鑑番号、氏名、生年月日等の項目(情報)で構成され、2)氏名・生年月日が同じである登録者情報については、各市町村の個人番号、氏名、生年月日等の項目(情報)で構成され、3)印影情報のみが同じである登録者情報については、個人番号、印鑑番号等の項目(情報)を含んで構成される。
なお、2)氏名・生年月日が同じである登録者情報とは、氏名・生年月日は同じだが、印影情報は異なる登録者情報のほか、対応する印鑑情報そのものが無い(印鑑登録をしていない)登録者情報も含まれる。
重複登録可能性者情報記憶部131に格納される重複可能性者情報の詳細については、後記する重複可能性者検出装置100の処理手順の項で説明する。
The registrant information stored in the duplicate registration possibility person information storage unit 131 is as follows: 1) For registrant information with the same name, date of birth, and seal information, the personal number, seal number, name, and year of birth of each municipality It consists of items (information) such as date and time. 2) For registrant information with the same name and date of birth, it consists of items (information) such as individual number, name, and date of birth of each municipality. 3) Registrant information in which only the seal stamp information is the same includes items (information) such as personal numbers and seal numbers.
In addition, 2) Registrant information with the same name and date of birth is the same as the name and date of birth, but the imprint information is different from the registrant information, and there is no corresponding seal information itself (Registrant information) is also included.
The details of the duplication possibility person information stored in the duplication registration possibility person information storage unit 131 will be described in the section of the processing procedure of the duplication possibility person detection device 100 described later.

登録者情報記憶部132は、前記したとおり、データ取得部110で取得した登録者情報から重複可能性のある登録者情報を除いた情報を記憶する機能を有する。   As described above, the registrant information storage unit 132 has a function of storing information obtained by removing registrant information that may be duplicated from the registrant information acquired by the data acquisition unit 110.

次に、図2のフローチャートを用いて、重複可能性者検出装置100の重複可能性者検出の処理手順を説明する。
ここでは、図1、図3を適宜参照しつつ、A市、B町、C村の登録者情報を統合する場合を例として説明する。
Next, the processing procedure of the duplication possibility person detection of the duplication possibility person detection apparatus 100 is demonstrated using the flowchart of FIG.
Here, the case where registrant information of A city, B town, and C village is integrated will be described as an example with reference to FIGS. 1 and 3 as appropriate.

(ステップS101)
ステップS101では、重複可能性者検出装置100のデータ取得部110が、ネットワーク3を介して登録者情報記憶部201A〜201CからA市、B町、C村の登録者情報(住民記録および住民記録以外の情報)を取得し、印鑑情報記憶部202A〜202CからA市、B町、C村の印鑑情報を取得し、これらの情報を処理部120へ出力する。
(Step S101)
In step S101, the data acquisition unit 110 of the duplication possibility person detecting device 100 performs registration information (resident record and resident record) of A city, B town, and C village from the registrant information storage units 201A to 201C via the network 3. Information) is acquired, stamp information of A city, B town, and C village is acquired from the seal information storage units 202A to 202C, and these information is output to the processing unit 120.

ここで、データ取得部110は、取得した登録者情報を処理部120が処理可能なフォーマットに変換するものとする。このようにすることで、取得した登録者情報のフォーマット(レイアウト)が異なる場合も、処理部120でマッチング(同定処理)をしやすくなる。   Here, the data acquisition unit 110 converts the acquired registrant information into a format that can be processed by the processing unit 120. In this way, even when the format (layout) of the acquired registrant information is different, the processing unit 120 can easily perform matching (identification processing).

(ステップS102)
ステップS102では、処理部120が、ステップS101で取得したA市、B町、C村の登録者情報(住民記録および住民記録以外の情報)と印鑑情報を取得する。そして、各市町村の登録者情報ごとに重複可能性者を検出し、各市町村ごとに登録者情報の名寄せを行う。
なお、ここで名寄せとは、同一人物についての複数の登録者情報があるとき、人物ごとにこの情報をまとめることをいう。
(Step S102)
In step S102, the processing unit 120 acquires registrant information (information other than resident records and resident records) and seal information of A city, B town, and C village acquired in step S101. And a duplication possibility person is detected for every registrant information of each municipality, and registrant information is collated for every municipality.
Here, name identification means that when there is a plurality of registrant information for the same person, this information is collected for each person.

例えば、図3に示されるように、処理部120の識別情報マッチング部122で、A市の登録者情報の住民記録と住民記録以外の情報とで重複可能性者を検出し、名寄せを行い、住民記録と住民記録以外の情報とを統合した登録者情報(図3(e)参照)を作成する。
具体的には、A市の住民記録と住民記録以外の情報とで、それぞれの個人番号または氏名・生年月日でマッチングを行い、同一人物の登録者情報の情報を特定し、同一人物の登録者情報のまとめ(名寄せ)を行い、住民記録と住民記録以外の情報とを統合した登録者情報を作成する。
同様に、B町、C村の登録者情報についても、それぞれ住民記録と住民記録以外の情報とを統合した登録者情報を作成する。
For example, as shown in FIG. 3, the identification information matching unit 122 of the processing unit 120 detects a duplication possibility person in the resident record of the registrant information of A city and information other than the resident record, performs name identification, The registrant information (see FIG. 3E) is created by integrating the resident record and information other than the resident record.
Specifically, matching is performed by the personal number or name / birth date of each resident record in City A and information other than the resident record, and the information on the registrant information of the same person is specified, and the same person is registered. The registrant information is compiled (name identification) and registrant information is created by integrating the resident record and information other than the resident record.
Similarly, for the registrant information of B town and C village, registrant information is created by integrating the resident record and information other than the resident record.

なお、識別情報マッチング部122は、文字コード変換機能や外字同定機能を持つものとする。このようにすることで、識別情報マッチング部122は、住民記録と住民記録以外の情報に、文字コードが異なる文字情報や、外字等が含まれている場合でも、これらの文字情報についても実質的に同じ文字として登録者情報の同定ができる。   The identification information matching unit 122 has a character code conversion function and an external character identification function. By doing in this way, the identification information matching part 122 is effective also about these character information, even when character information in which character codes differ, an external character, etc. are contained in information other than a resident record and a resident record. The registrant information can be identified as the same character.

(ステップS103)
ステップS103では、識別情報マッチング部122が、ステップS102で作成したA市、B町、C村の登録者情報から氏名・生年月日が同じである情報を検索する。すなわち、識別情報マッチング部122が、登録者情報から重複可能性のある(同一人物である可能性が高い)情報を特定する。そして、重複可能性者(氏名・生年月日)の情報を作成する。
以下の表1は、重複可能性者(氏名・生年月日)の情報を例示した表である。
(Step S103)
In step S103, the identification information matching unit 122 searches the registrant information of A city, B town, and C village created in step S102 for information having the same name and date of birth. That is, the identification information matching unit 122 identifies information that may be duplicated (highly likely to be the same person) from the registrant information. Then, information on the possibility of duplication (name and date of birth) is created.
Table 1 below is a table exemplifying information on the possibility of duplication (name and date of birth).

Figure 2005135064
Figure 2005135064

表1に例示されるように、重複可能性者(氏名・生年月日)の情報は、各市町村の個人番号、氏名、生年月日等の情報で構成される。
例えば、表1の例の場合、氏名「IIII」、生年月日「JJJJ」で共通する登録者情報として、A市の個人番号が「GGGG」という登録者情報と、B町の個人番号が「HHHH」という登録者情報があることを示している。
As exemplified in Table 1, the information on the possibility of duplication (name / birth date) includes information such as the personal number, name, date of birth, etc. of each municipality.
For example, in the case of the example in Table 1, as registrant information common to the name “IIII” and the date of birth “JJJJ”, the registrant information whose personal number in City A is “GGGG” and the personal number in Town B is “ This indicates that there is registrant information “HHHH”.

(ステップS104)
ステップS104では、処理部120の印影情報マッチング部121が、ステップ101で取得した印鑑情報(ここでは、A市、B町、C村の印鑑情報)から、印影情報が同じである(または類似・近似する)印鑑情報を検索する。すなわち、印影情報マッチング部121が、取得した印鑑情報から重複可能性のある(同一人物の印鑑情報である可能性が高い)情報を特定し、重複可能性者(印影)の情報を作成する。そして、この情報を、記憶部130の重複登録可能性者情報記憶部131に格納させる。
以下の表2は、印影情報マッチング部121が作成する重複可能性者(印影)の情報を例示した表である。
(Step S104)
In step S104, the imprint information matching unit 121 of the processing unit 120 has the same imprint information from the stamp information acquired in step 101 (here, the seal information of A city, B town, and C village) (or similar / Search for seal stamp information (approximate). In other words, the imprint information matching unit 121 identifies information that may be duplicated (highly likely to be stamp information of the same person) from the acquired seal stamp information, and creates information on the possibility of duplication (imprint). Then, this information is stored in the duplication registration possibility person information storage unit 131 of the storage unit 130.
Table 2 below is a table exemplifying information on the possibility of duplication (imprint) created by the imprint information matching unit 121.

Figure 2005135064
Figure 2005135064

表2に例示されるように、重複可能性者(印影)の情報は、各市町村の個人番号、印鑑番号等の情報で構成される。
例えば、表2の例の場合、印影情報が同じである印鑑情報として、A市の個人番号が「GGGG」でA市の印鑑番号が「KKKK」である印鑑情報と、B町の個人番号が「HHHH」でB町の印鑑番号が「LLLL」という印鑑情報があることを示している。
As illustrated in Table 2, the information on the possibility of duplication (imprint) is composed of information such as the personal number and seal number of each municipality.
For example, in the case of the example in Table 2, as the seal stamp information having the same seal information, the stamp information with the city A personal number “GGGG” and the city A stamp number “KKKK”, and the city B personal number “HHHH” indicates that there is seal information in which the stamp number of town B is “LLLL”.

そして、この特定された印鑑情報に含まれる登録者識別情報(市町村の個人番号や氏名・生年月日)は、識別情報マッチング部122へ出力される。   Then, the registrant identification information (personal number or name / birth date of the municipality) included in the specified seal information is output to the identification information matching unit 122.

なお、印影情報マッチング部121は、重複可能性者検出装置100が取得した印鑑情報の印影情報の解像度が異なる場合でも、印影情報が同じであるか否かの判断を行えるよう、取得した印鑑情報に含まれる印影情報の解像度を統一してから、印影情報が同じか否かの判断(マッチング)を行うようにしても良い。   The imprint information matching unit 121 obtains the stamp information so that it can be determined whether the imprint information is the same even when the resolution of the imprint information of the seal information acquired by the duplication possibility person detecting device 100 is different. It is also possible to determine (matching) whether or not the imprint information is the same after unifying the resolution of the imprint information included in.

(ステップS105)
ステップS105では、識別情報マッチング部122は、ステップ103で特定(作成)された重複可能性者の登録者情報(氏名・生年月日)の中から、ステップ104で特定された印鑑情報の市町村の個人番号(登録者識別情報)と同じ市町村の個人番号を持つ登録者情報を特定し、この登録者情報を重複している可能性のある登録者情報として検出する。そして、識別情報マッチング部122は、重複可能性者の登録者情報(氏名・生年月日・印影)の情報を作成する。
以下の表3は、印影情報マッチング部121が作成する重複可能性者(氏名・生年月日・印影)の情報を例示した表である。
(Step S105)
In step S105, the identification information matching unit 122 identifies the municipality of the seal information specified in step 104 from the registrant information (name / birth date) of the duplication potential person specified (created) in step 103. The registrant information having the same municipality personal number as the personal number (registrant identification information) is specified, and this registrant information is detected as registrant information that may be duplicated. And the identification information matching part 122 produces the information of the registrant information (name, date of birth, seal) of a possibility duplicate person.
Table 3 below is an example of information on the possibility of duplication (name, date of birth, seal) created by the seal imprint information matching unit 121.

Figure 2005135064
Figure 2005135064

表3に例示されるように、重複可能性者(氏名・生年月日・印影)の情報は、各市町村の個人番号等の情報で構成される。
例えば、表3の例の場合、氏名「IIII」、生年月日「JJJJ」で共通し、印影情報も共通する登録者情報として、A市の個人番号が「GGGG」でA市の印鑑番号は「KKKK」である登録者情報と、B町の個人番号が「HHHH」でB町の印鑑番号は「LLLL」である登録者情報があることを示している。
As illustrated in Table 3, the information on the possibility of duplication (name, date of birth, seal) is composed of information such as the personal number of each municipality.
For example, in the case of Table 3, as the registrant information that is common to the name “IIII”, the date of birth “JJJJ”, and the seal information, the city A personal number is “GGGG” and the city A seal number is It shows that there is registrant information with “KKKK” and registrant information with the personal number of B town “HHHH” and the seal number of B town “LLLL”.

識別情報マッチング部122は、ステップS103で作成された重複可能性者(氏名・生年月日)の情報(登録者情報)を、1)氏名・生年月日・印影情報が同じである登録者情報と、2)氏名・生年月日が同じである登録者情報とに分け、それぞれの情報を記憶部130の重複登録可能性者情報記憶部131に格納させる。
氏名・生年月日が同じである登録者情報とは、前記したとおり、印鑑情報の印影情報が異なる場合のほか、対応する印鑑情報が無い場合(対応する印鑑を登録していない場合)も含まれる。
The identification information matching unit 122 uses the information (registrant information) of the possibility of duplication (name / birth date) created in step S103 as 1) registrant information with the same name / birth date / imprint information. 2) The information is divided into registrant information having the same name and date of birth, and each information is stored in the duplicate registration possibility person information storage unit 131 of the storage unit 130.
Registrant information with the same name and date of birth includes the case where the seal information of the seal information is different as described above, as well as the case where there is no corresponding seal information (when the corresponding seal is not registered). It is.

なお、ここでは、重複可能性者(氏名・生年月日)の登録者情報を、1)氏名・生年月日・印影情報が同じである登録者情報と、2)氏名・生年月日が同じである登録者情報とに分けて格納することとしたが、単に重複可能性者の登録者情報(氏名・生年月日)を1)→2)の順に並べ替えて格納するようにしても良い。   In addition, here, the registrant information of the person who has the possibility of duplication (name / date of birth) is the same as 1) the registrant information with the same name / date of birth / imprint information, and 2) the name / date of birth is the same. The registrant information is stored separately. However, the registrant information (name / birth date) of potential duplicates may be stored in the order of 1) → 2). .

このようにして検出された氏名・生年月日・印影情報が同じである登録者情報は、同一人物の情報である可能性が極めて高い登録者情報であると考えられる。したがって、登録者情報の管理者は、本実施の形態の重複可能性者検出装置100により検出された氏名・生年月日・印影情報が同じである登録者情報(重複可能性者情報)のみについて詳細な調査を行ったり、ほかの登録者情報よりも優先的に調査したりすることで同一人物の登録者情報の検出、名寄せを効率的に行うことができる。   Registrant information with the same name, date of birth, and seal imprint information detected in this way is considered to be registrant information that is very likely to be information of the same person. Therefore, the administrator of the registrant information only applies to registrant information (duplicate potential person information) having the same name, date of birth, and seal imprint information detected by the duplication possibility person detection device 100 of the present embodiment. By conducting a detailed survey or conducting a survey with priority over other registrant information, it is possible to efficiently detect and identify the registrant information of the same person.

さらに、同一人物である可能性の高い登録者情報に含まれる情報(例えば、氏名・生年月日、印影情報のほかに同一人物である可能性の高い登録者情報に共通する項目等)は、登録者情報管理者が、登録者情報から重複可能性のある登録者情報の検出を行う際のフィルタリングパラメータとして活用しても良い。
このような方法は、特に、多数の市町村の合併や、大規模な市町村の合併等多数の登録者情報の名寄せ(重複可能性者検出)が必要とされる場合に有効である。
In addition, information included in registrant information that is likely to be the same person (for example, items common to registrant information that is likely to be the same person in addition to name, date of birth, seal information, etc.) The registrant information manager may use it as a filtering parameter when detecting registrant information that may be duplicated from the registrant information.
Such a method is particularly effective when it is necessary to collate a large number of registrant information (detection of potential duplicates) such as a merger of many municipalities or a large-scale merger of municipalities.

また、本実施の形態では、登録者情報は市町村の登録者情報として説明したが、本発明はこれに限定されず広く応用可能である。
例えば、登録者情報は、銀行等の口座所持者の情報であり、印鑑情報は口座を開設する際に登録した印鑑(またはサイン)であっても良い。また、登録者情報は自然人を対象として説明したが、法人であっても良い。さらに、登録者情報に含まれる氏名(または法人名)は、現在の氏名のみならず過去の氏名(旧姓や旧法人名)が含まれていても良い。このようにすることで、氏名(姓)や法人名に変更があった場合でも、より正確に同じ人物(法人)の特定を行うことができる。
Further, in the present embodiment, the registrant information has been described as registrant information of municipalities, but the present invention is not limited to this and can be widely applied.
For example, the registrant information may be information of an account holder such as a bank, and the seal information may be a seal (or signature) registered when an account is opened. Further, the registrant information has been described for natural persons, but may be a corporation. Furthermore, the name (or corporate name) included in the registrant information may include not only the current name but also a past name (former name or old corporate name). By doing in this way, even when a full name (last name) or a corporate name is changed, the same person (corporate) can be specified more accurately.

なお、本発明の実施の形態に係る重複可能性者検出装置は、コンピュータ及びプログラムによって実現することができ、そのプログラムをコンピュータによる読み取り可能な記録媒体に記録することでその記録媒体によって提供することが可能である。また、そのプログラムを、ネットワークを通して提供することも可能である。
ここでいうコンピュータシステムとは、OS(Operating System)等のソフトウエアや周辺機器等のハードウエアを含むものである。
The duplication possibility person detecting device according to the embodiment of the present invention can be realized by a computer and a program, and provided by recording the program on a computer-readable recording medium. Is possible. It is also possible to provide the program through a network.
The computer system here includes software such as an OS (Operating System) and hardware such as peripheral devices.

本発明の実施の形態である重複可能性者検出システムの構成を示したブロック図である。It is the block diagram which showed the structure of the duplication possibility detection system which is embodiment of this invention. 図1の重複可能性者検出装置の処理手順を示したフローチャートである。It is the flowchart which showed the process sequence of the duplication possibility person detection apparatus of FIG. 図1の重複可能性者検出装置が登録者情報を作成する処理手順を概念的に説明した図である。It is the figure which conceptually demonstrated the process sequence which the duplication possibility person detection apparatus of FIG. 1 produces registrant information.

符号の説明Explanation of symbols

3 ネットワーク
100 重複可能性者検出装置
110 データ取得部
120 処理部
121 印影情報マッチング部
122 識別情報マッチング部(重複可能性者検出部)
130 記憶部
131 重複登録可能性者情報記憶部
132 登録者情報記憶部
140 出力部
150 入力部
201A 登録者情報記憶部
202A 印鑑情報記憶部
3 Network 100 Duplicate Person Detection Device 110 Data Acquisition Unit 120 Processing Unit 121 Imprint Information Matching Unit 122 Identification Information Matching Unit (Duplicate Person Detection Unit)
DESCRIPTION OF SYMBOLS 130 Storage part 131 Duplicate registration possibility person information storage part 132 Registrant information storage part 140 Output part 150 Input part 201A Registrant information storage part 202A Seal information storage part

Claims (5)

登録者の識別情報を含む登録者情報と、登録者の印影情報を含む印鑑情報に関して、複数の登録者情報のなかから、重複可能性のある登録者情報を検出する重複可能性者検出装置であって、
ネットワークを介して、前記登録者情報および印鑑情報を取得する取得部、
前記取得した印鑑情報のうち、前記印影情報が同じである印鑑情報を特定する印影情報マッチング部、
前記取得した登録者情報のうち、前記識別情報が同じである登録者情報を特定する識別情報マッチング部、
前記特定した印鑑情報の印影情報と前記特定した登録者情報の識別情報に基づき、前記取得した登録者情報のなかから、重複の可能性のある登録者情報を検出する重複可能性者検出部、
前記検出した重複の可能性のある登録者情報を格納する記憶部、
を含んで構成されることを特徴とする識別情報と印影情報に基づく重複可能性者検出装置。
A duplicating potential person detection device that detects duplicative registrant information from among a plurality of registrant information regarding registrant information including identification information of the registrant and seal stamp information including imprint information of the registrant. There,
An obtaining unit for obtaining the registrant information and the seal information via a network;
Among the acquired seal stamp information, the seal stamp information matching unit for specifying seal stamp information in which the seal stamp information is the same,
Among the acquired registrant information, an identification information matching unit that identifies registrant information having the same identification information,
Based on the imprint information of the specified seal information and the identification information of the specified registrant information, from the acquired registrant information, a duplication possibility person detection unit that detects registrant information that may be duplicated,
A storage unit for storing the detected registrant information that may be duplicated,
The duplication possibility person detection device based on the identification information and the seal imprint information characterized by comprising.
前記登録者の識別情報は、登録者の氏名および生年月日を含み、
前記取得した登録者情報から、前記検出された重複可能性のある登録者情報を除いた登録者情報を記憶する登録者情報記憶部
をさらに含んで構成されることを特徴とする請求項1に記載の重複可能性者検出装置。
The registrant identification information includes the registrant's name and date of birth,
The registrant information storage part which memorize | stores the registrant information which remove | excluded the detected registrant information with the possibility of duplication from the acquired registrant information is further comprised, The structure characterized by the above-mentioned. The duplication possibility person detection apparatus of description.
請求項1または請求項2に記載の重複可能性者検出装置を用いた重複の可能性のある登録者情報の検出方法であって、
前記データ取得部が、ネットワークを介して、前記登録者情報および前記印鑑情報を取得するステップ、
前記印影情報マッチング部が、前記取得した登録者情報のなかから、印影情報が同じである印鑑情報を特定するステップ、
前記識別情報マッチング部が、前記取得した登録者情報のなかから、前記識別情報が同じである登録者情報を特定するステップ、
前記重複可能性者検出部が、前記特定した登録者情報と、前記特定された印鑑情報に基づき、前記取得された登録者情報のなかから、重複の可能性のある登録者情報を検出するステップ、
前記重複可能性者情報記憶部が、前記検出した重複可能性のある登録者情報を格納するステップ、
を含むことを特徴とする印影情報による重複可能性者検出方法。
A method for detecting registrant information with a possibility of duplication using the duplication possibility person detecting device according to claim 1 or 2,
The data obtaining unit obtaining the registrant information and the seal information via a network;
The stamp information matching unit identifying seal information having the same seal information from the acquired registrant information;
The identification information matching unit identifying registrant information having the same identification information from the acquired registrant information;
The duplication possibility person detection unit detects registrant information with a possibility of duplication from the obtained registrant information based on the identified registrant information and the identified seal information. ,
The duplication possibility person information storage part stores the detected registrant information with the possibility of duplication;
The duplication possibility person detection method by the imprint information characterized by including this.
請求項1または請求項2に記載の重複可能性者検出装置を用いた重複の可能性のある登録者情報の検出用プログラムであって、
コンピュータに、
前記データ取得部として、ネットワークを介して、前記登録者情報および前記印鑑情報を取得させるステップ、
前記印影情報マッチング部として、前記取得された登録者情報のなかから、印影情報が同じである印鑑情報を特定させるステップ、
前記識別情報マッチング部として、前記取得された登録者情報のなかから、前記識別情報が同じである登録者情報を特定させるステップ、
前記重複可能性者検出部として、前記特定された登録者情報と、前記特定された印鑑情報に基づき、前記取得された登録者情報のなかから、重複の可能性のある登録者情報を検出させるステップ、
前記重複可能性者情報記憶部として、前記検出された重複可能性のある登録者情報を格納させるステップ、
を実行させることを特徴とする印影情報による重複可能性者検出用プログラム。
A program for detecting registrant information with a possibility of duplication using the duplication possibility person detecting device according to claim 1 or 2,
On the computer,
As the data acquisition unit, the step of acquiring the registrant information and the seal information via a network,
As the imprint information matching unit, from the acquired registrant information, the step of specifying seal stamp information having the same imprint information,
As the identification information matching unit, from among the acquired registrant information, the step of identifying registrant information having the same identification information;
Based on the specified registrant information and the specified seal information, the duplicating person detection unit detects registrant information that may be duplicated from the acquired registrant information. Step,
Storing the detected registrant information with the possibility of duplication as the duplication possibility person information storage unit;
A program for detecting possibility of duplication using seal stamp information.
請求項4に記載の重複可能性者検出用プログラムを記憶した記憶媒体。   The storage medium which memorize | stored the duplication possibility person detection program of Claim 4.
JP2003368587A 2003-10-29 2003-10-29 Duplicate person detection device, duplication person detection method, program, and storage medium storing the program Expired - Fee Related JP4365664B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003368587A JP4365664B2 (en) 2003-10-29 2003-10-29 Duplicate person detection device, duplication person detection method, program, and storage medium storing the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003368587A JP4365664B2 (en) 2003-10-29 2003-10-29 Duplicate person detection device, duplication person detection method, program, and storage medium storing the program

Publications (2)

Publication Number Publication Date
JP2005135064A true JP2005135064A (en) 2005-05-26
JP4365664B2 JP4365664B2 (en) 2009-11-18

Family

ID=34646205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003368587A Expired - Fee Related JP4365664B2 (en) 2003-10-29 2003-10-29 Duplicate person detection device, duplication person detection method, program, and storage medium storing the program

Country Status (1)

Country Link
JP (1) JP4365664B2 (en)

Also Published As

Publication number Publication date
JP4365664B2 (en) 2009-11-18

Similar Documents

Publication Publication Date Title
CN108399240B (en) Enterprise change information data mining method and system
Jin et al. BDcleaner: A workflow for cleaning taxonomic and geographic errors in occurrence data archived in biodiversity databases
JP2005135211A (en) Method and apparatus for managing document
Christen et al. A probabilistic geocoding system based on a national address file
JP2005011049A (en) Database integration device
CN111899822A (en) Medical institution database construction method, query method, device, equipment and medium
JP2007114836A (en) Information processor, control method for the same and control program
US20110289086A1 (en) System, method and apparatus for data analysis
JPH11184884A (en) System for judging the same person and method therefor
CN110968584B (en) Portrait generation system, method, electronic device and readable storage medium
JP4365664B2 (en) Duplicate person detection device, duplication person detection method, program, and storage medium storing the program
KR20000058924A (en) System for serving information of genealogy on internet and its method of providing the service
CN108388610B (en) Data ETL processing method and device
CN110543457A (en) Track type document processing method and device, storage medium and electronic device
Christen et al. A probabilistic geocoding system utilising a parcel based address file
JP2015079403A (en) Creating method of test data, system and program
TWM613338U (en) Medical Order Information Retrieval System
JP6875768B1 (en) Home care matching system
CN113626536A (en) News geocoding method based on deep learning
JP6791830B2 (en) Information processing equipment, information processing methods, and programs
JP2003223459A (en) Managing method for address information
JP2019175141A (en) Photographed image classification device
Ng et al. Geographical Dimension of Colonial Justice: Using GIS in Research on Law and History
Barboi et al. Client registries: identifying and linking patients
JP2003317075A (en) Processor and method for masking electronized document

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090818

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090821

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4365664

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees