JPH1078953A - Address notation conversion and check method - Google Patents

Address notation conversion and check method

Info

Publication number
JPH1078953A
JPH1078953A JP8231533A JP23153396A JPH1078953A JP H1078953 A JPH1078953 A JP H1078953A JP 8231533 A JP8231533 A JP 8231533A JP 23153396 A JP23153396 A JP 23153396A JP H1078953 A JPH1078953 A JP H1078953A
Authority
JP
Japan
Prior art keywords
information
address
notation
numeral
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8231533A
Other languages
Japanese (ja)
Inventor
Shinji Omura
真二 大村
Toshiya Suzuki
敏哉 鈴木
Akitoshi Sakamoto
晃敏 坂本
Akiko Kikuchi
章子 菊池
Naosato Kaneko
尚里 金子
Ikuko Shimanoe
郁子 島ノ江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP8231533A priority Critical patent/JPH1078953A/en
Publication of JPH1078953A publication Critical patent/JPH1078953A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an address notation conversion method which can prevent the deterioration in conversion accuracy that is caused by the input method by converting automatically the Chinese numeric character data into the Arabic numeral notation and also to provide an address notation check method which checks whether the address notation is correct or not. SOLUTION: The address data inputted via a keyboard are fetched in the form of a Chinese numeric character notation (201). The Arabic numeral conversion is successively processed from the final character through the head character of the input data. Under such conditions, the house number information serves as a keyword for retrieval (202). When the keyword is coincident with the house number information, the Chinese numeric characters preceding the house number information are recognized and extracted as a character string to be converted (203). Then the notation conversion processing is carried out (204). The notation check is carried out according to a fact whether the numeric characters preceding the municipality information have high possibility of errors.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、電子化された日本語文
書データ中の数字表記変換方法に関し、特に、住所番地
表記における漢数字データを算用数字データに変換する
住所表記変換方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for converting digit notation in digitized Japanese document data, and more particularly to a method for converting address notation in address and address notation into arithmetic numeric data.

【0002】[0002]

【従来の技術】近年、ワードプロセッサ(ワープロ)な
どのOA機器が普及し、各種文書を電子化して保存/管
理することが多くなってきている。そのうちの一つとし
て戸籍文書などの電子化がある。戸籍文書などの電子化
において、文書中の住所欄の番地情報を算用数字に統一
する方法として、まず第一に手作業によるものが考えら
れる。これはデータ入力者が戸籍文書中の漢数字を算用
数字に頭の中で変換して入力する従来最も一般的に用い
られている方法である。別の方法として、漢数字と算用
数字の対応関係をテーブルに保持しておき、一方の文字
形式で入力されたものをこのテーブルを参照して他方の
文字形式に一括して変換する方法も知られている。例え
ば、特開昭59−172031号公報には、算用数字を
入力し、数(一・・・九),数位(十,百,千),位
(万,億,兆,・・・)の文字を含めて対応する漢数字
に変換して出力する変換方式が開示されている。
2. Description of the Related Art In recent years, OA devices such as word processors (word processors) have become widespread, and various documents have been electronically stored and managed. One of them is the digitization of family register documents. In digitizing a family register document or the like, as a method of unifying the address information in the address column in the document into an arithmetic numeral, first, a manual method can be considered. This is the most commonly used method in the past, in which a data entry person converts a Chinese numeral in a family register document into an arithmetic numeral in his head and inputs it. Another method is to store the correspondence between Kanji numbers and arithmetic numbers in a table, and convert those entered in one character format to the other character format collectively by referring to this table. Are known. For example, in Japanese Patent Application Laid-Open No. 59-17231, an arithmetic numeral is input, and a number (one ... nine), a digit (ten, hundred, thousand), a digit (ten, hundred, trillion, ...) are input. There is disclosed a conversion method for converting the output to a corresponding Chinese numeral including the character of the character.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、前述の
方法では以下の問題点が存在する。まず、前者のデータ
入力者が予め算用数字に変換して入力する方法は、デー
タ入力者の読み違いや入力のミスが発生しやすく、ま
た、入力処理後の漢数字(原データ)と算用数字(変換
後データ)の突合せ確認にも時間がかかるという問題点
がある。また、後者の漢数字と算用数字の対応関係を表
したテーブルを用いて漢数字を算用数字に一括して変換
する方法は、地番情報(丁目,番,号)だけでなく固有
名詞(例えば、町名)に含まれる漢数字も同時に算用数
字に変換されてしまうという問題点がある。例えば、
「大田区南六郷三丁目弐十一番」の“六郷”は町名であ
るから変換せず「大田区南六郷3丁目21番」のように
変換しなければならないが、テーブルを用いて一括変換
した場合には「大田区南6郷3丁目21番」のように間
違って変換してしまう。本発明は、上記問題点を解消
し、文中より変換対象部分を抽出し単位情報とマッチン
グすることにより、ゼロ記号を含む漢数字データをも正
確に算用数字表記に変換するとともに、入力方法に起因
する変換精度の低下を防ぐことのできる住所表記変換方
法、および住所表記が正しくなされているか否かをチェ
ックする住所表記チェック方法を提供することを目的と
している。
However, the above-mentioned method has the following problems. First, the former method of inputting data by converting the data into an algebraic number in advance is liable to cause misreading or an input error by the data inputter, and also requires the input data to be calculated with the kanji numerals (original data). There is a problem that it takes a long time to check the matching of the numbers for use (data after conversion). In addition, the latter method of converting kanji numbers into math numbers collectively using a table representing the correspondence between kanji numbers and arithmetic numbers is not only a lot number information (chome, number, number) but also a proper noun ( For example, there is a problem that the Chinese numerals included in the street name) are simultaneously converted into arithmetic numerals. For example,
“Rokugo” in “Minami-Rokugo 3-chome, 21-chome, Ota-ku” is a street name, so it must be converted like “3-21, Minami-rokugo, Ota-ku” without conversion. In that case, it will be incorrectly converted as "3-21, Minami 6go, Ota-ku". The present invention solves the above problems, extracts a conversion target portion from a sentence and matches it with unit information, thereby accurately converting Kanji numeric data including a zero symbol into an arithmetic numeric notation, and using an input method. It is an object of the present invention to provide an address notation conversion method capable of preventing a decrease in conversion accuracy caused by the above, and an address notation check method for checking whether or not address notation is correctly performed.

【0004】[0004]

【課題を解決するための手段】本発明は、上記の目的を
達成するために、漢数字データと地番情報(例:丁目,
番,号)のマッチングを行い、変換対象となる漢数字文
字列を抽出すること、漢数字データと単位情報のマッチ
ングを行うことにより、漢数字文字列を自動的に算用数
字化することを特徴としている。さらに詳しくいうと、
本発明の住所表記変換方法は、入力データの最後部文字
より先頭文字方向に先頭文字まで、変換文字列抽出のた
めの地番情報との一致を順次チェックする第1のステッ
プと、該第1のステップのチェックの結果、地番情報と
一致した場合に地番情報の前の漢数字データを抽出する
第2のステップと、該第2のステップで抽出した漢数字
データを算用数字データに変換する第3のステップとを
有すること、さらに前記第2のステップは、地番情報の
前の漢数字データが位を示す単位情報か、ゼロ記号を含
む数字情報かを判定し、単位情報の場合は位に対応する
算用数字桁位置を求め、数字情報の場合は対応する算用
数字に変換するとともに桁位置を一桁上位に進める処理
を漢数字以外の文字が出現するまで繰り返すステップで
あり、前記地番情報は、少なくとも「丁」,「号」,
「番」,「−(ハイフン)」,「棟」,「F」のいずれ
かを含み、前記単位情報は、少なくとも「十」,
「拾」,「百」,「千」,「万」,「億」のいずれかを
含むことを特徴としている。
SUMMARY OF THE INVENTION In order to achieve the above object, the present invention provides kanji numeral data and lot number information (eg, chome,
No., No.), to extract the kanji character string to be converted, and to match the kanji data and unit information to automatically convert the kanji character string into an arithmetic digit. And More specifically,
The address notation conversion method according to the present invention includes: a first step of sequentially checking, from the last character of the input data to the first character in the direction of the first character, matching with the lot number information for extracting the converted character string; A second step of extracting the Chinese numeral data before the lot number information when the result of the step check matches the lot number information; and a second step of converting the Chinese numeral data extracted in the second step into arithmetic numeric data. And the second step includes determining whether the Chinese numeral data preceding the lot number information is unit information indicating a place or numeric information including a zero sign. Calculating a corresponding arithmetic numeral digit position, and in the case of numeric information, converting the digit into the corresponding arithmetic numeral and advancing the digit position one digit higher until a character other than a kanji numeral appears; Emotion Is, at least, "Ding", "No."
The unit information includes at least one of “number”, “− (hyphen)”, “building”, and “F”, and the unit information includes at least “ten”,
It is characterized by including any of “pickup”, “one hundred”, “thousand”, “million”, and “billion”.

【0005】また、本発明の住所表記チェック方法は、
住所データの最後部文字より先頭文字方向に先頭文字ま
で、順次、市区町村情報の前に算用数字があるか否かを
チェックする第1のステップと、該第1のステップのチ
ェックの結果、市区町村情報の前に算用数字がない場合
さらの漢数字があるか否かをチェックする第2のステッ
プと、該第2のステップのチェックの結果、市区町村情
報の前に漢数字がある場合に地名情報との一致をチェッ
クする第3のステップと、前記第1のステップで市区町
村情報の前に算用数字があると判定された場合および前
記第3のステップで地名情報と一致していないと判定さ
れた場合にその住所表記に誤りの可能性が大きい旨の情
報を出力すること、さらに前記市区町村情報は「市」,
「区」,「町」,「村」,「目」,「丁」のいずれかを
含むことを特徴としている。
The address notation checking method of the present invention
A first step of sequentially checking whether there is an algebraic numeral before the municipal information from the last character of the address data to the first character in the first character direction, and a result of the check in the first step A second step of checking whether there is any further Chinese numeral when there is no arithmetic numeral before the municipal information, and as a result of the check in the second step, a Chinese character is added before the municipal information. A third step of checking the coincidence with the place name information when there is a number, and a case where it is determined in the first step that there is an algebraic number before the municipal information, and in the third step, the place name If it is determined that the information does not match the information, the information indicating that the possibility of an error in the address notation is large is output, and the municipal information is “city”,
It is characterized by including any of "ward", "town", "village", "eye", and "cho".

【0006】[0006]

【発明の実施の形態】本発明は、漢数字表記住所の算用
数字化変換を行うとき、漢数字データのまま入力し、変
換対象文字列の抽出を自動的に行う。次に、抽出部分を
変換対象データとして単位情報とのマッチングを行い、
その結果に基づいて算用数字化を行う。この方法によ
り、入力方法及び漢数字データの表記に起因する変換精
度の低下を防ぐことが可能である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS According to the present invention, when performing a digitized conversion of an address in kanji numerals, the kanji numeric data is input as it is, and a character string to be converted is automatically extracted. Next, matching is performed with unit information using the extracted part as data to be converted,
An arithmetic digitization is performed based on the result. With this method, it is possible to prevent a decrease in conversion accuracy due to the input method and the representation of the kanji numeric data.

【0007】以下、本発明による住所表記変換方法の実
施例を図面を参照して説明する。図1は、本発明の住所
表記変換方法の一実施例を実施するための構成例であ
る。同図において、1は漢数字表記の住所を入力するた
めの入力制御部であり、キーボードなどからなる。2は
参照数字化処理部であり、ここで入力制御部1から出力
された入力データを漢数字データから算用数字データに
変換する。3は変換のチェック部であり、正しく算用数
字化しているかチェックする機能を有する。4は出力さ
れる確認用リストであり、町名などの固有名詞部分に漢
数字を含む入力データ(例:五番町、八王子)を出力す
る。
An embodiment of the address notation conversion method according to the present invention will be described below with reference to the drawings. FIG. 1 is a configuration example for implementing an embodiment of the address notation conversion method of the present invention. Referring to FIG. 1, reference numeral 1 denotes an input control unit for inputting an address written in Chinese numerals, and comprises a keyboard and the like. Reference numeral 2 denotes a reference digitization processing unit, which converts input data output from the input control unit 1 from Kanji numeric data to arithmetic numeric data. Reference numeral 3 denotes a conversion check unit, which has a function of checking whether the digitization is performed correctly. Reference numeral 4 denotes a check list to be output, which outputs input data (for example, Gobancho, Hachioji) containing proper Chinese characters in proper nouns such as street names.

【0008】次に、本実施例の動作について説明する。
図2は図1における算用数字化処理部2の動作の流れを
示すフロー図である。まず、キーボードなどの入力制御
部1から入力された住所データを漢数字表記のまま取り
込む(ステップ201)。算用数字化の処理は入力デー
タの最後部文字より先頭文字方向に向かって順次行われ
る。このときの検索のキーワードとなるのは地番情報で
ある(ステップ202)。地番情報としては、例えば図
4(a)に示されているように、丁,号,番,−(ハイ
フン、例えば、「2−46−10」などの表示で使
用),棟,F(階),の(例えば「2の46の10」な
どの表示で使用),・・・などがある。この地番情報と
一致した場合にその地番情報より前の漢数字を変換対象
文字列と認識して抽出し(ステップ203)、表記変換
処理を実行する(ステップ204)。漢数字としては、
例えば図4(b)に示すように、単位情報として「十,
拾,百,千,万,萬」、数字情報として「一,二,三,
四,五,六,七,八,九,壱,弐,参」、記号情報とし
て「○,0」などがある。
Next, the operation of this embodiment will be described.
FIG. 2 is a flowchart showing a flow of the operation of the arithmetic digitization processing unit 2 in FIG. First, address data input from the input control unit 1 such as a keyboard is fetched in Chinese numeral notation (step 201). The arithmetic digitization process is performed sequentially from the last character of the input data toward the first character. The search keyword at this time is the lot number information (step 202). As the lot number information, for example, as shown in FIG. 4 (a), Ding, No., No.,-(used for displaying a hyphen, for example, "2-46-10"), building, F (floor ) (For example, used in the display of “2 of 46 10”),. When it matches with the lot number information, the kanji numeral preceding the lot number information is recognized and extracted as a character string to be converted (step 203), and a notation conversion process is executed (step 204). As Kanji numbers,
For example, as shown in FIG.
Pickup, one hundred, one thousand, ten thousand, ten thousand ", and numerical information of" one, two, three,
4, 5, 6, 6, 7, 8, 9, 1, 2, and 3 "and symbol information such as" O, 0 ".

【0009】図2のステップ203で抽出した地番情報
の前の漢数字が「弐千五拾弐」の場合を例にして図6の
フロー例を具体的に説明する。図7は、図6のフローの
途中におけるワークエリアの状態を示す図である。ま
ず、ステップ601で、ワークエリアを全て0に初期化
しておく(図7(a)参照)。次のステップ602で変
換のための初期化(i=1)を行う。ステップ603で
は、「弐」は漢数字であるからステップ604に進み、
ここでも単位情報でないからステップ605に進む。
「弐」は数字情報であるからステップ607に進み算用
数字「2」に変換してワークエリア(1)に入力する
(図7(b)参照)。次に、i=2に更新し、ステップ
603に戻る。
The flow example of FIG. 6 will be described in detail by taking as an example a case where the Chinese numeral before the lot number information extracted in step 203 of FIG. FIG. 7 is a diagram showing a state of the work area in the middle of the flow of FIG. First, in step 601, the work areas are all initialized to 0 (see FIG. 7A). In the next step 602, initialization for conversion (i = 1) is performed. In step 603, since "Ni" is a Chinese numeral, the process proceeds to step 604,
Here again, the process proceeds to step 605 because the information is not unit information.
Since "2" is numerical information, the process proceeds to step 607, where it is converted into an arithmetic numeral "2" and input to the work area (1) (see FIG. 7B). Next, i is updated to 2 and the process returns to step 603.

【0010】次の「拾」は単位情報(i=2)であるか
らステップ606に進みワークエリア(2)を1とし、
再びステップ603に戻る(図7(c)参照)。次の
「五」は漢数字であり(ステップ603:N)、単位情
報でなく数字情報であるから(ステップ604:N、ス
テップ605:Y)、ステップ607で算用数字「5」
に変換してワークエリア(2)に入力する(前回ステッ
プ606で1にしたものを5に変更する。図7(d)参
照)。ステップ608でiを3にしてステップ603に
戻る。
Since the next "pickup" is unit information (i = 2), the process proceeds to step 606, where the work area (2) is set to 1, and
The process returns to step 603 again (see FIG. 7C). The next “5” is a Chinese numeral (step 603: N) and is not unit information but numerical information (step 604: N, step 605: Y).
And input it to the work area (2) (change from 1 to 1 in the previous step 606 to 5; see FIG. 7D). In step 608, i is set to 3, and the process returns to step 603.

【0011】次の「千」は漢数字(ステップ603:
N)で単位情報(ステップ604:Y、i=4)である
からステップ606でワークエリア(4)を1とする
(図7(e)参照)。なお、このときワークエリア
(3)はステップ601で初期化されたままの値0を保
持している。次の「弐」は、漢数字であり(ステップ6
03:N)、単位情報でなく(ステップ604:N)、
数字情報であるので(ステップ605:Y)、ステップ
607で算用数字「2」に変換してワークエリア(4)
に入力する(前回のステップ606で1にしたものを2
に変更する。図7(f)参照)。以上の結果、地番情報
の前の漢数字「弐千五拾弐」は算用数字「2052」に
変換される。ステップ603の判定で漢数字以外の文字
になったら表記変換処理を終了する。
The next "thousand" is a Chinese numeral (step 603:
N) and the unit information (step 604: Y, i = 4), the work area (4) is set to 1 in step 606 (see FIG. 7E). At this time, the work area (3) holds the value 0 that has been initialized in step 601. The next “Ni” is a Chinese numeral (step 6
03: N), not unit information (step 604: N),
Since it is numerical information (step 605: Y), it is converted to an arithmetic numeral "2" in step 607 and the work area (4)
(To what was set to 1 in the previous step 606 to 2)
Change to FIG. 7 (f)). As a result of the above, the kanji numeral "25,000 Goji" in front of the lot number information is converted into an arithmetic numeral "2052". When it is determined in step 603 that the character is a character other than Chinese numerals, the notation conversion process ends.

【0012】図3は、図1の変換チェック部3の動作の
流れを示すフロー図である。まず、算用数字化処理部で
変換された入力データを読み込む(ステップ301)。
チェックは、入力データの後ろから先頭に向かって行
う。次に、市区町村情報を検索して、市区町村情報より
も前に算用数字があるかチェックする(ステップ30
2)。市区町村情報は、図5(a)に示すように、市,
区,町,村,目,丁からなっている。ステップ302の
チェックの結果、算用数字があれば、出力フラグをたて
(ステップ306)、算用数字がなければ、市区町村情
報よりも前に漢数字がないかをチェックし(ステップ3
03)、前に漢数字がなければ次の市区町村情報の検索
処理を続ける。前に漢数字があれば、地名情報とマッチ
ングを行い(ステップ304)、地名情報と一致した場
合は次の市区町村情報の検索処理を続ける。地名情報と
一致しない場合は、出力フラグをたてる(ステップ30
5)。地名情報は、図5(b)に示すように、地名また
は地名を表わすのによく使用される文字、例えば、街,
番地,地割,千葉,九州,八王子,・・・などからなっ
ている。以上の処理を入力データの最後部文字より先頭
文字方向に向かって先頭文字まで順次行い、先頭文字に
なったら変換チェック処理を終了する(ステップ30
7:Y)。
FIG. 3 is a flowchart showing the flow of the operation of the conversion check unit 3 of FIG. First, the input data converted by the arithmetic digitization processing unit is read (step 301).
The check is performed from the rear of the input data toward the head. Next, the municipal information is searched to check whether there is an algebraic numeral before the municipal information (step 30).
2). As shown in FIG. 5A, the city, town, and village information is
It is made up of wards, towns, villages, eyes, and Ding. As a result of the check in step 302, if there is an arithmetic numeral, an output flag is set (step 306). If there is no arithmetic numeral, it is checked whether there is any Chinese numeral before the municipal information (step 3).
03) If there is no preceding Chinese numeral, the search processing of the next municipal information is continued. If there is a Chinese character before, matching is performed with the place name information (step 304), and if the place number information is matched, the search processing of the next municipal information is continued. If they do not match the place name information, an output flag is set (step 30).
5). The place name information is, as shown in FIG. 5B, a place name or a character often used to represent a place name, for example, a town,
It consists of street address, land split, Chiba, Kyushu, Hachioji, etc. The above processing is sequentially performed from the last character of the input data to the first character in the direction of the first character, and when the first character is reached, the conversion check processing is terminated (step 30).
7: Y).

【0013】変換チェック処理の終了後にステップ30
5および306で出力フラグをたてたデータのみを確認
リストに印刷する(ステップ308)。ステップ305
でフラグがたったものは、算用数字化処理部2で変換さ
れた数字市区町村情報の前にある漢数字が地名情報と一
致していない場合であり、ステップ306でフラグがた
ったものは、市区町村情報の前に算用数字がある場合で
あり、どちらも変換誤りの可能性が大きいと考えられる
場合である。
Step 30 after the end of the conversion check process
Only the data for which the output flag has been set in steps 5 and 306 is printed on the confirmation list (step 308). Step 305
The flag is set when the kanji in front of the numeric city / town / village information converted by the arithmetic digitization processing unit 2 does not match the place name information. This is the case where there is an arithmetic numeral before the municipal information, and in both cases it is considered that the possibility of conversion error is large.

【0014】なお、上記説明では、図3の住所表記チェ
ック方法を、図2の住所表記変換方法によって漢数字表
記から算用数字表記に変換したときの住所表記をチェッ
クする場合を例にしているが、本方法は変換した住所に
限らずもともと算用数字で表記された住所表記のチェッ
クにも利用することが可能である。
In the above description, the case where the address notation check method in FIG. 3 is converted from the kanji numeral notation to the arithmetic numeral notation by the address notation conversion method in FIG. 2 is checked as an example. However, the present method can be used not only for the converted address but also for checking the address notation originally written in arithmetic numerals.

【0015】以上述べたように本実施例によれば、図8
(a)のような住所データ「東京都千代田区平河町弐千
五拾弐番地」だけではなく、同図(b)のようなゼロの
代わりに記号情報(○)を用いた住所データ「東京都千
代田区平河町弐千五○弐番地」でも同図(c)に示すよ
うな算用数字用いた正しい住所データ「東京都千代田区
平河町2052番地」に変換できる。また、本実施例に
よれば、原文の漢数字表記のままの住所データを入力す
るため、入力時に原文と入力データとの突合せ確認の精
度も向上し、確認に要する時間も短くて済む。尚、住所
データの入力方法は、本実施例では原文のまま漢数字デ
ータをキーボードなどを用いて入力しているが、OCR
などで読み込んでもよいことはいうまでもない。
As described above, according to this embodiment, FIG.
Address data "Tokyo, Chiyoda-ku, Niigata-cho, No. 2" as shown in (a) as well as address data "Tokyo using symbol information (O) instead of zero as shown in FIG. Even in the case of “25,000-2, Hirakawa-cho, Chiyoda-ku, Tokyo”, correct address data using arithmetic numerals as shown in FIG. 3C can be converted to “2052, Hirakawa-cho, Chiyoda-ku, Tokyo”. Further, according to the present embodiment, since the address data is input as it is in the original Chinese character notation, the accuracy of the matching check between the original text and the input data at the time of input is improved, and the time required for the checking can be shortened. In this embodiment, the input method of the address data is to input the Chinese numeral data as it is in the original text using a keyboard or the like.
Needless to say, it is also possible to read in such as.

【0016】[0016]

【発明の効果】以上説明したように、本発明の住所表記
変換方法によれば、原文の通り入力すれば自動的に算用
数字化変換が行われるため、データ入力時の人為的なミ
スを著しく減少させる効果がある。また、変換対象文字
列のみを抽出して処理を行うため、算用数字化変換作業
の能率が向上し、データ入力者の負担を軽減する効果が
大である。また、本発明の住所表記チェック方法によれ
ば、誤りの可能性が大きい数字表記を自動的に検出でき
るので、住所表記のチェック作業の能率が大幅に向上す
るという効果がある。
As described above, according to the address notation conversion method of the present invention, if the input is performed as in the original text, the arithmetic digitization conversion is automatically performed. Has the effect of reducing. In addition, since only the character string to be converted is extracted and processed, the efficiency of the arithmetic digitization conversion work is improved, and the effect of reducing the burden on the data input person is great. Further, according to the address notation checking method of the present invention, it is possible to automatically detect a numerical notation having a high possibility of error, so that there is an effect that the efficiency of the address notation checking work is greatly improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の住所表記変換方法の一実施例を実施す
るための構成例である。
FIG. 1 is a configuration example for implementing an embodiment of an address notation conversion method of the present invention.

【図2】図1に示す住所表記変換方法の算用数字化処理
のフロー図である。
FIG. 2 is a flowchart of an arithmetic digitization process of the address notation conversion method shown in FIG.

【図3】図1に示す住所表記変換方法の変換チェック処
理のフロー図である。
FIG. 3 is a flowchart of a conversion check process of the address notation conversion method shown in FIG. 1;

【図4】図2で用いられる地番情報(a)および漢数字
(b)のデータ一覧を示す図である。
FIG. 4 is a diagram showing a data list of lot number information (a) and Chinese numerals (b) used in FIG. 2;

【図5】図3で用いられる市区町村情報(a)および地
名情報(b)のデータ一覧を示す図である。
5 is a diagram showing a data list of municipal information (a) and place name information (b) used in FIG. 3;

【図6】図2における算用数字化処理の詳細フロー図で
ある。
FIG. 6 is a detailed flowchart of an arithmetic digitization process in FIG. 2;

【図7】図6のフローの途中におけるワークエリアの状
態を示す図である。
FIG. 7 is a diagram showing a state of a work area in the middle of the flow of FIG. 6;

【図8】本実施例による漢数字表記住所データの例
(a)および(b)と変換実施後の算用数字表記住所デ
ータの例(c)である。
FIGS. 8A and 8B are examples (a) and (b) of address data in Chinese numerals according to the present embodiment and examples (c) of address data in arithmetic numerals after conversion.

【符号の説明】[Explanation of symbols]

1:入力制御部 2:算用数字化処理部 3:変換チェック部 4:確認用リスト 1: Input control unit 2: Arithmetic digitization processing unit 3: Conversion check unit 4: Confirmation list

───────────────────────────────────────────────────── フロントページの続き (72)発明者 菊池 章子 東京都渋谷区道玄坂一丁目16番5号 株式 会社日立情報システムズ内 (72)発明者 金子 尚里 東京都渋谷区道玄坂一丁目16番5号 株式 会社日立情報システムズ内 (72)発明者 島ノ江 郁子 東京都渋谷区道玄坂一丁目16番5号 株式 会社日立情報システムズ内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Akiko Kikuchi 1-16-5 Dogenzaka, Shibuya-ku, Tokyo Inside Hitachi Information Systems Co., Ltd. (72) Inventor Takasato Kaneko 1-16-1 Dogenzaka, Shibuya-ku, Tokyo Hitachi Information Systems, Ltd. (72) Inventor Ikuko Shimanoe 1-16-5 Dogenzaka, Shibuya-ku, Tokyo Inside Hitachi Information Systems, Ltd.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 コンピュータシステムに入力された漢数
字表記の住所データを算用数字表記に変換する住所表記
変換方法であって、 入力データの最後部文字より先頭文字方向に先頭文字ま
で、変換文字列抽出のための地番情報との一致を順次チ
ェックする第1のステップと、該第1のステップのチェ
ックの結果、地番情報と一致した場合に地番情報の前の
漢数字データを抽出する第2のステップと、該第2のス
テップで抽出した漢数字データを算用数字データに変換
する第3のステップとを有することを特徴とする住所表
記変換方法。
1. An address notation conversion method for converting address data in kanji numeral notation input into a computer system into arithmetic numeral notation, comprising: converting characters from the last character of the input data to the first character in the first character direction. A first step of sequentially checking for coincidence with lot number information for column extraction, and a second step of extracting Chinese numeral data before the lot number information when the result of the check in the first step matches lot number information. And a third step of converting the Chinese numeral data extracted in the second step into arithmetic numeral data.
【請求項2】 前記第2のステップは、地番情報の前の
漢数字データが位を示す単位情報か、ゼロ記号を含む数
字情報かを判定し、単位情報の場合は位に対応する算用
数字桁位置を求め、数字情報の場合は対応する算用数字
に変換するとともに桁位置を一桁上位に進める処理を漢
数字以外の文字が出現するまで繰り返すステップである
ことを特徴とする請求項1記載の住所表記変換方法。
2. In the second step, it is determined whether the kanji numeric data before the lot number information is unit information indicating a place or numeric information including a zero sign. A step of obtaining a digit position and, in the case of numeric information, converting the digit position to a corresponding arithmetic digit and advancing the digit position one digit higher until a character other than a Chinese numeral appears, wherein the step is repeated. 1. Address notation conversion method described in 1.
【請求項3】 前記地番情報は、少なくとも「丁」,
「号」,「番」,「−(ハイフン)」,「棟」,「F」
のいずれかを含み、前記単位情報は、少なくとも
「十」,「拾」,「百」,「千」,「万」,「億」のい
ずれかを含むことを特徴とする請求項1または2記載の
住所表記変換方法。
3. The lot number information includes at least “cho”,
"No.", "Ban", "-" (hyphen), "Building", "F"
3. The unit information according to claim 1, wherein the unit information includes at least one of “ten”, “pickup”, “hundred”, “thousand”, “million”, and “billion”. Address notation conversion method described.
【請求項4】 コンピュータシステムに入力されている
住所表記をチェックする住所表記チェック方法であっ
て、 住所データの最後部文字より先頭文字方向に先頭文字ま
で、順次、市区町村情報の前に算用数字があるか否かを
チェックする第1のステップと、該第1のステップのチ
ェックの結果、市区町村情報の前に算用数字がない場合
さらの漢数字があるか否かをチェックする第2のステッ
プと、該第2のステップのチェックの結果、市区町村情
報の前に漢数字がある場合に地名情報との一致をチェッ
クする第3のステップと、前記第1のステップで市区町
村情報の前に算用数字があると判定された場合および前
記第3のステップで地名情報と一致していないと判定さ
れた場合にその住所表記に誤りの可能性が大きい旨の情
報を出力することを特徴とする住所表記チェック方法。
4. An address notation checking method for checking an address notation input to a computer system, wherein the address notation is sequentially calculated before the municipal information from the last character of the address data to the first character in the first character direction. A first step of checking whether or not there is a business numeral, and as a result of the check in the first step, if there is no arithmetic numeral before the municipal information, it is checked whether or not there are further Chinese numerals A second step of performing a check, when the result of the check in the second step indicates that there is a kanji numeral before the municipal information, a check with the place name information, and When it is determined that there is an algebraic numeral before the municipal information and when it is determined that the address does not match the place name information in the third step, information indicating that there is a large possibility of an error in the address notation. Output Address notation check method according to claim.
【請求項5】 前記市区町村情報は、少なくとも
「市」,「区」,「町」,「村」,「目」,「丁」のい
ずれかを含むことを特徴とする請求項4記載の住所表記
チェック方法。
5. The municipal information includes at least one of “city”, “ward”, “town”, “village”, “eye”, and “cho”. Address notation check method.
JP8231533A 1996-09-02 1996-09-02 Address notation conversion and check method Pending JPH1078953A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8231533A JPH1078953A (en) 1996-09-02 1996-09-02 Address notation conversion and check method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8231533A JPH1078953A (en) 1996-09-02 1996-09-02 Address notation conversion and check method

Publications (1)

Publication Number Publication Date
JPH1078953A true JPH1078953A (en) 1998-03-24

Family

ID=16924989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8231533A Pending JPH1078953A (en) 1996-09-02 1996-09-02 Address notation conversion and check method

Country Status (1)

Country Link
JP (1) JPH1078953A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196151A (en) * 1997-09-25 1999-04-09 Sharp Corp Zip code address converting device
KR101065135B1 (en) 2008-10-16 2011-09-16 엔에이치엔(주) Method and system for extraction range of property for query
JP2020173873A (en) * 2020-07-31 2020-10-22 株式会社Jon Registration information acquisition system, registration information acquisition method, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05182012A (en) * 1991-12-29 1993-07-23 Fuji Xerox Co Ltd Character recognition device
JPH07160701A (en) * 1993-12-13 1995-06-23 Sharp Corp Address information retrieval device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05182012A (en) * 1991-12-29 1993-07-23 Fuji Xerox Co Ltd Character recognition device
JPH07160701A (en) * 1993-12-13 1995-06-23 Sharp Corp Address information retrieval device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196151A (en) * 1997-09-25 1999-04-09 Sharp Corp Zip code address converting device
KR101065135B1 (en) 2008-10-16 2011-09-16 엔에이치엔(주) Method and system for extraction range of property for query
JP2020173873A (en) * 2020-07-31 2020-10-22 株式会社Jon Registration information acquisition system, registration information acquisition method, and program

Similar Documents

Publication Publication Date Title
JPH0736882A (en) Dictionary retrieving device
US20050249419A1 (en) Apparatus and method for handwriting recognition
JP2001166683A (en) System for automatic translation into braille and method for automatic translation into braille using the same
JPH1078953A (en) Address notation conversion and check method
JP2621999B2 (en) Document processing device
JP3045886B2 (en) Character processing device with handwriting input function
JP2776069B2 (en) Document inspection device
JP3935374B2 (en) Dictionary construction support method, apparatus and program
JP2939945B2 (en) Roman character address recognition device
JP2006031099A (en) Computer-executable program for making computer recognize character
JPH0682366B2 (en) Character string correction method
JP2988046B2 (en) Kana-Kanji conversion device
JPH02136959A (en) Extracting device for correction candidate of japanese sentence
JPS63163956A (en) Document preparation and correction supporting device
JPS595335A (en) Japanese language input device
CN115310458A (en) Name translation method, system, equipment and computer readable storage medium
JP2865443B2 (en) Kanji conversion device for Kana name or Kana corporation name
JPH0574867B2 (en)
JPH06103419A (en) Word dictionary organizing system
JPH07210629A (en) Character recognition system
JPS61292774A (en) Handwritten word processor
JPS6120176A (en) Roman character/chinese character converter
JPH0248938B2 (en)
JPH03222060A (en) Japanese reading system
JPH0528142A (en) Sentence check device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040917

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050225