JP2002288194A - 戸籍情報処理装置及び方法、プログラム - Google Patents

戸籍情報処理装置及び方法、プログラム

Info

Publication number
JP2002288194A
JP2002288194A JP2001085529A JP2001085529A JP2002288194A JP 2002288194 A JP2002288194 A JP 2002288194A JP 2001085529 A JP2001085529 A JP 2001085529A JP 2001085529 A JP2001085529 A JP 2001085529A JP 2002288194 A JP2002288194 A JP 2002288194A
Authority
JP
Japan
Prior art keywords
character
character string
family register
extracted
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001085529A
Other languages
English (en)
Other versions
JP2002288194A5 (ja
Inventor
Masanori Wakai
聖範 若井
Toshimi Takahashi
聡美 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001085529A priority Critical patent/JP2002288194A/ja
Publication of JP2002288194A publication Critical patent/JP2002288194A/ja
Publication of JP2002288194A5 publication Critical patent/JP2002288194A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 戸籍の記載事項を電子化するにあたり、効率
的な処理を実現すること。 【解決手段】 戸籍の記載内容を表した文字列を処理す
る戸籍情報処理装置であって、処理対象の前記文字列か
ら予め定めた項目に対応する文字又は文字列を抽出する
抽出手段と、抽出された文字又は文字列において、情報
の省略があるか否かを判定する判定手段と、情報の省略
があると判定された場合に、前記抽出された文字又は文
字列を、情報の省略がない文字又は文字列に完全化する
完全化手段と、を備えたことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、戸籍の記載内容を
電子化する技術に関するものである。
【0002】
【従来の技術】従来、戸籍は戸籍法に基づいて紙で管理
されるものであった。しかし、戸籍法改正により、戸籍
の電子化が許可され、コンピュータ上のデータベースに
より管理することが可能となった。戸籍の電子化技術と
しては、例えば、実用新案登録第3032743号や、特開平0
9-114901号に記載された技術が提案されている。
【0003】
【発明が解決しようとする課題】ここで、戸籍の電子化
にあっては、単に戸籍の記載内容をデータ化するのみな
らず、管理が容易な形式に項目分けしてデータの選別を
することが好ましい。また、このように項目化されたデ
ータは、戸籍情報として適切なものである必要もある。
これらは、従来の技術では不可能であるか、若しくは、
オペレータの手作業に依存する割合が大きく、効率的な
処理は実現されていない。
【0004】従って、本発明の目的は、戸籍の記載内容
を電子化するにあたり、効率的な処理を実現し得る戸籍
の情報処理技術を提供することにある。
【0005】
【課題を解決するための手段】本発明によれば、戸籍の
記載内容を表した文字列を処理する戸籍情報処理装置で
あって、処理対象の前記文字列から予め定めた項目に対
応する文字又は文字列を抽出する抽出手段と、抽出され
た文字又は文字列において、情報の省略があるか否かを
判定する判定手段と、情報の省略があると判定された場
合に、前記抽出された文字又は文字列を、情報の省略が
ない文字又は文字列に完全化する完全化手段と、を備え
たことを特徴とする戸籍情報処理装置が提供される。
【0006】また、本発明によれば、戸籍の記載内容を
表した文字列を処理するために、コンピュータを、処理
対象の前記文字列から予め定めた項目に対応する文字又
は文字列を抽出する抽出手段、抽出された文字又は文字
列において、情報の省略があるか否かを判定する判定手
段、情報の省略があると判定された場合に、前記抽出さ
れた文字又は文字列を、情報の省略がない文字又は文字
列に完全化する完全化手段、として機能させるプログラ
ムが提供される。
【0007】また、本発明によれば、戸籍の記載内容を
表した文字列を処理する戸籍情報処理装置であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出手段と、前記文字又は文字列
が抽出されていない前記項目があるか否かを判定する判
定手段と、前記文字又は文字列が抽出されていない前記
項目がある場合に、当該項目に該当する文字又は文字列
を検索する手段と、を備えことを特徴とする戸籍情報処
理装置が提供される。
【0008】また、本発明によれば、戸籍の記載内容を
表した文字列を処理するために、コンピュータを、処理
対象の前記文字列から予め定めた項目に対応する文字又
は文字列を抽出する抽出手段、前記文字又は文字列が抽
出されていない前記項目があるか否かを判定する判定手
段、前記文字又は文字列が抽出されていない前記項目が
ある場合に、当該項目に該当する文字又は文字列を検索
する手段、として機能させるプログラムが提供される。
【0009】また、本発明によれば、戸籍の記載内容を
表した文字列を処理する戸籍情報処理方法であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出工程と、抽出された文字又は
文字列において、情報の省略があるか否かを判定する判
定工程と、情報の省略があると判定された場合に、前記
抽出された文字又は文字列を、情報の省略がない文字又
は文字列に完全化する完全化工程と、を備えたことを特
徴とする戸籍情報処理方法が提供される。
【0010】また、本発明によれば、戸籍の記載内容を
表した文字列を処理する戸籍情報処理方法であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出工程と、前記文字又は文字列
が抽出されていない前記項目があるか否かを判定する判
定工程と、前記文字又は文字列が抽出されていない前記
項目がある場合に、当該項目に該当する文字又は文字列
を検索する工程と、を備えたことを特徴とする戸籍情報
処理方法が提供される。
【0011】
【発明の実施の形態】以下、本発明の好適な実施の形態
について、図面を参照して説明する。
【0012】図1は、本発明の一実施形態に係る戸籍情
報処理装置のハードウエア構成例を示すブロック図であ
る。
【0013】入力部101は、データを入力するための
ものであり、例えば、操作者がデータを入力するための
マウス、キーボード、或いは、スキャナや他のコンピュ
ータ等からデータを入力するためのインターフェース等
を含む。
【0014】CPU102は、戸籍情報処理装置全体の
制御を行い、後述する処理を実行するプロセッサであ
る。出力部103は、CPU102の処理結果等を出力
するためのものであり、例えば、ディスプレイである。
プログラムメモリ104は、CPU102が実行するプ
ログラムを格納したメモリであり、代表的にはROMや
RAMであるが、データを記憶可能なものであれば何で
もよい。
【0015】データメモリ105は、各種処理で生じた
データを格納するほか、戸籍を解析するための種々の情
報を有する知識ベースも格納する。知識ベースには、図
7に示すような解析ルールの選択テーブル、図8乃至図
10に示すような解析ルールのテーブルが含まれる。こ
れらの内容については後述する。
【0016】データメモリ105は、代表的にはRAM
であるが、データを記憶可能なものであれば何でもよ
い。また、知識ベースは、装置内部又は外部の、例え
ば、ハードディスク、CD−ROM、光磁気ディスク、
RAM、ROMといった記憶デバイス又は記憶媒体に格
納しておき、それらアクセスして取得するようにしても
よい。
【0017】これらの構成は、バス106に接続されて
いる。このように本実施形態の戸籍情報処理装置は、パ
ソコンと同等のハードウエア構成で足りる。
【0018】<戸籍の例>図2は、戸籍の例を示した図
である。戸籍は、通常、本籍/筆頭者氏名欄200と、
構成員全員に共通する事項が記入される戸籍事項欄20
1と、構成員に関する事項が記入される身分事項欄20
2と、から構成されている。
【0019】<全体的な処理の流れ>図3は、処理の全
体的な流れを示すフローチャートである。
【0020】戸籍に記載された文字群を電子化する(S
301)。電子化は、例えば、スキャナで戸籍を読み取
ってその画像データをOCR変換してもよいし、オペレ
ータがキーボード等から手入力で行ってもよい。本実施
形態では、戸籍に記載された文字群をテキスト形式で電
子化する。図4は、図2の戸籍の一部の文字群をテキス
ト形式で電子化したデータの一例を示す図である。
【0021】図4の例では、戸籍の文字群を戸籍の各欄
毎にタグを付して区分けしており、本籍/筆頭者氏名欄
200には、タグ<本籍筆頭>及び</本籍筆頭>を、
戸籍事項欄201には、タグ<戸籍事項>及び</戸籍
事項>を、身分事項欄202には、タグ<身分事項>及
び</身分事項>(図示せず)を、割りあてている。
【0022】また、身分事項欄201の文字群について
は、各構成員毎に、タグ<構成員1>及び</構成員1
>等を付して区分けしている。更に、戸籍の書式の枠組
等に従って、各文字群にタグ<P>及び</P>を付し
て、区分けしている。なお、これらは一例であり、電子
化された文字群のデータの構成は、これに限られず種々
の構成を採用することができ、例えば、より詳細に区分
けしてもよいし、また、大雑把に区分けしてもよいこと
はいうまでもない。
【0023】次に、文字群のデータに基づいて、項目化
処理を行う(S302)。項目化とは、予め定めた項目
に即して、文字群のデータから必要な情報を選別するこ
とをいう。例えば、「出生日」という項目が定められて
おれば、これに対応する年月日等を文字群のデータから
抽出するのである。ここで、例えば、図4のデータ40
で示すように構成員の「父」及びその名前「日本 一
郎」のようなものを、項目「構成員の父」に対応して抽
出することは、情報の内容が戸籍の書式の枠組と対応し
ており略一律に定まるので、項目化は容易である。
【0024】しかし、図4のデータ41や42で示すよ
うなものは、情報の内容の種類が複数に及び、また、戸
籍の記入者のくせ等もあるので、項目化は必ずしも容易
ではない。そこで、本実施形態では、後述する手順によ
り、データ41や42のような文字列から、予め定めた
項目に対応する文字や文字列を抽出する。
【0025】次に、項目化処理を実行することにより得
たデータに対して完全化処理を行う(S303)。完全
化とは、項目化処理において、項目に該当する文字又は
文字列を抽出できなかった場合や、項目化処理を実行す
ることにより得た文字や文字列において、情報の省略が
されている場合に、適切な文字又は文字列をその項目に
割りあてることをいう。例えば、項目化処理において
「同年参月拾日」という日付の文字列を抽出した場合
に、欠落した元号の部分を「昭和」とし、また、情報が
省略された「同年」の部分を、「平成五年」といったよ
うに完全化する。
【0026】最後に、項目化処理及び完全化処理を実行
することにより得たデータを出力部103から出力し、
例えばディスプレイ上に表示する(S304)。図5は
その表示例を示す図である。
【0027】<項目化処理>次に、上述した項目化処理
におけるCPU102の処理の内容について説明する。
図6は、項目化処理の内容を示したフローチャートであ
る。本実施形態では、戸籍事項と身分事項とを区分けし
て処理を進めるがそうでなくともよい。
【0028】S601では、S301で作成したテキス
トデータのうち、戸籍事項に属するテキストデータを取
得する。例えば、図4の例では、「平成参年拾月九日編
製」という文字列のテキストデータが取得される。
【0029】S602では、知識ベースから、解析ルー
ルの選択テーブルを取得して、選択テーブルに記録され
た選択用キーワードによる検索をS601で取得したテ
キストデータに適用し、その文字列中に選択用キーワー
ドがあるか否かを検索する。図7(a)は、戸籍事項用
の選択テーブルを示した図である。
【0030】選択テーブルには、各解析ルール、選択用
キーワードとIDと識別記号とが対応付けて付されて記
録されている。選択用キーワードは、戸籍事項の記載内
容として想定される文字又は文字列を列挙したものであ
る。S602では、選択用キーワードを順次読み出し
て、処理の対象である文字列中にそれが含まれるか否か
を検索する。例えば、図4の例の「平成参年拾月九日編
製」という文字列には、「編製」という選択用キーワー
ドを含むので、「HENSEI」という解析ルールが検
索される。
【0031】S603では、S602の検索結果に基づ
いて、処理中の文字列に対する解析ルールを選択する。
例えば、図4の例の「平成参年拾月九日編製」という文
字列では、「HENSEI」という解析ルールが選択さ
れることとなる。解析ルールが選択されると、その文字
列の先頭に、選択テーブルに記録された識別記号が付さ
れる。例えば、図4の例の「平成参年拾月九日編製」と
いう文字列では、そのテキストデータが、「hensei平成
参年拾月九日編製」となる。
【0032】S604では、S603で選択された解析
ルールに基づいて、処理中の文字列から、予め定めた項
目に対応する文字又は文字列を抽出する。具体的には、
まず、S603において識別記号が付された処理中の文
字列の当該識別記号を参照して、知識ベースから選択さ
れた解析ルールのテーブルを取得する。図8(a)及び
(b)は、解析ルールのテーブルの例を示した図であ
り、図8(a)は編製ルール(図7(a)の「HENS
EI」に相当する。)のテーブルを、図8(b)は氏変
更ルール(図7(a)の「HENKOU_TODOKE
DE」に相当する。)のテーブルを、それぞれ示してい
る。
【0033】解析ルールは、戸籍の記載事項に応じて定
められており、処理の手順と、抽出すべき項目に対応し
た解析用キーワードとが定められている。解析用キーワ
ードは、戸籍の記載内容として想定される文字又は文字
列を列挙したものである。尤もこの解析用キーワードと
して、任意の文字又は文字列に対応したものを定めても
よく、例えば、解析用キーワードが「***」であれ
ば、3文字の任意の文字列が該当するようにしてもよ
い。
【0034】図8の解析ルールのテーブルには、処理中
の文字列の注目すべき箇所の順番を示した注目点と、そ
の注目点に対する処理の内容と、処理に用いる解析用キ
ーワードと、処理の結果抽出した文字又は文字列に対す
る項目の格納先を示したデータ格納先とが記録されてい
る。
【0035】処理には、主として、サブの解析ルールの
呼び出しと抽出とチェックとがある。サブの解析ルール
とは、各解析ルールにおいて用いられることが多い処理
を別途定義したものであり、例えば、日付の抽出や氏名
の抽出等である。図9(a)乃至(d)は、サブの解析
ルールの例を示した図であり、それぞれ日付ルール、場
所ルール、資格ルール、氏名ルールを示している。
【0036】抽出は、処理の対象である文字列中に解析
用キーワードがあれば、これを予め定めた項目の格納先
に格納するものである。チェックは、処理の対象である
文字列中に解析用キーワードがあるか否かを判定し、あ
れば注目点を進め、なければエラーを返すといった処理
を行うものである。
【0037】S604の処理に戻って、例えば、図4の
例の「平成参年拾月九日編製」という文字列から、編製
ルールのテーブル(図8(a))に基づいて、文字又は
文字列を抽出する場合について説明する。編製ルールの
テーブルでは、最初に日付ルールを適用することが定め
られている。そこで、図9(a)の日付ルールのテーブ
ルが呼び出される。
【0038】日付ルールでは、最初に解析用キーワード
「明治」、「大正」等の抽出が定められている。これら
のキーワードが文字列中にあれば、これを[元号]に格
納する。その後、注目点2へ処理が進められる。そし
て、解析用キーワード「壱」、「一」等の抽出が定めら
れており、これらのキーワードが文字列中にあれば、こ
れを[年数字]に格納する。その後、注目点3へ進めら
れ、解析用キーワード「年」があるか否かを判定し、あ
れば注目点4へ進む。この場合、データの格納はしな
い。同様にして処理を進めて、注目点7の処理で解析用
キーワード「日」が文字列中にあるかをチェックして、
あれば編製ルールへ戻り、[編製日]に日付ルールで取
得した各データがまとめて一連にされて又は区分けされ
たまま格納される。ここでは、「平成参年拾月九日」と
いう文字列を示すデータが格納先である[編製日]に格
納されることとなる。
【0039】次に、編製ルールのテーブルにおいて、注
目点2へ処理が進められ、「編製」という文字があるか
否かがチェックされてS604の処理が終了する。
【0040】別の例として、氏変更ルールが選択された
場合について説明する。処理の対象となる文字列として
は、例えば、「平成拾年七月拾参日戸籍法七十三条の二
の届出」を想定する。氏変更ルールのテーブル(図8
(b))では、最初に日付ルールを適用することが定め
られている。そこで、図9(a)の日付ルールのテーブ
ルが呼び出され、上述した手順により、日付ルールが実
行されて抽出された文字列が[氏変更日]に格納され
る。ここでは、「平成拾年七月拾参日」という文字列を
示すデータが格納されることとなる。
【0041】次に、注目点2に処理が進められ、解析用
キーワード「戸籍法」という文字列があるか否かがチェ
ックされて注目点3に処理が進む。注目点3の処理で
は、処理対象である文字列から、「73条の2」や「7
7条の2」といった氏変更の種別を示す解析用キーワー
ドが抽出され、[氏変更の種別]に格納される。最後
に、注目点4へ進み、解析用キーワード「の届出」とい
う文字列があるか否かがチェックされて処理が終了す
る。
【0042】なお、解析ルールの適用がうまくいかなか
った場合、例えば、「チェック」処理でエラーが返され
た場合には、同じ処理対象の文字列に再度他の解析ルー
ルを適用するようにしてもよい。この場合、同じ戸籍の
記載事項に対応するが、処理の手順や、解析用キーワー
ドが異なる解析ルールを用意しておき、これを順に適用
してもよい。例えば、氏変更ルールとして、処理の手順
や解析用キーワードが相互に異なる氏変更ルール1、氏
変更ルール2を用意したり、日付ルールとして、日付ル
ール1、日付ルール2、日付ルール3...とすること
もできる。
【0043】図6のフローチャートに戻り、S605で
は、S301で作成した戸籍事項に属するテキストデー
タのうち、未処理のデータがあるか否かを判定し、あれ
ばS601へ戻り上述した手順を繰り返す。S601乃
至S605の処理を繰り返すことにより、戸籍事項に属
するテキストデータが順に処理されることとなる。
【0044】次に、S606へ進み、身分事項に関する
データの処理へ移行する。S606からS610までの
処理は、上述したS601からS605の処理と基本的
に同じである。S606では、S301で作成したテキ
ストデータのうち、身分事項に属するテキストデータを
取得する。なお、身分事項に関するデータの処理では、
各構成員単位で処理を進めてもよい。
【0045】S607では、知識ベースから、解析ルー
ルの選択テーブルを取得して、選択テーブルに記録され
た選択用キーワードによる検索をS606で取得したテ
キストデータに適用し、その文字列中に選択用キーワー
ドがあるか否かを検索する。図7(b)は、身分事項用
の選択テーブルを示した図である。
【0046】S608では、S607の検索結果に基づ
いて、処理中の文字列に対する解析ルールを選択する。
例えば、図4の例の「昭和参拾九年五月拾弐日東京都中
央区で出生同月拾八日父届出入籍」(データ42)とい
う文字列では、「SHUSSEI_TODOKEDE」
という解析ルールが選択されることとなる。解析ルール
が選択されると、その文字列の先頭に、選択テーブルに
記録された識別記号が付され、この例では、「shussei
昭和参拾九年五月拾弐日東京都中央区で出生同月拾八日
父届出入籍」となる。
【0047】S609では、S608で選択された解析
ルールに基づいて、処理中の文字列から、予め定めた項
目に対応する文字又は文字列を抽出する。具体的には、
まず、S608において識別記号が付された処理中の文
字列の当該識別記号を参照して、知識ベースから選択さ
れた解析ルールのテーブルを取得する。図10(a)乃
至(d)は、身分事項用の解析ルールのテーブルの例を
示した図であり、図10(a)は出生ルール(図7
(b)の「SHUSSEI_TODOKEDE」に相当
する。)のテーブルを、図10(b)は認知ルール(図
7(b)の「NINCHI_TODOKEDE」に相当
する。)のテーブルを、図10(c)は婚姻ルール(図
7(b)の「KONINRIKON_TODOKED
E」に相当する。)のテーブルを、図10(d)は養子
縁組ルール(図7(b)の「YOSHI_TODOKE
DE」に相当する。)のテーブルを、それぞれ示してい
る。
【0048】なお、図7(b)における解析ルール「D
rop」は、戸籍更新時に不要な記載事項に対して適用
されるルールであり、このルールの適用により、その記
載事項は項目化の対象とならず、データは破棄される。
【0049】次に、S609における具体的な処理の例
を説明する。図4の例の「昭和参拾九年五月拾弐日東京
都中央区で出生同月拾八日父届出入籍」(データ42)
に出生ルールのテーブル(図10(a))を適用する場
合を想定する。出生ルールのテーブル(図10(a))
では、最初に日付ルールを適用することが定められてい
る。そこで、図9(a)の日付ルールのテーブルが呼び
出され、上述した手順により、日付ルールが実行されて
抽出された文字列が[出生日]に格納される。ここで
は、「昭和参拾九年五月拾弐日」という文字列を示すデ
ータが格納されることとなる。
【0050】次に、注目点2に処理が進められ、場所ル
ールを適用することが定められているので、図9(b)
の場所ルールのテーブルが呼び出される。場所ルールの
テーブルでは、最初に解析用キーワード「北海道」、
「青森県」等の抽出が定められている。これらのキーワ
ードが文字列中にあれば、これを[都道府県]に格納す
る。その後、注目点2へ処理が進められる。そして、解
析用キーワード「札幌市」、「新宿区」等の抽出が定め
られており、これらのキーワードが文字列中にあれば、
これを[市町村区]に格納する。その後、出生ルールのテ
ーブルに戻り、場所ルールで取得したデータが[出生
地]へ格納される。ここでは、「東京都中央区」という
文字列を示すデータが[出生地]へ格納されることとな
る。
【0051】次に、注目点3の処理では、解析用キーワ
ード「で出生」という文字列があるか否かがチェックさ
れて注目点4に処理が進む。注目点4の処理では、日付
ルールのテーブルが呼び出され、「同月拾八日」という
文字列が[届出日]に格納される。注目点5の処理へ進
み、資格ルールのテーブル(図9(c))が呼び出さ
れ、処理中の文字列に解析キーワード「夫」、「母」等
があるか否かが判定され、あれば[資格名称]に格納さ
れる。その後、資格ルールで取得されたデータが[届出
人]へ格納され。ここでは、「父」という文字列を示す
データが[届出人]に格納されることとなる。
【0052】最後に注目点6へ進み、解析用キーワード
「届出」という文字列があるか否かがチェックされて処
理が終了する。
【0053】別の例として、養子縁組ルールが選択され
た場合について説明する。処理の対象となる文字列とし
ては、例えば、「平成五年八月六日日本太郎日本花子の
養子となる縁組届出千葉県千葉市佐藤一男戸籍から入
籍」を想定する。養子縁組ルールのテーブル(図10
(d))では、最初に日付ルールを適用することが定め
られている。そこで、図9(a)の日付ルールのテーブ
ルが呼び出され、上述した手順により、日付ルールが実
行されて抽出された文字列が[縁組日]に格納される。
ここでは、「平成五年八月六日」という文字列を示すデ
ータが格納されることとなる。
【0054】注目点2の処理では、図9(d)の氏名ル
ールのテーブルが呼び出され、抽出された氏名が[P
1]に格納される。注目点3の処理でも、図9(d)の
氏名ルールのテーブルが呼び出され、抽出された氏名が
[P2]に格納される。ここでは、「日本太郎」、「日
本花子」という文字列を示すデータが格納されることと
なる。注目点4の処理では、処理中の文字列に解析用キ
ーワード「養子となる」があるか否かがチェックされ、
あれば先の[P1]及び[P2]のデータが、それぞれ
[養父氏名]及び[養母氏名]に転送されて格納され
る。ここでは、「日本太郎」、「日本花子」という文字
列を示すデータが、[養父氏名]、[養母氏名]にそれ
ぞれ格納されることとなる。
【0055】注目点5の処理では、処理中の文字列に解
析用キーワード「縁組届出」があるか否かがチェックさ
れ、あれば注目点6の処理へ進み、図9(b)の場所ル
ールのテーブルが呼び出される。場所ルールの適用によ
り得られたデータは、[従前戸籍]に格納される。ここ
では、「千葉県千葉市」という文字列を示すデータが格
納されることとなる。
【0056】注目点7の処理では、図9(d)の氏名ル
ールのテーブルが呼び出され、得られたデータが[従前
戸籍筆頭者]に格納される。ここでは、「佐藤一男」と
いう文字列を示すデータが格納されることとなる。
【0057】注目点8及び9では、それぞれ、処理中の
文字列に解析用キーワード「戸籍から」、「入籍」があ
るか否かが順次チェックされ、いずれもある場合は処理
が終了する。
【0058】<完全化処理>次に、上述した完全化処理
におけるCPU102の処理の内容について説明する。
図11は、完全化処理の内容を示したフローチャートで
ある。ここで、上述した項目化処理により、S301で
作成したテキストデータは、項目化データとしてデータ
メモリ105に格納されている。図12(a)は、図4
の例の「昭和参拾九年五月拾弐日東京都中央区で出生同
月拾八日父届出入籍」(データ42)という文字列に、
上述した項目化処理を実行することにより得た項目化デ
ータの一例を示した図である。以下、この項目化データ
の場合を例にとって図11のフローチャートを説明す
る。
【0059】S1101では、上述した項目化処理によ
り項目化されたデータを取得する。例えば、図12
(a)のデータが取得される。S1102では、取得し
た項目化データの文字又は文字列において、情報の欠落
・省略があるか否かを判定する。この判定は、例えば、
空欄になっている項目があるか否かや、項目化データの
文字又は文字列に特定の文字又は文字列があるか否かに
基づいて判定することができる。そのような特定の文字
等としては、例えば、「同」、「父」、「母」、
「夫」、「妻」等である。
【0060】図12(b)は、図12(a)の項目化デ
ータに情報欠落・省略の有無の判定結果を付したデータ
テーブルを示す図である。同図の「欠落・省略の有無」
欄には、情報省略と判定したデータに「有」が付されて
おり、その他のデータには「無」が付されており、デー
タが「null」(空欄)の場合や、「同」或いは
「父」の場合に、「有」が付されていることが分かる。
【0061】図11のフローチャートに戻り、S110
3では、全ての項目化データについてS1102の処理
を行った否かを判定し、未処理の項目化データがあれば
S1101へ戻る。
【0062】S1104では、S1102において情報
の欠落・省略があったと判定された項目化データを順に
取得する。例えば、図12(b)のデータが取得され
る。S1105では、取得した項目化データの修正を行
いデータを完全化する。
【0063】完全化の具体的な方法としては、例えば以
下の方法(1)乃至(5)が挙げられる。この場合、い
ずれか一つの方法を採用してもよいし、適切なデータが
得られるまで順に適用していってもよい。また、省略の
態様(「null]、「同」、「父」、「母」、
「夫」、「妻」等)により以下の方法のいずれかの方法
を自動選択するようにしてもよい。
【0064】(1)情報が省略された文字又は文字列の
項目と同種の項目について抽出された文字又は文字列を
検索し、これに基づいて完全化する。特に、同じ処理対
象の文字列の、直前の同種の項目について抽出された文
字又は文字列を検索し、これに基づいて完全化すること
が好適である。
【0065】例えば、日付や場所に関する文字又は文字
列の省略の場合は、直前の日付や場所に関する項目化デ
ータを検索してこれに基づいて完全化する。図12
(a)の例で言えば、[届出日]の「元号」と「年」と
が欠落しているので(「null」)、直前の日付デー
タである[出生日]を検索し、その元号「昭和」と年
「参拾九」とをこれに適用する。また、[届出日]の
「月」が省略されているので(「同」)、直前の日付デ
ータである[出生日]を検索し、その月「五」をこれに
適用する。
【0066】(2)同じ処理対象の文字列に含まれる文
字又は文字列を検索し、これに基づいて完全化する。
【0067】(3)同じ戸籍に含まれる他の文字又は文
字列を検索し、これに基づいて完全化する。図12
(a)の例で言えば、[届出人]の名前が省略されてい
るので(「父」)、その構成員(この例では日本太郎)
の父親のデータを検索し(戸籍の「父」の欄)、「日本
一郎」をこれに適用する。
【0068】(4)他の戸籍に含まれる文字又は文字列
を検索して、これに基づいて完全化する。
【0069】(5)辞書データ等を用いて検索し、これ
に基づいて完全化する。
【0070】このような方法により、図12(a)の項
目化データを完全化した例を図12(c)に示す。
【0071】図11のフローチャートに戻り、S110
6では、、S1102において情報省略があったと判定
された全ての項目化データについてS1105の処理を
行った否かを判定し、未処理の項目化データがあればS
1104へ戻る。なければ完全化処理が終了する。
【0072】以上説明したとおり、本実施形態では、戸
籍の記載内容の項目化が自動化され、戸籍の記載事項を
電子化するにあたり、効率的な項目化を実現することが
できる。また、解析テーブルの設定の仕方により、様々
な戸籍の記載事項に対応でき、更に、戸籍の記入者のく
せ等にも対応することができる。
【0073】また、項目化されたデータの完全化を行う
ことにより、項目に対応するデータが欠落している場合
や、情報が省略された戸籍の記載に対応することができ
るので、オペレータの処理を軽減し、戸籍の記載事項の
電子化を効率よく行うことができる。
【0074】なお、上記実施形態では、項目化処理の後
に完全化処理を行ったが、同様の考え方により、完全化
処理を先に行ってから項目化処理を実行するようにして
もよい。また、情報の省略は、日付、場所、人名に関す
るデータにおいて行われ易いことから、これらのデータ
についてのみ完全化処理を行うようにしてもよい。
【0075】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウエアのプログラムコードを、
例えば、これを記録した記憶媒体(または記録媒体)等
を介して、システムあるいは装置に供給し、そのシステ
ムあるいは装置のコンピュータ(またはCPUやMPU)が、
該プログラムコードを実行することによっても、達成さ
れることは言うまでもない。この場合、そのプログラム
コード自体が前述した実施形態の機能を実現することに
なり、そのプログラムコード、及び、これを記憶した記
憶媒体は本発明を構成することになる。また、コンピュ
ータが読み出したプログラムコードを実行することによ
り、前述した実施形態の機能が実現されるだけでなく、
そのプログラムコードの指示に基づき、コンピュータ上
で稼働しているオペレーティングシステム(OS)などが実
際の処理の一部または全部を行い、その処理によって前
述した実施形態の機能が実現される場合も含まれること
は言うまでもない。
【0076】さらに、プログラムコードが、コンピュー
タに挿入された機能拡張カードやコンピュータに接続さ
れた機能拡張ユニットに備わるメモリに書込まれた後、
そのプログラムコードの指示に基づき、その機能拡張カ
ードや機能拡張ユニットに備わるCPUなどが実際の処理
の一部または全部を行い、その処理によって前述した実
施形態の機能が実現される場合も含まれることは言うま
でもない。
【0077】
【発明の効果】以上説明したように、本発明によれば、
戸籍の記載事項を電子化するにあたり、効率的な処理を
実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る戸籍情報処理装置の
ハードウエア構成例を示すブロック図である。
【図2】戸籍の例を示す図である。
【図3】処理の全体的な流れを示すフローチャートであ
る。
【図4】テキスト形式で電子化した文字群の一例を示す
図である。
【図5】処理結果の表示例を示す図である。
【図6】項目化処理の内容を示したフローチャートであ
る。
【図7】(a)は、戸籍事項用の選択テーブルを示した
図である。(b)は、身分事項用の選択テーブルを示し
た図である。
【図8】(a)及び(b)は、戸籍事項用の解析ルール
のテーブルの一例を示した図である。
【図9】(a)乃至(d)は、サブの解析ルールのテー
ブルの一例を示した図である。
【図10】(a)乃至(d)は、身分事項用の解析ルー
ルのテーブルの一例を示した図である。
【図11】完全化処理の内容を示したフローチャートで
ある。
【図12】(a)は、項目化処理により得た項目化デー
タの例、(b)は、(a)の項目化データに対して、S
1102の処理を実行することにより得たデータの例、
(c)は、(a)の項目化データを完全化した場合のデ
ータの例、を示す。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/60 154 G06F 17/60 154 Fターム(参考) 5B009 LA01 MB21 ME17 NA04 QA02 QA04 QB12 QB16 VA09 5B075 ND03 ND06 ND23 ND36 NK44 PP04 UU08

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 戸籍の記載内容を表した文字列を処理す
    る戸籍情報処理装置であって、 処理対象の前記文字列から予め定めた項目に対応する文
    字又は文字列を抽出する抽出手段と、 抽出された文字又は文字列において、情報の省略がある
    か否かを判定する判定手段と、 情報の省略があると判定された場合に、前記抽出された
    文字又は文字列を、情報の省略がない文字又は文字列に
    完全化する完全化手段と、を備えたことを特徴とする戸
    籍情報処理装置。
  2. 【請求項2】 前記完全化手段は、 同じ戸籍に含まれる他の文字または文字列に基づいて、
    前記抽出された文字又は文字列を、情報の省略がない文
    字又は文字列に完全化することを特徴とする請求項1に
    記載の戸籍情報処理装置。
  3. 【請求項3】 前記完全化手段は、 同じ処理対象の前記文字列に含まれる他の文字または文
    字列に基づいて、前記抽出された文字又は文字列を、情
    報の省略がない文字又は文字列に完全化することを特徴
    とする請求項1に記載の戸籍情報処理装置。
  4. 【請求項4】 前記完全化手段は、 前記抽出された文字又は文字列の前記項目と同種の項目
    について抽出された文字または文字列に基づいて、前記
    抽出された文字又は文字列を、情報の省略がない文字又
    は文字列に完全化することを特徴とする請求項1に記載
    の戸籍情報処理装置。
  5. 【請求項5】 前記判定手段は、 抽出された文字又は文字列が、特定の文字を含む場合
    に、情報の省略があると判定することを特徴とする請求
    項1に記載の戸籍情報処理装置。
  6. 【請求項6】 前記特定の文字には、「同」、「父」、
    「母」、「夫」又は「妻」のいずれかが含まれることを
    特徴とする請求項5に記載の戸籍情報処理装置。
  7. 【請求項7】 前記判定手段は、 抽出された文字又は文字列のうち、日付、場所、又は、
    人名を示す文字又は文字列について、情報の省略がある
    か否かを判定することを特徴とする請求項1に記載の戸
    籍情報処理装置。
  8. 【請求項8】 更に、 戸籍の記載事項に応じて定められた複数種類の解析ルー
    ルと、各々の前記解析ルールに付された少なくとも一つ
    のルール選択用キーワードと、を記憶する記憶デバイス
    又は記憶媒体からこれらを取得する手段を備え、 前記抽出手段は、 処理対象の前記文字列に含まれる前記ルール選択用キー
    ワードを検索する検索手段と、 検索した前記ルール選択用キーワードに対応する前記解
    析ルールに基づいて、処理対象の前記文字列から予め定
    めた項目に対応する文字又は文字列を抽出する処理手段
    と、を備えたことを特徴とする請求項1に記載の戸籍情
    報処理装置。
  9. 【請求項9】 戸籍の記載内容を表した文字列を処理す
    るために、コンピュータを、 処理対象の前記文字列から予め定めた項目に対応する文
    字又は文字列を抽出する抽出手段、 抽出された文字又は文字列において、情報の省略がある
    か否かを判定する判定手段、 情報の省略があると判定された場合に、前記抽出された
    文字又は文字列を、情報の省略がない文字又は文字列に
    完全化する完全化手段、として機能させるプログラム。
  10. 【請求項10】 戸籍の記載内容を表した文字列を処理
    する戸籍情報処理装置であって、 処理対象の前記文字列から予め定めた項目に対応する文
    字又は文字列を抽出する抽出手段と、 前記文字又は文字列が抽出されていない前記項目がある
    か否かを判定する判定手段と、 前記文字又は文字列が抽出されていない前記項目がある
    場合に、当該項目に該当する文字又は文字列を検索する
    手段と、を備えたことを特徴とする戸籍情報処理装置。
  11. 【請求項11】 戸籍の記載内容を表した文字列を処理
    するために、コンピュータを、 処理対象の前記文字列から予め定めた項目に対応する文
    字又は文字列を抽出する抽出手段、 前記文字又は文字列が抽出されていない前記項目がある
    か否かを判定する判定手段、 前記文字又は文字列が抽出されていない前記項目がある
    場合に、当該項目に該当する文字又は文字列を検索する
    手段、として機能させるプログラム。
  12. 【請求項12】 戸籍の記載内容を表した文字列を処理
    する戸籍情報処理方法であって、 処理対象の前記文字列から予め定めた項目に対応する文
    字又は文字列を抽出する抽出工程と、 抽出された文字又は文字列において、情報の省略がある
    か否かを判定する判定工程と、 情報の省略があると判定された場合に、前記抽出された
    文字又は文字列を、情報の省略がない文字又は文字列に
    完全化する完全化工程と、を備えたことを特徴とする戸
    籍情報処理方法。
  13. 【請求項13】 戸籍の記載内容を表した文字列を処理
    する戸籍情報処理方法であって、 処理対象の前記文字列から予め定めた項目に対応する文
    字又は文字列を抽出する抽出工程と、 前記文字又は文字列が抽出されていない前記項目がある
    か否かを判定する判定工程と、 前記文字又は文字列が抽出されていない前記項目がある
    場合に、当該項目に該当する文字又は文字列を検索する
    工程と、を備えたことを特徴とする戸籍情報処理方法。
JP2001085529A 2001-03-23 2001-03-23 戸籍情報処理装置及び方法、プログラム Pending JP2002288194A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001085529A JP2002288194A (ja) 2001-03-23 2001-03-23 戸籍情報処理装置及び方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001085529A JP2002288194A (ja) 2001-03-23 2001-03-23 戸籍情報処理装置及び方法、プログラム

Publications (2)

Publication Number Publication Date
JP2002288194A true JP2002288194A (ja) 2002-10-04
JP2002288194A5 JP2002288194A5 (ja) 2008-05-08

Family

ID=18941025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001085529A Pending JP2002288194A (ja) 2001-03-23 2001-03-23 戸籍情報処理装置及び方法、プログラム

Country Status (1)

Country Link
JP (1) JP2002288194A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647174B2 (en) 2005-06-01 2010-01-12 Hyundai Autonet Co., Ltd. Navigation system with function of one-touch map matching correction and method thereof
JP2015191277A (ja) * 2014-03-27 2015-11-02 富士通株式会社 データ識別方法、データ識別プログラム及びデータ識別装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07225807A (ja) * 1994-02-10 1995-08-22 Hitachi Ltd 戸籍データ作成装置
JPH09114901A (ja) * 1995-10-13 1997-05-02 Canon Inc 情報処理システム及びその方法
JPH10340351A (ja) * 1997-06-05 1998-12-22 Hitachi Inf Syst Ltd 文字データの自動校正方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07225807A (ja) * 1994-02-10 1995-08-22 Hitachi Ltd 戸籍データ作成装置
JPH09114901A (ja) * 1995-10-13 1997-05-02 Canon Inc 情報処理システム及びその方法
JPH10340351A (ja) * 1997-06-05 1998-12-22 Hitachi Inf Syst Ltd 文字データの自動校正方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647174B2 (en) 2005-06-01 2010-01-12 Hyundai Autonet Co., Ltd. Navigation system with function of one-touch map matching correction and method thereof
JP2015191277A (ja) * 2014-03-27 2015-11-02 富士通株式会社 データ識別方法、データ識別プログラム及びデータ識別装置

Similar Documents

Publication Publication Date Title
US8150156B2 (en) Automated processing of paper forms using remotely-stored templates
JPH06111056A (ja) 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法
JP2002099561A (ja) データ変換方法およびデータ変換システム並びに記憶媒体
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR102442350B1 (ko) 인공지능을 기반으로 자동 문서 작성을 수행하기 위한 정보 분석 방법 및 장치
JP6529254B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記憶媒体
US20090228794A1 (en) Business specification comprehension assistance system and method
JP3784060B2 (ja) データベース検索システム、その検索方法及びプログラム
JP2002288194A (ja) 戸籍情報処理装置及び方法、プログラム
JP2002288195A (ja) 戸籍情報処理装置及び方法、プログラム
JP2002288193A (ja) 戸籍情報処理装置及び方法、プログラム
JP6250307B2 (ja) 画像情報処理装置及び画像情報処理方法
JP7120981B2 (ja) 情報処理装置、情報処理方法、および、情報処理プログラム
JPWO2017072872A1 (ja) 業務プログラム生成支援システムおよび業務プログラム生成支援方法
JP2001297080A (ja) 読取支援装置
JP2008210229A (ja) 知的財産情報検索装置、知的財産情報検索方法及び知的財産情報検索プログラム
JP2001094711A (ja) ドキュメント画像処理装置及びドキュメント画像処理方法
US11868726B2 (en) Named-entity extraction apparatus, method, and non-transitory computer readable storage medium
JP4521413B2 (ja) データベース管理システム及びプログラム
JP2002149471A (ja) ファイルシステム
JPH09259132A (ja) 情報登録検索装置及びその方法
JP2002150207A (ja) 自動入力システム
JP2001256422A (ja) 登記簿データ電子化装置
JP3419425B2 (ja) 認識文字補正装置
JP2024015819A (ja) 指標算出装置、指標算出方法及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080324

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080324

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101102

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110509