JP2002288194A

JP2002288194A - 戸籍情報処理装置及び方法、プログラム

Info

Publication number: JP2002288194A
Application number: JP2001085529A
Authority: JP
Inventors: Masanori Wakai; 聖範若井; Toshimi Takahashi; 聡美高橋
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2001-03-23
Filing date: 2001-03-23
Publication date: 2002-10-04

Abstract

(57)【要約】【課題】戸籍の記載事項を電子化するにあたり、効率
的な処理を実現すること。【解決手段】戸籍の記載内容を表した文字列を処理す
る戸籍情報処理装置であって、処理対象の前記文字列か
ら予め定めた項目に対応する文字又は文字列を抽出する
抽出手段と、抽出された文字又は文字列において、情報
の省略があるか否かを判定する判定手段と、情報の省略
があると判定された場合に、前記抽出された文字又は文
字列を、情報の省略がない文字又は文字列に完全化する
完全化手段と、を備えたことを特徴とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、戸籍の記載内容を
電子化する技術に関するものである。

【０００２】

【従来の技術】従来、戸籍は戸籍法に基づいて紙で管理
されるものであった。しかし、戸籍法改正により、戸籍
の電子化が許可され、コンピュータ上のデータベースに
より管理することが可能となった。戸籍の電子化技術と
しては、例えば、実用新案登録第3032743号や、特開平0
9-114901号に記載された技術が提案されている。

【０００３】

【発明が解決しようとする課題】ここで、戸籍の電子化
にあっては、単に戸籍の記載内容をデータ化するのみな
らず、管理が容易な形式に項目分けしてデータの選別を
することが好ましい。また、このように項目化されたデ
ータは、戸籍情報として適切なものである必要もある。
これらは、従来の技術では不可能であるか、若しくは、
オペレータの手作業に依存する割合が大きく、効率的な
処理は実現されていない。

【０００４】従って、本発明の目的は、戸籍の記載内容
を電子化するにあたり、効率的な処理を実現し得る戸籍
の情報処理技術を提供することにある。

【０００５】

【課題を解決するための手段】本発明によれば、戸籍の
記載内容を表した文字列を処理する戸籍情報処理装置で
あって、処理対象の前記文字列から予め定めた項目に対
応する文字又は文字列を抽出する抽出手段と、抽出され
た文字又は文字列において、情報の省略があるか否かを
判定する判定手段と、情報の省略があると判定された場
合に、前記抽出された文字又は文字列を、情報の省略が
ない文字又は文字列に完全化する完全化手段と、を備え
たことを特徴とする戸籍情報処理装置が提供される。

【０００６】また、本発明によれば、戸籍の記載内容を
表した文字列を処理するために、コンピュータを、処理
対象の前記文字列から予め定めた項目に対応する文字又
は文字列を抽出する抽出手段、抽出された文字又は文字
列において、情報の省略があるか否かを判定する判定手
段、情報の省略があると判定された場合に、前記抽出さ
れた文字又は文字列を、情報の省略がない文字又は文字
列に完全化する完全化手段、として機能させるプログラ
ムが提供される。

【０００７】また、本発明によれば、戸籍の記載内容を
表した文字列を処理する戸籍情報処理装置であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出手段と、前記文字又は文字列
が抽出されていない前記項目があるか否かを判定する判
定手段と、前記文字又は文字列が抽出されていない前記
項目がある場合に、当該項目に該当する文字又は文字列
を検索する手段と、を備えことを特徴とする戸籍情報処
理装置が提供される。

【０００８】また、本発明によれば、戸籍の記載内容を
表した文字列を処理するために、コンピュータを、処理
対象の前記文字列から予め定めた項目に対応する文字又
は文字列を抽出する抽出手段、前記文字又は文字列が抽
出されていない前記項目があるか否かを判定する判定手
段、前記文字又は文字列が抽出されていない前記項目が
ある場合に、当該項目に該当する文字又は文字列を検索
する手段、として機能させるプログラムが提供される。

【０００９】また、本発明によれば、戸籍の記載内容を
表した文字列を処理する戸籍情報処理方法であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出工程と、抽出された文字又は
文字列において、情報の省略があるか否かを判定する判
定工程と、情報の省略があると判定された場合に、前記
抽出された文字又は文字列を、情報の省略がない文字又
は文字列に完全化する完全化工程と、を備えたことを特
徴とする戸籍情報処理方法が提供される。

【００１０】また、本発明によれば、戸籍の記載内容を
表した文字列を処理する戸籍情報処理方法であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出工程と、前記文字又は文字列
が抽出されていない前記項目があるか否かを判定する判
定工程と、前記文字又は文字列が抽出されていない前記
項目がある場合に、当該項目に該当する文字又は文字列
を検索する工程と、を備えたことを特徴とする戸籍情報
処理方法が提供される。

【００１１】

【発明の実施の形態】以下、本発明の好適な実施の形態
について、図面を参照して説明する。

【００１２】図１は、本発明の一実施形態に係る戸籍情
報処理装置のハードウエア構成例を示すブロック図であ
る。

【００１３】入力部１０１は、データを入力するための
ものであり、例えば、操作者がデータを入力するための
マウス、キーボード、或いは、スキャナや他のコンピュ
ータ等からデータを入力するためのインターフェース等
を含む。

【００１４】ＣＰＵ１０２は、戸籍情報処理装置全体の
制御を行い、後述する処理を実行するプロセッサであ
る。出力部１０３は、ＣＰＵ１０２の処理結果等を出力
するためのものであり、例えば、ディスプレイである。
プログラムメモリ１０４は、ＣＰＵ１０２が実行するプ
ログラムを格納したメモリであり、代表的にはＲＯＭや
ＲＡＭであるが、データを記憶可能なものであれば何で
もよい。

【００１５】データメモリ１０５は、各種処理で生じた
データを格納するほか、戸籍を解析するための種々の情
報を有する知識ベースも格納する。知識ベースには、図
７に示すような解析ルールの選択テーブル、図８乃至図
１０に示すような解析ルールのテーブルが含まれる。こ
れらの内容については後述する。

【００１６】データメモリ１０５は、代表的にはＲＡＭ
であるが、データを記憶可能なものであれば何でもよ
い。また、知識ベースは、装置内部又は外部の、例え
ば、ハードディスク、ＣＤ−ＲＯＭ、光磁気ディスク、
ＲＡＭ、ＲＯＭといった記憶デバイス又は記憶媒体に格
納しておき、それらアクセスして取得するようにしても
よい。

【００１７】これらの構成は、バス１０６に接続されて
いる。このように本実施形態の戸籍情報処理装置は、パ
ソコンと同等のハードウエア構成で足りる。

【００１８】＜戸籍の例＞図２は、戸籍の例を示した図
である。戸籍は、通常、本籍／筆頭者氏名欄２００と、
構成員全員に共通する事項が記入される戸籍事項欄２０
１と、構成員に関する事項が記入される身分事項欄２０
２と、から構成されている。

【００１９】＜全体的な処理の流れ＞図３は、処理の全
体的な流れを示すフローチャートである。

【００２０】戸籍に記載された文字群を電子化する（Ｓ
３０１）。電子化は、例えば、スキャナで戸籍を読み取
ってその画像データをＯＣＲ変換してもよいし、オペレ
ータがキーボード等から手入力で行ってもよい。本実施
形態では、戸籍に記載された文字群をテキスト形式で電
子化する。図４は、図２の戸籍の一部の文字群をテキス
ト形式で電子化したデータの一例を示す図である。

【００２１】図４の例では、戸籍の文字群を戸籍の各欄
毎にタグを付して区分けしており、本籍／筆頭者氏名欄
２００には、タグ＜本籍筆頭＞及び＜／本籍筆頭＞を、
戸籍事項欄２０１には、タグ＜戸籍事項＞及び＜／戸籍
事項＞を、身分事項欄２０２には、タグ＜身分事項＞及
び＜／身分事項＞（図示せず）を、割りあてている。

【００２２】また、身分事項欄２０１の文字群について
は、各構成員毎に、タグ＜構成員１＞及び＜／構成員１
＞等を付して区分けしている。更に、戸籍の書式の枠組
等に従って、各文字群にタグ＜Ｐ＞及び＜／Ｐ＞を付し
て、区分けしている。なお、これらは一例であり、電子
化された文字群のデータの構成は、これに限られず種々
の構成を採用することができ、例えば、より詳細に区分
けしてもよいし、また、大雑把に区分けしてもよいこと
はいうまでもない。

【００２３】次に、文字群のデータに基づいて、項目化
処理を行う（Ｓ３０２）。項目化とは、予め定めた項目
に即して、文字群のデータから必要な情報を選別するこ
とをいう。例えば、「出生日」という項目が定められて
おれば、これに対応する年月日等を文字群のデータから
抽出するのである。ここで、例えば、図４のデータ４０
で示すように構成員の「父」及びその名前「日本一
郎」のようなものを、項目「構成員の父」に対応して抽
出することは、情報の内容が戸籍の書式の枠組と対応し
ており略一律に定まるので、項目化は容易である。

【００２４】しかし、図４のデータ４１や４２で示すよ
うなものは、情報の内容の種類が複数に及び、また、戸
籍の記入者のくせ等もあるので、項目化は必ずしも容易
ではない。そこで、本実施形態では、後述する手順によ
り、データ４１や４２のような文字列から、予め定めた
項目に対応する文字や文字列を抽出する。

【００２５】次に、項目化処理を実行することにより得
たデータに対して完全化処理を行う（Ｓ３０３）。完全
化とは、項目化処理において、項目に該当する文字又は
文字列を抽出できなかった場合や、項目化処理を実行す
ることにより得た文字や文字列において、情報の省略が
されている場合に、適切な文字又は文字列をその項目に
割りあてることをいう。例えば、項目化処理において
「同年参月拾日」という日付の文字列を抽出した場合
に、欠落した元号の部分を「昭和」とし、また、情報が
省略された「同年」の部分を、「平成五年」といったよ
うに完全化する。

【００２６】最後に、項目化処理及び完全化処理を実行
することにより得たデータを出力部１０３から出力し、
例えばディスプレイ上に表示する（Ｓ３０４）。図５は
その表示例を示す図である。

【００２７】＜項目化処理＞次に、上述した項目化処理
におけるＣＰＵ１０２の処理の内容について説明する。
図６は、項目化処理の内容を示したフローチャートであ
る。本実施形態では、戸籍事項と身分事項とを区分けし
て処理を進めるがそうでなくともよい。

【００２８】Ｓ６０１では、Ｓ３０１で作成したテキス
トデータのうち、戸籍事項に属するテキストデータを取
得する。例えば、図４の例では、「平成参年拾月九日編
製」という文字列のテキストデータが取得される。

【００２９】Ｓ６０２では、知識ベースから、解析ルー
ルの選択テーブルを取得して、選択テーブルに記録され
た選択用キーワードによる検索をＳ６０１で取得したテ
キストデータに適用し、その文字列中に選択用キーワー
ドがあるか否かを検索する。図７（ａ）は、戸籍事項用
の選択テーブルを示した図である。

【００３０】選択テーブルには、各解析ルール、選択用
キーワードとＩＤと識別記号とが対応付けて付されて記
録されている。選択用キーワードは、戸籍事項の記載内
容として想定される文字又は文字列を列挙したものであ
る。Ｓ６０２では、選択用キーワードを順次読み出し
て、処理の対象である文字列中にそれが含まれるか否か
を検索する。例えば、図４の例の「平成参年拾月九日編
製」という文字列には、「編製」という選択用キーワー
ドを含むので、「ＨＥＮＳＥＩ」という解析ルールが検
索される。

【００３１】Ｓ６０３では、Ｓ６０２の検索結果に基づ
いて、処理中の文字列に対する解析ルールを選択する。
例えば、図４の例の「平成参年拾月九日編製」という文
字列では、「ＨＥＮＳＥＩ」という解析ルールが選択さ
れることとなる。解析ルールが選択されると、その文字
列の先頭に、選択テーブルに記録された識別記号が付さ
れる。例えば、図４の例の「平成参年拾月九日編製」と
いう文字列では、そのテキストデータが、「hensei平成
参年拾月九日編製」となる。

【００３２】Ｓ６０４では、Ｓ６０３で選択された解析
ルールに基づいて、処理中の文字列から、予め定めた項
目に対応する文字又は文字列を抽出する。具体的には、
まず、Ｓ６０３において識別記号が付された処理中の文
字列の当該識別記号を参照して、知識ベースから選択さ
れた解析ルールのテーブルを取得する。図８（ａ）及び
（ｂ）は、解析ルールのテーブルの例を示した図であ
り、図８（ａ）は編製ルール（図７（ａ）の「ＨＥＮＳ
ＥＩ」に相当する。）のテーブルを、図８（ｂ）は氏変
更ルール（図７（ａ）の「ＨＥＮＫＯＵ＿ＴＯＤＯＫＥ
ＤＥ」に相当する。）のテーブルを、それぞれ示してい
る。

【００３３】解析ルールは、戸籍の記載事項に応じて定
められており、処理の手順と、抽出すべき項目に対応し
た解析用キーワードとが定められている。解析用キーワ
ードは、戸籍の記載内容として想定される文字又は文字
列を列挙したものである。尤もこの解析用キーワードと
して、任意の文字又は文字列に対応したものを定めても
よく、例えば、解析用キーワードが「＊＊＊」であれ
ば、３文字の任意の文字列が該当するようにしてもよ
い。

【００３４】図８の解析ルールのテーブルには、処理中
の文字列の注目すべき箇所の順番を示した注目点と、そ
の注目点に対する処理の内容と、処理に用いる解析用キ
ーワードと、処理の結果抽出した文字又は文字列に対す
る項目の格納先を示したデータ格納先とが記録されてい
る。

【００３５】処理には、主として、サブの解析ルールの
呼び出しと抽出とチェックとがある。サブの解析ルール
とは、各解析ルールにおいて用いられることが多い処理
を別途定義したものであり、例えば、日付の抽出や氏名
の抽出等である。図９（ａ）乃至（ｄ）は、サブの解析
ルールの例を示した図であり、それぞれ日付ルール、場
所ルール、資格ルール、氏名ルールを示している。

【００３６】抽出は、処理の対象である文字列中に解析
用キーワードがあれば、これを予め定めた項目の格納先
に格納するものである。チェックは、処理の対象である
文字列中に解析用キーワードがあるか否かを判定し、あ
れば注目点を進め、なければエラーを返すといった処理
を行うものである。

【００３７】Ｓ６０４の処理に戻って、例えば、図４の
例の「平成参年拾月九日編製」という文字列から、編製
ルールのテーブル（図８（ａ））に基づいて、文字又は
文字列を抽出する場合について説明する。編製ルールの
テーブルでは、最初に日付ルールを適用することが定め
られている。そこで、図９（ａ）の日付ルールのテーブ
ルが呼び出される。

【００３８】日付ルールでは、最初に解析用キーワード
「明治」、「大正」等の抽出が定められている。これら
のキーワードが文字列中にあれば、これを［元号]に格
納する。その後、注目点２へ処理が進められる。そし
て、解析用キーワード「壱」、「一」等の抽出が定めら
れており、これらのキーワードが文字列中にあれば、こ
れを[年数字]に格納する。その後、注目点３へ進めら
れ、解析用キーワード「年」があるか否かを判定し、あ
れば注目点４へ進む。この場合、データの格納はしな
い。同様にして処理を進めて、注目点７の処理で解析用
キーワード「日」が文字列中にあるかをチェックして、
あれば編製ルールへ戻り、［編製日］に日付ルールで取
得した各データがまとめて一連にされて又は区分けされ
たまま格納される。ここでは、「平成参年拾月九日」と
いう文字列を示すデータが格納先である［編製日］に格
納されることとなる。

【００３９】次に、編製ルールのテーブルにおいて、注
目点２へ処理が進められ、「編製」という文字があるか
否かがチェックされてＳ６０４の処理が終了する。

【００４０】別の例として、氏変更ルールが選択された
場合について説明する。処理の対象となる文字列として
は、例えば、「平成拾年七月拾参日戸籍法七十三条の二
の届出」を想定する。氏変更ルールのテーブル（図８
（ｂ））では、最初に日付ルールを適用することが定め
られている。そこで、図９（ａ）の日付ルールのテーブ
ルが呼び出され、上述した手順により、日付ルールが実
行されて抽出された文字列が［氏変更日］に格納され
る。ここでは、「平成拾年七月拾参日」という文字列を
示すデータが格納されることとなる。

【００４１】次に、注目点２に処理が進められ、解析用
キーワード「戸籍法」という文字列があるか否かがチェ
ックされて注目点３に処理が進む。注目点３の処理で
は、処理対象である文字列から、「７３条の２」や「７
７条の２」といった氏変更の種別を示す解析用キーワー
ドが抽出され、［氏変更の種別］に格納される。最後
に、注目点４へ進み、解析用キーワード「の届出」とい
う文字列があるか否かがチェックされて処理が終了す
る。

【００４２】なお、解析ルールの適用がうまくいかなか
った場合、例えば、「チェック」処理でエラーが返され
た場合には、同じ処理対象の文字列に再度他の解析ルー
ルを適用するようにしてもよい。この場合、同じ戸籍の
記載事項に対応するが、処理の手順や、解析用キーワー
ドが異なる解析ルールを用意しておき、これを順に適用
してもよい。例えば、氏変更ルールとして、処理の手順
や解析用キーワードが相互に異なる氏変更ルール１、氏
変更ルール２を用意したり、日付ルールとして、日付ル
ール１、日付ルール２、日付ルール３．．．とすること
もできる。

【００４３】図６のフローチャートに戻り、Ｓ６０５で
は、Ｓ３０１で作成した戸籍事項に属するテキストデー
タのうち、未処理のデータがあるか否かを判定し、あれ
ばＳ６０１へ戻り上述した手順を繰り返す。Ｓ６０１乃
至Ｓ６０５の処理を繰り返すことにより、戸籍事項に属
するテキストデータが順に処理されることとなる。

【００４４】次に、Ｓ６０６へ進み、身分事項に関する
データの処理へ移行する。Ｓ６０６からＳ６１０までの
処理は、上述したＳ６０１からＳ６０５の処理と基本的
に同じである。Ｓ６０６では、Ｓ３０１で作成したテキ
ストデータのうち、身分事項に属するテキストデータを
取得する。なお、身分事項に関するデータの処理では、
各構成員単位で処理を進めてもよい。

【００４５】Ｓ６０７では、知識ベースから、解析ルー
ルの選択テーブルを取得して、選択テーブルに記録され
た選択用キーワードによる検索をＳ６０６で取得したテ
キストデータに適用し、その文字列中に選択用キーワー
ドがあるか否かを検索する。図７（ｂ）は、身分事項用
の選択テーブルを示した図である。

【００４６】Ｓ６０８では、Ｓ６０７の検索結果に基づ
いて、処理中の文字列に対する解析ルールを選択する。
例えば、図４の例の「昭和参拾九年五月拾弐日東京都中
央区で出生同月拾八日父届出入籍」（データ４２）とい
う文字列では、「ＳＨＵＳＳＥＩ＿ＴＯＤＯＫＥＤＥ」
という解析ルールが選択されることとなる。解析ルール
が選択されると、その文字列の先頭に、選択テーブルに
記録された識別記号が付され、この例では、「shussei
昭和参拾九年五月拾弐日東京都中央区で出生同月拾八日
父届出入籍」となる。

【００４７】Ｓ６０９では、Ｓ６０８で選択された解析
ルールに基づいて、処理中の文字列から、予め定めた項
目に対応する文字又は文字列を抽出する。具体的には、
まず、Ｓ６０８において識別記号が付された処理中の文
字列の当該識別記号を参照して、知識ベースから選択さ
れた解析ルールのテーブルを取得する。図１０（ａ）乃
至（ｄ）は、身分事項用の解析ルールのテーブルの例を
示した図であり、図１０（ａ）は出生ルール（図７
（ｂ）の「ＳＨＵＳＳＥＩ＿ＴＯＤＯＫＥＤＥ」に相当
する。）のテーブルを、図１０（ｂ）は認知ルール（図
７（ｂ）の「ＮＩＮＣＨＩ＿ＴＯＤＯＫＥＤＥ」に相当
する。）のテーブルを、図１０（ｃ）は婚姻ルール（図
７（ｂ）の「ＫＯＮＩＮＲＩＫＯＮ＿ＴＯＤＯＫＥＤ
Ｅ」に相当する。）のテーブルを、図１０（ｄ）は養子
縁組ルール（図７（ｂ）の「ＹＯＳＨＩ＿ＴＯＤＯＫＥ
ＤＥ」に相当する。）のテーブルを、それぞれ示してい
る。

【００４８】なお、図７（ｂ）における解析ルール「Ｄ
ｒｏｐ」は、戸籍更新時に不要な記載事項に対して適用
されるルールであり、このルールの適用により、その記
載事項は項目化の対象とならず、データは破棄される。

【００４９】次に、Ｓ６０９における具体的な処理の例
を説明する。図４の例の「昭和参拾九年五月拾弐日東京
都中央区で出生同月拾八日父届出入籍」（データ４２）
に出生ルールのテーブル（図１０（ａ））を適用する場
合を想定する。出生ルールのテーブル（図１０（ａ））
では、最初に日付ルールを適用することが定められてい
る。そこで、図９（ａ）の日付ルールのテーブルが呼び
出され、上述した手順により、日付ルールが実行されて
抽出された文字列が［出生日］に格納される。ここで
は、「昭和参拾九年五月拾弐日」という文字列を示すデ
ータが格納されることとなる。

【００５０】次に、注目点２に処理が進められ、場所ル
ールを適用することが定められているので、図９（ｂ）
の場所ルールのテーブルが呼び出される。場所ルールの
テーブルでは、最初に解析用キーワード「北海道」、
「青森県」等の抽出が定められている。これらのキーワ
ードが文字列中にあれば、これを［都道府県]に格納す
る。その後、注目点２へ処理が進められる。そして、解
析用キーワード「札幌市」、「新宿区」等の抽出が定め
られており、これらのキーワードが文字列中にあれば、
これを[市町村区]に格納する。その後、出生ルールのテ
ーブルに戻り、場所ルールで取得したデータが［出生
地］へ格納される。ここでは、「東京都中央区」という
文字列を示すデータが［出生地］へ格納されることとな
る。

【００５１】次に、注目点３の処理では、解析用キーワ
ード「で出生」という文字列があるか否かがチェックさ
れて注目点４に処理が進む。注目点４の処理では、日付
ルールのテーブルが呼び出され、「同月拾八日」という
文字列が［届出日］に格納される。注目点５の処理へ進
み、資格ルールのテーブル（図９（ｃ））が呼び出さ
れ、処理中の文字列に解析キーワード「夫」、「母」等
があるか否かが判定され、あれば［資格名称］に格納さ
れる。その後、資格ルールで取得されたデータが［届出
人］へ格納され。ここでは、「父」という文字列を示す
データが［届出人］に格納されることとなる。

【００５２】最後に注目点６へ進み、解析用キーワード
「届出」という文字列があるか否かがチェックされて処
理が終了する。

【００５３】別の例として、養子縁組ルールが選択され
た場合について説明する。処理の対象となる文字列とし
ては、例えば、「平成五年八月六日日本太郎日本花子の
養子となる縁組届出千葉県千葉市佐藤一男戸籍から入
籍」を想定する。養子縁組ルールのテーブル（図１０
（ｄ））では、最初に日付ルールを適用することが定め
られている。そこで、図９（ａ）の日付ルールのテーブ
ルが呼び出され、上述した手順により、日付ルールが実
行されて抽出された文字列が［縁組日］に格納される。
ここでは、「平成五年八月六日」という文字列を示すデ
ータが格納されることとなる。

【００５４】注目点２の処理では、図９（ｄ）の氏名ル
ールのテーブルが呼び出され、抽出された氏名が［Ｐ
１］に格納される。注目点３の処理でも、図９（ｄ）の
氏名ルールのテーブルが呼び出され、抽出された氏名が
［Ｐ２］に格納される。ここでは、「日本太郎」、「日
本花子」という文字列を示すデータが格納されることと
なる。注目点４の処理では、処理中の文字列に解析用キ
ーワード「養子となる」があるか否かがチェックされ、
あれば先の［Ｐ１］及び［Ｐ２］のデータが、それぞれ
［養父氏名］及び［養母氏名］に転送されて格納され
る。ここでは、「日本太郎」、「日本花子」という文字
列を示すデータが、［養父氏名］、［養母氏名］にそれ
ぞれ格納されることとなる。

【００５５】注目点５の処理では、処理中の文字列に解
析用キーワード「縁組届出」があるか否かがチェックさ
れ、あれば注目点６の処理へ進み、図９（ｂ）の場所ル
ールのテーブルが呼び出される。場所ルールの適用によ
り得られたデータは、［従前戸籍］に格納される。ここ
では、「千葉県千葉市」という文字列を示すデータが格
納されることとなる。

【００５６】注目点７の処理では、図９（ｄ）の氏名ル
ールのテーブルが呼び出され、得られたデータが［従前
戸籍筆頭者］に格納される。ここでは、「佐藤一男」と
いう文字列を示すデータが格納されることとなる。

【００５７】注目点８及び９では、それぞれ、処理中の
文字列に解析用キーワード「戸籍から」、「入籍」があ
るか否かが順次チェックされ、いずれもある場合は処理
が終了する。

【００５８】＜完全化処理＞次に、上述した完全化処理
におけるＣＰＵ１０２の処理の内容について説明する。
図１１は、完全化処理の内容を示したフローチャートで
ある。ここで、上述した項目化処理により、Ｓ３０１で
作成したテキストデータは、項目化データとしてデータ
メモリ１０５に格納されている。図１２（ａ）は、図４
の例の「昭和参拾九年五月拾弐日東京都中央区で出生同
月拾八日父届出入籍」（データ４２）という文字列に、
上述した項目化処理を実行することにより得た項目化デ
ータの一例を示した図である。以下、この項目化データ
の場合を例にとって図１１のフローチャートを説明す
る。

【００５９】Ｓ１１０１では、上述した項目化処理によ
り項目化されたデータを取得する。例えば、図１２
（ａ）のデータが取得される。Ｓ１１０２では、取得し
た項目化データの文字又は文字列において、情報の欠落
・省略があるか否かを判定する。この判定は、例えば、
空欄になっている項目があるか否かや、項目化データの
文字又は文字列に特定の文字又は文字列があるか否かに
基づいて判定することができる。そのような特定の文字
等としては、例えば、「同」、「父」、「母」、
「夫」、「妻」等である。

【００６０】図１２（ｂ）は、図１２（ａ）の項目化デ
ータに情報欠落・省略の有無の判定結果を付したデータ
テーブルを示す図である。同図の「欠落・省略の有無」
欄には、情報省略と判定したデータに「有」が付されて
おり、その他のデータには「無」が付されており、デー
タが「ｎｕｌｌ」（空欄）の場合や、「同」或いは
「父」の場合に、「有」が付されていることが分かる。

【００６１】図１１のフローチャートに戻り、Ｓ１１０
３では、全ての項目化データについてＳ１１０２の処理
を行った否かを判定し、未処理の項目化データがあれば
Ｓ１１０１へ戻る。

【００６２】Ｓ１１０４では、Ｓ１１０２において情報
の欠落・省略があったと判定された項目化データを順に
取得する。例えば、図１２（ｂ）のデータが取得され
る。Ｓ１１０５では、取得した項目化データの修正を行
いデータを完全化する。

【００６３】完全化の具体的な方法としては、例えば以
下の方法（１）乃至（５）が挙げられる。この場合、い
ずれか一つの方法を採用してもよいし、適切なデータが
得られるまで順に適用していってもよい。また、省略の
態様（「ｎｕｌｌ］、「同」、「父」、「母」、
「夫」、「妻」等）により以下の方法のいずれかの方法
を自動選択するようにしてもよい。

【００６４】（１）情報が省略された文字又は文字列の
項目と同種の項目について抽出された文字又は文字列を
検索し、これに基づいて完全化する。特に、同じ処理対
象の文字列の、直前の同種の項目について抽出された文
字又は文字列を検索し、これに基づいて完全化すること
が好適である。

【００６５】例えば、日付や場所に関する文字又は文字
列の省略の場合は、直前の日付や場所に関する項目化デ
ータを検索してこれに基づいて完全化する。図１２
（ａ）の例で言えば、［届出日］の「元号」と「年」と
が欠落しているので（「ｎｕｌｌ」）、直前の日付デー
タである［出生日］を検索し、その元号「昭和」と年
「参拾九」とをこれに適用する。また、［届出日］の
「月」が省略されているので（「同」）、直前の日付デ
ータである［出生日］を検索し、その月「五」をこれに
適用する。

【００６６】（２）同じ処理対象の文字列に含まれる文
字又は文字列を検索し、これに基づいて完全化する。

【００６７】（３）同じ戸籍に含まれる他の文字又は文
字列を検索し、これに基づいて完全化する。図１２
（ａ）の例で言えば、［届出人］の名前が省略されてい
るので（「父」）、その構成員（この例では日本太郎）
の父親のデータを検索し（戸籍の「父」の欄）、「日本
一郎」をこれに適用する。

【００６８】（４）他の戸籍に含まれる文字又は文字列
を検索して、これに基づいて完全化する。

【００６９】（５）辞書データ等を用いて検索し、これ
に基づいて完全化する。

【００７０】このような方法により、図１２（ａ）の項
目化データを完全化した例を図１２（ｃ）に示す。

【００７１】図１１のフローチャートに戻り、Ｓ１１０
６では、、Ｓ１１０２において情報省略があったと判定
された全ての項目化データについてＳ１１０５の処理を
行った否かを判定し、未処理の項目化データがあればＳ
１１０４へ戻る。なければ完全化処理が終了する。

【００７２】以上説明したとおり、本実施形態では、戸
籍の記載内容の項目化が自動化され、戸籍の記載事項を
電子化するにあたり、効率的な項目化を実現することが
できる。また、解析テーブルの設定の仕方により、様々
な戸籍の記載事項に対応でき、更に、戸籍の記入者のく
せ等にも対応することができる。

【００７３】また、項目化されたデータの完全化を行う
ことにより、項目に対応するデータが欠落している場合
や、情報が省略された戸籍の記載に対応することができ
るので、オペレータの処理を軽減し、戸籍の記載事項の
電子化を効率よく行うことができる。

【００７４】なお、上記実施形態では、項目化処理の後
に完全化処理を行ったが、同様の考え方により、完全化
処理を先に行ってから項目化処理を実行するようにして
もよい。また、情報の省略は、日付、場所、人名に関す
るデータにおいて行われ易いことから、これらのデータ
についてのみ完全化処理を行うようにしてもよい。

【００７５】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウエアのプログラムコードを、
例えば、これを記録した記憶媒体（または記録媒体）等
を介して、システムあるいは装置に供給し、そのシステ
ムあるいは装置のコンピュータ（またはCPUやMPU）が、
該プログラムコードを実行することによっても、達成さ
れることは言うまでもない。この場合、そのプログラム
コード自体が前述した実施形態の機能を実現することに
なり、そのプログラムコード、及び、これを記憶した記
憶媒体は本発明を構成することになる。また、コンピュ
ータが読み出したプログラムコードを実行することによ
り、前述した実施形態の機能が実現されるだけでなく、
そのプログラムコードの指示に基づき、コンピュータ上
で稼働しているオペレーティングシステム(OS)などが実
際の処理の一部または全部を行い、その処理によって前
述した実施形態の機能が実現される場合も含まれること
は言うまでもない。

【００７６】さらに、プログラムコードが、コンピュー
タに挿入された機能拡張カードやコンピュータに接続さ
れた機能拡張ユニットに備わるメモリに書込まれた後、
そのプログラムコードの指示に基づき、その機能拡張カ
ードや機能拡張ユニットに備わるCPUなどが実際の処理
の一部または全部を行い、その処理によって前述した実
施形態の機能が実現される場合も含まれることは言うま
でもない。

【００７７】

【発明の効果】以上説明したように、本発明によれば、
戸籍の記載事項を電子化するにあたり、効率的な処理を
実現することができる。

【図面の簡単な説明】

【図１】本発明の一実施形態に係る戸籍情報処理装置の
ハードウエア構成例を示すブロック図である。

【図２】戸籍の例を示す図である。

【図３】処理の全体的な流れを示すフローチャートであ
る。

【図４】テキスト形式で電子化した文字群の一例を示す
図である。

【図５】処理結果の表示例を示す図である。

【図６】項目化処理の内容を示したフローチャートであ
る。

【図７】（ａ）は、戸籍事項用の選択テーブルを示した
図である。（ｂ）は、身分事項用の選択テーブルを示し
た図である。

【図８】（ａ）及び（ｂ）は、戸籍事項用の解析ルール
のテーブルの一例を示した図である。

【図９】（ａ）乃至（ｄ）は、サブの解析ルールのテー
ブルの一例を示した図である。

【図１０】（ａ）乃至（ｄ）は、身分事項用の解析ルー
ルのテーブルの一例を示した図である。

【図１１】完全化処理の内容を示したフローチャートで
ある。

【図１２】（ａ）は、項目化処理により得た項目化デー
タの例、（ｂ）は、（ａ）の項目化データに対して、Ｓ
１１０２の処理を実行することにより得たデータの例、
（ｃ）は、（ａ）の項目化データを完全化した場合のデ
ータの例、を示す。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 17/60 １５４Ｇ０６Ｆ 17/60 １５４Ｆターム(参考） 5B009 LA01 MB21 ME17 NA04 QA02 QA04 QB12 QB16 VA09 5B075 ND03 ND06 ND23 ND36 NK44 PP04 UU08

Claims

【特許請求の範囲】

【請求項１】戸籍の記載内容を表した文字列を処理す
る戸籍情報処理装置であって、処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段と、抽出された文字又は文字列において、情報の省略がある
か否かを判定する判定手段と、情報の省略があると判定された場合に、前記抽出された
文字又は文字列を、情報の省略がない文字又は文字列に
完全化する完全化手段と、を備えたことを特徴とする戸
籍情報処理装置。
【請求項２】前記完全化手段は、同じ戸籍に含まれる他の文字または文字列に基づいて、
前記抽出された文字又は文字列を、情報の省略がない文
字又は文字列に完全化することを特徴とする請求項１に
記載の戸籍情報処理装置。
【請求項３】前記完全化手段は、同じ処理対象の前記文字列に含まれる他の文字または文
字列に基づいて、前記抽出された文字又は文字列を、情
報の省略がない文字又は文字列に完全化することを特徴
とする請求項１に記載の戸籍情報処理装置。
【請求項４】前記完全化手段は、前記抽出された文字又は文字列の前記項目と同種の項目
について抽出された文字または文字列に基づいて、前記
抽出された文字又は文字列を、情報の省略がない文字又
は文字列に完全化することを特徴とする請求項１に記載
の戸籍情報処理装置。
【請求項５】前記判定手段は、抽出された文字又は文字列が、特定の文字を含む場合
に、情報の省略があると判定することを特徴とする請求
項１に記載の戸籍情報処理装置。
【請求項６】前記特定の文字には、「同」、「父」、
「母」、「夫」又は「妻」のいずれかが含まれることを
特徴とする請求項５に記載の戸籍情報処理装置。
【請求項７】前記判定手段は、抽出された文字又は文字列のうち、日付、場所、又は、
人名を示す文字又は文字列について、情報の省略がある
か否かを判定することを特徴とする請求項１に記載の戸
籍情報処理装置。
【請求項８】更に、戸籍の記載事項に応じて定められた複数種類の解析ルー
ルと、各々の前記解析ルールに付された少なくとも一つ
のルール選択用キーワードと、を記憶する記憶デバイス
又は記憶媒体からこれらを取得する手段を備え、前記抽出手段は、処理対象の前記文字列に含まれる前記ルール選択用キー
ワードを検索する検索手段と、検索した前記ルール選択用キーワードに対応する前記解
析ルールに基づいて、処理対象の前記文字列から予め定
めた項目に対応する文字又は文字列を抽出する処理手段
と、を備えたことを特徴とする請求項１に記載の戸籍情
報処理装置。
【請求項９】戸籍の記載内容を表した文字列を処理す
るために、コンピュータを、処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段、抽出された文字又は文字列において、情報の省略がある
か否かを判定する判定手段、情報の省略があると判定された場合に、前記抽出された
文字又は文字列を、情報の省略がない文字又は文字列に
完全化する完全化手段、として機能させるプログラム。
【請求項１０】戸籍の記載内容を表した文字列を処理
する戸籍情報処理装置であって、処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段と、前記文字又は文字列が抽出されていない前記項目がある
か否かを判定する判定手段と、前記文字又は文字列が抽出されていない前記項目がある
場合に、当該項目に該当する文字又は文字列を検索する
手段と、を備えたことを特徴とする戸籍情報処理装置。
【請求項１１】戸籍の記載内容を表した文字列を処理
するために、コンピュータを、処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段、前記文字又は文字列が抽出されていない前記項目がある
か否かを判定する判定手段、前記文字又は文字列が抽出されていない前記項目がある
場合に、当該項目に該当する文字又は文字列を検索する
手段、として機能させるプログラム。
【請求項１２】戸籍の記載内容を表した文字列を処理
する戸籍情報処理方法であって、処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出工程と、抽出された文字又は文字列において、情報の省略がある
か否かを判定する判定工程と、情報の省略があると判定された場合に、前記抽出された
文字又は文字列を、情報の省略がない文字又は文字列に
完全化する完全化工程と、を備えたことを特徴とする戸
籍情報処理方法。
【請求項１３】戸籍の記載内容を表した文字列を処理
する戸籍情報処理方法であって、処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出工程と、前記文字又は文字列が抽出されていない前記項目がある
か否かを判定する判定工程と、前記文字又は文字列が抽出されていない前記項目がある
場合に、当該項目に該当する文字又は文字列を検索する
工程と、を備えたことを特徴とする戸籍情報処理方法。