JP2002288194A - 戸籍情報処理装置及び方法、プログラム - Google Patents
戸籍情報処理装置及び方法、プログラムInfo
- Publication number
- JP2002288194A JP2002288194A JP2001085529A JP2001085529A JP2002288194A JP 2002288194 A JP2002288194 A JP 2002288194A JP 2001085529 A JP2001085529 A JP 2001085529A JP 2001085529 A JP2001085529 A JP 2001085529A JP 2002288194 A JP2002288194 A JP 2002288194A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- family register
- extracted
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
的な処理を実現すること。 【解決手段】 戸籍の記載内容を表した文字列を処理す
る戸籍情報処理装置であって、処理対象の前記文字列か
ら予め定めた項目に対応する文字又は文字列を抽出する
抽出手段と、抽出された文字又は文字列において、情報
の省略があるか否かを判定する判定手段と、情報の省略
があると判定された場合に、前記抽出された文字又は文
字列を、情報の省略がない文字又は文字列に完全化する
完全化手段と、を備えたことを特徴とする。
Description
電子化する技術に関するものである。
されるものであった。しかし、戸籍法改正により、戸籍
の電子化が許可され、コンピュータ上のデータベースに
より管理することが可能となった。戸籍の電子化技術と
しては、例えば、実用新案登録第3032743号や、特開平0
9-114901号に記載された技術が提案されている。
にあっては、単に戸籍の記載内容をデータ化するのみな
らず、管理が容易な形式に項目分けしてデータの選別を
することが好ましい。また、このように項目化されたデ
ータは、戸籍情報として適切なものである必要もある。
これらは、従来の技術では不可能であるか、若しくは、
オペレータの手作業に依存する割合が大きく、効率的な
処理は実現されていない。
を電子化するにあたり、効率的な処理を実現し得る戸籍
の情報処理技術を提供することにある。
記載内容を表した文字列を処理する戸籍情報処理装置で
あって、処理対象の前記文字列から予め定めた項目に対
応する文字又は文字列を抽出する抽出手段と、抽出され
た文字又は文字列において、情報の省略があるか否かを
判定する判定手段と、情報の省略があると判定された場
合に、前記抽出された文字又は文字列を、情報の省略が
ない文字又は文字列に完全化する完全化手段と、を備え
たことを特徴とする戸籍情報処理装置が提供される。
表した文字列を処理するために、コンピュータを、処理
対象の前記文字列から予め定めた項目に対応する文字又
は文字列を抽出する抽出手段、抽出された文字又は文字
列において、情報の省略があるか否かを判定する判定手
段、情報の省略があると判定された場合に、前記抽出さ
れた文字又は文字列を、情報の省略がない文字又は文字
列に完全化する完全化手段、として機能させるプログラ
ムが提供される。
表した文字列を処理する戸籍情報処理装置であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出手段と、前記文字又は文字列
が抽出されていない前記項目があるか否かを判定する判
定手段と、前記文字又は文字列が抽出されていない前記
項目がある場合に、当該項目に該当する文字又は文字列
を検索する手段と、を備えことを特徴とする戸籍情報処
理装置が提供される。
表した文字列を処理するために、コンピュータを、処理
対象の前記文字列から予め定めた項目に対応する文字又
は文字列を抽出する抽出手段、前記文字又は文字列が抽
出されていない前記項目があるか否かを判定する判定手
段、前記文字又は文字列が抽出されていない前記項目が
ある場合に、当該項目に該当する文字又は文字列を検索
する手段、として機能させるプログラムが提供される。
表した文字列を処理する戸籍情報処理方法であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出工程と、抽出された文字又は
文字列において、情報の省略があるか否かを判定する判
定工程と、情報の省略があると判定された場合に、前記
抽出された文字又は文字列を、情報の省略がない文字又
は文字列に完全化する完全化工程と、を備えたことを特
徴とする戸籍情報処理方法が提供される。
表した文字列を処理する戸籍情報処理方法であって、処
理対象の前記文字列から予め定めた項目に対応する文字
又は文字列を抽出する抽出工程と、前記文字又は文字列
が抽出されていない前記項目があるか否かを判定する判
定工程と、前記文字又は文字列が抽出されていない前記
項目がある場合に、当該項目に該当する文字又は文字列
を検索する工程と、を備えたことを特徴とする戸籍情報
処理方法が提供される。
について、図面を参照して説明する。
報処理装置のハードウエア構成例を示すブロック図であ
る。
ものであり、例えば、操作者がデータを入力するための
マウス、キーボード、或いは、スキャナや他のコンピュ
ータ等からデータを入力するためのインターフェース等
を含む。
制御を行い、後述する処理を実行するプロセッサであ
る。出力部103は、CPU102の処理結果等を出力
するためのものであり、例えば、ディスプレイである。
プログラムメモリ104は、CPU102が実行するプ
ログラムを格納したメモリであり、代表的にはROMや
RAMであるが、データを記憶可能なものであれば何で
もよい。
データを格納するほか、戸籍を解析するための種々の情
報を有する知識ベースも格納する。知識ベースには、図
7に示すような解析ルールの選択テーブル、図8乃至図
10に示すような解析ルールのテーブルが含まれる。こ
れらの内容については後述する。
であるが、データを記憶可能なものであれば何でもよ
い。また、知識ベースは、装置内部又は外部の、例え
ば、ハードディスク、CD−ROM、光磁気ディスク、
RAM、ROMといった記憶デバイス又は記憶媒体に格
納しておき、それらアクセスして取得するようにしても
よい。
いる。このように本実施形態の戸籍情報処理装置は、パ
ソコンと同等のハードウエア構成で足りる。
である。戸籍は、通常、本籍/筆頭者氏名欄200と、
構成員全員に共通する事項が記入される戸籍事項欄20
1と、構成員に関する事項が記入される身分事項欄20
2と、から構成されている。
体的な流れを示すフローチャートである。
301)。電子化は、例えば、スキャナで戸籍を読み取
ってその画像データをOCR変換してもよいし、オペレ
ータがキーボード等から手入力で行ってもよい。本実施
形態では、戸籍に記載された文字群をテキスト形式で電
子化する。図4は、図2の戸籍の一部の文字群をテキス
ト形式で電子化したデータの一例を示す図である。
毎にタグを付して区分けしており、本籍/筆頭者氏名欄
200には、タグ<本籍筆頭>及び</本籍筆頭>を、
戸籍事項欄201には、タグ<戸籍事項>及び</戸籍
事項>を、身分事項欄202には、タグ<身分事項>及
び</身分事項>(図示せず)を、割りあてている。
は、各構成員毎に、タグ<構成員1>及び</構成員1
>等を付して区分けしている。更に、戸籍の書式の枠組
等に従って、各文字群にタグ<P>及び</P>を付し
て、区分けしている。なお、これらは一例であり、電子
化された文字群のデータの構成は、これに限られず種々
の構成を採用することができ、例えば、より詳細に区分
けしてもよいし、また、大雑把に区分けしてもよいこと
はいうまでもない。
処理を行う(S302)。項目化とは、予め定めた項目
に即して、文字群のデータから必要な情報を選別するこ
とをいう。例えば、「出生日」という項目が定められて
おれば、これに対応する年月日等を文字群のデータから
抽出するのである。ここで、例えば、図4のデータ40
で示すように構成員の「父」及びその名前「日本 一
郎」のようなものを、項目「構成員の父」に対応して抽
出することは、情報の内容が戸籍の書式の枠組と対応し
ており略一律に定まるので、項目化は容易である。
うなものは、情報の内容の種類が複数に及び、また、戸
籍の記入者のくせ等もあるので、項目化は必ずしも容易
ではない。そこで、本実施形態では、後述する手順によ
り、データ41や42のような文字列から、予め定めた
項目に対応する文字や文字列を抽出する。
たデータに対して完全化処理を行う(S303)。完全
化とは、項目化処理において、項目に該当する文字又は
文字列を抽出できなかった場合や、項目化処理を実行す
ることにより得た文字や文字列において、情報の省略が
されている場合に、適切な文字又は文字列をその項目に
割りあてることをいう。例えば、項目化処理において
「同年参月拾日」という日付の文字列を抽出した場合
に、欠落した元号の部分を「昭和」とし、また、情報が
省略された「同年」の部分を、「平成五年」といったよ
うに完全化する。
することにより得たデータを出力部103から出力し、
例えばディスプレイ上に表示する(S304)。図5は
その表示例を示す図である。
におけるCPU102の処理の内容について説明する。
図6は、項目化処理の内容を示したフローチャートであ
る。本実施形態では、戸籍事項と身分事項とを区分けし
て処理を進めるがそうでなくともよい。
トデータのうち、戸籍事項に属するテキストデータを取
得する。例えば、図4の例では、「平成参年拾月九日編
製」という文字列のテキストデータが取得される。
ルの選択テーブルを取得して、選択テーブルに記録され
た選択用キーワードによる検索をS601で取得したテ
キストデータに適用し、その文字列中に選択用キーワー
ドがあるか否かを検索する。図7(a)は、戸籍事項用
の選択テーブルを示した図である。
キーワードとIDと識別記号とが対応付けて付されて記
録されている。選択用キーワードは、戸籍事項の記載内
容として想定される文字又は文字列を列挙したものであ
る。S602では、選択用キーワードを順次読み出し
て、処理の対象である文字列中にそれが含まれるか否か
を検索する。例えば、図4の例の「平成参年拾月九日編
製」という文字列には、「編製」という選択用キーワー
ドを含むので、「HENSEI」という解析ルールが検
索される。
いて、処理中の文字列に対する解析ルールを選択する。
例えば、図4の例の「平成参年拾月九日編製」という文
字列では、「HENSEI」という解析ルールが選択さ
れることとなる。解析ルールが選択されると、その文字
列の先頭に、選択テーブルに記録された識別記号が付さ
れる。例えば、図4の例の「平成参年拾月九日編製」と
いう文字列では、そのテキストデータが、「hensei平成
参年拾月九日編製」となる。
ルールに基づいて、処理中の文字列から、予め定めた項
目に対応する文字又は文字列を抽出する。具体的には、
まず、S603において識別記号が付された処理中の文
字列の当該識別記号を参照して、知識ベースから選択さ
れた解析ルールのテーブルを取得する。図8(a)及び
(b)は、解析ルールのテーブルの例を示した図であ
り、図8(a)は編製ルール(図7(a)の「HENS
EI」に相当する。)のテーブルを、図8(b)は氏変
更ルール(図7(a)の「HENKOU_TODOKE
DE」に相当する。)のテーブルを、それぞれ示してい
る。
められており、処理の手順と、抽出すべき項目に対応し
た解析用キーワードとが定められている。解析用キーワ
ードは、戸籍の記載内容として想定される文字又は文字
列を列挙したものである。尤もこの解析用キーワードと
して、任意の文字又は文字列に対応したものを定めても
よく、例えば、解析用キーワードが「***」であれ
ば、3文字の任意の文字列が該当するようにしてもよ
い。
の文字列の注目すべき箇所の順番を示した注目点と、そ
の注目点に対する処理の内容と、処理に用いる解析用キ
ーワードと、処理の結果抽出した文字又は文字列に対す
る項目の格納先を示したデータ格納先とが記録されてい
る。
呼び出しと抽出とチェックとがある。サブの解析ルール
とは、各解析ルールにおいて用いられることが多い処理
を別途定義したものであり、例えば、日付の抽出や氏名
の抽出等である。図9(a)乃至(d)は、サブの解析
ルールの例を示した図であり、それぞれ日付ルール、場
所ルール、資格ルール、氏名ルールを示している。
用キーワードがあれば、これを予め定めた項目の格納先
に格納するものである。チェックは、処理の対象である
文字列中に解析用キーワードがあるか否かを判定し、あ
れば注目点を進め、なければエラーを返すといった処理
を行うものである。
例の「平成参年拾月九日編製」という文字列から、編製
ルールのテーブル(図8(a))に基づいて、文字又は
文字列を抽出する場合について説明する。編製ルールの
テーブルでは、最初に日付ルールを適用することが定め
られている。そこで、図9(a)の日付ルールのテーブ
ルが呼び出される。
「明治」、「大正」等の抽出が定められている。これら
のキーワードが文字列中にあれば、これを[元号]に格
納する。その後、注目点2へ処理が進められる。そし
て、解析用キーワード「壱」、「一」等の抽出が定めら
れており、これらのキーワードが文字列中にあれば、こ
れを[年数字]に格納する。その後、注目点3へ進めら
れ、解析用キーワード「年」があるか否かを判定し、あ
れば注目点4へ進む。この場合、データの格納はしな
い。同様にして処理を進めて、注目点7の処理で解析用
キーワード「日」が文字列中にあるかをチェックして、
あれば編製ルールへ戻り、[編製日]に日付ルールで取
得した各データがまとめて一連にされて又は区分けされ
たまま格納される。ここでは、「平成参年拾月九日」と
いう文字列を示すデータが格納先である[編製日]に格
納されることとなる。
目点2へ処理が進められ、「編製」という文字があるか
否かがチェックされてS604の処理が終了する。
場合について説明する。処理の対象となる文字列として
は、例えば、「平成拾年七月拾参日戸籍法七十三条の二
の届出」を想定する。氏変更ルールのテーブル(図8
(b))では、最初に日付ルールを適用することが定め
られている。そこで、図9(a)の日付ルールのテーブ
ルが呼び出され、上述した手順により、日付ルールが実
行されて抽出された文字列が[氏変更日]に格納され
る。ここでは、「平成拾年七月拾参日」という文字列を
示すデータが格納されることとなる。
キーワード「戸籍法」という文字列があるか否かがチェ
ックされて注目点3に処理が進む。注目点3の処理で
は、処理対象である文字列から、「73条の2」や「7
7条の2」といった氏変更の種別を示す解析用キーワー
ドが抽出され、[氏変更の種別]に格納される。最後
に、注目点4へ進み、解析用キーワード「の届出」とい
う文字列があるか否かがチェックされて処理が終了す
る。
った場合、例えば、「チェック」処理でエラーが返され
た場合には、同じ処理対象の文字列に再度他の解析ルー
ルを適用するようにしてもよい。この場合、同じ戸籍の
記載事項に対応するが、処理の手順や、解析用キーワー
ドが異なる解析ルールを用意しておき、これを順に適用
してもよい。例えば、氏変更ルールとして、処理の手順
や解析用キーワードが相互に異なる氏変更ルール1、氏
変更ルール2を用意したり、日付ルールとして、日付ル
ール1、日付ルール2、日付ルール3...とすること
もできる。
は、S301で作成した戸籍事項に属するテキストデー
タのうち、未処理のデータがあるか否かを判定し、あれ
ばS601へ戻り上述した手順を繰り返す。S601乃
至S605の処理を繰り返すことにより、戸籍事項に属
するテキストデータが順に処理されることとなる。
データの処理へ移行する。S606からS610までの
処理は、上述したS601からS605の処理と基本的
に同じである。S606では、S301で作成したテキ
ストデータのうち、身分事項に属するテキストデータを
取得する。なお、身分事項に関するデータの処理では、
各構成員単位で処理を進めてもよい。
ルの選択テーブルを取得して、選択テーブルに記録され
た選択用キーワードによる検索をS606で取得したテ
キストデータに適用し、その文字列中に選択用キーワー
ドがあるか否かを検索する。図7(b)は、身分事項用
の選択テーブルを示した図である。
いて、処理中の文字列に対する解析ルールを選択する。
例えば、図4の例の「昭和参拾九年五月拾弐日東京都中
央区で出生同月拾八日父届出入籍」(データ42)とい
う文字列では、「SHUSSEI_TODOKEDE」
という解析ルールが選択されることとなる。解析ルール
が選択されると、その文字列の先頭に、選択テーブルに
記録された識別記号が付され、この例では、「shussei
昭和参拾九年五月拾弐日東京都中央区で出生同月拾八日
父届出入籍」となる。
ルールに基づいて、処理中の文字列から、予め定めた項
目に対応する文字又は文字列を抽出する。具体的には、
まず、S608において識別記号が付された処理中の文
字列の当該識別記号を参照して、知識ベースから選択さ
れた解析ルールのテーブルを取得する。図10(a)乃
至(d)は、身分事項用の解析ルールのテーブルの例を
示した図であり、図10(a)は出生ルール(図7
(b)の「SHUSSEI_TODOKEDE」に相当
する。)のテーブルを、図10(b)は認知ルール(図
7(b)の「NINCHI_TODOKEDE」に相当
する。)のテーブルを、図10(c)は婚姻ルール(図
7(b)の「KONINRIKON_TODOKED
E」に相当する。)のテーブルを、図10(d)は養子
縁組ルール(図7(b)の「YOSHI_TODOKE
DE」に相当する。)のテーブルを、それぞれ示してい
る。
rop」は、戸籍更新時に不要な記載事項に対して適用
されるルールであり、このルールの適用により、その記
載事項は項目化の対象とならず、データは破棄される。
を説明する。図4の例の「昭和参拾九年五月拾弐日東京
都中央区で出生同月拾八日父届出入籍」(データ42)
に出生ルールのテーブル(図10(a))を適用する場
合を想定する。出生ルールのテーブル(図10(a))
では、最初に日付ルールを適用することが定められてい
る。そこで、図9(a)の日付ルールのテーブルが呼び
出され、上述した手順により、日付ルールが実行されて
抽出された文字列が[出生日]に格納される。ここで
は、「昭和参拾九年五月拾弐日」という文字列を示すデ
ータが格納されることとなる。
ールを適用することが定められているので、図9(b)
の場所ルールのテーブルが呼び出される。場所ルールの
テーブルでは、最初に解析用キーワード「北海道」、
「青森県」等の抽出が定められている。これらのキーワ
ードが文字列中にあれば、これを[都道府県]に格納す
る。その後、注目点2へ処理が進められる。そして、解
析用キーワード「札幌市」、「新宿区」等の抽出が定め
られており、これらのキーワードが文字列中にあれば、
これを[市町村区]に格納する。その後、出生ルールのテ
ーブルに戻り、場所ルールで取得したデータが[出生
地]へ格納される。ここでは、「東京都中央区」という
文字列を示すデータが[出生地]へ格納されることとな
る。
ード「で出生」という文字列があるか否かがチェックさ
れて注目点4に処理が進む。注目点4の処理では、日付
ルールのテーブルが呼び出され、「同月拾八日」という
文字列が[届出日]に格納される。注目点5の処理へ進
み、資格ルールのテーブル(図9(c))が呼び出さ
れ、処理中の文字列に解析キーワード「夫」、「母」等
があるか否かが判定され、あれば[資格名称]に格納さ
れる。その後、資格ルールで取得されたデータが[届出
人]へ格納され。ここでは、「父」という文字列を示す
データが[届出人]に格納されることとなる。
「届出」という文字列があるか否かがチェックされて処
理が終了する。
た場合について説明する。処理の対象となる文字列とし
ては、例えば、「平成五年八月六日日本太郎日本花子の
養子となる縁組届出千葉県千葉市佐藤一男戸籍から入
籍」を想定する。養子縁組ルールのテーブル(図10
(d))では、最初に日付ルールを適用することが定め
られている。そこで、図9(a)の日付ルールのテーブ
ルが呼び出され、上述した手順により、日付ルールが実
行されて抽出された文字列が[縁組日]に格納される。
ここでは、「平成五年八月六日」という文字列を示すデ
ータが格納されることとなる。
ールのテーブルが呼び出され、抽出された氏名が[P
1]に格納される。注目点3の処理でも、図9(d)の
氏名ルールのテーブルが呼び出され、抽出された氏名が
[P2]に格納される。ここでは、「日本太郎」、「日
本花子」という文字列を示すデータが格納されることと
なる。注目点4の処理では、処理中の文字列に解析用キ
ーワード「養子となる」があるか否かがチェックされ、
あれば先の[P1]及び[P2]のデータが、それぞれ
[養父氏名]及び[養母氏名]に転送されて格納され
る。ここでは、「日本太郎」、「日本花子」という文字
列を示すデータが、[養父氏名]、[養母氏名]にそれ
ぞれ格納されることとなる。
析用キーワード「縁組届出」があるか否かがチェックさ
れ、あれば注目点6の処理へ進み、図9(b)の場所ル
ールのテーブルが呼び出される。場所ルールの適用によ
り得られたデータは、[従前戸籍]に格納される。ここ
では、「千葉県千葉市」という文字列を示すデータが格
納されることとなる。
ールのテーブルが呼び出され、得られたデータが[従前
戸籍筆頭者]に格納される。ここでは、「佐藤一男」と
いう文字列を示すデータが格納されることとなる。
文字列に解析用キーワード「戸籍から」、「入籍」があ
るか否かが順次チェックされ、いずれもある場合は処理
が終了する。
におけるCPU102の処理の内容について説明する。
図11は、完全化処理の内容を示したフローチャートで
ある。ここで、上述した項目化処理により、S301で
作成したテキストデータは、項目化データとしてデータ
メモリ105に格納されている。図12(a)は、図4
の例の「昭和参拾九年五月拾弐日東京都中央区で出生同
月拾八日父届出入籍」(データ42)という文字列に、
上述した項目化処理を実行することにより得た項目化デ
ータの一例を示した図である。以下、この項目化データ
の場合を例にとって図11のフローチャートを説明す
る。
り項目化されたデータを取得する。例えば、図12
(a)のデータが取得される。S1102では、取得し
た項目化データの文字又は文字列において、情報の欠落
・省略があるか否かを判定する。この判定は、例えば、
空欄になっている項目があるか否かや、項目化データの
文字又は文字列に特定の文字又は文字列があるか否かに
基づいて判定することができる。そのような特定の文字
等としては、例えば、「同」、「父」、「母」、
「夫」、「妻」等である。
ータに情報欠落・省略の有無の判定結果を付したデータ
テーブルを示す図である。同図の「欠落・省略の有無」
欄には、情報省略と判定したデータに「有」が付されて
おり、その他のデータには「無」が付されており、デー
タが「null」(空欄)の場合や、「同」或いは
「父」の場合に、「有」が付されていることが分かる。
3では、全ての項目化データについてS1102の処理
を行った否かを判定し、未処理の項目化データがあれば
S1101へ戻る。
の欠落・省略があったと判定された項目化データを順に
取得する。例えば、図12(b)のデータが取得され
る。S1105では、取得した項目化データの修正を行
いデータを完全化する。
下の方法(1)乃至(5)が挙げられる。この場合、い
ずれか一つの方法を採用してもよいし、適切なデータが
得られるまで順に適用していってもよい。また、省略の
態様(「null]、「同」、「父」、「母」、
「夫」、「妻」等)により以下の方法のいずれかの方法
を自動選択するようにしてもよい。
項目と同種の項目について抽出された文字又は文字列を
検索し、これに基づいて完全化する。特に、同じ処理対
象の文字列の、直前の同種の項目について抽出された文
字又は文字列を検索し、これに基づいて完全化すること
が好適である。
列の省略の場合は、直前の日付や場所に関する項目化デ
ータを検索してこれに基づいて完全化する。図12
(a)の例で言えば、[届出日]の「元号」と「年」と
が欠落しているので(「null」)、直前の日付デー
タである[出生日]を検索し、その元号「昭和」と年
「参拾九」とをこれに適用する。また、[届出日]の
「月」が省略されているので(「同」)、直前の日付デ
ータである[出生日]を検索し、その月「五」をこれに
適用する。
字又は文字列を検索し、これに基づいて完全化する。
字列を検索し、これに基づいて完全化する。図12
(a)の例で言えば、[届出人]の名前が省略されてい
るので(「父」)、その構成員(この例では日本太郎)
の父親のデータを検索し(戸籍の「父」の欄)、「日本
一郎」をこれに適用する。
を検索して、これに基づいて完全化する。
に基づいて完全化する。
目化データを完全化した例を図12(c)に示す。
6では、、S1102において情報省略があったと判定
された全ての項目化データについてS1105の処理を
行った否かを判定し、未処理の項目化データがあればS
1104へ戻る。なければ完全化処理が終了する。
籍の記載内容の項目化が自動化され、戸籍の記載事項を
電子化するにあたり、効率的な項目化を実現することが
できる。また、解析テーブルの設定の仕方により、様々
な戸籍の記載事項に対応でき、更に、戸籍の記入者のく
せ等にも対応することができる。
ことにより、項目に対応するデータが欠落している場合
や、情報が省略された戸籍の記載に対応することができ
るので、オペレータの処理を軽減し、戸籍の記載事項の
電子化を効率よく行うことができる。
に完全化処理を行ったが、同様の考え方により、完全化
処理を先に行ってから項目化処理を実行するようにして
もよい。また、情報の省略は、日付、場所、人名に関す
るデータにおいて行われ易いことから、これらのデータ
についてのみ完全化処理を行うようにしてもよい。
の機能を実現するソフトウエアのプログラムコードを、
例えば、これを記録した記憶媒体(または記録媒体)等
を介して、システムあるいは装置に供給し、そのシステ
ムあるいは装置のコンピュータ(またはCPUやMPU)が、
該プログラムコードを実行することによっても、達成さ
れることは言うまでもない。この場合、そのプログラム
コード自体が前述した実施形態の機能を実現することに
なり、そのプログラムコード、及び、これを記憶した記
憶媒体は本発明を構成することになる。また、コンピュ
ータが読み出したプログラムコードを実行することによ
り、前述した実施形態の機能が実現されるだけでなく、
そのプログラムコードの指示に基づき、コンピュータ上
で稼働しているオペレーティングシステム(OS)などが実
際の処理の一部または全部を行い、その処理によって前
述した実施形態の機能が実現される場合も含まれること
は言うまでもない。
タに挿入された機能拡張カードやコンピュータに接続さ
れた機能拡張ユニットに備わるメモリに書込まれた後、
そのプログラムコードの指示に基づき、その機能拡張カ
ードや機能拡張ユニットに備わるCPUなどが実際の処理
の一部または全部を行い、その処理によって前述した実
施形態の機能が実現される場合も含まれることは言うま
でもない。
戸籍の記載事項を電子化するにあたり、効率的な処理を
実現することができる。
ハードウエア構成例を示すブロック図である。
る。
図である。
る。
図である。(b)は、身分事項用の選択テーブルを示し
た図である。
のテーブルの一例を示した図である。
ブルの一例を示した図である。
ルのテーブルの一例を示した図である。
ある。
タの例、(b)は、(a)の項目化データに対して、S
1102の処理を実行することにより得たデータの例、
(c)は、(a)の項目化データを完全化した場合のデ
ータの例、を示す。
Claims (13)
- 【請求項1】 戸籍の記載内容を表した文字列を処理す
る戸籍情報処理装置であって、 処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段と、 抽出された文字又は文字列において、情報の省略がある
か否かを判定する判定手段と、 情報の省略があると判定された場合に、前記抽出された
文字又は文字列を、情報の省略がない文字又は文字列に
完全化する完全化手段と、を備えたことを特徴とする戸
籍情報処理装置。 - 【請求項2】 前記完全化手段は、 同じ戸籍に含まれる他の文字または文字列に基づいて、
前記抽出された文字又は文字列を、情報の省略がない文
字又は文字列に完全化することを特徴とする請求項1に
記載の戸籍情報処理装置。 - 【請求項3】 前記完全化手段は、 同じ処理対象の前記文字列に含まれる他の文字または文
字列に基づいて、前記抽出された文字又は文字列を、情
報の省略がない文字又は文字列に完全化することを特徴
とする請求項1に記載の戸籍情報処理装置。 - 【請求項4】 前記完全化手段は、 前記抽出された文字又は文字列の前記項目と同種の項目
について抽出された文字または文字列に基づいて、前記
抽出された文字又は文字列を、情報の省略がない文字又
は文字列に完全化することを特徴とする請求項1に記載
の戸籍情報処理装置。 - 【請求項5】 前記判定手段は、 抽出された文字又は文字列が、特定の文字を含む場合
に、情報の省略があると判定することを特徴とする請求
項1に記載の戸籍情報処理装置。 - 【請求項6】 前記特定の文字には、「同」、「父」、
「母」、「夫」又は「妻」のいずれかが含まれることを
特徴とする請求項5に記載の戸籍情報処理装置。 - 【請求項7】 前記判定手段は、 抽出された文字又は文字列のうち、日付、場所、又は、
人名を示す文字又は文字列について、情報の省略がある
か否かを判定することを特徴とする請求項1に記載の戸
籍情報処理装置。 - 【請求項8】 更に、 戸籍の記載事項に応じて定められた複数種類の解析ルー
ルと、各々の前記解析ルールに付された少なくとも一つ
のルール選択用キーワードと、を記憶する記憶デバイス
又は記憶媒体からこれらを取得する手段を備え、 前記抽出手段は、 処理対象の前記文字列に含まれる前記ルール選択用キー
ワードを検索する検索手段と、 検索した前記ルール選択用キーワードに対応する前記解
析ルールに基づいて、処理対象の前記文字列から予め定
めた項目に対応する文字又は文字列を抽出する処理手段
と、を備えたことを特徴とする請求項1に記載の戸籍情
報処理装置。 - 【請求項9】 戸籍の記載内容を表した文字列を処理す
るために、コンピュータを、 処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段、 抽出された文字又は文字列において、情報の省略がある
か否かを判定する判定手段、 情報の省略があると判定された場合に、前記抽出された
文字又は文字列を、情報の省略がない文字又は文字列に
完全化する完全化手段、として機能させるプログラム。 - 【請求項10】 戸籍の記載内容を表した文字列を処理
する戸籍情報処理装置であって、 処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段と、 前記文字又は文字列が抽出されていない前記項目がある
か否かを判定する判定手段と、 前記文字又は文字列が抽出されていない前記項目がある
場合に、当該項目に該当する文字又は文字列を検索する
手段と、を備えたことを特徴とする戸籍情報処理装置。 - 【請求項11】 戸籍の記載内容を表した文字列を処理
するために、コンピュータを、 処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出手段、 前記文字又は文字列が抽出されていない前記項目がある
か否かを判定する判定手段、 前記文字又は文字列が抽出されていない前記項目がある
場合に、当該項目に該当する文字又は文字列を検索する
手段、として機能させるプログラム。 - 【請求項12】 戸籍の記載内容を表した文字列を処理
する戸籍情報処理方法であって、 処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出工程と、 抽出された文字又は文字列において、情報の省略がある
か否かを判定する判定工程と、 情報の省略があると判定された場合に、前記抽出された
文字又は文字列を、情報の省略がない文字又は文字列に
完全化する完全化工程と、を備えたことを特徴とする戸
籍情報処理方法。 - 【請求項13】 戸籍の記載内容を表した文字列を処理
する戸籍情報処理方法であって、 処理対象の前記文字列から予め定めた項目に対応する文
字又は文字列を抽出する抽出工程と、 前記文字又は文字列が抽出されていない前記項目がある
か否かを判定する判定工程と、 前記文字又は文字列が抽出されていない前記項目がある
場合に、当該項目に該当する文字又は文字列を検索する
工程と、を備えたことを特徴とする戸籍情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001085529A JP2002288194A (ja) | 2001-03-23 | 2001-03-23 | 戸籍情報処理装置及び方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001085529A JP2002288194A (ja) | 2001-03-23 | 2001-03-23 | 戸籍情報処理装置及び方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002288194A true JP2002288194A (ja) | 2002-10-04 |
JP2002288194A5 JP2002288194A5 (ja) | 2008-05-08 |
Family
ID=18941025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001085529A Pending JP2002288194A (ja) | 2001-03-23 | 2001-03-23 | 戸籍情報処理装置及び方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002288194A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7647174B2 (en) | 2005-06-01 | 2010-01-12 | Hyundai Autonet Co., Ltd. | Navigation system with function of one-touch map matching correction and method thereof |
JP2015191277A (ja) * | 2014-03-27 | 2015-11-02 | 富士通株式会社 | データ識別方法、データ識別プログラム及びデータ識別装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07225807A (ja) * | 1994-02-10 | 1995-08-22 | Hitachi Ltd | 戸籍データ作成装置 |
JPH09114901A (ja) * | 1995-10-13 | 1997-05-02 | Canon Inc | 情報処理システム及びその方法 |
JPH10340351A (ja) * | 1997-06-05 | 1998-12-22 | Hitachi Inf Syst Ltd | 文字データの自動校正方法及び装置 |
-
2001
- 2001-03-23 JP JP2001085529A patent/JP2002288194A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07225807A (ja) * | 1994-02-10 | 1995-08-22 | Hitachi Ltd | 戸籍データ作成装置 |
JPH09114901A (ja) * | 1995-10-13 | 1997-05-02 | Canon Inc | 情報処理システム及びその方法 |
JPH10340351A (ja) * | 1997-06-05 | 1998-12-22 | Hitachi Inf Syst Ltd | 文字データの自動校正方法及び装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7647174B2 (en) | 2005-06-01 | 2010-01-12 | Hyundai Autonet Co., Ltd. | Navigation system with function of one-touch map matching correction and method thereof |
JP2015191277A (ja) * | 2014-03-27 | 2015-11-02 | 富士通株式会社 | データ識別方法、データ識別プログラム及びデータ識別装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8150156B2 (en) | Automated processing of paper forms using remotely-stored templates | |
JPH06111056A (ja) | 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法 | |
JP2002099561A (ja) | データ変換方法およびデータ変換システム並びに記憶媒体 | |
JPH11282955A (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR102442350B1 (ko) | 인공지능을 기반으로 자동 문서 작성을 수행하기 위한 정보 분석 방법 및 장치 | |
JP6529254B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび記憶媒体 | |
US20090228794A1 (en) | Business specification comprehension assistance system and method | |
JP3784060B2 (ja) | データベース検索システム、その検索方法及びプログラム | |
JP2002288194A (ja) | 戸籍情報処理装置及び方法、プログラム | |
JP2002288195A (ja) | 戸籍情報処理装置及び方法、プログラム | |
JP2002288193A (ja) | 戸籍情報処理装置及び方法、プログラム | |
JP6250307B2 (ja) | 画像情報処理装置及び画像情報処理方法 | |
JP7120981B2 (ja) | 情報処理装置、情報処理方法、および、情報処理プログラム | |
JPWO2017072872A1 (ja) | 業務プログラム生成支援システムおよび業務プログラム生成支援方法 | |
JP2001297080A (ja) | 読取支援装置 | |
JP2008210229A (ja) | 知的財産情報検索装置、知的財産情報検索方法及び知的財産情報検索プログラム | |
JP2001094711A (ja) | ドキュメント画像処理装置及びドキュメント画像処理方法 | |
US11868726B2 (en) | Named-entity extraction apparatus, method, and non-transitory computer readable storage medium | |
JP4521413B2 (ja) | データベース管理システム及びプログラム | |
JP2002149471A (ja) | ファイルシステム | |
JPH09259132A (ja) | 情報登録検索装置及びその方法 | |
JP2002150207A (ja) | 自動入力システム | |
JP2001256422A (ja) | 登記簿データ電子化装置 | |
JP3419425B2 (ja) | 認識文字補正装置 | |
JP2024015819A (ja) | 指標算出装置、指標算出方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080324 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101102 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110509 |