JPH1040401A - 戸籍データ作成における書式解析方法 - Google Patents

戸籍データ作成における書式解析方法

Info

Publication number
JPH1040401A
JPH1040401A JP8193307A JP19330796A JPH1040401A JP H1040401 A JPH1040401 A JP H1040401A JP 8193307 A JP8193307 A JP 8193307A JP 19330796 A JP19330796 A JP 19330796A JP H1040401 A JPH1040401 A JP H1040401A
Authority
JP
Japan
Prior art keywords
format
family register
image data
ruled line
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8193307A
Other languages
English (en)
Inventor
Shinichi Yokoi
慎一 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8193307A priority Critical patent/JPH1040401A/ja
Publication of JPH1040401A publication Critical patent/JPH1040401A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】 用紙の形の戸籍原本を画像データとして入力
して戸籍データベースを作成するとき、戸籍帳票の文字
認識を行う前に画像データに含まれる罫線を認識して除
去する必要がある。画像データ中の罫線情報と書式デー
タ11に登録される罫線情報とのマッチング回数を削減
して書式解析3の処理を高速化する。 【解決手段】 書式データ11は戸籍帳票に含まれる罫
線の位置の相違によって複数種類の書式情報を格納す
る。ステップ3の書式解析は、戸籍本票について一度決
定した書式の種別を保存しておき、次に入力される戸籍
本票についてまず保存された書式種別の書式とのマッチ
ングを最優先で行う。同一戸籍中の戸籍次票及び附票本
票の書式解析についても、同様にまず保存された書式種
別に対応する書式種別の書式とのマッチングを最優先で
行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子計算機を利用
する戸籍データの作成方法に係わり、特に戸籍帳票の文
字認識に先立って行う戸籍帳票書式の解析方法に関す
る。
【0002】
【従来の技術】戸籍簿を管理する方式としては、戸籍原
本を用紙で保管する従来から行われている方式と、戸籍
簿に記載する内容を項目化してデータベースの形で保管
する新しい方式とがある。従来の用紙の形の戸籍原本を
データベース化する方式の1つとして、従来の戸籍原本
をイメージスキャナ等を介して計算機に入力し計算機で
文字認識をして項目分けし、データベースに格納するセ
ットアップ方式がある。計算機に入力される戸籍の画像
データは、文字情報の他に縦横の罫線を含んでいるの
で、特開平7−220023号公報に詳述されているよ
うに文字認識を実行するに先立って画像データ中のすべ
ての罫線を認識してこれらの罫線の画像情報を除去しな
ければならない。特開平7−220023号公報は、1
つの帳票に含まれるすべての罫線の位置座標を書式情報
データベースとして記憶装置に格納しておき、画像デー
タ中の罫線情報を1つ1つデータベース中の罫線情報と
比較照合して画像データに含まれる書式の種類を決定す
る技術を開示する。
【0003】図4(a)は戸籍本票の主な罫線の例を示
す図であり、図4(b)は戸籍次票の主な罫線の例を示
す図である。
【0004】図5(a)は附票本票の主な罫線の例を示
す図であり、図5(b)は附票次票の主な罫線の例を示
す図である。
【0005】図4及び図5に見られるように、戸籍本
票、戸籍次票、附票本票、附票次票によって書式を構成
する罫線の数及び位置情報が異なるので、少なくとも4
種類の書式について各々の罫線情報をデータベースに登
録しておかねばならない。さらに同一種類の帳票であっ
てもその帳票用紙を作成した年代あるいは印刷業者によ
って罫線の位置が微妙に異なる場合があるので、このよ
うな作成年代による書式の相違を考慮すると、データベ
ースに登録する書式の種類数は十数種から数十種にもな
る。
【0006】
【発明が解決しようとする課題】特開平7−22002
3号公報によれば、書式情報データベースに含まれる各
々の書式について罫線の位置情報と画像データ中の罫線
の位置情報とを比較照合した上で画像データに含まれる
書式の種類を決定するので、入力される戸籍帳票ごとに
データベースに登録される書式の種類数だけのマッチン
グ処理を繰り返さねばならず、書式解析の処理時間がか
かるという問題があった。
【0007】本発明の目的は、入力される戸籍帳票当り
の書式マッチング回数を削減することによって書式解析
処理を高速化することにある。
【0008】
【課題を解決するための手段】本発明で戸籍帳票の書式
というとき、1つの戸籍帳票に含まれるすべての罫線の
位置情報をまとめて呼称するものである。
【0009】本発明は、戸籍本票について一度決定した
書式の種類を示す書式コードを記憶装置に保存してお
き、次に入力される戸籍の戸籍本票の画像データについ
てまず保存された書式コードの書式について登録された
書式の罫線の位置と画像データ中の罫線の位置とを比較
する書式解析方法を特徴とする。
【0010】また本発明は、戸籍本票の罫線位置情報に
よって構成される書式と同時期に用紙が作成された附票
本票の罫線位置情報によって構成される書式とを対応付
け可能なように記憶装置に登録しておき、戸籍本票につ
いて決定した書式の種類を示す書式コードを記憶装置に
保存しておき、同一戸籍中の附票本票の画像データにつ
いてまず保存された書式に対応する登録された附票本票
の書式の罫線の位置と画像データ中の罫線の位置とを比
較する書式解析方法を特徴とする。
【0011】さらに本発明は、戸籍本票の罫線位置情報
によって構成される書式と同時期に用紙が作成された戸
籍次票の罫線位置情報によって構成される書式とを対応
付け可能なように記憶装置に登録しておき、戸籍本票に
ついて決定した書式の種類を示す書式コードを記憶装置
に保存しておき、同一戸籍中の戸籍次票の画像データに
ついてまず保存された書式に対応する登録された戸籍次
票の書式の罫線の位置と画像データ中の罫線の位置とを
比較する書式解析方法を特徴とする。
【0012】
【発明の実施の形態】以下、本発明の一実施形態につい
て図面を用いて説明する。
【0013】図1は、本実施形態の戸籍帳票の文字認識
処理の手順を示す図である。戸籍帳票の文字認識処理を
実施する装置は、少なくとも戸籍帳票を画像データとし
て入力する機構、書式データ及び出力データを格納する
記憶装置、文字認識機構及び処理プログラムを格納する
記憶装置を備えた情報処理装置を必要とする。まず情報
処理装置に接続されたスキャナ又はディスク装置を介し
て戸籍帳票の画像データを読み込み(ステップ1)、記
憶装置に格納する。次に記憶装置上の画像データを参照
して戸籍帳票の外枠罫線を抽出する(ステップ2)。外
枠罫線は、左側外枠縦線、右側外枠縦線、上側外枠横線
及び下側外枠横線の4種類あり、これらの外枠罫線の近
似直線を計算することによってこれら4種の外枠罫線の
4つの交点の座標を求めることができ、これらの座標値
が書式データを構成する各罫線を認識するときの基準座
標となる。具体的な計算方法は特開平7−220023
号公報に詳しい。書式データ11は、戸籍帳票の各書式
を構成する罫線の各々について始点座標と終点座標とを
保有する。処理プログラムは、書式データ11を参照し
て画像データに含まれる罫線情報が書式データ11に登
録される罫線と一致するか、罫線の一致度を評価する書
式解析を行う(ステップ3)。このときすでに書式一致
が確認された戸籍本票の書式データの書式番号を保存し
ておき、これを基にして最も一致する確度の高い書式を
最優先に評価することによって書式解析を高速化する。
ステップ3は本発明の特徴とする処理である。このよう
にして画像データと一致する書式が確定したら、画像デ
ータから罫線部分を消去し(ステップ4)、罫線によっ
て囲まれるフィールド領域の位置を設定し(ステップ
5)、このフィールド領域を基準にして文字認識機構に
よって文字認識を行い、認識した文字コードの情報をコ
ードデータ12として記憶装置に格納する(ステップ
6)。このようにして1枚の戸籍帳票の文字認識が終了
したとき、次の戸籍帳票について画像データが読み込ま
れていなければステップ1から、画像データが読み込ま
れていればステップ2から上記処理を繰り返す。なおス
テップ1で画像入力と対応して各戸籍の戸籍番号と帳票
枚数(ページ数)とが入力されるものとする。
【0014】図2は、書式データ11のデータ形式を示
す図である。各書式データは、1つの戸籍帳票の書式に
対応して設けられ、書式を構成する罫線の位置の情報を
設定する。位置の情報は、戸籍帳票の左上を原点(0,
0)、右下を(10000,10000)とした直交座
標系の座標値で表現される。罫線情報は、縦線情報11
a及び横線情報11bから構成され、それぞれ縦罫線又
は横罫線の1本ごとに始点座標と終点座標を設定する。
書式番号11cは、各書式データの種類を示す書式コー
ドである。戸籍帳票の書式は大きく戸籍本票、戸籍次
票、附票本票、附票次票の4種類に分かれ、それぞれの
書式はさらに帳票用紙を印刷する業者の変遷などによっ
て戸籍帳票に含まれる罫線の位置が微妙に異なり、この
ような罫線位置の相違によって数種類の書式に分かれる
ので、書式データ11に格納される書式の数は4×nと
なり、nは印刷業者の変遷などによって生じた書式の種
類の数である。以下戸籍本票、戸籍次票、附票本票、附
票次票の書式をそれぞれA(1,i),A(2,i),
B(1,i),B(2,i)の記号で表現する。iは1
からnまでの変数である。書式データA(1,1),A
(1,2),・・・A(1,n)は用紙作成年代の古い
ものから順に配列されるものとし、A(2,i),B
(1,i)及びB(2,i)についても同じである。従
ってインデックスiが同一なA(1,i),A(2,
i),B(1,i),B(2,i)の4種の書式データ
の集合は、同時期に用紙が印刷されたものである。書式
番号11cは、A(1,1),A(1,2),・・・,
A(2,1),A(2,2),・・・,B(2,1),
B(2,2),・・・に対応して付与されているものと
し、いずれかの書式データの記号が与えられたとき、対
応する書式番号11cが得られるものとする。すなわち
書式データA(1,i),A(2,i),B(1,
i),B(2,i)はそれぞれ対応付けられるので、対
応する書式番号11cもそれぞれ対応付けが可能であ
る。
【0015】図3a〜図3fは、ステップ3の書式解析
の処理の流れを示すフローチャートである。情報処理装
置の主記憶装置には、次にヒットする確度の高い書式デ
ータの集合を代表する書式A(1,i)の書式番号を記
憶する保存書式番号の領域、同一戸籍の中で現在処理中
の戸籍帳票のページ番号を示すページカウンタ及び次に
処理すべき帳票の書式がB(2,i)であることを示す
B2フラグの領域が設けられる。初期状態ではこれらの
領域は0クリア又はリセットされている。なお1組の戸
籍帳票の画像データの書式は、一般にA(1,i),A
(2,j),A(2,k),・・・B(1,i),B
(2,l),B(2,m),・・・の順序で入力される
ものとする。ここにi≦j≦kであり、i≦l≦mであ
る。ページ数が最小の戸籍は2ページの戸籍であり、入
力される書式はA(1,i)に続いてB(1,i)であ
る。
【0016】図3aは、最初の書式解析の処理の流れを
示すフローチャートである。まず保存書式番号の領域に
書式番号11cが格納されているか否かを判定する(ス
テップ31)。保存書式番号が格納されていなければ
(ステップ31NO)、インデックスiを1に設定し
(ステップ32)、画像データ中の書式と書式データ1
1に格納されている書式データA(1,i)との一致度
を評価する(ステップ33)。一致度評価の処理手順
は、書式データA(1,i)に対応する書式番号11c
の書式データ11から1本の罫線の罫線情報を読み出し
て、画像データ中の外枠罫線から抽出した4つの基準座
標を基にして座標変換を行い、得られた罫線と画像デー
タ中の罫線とのマッチングを行って画像データ中の対応
する位置に罫線が存在するか否かを判定する。罫線が存
在すれば正カウンタに1を加え、存在しなれば誤カウン
タに1を加える。このようにして書式データA(1,
i)に登録されているすべての罫線について上記処理を
繰り返す。すべての罫線についてマッチング処理が済ん
だとき、正カウンタのマッチング数/(正カウンタのマ
ッチング数+誤カウンタのアンマッチング数)の計算式
によって評価値を算出する。評価値が所定値以上であれ
ば画像データ中の書式と書式データA(1,i)とが一
致するものとみなし、評価値が所定値に達しなければ両
者は一致しないものとみなす。特開平7−220023
号公報には、登録された書式データと画像データ中の書
式データとの一致度評価の具体的手順が記載されてい
る。画像データ中の書式と書式データA(1,i)とが
一致しなければ(ステップ34NO)、書式データの集
合{A(1,i)}の最後の書式データA(1,n)に
まで達しているか否かを判定する(ステップ35)。書
式データの終端A(1,n)に達していなければ(ステ
ップ35NO)、インデックスiに1を加えて(ステッ
プ36)、ステップ33に戻り上記処理を繰り返す。画
像データ中の書式と書式データA(1,i)とが一致し
たとき(ステップ34YES)、対応書式A(1,k)
の書式番号11cを保存書式番号に格納し(ステップ3
7)、ステップ4の処理に進む(ステップ38)。書式
データの終端A(1,n)に達したとき(ステップ35
YES)、文字認識処理を終了する。すでに記憶領域に
保存書式番号が格納されていれば(ステップ31YE
S)、B(図3b)へ行く。
【0017】図3bは、保存書式番号に書式番号11c
が格納されている状態で第1ページの画像データが入力
されたときの書式解析の処理の流れを示すフローチャー
トである。ページカウンタが第1ページを示していると
き(ステップ41YES)、保存書式番号に対応する保
存書式A(1,k)のkをインデックスkに設定し(ス
テップ42)、画像データ中の書式と書式データ11に
格納される書式データA(1,k)との一致度を評価す
る(ステップ43)。画像データ中の書式と書式データ
A(1,k)とが一致したとき(ステップ44YE
S)、対応書式A(1,k)の書式番号11cを保存書
式番号に格納し(ステップ45)、一致度評価の最後の
書式データの書式番号11cを格納する領域を0クリア
し(ステップ46)、ステップ4の処理に進む(ステッ
プ47)。画像データ中の書式と書式データA(1,
k)とが一致しなければ(ステップ44NO)、A
(1,k)の書式番号11cと最終書式番号とを比較し
て評価すべき最後の書式の書式番号でなければ(ステッ
プ48NO)、書式データの集合{A(1,i)}の最
後の書式データA(1,n)にまで達しているか否かを
判定する(ステップ49)。書式データの終端A(1,
n)に達していなければ(ステップ49NO)、インデ
ックスkに1を加えて(ステップ50)、ステップ43
に戻り上記処理を繰り返す。最後の書式データA(1,
n)に達しているとき(ステップ49YES)、保存書
式がA(1,1)でなければ(ステップ51NO)、保
存書式A(1,k)の1つ前の書式A(1,k−1)の
書式番号11cを最終書式番号の領域にセットする(ス
テップ52)。ここでkはステップ42で設定したkで
ある。次にインデックスkを1に設定し(ステップ5
3)、ステップ43に戻って上記処理を繰り返す。最終
書式に到達していれば(ステップ48YES)、最終書
式番号の領域を0クリアし(ステップ54)、処理を終
了する。保存書式がA(1,1)であれば(ステップ5
1YES)、書式データの終端A(1,n)が最終書式
であったのであるから、処理を終了する。図3bに示す
処理によれば、直前に処理された戸籍の書式データA
(1,k)の書式番号11cが保存されていれば、当該
戸籍の第1ページの書式も同じである確度が高いものと
して最優先で一致度評価をする。保存されたA(1,
k)がヒットしなければ、A(1,k)を除く残りのA
(1,i)の各々について一致度評価を行ってヒットし
た書式A(1,k)の書式番号11cによって保存書式
番号を更新する。ページカウンタの内容が第1ページ以
外であるとき(ステップ41NO)、C(図3c)へ行
く。
【0018】図3cは、保存書式A(1,k)が存在し
て画像データが戸籍帳票の第2ページ以後である場合の
書式解析の処理の流れを示すフローチャートである。帳
票枚数のカウンタの内容とページカウンタの内容とを比
較し、両者が2でなければ(ステップ61NO)、B2
フラグを調べ、B2フラグがオフであれば(ステップ6
2NO)、保存書式番号に対応する保存書式A(1,
k)のkをインデックスkに設定し(ステップ63)、
画像データ中の書式と書式データ11に格納される書式
データA(2,k)との一致度を評価する(ステップ6
4)。画像データ中の書式と書式データA(2,k)と
が一致したとき(ステップ65YES)、ステップ4の
処理に進む(ステップ66)。画像データ中の書式と書
式データA(2,k)とが一致しなければ(ステップ6
5NO)、書式データの集合{A(2,i)}の最後の
書式データA(2,n)にまで達しているか否かを判定
する(ステップ67)。書式データの終端A(2,n)
に達していなければ(ステップ67NO)、インデック
スkに1を加えて(ステップ68)、ステップ64に戻
り上記処理を繰り返す。書式データの終端A(2,n)
に達しているとき(ステップ67YES)、D(図3
d)へ行く。図3cに示す処理によれば、戸籍帳票が第
2ページ以後であるとき、画像データに出現する書式は
A(2,i)以後であるので、まずA(2,i)につい
て書式の一致度を評価する。このとき保存された書式A
(1,k)に対応する書式A(2,k)が最もヒットす
る確度が高いものとして最優先で一致度評価をする。保
存された書式A(1,k)に対応する書式A(2,k)
がヒットしない場合があるが、そのときヒットした書式
A(2,i)のiは必ずkより大きい。このときヒット
した書式データA(2,i)の書式番号11cを保存し
ない。何故なら次の画像データの書式がB(1,i)で
ある確度が高く、次の画像データの書式がB(1,i)
であれば、保存された書式A(1,k)に対応するB
(1,k)であることがほぼ確実であるからである。B
2フラグがオンであれば(ステップ62YES)、E
(図3e)へ行く。処理対象の画像データが2ページ戸
籍の第2ページであるとき(ステップ61YES)、F
(図3f)へ行く。
【0019】図3dは、第2ページ以後の戸籍帳票の書
式データがA(2,i)でない場合の書式解析の処理の
流れを示すフローチャートである。保存書式番号に対応
する保存書式A(1,k)のkをインデックスkに設定
し(ステップ71)、画像データ中の書式と書式データ
11に格納される書式データB(1,k)との一致度を
評価する(ステップ72)。画像データ中の書式と書式
データB(1,k)とが一致したとき(ステップ73Y
ES)、帳票枚数のカウンタの内容とページカウンタの
内容とを比較し、両者が等しければ、すなわち当該画像
データが戸籍の最終ページであれば(ステップ74YE
S)、ステップ4の処理に進む(ステップ76)。画像
データが最終ページでなければ(ステップ74NO)、
次の画像データの書式はB(2,i)であることが確実
であるので、B2フラグをセットして(ステップ7
5)、ステップ4の処理に進む(ステップ76)。画像
データ中の書式と書式データB(1,k)とが一致しな
ければ(ステップ73NO)、書式データの終端B
(1,n)に達していなければ(ステップ77NO)、
インデックスkに1を加えて(ステップ78)、ステッ
プ72に戻り上記処理を繰り返す。書式データの終端B
(1,n)に達したとき(ステップ77YES)、処理
を終了する。図3dに示す処理によれば、第2ページ以
後の戸籍帳票の書式データがA(2,i)でなければB
(1,i)であることが確実なので、画像データの書式
と登録された書式がB(1,i)とのマッチングを行
う。このとき保存された書式A(1,k)に対応する書
式B(1,k)がヒットすることがほぼ確実なので、最
優先で書式B(1,k)との一致度評価を行う。また書
式B(1,k)がヒットし、続きのページがあれば次の
画像データについて出現する書式はB(2,i)である
ことが確実なので、B2フラグをセットし、次の画像デ
ータの書式の一致度評価の際にA(2,i)及びB
(1,i)に対する一致度評価の処理をバイパスする。
【0020】図3eは、処理の対象とする画像データの
書式がB(2,i)であることが確実なときの書式解析
の処理の流れを示すフローチャートである。保存書式番
号に対応する保存書式A(1,k)のkをインデックス
kに設定し(ステップ81)、画像データ中の書式と書
式データ11に格納される書式データB(2,k)との
一致度を評価する(ステップ82)。画像データ中の書
式と書式データB(2,k)とが一致したとき(ステッ
プ83YES)、帳票枚数のカウンタの内容とページカ
ウンタの内容とを比較し、両者が等しければ、すなわち
当該画像データが戸籍の最終ページであれば(ステップ
84YES)、B2フラグをリセットして(ステップ8
5)、ステップ4の処理に進む(ステップ86)。最終
ページでなければ(ステップ84NO)、書式B(2,
i)が続くので、単にステップ4の処理に進む(ステッ
プ86)。画像データ中の書式と書式データB(2,
k)とが一致しなければ(ステップ83NO)、書式デ
ータの終端B(2,n)に達していなければ(ステップ
87NO)、インデックスkに1を加えて(ステップ8
8)、ステップ82に戻り上記処理を繰り返す。書式デ
ータの終端B(2,n)に達したとき(ステップ87Y
ES)、B2フラグをリセットして(ステップ89)、
処理を終了する。図3eに示す処理によれば、当該戸籍
についてすでに処理されてヒットしたB(1,i)は、
保存された書式A(1,k)に対応する書式B(1,
k)であることがほぼ確実なので、B(1,k)に対応
する書式B(2,k)が最もヒットする確度が高いもの
として最優先で一致度評価をする。
【0021】図3fは、戸籍帳票の枚数が2枚、すなわ
ち2ページである場合の書式解析の処理の流れを示すフ
ローチャートである。この場合の処理手順は、図3dに
示す書式データB(1,k)と画像データとの一致度評
価と同じである。ただし処理対象の画像データは戸籍の
最終ページであるから、ステップ74及びステップ75
のB2フラグセットの処理はない。図3fに示す処理の
利点は、2ページ戸籍であるという知識を利用して図3
cに示す書式データA(2,k)に関する処理をバイパ
スできる点である。
【0022】本実施形態の効果について定量的に考察す
る。例えば書式データ11に格納される書式の種類が4
×5=20種類あるとすれば、従来技術によれば書式の
一致度評価のためにマッチング処理をする数は1戸籍当
り20×ページ数/戸籍であるが、本発明によれば2ペ
ージ戸籍の場合にほぼ2回、2ページ戸籍でない場合に
はほぼ(ページ数+1)回に削減できる。3ページ以内
の戸籍が全戸籍の90%以上を占めるとすれば、従来の
40〜60回/戸籍のマッチング回数がほぼ2〜4回/
戸籍に削減される。
【0023】
【発明の効果】本発明によれば、入力される戸籍帳票の
並びから最も確度の高い書式を最優先で入力された画像
データ中の書式とマッチングするので、戸籍帳票当りの
書式マッチング回数が削減され、戸籍データ作成処理に
おける書式解析処理を高速化することができる。
【図面の簡単な説明】
【図1】実施形態の戸籍帳票の文字認識処理の手順を示
す図である。
【図2】書式データ11のデータ形式の例を示す図であ
る。
【図3a】実施形態の書式解析3の処理の流れを示すフ
ローチャートである。
【図3b】実施形態の書式解析3の処理の流れを示すフ
ローチャート(続き)である。
【図3c】実施形態の書式解析3の処理の流れを示すフ
ローチャート(続き)である。
【図3d】実施形態の書式解析3の処理の流れを示すフ
ローチャート(続き)である。
【図3e】実施形態の書式解析3の処理の流れを示すフ
ローチャート(続き)である。
【図3f】実施形態の書式解析3の処理の流れを示すフ
ローチャート(続き)である。
【図4】戸籍本票及び同次票の主な罫線の例を示す図で
ある。
【図5】附票本票及び同次票の主な罫線の例を示す図で
ある。
【符号の説明】
3・・・(書式解析)ステップ、11・・・書式データ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】各々の戸籍が戸籍帳票として少なくとも戸
    籍本票を含み、該戸籍本票に含まれる罫線の位置の相違
    によって複数種類の戸籍本票の書式が存在する場合に、
    該戸籍本票の書式ごとに書式を構成する各罫線の位置座
    標を記憶装置に格納しておき、複数個の該戸籍について
    その戸籍帳票の画像データを順次情報処理装置の記憶装
    置に読み込み、該画像データに含まれる罫線の位置と記
    憶装置に登録される各書式の罫線の位置とを順次比較す
    ることによって該画像データ中の書式の種類を認識する
    戸籍データ作成の書式解析方法において、 戸籍本票について決定した書式の種類を示す書式コード
    を記憶装置に保存しておき、次に入力される戸籍の戸籍
    本票の画像データについてまず保存された書式コードの
    書式について登録された書式の罫線の位置と画像データ
    中の罫線の位置とを比較することを特徴とする戸籍デー
    タ作成における書式解析方法。
  2. 【請求項2】各々の戸籍が戸籍帳票として少なくとも戸
    籍本票と附票本票とを含み、該戸籍帳票に含まれる罫線
    の位置の相違によって複数種類の戸籍本票の書式と種類
    数が同一の附票本票の書式が存在する場合に、該戸籍帳
    票の書式ごとに書式を構成する各罫線の位置座標を記憶
    装置に格納しておき、戸籍帳票の画像データを順次情報
    処理装置の記憶装置に読み込み、該画像データに含まれ
    る罫線の位置と記憶装置に登録される各書式の罫線の位
    置とを順次比較することによって該画像データ中の書式
    の種類を認識する戸籍データ作成の書式解析方法におい
    て、 該戸籍本票の罫線位置情報によって構成される書式と同
    時期に用紙が作成された該附票本票の罫線位置情報によ
    って構成される書式とを対応付け可能なように記憶装置
    に登録しておき、戸籍本票について決定した書式の種類
    を示す書式コードを記憶装置に保存しておき、同一戸籍
    中の附票本票の画像データについてまず保存された書式
    に対応する登録された附票本票の書式の罫線の位置と画
    像データ中の罫線の位置とを比較することを特徴とする
    戸籍データ作成における書式解析方法。
  3. 【請求項3】各々の戸籍が戸籍帳票として少なくとも戸
    籍本票と戸籍次票とを含み、該戸籍帳票に含まれる罫線
    の位置の相違によって複数種類の戸籍本票の書式と種類
    数が同一の戸籍次票の書式が存在する場合に、該戸籍帳
    票の書式ごとに書式を構成する各罫線の位置座標を記憶
    装置に格納しておき、戸籍帳票の画像データを順次情報
    処理装置の記憶装置に読み込み、該画像データに含まれ
    る罫線の位置と記憶装置に登録される各書式の罫線の位
    置とを順次比較することによって該画像データ中の書式
    の種類を認識する戸籍データ作成の書式解析方法におい
    て、 該戸籍本票の罫線位置情報によって構成される書式と同
    時期に用紙が作成された該戸籍次票の罫線位置情報によ
    って構成される書式とを対応付け可能なように記憶装置
    に登録しておき、戸籍本票について決定した書式の種類
    を示す書式コードを記憶装置に保存しておき、同一戸籍
    中の戸籍次票の画像データについてまず保存された書式
    に対応する登録された戸籍次票の書式の罫線の位置と画
    像データ中の罫線の位置とを比較することを特徴とする
    戸籍データ作成における書式解析方法。
JP8193307A 1996-07-23 1996-07-23 戸籍データ作成における書式解析方法 Pending JPH1040401A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8193307A JPH1040401A (ja) 1996-07-23 1996-07-23 戸籍データ作成における書式解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8193307A JPH1040401A (ja) 1996-07-23 1996-07-23 戸籍データ作成における書式解析方法

Publications (1)

Publication Number Publication Date
JPH1040401A true JPH1040401A (ja) 1998-02-13

Family

ID=16305741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8193307A Pending JPH1040401A (ja) 1996-07-23 1996-07-23 戸籍データ作成における書式解析方法

Country Status (1)

Country Link
JP (1) JPH1040401A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010098727A (ko) * 2000-04-21 2001-11-08 가나이 쓰토무 전표인식처리장치
KR100873192B1 (ko) 2006-09-26 2008-12-10 주식회사 케이티프리텔 청구서 표본 품질 분석 방법 및 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010098727A (ko) * 2000-04-21 2001-11-08 가나이 쓰토무 전표인식처리장치
KR100873192B1 (ko) 2006-09-26 2008-12-10 주식회사 케이티프리텔 청구서 표본 품질 분석 방법 및 시스템

Similar Documents

Publication Publication Date Title
JP3602596B2 (ja) ドキュメントファイリング装置および方法
JPH05143707A (ja) 符号化画像データの処理方法および装置
JPH0684006A (ja) オンライン手書き文字認識方法
CN112036295B (zh) 票据图像处理方法、装置、存储介质及电子设备
CN112509661A (zh) 用于识别体检报告的方法、计算设备和介质
CN112381087A (zh) 结合rpa和ai的图像识别方法、装置、计算机设备和介质
JP2004252881A (ja) テキストデータ修正方法
JP4140221B2 (ja) 画像照合装置および画像照合プログラム
JPH05258099A (ja) 文字認識処理装置
JPH1040401A (ja) 戸籍データ作成における書式解析方法
JP3090070B2 (ja) 帳票識別方法及び装置
JPH11282956A (ja) 帳票識別方法、装置および記録媒体
CN113435331B (zh) 图像文字识别方法、系统、电子设备及存储介质
JP3955410B2 (ja) 類似情報照合装置、類似情報照合方法、及び、類似情報照合プログラムを記録した記録媒体
JPH06131497A (ja) 表認識方式
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JP4276402B2 (ja) 帳票処理装置
JP3292595B2 (ja) 文字認識装置
JP3085508B2 (ja) 電子帳票検索システム
JP3419425B2 (ja) 認識文字補正装置
JPH0830734A (ja) 文字列認識装置
JPH10247221A (ja) オンライン文字認識装置
CN115661825A (zh) 一种文字识别方法和系统
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPS594358Y2 (ja) 文字修正における文字制御装置