JP2001075984A - ファイリング装置 - Google Patents

ファイリング装置

Info

Publication number
JP2001075984A
JP2001075984A JP24994799A JP24994799A JP2001075984A JP 2001075984 A JP2001075984 A JP 2001075984A JP 24994799 A JP24994799 A JP 24994799A JP 24994799 A JP24994799 A JP 24994799A JP 2001075984 A JP2001075984 A JP 2001075984A
Authority
JP
Japan
Prior art keywords
item
data
image
item data
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP24994799A
Other languages
English (en)
Inventor
Hiroyuki Masai
宏之 政井
Koichi Higuchi
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP24994799A priority Critical patent/JP2001075984A/ja
Publication of JP2001075984A publication Critical patent/JP2001075984A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 項目名を指定することによるイメージデータ
の選択、分類を実現し、選択、分類した結果を必要最小
限に表示することにある。 【解決手段】 画像データ記憶部30と、文書画像中の
表構造から抽出した縦・横方向の罫線に基づいて表枠矩
形を抽出し、この表枠矩形の頂点の座標値に基づいて項
目名矩形及び項目データ矩形を抽出して表枠構造を求め
ると共に、項目名矩形については、その矩形内部の文字
認識を行って項目名を取得し、項目データ矩形について
は画像領域を示す座標値あるいは文字データを取得して
項目データとし、前記項目名及び項目データを対応づけ
て構造解析結果データベースとして出力する構造解析部
40と、構造解析結果データベースから構造解析結果の
任意の項目を一つ以上指定する項目指定部50と、指定
した項目の項目データを構造解析結果データベースから
全て取得する項目データ取得部60と、取得した項目デ
ータを画像表示部80に表示させる項目データ記憶部7
0とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書画像を蓄積
する機能を有し、蓄積された文書画像の選択や分類を行
うファイリング装置において、選択や分類の操作性に優
れ、選択や分類の結果の効果的な表示を行う装置に関す
るものである。
【0002】
【従来の技術】文献:特開平8−87528号公報に記
載されているように、文書画像中の文字列を文書構造に
対応させてディスク記憶装置等に蓄積し、ある検索要求
を満たす文書を前記ディスク記憶装置等から検索し、同
定すると共に、該文書の文書画像を文書画像が蓄積され
た別のディスク記憶装置等から出力することで文書の選
択や分類を行うファイリング装置が考案され、大量デー
タの情報処理に利用されようとしている。
【0003】
【発明が解決しようとする課題】しかしながら、前記フ
ァイリング装置では、テキストデータの誤り検出やイメ
ージデータによる選択、分類等、文書画像の一部の表示
確認を行いたい場合においても、ディスク記憶装置等に
蓄積されるのは文書構造に対応させられたテキストデー
タと、文書画像全体であるため、確認画面に文書画像全
体を表示することになる。すなわち、文書画像の一部を
表示することができない。
【0004】そこで本発明の目的は、文書画像を解析し
て項目名を抽出し、さらに該項目名を有する項目の項目
データをイメージデータあるいはテキストデータとして
抽出することで当該文書の構造化データを取得し、前記
文書画像と構造化データを対応させて格納するファイリ
ング装置において、構造化データが記載された前記文書
画像上の位置座標を前記構造化データに付加して格納す
るようにすることで、項目名を指定することによるイメ
ージデータの選択、分類を実現し、選択、分類した結果
を必要最小限に表示することにある。
【0005】
【課題を解決するための手段】そのために、請求項1の
発明に係るファイリング装置は、罫線による表構造を有
する文書画像を蓄積する機能を有し、該蓄積された文書
画像の選択や分類を行うファイリング装置において、画
像読取装置により読み取った文書画像データを画像デー
タベースに格納する画像データ記憶部と、文書画像中の
表構造から抽出した縦・横方向の罫線に基づいて前記表
構造の基本要素である表枠矩形を抽出し、抽出された表
枠矩形の頂点の座標値に基づいて項目名矩形及び項目デ
ータ矩形を抽出して表枠構造を求めると共に、項目名矩
形については、その矩形内部の文字認識を行って項目名
を取得し、項目データ矩形については当該矩形に属する
データが画像データか否かに応じて画像領域を示す座標
値あるいは文字データを取得して項目データとし、前記
項目名及び項目データを対応づけて構造解析結果データ
ベースとして出力する構造解析部と、前記構造解析結果
データベースから構造解析結果の任意の項目を一つ以上
指定する項目指定部と、前記項目指定部で指定した項目
の項目データを前記構造解析結果データベースから全て
取得する項目データ取得部と、前記項目データ取得部で
取得した項目データが蓄積された画像データの部分画像
データを示す場合、該部分画像データを項目データ記憶
部内のイメージメモリに格納し、画像表示部に表示させ
る項目データ記憶部とを備えたことを特徴とする。
【0006】また、請求項2の発明に係るファイリング
装置は、罫線による表構造を有する文書画像を蓄積する
機能を有し、該蓄積された文書画像の選択や分類を行う
ファイリング装置において、画像読取装置により読み取
った文書画像データを画像データベースに格納する画像
データ記憶部と、文書画像中の表構造から抽出した縦・
横方向の罫線に基づいて前記表構造の基本要素である表
枠矩形を抽出し、抽出された表枠矩形の頂点の座標値に
基づいて項目名矩形及び項目データ矩形を抽出して表枠
構造を求めると共に、項目名矩形については、その矩形
内部の文字認識を行って項目名を取得し、項目データ矩
形については当該矩形に属するデータが画像データか否
かに応じて画像領域を示す座標値あるいは文字データを
取得して項目データとし、前記項目名及び項目データを
対応づけて構造解析結果データベースとして出力する構
造解析部と、前記構造解析結果データベースから構造解
析結果の任意の項目を一つ以上指定する項目指定部と、
前記項目指定部で指定した項目の項目データを前記構造
解析結果データベースから全て取得する項目データ取得
部と、前記項目データ取得部で取得した項目データが蓄
積された画像データの部分画像データを示す場合、該部
分画像データを項目データ記憶部内のイメージメモリに
格納する項目データ記憶部と、前記項目データ取得部で
取得した項目データのうち、テキストデータを示す項目
データあるいは蓄積された画像データの部分画像データ
を示す項目データを一つ以上指定し、テキストデータを
示す項目データを指定した場合はテキスト照合を行い、
部分画像データを示す項目データを指定した場合はイメ
ージ照合を行うことで、指定した項目データAと一致す
る全ての項目データA’を取得すると共に、前記項目指
定部で指定した他の項目の項目データBのうち、前記項
目データ(A,A’)と同一の構造解析結果に記述され
ている項目データB’を全て取得して、項目データ
(A,A’)と項目データB’とを対応づけて画像表示
部に表示させる項目データ照合部とを備えたことを特徴
とする。
【0007】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら詳細に説明する。なお、説明に用いる各
図面は本発明を理解できる程度に概略的に示したもので
ある。
【0008】<実施形態1>図1は実施形態1における
ファイリング装置の構成を概略的に示すブロック図であ
る。同図に示すように、この実施形態のファイリング装
置10は、文字、罫線等の線図形が印刷された帳票等の
媒体を光学的に走査し、該帳票等の媒体からの光情報を
量子化された電気信号に変換する画像読取部20より取
得した画像データを画像データ記憶部30内のイメージ
メモリ上に格納すると共に、この画像データにIDを付
与して画像データベース100に格納する画像データ記
憶部30と、画像データ記憶部30に格納された画像デ
ータより罫線を抽出して帳票内の表の構造を解析し、表
枠内の文字等をテキストデータに変換すること等により
構造解析結果を作成し、この構造解析結果を構造解析結
果データベース200に格納する構造解析部40と、構
造解析結果データベース200に格納された構造解析結
果の任意の項目を一つ以上指定する項目指定部50と、
構造解析結果データベース200に格納された構造解析
結果より、項目指定部50で指定した項目の項目データ
を全て取得する項目データ取得部60と、項目データ取
得部60で取得した項目データが画像データベース10
0に格納された画像データの部分画像データを示す場
合、この部分画像データを項目データ記憶部70内に設
置したイメージメモリ上に格納して、ディスプレイ等の
画像表示部80に表示させる項目データ記憶部70とを
備えて成る。
【0009】以下、図1のブロック図、図2の流れ図、
図3の帳票画像データの一例及び図4の構造解析結果の
一例に基づいて実施形態1の動作について説明を行う。
【0010】(画像データ記憶部)画像データ記憶部3
0は、帳票等の媒体を光学的に走査し、該媒体からの光
情報を量子化された電気信号に変換する画像読取部20
より取得した画像データを画像データ記憶部30内のイ
メージメモリ上に格納すると共に、この画像データにI
Dを付与して画像データベース100に格納する(S
1)。ここで、画像データに付与されたIDを画像ID
と呼ぶ。なお、イメージメモリ、画像データベース10
0上にはX−Y座標が仮想的に設定されており、この座
標系で表される位置の画素をイメージメモリ、画像デー
タベース100上から読み出すことができるようにして
いる。
【0011】(構造解析部)構造解析部40は、先ず画
像データ記憶部30に格納された画像データを水平/垂
直方向に投影し、投影した結果の黒の塊の輪郭外接矩形
を求める。この輪郭外接矩形の水平/垂直方向の長さが
予め設定した閾値Thaを超える場合、この輪郭外接矩
形を表矩形であると判定し、前記閾値Tha以下である
場合輪郭外接矩形を文字矩形であると判定する。輪郭外
接矩形が文字矩形である場合は、文字切出し、文字認識
を行ってテキストデータを取得し、このテキストデータ
を帳票名とする。例えば、図3では「帳票A」が帳票名
になる。一方、輪郭外接矩形が表矩形である場合は、表
矩形を水平/垂直方向に投影し、投影した結果におい
て、予め設定した閾値Thbを超える大きさを有する黒
の塊を罫線であると判定し、水平/垂直方向にそれぞれ
二本の罫線で囲まれる領域を表枠矩形として求める。更
に、表枠矩形の頂点の座標値より表枠構造を求め、最左
側の表枠矩形を項目名矩形、各項目名矩形の右側の表枠
矩形を項目データ矩形と判定する。
【0012】先ず項目名矩形に対して、文字切出し、文
字認識を行ってテキストデータを取得し、このテキスト
データを項目名とする。例えば、図3では「住所」「氏
名」「年齢」「性別」「印鑑」が項目名になる。一方、
項目データ矩形に対しては、「印鑑」のような画像デー
タの場合は、画像データベース100に格納された画像
データの画像IDと項目データ矩形の頂点の座標値を項
目データとする。例えば、図3では項目名「印鑑」の項
目データは「帳票ID=AA,座標=(X1,Y1,X
2,Y2)」となる。画像データでない場合は、文字切
出し、文字認識を行ってテキストデータを取得し、この
テキストデータを項目データとする。例えば、図3では
「○○県△△市□□町××番地」「日本太郎」「26」
「男」がテキストデータの項目データである。構造解析
部40は、前記処理を終了した後、帳票名、項目名、項
目データを構造解析結果としてまとめ、構造解析結果デ
ータベース200に格納する(S2)。例えば、図3の
帳票画像データの構造解析結果は図4のようになる。
【0013】(項目指定部)項目指定部50は、構造解
析結果データベース200に格納された構造解析結果の
任意の項目を一つ以上指定する(S3)。例えば、図4
の帳票Aは項目名が「住所」「氏名」「年齢」「性別」
「印鑑」である五つの項目を有しているが、例えば、項
目名が「印鑑」である項目を指定するものとする。
【0014】(項目データ取得部)項目データ取得部6
0は、項目指定部50で指定した項目名を有する項目の
項目データを構造解析結果データベース200より全て
取得する(S4)。例えば、項目指定部50で指定した
項目の項目名が「印鑑」の場合、図4の帳票Aにおいて
は、項目名が「印鑑」である項目の項目データ「画像I
D=AA,座標=(X1,Y1,X2,Y2)」を取得
する。
【0015】(項目データ記憶部)項目データ記憶部7
0は、項目データ取得部60で取得した項目データが画
像データベース100に格納された画像データの部分画
像データを示す場合、画像データベース100に格納さ
れた画像データの指定された部分画像データを項目デー
タ記憶部70内のイメージメモリ上に格納し(S5)、
ディスプレイ等の画像表示部80で表示する。例えば、
項目データが「画像ID=AA,座標=(X1,Y1,
X2,Y2)」である場合、画像データベース100に
格納された画像ID=AAを有する画像データの座標=
(X1,Y1,X2,Y2)で囲まれる部分画像データ
を項目データ記憶部70内のイメージメモリ上に格納
し、画像表示部80で表示する。
【0016】以上のように、本実施形態によれば、画像
データ記憶部30と、構造解析部40と、項目指定部5
0と、項目データ取得部60と、項目データ記憶部70
とを設けることにより、画像データの構造解析結果にお
いて、画像データの部分画像データを項目データに持つ
項目を項目名で指定することができ、かつ項目名を指定
することで画像データの部分画像である項目データを全
て取得し、まとめてディスプレイ等に表示できる。こう
することで、視覚的に項目データを容易に確認すること
ができ、項目データ上の不備等を即座に発見できるた
め、修正作業等に速やかに取り掛かることができる。
【0017】<実施形態2>図5は実施形態2における
ファイリング装置の構成を概略的に示すブロック図であ
る。尚、実施形態1の構成要素と同様の構成要素につい
ては図1の番号と同一番号を付与している。同図に示す
ように、この実施形態のファイリング装置10は、文
字、罫線等の線図形が印刷された帳票等の媒体を光学的
に走査し、該帳票等の媒体からの光情報を量子化された
電気信号に変換する画像読取部20より取得した画像デ
ータを画像データ記憶部30内のイメージメモリ上に格
納すると共に、この画像データにIDを付与して画像デ
ータベース100に格納する画像データ記憶部30と、
画像データ記憶部30に格納された画像データより罫線
を抽出して帳票内の表の構造を解析し、表枠内の文字等
をテキストデータに変換すること等により構造解析結果
を作成し、この構造解析結果を構造解析結果データベー
ス200に格納する構造解析部40と、構造解析結果デ
ータベース200に格納された構造解析結果の任意の項
目を一つ以上指定する項目指定部50と、構造解析結果
データベース200に格納された構造解析結果より、項
目指定部50で指定した項目の項目データを全て取得す
る項目データ取得部60と、項目データ取得部60で取
得した項目データが画像データベース100に格納され
た画像データの部分画像データを示す場合、この部分画
像データを項目データ記憶部70内のイメージメモリ上
に格納する項目データ記憶部70と、項目データ取得部
60で取得した項目データのうち、テキストデータを示
す項目データあるいは画像データベース100に格納さ
れた画像データの部分画像データを示す項目データを一
つ以上指定し、テキストデータを示す項目データを指定
した場合はテキスト照合を行い、部分画像データを示す
項目データを指定した場合はイメージ照合を行うこと
で、指定した項目データAと一致する全ての項目データ
A’を取得すると共に、項目指定部50で指定した他の
項目の項目データBのうち、項目データ(A,A’)と
同一の構造解析結果に記述されている項目データB’を
全て取得し、項目データ(A,A’)と項目データB’
とを対応づけてディスプレイ等の画像表示部80に表示
させる項目データ照合部75とを備えて成る。
【0018】以下、図5のブロック図、図6の流れ図、
図3の帳票画像データの一例、図4の構造解析結果の一
例及び図7の画像表示の一例に基づいて実施形態2の動
作について説明を行う。
【0019】(画像データ記憶部)画像データ記憶部3
0は、帳票等の媒体を光学的に走査し、該媒体からの光
情報を量子化された電気信号に変換する画像読取部20
より取得した画像データを画像データ記憶部30内のイ
メージメモリ上に格納すると共に、この画像データにI
Dを付与して画像データベース100に格納する(S1
0)。ここで、画像データに付与されたIDを画像ID
と呼ぶ。なお、イメージメモリ、画像データベース10
0上にはX−Y座標が仮想的に設定されており、この座
標系で表される位置の画素をイメージメモリ、画像デー
タベース100上から読み出すことができるようにして
いる。
【0020】(構造解析部)構造解析部40は、先ず画
像データ記憶部30に格納された画像データを水平/垂
直方向に投影し、投影した結果の黒の塊の輪郭外接矩形
を求める。この輪郭外接矩形の水平/垂直方向の長さが
予め設定した閾値Thaを超える場合、この輪郭外接矩
形を表矩形であると判定し、前記閾値Tha以下である
場合輪郭外接矩形を文字矩形であると判定する。輪郭外
接矩形が文字矩形である場合は、文字切出し、文字認識
を行ってテキストデータを取得し、このテキストデータ
を帳票名とする。例えば、図3では「帳票A」が帳票名
になる。一方、輪郭外接矩形が表矩形である場合は、表
矩形を水平/垂直方向に投影し、投影した結果におい
て、予め設定した閾値Thbを超える大きさを有する黒
の塊を罫線であると判定し、水平/垂直方向にそれぞれ
二本の罫線で囲まれる領域を表枠矩形として求める。更
に、表枠矩形の頂点の座標値より表枠構造を求め、最左
側の表枠矩形を項目名矩形、各項目名矩形の右側の表枠
矩形を項目データ矩形と判定する。
【0021】先ず項目名矩形に対して、文字切出し、文
字認識を行ってテキストデータを取得し、このテキスト
データを項目名とする。例えば、図3では「住所」「氏
名」「年齢」「性別」「印鑑」が項目名になる。一方、
項目データ矩形に対しては、「印鑑」のような画像デー
タの場合は、画像データベース100に格納された画像
データの画像IDと項目データ矩形の頂点の座標値を項
目データとする。例えば、図3では項目名「印鑑」の項
目データは「画像ID=AA,座標=(X1,Y1,X
2,Y2)」となる。画像データでない場合は、文字切
出し、文字認識を行ってテキストデータを取得し、この
テキストデータを項目データとする。例えば、図3では
「○○県△△市□□町××番地」「日本太郎」「26」
「男」がテキストデータの項目データである。構造解析
部40は、前記処理を終了した後、帳票名、項目名、項
目データを構造解析結果としてまとめ、構造解析結果デ
ータベース200に格納する(S20)。例えば、図3
の帳票画像データの構造解析結果は図4のようになる。
【0022】(項目指定部)項目指定部50は、構造解
析結果データベース200に格納された構造解析結果の
任意の項目を一つ以上指定する(S30)。例えば、図
4の帳票Aは項目名が「住所」「氏名」「年齢」「性
別」「印鑑」である五つの項目を有しているが、例え
ば、項目名が「印鑑」である項目を指定するものとす
る。
【0023】(項目データ取得部)項目データ取得部6
0は、項目指定部50で指定した項目名を有する項目の
項目データを構造解析結果データベース200より全て
取得する(S40)。例えば、項目指定部50で指定し
た項目の項目名が「印鑑」の場合、図4の帳票Aにおい
ては、項目名が「印鑑」である項目の項目データ「画像
ID=AA,座標=(X1,Y1,X2,Y2)」を取
得する。
【0024】(項目データ記憶部)項目データ記憶部7
0は、項目データ取得部60で取得した項目データが画
像データベース100に格納された画像データの部分画
像データを示す場合、画像データベース100に格納さ
れた画像データの指定された部分画像データを項目デー
タ記憶部70内のイメージメモリ上に格納する(S5
0)。例えば、項目データが「画像ID=AA,座標=
(X1,Y1,X2,Y2)」である場合、画像データ
ベース100に格納された画像ID=AAを有する画像
データの座標=(X1,Y1,X2,Y2)で囲まれる
部分画像データを項目データ記憶部70内のイメージメ
モリ上に格納する。
【0025】(項目データ照合部)項目データ照合部7
5は、項目データ取得部60で取得した項目データのう
ち、テキストデータを示す項目データあるいは画像デー
タベース100に格納された画像データの部分画像デー
タを示す項目データを一つ以上指定し、テキストデータ
を示す項目データを指定した場合はテキスト照合を行
い、部分画像データを示す項目データを指定した場合は
イメージ照合を行うことで、指定した項目データAと一
致する全ての項目データA’を取得すると共に、前記項
目指定部50で指定した他の項目の項目データBのう
ち、前記項目データ(A,A’)と同一の構造解析結果
に記述されている項目データB’を全て取得し、項目デ
ータ(A,A’)と項目データB’とを対応づけてディ
スプレイ等の画像表示部80に表示する。例えば、項目
データ取得部60で取得した項目データが項目名「氏
名」、「印鑑」の項目データであり、項目データ照合部
75で指定する項目データが「画像ID=AA,座標=
(X1,Y1,X2,Y2)」である場合、この項目デ
ータは印影の画像データであるため、項目データ記憶部
70に格納された部分画像データのうち、項目データ照
合部75で指定した印影の画像データと一致する全ての
項目データを印影照合技術を用いて項目データ記憶部7
0内のイメージメモリより取得すると共に、「氏名」の
項目データのうち、前記「印鑑」の項目データと同一の
構造解析結果に記述されている「日本太郎」を含めた全
ての項目データを取得し、項目名が「印鑑」の項目デー
タと項目名が「氏名」の項目データを対応づけて図7の
ようにディスプレイ等の画像表示部80に表示する。
【0026】以上のように、本実施形態によれば、画像
データ記憶部30と、構造解析部40と、項目指定部5
0と、項目データ取得部60と、項目データ記憶部70
と、項目データ照合部75とを設けることにより、画像
データの構造解析結果において、画像データの部分画像
データを項目データに持つ項目を項目名で指定すること
ができ、かつ項目名を指定することで画像データの部分
画像データである項目データを全て取得することができ
る。
【0027】更に、取得した項目データのうち、テキス
トデータを示す項目データあるいは画像データベース1
00に格納された画像データの部分画像データを示す項
目データを一つ以上指定し、テキストデータを示す項目
データを指定した場合はテキスト照合を行い、部分画像
データを示す項目データを指定した場合はイメージ照合
を行うことで、指定した項目データAと一致する全ての
項目データA’を取得すると共に、前記項目指定部50
で指定した他の項目の項目データBのうち、前記項目デ
ータ(A,A’)と同一の構造解析結果に記述されてい
る項目データB’を全て取得して、項目データ(A、
A’)と項目データB’とを対応づけてディスプレイ等
に表示できる。このように、項目あるいは項目データを
一つ以上指定することで、項目データの効果的な選択が
実現できる。
【0028】また、図7における2番目の氏名データ
(「日本大郎」)のように、同一の印鑑データを有しな
がらも、異なる氏名データを有する構造解析結果を取得
することができるため、文字認識結果の誤りや偽筆等の
発見が容易になる。
【0029】前述の実施形態では、構造解析部の罫線判
定の説明に水平/垂直方向の投影結果における黒の塊の
大きさを用いたが、水平/垂直方向のランレングスにお
ける連結黒画素数を用いることもできる。
【0030】尚、前述の実施形態では、構造解析部の表
枠矩形抽出の説明に水平/垂直方向の二本の罫線に囲ま
れる領域を用いたが、文書固有のフォーマット情報を用
いることもできる。
【0031】また、前述の実施形態では、構造解析部の
説明に水平/垂直方向の投影結果における黒の塊の大き
さによる罫線判定、水平/垂直方向の二本の罫線に囲ま
れる領域を抽出する表枠矩形抽出、項目データの表枠矩
形は項目名の表枠矩形の右隣に位置するという知識によ
る構造解析手法を用いたが、文書構造のレイアウト規則
を文書モデルとして構造解析に利用する手法(例えば前
記文献参照)を用いることもできる。
【0032】さらに、実施形態2では、項目データ照合
部の説明に蓄積された画像データの部分画像データを示
す項目データを指定してイメージ照合技術を用いたが、
テキストデータを示す項目データを指定してテキスト照
合技術を用いることもできる。また、該システムが利用
される環境によって項目データがテキストデータである
か、あるいは蓄積された画像データの部分画像データで
あるかが自明である場合、項目データ照合部をテキスト
照合機能のみ、あるいはイメージ照合機能のみで構成す
ることもできる。
【0033】
【発明の効果】以上詳細に説明したように、請求項1に
記載の発明によれば、罫線による表構造を有する文書画
像を蓄積する機能を有し、該蓄積された文書画像の選択
や分類を行うファイリング装置において、画像読取装置
により読み取った文書画像データを画像データベースに
格納する画像データ記憶部と、文書画像中の表構造から
抽出した縦・横方向の罫線に基づいて前記表構造の基本
要素である表枠矩形を抽出し、抽出された表枠矩形の頂
点の座標値に基づいて項目名矩形及び項目データ矩形を
抽出して表枠構造を求めると共に、項目名矩形について
は、その矩形内部の文字認識を行って項目名を取得し、
項目データ矩形については当該矩形に属するデータが画
像データか否かに応じて画像領域を示す座標値あるいは
文字データを取得して項目データとし、前記項目名及び
項目データを対応づけて構造解析結果データベースとし
て出力する構造解析部と、前記構造解析結果データベー
スから構造解析結果の任意の項目を一つ以上指定する項
目指定部と、前記項目指定部で指定した項目の項目デー
タを前記構造解析結果データベースから全て取得する項
目データ取得部と、前記項目データ取得部で取得した項
目データが蓄積された画像データの部分画像データを示
す場合、該部分画像データを項目データ記憶部内のイメ
ージメモリに格納し、画像表示部に表示させる項目デー
タ記憶部とを備えた構成としたので、画像データの構造
解析結果において、画像データの部分画像データを項目
データに持つ項目を項目名で指定することができ、かつ
項目名を指定することで画像データの部分画像データで
ある項目データを全て取得し、まとめてディスプレイ等
に表示できる。こうすることで、視覚的に項目データを
容易に確認することができ、項目データ上の不備等を即
座に発見できるため、修正作業等に速やかに取り掛かる
ことができる。
【0034】また、請求項2に記載の発明によれば、罫
線による表構造を有する文書画像を蓄積する機能を有
し、該蓄積された文書画像の選択や分類を行うファイリ
ング装置において、画像読取装置により読み取った文書
画像データを画像データベースに格納する画像データ記
憶部と、文書画像中の表構造から抽出した縦・横方向の
罫線に基づいて前記表構造の基本要素である表枠矩形を
抽出し、抽出された表枠矩形の頂点の座標値に基づいて
項目名矩形及び項目データ矩形を抽出して表枠構造を求
めると共に、項目名矩形については、その矩形内部の文
字認識を行って項目名を取得し、項目データ矩形につい
ては当該矩形に属するデータが画像データか否かに応じ
て画像領域を示す座標値あるいは文字データを取得して
項目データとし、前記項目名及び項目データを対応づけ
て構造解析結果データベースとして出力する構造解析部
と、前記構造解析結果データベースから構造解析結果の
任意の項目を一つ以上指定する項目指定部と、前記項目
指定部で指定した項目の項目データを前記構造解析結果
データベースから全て取得する項目データ取得部と、前
記項目データ取得部で取得した項目データが蓄積された
画像データの部分画像データを示す場合、該部分画像デ
ータを項目データ記憶部内のイメージメモリに格納する
項目データ記憶部と、前記項目データ取得部で取得した
項目データのうち、テキストデータを示す項目データあ
るいは蓄積された画像データの部分画像データを示す項
目データを一つ以上指定し、テキストデータを示す項目
データを指定した場合はテキスト照合を行い、部分画像
データを示す項目データを指定した場合はイメージ照合
を行うことで、指定した項目データAと一致する全ての
項目データA’を取得すると共に、前記項目指定部で指
定した他の項目の項目データBのうち、前記項目データ
(A,A’)と同一の構造解析結果に記述されている項
目データB’を全て取得して、項目データ(A,A’)
と項目データB’とを対応づけて画像表示部に表示させ
る項目データ照合部とを備えた構成としたので、画像デ
ータの構造解析結果において、画像データの部分画像デ
ータを項目データに持つ項目を項目名で指定することが
でき、かつ項目名を指定することで帳票画像データの部
分画像データである項目データを全て取得することがで
きる。
【0035】また、取得した項目データのうち、テキス
トデータを示す項目データあるいは蓄積された画像デー
タの部分画像データを示す項目データを一つ以上指定
し、テキストデータを示す項目データを指定した場合は
テキスト照合を行い、部分画像データを示す項目データ
を指定した場合はイメージ照合を行うことで、指定した
項目データAと一致する全ての項目データA’を取得す
ると共に、前記項目指定部で指定した他の項目の項目デ
ータBの中から、前記項目データ(A,A’)と同一の
構造解析結果に記述されている項目データB’を全て取
得して、項目データ(A,A’)と項目データB’とを
対応づけてディスプレイ等に表示できる。このように、
項目あるいは項目データを一つ以上指定することで、項
目データの効果的な選択が実現できる。
【図面の簡単な説明】
【図1】本発明の実施形態1におけるファイリング装置
の構成を示すブロック図である。
【図2】実施形態1におけるファイリング装置の動作を
示す流れ図である。
【図3】帳票画像データの一例を示す図である。
【図4】構造解析結果の一例を示す図である。
【図5】本発明の実施形態2におけるファイリング装置
の構成を示すブロック図である。
【図6】実施形態2におけるファイリング装置の動作を
示す流れ図である。
【図7】実施形態2における画像表示の一例を示す図で
ある。
【符号の説明】
10 ファイリング装置 20 画像読取部 30 画像データ記憶部 40 構造解析部 50 項目指定部 60 項目データ取得部 70 項目データ記憶部 75 項目データ照合部 80 画像表示部 100 画像データベース 200 構造解析結果データベース
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06K 9/00 G06F 15/40 370B 5L096 9/20 340 15/401 330Z 15/62 330A 15/70 330Q Fターム(参考) 5B009 SA12 5B029 BB02 CC29 EE12 5B050 BA10 BA16 CA07 EA06 EA20 FA02 FA19 GA08 5B064 AA01 AA10 CA08 FA01 FA13 5B075 ND07 ND34 PQ02 5L096 BA14 BA17 DA02 FA03 FA44

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 罫線による表構造を有する文書画像を蓄
    積する機能を有し、該蓄積された文書画像の選択や分類
    を行うファイリング装置において、 画像読取装置により読み取った文書画像データを画像デ
    ータベースに格納する画像データ記憶部と、 文書画像中の表構造から抽出した縦・横方向の罫線に基
    づいて前記表構造の基本要素である表枠矩形を抽出し、
    抽出された表枠矩形の頂点の座標値に基づいて項目名矩
    形及び項目データ矩形を抽出して表枠構造を求めると共
    に、項目名矩形については、その矩形内部の文字認識を
    行って項目名を取得し、項目データ矩形については当該
    矩形に属するデータが画像データか否かに応じて画像領
    域を示す座標値あるいは文字データを取得して項目デー
    タとし、前記項目名及び項目データを対応づけて構造解
    析結果データベースとして出力する構造解析部と、 前記構造解析結果データベースから構造解析結果の任意
    の項目を一つ以上指定する項目指定部と、 前記項目指定部で指定した項目の項目データを前記構造
    解析結果データベースから全て取得する項目データ取得
    部と、 前記項目データ取得部で取得した項目データが蓄積され
    た画像データの部分画像データを示す場合、該部分画像
    データを項目データ記憶部内のイメージメモリに格納
    し、画像表示部に表示させる項目データ記憶部と、を備
    えたことを特徴とするファイリング装置。
  2. 【請求項2】 罫線による表構造を有する文書画像を蓄
    積する機能を有し、該蓄積された文書画像の選択や分類
    を行うファイリング装置において、 画像読取装置により読み取った文書画像データを画像デ
    ータベースに格納する画像データ記憶部と、 文書画像中の表構造から抽出した縦・横方向の罫線に基
    づいて前記表構造の基本要素である表枠矩形を抽出し、
    抽出された表枠矩形の頂点の座標値に基づいて項目名矩
    形及び項目データ矩形を抽出して表枠構造を求めると共
    に、項目名矩形については、その矩形内部の文字認識を
    行って項目名を取得し、項目データ矩形については当該
    矩形に属するデータが画像データか否かに応じて画像領
    域を示す座標値あるいは文字データを取得して項目デー
    タとし、前記項目名及び項目データを対応づけて構造解
    析結果データベースとして出力する構造解析部と、 前記構造解析結果データベースから構造解析結果の任意
    の項目を一つ以上指定する項目指定部と、 前記項目指定部で指定した項目の項目データを前記構造
    解析結果データベースから全て取得する項目データ取得
    部と、 前記項目データ取得部で取得した項目データが蓄積され
    た画像データの部分画像データを示す場合、該部分画像
    データを項目データ記憶部内のイメージメモリに格納す
    る項目データ記憶部と、 前記項目データ取得部で取得した項目データのうち、テ
    キストデータを示す項目データあるいは蓄積された画像
    データの部分画像データを示す項目データを一つ以上指
    定し、テキストデータを示す項目データを指定した場合
    はテキスト照合を行い、部分画像データを示す項目デー
    タを指定した場合はイメージ照合を行うことで、指定し
    た項目データAと一致する全ての項目データA’を取得
    すると共に、前記項目指定部で指定した他の項目の項目
    データBのうち、前記項目データ(A,A’)と同一の
    構造解析結果に記述されている項目データB’を全て取
    得して、項目データ(A,A’)と項目データB’とを
    対応づけて画像表示部に表示させる項目データ照合部
    と、を備えたことを特徴とするファイリング装置。
JP24994799A 1999-09-03 1999-09-03 ファイリング装置 Withdrawn JP2001075984A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24994799A JP2001075984A (ja) 1999-09-03 1999-09-03 ファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24994799A JP2001075984A (ja) 1999-09-03 1999-09-03 ファイリング装置

Publications (1)

Publication Number Publication Date
JP2001075984A true JP2001075984A (ja) 2001-03-23

Family

ID=17200558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24994799A Withdrawn JP2001075984A (ja) 1999-09-03 1999-09-03 ファイリング装置

Country Status (1)

Country Link
JP (1) JP2001075984A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100435697B1 (ko) * 2002-01-31 2004-06-12 현대자동차주식회사 차량용 전기 회로도의 이미지 파일 생성방법
JP2009301272A (ja) * 2008-06-12 2009-12-24 Pfu Ltd 証憑管理装置および証憑管理方法
JP2013015909A (ja) * 2011-06-30 2013-01-24 Fujitsu Ltd 表構造自動認識プログラム、表構造自動認識方法及び表構造自動認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100435697B1 (ko) * 2002-01-31 2004-06-12 현대자동차주식회사 차량용 전기 회로도의 이미지 파일 생성방법
JP2009301272A (ja) * 2008-06-12 2009-12-24 Pfu Ltd 証憑管理装置および証憑管理方法
JP2013015909A (ja) * 2011-06-30 2013-01-24 Fujitsu Ltd 表構造自動認識プログラム、表構造自動認識方法及び表構造自動認識装置

Similar Documents

Publication Publication Date Title
EP0774729B1 (en) Character recognizing and translating system
JP6569532B2 (ja) 管理システム、リスト作成装置、リスト作成方法、管理方法及び管理用プログラム
US8655107B2 (en) Signal processing apparatus, signal processing method, computer-readable medium and computer data signal
CN111507251A (zh) 试题图像中作答区域的定位方法、装置和电子设备
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
JPH05143707A (ja) 符号化画像データの処理方法および装置
JPH08235341A (ja) ドキュメントファイリング装置および方法
CN109447019B (zh) 基于图像识别与数据库存储的纸质扫描文档电子化方法
CN111638792A (zh) Ar效果的呈现方法、装置、计算机设备及存储介质
JP2001075984A (ja) ファイリング装置
CN112381100A (zh) 智能座舱系统中控报警文字识别方法、装置及设备
JP7026386B2 (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JPH08153110A (ja) 文書ファイリング装置及び方法
CN115631493B (zh) 文本区确定方法、系统及相关装置
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2803736B2 (ja) 文字認識方式
WO2021117128A1 (ja) 帳票画像処理システム
JPH07152856A (ja) 光学的文字読取装置
JPH0689330A (ja) 画像ファイリングシステム
JP3199175B2 (ja) 捺印文字検査方法および装置
JPH01292586A (ja) 文字認識支援装置
JP2020095430A (ja) 情報処理装置、その制御方法とプログラム
JP4230478B2 (ja) 文書処理装置、方法およびプログラム
JP2023027838A (ja) 文書処理装置、文書処理方法及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061107