JPH08329187A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH08329187A
JPH08329187A JP7139067A JP13906795A JPH08329187A JP H08329187 A JPH08329187 A JP H08329187A JP 7139067 A JP7139067 A JP 7139067A JP 13906795 A JP13906795 A JP 13906795A JP H08329187 A JPH08329187 A JP H08329187A
Authority
JP
Japan
Prior art keywords
image
data
ruled line
cell
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7139067A
Other languages
English (en)
Inventor
Tetsuo Nakamura
哲夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7139067A priority Critical patent/JPH08329187A/ja
Publication of JPH08329187A publication Critical patent/JPH08329187A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 表罫線や認識文字の確認・修正を容易に行え
るようにした文書読取装置を提供することを目的とす
る。 【構成】 画像メモリ3に格納された画像データから表
領域を抽出すると共に、表メモリ5に格納された表罫線
データを読み出し、表領域の画像と表罫線の画像との両
者を互いの線が区別できるように表示部9の表示画面に
表示する表示手段と、表領域の画像と表罫線の画像とが
表示された表示画面上で、表罫線の修正をオペレータの
指示で行えるようにした表罫線確認・修正手段とを総合
制御部8に設けた。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、媒体である文書上に記
載された文字,図形,絵,写真や罫線等のイメージ情報
を読み取り、記憶してある認識データに従ってそのイメ
ージ情報を認識し、その認識結果をオペレータが確認し
て認識誤りに対して修正を施すことができる文書読取装
置に関し、特に、表の読取結果の確認・修正に有用なも
のである。
【0002】
【従来の技術】従来の文書読取装置では、特に、表形式
で表された文書を読み取る場合には、読み取った画像デ
ータを表解析して罫線や行間空白等を認識すると共に、
文字部分を抽出して文字を認識した後に、その認識文字
を読み取った表形式で表示画面上に表示して、オペレー
タに表の読取結果の確認・修正を行わせるようにしてい
た。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た文書読取装置では、表の読取結果の確認・修正は、罫
線や行間空白等を認識した表解析結果の確認・修正も、
文字認識結果の確認・修正と共に同時に表示される表示
画面上で行わせるようにしていた。このため、表解析結
果に誤りがあると、表示画面上の文字を見づらくさせて
文字の確認・修正をさせにくくし、修正作業を煩雑なも
のにする問題があった。また、かかる問題が生じると、
オペレータの負担を多大にする問題があった。
【0004】例えば、従来の文書読取装置によると、表
が正しく認識されなかった場合には、文字認識後に修正
するようにしているので、表データに従った文字認識結
果の表示は、図8に示すように、表形式の崩れた形で表
示されてしまうため、並びかえや画像入力からやり直さ
なければならず、修正作業が煩雑であり作業量も多大と
なる問題があった。
【0005】
【課題を解決するための手段】そこで本発明の文書読取
装置は、画像メモリに格納された画像データから表領域
を抽出すると共に、表メモリに格納された表罫線データ
を読み出し、表領域の画像と表罫線の画像との両者を互
いの線が区別できるように表示画面に表示する表示手段
と、表領域の画像と表罫線の画像とが表示された表示画
面上で、表罫線の修正をオペレータの指示で行えるよう
にした表罫線確認・修正手段とを設け、その表罫線の確
認・修正を行った後に、文字認識を行って認識データの
確認修正をオペレータに行わせるようにした。
【0006】
【作用】このような構成によると、表罫線及びセルのそ
れぞれの抽出後であって文字認識前に画像データの表示
にそれぞれの抽出結果の表示を重ねて表示して、その都
度確認・修正することができるようになる。このため、
文字認識後に文字の確認・修正を施すときには、表罫線
及びセルを正しい認識状態にすることができるので、表
示画面と文書との比較がしやすくなって、オペレータが
認識文字の確認・修正を容易に行うことができるように
なる。
【0007】
【実施例】以下に、図面を参照して、本発明の実施例を
説明する。 第1の実施例 図1は、文書読取装置の構成を示すブロック図である。
なお、表形式の文書を読み取る場合の説明をする。
【0008】この文書読取装置1は、画像入力部2、画
像メモリ3、表解析部4、表メモリ5、文字認識部6、
認識メモリ7を有し、それぞれが総合制御部8と接続さ
れるようにしてある。また、前記総合制御部8には、表
示部9と操作部10とを接続してある。前記画像入力部
2は、読取対象の文書を光学的に走査し、文書上に記録
された表を読み取り、画像データを作成するものであ
る。なお、画像ファイルや通信回線を介して他システム
から画像データを得ることもできる(図示せず)。
【0009】前記画像メモリ3は、画像入力部2が作成
した画像データを格納するものである。前記表解析部4
は、画像メモリ3内の画像データから表領域を抽出し、
この表領域の罫線とセルを抽出して、表罫線の抽出結果
とセルの抽出結果とで構成される表データを作成する。
【0010】前記表メモリ5は、表解析部4が作成した
表データを格納するものである。前記文字認識部6は、
表解析部4に格納してある表データと画像メモリ3に格
納してある画像データとから表内のセルの画像から文字
画像を抽出して、この文字画像を認識して認識データを
作成する。この認識データは、対象の文字画像の確から
しい文字コードで表される。なお、その認識データを単
語照合して修正するようにしてもよい。
【0011】前記認識メモリ7は、文字認識部6が作成
した認識データを格納するものである。前記総合制御部
8は、上記各部や各メモリの動作全体を制御するもので
あり、認識結果を表示部9(CRT等)に表示したり、
オペレータが操作部10(キーボード、マウス等)を操
作して動作制御の指示をするために、画像入力部2、表
解析部4および文字認識部6の処理の開始・終了指示、
処理結果(画像データ、表データ、および認識データ)
の表示やその確認・修正などのオペレータと文書読取装
置とのインターフェースをとるようにしてある。また、
画像メモリ3に格納された画像データから表領域を抽出
すると共に、表メモリ5に格納された表罫線データを読
み出し、表領域の画像と表罫線の画像との両者を互いの
線が区別できるように表示部9の表示画面に表示する表
示手段と、表領域の画像と表罫線の画像とが表示された
表示画面上で、表罫線の修正をオペレータの指示で行え
るようにした表罫線確認・修正手段とを有している。さ
らに、画像メモリ3に格納された画像データから表領域
を抽出すると共に、表メモリ5に格納されたセルデータ
を読み出し、表領域の画像にセルを表す枠の画像を重ね
て両者を表示部9の表示画面に表示する表示手段と、表
領域の画像と表罫線の画像とが表示された表示画面上
で、セルを表す枠の画像位置の修正をオペレータの指示
で行えるようにしたセル確認・修正手段とを有してい
る。
【0012】なお、この文書読取装置1では、1頁毎に
表形式の文書を読み込んで、確認・修正処理を施すよう
にするものとする。次に、上記構成の文書読取装置の動
作を説明する。図2は、第1の実施例の文書読取処理の
フローチャートである。 S1:画像入力部2により画像を1頁毎に入力する。す
なわち、画像入力部2は、読取対象の入力文書を光学的
に走査し、文書上に記録された表を光電変換により画像
信号に変換し、さらに、この画像信号をデジタル二値の
画像データに変換する。この画像データを総合制御部8
により表示部9に画像表示し、オペレータが操作部10
を使い、この画像データを確認・修正する。もし、画像
データに不良があれば、再度画像入力する。確認後の画
像データを画像メモリ3に格納し、処理をS2に移す。
例えば、画像入力する表形式の文書は、図3に示す場合
とする。 S2:上記S1の画像入力が終わると、総合制御部8
は、表解析部4により画像メモリ3に格納した画像デー
タから黒画素の周辺分布ヒストグラムを利用して表領域
を抽出させ、黒画素の連結を利用して表罫線を抽出さ
せ、表メモリ5に抽出した表罫線を格納させ、処理をS
a3に移す。例えば、抽出した表罫線は、図4に示す場
合として以下の説明をする。この図4に示す表罫線は、
図3に示す縦罫線Xが抽出できなかったものとする。 S3:上記Sa2の表罫線の抽出が終わると、オペレー
タに表罫線の確認・修正を行わせる。総合制御部8は、
表メモリ5に格納した表罫線の直線表示と画像メモリ3
内の画像データの画像表示を表示部9に重ねて表示し、
オペレータに表罫線の確認をさせ、誤りがあれば操作部
10で修正させる。例えば、上述のように表示部9に重
ねて表示する場合は、図3に示す表形式の文書の画像デ
ータを画像メモリ3から読み出して表示した後に、図4
に示す表罫線の抽出結果を表メモリ5から読み出して画
像データの表示の上に重ねて表示する。このとき、画像
データの表示と抽出結果の表示とを判別しやすくするた
め、例えば、前者は黒、後者は青の破線として表示する
ようにしてもよい。そして、オペレータが、その重ねて
表示された表示画面を見て、表罫線の抽出結果の確認・
修正を行う。その修正時に、総合制御部8は、例えば、
図3の罫線Xが抽出できない場合には、図4の抽出結果
に罫線Xに相当する罫線をオペレータに操作部10を操
作させて修正を行わせ、図5に示すように罫線を追加し
て修正し、その修正結果を表メモリ5に格納するように
動作制御する。 S4:上記S3の表罫線の確認・修正が終わると、総合
制御部8は、表解析部4によりセルの抽出をさせる。表
解析部4は、上記S3で確認して表メモリ5に格納され
た表罫線を読み出し、その表罫線に従って、罫線に囲ま
れた矩形毎に、画像メモリ3内の画像データから黒画素
の周辺分布ヒストグラムを利用して文字画像部分をセル
として抽出する。例えば、図3の表形式の文書の画像デ
ータから文字画像部分をセルとして抽出し、総合制御部
8内の一時記憶部に格納しておいて、処理をS5に移
す。なお、総合制御部8内の一時記憶部に格納するので
はなく、表メモリ5等に格納するようにしてもよい。 S5:上記S4のセルの抽出が終わると、オペレータに
セル抽出結果の確認・修正をさせる。総合制御部8は、
図6に示すように、画像メモリ3内の画像データの画像
表示を表示部9に表示した後に、その画像データに重ね
てセルを破線等で囲んだ枠表示として表示する。オペレ
ータは、その表示を見て操作部10を使ってセルの抽出
結果の確認・修正を行う。このセルが正確に抽出できて
いない場所があれば、例えば、その枠表示を表示画面上
で移動させて適正な位置にするようにしたり、再度セル
抽出をさせるようにしてもよい。このセルの確認・修正
の後、総合制御部8は、表罫線の抽出結果とセルの抽出
結果とで構成される表データを表メモリ5に格納し、処
理をS6に移す。 S6:上記S5のセル抽出結果の確認・修正が終わる
と、総合制御部8は、文字認識部6に文字認識をさせ
る。文字認識部6は、表メモリ3内の表データのセル抽
出結果に従い、画像メモリ3内の画像データから黒画素
の周辺分布ヒストグラムを利用してセルから行を切り出
した後に、行から文字を切り出す。そして、この1文字
毎の文字画像は、認識辞書を参照して認識処理を施され
て文字コードに変換される。その認識辞書は、文字認識
部6内に格納するようにしたもので、標準的な文字の認
識特徴を表したものである。そして、変換された文字コ
ードを認識データとしてセル単位毎に区切って認識メモ
リ7に格納し、処理をS7に移す。 S7:上記S6の文字認識が終わると、総合制御部8
は、オペレータに文字認識結果の確認・修正をさせる。
総合制御部8は、認識メモリ7内の認識データを表メモ
リ5内の表データに従い、例えば、図7に示すように、
カンマを用いて表示部9に文字表示する。オペレータ
が、この表示を見て操作部10を使い文字認識結果を確
認・修正したら、総合制御部8は、その確認・修正後の
認識データを認識メモリ7に格納して処理を終了する。
なお、図示しないプリンタ等から認識結果等を出力した
り、図示しない出力メモリを介することにより、他の文
書処理システム(ワープロ、DTPシステム、文書管理
システム等)に認識結果を渡したり、通信により他の文
書管理システムに認識結果を渡すようにしてもよい。
【0013】上記第1の実施例によると、表罫線および
セルのそれぞれの抽出後であって文字認識前に画像デー
タの表示にそれぞれの抽出結果の表示を重ねてその都度
確認・修正するようにしたので、オペレータが容易に表
罫線の確認・修正をすることができるようになる。例え
ば、図3〜図5を参照して説明したように、罫線Xを抽
出できない場合には、画像表示に合わせて罫線を1本追
加するだけで容易にその修正作業を行うことができるよ
うになり、オペレータの負担も軽くすることができるよ
うになる。
【0014】第2の実施例 以下、第2の実施例の文書読取装置の基本構成は、上記
第1の実施例と同一であるのでその説明を省略し、同一
箇所に同一符号を付して説明するものとするが、表解析
部4と文字認識部6に上記第1の実施例の処理機能の他
に、下記の機能を追加した点が相違する。また、上記第
1の実施例で図2を参照して説明した処理は、基本的に
は上記第2の実施例と同一であり、相違する動作制御の
みを説明して他の動作制御の説明を省略する。
【0015】第2の実施例の文書読取装置1は、抽出し
た表罫線から見出し線を認知して見出し部分を検出する
処理機能を表解析部4に追加し、また、その見出し部分
のセルを抽出して、そのセル内の文字認識を行う処理機
能を文字認識部6に追加したものである。上記第1の実
施例と同様にS1で画像入力部2から画像入力して画像
メモリ3内に画像データを格納した後に、S2と同様に
して、例えば、表解析部4が、図9に示す画像データか
ら表罫線の抽出結果を作成する。そして、その抽出した
表罫線の表構造の解析をする。その解析は、図10に示
すように、その表罫線から、横方向の罫線で最上段の罫
線Y1、最下段の罫線Y5を除き、表の横幅全部に渡る
もので最上段を見出し線Y2とし、この見出し線Y2の
上側を見出し部分A1、下側をデータ部分A2として認
識するようにして行う。
【0016】次に、S3の表罫線の確認・修正では、上
述のようにして見出し線Y2とした罫線を他の罫線と区
別して表示する。例えば、見出し線Y2を赤の破線、他
の罫線を青の破線として表示する。ここで、見出し線Y
2を誤って検出する場合を想定して、オペレータが見出
し線の選択及び修正を行えるようにしてもよい。そし
て、S4及びS5と同様にセルの抽出及びセル抽出結果
の確認・修正を行った後に、S6の文字認識では、文字
認識部6により見出し部分A1の認識結果に従ったデー
タ部分A2の文字認識をする。ここで、例えば、表を
「姓名」「所属」「資格」から構成するものとすると、
「姓名」「所属」「資格」のそれぞれに対応した単語を
登録した単語辞書を文字認識部6内に設けておき、文字
認識部6がセル内の文字認識を行う場合に、適宜、単語
辞書の中の文字と対応させて文字認識を行うことができ
るようにしておく。すなわち、図11に示すように、単
語辞書は見出し語と単語で構成するものとすると、ま
ず、見出し部分A1を見出し語の文字範囲で認識し、こ
の候補文字の組み合わせと見出し語を照合して一致する
ものを認識結果とする。この結果、例えば、「姓名」と
「資格」が認識結果となった場合には、表の左部分B1
のデータ部A2は単語辞書「姓名」の単語の文字範囲で
認識し、この候補文字の組み合わせと単語辞書「姓名」
の単語を照合して一致するものを認識結果とし、また、
表の右部分B2のデータ部A2は単語辞書「資格」を使
って同様に処理する。このように文字認識を施した後
に、S7と同様に、文字認識結果の確認・修正を行い、
処理を終了する。
【0017】上記第2の実施例によると、表罫線の画像
データから見出し線Y2を検出した後に、オペレータに
確認・修正させて正確に見出し線Y2を読み取る。そし
て、この見出し線Y2を利用して表を見出し部分A1と
データ部分A2とに分け、単語辞書を利用した文字認識
と単語照合により、正確でかつ高速な表の読み取りを実
現することが期待できる。
【0018】なお、上述のように、見出し線Y2が横線
でなくても、縦線の場合も同様にして処理することがで
きる。すなわち、縦線の場合には、縦方向の罫線で一番
左側の罫線、一番右側の罫線を除き、表の縦幅全部に渡
るもので一番左側を見出し線とし、この見出し線の左側
を見出し部分、右側をデータ部分として認識するように
して行うことができる。
【0019】また、上述のように、見出し線Y2の検出
だけでなく、他の意味付けされた線の検出も同様に行う
ことができる。例えば、図12に示す表のように、大見
出しと小見出しとに分かれている部分等がある場合に
は、図13の見出し分割線C1、縦方向の見出し線C
2、見出し親子線C3、省略線C4、横方向の見出し線
C5を検出してこれを利用することにより、さらに複雑
な表構造に対応することもできる。
【0020】上記第1の実施例及び第2の実施例では、
表の記録された文書を読取対象としたが、表以外の文
字、図形、写真などが表と混在した文書でも、公知の領
域検出技術を利用し、表領域と表以外の領域とを区別し
た後に、上述の各実施例と同様にして表形式の文書の読
み取りを行うことも可能である。
【0021】
【発明の効果】以上説明したように本発明の文書読取装
置によると、表罫線及びセルのそれぞれの抽出後であっ
て文字認識前に画像データの表示にそれぞれの抽出結果
の表示を重ねて表示して、その都度確認・修正すること
ができるようになるため、文字認識後に文字の確認・修
正を施すときには、表罫線及びセルを正しい認識状態に
することができる効果が得られる。このため、表示画面
と文書との比較がしやすくなって、オペレータが認識文
字の確認・修正を容易に行うことができるようになる効
果が得られる。例えば、罫線の抽出が失敗した場合に
は、画像表示に合わせて罫線を追加するだけで容易にそ
の修正作業を行うことができるようになり、オペレータ
の修正作業の負担を軽くする効果が得られる。
【図面の簡単な説明】
【図1】第1の実施例の文書読取装置の構成を示すブロ
ック図
【図2】第1の実施例の処理フローチャート
【図3】表形式の文書の例示図
【図4】表罫線の抽出結果の例示図
【図5】表罫線の確認・修正後の例示図
【図6】セル抽出結果の例示図
【図7】カンマを用いた文字認識結果の表示の例示図
【図8】表罫線抽出で誤った場合の文字認識結果の表示
の例示図
【図9】画像データの例示図
【図10】表罫線の抽出結果の例示図
【図11】単語辞書の例示図
【図12】画像データの例示図
【図13】表罫線の抽出結果の例示図
【符号の説明】
1 文書読取装置 2 画像入力部 3 画像メモリ 4 表解析部 5 表メモリ 6 文字認識部 7 認識メモリ 8 総合制御部 9 表示部 10 操作部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06K 9/46 G06F 15/22 C 310Z

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 表が記載された文書を走査して画像デー
    タを作成する画像入力部と、この画像入力部で作成され
    た画像データを格納する画像メモリと、その画像データ
    から表領域を抽出して表罫線データを作成し、表罫線同
    士で囲まれる領域内の文字がある部分をセルとして抽出
    し、そのセルデータを作成する表解析部と、前記表罫線
    データと前記セルデータを格納する表メモリと、前記表
    罫線データと前記セルデータに基づいて、前記画像デー
    タから各セルに存在する文字画像を切り出して文字画像
    を認識して、文字の認識データを作成する文字認識部
    と、その認識データをセルデータと対応させて格納して
    おく認識メモリとを有し、セルデータに従って認識デー
    タを表示部に表示してオペレータに認識データの確認を
    させ、正しい文字認識が行われなかった文字をオペレー
    タの操作部の操作により修正させるようにした文書読取
    装置において、 画像メモリに格納された画像データから表領域を抽出す
    ると共に、表メモリに格納された表罫線データを読み出
    し、表領域の画像と表罫線の画像との両者を互いの線が
    区別できるように表示画面に表示する表示手段と、 表領域の画像と表罫線の画像とが表示された表示画面上
    で、表罫線の修正をオペレータの指示で行えるようにし
    た表罫線確認・修正手段とを設け、 その表罫線の確認・修正を行った後に、文字認識を行っ
    て認識データの確認修正をオペレータに行わせるように
    したことを特徴とする文書読取装置。
  2. 【請求項2】 請求項1において、画像メモリに格納さ
    れた画像データから表領域を抽出すると共に、表メモリ
    に格納されたセルデータを読み出し、表領域の画像にセ
    ルを表す枠の画像を重ねて両者を表示画面に表示する表
    示手段と、 表領域の画像と表罫線の画像とが表示された表示画面上
    で、セルを表す枠の画像位置の修正をオペレータの指示
    で行えるようにしたセル確認・修正手段とを設け、 表罫線の確認・修正とセルの確認・修正とを行った後
    に、文字認識を行って認識データの確認修正をオペレー
    タに行わせるようにしたことを特徴とする文書読取装
    置。
  3. 【請求項3】 請求項1において、表解析部が、表罫線
    の中から見出し線を検出しておき、 表罫線確認・修正手段が、見出し線と一般の表罫線を区
    別して表示して、見出し部分とデータ部分とが区別でき
    るようにしたことを特徴とする文書読取装置。
  4. 【請求項4】 請求項3において、表形式の文書の見出
    し語に対応した単語を登録した単語辞書を文字認識部に
    設けておき、 文字認識部が見出し部分のセルに従い単語辞書を検索し
    てそのセル内の文字を認識し、その見出し部分の文字に
    対応する単語辞書を検索してデータ部分のセルに従って
    文字を認識するようにしたことを特徴とする文書読取装
    置。
JP7139067A 1995-06-06 1995-06-06 文書読取装置 Pending JPH08329187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7139067A JPH08329187A (ja) 1995-06-06 1995-06-06 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7139067A JPH08329187A (ja) 1995-06-06 1995-06-06 文書読取装置

Publications (1)

Publication Number Publication Date
JPH08329187A true JPH08329187A (ja) 1996-12-13

Family

ID=15236729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7139067A Pending JPH08329187A (ja) 1995-06-06 1995-06-06 文書読取装置

Country Status (1)

Country Link
JP (1) JPH08329187A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001093188A1 (fr) * 2000-06-02 2001-12-06 Japan Science And Technology Corporation Procede de traitement de document, support sur lequel est enregistre un programme de traitement de document et processeur de document
JP2010061693A (ja) * 2009-12-15 2010-03-18 Fujitsu Ltd 帳票認識方法及び帳票認識装置
JP2011077705A (ja) * 2009-09-29 2011-04-14 Sharp Corp 画像処理装置及び画像処理方法
JP2016027681A (ja) * 2014-07-07 2016-02-18 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2016071898A (ja) * 2014-09-30 2016-05-09 メディア株式会社 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体
JP2017182276A (ja) * 2016-03-29 2017-10-05 株式会社東芝 画像処理システム、画像処理装置、および画像処理プログラム
JP2022128427A (ja) * 2021-02-22 2022-09-01 ネイバー コーポレーション テーブル生成方法及びシステム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001093188A1 (fr) * 2000-06-02 2001-12-06 Japan Science And Technology Corporation Procede de traitement de document, support sur lequel est enregistre un programme de traitement de document et processeur de document
US7221795B2 (en) 2000-06-02 2007-05-22 Japan Science And Technology Corporation Document processing method, recording medium having recorded thereon document processing program, document processing program, document processing apparatus, and character-input document
JP2011077705A (ja) * 2009-09-29 2011-04-14 Sharp Corp 画像処理装置及び画像処理方法
JP2010061693A (ja) * 2009-12-15 2010-03-18 Fujitsu Ltd 帳票認識方法及び帳票認識装置
JP2016027681A (ja) * 2014-07-07 2016-02-18 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2016071898A (ja) * 2014-09-30 2016-05-09 メディア株式会社 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体
JP2017182276A (ja) * 2016-03-29 2017-10-05 株式会社東芝 画像処理システム、画像処理装置、および画像処理プログラム
JP2022128427A (ja) * 2021-02-22 2022-09-01 ネイバー コーポレーション テーブル生成方法及びシステム

Similar Documents

Publication Publication Date Title
US6628832B2 (en) Table recognition method and apparatus, and storage medium
JP3278471B2 (ja) 領域分割方法
JP2835178B2 (ja) 文書読取装置
US6201894B1 (en) Method and apparatus for extracting ruled lines or region surrounding ruled lines
JP7444495B2 (ja) Ocrベース文書分析システム及び方法
JPH08329187A (ja) 文書読取装置
US5233672A (en) Character reader and recognizer with a specialized editing function
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP3435375B2 (ja) 文字認識方法および装置
JP3484446B2 (ja) 光学文字認識装置
JP3157414B2 (ja) 文書読取装置
JPH117493A (ja) 文字認識処理装置
JPS594358Y2 (ja) 文字修正における文字制御装置
WO2023042270A1 (ja) 文字認識プログラム、文字認識システム、及び文字認識方法
JP2002366893A (ja) 帳票認識方法
JPS61198375A (ja) 光学的文字読取装置
JP2000339407A (ja) 画像処理装置及び画像処理方法及びコンピュータ読み取り可能な記憶媒体
JPS61198376A (ja) 光学的文字読取装置
JPS61198378A (ja) 光学的文字読取装置
JPH05303661A (ja) イメージデータ部分取得表示装置
JP2682873B2 (ja) 表形式文書の認識装置
JPH09269970A (ja) 文字認識方法とその装置
JPS61198377A (ja) 光学的文字読取装置
JPH09288714A (ja) 表認識方法および装置
JPH01292586A (ja) 文字認識支援装置