JP3281065B2 - 領域分離方法 - Google Patents

領域分離方法

Info

Publication number
JP3281065B2
JP3281065B2 JP30093792A JP30093792A JP3281065B2 JP 3281065 B2 JP3281065 B2 JP 3281065B2 JP 30093792 A JP30093792 A JP 30093792A JP 30093792 A JP30093792 A JP 30093792A JP 3281065 B2 JP3281065 B2 JP 3281065B2
Authority
JP
Japan
Prior art keywords
area
character
image
character area
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30093792A
Other languages
English (en)
Other versions
JPH06150057A (ja
Inventor
昌明 今泉
恒典 吉成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP30093792A priority Critical patent/JP3281065B2/ja
Publication of JPH06150057A publication Critical patent/JPH06150057A/ja
Application granted granted Critical
Publication of JP3281065B2 publication Critical patent/JP3281065B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙面に記載された情報
から文字領域を分離して抽出する領域分離方法に関する
ものである。
【0002】さらに詳述すれば、本発明は、新聞や雑誌
などの文章画像から所望とする記事内容を効果的に切抜
き抽出し、これをそのまま、または再編集して表示また
はファイルすることのできる実用性の高い新聞・雑誌な
どの切り出しのための領域分離方法に関するものであ
る。
【0003】
【従来の技術】従来技術1 新聞や雑誌などの文章画像には、数多くの記事が予め定
められた枠組み構成規則に従ってレイアウトして載せら
れている。そして、最近では、これらの中から所望とす
る記事を人間が指定(切抜き)し、再構築してコンピュ
ータシステムにファイリングすることが試みられてい
る。
【0004】従来技術2 また従来、この種の画像領域分離には、フーリエ変換に
よるエッジ検出等の方法が研究され、対象文書全体につ
いて演算するためのプログラムが開発されてきた。
【0005】
【発明が解決しようとする課題】課題1 しかしながら、新聞・雑誌などは紙面サイズが決められ
ているものの、各種記事は上記紙面サイズを有効に利用
すべく、ある領域に割り付けがなされて組み込まれてい
るため、文字領域,図・表領域,写真領域などが混在し
てあり、単に紙面上の単純な位置・領域を特定するだけ
では所望とする文字領域のみを抽出することができない
という不具合がある。
【0006】すなわち、1枚の紙面上で表示あるいはフ
ァイル化の対象となる記事は多数存在し、その中で種々
の形状に割り付けがなされているある一つの記事だけが
一つの単位記事となるので、例えば一紙面をページなど
とする固定的な単位のみでは扱うことができない。
【0007】また、コード化された文字情報を扱う場合
と異なり、文章画像として入力される情報を取り扱うの
で、必然的に領域の理解・判断という処理が必要となっ
てくる。
【0008】さらに、新聞・雑誌などの情報を効果的に
蓄積するために、コード化する領域(文字領域)と画像
情報として扱う領域(図・表領域,写真領域)などを適
切に判断することが要求される。
【0009】よって、本発明の第1の目的は、新聞や雑
誌などの中から所望とする記事を効果的に抽出して、割
り付け領域を抽出表示したり、あるいはファイル化する
ことのできる実用性の高い文章画像の領域分離方法を提
供することにある。
【0010】また、本発明の第2の目的は、図・表・グ
ラフなどの領域に含まれる文字領域を認識することによ
り、データベースなどに用いることができるよう構成し
た領域分離方法を提供することにある。
【0011】課題2 上述した第2の従来例では、文書全体に対して定められ
た種々の複雑な演算を施し、その結果のデータを記憶
し、さらに定められたデータ処理を行った後、定められ
た手順に従って領域を分けるといった複雑なルーチンを
経て分離が行われるため、正確ではある反面、 (1)演算処理に長い時間を要する。
【0012】(2)演算結果などのデータを格納する膨
大な記憶容量が必要になる。
【0013】という欠点があった。
【0014】ところが実際の文書は、ある程度まで(認
識率70〜80%程度)は、より簡単な方法で領域分離
することが可能であり、文書全体にこのように複雑な演
算処理をするのは無駄が多いことになる。
【0015】よって、本発明の第3の目的は、演算時間
を短縮すると共に、少ない記憶容量で正確な領域の識別
を可能とした領域分離方法を提供することにある。
【0016】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に係る本発明は、文字領域,図表領域,
写真領域のうち少なくともひとつの領域を含む画像情報
を入力する入力ステップと、前記画像情報から領域判別
のための特徴量を抽出する特徴量抽出ステップと、前記
特徴量を入力し、前記領域判別を行うための複数の条件
命題をファジィ集合を用いて設定し、ファジィ推論の結
果に基づいて文字領域,文字以外の領域を判別する判別
ステップと、前記判別ステップによる前記領域判別にお
いて文字領域以外の判別された領域については、当該領
域の内部についてさらに領域分離を行い、当該領域中に
含まれる文字領域を抽出し、表示あるいはファイル化す
るステップとを有する領域分離方法である。また、請求
項2に係る本発明は、入力された画像の中から文字領域
を抽出する領域分離方法において、入力された画像全体
に対して粗い文字領域識別処理を施す第1の識別ステッ
プと、前記第1の識別手段により判別し得なかった残り
の領域については、複雑な文字領域識別処理を施す第2
の識別ステップとを有するものである。
【0017】
【0018】
【0019】
【作用】本発明によれば、文章画像として入力される新
聞や雑誌などの文章画像から領域判別のための特徴量を
抽出し、領域判別のための複数の条件命題をファジィ集
合を用いて設定し、ファジィ推論の結果に基づいて領域
の判別をすることによって、人為的な判断処理を要する
ことなしに実用性の高い領域分離方法を実現することが
できる。
【0020】さらに、その他の本発明によれば、まず、
文書全体にファジィ推論などを用いて粗い領域判別を行
い、明確に文字領域と識別される部分と、文字領域か画
像領域かの判別が困難である部分とに分け、この後者の
部分についてのみに先の従来例で示した種々の方法(F
FT法など)を適用することにより、演算時間を短く
し、少ない記憶容量で正確に画像領域分離を行うことが
できる。
【0021】
【実施例】以下、図面を参照して本発明の各実施例を詳
細に説明する。なお、以下に述べる実施例では論文誌を
例に挙げて説明するが、一般的な新聞,雑誌,書籍など
も対象となることは言うまでもない。
【0022】実施例1 領域判別の対象となる論文誌は、図2に模式的に示すよ
うに、その紙面にタイトル21、氏名22、所属23、
見出し24、本文25A,25B、図26、表27、写
真28などが所定のレイアウト規則に従って割り付けし
て構成されている。このように、1枚の誌面中に複数の
領域が混在したものとなっている。
【0023】本発明の一実施例による領域分離システム
では、次のようにして画像入力される論文・新聞・雑誌
などの文章情報から所望とする領域の判定を行ってい
る。
【0024】本システムにおける処理は基本的には、図
1に示すように、 (1)入力された文章画像の中から、領域に分割する処
理。:S11 (2)文章画像から領域の判別に必要な特徴量を抽出す
る処理。:S12 (3)所定の規則に従い、上記領域の特性を判別する処
理。:S13 (4)領域判別が終了した画像領域を表示する処理また
はファイル化する処理。:S14 に大別される。
【0025】次に、それぞれの処理S11〜S14につ
いて、具体的に説明する。
【0026】(1)文章画像の文字領域・図表・写真の
境界は、例えば2値化後の画像拡大(deliatio
n)処理や画像融合(fusion)処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。
【0027】具体的には、多値画像の入力画像を適当な
しきい値処理した後の2値画像に図3に示すような拡大
処理(deliation):F(x,y)を適当な
数;m回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる(図4参照)。
【0028】(2)次に、画像から領域判別に必要な特
徴量を抽出する。まず、各領域について最小外接矩形を
求める(図5参照)。
【0029】そして、その外接矩形のW,Lを求める
(図6参照)。
【0030】(3)特徴量(W,L)を用いてラベリン
グした領域の属性を判別する。
【0031】領域の判別にあたり、判別関数が複雑にな
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするために、ここではファジィ表現を用いる。
【0032】具体的な例を以下に示す。
【0033】文字領域の判別として ルール1 ファジィ表現 領域の幅;Wが短く かつ 領域の長さ;Lが長い時 その領域が文字領域の可能性が高い。
【0034】−−−−(ルール1) と言うように表現する。
【0035】次に特徴量W,Lからどのようにしてその
領域の特性を決定するかについて、図7および図8を用
いて説明する。
【0036】ルール1を if {W(width) is SH(short)} and {L(length) is LN(long)} then Ptx(Possibility of text) is HG(high) ルール2を if{W(width) is VS(very short)} and {L(length) is MD(middle)} then Ptx(Possibility of text) is UK(unknown)
【0037】ここでifから後を前件部、thenから
後を後件部と呼ぶ。
【0038】そしてSH,LN,HGを各々言語真理値
と呼び、各々「短い」、「長い」、「高い」に相当す
る。
【0039】図8に戻って、領域i番目の特徴量をW
i,Liとする。
【0040】文字領域の判別に関するルールがn個あっ
た場合、ルール1の成立度:α1を求める。
【0041】W is SHの成立度をαW1 L is LNの成立度をαL1とすると α1=min(αW1,αL1) ルール1の結論部をfc1とすると f1=α1×fc1 同様にルール2の成立度:α2 α2=min(αW2,αL2) ルール2の結論部をfc2とすると f2=α2×fc2 全てのルールに関する結論をファジィ集合fcとする
と、 fc=max(f1,f2,…,fn) で表せる。これを非ファジィ化する場合、確定値Ptx
とすると、 Ptx=(積分)fc*x/(積分)fc 文字領域の可能性Ptxが求められる。
【0042】
【0043】(4)領域の判別が終了した領域について
は、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域については、そのままの
形でファイル化を行う。
【0044】さらに、文字領域/その他の領域について
指定された形式で表示を行う。
【0045】本発明の上記実施例によれば、文章画像の
なかの文字領域と、図・表・グラフ・写真領域の判別を
精度よく行うことができる。
【0046】そして文字領域に関しては文字認識を行い
コード化し、その他の領域について画像領域として記録
することにより、文章画像に比べてデータ量の圧縮・デ
ータ転送時間の短縮化・ファイル内容の修正が可能とな
る。
【0047】実施例2 図9は、本発明の第2の実施例による領域分離システム
を示すフローチャートである。
【0048】本システムにおける処理は基本的には、図
9に示すように (1)入力された文章画像の中から、領域に分割する処
理。:S21 (2)文章画像から、領域の判別に必要な特徴量を抽出
する処理。:S22 (3)所定の規則に従い、上記領域の特性を判別する処
理。:S23 (4)文字領域以外と判別された領域について、再度文
字領域の判別を行う。:S24 (5)領域判別が終了した画像領域を表示する処理また
はファイル化する処理。:S25 に大別される。
【0049】次に、それぞれの処理S21〜S25につ
いて、具体的に説明する。
【0050】(1)文章画像の文字領域・図表・写真の
境界は、例えば2値化後の画像拡大(deliatio
n)処理や画像融合(fusion)処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。
【0051】具体的には、多値画像の入力画像を適当な
しきい値処理した後の2値画像に図3に示すような拡大
処理(deliation):F(x,y)を適当な
数;m回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる(図4参照)。
【0052】(2)次に、画像から領域判別に必要な特
徴量を抽出する。まず、各領域について最小外接矩形を
求める(図5参照)。
【0053】そして、その外接矩形のW,Lを求める
(図6参照)。
【0054】(3)特徴量(W,L)を用いてラベリン
グした領域の属性を判別する。
【0055】領域の判別にあたり、判別関数が複雑にな
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするために、ここではファジィ表現を用いる。
【0056】具体的な例を以下に示す。
【0057】文字領域の判別として ルール1 ファジィ表現 領域の幅;Wが短く かつ 領域の長さ;Lが長い時 その領域が文字領域の可能性が高い。
【0058】−−−−(ルール1) と言うように表現する。
【0059】次に特徴量W,Lからどのようにしてその
領域の特性を決定するかについて、図7および図8を用
いて説明する。
【0060】ルール1を if {W(width) is SH(short)} and {L(length) is LN(long)} then Ptx(Possibility of text) is HG(high) ルール2を if{W(width) is VS(very short)} and {L(length) is MD(middle)} then Ptx(Possibility of text) is UK(unknown)
【0061】ここifから後を前件部、thenから後
を後件部と呼ぶ。
【0062】そしてSH,LN,HGを各々言語真理値
と呼び、各々「短い」、「長い」、「高い」に相当す
る。
【0063】図8に戻って、領域i番目の特徴量をW
i,Liとする。
【0064】文字領域の判別に関するルールがn個あっ
た場合、ルール1の成立度:α1を求める。
【0065】W is SHの成立度をαW1 L is LNの成立度をαL1とすると α1=min(αW1,αL1) ルール1の結論部をfc1とすると f1=α1×fc1 同様にルール2の成立度:α2 α2=min(αW2,αL2) ルール2の結論部をfc2とすると f2=α2×fc2 全てのルールに関する結論をファジィ集合fcとする
と、 fc=max(f1,f2,…,fn) で表せる。これを非ファジィ化する場合、確定値Ptx
とすると、 Ptx=(積分)fc*x/(積分)fc 文字領域の可能性をPtxが求められる。
【0066】写真領域の判別ルール、図領域の判別ルー
ル、表領域の判別ルールに関して同様の処理を行うこと
により領域の判別を行う。
【0067】(4)上記判別で文字領域以外と判別され
た領域の中にある領域について、再度特徴量(W,L)
を用いてラベリングした領域の属性を判別する。
【0068】これを、図10を用いて説明する。
【0069】領域2{(XL,YL)、(XR2,
YR2)}…領域n{(XLn,YLn),(XRn,
YRn)}が領域1{(XL1,YL1)(XR1,Y
R1)}に内包:XL1≦XLn≦XRn≦XR1かつ
YL1≦YLn≦YRn≦YR1され、しかも領域1が
上記(3)により文字以外の領域として判別され領域
2,領域nが文字領域として判別される。
【0070】(5)領域の判別が終了した領域につい
て、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域についてはそのままの形
でファイル化を行う。
【0071】
【0072】実施例3 第3の実施例における処理は、基本的には第1の実施例
における処理(図1参照)と同じである。
【0073】そこで、本実施例における各処理を具体的
に説明する。
【0074】(1)文章画像の文字領域・図表・写真の
境界は、例えば2値化後の画像拡大(deliatio
n)処理や画像融合(fusion)処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。
【0075】具体的には、多値画像の入力画像を適当な
しきい値処理した後の2値画像に図3に示すような拡大
処理(deliation):F(x,y)を適当な
数;m回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる(図4参照)。
【0076】(2)次に、画像から領域判別に必要な特
徴量を抽出する。まず、各領域について最小外接矩形を
求める(図5参照)。
【0077】そして、その外接矩形のW,Lを求める
(図11参照)。
【0078】(3)特徴量(W,L,Sa/S)を用い
てラベリングした領域の属性を判別する。
【0079】領域の判別にあたり、判別関数が複雑にな
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするためにここではファジィ表現を用いる。
【0080】具体的な例を以下に示す。
【0081】文字領域の判別として ルール1 ファジィ表現 領域の幅;Wが短く かつ 領域の長さ;Lが長く か
つ面積比Sa/Sが中くらいの時 その領域が文字領域の可能性が高い。
【0082】−−−−(ルール1) と言うように表現する。特徴量W,L,Sa/Sからど
のようにしてその領域の特性を決定するかについて、図
12および図13を用いて説明する。
【0083】ルール1を if {W(width) is SH(short)} and {L(length) is LN(long)} and {Sa/S is MD(middle)} then Ptx(Possibility of text) is HG( high) ルール2を if{W(width) is VS(very short)} and {L(length) is MD(middle)} and {Sa/S is MD(middle)} then Ptx(Possibility of text) is UK(unknown)
【0084】ここでifから後を前件部、thenから
後を後件部と呼ぶ。
【0085】そしてSH,LN,MD,HGを各々言語
真理値と呼び、各々「短い」、「長い」、「中くらい」
「高い」に相当する。
【0086】図13に戻って、領域i番目の特徴量をW
i,Li,Sai/Siとする。
【0087】文字領域の判別に関するルールがn個あっ
た場合、ルール1の成立度:α1を求める。
【0088】W is SHの成立度をαW1 L is LNの成立度をαL1 Sa/S is MDの成立度をαSa1/S1とする
と α1=min(αW1,αL1,αSa1/S1) ルール1の結論部をfc1とすると f1=α1×fc1 同様にルール2の成立度:α2 α2=min(αW2,αL2,αSa2/S2) ルール2の結論部をfc2とすると f2=α2×fc2 全てのルールに関する結論をファジィ集合fcとする
と、 fc=max(f1,f2,…,fn) で表せる。これを非ファジィ化する場合、確定値Ptx
とすると、 Ptx=(積分)fc*x/(積分)fc 文字領域の可能性Ptxが求められる。
【0089】写真領域の判別ルール、図領域の判別ルー
ル、表領域の判別ルールに関して同様の処理を行うこと
により領域の判別を行う。
【0090】(4)領域の判別が終了した領域について
は、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域については、そのままの
形でファイル化を行う。
【0091】さらには、文字領域/その他の領域につい
て指定された形式で表示を行う。
【0092】実施例4 以下に詳述する第4の実施例では、文書画像の領域分離
処理において、ファジィ推論などの粗い識別法を用いて
はっきりそれとわかる領域を分離し、次にFFT法など
複雑であるが精密な識別法を残りの領域に適用すること
により、処理時間や記憶容量についての従来の欠点を補
うものである。
【0093】図14は、第4の実施例における処理手順
を示したフローチャートである。
【0094】まず、文書全体の画素をスキャナー等によ
って読み込み(ステップS41)、これをファジィ推論
を用いた粗い分離法(例えば、文字列や図表域をブロッ
ク化し、その幅W,長さL,面積Sといった“あいま
い”な特徴量からファジィ推論して領域の分離を行う)
を用いて明確に識別できる領域についてはこれを分離し
ておき(ステップS42)、残った不明確(はっきりど
ちらともいえない)な領域については、従来用いてきた
複雑な演算手法(FFT法など)を用いて何の領域かを
明確化することにより(ステップS43)、簡単である
が粗いファジィ推論による領域分離と、複雑であるが正
確な従来法との欠点を相補う利点が得られる。
【0095】
【0096】図15は、上述した実施例1〜実施例4に
おけるハードウェア構成を示す。本図において51は画
像入力部であり、図1に示したステップS11,図9に
示したステップS21,図14に示したステップS41
の内容を実行する。
【0097】52はファジィ推論部であり、図1に示し
たステップS12およびS13,図9に示したステップ
S22〜S24,図14に示したステップS42の内容
を実行する。
【0098】53は表示部、54はファイル部であり、
図1に示したステップS14,図9に示したステップS
25の内容を実行する。
【0099】55はFFT部であり、図14に示したス
テップS43の内容を実行する。なお、上述した各実施
例は、光学的に原稿画像を読み取る複写機・ファクシミ
リ装置・電子ファイル等にも適用可能である。
【0100】
【発明の効果】効果1 以上説明したとおり、本発明(手段1)によれば、文章
画像の領域判別を簡単かつ高認識率で実現でき、データ
ベース化・ファイリング化の自動化が可能となる。
【0101】効果2 本発明(手段2)では、画像領域を分離する際に、粗い
分離と精密な分離を併用することとしているので、 (1)複雑な演算処理をしなければならない領域が大幅
(半分以下)に減る。
【0102】(2)必要な記憶容量が大幅に減る。
【0103】(3)処理時間が短縮される。
【0104】といった効果が得られる。
【0105】
【図面の簡単な説明】
【図1】本発明の一実施例を示すフローチャートであ
る。
【図2】文章画像の一例を示す模式図である。
【図3】拡大処理の説明図である。
【図4】領域分離した結果を例示した図である。
【図5】最小外接矩形の説明図である。
【図6】特徴量を説明するための模式図である。
【図7】メンバーシップ関数の一例を示す図である。
【図8】ファジィ判別処理の一例を示す図である。
【図9】本発明のその他の実施例を示すフローチャート
である。
【図10】文字領域以外(図・表・グラフ)の領域に文
字領域が含まれている場合を示す説明図である。
【図11】特徴量を説明するための模式図である。
【図12】メンバーシップ関数のその他の例を示す図で
ある。
【図13】ファジィ判別処理のその他の例を示す図であ
る。
【図14】本発明のその他の実施例を示すフローチャー
トである。
【図15】本発明を実施するためのハードウェア構成を
示すブロック図である。
【符号の説明】
51 画像入力部 52 ファジィ推論部 53 表示部 54 ファイル部 55 FFT部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 H04N 1/40

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字領域,図表領域,写真領域のうち少
    なくともひとつの領域を含む画像情報を入力する入力ス
    テップと、 前記画像情報から領域判別のための特徴量を抽出する特
    徴量抽出ステップと、 前記特徴量を入力し、前記領域判別を行うための複数の
    条件命題をファジィ集合を用いて設定し、ファジィ推論
    の結果に基づいて文字領域,文字以外の領域を判別する
    判別ステップと、 前記判別ステップによる前記領域判別において文字領域
    以外の判別された領域については、当該領域の内部につ
    いてさらに領域分離を行い、当該領域中に含まれる文字
    領域を抽出し、表示あるいはファイル化するステップと
    を有することを特徴とする領域分離方法。
  2. 【請求項2】 入力された画像の中から文字領域を抽出
    する領域分離方法において、 入力された画像全体に対して粗い文字領域識別処理を施
    す第1の識別ステップと、 前記第1の識別手段により判別し得なかった残りの領域
    については、複雑な文字領域識別処理を施す第2の識別
    ステップとを有することを特徴とする領域分離方法。
JP30093792A 1992-11-11 1992-11-11 領域分離方法 Expired - Fee Related JP3281065B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30093792A JP3281065B2 (ja) 1992-11-11 1992-11-11 領域分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30093792A JP3281065B2 (ja) 1992-11-11 1992-11-11 領域分離方法

Publications (2)

Publication Number Publication Date
JPH06150057A JPH06150057A (ja) 1994-05-31
JP3281065B2 true JP3281065B2 (ja) 2002-05-13

Family

ID=17890905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30093792A Expired - Fee Related JP3281065B2 (ja) 1992-11-11 1992-11-11 領域分離方法

Country Status (1)

Country Link
JP (1) JP3281065B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08265558A (ja) * 1994-12-26 1996-10-11 Ricoh Co Ltd 画像形成装置
JP4671885B2 (ja) * 2005-06-01 2011-04-20 株式会社リコー 画像処理装置、プログラムおよび画像処理方法
JP4766451B2 (ja) * 2005-12-20 2011-09-07 富士ゼロックス株式会社 符号化装置、画像処理装置、符号化方法及び符号化プログラム

Also Published As

Publication number Publication date
JPH06150057A (ja) 1994-05-31

Similar Documents

Publication Publication Date Title
JP3703157B2 (ja) フォーム処理方法及び装置
US9639751B2 (en) Property record document data verification systems and methods
EP0202671B1 (en) Method of storing and retrieving image data
JP2890482B2 (ja) 文書画像再配置ファイリング装置
CN111444795A (zh) 票据数据识别方法、电子设备、存储介质及装置
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
CN111859885A (zh) 一种法律判决书自动生成方法及系统
CN113936764A (zh) 一种医疗报告单照片中敏感信息脱敏方法及系统
JP3281065B2 (ja) 領域分離方法
CN112418199B (zh) 多模态信息提取方法、装置、电子设备及存储介质
Li et al. A document classification and extraction system with learning ability
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
Qin et al. Laba: Logical layout analysis of book page images in arabic using multiple support vector machines
CN113537221A (zh) 图像识别方法、装置和设备
JP4517822B2 (ja) 画像処理装置及びプログラム
JP4480109B2 (ja) 画像管理装置および画像管理方法
JP2003178071A (ja) 文書管理システム
Yin et al. Automating data extraction and identification on Chinese road maps
Hong et al. Information Extraction and Analysis on Certificates and Medical Receipts
JP3768738B2 (ja) 電子ファイリングシステム,表紙識別処理装置およびそれらのプログラム記録媒体
JPH0757040A (ja) Ocr付きファイリング装置
JPH0922442A (ja) イメージ・ドキュメント資料の電子管理システム
JPS60123961A (ja) デ−タ記憶方法
JPH07193710A (ja) 文章画像処理装置
JP3116453B2 (ja) 英文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees