JPH11238096A - 文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体 - Google Patents

文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体

Info

Publication number
JPH11238096A
JPH11238096A JP10054251A JP5425198A JPH11238096A JP H11238096 A JPH11238096 A JP H11238096A JP 10054251 A JP10054251 A JP 10054251A JP 5425198 A JP5425198 A JP 5425198A JP H11238096 A JPH11238096 A JP H11238096A
Authority
JP
Japan
Prior art keywords
line
document image
list structure
image processing
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10054251A
Other languages
English (en)
Inventor
Tei Abe
悌 阿部
Koichi Ejiri
公一 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10054251A priority Critical patent/JPH11238096A/ja
Publication of JPH11238096A publication Critical patent/JPH11238096A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 あらかじめ文書の構造を記述した辞書や文法
を用いることなく,文書画像から行単位にリスト構造を
抽出すること。 【解決手段】 処理対象の文書画像を入力・電子データ
に変換し,該文書画像に含まれる全ての行から行単位に
リスト構造を抽出する文書画像処理装置であって,前記
行の属性として,リスト構造をなす特定の特徴量に基づ
いて,リスト構造を抽出するリスト構造抽出手段(文字
認識部106,インデント量抽出部107,行ピッチ抽
出部108)を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,あらかじめ文書の
構造を記述した辞書や文法を用いることなく,文書画像
から行単位にリスト構造を抽出する文書画像処理装置お
よび文書画像処理方法,並びに文書画像処理方法をコン
ピュータに実行させるプログラムを記録した機械読み取
り可能な記録媒体に関する。
【0002】
【従来の技術】最近,紙に印刷された文書を電子的な情
報として処理・保存することによって再利用を図る試み
が盛んに行われている。付言すれば,紙に印刷された文
書を電子化する際に,その論理構造を抽出し,保存して
おくことで文書の再利用性を高めている。つまり,この
ような文書処理は,再び紙に印刷して出力する際やディ
スプレイ上に表示する際に自由にレイアウト変更を行っ
たり,論理構造上の領域の先頭行のみといった所望の部
分を抽出するのに有用となる。
【0003】上記の文書処理は,スキャナなどの画像入
力装置で読み取った画像に対して光学的文字認識(OC
R)を行い,そこで文字コードを得るのみではなく,そ
のレイアウトや論理構造の理解といった処理も含まれ
る。
【0004】従来より,文書画像から論理構造を抽出す
る試みはすでに行われているが,その多くはあらかじめ
文書の構造を記述しておき,入力された画像から抽出さ
れた行をその構造と比較するものである。このような技
術に関連する参考技術文献として,たとえば,特開平8
−6945号公報の『文書の論理構造の解析方法及びシ
ステム』には,あらかじめ辞書パターンを用意してお
き,行単位にマッチングを行ってグラフを作成し,全体
のコストが最小となるように経路を決定し,論理構造を
解釈する方法が開示されている。
【0005】また,特開平6−214983号公報の
『文書画像の論理構造化文書への変換および装置』に
は,入力画像を領域単位に分割し,その後,領域毎に論
理構造化を図る技術が開示されている。
【0006】
【発明が解決しようとする課題】しかしながら,上記に
示されるような従来の技術にあっては,論理構造の理解
においては多くの場合,あらかじめ文書構造の文法を記
述しておくことがあり,雑誌のような非常に多様性に富
んだ文書を対象とすることができないという問題点があ
った。
【0007】また,特開平6−214983号公報にあ
っては,領域単位に処理を行うため,たとえば領域内に
1行ずつ箇条書きされたようなリスト構造を抽出するこ
とができないという問題点があった。
【0008】本発明は,上記に鑑みてなされたものであ
って,あらかじめ文書の構造を記述した辞書や文法を用
いることなく,文書画像から行単位にリスト構造を抽出
することを目的とする。
【0009】
【課題を解決するための手段】上記の目的を達成するた
めに,請求項1に係る文書画像処理装置にあっては,処
理対象の文書画像を入力・電子データに変換し,該文書
画像に含まれる全ての行から行単位にリスト構造を抽出
する文書画像処理装置であって,前記行の属性として,
リスト構造をなす特定の特徴量に基づいて,リスト構造
を抽出するリスト構造抽出手段を備えたものである。
【0010】すなわち,処理対象とする文書画像に含ま
れる全ての行から行単位に,特定の特徴量に基づいてリ
スト構造を抽出することにより,あらかじめ文書構造を
定義しなくても処理を行うことが可能となり,特に雑誌
のような多種多様な書式の文書からでもリスト構造を抽
出することができる。
【0011】また,請求項2に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行と
該行の前後の行との間隔を特徴量としてリスト構造を抽
出するものである。
【0012】すなわち,請求項1のリスト構造抽出手段
が,行の特徴量としてその行の属する領域に対する行の
インデントの大きさを用いることにより,リスト構造を
正確に抽出でき,特に領域に対するインデントの大きさ
を用いているので,ダブルコラムのような書式の文書か
らでもリスト構造を抽出することができる。
【0013】また,請求項3に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行の
属する領域に対する行のインデント量を特徴量としてリ
スト構造を抽出するものである。
【0014】すなわち,請求項1のリスト構造抽出手段
が,行の特徴量としてその行と前後の行との間隔(行ピ
ッチ)を用いているので,リスト構造を正確に抽出する
ことができる。
【0015】また,請求項4に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行の
フォントサイズ(ポイント数)を特徴量としてリスト構
造を抽出するものである。
【0016】すなわち,請求項1のリスト構造抽出手段
が,行の特徴量としてその行のフォントサイズ(ポイン
ト数)を用いているので,リスト構造を正確に抽出する
ことができる。
【0017】また,請求項5に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行の
フォントタイプ(書体)を特徴量としてリスト構造を抽
出するものである。
【0018】すなわち,請求項1のリスト構造抽出手段
が,行の特徴量としてその行のフォントタイプ(書体)
を用いているので,リスト構造を正確に抽出することが
できる。
【0019】また,請求項6に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行の
フォントスタイルを特徴量としてリスト構造を抽出する
ものである。
【0020】すなわち,請求項1のリスト構造抽出手段
が,行の特徴量としてその行のフォントスタイル(標
準,ボールド,イタリックなど)を用いているので,リ
スト構造を正確に抽出することができる。
【0021】また,請求項7に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行の
フォント色を特徴量としてリスト構造を抽出するもので
ある。
【0022】すなわち,請求項1のリスト構造抽出手段
が,行の特徴量としてその行のフォント色を用いている
ので,リスト構造を正確に抽出することができる。
【0023】また,請求項8に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,処理対象の行の
互いに隣接する複数の行のうち,該行の頭の文字がリス
ト構造を示す特殊な記号である場合,該当する行をリス
ト構造として抽出するものである。
【0024】すなわち,請求項1のリスト構造抽出手段
が,互いに隣接する複数の行についてその行頭の文字が
リスト構造を構成する特殊な記号であるか否かというこ
とを特徴量としているので,リスト構造を正確に抽出す
ることができる。
【0025】また,請求項9に係る文書画像処理装置に
あっては,前記リスト構造抽出手段は,前記請求項2な
いし8に記載の特徴量を組み合わせ,リスト構造を抽出
するものである。
【0026】すなわち,請求項1のリスト構造抽出手段
が,請求項2ないし8に記載の特徴量を適宜組み合わ
せ,各行の属性を調べることにより,一つの特徴量では
正確にリスト構造を判定できない場合に非常に正確に抽
出することができる。
【0027】また,請求項10に係る文書画像処理方法
にあっては,処理対象の文書画像を入力・電子データに
変換し,該文書画像に含まれる全ての行から行単位にリ
スト構造を抽出する文書画像処理方法であって,前記文
書画像を領域単位に分割し,領域の属性を識別する領域
識別工程と,前記領域識別工程で得られた全ての領域に
対し,行の抽出処理を行う行抽出工程と,前記行抽出工
程で得られた全ての行に対し,文字画像のみを抽出し,
文字認識処理を実行する文字認識工程と,注目行のフォ
ントサイズ(ポイント数),フォントタイプ(書体),
フォントスタイル,フォント色を識別・抽出するフォン
ト識別工程と,注目行のインデント量を抽出するインデ
ント量抽出工程と,注目行とその前後の行との行ピッチ
を抽出する行ピッチ抽出工程と,注目行の行頭の文字を
抽出する行頭文字抽出工程と,前記各工程で得られた特
徴量から注目行の属性を判定する行属性判定工程と,を
含むものである。
【0028】すなわち,処理対象とする文書画像に含ま
れる全ての行から行単位に,特定の特徴量に基づいてリ
スト構造を抽出することにより,あらかじめ文書構造を
定義しなくても処理を行うことが可能となり,特に雑誌
のような多種多様な書式の文書からでもリスト構造を抽
出することができる。
【0029】また,請求項11に係る機械読み取り可能
な記録媒体にあっては,前記請求項10に記載された文
書画像処理方法をコンピュータに実行させるプログラム
を記録したものである。
【0030】すなわち,請求項10に記載された文書画
像処理方法をコンピュータに実行させるプログラムを記
録したことにより,コンピュータによって文書画像処理
を実現することが可能となる。
【0031】
【発明の実施の形態】以下,本発明の文書画像処理装置
および文書画像処理方法,並びに文書画像処理方法をコ
ンピュータに実行させるプログラムを記録した機械読み
取り可能な記録媒体について添付図面を参照し,詳細に
説明する。
【0032】〔概要〕先に述べたように,紙に印刷され
た文書を電子化することによって再利用する場合,スキ
ャナなどの画像入力装置で読み取った画像に対して光学
的文字認識(OCR)を行い,そこで文字コードを得る
のみではなく,そのレイアウトや論理構造の理解といっ
た処理も含まれる。ところが,論理構造の理解において
は多くの場合,あらかじめ文書構造の文法を記述してお
くことがあり,雑誌のような非常に多様性に富んだ文書
を対象とすることができない。
【0033】そこで,本発明では,あらゆる文書に共通
な普遍的な性質を用いて文書画像からのリスト構造を抽
出することにより,あらゆる文書に共通な普遍的な性質
を用い,文書画像からリスト構造を抽出する手段を実現
するものである。特に,本や雑誌の1ページあるいはさ
らにその一部といった断片的に得られた文書に対して処
理が可能であり,かつ非常に汎用の高い装置・方法を実
現する。
【0034】すなわち,リスト構造をなすような行(論
理構造上並列な行)は,一般的に,インデント量,行ピ
ッチ(注目行前後の行間隔),フォントサイズ(ポイン
ト数),フォントタイプ(書体),フォントスタイル
(標準,ボールド,イタリックなど),フォント色など
の特徴量が似通っている。
【0035】また,箇条書きのようなリスト構造の場合
には,さらに行頭の文字が「・」や「□」のような特定
の記号が用いられることが多く,これもあらゆる文書に
普遍的な性質である。したがって,本発明では,このよ
うな文書の性質を利用して,リスト構造を抽出するもの
である。以下,その具体例について説明する。
【0036】〔文書画像処理装置の構成〕図1は,実施
の形態に係る文書画像処理装置の概略構成を示すブロッ
ク図であ。図において,101は紙に印刷された文書な
どを電子的な画像データとして読み込む画像入力部,1
02は画像入力部101で読み取った画像データやプロ
グラム,結果などを蓄えておくメモリ,103は文書画
像を領域に分割し,領域の属性を識別する領域識別部,
104は文書画像から行を抽出する行抽出部,105は
文書画像から文字画像のみを抽出する文字矩形抽出部で
ある。
【0037】また,106は矩形毎に文字コード,フォ
ントサイズ(ポイント数),フォントタイプ(書体),
フォントスタイル(標準,ボールド,イタリックな
ど),フォント色を求める文字認識部,107は行のイ
ンデント(indent)量を求めるインデント量抽出
部,108は行間のピッチ(行とその前後の行との間
隔)を求める行ピッチ抽出部,109は本装置全体を統
括的に制御する制御部,110は文字認識結果やリスト
構造の抽出結果を出力するデータ表示部,111は外部
記憶装置などの手段を用い,プログラムやデータを格納
するデータ保存部である。
【0038】また,文字認識部106は,行の属性とし
てその行の文字コードを認識する文字コード認識部11
2と,行の属性としてその行のフォントサイズ(ポイン
ト数)を識別するフォントサイズ識別部113と,行の
属性としてその行のフォントタイプ(書体)を識別する
フォントタイプ識別部114と,行の属性としてその行
のフォントスタイル(標準,ボールド,イタリックな
ど)を識別するフォントスタイル識別部115と,行の
属性としてその行のフォント色を識別するフォント色識
別部116と,から構成されている。
【0039】なお,リスト抽出手段として,文字認識部
106,インデント量抽出部107,行ピッチ抽出部1
08が該当する。
【0040】〔文書画像処理装置の動作〕次に,以上の
ように構成された文書画像処理装置におけるリスト構造
抽出処理の処理手順について説明する。図2は,実施の
形態におけるリスト構造抽出処理の処理手順を示すフロ
ーチャートである。
【0041】図において,まず,画像入力部101によ
り,識別対象である原稿を画像情報として入力し,これ
をメモリ102に取り込む(S201)。続いて,上記
メモリ102から画像情報を読み出し,領域識別部10
3により領域識別処理を実行する(S202)。さら
に,上記ステップS202で得られた全ての領域に対
し,行抽出部104により行(行数:N)の抽出処理を
実行する(S203)。
【0042】続いて,上記ステップS203で得られた
全ての行に対し,文字矩形抽出部105によって矩形抽
出し,文字認識部106により文字認識処理を実行する
(S204)。次いで,行のカウンタnを1にセットす
る(S205)。
【0043】さらに,文字認識部106により,注目行
のフォントサイズ(ポイント数),フォントタイプ(書
体),フォントスタイル(標準,ボールド,イタリック
など),フォント色を識別・抽出する(S206)。続
いて,インデント量抽出部107により注目行のインデ
ント量を抽出し(S207),さらに行ピッチ抽出部1
08により注目行とその前後の行との行ピッチを抽出す
る(S208)。
【0044】続いて,注目行の行頭の文字を抽出する
(S209)。つまり,箇条書きのようなリスト構造の
場合には,さらに行頭の文字が「・」や「□」のような
特定の記号が用いられることが多く,これもあらゆる文
書に普遍的な性質であるので,この特徴量を用いる。さ
らに上記ステップS206〜S209で得られた特徴量
から注目行の属性を判定する(S210)。
【0045】続いて,上記ステップS210で判定され
た行の属性が以前に登録されたものであるか否かを判断
する(S211)。ここで,行の属性が以前に登録され
たものであると判断したならば,注目行の同じ属性のリ
ストに追加する(S212)。一方,上記ステップS2
11において,行の属性が以前に登録されたものではな
いと判断した場合には,新たな属性のリストを生成し,
注目行を追加する(S213)。
【0046】上記ステップS212あるいはS213の
処理を終了したならば,行のカウンタnを1つインクリ
メントする(S214)。そして,行のカウンタnと文
書全体の行数Nとを比較・判断(n>N)する(S21
5)。ここで,n>Nと判断したならば全ての処理を終
了する。一方,n≦Nであると判断したならば上記ステ
ップS206に戻り,以降の処理を繰り返し実行する。
【0047】さて,本発明は上述した実施の形態の他に
ソフトウェアによっても実現することができる。たとえ
ば,上述した図2の動作をプログラム化し,それを機械
読み取り可能な記録媒体に格納しておき,コンピュータ
上で実行することで実現する。
【0048】したがって,識別対象とする文書画像か
ら,行単位でリスト構造を抽出することが可能となるの
で,文書画像の論理構造化を進める上で大変有用とな
る。特に,あらかじめ文書構造を定義するという煩わし
い定義を行う必要がなく,あらゆる論理構造を有する文
書画像に対しての処理が可能となる。
【0049】
【発明の効果】以上説明したように,本発明に係る文書
画像処理装置(請求項1)によれば,処理対象とする文
書画像に含まれる全ての行から行単位に,特定の特徴量
に基づいてリスト構造を抽出するため,あらかじめ文書
構造を定義しなくても処理を行うことが可能となり,特
に雑誌のような多種多様な書式の文書からでもリスト構
造を抽出することができる。
【0050】また,本発明に係る文書画像処理装置(請
求項2)によれば,請求項1のリスト構造抽出手段が,
行の特徴量としてその行の属する領域に対する行のイン
デントの大きさを用いるため,リスト構造を正確に抽出
でき,特に領域に対するインデントの大きさを用いてい
るので,ダブルコラムのような書式の文書からでもリス
ト構造を抽出することができる。
【0051】また,本発明に係る文書画像処理装置(請
求項3)によれば,請求項1のリスト構造抽出手段が,
行の特徴量としてその行と前後の行との間隔(行ピッ
チ)を用いているので,リスト構造を正確に抽出するこ
とができる。
【0052】また,本発明に係る文書画像処理装置(請
求項4)によれば,請求項1のリスト構造抽出手段が,
行の特徴量としてその行のフォントサイズ(ポイント
数)を用いているので,リスト構造を正確に抽出するこ
とができる。
【0053】また,本発明に係る文書画像処理装置(請
求項5)によれば,請求項1のリスト構造抽出手段が,
行の特徴量としてその行のフォントタイプ(書体)を用
いているので,リスト構造を正確に抽出することができ
る。
【0054】また,本発明に係る文書画像処理装置(請
求項6)によれば,請求項1のリスト構造抽出手段が,
行の特徴量としてその行のフォントスタイル(標準,ボ
ールド,イタリックなど)を用いているので,リスト構
造を正確に抽出することができる。
【0055】また,本発明に係る文書画像処理装置(請
求項7)によれば,請求項1のリスト構造抽出手段が,
行の特徴量としてその行のフォント色を用いているの
で,リスト構造を正確に抽出することができる。
【0056】また,本発明に係る文書画像処理装置(請
求項8)によれば,請求項1のリスト構造抽出手段が,
互いに隣接する複数の行についてその行頭の文字がリス
ト構造を構成する特殊な記号であるか否かということを
特徴量としているので,リスト構造を正確に抽出するこ
とができる。
【0057】また,本発明に係る文書画像処理装置(請
求項9)によれば,請求項1のリスト構造抽出手段が,
請求項2ないし8に記載の特徴量を適宜組み合わせ,各
行の属性を調べるため,一つの特徴量では正確にリスト
構造を判定できない場合に非常に正確に抽出することが
できる。
【0058】また,本発明に係る文書画像処理装置(請
求項10)によれば,処理対象とする文書画像に含まれ
る全ての行から行単位に,特定の特徴量に基づいてリス
ト構造を抽出するため,あらかじめ文書構造を定義しな
くても処理を行うことが可能となり,特に雑誌のような
多種多様な書式の文書からでもリスト構造を抽出するこ
とができる。
【0059】また,本発明に係る機械読み取り可能な記
録媒体(請求項11)によれば,請求項10に記載され
た文書画像処理方法をコンピュータに実行させるプログ
ラムを記録したことにより,コンピュータによって文書
画像処理を実現することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文書画像処理装置の
概略構成を示すブロック図であ。
【図2】本発明の実施の形態におけるリスト構造抽出処
理の処理手順を示すフローチャートである。
【符号の説明】
101 画像入力部 102 メモリ 103 領域識別部 104 行抽出部 105 文字矩形抽出部 106 文字認識部 107 インデント量抽出部 108 行ピッチ抽出部 109 制御部 111 データ保存部 112 文字コード認識部 113 フォントサイズ識別部 114 フォントタイプ識別部 115 フォントスタイル識別部 116 フォント色識別部

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 処理対象の文書画像を入力・電子データ
    に変換し,該文書画像に含まれる全ての行から行単位に
    リスト構造を抽出する文書画像処理装置であって,前記
    行の属性として,リスト構造をなす特定の特徴量に基づ
    いて,リスト構造を抽出するリスト構造抽出手段を備え
    たことを特徴とする文書画像処理装置。
  2. 【請求項2】 前記リスト構造抽出手段は,処理対象の
    行と該行の前後の行との間隔を特徴量としてリスト構造
    を抽出することを特徴とする請求項1に記載の文書画像
    処理装置。
  3. 【請求項3】 前記リスト構造抽出手段は,処理対象の
    行の属する領域に対する行のインデント量を特徴量とし
    てリスト構造を抽出することを特徴とする請求項1に記
    載の文書画像処理装置。
  4. 【請求項4】 前記リスト構造抽出手段は,処理対象の
    行のフォントサイズ(ポイント数)を特徴量としてリス
    ト構造を抽出することを特徴とする請求項1に記載の文
    書画像処理装置。
  5. 【請求項5】 前記リスト構造抽出手段は,処理対象の
    行のフォントタイプ(書体)を特徴量としてリスト構造
    を抽出することを特徴とする請求項1に記載の文書画像
    処理装置。
  6. 【請求項6】 前記リスト構造抽出手段は,処理対象の
    行のフォントスタイルを特徴量としてリスト構造を抽出
    することを特徴とする請求項1に記載の文書画像処理装
    置。
  7. 【請求項7】 前記リスト構造抽出手段は,処理対象の
    行のフォント色を特徴量としてリスト構造を抽出するこ
    とを特徴とする請求項1に記載の文書画像処理装置。
  8. 【請求項8】 前記リスト構造抽出手段は,処理対象の
    行の互いに隣接する複数の行のうち,該行の頭の文字が
    リスト構造を示す特殊な記号である場合,該当する行を
    リスト構造として抽出することを特徴とする請求項1に
    記載の文書画像処理装置。
  9. 【請求項9】 前記リスト構造抽出手段は,前記請求項
    2ないし8に記載の特徴量を組み合わせ,リスト構造を
    抽出することを特徴とする請求項1に記載の文書画像処
    理装置。
  10. 【請求項10】 処理対象の文書画像を入力・電子デー
    タに変換し,該文書画像に含まれる全ての行から行単位
    にリスト構造を抽出する文書画像処理方法であって,前
    記文書画像を領域単位に分割し,領域の属性を識別する
    領域識別工程と,前記領域識別工程で得られた全ての領
    域に対し,行の抽出処理を行う行抽出工程と,前記行抽
    出工程で得られた全ての行に対し,文字画像のみを抽出
    し,文字認識処理を実行する文字認識工程と,注目行の
    フォントサイズ(ポイント数),フォントタイプ(書
    体),フォントスタイル,フォント色を識別・抽出する
    フォント識別工程と,注目行のインデント量を抽出する
    インデント量抽出工程と,注目行とその前後の行との行
    ピッチを抽出する行ピッチ抽出工程と,注目行の行頭の
    文字を抽出する行頭文字抽出工程と,前記各工程で得ら
    れた特徴量から注目行の属性を判定する行属性判定工程
    と,を含むことを特徴とする文書画像処理方法。
  11. 【請求項11】 前記請求項9に記載された文書画像処
    理方法をコンピュータに実行させるプログラムを記録し
    たことを特徴とする機械読み取り可能な記録媒体。
JP10054251A 1998-02-20 1998-02-20 文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体 Pending JPH11238096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10054251A JPH11238096A (ja) 1998-02-20 1998-02-20 文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10054251A JPH11238096A (ja) 1998-02-20 1998-02-20 文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH11238096A true JPH11238096A (ja) 1999-08-31

Family

ID=12965343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10054251A Pending JPH11238096A (ja) 1998-02-20 1998-02-20 文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH11238096A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007026279A (ja) * 2005-07-20 2007-02-01 Canon Inc オブジェクト編集装置、方法、及びプログラム
JP2010146147A (ja) * 2008-12-17 2010-07-01 Fuji Xerox Co Ltd 画像処理装置及びプログラム
US8125683B2 (en) 2005-06-01 2012-02-28 Ricoh Company, Ltd. Image preview processing apparatus, image preview processing method, and image preview computer product
US8538154B2 (en) 2009-09-28 2013-09-17 Konica Minolta Business Technologies, Inc. Image processing method and image processing apparatus for extracting heading region from image of document

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8125683B2 (en) 2005-06-01 2012-02-28 Ricoh Company, Ltd. Image preview processing apparatus, image preview processing method, and image preview computer product
JP2007026279A (ja) * 2005-07-20 2007-02-01 Canon Inc オブジェクト編集装置、方法、及びプログラム
JP2010146147A (ja) * 2008-12-17 2010-07-01 Fuji Xerox Co Ltd 画像処理装置及びプログラム
US8432555B2 (en) 2008-12-17 2013-04-30 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, computer-readable medium and computer data signal
US8538154B2 (en) 2009-09-28 2013-09-17 Konica Minolta Business Technologies, Inc. Image processing method and image processing apparatus for extracting heading region from image of document

Similar Documents

Publication Publication Date Title
JP4311365B2 (ja) 文書処理装置およびプログラム
JPH0713995A (ja) 自動テキスト特徴決定装置
JP2002063215A (ja) 文書表示方法及びシステム、コンピュータプログラム、記録媒体
JPH11341292A (ja) 画像処理装置及び方法及び記憶媒体
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2008108114A (ja) 文書処理装置および文書処理方法
JPH11238096A (ja) 文書画像処理装置および文書画像処理方法,並びに文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JP2008282094A (ja) 文字認識処理装置
US20020181779A1 (en) Character and style recognition of scanned text
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP3993025B2 (ja) 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
JP2584973B2 (ja) 文字認識装置における認識結果出力方法
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4501731B2 (ja) 画像処理装置
JP6614857B2 (ja) 画像処理装置、画像処理方法及びプログラム
JPH02202689A (ja) 文字認識装置
JPH07262317A (ja) 文書処理装置
JP4651407B2 (ja) 画像処理装置およびコンピュータプログラムおよび記憶媒体
JP2544589B2 (ja) 文書処理方法及び装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3116453B2 (ja) 英文字認識装置
US20090316210A1 (en) Image forming apparatus, image forming method and computer readable medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206