JP3254896B2 - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JP3254896B2
JP3254896B2 JP10173294A JP10173294A JP3254896B2 JP 3254896 B2 JP3254896 B2 JP 3254896B2 JP 10173294 A JP10173294 A JP 10173294A JP 10173294 A JP10173294 A JP 10173294A JP 3254896 B2 JP3254896 B2 JP 3254896B2
Authority
JP
Japan
Prior art keywords
area
document
document image
image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10173294A
Other languages
English (en)
Other versions
JPH07287767A (ja
Inventor
正和 藤本
麻希 大西
慎也 古郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP10173294A priority Critical patent/JP3254896B2/ja
Publication of JPH07287767A publication Critical patent/JPH07287767A/ja
Application granted granted Critical
Publication of JP3254896B2 publication Critical patent/JP3254896B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル複写機など
において、文書の一部分について例えば濃度変換を行な
うことができる文書画像処理装置に関する。
【0002】
【従来の技術】近年のディジタル複写機において、その
複写性能および諸機能は著じるしく向上している。この
ような複写機の諸機能を用いて、紙の原稿の文書を複写
する場合、例えば、文書中で目立たせたくない文字の濃
度を下げることにより、目立たせたい部分との区別をは
っきりさせたり、本文の文字濃度を下げることにより、
おしゃれなイメージを付加したり、また、長い文章に対
しては、背景とのコントラストを抑えて複写することに
より、目が疲れにくいような高品質の文書にして複写す
ることなどが所望される場合がある。
【0003】こような文字に対する編集を行うには、従
来の技術において、複写機ではないが、デスクトップパ
ブリッシングシステムの技術を使用することにより、文
字列に対する文字修飾を行い対応することができる。こ
のような技術としては、例えば、特開平3−15666
7号公報に記載されている「文書編集処理装置」の技術
が利用できる。ここでは、文書の構成に基づき、文書中
の見出し文字列に対して、簡単な操作で文字修飾が行え
る技術が提案されている。また、電子コード化されてい
ない文書に対しては、例えば、特開平2−223275
号公報に記載されている「画像処理装置の編集制御方
式」のように、編集機能付のデジタルカラー複写機の技
術を用いることができる。この技術を用いることによ
り、編集方法として色変換を指定し、編集範囲の指定お
よび色の指定の操作を行なうことにより、紙に出力され
た文書の文字についての濃度を下げることができる。
【0004】
【発明が解決しようとする課題】しかしながら、これま
での編集機能付デジタルカラー複写機のような編集方法
を用いる場合には、まず、編集する範囲を指定し、次
に、色(濃度)を指定する2回の操作が必要である。ま
た、この場合、文書の一部分を残して編集したい場合に
は対応できない。このため、例えば、文書の本文全体の
濃度を下げる際、その中に数か所の強調部分があり、そ
の強調部分については濃度を下げたくない場合、その強
調部分に対応して編集対象領域を複数に分割し、分割し
た各々の編集対象領域に対して、編集対象として編集指
示の操作を行なわなければならない。そのため、編集の
操作が非常に複雑になり、また、煩雑となるという問題
点がある。
【0005】本発明は、これらの問題を解決するために
なされたものであり、本発明の目的は、編集対象の指示
方法を簡略化でき、また、煩雑な操作を行なわずに、文
書の一部分について例えば濃度を下げる編集を行うこと
ができる文書画像処理装置を提供することにある。
【0006】
【課題を解決するための手段】上記のような目的を達成
するため、本発明において第1の特徴とする文書画像処
理装置は、文書画像上の編集されない領域を指示する編
集対象外領域指示手段(102)と、編集対象外領域指
示手段により指示された領域と入力原稿の文書画像との
対応関係を示す指示領域フラグを編集方法に応じて値を
変えて付加する指示領域判別手段(103)と、指示領
域判別手段により付加された指示領域フラグの値に応じ
編集対象とする画像データに編集領域フラグを付加す
編集対象領域判別手段(104)と、編集領域フラグ
が付加された編集対象の画像データに対して画像の例え
ば濃度を変換する文書画像変換手段(105)とを備え
ることを特徴とする。
【0007】本発明の第2の特徴とする文書画像処理装
置は、文書画像上の画素の集まりをそれぞれ文書要素の
意味のある塊として小領域に分割する領域分割手段(2
02)と、領域分割手段により分割された小領域から、
その中の最下位要素の数を計数する最下位要素計数手段
(203)と、最下位要素計数手段で計数された小領域
中の最下位要素の数から長い文章の領域を判別する長文
領域判別手段(204)と、長文領域判別手段によって
抽出された領域の長文の画像の例えば濃度を変換する文
書画像変換手段(205)とを備えることを特徴とす
る。
【0008】
【0009】
【作用】本発明の第1の特徴とする文書画像処理装置に
おいては、編集対象外領域指示手段が、文書画像上の編
集されない領域を指示すると、指示領域判別手段が、編
集対象外領域指示手段により指示された領域と入力原稿
の文書画像との対応関係を示す指示領域フラグを編集方
法に応じて値を変えて付加する。この指示領域判別手段
により付加された指示領域フラグの値に応じて、編集対
象領域判別手段が、文書画像の編集対象とする画像デー
タに編集領域フラグを付加する。そして、文書画像変換
手段が、編集領域フラグが付加された編集対象の画像デ
ータに対して画像の例えば濃度を変換する。
【0010】このように、利用者が、編集対象外領域指
示手段により領域を指定するが、その領域は編集しない
領域として指示される。編集対象領域判別手段が、逆に
指示されなかった領域を抽出して編集領域とする。この
場合に、指示された領域と入力原稿との対応関係を示す
指示領域フラグが編集方法に応じて値を変えて付加され
るので、付加された指示領域フラグの値に応じて編集対
象とする画像データに編集領域フラグを付加して編集領
域とする。そして、文書画像変換手段が編集領域され
た領域の画像データに対して画像例えば濃度を変更す
る。これにより、複雑な編集領域を指示する場合であっ
ても、編集しない領域の指示を行うことにより、領域の
指定が簡略化される。また、更に、例えば、編集する領
域の指定と組合せて領域を指定することにり、更に領域
の指定が簡略化される。
【0011】本発明の第2の特徴とする文書画像処理装
置においては、領域分割手段が、文書画像上の画素の集
まりをそれぞれ文書要素の意味のある塊として小領域に
分割する。最下位要素計数手段が、領域分割手段により
分割された小領域からその中の最下位要素の数を計数す
ると、長文領域判別手段は、最下位要素計数手段で計数
された小領域の中の最下位要素の数から長い文章の領域
を判別する。そして、文書画像変換手段が、長文領域判
別手段によって抽出された領域の長文の画像の例えば
度を変換する。
【0012】このように、最下位要素計数手段が、分割
された小領域から、文書画像上の画素の集まりの文書要
素の意味のある塊の最下位要素(文字)の数を計数し、
つまり、文字領域のブロックごとの文字数を計数するの
で、計数した値によって、長文領域判別手段が、文字領
域の中から長い文章に相当するブロックを判別して抽出
する。抽出されたブロックの領域に対して、文書画像変
換手段が画像の例えば濃度を変更する。このため、例え
ば、画像の濃度を変更する領域を、予じめ文字領域と定
めておけば、その領域の指示が省略できる。
【0013】
【0014】
【0015】
【実施例】以下、本発明の実施例を図面を参照して具体
的に説明する。図1は、本発明の文書画像処理装置の第
1の実施例の基本構成を示すブロック図である。図1に
おいて、101は編集対象文書画像、102は編集対象
外領域指示部、103は指示領域判別部、104は編集
対象領域判定部、105は文書画像変換部、106は編
集後文書画像である。
【0016】編集対象外領域指示部102は、編集され
ない領域の座標を入力するため機能要素であり、デジタ
イザ,ライトペン,マウスなどポインティングデバイス
の座標入力装置が利用される。指示領域判別部103
は、編集対象外領域指示部102により指示された領域
が、編集対象画像101として入力された原稿の文書画
像データ中のどの領域に相当するかを判別するための処
理機能要素である。編集対象領域判別部104は、指示
された領域が編集対象外となるように、逆に編集対象領
域を抽出する処理機能要素である。また、文書画像変換
部105は、編集領域判別部104によって抽出された
編集対象となる領域の画像の濃度やコントラストを変換
し、出力画像を生成する処理機能要素である。文書画像
変換部105からは、編集後文書画像106が出力され
る。文書画像変換部105としては通常の画像形成処理
装置が利用される。
【0017】次に、このような各々の機能要素により構
成される文書画像処理装置を、デジタルカラー複写機に
適用した場合を例として説明する。装置を構成する各々
の機能要素は、前述した公知例となっている特開平2−
223275号公報に記載されているようなディジタル
カラー複写機における各々の機能要素が利用できるの
で、個別の各々の機能要素についての説明は省略し、以
下の説明では、文書画像処理の動作を順を追って説明す
る。
【0018】図3は、デジタルカラー複写機に適用した
文書画像処理装置の要部の構成を説明するブロック図で
ある。図3において、20は文書画像処理装置、21は
イメージスキャナ、22は編集対象外領域指示モジュー
ル、23は指示領域判別モジュール、24は編集対象領
域判別モジュール、25は文書画像変換モジュール、2
6はプリンタ機構、27は制御モジュール、また、28
はコントロールパネル部である。
【0019】コントロールパネル部28は、利用者から
濃度変換などの指示を受け付ける機能要素であり、テン
キーおよびファンクションキーからなるキーボード、お
よびディスプレイなどから構成される。制御モジュール
27はコントロールパネル部28に対するデータの入出
力処理、イメージスキャナ21の起動処理、プリンタ機
構26の起動処理などの制御処理を行なう制御ユニット
である。制御ユニットは制御用のマイクロプロセッサが
搭載されて構成されており、これらの制御処理プログラ
ムが内部にプログラムされている。
【0020】また、図2はディジタル複写機におけるコ
ンソールパネルの一例を示す図である。図2に示すよう
に、コンソールパネル30には、複写枚数指定用のテン
キー部31と、設定された複写枚数の表示部32と、通
常の複写モードを指示する複写ボタン33と、部分的な
濃度変換モードを指示する濃度変換ボタン34と、複写
スタートボタン35と、状態表示部36とが設けられて
いる。複写ボタン33と濃度変換ボタン34は内部にそ
の機能が指定されているかどうかを示すLEDランプが
設けられており、図2に示すような状態では、濃度変換
のモードが選択されている状態を表示している。次に、
このような濃度変換のモードが選択されている場合の処
理の動作をフローチャートを参照して説明する。
【0021】図4は、指定された領域に対する濃度変換
を行う場合の処理を流れを示すフローチャートである。
図4を参照して処理の概略を説明する。電源が投入さ
れ、処理が開始されると、まず、ステップ40におい
て、立ち上げ処理を行う。次に、ステップ41におい
て、濃度変換モードが指定されているか否かを判定す
る。濃度変換モードが指定されていない場合には、ステ
ップ42に進み、通常の複写処理を行う。そして、再
び、ステップ41に戻り、濃度変換モードの指定を判定
する。
【0022】ステップ41の判定により、濃度変換モー
ドが指定されていることが判定されると、ステップ43
からの一部の領域指定による濃度変換処理を行う。この
処理では、まず、ステップ43でスタートが指示された
か否かを判定する。スタートの指示が判定されない場合
は、ステップ44に進み、領域指示入力の受け付け処理
を行い、ステップ43に戻って、再び、スタートが指示
されたか否かを判定する。つまり、スタートが指示され
るまでは、ステップ44の領域指示入力の受け付け処理
を繰り返し行う。この領域指示入力では、編集対象外と
する領域の指定を行う。
【0023】領域指示入力の受け付け処理が終了し、更
に、スタートが指示されると、入力指示された領域に応
じて、ステップ45からの濃度変換の処理を行う。この
処理では、ステップ45において、原稿読み取りの処理
を行い、次に、ステップ46において、指示領域判別の
処理を行う。ここで指示されている領域は画像編集を行
う編集対象外とする領域の指定なので、次のステップ4
7において、この指定の領域から編集領域抽出の処理を
行う。次に、ステップ48において、抽出された編集領
域の文字画像の変換を行い、次のステップ49におい
て、画像出力を行う。そして、ステップ41に戻り、次
の文書画像に対して同様の処理の流れに従って、ステッ
プ41から処理を繰り返し行う。
【0024】次に、このような領域を指定した部分的な
濃度変換の処理について、具体的な文書画像の処理例に
ついて説明する。図5は、処理対象の文書画像として入
力する白黒の入力文書の一例を示す図であり、図6は、
入力文書において処理対象の領域を指定する場合の操作
例を説明する図である。また、図7は、256階調グレ
ースケールによる文書画像の画像データを部分的に示す
図であり、図8は、画像データに指示領域フラグが設け
られた場合の画像データを部分的に示す図であり、図9
は、指示領域フラグが反転されて編集対象領域フラグと
された状態の画像データを部分的に示す図である。ま
た、図10は、指定された領域に対する濃度変換が行な
われた状態の画像データを部分的に示す図であり、図1
1は、最終的に濃度変換が行なわれた状態の出力文書の
文書画像の一例を示す図である。図12は、領域が指示
された状態の領域テーブルの一例を示す図である。
【0025】次に、これらの図5〜図12を参照しなが
ら、指定された領域に対する濃度変換を行う場合の処理
を説明する。以降の説明では、図5に示す入力文書を濃
度変換する場合を例として、図6〜図12を参照しなが
ら順次にその動作例を説明する。なお、文書画像の処理
を行う場合の位置の基準として、直交座標の座標値を用
いるが、この座標軸は、図5の中に示すように、文書画
像のページ右に向かってx軸、ページ下に向かってy軸
とする。
【0026】電源が投入されると、制御モジュール27
が立ち上げ処理を行ない(ステップ40:図4)、コン
トロールパネル部28においてコンソールパネルの状態
表示部36に初期画面を表示する。この初期画面が表示
された状態において、次に、利用者がコンソールパネル
上の濃度変換ボタン34を押すと、濃度変換モードが指
示され、濃度変換モードとなる。濃度変換モードが指示
されていなければ、通常の複写処理を行なう。濃度変換
モードになった後は、複写スタートボタン35が押され
るまで、領域指示入力を受け付ける(ステップ41〜4
4)。
【0027】領域指示入力の受け付けの処理(ステップ
44)では、利用者は、編集対象外領域指示モジュール
22のデジタイザの上に原稿を置き、ここでは編集を加
えない部分の領域の指定入力を行う。つまり、この領域
指示入力の処理では、領域指定方法と座標と入力す
る。この領域指定方法としては、例えば矩形,正方形ま
たは円などの領域の形状を指定し、これに対して、その
形状に対する座標を入力する。図12に示すように、例
えば、矩形の形状で領域を入力する場合には、領域指定
方法として矩形を指定し、その始点と終点として、矩形
の対角の2点を指示する。また、図示していないが、例
えば、領域指定方法として円を指定した場合には、その
始点と終点として、円の中心点と円周上の1点を指示す
る。ここで指定した領域は、編集を加えない領域として
処理される。
【0028】例えば、図5に示すような入力文書の文書
画像51に対して、ある文字列の領域のみ、濃度はその
ままとし、その他の領域については濃度を押える(濃度
を薄くする)ような画像編集を行う場合、編集を加えな
い部分の領域を、図6に示すように、その領域指定方法
と始点および終点の座標の入力を行う。この場合、入力
文書の文書画像51に対して、第1の編集領域52とし
て領域指定方法で矩形を指定し、その始点53および終
点54を指示し、また、第2の編集領域55として領域
指定方法で矩形を指定し、その始点56および終点57
を指示する。
【0029】このように、指定された領域指定方法の内
容とその座標(始点,終点)の入力に応じて、制御モジ
ュール27は、領域として指定された座標値を、図12
に示すように、順次に領域テーブル60に書き込む。こ
の領域テーブル60に書き込まれた領域の例は、文書中
の2か所の矩形の領域を、編集しない領域として指示す
る例となっている。そして、文書画像に対して編集対象
外の領域の全てを指定し終えると、次に、原稿を原稿台
(プラテン)の上に置いて、複写スタートボタン35を
押す。複写スタートボタン35が押されると、制御モジ
ュール27は、続いて、イメージスキャナに読み取り指
示信号を送り、原稿画像の読み取りが開始される(ステ
ップ45:図4)。
【0030】原稿画像の読み取りが行なわれると、図7
に示すように、読み取られた画像データ61は表形式の
データで表現され、画像メモリ(図示せず)に格納され
る。この実施例では、入力文書が白黒文書であり、イメ
ージスキャナ21が256階調のグレースケールで入力
文書からの画像データを読み取る場合を例にして説明し
ているが、カラー文書の場合には、R(赤),G
(緑),B(青)の3色のそれぞれについて、グレース
ケールの場合と同様に、256階調での画像処理とする
ことにより、同様に扱え、同様な効果が得られる。ま
た、2値画像の場合であっても、白い部分の階調を
“0”、黒い部分の階調を“255”とすることによ
り、グレースケールの場合と同様に扱うことができる。
【0031】原稿画像の読み取りが終了すると、読み取
られた画像データ61と、編集対象外として指示入力さ
れた領域の座標データ(領域テーブル60)が、指示領
域判別モジュール23に送られ、指示領域判別の処理が
行なわれる(ステップ46)。つまり、指示領域判別モ
ジュール23では、まず、画像データ61に対し、編集
対象外として指示された領域と指示されなかった領域を
区別する。このため、画像データ61を、図8に示すよ
うに、指示領域フラグ63を追加した画像データ62と
する。画像データ62に指示領域フラグ63を追加する
場合、まず、全ての指示領域フラグ6に、初期値とし
て“0”を書き込み、更に、領域テーブル60(図1
2)の座標データをもとに指示された領域だけにその指
示領域フラグを“1”とする書き込みを行う。例えば、
図12に示す領域テーブル60では、始点および終点の
座標(x,y)により、x1≦x<x2かつy1≦y<
y2を満たす矩形の領域と、x3≦x<x4かつy3≦
y<y4を満たす矩形の領域の2つの領域を指示してい
るので、この2つの領域の範囲内の画像データの点(ド
ット)の指示領域フラグ63を“1”とする。この結
果、図8に示すように、指示領域フラグ63がそれぞれ
“1”または“0”に設定された状態となる。
【0032】なお、この実施例の説明では理解を容易に
するため、指示領域フラグ63に設定される値としては
“0”と“1”の場合のみを示しているが、この指示領
域フラグ63は、同時に、他の編集方法を併用するた
め、つまり、それぞれの編集方法に応じて指示する領域
を区別するため、指示領域フラグ63の値として“0”
または“1”以外の値をとるようにしても良い。例え
ば、他の編集方法による領域を指示する場合(別の濃度
に変換するような場合など)、その領域の指定のため、
指示領域フラグの値を“2”とする。これにより、最初
の指定の領域と区別して、領域を指定することができ
る。この結果、その領域は、最初の濃度変換の編集の影
響を受けないようにすることができる。
【0033】このようにして、指示領域フラグ63が追
加された画像データ62は、編集対象領域判別モジュー
ル24に送られ、編集領域抽出の処理が行われる(ステ
ップ47)。すなわち、編集対象領域判別モジュール2
4は、指示領域フラグ63が追加された画像データ62
を受けとると、この画像データ62の指示領域フラグ6
3を、図9に示すように、反転して、編集対象領域フラ
グ64に変更し、画像データ65とする処理を行う。具
体的には、指示領域フラグ63が“1”の場合には編集
対象領域フラグ64は“0”とし、指示領域フラグ63
が“0”の場合には編集対象領域フラグ64を“1”と
する変更を行う。なお、上述したように、他の編集方法
が併用されており、指示領域フラグの値が“1”または
“0”以外の別の値となっているような場合には、ここ
で指示領域フラグ63の値は、編集対象領域フラグ64
のような値に変更されないので、その領域を抽出する影
響を受けない。編集領域抽出の処理が行われた後の画像
データ65は、文書画像変換モジュール25に送られ
る。
【0034】文書画像変換モジュール25では、編集対
象領域フラグ64を有する画像データ65に基づいて、
文書画像変換の処理を行う(ステップ48)。つまり、
文書画像変換モジュール25は、編集対象領域フラグ6
4が付加されている画像データ65を受けとると、編集
対象領域フラグ64を1ドットづつ読み出し、編集対象
領域フラグ64が立っている(編集対象領域フラグが
“1”である)場合に、そのドットの画像データの値を
読み出す。そして、読み出した画像データの値を編集対
象領域以外の領域(編集対象領域フラグが“0”である
領域)との濃度差をつけるように書きかえる。
【0035】濃度差をつける編集を行う具体例として、
例えば、図10に示すように、編集対象領域フラグが
“1”である画素のドットに対してのみ、その画像デー
タの値(濃度の値)が0.6倍とする。このような画像
データの値の書き換えが行なわれ、編集された状態の画
像データ66となる。この実施例では、濃度の変換を行
う場合に、係数0.6を掛けるようにしているが、トナ
ーを用いて記録する複写機の場合では、約0.3〜0.
8程度の係数を掛るようにする。
【0036】また、画像変換の処理では、編集対象領域
のドットの濃度を下げる代わりに、編集対象領域の背景
部分をグレーにする編集方法も利用しても良い。その場
合には、係数を掛けるのではなく、編集対象領域の全て
の画素の画像データの濃度の値に、例えば係数25を加
える(ただし、加算した値の最大値は255を越えな
い)処理を行う。係数25を加える場合の処理では、背
景が10%のグレー化される処理となる。更に、利用者
が個別に濃度を指定して、濃度を下げるようにしても良
い。また、背景をグレーにする方法などの個々の編集方
法をコントロールパネル部28の操作により選択できる
ようにしても良い。このようにして、各々の画素の画像
データの値が書き換えられた画像データは、プリンタ機
構26に送られて、プリントアウトされる(ステップ4
9)。
【0037】このようにして、図5に示したような入力
文書の文書画像51に対して、その文書中に2ヶ所の領
域の指定が行なわれ、その指定の領域に対しては編集を
行なわず、それ以外のの背景のみをグレー変換すると、
その結果、図11に示すような出力文書の文書画像67
が得られる。
【0038】ところで、前述した第1の実施例において
は、利用者がポインティングデバイス,ディジタイザな
どの座標入力装置によって、入力文書の文書画像51に
対して、例えば、濃度変換を行うための編集対象以外の
領域を指定し、その編集対象以外を指定した領域の指定
により、逆に編集対象領域を判定して、入力画像に対す
る編集処理を施すものとなっている。このように、その
編集対象以外を指定する領域の指定を行うことにより、
編集対象領域の指定を行い、文書の周辺部までの編集対
象とする領域を正確に指定することができる。しかし、
このような領域の指定は、利用者による手操作による領
域の指定であり、手操作の入力ではその操作が煩雑にな
る。これに対して、従来からの技術を利用して、文字領
域または図表領域などの文書画像の特徴を自動的に判定
して、編集対象の領域の指定(編集対象以外の指定をも
含めて)を行うように構成してもよい。このような変形
例を第2の実施例として説明する。
【0039】(第2の実施例) 図13は、本発明の第2の実施例の文書画像処理装置の
基本構成を示すブロック図である。図13において、2
01は編集対象文書画像、202は領域分割処理部、2
03は最下位要素計数部、204は長文領域判定部、2
05は文書画像変換部、206は編集後文書画像であ
る。
【0040】領域分割処理部202は、文書画像を入力
として、文字領域、図表領域などに分割する処理機能要
素である。すなわち、文書画像上の画素の集まりをそれ
ぞれの文書要素の意味のある塊として小領域に分割し、
その文書画像の領域の物理的性質を認識して文字領域お
よび図表領域などの領域に分割する処理を行う。このよ
うな機能要素の技術に関しては、つまり、文書画像を入
力し、その物理的な性質から文字領域または図形領域な
どに分割する技術に関しては、従来から公知となってい
る例えば特開昭64−15889号公報あるいは特公昭
61−32712号公報により提案されているような技
術を利用すれば良いので、ここでの詳細な説明は省略す
る。
【0041】なお、ここでの領域分割処理部202で
は、それぞれの領域を矩形に分割して出力するが、文書
画像に対して、領域分割の処理を行う前に、傾き補正、
ノイズ除去等の前処理が行なわれる。また、この領域分
割処理部202においては、ここで分割された文書画像
の各領域において、更に、文字の要素、図形の要素、け
い線の要素などの種別が識別され、これらの要素の種別
も同時に付加して出力される。また、要素の種別のデー
タにより、更に、領域の特性を判定する。このような領
域が分割された結果として、領域分割処理部202から
出力される文書画像の要素の列は、文書のレイアウト構
造データと呼ばれる。
【0042】最下位要素計数部203は、領域分割処理
部202で得られたレイアウト構造データから、文字領
域の文字のブロックごとに最下位要素の領域(1文字に
対応する領域)の数を、文字数として計数する。各々の
領域について、その文字数が最下位要素計数部203に
より計数されると、計数された計数値により、長文領域
判定部204は、計数された領域数の平均値を計算し、
平均領域数より多い文字ブロックの領域を、編集対象領
域として判定する。この判定された結果の領域に対し
て、文書画像変換部205は、編集対象となる領域の濃
度やコントラストを変換し、出力画像を生成し、編集後
文書画像206として出力する処理機能要素である。文
書画像変換部205としては通常の画像形成処理装置が
利用される。
【0043】次に、このような各々の機能要素により構
成される第2の実施例にかかる文書画像処理装置を、デ
ジタルカラー複写機に適用した場合を例として説明す
る。前述した第1の実施例の説明と同様に、装置を構成
する各々の機能要素は、前述した公知例となっている特
開平2−223275号公報に記載されているディジタ
ルカラー複写機における各々の機能要素が利用できるの
で、個別の各々の機能要素についての説明は省略し、以
下の説明では、文書画像処理の動作に従い順を追って説
明する。
【0044】図14はデジタルカラー複写機に適用した
第2の実施例の文書画像処理装置の要部の装置構成を説
明するブロック図である。図14において、70は文書
画像処理装置、71はイメージスキャナ、72は領域分
割モジュール、73最下位要素計数モジュール、74は
長文領域判別モジュール、75は文書画像変換モジュー
ル、76はプリンタ機構、77は制御モジュール、78
はコントロールパネル部である。
【0045】コントロールパネル部78は、利用者から
の変換指示を受け付ける機能要素であり、テンキーおよ
びファンクションキーからなるキーボード、およびディ
スプレイなどから構成される。制御モジュール77はコ
ントロールパネル部78に対するデータの入出力処理、
イメージスキャナ71の起動処理、プリンタ機構76の
起動処理などの制御処理を行なうため制御ユニットであ
る。制御ユニットには制御用のマイクロプロセッサが搭
載されており、マイクロプロセッサには、制御処理のプ
ログラムが内部にプログラムされている。これらは第1
の実施例で用いられているものと同様である。
【0046】図15は、文書画像の文字領域を判別して
その領域に対する濃度変換を行う場合の処理を流れを示
すフローチャートである。図15を参照して処理の概略
を説明する。電源が投入され、処理が開始されると、ま
ず、ステップ80において、立ち上げ処理を行う。次
に、ステップ81において、濃度変換モードが指定され
ているか否かを判定する。濃度変換モードが指定されて
いない場合には、ステップ82に進み、通常の複写処理
を行う。そして、再び、ステップ81に戻り、濃度変換
モードの指定を判定する。
【0047】ステップ81の判定により、濃度変換モー
ドが指定されていることが判定されると、ステップ83
からの処理により、文書画像の文字領域を判別してその
領域に対する濃度変換処理を行う。この処理では、ま
ず、ステップ83でスタートが指示されたか否かを判定
する。スタートの指示が判定されない場合は、再び、ス
テップ83に戻り、再び、スタートが指示されたか否か
を判定する。つまり、スタートが指示されるまで待つダ
イナミックループに入る。
【0048】ステップ83において、スタートが指示さ
れたことが判定されると、次に、ステップ84に進み、
原稿読み取りの処理を行う。次に、ステップ85におい
て、文書画像の領域分割の処理を行い、レイアウト構造
データを取り出し、次のステップ86において、分割し
た各々の領域に対して、最下位要素の領域を計数する文
字数計数の処理を行う。次に、ステップ87において、
各々の領域毎に文字数として計数した計数値から長文領
域を判定する処理を行う。そして、次のステップ88に
おいて、判定された長文領域を編集領域として文字画像
の濃度変換を行う文字画像変換の処理を行い、次のステ
ップ89において、画像出力を行う。そして、ステップ
81に戻り、次の文書画像に対して同様の処理の流れに
従って、ステップ81から処理を繰り返し行う。
【0049】次に、このようにして、編集対象の文書画
像の領域判定を行い、その領域判定の結果により部分的
に濃度変換を行う場合の処理について、具体的な文書画
像の処理例について説明する。図16は、処理対象の文
書画像に対して領域判定行なわれた結果の領域判別デ
ータの一例を示す図であり、図17は、領域判定結果の
1つの文字ブロック領域における階層構造の判定結果と
入力文書との対応関係を説明する図である。また、図1
8は領域判別データの1つの領域における判定結果の階
層構造の領域データを示す図であり、図19は各々の判
定領域毎に文字数として計数された計数データを格納す
る文字数テーブルを示す図である。また、図20は、判
定された長文領域に対して最終的に濃度変換が行なわれ
た状態の文書画像の出力文書の一例を示す図である。な
お、文書画像(図16および図20)においては、前述
の場合と同様に、領域の位置を表わすため、位置の基準
として直交座標の座標値を用いるが、この座標軸は、図
中に示すように、ページ右に向かってx軸とし、ページ
下に向かってy軸とする。
【0050】次に、これらの図16〜図20を参照して
説明する。電源が投入されると、制御モジュール77が
立ち上げ処理を行ない、コントロールパネル部78にお
いて初期画面を表示する(ステップ80)。利用者が、
コントロールパネル部78において所望する操作を行
い、例えば、濃度変換モードを指示する(「濃度変換」
ボタンを押す)と、濃度変換モードとなるが、そうでな
ければ、通常の複写処理を行なう。濃度変換モードにな
った後は、「スタート」を指示する複写スタートボタン
が押されるのを待つ(ステップ81〜83)。
【0051】次に、利用者が、原稿をプラテン上に置
き、複写スタートボタンを押すと、制御モジュール77
がイメージスキャナ71を起動する。イメージスキャナ
71からは原稿画像が読み取られ、デジタル画像データ
として、文書画像処理装置70の領域分割モジュール7
2に受け渡される。領域分割モジュール72は、領域分
割の処理を行い、例えば、図5に示すような入力文書の
文書画像51に対して、領域分割の処理を行う。その結
果、図16に示すように、文書画像データ91の各々の
領域に対して、文字がまとまって並んでいる領域(文字
ブロック領域)92と、罫線が存在する領域(罫線領
域)93と、これら以外の余白の領域(余白領域)94
とに分割される。
【0052】ここで各々の領域を表現する矩形は、原稿
画像のx軸およびy軸の方向それぞれに平行な辺を持
ち、対象となる領域を囲む最小の矩形とする。この矩形
の領域を表現するデータは基本的に「種別,左上点x座
標,左上点y座標,幅,高さ」の5個のデータの組で表
現される。領域を表現する矩形のデータは、レイアウト
構造データのそれぞれの要素であり、それらの要素が階
層構造のデータとなっている。例えば、矩形の領域が文
字ブロック領域である場合は、図17に示すように、文
字ブロック領域に対して、その領域内の下位の領域デー
タとして、レイアウト構造データの要素である文字行領
域のデータがあり、更に、文字行領域のデータに対して
は、その文字行領域内の下位の領域データとして、レイ
アウト構造データの最下位の要素である一文字ずつの文
字領域のデータがある。
【0053】例えば、図5に示すような入力文書の文書
画像51に対して、領域分割により領域判定が行なわれ
た場合には、図17に示すように、入力文書における文
字列“本報告は顧客の満足度を… ○○○○○”の領
域に対して、それぞれに分割された領域は、最上位の文
字ブロック領域101に対して、その下位の領域とし
て、文字行領域102があり、更に下位のレイアウト構
造データの要素として文字領域103の各々の領域が判
定され、それぞれの領域データに分割される。なお、図
17では、階層構造100となっている各々の領域デー
タに対応して、その本文の文字列部分と、その領域デー
タとを示している。
【0054】このように領域分割された各々の階層構造
を有する領域データは、図18に示すように、表形式の
レコードデータとして表現され、その各々の領域データ
が領域テーブル104に格納される。この領域テーブル
104の1つのレコードデータが1つの領域データを表
現している。ここでの各々の領域データのレコードデー
タは、前述したように「種別,左上点x座標,左上点y
座標,幅,高さ」の5個のデータの組から成る領域を表
わす各々のフィールドのデータに加えて、各々の領域に
対して、その階層構造を表現するため、更に、下位要素
個数フィールド105および下位要素開始番号フィール
ド106のフィールドデータが追加されている。この下
位要素個数フィールド105および下位要素開始番号フ
ィールド106の2つのフィールドデータによる階層構
造を順次に辿ることにより、1つの文字ブロック領域の
文字領域の個数が文字数として計数できる。
【0055】つまり、最下位要素計数モジュール73で
は、領域分割モジュール72で得られたレイアウト構造
データの中から、文字ブロック領域ごとに最下位要素の
領域数を計数する処理を行う。ここの処理は、レイアウ
ト構造データから、その最上位の領域が文字ブロック領
域であるものについて、具体的には、図18に示すよう
な領域テーブル104において、種別フィールドのデー
タが“文字ブロック”となっている領域のレコードデー
タについて、その階層構造から下位側の領域データの要
素を辿る。そして、最終的に、下位要素開始番号フィー
ルド106のデータが“0”となっている領域データ
(すなわち、それより下位にリンクする要素がない最下
位要素の領域データ)までの要素の数を計数する。
【0056】図18に示す領域テーブル104のデータ
の例で具体的に説明すると、番号フィールドの値が
“1”である文字ブロック領域の領域データは、下位要
素個数フィールド105および下位要素開始番号フィー
ルド106のデータにより、その下位の要素は、番号フ
ィールドの値が“11”の文字行領域のみとなってい
る。更に、番号フィールドの値が“11”の文字行領域
の領域データは、更に下位の要素が、番号フィールドの
値が“50”から“59”までの文字領域のデータであ
る。これらの文字領域の領域データは、それより下位に
リンクされる要素は存在しないため、最下位要素の数は
「10個」と求められる。このようにして得られた各々
の文字ブロック領域毎に、文字数として計数された結果
は、そのレイアウト構造データと共に、長文領域判別モ
ジュール74へと送られる。
【0057】長文領域判別モジュール74では、送られ
てきた文字数のデータとそのレイアウト構造のデータ
を、図19に示すように、文字数テーブル107に、各
々の文字ブロック領域毎にその文字数のデータを格納す
る。そして、得られた各領域毎の文字数の平均値を計算
し、計算した平均値よりも文字数が多い文字ブロック領
を長文領域と判定する。図19に示す例では、文字ブ
ロック番号が“5”および“7”である2つの領域が長
文領域と判定され、その判定結果フィールドには判定フ
ラグが立てられる。
【0058】このように判定された長文領域を画像編集
領域として、ここでの濃度変換が行われる。例えば、図
5に示すような入力文書の文書画像51に対して、領域
分割が行なわれ、分割された結果の文字ブロック領域に
対して、2つの長文領域が判定され、図19に示すよう
な判定結果のデータが得られる。そして、長文領域であ
ると判定された文字ブロック領域に対して、その領域デ
ータ「左上点x座標,左上点y座標,幅,高さ」で示さ
れる領域が、編集領域とされる。次に、第1の実施例の
場合と同様に、編集領域とされた領域の範囲内の画素の
画像データに、編集対象領域フラグを追加し、長文領域
であると判定された文字ブロック領域の編集対象領域フ
ラグを“1”とする処理を行なった後、その画像データ
を文書画像変換モジュール75に受け渡す。
【0059】文書画像変換モジュール75では、第1の
実施例と同様の処理を行ない、編集対象領域フラグが
“1”となっている領域の画像データに対して、前述し
たように所定の係数(0.6)を掛けて濃度を下げる
か、または、それぞれの領域の内の画像データの所定の
値を加算して、その背景をグレーにする濃度変換を行
う。このようにして、画像変換を行った後の画像データ
は、プリンタ機構76に受け渡され、出力文書の文書画
像とし出力される。この結果、図5に示すような入力文
書の文書画像51に対して、長文領域が判定され、その
領域の背景をグレーにする編集が行なわれた場合、図2
0に示すように、文字列のまとまった領域がグレーに編
集された結果の出力文書の文書画像108が出力され
る。
【0060】以上に説明した第2の実施例においては、
文書画像の編集領域の指示を、従来からの技術を利用し
て、文字領域または図表領域などの文書画像の物理的な
特徴を自動的に判定し、編集対象の領域の指定(編集対
象以外の指定をも含めて)を行うように構成したもので
あったが、この文書画像の編集領域の指示を、文字領域
または図表領域などの文書画像の物理的な特徴を判定
し、更に、編集する入力文書の文書画像に特有の論理的
な特徴から、その領域指定を行うように変形しても良
い。その場合の論理的な特徴付けは、例えば、レイアウ
ト構造データの各々要素に対応して、予じめ「タイト
ル」,「著者」,「本文」などの論理的な意味から領域
を対応づけをしておく。次に、このような変形例の文書
画像処理装置を第3の実施例として説明する。
【0061】(第3の実施例) 図21は、本発明の第3の実施例の文書画像処理装置の
基本構成を示すブロック図である。図21において、3
01は編集対象文書画像、302は領域分割部、303
は論理識別子付与部、304は編集領域判別部、305
は文書画像変換部、306は編集後文書画像である。
【0062】領域分割部302は、第2の実施例で説明
領域分割処理部202と同様なものであり、文書画
像を入力として、文字領域、図表領域などに分割する処
理機能要素である。この場合においても、領域分割部
02は、分割された文書画像の各領域において、更に、
文字の要素、図形の要素、けい線の要素などを識別する
と共に、これらの要素の種別も領域データに付加したレ
イアウト構造データを出力する。
【0063】論理識別子付与部303は、領域分割部
02で得られたレイアウト構造データの要素を入力と
し、それぞれに「タイトル」,「著者」,「本文」など
の論理的に意味付ける識別子を付与する処理機能要素で
ある。具体的には、例えば特開平5−159101号公
報に記載されたような技術を利用する。この論理識別子
付与部303は、認識対象のレイアウト構造と論理構造
の対応を表わす文書構造モデルをあらかじめ登録してお
き、領域分割の結果データと構造モデルとのマッチング
によってそれぞれの領域に対して論理的な意味を表現す
る名称を付与する。
【0064】編集領域判別部304は、論理識別子付与
部303において付与された論理識別子に基づいて編集
対象となる領域を決定する機能要素である。例えば、文
書画像におけるレイアウト構造から、タイトルなどの大
きな文字部分を除き、小さい文字部分だけ濃度を薄くす
る編集を行う場合、文書構造の「本文」,「ページ番
号」,「ヘッダ」,「脚注」,「著者」などの論理構造
の名称により、編集対象する要素を指定しておく。これ
により、編集領域判別部304は、それに対応して文書
画像中の編集領域を判定し、編集領域指示フラグを設定
する。このように判定された結果の編集領域に対して、
文書画像変換処理部305は、編集対象とされた領域の
濃度やコントラストを変換し、出力文書の文書画像を生
成し、編集後文書画像306として出力する機能要素と
なっている。これは第1の実施例および第2の実施例の
ものと同様である。
【0065】次に、このような各々の機能要素により構
成される第3の実施例の文書画像処理装置を、前述の場
合と同様に、デジタルカラー複写機に適用した場合を例
として、実際の動作例で説明する。前述した第1の実施
例の説明と同様に、装置を構成する各々の機能要素は、
前述した公知例となっている特開平2−223275号
公報に記載されているディジタルカラー複写機における
各々の機能要素が利用できるので、個別の各々の機能要
素についての説明は省略し、以下の説明では、文書画像
処理の動作に従い順を追って説明する。
【0066】図23はデジタルカラー複写機に適用した
第3の実施例の文書画像処理装置の要部の装置構成を説
明するブロック図である。図23において、120は文
書画像処理装置、121はイメージスキャナ、122は
領域分割モジュール、123は論理識別子付与モジュー
ル、124は編集領域判定モジュール、125は文書画
像変換モジュール、126はプリンタ機構、127は制
御モジュール、128はコントロールパネル部である。
【0067】コントロールパネル部128は、利用者か
らの変換指示を受け付ける機能要素であり、テンキーお
よびファンクションキーからなるキーボード、およびデ
ィスプレイなどから構成される。制御モジュール127
はコントロールパネル部128に対するデータの入出力
処理、イメージスキャナ121の起動処理、プリンタ機
構126の起動処理などの制御処理を行なうため制御
ユニットである。これらのものは第1の実施例で用いら
れているものと同様である。
【0068】図24は、文書画像の各領域を論理識別子
により判別してその領域に対する濃度変換を行う場合の
処理を流れを示すフローチャートである。図24を参照
して処理の概略を説明する。電源が投入され、処理が開
始されると、まず、ステップ130において、立ち上げ
処理を行う。次に、ステップ131において、濃度変換
モードが指定されているか否かを判定する。濃度変換モ
ードが指定されていない場合には、ステップ132に進
み、通常の複写処理を行う。そして、再び、ステップ1
31に戻り、濃度変換モードの指定を判定する。
【0069】ステップ131の判定により、濃度変換モ
ードが指定されていることが判定されると、ステップ1
33からの処理により、文書画像の各領域を論理識別子
により判別してその領域に対する濃度変換処理を行う。
この処理では、まず、ステップ133でスタートが指示
されたか否かを判定する。スタートの指示が判定されな
い場合は、再び、ステップ133に戻り、再び、スター
トが指示されたか否かを判定し、スタートが指示される
まで待つ。
【0070】ステップ133において、スタートが指示
されたことが判定されると、次に、ステップ134に進
み、原稿読み取りの処理を行う。次に、ステップ135
において、文書画像の領域分割の処理を行い、レイアウ
ト構造データを取り出し、次のステップ136におい
て、取り出したレイアウト構造データに対して論理識別
子を付与する処理を行う。つまり、取り出されたレイア
ウト構造データと、保持している構造モデルとのマッチ
ングを行い、レイアウト構造の最上位の要素がどのよう
な文書構造における論理的な意味を持つかを示す識別子
を与える。この識別子は、「タイトル」,「著者」,
「サブタイトル」,「本文」,「脚注」などの文書構造
の要素を意味する識別子である。
【0071】次に、ステップ137において、各々の領
域に付与された識別子に応じて、編集する領域を判別す
る処理を行う。そして、次のステップ138において、
判定された各々の編集領域に対して文字画像の濃度変換
を行う文字画像変換の処理を行い、次のステップ139
において、画像出力を行う。そして、ステップ131に
戻り、次の文書画像に対して同様の処理の流れに従っ
て、ステップ131から処理を繰り返し行う。
【0072】このようにして、編集対象の文書画像の領
域分割を行い、その分割した領域に付与した論理的な識
別子による判定した領域に対して濃度変換を行う場合の
処理について、具体的な文書画像の処理例について説明
する。図22は、文書構造の論理識別子の一例を示す図
であり、また、図25は、文書画像の各領域に対応付け
る構造文書モデルの一例を示す図である。図26は、レ
イアウト構造データの要素に対応づけた論理識別子との
対応関係を示す図である。また、図27は、編集対象の
候補として抽出する領域を論理識別子により指定する編
集対象判定データの一例を示す図である。図28は、論
理識別子により判定された領域判定データの一例を示す
図であり、図29は、領域判定データによる指定された
領域に対して最終的に濃度変換が行なわれた状態の文書
画像の出力文書の一例を示す図である。なお、前述の場
合と同様に、領域の位置を表わすため、位置の基準とし
て直交座標の座標値を用いるが、この座標軸は、図20
に示すように、文書画像のページ右に向かってx軸と
し、ページ下に向かってy軸とする。
【0073】これらの図22,図25〜図28を参照し
て説明する。電源が投入されると、制御モジュール12
7が立ち上げ処理を行ない、コントロールパネル部12
8で初期画面を表示する(ステップ130)。利用者が
コントロールパネル部128において操作を行い、濃度
変換モードを指示する(「濃度変換」ボタンを押す)
と、濃度変換モードとなるが、そうでなければ、通常の
複写処理を行なう。濃度変換モードになった後は、「ス
タート」ボタンが押されるのを待つ(ステップ131〜
133)。
【0074】利用者が編集対象文書の原稿をプラテン上
に置き、「スタート」ボタンを押すと、制御モジュール
127がイメージスキャナ121を起動し、原稿の文書
画像が読み取られ、デジタル画像データとされて、領域
分割モジュール122に受け渡される(ステップ13
4)。領域分割モジュール122では、第2の実施例と
同様に、文書画像に対して領域分割の処理を行ない、そ
の処理結果のレイアウト構造データを論理識別子付与モ
ジュール123に受け渡す(ステップ135)。
【0075】論理識別子付与モジュール123は、受け
取ったレイアウト構造データと保持している文書構造モ
デル(図25)とのマッチングを行い、レイアウト構造
データの階層構造の分割領域データの最上位の要素が、
文書構造において、どのような論理的な意味を持つかを
示す識別子を与える(ステップ136)。
【0076】ここでの識別子は、例えば、図22に示す
ように、文書構造に対する各々の構成要素を意味する
「タイトル」,「著者」,「サブタイトル」,「本
文」,「脚注」,「脚注罫」などに対して、それぞれを
区別するフラグのデータである。また、レイアウト構造
データにおける最上位の要素とは、レイアウト構造デー
タのどの要素に対しても下位要素となっていない要素で
あり、例えば、階層構造の領域データである文字ブロッ
ク領域は、最上位の文字ブロック全体でひとつの識別子
が付与される。したがって、その更に下位の要素である
文字行領域や、文字領域は個々には、論理識別子が付与
される対象とならない。
【0077】通常、ある範囲で流通する文書(所定形式
を有する論文,報告書,事務連絡文書など)では、「タ
イトル」,「著者」は上下配置になっているなど、ある
程度は固定的なデザインとなっている文書が多い。ここ
では、この性質を利用して文書構造に対する論理識別子
を付与する。つまり、文書構造モデルとして文書画像の
各々の領域データに対する構造(領域の配置)を登録し
ておき、文書画像の領域分割により得られたレイアウト
構造データの各要素の領域データと、文書構造モデルに
おける領域の配置とのマッチングを行い、対応が付けら
れれた場合に論理識別子を付与する。すなわち、この文
書構造モデルとは、処理対象となる文書のデザインにつ
いてのテンプレートであり、これらのテンプレートとな
る文書構造モデルはROM等にあらかじめ複数の種類を
登録しておく。
【0078】文書構造モデルは、具体的には、図25に
示すように、文書画像の要素の種別(文字ブロック、文
字行、けい線など)と対応する論理名称を持つノード
と、これら要素間の相対的な位置関係を示すリンク情報
とにより表われるグラフ構造のデータとする。その場
合、識別子付与モジュール123におけるマッチング処
理では、登録してある1つの文書構造モデルとマッチす
るか否かを判定する処理を順次に行う。つまり、登録さ
れている文書構造モデルを1つずつ取り出し、マッチン
グ処理が成功するまで順次にマッチング処理を実行す
る。もし、全ての文書構造モデルとのマッチングが失敗
した場合には、入力文書に対する編集処理は処理不可能
である旨のメッセージをコントロールパネル部128に
表示し、以後の処理を何も行なわずに終了する。なお、
この場合、以降の処理では、例えば、第1の実施例で説
明したように、手動での領域指定による編集処理を行う
ようにしても良い。
【0079】ある文書構造モデルとのマッチング処理が
成功した場合は、レイアウト構造データにおける各々の
要素の領域データは、文書構造モデルの各ノードとの対
応が付けられるので、その処理結果は、図26に示すよ
うに、論理識別子付与テーブル140に格納される。論
理識別子付与テーブル140は、要素番号フィールド1
41と論理識別子フィールド142から構成されてお
り、レイアウト構造データの各々の要素番号のデータに
対応してその論理識別子が対応付けられたデータテーブ
ルである。ここでの論理識別子が付与された論理識別子
付与テーブル140のレイアウト構造データは、編集領
域判別モジュール124に受け渡される。
【0080】編集領域判別モジュール124は、図27
に示すように、各々の論理識別子に対応して編集を行な
う候補を判定する判定規準を示す編集対象判定データ1
50を予じめ記憶しており、この編集対象判定データ1
50に基づいて、編集対象となるレイアウト構造データ
の要素を判別する。例えば、図26に示すようなレイア
ウト構造データの要素番号に対して論理識別子が付与さ
れた論理識別子付与テーブル140のデータが、編集領
域判別モジュール124に渡され、図27に示すような
編集対象判定データ150に基づいて、編集対象とする
領域が判定された場合、図28に示すような領域判定結
果データ160が得られる(ステップ137)。
【0081】この領域判定結果データ160による判別
の結果により、レイアウト構造データの領域データに対
して、第2の実施例と同様に、編集対象となる文字ブロ
ック領域の「左上点x座標、左上点y座標、幅、高さ」
で示される領域データから、編集領域が抽出される。文
書画像の編集領域の指定の処理では、第1の実施例の場
合と同様に、画素の画像データに編集対象領域フラグを
追加し、編集対象となる領域の編集対象領域フラグを
“1”とする処理を行なった後、文書画像の画像データ
を文書画像変換モジュール125に受け渡す。
【0082】文書画像変換モジュール125では、第1
の実施例の場合と同様に、編集対象領域フラグが“1”
である領域の画像データに対して係数を掛けて、濃度を
下げるか、または、画像データに所定数の値を加算して
背景をグレーにする(ステップ138)。この変換後の
画像データはプリンタ機構126に受け渡され、出力文
書の画像として出力される(ステップ139)。例え
ば、図5に示すような入力文書の文書画像51に対し
て、その文書構造から編集対象の領域を指示して文書画
像変換を行った場合、その編集結果の出力文書の画像
は、図29に示すような文書画像170として出力され
る。
【0083】図29に示すような出力文書の文書画像1
70では、図27に示す編集対象判定データ150に基
づいて、編集対象とする領域を判定し、その判定された
領域に対して画像変換が行われた結果となっている。つ
まり、「本文」,「ページ番号」,「ヘッダ」,「脚
注」,「著者」の論理識別子を編集対象として指定する
指示内容を持つ編集対象判定データ150により、それ
ぞれの編集領域が判定され、その論理識別子を持つ要素
(レイアウト構造データの要素)の領域データに従っ
て、その背景がグレーにされた出力文書の文書画像の例
となっている。
【0084】なお、この実施例の説明では、指定された
論理識別子を持つ文字ブロック領域を編集対象とした
が、編集対象領域を決定する場合、例えば、第1の実施
例と同様に、「タイトル」,「サブタイトル」などの編
集候補とならない論理識別子から、それらの論理識別子
を持つ要素以外を編集対象とするようにしても良い。ま
た、編集しない候補の論理識別子の指定により、それ以
外の論理識別子を持つ要素と余白部分を加えた領域を編
集対象とするようにも変形できる。
【0085】
【発明の効果】以上に、説明したように、本発明の文書
画像処理装置によれば、簡単な操作によって、文書画像
の一部分について、例えば、その画像の濃度を下げた
り、背景の明度を下げたりすることができる。また、編
集対象としない領域の指定により、編集する領域を指定
することにより編集対象領域の指示が簡単になり、その
他,編集処理の指定が不要になり、操作が簡単になる。
また、文書画像における文字領域または図面領域などの
物理的な特徴から長文領域を自動判別して、編集対象の
処理を行うように構成できるため、領域を指示する操作
が不要になる。更に、予じめ論理識別子による指定によ
り「本文」,「注」などの編集対象領域を自動判別し
て、編集対象の処理を行うため、領域を指示する操作が
不要になる。このため、利用者は文書画像の操作を行う
場合には、特に、複雑な操作を行うことなく、画像編集
の操作が容易に行える。
【図面の簡単な説明】
【図1】 図1は本発明の文書画像処理装置の第1の実
施例の基本構成を示すブロック図、
【図2】 図2はディジタル複写機におけるコンソール
パネルの一例を示す図、
【図3】 図3はデジタルカラー複写機に適用した文書
画像処理装置の要部の構成を説明するブロック図、
【図4】 図4は指定された領域に対する濃度変換を行
う場合の処理を流れを示すフローチャート、
【図5】 図5は、処理対象の文書画像として入力する
白黒の入力文書の一例を示す図、
【図6】 図6は入力文書において処理対象の領域を指
定する場合の操作例を説明する図、
【図7】 図7は256階調グレースケールによる文書
画像の画像データを部分的に示す図、
【図8】 図8は画像データに指示領域フラグが設けら
れた場合の画像データを部分的に示す図、
【図9】 図9は指示領域フラグが反転され編集対象領
域フラグとされた状態の画像データを部分的に示す図、
【図10】 図10は指定された領域に対する濃度変換
が行なわれた状態の画像データを部分的に示す図、
【図11】 図11は最終的に濃度変換が行なわれた状
態の出力文書の文書画像の一例を示す図、
【図12】 図12は領域が指示された状態の領域テー
ブルの例を示す図、
【図13】 図13は本発明の第2の実施例の文書画像
処理装置の基本構成を示すブロック図、
【図14】 図14はデジタルカラー複写機に適用した
第2の実施例の文書画像処理装置の要部の装置構成を説
明するブロック図、
【図15】 図15は文書画像の文字領域を判別してそ
の領域に対する濃度変換を行う場合の処理を流れを示す
フローチャート、
【図16】図16は処理対象の文書画像に対して領域判
行なわれた結果の領域判別データの一例を示す図、
【図17】 図17は領域判定結果の1つの文字ブロッ
ク領域における階層構造の判定結果と入力文書との対応
関係を説明する図、
【図18】 図18は領域判別データの1つの領域にお
ける判定結果の階層構造の領域データを示す図、
【図19】 図19は各々の判定領域毎に文字数として
計数された計数データを格納する文字数テーブルを示す
図、
【図20】 図20は、判定された長文領域に対して最
終的に濃度変換が行なわれた状態の文書画像の出力文書
の一例を示す図、
【図21】 図21は本発明の第3の実施例の文書画像
処理装置の基本構成を示すブロック図、
【図22】 図22は文書構造の論理識別子の一例を示
す図、
【図23】 図23はデジタルカラー複写機に適用した
第3の実施例の文書画像処理装置の要部の装置構成を説
明するブロック図、
【図24】 図24は文書画像の各領域を論理識別子に
より判別してその領域に対する濃度変換を行う場合の処
理を流れを示すフローチャート、
【図25】 図25は文書画像の各領域に対応付ける構
造文書モデルの一例を示す図、
【図26】 図26はレイアウト構造データの要素に対
応づけた論理識別子との対応関係を示す図、
【図27】 図27は編集対象の候補として抽出する領
域を論理識別子により指定する編集対象判定データの一
例を示す図、
【図28】 図28は論理識別子により判定された領域
判定データの一例を示す図、
【図29】 図29は領域判定データによる指定された
領域に対して最終的に濃度変換が行なわれた状態の文書
画像の出力文書の一例を示す図である。
【符号の説明】 20…文書画像処理装置、21…イメージスキャナ、2
2…編集対象外領域指示モジュール、23…指示領域判
別モジュール、24…編集対象領域判別モジュール、2
5…文書画像変換モジュール、26…プリンタ機構、2
7…制御モジュール、28…コントロールパネル部、3
0…コンソールパネル、31…テンキー部31と、32
…表示部、33…複写ボタン、34…濃度変換ボタン、
35…複写スタートボタン、36…状態表示部、51…
入力文書の文書画像、52…第1の編集領域、53…始
点、54…終点、55…第2の編集領域、56…始点、
57…終点、60…領域テーブル、61…画像データ、
62…画像データ、63…指示領域フラグ、64…編集
対象領域フラグ、65…画像データ、66…編集された
状態の画像データ、67…出力文書の文書画像、70…
文書画像処理装置、71…イメージスキャナ、72…領
域分割モジュール、73最下位要素計数モジュール、7
4…長文領域判別モジュール、75…文書画像変換モジ
ュール、76…プリンタ機構、77…制御モジュール、
78…コントロールパネル部、91…文書画像データ、
92…文字ブロック領域、93…罫線領域、94…余白
領域、100…階層構造、101…文字ブロック領域、
102…文字行領域、103…文字領域、104…領域
テーブル、105…下位要素個数フィールド、106…
下位要素開始番号フィールド、107…文字数テーブ
ル、108…出力文書の文書画像、120…文書画像処
理装置、121…イメージスキャナ、122…領域分割
モジュール、123…論理識別子付与モジュール、12
4…編集領域判定モジュール、125…文書画像変換モ
ジュール、126…プリンタ機構、127…制御モジュ
ール、128…コントロールパネル部、140…論理識
別子付与テーブル、141…要素番号フィールド、14
2…論理識別子フィールド、150…編集対象判定デー
タ、160…領域判定結果データ、170…出力文書の
文書画像、301…編集対象文書画像、302…領域分
割処理部、303…論理識別子付与部、304…編集領
域判別部、305…文書画像変換処理部、306…編集
後文書画像。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 古郷 慎也 神奈川県横浜市保土ヶ谷区神戸町134番 地 横浜ビジネスパークイーストタワー 富士ゼロックス株式会社内 (56)参考文献 特開 平5−328094(JP,A) 特開 平3−48976(JP,A) 特開 平1−183784(JP,A) 特開 平5−342326(JP,A) 特開 平4−328688(JP,A) 実開 平2−72071(JP,U) (58)調査した分野(Int.Cl.7,DB名) G06T 1/00 G06T 11/60 - 17/50 H04N 1/38 - 1/393

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像上の編集されない領域を指示する
    編集対象外領域指示手段と、 編集対象外領域指示手段により指示された領域と入力原
    稿の文書画像との対応関係を示す指示領域フラグを編集
    方法に応じて値を変えて付加する指示領域判別手段と、 指示領域判別手段により付加された指示領域フラグの値
    に応じて編集対象とする画像データに編集領域フラグ
    付加する編集対象領域判別手段と、 編集領域フラグが付加された編集対象の画像データに対
    して画像を変換する文書画像変換手段とを備えることを
    特徴とする文書画像処理装置。
  2. 【請求項2】文書画像上の画素の集まりをそれぞれ文書
    要素の意味のある塊として小領域に分割する領域分割手
    段と、 領域分割手段により分割された小領域から、その中の最
    下位要素の数を計数する最下位要素計数手段と、 最下位要素計数手段で計数された小領域中の最下位要素
    の数から長い文章の領域を判別する長文領域判別手段
    と、 長文領域判別手段によって抽出された領域の長文の画像
    を変換する文書画像変換手段とを備えることを特徴とす
    る文書画像処理装置。
JP10173294A 1994-04-18 1994-04-18 文書画像処理装置 Expired - Fee Related JP3254896B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10173294A JP3254896B2 (ja) 1994-04-18 1994-04-18 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10173294A JP3254896B2 (ja) 1994-04-18 1994-04-18 文書画像処理装置

Publications (2)

Publication Number Publication Date
JPH07287767A JPH07287767A (ja) 1995-10-31
JP3254896B2 true JP3254896B2 (ja) 2002-02-12

Family

ID=14308444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10173294A Expired - Fee Related JP3254896B2 (ja) 1994-04-18 1994-04-18 文書画像処理装置

Country Status (1)

Country Link
JP (1) JP3254896B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3697064B2 (ja) * 1998-05-29 2005-09-21 キヤノン株式会社 画像編集装置、記録装置、画像編集方法及びコンピュータ読み取り可能な記録媒体
JP3756719B2 (ja) 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
JP2004171590A (ja) * 2004-01-16 2004-06-17 Sony Computer Entertainment Inc 計算機
JP5293328B2 (ja) * 2009-03-26 2013-09-18 富士ゼロックス株式会社 画像処理装置及びプログラム
JP7095541B2 (ja) * 2018-10-09 2022-07-05 富士通株式会社 階層構造認識プログラム、階層構造認識方法及び階層構造認識装置

Also Published As

Publication number Publication date
JPH07287767A (ja) 1995-10-31

Similar Documents

Publication Publication Date Title
US5751921A (en) Document image processing device for converting monochrome images to color images
US5142620A (en) Image processing system
US7805022B2 (en) Image processing apparatus, image processing method and computer program
US5257074A (en) Image forming apparatus
EP0797166A2 (en) Image output system and method
JPH08289094A (ja) 文書イメージスキャン方法及びその装置
US5136399A (en) Image recording apparatus having editing functions and an edit table with bank orders
JP2800672B2 (ja) 文書処理装置
JP3635765B2 (ja) 印刷特性表示装置
JP3068131B2 (ja) 文書処理装置
JP3291989B2 (ja) 文書処理装置
JP3254896B2 (ja) 文書画像処理装置
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JPH0962662A (ja) 文書処理装置
JP3211446B2 (ja) 文書処理装置
JP3306969B2 (ja) 文書編集装置
JP2547716B2 (ja) デ−タ処理システム
JPH06168310A (ja) 文書処理装置
JPH0622118A (ja) 文書処理装置
JPH08147123A (ja) 印刷装置および印刷装置の色文字印刷方法
JPH04160981A (ja) 複写機の像域別画像処理装置
JPH06243225A (ja) 画像編集方法
JP2006018509A (ja) 文書管理支援装置
JP3318991B2 (ja) 文書編集方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees