JPH0991450A - 文書処理装置および文書処理方法 - Google Patents

文書処理装置および文書処理方法

Info

Publication number
JPH0991450A
JPH0991450A JP8034702A JP3470296A JPH0991450A JP H0991450 A JPH0991450 A JP H0991450A JP 8034702 A JP8034702 A JP 8034702A JP 3470296 A JP3470296 A JP 3470296A JP H0991450 A JPH0991450 A JP H0991450A
Authority
JP
Japan
Prior art keywords
area
image
unit
document
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8034702A
Other languages
English (en)
Other versions
JP3504054B2 (ja
Inventor
Naoaki Kodaira
直朗 小平
Hiroaki Kubota
浩明 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03470296A priority Critical patent/JP3504054B2/ja
Priority to US08/682,007 priority patent/US6043823A/en
Publication of JPH0991450A publication Critical patent/JPH0991450A/ja
Application granted granted Critical
Publication of JP3504054B2 publication Critical patent/JP3504054B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Storing Facsimile Image Data (AREA)

Abstract

(57)【要約】 【課題】文書画像を種類対応の領域に分けて、個別に出
力できるようにする。 【解決手段】文書画像を複数の領域あるいは連結成分に
分割する手段 103と、分割された領域毎に領域の種類を
識別する手段 104と、識別された結果を表示しながら領
域情報を編集する編集手段105,106 と、編集された領域
情報を利用して、文書画像を整形する手段 107とを具備
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、書面としての文書
(原紙)を読み込んで、ハードコピーとして複写した
り、画像データに変換して保存したりするための文書処
理装置および文書処理方法に関する。
【0002】
【従来の技術】書面としての文書(原紙;オリジナル)
を画像データとして取り込んで、その画像をハードコピ
ーとして出力したり、イメージファイルとして保存した
りする技術がある。前者は複写機や、パソコン等におけ
るイメージ取り込みの分野等に利用されている技術であ
り、後者はファイリング装置やデータベースに利用され
る技術である。
【0003】このような従来のイメージ処理のための装
置においては、書面としての文書書類を画像データとし
て取り込んで、その画像をハードコピーとして複写した
り、画像に変換して保存したりする場合、文書書類が定
型サイズのものであれば、文書原紙の頁一枚(一葉)を
1つの単位として扱うのが一般的であった。
【0004】また、文書書類のレイアウトを認識するた
めに文書画像をブロックに分割するといった方法がとら
れることもあった。
【0005】すなわち、文書書類を構成している紙面内
容としてはタイトルや文章(テキスト)、挿絵や図表、
写真等の様々なものが含まれ、これらが紙面にレイアウ
トされている。
【0006】それにもかかわらず、全てを一色端に扱う
ことから文書を複写したり、画像に変換して保存したり
する場合に、文書中に必要な部分と必要でない部分が混
在していてもそれらを分離して扱うことができなかっ
た。
【0007】
【発明が解決しようとする課題】以上述べたように、従
来の文書処理装置においては、文書を複写したり、画像
に変換して保存したりする場合、文書一枚を1つの単位
として扱うため、文書中に必要な部分と必要でない部分
が混在していてもそれらを分離して扱うことができなか
った。
【0008】文書のレイアウトを認識する方法では、テ
キスト領域を積極的に探索するのみで、テキスト領域を
知ることはできるものの、単にそれのみであり、必要な
領域と不必要な領域を分離して、必要な領域のみを文書
画像として出力あるいは保存しておくといったことは不
可能であった。
【0009】そこでこの発明の目的とするところは、タ
イトルや文章(テキスト)、挿絵や図表、写真等の様々
なものが描かれている書面の画像から、タイトルや文章
(テキスト)、挿絵や図表、写真等の領域を区別して抽
出し、それぞれ別個に保存したり、別個に修正を加えて
ハードコピーしたりすることを可能にする文書処理装置
を提供することにある。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明はつぎのように構成する。
【0011】この発明においては、文書入力された画像
より特定の領域を抽出する領域抽出手段と、領域抽出手
段により抽出された領域をその特徴量により分類する領
域識別手段と、領域識別手段により識別された結果を表
示する識別結果表示手段と、識別結果を編集できる領域
編集手段と、領域編集手段によって編集された結果ある
いは識別結果により出力画像を生成する出力画像生成手
段と、出力画像生成手段によって生成された画像を出力
する画像出力手段とを具備する。
【0012】更には、領域識別手段には、前記特徴量に
より分類すると共に、分類結果に応じて分割する機能を
持たせ、更には、分類結果が雑音領域である場合に、こ
の雑音領域を分離削除する機能を持たせる。
【0013】文書を複写したり、画像に変換して保存し
たりする場合、入力された文書画像に対して、入力画像
に含まれる要素を領域として抽出し、それぞれの領域に
対して文書としての重要度を識別あるいは修正すること
により、必要な部分と不必要な部分を的確に分離して扱
うことが可能である。これにより、文書に含まれる書き
込みやノイズ、書類の影、その他の不必要な部分を取り
除いて、複写あるは保存などが可能となる。
【0014】また、入力された文書画像に対して、入力
画像に含まれる要素を領域として抽出し、それぞれの領
域に対して文書としての重要度を識別あるいは修正し、
必要な部分のみを要素ごとに独立のデータとして保存し
ておくことにより、入力画像より得られたデータを別の
文書に再利用することができる。同時に、必要な部分の
みを保存しておくため、保存領域の節約にも効果をあげ
ることができる。
【0015】さらに、領域をデータとして保存しておく
場合、すでに登録されているデータとの差異を計測する
ことにより、既登録のデータを重複して保存することな
くデータベースを構築できる。同時に、検索が効率的に
行え、保存領域の節約により効果をあげることができ
る。
【0016】従って、このような本発明によれば、文書
を構成要素毎に領域分割し、それぞれの領域に必要・不
必要に係わる領域情報を識別し、識別結果表示手段に表
示された領域識別情報を見ながら、編集することによ
り、文書中の必要な部分のみを容易に取り出すことがで
きるようになり、また、必要な領域と不要な領域を分離
して扱うことが自動的にあるいは容易な手続きによって
実現できる。さらに、文書中のテキスト、図表などの構
成要素を部品として保存することができ、再利用するこ
とが容易にできる等の効果が得られる。
【0017】また、文書を複写したり、画像に変換して
保存したりする場合に、入力文書に傾きがあっても、文
書中のテキストや図表といった必要な領域のみを残し、
ノイズ等の必要でない領域を削って出力することができ
るようにするために、本発明においては、領域識別にあ
たって、入力された文書画像から傾きを検出する傾き検
出手段と、前記傾き検出手段によって検出された傾きに
対して水平または垂直方向における前記文書画像の連結
成分領域を抽出する領域抽出手段と、前記領域抽出手段
に基づいて連結成分領域の形状を計測することにより領
域の属性を識別する領域識別手段と、識別された属性に
より変形あるいは濃度変換を行って出力画像データを生
成する出力画像生成手段を具備して構成した。
【0018】文書を複写したり、画像に変換して保存し
たりする場合、入力された文書画像に対して、入力画像
の傾きを検出し、入力画像に含まれる要素を傾きに対し
て水平または垂直方向における領域として抽出し、それ
ぞれの領域に対して文書要素としての属性を識別するこ
とにより、必要な部分と不必要な部分を的確に分離して
扱うことが可能である。これにより、文書に含まれる書
き込みやノイズ、書類の影、その他の不必要な部分を取
り除いて、複写あるは保存などが可能となり、複写の際
のトナーや保存領域の節約にも効果を上げることができ
る。
【0019】そして、本発明装置においては、入力文書
の傾きを検出し、その傾きに対して水平または垂直方向
における連結黒画素矩形領域を発生させ、この領域毎に
文字、図、写真、および雑音等の属性の識別を行なう。
【0020】そのため、入力された文書画像に傾きがあ
り、その傾きを補正する場合において、抽出された領域
に対して傾き補正するために、必要な領域だけ高速に補
正することができる。
【0021】すなわち、本発明では、領域識別にあたっ
て文書画像の傾きを補正してから領域識別するのではな
く、傾きを持った矩形領域情報より領域識別するため、
高速な処理を行うことができる。
【0022】また、入力された文書画像に対して、入力
画像の傾きを検出し、入力画像に含まれる要素を傾きに
対して水平または垂直方向における領域として抽出し、
それぞれの領域に対して文書要素としての属性を識別す
る。これにより、同一属性の領域同士を統合すること
で、格納領域を削減することができる。
【0023】すなわち、補正を行った画像を出力したい
場合においても、傾き補正が必要な領域だけに限定して
補正を行なうため、高速な傾き補正を行うことができ
る。また、画像全体の補正を行なうためには新たな格納
領域(メモリ)を必要とするが、本発明においてはそれ
を省くことが可能である。
【0024】
【発明の実施の形態】本発明システムは、書類の画像を
画像入力部により取り込み、これを入力画像格納部に入
力画像データとして一時的に記憶し、次いで、この一時
記憶された画像データに対してデータの状況から領域抽
出部により文字や図形等が物理的にあるいは論理的に連
結されている単位を一つの領域として抽出し、次に、こ
の抽出された領域に対して領域識別部が、個々にその領
域の画像上の位置、大きさ、形状、構造、濃度分布等の
特徴量を計測し、その計測結果を、予め定められたルー
ルに基づいて識別することにより、各領域の種類、ある
いは、文書上の重要度を識別する。
【0025】そして、これら識別された領域情報を、モ
ニタディスプレイ等の表示手段である領域識別結果表示
部に表示し、編集モードにすることで領域編集部により
ユーザは前記表示内容を参照しながら領域情報の編集作
業を行なうことでユーザの思うように領域情報の編集を
行なうことができる。そして、その編集の結果を画像デ
ータとして出力することができる。
【0026】このように本発明システムにより、入力さ
れた文書画像に対して、入力画像に含まれるタイトル領
域、文章領域、図表領域、頁領域、写真領域などの如き
種別の異なる画像要素を区別して領域として抽出し、そ
れぞれの領域に対して予め設定したルールに従い、文書
としての重要度を識別し、あるいはその結果を修正する
ことにより、必要な部分と不必要な部分を適確に分離し
て扱うことが可能となる。
【0027】従って、文書画像のデータのファイリング
や、ハードコピーなどを行なうにあたっても、ユーザの
思うように編集したり、調整したりして最終利用に供す
ることができるようになり、新しい利用分野、応用分野
を開拓できることになる。
【0028】(より具体的な実施の態様1)以下、本発
明のより具体的な実施の態様の一例について、図面を参
照して説明する。
【0029】図1は本発明の実施の態様の一例を示すブ
ロック図である。図1において、101は画像入力部、
102は入力画像格納部、103は領域抽出部、104
は領域識別部、105は領域識別結果表示部、106は
領域編集部、107は出力画像生成部、108は出力画
像格納部、109は画像出力部である。
【0030】これらのうち、画像入力部101は画像デ
ータを入力するための装置であり、画像を読み取って画
像データ化するための装置であるイメージスキャナ等の
画像入力装置により、与えられた文書等の書類(内容が
記述された原紙)からの画像データを取り込むための装
置である。もちろん、画像入力部101は画像入力装置
そのものを含んだ構成であっても良いし、画像入力装置
により与えられた画像を取り込むだけの構成であっても
良い。
【0031】入力画像格納部102はデータを一時保持
するための記憶部であり、画像入力部101で読み取ら
れた画像データを一時的に記憶するために格納しておく
ものである。また、領域抽出部103は、入力画像格納
部102に格納された画像データに対して、文字や図形
等が物理的にあるいは論理的に連結されている各領域に
分割して抽出するといった処理を行なうものである。
【0032】領域識別部104は、詳細は後述するが領
域抽出部103において抽出された領域に対して、その
領域の位置、大きさ、形状等の特徴を計測して、領域の
種類あるいは重要度を識別するものである。
【0033】また、領域識別結果表示部105は、入力
画像格納部102に格納されている画像データに、領域
識別部104において識別された領域の識別情報を重ね
て、表示するものであり、領域編集部106は、領域識
別結果表示部105に表示された領域情報を編集および
修正するためのユーザインタフェースであり、出力画像
生成部107は、領域識別部104において識別された
領域情報あるいは領域編集部106において編集された
領域情報を用いて、入力画像格納部102に記憶されて
いる画像に変更を加えて出力画像を生成するものであ
る。
【0034】出力画像格納部108は、出力画像生成部
107において生成された出力画像を一時的に保存して
おくものであり、画像出力部109は、出力画像格納部
108において格納されている出力画像をプリンタや外
部記憶装置等に出力するものである。
【0035】図2は図1の構成の本発明装置の文書処理
手順の例を示すフローチャートである。このフローチャ
ートを参照しながら図1の構成図と合わせて本発明によ
る文書処理装置の処理の流れを次に説明する。
【0036】まず、書類の画像を画像入力部101によ
り取り込む(ステップST201)。すなわち、スキャ
ナ等の画像入力装置を利用して書類から画像を読み取
り、画像入力部101により画像データに変換してか
ら、入力画像格納部102に入力画像データとして一時
的に記憶しておく。
【0037】次いで、入力された画像データに対して
(入力画像格納部102に一時的に記憶された入力画像
データに対して)領域抽出部103は、文字や図形等が
物理的にあるいは論理的に連結されている単位を一つの
領域として抽出する(ステップST202)。なお、領
域抽出部103での具体的な処理の内容の詳細は、図3
を参照して後述する。
【0038】次に、この領域抽出部103で抽出された
領域に対して領域識別部104が、個々にその領域の画
像上の位置、大きさ、形状、構造、濃度分布等の特徴量
を計測し、予め定められたルールに従って領域の種類、
あるいは、文書上の重要度を識別する(ステップST2
03)。
【0039】抽出された全ての領域に対して識別処理が
終了すると(ステップST204)、これら識別された
領域情報を、モニタディスプレイ等の表示手段である領
域識別結果表示部105に表示する(ステップST20
5)。
【0040】ユーザはこれを参照して領域情報の編集作
業を行なう(ステップST206)。そして、ユーザの
領域情報の編集作業(ステップST206)に対して、
領域情報を更新し(ステップST207)、その更新に
従って領域情報の表示も変更する(ステップST20
5)。この手順はユーザの修正作業が終了するまで繰り
返し行われる(ステップST208)。
【0041】ユーザの修正作業が終了すると出力画像生
成部107において、出力画像生成が行なわれる(ステ
ップST209)。すなわち、編集後に、出力画像生成
部107において、修正が行われたなら修正された領域
情報を用いて、また、修正が行われなかったなら識別さ
れた領域情報を用いて、入力画像格納部102に記憶さ
れている画像に変更を加えて出力画像を生成する。
【0042】最後に、画像出力部109において、生成
された出力画像をプリンタや外部記憶装置等に出力し
(ST210)、一連の処理が終了する。
【0043】以上が本発明のシステムの大まかな処理動
作である。つぎに個々の要素の処理の詳細を説明する。
【0044】[領域抽出部103の処理の詳細]図3は
本発明の文書処理装置の領域抽出部103における一例
としての領域抽出処理の詳細を示すフローチャートであ
り、領域抽出処理図2に示したステップST202で行
われる処理のフローチャートである。
【0045】領域抽出処理を実施するために領域抽出部
103は、まず、入力された画像データ131(入力画
像格納部102にある1画面分(1頁分)の画像デー
タ)の全画素について2値化処理を行なう(ステップS
T301)。たとえば、2値化の閾値をTと予め設定し
ておき、この閾値T以下の画素値を持っている画素を
“1”、それ以外を“0”とする処理を行なう。すなわ
ち、文書画像上の黒っぽいところを“1”とし、それ以
外を“0”とする処理を行なう。
【0046】次に、2値化処理後の画素値が“1”であ
る画素に対してラベリング処理を行う(ステップST3
02)。この処理は画素値“1”の画素が互いに隣り合
っている、あるいは、連結している画素を一纏まりにす
る処理であり、その纏まり(連結成分と呼ぶ)毎に違う
値を持つように画素値を変換する。この処理は例えば、
文献“長谷川純一他共著「画像処理の基本技法<技法入
門編>」 技術評論社刊、1986,(pp.47〜49) ”に
示されている如き手法を用いることにより行える。
【0047】次いで、このラベリングされた画像に対し
て、2個以上の連結成分をさらに連結し、ひとつの連結
成分として融合する連結処理を行う(ステップST30
3)。
【0048】連結の方法は例えば次のようにする。
【0049】まず、抽出された連結成分から任意の2個
を取り出し、それらの間の距離を計測する。2つの連結
成分間の距離は画素間の最小距離とする。そして、この
計測された距離が予め設定された閾値Dよりも小さい場
合に、1つの連結成分として連結する。
【0050】領域抽出部103は以上の処理により、抽
出された連結成分の一つ一つを領域として出力し、領域
データ132とする。この領域データ132は領域識別
部104に渡されて領域識別の処理がなされることにな
る。
【0051】以上が領域抽出部103の処理の詳細であ
る。次に領域識別部104の処理の詳細を説明する。
【0052】[領域識別部104の処理の詳細]図4は
本発明の文書処理装置における領域識別部104での処
理である領域識別処理の詳細を示すフローチャートであ
り、図2における領域識別処理ステップST203での
処理の中身を示すフローチャートである。
【0053】領域抽出部103から領域データ132を
受け取ると領域識別部104では、まず、この抽出され
た全領域データ132のそれぞれに対して特徴量を計測
する処理を行なう(ステップST401)。
【0054】この特徴量の計測は、“画像上の位置”、
“領域の大きさ”、“領域の形状”、“領域の構造”、
“領域の濃度分布”のうち少なくとも1つである。これ
らの特徴量の計測方法の例を簡単に説明する。
【0055】“画像上の位置”は、個々の領域の中心位
置あるいは重心の計測によって求める。どちらも縦横の
方向の座標値によって与えることができる。
【0056】“領域の大きさ”は、縦横両方向の幅を計
測することで求める。そして、縦横の幅を掛合わせるこ
とで大きさが求まる。縦方向の幅は、領域内で最も上に
位置する画素の座標と最も下に位置する画素の座標との
差によって求める。また、横方向の幅は、領域内で最も
左に位置する画素の座標と最も右に位置する画素の座標
との差によって求める。
【0057】“領域の形状”は、例えば縦方向の幅と横
方向の幅の割合によって求めることができる。これによ
り、縦長の領域あるいは横長の領域、正方形に近い領域
などの特徴が得られる。
【0058】“領域の構造”は、縦横両方向の射影(プ
ロジェクション)を計測することにより求めることがで
きる。
【0059】“領域の濃度分布”は、領域内の画素の濃
度値ヒストグラムをとることによって計測する。この場
合は2値化前の画像データを参照して計測する。
【0060】以上の処理手法で特徴量を計測することが
できる。
【0061】特徴量の計測が終了したら、次に予め設定
しておいたルールを適応して“文字領域”、“タイトル
領域”、“下線領域”、“表領域”、“線図領域”、
“写真領域”、“グラフ領域”などの如き各種領域の種
類のうちのいずれの種類であるかを判定する(ステップ
ST402,ST403)。
【0062】この処理は例えば、図5に示されるような
ルールを設定しておき、これを参照して各領域の種類を
決定する。図5においてはルールのセット201は各領
域の種類毎に“位置”、“大きさ”、“形状”、“構
造”、“濃度分布”などの特徴量の範囲あるいは値が設
定されており、ここでは“文字領域”のルール202、
“タイトル領域”のルール203、“下線領域”のルー
ル204、“表領域”のルール205、“線図領域”の
ルール206、“写真領域”のルール207、“グラフ
領域”のルール208が登録されている。
【0063】これに他の領域のルールを加えることがで
きる。また、登録済みの領域でも2個以上のルールによ
って領域の種類を決定することもできる。なお、図5に
おいて「−」であらわされている項は特徴量計測の結果
を問わない部分である。例えば、“文字領域”を決定す
るルール202は、“画像上の位置”、“形状”、“濃
度分布”に関してはどんな値をとっても構わないが、
“大きさ”については縦方向の幅がAよりも大きく、B
よりも小さく、構造は均等である”という条件を満たし
ていれば、これは「“文字領域”である」、ということ
を意味する。
【0064】図5における各特徴量の値について簡単に
説明しておく。
【0065】まず、“位置”において「上部」は“画像
のT%よりも上にある”場合をいう。Tは設定値であ
り、たとえば20%と設定する。「内部」は“画像のふ
ちにない”ことをいう。“ふち”とは、ある設定値Uを
定めたとき、画像の隅からU%以内の範囲をいう。設定
値Uはたとえば10%と設定しておくが、画像データ上
の濃い画素の分布を射影(プロジェクション)の計測に
より求め、Uの値を文書(書面)毎に変化させても良
い。
【0066】“大きさ”においては、図5では縦方向の
幅yのみを指定しているが、横方向の幅xを同時に設定
することもできる。文書画像のサイズから設定値A,
B,C,D,Eが自動で求まるようにする。それぞれの
設定値は画素数で評価する。
【0067】形状において、「横長」は“横方向の幅が
縦方向の幅のV倍よりも大きい”場合をいう。例えば、
設定値Vを“2”としておく。同様に「縦長」を定義で
きる。このとき、V≧1である。
【0068】「方形」は“横長でもなく、縦長でもな
い”状態をいう。すなわち、横方向の幅が縦方向の幅の
V倍以下であり、かつ、1/V倍以上である場合をい
う。
【0069】構造において、「均等」は“射影がほぼ均
等である”状態をいう。「変化等間隔」は“射影に際立
った変化があるもので、細いピークがある間隔毎にあ
る”状態をいう。「変化大」は“射影に際立った変化が
あるもので、非常に細いピークがある”状態をいう。
「変化あり」は“射影に際立った変化があるもので、ピ
ークに特徴がない”状態をいう。
【0070】濃度分布において、「濃淡」は“濃淡の変
化がある”状態であり、「なし」は“濃淡の変化がな
い”状態である。
【0071】以上により、各領域毎に計測された特徴量
から各領域の種類を識別することができるが、予め設定
されているルール201により識別できなかった領域を
“雑音領域”とすることもできる。
【0072】また、識別された領域の種類により、各領
域の文書での“重要度”を点数化することができる(ス
テップST404)。たとえば“文字領域”であれば重
要度は“8”、“タイトル領域”であれば重要度は“1
0”、“下線・線領域”であれば重要度は“5”といっ
た具合に目的対応に適宜設定ができる。ここで重要度は
点数が高いほど重要であるとする。同じ種類の領域であ
ると判断されても、領域の大きさなどの特徴量で重要度
を変化させることもルールを増やすことによって可能で
ある。
【0073】特に図5のルールに示されなかった“雑音
領域”については、重要度を低い点数に割り当てること
ができ、領域が持つ特徴量によりその点数を“0”〜
“4”程度に広がりを持たせることができる。たとえば
画像の位置が隅にあるものは重要度“1”、大きさがか
なり小さいものは重要度“0”というように設定ができ
る。この設定も図5でのルールと同様なルールを設定し
ておくことにより実現できる。
【0074】以上により、領域情報データ133として
領域の特徴量に加えて領域の種類と領域の重要度を求め
ることができる。例えば、識別された領域情報は図6の
ようなテーブル251を用意しておき、領域の特徴量
(図6では縦横の位置、大きさのみであるが計測された
特徴量すべて)とともに、識別された領域の種類と重要
度を管理しておくことができる。
【0075】以上が領域識別部104の処理の詳細であ
る。次に領域識別結果表示部105の処理の詳細を説明
する。
【0076】[領域識別結果表示部105の処理の詳
細]図7は本発明の文書処理装置に入力される一例とし
ての文書画像の例である。ここでは文書画像501とし
てアンダーラインが引かれた文書タイトルと文章部分、
図表とが描かれているものを示してある。
【0077】このような文書画像501を画像入力部1
01より取り込み、入力画像格納部102に一時保持さ
せたとし、そして、領域抽出部103にてこれについて
領域抽出したとする。その結果は、例えば図8の如きと
なり、このような領域抽出して得られた画像がディスプ
レイの画面に出力されて表示されることになる。
【0078】すなわち、図8は本発明の文書処理装置に
おける領域識別結果表示部105で領域情報表示処理
(図2の領域情報表示処理ステップST205での処
理)された内容によってCRTや液晶表示板等のディス
プレイの画面に出力される領域情報501aであり、領
域別に区切られた画像が画面表示される。
【0079】すなわち、図7に示される文書画像501
が入力され、これが領域抽出処理において、図8に示す
ように502から506までの5つの領域が存在すると
認識されたとする。このとき、領域識別結果表示部10
5ではそれぞれの領域を矩形枠で囲んだ形でディスプレ
イに画像を表示させる。この表示は図6に示すような認
識された領域情報が格納されているテーブルを参照して
行われる。
【0080】このとき、領域識別結果表示部105では
重要度が“3”以下のものは領域情報を表示させない等
の設定が可能であり、また、このとき領域を示す矩形枠
の情報のみを表示したり、矩形枠の情報と一緒に入力画
像情報(文書画像501)を重ねて図8のように表示す
ることもできる。
【0081】また、領域識別結果表示部105では設定
により、矩形枠の表示は行わないで、画像情報(文書画
像501)そのものを領域毎に異なる色で着色表示する
ようにすることもでき、このようにすることにより、領
域情報を色分け表示することもできる構成である。
【0082】ここで、矩形枠の表示あるいは画像情報の
色分け表示において、領域の種類によって色分けを行う
ようにすれば、領域の種類の情報を言葉で表示せずと
も、領域の種類情報をユーザに知らせることができる利
点がある。
【0083】例えば、“タイトル領域”の表示色は赤、
“テキスト領域”の表示色は緑、“線図領域”の表示色
は青、“ページ番号領域”の表示色は紫と設定した場合
において、領域502はタイトル、領域503はテキス
ト、領域504はテキスト、領域505は線図、領域5
06はページ番号と識別されていたとすると、領域50
2から506までの矩形枠あるいは画像情報の色をそれ
ぞれ赤、緑、緑、青、紫などなり、これらの色から領域
の種別をユーザは認識可能となる。
【0084】以上が領域識別結果表示部105の処理の
詳細である。次に領域編集部106における領域情報編
集処理の詳細を説明する。
【0085】[領域編集部106における領域情報編集
処理の詳細]図9、図10は本発明の文書処理装置の領
域編集部106での領域情報編集処理の内容を示してお
り、図2のステップST206において行われる領域情
報の編集処理の状況の説明図である。
【0086】領域編集部106はライトペンやマウスな
どのポインティングデバイスによりユーザがディスプレ
イの画面上で指示する領域を、これもまたユーザの指示
する“領域削除”、“領域統合”、“領域分割”、“領
域種別変更”の指令に応じて“領域削除”、“領域統
合”、“領域分割”、“領域種別変更”などの編集作業
を実施する。
【0087】すなわち、ユーザはディスプレイの画面に
表示された図8に示される如き画面501aを見ながら
上述の如きポインティングデバイス等を使用して、領域
の位置を指定する。そして、指定した領域に対して削除
や分割や統合、あるいは、領域の種類の変更等の作業内
容を指示することで、その指定した領域に対する削除や
領域の分割や統合、あるいは、領域の種類の変更をはじ
めとして、表示されている領域情報を様々に編集するこ
とができる。
【0088】例えば、図9は領域情報501aに対して
ページ番号の領域506を指定し、削除する編集処理を
実行することにより得られた結果としての編集済み表示
画面501bである。また、図10は領域情報501a
に対してタイトルの領域502を指定し、タイトルの文
字部分の領域502aと下線部分の領域502bに領域
分割する編集処理を実行することにより得られた結果と
しての編集済み表示画面501cである。
【0089】実際には図6に示すような領域情報が格納
されているテーブルを書き換えることにより、編集が行
われる。例えば、領域の削除の編集処理では該当する領
域の重要度をより低く設定することで行われる。分割で
はひとつの領域情報が2つの領域情報として分割され
る。統合では2つ以上の領域情報が1つの領域情報とし
てまとめられる。領域の種類の変更では該当する領域の
種類の項が変更される。その他、領域の位置、大きさの
変更なども同様に行わうことができる。
【0090】このような機能を実施することで、領域編
集部106は領域情報編集処理を実現する。
【0091】図11は本発明の一例としての文書処理装
置の領域編集部106での領域情報編集処理(図2のス
テップST206での処理)を行うためのユーザインタ
フェースの例である。
【0092】文書処理装置にはユーザが装置を操作する
ための操作パネルがあるが、この操作パネルに領域情報
編集処理のためのユーザインタフェースが取り付けられ
る。すなわち、図11において301は操作パネルであ
り、ディスプレイとしての液晶表示部302と各種操作
キー304〜308が設けられており、さらに操作パネ
ル301にはペン入力デバイス303が設けられてい
る。
【0093】すなわち、このユーザインタフェースは文
書処理装置の操作パネル301の一部に付けられたもの
で、液晶表示部302にペン入力デバイス303、数個
のボタン304〜308が用意された構成となってお
り、そして、液晶表示部302には、領域識別結果表示
部105における領域識別結果表示処理(図2でのST
205の処理)での表示機能との絡みで、領域情報が表
示され、編集結果が表示される構成である。ボタン30
4〜308は液晶表示部302内に仮想的に作成するこ
ともできる。この場合はペン入力デバイス303により
操作することになる。
【0094】このような構成において、ユーザはボタン
304〜306を押すことによって編集機能を選択する
ことができる。そして、例えば、削除ボタン304が押
された状態では、ボタン304にランプがついて現在、
削除モードであることがわかるようになっている。この
削除モードにおいて、ユーザが液晶表示部302に表示
されている領域情報のうちの1つをペン入力デバイス3
03で指定することによって、図9で説明したような削
除処理を領域編集部106が行うことになり、ユーザは
所望のように削除処理をすることができる。
【0095】この削除モードは、他のボタンが押される
まで継続される。分割ボタン305が押されると、領域
の分割モードに切り替わり、領域編集部106は領域分
割処理をするモードになる。このモード時では指定され
た領域は分割処理が行われることになるので、ユーザの
所望のように指定領域を分割することができる。
【0096】この分割処理はその対象領域に対して図3
におけるラベリング処理(ステップST302)、連結
処理(ステップST303)を再度行うものである。こ
のとき、連結処理(ステップST303)において連結
させる距離を小さくして領域統合を行うことにより、結
果的に領域を分離させることができる。
【0097】また、統合ボタン306が押されると複数
領域の統合モードに切り替わり、領域編集部106はユ
ーザの指定した複数領域を統合する。つまり、統合モー
ドにおいては、ユーザがペン入力デバイス303で指定
した領域をすべて一つの領域に統合するように処理す
る。領域統合は統合モードを解除するまで続けられる。
終了ボタン307と取消ボタン308は特殊機能であっ
て、編集終了後は終了ボタン307を押すことによって
編集処理を終えることができる。また、操作を誤った場
合は取消ボタン308を押すことによって既に行われた
編集処理を無効にすることができる。
【0098】以上により、入力された文書画像に対し
て、入力画像に含まれる領域情報を自動的に識別し、そ
れをユーザに提示することで編集を容易にし、また、編
集を可能にすることで自動識別が失敗した場合において
もそれを容易に修正することが可能となる。
【0099】次に出力画像生成処理を説明する。
【0100】[出力画像生成部107での処理の詳細]
図12は本発明の1例としての文書処理装置の出力画像
生成部107の出力画像生成処理を示すフローチャート
であり、図2のステップST209で行われる処理の詳
細を示すフローチャートである。このフローチャートに
沿って説明する。
【0101】出力画像生成処理においては、出力画像生
成部107はまず、入力画像格納部102に保存されて
いる入力画像のサイズ、解像度などの情報を読み込む
(ステップST501)。この情報に応じて出力画像格
納部108に出力画像用のエリアを割り当てる(ステッ
プST502)。ついで、図6に示すような領域情報を
読み込んで(ステップST503)、領域毎に入力画像
から出力画像へ画像データの複写を行い、これをすべて
の領域の処理が終了するまで続ける(ステップST50
4)。
【0102】画像データの転送は次のように行われる。
【0103】まず、入力画像格納部102から領域の範
囲に位置する入力画像データを読み込んでくる(ステッ
プST505)。次にこの画像データに対して2値化な
どの濃度変換処理を行って(ステップST506)、出
力画像データとして出力画像格納部108に処理済みデ
ータ書き込む(ステップST507)。濃度変換処理
(ステップST506)は該当する領域の種類、重要度
によって濃度の変換値を変化させて実施することができ
る。例えば重要度の情報を利用して、重要度“5”以下
は濃度値を“0”として出力したり、といった具合であ
る。
【0104】また、該当する領域の種類によって、濃度
変換の手法を変えることができる。例えば、テキストや
タイトルの領域では2値化を行ない、写真領域では濃淡
レベルのまま出力し、また、出力画像を濃淡レベルで出
力する場合では重要度が低いとき、出力される濃度が薄
くなるように濃度変換を加えるといった具合であり、設
定により、このような様々な濃度変換をすることが可能
である。
【0105】なお、この出力画像生成処理(ステップS
T209)では、入力画像格納部102と出力画像格納
部108を別々のエリアとして説明しているが、これを
同じエリアに割り当てておいても良い。この場合、出力
画像エリアの割り当て処理(ステップST502)は省
略できる。また、濃度変換処理(ステップST506)
で変換が不要な領域についてはデータの読み込み処理
(ステップST505)およびデータの書き込み処理
(ステップST507)が省略できる。
【0106】このように、本システムは、書類の画像を
画像入力部101により取り込み、これを入力画像格納
部102に入力画像データとして一時的に記憶し、次い
で、この一時記憶された画像データに対してデータの状
況から領域抽出部103により文字や図形等が物理的に
あるいは論理的に連結されている単位を一つの領域とし
て抽出し、次に、この抽出された領域に対して領域識別
部104が、個々にその領域の画像上の位置、大きさ、
形状、構造、濃度分布等の特徴量を計測し、その計測結
果を、予め定められたルールに基づいて識別することに
より、各領域の種類、あるいは、文書上の重要度を識別
する。
【0107】そして、これら識別された領域情報を、モ
ニタディスプレイ等の表示手段である領域識別結果表示
部105に表示し、編集モードにすることで領域編集部
106によりユーザは前記表示内容を参照しながら領域
情報の編集作業を行なうことでユーザの思うように領域
情報の編集を行なうことができ、その編集の結果を画像
データとして出力するようにしたものである。
【0108】このように本発明システムにより、入力さ
れた文書画像に対して、入力画像に含まれるタイトル領
域、文章領域、図表領域、頁領域、写真領域などの如き
種別の異なる画像要素を区別して領域として抽出し、そ
れぞれの領域に対して予め設定したルールに従い、文書
としての重要度を識別し、あるいはその結果を修正する
ことにより、例えば、文書中のテキストや図表といった
必要な領域のみを残し、書き込みやノイズといった必要
でない領域を削って出力するなど、必要な部分と不必要
な部分を適確に分離して扱うことが可能となる。
【0109】従って、文書画像のデータのファイリング
や、ハードコピーなどを行なうにあたっても、ユーザの
思うように編集したり、調整したりして最終利用に供す
ることができるようになり、新しい利用分野、応用分野
を開拓できることになる。
【0110】以上は文書画像のデータの取り込み、領域
抽出、領域の識別、編集、最終画像の出力といった構成
として、ハードコピー出力装置や画像ファイリング装置
のインタフェース等に適用するに最適な基本構成として
のシステム構成例を説明した。
【0111】次に文書画像のデータの取り込み、領域抽
出、領域の識別、編集、最終出力画像の蓄積といった機
能を持たせ画像ファイリングシステムとしての具体的な
適用例を説明する。
【0112】(より具体的な実施の態様2)図13は本
発明の第2の実施の態様に係わる文書処理装置の構成図
である。
【0113】この図において出力画像データをファイル
として蓄積する画像ファイリングシステムについて説明
する。この例は基本的には図1の構成に、さらに画像蓄
積部110を付加したものである。
【0114】図13に示すように、本装置は画像入力部
101、入力画像格納部102、領域抽出部103、領
域識別部104、領域識別結果表示部105、領域編集
部106、出力画像生成部107、出力画像格納部10
8、画像出力部109、画像蓄積部110から構成され
る。
【0115】画像入力部101はスキャナ等の画像入力
装置により、与えられた文書等の書類から画像を読み取
るものである。入力画像格納部102は、画像入力部1
01で読み取られた画像データを一時的に記憶するため
に格納しておくものである。
【0116】領域抽出部103は、入力画像格納部10
2に格納された画像データに対して、文字や図形等が物
理的に、あるいは論理的に連結されている各領域に分割
して抽出するものである。
【0117】領域識別部104は、領域抽出部103に
おいて抽出された領域に対して、その領域の位置、大き
さ、形状等の特徴を計測して、領域の種類あるいは重要
度を識別するものである。
【0118】領域識別結果表示部105は、入力画像格
納部102に格納されている画像データに、領域識別部
104において識別された領域の識別情報を重ねて、表
示するものである。
【0119】領域の位置、大きさ、形状等の特徴を計測
して、領域の種類あるいは重要度を識別するものであ
る。
【0120】領域識別結果表示部105は、入力画像格
納部102に格納されている画像データに、領域識別部
104において識別された領域の識別情報を重ねて、表
示するものであり、領域編集部106は、領域識別結果
表示部105に表示された領域情報を編集および修正す
るためのユーザインタフェースである。
【0121】出力画像生成部107は、領域識別部10
4において識別された領域情報あるいは領域編集部10
6において編集された領域情報を用いて、入力画像格納
部102に記憶されている画像に変更を加えて出力画像
を生成するものである。また、出力画像格納部108
は、出力画像生成部107において生成された出力画像
を一時的に保存しておくものである。画像出力部109
は、出力画像格納部108において格納されている出力
画像を画像蓄積部110に出力するものである。
【0122】画像蓄積部110は、画像出力部109に
おいて出力された画像データをファイルとして蓄積して
おくものであり、これが画像ファイリング装置として新
たに加わった要素である。
【0123】このような構成において、画像入力部10
1、入力画像格納部102、領域抽出部103、領域識
別部104、領域識別結果表示部105、領域編集部1
06、出力画像生成部107、出力画像格納部108、
画像出力部109での作用は、より具体的な実施の態様
1のところで説明したものと変わりはない。
【0124】従って、その処理の詳細は先の説明を参照
することとし、ここでは異なる部分のみ説明する。但
し、ここで説明する例においては、出力画像生成部10
7における処理機能として、領域毎にファイルを分割し
て保存できる機能を設けるようにして良い。
【0125】図14は本発明の具体的な実施の態様2に
係わる文書処理装置の出力画像生成部107における出
力画像生成処理(図2のステップST209での処理)
での具体的手順を示す処理フローである。
【0126】このフローチャートを参照して説明する
と、出力画像生成部107ではまず、図6に示すような
領域情報を読み込む(ステップST601)。そして、
読み込んだ領域の数だけ出力画像データを生成する。全
ての領域について画像データの生成が終了したならば
(ステップST602)、出力画像生成処理(ST20
9)を終了する。
【0127】[各出力画像データの生成]各出力画像デ
ータの生成は次のように行われる。
【0128】まず、該当する領域の出力画像への生成が
必要であるかを検査する(ステップST603)。ここ
では領域の重要度の情報より、例えば領域の重要度が
“3”未満であれば“生成必要なし”とし、重要度
“3”以上の領域のみについて出力画像を生成する(ス
テップST604)。
【0129】このようにして領域の重要度の情報より
“生成必要あり”と判断された領域に対して出力画像デ
ータの生成を行う。
【0130】次に、該当する領域のサイズに基づいて出
力画像格納部108に出力画像エリアの割り当てを行う
(ステップST603)。次に、入力画像格納部102
から領域の範囲に位置する入力画像データを読み込んで
くる(ステップST604)。この画像データに対して
出力画像エリアに収まるように座標変換を行った上で
(ステップST605)、2値化などの濃度変換を行っ
て(ステップST606)、出力画像データとして出力
画像格納部108に書き込む(ステップST607)。
【0131】ここで、それぞれの出力画像データに図6
で示したような領域情報の一部あるいは全部と、どの入
力画像から得られた画像データであるかを示す情報から
なる属性とを設定しておく(ステップST608)。座
標変換処理(ステップST605)あるいは濃度変換処
理(ステップST606)は該当する領域の種類、重要
度によって変化させて行うことができ、例えば、重要度
を利用して、重要度“5”以下はサイズを縮小して出力
画像データを生成するようにしたりする。
【0132】また、該当する領域の種類によって、濃度
変換の手法を変えることができる。例えば、テキストや
タイトルの領域では2値化を行うようにしたり、写真領
域では濃淡のまま出力するようにしたり、出力画像を濃
淡レベルで出力する場合では重要度が低いとき、出力さ
れる濃度が薄くなるように濃度変換を加えるようにした
りする等が可能である。
【0133】図15は、図14に示される処理手順によ
って、図7に示される文書画像データ501を図9に示
される領域情報501bを使って処理した結果、得られ
た出力画像群502〜505を示した図である。
【0134】図15(a)〜(d)に示すように、これ
らの出力画像群502〜505は、画像出力部109に
よる画像出力処理(ステップST210)によってプリ
ンタなどの画像出力装置あるいはハードディスクなどの
画像蓄積装置110に出力されることになる。
【0135】以上、説明したように本発明のより具体的
な実施の態様2の例の構成により、入力された文書画像
に対して、入力画像に含まれる要素を領域として抽出
し、それぞれの領域に対して文書としての重要度を識別
あるいは修正することにより、必要な部分のみを要素毎
に独立のデータとして保存しておくことができる。これ
により保存したデータを別の文書の作成時に再利用する
ことができる。同時に、必要な部分のみを保存しておく
ため、保存領域の節約にも効果をあげることができる。
【0136】要するに、ここに示した1例としての本シ
ステムは、書類の画像を画像入力部101により取り込
み、これを入力画像格納部102に入力画像データとし
て一時的に記憶し、次いで、この一時記憶された画像デ
ータに対してデータの状況から領域抽出部103により
文字や図形等が物理的にあるいは論理的に連結されてい
る単位を一つの領域として抽出し、次に、この抽出され
た領域に対して領域識別部104が、個々にその領域の
画像上の位置、大きさ、形状、構造、濃度分布等の特徴
量を計測し、その計測結果を、予め定められたルールに
基づいて識別することにより、各領域の種類、あるい
は、文書上の重要度を識別し、そして、これら識別され
た領域情報を、モニタディスプレイ等の表示手段である
領域識別結果表示部105に表示し、編集モードにする
ことで領域編集部106によりユーザは前記表示内容を
参照しながら領域情報の編集作業を行なうことでユーザ
の思うように領域情報の編集して各領域の画像を更新す
ることができるようにし、その編集の結果の更新画像を
含め、書類の入力画像を領域別の画像データとして分け
て出力し、画像蓄積部110に別々にファイルすること
ができるようにしたものである。
【0137】このように本発明システムにより、入力さ
れた文書画像に対して、入力画像に含まれるタイトル領
域、文章領域、図表領域、頁領域、写真領域などの如き
種別の異なる画像要素を区別して抽出し、これを領域別
に編集して更新することができると共に、更新結果の画
像を含め各領域の画像を分離して各別にファイルするこ
とができるようにしたことにより、文書画像のデータの
ファイリングと、後のファイルの利用の道に汎用性を持
たせることができるようになり、データベースとしての
応用が広がる。また、それぞれの領域に対して予め設定
したルールに従い、文書としての重要度を識別し、ある
いはその結果を修正することができるようにしたことに
より、必要な部分と不必要な部分を的確に分離して扱う
ことが可能となり、整理されたファイルを収集できるよ
うになる。
【0138】従って、文書画像のデータのファイリング
や、ハードコピーなどを行なうにあたっても、ユーザの
思うように編集したり、調整したりして最終利用に供す
ることができるようになり、新しい利用分野、応用分野
を開拓できることになる。
【0139】以上は文書画像のデータの取り込み、領域
抽出、領域の識別を行い、領域抽出された文書画像と識
別情報とを用いて、ユーザによる編集を行い、最終画像
の出力を得るようにするといった構成として、ハードコ
ピー出力装置や画像ファイリング装置のインタフェース
等に適用するに最適な基本構成としてのシステム構成例
を説明した。
【0140】しかし、文書画像によつては、ユーザによ
る編集作業を行わなくとも、領域識別の結果をもとに領
域分割、座標変換、濃度変換などのいずれかの処理を行
った後、文書画像のデータのファイリングやハードコピ
ーなどを行うことで不要な領域部分を除外して必要領域
のみを最適な状態でファイリングしたり、ハードコピー
などを行うことも可能である。
【0141】例えば、雑音領域と識別された領域に、雑
音成分以外の領域が接している場合、それらを分離し、
別々のものとして扱ったり、または入力画像中に含まれ
る雑音領域が大きい場合、その領域を削除し、更には必
要とされる文書領域を出力画像の大きさに合わせるなど
ということを行うことによって、出力画像の品質の向上
が見込まれ、ひいてはファイリング後のユーザによる編
集作業の軽減にもつながる。
【0142】これを実現する構成の−例を、より具体的
な実施の態様3として説明する。
【0143】(より具体的な実施の態様3)以下、本発
明の実施の態様3について、図面を参照して説明する。
この例は、文書のデータの取り込み、領域柚出、領域識
別、出力画像生成といった機能を持ち、領域識別には原
稿の縁等に現れた枠状あるいは帯状の雑音領域を認識し
て、これを他と区別する機能を持たせ、この雑音領域を
除外したものについて、出力として文書画像のハードコ
ピーやファイリングを行うものである。原稿の縁に雑音
領域が現れるケースは、例えば、原稿や本を複写機によ
りコピーして得た原稿あるいはスキャナーで読み取った
原稿が、複写機やスキャナーの用紙サイズより狭い場合
や、これらに原稿セットするに際して、位置がずれたり
した場合などにおいて、読取り領域の端に原稿の存在し
ない部分が生じてこの部分が黒やグレーの帯状あるいは
枠状の不要像として現れることがある。これは本来無用
のものであり、また、残すと見苦しいものであり、文書
画像のハードコピーを出力する場合にはトナー等の浪費
に繋がり、文書画像のファイリングにあっては、ファイ
ル容量を増やして、記憶資源の無駄使いになる。このよ
うな不都合の改善に、実施の態様3は役立つ。
【0144】この場合の文書処理装置の構成図は、図1
3に示したものと同じである。但し、領域識別部104
で識別された領域情報はユーザに表示して、編集モード
に入り、雑音領域として認識された部分の除去が指示さ
れれば、そこが除去修正された画像データを出力画像生
成部107において生成し、画像蓄積部110に保存す
るようにした画像ファイリングシステムとしてある点が
異なる。
【0145】そして、領域識別部104に持たせる知識
ベースに、黒枠雑音領域や外縁雑音領域の認識のための
知識情報を追加してある。図16にこの例で用いる知識
ベースのルール内容を示す。図16の例では、図5で説
明したものにさらに黒枠雑音領域209、外縁雑音領域
210の知識を付加したものである。
【0146】つまり、黒枠雑音領域209のルールにお
いては、“位置”は「内部」とする。これは、領域の中
心位置または重心が画像上において中心部付近に存在す
るとを意味する。
【0147】“大きさ”においては入力文書画像のサイ
ズに近い値となる。“形状”は入力文書画像のサイズに
近いので、“横長でもなく、縦長でもない”状態の「方
形」とする。“構造”においては、斜影が縦横とも両端
に際だったピークを持つので、「変化大」とする。“濃
度分布”においては、濃淡の変化がないので「なし」と
する。この条件を満たせば黒枠雑音領域である。
【0148】また、周辺雑音領域210のルールにおい
て、“位置”は原稿の端であり、“大きさ”については
横方向の場合にその幅xが設定値Waに誤差分としてw
a なるマージンを持たせた範囲内、縦方向の場合にはそ
の幅yが設定値Haに誤差分としてha なるマージンを
持たせた範囲内の少なくともいずれかを満たし、“形
状”は不定とし、“構造”は変化ありとし、“濃度分
布”は不定として、この条件に合うものを外縁雑音領域
とする。
【0149】なお、図5での説明と同様に、文書画像の
サイズから設定値Wa,Haは自動で求まるようにす
る。
【0150】以下、動作の詳細を、例をあげて説明す
る。図17は本発明の文書処理装置に入力される一例と
しての文書画像の例である。文書画像の構成は、図7に
示されているような文書画像に見出し703が存在し、
さらに文書領域の外側に黒枠状の雑音領域702が存在
し、全体として入力文書画像701となるようなものを
示してある。
【0151】この黒枠状の雑音領域702は、複写機等
で複写した際に生じるものであってもよい。この例の場
合、見出し部分703と黒枠状の雑音領城702は接触
しているため、領域抽出部103において、一つの領域
として抽出されることが予想される。そこで、このよう
な領域を領域識別部104における図16に示されるよ
うなルールに予め設定しておき、他の雑音成分と分離し
ておくことが可能である。黒枠雑音領域に対する対応を
例に説明する。黒枠雑音領域の検出の具体的なルールと
しては、209のような設定で行える。
【0152】これは、領域の中心位置または重心が画像
上において中心部付近に存在するので、“位置”の条件
は「内部」であり、“大きさ”は入力文書画像のサイズ
に近い値となる。そして、“形状”は入力文書画像のサ
イズに近いので、“横長でもなく、縦長でもない”状態
の「方形」であり、“構造”は、斜影が縦横とも両端に
際だったピークを持つので、「変化大」である。また、
“濃度分布”は、濃淡の変化がないので「なし」であ
る。
【0153】以上のようなルールを予め設定しておき、
これに該当する領域を“黒枠雑音領域”と登録してあ
り、また、重要度は雑音領域であることから、低い値、
例えば、“1”を与えておく。
【0154】このようにすることで、前述の実施の態様
1や態様2における領域識別結果表示部105や領域編
集部106などにおいても、他の雑音領域と同様に扱う
ことが可能である。
【0155】まず、黒枠雑音領域として識別された領域
に対してのみ、縦横両方向の射影(プロジェクション)
を計測する。これは領域識別の“構造”を決める際に、
求めた射影の結果を使用してもよい。
【0156】図18は、図17に示した文書画像の例7
01の黒枠雑音領域702に対してのみ、縦横両方向の
射影を計測した結果である。ドット数計数を行うことに
より得た縦横射影計測結果としてのプロファイルは、そ
れぞれ704、705に示す如きとなる。見出し部分7
03は領域抽出部103の出力結果では、黒枠雑音領域
と接触しているため、黒枠雑音領域の一部として識別さ
れる。
【0157】そこで、領域識別部104において、この
射影の計測結果を利用して黒枠雑音領域702と見出し
部分703の領域分割を行う。射影704の結果、射影
のピーク値lに対し、見出し部分ではm、それ以外では
nとなったとする。また、射影705の結果、射影のピ
ーク値oに対し、見出し部分ではp、それ以外ではqと
なったとする。
【0158】その時、ピーク値lに対し、(m−n)の
値が1/α倍以上または、ピーク値oに対し、(p−
q)の値が1/α倍以上であれば、そこに領域分割すべ
き部分が存在すると識別される。このαは入力文書のサ
イズなどから自動的に設定されてもよい。
【0159】次に領域分割すべき部分が存在すると識別
された場合、領域分割する位置の推定を行う。射影70
4の位置gにおいて射影値が大きく変化し、さらに位置
hで値が変化していることから、g−h間を分割すべき
領域とする。また同様に、射影705の位置jにおいて
射影値が大きく変化し、さらに位置iで値が変化してい
ることから、i−j間を分割すべき領域とする。これよ
り分割領域は位置g,h,i,jで囲まれた領域と推定
される。
【0160】従って、この領域を黒枠雑音領域702と
分割することで、見出し預域703が得られることにな
る。
【0161】[出力画像生成処理]次に、この具体的な
実施の態様3における出力画像生成処理について説明す
る。図19は、文書処理装置の出力画像生成部107に
おける出力画像生成処理での具体的手順を示す処理フロ
ーである。
【0162】このフローチャートに従って説明すると、
出力画像生成部107ではまず、入力画像格納部102
の保存されている入力画像のサイズ、解像度などを読み
込む(ステップSΤ801)。この情報に応じて出力画
像格納部108に出力画像用のエリアを割り当てる(ス
テップSΤ802)。次に図6に示すような領域情報な
どを読み込む(ステップST803)。
【0163】この領域情報に“黒枠雑音領域”が含まれ
ているか検索し(ステップST804)、その結果、も
し存在する場合は文書領域推定処理(ステップSΤ80
5)行う。この文書領域推定とは、文書画像に含まれる
“黒枠雑音領域”の情報を用いて、文書画像での必要と
される領域を推定することである。
【0164】その後、領域毎に入力画像から出力画像へ
画像データの複写を行い、これをすべての領域の処理が
終了するまで続ける(ステップSΤ806)。文書領域
の推定は次のように行われる。
【0165】まず、黒枠雑音領域として識別された領域
に対してのみ、縦横両方向の射影(プロジェクション)
を計測する。この射影は領域識別の“構造”を決める際
に求めたもの、または領域分割で分割位置の推定する際
に求めたものを使用してもよい。
【0166】図20は、図17に示した文書画像の例の
黒枠雑音領域702に対してのみ、縦横両方向の射影を
計測した結果である。なお、見出し領域703は、既に
分離が終了しているものとする。
【0167】黒枠雑音領域702に対してのみ射影を計
測すると、それぞれ、706、707の様な結果が得ら
れる。次に、それぞれの射影のビークを求める。ピーク
はどちらも文書領域の外側に存在するので、それぞれの
ピークの内側領域を文書領域708として推定する。
【0168】具体的には、文書領域708の座標値によ
って文書領域情報を管理することができる。画像データ
の転送は次のように行われる。まず、入力画像格納部1
02から領域の範囲に位置する入力データを読み込んで
くる(ステップST807)。
【0169】次に、この画像データに対して座標変換処
理(ステップST808)および濃度変換処理(SΤ8
09)を行う。これは、該当する領域の種類、重要度に
よって座標位置を変換したり、濃度の変換値を変化させ
る処理である。これにより、例えば、黒枠雑音領域は重
要度が低いので、濃度値を“0”にして出力するといっ
たことが行える。
【0170】また、文書領域推定処理(ST805)で
推定された文書領域を、出力画像サイズに合わせること
ができる。つまり、黒枠雑音領域は濃度変換処理(ST
808)で濃度値が“0”となるので、そのままの出力
では空白領域となる。
【0171】そこで、文書と推定された領域を出力画像
サイズに合わせる、つまり、座標変換処理(ステップS
T808)による拡大処理を行うことにより、より品質
の高い出力画像が得られる。その際、文書領域内であっ
ても、重要度が低い頒域、つまり、雑音と識別されたも
のは濃度変換により濃度値を“0”とすることができ
る。
【0172】逆に、出力画像サイズを文書領域推定処理
(SΤ805)で推定された文書領域の大きさに合わせ
ることも可能である。この場合、出力画像領域等のコス
トの削減につながる。
【0173】出力画像データ書き込み(ST810)以
降の処理は、前述した具体的な実施の態様1と同様であ
るので省略する。
【0174】図21は、図19に示される処理手順によ
つて、図17に示される文書画像データ701を処理し
た結果、得られた出力画像を示した図である。図21に
示す出力結果は、画像出力部109による画像出力装置
あるいはハードディスクなどの画像蓄積装置110に出
力されることになる。
【0175】以上、この具体例は、領域抽出手段によ
り、画像データとして読み込まれた文書画像から、関連
するひとまとまりの領域を抽出し、この領域抽出手段に
より抽出された領域をその特徴量により領域識別手段に
て分類および分割し、また、出力画像生成手段にて前記
領域識別手段の識別した結果に応じて出力画像を生成す
ると共に、この出力画像生成手段により生成された画像
を画像出力手段に出力し、また、前記画像出力手段によ
り出力された画像を画像蓄積手段に蓄積するようにした
ことを特徴とする文書処理装置である。
【0176】そして、このような装置構成によれば、入
力された文書画像に対して、入力画像に含まれる要素を
領域として抽出し、それぞれの領域に対して文書として
の重要度を識別し、更に黒枠雑音領域から得られる情報
を利用して、黒枠雑音領域に接触している領域を自動的
に分割し、文書領域と推定される部分を出力画像サイズ
に合わせることが可能となる。また、文書画像に現れた
枠状の雑音領域を除外することにより、ハードコピーを
出力するに当たり、トナー等の無用な消費を抑制でき、
また、ファイリングするに当たっては無用なデータを除
外できるので、その分、記憶資源の有効利用を図ること
ができるようになる。
【0177】従って、この構成および処理によれば、ユ
ーザによる編集作業を行わなくとも、雑音成分と接触し
ている雑音成分以外の領域を分割し、さらに雑音領域を
消し、無駄の少ない出力画像が得られる。
【0178】以上は文書画像のデータの取り込み、領域
抽出、領域の識別、編集、最終画像の出力といった構成
として、ハードコピー出力装置や画像ファイリング装置
のインタフェース等に適用するに最適な基本構成として
のシステム構成例を説明した。
【0179】しかし、ユーザによる編集や調整は、時と
して煩わしいものであり、これらの機能を付加しなくと
も文書画像のデータのファイリングや、ハードコピーな
どを行なうことは可能である。その構成を次により具体
的な実施の態様4として説明する。
【0180】(より具体的な実施の態様4)以下、本発
明のより具体的な実施の態様4について、図面を参照し
て説明する。この例は、文書画像のデータの取り込み、
領域抽出、領域の識別、編集、最終出力画像の蓄積とい
った機能を持たせ画像ファイリングシステムとしての具
体的な適用例を説明する。
【0181】図22は本発明の実施の態様4としての文
書処理装置の構成図である。
【0182】基本的構成としては図13で示した文書処
理装置とほとんど同じであるが、図22では領域識別部
104で識別された領域情報をユーザに表示せずに、か
つ、修正されることなく、画像蓄積部110に保存する
画像データを出力画像生成部107において生成する画
像ファイリングシステムとしてある点が異なる。
【0183】従って、この構成によれば、領域編集を行
なうことなく画像データを画像蓄積部110に保存す
る。故に簡易なる構成で領域別画像データをファイリン
グすることができるシステムが得られる。
【0184】以上の各例は文書画像のデータの取り込
み、領域抽出、領域の識別、最終画像の出力、ファイル
の蓄積、あるいは編集機能、といった構成要素を備え
て、ハードコピー出力装置や画像ファイリング装置とし
てのシステム構成例を説明した。
【0185】しかし、システムとして纏まっていなくと
も、各機能要素をコンピュータネットワークに接続して
最終的に文書画像のデータのファイリングやハードコピ
ーなどを行なうことを可能することもできる。その構成
をつぎに説明する。
【0186】(より具体的な実施の態様5)図23は本
発明の実施の態様5に係わる文書処理装置の構成図であ
る。この例は、文書画像のデータの取り込みと領域抽出
及び領域の識別部分、編集機能部分、最終出力画像の蓄
積部分といった機能要素をそれぞれ別個の端末装置と
し、コンピュータネットワークに接続して画像ファイリ
ングシステムとしての利用をネットワーク接続端末のユ
ーザで共有できるようにした構成である。
【0187】この例の構成も、図13で示した文書処理
装置とほとんど同じであるが、図23では領域識別部1
04で識別された領域情報をユーザに表示せずに、か
つ、修正されることなく、画像蓄積部110に保存する
画像データを出力画像生成部107において生成するよ
うにした画像ファイリングシステムとしてある。
【0188】図23に示す文書処理装置は、画像入力部
101、入力画像格納部102、領域抽出部103、領
域識別部104、出力画像生成部107、出力画像格納
部108、画像出力部109からなる画像取り込み装置
112と、領域識別結果表示部105、領域編集部10
6からなる端末装置113と、画像蓄積部からなるファ
イリング装置114の3つの装置からなり、それぞれを
ネットワーク115で接続されている。
【0189】この構成の場合、画像入力から領域抽出、
領域識別、出力画像生成、画像出力までの各処理はネッ
トワーク115に接続された画像取り込み装置112に
よって行なわれる。そして領域識別部104による領域
識別の結果と画像出力部109による画像出力はネット
ワーク115に対してなされる。
【0190】また、ネットワーク115にはファイリン
グ装置114が接続されており、ファイリング装置11
4はこのネットワーク115に出力された画像出力部1
09からの画像出力を取り込んで領域別に画像ファイル
として蓄積する。
【0191】また、ネットワーク115には領域識別結
果表示部105と領域編集部106からなる端末装置1
13が接続されており、端末装置113はネットワーク
115を介して領域識別の結果と、画像出力部109に
よる画像出力を受取り、領域識別の結果を表示して、こ
れに対して前述の如き領域編集の作業を施して所望の画
像ファイルに編集することができる。
【0192】また、ネットワーク115に対しては端末
装置として各種のインテリジェント端末を接続して利用
できるので、ファイリング装置114の画像ファイル検
索や、それを取り込んでの文書作成への利用など、ネッ
トワーク接続端末ユーザの様々な応用のみちが拓ける。
【0193】(より具体的な実施の態様6)図24は本
発明の実施の態様6に係わる文書処理装置の構成図であ
る。
【0194】この例においては、画像の類似性を計測す
るようにし、蓄積してあるファイルと類似性の高いもの
は除外するようにして、ファイルを重複して保存するこ
とのないようにした装置を説明する。ここでは例えば、
既に画像蓄積されている画像と同じ画像は出力しないよ
うにした画像ファイリングシステムについて説明する。
【0195】図24において、101は画像入力部、1
02は入力画像格納部、103は領域抽出部、104は
領域識別部、105は領域識別結果表示部、106は領
域編集部、107は出力画像生成部、108は出力画像
格納部、109は画像出力部、110は画像蓄積部、1
11は類似性計測部である。
【0196】これらのうち、画像入力部101はスキャ
ナ等の画像入力装置により、与えられた文書等の書類か
ら画像を読み取るものである。入力画像格納部102
は、画像入力部101で読み取られた画像データを一時
的に記憶するために格納しておくものである。
【0197】領域抽出部103は、入力画像格納部10
2に格納された画像データに対して、文字や図形等が物
理的にあるいは論理的に連結されている各領域に分割し
て抽出するものである。
【0198】領域識別部104は、領域抽出部103に
おいて抽出された領域に対して、その領域の位置、大き
さ、形状等の特徴を計測して、領域の種類あるいは重要
度を識別するものである。
【0199】また、領域識別結果表示部105は、入力
画像格納部102に格納されている画像データに、領域
識別部104において識別された領域の識別情報を重ね
て、表示するものである。
【0200】領域編集部106は、領域識別結果表示部
105に表示された領域情報を編集および修正するため
のユーザインタフェースであり、出力画像生成部107
は、領域識別部104において識別された領域情報ある
いは領域編集部106において編集された領域情報を用
いて、入力画像格納部102に記憶されている画像に変
更を加えて出力画像を生成するものである。
【0201】出力画像格納部108は、出力画像生成部
107において生成された出力画像を一時的に保存して
おくものであり、画像出力部109は、出力画像格納部
108において格納されている出力画像をプリンタや外
部記憶装置等に出力するものであり、画像蓄積部110
は、画像出力部109において出力された画像データを
ファイルとして蓄積しておくものである。
【0202】また、類似性計測部111は、出力画像格
納部108に格納されている出力画像データと画像蓄積
部110に登録されている画像データの類似性を計測す
るものである。本システムにおいては、類似性計測部1
11によって類似なものが既に画像蓄積部110に登録
されていると計測された画像データは画像出力部109
において画像出力しないように制御する構成である。あ
るいは、類似なものが既に登録されている場合は、既に
登録されている画像と入れ替えを行なうようにする構成
とすることもできる。
【0203】このような構成において、図24の各部1
01〜109で行われる処理の詳細は、本発明の実施の
態様1および2で説明したものと同様である。本システ
ムにおいては、画像蓄積部110に登録されている画像
データのファイル内容と出力画像格納部108に記憶さ
れている各領域の画像データの内容とを類似性計測部1
11により計測して類似性を判断する。
【0204】そして、類似性計測部111において類似
なものが既に画像蓄積部110に登録されていると計測
された画像データに対しては画像出力部109において
画像出力しないように制御するか、あるいは既に登録さ
れている画像データと入れ替えを行なうようにする。い
ずれを選択するかは、操作パネル等からのユーザの設定
に委ねる。
【0205】図25は本発明の実施の態様6に係わる文
書処理装置に入力される文書画像の例であり、文書画像
601は図に示すように例えば、“タイトル”、“文
章”、“図表”とからなるものとする。
【0206】図26は本発明の実施の態様6に係わる文
書処理装置の領域識別結果表示部105において実施さ
れる領域情報表示処理(図2のステップST205の処
理)によってCRTや液晶表示板の画面に出力される領
域情報601aである。
【0207】図25に示される文書画像601が入力さ
れたとき、図26に示される602から605までの4
つの領域が存在すると認識されたとする。このとき、そ
れぞれの領域を矩形枠で囲んだ形で表示される。表示の
形式は図8の説明でしたものと同様である。
【0208】図27は類似性計測部111の処理の詳細
を示すフローチャートである。このフローチャートに従
って類似性計測処理の詳細を説明する。類似性計測部1
11では、検査対象の領域画像を出力画像格納部108
に格納されている出力画像データのそれぞれと以下に説
明する処理を行なうことによって、類似画像が既に画像
蓄積部110に登録されているか、否かを検査する。
【0209】類似性計測部111では、まず、検査対象
の領域画像を出力画像格納部108から読み込む(ステ
ップST701)。
【0210】この領域画像に対する属性情報を読み込み
(ステップST702)、画像蓄積部110に登録され
ている画像から領域の種類をはじめとする情報が等しい
画像を検索する(ステップST703)。
【0211】そして、検索されたすべての画像に対して
類似度の計算を行なう(ステップST704)。類似度
の計算はつぎのようにして行なう。まず、検索された画
像データの読み込みを行なう(ステップST705)。
この画像データが検査対象画像のサイズに等しくなるよ
うに画像サイズの正規化を行なう(ステップST70
6)。
【0212】次に、正規化された画像と検査対象画像の
間の差異を計測する(ステップST707)。差異は濃
淡画像である場合は画像間の差分を用いるか、2値画像
である場合は対象画像の画素と検索画像の近傍画素の比
較あるいはパターンのマッチング処理により計測する。
あるいは領域がタイトルやテキストなどの文字データで
ある場合は文字認識を行って、文字コードデータを比較
することによって両者の差異を計測することもできる。
【0213】この結果より類似度を算出する(ステップ
ST708)。そして、この算出した類似度が、ある閾
値Sよりも大きいとき、類似画像が既に登録されている
こととする(ステップST709)。
【0214】一方、算出した類似度が閾値Sに満たない
場合は次の検索画像に対して同様の処理を行ない、閾値
Sに達するものがなかった場合は類似画像は登録されて
いないとする(ステップST710)。
【0215】ここで、類似度が高いものがあるときに、
対象となる画像と既登録の画像の両者を提示して、新た
に登録すべきかどうかを選択させるようにすることもで
きる。 図28は、図25に示される文書画像データ6
01を図13に示されるシステムによって処理手順によ
って、図26に示される領域情報601bを使用して処
理した結果、得られた領域別の画像データのファイルで
ある出力画像群602〜605を示している。
【0216】これらの出力画像群602〜605は、類
似度計測部111により、図27に示される類似性計測
処理を行なうことによって、既に画像蓄積部110に保
存されている画像データとの類似性が計測される。
【0217】現在、図24の画像蓄積部110に、図1
5(a)〜(d)に示される画像データ502〜505
の4枚が画像ファイルとして保存されているとする。
【0218】類似性計測処理によって、画像データ50
5の画像ファイルと出力画像605の類似性が高いと評
価されることになり、これによって、画像蓄積部110
に出力されないように類似性計測部111は画像蓄積部
109を制御し、一方、出力画像群602〜604は類
似性が低いと評価されて画像蓄積装置110に出力され
るように、類似度計測部111は画像出力部109を制
御することになる。
【0219】従って、類似性が低いと評価されたこれら
の出力画像群602〜604は、画像出力部109によ
ってハードディスクなどの画像蓄積装置110に追加出
力されて記録される結果、画像蓄積装置110には画像
データ502〜505および画像データ602〜604
の7枚の画像データが保存されることになる。
【0220】以上、説明したように本発明の実施の態様
6の例によれば、入力画像に含まれる要素を領域として
抽出し、それぞれの領域を独立のデータとして保存して
おくと共に、保存にあたっては保存データの内容との類
似性を評価し、類似性の高いものは除外して重複保存す
ることのないようにした。
【0221】そのため、入力された文書画像に対して、
入力画像に含まれる要素を領域として抽出し、それぞれ
の領域を独立のデータとして保存しておく場合、すでに
登録されているデータとの差異を計測するという手続き
を踏むだけで、既登録のデータを重複して保存すること
なくデータベースを構築できる。これにより、検索が効
率的に行え、保存領域の節約による効果をあげることが
できる。
【0222】以上の第1ないし第6の態様は、要約する
と、書類の画像を画像入力部により取り込み、これを入
力画像格納部に入力画像データとして一時的に記憶し、
次いで、この一時記憶された画像データに対してデータ
の状況から領域抽出部により文字や図形等が物理的にあ
るいは論理的に連結されている単位を一つの領域として
抽出し、次に、この抽出された領域に対して領域識別部
が、個々にその領域の画像上の位置、大きさ、形状、構
造、濃度分布等の特徴量を計測し、その計測結果を、予
め定められたルールに基づいて識別することにより、各
領域の種類、あるいは、文書上の重要度を識別し、そし
て、編集機能を有している場合には、これら識別された
領域情報を、モニタディスプレイ等の表示手段である領
域識別結果表示部に表示し、編集モードにすることで領
域編集部によりユーザは前記表示内容を参照しながら領
域情報の編集作業を行なうことでユーザの思うように領
域情報の編集して各領域の画像を更新することができる
ようにし、その編集の結果の更新画像を含め、書類の入
力画像を領域別の画像データとして分けて出力し、画像
蓄積部に別々にファイルすることができるようにし、編
集機能を有しない場合は識別された領域情報をもとに書
類の入力画像を領域別の画像データとして分けて出力
し、画像蓄積部に別々にファイルすることができるよう
にしたものである。
【0223】このように本発明システムによれば、文書
を複写したり、画像に変換して保存したりする場合、入
力された文書画像に対して、入力画像に含まれる要素、
例えば、タイトル領域、文章領域、図表領域、頁領域、
写真領域などの如き種別の異なる画像要素を区別して、
かつ、領域として抽出し、それぞれの領域に対して文書
としての重要度を識別あるいは修正することにより、必
要な部分と不必要な部分を的確に分離して扱うことが可
能である。これにより、文書に含まれる書き込みやノイ
ズ、書類の影、その他の不必要な部分を取り除いて、複
写あるは保存などが可能となる。
【0224】また、入力された文書画像に対して、入力
画像に含まれる要素を領域として抽出し、それぞれの領
域に対して文書としての重要度を識別あるいは修正し、
必要な部分のみを要素毎に独立のデータとして保存して
おくことにより、入力画像より得られたデータを別の文
書に再利用することができる。同時に、必要な部分のみ
を保存しておくため、保存領域の節約にも効果をあげる
ことができる。
【0225】さらに、領域をデータとして保存しておく
場合、すでに登録(すなわち保存)されているデータと
の差異を計測することにより、既登録のデータを重複し
て保存することなくデータベースを構築できる。同時
に、検索が効率的に行え、保存領域の節約により効果を
あげることができる。
【0226】以上は、文書画像から領域別に画像データ
を抽出してこれをファイルとして保存したり、ハードコ
ピーとして利用できるようにするものであったが、文書
書類を画像入力部101により読み込む場合に、読み込
む原稿である文書書類が斜めにセットされたり、文書書
類の歪みなどにより、画像が傾斜したりする。そこで、
これを修正することができるようにする技術を以下、説
明する。
【0227】(より具体的な実施の態様7)従来の文書
処理装置では、入力文書に傾きがある場合、その傾きを
検出・補正することで、レイアウト等の構造理解や、そ
の後の処理として入力文書中に記載されている文字の読
み取りなどを容易に行っていた。このとき用いられる傾
き補正としては、既に種々の手法が提案されている。例
えば、「ランに対する座標演算に基づく2値画像の高速
回転のための一手法」(電子情報通信学会論文誌、D、
vol、J71−D、No.7、pp.1296−13
05)に示されているように、画像データをランレング
スデータに変換し、回転行列を横方向と縦方向の変換座
標になるように分解することで高速な回転処理を実現し
ようとしている。しかし、この方法では、入力文書画像
全体の傾きを補正するため、実時間処理を行うには処理
時間がかかるという問題点があった。また、補正後の画
像データを格納する領域(メモリ)を新たに用意する必
要があった。
【0228】このように、従来の文書処理装置では、入
力文書画像に傾きがある場合、入力文書画像全体の傾き
の補正するため処理時間に関してコストがかかり、新た
な格納領域(メモリ)を用意しなければならないという
問題点があった。
【0229】そこで、以下に示す例では傾きの補正を行
わずに、文書画像の領域識別を行うことのできる文書処
理方式を説明する。
【0230】以下、図面に基づいて本発明を説明する。
図29は本装置の構成を示すブロック図であり、図30
はその主要部の構成であって領域識別機能要素部分の構
成である。図において、101は画像入力部、102は
入力画像格納部、103は領域抽出部、104は領域識
別部、105は領域識別結果表示部、106は領域編集
部、107は出力画像生成部、108は出力画像格納
部、109は画像出力部、110は画像蓄積部、210
は文書画像傾き検出処理部である。また、105は領域
識別部、106は領域編集部である。
【0231】画像入力部101は、処理対象となる文書
を画像データとして入力するためのものであり、例えば
イメージスキャナ等から構成される。入力画像格納部1
02は、この画像入力部101で取り込まれた画像デー
タを一時保持するためのものであり、文書画像傾き検出
処理部210は、この入力画像格納部102の画像デー
タから文書画像の傾きを検出するためのものである。
【0232】文書画像傾き検出処理部210は、図30
に示すように、2値化処理部211と文書画像傾き検出
部212とからなる。
【0233】これらのうち、2値化処理部211は、画
像入力部101で入力された画像データに対して2値化
データへ変換するものである。ここで実施される2値化
処理は公知である手法により実現されても良い。また2
値化されたデータは、主走査方向または副走査方向のど
ちらかの各走査線毎に圧縮しておいても良い。これは、
以降の処理を高速に行うことを目的としている。例え
ば、圧縮の方法としてはランレングス符号化を用いても
良い。
【0234】文書画像傾き検出部212は、文書画像よ
り特徴量を抽出して、傾きを判断するものである。文書
画像から傾きを検出する手法として、既に公知となって
いるものがあり、例えば、特開平5−174183号で
開示されている手法により実現するようにしても良い。
【0235】領域抽出部103は、入力画像格納部10
2に格納された画像データに対して、文字や図形等が物
理的に、あるいは論理的に連結されている各領域に分割
してそれぞれの種別毎に部分領域として抽出するもので
あり、ここではさらに文書画像傾き検出処理部210で
の検出情報を使用して入力画像格納部102上での入力
画像の傾きに対して水平または垂直方向において正確に
領域を抽出する機能を有する。
【0236】領域識別部104は、領域抽出部103に
よって抽出された領域(部分領域)から高さ、幅、縦横
率比などの特徴量を抽出して、文字・図・写真・雑音等
の領域の属性を識別する機能を有するものである。
【0237】出力画像生成部107は、領域識別部10
4からの結果を基に、識別された属性により、変形ある
いは濃度変換を行って画像データを生成する機能を有す
るものである。この場合、出力装置としては、ディスプ
レイのような画像表示装置でも良いし、プリンタでも良
い。さらに、磁気記憶装置等に格納することもできる。
【0238】また、本装置においては、領域識別結果表
示部105と領域編集部106とがある。領域識別結果
表示部105は、入力画像格納部102に格納されてい
る画像データに、領域識別部104において識別された
領域の識別情報を重ねて、表示するものであり、領域編
集部106は、領域識別結果表示部105に表示された
領域情報を編集および修正するものである。これらは既
に実施の態様1等で説明したものと同じであり、図7に
示される如き文書画像501が入力されていたとして領
域抽出部103にて領域抽出した結果として、領域識別
結果表示部105には図8に示す如きの表示が成される
ことになる。
【0239】領域編集部106はライトペンやマウスな
どのポインティングデバイスによりユーザがディスプレ
イの画面上で指示する領域を、これもまたユーザの指示
する“領域削除”、“領域統合”、“領域分割”、“領
域種別変更”の指令に応じて“領域削除”、“領域統
合”、“領域分割”、“領域種別変更”などの編集作業
を実施するものである。
【0240】すなわち、ユーザはディスプレイの画面に
表示された図8に示される如き画面501aを見ながら
上述の如きポインティングデバイス等を使用して、領域
の位置を指定する。そして、指定した領域に対して削除
や分割や統合、あるいは、領域の種類の変更等の作業内
容を指示することで、その指定した領域に対する削除や
領域の分割や統合、あるいは、領域の種類の変更をはじ
めとして、表示されている領域情報を様々に編集するこ
とができる。編集済みの領域は領域識別部104に渡さ
れることで、識別結果が修正されることになる。
【0241】そして、出力画像生成部107はこの識別
結果を反映した画像、修正されていない場合は領域識別
部104で識別された結果を反映した画像を生成するた
めの処理機能部であり、出力画像格納部108に対し
て、領域識別部104で識別された結果を反映した画像
を生成すべく対象領域の画像にデータについて必要なデ
ータ処理を施す機能を有する。そして、画像出力部10
9において、この生成されて出力画像格納部108に記
憶された出力画像をプリンタや外部記憶装置等に出力す
る機能を有する。
【0242】このような構成において、画像入力部10
1により、処理対象となる文書を画像データとして入力
する。すると入力画像格納部102は、この画像入力部
101で取り込まれた画像データを一時保持する。する
と、文書画像傾き検出処理部210は、この入力画像格
納部102の画像データから文書画像の傾きを検出す
る。
【0243】すなわち、文書画像傾き検出処理部210
は、図30に示すように、2値化処理部211と文書画
像傾き検出部212とからなるものであり、2値化処理
部211が、画像入力部101で入力された画像データ
に対して2値化データへ変換し、文書画像傾き検出部2
12は、この2値化データ化された文書画像より特徴量
を抽出して、傾きを判断する。文書画像から傾きを検出
する手法として、既に公知となっている例えば、特開平
5−174183号で開示されているが如き手法により
実現できる。
【0244】一方、領域抽出部103は、入力画像格納
部102に格納された画像データに対して、文字や図形
等が物理的に、あるいは論理的に連結されている各領域
に分割してそれぞれの種別毎に部分領域として抽出す
る。その際、ここではさらに文書画像傾き検出処理部2
10での検出情報を使用し、これによって入力画像格納
部102上での入力画像の傾きに対して水平または垂直
方向において正確に領域を抽出する。
【0245】領域識別部104は、領域抽出部103に
よって抽出された領域(部分領域)から高さ、幅、縦横
率比などの特徴量を抽出して、文字・図・写真・雑音等
の領域の属性を識別する。
【0246】そして、出力画像生成部107は、領域識
別部104からの結果を基に、識別された属性により、
変形あるいは濃度変換を行って画像データを生成する。
この場合、出力装置としては、ディスプレイのような画
像表示装置でも良いし、プリンタでも良い。さらに、磁
気記憶装置等に格納することもできる。
【0247】また、本装置においては、領域識別結果表
示部105と領域編集部106とがある。領域識別結果
表示部105は、入力画像格納部102に格納されてい
る画像データに、領域識別部104において識別された
領域の識別情報を重ねて、表示するものであり、領域編
集部106は、領域識別結果表示部105に表示された
領域情報を編集および修正するものである。これらは既
に実施の態様1等で説明したものと同じであり、図7に
示される如き文書画像501が入力されていたとして領
域抽出部103にて領域抽出した結果として、領域識別
結果表示部105には図8に示す如きの表示が成される
ことになる。
【0248】もちろん、領域識別結果表示部105では
設定により、矩形枠の表示は行わないで、画像情報(文
書画像501)そのものを領域毎に異なる色で着色表示
するようにすることもでき、このようにすることによ
り、領域情報を色分け表示することもできる。
【0249】一方、領域編集部106はライトペンやマ
ウスなどのポインティングデバイスによりユーザがディ
スプレイの画面上で指示する領域を、これもまたユーザ
の指示する“領域削除”、“領域統合”、“領域分
割”、“領域種別変更”の指令に応じて“領域削除”、
“領域統合”、“領域分割”、“領域種別変更”などの
編集作業を実施する。
【0250】すなわち、ユーザはディスプレイの画面に
表示された図8に示される如き画面501aを見ながら
上述の如きポインティングデバイス等を使用して、領域
の位置を指定する。そして、指定した領域に対して削除
や分割や統合、あるいは、領域の種類の変更等の作業内
容を指示することで、その指定した領域に対する削除や
領域の分割や統合、あるいは、領域の種類の変更をはじ
めとして、表示されている領域情報を様々に編集するこ
とができる。編集済みの領域は領域識別部104に渡さ
れることで、識別結果が修正されることになる。
【0251】そして、出力画像生成部107はこの識別
結果を反映した画像、修正されていない場合は領域識別
部104で識別された結果を反映した画像を生成するた
めの処理機能部であり、出力画像格納部108に対して
領域識別部104での識別された結果を反映した画像を
生成すべく対象領域の画像にデータについて必要なデー
タ処理を施す機能を有する。そして、画像出力部109
において、この生成されて出力画像格納部108に記憶
された出力画像をプリンタや外部記憶装置等に出力し、
一連の処理が終了する。
【0252】以上により、入力された文書画像に対し
て、これを2値化し、この2値化情報を用いて画像の傾
きを検出して傾き情報を得ると共に、文書画像の領域抽
出にあたってはこの傾き情報を参照して、領域の傾きを
水平(X軸)および垂直(Y軸)のうちのいずれかに正
確に修正して抽出し、領域の属性を判定して領域別の画
像に区分けした画像として出力できるようにしたもので
あるから、文書書類が傾いた状態で読み込まれた場合で
も領域抽出の際に、傾き修正しながら領域抽出するの
で、高速に領域抽出することができる。
【0253】また、入力画像に含まれる領域情報を自動
的に識別し、それをユーザに提示することで編集を容易
にし、また、編集を可能にすることで自動識別が失敗し
た場合においてもそれを容易に修正することが可能とな
る。
【0254】基本的には領域抽出部103の動作は実施
の態様1や実施の態様2で説明したものを踏襲するが、
実施の態様6においては領域の傾きを調べて対処できる
ようにしている。そのために、つぎのような機能が加わ
る。
【0255】[実施の態様7における領域抽出部103
の詳細]実施の態様7における領域抽出部103につい
て詳述する。図31は、本発明の領域識別機能要素部分
の一要素である領域抽出部103の動作を示すフローチ
ャートである。
【0256】領域抽出部103には2値化処理された入
力文書画像が入力される。
【0257】2値化処理された入力文書画像は、黒画素
融合処理(ステップS811)で水平または垂直方向の
どちらかまたは両方向において、黒画素に挟まれる長さ
L画素以下の白画素を黒画素に変換することにより一つ
の連続した黒画素とし、近接する黒画素を融合すること
で文書画像全体の連続黒画素の個数を減らす。
【0258】この処理の目的は、後述する部分領域抽出
処理(ステップS812)における領域数を減らすこと
によって処理量を削減することと、領域識別部104に
おける識別精度を高めることにある。
【0259】このとき、Lに与える値の大きさが問題と
なる。領域識別部104では、領域から得られる高さ、
幅、縦横比率等を用いて領域の属性を識別するものであ
るから、Lに大きい値を与えると、必要以上に黒画素が
融合され、実際には異なった属性で識別されるべき領域
が識別できないことが予想される。
【0260】また、入力文書画像の傾きが比較的大きい
場合、同一行にない文字列が融合されてしまう。逆にL
に小さな値を与えると、写真部分やかすれた部分の黒画
素が融合せず、正しく識別できいことも考えられる。従
って、Lは同一行にあり、隣接する文字が融合する程度
の値が望ましい。
【0261】部分領域抽出処理(ステップS812)で
は、黒画素間の連結性を調べることにより、連結する黒
画素領域を抽出するラベリング処理を行い、抽出された
連結黒画素領域を部分領域として抽出する。
【0262】その際、各部分領域を囲む最小矩形を検出
する。この最小矩形とはそれぞれの部分領域を構成する
画素を完全に囲み、更に画素が存在しない空白領域を最
小限にする矩形のことを指す。最小矩形の検出方法は領
域抽出部4の出力である傾きq によって変更しても良
い。以下にその例を示す。
【0263】<方法1>:図32は、本発明の領域識別
装置の一例である部分領域抽出処理(ステップS81
2)における最小矩形を求める方法の第1例を示したも
のである。
【0264】文書画像の主走査方向および副走査方向を
X‐Y座標系とし、文書画像の傾きqの値が閾値qtに
対して、q<qtまたはq>qtである場合、傾きqに
対して水平、垂直方向をX´‐Y´座標系とする。
【0265】ここで、X´‐Y´座標系の各座標軸にお
ける部分領域の最小値、最大値 (X'*min, X'*max, Y'*min, Y'*max) を検出し、その交点を(X'1,Y'1), (X'2,Y'2), (X'3,Y'
3), (X'4,Y'4)とする。この4つの交点がX´‐Y´座
標系における部分領域の最小矩形を表している。更に、
4点の内1点を基準点とし、その点に隣り合っている点
までの差、つまり幅と高さを求めても良い。
【0266】例えば、(X'1,Y'1) を基準点として(X'2,
Y'2) と(X'3,Y'3) との差を求め、それぞれW´,H´
とし、最小矩形データとする。この処理の目的は、基準
点の座標とW´,H´だけで最小矩形を表現できるた
め、部分領域データとして出力する際のデータ量を削減
することにある。また、X´‐Y´座標系における最小
矩形の4点の座標値が必要である場合、アフィン変換に
より求めても良い(文献“長谷川純一他共著「画像処理
の基本技法<技法入門編>」技術評論社、19861,
pp.32 ”参照)。
【0267】<方法2>図33は、本発明の領域識別装
置における部分領域抽出処理(ステップS812)にお
ける最小矩形を求める方法の第2例を示したものであ
る。
【0268】傾きqの値が閾値qtに対して、−qt≦
q≦qt である場合、文書画像の主走査方向および副
走査方向をX‐Y座標軸ととする。X‐Y座標系の各座
標軸における部分領域の最小値、最大値 (X*min, X*max, Y*min, Y*max) を検出し、その交点を(X1,Y1), (X2,Y2), (X3,Y3), (X
4,Y4)とする。この4つの交点がX‐Y座標系における
部分領域の最小矩形を表している。この処理の目的は、
文書画像の傾きqが閾値qtより小さい場合、傾きが無
いものと見なすことで処理を高速に行うことにある。ま
た、<方法1>の場合と同様に、最小矩形の4点の内1
点を基準点とし、その点に隣り合っている点までの差、
つまり幅と高さ(W,H)を求めて、最小矩形データと
しても良い。
【0269】以上の方法により、領域全体に亙って傾き
があっても、あるいは文字単位で傾きがあってもそれ対
応に、抽出された部分領域の最小矩形を検出して、抽出
された部分領域と共に部分領域データとして出力するこ
とができる。
【0270】つぎに領域識別部104について説明す
る。基本的には領域識別部104についてもその動作は
実施の態様1や実施の態様2で説明したものを踏襲する
が、実施の態様7においては領域の傾きを調べて対処で
きるようにしている。そのために、つぎのような機能が
加わる。
【0271】[実施の態様7における領域識別部104
の詳細]図34は、本発明の領域識別機能要素部分の一
要素である領域識別部104の動作を示すフローチャー
トである。
【0272】まず、矩形領域特徴量抽出処理(ステップ
S821)では、抽出された部分領域データすべてに対
して特徴量を計測する。特徴量としては、文書画像上の
位置、大きさ、形状、構造、濃度分布等があり、このう
ち、少なくとも1つの特徴量を計測する。その際、それ
ぞれの部分領域データにおける最小矩形を利用しするこ
とで、傾きのある場合においても正しく識別可能とな
る。
【0273】以下に、それぞれの特徴量計測方法の例を
示す。
【0274】画像上の位置は、個々の部分領域の最小矩
形の座標値、中心位置あるいは重心の計測によって求め
る。部分領域の大きさは、最小矩形のXとY(またはX
´とY´)の両方向の幅や高さを計測し、両者を掛合わ
せることで大きさが求まる。X(またはX´)方向の幅
は、最小矩形の最も左に位置する画素の座標と最も右に
位置する画素の座標との差によって求める。
【0275】最小矩形を検出後に幅(WまたはW´)を
求めている場合は、その値を用いる。Y(またはY´)
方向の高さは、最小矩形の最も上に位置する画素の座標
と最も下に位置する画素の座標との差によって求める。
最小矩形を検出後に高さ(HまたはH´)を求めている
場合は、その値を用いる。部分領域の形状は、例えばX
(またはX´)方向の幅とY(またはY´)方向の高さ
の割合によって求めることができる。
【0276】これにより、縦長の部分領域あるいは横長
の部分領域、正方形に近い部分領域などの特徴が得られ
る。部分領域の構造は、XとY(またはX´とY´)の
両方向の射影(プロジェクション)を計測することによ
り求めることができる。部分領域の濃度分布は、領域内
の画素の濃度値ヒストグラムをとることによって計測す
る。
【0277】この場合は2値化前の文書画像データを参
照して計測する。
【0278】このようにして特徴量の計測を行なうがこ
の特徴量計測終了後、矩形領域属性判定処理(ステップ
S822)により、すべての部分領域に対して領域属性
を割り当てる。例えば、図35に示されるような領域属
性と、それに対応する特徴量の閾値を設定しておき、こ
れを参照して各部分領域の属性を決定する。
【0279】図35においては属性は、文字領域属性、
線領域属性、表領域属性、線図領域属性、写真領域属性
が登録されている。場合によっては更に領域属性や特徴
量を追加することも可能である。
【0280】図35において、「−」で示されている項
は特徴量計測の結果を問わない部分である。
【0281】例えば、文字領域属性と決定される部分領
域は、画像上の位置、形状、濃度分布に関してはどんな
値をとってもかまわず、ただし大きさついてはX方向の
幅がAよりも大きく、Bよりも小さく、構造は均等であ
れば“文字領域”であることを意味する。
【0282】図35における各特徴量の値について簡単
に説明する。
【0283】まず、位置において「内部」は文書画像の
ふちにないことをいう。ふちとは、ある設定値Uを定め
たとき文書画像の隅からU%以内の範囲をいう。設定値
Uはたとえば10%と設定しておくが、文書画像上の濃
い画素の分布からUの値を文書ごとに変化させてもよ
い。大きさにおいて、図35ではX方向の幅のみを指定
しているが、Y方向の幅同時に設定することもできる。
また、文書画像によってはX´やy´方向に設定しても
良い。文書画像のサイズから設定値A,B,C,D,
E,Fが自動で求まるようにする。それぞれの設定値は
画素数で評価する。形状において、「横長」はx方向の
幅がy方向の高さのV倍よりも大きい場合をいう。例え
ば設定値Vを“2”としておく。同様に「縦長」を定義
できる。「方形」は横長でもなく縦長でもない状態をい
う。すなわち、横方向の幅が縦方向の幅のV倍以下であ
り、1/V倍以上である場合をいう。
【0284】構造において、「均等」とは射影がほぼ均
等である状態をいう。また、「極大変化」とは、細いピ
ークが一ヵ所で存在する状態をいう。「変化等間隔」と
は射影に際立った変化があるもので、細いピークがある
間隔毎にある状態をいう。さらには「変化大」とは射影
に際立った変化があるもので、非常に細いピークがある
状態をいう。また、「変化あり」とは射影に際立った変
化があるもので、ピークに特徴がない状態をいう。濃度
分布において、「濃淡」とは濃淡の変化がある状態であ
り、「なし」とは濃淡の変化がない状態である。
【0285】以上により、各領域毎に計測された特徴量
から各部分領域の属性を識別することができるが、予め
設定されている閾値により、識別できなかった領域を雑
音属性領域とすることもできる。
【0286】すべての部分領域に対して属性を割り当て
た後、部分領域データにその属性データを付加する。こ
の部分領域データ用いることで出力画像生成部107に
よって所望の形態を持つ出力結果を得ることができる。
【0287】その際、部分領域属性を利用して、部分領
域を変形させたり、あるいは濃度値を変換させたりする
ことで出力結果を加工することも可能である。例えば、
指定した領域属性を持つ領域だけ濃度値をそのまま出力
し、ほかの領域では濃度値を0にすることで消去するこ
とも可能である。また、雑音領域属性をもつ領域だけ濃
度値を0にすることで、綺麗な出力結果を得ることも可
能である。さらに、指定した領域属性を拡大・縮小した
り、移動させることで、ユーザの所望する出力結果を生
成できる。
【0288】以上、説明したように本発明の実施の態様
7により、入力文書画像に傾きがある場合においても、
その傾きを検出して、入力文書画像中の連結黒画素領域
を傾きに対して水平及び垂直方向における領域として抽
出することで、部分領域の抽出にあたり、正確な領域抽
出が行える。また、それぞれの領域に対して文書要素と
しての属性を識別することにより必要な部分と不必要な
部分を的確に分離して扱うことが可能である。これによ
り、文書に含まれる書き込みやノイズ、書類の影、その
他の不必要な部分を取り除いて、複写あるは保存などが
可能となり、複写(ハードコピー)の際のトナーの節約
や保存領域の節約にもその効果が期待できる。
【0289】また、傾斜情報を取得するので、抽出した
各領域の画像は傾斜分を補正して傾斜のない領域画像と
して扱うことができるようになり、複写(ハードコピ
ー)や保存された画像の利用に際して便利である。
【0290】(より具体的な実施の態様8)図36は本
発明の領域識別機能要素部分の別の構成例を示すブロッ
ク図である。この図の構成は図30の構成例に領域統合
部220を付加したものである。
【0291】以下、領域統合部220について詳述す
る。
【0292】文書画像は黒画素融合処理(図31のステ
ップS811)によって連続黒画素数が減らされている
が、通常の文書画像において部分領域として抽出される
部分領域数は多い。例えば、1行の文字列が黒画素融合
処理(図31のステップS811)を行っても1つの連
続黒画素とはならないで、複数の連続黒画素に分かれた
場合、抽出される部分領域数は連続黒画素数と同数であ
る。そこで、領域統合部220では、同一の属性を持
ち、かつ隣接した複数の部分領域を一つにまとめ、部分
領域数を減らすことを行なう。
【0293】図37は、領域統合部220における処理
の流れを示したフローチャートであり、図38、図3
9、図40及び図41は領域統合条件を説明するための
図である。以下、これらの図を基に領域統合部220に
おける領域統合処理について説明する。
【0294】すべての部分領域には領域識別部104に
よって、属性が割り当てられているので、領域統合部2
20ではまず部分領域データを読み込み(ステップS8
33)、統合しようとする目的の属性を持った部分領域
を見つける(ステップS834)。
【0295】次に他の部分領域データを読み込み(ステ
ップS836)、同じ属性の部分領域を見つける。同じ
属性である場合、領域統合条件を算出する。
【0296】図38は、部分領域抽出処理(図31のス
テップS812)において<方法1>で部分領域抽出を
行なった場合の領域統合条件を算出方法を示したもので
ある。符号1101を付して示す文字「A」の最小矩形
より、高さH1 と、符号1102を付して示す文字
「B」の最小矩形より、高さH2 を求め、H1 とH2 と
の差Hd を求める。
【0297】また、符号1101を付して示す文字
「A」の最小矩形と、符号1102を付して示す文字
「B」の最小矩形より、Wd を求める。そして、予め設
定した閾値Ht ,Wt と比較し、Hd <Ht かつWd <
Wt である場合、領域統合条件を満たすものとし、符号
1101を付して示す文字「A」と符号1102を付し
て示す文字「B」に対して部分領域統合を行う。
【0298】図39は、部分領域統合を行った後の状態
を示している。部分領域統合によって最小矩形は変化し
ているため、そのデータを更新する必要がある。そこで
符号1101を付して示す文字「A」と符号1102を
付して示す文字「B」の最小矩形の情報より、X´‐Y
´座標系の各座標軸における新たな部分領域(103)
の最小値、最大値 (X'*min, X'*max, Y'*min, Y'*max) を検出し、その交点を (X'1,Y'1), (X'2,Y'2), (X'3,Y'3),(X'4,Y'4) として、新たな最小矩形のときに部分領域データを更新
する。
【0299】以上の例では、領域統合処理をX(または
X´)方向について述べたが、Y(またはY´)方向に
ついても同様にして領域統合処理を行なうことができ
る。さらに、両者を組み合わせることで、両方向につい
ての領域統合処理を行っても良い。
【0300】図40は、部分領域抽出処理(図31のス
テップS812)において<方法2>で部分領域抽出を
行なった場合の領域統合条件を算出方法を示したもので
ある。<方法1>の場合と同様にして、領域統合条件を
満たす場合、部分領域統合を行う。
【0301】図41は、部分領域統合を行った後の状態
を示している。これも<方法1>の場合と同様にして、
部分領域データを更新する。
【0302】以上、説明したようにこの例により、同一
の属性を持ち、かつ隣接した複数の部分領域を一つにま
とめ、部分領域数を減らすことで、部分領域数を減ら
し、出力画像生成部107での処理の高速化を計ること
ができる。
【0303】(より具体的な実施の態様9)図42は本
発明の領域識別装置の実施の態様9を説明するためのブ
ロック図である。この図の構成は、図36の構成例に領
域傾き補正部230を付加したものである。
【0304】先の例では、文書画像が傾いている場合、
その傾きqを検出し、傾きqに対して水平、垂直方向に
座標系をとり、領域抽出や領域識別を行っていた。従っ
て、傾き補正は行っていないので、その出力である出力
画像生成部107では、傾いたままの画像が生成され
る。そこで、出力結果として傾き補正が必要な場合、領
域傾き補正部230で部分領域の傾き補正を行なう。
【0305】傾き補正部230では、文書画像傾き検出
部212からの出力である傾きqを用いて、例えば
“「座標の平行移動による画像の高速回転法」(電学論
C, 105,3, pp.61-68, 1985)”に示される如きの方法
により、傾き補正を行なう。この場合、画像全体で傾き
補正を行なうのではなく、抽出された部分領域毎に補正
を行なう。また、予め補正が必要とされる部分領域の属
性を指定することによって、傾き補正が必要な部分領域
だけに限定して行なう。
【0306】従って、何も黒画素が無い下地とされる領
域は補正対象外であるため、画像全体で傾き補正する場
合と比較して高速に行なうことができる。例えば、文字
や図の属性を持った部分領域のみを傾き補正を行ない、
雑音の領域属性を持った部分領域に対しては傾き補正を
行なわないということが可能である。
【0307】以上、説明したように本発明の実施の態様
9によれば、文書画像の傾きを検出する文書画像傾き検
出部210に加えてさらに領域統合部220を設けて、
領域識別部104により得られる分離抽出された各部分
領域の属性情報をもとに、同一の属性を持ち、かつ隣接
した複数の部分領域についてそれらを一つにまとめ、部
分領域数を減らすようにした。そのため、入力された文
書画像が傾いていて、なおかつ傾き補正が望まれる場
合、文書画像全体で補正するのではなく、必要とされる
部分領域に対してのみ傾き補正を行なうことになるた
め、高速な補正処理を行うことが可能である。
【0308】以上、実施の態様7ないし9においては、
入力された文書画像から画像の傾きを検出する傾き検出
手段と、この傾き検出手段によって検出された傾きに対
して水平または垂直方向における前記文書画像の連結成
分領域を抽出することにより、文字や図形等が物理的あ
るいは論理的に連結されている単位を一つの領域として
抽出する領域抽出手段と、この領域抽出手段の抽出した
領域の情報に基づいて連結成分領域の形状を計測するこ
とにより領域の属性を識別する領域識別手段と、識別さ
れた属性により変形あるいは濃度変換を行って出力画像
データを生成する出力画像生成手段を具備するものであ
り、領域抽出にあたって、入力文書の傾きを検出し、そ
の傾きに対して水平または垂直方向における連結黒画素
矩形領域を発生させ、この領域毎に文字、図、写真、お
よび雑音等の属性の識別を行なうようにした。
【0309】すなわち、本発明では、文書画像の傾きを
補正してから領域識別するのではなく、傾きを持った矩
形領域情報より領域識別をするようしたため、高速な処
理が可能になる。また、傾き補正を施した画像を出力し
たい場合においても、傾き補正が必要な領域だけに限定
して補正することになるため、高速な傾き補正が可能に
なり、また、画像全体の補正を行なおうとした場合には
新たな格納領域(メモリ)を必要とするが、本発明にお
いてはそれを省くことが可能である。
【0310】故に本発明によれば、文書を複写したり、
画像に変換して保存したりする場合、入力された文書画
像に対して、入力画像の傾きを検出し、入力画像に含ま
れる要素を傾きに対して水平または垂直方向における領
域として抽出することで、正確な領域抽出ができ、それ
ぞれの領域に対して文書要素としての属性を識別するこ
とにより、必要な部分と不必要な部分を的確に分離して
扱うことが可能であって、これにより、文書に含まれる
書き込みやノイズ、書類の影、その他の不必要な部分を
取り除いて、複写あるは保存などが可能となり、複写の
際のトナーや保存領域の節約にも効果を上げることがで
きる。
【0311】また、入力された文書画像に対して、入力
画像の傾きを検出し、入力画像に含まれる要素を傾きに
対して水平または垂直方向における領域として抽出し、
それぞれの領域に対して文書要素としての属性を識別す
ることにより、同一属性の領域どうしを統合すること
で、格納領域を削減することで効果をあげることができ
る。
【0312】さらに、入力された文書画像に傾きがあ
り、その傾きを補正する場合、抽出された領域に対して
傾き補正するため、必要な領域だけ高速に補正すること
ができる。
【0313】
【発明の効果】以上説明したように本発明によれば、第
1には、文書を複写したり、画像に変換して保存したり
する場合、入力された文書画像に対して、入力画像に含
まれる要素を領域として抽出し、それぞれの領域に対し
て文書としての重要度を識別あるいは修正することによ
り、必要な部分と不必要な部分を的確に分離して扱うこ
とが可能である。これにより、文書に含まれる書き込み
やノイズ、書類の影、その他の不必要な部分を取り除い
て、複写あるは保存などが可能となる。また、入力され
た文書画像に対して、入力画像に含まれる要素を領域と
して抽出し、それぞれの領域に対して文書としての重要
度を識別あるいは修正し、必要な部分のみを要素毎に独
立のデータとして保存しておくことにより、入力画像よ
り得られたデータを別の文書に再利用することができ
る。同時に、必要な部分のみを保存しておくため、保存
領域の節約にも効果をあげることができる。さらに、領
域をデータとして保存しておく場合、すでに登録(すな
わち保存)されているデータとの差異を計測することに
より、既登録のデータを重複して保存することなくデー
タベースを構築できる。同時に、検索が効率的に行え、
保存領域の節約により効果をあげることができる。
【0314】さらにまた、本発明によれば、第2には、
文書を複写したり、画像に変換して保存したりする場
合、入力された文書画像に対して、入力画像の傾きを検
出し、入力画像に含まれる要素を傾きに対して水平また
は垂直方向における領域として抽出することで、正確な
領域抽出が行われ、それぞれの領域に対して文書要素と
しての属性を識別することにより、必要な部分と不必要
な部分を的確に分離して扱うことが可能である。これに
より、文書に含まれる書き込みやノイズ、書類の影、そ
の他の不必要な部分を取り除いて、複写あるは保存など
が可能となり、複写の際のトナーや保存領域の節約にも
効果を上げることができる。また、入力された文書画像
に対して、入力画像の傾きを検出し、入力画像に含まれ
る要素を傾きに対して水平または垂直方向における領域
として抽出し、それぞれの領域に対して文書要素として
の属性を識別することにより、同一属性の領域どうしを
統合することで、格納領域を削減することで効果をあげ
ることができる。さらに、入力された文書画像に傾きが
あり、その傾きを補正する場合、抽出された領域に対し
て傾き補正するため、必要な領域だけ高速に補正するこ
とができる。
【図面の簡単な説明】
【図1】本発明に係わる文書処理装置の構成図であっ
て、本発明のより具体的な実施の態様1の例を示すブロ
ック図。
【図2】図1の構成の本発明装置の文書処理手順の例を
示すフローチャート。
【図3】本発明のより具体的な実施の態様1に係わる領
域抽出処理のフローチャート。
【図4】本発明のより具体的な実施の態様1に係わる領
域識別処理のフローチャート。
【図5】本発明に係わる文書処理装置の領域識別処理で
利用する領域の種類を決定するためのルールの例を示す
図。
【図6】本発明に係わる文書処理装置の領域識別処理で
利用される領域の重要度を決定するためのルールの例を
示す図。
【図7】本発明に係わる文書処理装置において扱われる
文書画像の例を示す図。
【図8】本発明に係わる文書処理装置の領域識別結果表
示部に出力される領域情報例を示す図。
【図9】本発明に係わる文書処理装置の領域情報編集処
理の説明図。
【図10】本発明に係わる文書処理装置の領域情報編集
処理の説明図。
【図11】本発明に係わる文書処理装置の領域編集部1
06での編集処理を行うためのユーザインタフェイス
例。
【図12】本発明に係わる文書処理装置の出力画像生成
処理のフローチャート。
【図13】本発明のより具体的な実施の態様2に係わる
文書処理装置の構成例を示すブロック図。
【図14】本発明のより具体的な実施の態様2に係わる
文書処理装置の出力画像生成部107における出力画像
生成処理のフローチャート。
【図15】本発明のより具体的な実施の態様2における
出力画像生成処理によって生成される出力画像の例を示
す図。
【図16】本発明に係わる文書処理装置の領域識別処理
で利用する領域の種類を決定するためのルールの例を示
す図。
【図17】本発明のより具体的な実施の態様3における
文書処理装置に入力される−例としての文書画像を示す
図。
【図18】図17に示す文書画像の例701の黒枠雑音
領域702に対してのみ、縦横両方向の射影を計測した
結果を示す図。
【図19】実施の態様3の説明をするための図であっ
て、文書処理装置の出力画像生成部107における出力
画像生成処理での具体的手順を示す処理フフローチャー
ト。
【図20】図17に示した文書画像の例の黒枠雑音領域
702に対してのみ、縦横両方向の射影を計測した結果
を示す図。
【図21】図19に示される処理手順によつて、図17
に示される文書画像データ701を処理した結果、得ら
れた出力画像を示す図。
【図22】本発明のより具体的な実施の態様4に係わる
文書処理装置の構成例を示すブロック図。
【図23】本発明のより具体的な実施の態様5に係わる
文書処理装置の構成例を示すブロック図。
【図24】本発明のより具体的な実施の態様6に係わる
文書処理装置の構成例を示すブロック図。
【図25】本発明の実施の態様6に係わる文書処理装置
に入力される文書画像の例を示す図。
【図26】本発明の実施の態様6に係わる文書処理装置
の領域識別結果表示部105において実施される領域情
報表示処理による表示画面例を示す図。
【図27】本発明の実施の態様6に係わる文書処理装置
における類似性計測部111の処理の詳細を示すフロー
チャート。
【図28】本発明の実施の態様6に係わる文書処理装置
における出力画像生成処理によって生成される出力画像
例を示す図。
【図29】本発明のより具体的な実施の態様7に係わる
文書処理装置の構成例を示すブロック図。
【図30】図29の要部構成図。
【図31】本発明のより具体的な実施の態様7に係わる
文書処理装置の領域抽出処理のフローチャート。
【図32】本発明のより具体的な実施の態様7に係わる
文書処理装置における領域抽出処理の説明図。
【図33】本発明のより具体的な実施の態様7に係わる
文書処理装置における領域抽出処理の説明図。
【図34】本発明のより具体的な実施の態様7に係わる
文書処理装置における領域識別処理のフローチャート。
【図35】本発明に係わる文書処理装置の領域識別処理
で利用される領域属性を決定するための要素例を示す
図。
【図36】本発明の実施の態様8に係わる文書処理装置
における領域識別機能要素部分の概略構成を示すブロッ
ク図。
【図37】本発明に係わる文書処理装置の領域統合部2
20における処理の流れを示したフローチャート。
【図38】本発明の実施の態様8に係わる領域統合処理
の説明図。
【図39】本発明の実施の態様8に係わる領域統合処理
の説明図。
【図40】本発明の実施の態様8に係わる領域統合処理
の説明図。
【図41】本発明の実施の態様8に係わる領域統合処理
の説明図。
【図42】 本発明の実施の態様9における領域識別機
能要素部分の概略構成を示すブロック図。
【符号の説明】
101…画像入力部 102…入力画像格納部 103…領域抽出部 104…領域識別部 105…領域識別結果表示部 106…領域編集部 107…出力画像生成部 108…出力画像格納部 109…画像出力部 110…画像蓄積部 111…類似性計測部 210…文書画像傾き検出処理部 211…2値化処理部 212…文書画像傾き検出部 220…領域統合部 230…領域傾き補正部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04N 1/40 H04N 1/40 F

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 画像データとして読み込まれた文書画像
    より、特定の領域を抽出する領域抽出手段と、 前記領域抽出手段により抽出された領域をその特徴量に
    より分類する領域識別手段と、 前記領域識別手段により識別された結果を表示する識別
    結果表示手段と、 前記識別結果を編集するための領域編集手段と、 前記領域編集手段によって編集された結果あるいは前記
    識別結果に対応した出力画像を生成する出力画像生成手
    段と、 前記出力画像生成手段によって生成された画像を出力す
    る画像出力手段と、を具備することを特徴とする文書処
    理装置。
  2. 【請求項2】 出力画像生成手段は、識別された領域毎
    に分割して別々の画像とする機能を有することを特徴と
    する請求項1記載の文書処理装置。
  3. 【請求項3】 画像データとして読み込まれた文書画像
    より、特定領域を抽出する領域抽出手段と、 前記領域抽出手段により抽出された領域をその特徴量に
    より分類する領域識別手段と、 前記領域識別手段により識別された結果に応じて出力画
    像を生成する出力画像生成手段と、 前記出力画像生成手段によって生成された画像を出力す
    る画像出力手段とを具備し、 前記出力画像生成手段は、識別された領域毎に分割して
    別々の画像とすることを特徴とする文書処理装置。
  4. 【請求項4】 画像データとして読み込まれた文書画像
    より、関連するひとまとまりの領域を抽出する領域抽出
    手段と、 前記領域抽出手段により抽出された領域をその特徴量に
    より分類する領域識別手段と、 前記領域識別手段により識別された結果に応じて出力画
    像を生成する出力画像生成手段と、 前記出力画像生成手段によって生成された画像を出力す
    る画像出力手段と、 前記画像出力手段により出力された画像を蓄積する画像
    蓄積手段と、を具備することを特徴とする文書処理装
    置。
  5. 【請求項5】 画像データとして読み込まれた文書画像
    より、関連するひとまとまりの領域を抽出する領域抽出
    手段と、 前記領域抽出手段により抽出された領域をその特徴量に
    より分類する領域識別手段と、 前記領域識別手段により識別された結果を表示する識別
    結果表示手段と、 前記識別結果を編集するための領域編集手段と、 前記領域編集手段によって編集された結果あるいは前記
    識別結果に対応した出力画像を生成する出力画像生成手
    段と、 前記出力画像生成手段によって生成された画像を出力す
    る画像出力手段と、 前記画像出力手段により出力された画像を蓄積する画像
    蓄積手段と、を具備することを特徴とする文書処理装
    置。
  6. 【請求項6】 前記画像出力手段により出力する画像と
    既に前記画像蓄積手段に蓄積されている画像との類似性
    を計測する類似性計測手段を具備し、 前記画像出力手段は、類似性計測手段により計測された
    類似性を利用して、類似性の度合いにより既に前記画像
    蓄積手段に蓄積されている画像であるか否かを判断して
    既蓄積画像は出力しない構成とすることを特徴とする請
    求項5または6いずれか1項記載の文書処理装置。
  7. 【請求項7】 画像蓄積手段に蓄積される画像の入力画
    像の属性情報および入力画像上の位置情報のうち、少な
    くとも1つの情報を設定しておく関連情報設定手段を具
    備することを特徴とする請求項4または5または6いず
    れか1項記載の文書処理装置。
  8. 【請求項8】 画像データをコード化あるいはベクトル
    化する画像コード化手段を具備し、 前記出力画像生成部は、前記領域識別手段により識別さ
    れた結果に応じて領域内の画像データをコード化あるい
    はベクトル化することを特徴とする請求項1または3ま
    たは4または5いずれか1項記載の文書処理装置。
  9. 【請求項9】 画像データとして読み込まれた文書画像
    より、特定の領域を抽出する領域抽出ステップと、 前記領域抽出ステップにより抽出された領域をその特徴
    量により分類する領域識別ステップと、 前記領域識別ステップにより識別された結果を表示する
    識別結果表示ステップと、 前記識別結果を編集するための領域編集ステップと、 前記領域編集手段によって編集された結果あるいは前記
    識別結果に対応した出力画像を生成する出力画像生成ス
    テップと、を具備することを特徴とする文書処理方法。
  10. 【請求項10】 画像データとして読み込まれた文書画
    像より、関連するひとまとまりの領域を抽出する領域抽
    出ステップと、 前記領域抽出ステップにより抽出された領域をその特徴
    量により分類する領域識別ステップと、 前記領域識別ステップにより識別された結果に応じて出
    力画像を生成する出力画像生成ステップと、 前記出力画像生成ステップによって生成された画像を蓄
    積する画像蓄積ステップと、を具備することを特徴とす
    る文書処理方法。
  11. 【請求項11】 画像データとして読み込まれた文書画
    像より、関連するひとまとまりの領域を抽出する領域抽
    出ステップと、 前記領域抽出ステップにより抽出された領域をその特徴
    量により分類する領域識別ステップと、 前記領域識別ステップにより識別された結果を表示する
    識別結果表示ステップと、 前記識別結果を編集する領域編集ステップと、 前記領域編集ステップによって編集された結果あるいは
    前記識別結果に対応した出力画像を生成する出力画像生
    成ステップと、 前記出力画像生成ステップによって生成された画像を蓄
    積する画像蓄積ステップと、を具備することを特徴とす
    る文書処理方法。
  12. 【請求項12】 入力された文書画像から傾きを検出す
    る傾き検出手段と、 前記傾き検出手段によって検出された傾きに対して水平
    または垂直方向における前記文書画像の連結成分領域
    を、画像の傾きを補正せずに抽出する領域抽出手段と、 前記領域抽出手段の抽出した領域の情報に基づいて連結
    成分領域の形状を求めることにより、領域の属性を識別
    する領域識別手段と、 識別された属性に応じて変形または濃度変換の少なくと
    も1つを実施して出力画像データを生成する出力画像生
    成手段と、を具備することを特徴とする文書処理装置。
  13. 【請求項13】 識別された属性が同一かつ隣接する複
    数の前記領域を統合する領域統合手段を具備することを
    特徴とする請求項12記載の文書処理装置。
  14. 【請求項14】 領域統合手段は、前記傾きに対して水
    平または垂直方向のうち、少なくとも一方において領域
    を統合することを特徴とする請求項13記載の文書処理
    装置。
  15. 【請求項15】 出力画像生成手段は、前記傾きに従っ
    て、前記領域毎に必要に応じて傾き補正処理を行うこと
    を特徴とする請求項12ないし14いずれか1項記載の
    文書処理装置。
  16. 【請求項16】 画像データとして読み込まれた文書画
    像より、関連するひとまとまりの領域を抽出する領域抽
    出手段と、 前記領域抽出手段により抽出された領域をその特徴量に
    より分類および分割する領域識別手段と、 前記領域識別手段により識別された結果に応じて出力画
    像を生成する出力画像生成手段と、 前記出力画像生成手段により生成された画像を出力する
    画像出力手段と、を具備することを特徴とする文書処理
    装置。
JP03470296A 1995-07-17 1996-02-22 文書処理装置および文書処理方法 Expired - Fee Related JP3504054B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03470296A JP3504054B2 (ja) 1995-07-17 1996-02-22 文書処理装置および文書処理方法
US08/682,007 US6043823A (en) 1995-07-17 1996-07-16 Document processing system which can selectively extract and process regions of a document

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-180442 1995-07-17
JP18044295 1995-07-17
JP03470296A JP3504054B2 (ja) 1995-07-17 1996-02-22 文書処理装置および文書処理方法

Publications (2)

Publication Number Publication Date
JPH0991450A true JPH0991450A (ja) 1997-04-04
JP3504054B2 JP3504054B2 (ja) 2004-03-08

Family

ID=26373543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03470296A Expired - Fee Related JP3504054B2 (ja) 1995-07-17 1996-02-22 文書処理装置および文書処理方法

Country Status (2)

Country Link
US (1) US6043823A (ja)
JP (1) JP3504054B2 (ja)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339244A (ja) * 1999-05-31 2000-12-08 Canon Inc データ通信装置及びその方法
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2005346586A (ja) * 2004-06-04 2005-12-15 Canon Inc 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2006146971A (ja) * 2006-02-24 2006-06-08 Sharp Corp 画像特徴領域分割装置および画像特徴量計算装置
JP2007013924A (ja) * 2005-06-01 2007-01-18 Ricoh Co Ltd 画像処理装置、プログラムおよび画像処理方法
JP2007082021A (ja) * 2005-09-16 2007-03-29 Ricoh Co Ltd 画像処理装置、プログラムおよび画像データ処理方法
JP2007110440A (ja) * 2005-09-16 2007-04-26 Ricoh Co Ltd 画像表示装置、画像表示方法、画像形成装置、画像形成方法、および、それらの方法をコンピュータに実行させるプログラム
JP2007110679A (ja) * 2005-09-16 2007-04-26 Ricoh Co Ltd 画像表示装置、画像表示方法、その方法をコンピュータに実行させるプログラム、および画像表示システム
JP2007150858A (ja) * 2005-11-29 2007-06-14 Ricoh Co Ltd 文書編集装置、画像形成装置、文書編集方法、およびその方法をコンピュータに実行させるプログラム
JP2007166541A (ja) * 2005-09-01 2007-06-28 Canon Inc 画像処理方法およびその装置
JP2008252862A (ja) * 2007-03-05 2008-10-16 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
US7593120B2 (en) 2004-06-10 2009-09-22 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
JP2009271691A (ja) * 2008-05-07 2009-11-19 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2010061453A (ja) * 2008-09-04 2010-03-18 Fuji Xerox Co Ltd 画像処理装置及びプログラム
US7715625B2 (en) 2004-04-01 2010-05-11 Fuji Xerox Co., Ltd. Image processing device, image processing method, and storage medium storing program therefor
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
JP2011097538A (ja) * 2009-11-02 2011-05-12 Sharp Corp 画像処理装置、プログラム、記録媒体
WO2012032834A1 (ja) * 2010-09-09 2012-03-15 日本デジタルオフィス株式会社 文書閲覧システムおよびその制御方法
JP2012168832A (ja) * 2011-02-16 2012-09-06 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法及びプログラム
US8363940B2 (en) 2010-03-09 2013-01-29 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium
US8571359B2 (en) 2008-06-30 2013-10-29 Canon Kabushiki Kaisha Image processing device, method and storage medium for storing and displaying an electronic document
JP2014013490A (ja) * 2012-07-04 2014-01-23 Nippon Telegr & Teleph Corp <Ntt> 画像領域分割装置、その方法及びプログラム
JP2014112934A (ja) * 2014-02-13 2014-06-19 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム、記録媒体
JP2014220652A (ja) * 2013-05-08 2014-11-20 コニカミノルタ株式会社 画像編集装置、画像編集方法および画像編集プログラム
JP2015130712A (ja) * 2015-04-17 2015-07-16 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム、記録媒体
EP2933708A1 (en) 2014-04-17 2015-10-21 Fujitsu Limited Read determining device and method
JP2016082357A (ja) * 2014-10-15 2016-05-16 富士通株式会社 画像処理装置、画像処理プログラムおよび画像処理方法
CN105592244A (zh) * 2014-11-06 2016-05-18 京瓷办公信息系统株式会社 图像处理装置
JP2016143142A (ja) * 2015-01-30 2016-08-08 富士ゼロックス株式会社 画像管理システム、画像管理装置、及びプログラム
JP2017134825A (ja) * 2015-12-30 2017-08-03 トムソン ライセンシングThomson Licensing 視聴覚データを含むコンテンツを選択するための方法、ならびに対応する電子装置、システム、コンピュータ読取り可能なプログラム、およびコンピュータ読取り可能な記憶媒体
JP2017175600A (ja) * 2016-03-18 2017-09-28 株式会社リコー 画像処理装置、画像処理方法及びプログラム
JP2019109703A (ja) * 2017-12-18 2019-07-04 トッパン・フォームズ株式会社 文書検索装置、文書検索方法、及びプログラム

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4114959B2 (ja) * 1995-06-20 2008-07-09 キヤノン株式会社 画像処理方法及び装置
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
JP3604902B2 (ja) * 1998-04-10 2004-12-22 キヤノン株式会社 画像処理装置
US6456732B1 (en) * 1998-09-11 2002-09-24 Hewlett-Packard Company Automatic rotation, cropping and scaling of images for printing
JP4078806B2 (ja) * 1998-10-26 2008-04-23 ソニー株式会社 画像処理装置、画像処理方法、学習装置および学習方法
US6868183B1 (en) 1999-04-01 2005-03-15 Kabushiki Kaisha Toshiba Image processing apparatus, image forming apparatus, and image processing method depending on the type of original image
US6674901B1 (en) * 1999-04-21 2004-01-06 Hewlett-Packard Development Company, L.P. Document analysis system and method
JP4450888B2 (ja) * 1999-05-28 2010-04-14 富士通株式会社 帳票認識方法
JP4310023B2 (ja) * 1999-06-17 2009-08-05 キヤノン株式会社 縮小画像作成方法及び装置、記憶媒体
JP3594228B2 (ja) * 1999-07-01 2004-11-24 シャープ株式会社 枠消し装置、枠消し方法、およびオーサリング装置
JP3756719B2 (ja) * 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
US6647144B2 (en) * 2000-12-04 2003-11-11 Xerox Corporation Detection and verification of scanning attributes
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
WO2003025713A2 (en) * 2001-09-21 2003-03-27 A.B. Dick Company Optical to digital prepress workflow system and method
DE10162559B4 (de) * 2001-12-19 2006-08-10 Siemens Ag Verfahren und Vorrichtung zur Unterdrückung von periodischen Störsignalen
JP4227426B2 (ja) * 2002-02-13 2009-02-18 キヤノン株式会社 データ処理方法、プログラム及び情報処理装置
JP2003259110A (ja) * 2002-02-28 2003-09-12 Fujitsu Ltd 画像結合装置、その方法、プログラム
US20040075679A1 (en) * 2002-04-25 2004-04-22 Carter Kris O. Guest interface appliance
KR20040069865A (ko) * 2003-01-30 2004-08-06 삼성전자주식회사 영상화면 내의 글자영역 확장장치 및 방법
US7496560B2 (en) * 2003-09-23 2009-02-24 Amazon Technologies, Inc. Personalized searchable library with highlighting capabilities
US7149353B2 (en) * 2003-09-23 2006-12-12 Amazon.Com, Inc. Method and system for suppression of features in digital images of content
WO2005031526A2 (en) * 2003-09-23 2005-04-07 Amazon.Com, Inc. Personalized searchable library based on user ownership
JP4165435B2 (ja) * 2004-04-13 2008-10-15 富士ゼロックス株式会社 画像形成装置およびプログラム
JP4232679B2 (ja) * 2004-04-15 2009-03-04 富士ゼロックス株式会社 画像形成装置およびプログラム
JP4651986B2 (ja) * 2004-06-04 2011-03-16 株式会社リコー 情報埋め込み装置、およびプログラム
JP4227569B2 (ja) * 2004-07-07 2009-02-18 キヤノン株式会社 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体
JP2006023944A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP2006025129A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP2006023945A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP4208780B2 (ja) * 2004-07-07 2009-01-14 キヤノン株式会社 画像処理システム及び画像処理装置の制御方法並びにプログラム
US20060230341A1 (en) * 2005-03-16 2006-10-12 Kabushiki Kaisha Toshiba Image editing apparatus and image editing method
US8010894B2 (en) * 2005-05-18 2011-08-30 Microsoft Corporation Memory optimizing for re-ordering user edits
US20090049104A1 (en) * 2005-06-08 2009-02-19 William Pan Method and system for configuring a variety of medical information
JP4574457B2 (ja) * 2005-06-08 2010-11-04 キヤノン株式会社 画像処理装置およびその方法
JP4591230B2 (ja) * 2005-06-23 2010-12-01 富士ゼロックス株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4591229B2 (ja) * 2005-06-23 2010-12-01 富士ゼロックス株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US8744217B2 (en) 2006-03-07 2014-06-03 Adobe Systems Incorporated Contextual variable attribute scaling
US8026923B1 (en) * 2006-03-07 2011-09-27 Adobe Systems Incorporated Contextual variable attribute scaling
JP2007272622A (ja) * 2006-03-31 2007-10-18 Brother Ind Ltd 画像処理装置
JP4151724B2 (ja) * 2006-10-04 2008-09-17 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP4123299B1 (ja) * 2007-02-21 2008-07-23 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US20080295013A1 (en) * 2007-05-21 2008-11-27 Justsystems Evans Research, Inc. Method and apparatus for performing semantically informed text operations
US20080294425A1 (en) * 2007-05-21 2008-11-27 Justsystems Evans Research, Inc. Method and apparatus for performing semantic update and replace operations
US20080294427A1 (en) * 2007-05-21 2008-11-27 Justsystems Evans Research, Inc. Method and apparatus for performing a semantically informed merge operation
US20080294426A1 (en) * 2007-05-21 2008-11-27 Justsystems Evans Research, Inc. Method and apparatus for anchoring expressions based on an ontological model of semantic information
US9547799B2 (en) * 2008-07-17 2017-01-17 Sharp Laboratories Of America, Inc. Methods and systems for content-boundary detection
JP5247311B2 (ja) * 2008-08-29 2013-07-24 キヤノン株式会社 電子文書処理装置および電子文書処理方法
JP5298831B2 (ja) * 2008-12-19 2013-09-25 富士ゼロックス株式会社 画像処理装置及びプログラム
JP2010198203A (ja) * 2009-02-24 2010-09-09 Fuji Xerox Co Ltd 情報処理装置及びプログラム
US8873864B2 (en) * 2009-12-16 2014-10-28 Sharp Laboratories Of America, Inc. Methods and systems for automatic content-boundary detection
US20110314361A1 (en) * 2010-06-21 2011-12-22 Microsoft Corporation Generating recommendations for improving a presentation document
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
JP2017151768A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置
US9824288B1 (en) 2016-05-04 2017-11-21 Bank Of America Corporation Programmable overlay for negotiable instrument electronic image processing
JP6531738B2 (ja) * 2016-08-08 2019-06-19 京セラドキュメントソリューションズ株式会社 画像処理装置
US10635743B2 (en) * 2018-03-12 2020-04-28 Microsoft Technology Licensing, Llc Automatic extraction of document page numbers from PDF
US10764448B1 (en) * 2019-04-24 2020-09-01 Kyocera Document Solutions Inc. Information processing apparatus and image forming apparatus performing file conversion of handwriting comment and comment extraction method
CN111275139B (zh) * 2020-01-21 2024-02-23 杭州大拿科技股份有限公司 手写内容去除方法、手写内容去除装置、存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6175477A (ja) * 1984-09-21 1986-04-17 Hitachi Ltd フアイリング方式
JPS6395577A (ja) * 1986-10-13 1988-04-26 Canon Inc 文書入出力システム
JPH0260371A (ja) * 1988-08-26 1990-02-28 Fuji Photo Film Co Ltd 画像処理装置の画像領域検出方法および装置
JPH0314184A (ja) * 1989-06-13 1991-01-22 Fuji Xerox Co Ltd 文書画像再配置ファイリング装置
JPH03233786A (ja) * 1990-02-09 1991-10-17 Oki Electric Ind Co Ltd 画像分割処理装置
JPH04105178A (ja) * 1990-08-24 1992-04-07 Seiko Epson Corp 文書画像処理装置
JPH0512398A (ja) * 1990-12-28 1993-01-22 Mutoh Ind Ltd 画像編集方法および装置
JPH0535842A (ja) * 1991-07-31 1993-02-12 Toshiba Corp 画像記憶装置
JPH0696134A (ja) * 1992-09-09 1994-04-08 Kokusai Denshin Denwa Co Ltd <Kdd> 画像検索方式

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6175477A (ja) * 1984-09-21 1986-04-17 Hitachi Ltd フアイリング方式
JPS6395577A (ja) * 1986-10-13 1988-04-26 Canon Inc 文書入出力システム
JPH0260371A (ja) * 1988-08-26 1990-02-28 Fuji Photo Film Co Ltd 画像処理装置の画像領域検出方法および装置
JPH0314184A (ja) * 1989-06-13 1991-01-22 Fuji Xerox Co Ltd 文書画像再配置ファイリング装置
JPH03233786A (ja) * 1990-02-09 1991-10-17 Oki Electric Ind Co Ltd 画像分割処理装置
JPH04105178A (ja) * 1990-08-24 1992-04-07 Seiko Epson Corp 文書画像処理装置
JPH0512398A (ja) * 1990-12-28 1993-01-22 Mutoh Ind Ltd 画像編集方法および装置
JPH0535842A (ja) * 1991-07-31 1993-02-12 Toshiba Corp 画像記憶装置
JPH0696134A (ja) * 1992-09-09 1994-04-08 Kokusai Denshin Denwa Co Ltd <Kdd> 画像検索方式

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339244A (ja) * 1999-05-31 2000-12-08 Canon Inc データ通信装置及びその方法
JP4532622B2 (ja) * 1999-05-31 2010-08-25 キヤノン株式会社 データ通信装置及びその方法
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US7715625B2 (en) 2004-04-01 2010-05-11 Fuji Xerox Co., Ltd. Image processing device, image processing method, and storage medium storing program therefor
JP2005346586A (ja) * 2004-06-04 2005-12-15 Canon Inc 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
US8174724B2 (en) 2004-06-10 2012-05-08 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
US7593120B2 (en) 2004-06-10 2009-09-22 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
JP2007013924A (ja) * 2005-06-01 2007-01-18 Ricoh Co Ltd 画像処理装置、プログラムおよび画像処理方法
US8125683B2 (en) 2005-06-01 2012-02-28 Ricoh Company, Ltd. Image preview processing apparatus, image preview processing method, and image preview computer product
JP2007166541A (ja) * 2005-09-01 2007-06-28 Canon Inc 画像処理方法およびその装置
JP2007110679A (ja) * 2005-09-16 2007-04-26 Ricoh Co Ltd 画像表示装置、画像表示方法、その方法をコンピュータに実行させるプログラム、および画像表示システム
JP2007110440A (ja) * 2005-09-16 2007-04-26 Ricoh Co Ltd 画像表示装置、画像表示方法、画像形成装置、画像形成方法、および、それらの方法をコンピュータに実行させるプログラム
JP2007082021A (ja) * 2005-09-16 2007-03-29 Ricoh Co Ltd 画像処理装置、プログラムおよび画像データ処理方法
US7899246B2 (en) 2005-09-16 2011-03-01 Ricoh Company, Limited Image display device, image display method, and computer product
JP2007150858A (ja) * 2005-11-29 2007-06-14 Ricoh Co Ltd 文書編集装置、画像形成装置、文書編集方法、およびその方法をコンピュータに実行させるプログラム
US8139257B2 (en) 2005-11-29 2012-03-20 Ricoh Company, Ltd. Document editing apparatus, image forming apparatus, document editing method, and computer program product
JP2006146971A (ja) * 2006-02-24 2006-06-08 Sharp Corp 画像特徴領域分割装置および画像特徴量計算装置
JP4611224B2 (ja) * 2006-02-24 2011-01-12 シャープ株式会社 画像特徴領域分割プログラムおよびコンピュータ読取可能な記録媒体
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
JP2008252862A (ja) * 2007-03-05 2008-10-16 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2009271691A (ja) * 2008-05-07 2009-11-19 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
US8965125B2 (en) 2008-06-30 2015-02-24 Canon Kabushiki Kaisha Image processing device, method and storage medium for storing and displaying an electronic document
US8571359B2 (en) 2008-06-30 2013-10-29 Canon Kabushiki Kaisha Image processing device, method and storage medium for storing and displaying an electronic document
JP2010061453A (ja) * 2008-09-04 2010-03-18 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2011097538A (ja) * 2009-11-02 2011-05-12 Sharp Corp 画像処理装置、プログラム、記録媒体
US8363940B2 (en) 2010-03-09 2013-01-29 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium
WO2012032834A1 (ja) * 2010-09-09 2012-03-15 日本デジタルオフィス株式会社 文書閲覧システムおよびその制御方法
JP2012168832A (ja) * 2011-02-16 2012-09-06 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法及びプログラム
JP2014013490A (ja) * 2012-07-04 2014-01-23 Nippon Telegr & Teleph Corp <Ntt> 画像領域分割装置、その方法及びプログラム
JP2014220652A (ja) * 2013-05-08 2014-11-20 コニカミノルタ株式会社 画像編集装置、画像編集方法および画像編集プログラム
US9189776B2 (en) 2013-05-08 2015-11-17 Konica Minolta, Inc. Image editing device, image editing method, and non-transitory computer-readable recording medium encoded with image editing program
JP2014112934A (ja) * 2014-02-13 2014-06-19 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム、記録媒体
EP2933708A1 (en) 2014-04-17 2015-10-21 Fujitsu Limited Read determining device and method
US9740930B2 (en) 2014-04-17 2017-08-22 Fujitsu Limited Read determining device and method
JP2016082357A (ja) * 2014-10-15 2016-05-16 富士通株式会社 画像処理装置、画像処理プログラムおよび画像処理方法
CN105592244A (zh) * 2014-11-06 2016-05-18 京瓷办公信息系统株式会社 图像处理装置
JP2016143142A (ja) * 2015-01-30 2016-08-08 富士ゼロックス株式会社 画像管理システム、画像管理装置、及びプログラム
JP2015130712A (ja) * 2015-04-17 2015-07-16 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム、記録媒体
JP2017134825A (ja) * 2015-12-30 2017-08-03 トムソン ライセンシングThomson Licensing 視聴覚データを含むコンテンツを選択するための方法、ならびに対応する電子装置、システム、コンピュータ読取り可能なプログラム、およびコンピュータ読取り可能な記憶媒体
JP2017175600A (ja) * 2016-03-18 2017-09-28 株式会社リコー 画像処理装置、画像処理方法及びプログラム
JP2019109703A (ja) * 2017-12-18 2019-07-04 トッパン・フォームズ株式会社 文書検索装置、文書検索方法、及びプログラム

Also Published As

Publication number Publication date
JP3504054B2 (ja) 2004-03-08
US6043823A (en) 2000-03-28

Similar Documents

Publication Publication Date Title
JP3504054B2 (ja) 文書処理装置および文書処理方法
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7391917B2 (en) Image processing method
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4181892B2 (ja) 画像処理方法
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8339619B2 (en) System and image processing method and apparatus for re-using and re-editing images
US7433517B2 (en) Image processing apparatus and method for converting image data to predetermined format
US7532757B2 (en) Image processing apparatus, control method therefor, and program
JP4502385B2 (ja) 画像処理装置およびその制御方法
US20070237394A1 (en) Image processor for character recognition
US7805022B2 (en) Image processing apparatus, image processing method and computer program
JPH1186014A (ja) 文書画像表示方法および表示装置
JP2006025129A (ja) 画像処理システム及び画像処理方法
US8181108B2 (en) Device for editing metadata of divided object
JP2007129557A (ja) 画像処理システム
JPH08180068A (ja) 電子ファイリング装置
JP2005151455A (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP2006134042A (ja) 画像処理システム
JP2004334340A (ja) 画像処理方法及び装置
US10922538B2 (en) Information processing apparatus that determines whether a PDF file is searchable, and method and storage medium thereof
JP2007334437A (ja) 画像処理装置及び方法、並びにプログラム及び記憶媒体
JP2005208872A (ja) 画像処理システム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees