JP4065473B2 - 画像処理装置及び方法及び記憶媒体及びシステム - Google Patents

画像処理装置及び方法及び記憶媒体及びシステム Download PDF

Info

Publication number
JP4065473B2
JP4065473B2 JP13482599A JP13482599A JP4065473B2 JP 4065473 B2 JP4065473 B2 JP 4065473B2 JP 13482599 A JP13482599 A JP 13482599A JP 13482599 A JP13482599 A JP 13482599A JP 4065473 B2 JP4065473 B2 JP 4065473B2
Authority
JP
Japan
Prior art keywords
image
data
area
document
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13482599A
Other languages
English (en)
Other versions
JP2000332984A (ja
Inventor
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP13482599A priority Critical patent/JP4065473B2/ja
Priority to US09/570,611 priority patent/US7426054B1/en
Publication of JP2000332984A publication Critical patent/JP2000332984A/ja
Application granted granted Critical
Publication of JP4065473B2 publication Critical patent/JP4065473B2/ja
Priority to US12/198,498 priority patent/US7639388B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Facsimile Transmission Control (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像処理装置及び画像再生装置及びシステム及び方法及び記憶媒体、より詳しきは文書画像を読み取り処理する画像処理装置及び画像再生装置及びシステム及び方法及び記憶媒体に関するものである。
【0002】
【従来の技術】
従来、文書画像処理に関する技術としては、文書を光学的に入力し、全体の画像を印刷して出力する複写機や、文書を光学的に入力し、その文書画像を保存する文書データベースシステム、文書を光学的に入力し、ネットワーク或いは回線を介してその文書画像を出力するファクシミリ装置、文書を光学的に入力し、文字を認識してテキストコードを出力するOCR等の技術が存在する。
【0003】
【発明が解決しようとする課題】
しかしながら、これまでの技術ではデジタル化やネットワーク化に適応できなくなっている。つまり、入力機器と出力機器がネットワークで接続されるようになったことや、文書のカラー化等により、
1)入力文書画像をそのまま保存、配信したのでは、データ量が大きくなる。
2)文書画像を一律に圧縮したのでは再利用に適した画質を保つことができない。
3)白黒プリンターやカラープリンター等の出力機器の違いによっては出力画質が劣化する。
4)文字認識処理(OCR)を用いてテキストのみを配信すると図や写真等の情報の欠落がある。
5)OCRによって誤認識があった場合には、意味の欠落がある。
【0004】
という問題がクローズアップされるようになった。
【0005】
第1の発明はかかる問題点に鑑みなされたものであり、原稿のレイアウトを保持しながら、データ量を少なくでき、しかも、再生出力する際に画質劣化することを抑えることを可能ならしめる画像処理装置及び画像再生装置及びシステム及び方法及び記憶媒体を提供しようとするものである。
【0006】
また、第2の発明は、上記第1の発明に加えてセキュリティーに優れた画像処理装置及び画像再生装置及びシステム及び方法及び記憶媒体を提供しようとするものである。
【0007】
そして、第3の発明は、上記第1の発明に加えて、画像中のテキストについて自然言語の違いを吸収できる画像処理装置及び画像再生装置及びシステム及び方法及び記憶媒体を提供しようとするものである。
【0008】
【課題を解決するための手段】
上記課題を解決するため、例えば第1の発明の課題を解決する画像処理装置は以下の構成を備える。すなわち、
文書の多値画像データ入力する入力手段と、
前記入力した多値画像データから二値画像データを生成する二値画像生成手段と、
前記生成した二値画像データ属性毎の領域に分割し、当該分割された各領域のレイアウト情報を生成するレイアウト解析手段と、
前記分割された領域のうち文字を含む属性の領域の部分画像について文字認識する文字認識手段と、
前記レイアウト解析手段で生成されたレイアウト情報に基づいて、文字を含む属性の領域の面積と文字を含まない属性の領域の面積と前記文書全体の面積とを算出し、当該算出された結果に基づいて、前記文書のレイアウトタイプがテキスト系であるかピクチャー系であるかを判断するレイアウトタイプ判断手段と、
前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがピクチャー系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記二値画像データから対応する領域の部分画像を切り取り、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、当該切り取られた各領域に対応する部分画像のデータを保存する第1保存手段と、
前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがテキスト系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記文字認識手段で認識した当該領域の文字認識データを選択し、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、前記選択された文字認識データと前記切り取られた部分画像のデータとを保存する第2保存手段と、
前記第1保存手段あるいは前記第2保存手段で保存されたデータ出力する出力手段とを備える。
【0009】
【発明の実施の形態】
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
【0010】
[第1の実施形態]
図1は第1の実施形態における構成概念とデータの流れを示す図である。
【0011】
同図において、101は入力される対象となる印刷物やコンピュータ上で扱う画像データ等を含む入力文書、102は文書を画像データとして入力する画像入力部(例えばイメージスキャナ)、103は画像入力部から入力された元画像データ、104は入力文書画像から二値画像を作成する二値化処理部、105は作成された二値画像データ、106は二値画像105をもとにして文書を、図、テキスト、表等の各種属性毎の領域に分割した情報、すなわちレイアウト解析データを出力するレイアウト解析部、107はレイアウト解析データである。
【0012】
また、108はレイアウト解析データをもとにして、二値画像の任意の領域の文字を認識しコード情報等を文字認識データとして出力する文字認識部、109は文字認識データ、110はレイアウト解析データをもとにして、入力文書元画像及び二値画像から適応的に保存条件を変更しながら画像データおよび文字認識データを文書画像理解データとして保存する文書画像理解データ保存部、111は文書画像理解データを出力する文書画像理解データ出力部、112は文書画像理解データ、113は文書画像理解データを入力する文書画像理解データ入力部、114は文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する文書画像理解再生部、115は再生文書画像、116は再生文書画像を出力する画像出力部、117は出力文書である。
【0013】
また、図2は第1の実施形態を表わすシステム装置構成の例を示している。
【0014】
同図において、201は文書画像理解処理(例えば図1における文書画像理解データ出力部111までの処理)を行うコンピュータ、202はデータを保存する記憶装置、203は画像入力を専用的に行うスキャナ、204はカラープリンタ、205はファクシミリ、206はカラー画像の入力及びプリント出力を複合的に行うデジタルカラー複写機(カラースキャナとカラープリンタとしての機能を有する)、207はプリンタを管理するプリンタサーバ、208はモノクロプリンタ、209はデータベースを管理するファイルサーバ、210はデータべ−ス、211はモノクロ画像の入力及びプリント出力を複合的に行うデジタル複写機、212は各デジタル機器間を接続するネットワークである。
【0015】
次に処理の流れについて図3乃至図10のフローチャート、及び図1、図2、図14乃至図17に従って説明する。
【0016】
本実施形態では、原稿画像を24ビット(RGBそれぞれ8ビット)多値画像データとしてスキャナ(203や206)より入力し、ネットワークで配信して、配信先でモノクロプリンター(208や211あるいは205)に出力する場合の画像理解処理システムについて説明する。
【0017】
まず、コンピュータ201は、図3のステップS301において、画像入力部102(図1におけるスキャナ203)より文書画像を多値画像として入力する。
【0018】
次に、ステップS302で、二値化処理部104により二値画像を作成する。二値画像の作成方法は、読み取った画像データRGB(各8ビット)から輝度成分を算出し、その算出した輝度を所定の閾値と比較することで行うものとする。
【0019】
ステップS303では、こうして作成された二値画像をもとに、レイアウト解析部106により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。レイアウト情報は、図15(a)に示す如く、1ページの原稿画像に対し、複数の矩形領域(部分画像)が設定され、部分画像の個数のデータが格納される。各部分画像は、識別情報(レイアウト領域ID)、切り取り幅、高さ、画像タイプ、圧縮方式、画像サイズ、そして切り取り画像データで構成されている。画像タイプには、同図(b)の如く、二値画像か24ビット多値画像かを識別情報、圧縮方式は同図(c)の如くMMR,JPEG等がある。なお、画像タイプ、圧縮方式の種類及び数はこれ以外であっても良いのは勿論である。
【0020】
次にステップS304においてテキストや表等の文字を含む領域の文字画像に対し文字認識(文字認識)処理を行い、ステップS305で、文書画像理解データ保存部(108)においてレイアウト解析データをもとにして、文字認識データならびに、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。
【0021】
ここで、具体的な文書画像理解データ保存処理の例を図5、図6、図7,図8のフローチャートに沿って説明する。
【0022】
本例では、文書画像理解データ保存処理(S305)に入ると、まずステップS501で各分割領域のレイアウト解析データを分析して各領域の領域属性ならびに文書レイアウトタイプを分類する。
【0023】
文書タイプの分類の例については図6に一例を示す。
【0024】
まず、ステップS601において、文書全体の面積(AS1)を算出する。
【0025】
次にステップS602において、領域属性が『テキスト』および『表』の領域面積の総和(DS1)を算出し、ステップS603において、総和面積(DS1)が文書全体の面積(AS1)に対して、あらかじめ定めた割合(TS1[%])より大である。すなわち
DS1>AS1×TS1/100
であれば、その文書は「テキスト系」レイアウト文書と判断する(ステップS604)。
【0026】
また、ステップS603において、テキスト系と判断されない場合に、領域属性『線図形』および『絵、写真』の領域面積の総和(PS1)を算出し(ステップS605)、ステップS606において、先に算出した『テキスト』および『表』の領域面積の総和(DS1)が領域属性『線図形』および『絵、写真』の総和面積(PS1)よりも大の場合、
すなわち
DS1>PS1
であれば、その文書は「テキスト系」レイアウト文書と判断する。(ステップS604)
上記以外の場合であれば、ステップS607において、その文書は「ピクチャー系」レイアウト文書と判断する。
【0027】
図5に戻って、上記のようにして文書レイアウトタイプが決定されると、ステップS502に進み、それぞれのレイアウトタイプによって分岐する。文書レイアウトタイプが「ピクチャー系」である場合は、ステップS503において、ピクチャー系文書画像理解データ保存処理を行う。
【0028】
図7を用いて、このピクチャー系文書画像理解データ保存処理について更に詳細に説明する。
【0029】
ピクチャー系文書画像理解データ保存処理においてはまず、ステップS701で各分割領域のレイアウト解析データを再度分析して、次に、ステップS702において領域属性が『テキスト』であれば、ステップS703で切り取り先全体画像として二値画像を選択し、ステップS705でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0030】
また、ステップS702において、領域属性が『テキスト』でなかった場合は、ステップS704において切り取り先全体画像として元画像である多値画像を選択し、ステップS705でレイアウト解析データの領域の座標データを用いてその部分画像である多値画像を切り取る。
【0031】
次にステップS706において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS707において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS709において文書画像理解データ(図14)として保存処理を行う。
【0032】
このとき、文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0033】
また、ステップS706において調べた結果が、多値画像タイプであったならば、ステップS708において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS709において文書画像理解データ(図14)として保存処理を行う。
【0034】
さらに詳細な本例の文書画像理解データの例は、図14、図15および図16に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像情報として保存する。
【0035】
次にステップS710において残りの分割領域が存在しているか否かを調べ、存在していればステップS701に戻り、残りの分割領域について上記の処理を繰り返し、全ての分割領域に対して行うと、文書画像理解データ保存処理を終了する。
【0036】
図5に戻る。同図のステップS502において文書レイアウトタイプが「テキスト系」である場合は、処理はステップS504に進み、テキスト系文書画像理解データ保存処理を行う。
【0037】
この文書タイプがテキスト系の場合の文書画像理解保存処理を図8のフローチャート、及び図13,15に従って説明する。
【0038】
本例では、文書画像理解保存処理(図3のステップS305)に入ったら、まずステップS801で各分割領域のレイアウト解析データを再度分析して各領域の領域属性を求める。
【0039】
次に、ステップS802において領域属性が『テキスト』であれば、ステップS803でその領域の文字認識データを選択し、ステップS804でその文字認識データを文書画像理解データとして(図14)として保存する。
【0040】
さらに詳細な本例の文書画像理解データの例は、図17に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、行数、行間隔、第一位から第n位までの文字コード、第一位から第n位までの文字認識距離、文字フォントタイプ、文字サイズ、文字位置の座標、不確実フラグ、等を文字認識データとして保存する。
【0041】
また、ステップS802で領域属性が『テキスト』でなかった場合は、ステップS805において切り取り先全体画像として元画像を選択し、ステップS806でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0042】
ステップS807において、本例の場合、元画像は多値画像であると判定されるので、ステップS808において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS809において文書画像理解データ(図14)として保存処理を行う。
【0043】
このとき、文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0044】
さらに詳細な本例の文書画像理解データの例は、図16に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像情報として保存する。
【0045】
次にステップS810において残りの分割領域が存在しているか否かを調べ、存在していればステップS801に戻り、残りの分割領域について上記の処理を繰り返す。残りの分割領域が存在していなければ、文書画像理解保存処理を終了する。
【0046】
以上のようにして、文書画像に対するレイアウトタイプ毎の理解データが保存されると、処理は図5のステップS505に進み、保存された文書画像理解データを出力する。
【0047】
さらに、本実施形態では文書画像理解データ保存部(110)において作成・保存された文書画像理解データは文書画像理解データ出力部(111)によりネットワーク上に出力され、ネットワークを介して利用先に配信される。
【0048】
利用先(クライアントでもある)では、図4に示すように、ステップS401において文書画像理解データ入力部(113)により文書画像理解データを入力し、ステップS402において文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する。
【0049】
この具体的な文書画像理解データ再生処理の例を図9に従って説明する。
【0050】
まず、ステップS901において再生文書画像の下地となる画像を白い下地となるように作成する。
【0051】
次に、ステップS902において文書画像理解データを分析し、ステップS903で、部分領域属性の検査を行い、属性が『テキスト』であるならば、ステップS904において文字認識データが存在するか否かを検査する。
【0052】
文字認識データが存在するならば、ステップS905において文書画像理解データから文字認識データ(文字コードを含む)を取り出し、ステップS906で、取り出した文字認識データから文字フォントを白い下地画像と合成し再生画像を作成する。
【0053】
また、ステップS903の検査で部分領域の属性が非『テキスト』であるか、ステップS904の検査で文字認識データが存在しないならば、ステップS907において文書画像理解データから部分領域の画像データを取り出し、ステップS908において、取り出した部分画像とその座標データから白い下地画像と合成し再生画像を作成する。
【0054】
再生画像合成処理(ステップS908)の一例としては、図10に示すように、ステップS1001において文書画像理解データから部分画像の画像タイプを抽出し、ステップS1002において、画像タイプが『二値画像タイプ』であれば、ステップS1003において、二値画像の黒、白画素をそれぞれ24ビット多値画像の黒、白画素に変換する疑似24ビット化の処理を行う。
【0055】
本例では、二値画像の黒画素は1、白画素は0、24ビット多値画像の黒画素は、R=0,G=0,B=0であり、白画素はR=255,G=255,B=255(RはRed成分、GはGreen成分、BはBlue成分で各8ビットの値を持つ。)としている。
【0056】
またステップS1002において、画像タイプが『24ビット多値画像タイプ』であればそのままの部分画像を合成に用いる。
【0057】
つぎに、ステップS1004において下地画像と部分画像に対し部分画像の各画素の論理演算を行い合成画像を作成する。
【0058】
本例では、下地画像の白画素(R=255,G=255,B=255)と部分画像の黒画素(R=0,G=0,B=0)の合成画像が黒画素(R=0,G=0,B=0)となるように論理演算を用いている。
【0059】
以上のような処理によって1つの部分画像に対して再生合成処理(S908)を終了したら、ステップS909において残りの部分領域が存在しているか否かを調べ、存在していればステップS902に戻り、残りの部分領域について上記の処理を繰り返す。残りの部分領域が存在していなければ、文書画像理解データ再生処理を終了する。
【0060】
図4に戻って、上記のようにして再生処理が行われると、ステップS403において画像出力部(116)であるモノクロプリンターから再生画像を出力文書として出力する。
【0061】
[第2の実施形態]
文書画像理解データ保存処理(ステップS305)において、レイアウト解析結果で領域属性がテキストとなった文書でも、画像の状態が文字認識処理に不適切な状態(ノイズ存在や、低解像度画像等)である場合に、不確実な文字認識データではなく確実な画像データを保存することも可能である。
【0062】
以下に具体的な文書画像理解データ保存処理の他の例を図11のフローチャートにしたがって説明する。
【0063】
本例では、文書画像理解データ保存処理(ステップS305)に入ったら、まずステップS1101で各分割領域のレイアウト解析データを分析して各領域の領域属性ならびに文書レイアウトタイプを分類する(図6)。
【0064】
ここで、ステップS1102においてピクチャー系文書レイアウトと判定された場合は、ステップS1106においてピクチャー系文書レイアウトとして文書画像理解データ保存処理(図7)を実行する。
【0065】
また、ステップS1102においてテキスト系文書レイアウトと判定された場合は、ステップS1103において全体文字認識信頼度(ZNr)を算出する。
【0066】
全体文字認識信頼度の一例としては、各文字ごとの認識演算結果である認識距離値(D)が、あらかじめ定めた閾値(Td)未満である場合、
すなわち
D<Td
である場合にその文字に対して不確実な文字であるとして文字認識データの不確実フラグを有効(=“1”)にし、その不確実フラグが有効でない(=“0”)文字数の和(n)を求め、全体の文字数(N)に対する割合(n/N)を全体文字認識信頼度(ZNr)としている。
すなわち
ZNr=n/N
として求める。
【0067】
次にステップS1103において、全体文字認識信頼度(ZNr)を検査し、全体文字認識信頼度があらかじめ定めた閾値(Tr)より大、
すなわち
ZNr>Tr
であればOKとし、ステップS1105においてテキスト系文書レイアウトとして文書画像理解データ保存処理(図8)を実行する。
【0068】
また、
ZNr≦Tr
であればNGとし、ステップS1106においてピクチャー系文書レイアウトとして文書画像理解データ保存処理(図7)を実行する。
【0069】
以上の結果、原稿文書の品位が悪い、或いはそこに印刷されている文字品位が悪い場合には、誤認識される率が高くなるので、認識結果を保存せず、ピクチャー系文書とすることが可能になる。従って、クライアント側で再生する場合にはオリジナルの原稿画像に忠実な再生が可能になる。
【0070】
[第3の実施形態]
文書画像理解データ保存処理(ステップS305)において、レイアウト解析結果で領域属性がテキストとなった文書でも、部分領域毎に画像の状態が文字認識処理に不適切な状態(ノイズ存在や、低解像度画像等)であるか否かを判断し、不適切な画像と判断した場合に、不確実な文字認識データだけではなく確実な画像データをも併せて保存することも可能である。
【0071】
以下に具体的な文書画像理解データ保存処理の例を図12のフローチャートにしたがって説明する。
【0072】
本例では、文書画像理解データ保存処理(ステップS305)に入ったら、まず図5のように各分割領域のレイアウト解析データを分析して各領域の領域属性ならびに文書レイアウトタイプを分類する。
【0073】
つぎにテキスト系文書レイアウトと判断された場合に、ステップS1201においてレイアウト解析データを再度分析し、ステップS1202で部分領域属性の検査を行い、属性が『テキスト』であるならば、ステップS1203で文字認識データを選択し、ステップS1204で文字認識データ保存処理を行った上、さらにステップS1205で部分領域の文字認識信頼度(ZMr)を算出する。
【0074】
部分領域文字認識信頼度の一例としては、各文字ごとの認識演算結果である認識距離値(D)が、あらかじめ定めた閾値(Td)未満である場合、
すなわち
D<Td
である場合にその文字に対して不確実な文字であるとして文字認識データの不確実フラグを有効(1)にし、その部分領域内における、不確実フラグが有効でない(0)文字数の和(m)を求め、その領域内の文字数(M)に対する割合(m/M)を部分領域文字認識信頼度(ZMr)として用いる。
すなわち
ZMr=m/M
として求める。
【0075】
次にステップS1206において、部分領域文字認識信頼度(ZMr)を検査し、部分領域文字認識信頼度があらかじめ定めた閾値(Tr)より大、
すなわち
ZMr>Tr
であればOKとし、画像データの保存処理は実行せずに、ステップS1214において残りの部分領域が存在しているか否かを調べ、存在していればステップS1201に戻り、残りの部分領域について上記の処理を繰り返す。
【0076】
残りの部分領域が存在していなければ、文書画像理解データ保存処理を終了する。
また、
ZMr≦Tr
であればNGとし、ステップS1207以降における画像データ保存処理を実行する。
【0077】
[第4の実施形態]
文書画像理解再生処理時に文字認識データの信頼度に応じて文字フォントを合成するか、領域文字画像を合成するかを適応的に選択し処理することも可能である。
【0078】
以下に処理の流れについて図4,図13のフローチャートに従って説明する。
【0079】
本例では部分領域毎に文字認識信頼度を求め文字フォントで出力するか領域画像で出力するかを選択する。また、文書画像領域データとして文字認識データおよび画像データの両方を持っているものとする。
【0080】
本例ではまず、文書画像理解データの再生利用先において、ステップS401において文書画像理解データ入力部(113)により文書画像理解データを入力し、ステップS402において文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する。
【0081】
この文書画像理解データ再生処理について図13のフローチャートで説明する。
【0082】
ステップS1301において再生文書画像の下地となる画像を白い下地となるように作成する。
【0083】
次に、ステップS1302において文書画像理解データを分析し、ステップS1303で、部分領域の属性が『テキスト』であるならば、ステップS1304で、文字認識データの検査を行い、文字認識データがあるのであれば、ステップS1305で文書画像理解データから文字認識データを取り出し、ステップS1306において文字認識信頼度を調べる。
【0084】
本例における文字認識信頼度の調べ方の一例としては、部分領域の文字認識データの不確実フラグの割合を用いるものとする。
【0085】
具体的には、その部分領域内における、不確実フラグが有効でない(0)文字数の和(m)を求め、その領域内の文字数(M)に対する割合(m/M)を部分領域文字認識信頼度(ZMr)としている。
すなわち
ZMr=m/M
として求める。
【0086】
次にステップS1307において、部分領域文字認識信頼度(ZMr)を検査し、部分領域文字認識信頼度があらかじめ定めた閾値(Tr2)より大、
すなわち
ZMr>Tr2
である場合、ステップS1308で、取り出した文字認識データから文字フォントを白い下地画像と合成し再生画像を作成する。
【0087】
もし、文字認識信頼度があらかじめ定めた閾値以下であるならば文書画像理解データから部分画像データを取り出し、ステップS1309において、取り出した部分画像とその座標データから白い下地画像と合成し再生画像を作成する。
【0088】
また、ステップS1303で、部分領域の属性が非『テキスト』である場合も文書画像理解データから部分画像データを取り出し、ステップS1304において、取り出した部分画像とその座標データから白い下地画像と合成し再生画像を作成する。
【0089】
以上のような処理によって1つの部分画像に対して再生合成処理(ステップS1309)を終了したら、ステップS1310において残りの部分領域が存在しているか否かを調べ、存在していればステップS1302に戻り、残りの部分領域について上記の処理を繰り返す。
【0090】
残りの部分領域が存在していなければ、文書画像理解データ再生処理を終了する。
【0091】
そして、ステップS403において画像出力部(ステップ114)から、合成した1ページの再生画像を出力文書として出力する。
【0092】
以上説明したように第1乃至第4の実施形態によれば、
1)文書画像の保存時における、データ量の削減、
2)文書画像の配信時における、ネットワークトラフィックへの負荷軽減、
3)文書画像の保存、配信時における、再利用に適した高画質の維持、
4)出力時の文書画像の画質劣化や情報欠落の防止、
5)DTP(デスクトップパブリッシング)等の電子文書への再利用の容易化、
等がはかれる効果がある。
【0093】
[第5の実施形態]
上記実施形態に加えて、本第5の実施形態では、セキュリティーを重視する例を説明する。
【0094】
図18は第5の実施形態における構成概念とデータの流れを示す図である。
【0095】
同図において、2101は入力される対象となる印刷物やコンピュータ上で扱う画像データ等を含む入力文書、2102は文書を画像として入力する画像入力部、2103は画像入力部から入力された元画像データ、2104は入力文書画像から二値画像を作成する二値画像出力部、2105は作成された二値画像、2106は二値画像をもとにして文書を図やテキストや表等の各種属性毎の領域に分割した情報すなわちレイアウト解析データを出力するレイアウト解析部、2107はレイアウト解析データ、2108はレイアウト解析データをもとにして、入力文書元画像及び二値画像から適応的に保存条件を変更しながら画像データ及び暗号化データを文書画像理解データとして保存する文書画像理解データ保存部、2109は文書画像理解データを出力する文書画像理解デーグ出力部、2110は文書画像理解データ、2111は文書画像理解データを入力する文書画像理解データ入力部、2112は文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する文書画像理解再生部、2113は再生文書画像、2114は再生文書画像を出力する画像出力部、2115は出力文書、2116は本第5の実施形態における特徴である、任意の領域の文字認識データならびに画像データを暗号化する暗号化処理部である。
【0096】
上記のデータの流れ及び処理が行われるシステムは、図2と同様である。
【0097】
次に処理の流れについて図19、図20、図21のフローチャート、及び図18、図2、図14、図15、図27、図28、図29に従って説明する。
【0098】
本実施形態でも、24ビット多値画像をスキャナ(203や206)より入力し、『テキスト』属性の領域に対して自動的に暗号化して保存し、ネットワークで配信して、配信先でモノクロプリンター(208や211あるいは205)に出力する場合の画像理解処理システムについて示す。
【0099】
まず、ステップS2301において、画像入力部(2102)であるスキャナより文書画像を多値画像データとして入力する。ステップS2302では、二値画像出力部(2104)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(2106)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報を出力する。このレイアウト情報は先に説明した第1の実施形態における図15と同様である。
【0100】
次に、ステップS2304で文書画像理解保存部(2108)においてレイアウト解析データをもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。その際に、あらかじめ定められた特定領域のデータの暗号化処理も行う。
【0101】
本実施形態では、『テキスト』領域の画像データを暗号化するものとする。
【0102】
文書画像理解保存処理の例を図20のフローチャート、及び図14、図15、図27に従って説明する。
【0103】
本例では、文書画像理解保存処理(ステップS2304)に入ったら、まずステップS2501で各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。
【0104】
次に、ステップS2502において領域属性が『テキスト』であれば、ステップS2503で切り取り先全体画像として二値画像を選択し、ステップS2504でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0105】
次にステップS2505で、その部分画像に対して暗号化処理を行い、暗号化データを作成し、ステップS506で、暗号化データを文書画像理解データとして保存する。
【0106】
さらに詳細な本例の文書画像理解データの例は図27に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび暗号化した切り取り画像を部分画像暗号化データとして保存する。この時暗号化フラグを有効(=1)にすることでデータが暗号化されていることを示すようにする。
【0107】
また、ステップS2502において、領域属性が非『テキスト』であるならば、ステップS2507で切り取り先全体画像として元画像を選択し、ステップS2508でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0108】
次にステップS2509において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS2510において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS2511において文書画像理解データ(図27)として保存処理を行う。
【0109】
この時文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0110】
また、ステップS2509において調べた結果が、多値画像タイプであったならば、ステップS2512において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS2511において文書画像理解データ(図27)として保存処理を行う。
【0111】
本例の文書画像理解データの例は図27に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0112】
次にステップS2513において残りの分割領域が存在しているか否かを調べ、存在していればステップS2501に戻り、残りの分割領域について上記の処理を繰り返す。
【0113】
残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。そして図19のステップS2305に進んで、文書画像理解データを出力する。
【0114】
ここで、本実施形態では文書画像理解保存部(2108)において作成・保存された文書画像理解データは文書画像理解データ出力部(2109)によりネットワーク上に出力され、ネットワークを介して利用先に配信される。
【0115】
利用先では、先の第1の実施形態で説明したように、図4のフローチャートに従って処理することになる。つまり、ステップS401において文書画像理解データ入力部(2111)により文書画像理解データを入力し、ステップS402において文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する。
【0116】
本第5の実施形態における具体的な文書画像理解再生処理(ステップS402)の例を図21のフローチャートに従って説明する。
【0117】
本例では、まず、ステップS2601において再生文書画像の下地となる画像を白い下地となるように作成する。次に、ステップS2602において文書画像理解データを分析し、ステップS2603で、部分領域の暗号化データにおける暗号化フラグが有効(=1)であるならば、ステップS2604で、文書画像理解データから暗号化データを取り出し、暗号化解除をおこない、部分画像に戻す。
【0118】
また、暗号化フラグが有効になっていないのであるならば、ステップS2605で文書画像理解データから画像データを取り出す。そして、ステップS2606において、取り出した部分画像とその座標データから白い下地画像と合成し再生画像を作成する。
【0119】
再生合成処理(ステップS2606)の一例としては、第1の実施形態で説明した図10のフローチャートに従うものである。
【0120】
つまり、ステップS1001において文書画像理解データから部分画像の画像タイプを抽出し、ステップ1002において、画像タイプが『二値画像タイプ』であれば、ステップS1003において、二値画像の黒、白画素をそれぞれ24ビット多値画像の黒、白画素に変換する疑似24ビット化の処理を行う。
【0121】
本例では、二値画像の黒画素は1、白画素は0、24ビット多値画像の黒画素は、R=0、G=0、B=0であり、白画素はR=255、G=255、B=255(RはRed成分、GはGreen成分、BはBlue成分で各8ビットの値を持つ。)としている。
【0122】
またステップS1002において、画像タイプが『24ビット多値画像タイプ』であればそのままの部分画像を合成に用いる。つぎに、ステップS1004において下地画像と部分画像に対し部分画像の各画素の論理演算を行い合成画像を作成する。
【0123】
本例では、下地画像の白画素(R=255,G=255、B=255)と部分画像の黒画索(R=0,G=0,B=0)の合成画像が黒画素(R=0,G=0,B=0)となるように論理演算を用いている。
【0124】
以上のような処理によって1つの部分画像に対して再生合成処理(S2606)を終了したら、ステップS2607において残りの部分画像が存在しているか否かを調べ、存在していればステップS2602に戻り、残りの部分領域について上記の処理を繰り返す。残りの部分領域が存在していなければ、文書画像理解データ再生処理を終了する。
【0125】
そして、図4のステップS403において画像出力部(2114)であるモノクロプリンターから再生画像を出力文書として出力する。
【0126】
[第6の実施形態]
上記第5の実施形態では、テキスト領域を暗号化させるものであったが、オペレータが選択した特定属性のみを暗号化させることも可能である。この例を第6の実施形態として説明する。
【0127】
具体例を図19を再度用い、更に図22、図23を用いて説明する。なお、図23は図18の変形例でもある。
【0128】
先ず、ステップS2301で画像入力部(2802)であるスキャナより文書画像を多値画像として入力する。
【0129】
次に、オペレータ指示部(2816)により、暗号化する領域属性を指示する。例えば、入力した画像を表示させ、その中の『表』属性の領域に対して暗号化するように指示する。
【0130】
次いで、ステップS302で、二値画像出力部(2804)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(2806)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。
【0131】
次に、ステップS2305で文書画像理解保存部(2808)においてレイアウト解析データならびにオペレータの指示をもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。
【0132】
さらに具体的な文書画像理解保存処理の例を図23のフローチャート、及び図14、図15、図27に従って説明する。
【0133】
本例では、文書画像理解保存処理(ステップS2305)に入ったら、まずステップS2901でオペレータが設定した属性をセットする。図30は、この時の表示画面の例を示しており、ウインドウ右上の暗号化指定のコンボボックスを指定し、その中で適当な領域属性について暗号化を指定することになる。ここでは、ペレータは『テキスト』を指示したものとする。設定するのはポインティングデバイス等を領域内を指定することで行えばよい。
【0134】
次にステップS2902で、各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。そして、ステップS2903において領域属性が暗号化対象として指定されたものであれば、つまり、上記の例の場合には『テキスト』であれば、ステップS2904で切り取り先全体画像として二値画像を選択し、ステップS2905でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0135】
さらに、ステップS2906で、その部分画像にたいして暗号化処理を行い、暗号化データを作成し、ステップS2907で、暗号化データを文書画像理解データとして保存する。
【0136】
この時暗号化フラグを有効(=1)にすることでデータが暗号化されていることを示している。
【0137】
また、ステップS2903において、領域属性が非暗号化領域を示す場合には、ステップS2908で切り取り先全体画像として元画像を選択し、ステップS2909でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0138】
次にステップS2910において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS2911において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS2913において文書画像理解データ(図27)として保存処理を行う。
【0139】
この時文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0140】
また、ステップS2910において調べた結果が、多値画像タイプであったならば、ステップS2912において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS2913において文書画像理解データ(図27)として保存処理を行う。
【0141】
さらに詳細な本例の文書画像理解データの例は、図27に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0142】
次にステップS2914において残りの分割領域が存在しているか否かを調べ、存在していればステップS2902に戻り、残りの分割領域について上記の処理を繰り返す。残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。こうして、ステップS2305で文書画像理解データを出力する。
【0143】
[第7の実施形態]
上記第6の実施形態では、属性毎に暗号化するしないを設定するものであったが、オペレータが入力時の画像およびレイアウト解析結果を確認し、その解析結果から所望とする領域を選択して暗号化を指示することも可能である。
【0144】
具体例を図19、図24、図25を用いて説明する。
【0145】
まず、ステップ2031で、画像入力部(3002)であるスキャナより文書画像を多値画像として入力する。
【0146】
次に、ステップS2302で、二値画像出力部(3004)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(3006)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。
【0147】
そのレイアウト情報はレイアウト解析データ表示部(3016)により入力画像と重ねて表示されることにより、オペレータは、オペレータ指示部(3017)において、ポインティングデバイス等で暗号化する領域を指示することが可能となる。図31は、この時の操作画面であり、適当な領域を先ず、指定し、その後でその領域について暗号化の設定を“ON”にしていることを示している。暗号化対象となった領域(図示の場合にはテキスト領域)は、他の領域と区別して表示することで操作者にどの領域が暗号化されることになるのかを知らしめる。
【0148】
次に、ステップS2305で文書画像理解保存部(3008)においてレイアウト解析データならびにオペレータの指示をもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。
【0149】
さらに具体的な文書画像理解保存処理の例を図25のフローチャート、及び図14、図15、図27に従って説明する。
【0150】
本例では、文書画像理解保存処理(ステップS2305)に入ったら、まずステップS3101でオペレータが設定した領域のIDをセットする。次にステップS3102で、各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。
【0151】
そして、ステップS3103において領域属性が『テキスト』であれば、ステップS3104で切り取り先全体画像として二値画像を選択し、ステップS3106でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0152】
また、ステップS3103において、領域属性が『テキスト』でないならば、ステップS3105で切り取り先全体画像として元画像を選択し、ステップS3106でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0153】
そして、ステップS3107で領域IDを検査し、暗号化対象領域か否かを調べる。
【0154】
暗号化対象領域であるならば、ステップS3108でその部分画像にたいして暗号化処理を行い、暗号化データを作成し、ステップS3109で、暗号化データを文書画像理解データとして保存する。
【0155】
この時暗号化フラグを有効(=1)にすることでデータが暗号化されていることを示している。
【0156】
また、ステップS3107で暗号化対象領域でないならば、ステップS3110において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS3111において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS3113において文書画像理解データ(図27)として保存処理を行う。
【0157】
この時文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0158】
また、ステップS3110において調べた結果が、多値画像(写真画像等の非2値画像)タイプであったならば、ステップS3112において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS3113において文書画像理解データ(図27)として保存処理を行う。
【0159】
文書画像理解データの例は、図27に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0160】
次にステップS3114において残りの分割領域が存在しているか否かを調べ、存在していればステップS3102に戻り、残りの分割領域について上記の処理を繰り返す。
【0161】
残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。こうして、ステップS2305で文書画像理解データを出力する。
【0162】
[第8の実施形態]
領域属性が『テキスト』など文字認識可能な領域の場合において、文字認識処理を用いて、画像データではなく文字認識データを保存する湯合や、画像データと文字認識データの両方を保存する場合等においても、文字認識データならびに画像データを暗号化することによって、暗号化データを保存することが可能である。
【0163】
以下に具体例を第8の実施形態として説明する。ここでは、一例として、『テキスト』の場合は文字認識結果を暗号化した暗号化データ、他の領域は画像データを保存させる例を、図18、図19、図26、図14、図15、図27、図28、図29を用いて説明する。
【0164】
まず、ステップS2301において、画像入力部(2102)であるスキャナより文書画像を多値画像として入力する。
【0165】
ステップS2302で、二値画像出力部(2104)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(2106)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。
【0166】
次に、ステップS2304で文書画像理解保存部(2108)においてレイアウト解析データをもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。
【0167】
その際に、あらかじめ定められた特定領域のデータの暗号化処理も行う。
【0168】
さらに具体的な文書画像理解保存処理の例を図26のフローチャート、及び図14、図15、図27、図28、図29に従って説明する。
【0169】
本例では、文書画像理解保存処理(ステップS2305)に入ったら、まずステップS3201で各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。そして、ステップS3202において領域属性が『テキスト』であれば、ステップS3203で認識用先全体画像として二値画像を選択し、ステップS3204でレイアウト解析データの領域の座標データを用いて部分画像に対して文字認識処理を行う。
【0170】
次に、ステップS3205において文字認識した結果の文字認識データを暗号化処理し、暗号化データを作成して、ステップS3206で、暗号化データを文書画像理解データ(図29)として保存する。ここで暗号化フラグが有効(=1)にすることは、そのデータが暗号化されていることを示している。
【0171】
また、ステップS3202において、領域属性が『テキスト』でないならば、ステップS3207で切り取り先全体画像として元画像を選択し、ステップS3208でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0172】
そして、ステップS3209において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS3210において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS3211において文書画像理解データ(図27)として保存処理を行う。
【0173】
この時文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0174】
また、ステップS3210において調べた結果が、多値画像タイプであったならば、ステップS3212において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS3211において文書画像理解データ(図27)として保存処理を行う。
【0175】
さらに詳細な本例の文書画像理解データの例は、図27に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0176】
次にステップS3213において残りの分割領域が存在しているか否かを調べ、存在していればステップS3201に戻り、残りの分割領域について上記の処理を繰り返す。残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。こうして、ステップS2305で文書画像理解データを出力する。
【0177】
なお、上記処理に更に、入力した多値画像を表示し、暗号化しようとする領域を指定していき、その中でテキスト領域についてはそのテキスト画像及び文字認識結果の両方を暗号化させるようにしてもよい。解読できるユーザ以外(解除できるキーを入力しなければ)は、その領域は「暗号化されているため表示できません」というメッセージを表示し、その領域をマウス等で指示したときに解除するキー入力を促すキー入力ダイアログボックスを表示し、設定された番号キーと一致した場合にそれを表示するようにする。なお、印刷する場合にも解除しなければその領域の印刷は行わない。
【0178】
以上説明したように第5乃至第8の実施形態によれば、
1)文書画像の保存時における、データ量の削減
2)文書画像の配信時における、ネットワークトラフィックへの負荷軽減
3)文書画像の保存、配信時における、再利用に適した高画質の維持
4)出力時の文書画像の画質劣化や情報欠落の防止
5)DTP(デスクトップパプリッシング)等の電子文書への再利用の容易化
6)文書画像の保存、配信時におけるセキュリテイーの向上
等がはかれる効果がある。
【0179】
[第9の実施形態]
本第9の実施形態では、例えば文書画像中のあるテキストの言語を他の言語に翻訳する機能を付加する例について説明する。
【0180】
図32は第9の実施形態における構成概念及びデータの流れを示している。
【0181】
同図において、4101は入力される対象となる印刷物やコンピュータ上で扱う画像データ等を含む入力文書、4102は文書を画像として入力する画像入力部、4103は画像入力部から入力された元画像データ、4104は入力文書画像から二値画像を作成する二値画像出力部、4105は作成された二値画像、4106は二値画像をもとにして文書を図やテキストや表等の各種属性毎の領域に分割した情報すなわちレイアウト解析データを出力するレイアウト解析部、4107はレイアウト解析データ、4108はレイアウト解析データをもとにして、入力文書元画像及び二値画像から適応的に保存条件を変更しながら画像データ、文字認識データ、および翻訳データを文書画像理解データとして保存する文書画像理解データ保存部である。
【0182】
4109は文書画像理解データを出力する文書画像理解デーグ出力部、4110は文書画像理解保存データ、4111は文書画像理解保存データを入力する文書画像理解データ入力部、4112は文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する文書画像理解再生部、4113は再生文書画像、4114は再生文書画像を出力する、画像出力部である。4115は出力文書、4116は任意の領域の文字を認識しコード情報等を文字認識データとして出力する文字認識処理部、4117は任意の種類の言語を他の任意の種類の言語に翻訳した情報を翻訳データとして出力する翻訳処理部(翻訳のための各種構文解析用の辞書等が含まれる)である。
【0183】
上記構成におけるシステムは図2と同様であるので、その説明は省略する。
【0184】
次に処理の流れについて図19、図4、図33、図10のフローチャート、及び図32、図2、図40、図15、図16、図17、図41に従って説明する。
【0185】
本第9の実施形態では24ビット多値画像をスキャナ(203や206)より入力し、『テキスト』属性の領域に対して自動的に翻訳処理して保存し、ネットワークで配信して、配信先でモノクロプリンター(208や211あるいは205)に出力する場合の画像理解処理システムについて示す。
【0186】
まず、ステップS2301において、画像入力部(4102)であるスキャナより文書画像を多値画像として入力する。
【0187】
ステップS2302で、二値画像出力部(4104)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(4106)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。
【0188】
次に、ステップS2304で文書画像理解保存部(4108)においてレイアウト解析データをもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。その際に、あらかじめ定められた特定領域のデータの文字認識処理ならびに翻訳処理も行う。
【0189】
本実施形態では、『テキスト』領域の画像データを文字認識し翻訳(日本語→英語)する例を示す。
【0190】
具体的な文書画像理解保存処理の例を図33のフローチャート、及び図40、図15、図16に従って説明する。
【0191】
本例では、文書画像理解保存処理(S2304)に入ったら、まずステップS4501で各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。
【0192】
そして、ステップS4502において領域属性が『テキスト』であれば、ステップS4503で認識用先全体画像として二値画像を選択し、ステップS4504でレイアウト解析データの領域の座標データを用いて部分画像に対して文字認識処理を行う。
【0193】
ステップS4505で文字認識データを文書画像理解データ(図16)として保存する。
【0194】
次に、ステップS4506において文字認識した結果の文字認識データを翻訳処理し、翻訳データを作成して、ステップS4507で翻訳データも文書画像理解データ(図41)として保存する。
【0195】
また、ステップS4502において、領域属性が『テキスト』でないならば、ステップS4508で切り取り先全体画像として元画像を選択し、ステップS4509でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0196】
そして、ステップS4510において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS4511において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS4513において文書画像理解データ(図16)として保存処理を行う。
【0197】
この時文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0198】
また、ステップS4510において調べた結果が、多値画像タイプであったならば、ステップS4512において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS4513において文書画像理解データ(図16)として保存処理を行う。
【0199】
本例の文書画像理解データの例も図15に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0200】
次にステップS4514において残りの分割領域が存在しているか否かを調べ、存在していればステップS4501に戻り、残りの分割領域について上記の処理を繰り返す。残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。こうして、ステップS2305で文書画像理解データを出力する。
【0201】
本実施形態では文書画像理解保存部(4108)において作成・保存された文書画像理解データは文書画像理解データ出力部(4109)によりネットワーク上に出力され、ネットワークを介して利用先に配信される。
【0202】
利用先では、先の第1の実施形態で説明した図4と同様の処理を行うことになる。
【0203】
先ず、ステップS401において文書画像理解データ入力部(4111)により文書画像理解データを入力し、ステップS402において文書画像理解データから適応的に再生条件を変更しながら再生文書画像を作成する。
【0204】
具体的な文書画像理解再生処理(S402)の例を図34、図10を用いて説明する。
【0205】
本例では、あらかじめ定めた言語の翻訳データがある場合は自動的に翻訳データを取り出し、再生する例を示す。
【0206】
まず、ステップS4601において再生文書画像の下地となる画像を白い下地となるように作成する。
【0207】
次に、ステップS4602において文書画像理解データを分析し、ステップS4603で、部分領域の属性が『テキスト』であるならば、ステップS4604で、文書画像理解データに翻訳データが存在するか否かを検査する。
【0208】
翻訳データが存在するならば、ステップS4605において、文書画像理解データから翻訳データを取り出し、ステップS4606で翻訳文を構成している文字コードに対応するフォントパターンを、白い下地画像と合成し再生画像を作成する。
【0209】
また、翻訳データが存在しないならば、ステップS4607において、文書画像理解データから原文の文字認識データを取り出す。
【0210】
ステップS4608において、取り出した原文を白い下地画像と合成し再生画像を作成する。
【0211】
また、ステップS4603において、部分領域の属性が『テキスト』でないのであれば、ステップS4609で文書画像理解データから画像データを取り出し、ステップS4610において、取り出した部分画像とその座標データから白い下地画像と合成し再生画像を作成する。
【0212】
再生合成処理(ステップS4610)の一例としては、第1の実施形態で説明した図10に従って処理すれば良い。つまり、ステップS1001において文書画像理解データから部分画像の画像タイプを抽出し、ステップS1002において、画像タイプが『二値画像タイプ』であれば、ステップS1003において、二値画像の黒、白画素をそれぞれ24ビット多値画像の黒、白画素に変換する疑似24ビット化の処理を行う。
【0213】
本例では、二値画像の黒画素は1、白画素は0であるとしたとき、それを24ビット多値画像の黒画素に対応させるため、黒画素はR=0、G=0、B=0とし、白画素はR=255、G=255、B=255(RはRed成分、GはGreen成分、BはBlue成分で各8ビットの値を持つ。)としている。
【0214】
またステップS1002において、画像タイプが『24ビット多値画像タイプ』であればそのままの部分画像を合成に用いる。
【0215】
つぎに、ステップS1004において下地画像と部分画像に対し部分画像の各画素の論理演算を行い合成画像を作成する。
【0216】
以上のような処理によって1つの部分画像に対して再生合成処理(図34のステップS4606,S4608,S4610)を終了したら、ステップS4611において残りの部分画像が存在しているか否かを調べ、存在していればステップS4602に戻り、残りの部分領域について上記の処理を繰り返す。
【0217】
残りの部分領域が存在していなければ、文書画像理解データ再生処理を終了する。
【0218】
次に、図4におけるステップS403において画像出力部(4114)であるモノクロプリンターから再生画像を出力文書として出力する。
【0219】
[第10の実施形態]
オペレータが入力時の画像およびレイアウト解析結果を確認し、その解析結果から特定領域を選択して翻訳を指示することも可能である。
【0220】
具体例を図19(第5の実施形態で説明した)、図35、図36を用いて説明する。
【0221】
まず、ステップ2301で、画像入力部(4802)であるスキャナより文書画像を多値画像として入力する。
【0222】
次に、ステップS2302で、二値画像出力部(4804)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(4806)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。
【0223】
そのレイアウト情報はレイアウト解析データ表示部(4816)により入力画像と重ねて表示されることにより、オペレータは、オペレータ指示部(4817)において、ポインティングデバイス等で翻訳処理する領域を指示することが可能とある。図38は、この翻訳処理を行う領域の指定画面の一例を示している。図示では、第2カラムの上段部分をその翻訳対象として設定している(領域の指定をONする)様を示している。
【0224】
次に、ステップS2305で文書画像理解保存部(4808)においてレイアウト解析データならびにオペレータの指示をもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。
【0225】
具体的な文書画像理解保存処理の例を図36のフローチャート、及び図40、図15、図16に従って説明する。
【0226】
本例では、文書画像理解保存処理(ステップS2305)に入ったら、まずステップS4901でオペレータが設定した領域のIDをセットする。
【0227】
次にステップS4902で、各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。そして、ステップS4903において領域属性がテキストを含むかどうかを判断し、テキストを含む場合にはステップS4904で認識用画像として二値画像を選択し、ステップS4905でレイアウト解析データの領域の座標データを用いて部分領域に対して文字認識処理を行い文字認識データを得る。そして、ステップS4906で文字認識データを文書画像理解データとして保存する。なお、誤って写真画像等、テキストを含まない画像については最初から翻訳不可にしておくので問題は発生しない。
【0228】
次に、ステップS4907で部分領域の領域IDを検査することにより翻訳対象領域か否かを調べる。
【0229】
翻訳対象領域でないならば、原文の文字認識データを保存しただけでこの領域に関する処理は終了となる。
【0230】
翻訳対象領域であるならば、ステップS4908において翻訳処理を行い、ステップS4909で翻訳データを文書画像理解データとして保存する。
【0231】
また、ステップS4903において、領域属性が翻訳対象とはならない、つまり、テキストを含んでいないならば、ステップS4910で切り取り先全体画像として元画像を選択し、ステップS4911でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0232】
ステップS4912において切り取った部分画像の画像タイプを調べ、二値画像タイプであれば、ステップS4913において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS4915において文書画像理解データ(図16)として保存処理を行う。
【0233】
このとき、文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0234】
また、ステップS4910において調べた結果が、多値画像タイプであったならば、ステップS4914において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をステップS4915において文書画像理解データ(図16)として保存処理を行う。
【0235】
本例の文書画像理解データの例は図16に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0236】
次にステップS4916において残りの分割領域が存在しているか否かを調べ、存在していればステップS4902に戻り、残りの分割領域について上記の処理を繰り返す。
【0237】
残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。こうして、ステップS2305で文書画像理解データを出力する。
【0238】
[第11の実施形態]
複数言語の翻訳手段をもつことにより、1つの原文の文字認識データに対して複数の翻訳データを併せ持たせることも可能である。
【0239】
[第12の実施形態]
複数の翻訳先から、オペレータが選択した言語に翻訳させることも可能である。
【0240】
具体例を再び図19を用い、更に、図35、図37を用いて説明する。
【0241】
まず、ステップS2301、画像入力部(4802)であるスキャナより文書画像を多値画像として入力する。
【0242】
次に、オペレータ指示部(4817)により、翻訳先言語を指示する。
【0243】
例えばオペレータは原文が英語の文書に対して、翻訳先言語として『日本語』を指示したものとする。本例では翻訳先は1つであるが複数の言語を指定することも可能である。
【0244】
次いで、ステップS2302で、二値画像出力部(4804)により二値画像を作成し、それをもとにステップS2303において、レイアウト解析部(4806)により、文書画像を図やテキストや表等の各種属性毎の領域に分割しレイアウト情報(図15)を出力する。
【0245】
次に、ステップS2305で文書画像理解保存部(4808)においてレイアウト解析データならびにオペレータの指示をもとにして、入力文書元画像である多値画像及び二値画像から適応的に保存条件を変更しながら文書画像理解データを作成し保存する。
【0246】
ここでのオペレータの指示としては、レイアウト解析された内容を図39に示すように表示し、翻訳先言語を選択する処理である。本実施形態では翻訳対象はテキスト領域であるが、表等の文字を含むものをもその対象にしてもよい。
【0247】
具体的な文書画像理解保存処理の例を図37のフローチャート、図40、図15、図16、図17、図41に従って説明する。
【0248】
本例では、文書画像理解保存処理(ステップS2305)に入ったら、まずステップS5001でオペレータが設定した翻訳先言語をセットし、翻訳処理の前準備を行う。
【0249】
次にステップS5002で、各分割領域のレイアウト解析データを分析して各領域の領域属性を分類する。
【0250】
そして、ステップS5003において領域属性が『テキスト』であるかどうかを判断する。もしそうなら、ステップS5004に進み、その領域に対する認識用画像として二値画像を選択し、ステップS5005でレイアウト解析データの領域の座標データを用いて部分領域に対して文字認識処理を行い、文字認識データを得る。さらに、ステップS5006で、その文字認識データを文書画像理解データとして保存する。次いで、ステップ5008に進み、翻訳処理を行い、ステップ5009で翻訳結果も保存する(図41)。
【0251】
一方、ステップS5003において、領域属性が『テキスト』でないと判断した場合には、ステップS5010で切り取り先全体画像として元画像を選択し、S5011でレイアウト解析データの領域の座標データを用いて部分画像を切り取る。
【0252】
次にステップS5012において切り取った画像部分の画像タイプを調べ、二値画像タイプであれば、ステップS5013において二値画像用の圧縮処理を施し(例えばMMR等)、圧縮した部分画像をステップS5015において文書画像理解データ(図16)として保存処理を行う。
【0253】
この時、文書画像理解データに圧縮方式も記録しておく事により、文書画像理解再生処理において圧縮画像を復号可能とする。
【0254】
また、ステップS5012において調べた結果が、多値画像タイプであったならば、ステップS5014において多値画像用の圧縮処理を施し(例えばJPEG等)、圧縮した部分画像をS1015において文書画像理解データ(図16)として保存処理を行う。
【0255】
さらに詳細な本例の文書画像理解データ(非テキスト画像)の例は、図16に示すように、対象となったレイアウト領域データのレイアウト解析データ内での出現順位をレイアウト領域データのIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0256】
次にステップS5016において残りの分割領域が存在しているか否かを調べ、存在していればステップS5002に戻り、残りの分割領域について上記の処理を繰り返す。残りの分割領域が存在していなければ、文書画像理解データ保存処理を終了する。こうして、ステップS2305で文書画像理解データを出力する。
【0257】
以上説明したように本第9乃至第12の実施形態によれば、
1)文書画像の保存時における、データ量の削減
2)文書画像の配信時における、ネットワークトラフィックへの負荷軽減
3)文書画像の保存、配信時における、再利用に適した高画質の維持
4)出力時の文書画像の画質劣化や情報欠落の防止
5)DTP(デスクトップパプリッシング)等の電子文書への再利用の容易化
6)地球規模の文書配信時における利便性の向上
等がはかれる効果がある。
【0258】
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0259】
また、図2ではネットワークを介して情報の授受を行う例を示したが、このネットワークとしてインターネットを採用しても良いのは勿論であるし、ネットワークの形態そのものによって本願発明が限定されるものではない。
【0260】
また、上記の各実施形態を大きく分けると、第1乃至第4の実施形態、第5乃至第8の実施形態、第9乃至第12の実施形態に分けられるが、それらを如何様にむ見合わせても良いのは勿論である。
【0261】
また、本発明の目的は、前述した各実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0262】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0263】
【発明の効果】
以上説明したように第1の発明によれば、原稿のレイアウトを保持しながら、データ量を少なくでき、しかも、再生出力する際に画質劣化することを抑えることが可能になる。
【0264】
また、第2の発明によれば、上記第1の発明に加えてセキュリティーに優れたものとすることができる。
【0265】
そして、第3の発明によれば、上記第1の発明に加えて、画像中のテキストについて自然言語の違いを吸収できるようにもなる。従って、国内外を問わずに情報を共有することができるようになる。
【図面の簡単な説明】
【図1】第1の実施形態におけるデータの流れを示す図である。
【図2】第1の実施形態のシステム構成を示す図である。
【図3】第1の実施形態における画像入力から文書画像理解保存データの出力処理までの手順を示すフローチャートである。
【図4】各実施形態における文書画像理解保存データ入力から再生画像出力までの処理手順を示すフローチャートである。
【図5】第1の実施形態の文書画像理解保存処理を示すフローチャートである。
【図6】第1の実施形態におけるテキスト判別処理を示すフローチャートである。
【図7】第1の実施形態の文書画像理解保存処理のフローチャートである。
【図8】第1の実施形態の文書画像理解保存処理のフローチャートである。
【図9】第1の実施形態の文書画像理解再生処理のフローチャートである。
【図10】第1の実施形態の再生画像合成処理のフローチャートである。
【図11】第2の実施形態における文書画像理解保存処理のフローチャートである。
【図12】第3の実施形態における文書画像理解保存処理のフローチャートである。
【図13】第3、第4の実施形態の文書画像理解再生処理のフローチャートである。
【図14】第1の実施形態の文書画像理解データの構造を示す図である。
【図15】第1の実施形態のレイアウト解析データの構造を示す図である。
【図16】第1の実施形態の画像データの構造を示す図である。
【図17】第1の実施形態の文字認識データの構造を示す図である。
【図18】第5の実施形態におけるデータの流れを示す図である。
【図19】第5の実施形態の画像入力から文書画像理解データ出力までのフローチャートである。
【図20】第5の実施形態の文書画像理解保存処理のフローチャートである。
【図21】第5の実施形態の文書画像理解再生処理のフローチャートである。
【図22】第6の実施形態におけるデータの流れを示す図である。
【図23】第6の実施形態の文書画像理解保存処理のフローチャートである。
【図24】第7の実施形態におけるデータの流れを示す図である。
【図25】第7の実施形態の文書画像理解保存処理のフローチャートである。
【図26】第8の実施形態の文書画像理解保存処理のフローチャートである。
【図27】第5の実施形態の画像データの構造を示す図である。
【図28】第5の実施形態の文字認識データの構造を示す図である。
【図29】第5の実施形態の暗号化文字認識データの構造を示す図である。
【図30】第6の実施形態のGUIの例を示す図である。
【図31】第7の実施形態のGUIの例を示す図である。
【図32】第9の実施形態におけるデータの流れを示す図である。
【図33】第9の実施形態の文書画像理解保存処理のフローチャートである。
【図34】第9の実施形態の文書画像理解再生処理のフローチャートである。
【図35】第10の実施形態におけるデータの流れを示す図である。
【図36】第11の実施形態の文書画像理解保存処理のフローチャートである。
【図37】第11の実施形態の文書画像理解保存処理のフローチャートである。
【図38】第10の実施形態のGUIの例を示す図である。
【図39】第11の実施形態のGUIの例を示す図である。
【図40】第9の実施形態の文書画像理解データの構造を示す図である。
【図41】第9の実施形態の翻訳データの構造を示す図である。

Claims (9)

  1. 文書の多値画像データ入力する入力手段と、
    前記入力した多値画像データから二値画像データを生成する二値画像生成手段と、
    前記生成した二値画像データ属性毎の領域に分割し、当該分割された各領域のレイアウト情報を生成するレイアウト解析手段と、
    前記分割された領域のうち文字を含む属性の領域の部分画像について文字認識する文字認識手段と、
    前記レイアウト解析手段で生成されたレイアウト情報に基づいて、文字を含む属性の領域の面積と文字を含まない属性の領域の面積と前記文書全体の面積とを算出し、当該算出された結果に基づいて、前記文書のレイアウトタイプがテキスト系であるかピクチャー系であるかを判断するレイアウトタイプ判断手段と、
    前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがピクチャー系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記二値画像データから対応する領域の部分画像を切り取り、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、当該切り取られた各領域に対応する部分画像のデータを保存する第1保存手段と、
    前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがテキスト系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記文字認識手段で認識した当該領域の文字認識データを選択し、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、前記選択された文字認識データと前記切り取られた部分画像のデータとを保存する第2保存手段と、
    前記第1保存手段あるいは前記第2保存手段で保存されたデータ出力する出力手段と
    を備えることを特徴とする画像処理装置。
  2. 前記レイアウトタイプ判断手段は、前記文字を含む属性の領域の面積が前記文書全体の面積に対して所定割合より大きい場合、前記文書のレイアウトタイプをテキスト系であると判断し、
    前記文字を含む属性の領域の面積が前記文書全体の面積に対して前記所定割合以下である場合は更に、前記文字を含む属性の領域の面積が前記文字を含まない属性の領域の面積よりも大きければ、前記文書のレイアウトタイプをテキスト系と判断し、前記文字を含む属性の領域の面積が前記文字を含まない属性の領域の面積以下であれば、前記文書のレイアウトタイプをピクチャー系と判断することを特徴とする請求項1に記載の画像処理装置。
  3. 前記第1保存手段は、前記切り取られた領域の部分画像が二値画像であれば二値画像用の圧縮処理を施し、前記切り取られた領域の部分画像が多値画像であれば多値画像用の圧縮処理を施し、当該圧縮処理が施された各領域に対応する部分画像のデータを保存することを特徴とする請求項第1項または第2項に記載の画像処理装置。
  4. 前記第2保存手段は、前記切り取られた部分画像に対して多値画像用の圧縮処理を施し、当該圧縮処理が施された部分画像のデータと前記選択された文字認識データとを保存することを特徴とする請求項第1項乃至第3項のいずれか1項に記載の画像処理装置。
  5. 前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがテキスト系であると判断された場合に、前記文字認識手段による文字認識信頼度を算出する算出手段を、更に備え、
    前記算出手段で算出された文字認識信頼度が所定閾値より大きければ、前記文書のレイアウトタイプをテキスト系として前記第2保存手段による保存処理を行い、前記算出手段で算出された文字認識信頼度が前記所定閾値以下であれば、前記文書のレイアウトタイプ をピクチャー系として前記第1保存手段による保存処理を行うことを特徴とする請求項第1項に記載の画像処理装置。
  6. 前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがテキスト系であると判断された場合に、前記文字を含む属性の領域ごとに前記文字認識手段による文字認識信頼度を算出する第2の算出手段を更に備え、
    前記第2保存手段は、前記第2算出手段で算出された文字認識信頼度が低い領域については前記文字認識データではなく、前記二値画像データから当該対応する領域の部分画像を切り取って保存対象とすることを特徴とする請求項第1項に記載の画像処理装置。
  7. 入力手段が、文書の多値画像データ入力する入力工程と、
    二値画像生成手段が、前記入力した多値画像データから二値画像データを生成する二値画像生成工程と、
    レイアウト解析手段が、前記生成した二値画像データ属性毎の領域に分割し、当該分割された各領域のレイアウト情報を生成するレイアウト解析工程と、
    文字認識手段が、前記分割された領域のうち文字を含む属性のテキスト領域の部分画像について文字認識する文字認識工程と、
    レイアウトタイプ判断手段が、前記レイアウト解析工程で生成されたレイアウト情報に基づいて、文字を含む属性の領域の面積と文字を含まない属性の領域の面積と前記文書全体の面積とを算出し、当該算出された結果に基づいて、前記文書のレイアウトタイプがテキスト系であるかピクチャー系であるかを判断するレイアウトタイプ判断工程と、
    第1保存手段が、前記レイアウトタイプ判断工程で前記文書のレイアウトタイプがピクチャー系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記二値画像データから対応する領域の部分画像を切り取り、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、当該切り取られた各領域に対応する部分画像のデータを保存する第1保存工程と、
    第2保存手段が、前記レイアウトタイプ判断工程で前記文書のレイアウトタイプがテキスト系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記文字認識工程で認識した当該領域の文字認識データを選択し、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、前記選択された文字認識データと前記切り取られた部分画像のデータとを保存する第2保存工程と、
    出力手段が、前記第1保存工程あるいは前記第2保存工程で保存されたデータ出力する出力工程と
    を備えることを特徴とする画像処理方法。
  8. コンピュータが読み込み実行するプログラム格納する記憶媒体であって、
    コンピュータを、
    文書の多値画像データ入力する入力手段、
    前記入力した多値画像データから二値画像データを生成する二値画像生成手段、
    前記生成した二値画像データ属性毎の領域に分割し、当該分割された各領域のレイアウト情報を生成するレイアウト解析手段、
    前記分割された領域のうち文字を含む属性の領域の部分画像について文字認識する文字認識手段、
    前記レイアウト解析手段で生成されたレイアウト情報に基づいて、文字を含む属性の領域の面積と文字を含まない属性の領域の面積と前記文書全体の面積とを算出し、当該算出された結果に基づいて、前記文書のレイアウトタイプがテキスト系であるかピクチャー系であるかを判断するレイアウトタイプ判断手段、
    前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがピクチャー系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記 二値画像データから対応する領域の部分画像を切り取り、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、当該切り取られた各領域に対応する部分画像のデータを保存する第1保存手段、
    前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがテキスト系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記文字認識手段で認識した当該領域の文字認識データを選択し、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、前記選択された文字認識データと前記切り取られた部分画像のデータとを保存する第2保存手段、
    前記第1保存手段あるいは前記第2保存手段で保存されたデータ出力する出力手段
    として機能させるためのプログラムを格納する記憶媒体。
  9. 画像データ発生装置と再生装置で構成される画像処理システムであって、
    前記画像データ発生装置は、
    文書の多値画像データ入力する入力手段と、
    前記入力した多値画像データから二値画像データを生成する二値画像生成手段と、
    前記生成した二値画像データ属性毎の領域に分割し、当該分割された各領域のレイアウト情報を生成するレイアウト解析手段と、
    前記分割された領域のうち文字を含む属性の領域の部分画像について文字認識する文字認識手段と、
    前記レイアウト解析手段で生成されたレイアウト情報に基づいて、文字を含む属性の領域の面積と文字を含まない属性の領域の面積と前記文書全体の面積とを算出し、当該算出された結果に基づいて、前記文書のレイアウトタイプがテキスト系であるかピクチャー系であるかを判断するレイアウトタイプ判断手段と、
    前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがピクチャー系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記二値画像データから対応する領域の部分画像を切り取り、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、当該切り取られた各領域に対応する部分画像のデータを保存する第1保存手段と、
    前記レイアウトタイプ判断手段で前記文書のレイアウトタイプがテキスト系であると判断された場合、前記レイアウト情報に基づいて、文字を含む属性の領域については前記文字認識手段で認識した当該領域の文字認識データを選択し、文字を含まない属性の領域については前記多値画像データから対応する領域の部分画像を切り取り、前記選択された文字認識データと前記切り取られた部分画像のデータとを保存する第2保存手段と、
    前記第1保存手段あるいは前記第2保存手段で保存されたデータを前記再生装置に出力する出力手段
    とを備え、
    前記再生装置は、
    前記出力手段から出力された前記文書内の各領域に対応するデータに応じて、前記文書中の領域に対応する部分画像を、適応的に再生条件を変更して再生て出力する出力手段備える
    ことを特徴とする画像処理システム。
JP13482599A 1999-05-13 1999-05-14 画像処理装置及び方法及び記憶媒体及びシステム Expired - Fee Related JP4065473B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP13482599A JP4065473B2 (ja) 1999-05-14 1999-05-14 画像処理装置及び方法及び記憶媒体及びシステム
US09/570,611 US7426054B1 (en) 1999-05-13 2000-05-12 Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
US12/198,498 US7639388B2 (en) 1999-05-13 2008-08-26 Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13482599A JP4065473B2 (ja) 1999-05-14 1999-05-14 画像処理装置及び方法及び記憶媒体及びシステム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007305073A Division JP4533422B2 (ja) 2007-11-26 2007-11-26 画像処理装置及び方法及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2000332984A JP2000332984A (ja) 2000-11-30
JP4065473B2 true JP4065473B2 (ja) 2008-03-26

Family

ID=15137366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13482599A Expired - Fee Related JP4065473B2 (ja) 1999-05-13 1999-05-14 画像処理装置及び方法及び記憶媒体及びシステム

Country Status (1)

Country Link
JP (1) JP4065473B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4189506B2 (ja) 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
JP4533187B2 (ja) * 2005-03-01 2010-09-01 キヤノン株式会社 画像処理装置およびその制御方法
JP4983526B2 (ja) * 2007-10-15 2012-07-25 富士ゼロックス株式会社 データ処理装置及びデータ処理プログラム
WO2009144796A1 (ja) 2008-05-29 2009-12-03 株式会社Pfu 電子ドキュメント処理システム、方法およびプログラム
JP5606385B2 (ja) 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム
JP6708476B2 (ja) 2016-05-27 2020-06-10 キヤノン株式会社 文書保存処理システム
JP6888410B2 (ja) * 2017-05-15 2021-06-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP2019140480A (ja) * 2018-02-08 2019-08-22 富士ゼロックス株式会社 画像処理装置、画像形成システムおよびプログラム

Also Published As

Publication number Publication date
JP2000332984A (ja) 2000-11-30

Similar Documents

Publication Publication Date Title
CN100419782C (zh) 图象处理方法
JP5302768B2 (ja) 画像処理装置及び画像処理方法
US7639388B2 (en) Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
US7113642B2 (en) Method and apparatus for encoding/decoding image data
US7532757B2 (en) Image processing apparatus, control method therefor, and program
RU2360288C2 (ru) Файлы, содержащие смешанный растр
CN101626448B (zh) 图像处理装置和图像处理方法
JP2001195536A (ja) コード及びコードのエンコーディング/デコーディング方法及び装置
US20060114484A1 (en) Image processing apparatus and method therefor
JP4065473B2 (ja) 画像処理装置及び方法及び記憶媒体及びシステム
US6687406B2 (en) Image coding without coding clipped regions
JP4533422B2 (ja) 画像処理装置及び方法及び記憶媒体
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2005259017A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP5007639B2 (ja) 画像処理装置及び画像処理プログラム
KR100447762B1 (ko) 서적 등에 부가된 코드이미지를 이용한 멀티미디어 정보서비스 방법 및 그 장치
JP2002254709A (ja) プリンタ装置及び画像処理装置
JPH05266247A (ja) 画像データ処理システム
JP4109793B2 (ja) 画像処理装置及びその方法
JP4158681B2 (ja) 画像処理システム
JP2006344014A (ja) 情報処理装置、情報処理方法、および、情報処理プログラム
JP2004318187A (ja) 画像生成装置および画像生成システム
JP3880240B2 (ja) 画像処理装置及びその方法
JP4848938B2 (ja) 情報処理システムおよび情報処理プログラム
JP3865688B2 (ja) 外字処理システム、外字処理プログラム及び外字処理の方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060515

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080105

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140111

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees