JP4738943B2 - 画像処理装置およびその方法 - Google Patents

画像処理装置およびその方法 Download PDF

Info

Publication number
JP4738943B2
JP4738943B2 JP2005253793A JP2005253793A JP4738943B2 JP 4738943 B2 JP4738943 B2 JP 4738943B2 JP 2005253793 A JP2005253793 A JP 2005253793A JP 2005253793 A JP2005253793 A JP 2005253793A JP 4738943 B2 JP4738943 B2 JP 4738943B2
Authority
JP
Japan
Prior art keywords
information
area
image
document
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005253793A
Other languages
English (en)
Other versions
JP2007066188A5 (ja
JP2007066188A (ja
Inventor
妙子 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005253793A priority Critical patent/JP4738943B2/ja
Priority to JP2005363864A priority patent/JP4553385B2/ja
Priority to EP06017806A priority patent/EP1760605A1/en
Priority to US11/468,351 priority patent/US7933447B2/en
Priority to CNB200610126692XA priority patent/CN100502454C/zh
Priority to KR1020060084201A priority patent/KR100808713B1/ko
Publication of JP2007066188A publication Critical patent/JP2007066188A/ja
Publication of JP2007066188A5 publication Critical patent/JP2007066188A5/ja
Application granted granted Critical
Publication of JP4738943B2 publication Critical patent/JP4738943B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4406Restricting access, e.g. according to user identity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4406Restricting access, e.g. according to user identity
    • H04N1/444Restricting access, e.g. according to user identity to a particular document or image or part thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4446Hiding of documents or document information

Description

本発明は画像処理装置およびその方法に関し、例えば、文書画像の利用、加工、表示、移動、共有など行う画像処理に関する。
複写機の高機能化は目覚しく、コピーおよびプリント機能に加えてスキャナおよびファックス機能をもつ複合機が市場の主流になった。オフィスにおける複合機は、紙に印刷した情報と電子データの間の入出力窓口として大きな役割を担っている。
とくに、複合機のスキャナ機能は、大量の文書を効率よく電子データ化することができる。このため、手軽に、文書をスキャンしてネットワーク上または複合機自身がもつデータベース(DB)に保存し、ドキュメント管理を行うケースが増えた。以下では、文書をスキャンして電子化したデータを「文書画像」と呼ぶ。
また、パーソナルコンピュータ(PC)の普及により、PC上のアプリケーションソフトウェアを用いた文書の作成が一般化した。以下では、アプリケーションソフトウェアで作成した電子データ状態の文書を「電子文書」と呼ぶ。
文書画像や電子文書は、紙に印刷した文書と比較すると、データの再編集・再利用が可能なこと、多人数のデータ共有が容易なこと、時間経過による劣化がないなどの利点がある。一方、紙に印刷した文書にも、文書画像や電子文書と比べて読み易い、扱い易い、持ち運びに便利、直感的にわかり易いなどの利点がある。そのため、電子文書や文書画像を紙に印刷した方が効率的という例は数多く見受けられる。
逆に、紙に印刷した文書と同一または類似する文書画像や電子文書が必要になることも多い。例えば、紙に印刷した文書の一部を破損してしまい、再度、初期状態の文書を得るために印刷したい場合や、元々はカラーの電子文書をモノクロ印刷した文書を、カラーで再印刷したい場合などである。
文書画像に混在する写真、文字、表、ラインアートをそれぞれ解析し、その結果を再利用したい場面も数多く考えられる。例えば、文書画像をテキストデータとして利用したい場合の文字認識による変換、特定の領域を拡大して見易くするに、拡大しても画質が劣化しないベクタ画像への変換などである。
このように、紙に印刷した文書を出発点として、データの利用、加工、表示、移動、共有などが簡単にできるドキュメント管理システムが求められている。
写真や文字が混在する文書をスキャンして生成した電子画像を再度印刷する場合、例えばA4サイズで300dpiのJPEG圧縮したカラースキャン画像は3.5MB近いデータサイズになり、多数の電子画像がネットワーク上を流れれば、ネットワークへの負荷が大きい。しかし、解像度を下げれば文字領域の画質が劣化するなど、電子画像の一頁に均一な画像処理を施すには限界があり、以下のような先行技術が提案されている。
特開平8-204950号公報は、入力画像を写真領域と文字領域に分け、写真領域と文字領域それぞれの解像度を可変にした画像管理を開示する。しかし、解像度が可変になるのはラスタ画像のみで、ベクタ画像や文字領域の文字認識結果などの管理は行わない。
特開2003-348326公報は、スキャン画像を携帯端末(PDA)で表示するために、文字画像を行単位で分割し再統合する技術を開示する。しかし、出力先は携帯端末に限定され、また、加工対象はラスタ画像のみで、ベクタ画像や文字認識結果には対応しない。
特開2000-306103公報は、文書画像を文字、イメージおよび背景に分離し、予め用意した階層に領域を振り分けて文書画像のデータ容量を大幅に削減し、データの再利用が容易な形態で文書データを保持する技術を開示する。再利用が容易な形態の文書データといっても、各領域がもつ伝達情報は一種類のみである。
これら先行技術に共通するのは、領域の属性ごとに画像を管理することである。しかし、属性が同じ領域でも、その性質は様々である。例えば、同じ文書画像中の異なる二つの文字領域を考えた場合、その片方は文字認識率が高く、他方は認識率があまり高くない例がある。このような場合、同じ属性ということで同一種類の伝達情報を提供しても、良好な情報提供ができるとは言いがたい。
また、先行技術はともに、解像度変換などの処理をデータ登録時に限定的に行い、出力時にユーザが所望する解像度に変換する処理には対応しない。
また、現状は、元々カラーの電子文書をモノクロで印刷した文書を、カラーで再印刷したい場合や、紙に印刷された文書から原本の電子文書を入手したい場合は、元々の電子文書を作成した本人に問い合わせ、必要とする電子文書を入手する場合が大半である。
特開平8-204950号公報 特開2003-348326公報 特開2000-306103公報
本発明は、文書画像の各領域の情報を出力する際に、その出力先の装置に応じた種類の情報を出力することを目的とする。
本発明は、前記の目的を達成する一手段として、以下の構成を備える。
本発明にかかる画像処理は、メモリに格納された文書画像の情報を処理する際に、文書画像の情報の出力先となる出力先装置の情報を取得し、前記出力先装置の情報と前記文書画像の各領域の属性に基づき、前記領域ごとに出力すべき前記文書画像の情報の種類を判断し、前記領域ごとに、前記判断した種類に対応する情報を前記メモリから取得し、前記領域ごとに、前記メモリから取得した情報を統合し、前記統合した情報を前記出力先装置に出力し、前記判断した種類の情報が存在しない注目領域について、前記注目領域の画像に類似する画像を有し、かつ、前記判断した種類に対応する情報を有する前記文書画像の他の領域を検索し、当該検索でヒットした前記他の領域の前記判断した種類の情報を、前記注目領域の情報として取得することを特徴とする。
本発明によれば、文書画像の各領域の情報を出力する際に、その出力先の装置に応じた種類の情報を出力することができる。
以下、本発明にかかる実施例を図面を参照して詳細に説明する。
[装置の構成]
図1は実施例の伝達情報出力装置の構成例を示すブロック図である。
CPU101は、ROM102に格納された制御プログラムに従い、RAM103をワークメモリとして装置全体制御する。ROM102は、CPU101が実行する後述する制御プログラムなどを格納する。RAM103および磁気ディスクなどHD104は、後述する処理プログラムや文書画像などを記憶する。
スキャナ108は、図示しない汎用インタフェイス(例えばUSBやIEEE1394)によって伝達情報出力装置に接続され、CPU 101の制御により、紙に印刷された文書(原稿)の画像を読み取り、文書画像を出力する。また、CPU 101は、ディスプレイ105にユーザインタフェイスを表示し、例えばUSBなどのインタフェイスを介して接続されるキーボード106やマウスなどのポインティングデバイス107からユーザの指示を入力する。
また、伝達情報出力装置は、ネットワークインタフェイス(I/F)109を介して、ローカルエリアネットワーク(LAN)110などに接続し、ネットワーク上の他の機器(サーバ、コンピュータ、プリンタ、スキャナ、複合など)と通信し、データやプログラムをやり取りする。
なお、伝達情報出力装置は、汎用的なコンピュータでも実現可能で、その場合、ネットワーク110や記録媒体を介して提供される制御プログラムや処理プログラムをHD 104に記憶し、それらプログムをユーザなどの指示に従いCPU 101で実行すればよい。
[登録処理]
図2は伝達情報出力装置にデータを登録する処理の一例を示すフローチャートで、ユーザなどの指示に基づきCPU 101が実行する処理である。
まず、スキャナ108またはネットワーク110から文書画像を入力し(S201)、文書画像を、文字、写真、表、線画などの属性を持つ領域に分割し(S202)、分割領域ごとに文書情報を生成する(S203)。文書情報には、領域の属性情報、頁上の位置座標などを示すレイアウト情報、領域情報などが含まれる。なお、領域情報は、文字属性の分割領域であれば文字コード列、段落、表題などの文書論理構造などである。
次に、分割領域ごとに伝達情報に変換する(S204)。伝達情報はレンダリングに必要な情報であり、例えば、解像度可変のラスタ画像、ベクタ画像、モノクロ画像、カラー画像、各伝達情報のデータサイズ、文字属性の分割領域であれば文字認識結果のテキスト、個々の文字の位置、フォント名または種、文字認識の信頼度などが含まれる。
伝達情報の出力には、領域の属性の特徴とユーザの使用条件を考慮して、カラー印刷、カラー印刷(高画質)、モノクロ印刷、モノクロ印刷(高画質)、モニタ表示、PDA表示、拡大表示、超拡大表示および加工の9パターンの出力モード、並びに、ユーザが設定するマニュアル出力モードを用意する。
図3は上記の10パターンの出力モードと、領域属性によって選択される伝達情報の関係例を示す図で、例えば、HD 104などにテーブルとして格納されている。
各領域の伝達情報は、すべて用意する必要はなく、よく使うと予想されるものを用意すればよく、伝達情報を格納するメモリもセーブすることができる。例えば、図3においては、極めて使用頻度が低いと考えられる「PDA表示-背景」の組み合わせや、「超拡大表示-文字(認識信頼度高低とも)、線画(ラインアート)および表」の組み合わせも、デフォルトで伝達情報を用意しない。さらに、マニュアル出力モードにおける、領域属性と伝達情報の関係は、ユーザインタフェイス、キーボード106やポインティングデバイス107を使用してユーザが設定する。
なお、以下の説明では、モノクロ印刷とモニタ表示基本的な出力モード(基本パターンと呼ぶ)として、他の出力モード(応用パターンと呼ぶ)、基本パターンに比べて利用頻度低いとする。従って、基本パターンにおける伝達情報だけを、例えば、次のように用意する、として説明する。
────┬────────┬─────────
│ モノクロ印刷 │ モニタ表示
────┼────────┼─────────
文字領域│ラスタ画像 │ラスタ画像
写真領域│階調ラスタ画像 │低解像度ラスタ画像
線画領域│ラスタ画像 │ラスタ画像
表領域 │ラスタ画像 │低解像度ラスタ画像
────┴────────┴─────────
次に、各分割領域の文書情報および伝達情報を関連付けた、ツリー構造で記述される構造化文書を生成する(S205)。続いて、生成したデータ群(各分割領域の文書情報および伝達情報、並びに、構造化文書)をHD104などに保存(登録)する(S206)。なお、データ群の保存先はネットワーク110上のサーバなどでもよい。
図4はカラーの文書画像の一例を示す図である。文書画像中の黒画素塊、白画素塊の集合を抽出し、その形状、大きさ、集合状態などの特徴量から文字、写真、図形、表、枠、線画といった属性の領域を抽出する。図4に示す例では、文字属性の領域として領域301、303および306、カラー写真属性の領域302、図形属性の領域304、並びに、表属性の領域305が分割される。ただし、ロゴマークの分割領域301は、一般的なフォントとは異なる文字形態のため、文字認識結果の信頼度は低いものとする。また、分割領域306の文字は、分割領域303の文字に比較してかなり小さいものとする。
図5は各分割領域の文書情報と伝達情報を関連付けた情報を模式的に示す図である。
つまり、ある分割領域の文書情報401は、ステップS204で得た、その領域の伝達情報402、403を保持する。このようなツリー構造により、各分割領域の関係を階層的に表現することができる。なお、文書情報は、複数種類の伝達情報保持することができる。
これらの関連付け情報は、XMLに代表される構造化文書の形式で生成され保存される。
[伝達情報の出力]
図6は伝達情報を出力する処理の一例を示すフローチャートで、ユーザなどの指示に基づきCPU 101が実行する処理である。
まず、ユーザに指示された登録データをHD 104などから呼び出し(S501)、その出力先の機器情報を取得し(S502)、出力先に応じて決まる出力モードに合わせて、分割領域ごとに出力すべき伝達情報の種類を設定する(S503)。なお、当該設定の詳細は後述する。
次に、設定した種類の伝達情報が、分割領域の伝達情報として存在するか否かを判定する(S504)。データ登録時には、上述したように、基本パターンの伝達情報を用意する。従って、基本パターン(モノクロ印刷、モニタ表示)の伝達情報は必ず存在する。一方、使用頻度が低い応用パターンの伝達情報は、基本パターンと同じ種類の伝達情報であれば存在するが、基本パターンと異なる種類の伝達情報は存在しない。従って、設定した種類の伝達情報が存在するかを判定し、存在すればステップS513へ、存在しなければステップS505へ処理を分岐する。
設定した種類の伝達情報が存在する場合は、その伝達情報を抽出し(S513)、領域ごとの伝達情報を統合し(S514)、統合した伝達情報を出力先に出力する(S515)。
他方、設定した種類の伝達情報が存在しない場合は、現存する伝達情報を、設定した種類の伝達情報に変換することができるか否かを判定し(S505)、変換可能な伝達情報が存在すればステップS506へ、存在しなければS508へ処理を分岐する。
図7は既存の伝達情報から変換可能な伝達情報の種類を示す図で、○印は変換可能を、×印は変換不能を表し、テーブルとしてHD 104などに格納されている。
例えば、拡大表示したいが拡大表示に適したベクタ画像が存在しない場合、既存の伝達情報からベクタ画像に変換可能なものがあるか否かを判定する。もし、伝達情報としてラスタ画像が存在すればベクタ画像に変換可能であるからステップS506へ分岐する。また、図4に示すカラー原稿をモノクロコピーした原稿の電子画像(図8)が登録され、出力モードがカラー印刷の場合、モノクロ写真属性の分割領域302'の伝達情報として、カラー印刷に適したカラーラスタ画像に変換可能な伝達情報が存在するか否かを判定する。この場合は、図7に示すように、モノクロラスタ画像からカラーラスタ画像への変換は不可能であるからステップS508へ分岐する。
変換可能な伝達情報が存在する場合は、当該伝達情報を、設定した種類の伝達情報に変換し(S506)、変換によって得た伝達情報(変換情報)をデータ登録時に生成した分割領域の文書情報と伝達情報の関連付け情報に追記する(S507)。そして、領域ごとの伝達情報を統合し(S514)、統合した伝達情報を出力先に出力する(S515)。
また、変換可能な伝達情報が存在しない場合は、分割領域の伝達情報を検索キーとして、出力モードに適した伝達情報(代替情報)をHD104やサーバから検索し(S508)、検索がヒットしたか否かを判定し(S509)、ヒットすればステップS510へ、ヒットしなければステップS511へ移行する。この検索は、例えば、モノクロ写真属性の分割領域をカラー出力したい場合、当該領域伝達情報(モノクロ画像)を検索キーとして類似するカラー画像検索するものである。詳細は省略するが、類似画像検索は、画像のアングルの変化、被写体の位置の変化および撮影条件による画像特徴量のある程度の違いを吸収して、ある程度の曖昧さを残しながらも適切な画像検索を行うことができる。
代替情報が検索されなかった場合は、分割領域の出力に適する伝達情報がない旨と、既存の伝達情報の利用または出力の中止をユーザに選択させるメッセージをディスプレイ105に表示する(S511)。そして、ステップS512の判定により、ユーザが出力中止を指示した場合は処理を終了し、既存の伝達情報の利用を指示した場合は処理をステップS513に移行する。
また、代替情報が検索された場合は、当該情報を取得し(S510)、当該情報をデータ登録時に生成した分割領域の文書情報と伝達情報の関連付け情報に追記する(S507)。そして、領域ごとの伝達情報を統合し(S514)、統合した伝達情報を出力先に出力する(S515)。
なお、図6では省略するが、ステップS504からS513の処理は、分割領域ごとに繰り返し実行するものである。
[伝達情報の設定]
次に、各分割領域の伝達情報を設定する処理(S503)を説明する。設定の基準には、分割領域の属性に加え、生成した伝達情報自体の特徴も加味する。以下、伝達情報の設定について基本パターンや応用パターンなどのパターンごとに説明する。
まず、基本パターンのモノクロ印刷の場合、求められる伝達情報は原本に忠実かつ高解像度のものである。よって、各分割領域の伝達情報としてラスタ画像を設定する。
図4に示す原稿画像を例にすると、各分割領域として提供する伝達情報は以下のとおりである。
文字領域301 ラスタ画像
写真領域302 高解像度ラスタ画像
文字領域303 ラスタ画像
図形領域304 ラスタ画像
表領域305 ラスタ画像
文字領域306 ラスタ画像
また、基本パターンのモニタ表示の場合、印刷の場合ほど高解像度の必要はないが、モニタ上ではっきり見える伝達情報が求められる。また、文字情報をテキストとして扱いたい場合も加味して、分割領域の文字認識の信頼度によって伝達情報を設定する。
図9はモニタ表示の場合の伝達情報の設定処理(S503)を説明するフローチャートで、CPU 101が実行する処理である。
まず、注目領域の属性が文字か否かを判定し(S601)、文字属性であれば注目領域に関連付けた伝達情報から文字認識の信頼度が所定値X%以上か否かを判定する(S602)。
文字属性以外の領域、および、文字認識の信頼度がX%未満の文字属性の領域は、低解像度ラスタ画像を設定する(S603)。また、文字認識の信頼度がX%以上の文字属性の領域は、文字認識結果のテキストを設定する(S604)。
そして、電子画像内の全分割領域について伝達情報の種類を設定したか否かを判定し(S605)、未設定の分割領域があれば処理をステップS601に戻し、なければ処理を終了する(図6に示すステップS504へ遷移する)。
図9に示す処理を実行すると、図4に示す電子画像の各分割領域として提供する伝達情報は以下のとおりである。
文字領域301 (信頼度が低いので)低解像度ラスタ画像
写真領域302 低解像度ラスタ画像
文字領域303 (信頼度が高いので)テキスト
図形領域304 低解像度ラスタ画像
表領域305 低解像度ラスタ画像
文字領域306 (信頼度が高いので)テキスト
次に、応用パターン(カラー印刷、高画質印刷、PDA表示、拡大表示、超拡大表示、加工)の場合の伝達情報の設定について説明する。
カラー印刷の場合は、モノクロ印刷で定義する条件に加えてカラー情報が必要になる。高画質印刷の場合は、モノクロ印刷、カラー印刷で定義する条件よりもさらに高解像度ラスタ画像が求められる。PDA表示の場合、PDAはメモリサイズに制限があり、データサイズが小さく処理速度が早い伝達情報が優先される。
図10はPDA表示の場合の伝達情報の設定処理(S503)を説明するフローチャートで、CPU 101が実行する処理である。
まず、注目領域の属性が文字か否かを判定し(S701)、文字属性であれば注目領域に関連付けた伝達情報から文字認識の信頼度が所定値X%以上か否かを判定し(S703)、文字認識の信頼度がX%以上の文字属性の領域は、文字認識結果のテキストを設定する(S707)。
また、注目領域が文字属性以外であれば、注目領域の属性が写真か否かを判定し(S702)、写真属性であれば低解像度ラスタ画像を設定する(S705)。
また、文字属性でも写真属性でもない注目領域、あるいは、文字認識の信頼度がX%未満の文字属性の注目領域は、注目領域に関連付けた伝達情報からラスタ画像のファイルサイズがYバイト以下か否かを判定する(S704)。ファイルサイズがYバイト以下のラスタ画像は、PDA表示に耐え得るので、この場合は低解像度ラスタ画像を設定する(S705)。ラスタ画像のファイルサイズがYバイトを超える場合はPDA表示に向かないので、ベクタ画像を設定する(S706)。
そして、電子画像内の全分割領域について伝達情報の種類を設定したか否かを判定し(S708)、未設定の分割領域があれば処理をステップS701に戻し、なければ処理を終了する(図6に示すステップS504へ遷移する)。
図10に示す処理を実行すると、図4に示す電子画像の各分割領域として提供する伝達情報は以下のとおりである。
文字領域301 (信頼度が低く、データサイズがY%超だから)ベクタ画像
写真領域302 低解像度ラスタ画像
文字領域303 (信頼度が高いので)テキスト
図形領域304 (データサイズがY%超だから)ベクタ画像
表領域305 低解像度ラスタ画像
文字領域306 (信頼度が高いので)テキスト
次に、拡大表示の場合は原本に忠実かつ拡大しても劣化しない伝達情報を設定する。なお、拡大したい領域は複数あってもよいし、領域の一部分でもよい。
図11は拡大表示の場合の伝達情報の設定処理(S503)を説明するフローチャートで、CPU 101が実行する処理である。
まず、電子画像中の拡大する分割領域を選択する(S801)。その際、属性を横断して設定してもよい。
次に、注目領域の属性が写真か否かを判定し(S802)、写真属性であれば高解像度ラスタ画像を設定し(S804)、写真属性以外であればベクタ画像を設定し(S803)、電子画像内の全分割領域について伝達情報の種類を設定したか否かを判定し(S805)、未設定の分割領域があれば処理をステップS801に戻し、なければ処理を終了する(図6に示すステップS504へ遷移する)。
図4に示す分割領域302と305の一部(図12に示す領域901)を拡大する場合に、図11に示す処理を実行すると、図12に示す拡大領域901として提供する伝達情報は以下のとおりである。
写真領域302 高解像度ラスタ画像
表領域305 ベクタ画像
次に、超拡大表示の場合は、先に述べた拡大表示よりもさらに拡大しても劣化しない伝達情報が求められる。
図13は超拡大表示の場合の伝達情報の設定処理(S503)を説明するフローチャートで、CPU 101が実行する処理である。図11に示す拡大表示の場合、写真属性の領域の拡大表示には高解像度ラスタ画像を設定(S804)したが、図13に示す超拡大表示の場合は、写真属性の領域の超拡大表示に超高解像度ラスタ画像を設定(S1001)することである。
図4に示す分割領域302と305の一部(図12に示す領域901)を超拡大する場合に、図13に示す処理を実行すると、図12に示す超拡大領域901として提供する伝達情報は以下のとおりである。
写真領域302 超高解像度ラスタ画像
表領域305 ベクタ画像
以上では、パターンごとに自動的に伝達情報を設定する例を説明したが、自動設定ではユーザが好む伝達情報が得られない場合もあり得る。そこで、図3に示したように、出力モードと領域属性に対応する伝達情報をユーザが決定するマニュアルモードを用意する。ユーザは、例えば図4に示す電子画像の表領域305の伝達情報として文字認識結果のテキストを設定することができる。また、先に挙げた五種類の設定方法のようなテンプレートを、マニュアルモードで作成することも可能である。
[変換情報(代替情報)の関連付け]
次に、変換情報(代替情報)の関連付け(S507)の処理を説明する。
図14は各分割領域の文書情報と伝達情報を関連付けた情報を模式的に示す図である。
ある分割領域の文書情報1101は、その領域の伝達情報1102(データ登録時に作成された既存の視覚情報)を保持する。さらに、ステップS506またはS510で新たに伝達情報が得られた場合は、伝達情報1103(新たな視覚情報)が追加される。勿論、この追加は、新たに得られた伝達情報1103が、今後再利用される可能性が高い場合や、保存するメモリに余裕がある場合などに制限してもよい。図14に示すように追加しておけば、再び伝達情報1103が必要になった場合、直ちに伝達情報1103を利用することができる。
[変形例]
上記では、文字属性の分割領域に対応する伝達情報として文字認識結果のテキストを含む例を説明したが、当該テキストから多言語へ変換した翻訳結果のテキストを用意してもよい。
また、上記では、分割領域に対応する伝達情報は視覚的な情報として説明したが、各分割領域の伝達情報として、当該領域の特徴を音声化した聴覚情報を用意してもよい。一例を挙げると、図4の写真属性の分割領域302の写真には空と海を背景に二羽の鳥が飛んでいる様子が写っている。この場合、「空と海と鳥が二羽いる写真です」などの音声情報を伝達情報として付加する。また、鳥の鳴き声などの状況を表現した音声情報を伝達情報に付加してもよい。また、図4の文字属性の分割領域303には、文字認識結果のテキストを読み上げた音声情報を付加する。
または、各分割領域の伝達情報として、当該領域の特徴に対応する触覚情報を用意してもよい。一例を挙げると、文字属性の分割領域であれば、文字認識結果のテキストを点字化した情報を付加する。線画属性の分割領域であれば線の凹凸、写真属性の分割領域であれば当該領域の被写体の三次元形状や肌理などの触覚情報を付加する。
あるいは、各分割領域の伝達情報として、当該領域の特徴に対応する嗅覚情報を用意してもよい。一例を挙げると、図4の写真属性の分割領域302は海が写っているので、潮の香りの情報を伝達情報に付加する。
さらに、各分割領域の伝達情報として、当該領域の特徴に対応する味覚情報を用意してもよい。一例を挙げると、写真属性の分割領域に食物が写っている場合、当該領域の伝達情報として食物の味覚情報を付加する。
このように、領域ごとに複数種類の伝達情報を用意し、伝達情報の出力時は領域ごとに適切な種類の伝達情報を選択して、様々な出力環境や要求に対応して伝達情報を提示することができる。また、出力時に適切な種類の伝達情報がない場合は、既存の伝達情報から適切な伝達情報に変換する処理を行うことで、初期状態のデータ量は小さくし、かつ、ユーザの動的な要求に柔軟に対応することができる。勿論、変換によって新たに作成した種類の伝達情報は、分割領域に関連付けを追加するので、当該伝達情報の再利用性を高めることができる。
なお、本発明は、上記の実施例に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることができる。
[他の実施例]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、上記実施例の機能を実現するソフトウェアを記録した記憶媒体(記録媒体)をシステムまたは装置に供給し、そのシステムまたは装置のコンピュータ(CPUやMPU)が前記ソフトウェアを実行することでも達成される。この場合、記憶媒体から読み出されたソフトウェア自体が上記実施例の機能を実現することになり、そのソフトウェアを記憶した記憶媒体は本発明を構成する。
また、前記ソフトウェアの実行により上記機能が実現されるだけでなく、そのソフトウェアの指示により、コンピュータ上で稼働するオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、それによって上記機能が実現される場合も含む。
また、前記ソフトウェアがコンピュータに接続された機能拡張カードやユニットのメモリに書き込まれ、そのソフトウェアの指示により、前記カードやユニットのCPUなどが実際の処理の一部または全部を行い、それによって上記機能が実現される場合も含む。
本発明を前記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するソフトウェアが格納される。
伝達情報出力装置の構成例を示すブロック図、 伝達情報出力装置にデータを登録する処理の一例を示すフローチャート、 出力モードと、領域属性によって選択される伝達情報の関係例を示す図、 カラーの文書画像の一例を示す図、 各分割領域の文書情報と伝達情報を関連付けた情報を模式的に示す図、 伝達情報を出力する処理の一例を示すフローチャート、 既存の伝達情報から変換可能な伝達情報の種類を示す図、 カラー原稿をモノクロコピーした原稿の電子画像の一例を示す図、 モニタ表示の場合の伝達情報の設定処理を説明するフローチャート、 PDA表示の場合の伝達情報の設定処理を説明するフローチャート、 拡大表示の場合の伝達情報の設定処理を説明するフローチャート、 拡大領域の一例を示す図、 超拡大表示の場合の伝達情報の設定処理を説明するフローチャート、 各分割領域の文書情報と伝達情報を関連付けた情報を模式的に示す図である。

Claims (12)

  1. メモリに格納された文書画像の情報を処理する画像処理装置が実行する画像処理方法であって、
    文書画像の情報の出力先となる出力先装置の情報を取得する第一の取得ステップと、
    前記出力先装置の情報と前記文書画像の各領域の属性に基づき、前記領域ごとに出力すべき前記文書画像の情報の種類を判断する判断ステップと、
    前記領域ごとに、前記判断した種類に対応する情報を前記メモリから取得する第二の取得ステップと、
    前記領域ごとに、前記メモリから取得した情報を統合する統合ステップと、
    前記統合した情報を前記出力先装置に出力する出力ステップとを有し、
    前記第二の取得ステップは、前記判断した種類の情報が存在しない注目領域について、前記注目領域の画像に類似する画像を有し、かつ、前記判断した種類に対応する情報を有する前記文書画像の他の領域を検索し、当該検索でヒットした前記他の領域の前記判断した種類の情報を、前記注目領域の情報として取得することを特徴とする画像処理方法。
  2. 前記第二の取得ステップは、前記他の領域の、前記判断した種類の情報を、前記注目領域に関連付けて前記メモリに格納することを特徴とする請求項1に記載された画像処理方法。
  3. メモリに格納された文書画像の情報を処理する画像処理装置が実行する画像処理方法であって、
    文書画像の情報の出力先となる出力先装置の情報を取得する第一の取得ステップと、
    前記出力先装置の情報、前記文書画像の各領域の属性、並びに、前記文書画像の各領域についての文字認識の信頼度およびデータサイズの少なくとも何れかに基づき、前記領域ごとに出力すべき情報の種類を判断する判断ステップと、
    前記領域ごとに、前記判断した種類に対応する情報を前記メモリから取得する第二の取得ステップと、
    前記領域ごとに、前記メモリから取得した情報を統合する統合ステップと、
    前記統合した情報を前記出力先装置に出力する出力ステップとを有することを特徴とする画像処理方法。
  4. さらに、前記画像処理装置に登録する対象の文書画像を、画像属性に基づき複数の領域に分割する分割ステップと、
    前記分割した各領域の画像を一または複数の情報に変換する変換ステップと、
    前記変換した情報を関連付けて前記文書画像の構造を示す構造化文書情報を生成する生成ステップと、
    前記構造化文書情報を前記文書画像の情報として前記メモリに格納する格納ステップとを有することを特徴とする請求項1から請求項3の何れか一項に記載された画像処理方法。
  5. 前記第二の取得ステップは、前記判断した種類の情報が存在しない注目領域について、前記判断した種類とは異なる種類の前記注目領域の情報を前記判断した種類の情報に変換して、前記変換した情報を前記注目領域の情報とすることを特徴とする請求項1から請求項4の何れか一項に記載された画像処理方法。
  6. 前記第二の取得ステップは、前記変換した情報を前記注目領域に関連付けて前記メモリに格納することを特徴とする請求項5に記載された画像処理方法。
  7. 前記メモリに格納された文書画像の情報は、前記文書画像の各領域の属性情報とレイアウト情報を含むことを特徴とする請求項1から請求項6の何れか一項に記載された画像処理方法。
  8. 前記出力すべき文書画像の情報の種類は、解像度可変のラスタ画像、ベクタ画像、モノクロ画像、カラー画像、三次元画像、文字認識結果のテキスト、フォント情報および他言語への翻訳結果の少なくとも一つであることを特徴とする請求項1から請求項7の何れか一項に記載された画像処理方法。
  9. 文書画像の情報を格納するメモリと、
    前記文書画像の情報の出力先となる出力先装置の情報を取得する第一の取得手段と、
    前記出力先装置の情報と前記文書画像の各領域の属性に基づき、前記領域ごとに出力すべき情報の種類を判断する判断手段と、
    前記領域ごとに、前記判断した種類に対応する情報を前記メモリから取得する第二の取得手段と、
    前記領域ごとに、前記メモリから取得した情報を統合する統合手段と、
    前記統合した情報を前記出力先装置に出力する出力手段とを有し、
    前記第二の取得手段は、前記判断した種類の情報が存在しない注目領域について、前記注目領域の画像に類似する画像を有し、かつ、前記判断した種類に対応する情報を有する前記文書画像の他の領域を検索し、当該検索でヒットした前記他の領域の前記判断した種類の情報を、前記注目領域の情報として取得することを特徴とする画像処理装置。
  10. 文書画像の情報を格納するメモリと、
    文書画像の情報の出力先となる出力先装置の情報を取得する第一の取得手段と、
    前記出力先装置の情報、前記文書画像の各領域の属性、並びに、前記文書画像の各領域についての文字認識の信頼度およびデータサイズの少なくとも何れかに基づき、前記領域ごとに出力すべき情報の種類を判断する判断手段と、
    前記領域ごとに、前記判断した種類に対応する情報を前記メモリから取得する第二の取得手段と、
    前記領域ごとに、前記メモリから取得した情報を統合する統合手段と、
    前記統合した情報を前記出力先装置に出力する出力手段とを有することを特徴とする画像処理装置。
  11. コンピュータを請求項9または請求項10に記載された画像処理装置の各手段として機能させることを特徴とするプログラム。
  12. 請求項11に記載されたプログラムが記録されたことを特徴とするコンピュータが読み取り可能な記録媒体。
JP2005253793A 2005-09-01 2005-09-01 画像処理装置およびその方法 Expired - Fee Related JP4738943B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2005253793A JP4738943B2 (ja) 2005-09-01 2005-09-01 画像処理装置およびその方法
JP2005363864A JP4553385B2 (ja) 2005-09-01 2005-12-16 画像処理方法およびその装置
EP06017806A EP1760605A1 (en) 2005-09-01 2006-08-25 Method, apparatus and computer program for processing structured documents to permit output to different types of output devices
US11/468,351 US7933447B2 (en) 2005-09-01 2006-08-30 Image processing apparatus and method thereof
CNB200610126692XA CN100502454C (zh) 2005-09-01 2006-09-01 图像处理装置及其方法
KR1020060084201A KR100808713B1 (ko) 2005-09-01 2006-09-01 화상 처리 장치, 방법 및 기록 매체

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005253793A JP4738943B2 (ja) 2005-09-01 2005-09-01 画像処理装置およびその方法
JP2005363864A JP4553385B2 (ja) 2005-09-01 2005-12-16 画像処理方法およびその装置

Publications (3)

Publication Number Publication Date
JP2007066188A JP2007066188A (ja) 2007-03-15
JP2007066188A5 JP2007066188A5 (ja) 2008-10-09
JP4738943B2 true JP4738943B2 (ja) 2011-08-03

Family

ID=37607364

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005253793A Expired - Fee Related JP4738943B2 (ja) 2005-09-01 2005-09-01 画像処理装置およびその方法
JP2005363864A Expired - Fee Related JP4553385B2 (ja) 2005-09-01 2005-12-16 画像処理方法およびその装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2005363864A Expired - Fee Related JP4553385B2 (ja) 2005-09-01 2005-12-16 画像処理方法およびその装置

Country Status (5)

Country Link
US (1) US7933447B2 (ja)
EP (1) EP1760605A1 (ja)
JP (2) JP4738943B2 (ja)
KR (1) KR100808713B1 (ja)
CN (1) CN100502454C (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100254606A1 (en) * 2005-12-08 2010-10-07 Abbyy Software Ltd Method of recognizing text information from a vector/raster image
US8374234B2 (en) * 2006-09-29 2013-02-12 Francis S. J. Munoz Digital scaling
JP4687625B2 (ja) * 2006-10-02 2011-05-25 富士ゼロックス株式会社 画像処理システムおよび画像処理プログラム
JP4997070B2 (ja) * 2007-10-31 2012-08-08 京セラドキュメントソリューションズ株式会社 電気機器、画像表示制御方法、及び、画像表示制御プログラム
US8488834B2 (en) * 2007-11-15 2013-07-16 Certifi-Media Inc. Method for making an assured image
JP5100354B2 (ja) * 2007-12-14 2012-12-19 キヤノン株式会社 画像処理装置、画像処理方法、及びコンピュータプログラム
US8593666B2 (en) * 2009-02-11 2013-11-26 Hewlett-Packard Development Company, L.P. Method and system for printing a web page
JP5264553B2 (ja) 2009-02-23 2013-08-14 キヤノン株式会社 画像処理装置、及びその制御方法,プログラム
JP4940270B2 (ja) 2009-07-06 2012-05-30 シャープ株式会社 画像形成装置
CN103294650B (zh) * 2012-02-29 2016-02-03 北大方正集团有限公司 一种显示电子文档的方法和装置
US10777164B2 (en) * 2014-12-19 2020-09-15 Qualcomm Incorporated Power optimization by rendering low-resolution tiles during page load
CN106874252A (zh) * 2017-02-17 2017-06-20 张家口浩扬科技有限公司 一种文档识别和显示方法及其移动终端
CN108334797B (zh) * 2017-06-21 2021-04-23 平安科技(深圳)有限公司 文件扫描方法、装置和计算机可读存储介质
JP7328797B2 (ja) * 2019-06-05 2023-08-17 株式会社日立製作所 端末装置、文字認識システム及び文字認識方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736860A (ja) * 1993-07-21 1995-02-07 Canon Inc 文書処理装置
JP2002305651A (ja) * 2002-01-24 2002-10-18 Fuji Xerox Co Ltd 画像処理装置および画像処理方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08204950A (ja) 1995-01-31 1996-08-09 Toshiba Corp イメージ管理装置及び方法
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JP3754791B2 (ja) * 1997-03-19 2006-03-15 キヤノン株式会社 画像検索装置及び方法
JPH11102414A (ja) * 1997-07-25 1999-04-13 Kuraritec Corp ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体
US6336124B1 (en) * 1998-10-01 2002-01-01 Bcl Computers, Inc. Conversion data representing a document to other formats for manipulation and display
JP2000306103A (ja) 1999-04-26 2000-11-02 Canon Inc 情報処理装置及び方法
US6785410B2 (en) * 1999-08-09 2004-08-31 Wake Forest University Health Sciences Image reporting method and system
US20020059265A1 (en) * 2000-04-07 2002-05-16 Valorose Joseph James Method and apparatus for rendering electronic documents
US7055095B1 (en) * 2000-04-14 2006-05-30 Picsel Research Limited Systems and methods for digital document processing
US7565605B2 (en) * 2001-05-08 2009-07-21 Nokia, Inc. Reorganizing content of an electronic document
US6768816B2 (en) * 2002-02-13 2004-07-27 Convey Corporation Method and system for interactive ground-truthing of document images
US20040205568A1 (en) * 2002-03-01 2004-10-14 Breuel Thomas M. Method and system for document image layout deconstruction and redisplay system
JP4154252B2 (ja) * 2003-02-04 2008-09-24 キヤノン株式会社 画像処理装置およびその方法
JP3993025B2 (ja) 2002-05-29 2007-10-17 株式会社リコー 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
JP4266695B2 (ja) * 2003-04-30 2009-05-20 キヤノン株式会社 画像処理装置及び画像処理方法
AU2003233572B8 (en) * 2003-05-17 2010-01-28 Microsoft Technology Licensing, Llc System and method for providing multiple renditions of document content
US7213035B2 (en) * 2003-05-17 2007-05-01 Microsoft Corporation System and method for providing multiple renditions of document content
JP2005148393A (ja) * 2003-11-14 2005-06-09 Ricoh Co Ltd 画像形成装置
US7287221B2 (en) * 2004-01-13 2007-10-23 International Business Machines Corporation Differential dynamic content delivery with text display in dependence upon sound level
US7519221B1 (en) * 2005-02-28 2009-04-14 Adobe Systems Incorporated Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts
JP2006350867A (ja) * 2005-06-17 2006-12-28 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラム及び情報記録媒体
JP4574467B2 (ja) * 2005-06-30 2010-11-04 キヤノン株式会社 データ処理装置、データ処理方法およびコンピュータプログラム
JP2007058725A (ja) * 2005-08-26 2007-03-08 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
US7702182B2 (en) * 2006-02-16 2010-04-20 Adobe Systems, Incorporated Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images
US7777915B2 (en) * 2006-06-15 2010-08-17 Eastman Kodak Company Image control system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736860A (ja) * 1993-07-21 1995-02-07 Canon Inc 文書処理装置
JP2002305651A (ja) * 2002-01-24 2002-10-18 Fuji Xerox Co Ltd 画像処理装置および画像処理方法

Also Published As

Publication number Publication date
KR20070026239A (ko) 2007-03-08
JP4553385B2 (ja) 2010-09-29
KR100808713B1 (ko) 2008-02-29
US7933447B2 (en) 2011-04-26
US20070047814A1 (en) 2007-03-01
CN100502454C (zh) 2009-06-17
CN1925541A (zh) 2007-03-07
JP2007066188A (ja) 2007-03-15
JP2007166541A (ja) 2007-06-28
EP1760605A1 (en) 2007-03-07

Similar Documents

Publication Publication Date Title
JP4738943B2 (ja) 画像処理装置およびその方法
US8456721B2 (en) Mosaic image generating apparatus and method
JP5452825B2 (ja) レンダリングのために多頁ドキュメントの頁別にサイズ縮小するための方法
US8244035B2 (en) Image processing apparatus and control method thereof
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US8223389B2 (en) Information processing apparatus, information processing method, and program and storage medium therefor
JP2008146258A (ja) 画像処理装置、画像処理方法
JP2006155381A (ja) 画像処理装置およびその方法
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
US20090279793A1 (en) Image processing apparatus and method for controlling the same
US20070127085A1 (en) Printing system, printing method and program thereof
EP2040451B1 (en) Information processing apparatus and information processing method
KR101525815B1 (ko) 부가정보 추가 문서를 생성하는 방법 및 이를 수행하는 화상형성장치
US8599433B2 (en) Image processor, image processing method, computer readable medium, and image processing system
JP5264155B2 (ja) プログラム、ファイル管理装置及びファイル管理方法
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2004304469A (ja) 原稿画像の領域分割・圧縮プログラム及び領域分割・圧縮方法
JP2008148263A (ja) 画像形成装置及びその制御方法
JP2008077148A (ja) 画像処理システムおよび画像処理装置
JP2010220046A (ja) 文書管理装置、文書管理システム、印刷制御方法、印刷制御プログラム、及びそのプログラムを記録した記録媒体
JP2009303149A (ja) 画像処理装置、画像処理方法及びコンピュータ制御プログラム
JP2010092141A (ja) 画像処理システム、画像読取装置、画像処理装置および画像処理プログラム
JP2000324331A (ja) 画像処理装置及びその方法
JP2009116405A (ja) プリントシステム、プリント方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080827

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110422

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110427

R150 Certificate of patent or registration of utility model

Ref document number: 4738943

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees