JP2006053690A - 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2006053690A
JP2006053690A JP2004233802A JP2004233802A JP2006053690A JP 2006053690 A JP2006053690 A JP 2006053690A JP 2004233802 A JP2004233802 A JP 2004233802A JP 2004233802 A JP2004233802 A JP 2004233802A JP 2006053690 A JP2006053690 A JP 2006053690A
Authority
JP
Japan
Prior art keywords
image
image data
processing
image processing
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004233802A
Other languages
English (en)
Inventor
Hirofumi Nishida
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004233802A priority Critical patent/JP2006053690A/ja
Priority to US11/191,954 priority patent/US7525694B2/en
Priority to EP05254869A priority patent/EP1646221A3/en
Priority to CNB2005100917204A priority patent/CN100362530C/zh
Publication of JP2006053690A publication Critical patent/JP2006053690A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30144Printing quality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0065Converting image data to a format usable by the connected apparatus or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3242Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of processing required or performed, e.g. for reproduction or before recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/333Mode signalling or mode changing; Handshaking therefor
    • H04N2201/33307Mode signalling or mode changing; Handshaking therefor of a particular mode
    • H04N2201/33378Type or format of data, e.g. colour or B/W, halftone or binary, computer image file or facsimile data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】カラー文書画像に対して、負荷や無駄が少ない方法で、様々な用途に最適な画像データを生成するためのデータの管理や手続きを行い、なおかつ拡張性に優れ、メンテナンスが容易な画像処理システムの提供を図ること。
【解決手段】オブジェクト指向を用い、画像データおよび画像要素と、画像処理と、画像処理の履歴および状態をオブジェクトとして一括管理する。処理を行いたい画像データに対し、まず、正規化を行い原画像オブジェクトを生成する(ステップS203)。次に、正規化された画像データは、最適化オブジェクトを用い用途に合わせた最適な画像データ形式へと変換され最適画像データが生成される(ステップS207)。オブジェクトの生成と状態の設定・変更も、オブジェクト内の同一のメソッド(機能)で行う。
【選択図】 図2

Description

この発明は、印刷文書をスキャナ等の画像機器から入力して得られるデジタル画像の認識、プリンタやディスプレイなどに出力・表示する際の画質を改善するために施す文書画像処理および認識のための方法、画像処理方法を実施するための文書画像処理、認識のための装置および前記方法を実行させるためのプログラム、装置および前記プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
カラースキャナやデジタルカメラの普及により、印刷文書をカラー入力して、その入力情報の蓄積・出力・再利用がなされている。さらに、入力された画像データのネットワークを介しての遠隔地への送信も行われている。このようなデジタルカラー文書画像データを、そのまま画像処理を何も施さずに表示・印刷したり、表示画像の文字を光学的に読み取り特定を行うOCR(Optical Character Reader)などの処理を施した場合、次のような現象がしばしば観測される。
・文字と背景の間のコントラストが低い。
・本来、白であるべき背景に色がついている。
・裏写りやノイズにより、背景が汚れている。
・画素が相互に干渉することにより、周期的な縞状のパターンが生じるモアレ現象が起こる。
・解像度が不十分なために、小さい文字の視認性が低く、OCRをかけても認識精度が低い。
このような問題の解決のためには、カラー文書画像データに適した画像強調を施す必要がある。従来、解決策として開示されているテキスト画像強調方法は、コントラスト強調などの階調変換、フィルタリング、モデルベースの画像復元、高解像度化の4種に分類することができる。
階調変換により、画像データのコントラストの強調とともに、地肌除去も行うことができる(例えば、下記特許文献1および非特許文献1,2参照。)。フィルタリングとしては、2値画像データまたは濃淡画像データからの特徴抽出を目的とするモルフォロジーを用いたノイズ除去方法(例えば、下記非特許文献3,4参照。)、2次フィルタを用い細部をぼかさずにノイズを除去する方法(例えば、下記非特許文献5参照。)などが開示されている。
また、モアレ現象の原因は、画像データ中のドットパターンとして表現された中間色部分であるが、その中間色部分を、連続階調表現に変換すれば、モアレ現象が解消される(例えば、下記特許文献2参照。)。また、OCRの誤認識の原因をクラスタ分析によりモデル化して画像復元する方法(例えば、下記非特許文献6参照。)などのモデルベースの画像復元も有効である。
文字の視認性やOCRの精度を向上させるためには、低解像度の文字画像データを高解像度化することが有効である。これには、テキスト画像上の文字ビットマップ(画像を色のついた点の羅列として表現したデータ)をクラスタリングして平均することにより、任意の解像度のアウトラインを生成する方法(例えば、下記特許文献3および非特許文献7参照。)、分布の双峰性、滑らかさ、輝度の3つの尺度から構成される評価関数に基づく逆問題として定式化し、最適な高解像度画像データを復元する方法(例えば、下記非特許文献8,9参照。)、補間による高解像度化と2値化に基づく方法(例えば、下記特許文献4〜7および非特許文献10,11参照。)などが開示されている。このように、カラー文書画像データに対して、様々な処理を施すことによって、表示、印刷、OCRなどの様々な用途に最適な画像データを生成することができる。
また、最近では、OCRに適した2値画像データや、印刷に適したラスター画像データの生成のほかにも、デジタル化された画像に対する新しい用途が出現してきている。画像データを、背景(低解像度に縮約する)と、文字などの前景(原解像度のまま、あるいは、高解像度化した)と、前景の色(文字色のパレットなど)とに分解して表現するMixed Raster Content Modelに基づく新しい画像データファイル表現方法、あるいは、スキャン画像データから得られる文字や写真などの構成要素を、HTMLなどを用いて画面上のブラウジングに適した形に再配置・再構成する技術も開示されている(例えば、下記非特許文献12参照。)。
米国特許第5524070号明細書 特開2003−281526号公報 米国特許第5930393号明細書 特許第3345350号公報 特開平8−340446号公報 特開2001−118032号公報 米国特許第6347156号明細書 ワイ・シー・シン(Y.C.Shin)、外4名、「コントラスト エンハンスメント オブ メール ピース イメージズ(Contrast enhancement of mail piece images)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1992年、第1661巻、p.27−37 ワイ・シン(Y.Shin)、外2名、「エンハンスメント オブ メール ピース イメージズ ベースド オン ウィンドウ スタティスティックス(Enhancement of mail piece images based on window statistics)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1993年、第1906巻、p.37−48 エル・コスキネン(L.Koskinen)、外2名、「テキスト エンハンスメント メソッド ベースド オン ソフト モフォロジカル フィルターズ(Text enhancement method based on soft morphological filters)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1994年、第2181巻、p.243−253 ジェイ・リャン(J.Liang)、外2名、「ドキュメント イメージ レストレ−ション ユージング バイナリー モフォロジカル フィルターズ(Document image restoration using binary morphological filters)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1996年、第2660巻、p.274−285 ジー・ランポーニ(G.Ramponi)、外1名、「エンハンシィング ドキュメント イメージズ ウィズ ア クアドレティック フィルター(Enhancing document images with a quadratic filter)」、(米国)、シグナル プロセシング(Signal Processing)、1993年、第33巻、p.23−34 エム・ワイ・ジャシマ(M.Y.Jaisimha)、外3名、「モデル−ベースド レストレーション オブ ドキュメント イメージズ フォー OCR(Model-based restoration of document images for OCR)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1996年、第2660巻、p.297−308 ジェイ・ディー・ホビィー(J.D.Hobby)、外1名、「エンハンシィング ディグレーデッド ドキュメント イメージズ ヴィア ビットマップ クラスタリング アンド アヴェレージング(Enhancing degraded document images via bitmap clustering and averaging)」、(独国)、プロシーディング オブ 第4回インターナショナル カンファレンス オン ドキュメント アナリシス アンド リコギニション(Proceeding of 4th International Conference on Document Analysis and Recognition)、1997年8月 ピー・ディー・トウン(P.D.Thouin)、外1名、「ア メソッド フォー レストレーション オブ ロウ−レゾリューション ドキュメント イメージズ(A method for restoration of low-resolution document images)」、(米国)、インターナショナル ジャーナル オン ドキュメント アナリシス アンド リコギニション(International Journal on Document Analysis and Recognition)2000年、第2巻、p.200−210 ピー・ディー・トウン(P.D.Thouin)、外1名、「オートメッテド システム フォー レストレーション オブ ロウ−レゾリューション ドキュメント アンド テキスト イメージズ(Automated system for restoration of low-resolution document and text images)」、(米国)、ジャーナル オブ エレクトロニック イメージング(Journal of Electronic Imaging)、2001年、第10巻、第2号、p.535−547 エム・ジェイ・タイラー(M.J.Taylor)、外1名、「エンハンスメント オブ ドキュメント イメージズ フロム カメラズ(Enhancement of document images from cameras)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1998年、第3305巻、p.230−241 エッチ・リー(H.Li)外2名、「テキスト エンハンスメント イン デジタル ビデオ(Text enhancement in digital video)」、(米国)、プロシーディングス オブ SPIE(Proceedings of SPIE)、1999年、第3651巻、p.2−9 ティー・ブリューエル(T.Breuel)、外3名、「ペーパー トゥー PDA(Paper to PDA)」、(カナダ)、プロシーディング オブ 第16回インターナショナル カンファレンス オン パターン リコギニション(Proceeding of 16th International Conference on Pattern Recognition)、2002年8月
しかしながら、カラー文書画像データに対して行う、ユーザの指定するデータ形式(用途)の種類が少ない場合には、従来の画像処理システムのように、入力画像データに対して、いくつかの処理をパイプライン的に適用して、処理結果の画像データを得れば十分であったが、用途が多様化してくると、次のような問題が生じる。
1.各用途のアプリケーションプログラムに負荷や無駄が生じる。
・同じ処理が各用途によって個別に呼び出されるために、処理に無駄が生じる。
・処理のUndo(取り消し)やRedo(やり直し)のために必要な中間データを各用途ごとに個別に管理する必要がある。
・処理の履歴や状態を各用途が個別に管理する必要がある。
2.拡張やシステムのメンテナンスが難しくなる。
・ある用途に最適な画像データの生成のための新しい処理、あるいは、新しい用途、ファイル形式や画像データ表現形式を導入したときに、各用途のアプリケーションプログラムごとに、個別対応が必要である。
・各用途に付随しているファイル形式や画像表現形式と、最適画像を生成するための処理を混同してしまう。そうすると、モジュール性の低いアプリケーションプログラムを、用途、ファイル形式や画像表現形式の数だけ開発することになる。
この発明は、上述した従来技術による問題点を解消するため、スキャナなどの画像機器により入力されたカラー文書画像データに対して、負荷や無駄が少ない方法で、様々な用途に最適な画像データを生成するためのデータの管理や手続きを行い、なおかつ拡張性に優れ、メンテナンスが容易な画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体の提供を目的とする。
上述した課題を解決し、目的を達成するため、請求項1の発明にかかる画像処理装置は、画像処理のための画像特徴量、画像要素および機能を含んだ画像処理に適した状態の画像データにする正規化により生成された原画像オブジェクトと、ユーザの指定する形式の画像データの生成を行う最適化オブジェクトからなる画像処理オブジェクトを用いて、オブジェクト指向による画像処理を行う画像処理装置であって、前記画像処理の対象となる画像データを取り込む取り込み手段と、前記取り込み手段により取り込んだ前記画像データに、正規化処理を行い原画像オブジェクトを生成する正規化処理手段と、前記正規化処理手段により正規化された前記画像データを基に、前記最適化オブジェクトにより最適画像データの生成を行う最適化処理手段と、を備えたことを特徴とする。
この請求項1の発明によれば、どの様な画像データ入力機器からの入力データであっても、ユーザの指定する多様な用途に対応した最適画像データを生成することができる。
また、請求項2の発明にかかる画像処理方法は、画像処理のための画像特徴量、画像要素および機能を含んだ画像処理に適した状態の画像データにする正規化により生成された原画像オブジェクトと、ユーザの指定する形式の画像データの生成を行う最適化オブジェクトからなる画像処理オブジェクトを用いて、オブジェクト指向による画像処理を行う画像処理方法であって、前記画像処理の対象となる画像データを取り込む取り込み工程と、前記取り込み工程により取り込んだ前記画像データに、正規化処理を行い原画像オブジェクトを生成する正規化処理工程と、前記正規化処理工程により正規化された前記画像データを基に、前記最適化オブジェクトにより最適画像データの生成を行う最適化処理工程とを含むことを特徴とする。
この請求項2の発明によれば、どの様なカラー文書画像データを扱う場合でも、ユーザの多様な用途に対応した最適画像データを生成することができる。
また、請求項3の発明にかかる画像処理方法は、請求項2に記載の発明において、前記最適化処理工程は、正規化された前記画像データの地肌部分を白にまとめる地肌除去処理工程と、前記地肌除去処理工程に用いる地肌除去のための階調変換曲線を表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、を含むことを特徴とする。
この請求項3の発明によれば、階調変換曲線を用いることで、画像データの地肌部分を白に縮約することができ、さらにオブジェクトを生成することで、縮約のためのパラメータを格納保管することができる。
また、請求項4の発明にかかる画像処理方法は、請求項2に記載の発明において、前記最適化処理工程は、正規化された前記画像データの地肌部分を地肌の代表色にまとめる地肌クリーニング処理工程と、前記地肌クリーニング処理工程に用いる地肌クリーニングのための階調変換曲線を表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、を含むことを特徴とする。
この請求項4の発明によれば、階調変換曲線を用いることで、画像データの地肌部分を地肌部分の代表色に縮約することができ、さらにオブジェクトを生成することで、縮約のためのパラメータを格納保管することができる。
また、請求項5の発明にかかる画像処理方法は、請求項2に記載の発明において、前記最適化処理工程は、正規化された前記画像データ中から抽出された文字を原解像度、あるいは、高解像度化された2値画像データとして抽出する抽出処理工程と、前記抽出処理工程により抽出された前記2値画像データを表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、を含むことを特徴とする。
この請求項5の発明によれば、画像データ中の文字を抽出し、原解像度、あるいは、高解像度化された2値画像データとして格納保管することができる。
また、請求項6の発明にかかる画像処理方法は、請求項2に記載の発明において、前記最適化処理工程は、正規化された前記画像データ中から抽出された文字の各々に対して、その色を推定する推定処理工程と、前記推定処理工程により推定された文字色データを表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、を含むことを特徴とする。
この請求項6の発明によれば、画像データ中の文字を抽出し、各文字の色データを格納保管することができる。
また、請求項7の発明にかかる画像処理方法は、請求項6に記載の発明において、前記最適化オブジェクト生成工程は、前記文字色データを少数のクラスタに分類し、正規化された前記画像データ中の各文字をいずれかの色クラスタに割り当てを行う割り当て処理工程と、クラスタを特徴づけるデータと各文字のクラスタ割り当てデータを表すオブジェクトを前記最適化オブジェクトを構成するオブジェクトの一つとして生成するオブジェクト生成工程と、を含むことを特徴とする。
この請求項7の発明によれば、請求項6にかかる発明で格納保管された文字色データを少数のクラスタに分類し、画像データ中の各文字をいずれかの色クラスタに割り当てることができる。
また、請求項8の発明にかかる画像処理方法は、請求項2に記載の発明において、前記正規化処理工程により生成した原画像オブジェクトおよび前記最適化オブジェクト生成工程により生成した最適化オブジェクトは、前記画像特徴量や前記画像要素などからなる基本データを持ち、前記正規化処理工程および前記最適化オブジェクト生成工程は、それぞれ、前記基本データに施すための画像処理を規定する画像特徴量および画像要素を計算するための計算工程と、前記計算工程による計算結果を格納保管するためのオブジェクトを生成するためのオブジェクト生成工程と、前記オブジェクト生成工程により生成された前記オブジェクトへのポインタを有し、前記オブジェクト内の基本データに対する処理の設定、更新、現在の処理状態、履歴をそれぞれ管理するオブジェクト管理工程と、前記処理状態および履歴のデータを有し、前記オブジェクトの現在の処理状態に応じて、画像データを生成する画像生成工程と、を含むことを特徴とする。
この請求項8の発明によれば、複雑な機能実行および状態の管理をオブジェクトで一括して行うことができる。
また、請求項9の発明にかかる画像処理方法は、請求項8に記載の発明において、前記画像生成工程は、全体あるいは指定された部分のラスター画像データを生成するラスター画像生成工程を含むことを特徴とする。
この請求項9の発明によれば、オブジェクトの状態に応じて、階調変換、解像度変換などの処理を施したラスター画像データを生成することができる。
また、請求項10の発明にかかる画像処理方法は、請求項8に記載の発明において、前記画像生成工程は、全体あるいは指定された部分の文字を2値画像データあるいはカラー画像データとして生成する文字画像生成工程を含むことを特徴とする。
この請求項10の発明によれば、オブジェクトの現在の状態の内、特に文字データの解像度倍率を参照して、指定した部分の文字画像データを出力することができる。
また、請求項11の発明にかかる画像処理方法は、請求項8に記載の発明において、前記画像生成工程は、全体あるいは指定された部分について、指定された色クラスタに属する色を持つ文字を集めた画像データを生成する色文字画像生成工程を含むことを特徴とする。
この請求項11の発明によれば、各色クラスタについて、当該クラスタに属する色を持つ文字を集めた2値画像を生成することができる。
また、請求項12の発明にかかる画像処理プログラムは、請求項2〜11のいずれか一つに記載の画像処理方法をコンピュータに実行させることを特徴とする。
この請求項12の発明によれば、既成のオブジェクトを用いてプログラムを構成することで、様々な用途および画像データ入力機器の特性に柔軟に対応することができる。
また、請求項13の発明にかかる記録媒体は、請求項12の画像処理プログラムが記録されていることを特徴とする。
この請求項13の発明によれば、当該記録媒体があれば、請求項1に記載の各手段を用意するだけで、場所を選ばず本発明にかかる画像処理を行うことができる。
本発明によれば、オブジェクト指向に基づいてデータの取り扱いを行うため、負荷や、無駄が少なく、拡張性に優れ、メンテナンスが容易な画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体を提供できるという効果を奏する。
以下に添付図面を参照して、この発明にかかる画像処理方法、画像処理装置、画像処理プログラムおよび記録媒体の好適な実施の形態を詳細に説明する。
この発明では、「オブジェクト指向」を導入したプログラムを用いる。オブジェクト指向とは、プログラムの内部構造よりもプログラムに関わる変数と、行われる機能に重点を置く考え方である。そしてこの発明の実施の形態では、カラー文書画像データを扱う場合は、原画像データ(正規化された画像データ)と、用途に最適な画像データの生成のための「材料」、最適画像データ生成のための従来処理方法(手続き)、そして処理の履歴や状態を「オブジェクト」として一括管理する。
具体的に、最適画像データ生成のための「材料」は、例えば、階調変換関数を規定するパラメータセット、高解像度化された文字を表す2値画像データ、文字色データやそのクラスタデータなどである。処理の履歴や材料は、例えば、数種類の階調変換の候補から選ばれたもののインデックス、高解像度化の倍率、文字色のクラスタリング方法、あるいは、各処理のON/OFFなどである。
(実施の形態)
図1は、本発明にかかる画像処理方法を実現する画像処理装置の一構成例を示すブロック図である。図1において、画像処理装置110は、CPU111と、メモリ112(ROM1121とRAM1122により構成)と、ハードディスク部(以下、「HDD」という)113と、リムーバブルディスク部114と、表示部115と、キーボードとマウスなどポインティングデバイスからなる入力部116と、スキャナ部117と、ネットワークインタフェース118とが、バス119に接続した構成になっている。画像処理装置110は、ネットワークインタフェース118から通信回線100を介して外部ネットワークに接続されている。
この実施の形態では、画像処理の対象となるカラービットマップ画像データは、リムーバブルディスク部114に格納されているものとする。また、本発明にかかる画像処理プログラムは、HDD113に格納されているものとする。ユーザが画像処理プログラムを起動すると、画像処理プログラムは、RAM1122に読み込まれ、画像処理が可能になる。他にも、通信回線100を介してネットワークインタフェース118に送られてきた画像データや、スキャナ部117から読み取った画像データをRAM1122に格納し、画像処理を行ってもよい。
図1に示した画像処理装置110により実行される最適画像データの生成動作について、図2を用いて説明する。図2は、画像処理装置の最適画像データの生成動作の流れを表すフローチャートである。
まず、画像処理装置110を起動すると、CPU111からの命令によりHDD113に格納されている画像処理プログラムがRAM1122へ格納される(ステップS201)。次に、入力部116のキーボードまたはポインティングデバイスを用い、リムーバブルディスク部114から、用途に合わせた最適化変換を行いたいカラービットマップによる画像データを選択し(ステップS202)、画像データの読み出しを行う。
読み出された画像データは、RAM1122へ格納され、画像処理プログラムにより正規化処理を施され、原画像オブジェクトが生成される。この正規化処理は、入力された画像データの種類・状態の如何に関わらず一律に施され、画像処理装置110における最適画像データ生成のための「材料」の一つである原画像データ(正規化された画像データ)として、RAM1122内の画像処理プログラムへ追加される(ステップS203)。
次に、入力部116のキーボードまたはポインティングデバイスから、画像データの用途(使用したい画像データの形式)の設定が行われる(ステップS204)。次に、選択された用途に適した画像データを生成するための最適化オブジェクトがすでに生成されているかの判断を行う(ステップS205)。この判断は、特定のオブジェクト内のメソッド(機能)で、一括して行う、このメソッドでは、生成された後の状態の管理も同時に行う。
すでに、最適化オブジェクトが生成されていれば(ステップS205:Yes)、その最適化オブジェクトを用い、最適化された画像データの生成を行う(ステップS207)。入力された画像データの用途に合った最適化オブジェクトが生成されていない場合(ステップS205:No)、画像処理プログラムにおいて、最適化オブジェクトが生成される。生成された最適化オブジェクトは、RAM1122内の画像処理プログラムへ追加される(ステップS206)。生成された最適化オブジェクトにより最適化された画像データを生成し(ステップS207)、最適化画像データ生成処理は終了する。
ステップS203およびステップS206に記したように、生成されたオブジェクトは、RAM1122内の画像処理プログラムに追加される。プログラムを終了する際は、あらたなオブジェクトが追加された画像処理プログラムをHDD113へ格納し、ステップS201で読み出された画像処理プログラムは、上書きされる。
(画像処理プログラムのオブジェクトの全体構成について)
次に、図2のフローチャートで行われた処理を実現させるために用いられている「オブジェクト」に関して説明する。オブジェクトは、入力データ(変数)に応じて、オブジェクトの内部状態に合わせた所定の機能を実行するブラックボックスである。ユーザは、行いたい機能に合わせ、既成のオブジェクトを呼び出し、実行させる。
従って、行いたい機能を持つオブジェクトがない場合や、複雑な機能を実行させたい場合は、既成オブジェクトを複数組み合わせ、その組み合わせ自体を一つのオブジェクトとして生成する。また、オブジェクトは、基本となる機能が同じ場合、扱う変数の変更や、機能の増加により容易に派生オブジェクトを生成することが可能である。
図2のフローチャートを用いた動作の説明で述べたように、画像入力機器を通してデジタル化された画像データは、まず、画像入力に使用された前記画像入力機器に固有の特性による画質変動を修正するための「正規化処理」が施される。
例えば、スキャナのMTF(Modulation Transfer Function:変調伝達関数)によっては、モアレ現象が生じることがあるが、これを解消するためには、特許文献2のような、ドットで表現された中間調パターンを連続階調表現に変換するような正規化処理を施せばよい。
この正規化処理により入力画像データは、画像処理に適した状態の画像データである原画像データとなる。原画像データは、正規化処理の際に生成された原画像オブジェクトによって表される。原画像オブジェクトも複数のオブジェクトの集合により構成されている。
次に、用途によって最適な画像を生成するための処理(以下、「最適化処理」という)を施す。ここで、用途としては、紙への印刷、ディスプレイやPDA上への表示、検索などが考えられるが、それぞれの用途に応じて、「最適画像」の画像表現形式、あるいは、ファイル形式が異なってくる。
紙印刷では、ラスター画像やPDFなどの構造化ファイル、表示では、HTML、検索では、OCRをかけたテキストファイルとして表現する必要がある。それぞれの用途、あるいは、画像表現・ファイルの生成プログラムに、「最適化処理」を組み込んでしまうと、先に述べたように、負荷や無駄が生じたり、拡張やメンテナンスが難しくなったりするという問題が生じる。
このような問題の解消のために、ここでも、原画像データと最適画像データ生成のための「材料」、最適画像データ生成のための処理(手続き)、そして、処理の履歴や状態を「オブジェクト」として扱い、これらのオブジェクトを一括管理するため、「要素構造化(オブジェクト)表現」部を導入する。「要素構造化(オブジェクト)表現」部は、同じ種類のオブジェクトが共通で持っている機能と個々に持つことができる状態の記憶形式を記述したテンプレートであるクラスにより構成されている。図3は、この「要素構造化(オブジェクト)表現」部の全体構成を表したクラス階層図である。
図3のクラス階層において、Root300は、「要素構造化(オブジェクト)表現」部全体をまとめる形式的なルートであり、中身は空になっている。Root300はImage301、Tone Correction302、Color Cluster303の3つの基底クラスを持つ。
Image301は、一般的な画像のオブジェクトのクラスであり、画像情報(サイズ、解像度)やラスター画像配列のような基本データを格納保管する。また、それら格納保管データを設定するための手続きをメソッドとして持つ。Tone Corrction302は、階調変換オブジェクトのクラスである。Color Cluster303は、文字色クラスタオブジェクトのクラスである。
Original Image304は、画像機器から入力される、または、通信回路やデータ読み取り機器から得られる画像データ(本実施の形態では、リムーバブルディスク部114に格納されている画像データ。)へ正規化を施した画像データを表す原画像オブジェクトのクラスである。Binary Text305は、文字オブジェクトのクラスであり、Text Color306は、文字色オブジェクトのクラスである。これら3つのクラスは、Image301から派生したものである。
(オブジェクトの構成について)
図3に示した様な機能ごとに派生したクラスを用い、画像処理の種類ごとにオブジェクトとして構成する。本発明の実施の形態における画像処理プログラム内のオブジェクトは、具体的には、原画像オブジェクト、最適化オブジェクトなどがある。原画像オブジェクトは、正規化を施された原画像を表すオブジェクトであり、最適化オブジェクトは、原画像に施す最適化処理を規定するパラメータやデータのセットを表すオブジェクトまたは、最適化を行うために必要な画像要素に施す処理を規定するパラメータやデータのセットを表すオブジェクトである。
図4は、最適化オブジェクトの構成の一例である。最適化オブジェクト400は、さらに、原画像オブジェクト401と、階調変換オブジェクト402と、文字オブジェクト403と、文字色オブジェクト404と、文字色オブジェクト404から派生した文字色クラスタオブジェクト405から構成されている。原画像オブジェクト401については、先に述べたが、それ以外の各オブジェクトは、具体的には以下のような処理を行う。
・階調変換オブジェクト:画像データの地肌部分を白に縮約する「地肌除去」や、地肌部分の代表色に縮約する「地肌クリーニング」のための階調変換を規定するパラメータを格納保管するオブジェクト。
・文字オブジェクト:画像データ中の文字を抽出し、原解像度の、あるいは、高解像化された2値画像データとして格納保管するオブジェクト。
・文字色オブジェクト:画像データ中の文字を抽出し、各文字の色データを格納保管するオブジェクト。
・文字色クラスタオブジェクト:文字色オブジェクトで格納保管されている文字色データを少数のクラスタに分類し、画像データ中の各文字をいずれかの色クラスタに割り当てるためのオブジェクト。
上記の最適化オブジェクトを構成する各オブジェクトには、そのオブジェクトを生成するための「入力」となったオブジェクトからのポインタ(プログラムで、メモリ領域を指し示す変数や、引数)が張られる。「階調変換オブジェクト402」、「文字オブジェクト403」、「文字色オブジェクト404」は、原画像データ(正規化された入力画像データ)を入力として生成されるので、「原画像オブジェクト401」からのポインタが張られる。また、「文字色クラスタオブジェクト405」は、「文字色オブジェクト404」を入力として計算されるので、「文字色オブジェクト404」からのポインタが張られる。
(各オブジェクトのメンバ変数とメソッドについて)
各オブジェクト内には、次のようなメンバ変数(クラスの現在状態の実装)とメソッドを持つ。
・基本データ:当該オブジェクトの基本データ(画像やパラメータ)。
・最適化オブジェクト生成の手続き:最適化処理を規定するパラメータやデータのセットの計算を行う。対応する最適化オブジェクトを生成し、計算結果を最適化オブジェクトとして管理する。
・最適化オブジェクトへのポインタ:当該オブジェクトを基に生成された最適化オブジェクトへのポインタ。
・現在の状態の管理・設定:最適化処理のON/OFFなどの履歴や状態を設定するための手続きと、管理するための変数。
・現在の状態に応じた画像合成手続き:最適化処理の現在状態を参照して、画像データを合成する。
具体的に上述のメンバ変数とメソッドうちのどれを用い、また用いたメンバ変数とメソッドの内容は各オブジェクトにより異なる。例えば、「原画像オブジェクト401」は、次の1.〜5.のようなメンバ変数とメソッドから構成される。
1.基本データ
・原画像のラスターデータ、サイズ、解像度
2.最適化オブジェクト生成の手続き
・階調変換オブジェクト生成
文字オブジェクト(解像度倍率をパラメータ)と文字色オブジェクトの生成
3.最適化オブジェクトへのポインタ
・階調変換オブジェクト
・文字オブジェクト(解像度倍率ごと)
・文字色オブジェクト
4.現在の状態を設定するための手続きと、状態を管理するための変数
・階調変換のモード(地肌除去/地肌クリーニング/OFF)
・地肌除去/クリーニングに用いる階調変換のインデックス
・文字の解像度倍率(文字強調をする場合は1以上、しない場合は0)
5.現在の状態に応じた画像合成手続き
・ラスター画像データの生成:現在の状態を参照して、階調変換、解像度変換などの処理を施したラスター画像データを生成する手続き(印刷用)
・2値/カラー文字画像データの出力:現在の状態、特に、文字の解像度倍率を参照して、指定された部分の文字画像データを出力する手続き(OCR用、HTML用)
・各色クラスタに属する文字画像データの生成:色クラスタの各々について、そのクラスタに属する色を持つ文字を集めた2値画像データを生成する手続き(PDF用)
また、「文字色オブジェクト404」は、次の1.〜4.のようなメンバ変数とメソッドから構成される。
1.基本データ
・各文字の色を表すラスター画像データ、サイズ、解像度
2.最適化オブジェクト生成の手続き
・文字色クラスタオブジェクトの生成
3.最適化オブジェクトへのポインタ
・文字色クラスタオブジェクト
4.現在の状態を設定するための手続きと、状態を管理するための変数
・クラスタリングのON/OFF
(最適化オブジェクトの生成と、状態の設定・変更と管理について)
最適化オブジェクトがすでに生成されているかどうかを各用途ごとのアプリケーション側で管理するのは煩わしい。そこで、最適化オブジェクトの生成と状態の設定・変更を、同一のメソッドを通して行えるようにする。
例えば、階調変換オブジェクトの生成、モード設定・変更(地肌除去/地肌クリーニング/階調変換OFF)、地肌除去/クリーニングの強度の設定・変更は、原画像オブジェクトの単一のメソッド「set_tone_correction(int mode、int factor)」で行うようにする。このメソッドが起動された時点で階調変換オブジェクトがまだ生成されていない場合には、階調変換オブジェクトの生成(地肌の代表色の計算や階調変換を規定するパラメータの計算を含む)を行ってから、状態(階調変換のモードやインデックス)の設定を行う。すでに生成されている場合には状態の設定・変更のみを行う。
(プログラム例)
上述した画像要素のオブジェクト指向表現プログラムを用いた、最適画像生成プログラムの例をプログラム言語「C++」を用いて示す。
原画像オブジェクトのクラス定義を行うプログラム例を図5に、文字色オブジェクトのクラス定義を行うプログラム例を図6に示す。図5中のソースコード500および、図6中のソースコード600は、プログラム言語「C++」によるプログラミングの一例である。
図7−1〜7−3は、原画像生成に関するオブジェクトのプログラム例と画像生成結果を示す図である。図7−1のソースコード710では、変数imgを原画像クラス型、dibarrayを合成された画像を格納する文字型配列へのポインタとして宣言し、原画像オブジェクトimgを初期化するメソッド「set_image」を、入力画像データへのポインタdibarray_0をパラメータとして起動する。ここで、imgについて現在の状態を参照してラスター画像データを生成するメソッド「rendering」を起動すると、図7−2に示すような画像720が生成される。ここでは、「最適化処理」が何も施されていないので、入力画像がそのまま出力される。その一部を拡大したものを図7−3の拡大画像730に示す。
図8−1〜8−3は、画像の地肌クリーニングに関するプログラム例と画像生成結果を示す図である。図8−1のソースコード810では、レベル0の地肌クリーニングを設定するように、階調変換オブジェクト設定のメソッド「set_tone_correction」を起動する。さらに、文字オブジェクト(解像度を2倍)と文字色オブジェクトの設定を行うメソッド「set_text_enhancement」を起動する。ここで、imgについて現在の状態を参照してラスター画像データを生成するメソッド「rendering」を起動すると、図8−2に示すような画像820が生成される。その一部を拡大したものを図8−3の拡大画像830に示す。ここでは、地肌の汚れや裏写りが消えて、拡大すると文字の鮮明さが向上している。
図9−1〜9−3は、画像の地肌クリーニングに関するプログラム例と画像生成結果を示す図である。図9−1のソースコード910では、階調変換オブジェクトが機能しない設定にするように、メソッド「set_tone_correction」を起動する。ここで、imgについて現在の状態を参照してラスター画像データを生成するメソッド「rendering」を起動すると、図9−2に示すような画像920が生成される。その一部を拡大したものを図9−3の拡大画像930に示している。ここでは、地肌は原画像の状態に戻って、汚れや裏写りが再現しているが、拡大すると文字の鮮明さは図8−3の拡大画像830の状態のままである。
図10−1〜10−3は、画像の文字強調と地肌クリーニングに関するプログラム例と画像生成結果を示す図である。図10−1のソースコード1010では、文字オブジェクトと文字色オブジェクトが機能しない設定にするように、メソッド「set_text_enhancement」を起動する。また、レベル0の地肌除去を設定するように、階調変換オブジェクト設定のメソッド「set_tone_correction」を起動する。ここで、imgについて現在の状態を参照してラスター画像データを生成するメソッド「rendering」を起動すると、図10−2に示すような画像1020が生成される。その一部を拡大したものを図10−3の拡大画像1030に示している。ここでは、地肌は除去されて白に縮約されるが、文字は原画像の状態に戻っている。
図11−1〜11−3は、画像の文字解像度と文字色に関するプログラム例と画像生成結果を示す図である。図11−1のソースコード1110では、文字オブジェクト(解像度を2倍)と文字色オブジェクトの設定を行うメソッド「set_text_enhancement」を起動する。さらに、文字色のクラスタリングをONに設定するように、文字色オブジェクトText_Colorのメソッド「set_color_clustering」を起動する。ここで、Text_Colorのメソッド「number_of_cluster」を起動することにより、色クラスタの数が得られる(この例では2)。色クラスタのそれぞれについて、そのクラスタに属する文字を集めた画像データを生成するメソッド「get_color_plane」を起動すると、図11−2および図11−3に示すような文字色クラスタ別に画像1120および画像1130が得られる。
図12−1および図12−2は、ラスター画像生成に関するプログラム例と画像生成結果を示す図である。図12−1のソースコード1210では、imgについて現在の状態を参照してラスター画像データを生成するメソッドrenderingを起動している。図12−2に示す生成された画像1220は、図9−2の画像920と比べて、文字の解像度が2倍になっているため、鮮明さが向上し、さらに、文字色がクラスタリングされているために、色のむらがなくなっている。その一方で、地肌は除去された状態のままである。
図13−1〜13−4は、画像の階調変換と文字に関するプログラム例と画像生成結果を示す図である。図13−1のソースコード1310では、原画像における(807,828)を座標とする画素を原点とし、幅と高さがそれぞれ25であるような部分領域に属する2値文字画像データを生成するメソッド「get_binary_character」を起動している。ここでは、文字解像度が2倍に設定されている。ソースコード1310により生成されたのが図13−2に示す画像1320である。そして図13−3のソースコード1330では、メソッド「set_text_enhancement」により文字解像度を1倍に設定し直した後、再び、メソッド「get_binary_character」を起動している。ソースコード1330により生成されたのが図13−4に示す画像1340である。それぞれの生成画像を見ると、文字解像度の設定による2値画像の品質の違いが顕著である。
図14−1〜14−3は、画像の階調変換と文字および文字色に関するプログラム例と画像生成結果を示す図である。図14−1のソースコード1410では、階調変換オブジェクトが機能しない設定、そして、文字オブジェクトと文字色オブジェクトが機能しない設定にするように、2つのメソッドを起動している。メソッド「rendering」の起動の結果生成された図14−2に示す画像1420およびその一部を拡大した画像である図14−3の拡大画像1430を見ると、再び図7−3の拡大原画像730と同じ状態に戻っていることがわかる。
図15−1および図15−2は、2値文字画像に関するプログラム例と画像生成結果を示す図である。図15−1のソースコード1510では、図13−1中のソースコード1310と同様に、部分領域に属する2値文字画像データを抽出するメソッド「get_binary_character」を起動している。ところが、文字オブジェクトと文字色オブジェクトが機能しない設定になっているため、文字が抽出されないので、図15−2の画像1520のように画像が生成されない。
図16−1および図16−2は、2値文字画像の解像度に関するプログラム例と画像生成結果を示す図である。図16−1のソースコード1610では、再び解像度を2倍にして文字オブジェクトと文字色オブジェクトを設定するように、メソッド「set_text_enhancement」を起動し、部分領域に属する2値文字画像データを抽出するメソッド「get_binary_character」を起動すると、図13−1中のソースコード1310の結果である画像1320(図13−2参照)と同じ画像が図16−2の画像1620の様に得られる。
以上、実施の形態のプログラム例の中に登場したメソッドは全て既成のものである。このように、アプリケーション側では、個々の「最適化処理」の実装形態に気を使うことなく、少数のメソッドを用いるだけで、用途に適した画像を得ることができる。また、中間データを格納保管する必要もなく、あらたな「最適化処理」が導入されても、実装が異なるメソッドを共通のインタフェースによって同じように扱えるよう規格を揃えることで(ポリモーフィズム)、新規にオブジェクトを作成する場合でも、必要に応じてその処理に対応するオブジェクトの操作メソッドを呼び出す部分を追加するだけでよい。
本実施の形態は、多様化するデジタル化された画像データの用途に対応するために、原画像データと最適画像データ生成のための「材料」、最適画像データ生成のための処理(手続き)、そして、処理の履歴や状態を「オブジェクト」として一括管理する方法を提案した。このような「オブジェクト指向」の導入により、次の1.〜3.のような利点がある。
1.処理の履歴や状態を一括して管理するので、各用途ごとに気にする必要がない。
2.原画像データ(正規化された)と最適化のための「材料」を常に格納保管することにより、
・いつでも任意の状態に戻れることができて、Undo、Redoも簡単である。
・一度作った最適画像データ生成のための「材料」を共同利用できる。すなわち、複数の「用途」から最適化処理が多重呼び出しされない。
3.用途と最適画像生成が分離されているので、拡張性やシステムのメンテナンスが容易になる。システム側では、現在の「状態」を参照して、各用途に応じた画像を合成する手続きを、オブジェクトに付随するメソッドとして用意するだけでよい。例えば、印刷のためにはラスター画像、OCRのためには2値画像データを、原画像データと最適画像データ生成のための「材料」から生成する単純な手続きだけでよい。
以上説明したように、本発明にかかる画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体によれば、スキャナなどの画像機器により入力されたカラー文書画像に対して、様々な用途に最適な画像を生成するためのデータを「オブジェクト指向」に基づいて取り扱うことにより、負荷や無駄が少なく、拡張性に優れた画像処理を、容易なメンテナンスで行うことができる。
なお、本実施の形態で説明した画像処理方法は、予め用意された画像処理プログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
以上のように、本発明にかかる画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体は、スキャナやデジタルカメラなどから取り込んだ文字を含む画像データを用途に合わせた最適なデータ状態へ変換したい場合に有用であり、特に、紙媒体の出版物などを、ネットワーク上で公開するためにPDFなどデジタル情報への変換する場合などに適している。
画像処理装置の一構成例を示すブロック図である。 画像処理装置の最適画像データの生成動作の流れを表すフローチャートである。 「要素構造化(オブジェクト)表現」部の全体構成を表したクラス階層図である。 最適化オブジェクトの構成の一例を示す図である。 原画像オブジェクトのクラス定義を行うプログラム例を示す図である。 文字色オブジェクトのクラス定義を行うプログラム例を示す図である。 原画像生成に関するオブジェクトのプログラム例を示す図である。 ソースコード710による画像生成結果を示す図である。 画像生成結果720の一部を拡大したものを示す図である。 画像の地肌クリーニングに関するプログラム例を示す図である。 ソースコード810による画像生成結果を示す図である。 画像生成結果820の一部を拡大したものを示す図である。 画像の地肌クリーニングに関するプログラム例を示す図である。 ソースコード910による画像生成結果を示す図である。 画像生成結果920の一部を拡大したものを示す図である。 画像の文字強調と地肌クリーニングに関するプログラム例を示す図である。 ソースコード1010による画像生成結果を示す図である。 画像生成結果1020の一部を拡大したものを示す図である。 画像の文字解像度と文字色に関するプログラム例を示す図である。 ソースコード1110による画像生成結果を示す図である。 ソースコード1110による画像生成結果を示す図である。 ラスター画像生成に関するプログラム例を示す図である。 ソースコード1210による画像生成結果を示す図である。 画像の階調変換と文字に関するプログラム例を示す図である。 ソースコード1310による画像生成結果を示す図である。 画像の階調変換と文字に関するプログラム例を示す図である。 ソースコード1330による画像生成結果を示す図である。 画像の階調変換と文字および文字色に関するプログラム例を示す図である。 ソースコード1410による画像生成結果を示す図である。 画像生成結果1420の一部を拡大したものを示す図である。 2値文字画像に関するプログラム例を示す図である。 ソースコード1510による画像生成結果を示す図である。 2値文字画像の解像度に関するプログラム例を示す図である。 ソースコード1610による画像生成結果を示す図である。
符号の説明
100 通信回線
110 画像処理装置
111 CPU
112 メモリ
1121 ROM
1122 RAM
113 ハードディスク部(HDD)
114 リムーバブルディスク部
115 表示部
116 入力部
117 スキャナ部
118 ネットワークインタフェース
119 バス

Claims (13)

  1. 画像処理のための画像特徴量、画像要素および機能を含んだ画像処理に適した状態の画像データにする正規化により生成された原画像オブジェクトと、ユーザの指定する形式の画像データの生成を行う最適化オブジェクトからなる画像処理オブジェクトを用いて、オブジェクト指向による画像処理を行う画像処理装置であって、
    前記画像処理の対象となる画像データを取り込む取り込み手段と、
    前記取り込み手段により取り込んだ前記画像データに、正規化処理を行い原画像オブジェクトを生成する正規化処理手段と、
    前記正規化処理手段により正規化された前記画像データを基に、前記最適化オブジェクトにより最適画像データの生成を行う最適化処理手段と、
    を備えたことを特徴とする画像処理装置。
  2. 画像処理のための画像特徴量、画像要素および機能を含んだ画像処理に適した状態の画像データにする正規化により生成された原画像オブジェクトと、ユーザの指定する形式の画像データの生成を行う最適化オブジェクトからなる画像処理オブジェクトを用いて、オブジェクト指向による画像処理を行う画像処理方法であって、
    前記画像処理の対象となる画像データを取り込む取り込み工程と、
    前記取り込み工程により取り込んだ前記画像データに、正規化処理を行い原画像オブジェクトを生成する正規化処理工程と、
    前記正規化処理工程により正規化された前記画像データを基に、前記最適化オブジェクトにより最適画像データの生成を行う最適化処理工程と、
    を含むことを特徴とする画像処理方法。
  3. 前記最適化処理工程は、正規化された前記画像データの地肌部分を白にまとめる地肌除去処理工程と、
    前記地肌除去処理工程に用いる地肌除去のための階調変換曲線を表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、
    を含むことを特徴とする請求項2に記載の画像処理方法。
  4. 前記最適化処理工程は、正規化された前記画像データの地肌部分を地肌の代表色にまとめる地肌クリーニング処理工程と、
    前記地肌クリーニング処理工程に用いる地肌クリーニングのための階調変換曲線を表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、
    を含むことを特徴とする請求項2に記載の画像処理方法。
  5. 前記最適化処理工程は、正規化された前記画像データ中から抽出された文字を原解像度、あるいは、高解像度化された2値画像データとして抽出する抽出処理工程と、
    前記抽出処理工程により抽出された前記2値画像データを表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、
    を含むことを特徴とする請求項2に記載の画像処理方法。
  6. 前記最適化処理工程は、正規化された前記画像データ中から抽出された文字の各々に対して、その色を推定する推定処理工程と、
    前記推定処理工程により推定された文字色データを表すオブジェクトを前記最適化オブジェクトとして生成する最適化オブジェクト生成工程と、
    を含むことを特徴とする請求項2に記載の画像処理方法。
  7. 前記最適化オブジェクト生成工程は、前記文字色データを少数のクラスタに分類し、正規化された前記画像データ中の各文字をいずれかの色クラスタに割り当てを行う割り当て処理工程と、
    クラスタを特徴づけるデータと各文字のクラスタ割り当てデータを表すオブジェクトを前記最適化オブジェクトを構成するオブジェクトの一つとして生成するオブジェクト生成工程と、
    を含むことを特徴とする請求項6に記載の画像処理方法。
  8. 前記正規化処理工程により生成した原画像オブジェクトおよび前記最適化オブジェクト生成工程により生成した最適化オブジェクトは、前記画像特徴量や前記画像要素などからなる基本データを持ち、
    前記正規化処理工程および前記最適化オブジェクト生成工程は、それぞれ、
    前記基本データに施すための画像処理を規定する画像特徴量および画像要素を計算するための計算工程と、
    前記計算工程による計算結果を格納保管するためのオブジェクトを生成するためのオブジェクト生成工程と、
    前記オブジェクト生成工程により生成された前記オブジェクトへのポインタを有し、前記オブジェクト内の基本データに対する処理の設定、更新、現在の処理状態、履歴をそれぞれ管理するオブジェクト管理工程と、
    前記処理状態および履歴のデータを有し、前記オブジェクトの現在の処理状態に応じて、画像データを生成する画像生成工程と、
    を含むことを特徴とする請求項2に記載の画像処理方法。
  9. 前記画像生成工程は、全体あるいは指定された部分のラスター画像データを生成するラスター画像生成工程を含むことを特徴とする請求項8に記載の画像処理方法。
  10. 前記画像生成工程は、全体あるいは指定された部分の文字を2値画像データあるいはカラー画像データとして生成する文字画像生成工程を含むことを特徴とする請求項8に記載の画像処理方法。
  11. 前記画像生成工程は、全体あるいは指定された部分について、指定された色クラスタに属する色を持つ文字を集めた画像データを生成する色文字画像生成工程を含むことを特徴とする請求項8に記載の画像処理方法。
  12. 請求項2〜11のいずれか一つに記載された画像処理方法をコンピュータに実行させることを特徴とする画像処理プログラム。
  13. 請求項12に記載された画像処理プログラムを記録した記録媒体。
JP2004233802A 2004-08-10 2004-08-10 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 Pending JP2006053690A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004233802A JP2006053690A (ja) 2004-08-10 2004-08-10 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
US11/191,954 US7525694B2 (en) 2004-08-10 2005-07-29 Image processing device, image processing method, image processing program, and recording medium
EP05254869A EP1646221A3 (en) 2004-08-10 2005-08-04 Image processing device, image processing method, image processing program and recording medium
CNB2005100917204A CN100362530C (zh) 2004-08-10 2005-08-08 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004233802A JP2006053690A (ja) 2004-08-10 2004-08-10 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2006053690A true JP2006053690A (ja) 2006-02-23

Family

ID=35708391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004233802A Pending JP2006053690A (ja) 2004-08-10 2004-08-10 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体

Country Status (4)

Country Link
US (1) US7525694B2 (ja)
EP (1) EP1646221A3 (ja)
JP (1) JP2006053690A (ja)
CN (1) CN100362530C (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244039B2 (en) 2007-07-12 2012-08-14 Ricoh Company, Limited Apparatus, method, and computer program product for acquiring processing content for image data
US8254669B2 (en) 2007-09-19 2012-08-28 Ricoh Company, Ltd. Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit
US8321367B2 (en) 2008-03-17 2012-11-27 Ricoh Company. Ltd. Data processing apparatus, method, and computer program product for user objective prediction

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4281719B2 (ja) * 2005-08-10 2009-06-17 コニカミノルタビジネステクノロジーズ株式会社 ファイル処理装置、ファイル処理方法、およびファイル処理プログラム
US8509563B2 (en) * 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
JP2007296742A (ja) * 2006-04-28 2007-11-15 Fuji Xerox Co Ltd 画像形成装置、電子文書管理方法
JP4815470B2 (ja) * 2007-06-15 2011-11-16 富士フイルム株式会社 画像表示装置及び画像表示方法
JP5022979B2 (ja) * 2007-07-12 2012-09-12 株式会社リコー 画像処理装置、画像処理方法およびプログラム
US8724930B2 (en) * 2008-05-30 2014-05-13 Abbyy Development Llc Copying system and method
US8326017B2 (en) * 2010-01-09 2012-12-04 Ford Global Technologies, Llc Rapid color verification system using digital imaging and curve comparison algorithm
US9152617B2 (en) * 2010-03-11 2015-10-06 A2iA S.A. System and method for processing objects
US9891177B2 (en) 2014-10-03 2018-02-13 Kla-Tencor Corporation TDI sensor in a darkfield system
WO2018061706A1 (ja) * 2016-09-28 2018-04-05 富士フイルム株式会社 レンチキュラー表示体、レンチキュラー画像の形成方法、レンチキュラー表示体の製造方法、及びレンチキュラー画像の形成プログラム

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5552675A (en) * 1959-04-08 1996-09-03 Lemelson; Jerome H. High temperature reaction apparatus
GB1242123A (en) * 1968-11-12 1971-08-11 Nat Res Dev Improvements relating to a method and apparatus for laser beam cutting
US3679998A (en) * 1971-01-21 1972-07-25 Hughes Aircraft Co Laser flashtube triggering arrangement
US3914648A (en) * 1974-05-10 1975-10-21 Avco Everett Res Lab Inc Flashlamp discharge circuit
US4005333A (en) * 1974-06-03 1977-01-25 Hughes Aircraft Company Apparatus for increasing output efficiency of an optically pumped Nd:YAG laser
JPS5157283A (en) * 1974-11-15 1976-05-19 Nippon Electric Co Handotaikibanno bunkatsuhoho
US4276518A (en) * 1978-05-01 1981-06-30 The United States Of America As Represented By The Secretary Of The Navy Optical oscillator
US4550275A (en) * 1983-10-07 1985-10-29 The United States Of America As Represented By The Secretary Of The Air Force High efficiency pulse ultraviolet light source
US4862888A (en) * 1983-10-28 1989-09-05 Bausch & Lomb Incorporated Laser system
US4910438A (en) * 1985-12-17 1990-03-20 Hughes Aircraft Company Wide band, high efficiency simmer power supply for a laser flashlamp
DE3719561C2 (de) * 1986-06-12 1998-12-10 Morita Mfg Medizinisches Lichtbestrahlungshandstück
US4724299A (en) * 1987-04-15 1988-02-09 Quantum Laser Corporation Laser spray nozzle and method
US4908030A (en) * 1987-04-29 1990-03-13 Vent-Plant Corporation, Inc. Method of manufacturing synthetic bone coated surgical implants
US5151029A (en) * 1988-12-21 1992-09-29 Endo Technic Corporation Removing physiologic tissue from a tooth canal
US5092773A (en) * 1989-01-18 1992-03-03 Endo Technic Corporation Method and apparatus for filling a tooth canal
DE3911871A1 (de) * 1989-04-11 1990-10-25 Aesculap Ag Verfahren zum zerstoeren und abtragen von zahnmaterial
US5102410A (en) * 1990-02-26 1992-04-07 Dressel Thomas D Soft tissue cutting aspiration device and method
US5092864A (en) * 1990-04-30 1992-03-03 Microfab Technologies, Inc. Method and apparatus for improved laser surgery
FR2674768B1 (fr) * 1991-04-02 1994-09-02 France Telecom Procede de traitement photochimique d'un materiau utilisant une source de lumiere a tubes a eclairs.
US5267856A (en) * 1991-09-20 1993-12-07 Premier Laser Systems, Inc. Laser surgical method
US5374266A (en) * 1991-11-27 1994-12-20 Kabushiki Kaisha Morita Seisakusho Medical laser treatment device
US5334019A (en) * 1991-12-06 1994-08-02 American Dental Technologies, Inc. Dental air abrasive system
US5318562A (en) * 1992-03-10 1994-06-07 Laser Endo Technic Corporation Handpiece for delivering laser radiation
US5405368A (en) * 1992-10-20 1995-04-11 Esc Inc. Method and apparatus for therapeutic electromagnetic treatment
US5242454A (en) * 1992-06-12 1993-09-07 Omega Universal Technologies, Ltd. Method for diagnosis and shock wave lithotripsy of stones in the submaxillary and parotid glands
US5401171A (en) * 1992-07-20 1995-03-28 Paghdiwala; Abid F. Dental laser device and method
DE4226461C2 (de) * 1992-08-10 1994-10-20 Siemens Ag Zahnärztliches Instrument zur Behandlung von Zähnen mittels Laserstrahlen
US5524070A (en) 1992-10-07 1996-06-04 The Research Foundation Of State University Of New York Local adaptive contrast enhancement
US5626631A (en) * 1992-10-20 1997-05-06 Esc Medical Systems Ltd. Method and apparatus for therapeutic electromagnetic treatment
US5409376A (en) * 1993-03-10 1995-04-25 Murphy; Quentin M. Apparatus and process for laser-assisted driling
JP3116675B2 (ja) * 1993-07-28 2000-12-11 ソニー株式会社 半導体レーザー
US5313481A (en) * 1993-09-29 1994-05-17 The United States Of America As Represented By The United States Department Of Energy Copper laser modulator driving assembly including a magnetic compression laser
JP3483946B2 (ja) * 1994-08-19 2004-01-06 三菱電機株式会社 フォント処理装置及びフォント処理方法
DE4434409C1 (de) * 1994-09-26 1996-04-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Materialbearbeiten mit Plasma induzierender Laserstrahlung
DE4442238C1 (de) * 1994-11-28 1996-04-04 Precitec Gmbh Verfahren zur thermischen Bearbeitung eines Werkstücks, insbesondere mittels Laserstrahlung
US5581667A (en) 1994-12-23 1996-12-03 Xerox Corporation Electronic trapping system for digitized text and images
WO1996025778A1 (en) * 1995-02-17 1996-08-22 Cymer Laser Technologies Pulse power generating circuit with energy recovery
JPH08340446A (ja) 1995-06-12 1996-12-24 Canon Inc 画像処理装置及びその方法
US6288499B1 (en) * 1997-06-12 2001-09-11 Biolase Technology, Inc. Electromagnetic energy distributions for electromagnetically induced mechanical cutting
US5741247A (en) * 1995-08-31 1998-04-21 Biolase Technology, Inc. Atomized fluid particles for electromagnetically induced cutting
US5785521A (en) * 1995-08-31 1998-07-28 Biolase Technology, Inc. Fluid conditioning system
US6350123B1 (en) * 1995-08-31 2002-02-26 Biolase Technology, Inc. Fluid conditioning system
US5723864A (en) * 1995-09-01 1998-03-03 Innovative Lasers Corporation Linear cavity laser system for ultra-sensitive gas detection via intracavity laser spectroscopy (ILS)
US5742703A (en) * 1995-10-11 1998-04-21 Xerox Corporation Method and apparatus for the resolution enhancement of gray-scale images that include text and line art
US5820627A (en) * 1996-03-28 1998-10-13 Physical Sciences, Inc. Real-time optical feedback control of laser lithotripsy
US6083218A (en) * 1996-07-10 2000-07-04 Trw Inc. Method and apparatus for removing dental caries by using laser radiation
US6080148A (en) * 1996-11-18 2000-06-27 Trimedyne, Inc. Variable pulse width lasing device
US5960111A (en) 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
US6025826A (en) 1997-06-30 2000-02-15 Sun Microsystems, Inc. Method and apparatus for handling alpha premultiplication of image data
US5930393A (en) 1997-08-11 1999-07-27 Lucent Technologies Inc. Method and apparatus for enhancing degraded document images
JP3345350B2 (ja) 1998-05-27 2002-11-18 富士通株式会社 文書画像認識装置、その方法、及び記録媒体
US7010177B1 (en) 1998-08-27 2006-03-07 Intel Corporation Portability of digital images
US6449301B1 (en) * 1999-06-22 2002-09-10 The Regents Of The University Of California Method and apparatus for mode locking of external cavity semiconductor lasers with saturable Bragg reflectors
JP2001118032A (ja) 1999-10-15 2001-04-27 Ricoh Co Ltd 文字認識装置および文字認識方法、並びに文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3923243B2 (ja) * 2000-07-24 2007-05-30 独立行政法人科学技術振興機構 カラー文書画像からの文字抽出方法
US6961064B2 (en) * 2001-06-28 2005-11-01 Hewlett-Packard Development Company, L.P. System and method for combining graphics formats in a digital video pipeline
JP4169522B2 (ja) 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG199700173027, 川島享,田幡勝,金森吉成,増永良文, "画像オブジェクトの版管理モデル", 電子情報通信学会論文誌, 19961025, 第J79−D−I巻, p843−852, JP, 社団法人電子情報通信学会 *
CSNG200000121011, 脇山俊一郎,川島亨,金森吉成,増永良文, "分散処理環境における汎用画像オブジェクトの構成", 情報処理学会研究報告94−DBS−99, 19940722, 第94巻第62号, P73−80, JP, 社団法人情報処理学会 *
JPN6010031169, 脇山俊一郎,川島亨,金森吉成,増永良文, "分散処理環境における汎用画像オブジェクトの構成", 情報処理学会研究報告94−DBS−99, 19940722, 第94巻第62号, P73−80, JP, 社団法人情報処理学会 *
JPN6010031170, 川島享,田幡勝,金森吉成,増永良文, "画像オブジェクトの版管理モデル", 電子情報通信学会論文誌, 19961025, 第J79−D−I巻, p843−852, JP, 社団法人電子情報通信学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244039B2 (en) 2007-07-12 2012-08-14 Ricoh Company, Limited Apparatus, method, and computer program product for acquiring processing content for image data
US8254669B2 (en) 2007-09-19 2012-08-28 Ricoh Company, Ltd. Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit
US8321367B2 (en) 2008-03-17 2012-11-27 Ricoh Company. Ltd. Data processing apparatus, method, and computer program product for user objective prediction

Also Published As

Publication number Publication date
EP1646221A2 (en) 2006-04-12
EP1646221A3 (en) 2006-05-24
CN100362530C (zh) 2008-01-16
US7525694B2 (en) 2009-04-28
CN1737852A (zh) 2006-02-22
US20060033963A1 (en) 2006-02-16

Similar Documents

Publication Publication Date Title
US7525694B2 (en) Image processing device, image processing method, image processing program, and recording medium
JP4568460B2 (ja) 画像処理装置及び記録媒体
JP5274495B2 (ja) 文書画像サイズ変更方法
JP4960897B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
US8488181B2 (en) Preserving user applied markings made to a hardcopy original document
JP4586891B2 (ja) 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
JP6781406B2 (ja) 画像処理装置、および、コンピュータプログラム
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
JP2009225422A (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP2009278363A (ja) 画像処理装置及び画像処理方法
US20100067791A1 (en) Image processing apparatus, image processing method, and medium storing image processing program
JP2010074540A (ja) 画像処理装置
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP2006253892A (ja) 画像処理方法及び画像処理装置
EP3422690B1 (en) Information processing apparatus, control method thereof, and program
US8229214B2 (en) Image processing apparatus and image processing method
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2010074672A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3910120B2 (ja) 画像処理装置、方法、該方法を実行するプログラム及び記録媒体
JP2007088912A (ja) 画像処理装置およびプログラム
JP2008160404A (ja) 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記憶媒体
JP2007005907A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP3711770B2 (ja) 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体
JP2004240732A (ja) 画像合成方法、画像合成装置、画像合成プログラム及び画像記録装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070614

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090730

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101019