JP2007184842A - 画像処理装置、画像処理方法、及び、画像処理プログラム - Google Patents

画像処理装置、画像処理方法、及び、画像処理プログラム Download PDF

Info

Publication number
JP2007184842A
JP2007184842A JP2006002652A JP2006002652A JP2007184842A JP 2007184842 A JP2007184842 A JP 2007184842A JP 2006002652 A JP2006002652 A JP 2006002652A JP 2006002652 A JP2006002652 A JP 2006002652A JP 2007184842 A JP2007184842 A JP 2007184842A
Authority
JP
Japan
Prior art keywords
image
area
character
display
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006002652A
Other languages
English (en)
Inventor
Toshio Akiyama
敏雄 穐山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2006002652A priority Critical patent/JP2007184842A/ja
Publication of JP2007184842A publication Critical patent/JP2007184842A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Abstract

【課題】文字と画像等、特性が異なる領域が混在するイメージを圧縮して保存する場合に、特性の異なる領域を適切に分割し、それぞれの領域毎に処理することのできる画像処理装置を提供すること。
【解決手段】画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段と、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段とを有し、前記表示手段は、前記確定前の画像が更新される毎に、表示を更新する画像処理装置。
【選択図】図1

Description

本発明は、画像処理装置、画像処理方法、及び、画像処理プログラムに関する。
従来から、文字と画像が混在するイメージのデータを圧縮して保存する装置及び方法がある。文字や罫線は、画像に比べて輪郭が多く、また、輪郭の内部の画素の値がほぼ同等であると言う特徴がある。一方、写真などの自然画像は、文字に比べて、輪郭が少なく、同等の値を持った画素のクラスタが少ない。そこで、文字と画像の混在するイメージのデータを圧縮する場合には、主として文字や罫線などから構成される領域と、主として画像から構成される領域とに分割し、それぞれの領域の特性に適した圧縮を行うことより、データの量を効率よく削減することができる。
特開2005−204206号公報(特許文献1)及び特開2005−204207号公報(特許文献2)には、入力された多値画像から2値画像を生成し、該2値画像に基づき、文字及び罫線等の領域と、その他の画像等の領域とを分割して処理する画像処理装置が開示されている。特許文献2は、更に、2値画像に基づき分割する際に、黒色の画素からなるクラスタの大きさを考慮することにより、より適切に、文字及び罫線等の領域と、その他の画像の領域とを分割する画像処理装置が開示されている。
特開2005−204206号公報 特開2005−204207号公報
しかしながら、特許文献1及び特許文献2に開示されている技術は、いずれも、文字等の領域とその他の画像の領域の分割の結果を、予めユーザが知ることはできないため、適切に分割が行われない場合が生じるという不具合があった。
本発明は、上記の点に鑑みて、これらの問題を解消するために発明されたものであり、文字と画像等、特性が異なる領域が混在するイメージを圧縮して保存する場合に、特性の異なる領域を適切に分割し、それぞれの領域毎に処理することのできる画像処理装置を提供することを目的としている。
上記目的を達成するために、本発明の画像処理装置は次のような構成を採用した。
本発明の画像処理装置は、画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段と、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段とを有し、前記表示手段は、前記確定前の画像が更新される毎に、表示を更新するように構成することができる。
これにより、画像のデータから文字のレイヤが適切に分割されているか否かを、確認しながら処理を行うことのできる画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記表示手段は、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択手段と、前記確定前の画像の表示領域から、前記文字レイヤの編集手段が編集する編集領域を選択する編集領域の選択手段とを有する構成とすることができる。
これにより、画像のデータを複数のレイヤに分割する場合に、文字が適切に分割されているか否かを確認し、更に、文字のレイヤの中で適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記文字レイヤの編集手段は、2値化処理、又は、非文字のイメージの削除を行い、2値化の閾値、2値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、2値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力手段を有する構成とすることができる。
これにより、画像のデータを複数のレイヤに分割する場合に、文字を適切に分割するのに必要な2値化のパラメータを入力し、該2値化のパラメータに基づく処理の結果を表示によって確認することのできる画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記文字レイヤの編集手段は、2値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、OCR(Optical Character Reader)処理を行うように構成することができる。
これにより、文字を適切に分割した結果である2値化された文字のイメージから、テキストデータを生成するOCR処理に際し、誤認識の少ない画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置は、前記編集領域の選択手段によって選択された編集領域が編集される場合に、前記表示手段は、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、編集の確定が入力された際に、編集されながらも更新されていない領域を更新するように構成することができる。
これにより、編集の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置は、画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、前記表示手段に表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択手段と、前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出手段とを有する構成とすることができる。
これにより、画像のイメージの中から、予め特性の異なる領域を選択することができ、領域の特性に応じた処理を行う画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記文字の検出手段は、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、前記文字の検出手段が文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいように構成することができる。
これにより、主として文字のイメージからなる領域と、主として非文字のイメージからなる領域とで、それぞれの領域の特性に応じた処理を行う画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置は、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段を有し、該文字レイヤの編集手段は、前記文字の検出手段が検出した結果に基づき、用紙方向の補正、スキュー補正、及び/又は、OCR処理を行うように構成することができる。
これにより、文字を適切に分割した結果である2値化された文字のイメージから、テキストデータを生成するOCR処理に際し、誤認識の少ない画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記文字レイヤの編集手段がOCR処理を行う場合に、前記表示手段は、OCR処理の結果に対応するテキストデータを表示するように構成することができる。
これにより、OCR処理に際し、誤認識が生じているか否かを確認する画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記文字・非文字領域の選択手段によって選択された文字領域又は非文字領域が処理によって変更される場合に、前記表示手段は、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新するように構成することができる。
これにより、変更の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置は、画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理装置において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び/又は、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、該表示手段が表示する領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び/又は、OCR処理のうち一の処理を行う処理領域を選択する処理領域の選択手段と、前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択手段とを有する構成とすることができる。
これにより、複数の領域に分割され、該複数の領域のそれぞれを複数のレイヤに分割され、圧縮等の処理をされた画像のイメージの中から、レイヤの分割、及び、圧縮等の処理が適切ではない領域を選択し、該適切ではない領域に対し、更なる領域の分割、レイヤの再分割、及び、圧縮等の処理を行う場合に、それらの結果を表示によって確認する画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記表示手段は、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、前記処理領域の選択手段は、前記確定前の画像の表示領域から、処理を行う処理領域を選択するように構成することができる。
これにより、複数のレイヤに分割された画像のデータの中から、適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における 前記処理領域の選択手段によって選択された処理領域が編集される場合に、前記表示手段は、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、編集の確定が入力された際に、処理されながらも更新されていない領域を更新するように構成することができる。
これにより、変更の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置における前記処理領域の選択手段は、前記複数の領域のうちの一つの領域を選択するように構成することができる。
これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、同じ特性を有する一の領域を容易に選択することのできる画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理装置は、処理領域の最低単位を選択する、処理領域の単位の選択手段を有し、前記処理領域の選択手段は、前記処理領域の最低単位を選択するように構成することができる。
これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、前記適切ではない部分の選択を容易かつ詳細に行うことのできる画像処理装置を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法は、画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップと、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップとを有し、前記表示ステップは、前記確定前の画像が更新される毎に、表示を更新するように構成することができる。
これにより、画像のデータから文字のレイヤが適切に分割されているか否かを、確認しながら処理を行うことのできる画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記表示ステップは、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択ステップと、前記確定前の画像の表示領域から、前記文字レイヤの編集ステップが編集する編集領域を選択する編集領域の選択ステップとを有する構成とすることができる。
これにより、画像のデータを複数のレイヤに分割する場合に、文字が適切に分割されているか否かを確認し、更に、文字のレイヤの中で適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記文字レイヤの編集ステップは、2値化処理、又は、非文字のイメージの削除を行い、前記2値化処理における2値化の閾値、前記2値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、2値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力ステップを有する構成とすることができる。
これにより、画像のデータを複数のレイヤに分割する場合に、文字を適切に分割するのに必要な2値化のパラメータを入力し、該2値化のパラメータに基づく処理の結果を表示によって確認することのできる画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記文字レイヤの編集ステップは、2値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、OCR処理を行うように構成することができる。
これにより、文字を適切に分割した結果である2値化された文字のイメージから、テキストデータを生成するOCR処理に際し、誤認識の少ない画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記編集領域の選択ステップによって選択された編集領域が編集される場合に、前記表示ステップは、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、編集の確定が入力された際に、編集されながらも更新されていない領域を更新するように構成することができる。
これにより、編集の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法は、画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、前記表示ステップにおいて表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択ステップと、前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出ステップとを有する構成とすることができる。
これにより、画像のイメージの中から、予め特性の異なる領域を選択することができ、領域の特性に応じた処理を行う画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記文字の検出ステップは、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、前記文字の検出ステップが文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいように構成することができる。
これにより、主として文字のイメージからなる領域と、主として非文字のイメージからなる領域とで、それぞれの領域の特性に応じた処理を行う画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法は、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップを有し、該文字レイヤの編集ステップは、前記文字の検出ステップが検出した結果に基づき、用紙方向の補正、スキュー補正、及び/又は、OCR処理を行うように構成することができる。
これにより、文字を適切に分割した結果である2値化された文字のイメージから、テキストデータを生成するOCR処理に際し、誤認識の少ない画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記文字レイヤの編集ステップにおいてOCR処理を行う場合に、前記表示ステップは、OCR処理の結果に対応するテキストデータを表示するように構成することができる。
これにより、OCR処理に際し、誤認識が生じているか否かを確認する画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記文字・非文字領域の選択ステップによって選択された文字領域又は非文字領域が処理によって変更される場合に、前記表示ステップは、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新するように構成することができる。
これにより、変更の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法は、画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理方法において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び/又は、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、該表示ステップにおいて表示される領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び、OCR処理のうち、一の処理を行う処理領域を選択する処理領域の選択ステップと、前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択ステップとを有する構成とすることができる。
これにより、複数の領域に分割され、該複数の領域のそれぞれを複数のレイヤに分割され、圧縮等の処理をされた画像のイメージの中から、レイヤの分割、及び、圧縮等の処理が適切ではない領域を選択し、該適切ではない領域に対し、更なる領域の分割、レイヤの再分割、及び、圧縮等の処理を行う場合に、それらの結果を表示によって確認する画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記表示ステップは、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、前記処理領域の選択ステップは、前記確定前の画像の表示領域から、前記処理を行う領域を選択するように構成することができる。
これにより、複数のレイヤに分割された画像のデータの中から、適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記処理領域の選択ステップによって選択された処理領域が編集される場合に、前記表示ステップは、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、編集の確定が入力された際に、処理されながらも更新されていない領域を更新するように構成することができる。
これにより、変更の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法における前記処理領域の選択ステップは、前記複数の領域のうちの一つの領域を選択するように構成することができる。
これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、同じ特性を有する一の領域を容易に選択することのできる画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理方法は、処理領域の最低単位を選択する、処理領域の単位の選択ステップを有し、前記処理領域の選択ステップは、前記処理領域の最低単位を選択するように構成することができる。
これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、前記適切ではない部分の選択を容易かつ詳細に行うことのできる画像処理方法を提供することができる。
また、上記目的を達成するために、本発明の画像処理プログラムは、請求項16から30何れか一項記載の画像処理方法をコンピュータに実行させるためのプログラムとして構成することができる。
本発明によれば、文字と画像等、特性が異なる領域が混在するイメージを圧縮して保存する場合に、特性の異なる領域を適切に分割し、それぞれの領域毎に処理することのできる画像処理装置を提供することができる。
以下、本発明の実施例を図面に基づき説明する。
(文字のレイヤを編集する処理の説明)
図1は、本発明の第一の実施例である、文字のイメージのレイヤを編集し所望のイメージを生成する画像処理装置の一例である。
高圧縮ファイル作成の主処理部1は、原稿であるカラー画像100を読み込み、文字のレイヤと非文字である背景のレイヤとに分割し、それぞれのレイヤに適した処理を行うことにより、高圧縮画像ファイル600を生成する。文字のレイヤの編集部2は、文字のレイヤと背景のレイヤとに適切に分割するために、前記文字のレイヤを表示して編集することにより、望ましい文字のイメージを生成する。
高圧縮ファイル作成の主処理部1は、2値化処理部10、領域識別部20、前景画像抜き出し部30、前景色分離部40、及び、高圧縮ファイル作成部50とから構成される。2値化処理部は、入力された原稿であるカラー画像100のイメージデータを、所定の閾値を用いて2値画像に変換する。領域識別部20は、前記2値画像から、主に文字のイメージからなる文字の領域(前景部)と、主に非文字のイメージからなる領域(背景部)とに分割し、前景部の位置を指定するマスク画像である、前景部指定画像200を出力する。
ところで、画像を複数のレイヤに分割した場合に、文字のイメージのレイヤは、通常は、上位のレイヤになることが多く、非文字のイメージのレイヤは、通常は、下位のレイヤになることが多い。そこで、本明細書では、主に文字のイメージからなるイメージを「前景画像」、主に非文字のイメージからなるイメージを「背景画像」とし、前景画像の領域を「前景部」、背景画像の領域を「背景部」とする。
前景画像抜き出し部30には、カラー画像100と、前景指定画像200とが入力され、カラー画像100のうち、前景指定画像200が指定する位置のイメージである前景部抽出画像400と、その他の位置のイメージである前景部消去背景画像300とに分割する。
前景部抽出画像400は、前景色分離部40に入力され、前景部を構成する文字のイメージの形を表現する、前景部表現画像500と、前記文字のイメージの色を表現する、前景色画像510とに分割される。
高圧縮ファイル作成部50は、前景部消去背景画像300、前景部表現画像500、及び、前景色画像510のそれぞれについて、画像の特性に適した圧縮を行い、その結果を一のファイルとして格納した高圧縮画像ファイル600を出力する。
ここで、圧縮の方法は、例えば、次のようになる。前景部消去背景画像300は、主に非文字のイメージからなる多値画像であり、文字のイメージに比して、求められる解像度や圧縮伸長後の画像の品質が低い。そこで、そのような画像の特性に適した、JPEG等の多値の圧縮方式を適用する。前景部表現画像500は、主に文字のイメージからなる2値画像であり、非文字のイメージに比して求められる解像度や圧縮伸長後の画像の品質が高い。そこで、例えば、MH(Modified Huffman Run Length Coding)、MMR(Modified Modified READ(Relative Element Address Designate codes))等の圧縮方式を用いる。また、前景部色画像510は、複数の矩形に対し、該矩形のそれぞれに単一又は複数の色のパターンを定めた多値画像であり、そのような画像の特性に適した、JPEG、DEFLATE圧縮、又は、LZW圧縮等の多値符号化を適用する。
高圧縮画像ファイル600のデータ構造は、例えば、ミクストラスターコンテント(MRC(ITU−T T.44))に規定されている構造を用いる。
文字のレイヤの編集部2は、高圧縮ファイル作成の主処理部1が、カラー画像100を前景部と背景部とに分割する処理の中間生成画像として生成する、前景部指定画像200、及び/又は、前景部抽出画像400が、望ましい画像になるように編集する装置であって、合成表示部60、画像調整部70、ユーザ操作判定部80、及び、表示機能を有するパソコン90とから構成され、表示機能を有するパソコン90には、更に、キーボード91及びマウス92が接続されている。
(前景部指定画像200の編集処理)
文字のレイヤの編集部2に、前景部指定画像200が入力された場合には、前景部指定画像200は前景部を構成する文字のイメージの形状のみを表すイメージであるため、合成表示部60は、白黒2値のイメージにより、前景部指定画像200を表示する指示と共に、パソコン90に前景部指定画像200のイメージのデータを送信する。パソコン90は、入力されたイメージを表示し、接続されたキーボード及びマウスによって、ユーザが編集の指示を行う。編集の指示は、例えば、2値化の閾値の変更、前景部指定画像200に含まれる画像のイメージの削除等である。ユーザ操作判定部80は、パソコン90に入力された指示を信号に変換し、画像調整部70に送信する。画像調整部70は、ユーザ操作判定部80からの編集を指示する信号を、高圧縮ファイル作成の主処理部1に入力されたカラー画像100に適用した画像である、前景部調整画像210を生成し、合成表示部60に送信する。
(前景部抽出画像400の編集処理)
また、文字のレイヤの編集部2に、前景部抽出画像400が入力された場合には、前景部抽出画像400は、前景部を構成する文字のイメージの形状の他に、文字の色を含むカラー画像のイメージであるため、合成表示部60は、カラー表示によって前景部抽出画像400を表示する指示と共に、パソコン90に、前景部指定画像200のイメージのデータを送信する。パソコン90は、入力されたイメージを表示し、接続されたキーボード及びマウスによって、ユーザが編集の指示を行う。例えば、文字のイメージの画素の値の調整、前景部抽出画像200に含まれる画像のイメージの削除等である。ユーザ操作判定部80は、パソコン90に入力された指示を信号に変換し、画像調整部70に送信する。画像調整部70は、ユーザ操作判定部80からの編集を指示する信号を、高圧縮ファイル作成の主処理部1に入力されたカラー画像100に適用した画像である、前景部調整画像210を生成し、合成表示部60に送信する。
(文字のレイヤの編集部2の処理の終了)
ユーザ操作判定部80が、文字のレイヤの編集処理の終了の指示を受け取るまで、合成表示部60、パソコン90、ユーザ操作判定部80、及び、画像調整部70が処理を繰り返す。
ユーザ操作判定部80が、終了の指示を受け取ると、その時点で最後に生成された前景部調整画像210が、高圧縮ファイル作成の主処理部1に送信され、前景画像抜き出し部30が、前景部指定画像200に代えて、前記前景部調整画像210をマスク画像として、カラー画像100から、前景部抽出画像400と前景部消去画像300とを生成する。
(文字のレイヤを編集する処理の流れ)
次に、高圧縮データ作成の処理のフローについて、図2及び図3を用いて説明する。
図2は、前景部指定画像200を編集する処理のフローであり、図3は、前景部抽出画像400を編集する処理のフローである。
図2において、入力されたカラー画像100は、前景部と背景部とに分離された後、それぞれのイメージの特性に応じた圧縮方式によって圧縮され、各圧縮されたデータが一のファイルとして格納された高圧縮画像ファイルが生成される。
ステップS1000では、2値化処理部10が、入力されたカラー画像100の2値化の処理を行う。ステップS2000では、領域識別部20が、文字のイメージの特徴である矩形の分布等から、前景部を抽出し、前景部指定画像200を生成する。
前景部指定画像200は、ステップS6100からS6400の処理によって編集され、前景部調整画像210が生成される。
ステップS3000では、前景画像抜き出し部30が、前景部調整画像210をマスク画像として、元画像であるカラー画像100から、前景部抽出画像400を生成するとともに、元画像であるカラー画像100から、前景部抽出画像400を抜き出した残りの画像に対し、抜き出した部分を所定の値の画素で置き換えた、前景部消去背景画像300を生成する。ここで、所定の値の画素とは、例えば、背景画像で多用されている画素や、予め定められている背景色の値の画素である。
ステップS4000では、前景色分離部40が、前景部抽出画像400のイメージを、前景部抽出画像を構成するイメージの形状である前景部表現画像500、及び、前記前景部抽出画像を構成するイメージの色を表す前景色画像510とに分離する。
ステップS5000では、高圧縮ファイル作成部50が、前景部消去背景画像300、前景部表現画像500、及び、前景色画像510を、それぞれ適した圧縮方法で圧縮し、さらに、圧縮されたそれぞれのデータを、それらを表示する際に重ね合わせる情報と共に、一のファイルに格納した高圧縮画像ファイル600を生成する。
次に、ステップS6100からS6400の処理について説明する。ステップS6100からS6400は、前景部指定画像200から、前景部調整画像210を生成するステップSである。
ステップS6100では、合成表示部60が、前景部を表す2値画像である前景部指定画像200を画面表示する信号を生成し、パソコン90に送信する。ここで、ステップS6100が第一回目に実行される場合には、前景部指定画像200が用いられ、ステップS6100が二回目以降に実行される場合には、前景部調整画像210が用いられる。なお、各ステップの実行回数は、カラー画像100が入力される毎に初期値である0となる。
ステップS6200では、ユーザが、パソコン90を操作し、表示された結果に対して、可否を入力する。表示されている結果が良好である場合は、表示されている画像を前景部調整画像210として、ステップS3000へ進む。表示されている結果が良好ではない場合は、ステップS6300へ進む。
ステップS6300では、ユーザ操作判定部80が、パソコン90に入力されたユーザの指示を判定し、再処理を行う領域、2値化の閾値、又は、指定された領域の削除等の信号を生成する。
ステップS6400では、画像調整部70が、ユーザ操作判定部80の送信する信号に基づき、入力されたカラー画像100に対して処理を行い、前景部調整画像210を生成し、ステップS6100に進む。
ステップS6400に続くステップS6100では、前景部指定画像200に代えて、前景部調整画像210を表示する信号を生成し、パソコン90に送信する。
ステップS6200において、表示結果が良好であると判断されるまで、ステップS6100からS6400を繰り返す。
図3において、ステップS1000、ステップS2000、ステップS4000、及び、ステップS5000の処理は図2と同一である。
ステップS3100では、前景部抜き出し部30が、入力されたカラー画像100から、前景部指定画像200又は前景部調整画像210に基づき、前景画像相当部分を抜き出し、前景部調整画像400を生成する。前景部指定画像200は、ステップS3100が第一回目に実行される場合に用いられ、前景部調整画像210は、ステップS3100が二回目以降に実行される場合に用いられる。なお、各ステップの実行回数は、カラー画像100が入力される毎に初期値である0となる。
前景部抽出画像400は、ステップS6110からS6410及びステップS3100の処理を繰り返すことにより編集され、所望の画像となる。
ステップS3200では、前景画像抜き出し部30が、前景部抽出画像400に基づき、入力カラー画像10から前景部画像を抜き出した残りの画像イメージに対し、前景部として抜き出された領域の画素の値を、該領域の周辺の画素の値、又は、周辺の画素の代表の値で置き換え、前景部消去背景画像300を生成する。
次に、ステップS6110からS6410の処理について説明する。ステップS6110からS6410は、前景部指定画像200、又は、前景部調整画像210から、前景部抽出画像400を生成するステップである。
ステップS6110では、合成表示部60が、ステップS3100で生成した前景部のカラー画像である前景部抽出画像400を表示する信号を生成し、パソコン90に送信する。
ステップS6210では、ユーザが、パソコン90を操作し、表示された結果に対して、可否を入力する。表示されている結果が良好である場合は、表示されている画像を前景部抽出画像400として、ステップS3200へ進む。表示されている結果が良好ではない場合は、ステップS6310へ進む。
ステップS6310では、ユーザ操作判定部80が、パソコン90に入力されたユーザの指示を判定し、再処理を行う領域、2値化の閾値、又は、指定された領域の削除等の信号を生成する。
ステップS6410では、画像調整部70が、ユーザ判定部80の送信する信号に基づき、入力されたカラー画像100に対して処理を行う。ここで、2値化の処理を再度行うことが指定されている場合には、前景部調整画像210を生成し、その他の処理が指定されている場合には、それらの処理の内容を、元画像から前景部を抜き出す際の指示として、ステップS3100に送信する。
ステップS6210において、表示結果が良好であると判断されるまで、ステップS6110からS6410、及び、ステップS3100を繰り返す。
(前景部調整画像210の編集処理の状態遷移)
図4は、図1から図3におけるパソコン90が表示するイメージの遷移図であって、前景部指定画像200を編集することにより、前景部調整画像210が生成する状態の遷移図である。ST100は、入力されたカラー画像100から生成された前景部指定画像200の表示の状態であり、ST200は、前景部調整画像210を生成する途中の表示の状態、ST300は、前景部調整画像210が確定した状態である。
状態ST100は、編集パラメータを設定する領域ST110、カラー画像100の全体を表示する領域ST120、及び、編集する前景部指定画像200を表示する領域ST130とから構成される。
ST130に表示される前景部指定画像200の領域は、ST120において、矩形の枠ST121で選択することにより定められる。ここで、前景部指定画像200は、モノクロ画像であるため、ST130には、白黒2値のイメージが表示される。
ST110は、ST130に表示された前景部指定画像200の領域を編集するパラメータ等を入力する領域である。ここでは、2値化の閾値を、「濃度」「エッジ強調」等のパラメータを入力することにより設定する他、複数の2値化の方法の中から、一の2値化の方法を選択する。
また、カラー画像100を複数の領域に分けた場合には、それらの領域をまとめて一のファイルに格納するか否かを「フィールド合成保存」のチェックボックスにより設定する。さらに、前景部指定画像200、又は、前景部調整画像210の編集が終了した場合には「保存」の指示を入力する。
ST130に表示されている領域の中に、2値化によって文字の周囲に意図されない黒画素が存在し、文字がつぶれて読めなくなる領域が含まれている場合には、ST110において、2値化の閾値を上げることにより、文字の周囲の黒画素が減少し、文字の形状が正しく表示される。
状態ST200では、ST130に表示された領域の2値化の閾値を高くした場合の前景部調整画像210を表示している。2値化の閾値を高くしたことにより、ST231の領域については、文字の形状が正しく表示されるようになったが、ST232の領域については、却って文字のイメージがかすれた表示になり、判読が難しくなっている。
そこで、ST232の部分を、独立した領域として処理を行うことにより、文字の形状が正しく表示されるようにする。状態ST300では、ST110から、2値化の方式の変更と、2値化の閾値の変更を行うことにより、文字の形状がはっきりと表示されるようになっている(ST331)。また、ST332の領域は、状態ST200では写真が含まれていたため、この領域を白画素で置き換えている。
カラー画像100の全領域について、前景部調整画像210が完成されるまで、上記の操作を行い、最後に、ST110の領域にある「保存」ボタンをクリックすることにより、前景部調整画像210に基づく処理が、カラー画像100に対して行われ、高圧縮画像ファイル600が生成される。
図4は、前景部調整画像210の作成に関する説明であるが、前景部抽出画像400を作成する場合にも、状態ST100からST300と同様に処理が行われる。この場合、ST130の領域には、カラー画像である前景部調整画像400が表示される。
(文字/非文字領域の指定の説明)
図5は、前景部指定画像200を作成する際に、予め、主に文字のイメージからなる文字領域と、主に非文字のイメージからなる非文字領域とを指定する場合の表示の状態の遷移図である。
状態ST400は、入力されたカラー画像100を読み込んだ初期状態であり、状態ST500は、カラー画像100から非文字領域を指定した状態である。
状態ST400において、ST410は、カラー画像100の全体を表示する領域であり、ST420に表示される領域は、ST410において、矩形の枠で選択することにより定められる。ここでは、カラー画像100の全体が選択されている。カラー画像100は、文字のイメージと写真のイメージとが混在している。そこで、主として写真のイメージのからなる領域を選択することにより、前景部抽出画像400と、前景部消去背景画像300とに分離する。
状態ST500では、主として写真のイメージからなる領域ST521とST522とが選択されている。
(MRCを編集する処理の説明)
図6は、MRCを編集する処理の流れである。図6では、図1における文字のレイヤの編集部2に代えて、MRCの編集部3が、高圧縮ファイル作成の主処理部1に接続されている。MRCの編集部3が、高圧縮ファイル作成の主処理部1より各レイヤのデータを受信し、表示し、前記各レイヤの画像を生成する中間画像が編集されることにより、高圧縮画像ファイル600が生成される。
MRCの編集部3は、合成表示部60、ユーザ操作判定部80、調整領域判定部71、画像調整編集部72、及び、表示機能を有するパソコン90とから構成され、表示機能を有するパソコン90には、さらに、キーボード91及びマウス92が接続されている。
MRCの編集部3には、前景部消去背景画像300、前景部表現画像500、及び、前景色画像510が、高圧縮ファイル作成の主処理部1より入力される。合成表示部60は、入力された画像のイメージを合成したデータを、合成したイメージを表示する指示と共に、パソコン90に送信する。パソコン90は、入力されたイメージを表示し、接続されたキーボード及びマウスによって、ユーザが編集の指示を行う。編集の指示は、例えば、編集する領域の選択、及び、選択された領域の色の値の変更等である。ユーザ操作判定部80は、パソコン90に入力された指示を信号に変換し、調整領域判定部71に送信する。調整領域判定部71は、ユーザ操作判定部80からの編集を指示する信号に基づき、編集を行う中間画像とその中間画像内の領域を選択すると共に、ユーザ操作判定部80から受信した編集内容の信号を、画像調整編集部72へ送信する。画像調整編集部72は、調整領域判定部71から受信した信号に基づき、カラー画像100、前景部指定画像200、前景部消去背景画像300、及び、前景部抽出画像400を編集する。
ユーザ操作判定部80が、MRCの編集処理の終了の指示を受け取るまで、合成表示部60、パソコン90、ユーザ操作判定部80、調整領域判定部71、及び、画像調整編集部72が処理を繰り返す。
(MRCを編集する処理の流れ)
図7は、MRCを編集する処理のフローである。
図7において、入力されたカラー画像100は、前景部と背景部に分離された後、それぞれのイメージの特性に応じた圧縮方式によって圧縮され、各圧縮されたデータが一のファイルとして格納された高圧縮画像ファイルが生成される。ステップS1000、及び、S2000の動作は、図2と同一である。
ステップS3100では、前景画像抜き出し部30が、前景部指定画像200をマスク画像として、元画像であるカラー画像100から、前景部抽出画像400を生成する。ステップS3200では、ステップS3100で前景部抽出画像400をぬきだした残りの画像に対し、抜き出した部分を所定の値の画素で置き換えた、前景部消去背景画像300を生成する。ここで、所定の画素の値とは、例えば、抜き出された前景部の周辺の領域の背景部の画素の値である。
ステップS4000では、前景色分離部40が、前景部抽出画像400のイメージを、前景部抽出画像を構成するイメージの形状である前景部表現画像500、及び、前記前景部抽出画像を構成するイメージの色を表す前景色画像510とに分離する。
ステップS5000では、高圧縮ファイル作成部50が、前景部消去背景画像300、前景部表現画像500、及び、前景色画像510を、それぞれ適した圧縮方法で圧縮し、さらに、圧縮されたそれぞれのデータを、それらを表示する際に重ね合わせる情報と共に、一のファイルに格納した高圧縮画像ファイル600を生成する。
次に、ステップS7100からS7600の処理について説明する。ステップS7100からS7600は、ステップS5000の直前までに生成された各レイヤの画像を表示することにより、再処理を行うレイヤとそのレイヤ内の領域を選択し、再度、中間画像を生成する処理である。
ステップS7100では、合成表示部60が、MRCを構成する各レイヤのイメージである、前景部消去背景画像300、前景部表現画像500、及び、前景色画像510を重ね合わせて表示する信号を生成し、パソコン90に送信する。
ステップS7200では、ユーザが、パソコン90を操作し、表示された結果に対して、可否を入力する。表示されている結果が良好である場合は、ステップS5000へ進む。表示されている結果が良好ではない場合は、ステップS7300へ進む。ステップS7300では、ユーザが、パソコン90を操作することにより、編集を行う領域と、編集の内容、及び、編集に関するパラメータ等を入力する。
ステップS7400では、調整領域判定部71が、パソコン90に入力された内容から、再処理を行う中間画像及び該中間画像内の領域を判定し、編集内容の信号とともに、ステップS7500へ送る。ステップS7500では、画像調整編集部72が、ステップS7400で判定された中間画像及び該中間画像内の領域に対し、パソコン90に入力された編集の処理を行う。
ステップS7600では、ステップS7500によって再度編集がなされた中間画像を用いて、MRCを生成する。
ステップS7200において、表示されている結果が良好であると判断されるまで、ステップS7100からS7600の処理を繰り返す。
図8は、図6及び図7におけるパソコン90が表示するイメージの遷移図であって、高圧縮ファイル作成の主処理部1で生成された各レイヤの画像をMRCとして合成して表示した結果から、再度、各レイヤの画像を生成する処理を行う場合の表示である。状態ST600は、MRCとして合成して表示した状態であり、状態ST700は、再度、各レイヤの画像を生成した後の表示の状態である。
状態ST600は、MRCの全体のイメージを表示する領域ST610、ST610から矩形によって選択されたMRCのイメージの領域である、領域ST620とから構成される。
領域ST620は、主として画像のイメージからなる領域であり、文字のイメージの領域ST621からST623を有する。ここでは、文字のイメージの領域ST621からST623は、かすれたようになっており、判読が困難になっている。
そこで、領域ST621からST623を選択し、これらの領域の2値化の閾値を低くするように指示する。領域ST621からST623を生成する2値化の処理は、ステップS2000における前景部指定画像200を生成する処理である。そこで、カラー画像100に対し、2値化の閾値を低めて2値化処理を行う。
状態ST700は、上記の処理によって得られたMRCのイメージの表示である。ST621からST623が、ST721からST723にそれぞれ状態が遷移しているが、その他の領域については、ST700とST600とは同一のイメージである。
(選択する領域の説明)
図9は、領域を選択する説明の図である。
ST800は、パソコン90に表示されているイメージの一例であり、領域の選択に関する設定等を行う領域ST810、カラー画像100の全体のイメージを表示する領域820、及び、カラー画像100のうち、選択された領域を表示する領域ST830とから構成されている。
ST830は、例えば、領域識別部20等で分割された複数の領域ST831からST835を有する。ST831からST833は、主として文字のイメージからなる文字領域であり、ST834からST836は、主として画像のイメージからなる非文字領域である。
編集する領域を選択する場合には、ST831からST836の領域のうち、一の領域の内部にマウスポインタを移動し、クリックすることにより、クリックされた点を含む領域が選択される。
ST810には、「領域レベル」を設定するスイッチが設けられている。領域レベルとは、選択する領域の最小単位を現すものであり、例えば、「1文字」「1行」「1の文字領域」又は「同色の背景領域」などが、所定の数字によって表される。例えば、選択する領域の最小単位が「1文字」の場合には、クリックされた点の文字のみが選択される。
(選択領域、処理領域、及び、表示の更新の関連の説明)
図9において、ST831、ST832、及び、ST836は、領域ST830内に収まっているが、ST833、ST834、及び、ST835は、領域の一部が、領域ST830の外に存在している。
そこで、ST831、ST832、又は、ST836が選択され、所定の処理を実行する場合には、ST830の中で、当該領域の表示を更新する。
一方、ST833、ST834、又は、ST835が選択され、所定の処理を実行する場合には、当該領域のうち、ST833内に含まれる領域の表示が更新され、ST833の外に存在する領域については、表示を更新しない未更新領域とし、領域の範囲の情報、及び、処理の内容を対応づけて保持する。
ST821の位置又は大きさを変更することにより、ST830に表示されるイメージが変更される場合に、新たに表示される領域の中で、未更新領域があるときには、当該未更新領域に対し、対応づけられている所定の処理を実行し、表示を更新する。
処理を全て終了する際には、ST810等に設けられている入力装置から終了の指示が入力さる。このとき、全ての未更新領域に対して、対応付けられている処理が実行される。
(OCRの処理の説明)
図10は、入力されたカラー画像100から、テキストデータ900を生成するOCR処理のブロック図である。OCR処理は、OCRの主処理部4及びOCRデータの作成部5によって実行される。
OCRの主処理部4は、入力されたカラー画像を2値化し、用紙方向の補正、及び、スキュー補正を行うことにより、テキストデータ900を生成するOCR処理の主たる部分であり、2値化処理部10、用紙方向判定部31、スキュー補正処理部32、及び、OCR処理部51から構成されている。
2値化処理部10は、入力されたカラー画像100を所定の閾値で2値化し、2値画像200を生成する。用紙方向判別処理部31は、2値化画像200のイメージから、文字のイメージが紙面に形成されている方向を判別する。ここで判別される方向は、例えば、90度毎の方向であり、詳細な方向は、スキュー補正部32によって定められる。スキュー補正部32は、用紙方向判別処理部31が、文字のイメージの形成されている方向を判別した後に、詳細なずれの角度を検出し、イメージの上下左右方向の角度を確定し、用紙方向及びスキュー補正後2値画像700を生成する。用紙方向判別処理部31及びスキュー補正処理部32は、2値画像200から得られた、用紙方向及びスキュー補正の値を、カラー画像100に適用し、用紙方向及びスキュー補正後カラー画像800を生成する。
OCRデータの作成部5は、OCRの主処理部1で生成されたテキストデータ900等を表示し、テキストデータ900等のイメージから編集する領域を選択し、選択されたイメージの領域に対応する画像の領域に対し、編集を行うことにより、OCRの精度の良いテキストデータ900を得る処理を行い、ユーザ操作判定部80、対象部分切り出し部73、対象部分2値化調整部74、データ合成制御部61、及び、表示処理部62とから構成される。
データ合成制御部61は、用紙方向及びスキュー補正後2値画像を表示する信号を生成し、表示処理部62へ送信する。表示処理部62は、入力された画像のデータと表示の信号とを、表示機能を有するパソコン90に送信する。
ユーザ操作判定部80は、パソコン90に入力された指示を元に、用紙方向及びスキュー補正後カラー画像800の中で、編集を行う領域を判定し、該領域の信号を編集の内容の信号とともに、対象部分切り出し部73へ信号を送信する。
対象部分切り出し部73は、ユーザ操作判定部80より受信した編集を行う領域の信号に基づき、用紙方向及びスキュー補正後カラー画像800から、編集の対象となる領域を切り出し、編集の内容とともに、対象部分2値化調整部74へ送信する。対象部分2値化調整部74は、入力された画像のイメージのデータに対し、入力された編集の内容に基づく2値化の処理を行い、対象部分濃度調整後2値画像710を生成する。対象部分濃度調整後2値画像710は、OCR処理部51に送信され、OCRの処理が行われた、対象部分のみテキストデータ910が生成される。
データ合成制御部61は、対象部分濃度調整後2値画像710及び対象部分のみテキストデータ910を同時に表示するイメージを生成し、表示処理部62に送信する。
(文字のイメージを検出する方法)
ところで、任意の領域から、文字のイメージを検出するには、処理する領域の中で、主に文字のイメージからなる文字領域と、主に非文字のイメージからなる非文字領域とに分けた後、更に、それらの領域から文字のイメージを抽出する。任意の領域が、文字領域であるか、非文字領域であるかは、カラー画像の色分布状態、又は、カラー画像を2値化した2値画像の画素の分布状態から判定する。
例えば、2値画像の画素の分布状態から文字の領域を判定する場合には、次のような手順で行う。まず、同色の画素のクラスタを検出し、外接する矩形内に存在する複数のクラスタの集合体を得る。この集合体を一の文字のイメージとみなす。次に、複数の集合体が縦又は横方向に連続して出現するか否かを検出する。例えば、3つの集合体が連続して出現する場合には、3文字のイメージがあるとみなし、文字列の領域と判定する。
また、他のクラスタの集合体に比して、非常に大きな面積を有するクラスタは、文字のイメージではないと判断する。また、非常に小さなクラスタはノイズとして除去することもある。
上記の文字のイメージの検出の処理の中で、有効なクラスタであることを判断する閾値、有効な集合体であることを判断する閾値、及び、有効な文字列の領域であることを判断する閾値等、文字のイメージを検出する際の様々な閾値を変化させることにより、文字のイメージを検出する精度を変えることができる。
そこで、文字領域においては、文字のイメージを検出する際の閾値を小さくし、非文字領域においては、文字のイメージを検出する際の閾値を、文字領域より大きくすることにより、文字及び非文字のイメージのそれぞれについて、誤検出を減らすことができる。
(OCRの処理の流れ)
図11は、OCRの処理のフローである。
図11において、入力されたカラー画像100は、2値化及びスキュー補正等の処理を行われた後、OCR処理によってテキストデータが出力される。
ステップS1000は、2値化処理部10が、カラー画像100に対して2値化の処理を行うステップであり、ステップS3110では、2値化された画像に対して、用紙方向判別処理部31、及び、スキュー補正処理部32が、それぞれ、イメージが形成された用紙の方向及び詳細な角度を求めて補正を行った、用紙方向及びスキュー補正2値画像700を生成する。
ステップS3120では、用紙方向判別処理部31、及び、スキュー補正処理部32が、ステップS3110で求められたイメージが形成された用紙の方向及び詳細な角度を用いて、カラー画像100に対して補正を行い、用紙方向及びスキュー補正カラー画像800を生成する。
ステップS5100では、OCR処理部51が、ステップS3110で補正された2値画像に対し、OCR処理を行い、テキストデータ900を生成する。
ステップS8100では、ステップS5100で生成されたテキストデータ900と、ステップ3110で生成された用紙方向及びスキュー補正2値画像700とをパソコン90に表示する。
ステップS8200では、ユーザが、パソコン90に表示されたイメージの可否を入力する。パソコン90に表示されたイメージ又はOCR結果が良好な場合には、ステップS8700に進み、パソコン90に表示されたイメージが不可の場合には、ステップS8300に進む。
ステップS8300では、ユーザ操作判定部80が、パソコンに入力された内容から、用紙方向及びスキュー補正カラー画像800における編集の対象となる領域と、編集の内容とを判定し、ステップS8400へ進む。
ステップS8400では、対象部分切り出し部73が、ステップS8300で判定された内容に基づき、用紙方向及びスキュー補正カラー画像800のデータから、対象となる部分を切り出す。ステップS8500では、対象部分2値化調整部74が、ステップS8400で切り出された画像のデータに対し、ステップS8300で判定された編集の内容を実行し、濃度調整後2値画像710を生成する。編集の内容は、例えば、対象となる領域全体の画素の値を変更して明るさを調整する、対象となる領域を、ステップS1000とは異なるステップS8300で判定された閾値で2値化する、等である。
ステップS8600では、データ合成制御部61が、OCRの処理を実行する2値画像を生成する。OCRの処理を実行する2値画像は、濃度調整後2値画像710、又は、用紙方向及びスキュー補正2値画像700について、ステップS8300で判定された領域を濃度調整後2値画像710で置き換えた画像である。
ステップS8200において、表示結果が良好と判定されるまで、ステップS810からステップS8600、及び、ステップS5100の処理を繰り返す。
ステップS8700では、OCR処理を行った結果のテキストデータを出力し、処理を終了する。
図12は、本発明の画像処理プログラムを実行するコンピュータの構成図である。コンピュータの主処理部6が、キーボード91、表示装置93等の入出力装置、及び、ハードディスクドライブ601等に接続されており、さらに、スキャナ101、及び、プリンタ602等の画像イメージの入出力機器に接続されている。
コンピュータの主処理部6は、CPU7、ROM8、及び、RAM9から構成されており、CPU7が、ROM8に格納されたプログラムを実行することにより、本発明の画像処理を実現する。RAM9は、CPU7がプログラムを実行する際の一時データを格納するメモリである。RAM9は、前景部指定画像200等の中間イメージデータを格納してもよい。
キーボード91、及び、マウス92は、処理する領域等を入力する装置であり、表示装置93は、本発明の画像処理方法における各処理ステップで表示されるイメージを表示する装置である。
ハードディスクドライブ601は、大容量のデータを格納する装置であり、高圧縮画像ファイル600、テキストデータ900を格納する他に、入力されるカラー画像100、及び、前景部指定画像200等の中間イメージデータを格納してもよい。
スキャナ101は、媒体に形成された画像を読み込み、カラー画像100のイメージデータを生成する装置であり、プリンタ602は、各種イメージを紙面に形成して出力する装置である。
なお、コンピュータの主処理部6は、コンピュータ90の主処理部と同一になるように構成されてもよい。
以上、発明を実施するための最良の形態について説明を行ったが、本発明は、この最良の形態で述べた実施の形態に限定されるものではない。本発明の主旨をそこなわない範囲で変更することが可能である。
文字のレイヤを編集する機能を有する画像処理装置。 前景部指定画像を編集する処理のフロー。 前景部抽出画像を編集する処理のフロー。 前景部指定画像を編集する際の表示の遷移。 文字領域又は非文字領域を選択する際の表示の遷移。 MRCを編集する機能を有する画像処理装置。 MRCを編集する処理のフロー。 MRCを編集する際の表示の遷移。 MRCから領域を選択する場合の表示。 OCR処理の機能を有する画像処理装置。 OCR処理のフロー。 本発明の画像処理プログラムを実行するコンピュータの構成図。
符号の説明
1 高圧縮ファイル作成の主処理部
2 文字のレイヤの編集部
3 MRCの編集部
4 OCRの主処理部
5 OCRデータの作成部
6 コンピュータの主処理部
7 CPU
8 ROM
9 RAM
60 合成表示部
61 データ合成制御部
62 表示処理部
70 画像調整部
71 調整領域判定部
72 画像調整編集部
73 対象部分切り出し部
74 対象部分2値化調整部
80 ユーザ操作判定部
90 表示機能を有するパソコン

Claims (31)

  1. 画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、
    前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段と、
    前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段とを有し、
    前記表示手段は、前記確定前の画像が更新される毎に、表示を更新することを特徴とする画像処理装置。
  2. 前記表示手段は、
    前記画像の初期状態のイメージを表示する初期画像の表示領域と、
    前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、
    前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択手段と、
    前記確定前の画像の表示領域から、前記文字レイヤの編集手段が編集する編集領域を選択する編集領域の選択手段と
    を有することを特徴とする請求項1記載の画像処理装置。
  3. 前記文字レイヤの編集手段は、2値化処理、又は、非文字のイメージの削除を行い、
    前記2値化処理における2値化の閾値、前記2値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、2値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力手段を有することを特徴とする請求項2記載の画像処理装置。
  4. 前記文字レイヤの編集手段は、2値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、OCR処理を行うことを特徴とする請求項1ないし3記載の画像処理装置。
  5. 前記編集領域の選択手段によって選択された編集領域が編集される場合に、
    前記表示手段は、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、
    表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、
    編集の確定が入力された際に、編集されながらも更新されていない領域を更新することを特徴とする請求項2ないし4記載の画像処理装置。
  6. 画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、
    前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、
    前記表示手段に表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択手段と、
    前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出手段と、
    を有することを特徴とする画像処理装置。
  7. 前記文字の検出手段は、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、
    前記文字の検出手段が文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいことを特徴とする請求項6記載の画像処理装置。
  8. 前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段を有し、
    該文字レイヤの編集手段は、前記文字の検出手段が検出した結果に基づき、用紙方向の補正、スキュー補正、及び/又は、OCR処理を行うことを特徴とする請求項6又は7記載の画像処理装置。
  9. 前記文字レイヤの編集手段がOCR処理を行う場合に、前記表示手段は、OCR処理の結果に対応するテキストデータを表示することを特徴とする請求項8記載の画像処理装置。
  10. 前記文字・非文字領域の選択手段によって選択された文字領域又は非文字領域が処理によって変更される場合に、
    前記表示手段は、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、
    表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、
    編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新することを特徴とする請求項6ないし9記載の画像処理装置。
  11. 画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理装置において、
    前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び/又は、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、
    該表示手段が表示する領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び、OCR処理のうち、一の処理を行う処理領域を選択する処理領域の選択手段と、
    前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択手段と、
    を有することを特徴とする画像処理装置。
  12. 前記表示手段は、
    前記画像の初期状態のイメージを表示する初期画像の表示領域と、
    前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、
    前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、
    前記処理領域の選択手段は、前記確定前の画像の表示領域から、処理を行う処理領域を選択することを特徴とする請求項11記載の画像処理装置。
  13. 前記処理領域の選択手段によって選択された処理領域が編集される場合に、
    前記表示手段は、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、
    表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、
    編集の確定が入力された際に、処理されながらも更新されていない領域を更新することを特徴とする請求項12記載の画像処理装置。
  14. 前記処理領域の選択手段は、前記複数の領域のうちの一つの領域を選択することを特徴とする請求項11ないし13記載の画像処理装置。
  15. 処理領域の最低単位を選択する、処理領域の単位の選択手段を有し、
    前記処理領域の選択手段は、前記処理領域の最低単位を選択することを特徴とする請求項11ないし14記載の画像処理装置。
  16. 画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、
    前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップと、
    前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップとを有し、
    前記表示ステップは、前記確定前の画像が更新される毎に、表示を更新することを特徴とする画像処理方法。
  17. 前記表示ステップは、
    前記画像の初期状態のイメージを表示する初期画像の表示領域と、
    前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、
    前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択ステップと、
    前記確定前の画像の表示領域から、前記文字レイヤの編集ステップが編集する編集領域を選択する編集領域の選択ステップと
    を有することを特徴とする請求項16記載の画像処理方法。
  18. 前記文字レイヤの編集ステップは、2値化処理、又は、非文字のイメージの削除を行い、
    前記2値化処理における2値化の閾値、前記2値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、2値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力ステップを有することを特徴とする請求項17記載の画像処理方法。
  19. 前記文字レイヤの編集ステップは、2値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、OCR処理を行うことを特徴とする請求項16ないし18記載の画像処理方法。
  20. 前記編集領域の選択ステップによって選択された編集領域が編集される場合に、
    前記表示ステップは、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、
    表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、
    編集の確定が入力された際に、編集されながらも更新されていない領域を更新することを特徴とする請求項17ないし19記載の画像処理方法。
  21. 画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、
    前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、
    前記表示ステップにおいて表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択ステップと、
    前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出ステップと、
    を有することを特徴とする画像処理方法。
  22. 前記文字の検出ステップは、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、
    前記文字の検出ステップが文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいことを特徴とする請求項21記載の画像処理方法。
  23. 前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップを有し、
    該文字レイヤの編集ステップは、前記文字の検出ステップが検出した結果に基づき、用紙方向の補正、スキュー補正、及び/又は、OCR処理を行うことを特徴とする請求項21又は22記載の画像処理方法。
  24. 前記文字レイヤの編集ステップにおいてOCR処理を行う場合に、前記表示ステップは、OCR処理の結果に対応するテキストデータを表示することを特徴とする請求項23記載の画像処理方法。
  25. 前記文字・非文字領域の選択ステップによって選択された文字領域又は非文字領域が処理によって変更される場合に、
    前記表示ステップは、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、
    表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、
    編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新することを特徴とする請求項21ないし24記載の画像処理方法。
  26. 画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理方法において、
    前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び/又は、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、
    該表示ステップにおいて表示される領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び、OCR処理のうち、一の処理を行う処理領域を選択する処理領域の選択ステップと、
    前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択ステップと、
    を有することを特徴とする画像処理方法。
  27. 前記表示ステップは、
    前記画像の初期状態のイメージを表示する初期画像の表示領域と、
    前記確定前の前記画像のイメージ、及び/又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、
    前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、
    前記処理領域の選択ステップは、前記確定前の画像の表示領域から、前記処理を行う領域を選択することを特徴とする請求項26記載の画像処理方法。
  28. 前記処理領域の選択ステップによって選択された処理領域が編集される場合に、
    前記表示ステップは、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、
    表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、
    編集の確定が入力された際に、処理されながらも更新されていない領域を更新することを特徴とする請求項27記載の画像処理方法。
  29. 前記処理領域の選択ステップは、前記複数の領域のうちの一つの領域を選択することを特徴とする請求項26ないし28記載の画像処理方法。
  30. 処理領域の最低単位を選択する、処理領域の単位の選択ステップを有し、
    前記処理領域の選択ステップは、前記処理領域の最低単位を選択することを特徴とする請求項26ないし29記載の画像処理方法。
  31. 請求項16から30何れか一項記載の画像処理方法をコンピュータに実行させるためのプログラム。
JP2006002652A 2006-01-10 2006-01-10 画像処理装置、画像処理方法、及び、画像処理プログラム Pending JP2007184842A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006002652A JP2007184842A (ja) 2006-01-10 2006-01-10 画像処理装置、画像処理方法、及び、画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006002652A JP2007184842A (ja) 2006-01-10 2006-01-10 画像処理装置、画像処理方法、及び、画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2007184842A true JP2007184842A (ja) 2007-07-19

Family

ID=38340531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006002652A Pending JP2007184842A (ja) 2006-01-10 2006-01-10 画像処理装置、画像処理方法、及び、画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2007184842A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010074425A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像処理装置、プログラム、および画像処理方法
CN102466965A (zh) * 2010-10-29 2012-05-23 方正国际软件(北京)有限公司 一种分色制版的方法和系统
CN112508785A (zh) * 2020-11-28 2021-03-16 华为技术有限公司 一种图片处理方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010074425A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像処理装置、プログラム、および画像処理方法
CN102466965A (zh) * 2010-10-29 2012-05-23 方正国际软件(北京)有限公司 一种分色制版的方法和系统
CN112508785A (zh) * 2020-11-28 2021-03-16 华为技术有限公司 一种图片处理方法及装置

Similar Documents

Publication Publication Date Title
US7831107B2 (en) Image processing apparatus, image processing method, and program
JP4903034B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2009077048A (ja) 画像処理装置、および画像処理方法
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP6122988B1 (ja) 画像処理装置、画像処理方法、および、プログラム
JP6939449B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP4364809B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP4532331B2 (ja) 情報埋め込み装置、情報抽出装置、情報埋め込み方法、情報抽出方法、情報埋め込みプログラム、及び情報抽出プログラム
JP5645612B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2007158725A (ja) 画像処理装置及び画像処理方法並びにプログラム
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP2007184842A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2010146218A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2020067959A (ja) 画像処理装置、その制御方法及びプログラム
JP5005732B2 (ja) 画像形成装置及び画像処理方法
JP2008061068A (ja) 画像形成装置
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2005045799A (ja) 部分的テンプレート照合を用いた画質向上
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP4626565B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP2006165818A (ja) 改ざん検出装置,透かし入り画像出力装置,透かし入り画像入力装置,透かし入り画像出力方法,および透かし入り画像入力方法
JP2020087320A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2008017213A (ja) 画像処理装置及びその方法
JP2005301713A (ja) 帳票画像の地紋除去方法及び装置
JP2009141525A (ja) 画像処理装置及び画像処理方法