JP2007184842A

JP2007184842A - 画像処理装置、画像処理方法、及び、画像処理プログラム

Info

Publication number: JP2007184842A
Application number: JP2006002652A
Authority: JP
Inventors: Toshio Akiyama; 敏雄穐山
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2006-01-10
Filing date: 2006-01-10
Publication date: 2007-07-19

Abstract

【課題】文字と画像等、特性が異なる領域が混在するイメージを圧縮して保存する場合に、特性の異なる領域を適切に分割し、それぞれの領域毎に処理することのできる画像処理装置を提供すること。
【解決手段】画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段と、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段とを有し、前記表示手段は、前記確定前の画像が更新される毎に、表示を更新する画像処理装置。
【選択図】図１

Description

本発明は、画像処理装置、画像処理方法、及び、画像処理プログラムに関する。

従来から、文字と画像が混在するイメージのデータを圧縮して保存する装置及び方法がある。文字や罫線は、画像に比べて輪郭が多く、また、輪郭の内部の画素の値がほぼ同等であると言う特徴がある。一方、写真などの自然画像は、文字に比べて、輪郭が少なく、同等の値を持った画素のクラスタが少ない。そこで、文字と画像の混在するイメージのデータを圧縮する場合には、主として文字や罫線などから構成される領域と、主として画像から構成される領域とに分割し、それぞれの領域の特性に適した圧縮を行うことより、データの量を効率よく削減することができる。

特開２００５−２０４２０６号公報（特許文献１）及び特開２００５−２０４２０７号公報（特許文献２）には、入力された多値画像から２値画像を生成し、該２値画像に基づき、文字及び罫線等の領域と、その他の画像等の領域とを分割して処理する画像処理装置が開示されている。特許文献２は、更に、２値画像に基づき分割する際に、黒色の画素からなるクラスタの大きさを考慮することにより、より適切に、文字及び罫線等の領域と、その他の画像の領域とを分割する画像処理装置が開示されている。
特開２００５−２０４２０６号公報特開２００５−２０４２０７号公報

しかしながら、特許文献１及び特許文献２に開示されている技術は、いずれも、文字等の領域とその他の画像の領域の分割の結果を、予めユーザが知ることはできないため、適切に分割が行われない場合が生じるという不具合があった。

本発明は、上記の点に鑑みて、これらの問題を解消するために発明されたものであり、文字と画像等、特性が異なる領域が混在するイメージを圧縮して保存する場合に、特性の異なる領域を適切に分割し、それぞれの領域毎に処理することのできる画像処理装置を提供することを目的としている。

上記目的を達成するために、本発明の画像処理装置は次のような構成を採用した。

本発明の画像処理装置は、画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段と、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段とを有し、前記表示手段は、前記確定前の画像が更新される毎に、表示を更新するように構成することができる。

これにより、画像のデータから文字のレイヤが適切に分割されているか否かを、確認しながら処理を行うことのできる画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記表示手段は、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択手段と、前記確定前の画像の表示領域から、前記文字レイヤの編集手段が編集する編集領域を選択する編集領域の選択手段とを有する構成とすることができる。

これにより、画像のデータを複数のレイヤに分割する場合に、文字が適切に分割されているか否かを確認し、更に、文字のレイヤの中で適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記文字レイヤの編集手段は、２値化処理、又は、非文字のイメージの削除を行い、２値化の閾値、２値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、２値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力手段を有する構成とすることができる。

これにより、画像のデータを複数のレイヤに分割する場合に、文字を適切に分割するのに必要な２値化のパラメータを入力し、該２値化のパラメータに基づく処理の結果を表示によって確認することのできる画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記文字レイヤの編集手段は、２値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、ＯＣＲ（Optical Character Reader）処理を行うように構成することができる。

これにより、文字を適切に分割した結果である２値化された文字のイメージから、テキストデータを生成するＯＣＲ処理に際し、誤認識の少ない画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置は、前記編集領域の選択手段によって選択された編集領域が編集される場合に、前記表示手段は、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、編集の確定が入力された際に、編集されながらも更新されていない領域を更新するように構成することができる。

これにより、編集の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置は、画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、前記表示手段に表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択手段と、前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出手段とを有する構成とすることができる。

これにより、画像のイメージの中から、予め特性の異なる領域を選択することができ、領域の特性に応じた処理を行う画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記文字の検出手段は、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、前記文字の検出手段が文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいように構成することができる。

これにより、主として文字のイメージからなる領域と、主として非文字のイメージからなる領域とで、それぞれの領域の特性に応じた処理を行う画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置は、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段を有し、該文字レイヤの編集手段は、前記文字の検出手段が検出した結果に基づき、用紙方向の補正、スキュー補正、及び／又は、ＯＣＲ処理を行うように構成することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記文字レイヤの編集手段がＯＣＲ処理を行う場合に、前記表示手段は、ＯＣＲ処理の結果に対応するテキストデータを表示するように構成することができる。

これにより、ＯＣＲ処理に際し、誤認識が生じているか否かを確認する画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記文字・非文字領域の選択手段によって選択された文字領域又は非文字領域が処理によって変更される場合に、前記表示手段は、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新するように構成することができる。

これにより、変更の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置は、画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理装置において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び／又は、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、該表示手段が表示する領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び／又は、ＯＣＲ処理のうち一の処理を行う処理領域を選択する処理領域の選択手段と、前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択手段とを有する構成とすることができる。

これにより、複数の領域に分割され、該複数の領域のそれぞれを複数のレイヤに分割され、圧縮等の処理をされた画像のイメージの中から、レイヤの分割、及び、圧縮等の処理が適切ではない領域を選択し、該適切ではない領域に対し、更なる領域の分割、レイヤの再分割、及び、圧縮等の処理を行う場合に、それらの結果を表示によって確認する画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記表示手段は、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、前記処理領域の選択手段は、前記確定前の画像の表示領域から、処理を行う処理領域を選択するように構成することができる。

これにより、複数のレイヤに分割された画像のデータの中から、適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記処理領域の選択手段によって選択された処理領域が編集される場合に、前記表示手段は、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、編集の確定が入力された際に、処理されながらも更新されていない領域を更新するように構成することができる。

また、上記目的を達成するために、本発明の画像処理装置における前記処理領域の選択手段は、前記複数の領域のうちの一つの領域を選択するように構成することができる。

これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、同じ特性を有する一の領域を容易に選択することのできる画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理装置は、処理領域の最低単位を選択する、処理領域の単位の選択手段を有し、前記処理領域の選択手段は、前記処理領域の最低単位を選択するように構成することができる。

これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、前記適切ではない部分の選択を容易かつ詳細に行うことのできる画像処理装置を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法は、画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップと、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップとを有し、前記表示ステップは、前記確定前の画像が更新される毎に、表示を更新するように構成することができる。

これにより、画像のデータから文字のレイヤが適切に分割されているか否かを、確認しながら処理を行うことのできる画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記表示ステップは、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択ステップと、前記確定前の画像の表示領域から、前記文字レイヤの編集ステップが編集する編集領域を選択する編集領域の選択ステップとを有する構成とすることができる。

これにより、画像のデータを複数のレイヤに分割する場合に、文字が適切に分割されているか否かを確認し、更に、文字のレイヤの中で適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記文字レイヤの編集ステップは、２値化処理、又は、非文字のイメージの削除を行い、前記２値化処理における２値化の閾値、前記２値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、２値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力ステップを有する構成とすることができる。

これにより、画像のデータを複数のレイヤに分割する場合に、文字を適切に分割するのに必要な２値化のパラメータを入力し、該２値化のパラメータに基づく処理の結果を表示によって確認することのできる画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記文字レイヤの編集ステップは、２値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、ＯＣＲ処理を行うように構成することができる。

これにより、文字を適切に分割した結果である２値化された文字のイメージから、テキストデータを生成するＯＣＲ処理に際し、誤認識の少ない画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記編集領域の選択ステップによって選択された編集領域が編集される場合に、前記表示ステップは、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、編集の確定が入力された際に、編集されながらも更新されていない領域を更新するように構成することができる。

これにより、編集の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法は、画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、前記表示ステップにおいて表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択ステップと、前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出ステップとを有する構成とすることができる。

これにより、画像のイメージの中から、予め特性の異なる領域を選択することができ、領域の特性に応じた処理を行う画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記文字の検出ステップは、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、前記文字の検出ステップが文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいように構成することができる。

これにより、主として文字のイメージからなる領域と、主として非文字のイメージからなる領域とで、それぞれの領域の特性に応じた処理を行う画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法は、前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップを有し、該文字レイヤの編集ステップは、前記文字の検出ステップが検出した結果に基づき、用紙方向の補正、スキュー補正、及び／又は、ＯＣＲ処理を行うように構成することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記文字レイヤの編集ステップにおいてＯＣＲ処理を行う場合に、前記表示ステップは、ＯＣＲ処理の結果に対応するテキストデータを表示するように構成することができる。

これにより、ＯＣＲ処理に際し、誤認識が生じているか否かを確認する画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記文字・非文字領域の選択ステップによって選択された文字領域又は非文字領域が処理によって変更される場合に、前記表示ステップは、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新するように構成することができる。

これにより、変更の結果に対応するイメージを表示する際に、全体のイメージの表示を更新する場合よりも高速に表示する画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法は、画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理方法において、前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び／又は、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、該表示ステップにおいて表示される領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び、ＯＣＲ処理のうち、一の処理を行う処理領域を選択する処理領域の選択ステップと、前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択ステップとを有する構成とすることができる。

これにより、複数の領域に分割され、該複数の領域のそれぞれを複数のレイヤに分割され、圧縮等の処理をされた画像のイメージの中から、レイヤの分割、及び、圧縮等の処理が適切ではない領域を選択し、該適切ではない領域に対し、更なる領域の分割、レイヤの再分割、及び、圧縮等の処理を行う場合に、それらの結果を表示によって確認する画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記表示ステップは、前記画像の初期状態のイメージを表示する初期画像の表示領域と、前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、前記処理領域の選択ステップは、前記確定前の画像の表示領域から、前記処理を行う領域を選択するように構成することができる。

これにより、複数のレイヤに分割された画像のデータの中から、適切に処理されていない領域を選択し、該領域に対して更なる処理を行うことのできる画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記処理領域の選択ステップによって選択された処理領域が編集される場合に、前記表示ステップは、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、編集の確定が入力された際に、処理されながらも更新されていない領域を更新するように構成することができる。

また、上記目的を達成するために、本発明の画像処理方法における前記処理領域の選択ステップは、前記複数の領域のうちの一つの領域を選択するように構成することができる。

これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、同じ特性を有する一の領域を容易に選択することのできる画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理方法は、処理領域の最低単位を選択する、処理領域の単位の選択ステップを有し、前記処理領域の選択ステップは、前記処理領域の最低単位を選択するように構成することができる。

これにより、特性の異なる領域に分割された画像のデータを表示し、処理等が適切ではない部分を選択して更なる処理を行う場合に、前記適切ではない部分の選択を容易かつ詳細に行うことのできる画像処理方法を提供することができる。

また、上記目的を達成するために、本発明の画像処理プログラムは、請求項１６から３０何れか一項記載の画像処理方法をコンピュータに実行させるためのプログラムとして構成することができる。

本発明によれば、文字と画像等、特性が異なる領域が混在するイメージを圧縮して保存する場合に、特性の異なる領域を適切に分割し、それぞれの領域毎に処理することのできる画像処理装置を提供することができる。

以下、本発明の実施例を図面に基づき説明する。

（文字のレイヤを編集する処理の説明）
図１は、本発明の第一の実施例である、文字のイメージのレイヤを編集し所望のイメージを生成する画像処理装置の一例である。

高圧縮ファイル作成の主処理部１は、原稿であるカラー画像１００を読み込み、文字のレイヤと非文字である背景のレイヤとに分割し、それぞれのレイヤに適した処理を行うことにより、高圧縮画像ファイル６００を生成する。文字のレイヤの編集部２は、文字のレイヤと背景のレイヤとに適切に分割するために、前記文字のレイヤを表示して編集することにより、望ましい文字のイメージを生成する。

高圧縮ファイル作成の主処理部１は、２値化処理部１０、領域識別部２０、前景画像抜き出し部３０、前景色分離部４０、及び、高圧縮ファイル作成部５０とから構成される。２値化処理部は、入力された原稿であるカラー画像１００のイメージデータを、所定の閾値を用いて２値画像に変換する。領域識別部２０は、前記２値画像から、主に文字のイメージからなる文字の領域（前景部）と、主に非文字のイメージからなる領域（背景部）とに分割し、前景部の位置を指定するマスク画像である、前景部指定画像２００を出力する。

ところで、画像を複数のレイヤに分割した場合に、文字のイメージのレイヤは、通常は、上位のレイヤになることが多く、非文字のイメージのレイヤは、通常は、下位のレイヤになることが多い。そこで、本明細書では、主に文字のイメージからなるイメージを「前景画像」、主に非文字のイメージからなるイメージを「背景画像」とし、前景画像の領域を「前景部」、背景画像の領域を「背景部」とする。

前景画像抜き出し部３０には、カラー画像１００と、前景指定画像２００とが入力され、カラー画像１００のうち、前景指定画像２００が指定する位置のイメージである前景部抽出画像４００と、その他の位置のイメージである前景部消去背景画像３００とに分割する。

前景部抽出画像４００は、前景色分離部４０に入力され、前景部を構成する文字のイメージの形を表現する、前景部表現画像５００と、前記文字のイメージの色を表現する、前景色画像５１０とに分割される。

高圧縮ファイル作成部５０は、前景部消去背景画像３００、前景部表現画像５００、及び、前景色画像５１０のそれぞれについて、画像の特性に適した圧縮を行い、その結果を一のファイルとして格納した高圧縮画像ファイル６００を出力する。

ここで、圧縮の方法は、例えば、次のようになる。前景部消去背景画像３００は、主に非文字のイメージからなる多値画像であり、文字のイメージに比して、求められる解像度や圧縮伸長後の画像の品質が低い。そこで、そのような画像の特性に適した、ＪＰＥＧ等の多値の圧縮方式を適用する。前景部表現画像５００は、主に文字のイメージからなる２値画像であり、非文字のイメージに比して求められる解像度や圧縮伸長後の画像の品質が高い。そこで、例えば、ＭＨ（ＭｏｄｉｆｉｅｄＨｕｆｆｍａｎＲｕｎＬｅｎｇｔｈＣｏｄｉｎｇ）、ＭＭＲ（ＭｏｄｉｆｉｅｄＭｏｄｉｆｉｅｄＲＥＡＤ（ＲｅｌａｔｉｖｅＥｌｅｍｅｎｔＡｄｄｒｅｓｓＤｅｓｉｇｎａｔｅｃｏｄｅｓ））等の圧縮方式を用いる。また、前景部色画像５１０は、複数の矩形に対し、該矩形のそれぞれに単一又は複数の色のパターンを定めた多値画像であり、そのような画像の特性に適した、ＪＰＥＧ、ＤＥＦＬＡＴＥ圧縮、又は、ＬＺＷ圧縮等の多値符号化を適用する。

高圧縮画像ファイル６００のデータ構造は、例えば、ミクストラスターコンテント（ＭＲＣ（ＩＴＵ−ＴＴ．４４））に規定されている構造を用いる。

文字のレイヤの編集部２は、高圧縮ファイル作成の主処理部１が、カラー画像１００を前景部と背景部とに分割する処理の中間生成画像として生成する、前景部指定画像２００、及び／又は、前景部抽出画像４００が、望ましい画像になるように編集する装置であって、合成表示部６０、画像調整部７０、ユーザ操作判定部８０、及び、表示機能を有するパソコン９０とから構成され、表示機能を有するパソコン９０には、更に、キーボード９１及びマウス９２が接続されている。
（前景部指定画像２００の編集処理）
文字のレイヤの編集部２に、前景部指定画像２００が入力された場合には、前景部指定画像２００は前景部を構成する文字のイメージの形状のみを表すイメージであるため、合成表示部６０は、白黒２値のイメージにより、前景部指定画像２００を表示する指示と共に、パソコン９０に前景部指定画像２００のイメージのデータを送信する。パソコン９０は、入力されたイメージを表示し、接続されたキーボード及びマウスによって、ユーザが編集の指示を行う。編集の指示は、例えば、２値化の閾値の変更、前景部指定画像２００に含まれる画像のイメージの削除等である。ユーザ操作判定部８０は、パソコン９０に入力された指示を信号に変換し、画像調整部７０に送信する。画像調整部７０は、ユーザ操作判定部８０からの編集を指示する信号を、高圧縮ファイル作成の主処理部１に入力されたカラー画像１００に適用した画像である、前景部調整画像２１０を生成し、合成表示部６０に送信する。
（前景部抽出画像４００の編集処理）
また、文字のレイヤの編集部２に、前景部抽出画像４００が入力された場合には、前景部抽出画像４００は、前景部を構成する文字のイメージの形状の他に、文字の色を含むカラー画像のイメージであるため、合成表示部６０は、カラー表示によって前景部抽出画像４００を表示する指示と共に、パソコン９０に、前景部指定画像２００のイメージのデータを送信する。パソコン９０は、入力されたイメージを表示し、接続されたキーボード及びマウスによって、ユーザが編集の指示を行う。例えば、文字のイメージの画素の値の調整、前景部抽出画像２００に含まれる画像のイメージの削除等である。ユーザ操作判定部８０は、パソコン９０に入力された指示を信号に変換し、画像調整部７０に送信する。画像調整部７０は、ユーザ操作判定部８０からの編集を指示する信号を、高圧縮ファイル作成の主処理部１に入力されたカラー画像１００に適用した画像である、前景部調整画像２１０を生成し、合成表示部６０に送信する。
（文字のレイヤの編集部２の処理の終了）
ユーザ操作判定部８０が、文字のレイヤの編集処理の終了の指示を受け取るまで、合成表示部６０、パソコン９０、ユーザ操作判定部８０、及び、画像調整部７０が処理を繰り返す。

ユーザ操作判定部８０が、終了の指示を受け取ると、その時点で最後に生成された前景部調整画像２１０が、高圧縮ファイル作成の主処理部１に送信され、前景画像抜き出し部３０が、前景部指定画像２００に代えて、前記前景部調整画像２１０をマスク画像として、カラー画像１００から、前景部抽出画像４００と前景部消去画像３００とを生成する。
（文字のレイヤを編集する処理の流れ）
次に、高圧縮データ作成の処理のフローについて、図２及び図３を用いて説明する。

図２は、前景部指定画像２００を編集する処理のフローであり、図３は、前景部抽出画像４００を編集する処理のフローである。

図２において、入力されたカラー画像１００は、前景部と背景部とに分離された後、それぞれのイメージの特性に応じた圧縮方式によって圧縮され、各圧縮されたデータが一のファイルとして格納された高圧縮画像ファイルが生成される。

ステップＳ１０００では、２値化処理部１０が、入力されたカラー画像１００の２値化の処理を行う。ステップＳ２０００では、領域識別部２０が、文字のイメージの特徴である矩形の分布等から、前景部を抽出し、前景部指定画像２００を生成する。

前景部指定画像２００は、ステップＳ６１００からＳ６４００の処理によって編集され、前景部調整画像２１０が生成される。

ステップＳ３０００では、前景画像抜き出し部３０が、前景部調整画像２１０をマスク画像として、元画像であるカラー画像１００から、前景部抽出画像４００を生成するとともに、元画像であるカラー画像１００から、前景部抽出画像４００を抜き出した残りの画像に対し、抜き出した部分を所定の値の画素で置き換えた、前景部消去背景画像３００を生成する。ここで、所定の値の画素とは、例えば、背景画像で多用されている画素や、予め定められている背景色の値の画素である。

ステップＳ４０００では、前景色分離部４０が、前景部抽出画像４００のイメージを、前景部抽出画像を構成するイメージの形状である前景部表現画像５００、及び、前記前景部抽出画像を構成するイメージの色を表す前景色画像５１０とに分離する。

ステップＳ５０００では、高圧縮ファイル作成部５０が、前景部消去背景画像３００、前景部表現画像５００、及び、前景色画像５１０を、それぞれ適した圧縮方法で圧縮し、さらに、圧縮されたそれぞれのデータを、それらを表示する際に重ね合わせる情報と共に、一のファイルに格納した高圧縮画像ファイル６００を生成する。

次に、ステップＳ６１００からＳ６４００の処理について説明する。ステップＳ６１００からＳ６４００は、前景部指定画像２００から、前景部調整画像２１０を生成するステップＳである。

ステップＳ６１００では、合成表示部６０が、前景部を表す２値画像である前景部指定画像２００を画面表示する信号を生成し、パソコン９０に送信する。ここで、ステップＳ６１００が第一回目に実行される場合には、前景部指定画像２００が用いられ、ステップＳ６１００が二回目以降に実行される場合には、前景部調整画像２１０が用いられる。なお、各ステップの実行回数は、カラー画像１００が入力される毎に初期値である０となる。

ステップＳ６２００では、ユーザが、パソコン９０を操作し、表示された結果に対して、可否を入力する。表示されている結果が良好である場合は、表示されている画像を前景部調整画像２１０として、ステップＳ３０００へ進む。表示されている結果が良好ではない場合は、ステップＳ６３００へ進む。

ステップＳ６３００では、ユーザ操作判定部８０が、パソコン９０に入力されたユーザの指示を判定し、再処理を行う領域、２値化の閾値、又は、指定された領域の削除等の信号を生成する。

ステップＳ６４００では、画像調整部７０が、ユーザ操作判定部８０の送信する信号に基づき、入力されたカラー画像１００に対して処理を行い、前景部調整画像２１０を生成し、ステップＳ６１００に進む。

ステップＳ６４００に続くステップＳ６１００では、前景部指定画像２００に代えて、前景部調整画像２１０を表示する信号を生成し、パソコン９０に送信する。

ステップＳ６２００において、表示結果が良好であると判断されるまで、ステップＳ６１００からＳ６４００を繰り返す。

図３において、ステップＳ１０００、ステップＳ２０００、ステップＳ４０００、及び、ステップＳ５０００の処理は図２と同一である。

ステップＳ３１００では、前景部抜き出し部３０が、入力されたカラー画像１００から、前景部指定画像２００又は前景部調整画像２１０に基づき、前景画像相当部分を抜き出し、前景部調整画像４００を生成する。前景部指定画像２００は、ステップＳ３１００が第一回目に実行される場合に用いられ、前景部調整画像２１０は、ステップＳ３１００が二回目以降に実行される場合に用いられる。なお、各ステップの実行回数は、カラー画像１００が入力される毎に初期値である０となる。

前景部抽出画像４００は、ステップＳ６１１０からＳ６４１０及びステップＳ３１００の処理を繰り返すことにより編集され、所望の画像となる。

ステップＳ３２００では、前景画像抜き出し部３０が、前景部抽出画像４００に基づき、入力カラー画像１０から前景部画像を抜き出した残りの画像イメージに対し、前景部として抜き出された領域の画素の値を、該領域の周辺の画素の値、又は、周辺の画素の代表の値で置き換え、前景部消去背景画像３００を生成する。

次に、ステップＳ６１１０からＳ６４１０の処理について説明する。ステップＳ６１１０からＳ６４１０は、前景部指定画像２００、又は、前景部調整画像２１０から、前景部抽出画像４００を生成するステップである。

ステップＳ６１１０では、合成表示部６０が、ステップＳ３１００で生成した前景部のカラー画像である前景部抽出画像４００を表示する信号を生成し、パソコン９０に送信する。

ステップＳ６２１０では、ユーザが、パソコン９０を操作し、表示された結果に対して、可否を入力する。表示されている結果が良好である場合は、表示されている画像を前景部抽出画像４００として、ステップＳ３２００へ進む。表示されている結果が良好ではない場合は、ステップＳ６３１０へ進む。

ステップＳ６３１０では、ユーザ操作判定部８０が、パソコン９０に入力されたユーザの指示を判定し、再処理を行う領域、２値化の閾値、又は、指定された領域の削除等の信号を生成する。

ステップＳ６４１０では、画像調整部７０が、ユーザ判定部８０の送信する信号に基づき、入力されたカラー画像１００に対して処理を行う。ここで、２値化の処理を再度行うことが指定されている場合には、前景部調整画像２１０を生成し、その他の処理が指定されている場合には、それらの処理の内容を、元画像から前景部を抜き出す際の指示として、ステップＳ３１００に送信する。

ステップＳ６２１０において、表示結果が良好であると判断されるまで、ステップＳ６１１０からＳ６４１０、及び、ステップＳ３１００を繰り返す。
（前景部調整画像２１０の編集処理の状態遷移）
図４は、図１から図３におけるパソコン９０が表示するイメージの遷移図であって、前景部指定画像２００を編集することにより、前景部調整画像２１０が生成する状態の遷移図である。ＳＴ１００は、入力されたカラー画像１００から生成された前景部指定画像２００の表示の状態であり、ＳＴ２００は、前景部調整画像２１０を生成する途中の表示の状態、ＳＴ３００は、前景部調整画像２１０が確定した状態である。

状態ＳＴ１００は、編集パラメータを設定する領域ＳＴ１１０、カラー画像１００の全体を表示する領域ＳＴ１２０、及び、編集する前景部指定画像２００を表示する領域ＳＴ１３０とから構成される。

ＳＴ１３０に表示される前景部指定画像２００の領域は、ＳＴ１２０において、矩形の枠ＳＴ１２１で選択することにより定められる。ここで、前景部指定画像２００は、モノクロ画像であるため、ＳＴ１３０には、白黒２値のイメージが表示される。

ＳＴ１１０は、ＳＴ１３０に表示された前景部指定画像２００の領域を編集するパラメータ等を入力する領域である。ここでは、２値化の閾値を、「濃度」「エッジ強調」等のパラメータを入力することにより設定する他、複数の２値化の方法の中から、一の２値化の方法を選択する。

また、カラー画像１００を複数の領域に分けた場合には、それらの領域をまとめて一のファイルに格納するか否かを「フィールド合成保存」のチェックボックスにより設定する。さらに、前景部指定画像２００、又は、前景部調整画像２１０の編集が終了した場合には「保存」の指示を入力する。

ＳＴ１３０に表示されている領域の中に、２値化によって文字の周囲に意図されない黒画素が存在し、文字がつぶれて読めなくなる領域が含まれている場合には、ＳＴ１１０において、２値化の閾値を上げることにより、文字の周囲の黒画素が減少し、文字の形状が正しく表示される。

状態ＳＴ２００では、ＳＴ１３０に表示された領域の２値化の閾値を高くした場合の前景部調整画像２１０を表示している。２値化の閾値を高くしたことにより、ＳＴ２３１の領域については、文字の形状が正しく表示されるようになったが、ＳＴ２３２の領域については、却って文字のイメージがかすれた表示になり、判読が難しくなっている。

そこで、ＳＴ２３２の部分を、独立した領域として処理を行うことにより、文字の形状が正しく表示されるようにする。状態ＳＴ３００では、ＳＴ１１０から、２値化の方式の変更と、２値化の閾値の変更を行うことにより、文字の形状がはっきりと表示されるようになっている（ＳＴ３３１）。また、ＳＴ３３２の領域は、状態ＳＴ２００では写真が含まれていたため、この領域を白画素で置き換えている。

カラー画像１００の全領域について、前景部調整画像２１０が完成されるまで、上記の操作を行い、最後に、ＳＴ１１０の領域にある「保存」ボタンをクリックすることにより、前景部調整画像２１０に基づく処理が、カラー画像１００に対して行われ、高圧縮画像ファイル６００が生成される。

図４は、前景部調整画像２１０の作成に関する説明であるが、前景部抽出画像４００を作成する場合にも、状態ＳＴ１００からＳＴ３００と同様に処理が行われる。この場合、ＳＴ１３０の領域には、カラー画像である前景部調整画像４００が表示される。
（文字／非文字領域の指定の説明）
図５は、前景部指定画像２００を作成する際に、予め、主に文字のイメージからなる文字領域と、主に非文字のイメージからなる非文字領域とを指定する場合の表示の状態の遷移図である。

状態ＳＴ４００は、入力されたカラー画像１００を読み込んだ初期状態であり、状態ＳＴ５００は、カラー画像１００から非文字領域を指定した状態である。

状態ＳＴ４００において、ＳＴ４１０は、カラー画像１００の全体を表示する領域であり、ＳＴ４２０に表示される領域は、ＳＴ４１０において、矩形の枠で選択することにより定められる。ここでは、カラー画像１００の全体が選択されている。カラー画像１００は、文字のイメージと写真のイメージとが混在している。そこで、主として写真のイメージのからなる領域を選択することにより、前景部抽出画像４００と、前景部消去背景画像３００とに分離する。

状態ＳＴ５００では、主として写真のイメージからなる領域ＳＴ５２１とＳＴ５２２とが選択されている。

（ＭＲＣを編集する処理の説明）
図６は、ＭＲＣを編集する処理の流れである。図６では、図１における文字のレイヤの編集部２に代えて、ＭＲＣの編集部３が、高圧縮ファイル作成の主処理部１に接続されている。ＭＲＣの編集部３が、高圧縮ファイル作成の主処理部１より各レイヤのデータを受信し、表示し、前記各レイヤの画像を生成する中間画像が編集されることにより、高圧縮画像ファイル６００が生成される。

ＭＲＣの編集部３は、合成表示部６０、ユーザ操作判定部８０、調整領域判定部７１、画像調整編集部７２、及び、表示機能を有するパソコン９０とから構成され、表示機能を有するパソコン９０には、さらに、キーボード９１及びマウス９２が接続されている。

ＭＲＣの編集部３には、前景部消去背景画像３００、前景部表現画像５００、及び、前景色画像５１０が、高圧縮ファイル作成の主処理部１より入力される。合成表示部６０は、入力された画像のイメージを合成したデータを、合成したイメージを表示する指示と共に、パソコン９０に送信する。パソコン９０は、入力されたイメージを表示し、接続されたキーボード及びマウスによって、ユーザが編集の指示を行う。編集の指示は、例えば、編集する領域の選択、及び、選択された領域の色の値の変更等である。ユーザ操作判定部８０は、パソコン９０に入力された指示を信号に変換し、調整領域判定部７１に送信する。調整領域判定部７１は、ユーザ操作判定部８０からの編集を指示する信号に基づき、編集を行う中間画像とその中間画像内の領域を選択すると共に、ユーザ操作判定部８０から受信した編集内容の信号を、画像調整編集部７２へ送信する。画像調整編集部７２は、調整領域判定部７１から受信した信号に基づき、カラー画像１００、前景部指定画像２００、前景部消去背景画像３００、及び、前景部抽出画像４００を編集する。

ユーザ操作判定部８０が、ＭＲＣの編集処理の終了の指示を受け取るまで、合成表示部６０、パソコン９０、ユーザ操作判定部８０、調整領域判定部７１、及び、画像調整編集部７２が処理を繰り返す。
（ＭＲＣを編集する処理の流れ）
図７は、ＭＲＣを編集する処理のフローである。

図７において、入力されたカラー画像１００は、前景部と背景部に分離された後、それぞれのイメージの特性に応じた圧縮方式によって圧縮され、各圧縮されたデータが一のファイルとして格納された高圧縮画像ファイルが生成される。ステップＳ１０００、及び、Ｓ２０００の動作は、図２と同一である。

ステップＳ３１００では、前景画像抜き出し部３０が、前景部指定画像２００をマスク画像として、元画像であるカラー画像１００から、前景部抽出画像４００を生成する。ステップＳ３２００では、ステップＳ３１００で前景部抽出画像４００をぬきだした残りの画像に対し、抜き出した部分を所定の値の画素で置き換えた、前景部消去背景画像３００を生成する。ここで、所定の画素の値とは、例えば、抜き出された前景部の周辺の領域の背景部の画素の値である。

次に、ステップＳ７１００からＳ７６００の処理について説明する。ステップＳ７１００からＳ７６００は、ステップＳ５０００の直前までに生成された各レイヤの画像を表示することにより、再処理を行うレイヤとそのレイヤ内の領域を選択し、再度、中間画像を生成する処理である。

ステップＳ７１００では、合成表示部６０が、ＭＲＣを構成する各レイヤのイメージである、前景部消去背景画像３００、前景部表現画像５００、及び、前景色画像５１０を重ね合わせて表示する信号を生成し、パソコン９０に送信する。

ステップＳ７２００では、ユーザが、パソコン９０を操作し、表示された結果に対して、可否を入力する。表示されている結果が良好である場合は、ステップＳ５０００へ進む。表示されている結果が良好ではない場合は、ステップＳ７３００へ進む。ステップＳ７３００では、ユーザが、パソコン９０を操作することにより、編集を行う領域と、編集の内容、及び、編集に関するパラメータ等を入力する。

ステップＳ７４００では、調整領域判定部７１が、パソコン９０に入力された内容から、再処理を行う中間画像及び該中間画像内の領域を判定し、編集内容の信号とともに、ステップＳ７５００へ送る。ステップＳ７５００では、画像調整編集部７２が、ステップＳ７４００で判定された中間画像及び該中間画像内の領域に対し、パソコン９０に入力された編集の処理を行う。

ステップＳ７６００では、ステップＳ７５００によって再度編集がなされた中間画像を用いて、ＭＲＣを生成する。

ステップＳ７２００において、表示されている結果が良好であると判断されるまで、ステップＳ７１００からＳ７６００の処理を繰り返す。

図８は、図６及び図７におけるパソコン９０が表示するイメージの遷移図であって、高圧縮ファイル作成の主処理部１で生成された各レイヤの画像をＭＲＣとして合成して表示した結果から、再度、各レイヤの画像を生成する処理を行う場合の表示である。状態ＳＴ６００は、ＭＲＣとして合成して表示した状態であり、状態ＳＴ７００は、再度、各レイヤの画像を生成した後の表示の状態である。

状態ＳＴ６００は、ＭＲＣの全体のイメージを表示する領域ＳＴ６１０、ＳＴ６１０から矩形によって選択されたＭＲＣのイメージの領域である、領域ＳＴ６２０とから構成される。

領域ＳＴ６２０は、主として画像のイメージからなる領域であり、文字のイメージの領域ＳＴ６２１からＳＴ６２３を有する。ここでは、文字のイメージの領域ＳＴ６２１からＳＴ６２３は、かすれたようになっており、判読が困難になっている。

そこで、領域ＳＴ６２１からＳＴ６２３を選択し、これらの領域の２値化の閾値を低くするように指示する。領域ＳＴ６２１からＳＴ６２３を生成する２値化の処理は、ステップＳ２０００における前景部指定画像２００を生成する処理である。そこで、カラー画像１００に対し、２値化の閾値を低めて２値化処理を行う。

状態ＳＴ７００は、上記の処理によって得られたＭＲＣのイメージの表示である。ＳＴ６２１からＳＴ６２３が、ＳＴ７２１からＳＴ７２３にそれぞれ状態が遷移しているが、その他の領域については、ＳＴ７００とＳＴ６００とは同一のイメージである。
（選択する領域の説明）
図９は、領域を選択する説明の図である。

ＳＴ８００は、パソコン９０に表示されているイメージの一例であり、領域の選択に関する設定等を行う領域ＳＴ８１０、カラー画像１００の全体のイメージを表示する領域８２０、及び、カラー画像１００のうち、選択された領域を表示する領域ＳＴ８３０とから構成されている。

ＳＴ８３０は、例えば、領域識別部２０等で分割された複数の領域ＳＴ８３１からＳＴ８３５を有する。ＳＴ８３１からＳＴ８３３は、主として文字のイメージからなる文字領域であり、ＳＴ８３４からＳＴ８３６は、主として画像のイメージからなる非文字領域である。

編集する領域を選択する場合には、ＳＴ８３１からＳＴ８３６の領域のうち、一の領域の内部にマウスポインタを移動し、クリックすることにより、クリックされた点を含む領域が選択される。

ＳＴ８１０には、「領域レベル」を設定するスイッチが設けられている。領域レベルとは、選択する領域の最小単位を現すものであり、例えば、「１文字」「１行」「１の文字領域」又は「同色の背景領域」などが、所定の数字によって表される。例えば、選択する領域の最小単位が「１文字」の場合には、クリックされた点の文字のみが選択される。
（選択領域、処理領域、及び、表示の更新の関連の説明）
図９において、ＳＴ８３１、ＳＴ８３２、及び、ＳＴ８３６は、領域ＳＴ８３０内に収まっているが、ＳＴ８３３、ＳＴ８３４、及び、ＳＴ８３５は、領域の一部が、領域ＳＴ８３０の外に存在している。

そこで、ＳＴ８３１、ＳＴ８３２、又は、ＳＴ８３６が選択され、所定の処理を実行する場合には、ＳＴ８３０の中で、当該領域の表示を更新する。

一方、ＳＴ８３３、ＳＴ８３４、又は、ＳＴ８３５が選択され、所定の処理を実行する場合には、当該領域のうち、ＳＴ８３３内に含まれる領域の表示が更新され、ＳＴ８３３の外に存在する領域については、表示を更新しない未更新領域とし、領域の範囲の情報、及び、処理の内容を対応づけて保持する。

ＳＴ８２１の位置又は大きさを変更することにより、ＳＴ８３０に表示されるイメージが変更される場合に、新たに表示される領域の中で、未更新領域があるときには、当該未更新領域に対し、対応づけられている所定の処理を実行し、表示を更新する。

処理を全て終了する際には、ＳＴ８１０等に設けられている入力装置から終了の指示が入力さる。このとき、全ての未更新領域に対して、対応付けられている処理が実行される。

（ＯＣＲの処理の説明）
図１０は、入力されたカラー画像１００から、テキストデータ９００を生成するＯＣＲ処理のブロック図である。ＯＣＲ処理は、ＯＣＲの主処理部４及びＯＣＲデータの作成部５によって実行される。

ＯＣＲの主処理部４は、入力されたカラー画像を２値化し、用紙方向の補正、及び、スキュー補正を行うことにより、テキストデータ９００を生成するＯＣＲ処理の主たる部分であり、２値化処理部１０、用紙方向判定部３１、スキュー補正処理部３２、及び、ＯＣＲ処理部５１から構成されている。

２値化処理部１０は、入力されたカラー画像１００を所定の閾値で２値化し、２値画像２００を生成する。用紙方向判別処理部３１は、２値化画像２００のイメージから、文字のイメージが紙面に形成されている方向を判別する。ここで判別される方向は、例えば、９０度毎の方向であり、詳細な方向は、スキュー補正部３２によって定められる。スキュー補正部３２は、用紙方向判別処理部３１が、文字のイメージの形成されている方向を判別した後に、詳細なずれの角度を検出し、イメージの上下左右方向の角度を確定し、用紙方向及びスキュー補正後２値画像７００を生成する。用紙方向判別処理部３１及びスキュー補正処理部３２は、２値画像２００から得られた、用紙方向及びスキュー補正の値を、カラー画像１００に適用し、用紙方向及びスキュー補正後カラー画像８００を生成する。

ＯＣＲデータの作成部５は、ＯＣＲの主処理部１で生成されたテキストデータ９００等を表示し、テキストデータ９００等のイメージから編集する領域を選択し、選択されたイメージの領域に対応する画像の領域に対し、編集を行うことにより、ＯＣＲの精度の良いテキストデータ９００を得る処理を行い、ユーザ操作判定部８０、対象部分切り出し部７３、対象部分２値化調整部７４、データ合成制御部６１、及び、表示処理部６２とから構成される。

データ合成制御部６１は、用紙方向及びスキュー補正後２値画像を表示する信号を生成し、表示処理部６２へ送信する。表示処理部６２は、入力された画像のデータと表示の信号とを、表示機能を有するパソコン９０に送信する。

ユーザ操作判定部８０は、パソコン９０に入力された指示を元に、用紙方向及びスキュー補正後カラー画像８００の中で、編集を行う領域を判定し、該領域の信号を編集の内容の信号とともに、対象部分切り出し部７３へ信号を送信する。

対象部分切り出し部７３は、ユーザ操作判定部８０より受信した編集を行う領域の信号に基づき、用紙方向及びスキュー補正後カラー画像８００から、編集の対象となる領域を切り出し、編集の内容とともに、対象部分２値化調整部７４へ送信する。対象部分２値化調整部７４は、入力された画像のイメージのデータに対し、入力された編集の内容に基づく２値化の処理を行い、対象部分濃度調整後２値画像７１０を生成する。対象部分濃度調整後２値画像７１０は、ＯＣＲ処理部５１に送信され、ＯＣＲの処理が行われた、対象部分のみテキストデータ９１０が生成される。

データ合成制御部６１は、対象部分濃度調整後２値画像７１０及び対象部分のみテキストデータ９１０を同時に表示するイメージを生成し、表示処理部６２に送信する。
（文字のイメージを検出する方法）
ところで、任意の領域から、文字のイメージを検出するには、処理する領域の中で、主に文字のイメージからなる文字領域と、主に非文字のイメージからなる非文字領域とに分けた後、更に、それらの領域から文字のイメージを抽出する。任意の領域が、文字領域であるか、非文字領域であるかは、カラー画像の色分布状態、又は、カラー画像を２値化した２値画像の画素の分布状態から判定する。

例えば、２値画像の画素の分布状態から文字の領域を判定する場合には、次のような手順で行う。まず、同色の画素のクラスタを検出し、外接する矩形内に存在する複数のクラスタの集合体を得る。この集合体を一の文字のイメージとみなす。次に、複数の集合体が縦又は横方向に連続して出現するか否かを検出する。例えば、３つの集合体が連続して出現する場合には、３文字のイメージがあるとみなし、文字列の領域と判定する。

また、他のクラスタの集合体に比して、非常に大きな面積を有するクラスタは、文字のイメージではないと判断する。また、非常に小さなクラスタはノイズとして除去することもある。

上記の文字のイメージの検出の処理の中で、有効なクラスタであることを判断する閾値、有効な集合体であることを判断する閾値、及び、有効な文字列の領域であることを判断する閾値等、文字のイメージを検出する際の様々な閾値を変化させることにより、文字のイメージを検出する精度を変えることができる。

そこで、文字領域においては、文字のイメージを検出する際の閾値を小さくし、非文字領域においては、文字のイメージを検出する際の閾値を、文字領域より大きくすることにより、文字及び非文字のイメージのそれぞれについて、誤検出を減らすことができる。
（ＯＣＲの処理の流れ）
図１１は、ＯＣＲの処理のフローである。

図１１において、入力されたカラー画像１００は、２値化及びスキュー補正等の処理を行われた後、ＯＣＲ処理によってテキストデータが出力される。

ステップＳ１０００は、２値化処理部１０が、カラー画像１００に対して２値化の処理を行うステップであり、ステップＳ３１１０では、２値化された画像に対して、用紙方向判別処理部３１、及び、スキュー補正処理部３２が、それぞれ、イメージが形成された用紙の方向及び詳細な角度を求めて補正を行った、用紙方向及びスキュー補正２値画像７００を生成する。

ステップＳ３１２０では、用紙方向判別処理部３１、及び、スキュー補正処理部３２が、ステップＳ３１１０で求められたイメージが形成された用紙の方向及び詳細な角度を用いて、カラー画像１００に対して補正を行い、用紙方向及びスキュー補正カラー画像８００を生成する。

ステップＳ５１００では、ＯＣＲ処理部５１が、ステップＳ３１１０で補正された２値画像に対し、ＯＣＲ処理を行い、テキストデータ９００を生成する。

ステップＳ８１００では、ステップＳ５１００で生成されたテキストデータ９００と、ステップ３１１０で生成された用紙方向及びスキュー補正２値画像７００とをパソコン９０に表示する。

ステップＳ８２００では、ユーザが、パソコン９０に表示されたイメージの可否を入力する。パソコン９０に表示されたイメージ又はＯＣＲ結果が良好な場合には、ステップＳ８７００に進み、パソコン９０に表示されたイメージが不可の場合には、ステップＳ８３００に進む。

ステップＳ８３００では、ユーザ操作判定部８０が、パソコンに入力された内容から、用紙方向及びスキュー補正カラー画像８００における編集の対象となる領域と、編集の内容とを判定し、ステップＳ８４００へ進む。

ステップＳ８４００では、対象部分切り出し部７３が、ステップＳ８３００で判定された内容に基づき、用紙方向及びスキュー補正カラー画像８００のデータから、対象となる部分を切り出す。ステップＳ８５００では、対象部分２値化調整部７４が、ステップＳ８４００で切り出された画像のデータに対し、ステップＳ８３００で判定された編集の内容を実行し、濃度調整後２値画像７１０を生成する。編集の内容は、例えば、対象となる領域全体の画素の値を変更して明るさを調整する、対象となる領域を、ステップＳ１０００とは異なるステップＳ８３００で判定された閾値で２値化する、等である。

ステップＳ８６００では、データ合成制御部６１が、ＯＣＲの処理を実行する２値画像を生成する。ＯＣＲの処理を実行する２値画像は、濃度調整後２値画像７１０、又は、用紙方向及びスキュー補正２値画像７００について、ステップＳ８３００で判定された領域を濃度調整後２値画像７１０で置き換えた画像である。

ステップＳ８２００において、表示結果が良好と判定されるまで、ステップＳ８１０からステップＳ８６００、及び、ステップＳ５１００の処理を繰り返す。

ステップＳ８７００では、ＯＣＲ処理を行った結果のテキストデータを出力し、処理を終了する。

図１２は、本発明の画像処理プログラムを実行するコンピュータの構成図である。コンピュータの主処理部６が、キーボード９１、表示装置９３等の入出力装置、及び、ハードディスクドライブ６０１等に接続されており、さらに、スキャナ１０１、及び、プリンタ６０２等の画像イメージの入出力機器に接続されている。

コンピュータの主処理部６は、ＣＰＵ７、ＲＯＭ８、及び、ＲＡＭ９から構成されており、ＣＰＵ７が、ＲＯＭ８に格納されたプログラムを実行することにより、本発明の画像処理を実現する。ＲＡＭ９は、ＣＰＵ７がプログラムを実行する際の一時データを格納するメモリである。ＲＡＭ９は、前景部指定画像２００等の中間イメージデータを格納してもよい。

キーボード９１、及び、マウス９２は、処理する領域等を入力する装置であり、表示装置９３は、本発明の画像処理方法における各処理ステップで表示されるイメージを表示する装置である。

ハードディスクドライブ６０１は、大容量のデータを格納する装置であり、高圧縮画像ファイル６００、テキストデータ９００を格納する他に、入力されるカラー画像１００、及び、前景部指定画像２００等の中間イメージデータを格納してもよい。

スキャナ１０１は、媒体に形成された画像を読み込み、カラー画像１００のイメージデータを生成する装置であり、プリンタ６０２は、各種イメージを紙面に形成して出力する装置である。

なお、コンピュータの主処理部６は、コンピュータ９０の主処理部と同一になるように構成されてもよい。

以上、発明を実施するための最良の形態について説明を行ったが、本発明は、この最良の形態で述べた実施の形態に限定されるものではない。本発明の主旨をそこなわない範囲で変更することが可能である。

文字のレイヤを編集する機能を有する画像処理装置。前景部指定画像を編集する処理のフロー。前景部抽出画像を編集する処理のフロー。前景部指定画像を編集する際の表示の遷移。文字領域又は非文字領域を選択する際の表示の遷移。ＭＲＣを編集する機能を有する画像処理装置。ＭＲＣを編集する処理のフロー。ＭＲＣを編集する際の表示の遷移。ＭＲＣから領域を選択する場合の表示。ＯＣＲ処理の機能を有する画像処理装置。ＯＣＲ処理のフロー。本発明の画像処理プログラムを実行するコンピュータの構成図。

符号の説明

１高圧縮ファイル作成の主処理部
２文字のレイヤの編集部
３ＭＲＣの編集部
４ＯＣＲの主処理部
５ＯＣＲデータの作成部
６コンピュータの主処理部
７ＣＰＵ
８ＲＯＭ
９ＲＡＭ
６０合成表示部
６１データ合成制御部
６２表示処理部
７０画像調整部
７１調整領域判定部
７２画像調整編集部
７３対象部分切り出し部
７４対象部分２値化調整部
８０ユーザ操作判定部
９０表示機能を有するパソコン

Claims

画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、
前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段と、
前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段とを有し、
前記表示手段は、前記確定前の画像が更新される毎に、表示を更新することを特徴とする画像処理装置。
前記表示手段は、
前記画像の初期状態のイメージを表示する初期画像の表示領域と、
前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、
前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択手段と、
前記確定前の画像の表示領域から、前記文字レイヤの編集手段が編集する編集領域を選択する編集領域の選択手段と
を有することを特徴とする請求項１記載の画像処理装置。
前記文字レイヤの編集手段は、２値化処理、又は、非文字のイメージの削除を行い、
前記２値化処理における２値化の閾値、前記２値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、２値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力手段を有することを特徴とする請求項２記載の画像処理装置。
前記文字レイヤの編集手段は、２値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、ＯＣＲ処理を行うことを特徴とする請求項１ないし３記載の画像処理装置。
前記編集領域の選択手段によって選択された編集領域が編集される場合に、
前記表示手段は、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、
表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、
編集の確定が入力された際に、編集されながらも更新されていない領域を更新することを特徴とする請求項２ないし４記載の画像処理装置。
画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理装置において、
前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、
前記表示手段に表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択手段と、
前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出手段と、
を有することを特徴とする画像処理装置。
前記文字の検出手段は、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、
前記文字の検出手段が文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいことを特徴とする請求項６記載の画像処理装置。
前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集手段を有し、
該文字レイヤの編集手段は、前記文字の検出手段が検出した結果に基づき、用紙方向の補正、スキュー補正、及び／又は、ＯＣＲ処理を行うことを特徴とする請求項６又は７記載の画像処理装置。
前記文字レイヤの編集手段がＯＣＲ処理を行う場合に、前記表示手段は、ＯＣＲ処理の結果に対応するテキストデータを表示することを特徴とする請求項８記載の画像処理装置。
前記文字・非文字領域の選択手段によって選択された文字領域又は非文字領域が処理によって変更される場合に、
前記表示手段は、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、
表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、
編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新することを特徴とする請求項６ないし９記載の画像処理装置。
画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理装置において、
前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び／又は、確定前の前記複数のレイヤ毎のイメージを表示する表示手段と、
該表示手段が表示する領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び、ＯＣＲ処理のうち、一の処理を行う処理領域を選択する処理領域の選択手段と、
前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択手段と、
を有することを特徴とする画像処理装置。
前記表示手段は、
前記画像の初期状態のイメージを表示する初期画像の表示領域と、
前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とを有し、
前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、
前記処理領域の選択手段は、前記確定前の画像の表示領域から、処理を行う処理領域を選択することを特徴とする請求項１１記載の画像処理装置。
前記処理領域の選択手段によって選択された処理領域が編集される場合に、
前記表示手段は、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、
表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、
編集の確定が入力された際に、処理されながらも更新されていない領域を更新することを特徴とする請求項１２記載の画像処理装置。
前記処理領域の選択手段は、前記複数の領域のうちの一つの領域を選択することを特徴とする請求項１１ないし１３記載の画像処理装置。
処理領域の最低単位を選択する、処理領域の単位の選択手段を有し、
前記処理領域の選択手段は、前記処理領域の最低単位を選択することを特徴とする請求項１１ないし１４記載の画像処理装置。
画像のデータを、複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、
前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップと、
前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップとを有し、
前記表示ステップは、前記確定前の画像が更新される毎に、表示を更新することを特徴とする画像処理方法。
前記表示ステップは、
前記画像の初期状態のイメージを表示する初期画像の表示領域と、
前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、
前記確定前の画像の表示領域に表示するイメージを、前記初期画像の表示領域から選択する表示領域の選択ステップと、
前記確定前の画像の表示領域から、前記文字レイヤの編集ステップが編集する編集領域を選択する編集領域の選択ステップと
を有することを特徴とする請求項１６記載の画像処理方法。
前記文字レイヤの編集ステップは、２値化処理、又は、非文字のイメージの削除を行い、
前記２値化処理における２値化の閾値、前記２値化処理の際に行う輪郭強調の有無、及び、削除する前記非文字のイメージの領域からなる、２値化のパラメータのうちの少なくとも一つを入力する、パラメータ入力ステップを有することを特徴とする請求項１７記載の画像処理方法。
前記文字レイヤの編集ステップは、２値化された文字のイメージに基づき、用紙方向の補正、スキュー補正、又は、ＯＣＲ処理を行うことを特徴とする請求項１６ないし１８記載の画像処理方法。
前記編集領域の選択ステップによって選択された編集領域が編集される場合に、
前記表示ステップは、表示しているイメージの領域、又は、編集された領域の何れか小さい領域を更新し、
表示領域が変更されたときに、新たに表示された領域の中で編集された領域の表示を更新し、
編集の確定が入力された際に、編集されながらも更新されていない領域を更新することを特徴とする請求項１７ないし１９記載の画像処理方法。
画像のデータを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、前記画像のデータを一のファイルとして保存する画像処理方法において、
前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、
前記表示ステップにおいて表示されたイメージから、主として文字のイメージからなる文字領域、又は、主として非文字のイメージからなる非文字領域を選択する文字・非文字領域の選択ステップと、
前記文字領域、及び、前記非文字領域から文字のイメージを検出する文字の検出ステップと、
を有することを特徴とする画像処理方法。
前記文字の検出ステップは、所定の色の輪郭及び前記所定の色の画素の連続の有無を検出することにより文字のイメージを検出し、
前記文字の検出ステップが文字の検出を行う場合に、前記文字領域における文字の検出の閾値は、前記非文字領域における文字の検出の閾値よりも小さいことを特徴とする請求項２１記載の画像処理方法。
前記複数のレイヤの一つである文字のレイヤを編集する文字レイヤの編集ステップを有し、
該文字レイヤの編集ステップは、前記文字の検出ステップが検出した結果に基づき、用紙方向の補正、スキュー補正、及び／又は、ＯＣＲ処理を行うことを特徴とする請求項２１又は２２記載の画像処理方法。
前記文字レイヤの編集ステップにおいてＯＣＲ処理を行う場合に、前記表示ステップは、ＯＣＲ処理の結果に対応するテキストデータを表示することを特徴とする請求項２３記載の画像処理方法。
前記文字・非文字領域の選択ステップによって選択された文字領域又は非文字領域が処理によって変更される場合に、
前記表示ステップは、表示しているイメージの領域、又は、変更された文字領域若しくは非文字領域の何れか小さい領域を更新し、
表示領域が変更されたときに、新たに表示された領域の中で変更された領域の表示を更新し、
編集の確定が入力された際に、処理によって変更されながらも更新されていない領域を更新することを特徴とする請求項２１ないし２４記載の画像処理方法。
画像のイメージを、複数の領域に分割し、該複数の領域のそれぞれを複数のレイヤに分割し、前記レイヤ毎に異なる方式で圧縮した後、一のファイルとして格納された画像のイメージを表示する画像処理方法において、
前記画像の初期状態のイメージ、確定前の前記画像のイメージ、及び／又は、確定前の前記複数のレイヤ毎のイメージを表示する表示ステップと、
該表示ステップにおいて表示される領域から、複数の領域に分割、文字の抽出、画像イメージの圧縮、及び、ＯＣＲ処理のうち、一の処理を行う処理領域を選択する処理領域の選択ステップと、
前記処理領域に対して、行う処理の内容の候補を、複数表示し選択する処理内容の選択ステップと、
を有することを特徴とする画像処理方法。
前記表示ステップは、
前記画像の初期状態のイメージを表示する初期画像の表示領域と、
前記確定前の前記画像のイメージ、及び／又は、前記確定前の前記複数のレイヤ毎のイメージを表示する、確定前の画像の表示領域とに対して表示を行い、
前記確定前の画像の表示領域が表示するイメージは、前記初期画像の表示領域の一部を選択することにより定められ、
前記処理領域の選択ステップは、前記確定前の画像の表示領域から、前記処理を行う領域を選択することを特徴とする請求項２６記載の画像処理方法。
前記処理領域の選択ステップによって選択された処理領域が編集される場合に、
前記表示ステップは、表示しているイメージの領域、又は、処理された領域の何れか小さい領域を更新し、
表示領域が変更されたときに、新たに表示された領域の中で処理された領域の表示を更新し、
編集の確定が入力された際に、処理されながらも更新されていない領域を更新することを特徴とする請求項２７記載の画像処理方法。
前記処理領域の選択ステップは、前記複数の領域のうちの一つの領域を選択することを特徴とする請求項２６ないし２８記載の画像処理方法。
処理領域の最低単位を選択する、処理領域の単位の選択ステップを有し、
前記処理領域の選択ステップは、前記処理領域の最低単位を選択することを特徴とする請求項２６ないし２９記載の画像処理方法。
請求項１６から３０何れか一項記載の画像処理方法をコンピュータに実行させるためのプログラム。