JPH11167623A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法

Info

Publication number
JPH11167623A
JPH11167623A JP9333321A JP33332197A JPH11167623A JP H11167623 A JPH11167623 A JP H11167623A JP 9333321 A JP9333321 A JP 9333321A JP 33332197 A JP33332197 A JP 33332197A JP H11167623 A JPH11167623 A JP H11167623A
Authority
JP
Japan
Prior art keywords
character
image
compression
pixel data
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9333321A
Other languages
English (en)
Inventor
Tomotoshi Kanatsu
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9333321A priority Critical patent/JPH11167623A/ja
Priority to US09/203,511 priority patent/US6381368B1/en
Publication of JPH11167623A publication Critical patent/JPH11167623A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction

Abstract

(57)【要約】 【課題】 文字画像を表わす画素データを、外部装置で
再現するときに最低限必要なコンパクトなデータサイズ
で送信する画像処理装置及び画像処理方法の提供。 【解決手段】 所定の領域分割処理により得られた領域
が文字画像であるとき、予め定めた所定の圧縮率のうち
何れかの圧縮率で画像変換を施す(S505)。次に、画像変
換後に当該領域が画素データとして有するある情報量の
データに文字認識を行い、予め登録している文字種との
類似度(スコア)を算出する(S506)。算出したスコアが
所定のしきい値以下であれば、当該領域に含まれる文字
画像の再現に必要最小限の情報量を下回った状態である
ため、S505における圧縮率よりも1ランク小さい圧縮率
で当該文字画像の画像変換を行う(S507-S509)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、入力され
た画像データを外部装置に送信する画像処理装置及び画
像処理方法に関する。
【0002】
【従来の技術】従来より、例えば、イメージスキャナ等
により読み取った文書等の原稿(原画像)の画像データ
を、通信ネットワークを介して外部装置に送信すること
が一般に行われている。このような場合、通信ネットワ
ークのデータ伝送容量には制限が有るため、送信するデ
ータのサイズはできる限り小さいほうが望ましい。この
ため、近年では、受信側の装置においてある程度の受信
データのロスが発生することを予め許容して、送信側の
装置から画像データを送信するのに先立って送信すべき
画像データの解像度を低下させたり、或いは、圧縮効率
は高効率だが非可逆な画像圧縮処理を施したりする場合
がある。
【0003】しかしながら、そのような場合にあって
も、送信する画像データに文字領域の画像データが含ま
れる場合には、受信側の装置においてその画像が再現さ
れたときに、文字として解読可能な程度に送信する画像
データのロスを抑える必要がある。
【0004】また、送信すべきデータのサイズをできる
だけ小さくするという観点からは、理想的には、送信側
の装置において文字認識処理を行う際、原稿に含まれる
全ての文字を正確に認識することによってコード化する
ことが望ましい。しかしながら、現状では全ての認識対
象に対して人間と同等な認識性能で文字認識処理を行う
ことは困難である。従って、文字認識処理において生じ
た誤認識による情報欠損や誤情報の送信を防ぐために
は、文字部分をコード化前の画素(ピクセル)データと
して送信する必要性が生じる場合もある。
【0005】一方、文字以外の絵や図、写真等の部分を
表わす画像データについては、高精度な情報伝送が要求
されない場合や、逆に、絵や写真の領域の高精度な再現
性が特に要求されている場合には、文字領域には不適切
な画像圧縮手法を採用するほうが好ましい場合もある。
【0006】このような条件の元では、原稿上の画像を
文字領域と非文字領域とに分け、その領域毎に異なる方
法で画像圧縮を施すほうが、原稿の画像全体を単一の画
像圧縮手法で一様に圧縮するよりも、結果として、通信
ネットワーク上においてはコンパクトなデータサイズで
あり、且つ、受信側の装置においては良好な再現画像を
得ることができる画像データを生成することができる。
【0007】
【発明が解決しようとする課題】上述した観点からは、
通信ネットワークを介して送信しようとする文字領域の
画素データを、受信側の装置においてユーザが解読可能
な画像に構成する(再現する)ための必要最低限な情報
と考え、その必要最低限の情報以外は送信側の装置にお
いて削除されるような画像圧縮を施せば最も送信効率の
良いデータが生成できると言える。
【0008】しかしながら、上述した従来の画像処理装
置においては、以下のような問題がある。即ち、文字領
域に対して情報損失のない可逆な画像圧縮を行うため、
受信側の装置においては結果として無駄な情報までも送
信している場合がある。或いは、文字領域に対して情報
損失を伴なう解像度変換処理等の画像圧縮を施す場合に
おいては、その圧縮率が固定であるため、受信側の装置
においてユーザが解読可能な文字画像を再現するとき
に、小さなサイズの文字については必要な情報が欠落し
たり、逆に、大きなサイズの文字に対しては不必要な情
報を送信されている場合がある。
【0009】このような問題を避けるためには、原稿に
含まれる個々の文字領域に応じて圧縮率が異なる画像変
換を施す必要があるが、送信側の装置において文書領域
毎にユーザが圧縮率を判断して逐次変更することは、様
々な種類の文書や大量な文書を対象にする場合には現実
的でない。このため、文書の情報を高効率に送信するた
めには、受信側の装置においてユーザが解読可能な必要
最低限のデータを送信すればよいという考え方に基づい
て、原稿に含まれる個々の文字領域に対して最適な圧縮
率の画像変換処理を自動的に選択することが必要とされ
る。
【0010】そこで、本発明は、文字画像を表わす画素
データを、外部装置で再現するときに最低限必要なコン
パクトなデータサイズで送信する画像処理装置及び画像
処理方法の提供を目的とする。
【0011】
【課題を解決するための手段】上記の目的を達成するた
め、本発明の画像処理装置は以下の構成を備えることを
特徴とする。
【0012】即ち、文字画像ブロックの画素データに対
して、所定の複数の圧縮率のうち何れかの圧縮率でデー
タ圧縮する圧縮手段と、その圧縮手段により得られた画
素データに文字認識を行う文字認識手段と、その文字認
識手段による認識結果に基づいて、前記所定の複数の圧
縮率の中から何れかの圧縮率を選択する圧縮率選択手段
と、その圧縮率選択手段により選択された圧縮率で、前
記圧縮手段により前記文字画像ブロックの画素データを
データ圧縮して得られる画素データを、外部装置に送信
する送信手段と、を備えることを特徴とする。
【0013】また、例えば前記文字認識手段は、前記文
字画像ブロックの画素データが表わす特徴ベクトルと、
予め記憶している複数の文字種の特徴ベクトルとを比較
し、その比較により類似度が最も高い文字種を認識結果
として選択するとよい。
【0014】また、例えば前記圧縮率選択手段は、前記
文字認識手段による類似度を表わす値と所定のしきい値
とを比較した結果に応じて、前記所定の複数の圧縮率の
中から何れかの圧縮率を選択することを特徴とする。
【0015】また、例えば所定のしきい値は、前記送信
手段が送信した画素データに基づいて、前記外部装置に
て前記文字画像ブロックの画素データが表わす画像とし
て再現したときに、その画像を文字として解読可能な最
低限の状態を表わす値とするとよい。
【0016】また、例えば、前記文字画像ブロックが複
数存在するときに、前記圧縮率選択手段は、文字画像ブ
ロック毎に、前記所定の複数の圧縮率の中から何れかの
圧縮率を選択することを特徴とする。
【0017】上記の目的を達成するため、本発明の画像
処理方法は以下の構成を備えることを特徴とする。
【0018】即ち、文字画像ブロックの画素データに対
して、所定の複数の圧縮率のうち何れかの圧縮率でデー
タ圧縮する圧縮工程と、そのデータ圧縮により得られた
画素データに文字認識を行う文字認識工程と、その認識
結果に基づいて、前記所定の複数の圧縮率の中から何れ
かの圧縮率を選択する圧縮率選択工程と、その選択され
た圧縮率で前記文字画像ブロックの画素データをデータ
圧縮して得られる画素データを、外部装置に送信する送
信工程と、を有することを特徴とする。
【0019】また、例えば前記文字認識工程では、前記
文字画像ブロックの画素データが表わす特徴ベクトル
と、予め記憶している複数の文字種の特徴ベクトルとを
比較し、その比較により類似度が最も高い文字種を認識
結果として選択するとよい。
【0020】また、例えば前記圧縮率選択工程では、前
記文字認識工程で得られる類似度を表わす値と所定のし
きい値とを比較した結果に応じて、前記所定の複数の圧
縮率の中から何れかの圧縮率を選択することを特徴とす
る。
【0021】
【発明の実施の形態】以下、本発明の画像処理装置を、
コンピュータに適用した実施形態として図面を参照して
詳細に説明する。
【0022】[第1の実施形態]はじめに、本実施形態
における画像伝送システムの構成を図1を参照して説明
する。
【0023】図1は、本発明の第1の実施形態としての
画像伝送システムの概略構成を示す図である。
【0024】図中、送信側ホスト201(以下、ホスト
201)及び受信側ホスト204(以下、ホスト20
4)は、通信ネットワーク300を介して通信可能に接
続されている。
【0025】図1によって本実施形態の画像伝送システ
ムの動作の概略を説明すれば、ホスト201には、文書
等の原稿を光学的に読み取るスキャナ202が接続され
ている。スキャナ202からホスト201に入力された
画像データは、後述する所定の処理を施された後、通信
ネットワーク300を介してホスト204に送信するこ
とができる。ホスト204は、ホスト201から受信し
た画像データの内容をディスプレイ205に表示した
り、或いはプリンタ206によって印刷することができ
る。
【0026】図2は、本発明の第1の実施形態としての
送信側及び受信側のホストの装置構成を説明する図であ
る。
【0027】図中、送信側ホスト201は、主要部とし
てCPU207、メモリ208及び記憶装置209を備
える。CPU207は、記憶装置209に予め記憶され
たプログラムに従って後述する所定のデータ処理及びデ
ータ入出力処理を行う。また、210〜214の各ブロ
ックは、送信側ホスト201のCPU207において実
行されるプログラムの機能モジュールを示している。
【0028】同様に、受信側ホスト204は、主要部と
してCPU215、メモリ216及び記憶装置217を
備える。CPU215は、記憶装置217に予め記憶さ
れたプログラムに従って後述する所定のデータ処理及び
データ入出力処理を行う。また、218〜221の各ブ
ロックは、受信側ホスト204のCPU215において
実行されるプログラムの機能モジュールを示している。
【0029】通信ネットワーク203は、送信側ホスト
201から受信側ホスト204にデータを送信する伝送
路である。
【0030】スキャナ202から出力された原稿の画像
データは、領域分割部210によって領域(ブロック)
に分割され、その領域毎に「位置情報」、「属性情
報」、並びに「画素データ」が生成される(領域分割に
ついては後述する)。
【0031】文字認識部212では、領域分割部210
によって生成された領域の「属性情報」が「文字」の属
性を表わす場合に、その領域の「画素データ」に対して
所定の文字認識処理を施すことにより、当該領域の「画
素データ」が表わす文字のテキストコードを生成する
(文字認識については後述する)。
【0032】画像変換部211では、領域分割部210
によって生成された各領域の「画素データ」に対して、
データサイズの圧縮処理が施される。このときの画像変
換の方式は、各領域の「属性情報」と、文字認識部21
2の出力データとに応じて、所定の複数の方式の中から
何れかが選択される(画像変換については後述する)。
【0033】文書情報記述部213は、画像変換部21
1から出力される各領域の「属性情報」、「位置情
報」、並びに「圧縮された画素データ」に基づいて所定
のデータ構造のフォーマットを有する「文書情報デー
タ」を生成する。
【0034】図6は、本発明の第1の実施形態としての
文書情報データのデータ構造の一例を示す図であり、文
書情報記述部213によって記述されるデータである。
【0035】同図に示す「文書情報データ」には、原稿
のサイズ、スキャナ解像度等を収めた文書全体のヘッダ
に続き、領域分割部210による領域分割の結果に基づ
く複数の領域(ブロック)のブロック情報が連続して収
められている。各領域のブロック情報は、それぞれ、
「位置情報」、「属性情報」、そして画像変換により
「圧縮された画素データ」からなる。
【0036】データ送信部214は、文書情報記述部2
13が出力したデータを所定の伝送フォーマットに変化
して通信ネットワーク300を介して受信側ホスト20
4に送信する。
【0037】受信側ホスト204の受信部218は、送
信側ホスト201のデータ送信部214からのデータを
受信すると、その受信データに所定の逆変換処理を施す
ことによってデータ送信部214における所定のフォー
マットへの変換前の文書情報データに再編成する。
【0038】文書構成部219は、受信部218から出
力された「文書情報データ」を所定の方法で解読するこ
とにより、原稿画像の形態に構成する。
【0039】画像表示部220は、文書構成部219か
ら出力された画像データに基づいてディスプレイ205
に画像を表示する。
【0040】印刷出力部221は、文書構成部219か
ら出力された画像データに基づいてプリンタ206から
画像を印刷出力する。
【0041】次に、送信側ホスト201におけるデータ
処理の流れを図3を参照して説明する。
【0042】図3は、本発明の第1の実施形態としての
送信側ホストにおけるフローチャートであり、CPU2
07にて行われる上述した210〜214の各機能モジ
ュールの処理手順を示している。
【0043】送信側ホスト201は、ステップS301
にてスキャナ202により読み取った原稿(文書)の画
像データを、ステップS302にて領域分割部210に
より領域に分割し、それら分割した全ての領域は処理キ
ューに入れられる。
【0044】次に、ステップS303では、画像変換部
211により、キューの先頭の領域の画素データに対し
て、各領域の「属性情報」及び文字認識部212の出力
に基づいて所定の画像変換処理を施すことにより「画素
データ」のサイズを縮小する(詳細は後述する)。
【0045】ステップS304では、ステップS303
でまだ画像変換されていない領域が存在するためにキュ
ーが空でなければステップS303に戻る。一方、キュ
ーが空であればステップS305に進んで、文書情報記
述部213により、各領域の「位置情報」、「属性情
報」、並びに「圧縮された画素データ」に基づいて「文
書情報データ」を生成する。
【0046】ステップS306では、データ送信部21
4により、文書情報記述部213で作成した文書情報デ
ータをホスト204に送信する。
【0047】次に、受信側ホスト204におけるデータ
処理の流れを図4を参照して説明する。
【0048】図4は、本発明の第1の実施形態としての
受信側ホストにおけるフローチャートであり、CPU2
15にて行われる上述した218〜221の各機能モジ
ュールの処理手順を示している。
【0049】受信側ホスト204は、ステップS401
にてホスト201から受信したデータをデータ受信部2
18により「文書情報データ」に変換すると、その文書
情報データをステップS402にて文書構成部219に
よって原稿画像の形態の画像データに構成する。
【0050】ステップS403では、ステップS402
で構成された画像データに基づいてディスプレイ205
に画像を表示する。また、ステップS404では、ステ
ップS402で構成された画像データに基づいてプリン
タ206から画像を印刷出力する。
【0051】次に、領域分割部210にて行われる領域
分割処理、文字認識部212にて行われる文字認識処
理、そして、画像変換部211にて行われる画像変換処
理について説明する。
【0052】<領域分割処理>図7は、本発明の第1の
実施形態としての領域分割処理を説明する図である。
【0053】同図の(a)に一例として示す原稿画像7
01は、領域分割処理により(b)に示す文字領域70
2,703,704,707,709,並びに710、
絵/写真領域705及び708、そして線領域706へ
と分割される。そして、分割されたそれぞれの領域の画
像データに基づいて、その領域の範囲を示す「位置情
報」、画像の種類を示す「属性情報」及びその領域の
「画素データ」をそれぞれ所定のデータ構造を有すブロ
ック情報が生成される。
【0054】領域分割部210は、原稿の全体画像を、
文字領域、図領域、絵/写真領域、線領域といった属性
の異なる複数の領域に分割する。この分割処理は、原稿
の画素データを走査し、それぞれの領域内に有る黒画素
が、所定の条件を満足するか否かにより属性を決定す
る。この条件としては、主に、(1)黒画素のエッジ
(輪郭)の量、(2)所定幅の黒画素からなる連続する
ブロックの集合、等が挙げられるが、現在では一般的な
ため詳細な説明は省略する。
【0055】<文字認識処理>文字認識部212は、文
字認識処理の一例として、対象となる画像に含まれる特
徴ベクトルの抽出とそのマッチングによる文字認識方法
を採用する。即ち、ホスト201が文字認識対象とする
全字種の画像イメージを、予め特徴ベクトル化した辞書
として記憶装置209に備え、認識対象の文字であるべ
き画像が入力されたときに、その特徴ベクトルと辞書内
の字種毎のベクトルとの比較を、それらのベクトル間の
類似度の大きさに基づいて行う。そして、最も類似度の
高い辞書ベクトルの字種を、入力された認識対象の文字
の字種と判断する。
【0056】また、文字認識部212は、前記の比較処
理において認識対象の文字画像について得られた類似度
を表わす値の最大値をスコアとし、このスコアが所定の
しきい値以下であれば、現在の認識対象はリジェクト文
字、即ち、辞書には登録されていない文字であると判断
する。
【0057】<画像変換処理>画像変換部211では、
入力された領域のブロック情報を参照し、該領域の「属
性情報」が文字領域を示すか否かを判断する。そして、
非文字領域の場合は、その領域全体に対して非文字領域
用の所定の画像変換処理を一様に行う。ここで、非文字
領域への画像変換方法について説明すれば、例えば、自
然画の領域には、所謂JPEG(Joint Photographic Ex
perts Group)方式を用いて圧縮すればよい。
【0058】一方、文字領域の場合には、対象としてい
る文字領域に最適な圧縮率で文字領域用の画像変換処理
を行う。
【0059】文字領域に対して行う画像変換処理の手法
自体は、画像変換処理の一例として解像度変換、即ち、
ある領域の画像を表わす画素数を均等に間引いて減少さ
せる単純縮小変換処理を採用する。もちろん、その他の
画像圧縮方式を採用し、圧縮率と「画素データ」のロス
に関するパラメータとを変更してもよいことは言うまで
もない。
【0060】次に、画像変換処理を行う際の最適な圧縮
率の推定処理について説明する。
【0061】上述したように、文字認識部212では、
認識対象の領域に含まれる文字画像について得られた類
似度を表わす値の最大値をスコアとし、そのスコアに従
って現在の認識対象がリジェクト文字か否かを判断して
いる。この判断を利用して、画像変換部211は、以下
の手順で文字領域の画素データに対する圧縮限度を求め
る。
【0062】まず、現在対象としている領域中の文字画
像について、ある圧縮率で画像変換を施す。次に、画像
変換後に当該文字画像が画素データとして有するある情
報量の画素データに対して文字認識部212による文字
認識処理を施す。その結果、画像変換後の画素データに
より表わされる文字のスコアが所定のしきい値以下であ
れば、その画素データが表わす文字は受信側ホスト20
4で再現したときにユーザは解読することはできないこ
とを表わす。即ち、画像の再現に必要最小限の情報量を
下回った状態である。逆に、所定のしきい値よりスコア
が大きければユーザが解読することができる状態、即
ち、画像の再現に必要最小限の情報量は確保されている
状態である。
【0063】このような判断処理を最初は圧縮率を小さ
くし、徐々に圧縮率を高くしながら繰り返す。そして、
スコアが所定のしきい値以下となる直前の段階の圧縮率
を、その文字画像の領域に対する圧縮率の限界、即ち、
最適な圧縮率とする。
【0064】この最適な圧縮率の推定処理は、対象とす
る文字画像の領域に含まれる文字をより多く利用するほ
ど信頼性の高い圧縮率が得られる。
【0065】次に、上記の文字画像に対する最適な圧縮
率の推定処理の流れについて図5を参照して説明する。
【0066】図5は、本発明の第1の実施形態としての
最適圧縮率の推定処理を示すフローチャートであり、領
域分割部210から出力されるある1つの領域に対して
CPU207にて行われる画像変換部211及び文字認
識部212の機能モジュールの処理手順を示している。
従って、図5に示す画像変換処理は、領域分割部210
から出力されるそれぞれの領域に対して行われることは
言うまでもない。
【0067】尚、以下の処理において、圧縮率は、予め
段階的に定められた圧縮率を表わす値n(nは0以上の
整数とする)で表わすものとし、nの値が1から順に大
きくなるに従って、その値が表わす圧縮率は高くなるよ
うに定義する。
【0068】領域分割部210から処理対象の領域が入
力されると(ステップS501)、画像変換部211
は、入力された領域のブロック情報の「属性情報」を参
照し、当該領域が文字領域か非文字領域かを判断する
(ステップS502)。そして、ステップS502の判
断において非文字領域であった場合、領域分割部210
は、ステップS503において、その領域全体に対して
非文字領域用の所定の画像変換処理を一様に行う。一
方、ステップS502の判断において文字領域であった
場合は、ステップS504以降のステップに進む。
【0069】ステップS505では、nの値が表わす圧
縮率で、処理対象の領域に含まれる「画素データ」に対
する画像変換処理が行われる。上述したように、本実施
形態では、画像変換処理の一例としてある領域の画像を
表わす画素数を均等に間引いて減少させる単純縮小変換
処理を採用し、nを圧縮率のパラメータとする。nの値
には、1回目の画像変換処理のときに、ステップS50
4にてn=1が代入される。
【0070】尚、この画像変換を行う際、元の画素デー
タ、即ち、図3のステップS301で原稿を読み取った
ときに得られた「画素データ」は記憶装置209に保存
されており、当該領域に対する画像変換は常にこの本来
の「画素データ」に対して行うものとする。
【0071】ステップS506では、ステップS505
にて画像変換が施された領域の「画素データ」から幾つ
かの文字画像を抽出し、これらの文字画像に対して文字
認識部212による文字認識を行う。そして、それらの
文字画像についての類似度のスコアを計算する。
【0072】ステップS507では、ステップS506
で算出したスコアの平均値を算出し、その平均値を予め
定められた所定のしきい値と比較する。ここで、スコア
の平均値を算出するのは、対象とする文字画像の領域に
含まれる文字をより多く利用するほど信頼性の高い圧縮
率が得られるためである。
【0073】ステップS508では、ステップS507
の比較の結果、当該スコアの平均値がしきい値より大き
く、ステップS505で行った画像変換の圧縮率は受信
側ホスト201にて文字画像を再現したときに可読な状
態であると判断できるため、nの値に1を加え、ステッ
プS505に戻って更に圧縮率の高い画像変換を行う。
【0074】一方、ステップS509では、ステップS
507の比較の結果、当該スコアの平均値がしきい値以
下であり、現在の圧縮率では受信側ホスト201にて文
字画像を再現したときに可読ではないと判断できるた
め、前回の画像変換における圧縮率を最適な圧縮率と判
断し、nの値を(n−1)とし、その値が表わす圧縮率
で現在対象としている領域の「画素データ」(文字画
像)に画像変換を行う。そして、その変換後の画素デー
タを、文書情報記述部213に出力する。但し、n=0
のときは、圧縮変換を行わないことを表わすものとす
る。
【0075】以上説明したように、本実施形態では、領
域毎の属性に応じたデータサイズの圧縮を行うことがで
きるため、原稿の画像全体に一律に画像圧縮を行って送
信する場合と比較して、通信ネットワーク300におけ
るデータの伝送効率を向上することができる。また、原
稿に含まれる文字画像の領域に対しては、その文字画像
を受信側ホスト204にて再現したときにユーザが解読
するのに必要最小限の情報量を、文字画像の領域毎に自
動的に算出している。これにより、通信ネットワーク3
00上ではコンパクトなサイズであり、且つ、受信側の
装置においては良好な再現画像を得ることができる画像
データを生成することができる。
【0076】尚、本実施形態では、受信側と送信側をそ
れぞれ汎用コンピュータとし、上述した処理を主にソフ
トウエアにより実現する例として説明したが、ハードウ
ェアによって実現してもよいことは言うまでもない。
【0077】また、通信ネットワーク300は、専用線
や公衆回線等の種々の有線伝送路のみならず無線送信等
であってもよい。特に、本発明は、一般電話回線のよう
にデータ送信速度の遅い伝送路を用いる場合に伝送効率
の向上の効果を大きく得ることができる。
【0078】[第2の実施形態]上述した第1の実施形
態では、画像変換部211における文字画像の領域に対
する画像変換の圧縮度を、文字認識部212による文字
認識の結果に応じて決定したが、この方法に限られる訳
ではなく、文字画像中に存在するより詳細な性質を用い
て圧縮度を選択的に決定するアルゴリズムも考えられ
る。
【0079】例えば、原稿上に同じ大ききの文字として
書かれていても、例えば、一般に日本語の文字には線の
複雑な漢字が含まれるために、圧縮率の高いが変換を行
うと、その変換後のデータに基づいて画像を再現しても
人間が見て解読できない場合が多いのに対し、英語の文
字は比較的文字構造が単純で、高圧縮率な圧縮にも耐え
得るという差がある。
【0080】そこで、本実施形態では、第1の実施形態
と同様の装置構成を用いて、上記の特性の違いに着目し
た画像処理装置を説明する。また、文字判別する文字と
しては、一例として日本語と英語とを判別する。
【0081】図8は、本発明の第2の実施形態としての
画像変換処理を示すフローチャートであり、領域分割部
210から出力されるある1つの領域に対してCPU2
07にて行われる画像変換部211及び文字認識部21
2の機能モジュールの処理手順を示している。従って、
図8に示す画像変換処理は、領域分割部210から出力
されるそれぞれの領域に対して行われることは言うまで
もない。
【0082】ステップS601及びステップS602で
は、第1の実施形態で説明した図5のステップS501
及びステップS502と同様な処理が行われる。その結
果、非文字領域であった場合はステップS603に進
み、ステップS503と同様な処理が行われる。
【0083】一方、ステップS602の判断において文
字領域であった場合は、ステップS604にて当該領域
内の文字種の判別を行う。本実施形態において、文字種
の判別処理は、文字認識部212の出力(テキストコー
ド)を用いて日本語或いは英語という判断を行う。
【0084】尚、この文字種を判断する際に、特に、日
本語の文書に多く見られる傾向として、当該領域内に日
本語と英語とが混在しているときには、例えば、文字認
識部212の出力(テキストコード)中に日本語の文
字、即ちアルファベットや数字以外のコードが含まれて
いれば日本語、そうでなければ英語と判断するようにし
て文字種を判断すればよい。
【0085】尚、文字種の判別は文字認識部212の認
識結果を使用する手法でなくてもよいことは言うまでも
ない。
【0086】ステップS605にて当該領域内の文字種
が日本語とされた場合は、ステップS606にて所定の
圧縮率(j×s)で文字画像の画像変換を行い、英語と
された場合はステップS607にて圧縮率(k×s)で
画像変換を行う。ここで、sは、当該領域内の文字画像
から求められた文字サイズの平均値に比例する変数であ
る。また、j,kは、日本語及び英語の文字種にそれぞ
れ適するように予め定められた圧縮率の定数である。
【0087】本実施形態においても、個々の文字領域に
対する画像変換が、その領域の性質を考慮して行われて
いるので、通信ネットワーク300上ではコンパクトな
サイズであり、且つ、受信側の装置においては良好な再
現画像を得ることができる画像データを生成することが
できる。
【0088】
【他の実施形態】尚、本発明は、複数の機器(例えばホ
ストコンピュータ,インタフェイス機器,リーダ,プリ
ンタ等)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
等)に適用してもよい。
【0089】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システム或いは装置に供給し、その
システム或いは装置のコンピュータ(またはCPUやM
PU)が記憶媒体に格納されたプログラムコードを読出
し実行することによっても、達成されることは言うまで
もない。
【0090】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0091】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROM等
を用いることができる。
【0092】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)等が実際の処理の一部または全部
を行い、その処理によって前述した実施形態の機能が実
現される場合も含まれることは言うまでもない。
【0093】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPU等が実際の処理の一部または全部を行い、その処
理によって前述した実施形態の機能が実現される場合も
含まれることは言うまでもない。
【0094】
【発明の効果】以上説明したように、本発明によれば、
文字画像を表わす画素データを、外部装置で再現すると
きに最低限必要なコンパクトなデータサイズで送信する
画像処理装置及び画像処理方法の提供が実現する。
【0095】
【図面の簡単な説明】
【図1】本発明の第1の実施形態としての画像伝送シス
テムの概略構成を示す図である。
【図2】本発明の第1の実施形態としての送信側及び受
信側のホストの装置構成を説明する図である。
【図3】本発明の第1の実施形態としての送信側ホスト
におけるフローチャートである。
【図4】本発明の第1の実施形態としての受信側ホスト
におけるフローチャートである。
【図5】本発明の第1の実施形態としての最適圧縮率の
推定処理を示すフローチャートである。
【図6】本発明の第1の実施形態としての文書情報デー
タのデータ構造の一例を示す図である。
【図7】本発明の第1の実施形態としての領域分割処理
を説明する図である。
【図8】本発明の第2の実施形態としての画像変換処理
を示すフローチャートである。
【符号の説明】
201:送信側ホスト, 202:スキャナ, 203:ディスプレイ, 204,205:受信側ホスト, 206:プリンタ, 207,215:CPU, 208,216:メモリ, 209,217:記憶装置, 300:通信ネットワーク,

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 文字画像ブロックの画素データに対し
    て、所定の複数の圧縮率のうち何れかの圧縮率でデータ
    圧縮する圧縮手段と、 その圧縮手段により得られた画素データに文字認識を行
    う文字認識手段と、 その文字認識手段による認識結果に基づいて、前記所定
    の複数の圧縮率の中から何れかの圧縮率を選択する圧縮
    率選択手段と、 その圧縮率選択手段により選択された圧縮率で、前記圧
    縮手段により前記文字画像ブロックの画素データをデー
    タ圧縮して得られる画素データを、外部装置に送信する
    送信手段と、を備えることを特徴とする画像処理装置。
  2. 【請求項2】 前記文字認識手段は、前記文字画像ブロ
    ックの画素データが表わす特徴ベクトルと、予め記憶し
    ている複数の文字種の特徴ベクトルとを比較し、その比
    較により類似度が最も高い文字種を認識結果として選択
    することを特徴とする請求項1記載の画像処理装置。
  3. 【請求項3】 前記圧縮率選択手段は、前記文字認識手
    段による類似度を表わす値と所定のしきい値とを比較し
    た結果に応じて、前記所定の複数の圧縮率の中から何れ
    かの圧縮率を選択することを特徴とする請求項2記載の
    画像処理装置。
  4. 【請求項4】 所定のしきい値は、前記送信手段が送信
    した画素データに基づいて、前記外部装置にて前記文字
    画像ブロックの画素データが表わす画像として再現した
    ときに、その画像を文字として解読可能な最低限の状態
    を表わすことを特徴とする請求項3記載の画像処理装
    置。
  5. 【請求項5】 前記圧縮率選択手段は、前記文字認識手
    段による文字認識の結果判別された前記文字画像ブロッ
    クの文字の種類に応じて、圧縮率を変更することを特徴
    とする請求項1記載の画像処理装置。
  6. 【請求項6】 前記文字画像ブロックが複数存在すると
    きに、前記圧縮率選択手段は、文字画像ブロック毎に、
    前記所定の複数の圧縮率の中から何れかの圧縮率を選択
    することを特徴とする請求項1記載の画像処理装置。
  7. 【請求項7】 更に、原画像の画素データを、その原画
    像に含まれる画像の属性に基づいて複数の画像ブロック
    に分割する領域分割手段を備え、前記圧縮率選択手段
    は、該領域分割手段により分割した複数の画像ブロック
    のうち、画像属性が文字を示す文字画像ブロックを処理
    対象とすることを特徴とする請求項6記載の画像処理装
    置。
  8. 【請求項8】 前記圧縮手段は、前記文字画像ブロック
    の文字画像を表わす画素の数を所定の割合で均等に間引
    くことにより、データ圧縮を行うことを特徴とする請求
    項1記載の画像処理装置。
  9. 【請求項9】 文字画像ブロックの画素データに対し
    て、所定の複数の圧縮率のうち何れかの圧縮率でデータ
    圧縮する圧縮工程と、 そのデータ圧縮により得られた画素データに文字認識を
    行う文字認識工程と、 その認識結果に基づいて、前記所定の複数の圧縮率の中
    から何れかの圧縮率を選択する圧縮率選択工程と、 その選択された圧縮率で前記文字画像ブロックの画素デ
    ータをデータ圧縮して得られる画素データを、外部装置
    に送信する送信工程と、を有することを特徴とする画像
    処理方法。
  10. 【請求項10】 前記文字認識工程では、前記文字画像
    ブロックの画素データが表わす特徴ベクトルと、予め記
    憶している複数の文字種の特徴ベクトルとを比較し、そ
    の比較により類似度が最も高い文字種を認識結果として
    選択することを特徴とする請求項9記載の画像処理方
    法。
  11. 【請求項11】 前記圧縮率選択工程では、前記文字認
    識工程で得られる類似度を表わす値と所定のしきい値と
    を比較した結果に応じて、前記所定の複数の圧縮率の中
    から何れかの圧縮率を選択することを特徴とする請求項
    10記載の画像処理方法。
  12. 【請求項12】 所定のしきい値は、前記送信手段が送
    信した画素データに基づいて、前記外部装置にて前記文
    字画像ブロックの画素データが表わす画像として再現し
    たときに、その画像を文字として解読可能な最低限の状
    態を表わすことを特徴とする請求項11記載の画像処理
    方法。
  13. 【請求項13】 前記文字画像ブロックが複数存在する
    ときに、前記圧縮率選択工程では、文字画像ブロック毎
    に、前記所定の複数の圧縮率の中から何れかの圧縮率を
    選択することを特徴とする請求項9記載の画像処理方
    法。
  14. 【請求項14】 文字画像ブロックの画素データを外部
    装置に送信するプログラムを格納したコンピュータ読み
    取り可能な記憶媒体であって、その記憶媒体により、コ
    ンピュータを、 文字画像ブロックの画素データに対して、所定の複数の
    圧縮率のうち何れかの圧縮率でデータ圧縮する圧縮手段
    と、 その圧縮手段により得られた画素データに文字認識を行
    う文字認識手段と、 その文字認識手段による認識結果に基づいて、前記所定
    の複数の圧縮率の中から何れかの圧縮率を選択する圧縮
    率選択手段と、 その圧縮率選択手段により選択された圧縮率で、前記圧
    縮手段により前記文字画像ブロックの画素データをデー
    タ圧縮して得られる画素データを、外部装置に送信する
    送信手段として動作させることを特徴とする記録媒体。
JP9333321A 1997-12-03 1997-12-03 画像処理装置及び画像処理方法 Withdrawn JPH11167623A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9333321A JPH11167623A (ja) 1997-12-03 1997-12-03 画像処理装置及び画像処理方法
US09/203,511 US6381368B1 (en) 1997-12-03 1998-12-01 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9333321A JPH11167623A (ja) 1997-12-03 1997-12-03 画像処理装置及び画像処理方法

Publications (1)

Publication Number Publication Date
JPH11167623A true JPH11167623A (ja) 1999-06-22

Family

ID=18264811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9333321A Withdrawn JPH11167623A (ja) 1997-12-03 1997-12-03 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US6381368B1 (ja)
JP (1) JPH11167623A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010098744A (ja) * 2008-10-20 2010-04-30 Toshiba Corp 画像処理装置及び画像処理方法
US7738737B2 (en) 2005-03-25 2010-06-15 Fuji Xerox Co., Ltd. Image processing apparatus and image processing method
JP2010183499A (ja) * 2009-02-09 2010-08-19 Sony Corp 画像比較装置及びその方法、画像検索装置、並びにプログラム及び記録媒体
JP2011118517A (ja) * 2009-12-01 2011-06-16 Fujifilm Corp 文書画像生成サーバ及びプログラム、並びに文書閲覧システム
JP2014128025A (ja) * 2012-12-27 2014-07-07 Brother Ind Ltd 画像処理装置およびコンピュータプログラム
JP2015188156A (ja) * 2014-03-26 2015-10-29 富士通株式会社 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6583887B1 (en) * 1999-02-26 2003-06-24 Hewlett-Packard Development Company, L.P. Method and apparatus for data compression
US6968004B1 (en) * 1999-08-04 2005-11-22 Kabushiki Kaisha Toshiba Method of describing object region data, apparatus for generating object region data, video processing method, and video processing apparatus
US6829390B2 (en) * 2001-08-27 2004-12-07 Oridus, Inc. Method and apparatus for transmitting image updates employing high compression encoding
US8204079B2 (en) * 2002-10-28 2012-06-19 Qualcomm Incorporated Joint transmission of multiple multimedia streams
US20040083495A1 (en) * 2002-10-29 2004-04-29 Lane Richard D. Mulitmedia transmission using variable gain amplification based on data importance
US7274823B2 (en) * 2002-11-12 2007-09-25 Qualcomm Incorporated System and method for processing symbols embedded in digital video
JP2006202000A (ja) * 2005-01-20 2006-08-03 Fujitsu Ltd 車両監視方法及び特定文字パターン認識装置及び車両監視システム
TW200731760A (en) * 2006-02-13 2007-08-16 Benq Corp Image capturing method and image-capturing device thereof
WO2008100537A2 (en) * 2007-02-12 2008-08-21 Sorensen Associates Inc. Still image shopping event monitoring and analysis system and method
JP5066977B2 (ja) * 2007-03-29 2012-11-07 富士ゼロックス株式会社 画像処理装置、画像形成装置、及びプログラム
US8107743B2 (en) * 2007-03-30 2012-01-31 Sharp Kabushiki Kaisha Image processing device, image processing method, and storage medium
JP4626777B2 (ja) * 2008-03-14 2011-02-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN109670497A (zh) * 2018-09-26 2019-04-23 深圳壹账通智能科技有限公司 图片上传方法、装置、设备及可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4730348A (en) * 1986-09-19 1988-03-08 Adaptive Computer Technologies Adaptive data compression system
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
US4929946A (en) * 1989-02-09 1990-05-29 Storage Technology Corporation Adaptive data compression apparatus including run length encoding for a tape drive system
US5303313A (en) * 1991-12-16 1994-04-12 Cartesian Products, Inc. Method and apparatus for compression of images
US5467087A (en) * 1992-12-18 1995-11-14 Apple Computer, Inc. High speed lossless data compression system
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
US5553160A (en) * 1994-09-01 1996-09-03 Intel Corporation Method and apparatus for dynamically selecting an image compression process based on image size and color resolution

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738737B2 (en) 2005-03-25 2010-06-15 Fuji Xerox Co., Ltd. Image processing apparatus and image processing method
JP2010098744A (ja) * 2008-10-20 2010-04-30 Toshiba Corp 画像処理装置及び画像処理方法
JP2010183499A (ja) * 2009-02-09 2010-08-19 Sony Corp 画像比較装置及びその方法、画像検索装置、並びにプログラム及び記録媒体
JP2011118517A (ja) * 2009-12-01 2011-06-16 Fujifilm Corp 文書画像生成サーバ及びプログラム、並びに文書閲覧システム
JP2014128025A (ja) * 2012-12-27 2014-07-07 Brother Ind Ltd 画像処理装置およびコンピュータプログラム
JP2015188156A (ja) * 2014-03-26 2015-10-29 富士通株式会社 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
US9380316B2 (en) 2014-03-26 2016-06-28 Fujitsu Limited Image processing apparatus, image processing system and image processing method

Also Published As

Publication number Publication date
US6381368B1 (en) 2002-04-30

Similar Documents

Publication Publication Date Title
JPH11167623A (ja) 画像処理装置及び画像処理方法
US7970225B2 (en) Image processing device, image processing method, image processing program and computer-readable recording medium on which the program is recorded
EP0685963B1 (en) Image processing apparatus and method
JP4753627B2 (ja) ディジタル画像のファイルサイズを動的に制御する方法
US7660014B2 (en) Image processing apparatus capable of extracting rule from document image with high precision
US6437881B1 (en) Image processing apparatus and image processing method
JP2000067155A (ja) 画像処理装置及びその方法、コンピュ―タ可読メモリ
US20050162680A1 (en) Communication apparatus for forming and outputting image data on the basis of received data
US7653254B2 (en) Image coding apparatus and image coding method
JP4579759B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US5703967A (en) Color image transmitting method
US7609881B2 (en) Device and method for image processing as well as image processing computer program
JP6892625B2 (ja) データ処理装置、および、コンピュータプログラム
JP2000295468A (ja) 画像処理装置
US7127113B2 (en) Image processing method, storage medium, image forming apparatus and program with correction processing according to an attribute of an image
JP2005236800A (ja) 画像領域判定方法、画像処理装置およびプログラム
JP2002142106A (ja) 画像処理装置および画像処理方法
JP4411244B2 (ja) 画像処理装置、画像処理方法、プログラム
KR100750151B1 (ko) 팩스 데이터의 전송방법 및 장치
JP2010218106A (ja) 画像処理装置、画像処理方法及びプログラム
JPH0646271A (ja) ファクシミリ装置
JPH11120111A (ja) ネットワークスキャナシステム
JP2000251061A (ja) 画像処理装置、画像処理方法および画像処理用記録媒体
US20090316998A1 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same
JP2002111706A (ja) 通信システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050301