JP2010146185A - 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体 - Google Patents

画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP2010146185A
JP2010146185A JP2008321210A JP2008321210A JP2010146185A JP 2010146185 A JP2010146185 A JP 2010146185A JP 2008321210 A JP2008321210 A JP 2008321210A JP 2008321210 A JP2008321210 A JP 2008321210A JP 2010146185 A JP2010146185 A JP 2010146185A
Authority
JP
Japan
Prior art keywords
image
unit
character recognition
image data
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008321210A
Other languages
English (en)
Inventor
章人 ▲吉▼田
Akito Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008321210A priority Critical patent/JP2010146185A/ja
Priority to CN2009102591274A priority patent/CN101753764B/zh
Priority to US12/639,574 priority patent/US8363963B2/en
Publication of JP2010146185A publication Critical patent/JP2010146185A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】原稿から読み取って取得した画像データとこの画像データに対する文字認識処理によって得られたテキストデータとを対応付けた画像ファイルを作成する画像処理装置において、上記テキストデータに基づくキーワード検索を行う場合に、検索漏れが生じることを抑制する。
【解決手段】原稿から読み取って取得した画像データに基づいて上記原稿に含まれる文字の文字認識処理を行う文字認識部41と、文字認識処理によって得られたテキストデータと上記画像データとを対応付けた画像ファイルを作成するフォーマット化処理部43とを備え、文字認識部41は、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、フォーマット化処理部43は、文字認識部41が作成した各テキストデータをそれぞれ画像データに対応付けて画像ファイルを作成する。
【選択図】図1

Description

本発明は、原稿から読み取って取得した画像データとこの画像データに対する文字認識処理によって得られたテキストデータとを対応付けた画像ファイルを作成する画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体に関するものである。
従来から、紙媒体の原稿に記載されている情報をスキャナで読み取って画像データを取得し、当該画像データに対して文字認識処理を施して当該画像データに含まれる文字に関するテキストデータを作成し、上記画像データと上記テキストデータとを対応付けた画像ファイルを作成する技術がある。
例えば、特許文献1には、紙媒体に記載されている情報をスキャナで読み取ってPDF画像データを取得し、当該PDF画像データに対して文字認識処理を施してテキストデータを作成し、当該PDF画像データの余白領域および余白領域の色を検出し、上記テキストデータを上記PDF画像データの余白領域に余白領域と同一色で埋め込む技術が開示されている。この技術によれば、画像品位を低下させることなく、テキストデータを用いた検索処理等を行うことができる。すなわち、テキストデータは余白領域に余白領域と同一色で埋め込まれているので、ユーザに視認されることがなく、画像品位が低下しない。また、余白領域に埋め込まれたテキストデータに基づいてキーワード検索を行うなどして原稿に記載された情報を抽出することができる。
特開2004−280514号公報(平成16年10月7日公開) 特開平7−192086号公報(平成7年7月28日公開)
しかしながら、上記特許文献1の技術では、1つの文字に対して1つの文字認識結果のみを対応付けたテキストデータを用いている。このため、例えば、画像データにおける文字方向が縦書きか横書きか不明である場合や、1つの文字に対して複数の文字認識結果の候補が存在する場合などに上記テキストデータを用いて検索処理を行うと、検索漏れが生じる場合がある。
本発明は、上記の問題に鑑みてなされたものであり、その目的は、原稿から読み取って取得した画像データとこの画像データに対する文字認識処理によって得られたテキストデータとを対応付けた画像ファイルを作成する画像処理装置において、上記テキストデータに基づくキーワード検索を行う場合に、検索漏れが生じることを抑制することにある。
本発明の画像処理装置は、上記の課題を解決するために、原稿から読み取って取得した画像データに基づいて上記原稿に含まれる文字の文字認識処理を行う文字認識部と、文字認識処理によって得られたテキストデータと上記画像データとを対応付けた画像ファイルを作成する画像ファイル生成部とを備えた画像処理装置であって、上記文字認識部は、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴としている。
また、本発明の画像処理方法は、上記の課題を解決するために、原稿から読み取って取得した画像データに基づいて上記原稿に含まれる文字の文字認識処理を行う文字認識工程と、文字認識処理によって得られたテキストデータと上記画像データとを対応付けた画像ファイルを作成する画像ファイル生成工程とを含む画像処理方法であって、上記文字認識工程においては、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、上記画像ファイル生成工程においては、上記文字認識工程で作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴としている。
上記の画像処理装置および画像処理方法によれば、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成する。これにより、作成された画像ファイルを用いてキーワード検索を行う場合に、複数の文字認識結果の候補が存在する場合であっても、これら各候補を検索対象に含めることができる。したがって、検索漏れが生じることを抑制できる。
また、上記文字認識部は、1つの文字に対する文字認識結果の候補として複数の文字が検出された場合に、これら複数の文字に対応するテキストデータをそれぞれ作成し、上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成する構成としてもよい。
上記の構成によれば、1つの文字に対する文字認識結果の候補として複数の文字が検出された場合に、これら複数の文字に対応する各テキストデータをそれぞれ上記画像データに対応付けて上記画像ファイルを作成する。これにより、作成された画像ファイルを用いてキーワード検索を行う場合に、複数の文字認識結果の候補が存在する文字について、これら各候補を含めて検索することができる。したがって、検索漏れが生じることを抑制できる。
また、上記画像データに基づいて、上記原稿に記載された単語または文章が縦書きであるか横書きかであるかを解析するレイアウト解析部を備え、上記文字認識部は、上記レイアウト解析部によって上記原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合に、縦書きに応じた文字認識処理と横書きに応じた文字認識処理の両方を行い、これら両方の文字認識処理の結果に応じたテキストデータをそれぞれ作成し、上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成する構成としてもよい。
上記の構成によれば、原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合に、縦書きに応じた文字認識処理と横書きに応じた文字認識処理の両方の結果に応じたテキストデータをそれぞれ画像データに対応付けて画像ファイルを作成する。これにより、原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合であっても、作成された画像ファイルを用いてキーワード検索を行う場合に検索漏れが生じることを抑制できる。
また、上記文字認識部は、上記画像データに含まれる各文字に対する文字認識結果と上記レイアウト解析部の解析結果とに基づいて上記原稿に含まれる単語の認識処理を行うようになっており、上記レイアウト解析部によって上記原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合に、縦書きに応じた単語の認識処理で検出された単語と横書きに応じた単語の認識処理で検出された単語の両方に対応するテキストデータをそれぞれ作成し、上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成する構成としてもよい。
上記の構成によれば、原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合に、縦書きに応じた文字認識処理で検出された単語と横書きに応じた文字認識処理で検出された単語の両方に対応する各テキストデータをそれぞれ画像データに対応付けて画像ファイルを作成する。これにより、原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合であっても、作成された画像ファイルを用いてキーワード検索を行う場合に検索漏れが生じることを抑制できる。
また、上記画像ファイル生成部は、上記画像ファイルにおいて上記テキストデータと上記画像データにおける当該テキストデータに対応する文字の上記原稿上の位置とを対応付ける構成としてもよい。例えば、上記画像ファイル生成部は、上記テキストデータを、上記画像データにおける当該テキストデータに対応する文字の上記原稿上の位置に応じた位置に透明テキストとして配置する構成としてもよい。
上記の構成によれば、作成された画像ファイルを用いたキーワード検索で検出された文字に対応する文字画像を特定することができる。
本発明の画像読取装置は、原稿を読み取って原稿画像の画像データを取得する画像読取部と、上記したいずれかの画像処理装置とを備えている。また、本発明の画像送信装置は、上記したいずれかの画像処理装置と、上記画像ファイル生成部によって生成された画像ファイルを通信可能に接続された他の装置に送信する通信部とを備えている。また、本発明の画像形成装置は、上記したいずれかの画像処理装置と、画像データに応じた画像を記録材上に形成する画像形成部とを備えている。
上記の各構成によれば、作成された画像ファイルを用いてキーワード検索を行う場合に、複数の文字認識結果の候補が存在する文字について、これら各候補を含めて検索することができる。したがって、検索漏れが生じることを抑制できる。
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させる画像処理プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
以上のように、本発明の画像処理装置および画像処理方法は、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成する。
それゆえ、作成された画像ファイルを用いてキーワード検索を行う場合に、複数の文字認識結果の候補が存在する場合であっても、これら各候補を検索対象に含めることができる。したがって、検索漏れが生じることを抑制できる。
本発明の一実施形態について説明する。なお、本実施形態では、主に、本発明をデジタルカラー複合機に適用する場合の一例について説明する。
(1)デジタルカラー複合機の全体構成
図2および図3は、本実施形態にかかるデジタルカラー複合機1の概略構成を示すブロック図である。なお、デジタルカラー複合機1は、(1)画像入力装置2で読み取った画像データに応じた画像を画像出力装置4によって記録材上に形成する画像形成モード、および(2)画像入力装置2で読み取った画像データに傾き補正等の処理を施した画像データと、この画像データに対して文字認識処理を施して取得したテキストデータとを含む画像ファイルを通信装置5によって外部装置に送信する画像送信モードを備えている。そして、図2は画像形成モードにおけるデータの流れを示しており、図3は画像送信モードにおけるデータの流れを示している。
図2および図3に示すように、デジタルカラー複合機1は、画像入力装置2、画像処理装置3、画像出力装置4、通信装置5、および操作パネル6を備えている。
画像入力装置2は、原稿の画像を読み取って画像データを生成するものであり、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部(図示せず)より構成されている。本実施形態では、画像入力装置2は、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号として画像処理装置3に出力する。
図4は、画像入力装置2の一例を示す断面図である。この図に示す画像入力装置2は、上部筐体60と下部筐体61とを備えている。上部筐体(原稿カバー)60は、原稿押さえマット57、整合ローラ対55、原稿搬送路56、イメージセンサ部53、上側原稿搬送ガイド58等を備えており、下部筐体61は、第1コンタクトガラス(原稿台)51、第2コンタクトガラス52、読取部70、遮光部材59等を備えている。また、上部筐体60は下部筐体61に対して開閉可能に構成されている。
なお、画像入力装置2は、(1)第1コンタクトガラス51上に載置された原稿の下面側を読取部70によって読み取る静止読取モード、(2)第2コンタクトガラス52上を走行(移動)する原稿の下面側を読取部70によって読み取る走行読取モード、および(3)第2コンタクトガラス52上を走行(移動)する原稿の下面側を読取部70によって読み取るとともに、上面側をイメージセンサ部53で読み取る両面読取モードを備えている。
整合ローラ対55は、走行読取モードおよび両面読取モードにおいて、搬送されてきた原稿の先端が搬送方向に垂直になるように原稿の角度を整合させるためのものである。搬送された原稿の先端が回転停止状態の整合ローラ対55のニップ部に付き当たることによってこの原稿に所定の撓みを形成され、その後、整合ローラ対55を回転させることによって上記原稿の向きが整合されて整合ローラ対55の下流側に搬送される。
イメージセンサ部53は、両面モードが選択されたときに、第2コンタクトガラス52上を搬送される原稿の上面側の画像を読み取るためのものである。
原稿押さえマット57は、静止読取モードが選択されたときに、第1コンタクトガラス51上に載置された原稿を第1コンタクトガラス51側に押さえつけて原稿の位置を安定させるためのものである。
読取部70は、第1走査ユニット63、第2走査ユニット64、結像レンズ65、およびCCD(Charge Coupled Device)66を備えている。
第1走査ユニット63は、原稿の読み取り面を露光する光源(露光ランプ)62と、原稿からの反射光を第2走査ユニット64に向けて反射する第1反射ミラー67とを備えている。
なお、第1走査ユニット63は、静止読取モード時には、第1コンタクトガラス51に対して平行に図のPの位置から右に向かって原稿サイズに応じた距離だけ一定速度Vで移動しながら、第1コンタクトガラス51上に載置された原稿を光源62から出射した光で露光し、原稿からの反射光を第1反射ミラー67で反射させて第2走査ユニット64に導く。上記の原稿サイズは、図示しない原稿サイズ検出手段(例えば、フォトトランジスタなどの光電変換素子からなる原稿サイズ検出手段)によって第1コンタクトガラス51上に載置された原稿サイズを検知した結果であってもよく、ユーザが操作パネルを介して入力したものであってもよい。なお、本実施形態では、第1コンタクトガラス51は、A3サイズまでの原稿を読み取り可能な大きさに形成されている。
また、第1走査ユニット63は、走行読取モード時および両面読取モード時には、第2コンタクトガラス52に対向する所定の位置において、第2コンタクトガラス52上を搬送される原稿を光源62から出射した光で露光し、原稿からの反射光を第1反射ミラー67で反射させて第2走査ユニット64に導く。
第2走査ユニット64は、第2反射ミラー68と第3反射ミラー69とを備えており、これら両ミラーによって第1反射ミラー67から入射した光を結像レンズ65およびCCD66に導くように構成されている。なお、第2走査ユニット64は、静止読取モードでは第1走査ユニット63に追随してV/2の速度で移動するようになっている。
遮光部材59は、読取部54の光源62の光が、イメージセンサ部53に入射することによってイメージセンサ部53が画像を適切な濃度で読み取れなくなることを防止するためのものである。
結像レンズ65は、第3反射ミラー69から入射した原稿からの反射光を、CCD66上に結像させるためのものである。
CCD66は、結像レンズ65を介して入射した光をアナログの電気信号に変換するためのものである。なお、この電気信号は、後述する画像処理装置3によってデジタルの画像データに変換される。なお、両面読取モードの場合、読取部70によって読み取られた原稿の下面側の画像データが画像処理装置3に入力されて処理され、その後、イメージセンサ部53によって読み取られた原稿の上面側の画像データが画像処理装置3に入力されて処理される。画像処理装置3において原稿の下面側の画像データが処理されている間、イメージセンサ部53によって読み取られた原稿の上面側の画像データは図示しないメモリに一旦格納されており、原稿の上面側の画像データに対する処理が終了した時にこのメモリから読み出されて画像処理装置3に送られ、処理が施される。
画像処理装置3は、図2および図4に示すように、A/D変換部11、シェーディング補正部12、入力処理部13、原稿検知部14、原稿補正部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、中間調生成部(中間調生成部)20、領域分離部21、画像ファイル生成部22、記憶部23、および制御部24を備えている。記憶部23は画像処理装置3で扱われる各種データ(画像データ等)を記憶する記憶手段である。記憶部23の構成は特に限定されるものではないが、例えばハードディスクなどを用いることができる。また、制御部24は、画像処理装置3に備えられる各部の動作を制御する制御手段である。この制御部24は、デジタルカラー複合機1の主制御部(図示せず)に備えられるものであってもよく、主制御部とは別に備えられ、主制御部と協働して処理を行うものであってもよい。
画像処理装置3は、画像形成モードでは、画像入力装置2から入力された画像データに種々の画像処理を施して得られるCMYKの画像データを画像出力装置4に出力する。また、画像送信モードでは、画像入力装置2から入力された画像データに傾き補正処理、画像領域抽出処理、変倍処理、回転処理等の画像処理を施すと共に、画像データに対して文字認識処理を施してテキストデータを取得し、画像データとテキストデータとを含む画像ファイルを生成して通信装置5に出力するなお、画像処理装置3の詳細については後述する。
画像出力装置4は、画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いた画像出力装置を用いることができる。
通信装置5は、例えばモデムやネットワークカードより構成される。通信装置5は、ネットワークカード、LANケーブル等を介して、ネットワークに接続された他の装置(例えば、パーソナルコンピュータ、サーバ装置、表示装置、他のデジタル複合機、ファクシミリ装置等)とデータ通信を行う。通信装置5は、画像データを送信する場合、相手先との送信手続きを行って送信可能な状態が確保されると、所定の形式で圧縮された画像データをメモリから読み出し、圧縮形式の変更など必要な処理を施して、通信回線を介して相手先に順次送信する。また、通信装置5は、画像データを受信する場合、通信手続きを行うとともに、相手先から送信されてくる画像データを受信して画像処理装置3に入力する。受信した画像データは、画像処理装置3で伸張処理、回転処理、解像度変換処理、出力階調補正、階調再現処理などの所定の処理が施され、画像出力装置4によって出力される。なお、受信した画像データを記憶装置(図示せず)に保存し、画像処理装置3が必要に応じて読み出して上記所定の処理を施すようにしてもよい。
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複合機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。ユーザは、操作パネル6を介して入力画像データに対する処理モード、印刷枚数、用紙サイズ、送信先アドレスなどの各種情報を入力することができる。
上記主制御部は、例えばCPU(Central Processing Unit)等からなり、図示しないROM等に格納されたプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複合機1の各部の動作を制御する。
次に、画像処理装置3に備えられる各部における上記各モードでの処理について説明する。
(2)画像処理装置3の構成および動作
(2−1)画像形成モード
次に、画像処理装置3の構成、および画像形成モードにおける画像処理装置3の動作についてより詳細に説明する。画像形成モードの場合、図2に示すように、まず、A/D変換部11が、画像入力装置2から入力されたRGBのアナログ信号をデジタル信号に変換してシェーディング補正部12に出力する。
シェーディング補正部12は、A/D変換部11から送られてきたデジタルのRGB信号に対して、画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施し、入力処理部13に出力する。
入力処理部(入力階調補正部)13は、シェーディング補正部12にて各種の歪みが取り除かれたRGB信号に対して、カラーバランスを整えると同時に、濃度信号など画像処理装置3に採用されている画像処理システムの扱い易い信号に変換する処理を施すものである。また、下地濃度の除去やコントラストなどの画質調整処理を行う。また、入力処理部13は、上記の各処理を施した画像データを記憶部23に記憶させる。
原稿検知部14は、画像データに基づいて原稿画像の傾き角度、天地方向、画像データ中の画像が存在する領域である画像領域などを検出する。また、原稿補正部15は、原稿検知部14の検知結果に基づいて画像データに傾き補正処理、天地補正処理、画像抽出処理などを行う。
図5は、原稿検知部14の概略構成を示すブロック図である。この図に示すように、原稿検知部14は、信号変換部31、2値化処理部32、解像度変換部33、原稿傾き検知部34、およびレイアウト解析部35を備えている。
信号変換部31は、入力処理部13によって上記各処理を施された画像データがカラー画像であった場合にこの画像データを無彩化して、明度信号もしくは輝度信号に変換するものである。
例えば、信号変換部31は、Yi=0.30Ri+0.59Gi+0.11Biを演算することによりRGB信号を輝度信号Yに変換する。ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分であり、添え字のiは画素毎に付与された値(iは1以上の整数)である。
あるいは、RGB信号をCIE1976L***信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよい。
2値化処理部32は、無彩化された画像データ(輝度値(輝度信号)または明度値(明度信号))と、予め設定された閾値とを比較することにより画像データを2値化する。例えば、画像データが8ビットである場合、上記閾値を128とする。あるいは、複数の画素(例えば5画素×5画素)からなるブロックにおける濃度(画素値)の平均値を閾値としてもよい。
解像度変換部33は、2値化された画像データの解像度を低解像度に変換する。例えば、1200dpi、750dpi、あるいは600dpiで読み込まれた画像データを300dpiに変換する。解像度変換の方法は特に限定されるものではなく、例えば、公知のニアレストネイバー法、バイリニア法、バイキュービック法などを用いることができる。また、解像度変換部33は、低解像度化した画像データ(本実施形態では300dpiの画像データ)を原稿傾き検知部34に出力する。なお、解像度変換部33は、画像送信モードの場合には、第1解像度(本実施形態では300dpi)に低解像度化した画像データを原稿傾き検知部34とレイアウト解析部35とに出力するとともに、第1解像度よりも解像度が低い第2解像度(本実施形態では75dpi)に低解像度化した画像データをレイアウト解析部35に出力するようになっている。
原稿傾き検知部34は、解像度変換部33によって低解像度に変換された画像データに基づいて、画像読取時のスキャン範囲(正規の原稿位置)に対する原稿の傾き角度を検知し、検知結果を原稿補正部15に出力する。つまり、図6に示すように、画像入力装置2におけるスキャン範囲(正規の原稿位置)に対して、画像読取時における原稿の位置が傾いていた場合に、この傾き角度を検知する。
傾き角度の検知方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。例えば、特許文献2に記載されている方法を用いてもよい。この方法では、2値化された画像データからを黒画素と白画素との境界点(例えば各文字の上端における白/黒の境界点の座標)を複数個抽出し、各境界点の点列の座標データを求める。そして、この点列の座標データに基づいて回帰直線を求め、その回帰係数bを下記式(1)に基づいて算出する。
b=Sxy/Sx ・・・(1)
なお、Sx,Syはそれぞれ変量x,yの残差平方和であり、Sxyはxの残差とyの残差の積の和である。すなわち、Sx,Sy,Sxyは下記式(2)〜(4)で表わされる。
Figure 2010146185
そして、上記のように算出した回帰係数bより、下記式(5)に基づいて傾き角度θを算出する。
tanθ=b ・・・(5)
レイアウト解析部35は画像形成モードでは動作しない。レイアウト解析部35の動作については後述する。
原稿補正部15は、原稿傾き検知部34の傾き角度検知結果に基づいて、画像データに対して傾き補正処理を施す。また、原稿補正部15は、傾き補正処理を施した画像データを色補正部16および領域分離部21に出力する。
なお、原稿補正部15によって傾き補正処理が施された画像データをファイリングデータとして管理するようにしてもよい。この場合、上記画像データは、例えば、JPEG圧縮アルゴリズムに基づいてJPEGコードに圧縮されて記憶部23に格納される。そして、この画像データに対するコピー出力動作やプリント出力動作が指示された場合には、記憶部23からJPEGコードが引き出されて不図示のJPEG伸張部に引き渡され、復号化処理が施されてRGBデータに変換される。また、上記の画像データに対して送信動作が指示された場合には、記憶部23からJPEGコードが引き出され、ネットワーク網や通信回線を介して通信装置5から外部装置へ送信される。
色補正部16は、色再現の忠実化実現のために、不要吸収成分を含むCMY(C:シアン・M:マゼンタ・Y:イエロー)色材の分光特性に基づいた色濁りを取り除く処理を行うものである。
黒生成下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。
中間調生成部20は、空間フィルタ処理部18と同様、CMYK信号の画像データに対して領域識別信号を基に所定の処理を施すものである。例えば、領域分離部21にて文字に分離された領域は、特に黒文字あるいは色文字の再現性を高めるために、空間フィルタ処理部18による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、中間調生成部20においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。また、領域分離部21にて網点領域に分離された領域に関しては、空間フィルタ処理部18において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部19では、濃度信号などの信号を画像出力装置4の特性値である網点面積率に変換する出力階調補正処理を行った後、中間調生成部20で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)が施される。領域分離部21にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
領域分離部21は、RGB信号より、入力画像中の各画素を黒文字領域、色文字領域、網点領域、印画紙写真(連続階調領域)領域の何れかに分離するものである。領域分離部21は、分離結果に基づき、画素がどの領域に属しているかを示す領域分離信号を、黒生成下色除去部17、空間フィルタ処理部18、および中間調生成部20へと出力する。
画像ファイル生成部22は、画像ファイル生成部22は画像形成モードでは動作を行わない。画像ファイル生成部22の詳細については後述する。
上述した各処理が施された画像データは、一旦、図示しないメモリに記憶されたのち、所定のタイミングで読み出されて画像出力装置4に入力される。
(2−2)画像送信モード
次に、画像送信モードにおける画像処理装置3の動作について、図3を参照しながらより詳細に説明する。なお、通常送信モードにおけるA/D変換部11、シェーディング補正部12、入力処理部13、原稿補正部15、および領域分離部21の処理は、画像形成モード時と同様である。
原稿検知部14における信号変換部31、2値化処理部32、解像度変換部33、および原稿傾き検知部34の動作は画像形成モードの場合と略同様である。
原稿検知部14に備えられるレイアウト解析部35は、画像送信モードの場合、図7に示すように、解像度変換部33から入力される第2解像度の画像データに含まれる文字を抽出し、各文字の外接矩形を求め、隣接する外接矩形間の距離を算出する。そして、この隣接する外接矩形間の距離に基づいて画像データの文字が縦書きであるか横書きであるかを判定する。また、レイアウト解析部35は、判定結果を示す信号と、第1解像度の画像データとを画像ファイル生成部22に備えられる文字認識部41に出力する。なお、縦書きであるか横書きであるかを明確に判定することが困難な場合、レイアウト解析部35は、その旨を判定結果として出力する。
レイアウト解析部35は、具体的には、画像データにおける副走査方向に延伸する最初のラインに含まれる各画素が黒画素であるか否かを画素毎に判断し、黒画素であると判断した画素に所定のラベルを割り付ける。
その後、ラベル付けを行った上記のラインに対して主走査方向に隣接するラインについて、当該ラインに含まれる各画素が黒画素であるか否かを画素毎に判断し、黒画素であると判断した画素にラベル付け済みの上記ラインで用いたラベルとは異なるラベルを割り付ける。そして、黒画素であると判断した各画素について、当該画素に対して隣接するラベル付け済みの上記ラインの画素が黒文字であるかを判断し、黒文字であると判断した場合には、黒画素が連結していると判断し、当該画素のラベルを隣接するラベル付け済みの上記ラインの画素と同じラベル(1つ上のラインのラベルと同じラベル)に変更する。
その後、上記の処理を主走査方向に並ぶ各ラインについて繰り返し、同じラベルが付された画素を抽出することにより、文字の抽出を行う。
そして、抽出した各文字の外接矩形を算出する。なお、各文字および各外接矩形の座標は、例えば画像データの上端かつ左端の位置を原点として算出する。
画像ファイル生成部
なお、レイアウト解析部35が、原稿内の領域毎にレイアウト認識処理を行うようにしてもよい。例えば、レイアウト解析部35が、外接矩形間の距離が略均等である文字群からなる領域を抽出し、抽出した領域毎にレイアウト認識処理を行って縦書きであるか横書きであるかを判断するようにしてもよい。
色補正部16は、原稿補正部15から入力されたRGBの画像データを、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)に変換し、黒生成下色除去部17に出力する。黒生成下色除去部17は、通常送信モードでは色補正部16から入力された画像データをそのまま空間フィルタ処理部18に出力(スルー)する。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるR’G’B’の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、出力階調補正部19に出力する。出力階調補正部19は、通常送信モードでは空間フィルタ処理部18から入力された画像データをそのまま中間調生成部20に出力(スルー)する。
中間調生成部20は、出力階調補正部19から入力されたR’G’B’の画像データに対して領域識別信号を基に所定の処理を施し、画像ファイル生成部22に出力する。例えば、中間調生成部20は、文字領域に対しては図8に実線で示したガンマ曲線を用いた補正を行い、文字領域以外の領域に対しては図8に破線で示したガンマ曲線を用いた補正を行う。なお、文字領域以外の領域に対するガンマ曲線としては、例えば送信先の外部装置に備えられる表示装置の表示特性に応じた曲線を設定しておき、文字領域のガンマ曲線は文字をくっきり表示できるように設定しておくことが好ましい。
中間調生成部20から出力されたR’G’B’の画像データは、画像ファイル生成部22のフォーマット化処理部43に入力される。
画像ファイル生成部22は、文字認識部41、描画コマンド生成部42、およびフォーマット化処理部43を備えている。
文字認識部41は、原稿検知部14から入力された第2解像度の画像データに基づいて画像データに含まれる文字の特徴量を抽出し、抽出結果を辞書データに含まれる文字の特徴量と比較して文字認識を行い、類似する文字に対応する文字コードを検出する。また、レイアウト解析部35の判定結果(縦書きであるか横書きであるか)に基づいて、隣接する文字によって構成される単語の認識処理を行う。つまり、隣接する文字の組み合わせと、辞書データに含まれる単語データとのマッチングを行うことによって原稿に記載されている単語の認識処理を行う。そして、各文字および各単語の認識結果を文字認識結果として描画コマンド生成部42に出力する。
なお、本実施形態では、文字認識部41が、画像データに含まれる文字から抽出した特徴量と辞書データに含まれる文字の特徴量とを比較して両者の類似度を判定する。そして、辞書データに含まれる文字の中に画像データに含まれる文字に対する類似度が所定値以上である文字が複数存在する場合、これら複数の文字の文字コードを文字認識結果として描画コマンド生成部42に出力する。
例えば、類似度の取り得る値が0から1までの範囲であり、上記所定値が0.8に設定されている場合であって、辞書データに含まれる文字の中に、画像データに含まれる文字に対する類似度が(0.726)、(0.891)、(0.931)、(0.776)、(0.722)の文字が含まれている場合、類似度(0.891)および(0.931)に対応する各文字が文字認識結果として検出される。
なお、辞書データに含まれる文字の中に、画像データに含まれる文字に最も類似している文字の類似度(最高最大値)に対する類似度の差が規定値未満である文字が存在する場合に、それら各文字の文字コードを文字認識結果として描画コマンド生成部42に出力するようにしてもよい。
例えば、類似度の取り得る値が0から1までの範囲であり、上記規定値が0.2に設定されている場合であって、辞書データに含まれる文字の中に、画像データに含まれる文字に対する類似度が(0.726)、(0.891)、(0.931)、(0.776)、(0.722)の文字が含まれている場合、最高類似度である(0.931)に対応する文字、および最高類似度に対する差が0.2未満である(0.891)に対応する文字が文字認識結果として検出される。
これにより、例えば、図9に示すように、原稿に「開口部」という文字列が含まれていた場合、「口」という文字に対して漢字の「口」という文字と、カタカナの「ロ」という文字の2通りの文字認識結果が検出される。また、図9に示すように、原稿に「シャープ」という文字が含まれていた場合、「ー」という文字に対して長音符号の「ー」と、漢数字の「一」の2通りの文字認識結果が検出される。
また、文字認識部41は、レイアウト解析部35の判定結果(縦書きであるか横書きであるか)に基づいて、隣接する文字によって構成される単語の認識処理を行う。
例えば、レイアウト解析部35の判定結果が横書きであることを示しており、図9に示すように、原稿に「開口部」という文字列が含まれていた場合、「開口部(かいこうぶ)」と「開ロ部(かいロぶ)」の2通りの単語が検出される。同様に、レイアウト解析部35の判定結果が横書きであることを示しており、図9に示すように、原稿に「シャ−プ」という文字列が含まれていた場合、「しゃーぷ」と「しゃいちぷ」の2通りの単語が検出される。
一方、レイアウト解析部35の判定結果が縦書きであるか横書きであるかの明確な判定が困難であることを示している場合、文字認識部41は、縦書きの場合と横書きの場合の2通りについて単語の検出を行う。例えば、図9に示すように、原稿に、
画面
像に
という文字が含まれている場合、文字認識部41は、「がめん」「ぞうに」という単語(横書きとみなした場合に検出される単語)と、「がぞう」「めんに」という単語(縦書きとみなした場合に検出される単語)の2通りの単語を検出する。
なお、類似度の算出方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。
描画コマンド生成部42は、文字認識部41による文字認識結果に基づく透明テキストを画像ファイル内に配置するための命令を生成する。ここで、透明テキストとは、認識された文字および単語をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。
フォーマット化処理部43は、中間調生成部20から入力された画像データに、描画コマンド生成部42から入力された命令に応じて透明テキストを埋め込み、所定のフォーマットの画像ファイルを生成する。そして、生成した画像ファイルを通信装置5に出力する。なお、本実施形態では、フォーマット化処理部43がPDF形式の画像ファイルを生成する。ただし、画像ファイルのフォーマットはこれに限るものではなく、画像データに透明テキストを埋め込むことができるフォーマットであればよい。
図10は、フォーマット化処理部43によって生成されるPDF形式の画像ファイルの構成を示す説明図である。この図に示すように、上記画像ファイルは、ヘッダ部、ボディ部、相互参照表、およびトレーラ部によって構成されている。
ヘッダ部には、このファイルがPDFファイルであることを示す文字列とバージョン番号とが含まれる。ボディ部には、表示する情報やページ情報などが含まれる。相互参照表には、ボディ部の中身にアクセスするためのアドレス情報が記述されている。トレーラ部には、はじめにどこから読み込むかを示す情報などが記述されている。
ボディ部は、各ページからなるオブジェクトに対する参照情報などが記述される文書カタログ記述部、ページ毎の表示範囲等の情報が記述されるページ記述部、画像データが記述される画像データ記述部、および対応するページを描画する際に適用する条件が記述される画像描画記述部からなる。なお、ページ記述部、画像データ記述部、および画像描画記述部は各ページに対応して設けられる。
図11は、図9に示した原稿から検出された文字認識結果を透明テキストとして画像データに埋め込む場合の画像データ記述部に対する記述の例を示している。この図に示すように、1つの文字に対して複数の文字認識結果が検出された場合には、当該文字に対応する座標と対応付けて上記複数の文字認識結果(文字コード)が記述される。また、縦書きであるか横書きであるかが不明である場合には、縦書きとみなして検出された単語、および横書きとみなして検出された単語の両方が、対応する文字列の座標と対応付けて記述される。
通信装置5は、フォーマット化処理部43から入力された画像ファイルを、ネットワークを介して通信可能に接続された外部装置に送信する。例えば、通信装置5は、上記の画像ファイルを図示しないメール処理部(ジョブ装置)によって電子メールに添付して送信する。
(2−3)画像処理装置3における処理の概要
図1は、画像処理装置3における概略的な処理の流れを示すフロー図である。この図に示すように、まず、制御部24は、操作パネル6を介して入力されるユーザからの処理モードの選択指示を受け付ける(S1)。また、画像入力装置2から、原稿を読み取って得られた画像データを取得する(S2)。
その後、制御部24は、原稿検知部14に傾き角度の検出処理を行わせ(S3)、この検出結果に基づいて原稿補正部15に傾き補正処理を行わせる(S4)。
その後、制御部24は、S1で選択指示された処理モードが画像形成モードであるか否かを判断する(S5)。そして、画像形成モードが選択されたと判断した場合、傾き補正処理を施した画像データに対して所定の処理を施し、画像出力装置4に出力させて(S6)処理を終了する。
一方、S5において画像形成モードではないと判断した場合、制御部24は、S1で選択指示された処理モードが画像送信モードであると判断し、原稿検知部14のレイアウト解析部35にレイアウト解析(原稿画像における文字方向が縦書きであるか横書きであるかを解析する処理)を行わせる(S7)。そして、制御部24は、レイアウト(縦書きであるか横書きであるか)を特定可能であるか否かを判断する(S8)。
S8においてレイアウトを特定可能であると判断した場合、制御部24は、文字認識部41にレイアウト解析部35の解析結果に応じた文字方向に基づいて文字認識処理を行わせる(S9)。一方、S8においてレイアウトを特定不可能であると判断した場合、制御部24は、文字認識部41に縦方向および横方向の両方について文字認識処理を行わせる(S10)。
その後、制御部24は、原稿に含まれる各文字について、複数の文字認識結果が検出されたか否かを判断する(S11)。そして、文字認識結果が1つのみである場合にはその認識結果を採用し(S12)、文字認識結果が複数存在する場合にはこれら複数の文字認識結果を採用する(S13)。
その後、制御部24は、描画コマンド生成部42に文字認識結果に基づく透明テキストを画像データに埋め込むための透明テキストの配置コマンドを生成させ(S14)、フォーマット化処理部43に透明テキストを埋め込んだ画像データについての所定形式の画像ファイルを生成(フォーマット化)させる(S15)。そして、制御部24は、フォーマット化した画像ファイルを、通信装置5を介して外部装置に送信させ(S16)、処理を終了する。
以上のように、本実施形態にかかるデジタルカラー複合機1は、原稿から読み取った画像データに基づいて文字認識処理を行い、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、作成した各テキストデータを透明テキストとして画像データに埋め込む。
これにより、画像データに埋め込まれた透明テキストに基づいてキーワード検索を行う場合に、キーワードの検索漏れが生じることを抑制できる。
図12(a)〜図12(f)は、図9に示した原稿から読み取った画像データに基づいて生成された画像ファイルに対してキーワードの検索処理を行った場合の検索結果の例を示す説明図である。
本実施形態では、横書きとみなした場合に検出される単語と、縦書きとみなした場合に検出される単語の両方が透明テキストとして画像データに埋め込むので、図12(a)および図12(b)に示すように、キーワードを「画面」とした場合と「画像」とした場合の両方において対応する文字列が抽出される。
また、本実施形態では、1つの文字に対して複数の文字認識結果が検出された場合に、これら複数の文字認識結果を透明テキストとして画像データに埋め込むので、図12(c)および図12(d)に示すように、「開口部」という文字列に対して、キーワードを「開口部(かいこうぶ)」とした場合にも「開ロ部(かいロぶ)」とした場合にもこの「開口部」という文字列が抽出される。同様に、図12(e)および図12(f)に示すように、「シャ−プ」という文字列に対して、キーワードを「しゃーぷ」とした場合にも「しゃいちぷ」とした場合にもこの「シャープ」という文字列が抽出される。
なお、本実施形態では、原稿検知部14が2値化および低解像度化した画像データを画像ファイル生成部22へ出力するものとしているが、これに限るものではなく、例えば、図3に破線で示したように、原稿補正部15が上記の2値化および低解像度化された画像データに対して傾き補正処理を施した画像データを画像ファイル生成部22に出力し、画像ファイル生成部22の文字認識部41が傾き補正後の上記画像データを用いて文字認識処理を行うようにしてもよい。これにより、傾き補正前の画像データに基づいて文字認識を行う場合よりも文字認識の精度を向上させることができる。
また、本実施形態では、原稿検知部14によって白黒2値(輝度信号)に変換され、かつ低解像度(例えば300dpi)に変換された画像データに基づいて文字認識を行っている。これにより、文字サイズが比較的大きい場合であっても文字認識処理を適切に行える。ただし、文字認識処理に用いる画像の解像度は上記した例に限るものではない。
また、本実施形態では、フォーマット化処理部43がPDF形式の画像ファイルを生成する場合の実施例について説明したが、これに限るものではなく、画像データとテキストデータとを対応付けることが可能な形式の画像ファイルであればよい。例えば、プレゼンテーションソフトなどのフォーマットでテキストデータを配置した上に画像データを重畳させて配置し、テキストデータを不可視状態にし、画像データのみを可視状態にした画像ファイルを作成するようにしてもよい。
また、本実施形態では、透明テキストを埋め込んだ画像データを、通信装置5を介して外部装置に送信する場合について説明したが、これに限るものではない。例えば、透明テキストを埋め込んだ画像データを、デジタルカラー複合機1に備えられる記憶部あるいはデジタルカラー複合機1に脱着可能に装着される記憶部に記憶させるようにしてもよい。
また、本実施形態では、文字認識部41が原稿検知部14または原稿補正部15から入力される2値化および低解像度化を施された画像データに基づいて文字認識処理を施すものとしているが、これに限るものではない。例えば、図13に示すように、領域分離部21から出力される領域分離信号を文字認識部41に入力させ、文字認識部41がこの領域分離信号に基づいて、文字領域(文字エッジと判定された画素からなる画像領域)を示すテキストマップを生成し、文字領域に対してのみ文字認識処理を行うようにしてもよい。
あるいは、図14に示すように、画像データに基づいて原稿の種別を判別する原稿種別自動判別部25を設け、この原稿種別自動判別部25から出力される原稿種別判別信号を文字認識部41に入力させ、原稿種別判別信号が文字を含む原稿(例えば文字原稿、文字印刷写真原稿、文字印画紙写真原稿など)であることを示す場合にのみ文字認識部41が基づいて文字認識処理を行うようにしてもよい。原稿種別自動判別部25における原稿種別の判別方法は、少なくとも文字を含む原稿と文字を含まない原稿とを判別できる方法であれば特に限定されるものではなく、従来から公知の種々の方法を用いることができる。
また、本実施形態では、本発明をデジタルカラー複合機に適用する場合について説明したが、これに限らず、モノクロの複合機に適用してもよい。また、複合機に限らず、例えば単体の画像読取装置に適用してもよい。
図15は、本発明を画像読取装置に適用する場合の構成例を示すブロック図である。この図に示す画像読取装置100は、画像入力装置2、画像処理装置3b、通信装置5、および操作パネル6を備えている。画像入力装置2、通信装置5、および操作パネル6の構成および機能は上述したデジタルカラー複合機1の場合と略同様なので、ここではその説明を省略する。
画像処理装置3bは、A/D変換部11、シェーディング補正部12、入力処理部13、原稿検知部14、原稿補正部15、色補正部16、画像ファイル生成部22、記憶部23、および制御部24を備えている。また、画像ファイル生成部22は、文字認識部41、描画コマンド生成部42、およびフォーマット化処理部43を備えている。
なお、画像形成モードを備えていない点、および、色補正部16が色補正処理後の画像データをフォーマット化処理部43に出力し、フォーマット化処理部43が色補正部16から入力された画像データに基づいて外部装置に送信する画像ファイルを生成する点以外は、画像処理装置3bに備えられる各部の機能は上述したデジタルカラー複合機1の場合と略同様である。画像処理装置3bにおいて上述した各処理が施されて生成された画像ファイルは、通信装置5により、ネットワークを介して通信可能に接続されたコンピュータやサーバなどに送信される。
また、上記各実施形態において、デジタルカラー複合機1、画像読取装置100に備えられる各部(各ブロック)を、CPU等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、デジタルカラー複合機1、画像読取装置100は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複合機1、画像読取装置100の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複合機1、画像読取装置100に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、デジタルカラー複合機1、画像読取装置100を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
また、デジタルカラー複合機1、画像読取装置100の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、原稿から読み取って取得した画像データとこの画像データに対する文字認識処理によって得られたテキストデータとを対応付けた画像ファイルを作成する画像処理装置、画像読取装置、および画像送信装置に適用できる。
本発明の一実施形態にかかる画像処理装置における処理の流れを示すフロー図である。 本発明の一実施形態にかかる画像処理装置の概略構成、および画像形成モードにおけるデータの流れを示すブロック図である。 図2に示した画像処理装置における画像送信モードでのデータの流れを示すブロック図である。 図2に示した画像処理装置に備えられる画像入力装置の構成例を示す断面図である。 図2に示した画像処理装置に備えられる原稿検知部の概略構成を示すブロック図である。 図4に示した画像入力装置におけるスキャン範囲とスキャン時の原稿位置との関係の一例を示す説明図である。 図5に示した原稿検知部におけるレイアウト解析処理を説明するための説明図である。 図2に示した画像処理装置において中間調補正処理に用いるガンマ曲線の一例を示すグラフである。 図4に示した画像入力装置によって読み取られる原稿の一例を示す説明図である。 図2に示した画像処理装置において画像送信モードのときに送信される画像ファイルの構成を示す説明図である。 図2に示した画像処理装置において、画像データに透明テキストを埋め込むためのコマンドの例を示す説明図である。 (a)〜(f)は、図2に示した画像処理装置において生成された画像ファイルに対するキーワード検索結果の例を示す説明図である。 図2に示した画像処理装置の変形例を示すブロック図である。 図2に示した画像処理装置の変形例を示すブロック図である。 図2に示した画像処理装置の変形例を示すブロック図である。
符号の説明
1 デジタルカラー複合機(画像処理装置、画像読取装置、画像送信装置)
2 画像入力装置
3、3b 画像処理装置
4 画像出力装置
5 通信装置
6 操作パネル
14 原稿検知部
15 原稿補正部
21 領域分離部
22 画像ファイル生成部
23 記憶部
24 制御部
31 信号変換部
32 2値化処理部
33 解像度変換部
34 原稿傾き検知部
35 レイアウト解析部
41 文字認識部
42 描画コマンド生成部
43 フォーマット化処理部
100 画像読取装置(画像処理装置、画像読取装置)

Claims (12)

  1. 原稿から読み取って取得した画像データに基づいて上記原稿に含まれる文字の文字認識処理を行う文字認識部と、文字認識処理によって得られたテキストデータと上記画像データとを対応付けた画像ファイルを作成する画像ファイル生成部とを備えた画像処理装置であって、
    上記文字認識部は、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、
    上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴とする画像処理装置。
  2. 上記文字認識部は、1つの文字に対する文字認識結果の候補として複数の文字が検出された場合に、これら複数の文字に対応するテキストデータをそれぞれ作成し、
    上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴とする請求項1に記載の画像処理装置。
  3. 上記画像データに基づいて、上記原稿に記載された単語または文章が縦書きであるか横書きかであるかを解析するレイアウト解析部を備え、
    上記文字認識部は、上記レイアウト解析部によって上記原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合に、縦書きに応じた文字認識処理と横書きに応じた文字認識処理の両方を行い、これら両方の文字認識処理の結果に応じたテキストデータをそれぞれ作成し、
    上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴とする請求項1または2に記載の画像処理装置。
  4. 上記文字認識部は、
    上記画像データに含まれる各文字に対する文字認識結果と上記レイアウト解析部の解析結果とに基づいて上記原稿に含まれる単語の認識処理を行うようになっており、
    上記レイアウト解析部によって上記原稿に記載された単語または文章が縦書きであるか横書きかであるかを特定できない場合に、縦書きに応じた単語の認識処理で検出された単語と横書きに応じた単語の認識処理で検出された単語の両方に対応するテキストデータをそれぞれ作成し、
    上記画像ファイル生成部は、上記文字認識部が作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴とする請求項3に記載の画像処理装置。
  5. 上記画像ファイル生成部は、上記画像ファイルにおいて上記テキストデータと上記画像データにおける当該テキストデータに対応する文字の上記原稿上の位置とを対応付けることを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。
  6. 上記画像ファイル生成部は、
    上記テキストデータを、上記画像データにおける当該テキストデータに対応する文字の上記原稿上の位置に応じた位置に透明テキストとして配置することを特徴とする請求項5に記載の画像処理装置。
  7. 原稿を読み取って原稿画像の画像データを取得する画像読取部と、
    請求項1から6のいずれか1項に記載の画像処理装置とを備えていることを特徴とする画像読取装置。
  8. 請求項1から6のいずれか1項に記載の画像処理装置と、
    上記画像ファイル生成部によって生成された画像ファイルを通信可能に接続された他の装置に送信する通信部とを備えていることを特徴とする画像送信装置。
  9. 請求項1から6のいずれか1項に記載の画像処理装置と、
    画像データに応じた画像を記録材上に形成する画像形成部とを備えていることを特徴とする画像形成装置。
  10. 原稿から読み取って取得した画像データに基づいて上記原稿に含まれる文字の文字認識処理を行う文字認識工程と、文字認識処理によって得られたテキストデータと上記画像データとを対応付けた画像ファイルを作成する画像ファイル生成工程とを含む画像処理方法であって、
    上記文字認識工程においては、複数通りの文字認識結果の候補が検出された場合に、これら各候補に対応するテキストデータをそれぞれ作成し、
    上記画像ファイル生成工程においては、上記文字認識工程で作成した各テキストデータを上記画像データに対応付けて上記画像ファイルを作成することを特徴とする画像処理方法。
  11. 請求項1から6のいずれか1項に記載の画像処理装置を動作させるプログラムであって、コンピュータを上記の各部として機能させるためのプログラム。
  12. 請求項11に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008321210A 2008-12-17 2008-12-17 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体 Pending JP2010146185A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008321210A JP2010146185A (ja) 2008-12-17 2008-12-17 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
CN2009102591274A CN101753764B (zh) 2008-12-17 2009-12-11 图像处理装置及方法、图像读取装置、图像发送装置
US12/639,574 US8363963B2 (en) 2008-12-17 2009-12-16 Apparatus, method and computer readable medium that associates a plurality of possible word recognition results with an image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008321210A JP2010146185A (ja) 2008-12-17 2008-12-17 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体

Publications (1)

Publication Number Publication Date
JP2010146185A true JP2010146185A (ja) 2010-07-01

Family

ID=42240153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008321210A Pending JP2010146185A (ja) 2008-12-17 2008-12-17 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体

Country Status (3)

Country Link
US (1) US8363963B2 (ja)
JP (1) JP2010146185A (ja)
CN (1) CN101753764B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015179336A (ja) * 2014-03-18 2015-10-08 株式会社リコー 画像処理装置、画像処理方法、およびプログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5111242B2 (ja) * 2008-06-04 2013-01-09 キヤノン株式会社 画像処理装置及び方法
JP5547717B2 (ja) * 2009-04-07 2014-07-16 ローム株式会社 光電変換装置および撮像装置
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP6052657B2 (ja) * 2012-03-13 2016-12-27 パナソニックIpマネジメント株式会社 対象物検証装置、対象物検証プログラム、及び対象物検証方法
US20140307973A1 (en) * 2013-04-10 2014-10-16 Adobe Systems Incorporated Text Recognition Techniques
JP6330505B2 (ja) * 2014-06-18 2018-05-30 ブラザー工業株式会社 画像読取装置
JP6330506B2 (ja) 2014-06-18 2018-05-30 ブラザー工業株式会社 画像読取装置
CN106155994B (zh) * 2016-06-30 2019-04-26 广东小天才科技有限公司 一种页面内容的比较方法及装置、终端设备
JP6866636B2 (ja) * 2016-12-26 2021-04-28 カシオ計算機株式会社 文字編集方法、電子機器、及び、プログラム
US10679087B2 (en) * 2018-04-18 2020-06-09 Google Llc Systems and methods for merging word fragments in optical character recognition-extracted data
JP2023128907A (ja) * 2022-03-04 2023-09-14 シャープ株式会社 画像処理装置および画像処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000036530A (ja) * 1998-04-04 2000-02-02 Tokyo Electron Ltd 搬送機構及び処理装置
JP2006072524A (ja) * 2004-08-31 2006-03-16 Canon Inc 情報処理装置および情報処理方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520489A (ja) 1991-07-16 1993-01-29 Mitsubishi Electric Corp 文字認識装置
JPH0554177A (ja) 1991-08-22 1993-03-05 Ricoh Co Ltd 文字認識装置
JPH07182463A (ja) 1993-12-22 1995-07-21 Toshiba Corp 文字認識装置及び方法
JPH07182462A (ja) 1993-12-22 1995-07-21 Toshiba Corp 文字認識装置及び方法
JPH07192088A (ja) 1993-12-27 1995-07-28 Toshiba Corp 画像処理方法及び装置
JP3338537B2 (ja) 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
JPH087033A (ja) * 1994-06-16 1996-01-12 Canon Inc 情報処理方法及び装置
US7130487B1 (en) 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium
JP2004280514A (ja) 2003-03-17 2004-10-07 Toppan Forms Co Ltd Pdfファイル及びpdfファイル作成システム
CN1312625C (zh) * 2004-07-02 2007-04-25 清华大学 基于游程邻接图的复杂背景彩色图像中字符提取方法
US20070022233A1 (en) * 2005-07-20 2007-01-25 Lexmark International, Inc. Document processing device with USB drive
CN101009095A (zh) * 2007-01-24 2007-08-01 蒋清晓 全自动智能盲用阅读器
CN200997199Y (zh) * 2007-01-24 2007-12-26 蒋清晓 一种全自动智能盲用阅读器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000036530A (ja) * 1998-04-04 2000-02-02 Tokyo Electron Ltd 搬送機構及び処理装置
JP2006072524A (ja) * 2004-08-31 2006-03-16 Canon Inc 情報処理装置および情報処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015179336A (ja) * 2014-03-18 2015-10-08 株式会社リコー 画像処理装置、画像処理方法、およびプログラム

Also Published As

Publication number Publication date
US20100149569A1 (en) 2010-06-17
CN101753764B (zh) 2012-09-26
CN101753764A (zh) 2010-06-23
US8363963B2 (en) 2013-01-29

Similar Documents

Publication Publication Date Title
JP5280425B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP4758502B2 (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2010146185A (ja) 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
JP4772888B2 (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US8634650B2 (en) Image processing apparatus, image forming apparatus, image reading apparatus, and image processing method
JP4927122B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
US8238614B2 (en) Image data output processing apparatus and image data output processing method excelling in similarity determination of duplex document
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
US8184912B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
JP2009015820A (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
US20080310730A1 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
JP4362537B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP2012118863A (ja) 画像読取装置、画像形成装置、画像読取方法、プログラムおよびその記録媒体
JP2012074852A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2010161745A (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP6860609B2 (ja) 画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2010273119A (ja) 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP2011010232A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP5197464B2 (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP2010286917A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP2006270148A (ja) 画像処理方法および画像処理装置並びに画像形成装置
JP2016178451A (ja) 画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP2010130634A (ja) 画像処理装置、画像データ出力処理装置、画像処理方法、プログラムおよびその記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101109