JP5159588B2 - 画像処理装置、画像処理方法、コンピュータプログラム - Google Patents

画像処理装置、画像処理方法、コンピュータプログラム Download PDF

Info

Publication number
JP5159588B2
JP5159588B2 JP2008311229A JP2008311229A JP5159588B2 JP 5159588 B2 JP5159588 B2 JP 5159588B2 JP 2008311229 A JP2008311229 A JP 2008311229A JP 2008311229 A JP2008311229 A JP 2008311229A JP 5159588 B2 JP5159588 B2 JP 5159588B2
Authority
JP
Japan
Prior art keywords
color
character
data
color information
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008311229A
Other languages
English (en)
Other versions
JP2010136192A (ja
Inventor
誠 榎本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008311229A priority Critical patent/JP5159588B2/ja
Priority to US12/629,728 priority patent/US8295602B2/en
Publication of JP2010136192A publication Critical patent/JP2010136192A/ja
Application granted granted Critical
Publication of JP5159588B2 publication Critical patent/JP5159588B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像処理結果の複数のデータを、ユーザが利用しやすくなるように保存するための装置、方法、コンピュータプログラムに関する。
近年、インターネットに代表されるようなネットワークの広がりにより、文書が電子的に配布される機会も増えたが、電子文書が紙に印刷された状態で配布されることも多い。
手元に紙文書だけを所有しているような場合、紙文書をスキャンやデジタルカメラ撮影することにより得た画像に対して文字認識処理などを行い、テキストデータに変換してから利用する技術が考えられている。例えば、特許文献1では、端末から文書画像をサーバに送信し、サーバ上で文字認識を行い、更に、文字認識結果に属性を付与して再利用しやすいフォーマットに変換して端末に戻す技術が開示されている。
また、引用文献2,3には、文字や図形の輪郭に基づいて、ベクトルデータを生成する技術が開示されている。
特開平11−167532号公報 特許第3026592号公報 特開2005−346137号公報
ユーザが再利用したいデータの形式は場合によって異なるが、それぞれがユーザにとって利用しやすい状態で配置されたデータ形式の電子ドキュメント(電子データ)が生成されることが望まれる。例えば、文字を、文字コードで表されるテキストデータとして編集などに使いたいユーザにとっては、文字認識結果が利用しやすい状態で配置される事が望ましい。一方、ユーザがテキストデータを用いた編集などを考えずに、そのまま印刷などの用途に利用したい場合、文字認識結果は誤認識している可能性があるので、文字認識結果のテキストデータは、逆にユーザにとっては使いにくいデータになる。
また、特許文献2や3の技術を用いて、文字のベクトルデータを抽出し、ベクトルオブジェクトとして描画する方法がある。このようなベクトルデータは、そのまま印刷などの用途に利用する場合には適しているが、ユーザがテキストデータの編集などに利用する場合には向いていない。
このように、ユーザが文字情報をテキストデータとして編集して使用したい場合や、印刷やディスプレイ出力して使用したい場合など、目的によって最適なデータ形態は変わる。したがって、1つの電子ドキュメントで、各目的を同時に満たす事は困難である。
上記課題を解決するために、本発明の画像処理装置は、入力された画像内に含まれる文字領域と文字色とを解析する解析手段と、前記文字領域内の文字画像に対して文字認識処理を実行することにより、文字コードデータを得る文字認識手段と、前記文字領域内の文字画像に対してベクトル化処理を実行することにより、ベクトルデータを得るベクトル化手段と、複数の色情報定義それぞれについての生成ルールと前記解析手段で解析した文字色とに基づいて、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を定義する色情報定義を、複数生成する色情報定義生成手段と、前記文字認識手段で得た文字コードデータと、前記ベクトル化手段で得たベクトルデータと、前記色情報定義生成手段で生成した複数の色情報定義とを含む電子文書を生成する電子文書生成手段と、を有し、前記生成ルールは、前記複数の色情報定義それぞれについて、前記文字色で描画するデータの種類と透明色で描画するデータの種類とを設定したルールであって、前記複数の色情報定義ごとに前記文字色で描画するデータの種類と前記透明色で描画するデータの種類とが異なることを特徴とする。
本発明によれば、文字領域の認識結果である文字コードデータとベクトルデータとを簡単に切り換えられる電子ドキュメント(電子データ)を提供することができる。したがって、ユーザは、用途に応じて必要なデータを容易に使い分けることが可能となる。
<実施形態1>
図1は、本実施形態1を用いたシステム構成を示す図の一例である。100は本発明を実現するための画像処理装置の構成例である。画像処理装置100は、スキャナ101、CPU102、メモリ013、ハードディスク104、ネットワークI/F105を備えるものとする。スキャナ101は、文書をスキャンして、当該スキャンした文書の紙面情報を画像データに変換する。CPU102は、本発明に係るコンピュータ実行可能な電子ドキュメント生成プログラム(コンピュータプログラム)を実行することにより、画像データに対して、後述する本発明の処理を施す各処理ユニットとして機能する。メモリ103は、該プログラムを実行する際のワークメモリやデータの一時保存などに利用され、ハードディスク104は該プログラムやデータを格納する。なお、本実施形態では、コンピュータプログラムはハードディスク104に格納され、CPUが必要に応じてメモリ103に該プログラム呼び出して実行するものとするが、これに限るものではない。例えば、コンピュータプログラムは、その他のコンピュータ読み取り可能な記憶媒体(例えばCD−ROMやUSBメモリなど)を介して供給されるものであってもよい。ネットワークI/F105は、ネットワークを介して外部装置とデータの入出力を行うためのインターフェースである。
パーソナルコンピュータ(PC)120は、画像処理装置100とLAN110などのネットワークを介して接続され、画像処理装置100から送信された電子ドキュメントを受信する。PC120は、不図示のCPU、メモリ、ハードディスク、ディスプレイ等を備える汎用コンピュータで構成されるものとする。そして、PC120のCPUはハードディスクに格納された表示・編集プロラグム121を実行することにより、画像処理装置100から送信されてきた電子ドキュメントを、画面に表示し編集することが可能である。
図2は本実施形態1の各処理部(処理ユニット)の動作を示すブロック図である。なお、図2で行われる各処理は、CPU102で電子ドキュメント生成プログラムを実行することによって実現されるものとするが、本発明はこれに限るものではなく、その一部又は全部を電気回路(ハードウェア)で構成するようにしても構わない。
入力画像200は、スキャナ101やカメラ等から入力される入力画像(文書画像データ)である。電子ドキュメント生成部210は、この入力画像200から電子ドキュメント220を生成する。
ブロック211〜216は、電子ドキュメント生成部210で実行される各処理を模式的に示したものである。
解析部211は、入力された文書画像を解析することにより、文字色と文字領域を抽出する。ここで、解析部211は、公知の領域抽出処理(領域分割処理)を行うことにより、文字領域や図画領域や写真領域など、属性毎の領域を抽出することが可能であるとする。更に、各文字領域から文字色(文字代表色)を抽出する。文字色は、公知の文字代表色の決定手法を用いることができ、例えば、類似する文字色ごとに平均値を求めて、文字代表色を決定することができる。
文字認識部212は、解析部211から抽出された文字領域について文字認識を行い、文字コードデータを取得して、OCR結果を表示するためのOCRオブジェクトデータを生成する。OCRオブジェクトデータには、文字コード情報の他に、当該文字を抽出した位置を示す座標や、文字認識の際に抽出された文字サイズ情報などの情報が含まれる。すなわち、文字認識部212は、文字認識処理を実行することにより、文字コードデータを含むOCRオブジェクトデータを生成する。
ベクトル化部213は、解析部から抽出された文字領域について各文字の輪郭情報を抽出し、ベクトルデータで近似することにより、ベクトル描画するためのベクトルオブジェクトデータを生成する。すなわち、ベクトル化部213は、ベクトル化処理を実行することにより、ベクトルオブジェクトデータ(ベクトルデータ)を生成する。
色情報生成部214は、文字認識部212が出力するOCRオブジェクトデータと、ベクトル化部213が出力するベクトルオブジェクトデータとに対して、それぞれのカラーID(色情報)を生成し、電子ドキュメントの中で使用するカラーIDとして設定する。
色情報定義生成部215は、色情報生成部214で生成された各カラーIDを参照して、OCRオブジェクトデータ226とベクトルオブジェクトデータ225とに対して、実際の描画色を割り当てる色情報定義223・224を生成する。
フォーマット変換部216は、色情報を割り当てたOCRオブジェクトデータ226とベクトルオブジェクトデータ226、色情報定義生成部215で生成した色情報定義223・224を、電子ドキュメント220のフォーマットへ変換する。すなわち、フォーマット変換部216は、OCRオブジェクトデータ(文字コード)とベクトルオブジェクトデータ(ベクトルデータ)と色情報定義とを含む電子ドキュメント(電子文書ファイル)を生成する電子文書生成部として機能する。
このようにして生成された電子ドキュメント220は、型定義情報221と表示情報222とによって構成され、PC120にある表示・編集プログラム121によって表示・編集が可能である。型定義情報221は、表示・編集プログラム121において、型定義の変更時に用いられるデータであり、複数の色情報定義223,224などによって構成される。表示情報222は、表示・編集プログラム121において表示情報描画時に用いられるデータであり、ベクトルオブジェクトデータ225、OCRオブジェクトデータ226によって構成される。
以下に図3のフローチャートを用いて、色情報生成部214が実行する処理を説明する。
ステップS301では、解析部211で抽出した文字領域の内、未処理の領域を選択する。
ステップS302では、当該選択した文字領域の文字色が、既に、カラーID(色の識別子)を付与済みの色であるか否かを判定する(すなわち、以前に同じ色の文字色を処理したことがあるか否かを判定する)。まだカラーIDが付与されていない文字色であると判定した場合(すなわち、同じ色の文字色を処理したことが無いと判定した場合)は、ステップS303へ進む。一方、カラーIDが既に付与されている文字色であると判定した場合(すなわち、以前に同じ色の文字色を処理したことがあると判定した場合)は、ステップS308へ進む。
ステップS303では、OCRオブジェクト用として、新たなカラーIDを該文字色に付与する。すなわち、該文字色が関連付けられた新たなカラーIDが生成される。
ステップS304では、ステップS303で生成したカラーIDを、当該文字領域のOCRオブジェクトに対する描画色として関連付け設定する。
ステップS305では、ベクトルオブジェクト用として、更に新たなカラーIDを該文字色に付与する。すなわち、該文字色が関連付けられた新たなカラーID(ステップS303で生成されたカラーIDと異なるカラーID)が生成される。
ステップS306では、ステップS305で生成したカラーIDを、当該文字領域のベクトルオブジェクトに対する描画色として関連付け設定する。
ステップS307では、解析部211で抽出した文字領域の内、未処理の文字領域が残っているかを判断する。未処理の文字領域が見つかれば、ステップS301へ戻り、処理を繰り返す。未処理の文字領域が無ければ、処理を終了する。
ステップS308では、処理対象の文字領域の文字色に対して、OCRオブジェクト用として既に付与済みのカラーIDを判別し、当該処理対象の文字領域のOCRオブジェクトに当該判別したカラーIDを関連付け設定する。すなわち、他の文字領域において同色のOCRオブジェクトがあれば、同じカラーIDが関連付けられることになる。
ステップS309では、処理対象の文字領域の文字色に対して、ベクトルオブジェクト用として既に付与済みのカラーIDを判別し、当該処理対象の文字領域のベクトルオブジェクトに当該判別したカラーIDを関連付け設定する。すなわち、他の文字領域において同色のベクトルオブジェクトがあれば、同じカラーIDが関連付けられることになる。
以下、入力画像200の例として図5の画像500を、電子ドキュメント生成部210が処理する場合を説明する。
解析部211は、公知の画像解析処理を用いて入力画像中の文字領域と文字色を抽出する。例えば、画像中から各文字を構成する画素の集合を抽出し、さらにそれらのうち、同じくらいの大きさの画素集合の並び具合を判定し、文字行や段落を形成すると判定した画素集合の領域を文字領域として抽出する。なお、文字を構成する画素の集合を抽出する手法としては、入力多値画像から近似色画素塊を抽出する手法や、多値画像を二値化して2値画像における黒画素塊に基づいて抽出する手法を用いることができる。また、多値画像を微分してエッジ画像を生成し、エッジ画素の連結領域を抽出する手法などを用いてもよい。
画像500の例では、点線で囲まれる領域501と502がそれぞれ異なる文字色を有する文字領域として抽出されたものとする。
文字認識部212では、公知の文字認識技術を用いて各文字領域内の文字認識を行い、文字認識結果の文字コードデータと文字の大きさとで構成されるOCRオブジェクトデータを生成する。
文字認識処理の1例について簡単に説明する。本説明はあくまで一例であって別の手法を用いてもよい。文字認識処理では、処理対象の文字領域の縦書き横書きすなわち行方向を判断し、行ごとの画像に分割する。例えば、画像を二値化し、垂直方向のヒストグラムと水平方向のヒストグラムを取り、そのヒストグラムに基づいて行方向を判定し、文字行ごとに分割する方法がある。次に行画像を個々の文字画像へと分割する。これは、行画像に対して、行と垂直方向への射影を取り、切断すべき文字間を発見することで文字画像へと分割すればよい。そしてそれら文字画像ひとつひとつに対して特徴を取り、あらかじめ全字種分の特徴を保存した辞書から一番特徴の近いものを探し、辞書が示す文字コードを各文字の認識結果とする。
また、文字の大きさは、各文字を認識する際に得られる文字画像の大きさを平均した値として得ることができるが、他の方法を用いてもよい。
図6は、画像500を、解析部211と文字認識部212とで処理した結果、文字位置、文字サイズ、文字色、文字認識結果文字列とが得られたことを示す。図6では、文字領域501からは、文字色としてRGB色「#000000」、文字認識結果として文字列「ABC」が得られた。文字領域502からは、文字色としてRGB色「#0000FF」、文字認識結果として文字列「DEF」が得られたことを示している。
ベクトル化部213では、公知のベクトル化技術を用いて各文字領域の画像データから文字のベクトルオブジェクトデータを生成する。ベクトル化技術の例としては、特許文献2や特許文献3に開示される方法がある。例えば、特許文献2では、画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出する。次に、これら画素間ベクトル同士の接続状態をもとに、画像データの輪郭を抽出することで、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術を開示している。また、特許文献3では、アウトラインベクトルを直線や2次や3次のベジェ曲線で近似することで、大きく変倍しても高画質なベクトル記述データをする技術を開示している。
画像500に対して行われる色情報生成部214での処理を、図3のフローチャートに従って説明する。
ステップS301で、未処理の文字領域として、まず文字領域501を選択する。
ステップS302では、処理済の文字色はまだ無い(カラーIDが付与された文字色が無い)ので、ステップS303に進む。
ステップS303では、OCRオブジェクト用として、新規のカラーID「clr1」を生成して、文字領域501で得た文字色(RGB色「#000000」)を関連付ける。
ステップS304では、ステップS303で生成したカラーIDを、文字領域501から得たOCRオブジェクトの描画色に設定する。
ステップS305では、ベクトルオブジェクト用として、新規のカラーID「clr3」を生成して、文字領域501で得た文字色(RGB色「#000000」)を関連付ける。
ステップS306では、ステップS305で生成したカラーIDを、文字領域501から得たベクトルオブジェクトの描画色に設定する。
ステップS307では、まだ文字領域502が未処理の為、ステップS301に戻り、文字領域502を処理対象にする。
そして、ステップS302では、文字領域502の文字色が、既にカラーIDを付与済みの色であるか否かを判定する。すなわち、文字領域502の文字色「#0000FF」と関連付けられているカラーIDがあるかチェックする。図5の例では、文字領域502の文字色「#0000FF」はまだカラーIDが付与されていないため、ステップS303へ進む。
ステップS303では、OCRオブジェクト用として、新規のカラーID「clr2」を生成して、文字領域502で得た文字色(RGB色「#0000FF」)を関連付ける。そして、そのカラーIDをステップS304で文字領域502から得たOCRオブジェクトの描画色に設定する。
ステップS305では、ベクトルオブジェクト用として、新規のカラーID「clr4」を生成して、文字領域502で得た文字色(をRGB色「#0000FF」)を関連付ける。そして、そのカラーIDを、ステップS306で文字領域502から得たベクトルオブジェクトの描画色に設定する。
ステップS307では、既に全文字領域に対して処理を行った為、処理を終了する。
なお、上述した例では、カラーIDとして、便宜上「clr1」「clr2」「clr3」「clr4」と命名したが、もちろんこの名称に限るものではない。また、OfficeOpenXMLなど、フォーマットの種類によっては、あらかじめカラーID(色情報)が割り振られているフォーマットもあるので、その場合はあらかじめ指定されているカラーIDを使用することとなる。
図2に戻って、色情報定義生成部215では、例えば図4のような予め設定しておいたルール(色情報定義の生成ルール)に基づいて複数の色情報定義(カラー・セット)を生成する。本実施形態では、2種類のカラー・セット(2種類のテーマ)の配色を決定する。本実施形態において、色情報定義の生成ルールには、色情報定義それぞれにおいて、文字色で描画するデータの種類と透明色で描画するデータの種類とが設定されている。すなわち、生成ルールには、OCRオブジェクト(文字コード)とベクトルオブジェクト(ベクトルデータ)について、通常の文字色と透明色とのいずれで描画するかを色情報定義ごとに設定しておく。
図4のルールに従えば、まず、第1の色情報定義(色情報定義名「OCR表示」)として、OCRオブジェクト用のカラーID「clr1」「clr2」に対してアルファチャネルを100%に設定し、ベクトルオブジェクト用のカラーID「clr3」「clr4」に対してアルファチャネルを0%(すなわち透明色)に設定したテーマを生成する。次に、第2の色情報定義(色情報定義名「アウトライン表示」)として、OCRオブジェクト用のカラーID「clr1」「clr2」に対してアルファチャネルを0%、ベクトルオブジェクト用のカラーID「clr3」「clr4」に対してアルファチャネルを100%に設定したテーマを生成する。このようにして、計2種類の色情報定義(2種類のカラー・セット)が生成される事になる。図7に、生成された色情報定義の結果を示す。
なお、ここでは全ての色情報に関して元の文字色を適用しているが、アルファチャネル0%に設定された色に関しては、透明で描画されるため、RGB値は文字色以外の値にしても構わない。
フォーマット変換部216では、色情報定義生成部215で生成された2種類の色情報定義223,224とともに、OCRオブジェクトデータ226とベクトルオブジェクトデータ225を格納した電子ドキュメント220を生成する。このとき、文字認識部212で生成したOCRオブジェクトデータ226、およびベクトル化部213で生成したベクトルオブジェクトデータ225が、色情報生成部214でそれぞれに関連付けられたカラーIDで描画されるように記述されている。2種類の色情報定義(カラー・セット)223,224が格納されているので、表示・編集プログラム121では、色情報定義を切り換えることによりOCRオブジェクトデータやベクトルオブジェクトデータを表示することができるようになる。
図8の電子ドキュメント800は、本実施例の説明のために作られた仮想的なXMLフォーマットに従って作られた電子ドキュメント220の例である。
要素名<DefineStyle>と</DefineStyle>で挟まれた箇所801は電子ドキュメントの型定義情報221を格納する部分である。801には、2種類の色情報定義803、804が格納されている。図8では、初期表示で使用されるカラー・セットとして、要素<ColorSet>において属性“default”がtrueになっている色情報定義804(「ベクトル表示」)が選ばれている。
要素名<Layout>と</Layout>で挟まれた個所802は、電子ドキュメントの表示情報を格納する部分である。802には、OCR結果のテキストを描画するためのOCRオブジェクトデータ805と、ベクトル化結果を描画するためのベクトルオブジェクトデータ806とが格納されている。ここで、OCRオブジェクトデータ805は、カラーID「clr1」、「clr2」が関連づけられているので、色情報定義803が選択された場合には文字色で描画され、色情報定義804が選択された場合には透明になる。また、ベクトルオブジェクトデータ806には、カラーID「clr3」「clr4」が関連付けられているので、色情報定義803が選択された場合には透明になり、色情報定義804が選択された場合には文字色描画されることになる。
なお、生成される電子ドキュメント220の要素名および木構造は、表示・編集プログラム121の仕様に準じて生成されるものとする。すなわち、表示・編集プログラム121の種類によっては、図8以外の要素名や木構造で出力されることもありうる。
次に、図5の画像500から生成された図8の電子ドキュメント800を、図1のパーソナルコンピュータ120で実行される表示・編集プログラム121で処理する際の例を説明する。
図9は、表示・編集プログラム121に電子ドキュメント800を入力したときの表示例である。
表示・編集プログラム121による表示ウィンドウ901は、編集ウィンドウ902、色定義切り換えメニューウィンドウ903を含む。
編集ウィンドウ902には、電子ドキュメント220中の表示情報222の内容に従った表示がなされる。図8の電子ドキュメント800を表示する場合、OCRオブジェクトデータ(テキスト描画データ)805や、ベクトルオブジェクトデータ(ベクトル描画データ)806の内容が描画される。
この編集ウィンドウ902内で、ユーザはベクトルオブジェクトの拡大縮小、色情報の変更などといったベクトル編集作業や、テキストオブジェクトの文字列編集、フォント種類変更、サイズ変更、色情報変更などのテキスト編集作業が可能である。また編集後の電子ドキュメントを保存したり、902に表示されたとおりの外観で紙面を印刷することも可能である。
図8の電子ドキュメント800に対しては、色情報定義のデフォルト値が、色情報定義名「ベクトル表示」804となっている。したがって、初期状態の表示では、「clr1」「clr2」にアルファチャネル0%、「clr3」「clr4」にアルファチャネル100%が設定され、ベクトルオブジェクトが設定された文字色で編集ウィンドウ上に描画される。したがって、ユーザはベクトルオブジェクトに対してベクトル編集作業を容易に行う事ができる。
色定義切り換えメニューウィンドウ903には、電子ドキュメント220中の型定義情報221の内容に従って、色情報定義223,224をユーザの指示に従って切り換える事が可能なメニュー(ラジオボタン)が表示されている。ユーザが色定義を切り換え指示する事で、切り換え内容を反映し、編集ウィンドウ902の表示が更新される。図8では、2種類の色情報定義「OCR表示」と「ベクトル表示」が設定されているので、図9の903に、2種類の色情報定義の切り換えボタンが表示される。
ユーザが、色定義切り換えメニューウィンドウ903で色情報を「OCR表示」に切り換えた場合、電子ドキュメント800中の、色情報定義803を適用し、「clr1」「clr2」にアルファチャネル100%、「clr3」「clr4」にアルファチャネル0%が設定される。したがって、ベクトルオブジェクトが透明になり、OCRオブジェクトが設定された文字色で編集ウィンドウ上に描画される。
なお、図9の例では、色定義の切り換えに表示ウィンドウ901上に表示されるメニュー903を使用しているが、その他の選択方式を用いても構わない。
図10は、ユーザが色定義を「OCR表示」に切り換え、更に、文字列「ABC」を「ab」へ編集した場合の表示例である。「OCR表示」の場合は、テキストデータのため、キーボードなどを使って簡単に変更することが可能である。また、「OCR表示」を行って、更に、OCR結果のテキストデータをコピーし、他のアプリケーション等で再利用することも簡単にできる。
なお、図8の例では、文字認識により、元の文字画像が全て正しく認識されたが、誤認識している場合もありうる。その場合は、「OCR表示」で表示した場合に、元の入力画像と見た目が異なってしまうが、もし見た目を再現して印刷、表示を行いたいのであれば、「ベクトル表示」に切り換えれば良い。また、ベクトル表示とOCR表示を簡単に切り換えられるので、OCR結果の文字列を修正することも容易である。
メニューなどのユーザーインターフェースから色情報定義の切り換えが容易にできるので、目的に応じてデータを使い分けることも容易になる。例えば、スキャンした文書をそのままの形で印刷やプレゼンテーションをしたい場合は「ベクトル表示」を選択すればよい。また、スキャン文書の文言などをテキストデータとして編集して扱いたい場合は「OCR表示」を選択すればよい。
以上説明したように、本実施例によれば、画像内に含まれる文字領域について、同じ文字領域からベクトル化した情報(ベクトルデータ)と文字認識した情報(文字コード)とを得て、それぞれに異なるカラーIDを付与する。そして、複数の色情報定義それぞれで透明にするカラーIDを変えるように設定する。ベクトルデータと文字コードとそれぞれのカラーIDと複数の色情報定義とを含む電子文書を作成する。このように、複数の色情報定義それぞれで透明にするカラーIDを変えるように設定することで、ベクトル化した情報(ベクトルデータ)と文字認識した情報(文字コード)とを簡単な選択操作で切り換え表示させることができる。
このように生成した電子データは表示・編集プログラム121において、メニューなどからユーザが容易に切り換え選択し、使用することができる。
すなわち本実施例では、文字領域の認識結果である文字コードデータとベクトルデータの両方を保持し、ユーザの目的に応じてどちらを表示させるか簡単に切り換えることができる電子文書の提供が可能である。
また、表示・編集プログラム121として、例えば、マイクロソフト社のパワーポイント2007(商標)などのプレゼンテーション用アプリケーションを用いることができる。この場合、フォーマット変換部216では、図7で説明した「OCR表示」の色のセットと「ベクトル表示」の色のセットとのそれぞれが、パワーポイント2007のテーマの配色パターンに設定されるように変換して電子文書を作成する。このように、本発明によれば、パワーポイント2007などの市販のアプリケーションにおいて、OCR結果のテキストデータと文字の輪郭から生成したベクトルデータとを、容易に切り換え表示できる電子文書を作成することができる。なお、表示・編集プログラム121は、パワーポイント2007に限るものではなく、上述したような色定義切り換えメニューウィンドウ903のような、色情報定義を切り換えるためのユーザーインターフェースを備えるアプリケーションであればよい。
<実施形態2>
実施形態1では、単純な2種の色情報定義の切り換えであったが、目的に応じて、さらに多種の色情報定義を生成してもよい。
以下では、色情報定義生成ルールとして図11を適用する場合の処理を説明する。図11では、4種類の色情報定義を設定するようにしている。
図17は、実施形態2において、図2の色情報生成部214が実行する処理について、フローチャートを用いて説明した図である。
ステップS1701では、解析部211で抽出した文字領域の内、未処理の領域を選択する。
ステップS1702では、当該選択した文字領域の文字色が、既に、カラーID(色の識別子)を付与済みの色であるか否かを判定する(すなわち、以前に同じ色の文字色を処理したことがあるか否かを判定する)。まだカラーIDが付与されていない文字色であると判定した場合(すなわち、同じ色の文字色を処理したことが無いと判定した場合)は、ステップS1703へ進む。一方、カラーIDが既に付与されている文字色であると判定した場合(すなわち、以前に同じ色の文字色を処理したことがあると判定した場合)は、ステップS1708へ進む。
ステップS1703では、OCRオブジェクト用として、新たなカラーIDを該文字色に付与する。すなわち、該文字色が関連付けられた新たなカラーIDが生成される。
ステップS1704では、ステップS1703で生成したカラーIDを、当該文字領域のOCRオブジェクトに対する描画色として関連付け設定する。
ステップS1705では、ベクトルオブジェクト用として、更に新たなカラーIDを該文字色に付与する。すなわち、該文字色が関連付けられた新たなカラーID(ステップS303で生成されたカラーIDと異なるカラーID)が生成される。
ステップS1706では、ステップS1705で生成したカラーIDを、当該文字領域のベクトルオブジェクトに対する描画色として関連付け設定する。
ステップS1707では、解析部211で抽出した文字領域の内、未処理の文字領域が残っているかを判断する。未処理の文字領域が見つかれば、ステップS1701へ戻り、処理を繰り返す。未処理の文字領域が無ければ、処理を終了する。
ステップS1708では、該文字領域の認識精度が、ステップS1702で同色と判定されたカラーIDが関連付けられた文字領域の認識精度範囲に含まれるかを判断する。本実施形態では、認識精度(文字類似度)の範囲として、高精度(90%以上)、中精度(70%以上〜90%未満)、低精度(70%未満)の3つの範囲に分類するものとする。認識精度の範囲に含まれると判断したならばステップS1709に進み、含まれないと判断した場合はステップS1703へ進む。
ステップS1709では、該処理対象の文字領域から得た文字色と認識精度とに関してOCRオブジェクト用として既に付与済みのカラーIDを判別し、当該処理対象の文字領域のOCRオブジェクトに当該判別したカラーIDを関連付け設定する。すなわち、他の文字領域において同色で且つ同精度のOCRオブジェクトがあれば、同じカラーIDが関連付けられることになる。
ステップS1710では、処理対象の文字領域から得た文字色と認識精度に関してベクトルオブジェクト用として既に付与済みのカラーIDを判別し、当該処理対象の文字領域のベクトルオブジェクトに当該判別したカラーIDを関連付け設定する。すなわち、他の文字領域において同色で且つ同精度のベクトルオブジェクトがあれば、同じカラーIDが関連付けられることになる。
以下、入力画像200の例として図12の画像1200を、実施形態2の電子ドキュメント生成部210が処理する場合を説明する。
解析部211は、入力画像中の文字領域を抽出する。画像1200に対して、点線で囲まれる領域、1201、1202、1203および1204がそれぞれ異なる文字色を有する文字領域として抽出されたものとする。
文字認識部212では、各文字領域内の文字認識を行い、文字認識結果の文字コードデータと、文字認識の確からしさの指標である認識精度(類似度)の値とを得る。本実施形態において、認識精度の値に関しては、各文字領域において、文字の文字認識結果の類似度の平均を求めることによって、文字領域の認識精度を決定するものとするが、これに限るものでない。本実施形態では、複数の文字を1つの文字領域として扱っているが、これに限るものではなく、個々の文字画像を別々の文字領域として扱うようにしても構わない。
図13は、画像1200から抽出した文字領域と、文字認識した結果を表している。ここでは、文字領域1201に対して文字色「#000000」と文字認識結果「ABC」と認識精度「High」とが得られたものとする。また、文字領域1202に対して文字色「#0000FF」と文字認識結果「DEF」と認識精度「Middle」とが得られたものとする。また、文字領域1203に対して文字色「#000000」と文字認識結果「UVVVV」と認識精度「Low」とが得られたものとする。また、文字領域1204に対して文字色「#FF0000」と文字認識結果「XYZ」と認識精度「High」とが得られたものとする。
ベクトル化部213では、公知のベクトル化技術を用いて各文字領域の画像データから文字のベクトル描画データを生成する。
画像1200に対して行われる色情報生成部214での処理を、図17のフローチャートに従って説明する。
ステップS1701で、未処理の文字領域として、まず文字領域1201を選択する。
ステップS1702では、処理済の文字色はまだ無いため(カラーIDが付与された文字色が無い)、ステップS1703に進む。
ステップS1703では、OCRオブジェクト用として、新規のカラーID「clr1」を生成して、文字領域1201で得た文字色(RGB色「#000000」)を関連付ける。
ステップS1704では、ステップS1703で生成したカラーIDを、文字領域1201から得たOCRオブジェクトの描画色に設定する。
ステップS1705では、ベクトルオブジェクト用として、新規のカラーID「clr5」を生成して、文字領域1201で得た文字色(RGB色「#000000」)を関連付ける。
ステップS1706では、ステップS1705で生成した色情報を、文字領域1201から得たベクトルオブジェクトの描画色に設定する。
ステップS1707では、未処理の文字領域1202があるため、ステップS1701に戻り、文字領域1202を処理対象にする。
そして、ステップS1702では、文字領域1202の文字色が既にカラーIDを付与済みの色であるか否かを判定する。すなわち、文字領域1202の文字色「#0000FF」と関連付けられているカラーIDがあるかチェックする。図12の例では、文字領域1202の文字色「#0000FF」はまだカラーIDが付与されていないため、ステップS1703へ進む。
ステップS1703では、OCRオブジェクト用として、新規のカラーID「clr2」を生成して、文字領域1202で得た文字色(RGB色「#0000FF」)を関連付ける。そして、そのカラーIDをステップS1704で文字領域1202から得たOCRオブジェクトの描画色に設定する。
ステップS1705では、ベクトルオブジェクト用として、新規のカラーID「clr6」を生成して、文字領域1202で得た文字色(RGB色「#0000FF」)を関連付ける。そして、そのカラーIDを、ステップS1706で文字領域1202から得たベクトルオブジェクトの描画色に設定する。
ステップS1707では、未処理の文字領域1203があるため、ステップS1701に戻り、文字領域1203を処理対象にする。
ステップS1702では、文字領域1203の文字色が既にカラーIDを付与済みの色であるか否かを判定する。すなわち、文字領域1203の文字色「#000000」と関連付けられているカラーIDがあるかチェックする。図12の例では、文字領域1203の文字色「#000000」に対して、カラーID「clr1」、clr5”が存在するため、S1708へ進む。
ステップS1708では、ステップS1702で得られたカラーID「clr1」と「clr5」を付加された文字領域1201の認識精度の範囲に、文字領域1203から得た認識精度が同一か判断する。すなわち、文字領域1203での文字認識精度が属する認識精度範囲が、文字領域1201での文字認識精度が属する認識精度範囲と同じであるか判断する。
ここで、文字領域1201の認識精度は「High」であるのに対し、文字領域1203の認識精度「Low」であったとすると、ステップS1703へ進む。
ステップS1703では、OCRオブジェクト用として、新規のカラーID「clr3」を生成して、文字領域1203で得た文字色(RGB色「#000000」)を関連付ける。そして、そのカラーIDをステップS1704で文字領域1203から得たOCRオブジェクトの描画色に設定する。
ステップS1705では、ベクトルオブジェクト用として、新規のカラーID「clr7」を生成して、文字領域1203で得た文字色(RGB色「#000000」)を関連付ける。そして、そのカラーIDを、ステップS1706で文字領域1203から得たベクトルオブジェクトの描画色に設定する。
ステップS1707では、未処理の文字領域1204があるため、ステップS1701に戻り、文字領域1204を処理対象にする。
ステップS1702では、文字領域1204の文字色が既にカラーIDを付与済みの色であるか否かを判定する。すなわち、文字領域1204の文字色「#FF0000」と関連付けられているカラーIDがあるかチェックする。図12の例では、文字領域1204の文字色「#FF0000」はまだカラーIDが付与されていないため、ステップS1703へ進む。
ステップS1703では、OCRオブジェクト用として、新規のカラーID「clr4」を生成して、文字領域1204で得た文字色(RGB色「#FF0000」)を関連付ける。そして、そのカラーIDをステップS1704で文字領域1204から得たOCRオブジェクトの描画色に設定する。
ステップS1705では、ベクトルオブジェクト用として、新規のカラーID「clr8」を生成して、文字領域1204で得た文字色(RGB色「#FF0000」)を関連付ける。そして、そのカラーIDを、ステップS1706で文字領域1204から得たベクトルオブジェクトの描画色に設定する。
ステップS1707では、既に全文字領域に対して処理を行った為、処理を終了する。
なお、上述した例では、カラーIDとして、便宜上「clr1」〜「clr8」と命名したが、勿論この名称に限るものではない。また、OfficeOpenXMLなど、フォーマットの種類によっては、あらかじめカラーID(色情報)が割り振られている事もあるので、その場合はあらかじめ指定されたカラーIDを使用することとなる。
次に、色情報定義生成部215では、図11のように設定しておいたルール(色情報定義の生成ルール)に基づいて色情報定義(カラー・セット)を生成する。本実施形態では、4種類のカラー・セット(4種類のテーマ)の配色を決定する。本実施形態において、色情報定義の生成ルールには、色情報定義それぞれにおいて、文字色で描画するデータの種類と透明色で描画するデータの種類とが設定されている。すなわち、生成ルールには、OCRオブジェクト(文字コード)とその認識精度とベクトルオブジェクト(ベクトルデータ)とに基づき、通常の文字色と透明色とのいずれで描画するかを色情報定義ごとに設定しておく。
図14は図11のルールと図13の文字認識結果とに従って、色情報定義を生成した結果である。
第1の色情報定義(色情報定義名「全てOCR表示」)に関しては、OCRオブジェクト用のカラーID「clr1」〜「clr4」に対してアルファチャネル100%、ベクトルオブジェクト用のカラーID「clr5」〜「clr8」に対してアルファチャネルを0%(すなわち透明色)を設定する。
第2の色情報定義(中精度以上OCR表示)に関しては、OCRオブジェクト用のカラーIDで且つ認識精度が「Middle」以上のカラーID(すなわち「clr1」「clr2」「clr4」)と、ベクトルオブジェクト用のカラーIDで且つ認識精度が「Middle」未満のカラーID(すなわち「clr7」)とをアルファチャネル100%に設定する。そして、それ以外のカラーID(すなわち「clr3」「clr5」「clr6」「clr8」)をアルファチャネル0%に設定する。
第3の色情報定義(高精度OCR表示)に関しては、OCRオブジェクト用のカラーIDで且つ認識精度が「High」以上のカラーID(すなわち、「clr1」「clr4」)に対してアルファチャネル100%を設定する。また、ベクトルオブジェクト用のカラーIDで且つ認識精度が「High」未満のカラーID(すなわち「clr6」「clr7」)をアルファチャネル100%に設定する。そして、それ以外のカラーID(すなわち「clr2」「clr3」「clr5」「clr8」)にはアルファチャネル0%を設定する。
第4の色情報定義(全てベクトル表示)に関しては、ベクトルオブジェクト用のカラーID「clr5」〜「clr8」に対してアルファチャネル100%、OCRオブジェクト用のカラーID「clr1」〜「clr4」に対してアルファチャネル0%を設定する。
フォーマット変換部216では、色情報定義生成部215で生成された4種類の色情報定義とともに、OCRオブジェクトデータとベクトルオブジェクトデータとを格納した電子ドキュメントを生成する。このとき、文字認識部212で生成したOCRオブジェクトデータ、およびベクトル化部213で生成したベクトルオブジェクトデータが、色情報生成部214でそれぞれに関連付けられたカラーIDで描画されるように記述されている。更に、4種類の色情報定義(カラー・セット)が格納されているので、表示・編集プログラム121では、色情報定義を切り換えることにより、OCRオブジェクトデータやベクトルオブジェクトデータを各条件に適した状態で表示することができるようになる。
図15の電子ドキュメント1500は、本実施例の説明のために作られた仮想的なXMLフォーマットに従って作られた電子ドキュメントの例である。
要素名<DefineStyle>と</DefineStyle>で挟まれた箇所1501は電子ドキュメントの型定義情報221を格納する部分である。1501には、4種類の色情報定義1503、1504、1505、1506が格納されている(なお、図15では、紙面の都合上、一部の記述を省略している)。図15では、初期表示で使用されるカラー・セットとして、要素<ColorSet>において属性“default”がtrueになっている色情報定義1506(「全てベクトル表示」)が選ばれている。
要素名<Layout>と</Layout>で挟まれた個所1502は、電子ドキュメントの表示情報を格納する部分である。1502には、OCR結果のテキストを描画するためのOCRオブジェクトデータ(テキスト描画情報)1507と、ベクトル化結果を描画するためのベクトルオブジェクトデータ(ベクトル描画情報)1508とが格納されている。
なお、生成される電子ドキュメントの要素名および木構造は、表示・編集プログラム121の仕様に準じて生成されるものとする。すなわち、表示・編集プログラム121の種類によっては、図15以外の要素名や木構造で出力されることもありうる。
次に、図12の画像1200から生成された図15の電子ドキュメント1500を、図1のパーソナルコンピュータ120で実行される表示・編集プログラム121で処理する際の例を説明する。
図16は、表示・編集プログラム121に電子ドキュメント1500を入力したときの表示例である。
表示・編集プログラム121により表示される表示ウィンドウ1601は、編集ウィンドウ1602、色定義切り換えメニューウィンドウ1603を含む。
編集ウィンドウ1602には、電子ドキュメント中の表示情報の内容に従った表示がなされる。図15の電子ドキュメント1500を表示する場合、OCRオブジェクトデータ(テキスト描画データ)1507や、ベクトルオブジェクトデータ(ベクトル描画データ)1508の内容が描画される。
この編集ウィンドウ1602内で、ユーザはベクトルオブジェクトの拡大縮小、色情報の変更などといったベクトル編集作業や、テキストオブジェクトの文字列編集、フォント種類変更、サイズ変更、色情報変更などのテキスト編集作業が可能である。また編集後の電子ドキュメントを保存したり、902に表示されたとおりの外観で紙面を印刷することも可能である。
図15の電子ドキュメント1500に対しては、色情報定義のデフォルト値が、色情報定義名「すべてベクトル表示」1506となっている。したがって、初期状態の表示では、「clr1」〜「clr4」にアルファチャネル0%、「clr5」〜「clr8」にアルファチャネル100%が設定され、ベクトルオブジェクトが設定された文字色で編集ウィンドウ上に描画される。したがって、ユーザはベクトルオブジェクトに対してベクトル編集作業を容易に行う事ができる。
色定義切り換えメニューウィンドウ1603には、電子ドキュメント中の型定義情報の内容に従って、色情報定義をユーザの指示に従って切り換える事が可能なメニュー(ラジオボタン)が表示されている。ユーザが色定義を切り換え指示する事で、切り換え内容を反映し、編集ウィンドウ1602の表示が更新される。
図15の電子ドキュメント1500では、4種類の色情報定義「全てOCR表示」「中精度OCR表示」「高精度OCR表示」「全てベクトル表示」が設定されているので、図16の1603に、4種類の色情報定義の切り換えボタンが表示される。
ユーザが、色定義切り換えメニューウィンドウ1603で色情報定義を「全てOCR表示」に切り換えた場合、電子ドキュメント1500中の色情報定義1503を適用し、「clr1」〜「clr4」にアルファチャネル100%、「clr5」〜「clr8」に対してアルファチャネル0%が設定される。したがって、OCRオブジェクトが設定された文字色で編集ウィンドウ上に描画され、ユーザはOCRオブジェクトに対して、テキスト編集することが可能となる。
なお、図13の文字領域1203のように、文字認識結果に誤りが生じる場合がある。このように、認識に誤りが発生している場合、色情報定義「全てOCR表示」を適用すると、図18のように、元の入力画像と見た目に差異が生じてしまうが、もし見た目を再現して印刷、表示を行いたいのであれば、「ベクトル表示」に切り換えれば良い。また、「高精度OCR表示」を選択すれば、認識精度(類似度)の高い文字はOCR結果のテキストを用いて再現し、認識精度の低い文字画像はベクトルデータを用いて再現することができる。また、ベクトル表示とOCR表示を簡単に切り換えられるので、OCR結果の文字列を修正することも容易である。
色情報定義の種類をより詳細化することで、文章の一部分のみを編集したいユーザにとっては文字認識精度の低い文字領域については、ベクトル表示を行い、なるべく見た目の情報を維持しつつ、編集したい箇所に関して編集操作をする事が可能となる。
なお、本実施例では認識精度を基準として色情報定義のルールを作成しているが、その他の基準を用いても良い。例えば、文書中の上部にある閾値以上の文字列をタイトルと判断し、タイトルと本文とで切り換えを分ける色情報定義を作成しても良い。
以上説明したように、本実施例によれば、画像内に含まれる文字領域ついて、同じ文字領域からベクトル化した情報と文字認識した情報とを生成し、それらの情報と複数の色情報定義とを含む電子文書を作成する。そして、複数の色情報定義それぞれで透明にする情報を変えるように設定することで、ベクトル化した情報と文字認識した情報とを簡単な選択操作で切り換え表示させることができる。
このように生成した電子データは表示・編集プログラム121において、メニューなどからユーザが容易に切り換え選択し、使用することができる。
すなわち本実施例では、文字領域の認識結果である文字コードデータとベクトルデータの両方を保持し、例えば文字認識の精度を基準として、文字領域ごとに表示される情報を切り換え可能な文書の提供が可能である。
本発明実施形態の構成例を示す図 本実施形態1の動作を説明する図 本実施形態1における色情報生成手段を説明する図 本実施形態1における色情報定義の生成ルールの例 本実施形態1における入力画像の例 本実施形態1における解析、文字認識の結果の例 本実施形態1における色情報定義生成結果の例 本実施形態1における変換された電子ドキュメントの例 本実施形態1における表示・編集プログラムに電子ドキュメントを表示した例 本実施形態1における表示・編集プログラムを用いて電子ドキュメントの色情報定義を切り換えて編集した例 本実施形態2における色情報定義の生成ルールの例 本実施形態2における入力画像の例 本実施形態2における解析、文字認識の結果の例 本実施形態2における色情報定義生成結果の例 本実施形態2における変換された電子ドキュメントの例 本実施形態2における表示・編集プログラムに電子ドキュメントを表示した例 本実施形態2における色情報生成手段を説明する図 本実施形態1における表示・編集プログラムを用いて電子ドキュメントの色情報定義を切り換えて表示した例

Claims (9)

  1. 入力された画像内に含まれる文字領域と文字色とを解析する解析手段と、
    前記文字領域内の文字画像に対して文字認識処理を実行することにより、文字コードデータを得る文字認識手段と、
    前記文字領域内の文字画像に対してベクトル化処理を実行することにより、ベクトルデータを得るベクトル化手段と、
    複数の色情報定義それぞれについての生成ルールと前記解析手段で解析した文字色とに基づいて、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を定義する色情報定義を、複数生成する色情報定義生成手段と、
    前記文字認識手段で得た文字コードデータと、前記ベクトル化手段で得たベクトルデータと、前記色情報定義生成手段で生成した複数の色情報定義とを含む電子文書を生成する電子文書生成手段と、
    を有し、
    前記生成ルールは、前記複数の色情報定義それぞれについて、前記文字色で描画するデータの種類と透明色で描画するデータの種類とを設定したルールであって、前記複数の色情報定義ごとに前記文字色で描画するデータの種類と前記透明色で描画するデータの種類とが異なることを特徴とする画像処理装置。
  2. 前記文字認識処理の結果を表示させるための第1の色情報定義の生成ルールは、前記文字コードデータの描画の色を前記文字色に設定し且つ前記ベクトルデータの描画の色を前記透明色に設定するルールであり、
    前記ベクトル化処理の結果を表示させるための第2の色情報定義の生成ルールは、前記文字コードデータの描画の色を前記透明色に設定し且つ前記ベクトルデータの描画の色を前記文字色に設定するルールであることを特徴とする請求項1に記載の画像処理装置。
  3. 同じ文字画像から得られる、前記文字認識手段で得た文字コードデータと前記ベクトル化手段で得たベクトルデータとに対して、異なるカラーIDを関連付ける色情報生成手段を更に有し、
    前記色情報定義生成手段は、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を、前記関連付けられているカラーIDに関連付けることにより、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を定義することを特徴とする請求項1または2のいずれかに記載の画像処理装置。
  4. 前記色情報生成手段は、同じ文字色の文字画像に対しては、前記文字認識手段で得た文字コードデータと前記ベクトル化手段で得たベクトルデータのそれぞれで、同じカラーIDを関連付けることを特徴とする請求項3に記載の画像処理装置。
  5. 前記データの種類は、前記文字コードデータと前記ベクトルデータと前記文字認識手段での認識精度とに基づいて定められるものであり、
    前記色情報定義生成手段は、前記複数の色情報定義それぞれについての生成ルールと前記解析手段で解析した文字色と前記文字認識手段での認識精度とに基づいて、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を定義することを特徴とする請求項1乃至のいずれかに記載の画像処理装置。
  6. 前記電子文書生成手段で生成された電子文書は、前記電子文書に含まれている複数の色情報定義を切り換えて表示させるためのユーザーインターフェースを備えるアプリケーションで表示されることを特徴とする請求項1乃至のいずれかに記載の画像処理装置。
  7. 解析手段が、入力された画像内に含まれる文字領域と文字色とを解析する解析ステップと、
    文字認識手段が、前記文字領域内の文字画像に対して文字認識処理を実行することにより、文字コードデータを得る文字認識ステップと、
    ベクトル化手段が、前記文字領域内の文字画像に対してベクトル化処理を実行することにより、ベクトルデータを得るベクトル化手段と、
    色情報定義生成手段が、複数の色情報定義それぞれについての生成ルールと前記解析ステップで解析した文字色とに基づいて、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を定義する色情報定義を、複数生成する色情報定義生成ステップと、
    電子文書生成手段が、前記文字認識ステップで得た文字コードデータと、前記ベクトル化ステップで得たベクトルデータと、前記色情報定義生成ステップで生成した複数の色情報定義とを含む電子文書を生成する電子文書生成ステップと、
    を有し、
    前記生成ルールは、前記複数の色情報定義それぞれについて、前記文字色で描画するデータの種類と透明色で描画するデータの種類とを設定したルールであって、前記複数の色情報定義ごとに前記文字色で描画するデータの種類と前記透明色で描画するデータの種類とが異なることを特徴とする画像処理方法。
  8. コンピュータを、入力された画像内に含まれる文字領域と文字色とを解析する解析手段、
    前記文字領域内の文字画像に対して文字認識処理を実行することにより、文字コードデータを得る文字認識手段、
    前記文字領域内の文字画像に対してベクトル化処理を実行することにより、ベクトルデータを得るベクトル化手段、
    複数の色情報定義それぞれについての生成ルールと前記解析手段で解析した文字色とに基づいて、前記文字コードデータの描画の色と前記ベクトルデータの描画の色を定義する色情報定義を、複数生成する色情報定義生成手段、
    前記文字認識手段で得た文字コードデータと、前記ベクトル化手段で得たベクトルデータと、前記色情報定義生成手段で生成した複数の色情報定義とを含む電子文書を生成する電子文書生成手段、
    として機能させるためのコンピュータプログラムであって、前記生成ルールは、前記複数の色情報定義それぞれについて、前記文字色で描画するデータの種類と透明色で描画するデータの種類とを設定したルールであって、前記複数の色情報定義ごとに前記文字色で描画するデータの種類と前記透明色で描画するデータの種類とが異なることを特徴とするコンピュータプログラム
  9. 請求項に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2008311229A 2008-12-05 2008-12-05 画像処理装置、画像処理方法、コンピュータプログラム Expired - Fee Related JP5159588B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008311229A JP5159588B2 (ja) 2008-12-05 2008-12-05 画像処理装置、画像処理方法、コンピュータプログラム
US12/629,728 US8295602B2 (en) 2008-12-05 2009-12-02 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008311229A JP5159588B2 (ja) 2008-12-05 2008-12-05 画像処理装置、画像処理方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010136192A JP2010136192A (ja) 2010-06-17
JP5159588B2 true JP5159588B2 (ja) 2013-03-06

Family

ID=42231123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008311229A Expired - Fee Related JP5159588B2 (ja) 2008-12-05 2008-12-05 画像処理装置、画像処理方法、コンピュータプログラム

Country Status (2)

Country Link
US (1) US8295602B2 (ja)
JP (1) JP5159588B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2534005C2 (ru) * 2013-02-01 2014-11-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система преобразования моментального снимка экрана в метафайл
JP6432179B2 (ja) * 2014-06-25 2018-12-05 京セラドキュメントソリューションズ株式会社 文書ファイル生成装置及び文書ファイル生成方法
KR102029980B1 (ko) * 2017-08-31 2019-10-08 한국전자통신연구원 대체 텍스트 생성 장치 및 그 방법

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6444486A (en) * 1987-08-12 1989-02-16 Fujitsu Ltd Character generation system
JP3026592B2 (ja) 1990-10-22 2000-03-27 キヤノン株式会社 輪郭抽出方法及びその装置
JPH099161A (ja) * 1995-06-23 1997-01-10 Casio Comput Co Ltd 表示装置
JPH11109944A (ja) * 1997-10-03 1999-04-23 Canon Inc 情報処理装置及びその画像表示方法
JPH11167532A (ja) 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JP4086709B2 (ja) * 2003-05-02 2008-05-14 株式会社リコー 画像処理装置、プログラム及び記憶媒体
US7873218B2 (en) 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
JP4533683B2 (ja) * 2004-06-29 2010-09-01 株式会社リコー 画像処理装置及び画像形成装置
US7782384B2 (en) * 2004-11-05 2010-08-24 Kelly Douglas J Digital camera having system for digital image composition and related method
JP2006345314A (ja) * 2005-06-09 2006-12-21 Canon Inc 画像処理装置および画像処理方法
JP4574467B2 (ja) * 2005-06-30 2010-11-04 キヤノン株式会社 データ処理装置、データ処理方法およびコンピュータプログラム
JP2007028181A (ja) * 2005-07-15 2007-02-01 Canon Inc 画像処理装置
JP4921065B2 (ja) * 2005-09-08 2012-04-18 キヤノン株式会社 情報処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP3120844U (ja) * 2006-02-01 2006-04-20 日本通運株式会社 引越用カラーテープ構造
JP4808052B2 (ja) * 2006-03-14 2011-11-02 株式会社リコー 文書管理装置、文書管理方法、文書管理プログラム及びその記録媒体
JP2006223894A (ja) * 2006-05-19 2006-08-31 Ziosoft Inc 医用画像生成装置および方法、ならびに、プログラム
JP4772604B2 (ja) * 2006-06-30 2011-09-14 三菱電機株式会社 ベクトル図形描画装置及びそのプログラム
JP2008097450A (ja) * 2006-10-13 2008-04-24 Mitsubishi Electric Corp 図形描画装置およびプログラム
JP4854491B2 (ja) * 2006-12-13 2012-01-18 キヤノン株式会社 画像処理装置及びその制御方法
JP4685826B2 (ja) * 2007-04-12 2011-05-18 富士フイルム株式会社 投影画像生成装置、方法、およびプログラム

Also Published As

Publication number Publication date
JP2010136192A (ja) 2010-06-17
US20100142810A1 (en) 2010-06-10
US8295602B2 (en) 2012-10-23

Similar Documents

Publication Publication Date Title
US8954845B2 (en) Image processing device, method and storage medium for two-way linking between related graphics and text in an electronic document
CN101820489B (zh) 图像处理设备及图像处理方法
JP5361574B2 (ja) 画像処理装置、画像処理方法、及びプログラム
KR101334483B1 (ko) 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
US7551753B2 (en) Image processing apparatus and method therefor
US8355578B2 (en) Image processing apparatus, image processing method, and storage medium
JP2010074540A (ja) 画像処理装置
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2012205181A (ja) 画像処理装置およびプログラム
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2006345314A (ja) 画像処理装置および画像処理方法
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP2008004116A (ja) 映像中の文字検索方法及び装置
JP2020115260A (ja) 情報処理装置、及び情報処理プログラム
JP2009303149A (ja) 画像処理装置、画像処理方法及びコンピュータ制御プログラム
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JP2022167414A (ja) 画像処理装置、画像処理方法およびプログラム
JP2006166207A (ja) 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121211

R151 Written notification of patent or utility model registration

Ref document number: 5159588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151221

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees