JP2011188293A - 画像処理装置、画像処理システム、及び画像処理プログラム - Google Patents

画像処理装置、画像処理システム、及び画像処理プログラム Download PDF

Info

Publication number
JP2011188293A
JP2011188293A JP2010052068A JP2010052068A JP2011188293A JP 2011188293 A JP2011188293 A JP 2011188293A JP 2010052068 A JP2010052068 A JP 2010052068A JP 2010052068 A JP2010052068 A JP 2010052068A JP 2011188293 A JP2011188293 A JP 2011188293A
Authority
JP
Japan
Prior art keywords
character
color
image processing
characters
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010052068A
Other languages
English (en)
Other versions
JP5577763B2 (ja
Inventor
Katsuya Koyanagi
勝也 小柳
Shintaro Adachi
真太郎 安達
Hiroyoshi Kamijo
裕義 上條
Kazuhiro Otani
和宏 大谷
Chihiro Matsukuma
ちひろ 松隈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2010052068A priority Critical patent/JP5577763B2/ja
Publication of JP2011188293A publication Critical patent/JP2011188293A/ja
Application granted granted Critical
Publication of JP5577763B2 publication Critical patent/JP5577763B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

【課題】文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される、画像処理装置、画像処理システム、及び画像処理プログラムを提供する。
【解決手段】文字画像からOCR部20で文字を抽出し、文字情報抽出部21で抽出された文字情報である文字の大きさ及び相対的位置に基づいて、抽出された文字を第1文字統合部22が文字行または文字列に統合する。背景色抽出部24で各文字毎に背景色を抽出して、統合された文字行毎または文字列毎に背景色の頻度情報を生成する。また、文字情報抽出部21で抽出された文字の色に基づいて各文字行毎または各文字列毎に文字の色頻度情報を生成する。さらに文字行または文字列毎に、背景色の頻度情報及び文字色の頻度情報に基づいて、当該文字行または文字列の背景色を決定する。第2文字統合部26は、決定された背景色が同じ隣接する文字行または文字列を文字群に統合する。
【選択図】図1

Description

本発明は、画像処理装置、画像処理システム、及び画像処理プログラムに関する。
特許文献1には、画像から文字列を抽出する文字列抽出装置であって、入力した画像から画素の色に基づいて、画素の色が連なる連結成分を抽出する連結成分抽出手段と、連結成分の相対的位置、および、連結成分の太さに基づいて、連結成分を共通の文字列または文字列群を構成する可能性が高いグループにわけるグルーピング手段と、グループ毎に文字認識処理を行い、その結果の書く文字の第1位認識候補の距離値に基づいてグループの文字認識度を決める文字認識手段と、グループの文字認識度にグループが占める矩形領域の面積によって重み付けしたものをグループの評価値とし、全てのグループの組合せについてグループの評価値の和を組合せの評価値とする組合せ評価手段と、組合せの評価値が最も高いグループの組合せを文字列として抽出する文字列抽出手段と、を備えることを特徴とする文字列抽出装置が記載されている。
特開平11−238098号公報
本発明は、文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される、画像処理装置、画像処理システム、及び画像処理プログラムを提供することを目的とする。
上記目的を達成するために、請求項1に記載の画像処理装置は、画像データから複数の文字を抽出する第1の抽出手段と、前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段と、前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段と、前記第2の抽出手段で抽出された背景領域の色が同一であるとみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段と、を備える。
請求項2に記載の画像処理装置は、請求項1に記載の画像処理装置において、前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色に基づいて前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段を備え、前記第2の統合手段は、前記決定手段で決定した背景領域の色が同一とみなす、隣接する前記第1の文字群を第2の文字群に統合する。
請求項3に記載の画像処理装置は、請求項2に記載の画像処理装置において、前記決定手段は、前記第1の文字群の背景となる背景領域の面積に対する、前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合に基づいて、前記第1の文字群の背景となる背景領域の色を決定する。
請求項4に記載の画像処理装置は、請求項1から請求項3のいずれか1項に記載の画像処理装置において、前記第1の抽出手段で抽出された文字に関する情報を文字毎に抽出する第3の抽出手段を備え、前記第1の統合手段は、前記第3の抽出手段で抽出された文字に関する情報が同一であるとみなせる、予め定められた方向に隣接する文字を統合する。
請求項5に記載の画像処理装置は、請求項4に記載の画像処理装置において、前記文字に関する情報は、文字同士の距離及び文字の大きさを含む。
請求項6に記載の画像処理装置は、請求項5に記載の画像処理装置において、前記文字に関する情報は、文字の色を含む。
請求項7に記載の画像処理装置は、請求項1から請求項6のいずれか1項に記載の画像処理装置において、予め文字群の数が設定される設定手段と、前記設定手段に設定されている文字群の数に基づいて、前記第2の統合手段で前記第1の文字群を前記第2の文字群に統合するか否かを判定し、前記第2の文字群に統合しない場合は、前記第1の文字群を前記第2の文字群に統合しないように前記第2の統合手段を制御する制御手段と、を備える。
請求項8に記載の画像処理システムは、文字を含む画像を読み取る読取手段と、前記読取手段で読み取った画像の画像データから抽出した文字を、第1の文字群に統合し、統合された第1の文字群を第2の文字群に統合する請求項1から請求項7のいずれか1項に記載の画像処理装置と、を備える。
請求項9に記載の画像処理プログラムは、第1の抽出手段により、画像データから複数の文字を抽出するステップと、第2の抽出手段により、前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出するステップと、第1の統合手段により、前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合するステップと、第2の統合手段により、前記第2の抽出手段で抽出された背景領域の色が同一であるとみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合するステップと、を備えた処理をコンピュータに実行させるためのものである。
請求項1、請求項8、及び請求項9に記載の発明によれば、文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される。
請求項2に記載の発明によれば、文字の背景色に基づいて、第1の文字群毎の背景領域の色を決定しない場合に比べて、第1の文字群の背景色が適切に抽出される。
請求項3に記載の発明によれば、面積の割合に基づかないで第1の文字群の背景となる背景領域の色を決定する場合に比べて、適切に第1の文字群の背景となる領域の色が決定される。
請求項4に記載の発明によれば、文字に関する情報に基づかないで第1の文字群を統合する場合に比べて、適切に文字が第1の文字群に統合される。
請求項5に記載の発明によれば、文字同士の距離及び文字の大きさに基づかないで第1の文字群を統合する場合に比べて、適切に文字が第1の文字群に統合される。
請求項6に記載の発明によれば、文字の色に基づかないで第1の文字群を統合する場合に比べて、適切に文字が第1の文字群に統合される。
請求項7に記載の発明によれば、第1の文字群を第2の文字群に統合しないように第2の統合手段を制御しない場合に比べて、文字群の数が出力先の制限を超えることを抑制する。
本実施の形態に係る画像処理装置の概略構成の一例を示す機能ブロック図である。 本実施の形態に係る画像処理装置で実行される文字統合処理の流れの一例の概略を示すブロック図である。 本実施の形態に係る画像処理装置の制御部で実行される文字統合処理の具体的一例のフローチャートである。 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景色が第2行目及び第3行目と異なり、文字色が同一であり、第1行目と第2行目との距離が近接している場合を説明するための説明図である。 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景色及び文字色が第2行目及び第3行目と異なり、第1行目と第2行目との距離が近接している場合を説明するための説明図である。 背景色を考慮せずに文字統合処理を行った場合の比較例を説明するための説明図である。 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景色が第2行目及び第3行目と異なり、文字色が同一であり、第1行目と第2行目との距離が離れている場合を説明するための説明図である。 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景領域の一部分の色が他と異なる場合を説明するための説明図である。 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目〜第3行目の背景色及び文字色が同一であり、第1行目と第2行目との距離が離れている場合を説明するための説明図である。 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目〜第3行目の背景色が同一であり、第1行目の文字色が第2行目及び第3行目と異なり、第1行目と第2行目との距離が近接している場合を説明するための説明図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
まず、本実施の形態の画像処理装置の構成について説明する。図1に、本実施の形態の画像処理装置の概略構成の一例の機能ブロック図を示す。
図1に示した本実施の形態の画像処理装置は、制御部12、画像読取部14、記憶部16、オブジェクト分離部18、OCR部20、第1文字統合部22、背景色抽出部24、第2文字統合部26、フォーマット変換部28、U/I部30、及び出力部32を備えて構成されている。
制御部12は、画像処理装置10全体の制御を行うものであり、具体的には、CPU40、ROM42、及びRAM44を含んで構成されている。CPU40で実行される処理のプログラム43は、ROM42に格納されている。なお、本実施の形態では、プログラム43は、予め格納されている構成としているがこれに限らず、プログラム43をCD−ROMやリムーバブルディスク等の記録媒体等に記憶しておき記録媒体から制御部12にインストールするようにしてもよいし、インターネット等の通信回線を介して外部装置から制御部12にインストールするようにしてもよい。RAM44は、CPU40でプログラム43を実行する際の作業用の領域を確保するものである。
画像読取部14は、記録媒体上に形成されている画像を読み取って、画像データを出力する機能を有するものであり、具体的一例としては、スキャナ等が挙げられる。記憶部16は、画像読取部14で読み取った画像データを一時的に記憶する等、画像処理に要するデータ類等を記憶する機能を有するものである。
オブジェクト分離部18は、画像読取部14で読み取った画像データから、文字画像、写真画像、及び表画像等の各オブジェクトを分離する機能を有するものである。
OCR(光学的文字読取)部20は、オブジェクト分離部18で分離された文字画像から個々の文字を抽出する機能を有するものであり、一般的なOCRソフトの機能を用いればよく、特に限定されない。OCR部20は文字情報抽出部21を有しており、抽出された各文字の大きさ、相対的位置(文字同士の距離)、文字色の頻度情報、及び文字の書体(フォント)等を抽出する機能を有するものである。なお、文字情報抽出部21における文字情報抽出処理は、一般的なOCRソフトの機能等を用いるようにしてもよく、文字毎に予め定められた種類の文字情報を取得できるものであれば、特にその手法は限定されない。
第1文字統合部22は、OCR部20で抽出された文字を、文字情報抽出部21で抽出された文字情報に基づいて、文字画像が横書きの場合は、行方向に配列された隣接する文字を行に、また、文字画像が縦書きの場合は、列方向に配列された隣接する文字を列に、統合する機能を有するものである。
背景色抽出部24は、各文字毎に、文字の背景となる領域の色(背景色)を抽出し、第1文字統合部22で統合された行毎、または列毎に背景色の頻度情報に基づいて、各文字行または各文字列の背景色を決定する機能を有するものである。なお、本実施の形態では、具体的一例として、文字の背景となる領域とは、各文字に外接する矩形の(文字字体を除く)領域をいう。また、背景色の頻度情報の抽出は、例えば、文字の色頻度情報の抽出と同様の手法で行えばよく、各文字毎に当該文字の背景となる領域の色頻度情報を取得できるものであれば、特にその手法は限定されない。
第2文字統合部26は、各文字行の、または各文字列の背景色の情報に基づいて、隣接する行、または列を文字群に統合する機能を有するものである。
フォーマット変換部28は、第2文字統合部26により統合された文字群の文字画像データを出力先のフォーマットに合わせた文字画像データに変換する機能を有するものである。
U/I(ユーザインターフェイス)部30は、ユーザが出力先のフォーマット(ファイル形式)等を設定する機能を有するものである。出力部32は、フォーマット変換部28により出力先のフォーマットに合わせて変換されたファイルを外部の装置等に出力する機能を有するものである。
次に、本実施の形態の画像処理装置10の動作について説明する。図2は、本実施の形態の画像処理装置10で実行される文字統合処理の流れの一例の概略を示したブロック図である。図2を参照して、文字統合処理の流れの概略を説明する。画像読取部14により画像が入力されると、オブジェクト分離部18により、オブジェクト分離処理が行われ、文字画像が分離される。分離された文字画像はOCR部20により各文字が抽出され、文字情報抽出部21により抽出された文字情報に基づいて第1文字統合部22で第1文字統合処理(行または列に統合する処理)が行われる。一方、文字情報抽出部21により抽出された文字行毎または文字列毎の文字の色頻度情報、及び背景色抽出部24により抽出された文字行毎または文字列毎の背景色の色頻度情報に基づいて、色情報抽出処理が行われ、さらに抽出された色情報に基づいて、第2文字統合部26で行または列が文字群に統合される。統合された文字群は、フォーマット変換部28で予め定められた出力先のフォーマットに変換されファイルに出力される。
次に、具体的例を参照して、文字統合処理について詳細に説明する。図3に、本実施の形態の画像処理装置10の制御部12で実行される文字統合処理の具体的一例のフローチャートを示す。
ステップ100では、画像読取部14で読み取った画像データからOCR処理により各文字を抽出し、次のステップ102では、文字情報を抽出する。本実施の形態では、文字情報として、各文字の大きさ及び文字同士の距離(相対的位置)を抽出する。次のステップ104では、抽出された文字情報に基づいて、第1文字統合処理を行う。本実施の形態では、文書が横書きの場合は行方向、縦書きの場合は列方向に隣接する文字同士の距離が予め定められた範囲内の距離であり、かつ文字同士の大きさの違いが予め定められた範囲内である隣接する文字同士を文字行または文字列に統合する。なお、第1の統合処理は、少なくとも隣接する文字同士の距離及び大きさに基づいて行えばよいが、さらに色が同一とみなせるか否かにより文字同士を統合することにより、より適切に文字同士が統合され、出力されたファイルにより画像を再現する際に、元の画像(画像読取部14が読み取った画像)により近い画像が再現される。
次のステップ106では、色情報抽出処理により、文字毎に文字の色を抽出し、第1の文字統合処理により統合された文字行または文字列毎に、文字の色頻度情報を生成する。また、文字毎に当該文字の背景色を抽出し、第1の文字統合処理により統合された文字行または文字列毎に、背景色の色頻度情報を生成する。
次のステップ108では、ステップ106で生成した各文字行または各文字列毎の文字の色頻度情報、及び背景色の色頻度情報に基づいて、各文字行または各文字列の背景色を決定する。例えば、生成された色頻度情報(一例としては、明度に関する頻度情報等)により、頻度がもっとも多い色を背景色として決定してもよいし、頻度順に並べたときに予め定められた順番にあたる色を背景色として決定してもよい。なお、具体的一例を挙げて詳細を後述するが、文字行または文字列の領域の面積に対して、背景色の領域が予め定められた面積未満の場合は、当該背景色をその文字行または文字列の背景色として決定しない。このような場合は、その背景色が占める領域を別のオブジェクトとして分離して、取り扱うようにする。
次のステップ110では、ステップ108で決定された背景色に基づいて、各文字行または各文字列を文字群に統合する第2文字統合処理を行う。本実施の形態では、背景色が同一とみなせる隣接する文字行同士または文字列同士を同一の文字群に統合する。
次のステップ112では、設定されている出力先のフォーマットが制限を有しているかを判断する。例えば、出力先(アプリケーション)のフォーマットによっては、文字群の数に上限値が設けられている場合がある。また、出力先によっては、第2の統合を行わずに第1の統合のみを行った状態が望まれる場合がある。本ステップでは、予め指定されている出力先や、ユーザによりU/I部30によって設定された出力先のフォーマットにこのような制限が設けられているかを判断する。制限が設けられていない場合は、否定されてステップ118へ進む。
一方、制限が設けられている場合は、肯定されてステップ114へ進む。ステップ114では、第2文字統合処理で統合された文字群の数が制限されている条件を満たしているかを判断する。満たしている場合は、肯定されてステップ118へ進む。一方、満たしていない場合は、ステップ116へ進み、統合方法を、出力先のフォーマットの制限を満たす方法に変更し、変更した方法に応じた文字群への統合を行った後、ステップ118へ進む。例えば、文字群の数に上限値が設けられている場合は、背景色を考慮せずに統合する方法(背景色が異なる文字行または文字列であっても同一の文字群に統合する方法)としてもよい。また、上限値に達しないうちは第2文字統合処理を行い、上限値に達しそうになったらそれ以降は、背景色を考慮せずに統合する方法に変更するようにしてもよい。また、第1の統合のみを行った状態が望まれる場合は、第2の統合は行わないことにするようにすればよい。
ステップ118では、統合された文字群の画像データを出力先のフォーマットに変換し、文字データをファイルに出力した後、本処理を終了する。
本実施の形態による第2の文字統合処理、及びその効果について具体的例を挙げて詳細に説明する。以下、画像読取部14で読み取った文字画像の原文が横書きの文章であり、「この特許の目的を説明するために」、「資料を用意いたしました」、「確認をお願いいたします」という3つの行に第1の統合処理により統合された場合について説明する。
図4は、「資料を用意いたしました」という行(以下、第2行目という)及び「確認をお願いいたします」という行(以下、第3行目という)の背景色が同一であり、「この特許の目的を説明するために」という行(以下、第1行目という)文字の背景色が異なる場合を示している。また、図4に示した例では、第1行目〜第3行目の文字色は同一であり、第1行目と第2行目との距離が近接している(同一の文字群とみなせる距離)場合を示している。
このような場合では、第2統合処理では、第1行目は他の行と統合せずに単独で1つの文字群50とし、第2行目及び第3行目を統合して1つの文字群52とする。このようにすることにより、文字群50に対して背景色の情報が付加された状態でファイルに出力されるため、再現時には、図4に示すように、原文の状態が再現される。
また、図5は、第1行目の文字色及び背景色が、第2行目及び第3行目の文字色及び背景色と異なっており、第1行目と第2行目との距離が近接している場合を示している。なお、以下の図では、図示の都合上、文字の字体を斜体にすることにより、文字の色が異なることを表現している。
このような場合では、第2統合処理では、第1行目は他の行と統合せずに単独で1つの文字群54とし、第2行目及び第3行目を統合して1つの文字群56とする。このようにすることにより、文字群54に対して背景色の情報が付加された状態でファイルに出力されるため、再現時には、図5に示すように、原文の状態が再現される。なお、本実施の形態のように、背景色によらずに文字列を統合する場合、第1行目〜第3行目は1つの文字群に統合されるため、当該文字群に対して背景色の情報が付加されるため、再現時には、図5に示すようにはならず、図6に示すように、第1行目〜第3行目全ての背景色が同一となってしまい、原文とは異なる状態が再現されることになる。
また、図7は、第1行目の背景色が、第2行目及び第3行目の文字色及び背景色と異なっており、文字色は同一であり、第1行目と第2行目との距離が図4及び図5の状態よりも離れている場合を示している。
このような場合では、第2統合処理では、第1行目は他の行と統合せずに単独で1つの文字群58とし、第2行目及び第3行目を統合して1つの文字群60とする。このようにすることにより、文字群58に対して背景色の情報が付加された状態でファイルに出力されるため、再現時には、図7に示すように、原文の状態が再現される。
このように図4〜図7を参照して説明したように、本実施の形態では、背景色が異なる文字行同士は、文字色及び文字行同士の距離にかかわらず、別の文字群に統合することにより、元の画像の状態が再現される。
また、図8に示すように、第1行目の背景領域の一部分が、第2行目及び第3行目の背景色と異なっている場合について説明する。当該背景領域の一部分の占める領域の面積が、第1行目の文字領域の面積(第1行目の文字の背景領域全体の面積)に対して予め定められた割合(具体的一例としては50%)未満である場合は、第1行目〜第3行目の背景色は同一色であるとして、第2統合処理が行われる。従って、第1行目〜第3行目は1つの文字群62に統合される。また、色が他と異なった第1行目の背景領域の一部分は、別のオブジェクト64としてファイルに出力される。このようにすることにより、再現時には、文字データのオブジェクト62と、オブジェクト64とが合成されるため、図8に示すように、原文の状態が再現される。
またさらに、図9は、第1行目〜第3行目の文字色及び背景色が同一であり、第1行目と第2行目との距離が図4及び図5の状態よりも離れている場合を示している。このような場合では、第2統合処理では、第1行目〜第3行目を統合して1つの文字群66とする。このようにすることにより、再現時には、図9に示すように、再現される。なお原文の状態よりも第1行目と第2行目との距離が近接した状態に再現されているが、このような相違は目立たないことが多い等の理由により、本実施の形態ではファイルの再利用性や見栄えの観点で1つの文字群に統合している。
また、図10は、第1行目〜第3行目の背景色が同一であり、第1行目の文字色が異なり、第1行目と第2行目との距離が近接している場合を示している。このような場合では、第2統合処理では、第1行目〜第3行目を統合して1つの文字群68とする。このようにすることにより、再現時には、図10に示すように、再現される。
このように図9及び図10を参照して説明したように、本実施の形態では、背景色が同一の文字行同士は、文字色及び文字行同士の距離にかかわらず、同一の文字群に統合することにより、元の画像の状態が再現される。なお、本実施の形態では文字行同士の距離にかかわらずに統合しているが、なお、見栄えが悪くなるとして予め定められた距離以上に文字行同士が離れた場合は、第2の統合手段が同一の文字群に統合しないようにしてもよい。
以上説明したように本実施の形態では、画像読取部14で読み取った画像データの文字画像からOCR部20で文字を抽出し、文字情報抽出部21で抽出された文字情報である文字の大きさ及び相対的位置に基づいて、抽出された文字を第1文字統合部22が文字行または文字列に統合する。背景色抽出部24で各文字毎に背景となる領域の色(背景色)を抽出して、統合された文字行毎または文字列毎に背景色の頻度情報を生成する。また、文字情報抽出部21で抽出された文字の色に基づいて各文字行毎または各文字列毎に文字の色頻度情報を生成する。さらに文字行または文字列毎に、背景色の頻度情報及び文字色の頻度情報に基づいて、当該文字行または文字列の背景色を決定する。第2文字統合部26は、決定された背景色が同じ隣接する文字行または文字列を文字群に統合する。
このようにすることにより、文字群毎に背景色の情報が付加された状態でファイルに出力されるため、文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される、
また、本実施の形態では、第2文字統合部26で統合された文字群の数が設定されている出力先のフォーマットの制限を超える場合は、制限を越えない数以内に文字群の数を収めるように、統合された文字群の数が少なくなる文字の統合方法に文字の統合方法を変更するため、文字群の数が出力先の制限を超えることを抑制する。従って、再利用性が向上される。
なお、本実施の形態では画像読取部14で読み取った画像データから抽出した文字を文字群に統合する文字統合処理を行っているがこれに限らず、例えば、他の装置から入力された画像データをから抽出した文字を文字群に統合する文字統合処理を行う画像処理装置10であってもよい。なおこの場合、画像読取部14は、必須の構成ではない。
なお、本実施の形態は具体的一例を示したものであり、本発明を制限するものではない。
10 画像処理装置
12 制御部
14 画像読取部
20 OCR部
21 文字情報抽出部
22 第1文字統合部
24 背景色抽出部
26 第2文字統合部
28 フォーマット変換部
30 U/I部
43 プログラム

Claims (9)

  1. 画像データから複数の文字を抽出する第1の抽出手段と、
    前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段と、
    前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段と、
    前記第2の抽出手段で抽出された背景領域の色が同一であるとみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段と、
    を備えた画像処理装置。
  2. 前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色に基づいて前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段を備え、前記第2の統合手段は、前記決定手段で決定した背景領域の色が同一とみなす、隣接する前記第1の文字群を第2の文字群に統合する、請求項1に記載の画像処理装置。
  3. 前記決定手段は、前記第1の文字群の背景となる背景領域の面積に対する、前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合に基づいて、前記第1の文字群の背景となる背景領域の色を決定する、請求項2に記載の画像処理装置。
  4. 前記第1の抽出手段で抽出された文字に関する情報を文字毎に抽出する第3の抽出手段を備え、前記第1の統合手段は、前記第3の抽出手段で抽出された文字に関する情報が同一であるとみなせる、予め定められた方向に隣接する文字を統合する、請求項1から請求項3のいずれか1項に記載の画像処理装置。
  5. 前記文字に関する情報は、文字同士の距離及び文字の大きさを含む、請求項4に記載の画像処理装置。
  6. 前記文字に関する情報は、文字の色を含む、請求項5に記載の画像処理装置。
  7. 予め文字群の数が設定される設定手段と、
    前記設定手段に設定されている文字群の数に基づいて、前記第2の統合手段で前記第1の文字群を前記第2の文字群に統合するか否かを判定し、前記第2の文字群に統合しない場合は、前記第1の文字群を前記第2の文字群に統合しないように前記第2の統合手段を制御する制御手段と、
    を備えた請求項1から請求項6のいずれか1項に記載の画像処理装置。
  8. 文字を含む画像を読み取る読取手段と、
    前記読取手段で読み取った画像の画像データから抽出した文字を、第1の文字群に統合し、統合された第1の文字群を第2の文字群に統合する請求項1から請求項7のいずれか1項に記載の画像処理装置と、
    を備えた画像処理システム。
  9. 第1の抽出手段により、画像データから複数の文字を抽出するステップと、
    第2の抽出手段により、前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出するステップと、
    第1の統合手段により、前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合するステップと、
    第2の統合手段により、前記第2の抽出手段で抽出された背景領域の色が同一であるとみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合するステップと、
    を備えた処理をコンピュータに実行させるための画像処理プログラム。
JP2010052068A 2010-03-09 2010-03-09 画像処理装置、画像処理システム、及び画像処理プログラム Expired - Fee Related JP5577763B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010052068A JP5577763B2 (ja) 2010-03-09 2010-03-09 画像処理装置、画像処理システム、及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010052068A JP5577763B2 (ja) 2010-03-09 2010-03-09 画像処理装置、画像処理システム、及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2011188293A true JP2011188293A (ja) 2011-09-22
JP5577763B2 JP5577763B2 (ja) 2014-08-27

Family

ID=44794028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010052068A Expired - Fee Related JP5577763B2 (ja) 2010-03-09 2010-03-09 画像処理装置、画像処理システム、及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5577763B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418224A (zh) * 2021-01-22 2021-02-26 成都无糖信息技术有限公司 一种基于机器学习的通用ocr的训练数据生成系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11288465A (ja) * 1998-02-06 1999-10-19 Fujitsu Ltd カラー画像処理装置及びパターン抽出装置
JP2001283153A (ja) * 2000-01-27 2001-10-12 Fujitsu Ltd カラー画像から文字列パターンを抽出する装置および方法
JP2002077658A (ja) * 2000-09-04 2002-03-15 Minolta Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2006013590A (ja) * 2004-06-22 2006-01-12 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2006155588A (ja) * 2004-11-05 2006-06-15 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2007317034A (ja) * 2006-05-27 2007-12-06 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11288465A (ja) * 1998-02-06 1999-10-19 Fujitsu Ltd カラー画像処理装置及びパターン抽出装置
JP2001283153A (ja) * 2000-01-27 2001-10-12 Fujitsu Ltd カラー画像から文字列パターンを抽出する装置および方法
JP2002077658A (ja) * 2000-09-04 2002-03-15 Minolta Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2006013590A (ja) * 2004-06-22 2006-01-12 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2006155588A (ja) * 2004-11-05 2006-06-15 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2007317034A (ja) * 2006-05-27 2007-12-06 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418224A (zh) * 2021-01-22 2021-02-26 成都无糖信息技术有限公司 一种基于机器学习的通用ocr的训练数据生成系统及方法

Also Published As

Publication number Publication date
JP5577763B2 (ja) 2014-08-27

Similar Documents

Publication Publication Date Title
WO2021190146A1 (zh) 图片处理方法、装置、存储介质及电子设备
US10467466B1 (en) Layout analysis on image
JP7132654B2 (ja) レイアウト解析方法、読取り支援デバイス、回路および媒体
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
JP5526874B2 (ja) 画像処理装置及び画像処理プログラム
JP2012022575A5 (ja)
JP5769131B2 (ja) 画像処理装置およびプログラム
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP5577763B2 (ja) 画像処理装置、画像処理システム、及び画像処理プログラム
JP5612882B2 (ja) 印刷制御装置、印刷プログラムおよび画像形成装置
JP6191256B2 (ja) 画像処理装置及びプログラム
US8165404B2 (en) Method and apparatus for creating document data, and computer program product
JP2012022413A (ja) 画像処理装置、画像処理方法、およびプログラム
JP6051675B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
CN106598934A (zh) 电子书数据的显示方法、装置及终端设备
JP2011186835A (ja) 画像処理装置及び画像処理プログラム
JP2001222717A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2016139869A (ja) 画像処理装置
JP5884509B2 (ja) 画像処理装置、画像読取装置およびプログラム
JP2013178400A (ja) 画像投影装置、画像生成方法及びプログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
US9292770B2 (en) Information processing apparatus, method and medium
JP4973603B2 (ja) 画像処理装置および画像処理プログラム
JP5560780B2 (ja) 画像処理装置及び画像処理プログラム
JP5640403B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140610

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140623

R150 Certificate of patent or registration of utility model

Ref document number: 5577763

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees