JP5455395B2 - 画像処理装置及び画像処理方法 - Google Patents
画像処理装置及び画像処理方法 Download PDFInfo
- Publication number
- JP5455395B2 JP5455395B2 JP2009042787A JP2009042787A JP5455395B2 JP 5455395 B2 JP5455395 B2 JP 5455395B2 JP 2009042787 A JP2009042787 A JP 2009042787A JP 2009042787 A JP2009042787 A JP 2009042787A JP 5455395 B2 JP5455395 B2 JP 5455395B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character image
- separation
- subsequent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
文字画像に対しては、文字認識処理を行い、得られた文字情報に基づいてフォント情報を利用して、別の字形データに変更したり、文字色の変更や文字修飾を加えたりすることができる。
また、文字行の分割数を決めて文字画像分割位置を定め、文字画像を再レイアウトする装置が考案されている(例えば、特許文献2参照)。
図1は、画像処理装置(コンピュータ)のハードウェア構成の一例を示す図である。図1において、入力装置11は、キーボードやポインティング装置で構成されている。ユーザは入力装置11を操作しデータの入力や操作の指示を行う。蓄積装置12は、バイナリデータやメタデータを蓄積するものであり、例えば、ハードディスク等である。表示装置13は、蓄積装置12に蓄積されたバイナリデータ等を表示するものであり、例えば、CRTや液晶等である。
また、画像処理装置は、101から106の他、読込部を設け、公知のCCD素子等で構成されている撮像装置より画像を読み込むような構成としてもよい。また、図1には図示していないが、画像処理装置は、出力部としてプリンタ等を有するよう構成してもよい。
文書画像入力部101は、平面読み取り型の画像スキャナ或いはデジタルカメラ等の画像情報をデジタルデータに変換する。また、文書画像入力部101は、プリンタドライバによって送信されたPDL、ストレージに記録されたデジタル画像データを読み込む。
文書画像解析部102は、文書画像入力部101により入力された文書画像情報を解析する。
文書画像レイアウト部103は、文書画像解析部102によって解析され、個々に領域分割された文書構成素材となる画像を再配置し、文書画像を生成し、出力部105に出力する。分離文字判定テーブル104は、文書画像レイアウト部103が文字画像を再配置する際に参照されるデータである。分離文字判定テーブル104は、例えば、ROM15又は蓄積装置12等に記憶される。出力部105は、文書画像レイアウト部103がレイアウトした文書画像をプリンタ又は表示装置13に出力する。
(a)は、文書画像入力部101によって読み取られた文書画像中の一部である「労働 smart」という文字の字形が描画出力された文字画像である。
(b)は、文書画像解析部102によって解析された(a)の文字画像の各文字領域の外接矩形を表したものである。文字画像(a)に対する文字領域分離の結果、「労」「イ」「動」「s」「r」「n」「a」「r」「t」の9個の外接矩形領域に分離されている。
(c)は、(b)の文字領域分離結果に基づき、文書画像解析部102が、蓄積装置12等に記憶されている字形辞書を参照して得られた文字認識結果であり、「労イ動srnart」の符号化された文字情報が得られている。
図4は、図3(a)の文字画像を図3(b)の分離された文字画像に従い、所定の文字間隔をあけて文字画像を再配置した例であり、「働」「m」の部分で文書画像解析における文字領域分割の誤りが顕在化している。また、図5は、配置領域の右端で折り返すことによる文字領域分割誤りの影響が更に顕著に表れる例である。
ステップS810において、文書画像入力部101は、入力された文書画像情報を文書画像解析部102に送る。文書画像解析部102は、種別ごとに領域分離する。領域分離の処理は例えば、特開2000―293671号公報等に開示されている従来技術を用いて行うことができる。領域分離された処理結果は文書解析データとして蓄積装置12等に記憶される。
次にステップS820において、文書画像解析部102は、記憶された文書解析データのうち文字領域のデータがあるか否か判定し、文字領域データでない場合、ステップS860へ分岐し、文字領域データである場合、ステップS830へ分岐する。
ステップS830において、文書画像解析部102は、文字領域内の文字画像情報に対して文字認識処理を行い、符号化文字情報を抽出する。また、文書画像解析部102は、文字符号化と同時に文字列の配置方向が縦か横かを判別する。文字認識処理は広く実施されている公知の技術であり、詳細を省略する。文字認識の結果、図3(c)に示すような符号化文字列を得ることができる。
文字領域補正処理の後、ステップS850において、文書画像レイアウト部103は、文字画像のレイアウト編集処理を行う。文書画像レイアウト部103は、レイアウト編集処理において、文字画像を所定領域内に収まるよう配置し、必要に応じて、文字サイズ及び文字種、文字色等を変更する。
ステップS860において、文書画像レイアウト部103は、文字領域以外の画像領域のレイアウト編集処理を行う。
ステップS850或いはステップS860の後、ステップS870において、出力部105は、レイアウト編集結果を出力して、図9に示す処理を終了する。
ステップS910において、文書画像レイアウト部103は、図9ステップS830の文字認識処理の際に判別された文字画像領域における文字配置方向を取得する。
次にステップS920において、文書画像レイアウト部103は、1文字分の文字画像領域を取得し、取得した文字画像領域に対応する符号化文字情報を文字認識結果から取得する。
ステップS930において、文書画像レイアウト部103は、ステップS920で取得した符号化文字情報に基づき、分離文字判定テーブル104を参照し、分離禁止文字であるか否か検索する。ステップS940で判定を行い、文書画像レイアウト部103は、分離禁止文字である場合、ステップS950へ、分離禁止文字でない場合、ステップS980へ分岐する。
ステップS960において、文書画像レイアウト部103は、分離文字判定テーブル104の非分離条件704をチェックし、文字認識結果の当該文字の後続文字と一致するか否かを判定する。文書画像レイアウト部103は、一致しない場合、分離可能と判定し、ステップS980へ分岐し、一致する場合、分離禁止と判定し、ステップS970へ分岐する。なお、文書画像レイアウト部103は、更に分離文字判定テーブル104の分離確率を参照し、所定確率以上の場合のみ、分離禁止と判定するようにしてもよい。
文書画像レイアウト部103は、ステップS980ですべての文字画像領域について処理し終えたかどうか判定し、未処理文字画像領域がある場合、ステップS920へループし、全文字画像領域の処理を終了した場合、図10に示す処理を終了する。
つまり、文書画像レイアウト部103は、図10に示す処理によって、分離を禁止する文字である場合は、文字画像(文字画像領域)と、後続する文字画像(文字画像領域)と、を1つの文字画像領域として併合する。と共に、文書画像レイアウト部103は、分離を禁止しない文字である場合、文字画像(文字画像領域)と、後続する文字画像(文字画像領域)と、の間隔を保持するよう、文字画像と、後続する文字画像と、を文書画像に配置する。
また、上述した実施形態の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は上述した実施形態を構成することになる。
12 蓄積装置
13 表示部
14 CPU
15 ROM
16 RAM
Claims (6)
- 文書画像から文字画像を抽出する抽出手段と、
分離禁止文字と、分離可能性方向と、後続文字と、を含む分離文字判定テーブルに基づいて、前記抽出手段で抽出された文字画像が分離文字であるか否かを判定する判定手段と、
前記判定手段で分離文字と判定された場合、分離文字と判定された文字画像と、前記文字画像の後続の文字画像と、の間隔を保持するよう前記分離文字と判定された文字画像と、前記後続の文字画像と、を前記文書画像に配置し、前記判定手段で分離文字でないと判定された場合、分離文字でないと判定された文字画像と、前記文字画像の後続の文字画像と、を1つの文字画像として併合するよう前記文字画像に配置する配置手段と、
前記配置手段で配置された文字画像を所定領域内に収まるように配置し、再編集する再編集手段と、
前記再編集手段で再編集された結果を出力する出力手段と、
を有する画像処理装置。 - 前記抽出手段は、前記文字画像の後続文字を更に抽出し、
前記抽出手段で抽出された文字画像に係る領域における文字配置方向を取得する取得手段を更に有し、
前記判定手段は、前記抽出手段で抽出された文字画像が前記分離文字判定テーブルの分離禁止文字か否か、前記取得手段で取得された文字配置方向と前記分離文字判定テーブルの分離可能性方向とは一致するか否か、前記抽出手段で抽出された後続文字と前記分離文字判定テーブルの後続文字とは一致するか否か、に基づいて、前記抽出手段で抽出された文字画像が分離文字であるか否かを判定する請求項1記載の画像処理装置。 - 画像処理装置が実行する画像処理方法であって、
文書画像から文字画像を抽出する抽出ステップと、
分離禁止文字と、分離可能性方向と、後続文字と、を含む分離文字判定テーブルに基づいて、前記抽出ステップで抽出された文字画像が分離文字であるか否かを判定する判定ステップと、
前記判定ステップで分離文字と判定された場合、分離文字と判定された文字画像と、前記文字画像の後続の文字画像と、の間隔を保持するよう前記分離文字と判定された文字画像と、前記後続の文字画像と、を前記文書画像に配置し、前記判定ステップで分離文字でないと判定された場合、分離文字でないと判定された文字画像と、前記文字画像の後続の文字画像と、を1つの文字画像として併合するよう前記文字画像に配置する配置ステップと、
前記配置ステップで配置された文字画像を所定領域内に収まるように配置し、再編集する再編集ステップと、
前記再編集ステップで再編集された結果を出力する出力ステップと、
を含む画像処理方法。 - 前記抽出ステップでは、前記文字画像の後続文字を更に抽出し、
前記抽出ステップで抽出された文字画像に係る領域における文字配置方向を取得する取得ステップを更に含み、
前記判定ステップでは、前記抽出ステップで抽出された文字画像が前記分離文字判定テーブルの分離禁止文字か否か、前記取得ステップで取得された文字配置方向と前記分離文字判定テーブルの分離可能性方向とは一致するか否か、前記抽出ステップで抽出された後続文字と前記分離文字判定テーブルの後続文字とは一致するか否か、に基づいて、前記抽出ステップで抽出された文字画像が分離文字であるか否かを判定する請求項3記載の画像処理方法。 - コンピュータを、
文書画像から文字画像を抽出する抽出手段と、
分離禁止文字と、分離可能性方向と、後続文字と、を含む分離文字判定テーブルに基づいて、前記抽出手段で抽出された文字画像が分離文字であるか否かを判定する判定手段と、
前記判定手段で分離文字と判定された場合、分離文字と判定された文字画像と、前記文字画像の後続の文字画像と、の間隔を保持するよう前記分離文字と判定された文字画像と、前記後続の文字画像と、を前記文書画像に配置し、前記判定手段で分離文字でないと判定された場合、分離文字でないと判定された文字画像と、前記文字画像の後続の文字画像と、を1つの文字画像として併合するよう前記文字画像に配置する配置手段と、
前記配置手段で配置された文字画像を所定領域内に収まるように配置し、再編集する再編集手段と、
前記再編集手段で再編集された結果を出力する出力手段と、
して機能させるためのプログラム。 - 前記抽出手段は、前記文字画像の後続文字を更に抽出し、
前記抽出手段で抽出された文字画像に係る領域における文字配置方向を取得する取得手段として更に機能させ、
前記判定手段は、前記抽出手段で抽出された文字画像が前記分離文字判定テーブルの分離禁止文字か否か、前記取得手段で取得された文字配置方向と前記分離文字判定テーブルの分離可能性方向とは一致するか否か、前記抽出手段で抽出された後続文字と前記分離文字判定テーブルの後続文字とは一致するか否か、に基づいて、前記抽出手段で抽出された文字画像が分離文字であるか否かを判定する請求項5記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009042787A JP5455395B2 (ja) | 2009-02-25 | 2009-02-25 | 画像処理装置及び画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009042787A JP5455395B2 (ja) | 2009-02-25 | 2009-02-25 | 画像処理装置及び画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010198355A JP2010198355A (ja) | 2010-09-09 |
JP5455395B2 true JP5455395B2 (ja) | 2014-03-26 |
Family
ID=42823012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009042787A Active JP5455395B2 (ja) | 2009-02-25 | 2009-02-25 | 画像処理装置及び画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5455395B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102063566B1 (ko) | 2014-02-23 | 2020-01-09 | 삼성전자주식회사 | 메시지 운용 방법 및 이를 지원하는 전자 장치 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63136291A (ja) * | 1986-11-28 | 1988-06-08 | Nippon Telegr & Teleph Corp <Ntt> | 単語読み取り方式 |
JPH02230484A (ja) * | 1989-03-03 | 1990-09-12 | Hitachi Eng Co Ltd | 文字認識装置 |
JPH02292691A (ja) * | 1989-05-02 | 1990-12-04 | Ricoh Co Ltd | 文字認識装置 |
JP3420853B2 (ja) * | 1995-02-17 | 2003-06-30 | 株式会社リコー | 文字切り出し方法 |
JP2002230480A (ja) * | 2001-01-30 | 2002-08-16 | Toshiba Corp | 文字認識装置および文字認識結果修正方法 |
-
2009
- 2009-02-25 JP JP2009042787A patent/JP5455395B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010198355A (ja) | 2010-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2264995B1 (en) | Image processing apparatus, image processing method, and computer program | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
JP2007110679A (ja) | 画像表示装置、画像表示方法、その方法をコンピュータに実行させるプログラム、および画像表示システム | |
JP2010020468A (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
JP5049920B2 (ja) | 画像処理装置及び画像処理方法 | |
US8587817B2 (en) | Image processing apparatus, image processing method, and computer readable medium storing program | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP5526874B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5053722B2 (ja) | 画像処理装置及び画像処理方法、コンピュータプログラム及び記憶媒体 | |
JP2010056690A (ja) | 画像処理装置及び画像処理方法 | |
US8139237B2 (en) | Image generating apparatus, image processing apparatus, recording medium and computer readable recording medium | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5455395B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2010056691A (ja) | 画像処理装置及び画像処理方法 | |
JP2009087270A (ja) | 画像処理装置及びプログラム | |
JP2011013900A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
JP5612882B2 (ja) | 印刷制御装置、印刷プログラムおよび画像形成装置 | |
JP2010125779A (ja) | 印刷装置及びプログラム | |
JP5096989B2 (ja) | 文書処理装置及び文書処理方法 | |
JP5111242B2 (ja) | 画像処理装置及び方法 | |
JP6904717B2 (ja) | 画像処理装置、その制御方法、およびプログラム | |
JP5528410B2 (ja) | ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム | |
JP2012022413A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2010224659A (ja) | 情報処理装置、情報処理方法、プログラム及び記憶媒体 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140107 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5455395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |