JP2013186610A - 文字抽出装置および文字抽出プログラム - Google Patents

文字抽出装置および文字抽出プログラム Download PDF

Info

Publication number
JP2013186610A
JP2013186610A JP2012049990A JP2012049990A JP2013186610A JP 2013186610 A JP2013186610 A JP 2013186610A JP 2012049990 A JP2012049990 A JP 2012049990A JP 2012049990 A JP2012049990 A JP 2012049990A JP 2013186610 A JP2013186610 A JP 2013186610A
Authority
JP
Japan
Prior art keywords
image
character
feature amount
area
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012049990A
Other languages
English (en)
Inventor
Haruhiko Tanaka
晴彦 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Systems Inc
Original Assignee
Nikon Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Systems Inc filed Critical Nikon Systems Inc
Priority to JP2012049990A priority Critical patent/JP2013186610A/ja
Publication of JP2013186610A publication Critical patent/JP2013186610A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】画像から文字領域を確度高く検出することができる技術を提供する。
【解決手段】画像を複数の画像領域に分割する画像分割部と、画像領域の特徴量を取得する特徴量取得部と、特徴量に基づいて文字領域である画像領域を検出し抽出する文字領域抽出部と、を備える。特徴量は、画像領域の精細の度合いを示すエッジ度であり、文字領域抽出部は、エッジ度が所定値より大きい画像領域を文字領域として検出してもよい。
【選択図】図1

Description

本発明は、文字抽出装置および文字抽出プログラムに関する。
従来、画像上に重畳された文字を検出し抽出する様々な技術が開発されている。
例えば、画像のエッジを検出して、縦および横方向それぞれで対をなし閾値以上のエッジを有するエッジペアおよびエッジペア間の色を抽出し、エッジ密度が高い領域にあり同じ色を有するエッジペアに基づいて形成される領域をテロップ文字領域として検出する技術がある(特許文献1など参照)。
特開2011−87144号公報
しかしながら、従来技術では、テロップ文字領域の背景である画像の被写体の画像構造が複雑でエッジ密度が高い領域で文字領域と同じ色を有する場合、被写体の画像領域も文字領域として誤検出されてしまう場合がある。
上記従来技術が有する問題に鑑み、本発明の目的は、画像から文字領域を確度高く検出することができる技術を提供することにある。
上記課題を解決するために、本発明を例示する文字抽出装置の一態様は、画像を複数の画像領域に分割する画像分割部と、画像領域の特徴量を取得する特徴量取得部と、特徴量に基づいて文字領域である画像領域を検出し抽出する文字領域抽出部と、を備える。
また、特徴量は、画像領域の精細の度合いを示すエッジ度であり、文字領域抽出部は、エッジ度が所定値より大きい画像領域を文字領域として検出してもよい。
本発明を例示する文字抽出プログラムの一態様は、画像を読み込む入力手順、画像を複数の画像領域に分割する画像分割手順、画像領域の特徴量を取得する特徴量取得手順、特徴量に基づいて文字領域である画像領域を検出し抽出する領域抽出手順、をコンピュータに実行させる。
本発明によれば、画像から文字領域を確度高く検出することができる。
本発明の一の実施形態に係るコンピュータの構成を示すブロック図 一の実施形態に係るコンピュータによる文字抽出処理を示すフローチャート 画像の一例を示す図 Sobelフィルタの一例を示す図
図1は、本発明の一の実施形態に係る文字抽出装置として動作するコンピュータ100の構成を示す。
本実施形態のコンピュータ100は、図1(a)に示すように、CPU10、記憶部20、入出力インタフェース(入出力I/F)30、バス40から構成され、CPU10、記憶部20、入出力I/F30は、バス40を介して情報伝達可能に接続される。また、コンピュータ100には、入出力I/F30を介して、画像処理の途中経過や処理結果を表示する出力装置50、ユーザからの入力を受け付ける入力装置60がそれぞれ接続される。出力装置50には、一般的な液晶モニタやプリンタなどを、入力装置60には、キーボードやマウスなどをそれぞれ適宜選択して使用することができる。
CPU10は、記憶部20に記憶されている制御プログラムを実行し、コンピュータ100の各部を制御するマイクロプロセッサである。また、CPU10は、入力装置60を介して受け付けたユーザからの指示に基づいて、記憶部20に記憶されている文字抽出プログラムを実行することにより、図1(b)に示すように、画像分割部11、特徴量取得部12、文字領域抽出部13として動作する。CPU10は、文字抽出結果を出力装置50に表示する。なお、画像分割部11、特徴量取得部12、文字領域抽出部13の動作については後ほど説明する。
記憶部20は、制御プログラムおよび文字抽出プログラムとともに、画像のデータなどを記憶する。記憶部20に記憶されるプログラムやデータは、バス40を介して、CPU10から適宜参照することができる。記憶部20には、一般的なハードディスク装置、光磁気ディスク装置などの記憶装置を選択して用いることができる。
次に、コンピュータ100による文字抽出処理について、図2のフローチャートを参照しつつ説明する。なお、コンピュータ100が文字を抽出する画像は、図3(a)に示すように、例えば、「古都の夕焼け」という文字が背景の被写体に重畳された画像70であり、記憶部20に予め記憶されているとする。また、画像70は、静止画像であっても動画のフレームであってもよい。
ユーザが、入力装置60を用いて、文字抽出プログラムのコマンドを入力、またはそのプログラムのアイコンをダブルクリックすることにより、プログラムの起動命令を出す。CPU10は、その命令を入出力I/F30を通じて受け付け、記憶部20に記憶されている文字抽出プログラムを実行する。CPU10は、ステップS101からの処理を開始する。
ステップS101:CPU10は、記憶部20に記憶されている画像70を読み込む。
ステップS102:CPU10の画像分割部11は、読み込んだ画像70を公知の手法を用いて複数の画像領域に分割する。本実施形態では、公知の手法として、分割・統合(Split & Marge)法およびウォーターシェッド法を組み合わせて用いる。また、本実施形態の画像分割部11は、画像のエッジ量や彩度などの特徴量に基づいて画像70を分割するものとする。
ステップS103:CPU10の特徴量取得部12は、画像分割部11により分割された画像領域ごとに、例えば、図4に示すSobelフィルタを用いて、各画像領域の画素位置(i,j)における水平走査方向および垂直走査方向のエッジ量H(i,j)およびV(i,j)を算出する。なお、図4(a)および(b)は、水平走査方向および垂直走査方向のエッジ量を抽出するSobelフィルタを示す。
特徴量取得部12は、エッジ量H(i,j)およびV(i,j)から画素位置(i,j)におけるエッジ量Rを、次式(1)を用いて算出する。
R(i,j)=(H(i,j)+V(i,j)1/2 ・・・(1)
特徴量取得部12は、エッジ量Rを用いて、各画像領域におけるぼやけ具合や精細の度合いを示す、エッジ量の標準偏差Pedgeをエッジ度として、次式(2)を用いて算出し取得する。
Figure 2013186610
ここで、Nは画像領域Sにおける画素の総数を示す。
ステップS104:CPU10の文字領域抽出部13は、ステップS103において取得したエッジ度に基づいて、画像領域のうち文字領域を検出し抽出する。ここで、文字領域のエッジは、被写体のエッジに比べてシャープであることから、文字領域抽出部13は、例えば、全画像領域のエッジ度Pedgeの平均値Aedge(所定値)および最大値のエッジ度MAXedgeを用いて、次式(3)の条件を満たすエッジ度θedgeの画像領域を文字領域として検出し抽出する。
edge<θedge≦C×MAXedge ・・・(3)
ここで、係数Cは定数で、例えば、本実施形態ではC=0.5〜0.8とする。ただし、係数Cの値は、画像70の被写体や要求される検出精度に応じて決定されることが好ましい。
ステップS105:CPU10は、ステップS104において抽出された、図3(b)に示す文字領域を画像80として出力装置50に出力し表示するとともに、画像80を記憶部20に記憶する。CPU10は、一連の文字抽出処理を終了する。
このように、本実施形態では、ステップS103で取得した各画像領域のエッジ度および式(3)の条件を用いることにより、たとえ画像70の背景である被写体がどのような画像構造および色を有したとしても、画像70から被写体の画像領域を排除しつつ文字領域のみを確度高く特定し抽出することができる。
また、各画像領域のエッジ度だけで文字領域を検出することから、1文字単位で抽出できるだけでなく、1文字ごとに色が異なるとしても抽出することができる。
《実施形態の補足事項》
・上記実施形態では、評価対象の画像70を記憶部20に予め記憶されていたが、本発明はこれに限定されず、例えば、入出力I/F30を介して、コンピュータ100とデジタルカメラやデジタルビデオカメラなどとをUSB(Universal Serial Bus)ケーブルなどで接続して、静止画像や動画像を直接読み込んでもよい。
・上記実施形態では、画像分割部11は、分割・統合法およびウォーターシェッド法を組み合わせて画像70の画像分割を行ったが、本発明はこれに限定されず、他の手法を用いて画像70を画像分割してもよい。
以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲が、その精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図する。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずであり、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物によることも可能である。
10…CPU、20…記憶部、30…入出力I/F、40…バス、50…出力装置、60…入力装置、100…コンピュータ

Claims (3)

  1. 画像を複数の画像領域に分割する画像分割部と、
    前記画像領域の特徴量を取得する特徴量取得部と、
    前記特徴量に基づいて文字領域である画像領域を検出し抽出する文字領域抽出部と、
    を備えることを特徴とする文字抽出装置。
  2. 請求項1に記載の文字抽出装置において、
    前記特徴量は、前記画像領域の精細の度合いを示すエッジ度であり、
    前記文字領域抽出部は、前記エッジ度が所定値より大きい画像領域を前記文字領域として検出する
    ことを特徴とする文字抽出装置。
  3. 画像を読み込む入力手順、
    前記画像を複数の画像領域に分割する画像分割手順、
    前記画像領域の特徴量を取得する特徴量取得手順、
    前記特徴量に基づいて文字領域である画像領域を検出し抽出する領域抽出手順、
    をコンピュータに実行させること特徴とする文字抽出プログラム。
JP2012049990A 2012-03-07 2012-03-07 文字抽出装置および文字抽出プログラム Pending JP2013186610A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012049990A JP2013186610A (ja) 2012-03-07 2012-03-07 文字抽出装置および文字抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012049990A JP2013186610A (ja) 2012-03-07 2012-03-07 文字抽出装置および文字抽出プログラム

Publications (1)

Publication Number Publication Date
JP2013186610A true JP2013186610A (ja) 2013-09-19

Family

ID=49388001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012049990A Pending JP2013186610A (ja) 2012-03-07 2012-03-07 文字抽出装置および文字抽出プログラム

Country Status (1)

Country Link
JP (1) JP2013186610A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017157995A (ja) * 2016-03-01 2017-09-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05114045A (ja) * 1991-04-03 1993-05-07 Seiko Epson Corp 領域分離方法および画像処理装置
JPH07288679A (ja) * 1994-04-15 1995-10-31 Minolta Co Ltd 画像処理装置
JPH0916769A (ja) * 1995-06-27 1997-01-17 Canon Inc 画像処理装置および方法
JPH09231376A (ja) * 1996-02-28 1997-09-05 Oki Electric Ind Co Ltd ナンバープレート検出システム
JP2003189096A (ja) * 2001-12-21 2003-07-04 Minolta Co Ltd 画像処理装置
JP2003289426A (ja) * 2002-03-27 2003-10-10 Minolta Co Ltd 画像処理装置および画像処理方法
JP2011142469A (ja) * 2010-01-06 2011-07-21 Canon Inc 画像処理装置及び画像処理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05114045A (ja) * 1991-04-03 1993-05-07 Seiko Epson Corp 領域分離方法および画像処理装置
JPH07288679A (ja) * 1994-04-15 1995-10-31 Minolta Co Ltd 画像処理装置
JPH0916769A (ja) * 1995-06-27 1997-01-17 Canon Inc 画像処理装置および方法
JPH09231376A (ja) * 1996-02-28 1997-09-05 Oki Electric Ind Co Ltd ナンバープレート検出システム
JP2003189096A (ja) * 2001-12-21 2003-07-04 Minolta Co Ltd 画像処理装置
JP2003289426A (ja) * 2002-03-27 2003-10-10 Minolta Co Ltd 画像処理装置および画像処理方法
JP2011142469A (ja) * 2010-01-06 2011-07-21 Canon Inc 画像処理装置及び画像処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015052709; 芦田 和毅、外4名: '"情景画像からの文字抽出"' 電子情報通信学会技術研究報告 Vol.103, No.658, 20040212, pp.43-48, 社団法人電子情報通信学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017157995A (ja) * 2016-03-01 2017-09-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
WO2019057041A1 (zh) 用于实现图像增强的方法、装置和电子设备
JP6326847B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
US10694098B2 (en) Apparatus displaying guide for imaging document, storage medium, and information processing method
JP2015211471A (ja) 画像処理装置及び方法
US9536172B2 (en) Image processing apparatus, image processing method, and storage medium for checking an exposure state of captured image data
EP3893199A1 (en) Information processing apparatus, information processing method of information processing apparatus, and program
JP2016162420A (ja) 注目領域検出装置、注目領域検出方法及びプログラム
US20140079341A1 (en) Image processing apparatus and image processing method
EP3125087B1 (en) Terminal device, display control method, and program
US8379916B2 (en) Image display apparatus and control method thereof
DE102015110955A1 (de) Informationsverarbeitungsvorrichtung zum Erfassen eines Objekts von einem Bild, Verfahren zum Steuern der Vorrichtung und Speichermedien
US20130182943A1 (en) Systems and methods for depth map generation
EP3125089B1 (en) Terminal device, display control method, and program
JP2015170206A (ja) 検出装置および検出方法
US9613427B2 (en) Information processing method and electronic device
JP5046243B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2013186610A (ja) 文字抽出装置および文字抽出プログラム
JP5192597B1 (ja) 動き画像領域判定装置またはその方法
US10497103B2 (en) Information processing apparatus, information processing system, information processing method, and recording medium
WO2019065784A1 (ja) 画像処理装置、画像処理方法、及びコンピュータ読み取り可能な記録媒体
JP5903315B2 (ja) 画像処理装置および画像処理プログラム
CN113487552B (zh) 视频检测方法和视频检测装置
JP2013034660A (ja) 医用画像処理装置及び医用画像処理方法
JP5316662B2 (ja) 画像処理装置、画像処理プログラムおよび撮像装置
US20130057564A1 (en) Image processing apparatus, image processing method, and image processing program

Legal Events

Date Code Title Description
A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20150227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161108