JP5383022B2 - 画像検出装置及び方法 - Google Patents

画像検出装置及び方法 Download PDF

Info

Publication number
JP5383022B2
JP5383022B2 JP2007249173A JP2007249173A JP5383022B2 JP 5383022 B2 JP5383022 B2 JP 5383022B2 JP 2007249173 A JP2007249173 A JP 2007249173A JP 2007249173 A JP2007249173 A JP 2007249173A JP 5383022 B2 JP5383022 B2 JP 5383022B2
Authority
JP
Japan
Prior art keywords
specific
character
region
image
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007249173A
Other languages
English (en)
Other versions
JP2009080635A (ja
JP2009080635A5 (ja
Inventor
真一 鷲田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007249173A priority Critical patent/JP5383022B2/ja
Publication of JP2009080635A publication Critical patent/JP2009080635A/ja
Publication of JP2009080635A5 publication Critical patent/JP2009080635A5/ja
Application granted granted Critical
Publication of JP5383022B2 publication Critical patent/JP5383022B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像から特定の文字列領域を検出する画像検出装置及び方法に関する。より詳細には、本発明は、文字の並びに関するフォーマットが決まっている対象物を認識し、画像から特定文字列を含む画像領域を検出する画像検出装置、方法、プログラム及び記録媒体に関する。
ナンバープレートのような、予めある程度の文字の並びに関するフォーマットが決まっている対象物の認識に際し、抽出手段と文字認識手段を分ける画像認識システムは数多く存在する。しかし、万が一抽出に失敗すると、即検出不能もしくは文字認識手段による誤認識が発生することになる。それを防ぐため、例えば路面を誤検出しないように検出方法を工夫するような技術が提案されている(例えば、特許文献1参照)。また、対象物の抽出に文字認識手段を直接使用する画像認識システムも存在する。例えば、ナンバープレートの一連の番号部分らしい部分を文字認識し、明らかに数字である場合にナンバープレート領域であると認識する技術が提案されている(例えば、特許文献2参照)。また、対象物の抽出と文字認識に所謂、知識処理を利用する手法もある(例えば特許文献3参照)。
特開2000−235618号公報 特開2000−182181号公報 特開2000−148912号公報
しかし、抽出手段を工夫しても、例えば看板などの誤検出を防ぐことは難しく、また抽出に文字認識手段を使用しても、明らかに数字であると誤認識してしまった場合、誤検出を防ぐことはできない。
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、特定文字列を含む画像領域を精度よく効率的に検出する画像検出装置及び方法を提供することにある。
このような目的を達成するために、本発明の画像検出装置は、画像から特定領域を抽出するための画像検出装置であって、前記画像から前記特定領域の候補となる領域内の特定文字列が配置されるべき部分領域を抽出する領域抽出手段と、前記領域抽出手段によって抽出された前記部分領域を文字認識する文字認識手段と、前記特定文字列に含まれる文字と前記特定文字列に含まれない文字とを含む第1の辞書に基づ前記文字認識手段による認識結果に前記特定文字列に含まれる文字がある場合に、知識辞書を用いて前記認識結果を前記特定文字列に修正できれば前記領域を前記特定領域であると判定し、前記第1の辞書に基づく前記文字認識手段による認識結果において前記特定文字列が含む文字が含まれない場合に前記領域は前記特定領域ではないと判定する判定手段とを備えたことを特徴とする。
また上記目的を達成するために、本発明の画像検出方法は、画像から特定領域を抽出するための画像検出方法であって、前記画像から前記特定領域の候補となる領域内の特定文字列が配置されるべき部分領域を領域抽出手段が抽出する領域抽出ステップと、前記領域抽出ステップによって抽出された前記部分領域を文字認識手段が文字認識する文字認識ステップと、前記特定文字列に含まれる文字と前記特定文字列に含まれない文字とを含む第1の辞書に基づ前記文字認識ステップによる認識結果に前記特定文字列に含まれる文字がある場合に、知識辞書を用いて前記認識結果を前記特定文字列に修正できれば前記領域を前記特定領域であると判定し、前記第1の辞書に基づく前記文字認識ステップによる認識結果において前記特定文字列が含む文字が含まれない場合に前記領域は前記特定領域ではないと判定手段が判定する判定ステップとを備えることを特徴とする。
また、上記目的を達成するために、本発明のプログラムは、上記に記載の画像検出方法の各ステップをコンピュータに実行させることを特徴とする。
また、上記目的を達成するために、本発明の記録媒体は、上記に記載の画画像検出方法の各ステップをコンピュータに実行させるためのプログラムを記録したことを特徴とする。
なお、上記目的を達成するための手段の説明において、特許請求の範囲の構成要素と対応する実施形態中の図中符号等を()で示した。ただし、特許請求の範囲に記載した構成要素は上記()部の実施形態の構成要素に限定されるものではない。
本発明によれば、効率よく正確な画像検出処理が可能となり、特定文字列を含む画像領域を精度よく効率的に検出する効果を奏する。
以下、図面を参照して本発明を適用できる実施形態を詳細に説明する。尚、本明細書で参照される各図面において同様の機能を有する箇所には同一の符号を付している。
[実施形態1]
本実施形態を説明するための最良の形態として、ナンバープレート画像を抽出する場合を例にあげる。ナンバープレートは決まった矩形内に文字列が配置され、陸運支局名に特定の文字の並びがあり知識処理を施すことが可能である。
(装置構成)
図1は、本実施形態を実施するための装置の構成を示すブロック図である。図1に示す装置は、例えば汎用的なPC(personal computer)等のコンピュータが適用可能である。図中符号101は本装置全体の制御を行うCPU(central processing unit)、102は本装置を制御するプログラム等がロードされるRAM(random access memory)等のメモリである。103はプログラムファイル、データファイル、後述の各種辞書ファイル等が格納されているHDD(hard disk drive)等の外部記憶装置である。104は情報を表示するディスプレイ、105は情報を入力するためのキーボード・マウス等の入力装置、106はデジタルカメラ等の画像入力装置である。
(動作説明)
図2は本実施形態におけるシステム全体の動作を示すフローチャートである。図2の処理手順は、CPU101が実行する処理の内容を示し、CPU101が、メモリ102にロードされた制御プログラムを読み出して実行することにより行われる。ステップS201において、CPU101は画像入力装置106によって入力された画像から特定画像の矩形を仮抽出する。図3は、本実施形態における求める特定画像を含む入力画像の一例を示す図である。この場合の抽出手段は、車両からの位置推定や画像のエッジ抽出による方法、内部の文字塊と思われる部分からの推測など、既存の検出手段を用いて構わない。本実施形態では、この矩形抽出方法には既存の技術ほどの精度は求めておらず、むしろ精度が悪い場合に本実施形態の効果が大きく発揮される。
ステップS202において、CPU101は画像内から矩形候補が検出できなかった場合は、検出処理を終了する。図4は、本実施形態における矩形抽出部分の一例で、矩形候補が検出できた場合の矩形候補例を示す図である。CPU101は矩形候補が検出できた場合、必要に応じてノイズ除去や正対画像作成のための逆透視変換処理等の画像加工処理を加えた後、ステップS203において矩形内のOCR(optical character recognition)処理を試みる。図5は、矩形部分のOCR結果の一例を示す図である。
ステップS204において、CPU101はステップS203で得られたOCR結果を用い、知識処理を行う。この知識処理とは、例えば引用文献3に示すような手法の応用であってよい。図6は、矩形部分のOCR結果の詳細の一例を示す図である。図5に示すOCR結果の先頭2文字の詳細な認識結果が、図6に示されるようなOCR結果の詳細である。すなわち、この知識処理とは、認識対象に「岩手」という単語があり知識辞書(文字認識辞書)に登録されている場合に、1文字目の第8候補と2文字目の第2候補を用いて「岩手」という認識結果を実現するよう修正処理を行う処理である。なお、図6に示す認識結果は、ナンバープレートの陸運支局名に使用されている文字のみを認識対象とした文字認識辞書AによりOCR処理をした結果である。文字認識辞書Aの場合、ステップS204の知識処理の仕様によっては「岩手」が候補として上がる可能性があり、図7は、この場合に矩形部分のOCR結果を知識処理した一例である。
そこで、本実施形態では、認識のための文字認識辞書として、陸運支局名に使用されている以外の文字も加えた辞書Bを使用する。その文字認識辞書Bを利用した場合のステップS203、S204によるOCR結果を示した例が図8及び図9である。図8は、本実施形態における矩形部分のOCR結果の一例を示す図である。図9は、本実施形態における矩形部分のOCR結果の詳細の一例を示すである。この図9の例によると、認識結果にナンバープレートの陸運支局名に使用されている文字が一切含まれていないため、ステップS204の知識処理による陸運支局名の修正は不可能となる。
CPU101はステップS205において、文字認識辞書Bを利用したステップS204の知識処理の結果がどのようになったかを判定する。もし知識処理が失敗し、どの陸運支局名にも修正できなかった場合、CPU101はその矩形は特定画像の矩形ではなかったと判定し、検出処理を終了する。知識処理が成功し、修正せずとも陸運支局名であった、もしくは陸運支局名に修正することが可能であった場合(例えば図7)、CPU101はその矩形は求める画像矩形であったと判定する。そして、CPU101はステップS206において、ステップS204の知識処理の結果を反映する等の処理を行い、検出処理を終了する。
[実施形態2]
実施形態2は、実施形態1に記載したシステムにおいて、ナンバープレートを認識の対象とする場合を例に説明する。
図10は、本実施形態における矩形部分のOCR結果の一例を示す図で、本実施形態の特徴を示す図である。図2のステップS203におけるOCR処理、ステップS204の知識処理において、知識処理が可能な陸運支局名を認識するための文字認識辞書Cと、それ以外の一連番号等を認識するための文字認識辞書Dとを別に用意する。陸運支局名認識のための文字認識辞書Cには、陸運支局名に使用されている以外の文字も加える(実施形態の文字認識辞書Bの同様)。一方、一連番号等を認識するための文字認識辞書Dには認識対象である数字もしくはひらがなのみを加える。
[他の実施形態]
以上述べた実施形態の他に次の形態を実施できる。
(1)実施形態1では、求める領域を矩形としたが、必ずしも矩形である必要は無く、直線に囲まれた領域であってもよいことは、当業者には自明であろう。
(2)実施形態1、2では、説明に最良の形態としてナンバープレートを例に説明をした。しかしながら、人名を含む領域を対象としてもよい。例えば帳票に記入された人名でもよく、名札に記載された人名でもよい。単語辞書Eにはあらかじめ人名を登録しておき、実施形態1に記載の手順において、文字認識辞書Bに替えて辞書Eを使用することより、人名を含む矩形を検出することが可能である。
(3)住所を含む矩形を対象としてもよい。例えば帳票に記入された住所でもよく、交差点の信号部分に記載の交差点名でも、電柱に記載された住所でもよい。単語辞書Fにはあらかじめ住所を登録しておき、実施形態1に記載の手順において、文字認識辞書Bに替えて辞書Fを使用することより、住所を含む矩形を検出することが可能である。
(4)その他、四角形や楕円などのある領域の内部に存在し、商品名や企業名などの名詞や慣用句など、単語に相当するものを単語辞書に追加し、実施形態1または実施形態2に記載の方法を適用することによって、領域を精度よく検出できる。
(5)上述の実施形態は、各データ処理を順次実施するソフトウェアで実現できるものである。即ち、上述した実施の形態の機能を実現するコンピュータプログラムを記録したコンピュータ読み取り可能な記憶媒体(または、記録媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(または、CPUやMPU)が、記憶媒体に格納されたプログラムコードを読み出し、実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が、上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶したCD、MD、メモリカード、MO等のさまざまな記憶媒体に書き込み可能である。
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現されるだけではない。即ち、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
[実施形態の効果]
以上説明したように本実施形態によれば、画像検出装置は、以下の機能を有する。即ち、画像から特定文字列(陸運支局名に使用されている文字)を含むか否かを判定すべき領域を抽出する領域抽出手段(101、S201)と、上記領域抽出手段によって抽出された上記領域を文字認識する文字認識手段(S203)とを備える。さらに、上記文字認識手段による認識結果に対し第1の辞書(辞書B)に基づき修正を試みる認識結果修正手段(S204)を備える。さらに、上記認識結果修正手段による修正結果に基づき上記領域が上記特定文字列を含むか否かを判定する判定手段(S205)を備える(実施形態1)。
以上の構成により、求める画像矩形によく似た画像の誤検出をより詳細に防ぐことが可能となり、検出精度が従来よりも向上する。それと共に、同時にOCR結果も知識処理を用いた修正結果が得られるという副次効果を得ることができる。
ここで、上記第1の辞書は、上記特定文字列に含まれる文字と、上記特定文字列に含まれない文字とを含むことができる。
また、上記認識結果修正手段は、上記領域内に認識対象が複数存在する場合、認識対象別に上記第1の辞書を含む複数の辞書を使用する(実施形態2、辞書C=辞書B、辞書D))ことができる。
以上の構成により、検出に際し使用する文字部分(文字認識辞書Cによる)と文字認識のみに使用する文字部分(文字認識辞書Dによる)とで文字認識辞書を分けることにより、実施形態1に記載したシステムの精度をさらに向上させることが可能となる。
また、上記第1の辞書のみが、上記認識結果修正手段により文字列を修正する認識対象とする文字以外の文字も含む(辞書B、辞書C)ことができる。
また、上記第1の辞書は上記特定文字列を含むことができる。
本発明を適用できる実施形態の環境を示すシステム構成図である。 本発明を適用できる実施形態のシステム全体の動作を示すフローチャートである。 本発明を適用できる実施形態の入力画像の例を示した図である。 本発明を適用できる実施形態の求める特定画像の矩形抽出部分を示した図である。 求める特定画像の矩形部分のOCR結果例を示した図である。 求める特定画像の矩形部分のOCR詳細結果例を示した図である。 求める特定画像の矩形部分のOCR結果を知識処理し修正した例を示した図である。 本発明を適用できる実施形態の求める特定画像の矩形部分のOCR結果例を示した図である。 本発明を適用できる実施形態の求める特定画像の矩形部分のOCR詳細結果例を示した図である。 本発明を適用できる実施形態の認識対象部分とその文字認識辞書との組み合わせ例を示した図である。
符号の説明
101 CPU
102 メモリ
103 外部記憶装置
104 ディスプレイ
105 入力装置
106 画像入力装置

Claims (5)

  1. 画像から特定領域を抽出するための画像検出装置であって、
    前記画像から前記特定領域の候補となる領域内の特定文字列が配置されるべき部分領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された前記部分領域を文字認識する文字認識手段と、
    前記特定文字列に含まれる文字と前記特定文字列に含まれない文字とを含む第1の辞書に基づ前記文字認識手段による認識結果に前記特定文字列に含まれる文字がある場合に、知識辞書を用いて前記認識結果を前記特定文字列に修正できれば前記領域を前記特定領域であると判定し、前記第1の辞書に基づく前記文字認識手段による認識結果において前記特定文字列が含む文字が含まれない場合に前記領域は前記特定領域ではないと判定する判定手段と
    を備えたことを特徴とする画像検出装置。
  2. 前記判定手段は、前記領域内に認識対象が複数存在する場合、認識対象別に前記第1の辞書を含む複数の辞書を使用することを特徴とする請求項1に記載の画像検出装置。
  3. 画像から特定領域を抽出するための画像検出方法であって、
    前記画像から前記特定領域の候補となる領域内の特定文字列が配置されるべき部分領域を領域抽出手段が抽出する領域抽出ステップと、
    前記領域抽出ステップによって抽出された前記部分領域を文字認識手段が文字認識する文字認識ステップと、
    前記特定文字列に含まれる文字と前記特定文字列に含まれない文字とを含む第1の辞書に基づ前記文字認識ステップによる認識結果に前記特定文字列に含まれる文字がある場合に、知識辞書を用いて前記認識結果を前記特定文字列に修正できれば前記領域を前記特定領域であると判定し、前記第1の辞書に基づく前記文字認識ステップによる認識結果において前記特定文字列が含む文字が含まれない場合に前記領域は前記特定領域ではないと判定手段が判定する判定ステップと
    を備えることを特徴とする画像検出方法。
  4. 請求項3に記載の画像検出方法の各ステップをコンピュータに実行させることを特徴とするプログラム。
  5. 請求項3に記載の画像検出方法の各ステップをコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2007249173A 2007-09-26 2007-09-26 画像検出装置及び方法 Expired - Fee Related JP5383022B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007249173A JP5383022B2 (ja) 2007-09-26 2007-09-26 画像検出装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007249173A JP5383022B2 (ja) 2007-09-26 2007-09-26 画像検出装置及び方法

Publications (3)

Publication Number Publication Date
JP2009080635A JP2009080635A (ja) 2009-04-16
JP2009080635A5 JP2009080635A5 (ja) 2010-11-11
JP5383022B2 true JP5383022B2 (ja) 2014-01-08

Family

ID=40655341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007249173A Expired - Fee Related JP5383022B2 (ja) 2007-09-26 2007-09-26 画像検出装置及び方法

Country Status (1)

Country Link
JP (1) JP5383022B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6290800A (ja) * 1985-10-17 1987-04-25 財団法人 日本交通管理技術協会 車両ナンバ−自動読取りシステム
JP2898562B2 (ja) * 1995-01-05 1999-06-02 日本無線株式会社 ナンバープレート決定方法
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
JP3452774B2 (ja) * 1997-10-16 2003-09-29 富士通株式会社 文字認識方法
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
JP3987264B2 (ja) * 2000-03-24 2007-10-03 富士通株式会社 ナンバープレート読取装置及び方法

Also Published As

Publication number Publication date
JP2009080635A (ja) 2009-04-16

Similar Documents

Publication Publication Date Title
US8908969B2 (en) Creating flexible structure descriptions
US20120259618A1 (en) Computing device and method for comparing text data
US20180267956A1 (en) Identification of reading order text segments with a probabilistic language model
US11216425B2 (en) System and method of recognizing data in a table area from unstructured data
US8843493B1 (en) Document fingerprint
JP2004348591A (ja) 文書検索方法及び装置
US8155945B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US20150071542A1 (en) Automated redaction
JP2005135041A (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
JP2004046315A (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
KR20220122458A (ko) 영상 데이터에 포함된 텍스트 플레이트 비식별화 방법 및 이를 수행하기 위한 장치
EP2138959A1 (en) Word recognizing method and word recognizing program
JP5669041B2 (ja) 文書処理装置及び文書処理方法
JP5383022B2 (ja) 画像検出装置及び方法
US9009026B2 (en) Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method
JP5483467B2 (ja) 帳票読取装置、角印検出方法、および、角印検出プログラム
Chang et al. An image-based automatic Arabic translation system
TWI667579B (zh) 處理文書之資訊處理裝置、資訊處理方法及用來處理文書的程式
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP3814334B2 (ja) 画像処理装置及びその方法
US20150043832A1 (en) Information processing apparatus, information processing method, and computer readable medium
US8761547B2 (en) Computing device and method for automatically typesetting patent images
JP2004247883A (ja) 画像処理方法
JP2000137728A (ja) 文書解析装置及びプログラム記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100927

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100927

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131001

R151 Written notification of patent or utility model registration

Ref document number: 5383022

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees