JP2013200872A - 連続して存在する英数字を識別するための画像処理システムおよびその方法 - Google Patents

連続して存在する英数字を識別するための画像処理システムおよびその方法 Download PDF

Info

Publication number
JP2013200872A
JP2013200872A JP2013060524A JP2013060524A JP2013200872A JP 2013200872 A JP2013200872 A JP 2013200872A JP 2013060524 A JP2013060524 A JP 2013060524A JP 2013060524 A JP2013060524 A JP 2013060524A JP 2013200872 A JP2013200872 A JP 2013200872A
Authority
JP
Japan
Prior art keywords
image
alphanumeric characters
characters
images
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013060524A
Other languages
English (en)
Other versions
JP5521164B2 (ja
Inventor
Chattopadhyay Tanushyam
チョトパッダーエ タヌシャム
Bhattacharya Ujjwal
バッタチャリヤ ウジワル
Baran Chaudhuri Bidyut
バラン チャウドゥーリー ビデュート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Indian Statistical Inst
Original Assignee
Tata Consultancy Services Ltd
Indian Statistical Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd, Indian Statistical Inst filed Critical Tata Consultancy Services Ltd
Publication of JP2013200872A publication Critical patent/JP2013200872A/ja
Application granted granted Critical
Publication of JP5521164B2 publication Critical patent/JP5521164B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Traffic Control Systems (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

【課題】画像中に連続して存在する英数字を識別するためのシステムで、認識精度を改善する2値化画像を得る。
【解決手段】画像をキャプチャーし、画像のパターンを計算することで、画像に2値化のための処理をする。生成された2値化画像は、不要な成分を除去するためにフィルターされる。候補画像は、フィルター化された2値化画像から特定される。得られた全ての候補画像は、存在する有効な英数字を認識するためにさらにセグメント化されたファイナル候補画像を生成するために結合される。
【選択図】図1

Description

本発明は、文字を識別するための方法およびシステムに関する。より具体的に、本発明は、画像に連続して存在する英数字を識別するための方法およびシステムに関する。
車両識別番号(Vihicle Identification Number (VIN))の画像は、特別な状況において、特別な目的で一般人による携帯電話のカメラによって、何回もキャプチャーされる。キャプチャープロセスにおけるマニュアル操作の関与、不均一で不十分な照明、および高機能な焦点調節機構の使い勝手の悪さなどが、画質を低下させている。
携帯電話によってキャプチャーされたVIN画像に利用できるオープンソースの光学式文字識別(Opticat Character Recognition (OCR))システムの性能は、画質が種々のノイズによって影響されるため、極端に悪い。したがって、画質を高める技術は、入力としてスキャンされた画像を光学式文字識別システムにかける前に使用される必要がある。2値化技術は、複雑なバックグラウンド(より具体的にはバックグラウンドテキスト)からテキスト領域を得るために、画質を高める技術として使用される。
携帯電話でキャプチャーされた画像におけるテキストのOCRには、種々の欠点がある。従来のシステムにおいて、小さいメモリと遅い処理スピードを有する組み込みモバイルプラットフォーム(embedde mobile platform)上で個別の文字を復元することが必要とされている。2値化技術は、複雑なバックグラウンド(より具体的にはバックグラウンドテキスト)からテキスト領域を得るために、画質を高める技術として使用される。多くの2値化技術が、画像の認識精度を改善するために提案されている。従来の2値化技術は、せいぜい5.89%までのみ、画像の認識精度を改善することができる。
したがって、より広い範囲に対して画像の認識精度を改善する適切な低複雑度2値化技術を提供することができるシステムと方法が必要性とされている。
本発明の第1の目的は、画像に連続して存在する英数字を識別するためのシステムおよび方法を提供することにある。
本発明の別の目的は、キャプチャーされた画像の2値化を実行するためのシステムおよび方法を提供することにある。
また、本発明の他の目的は、2値化画像から不要なセグメント、オーバーセグメント化されたセグメント、およびアンダーセグメント化されたセグメントを取り除くシステムおよび方法を提供することにある。
本発明の他の目的は、有効な英数字におけるマルチプルコンポーネントラベル(multiple component labels)を統合するモルフォロジカルクロージング(morphological closing)を適用するためのシステムおよび方法を提供することにある。
本発明は、画像に連続して存在する英数字を識別するための方法を提供する。その方法は、プロセッサが実行する、連続した英数字を含む画像をキャプチャーする工程と、連続した英数字の中から識別できる文字のセットを得るために画像を処理する工程とを含む。当該処理工程は、バッググラウンドピークを決定するために画像におけるピクセル輝度分布(pixel intensity distribution)を認識するパターンをコンピューターで計算する工程と、バッググラウンドピークとフォアグラウンドピークとの間の複数の動的閾値(dynamic threshold values)を選択することによって複数の2値化画像を生成する工程と、1または2以上の有効な文字を識別するために複数の画像から不要な成分を取り除くことによって得られた2値化画像をフィルターする工程とをさらに含んでいる。その処理は、公知のグラウンドトゥルース値(ground truth value)に対して有効な文字を比較することで1または2以上の候補画像(candidate images)を識別する工程と、候補画像の結合が所定の状態によって決まるように候補画像を結合することでファイナル候補画像を生成する工程と、所定のセグメントにファイナル候補画像を分割し、各セグメントと関連付けられた有効な英数字を認識する工程と、をさらに含んでいる。
本発明は、画像に連続して存在する英数字を識別するためのシステムを提供する。そのシステムは、連続して存在する英数字を含む画像をキャプチャーする画像取得デバイスと、連続した英数字の中から識別できる文字のセットを得るように構成されたプロセッサとを含んでいる。プロセッサは、バッググラウンドピークとフォアグラウンドピークとを決定するための画像におけるピクセル輝度分布を認識するパターンをコンピューターで計算するように構成されたコンピューターモジュールと、バッググラウンドピークとフォアグラウンドピークとの間の複数の動的閾値を選択することによって複数の2値化画像を生成するように構成された2値化モジュールと、1または2以上の有効な文字を識別するために複数の画像から不要な成分を取り除くように構成されたフィルターと、を含んでいる。プロセッサは、1または2以上の候補画像を識別するために、公知のグラウンドトゥルース値に対して有効な文字を比較するように構成されたコンパレーターと、候補画像の結合が所定の状態によって決まるように候補画像を結合することで、ファイナル候補画像を生成するよう構成された画像発生器とをさらに含んでいる。システムは、所定のセグメントにファイナル候補画像を分割するように構成された出力発生モジュールをさらに含み、各セグメントと関連付けられた有効な英数字を認識している。
図1は、本発明の実施形態におけるシステムアーキテクチャを示す図である。
図2は、本発明の別の実施形態における典型的なフローチャート示す。
図3は、本発明のシステムの別の実施形態におけるモルフォロジカルクロージングを適用した後の画像形式を示す図である。
図4は、他の実施形態における本発明の2値化技術の分析を従来技術の2値化技術の分析と比較する図である。
本発明の実施形態を以下に説明するとともに、その特徴を説明する。
明細書中、「構成する」、「有する」、「含む」、「含んでいる」およびそれらの他の形式は、同等な意味であり、ある事項またはこれらの文言のいずれか一つに続く事項はそのような事項の包括的なリストであるような意味ではなく、また、列挙された事項のみに限定されるという意味ではない。
明細書および添付のクレームにおいて使用されるように、単数形“a”、“an”、“the”は、文脈が明確に示していなければ、複数形も含むことに注意しなければならない。ここで説明されるシステム、方法、装置、機器と同等、または似ているシステム、方法、装置、機器は、本発明の実施形態の実施またはテストに使用されることができるが、好ましいシステムとパーツは以下に説明される。以下の説明において、説明と理解の目的のために、発明の範囲に限定されない意図で、多数の実施形態が作られた。
本発明の1または2以上の成分は、詳細な説明の理解のためにモジュールとして説明されている。例えば、モジュールは、論理ゲート、半導体デバイス、集積回路または他のどのような個別部品を含むハードウエア回路における内蔵コンポーネントを含んでいてもよい。モジュールは、実施例のプロセッサ用のハードウェアエンティティによって実行されるソフトウェアプログラムの一部であってもよい。ソフトウェアプログラムとしてのモジュールの実行は、プロセッサまたは他のどのようなハードウェアエンティティによって実行されるべき論理演算命令のセットを含んでいてもよい。また、モジュールは、インターフェースを用いて、命令やプログラムのセットで具現化されていてもよい。
開示された実施形態は、本発明の単なる一例にすぎず、他の種々の形態であってもよい。
本発明は、画像に連続して存在する英数字を識別するためのシステムおよび方法に関する。第1段階において、2つの主なピークがスケール画像のパターンから確認され、多数の2値化画像が得られる。不要な成分は、2値化画像から除去される。また、1または2以上の候補画像はセグメント化され、それにより各セグメントがファイナル候補画像を生成するために有効な文字を含むようになっている。
本実施形態に従い、図1を参照すると、システム100は、連続して存在する英数字を含む画像を取得する画像取得デバイス(image capturing device)102を含む(図2のステップ202に示される)。また、システム100は、連続する英数字のうちの中から識別できる文字のセットを得るように構成されたプロセッサ104を含んでいる(図2のステップ206に示される)。また、プロセッサ104は、コンピューターモジュール106と、2値化モジュール108と、フィルター110と、コンパレーター112と、画像発生器114とを含んでいる。
本実施形態に従い、図1を参照すると、画像取得デバイス102は、グレースケールにおける画像を取得する。画像取得デバイス102は、カメラを有していてもよい。このカメラは、他の電子機器に連結されていてもよい。特別な例として、カメラは携帯電話に存在していてもよい。画像は、複数のフレーム画像取得デバイス102によって取得される。これらの画像は、識別されるべき連続した英数字を含み、したがって、1または2以上のノイズのタイプを含んでいるかもしれない。取得された画像は、プロセッサによってさらに処理される。プロセッサ104は、画像に存在する連続した英数字のうちの識別できる文字のセットを作り出す。
特別な例として、連続に存在する英数字の数は、17英数字を含むが、これに限定されない。
プロセッサ104は、コンピューターモジュール106をさらに含んでいる。コンピューターモジュール106は、バッググラウンドピークとフォアグラウンドピークとを決定するために画像におけるピクセル輝度分布を認識するパターンをコンピューターで計算するように構成されている。ピクセル輝度は、ヒストグラムで認識される。
コンピューターモジュール106は、レティネックス方式(retinex strategy)を適用することで入力画質を高めることができる(図2のステップ204に示される)。画質の増大は、2つのノイズ源があるという2つの主な観測(observation)に基づいている。一方は、実際、乗法的であり、バックグラウンドテキストおよびガラスからの反射のため現れる。また、コンピューターモジュール106は、グレースケール画像に画像を変換する。グレースケール画像は、色がグレーの色調のみであるものである。グレースケール画像の輝度ヒストグラムは、コンピューターで計算される。その輝度ヒストグラムは、画像に発見されるそれぞれ異なった輝度値でその画像にピクセルの数を示すグラフである(図2のステップ208に示される)。特別な例として、8ビットグレースケール画像にとって、256の異なる輝度がある。その結果、ヒストグラムは、グレースケール値の間で、ピクセルの分布を示す256の数をグラフ化して表示している。また、この分布から、2つの主要ピークが特定される。一方は0値付近に位置し、他方は225値近くに位置している(図2のステップ210に示される)。これらのピークは、画像のバッググラウンド部とフォアグラウンド部として表される。
プロセッサ104は、複数の2値化画像を生成するように構成された2値化モジュールをさらに含んでいる。
本実施形態に従い、開示された2値化方法は、2つの主な観測に基づいている。その2つの主な観測は、バックグラウンドテキスト(BGT)と関心テキスト(TOI)との間にわずかなグレースケール変化があるということと、17英数字が取得された画像に正確に存在するということである。バッググラウンドピークとフォアグラウンドピークとの間の動的閾値(ピクセル値)の特別の数(n)は、2値化のために使用される(図2のステップ212に示される)。ピクセルにつき8ビットの画像形式にとって、この数は、ヒューリスティックに得られる16である。こうして、2値化画像のn数はシングルグレースケール画像から得られる(図2のステップ214に示される)。
本実施形態に従い、そのような各画像のフォアグラウンドピクセルは、連結成分ラベル化方法(Connnected-component labeling method)を使用してラベル化される。連結成分ラベル化は、グラフ理論のアルゴリズムアプリケーションである。連結成分のサブセットは、与えられたヒューリスティックに基づいて、ユニークにラベル化される。頂点を含み、辺を結合するグラフは、入力画像から構成される。頂点は、ヒューリスティック比較によって要求される情報を含む。一方、辺は、連結された「隣(neighbors)」を示す。アルゴリズムは、グラフをトラバースし、それらの「隣」の相対的価値と連結性に基づいて頂点をラベル化している。ラベル化段階に続き、グラフは、サブセットに区分化される。その後、オリジナルの情報が回復され、処理される。
プロセッサ104は、1または2以上の有効な文字を特定するためにn数の2値化画像から不要な成分を取り除くように構成されたフィルターをさらに含んでいる(図2のステップ216に示される)。非常に大きいまたは非常に小さい成分は除去される。特別なレベルを有するピクセルの数が100よりも小さい場合、または、成分が3ピクセルよりも小さい高さ(h)または幅(w)を有している場合、成分は非常に小さくなるように構成されている。同様に、特別なレベルを有するピクセルの数が幅/4よりも大きい場合、または、h>(ht_image/3)またはw>(wd_image/4)である場合(ここで、ht_imageは画像の高さを表し、wd_imageは画像の幅を示す。)、成分は、非常に大きくなるように構成されている。
プロセッサ104は、1または2以上の候補画像を特定するために、公知のグラウンドトゥルース値(known ground truth value)に対して有効な文字を比較するように構成されたコンパレーター112をさらに含んでいる。公知のグラウンドトゥルース値(k)は、連続して存在する英数字の数と等しい。
コンパレーター112は、候補画像を特定するために不要な成分を取り除くよう使用される。成分の数がk/2よりも小さい場合、それは、実際の文字のk数がとても少なくセグメント化されるか、2値化画像がフォアグラウンドとして全ての有効な文字を含んでいないということを意味している(図2のステップ218に示される)。したがって、この2値化画像は候補画像として考えられない。同様に、成分の数がk*3よりも大きい場合、一つの有効な文字は、平均で、3セグメントよりも大きくなるようにオーバーセグメント化されている(図2のステップ218に示される)。オーバーセグメント2値化画像およびアンダーセグメント2値化画像は、無視される。残りの2値化画像は、候補画像として考えられる。こうして、少数の有効な画像のみがn個の2値化画像から外される。典型的に、各入力画像のためのそのような候補画像の数は、3以上である(連続して存在する英数字の数が17である場合)。
プロセッサ104は、候補画像を結合することで、ファイナル候補画像を生成するように構成された画像発生器114をさらに含んでいる(図2のステップ220に示される)。候補画像の半分以上においてバックグラウンドテキストとして決定される場合に限り、候補画像は、バックグラウンドテキスト(BGT)としてピクセルをマーキングすることによって結合される。この所定の状態の実現で、ファイナル候補画像は構築される。
システム100は、出力発生モジュール116をさらに含んでいる。その出力発生モジュール116は、ファイナル候補画像を所定のセグメントに分割するように構成され、それによって、各セグメントは一つの有効な文字のみを含んでいる。候補画像は、連続して存在する英数字の数と等しい数に分割される(図2のステップ222に示される)。
本実施形態に従って、スキュー補正の従来の方法は、予めセグメンテーションに使用される。セグメンテーションの以下の方法は、有効な文字の数が連続して存在する英数字の数kと等しいという観測に基づいている。文字数字セグメンテーション認識方法に含まれるステップは、以下の通りである。
・フォアグラウンドピクセルなしにコラム(段)を特定する。連続する列が得られる場合、これらのコラムの中心は候補カットコラム(CCC)としてとられる。得られるCCCの数はnである。
・連続するCCCsの間の距離(δ)を見つける。第i番目のCCCと第(i+1)番目のCCCとの間の距離がδ=|CCCi+1−CCC|として規定される。
・δ∀i∈(1、2・・・・・、n)のメジアン(medδ)を見つける。nは画像中におけるCCCsの数を示す。ヒューリスティックに得られるトレランスファクターτは、Thδ=(medδ−τ)として規定される閾値(Thδ)を規定するように使用される。
・ほぼ等間隔のコラムk−1成分が得られたら、各セグメントは候補セグメントとして使用される。
・n>k−1であるなら、有効な文字が横にセグメント化されることが結論付けられる。そのようなCCCsは、統合され、nは繰り返して一つによって少なくされる。
・n<k−1であるなら、互いに関連する有効な文字が確かにあるということが結論付けられる。
こうして、有効な文字を有するセグメントのk数が得られる。得られたセグメントは、オーバーセグメント化された形式であってもよい。
本実施形態に従い、図3を参照すると、いずれかのセグメントがマルチプルコンポーネントラベルを含んでいれば、マルチプルコンポーネントラベルはモルフォロジカルクロージングを適用することによって統合される(図2のステップ224に示される)。図3aはオーバーセグメント化された文字を示し、図3bはモルフォロジカルクロージングを適用した後の同じ文字を示す。クロージングは、まるでオープニングが逆に実行されるようなことと似ている。それは、両方の操作にとって、同じ構造要素を使用するダイレーション(dilation)と、それに続くエロージョン(erosion)として単に規定される。したがって、クロージング操作者は、2つの入力を必要とする。それは、クローズされるべき画像と、構造要素とである。グレイレベルクロージングは、グレイレベルダイレーションと、それに続くグレイレベルエロージョンとで直接的に構成される。クロージングはデュアルオープニングである。すなわち、特別な構造要素を有するフォアグラウンドピクセルのクロージングは、同じエレメントを有するバッググラウンドをクロージングすることと等しい。
本実施形態に従い、図4(g)は、図4(a)、4(b)、4(c)、4(d)、4(e)、4(f)に示される先行技術に対して、本発明に開示されるような2値化技術の改善された結果を示している。
画像に連続して存在する英数字を識別するためのシステムと方法は、以下の段落で説明される例を実施することによって説明されてもよい。そのようなプロセスは、前記例のみに限定されない。
モバイルにおける解像度2メガピクセルのカメラでキャプチャーされる車両識別番号(VIN)の画像を検討する。画像が複数のノイズによって影響されることを検討する(ナンバープレート上の泥、他の車両による影など)。オリジナルのナンバーは、MH05 1424 66720087である(2つのアルファベットを含む17の数)。そのうち、明確な数および/またはアルファベットは、M−05 14‐4‐‐‐2008‐(残りのナンバーは部分的に識別できる)。OCR(Optical character recognition)によって識別される前の、数とアルファベットを含むこの画像は、上述された方法とシステムによって改善される。ヒストグラムは、バッググラウンドとフォアグラウンドのピークポイントを与えることでコンピューター計算される。これは、閾値(例えば、16)を与え、それによって複数の2値化画像が得られる。
これらの2値化画像は、さらにフィルターされ、不要なものは除去され、有効な文字が得られる。これらの有効な文字は、それとグラウンドトゥルース値(本ケースでは17)とを比較することによって、候補画像を識別するために使用される。ファイナル候補画像は、これらの小さい候補画像を結合することで得られる。こうして、識別できなかった文字が識別される。
このプロセスは、欠けているまたはノイズに影響されたすべての文字の識別のために繰り返し使用される。そして、最後に、画質はOCRによって処理される前に改善される。

Claims (14)

  1. 画像中に連続して存在する英数字の識別方法であって、
    前記方法は、プロセッサで実行される、
    前記連続する英数字を含む前記画像をキャプチャーする工程と、
    前記連続する英数字のうちの識別できる文字のセットを得るために、前記画像を処理する工程とを含み、
    前記画像を処理する工程は、
    バッググラウンドピークとフォアグラウンドピークとを決定するために前記画像中のピクセル輝度分布を認識するためのパターンを計算する工程と、
    前記バッググラウンドピークと前記フォアグラウンドピークとの間の複数の動的閾値を選択することで、複数の2値化画像を生成する工程と、
    1または2以上の有効な文字を識別するために、複数の画像から不要な成分を除去することによって、前記生成された2値化画像をフィルターする工程と、
    所定のグラウンドトゥルース値に対して前記有効な文字を比較することで、1または2以上の候補画像を特定する工程と、
    前記候補画像の結合が所定の状態によって決まるように、前記候補画像を結合することによってファイナル候補画像を生成する工程と、を含み、
    前記識別方法は、プロセッサで実行される、
    前記ファイナル候補画像を所定のセグメントに分割し、前記各セグメントと関連する有効な英数字を認識する工程とをさらに含むことを特徴とする英数字の識別方法。
  2. 前記連続する英数字は、限定されないが、17の英数字を含んでいる請求項1に記載の英数字の識別方法。
  3. 前記ピクセル輝度を認識するためのパターンは、ヒストグラムの形式である請求項1に記載の英数字の識別方法。
  4. 複数のピクセル値は、前記連続して存在する英数字の数によって決まる請求項1に記載の英数字の識別方法。
  5. 前記不要な成分は、大きい成分と小さい成分とを含み、
    特別なレベルを有するピクセルの数が100より小さいと、成分は前記小さい成分であり、
    特別なレベルを有するピクセルの数が幅/4であると、成分は前記大きい成分である請求項1に記載の英数字の識別方法。
  6. 前記1または2以上の候補画像は、オーバーセグメント2値化画像と、アンダーセグメント2値化画像とを無視することによって識別される請求項1に記載の英数字の識別方法。
  7. 前記グラウンドトゥルース値は、前記連続して存在する英数字の数と等しい請求項1に記載の英数字の識別方法。
  8. 前記候補画像を結合するための前記所定の状態は、半分以上の前記候補画像がバックグラウンドである場合、前記候補画像がバッググラウンドとして前記候補画像の全てのピクセルをマークすることによって結合される状態である請求項1に記載の英数字の識別方法。
  9. 前記候補画像は、前記連続して存在する英数字の数と等しい数に分けられる請求項1に記載の英数字の識別方法。
  10. 前記有効な英数字におけるマルチプルコンポーネントラベルは、モルフォロジカルクロージングを適用することによって統合される請求項1に記載の英数字の識別方法。
  11. 画像中に連続して存在する英数字を識別するためのシステムであって、
    前記システムは、
    前記連続して存在する英数字を含む前記画像を取得する画像取得デバイスと、
    前記連続する英数字のうちの識別できる文字のセットを得るように構成されたプロセッサとを含み、
    前記プロセッサは、
    バッググラウンドピークとフォアグラウンドピークとを決定するために前記画像中のピクセル輝度分布を認識するためのパターンを計算するよう構成されたコンピューターモジュールと、
    前記バッググラウンドピークと前記フォアグラウンドピークとの間の複数の動的閾値を選択することで、複数の2値化画像を生成するように構成された2値化モジュールと、
    1または2以上の有効な文字を識別するために、複数の画像から不要な成分を除去するように構成されたフィルターと、
    1または2以上の候補画像を特定するために、所定のグラウンドトゥルース値に対して前記有効な文字を比較するように構成されたコンパレーターと、
    前記候補画像の結合が所定の状態によって決まるように、前記候補画像を結合することによってファイナル候補画像を生成するように構成された画像発生器と、を含み、
    前記システムは、
    前記ファイナル候補画像を所定のセグメントに分け、前記各セグメントと関連する有効な英数字を認識するように構成された出力発生モジュールとをさらに含むことを特徴とするシステム。
  12. 前記画像取得デバイスは、カメラを含む請求項11に記載のシステム。
  13. 前記コンピューターモジュールは、前記ピクセル輝度を認識するためのヒストグラムパターンを計算する請求項11に記載のシステム。
  14. 前記前記取得された画像は、17の前記連続して存在する英数字を含む請求項11に記載のシステム。
JP2013060524A 2012-03-26 2013-03-22 連続して存在する英数字を識別するための画像処理システムおよびその方法 Active JP5521164B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN825MU2012 2012-03-26
IN825/MUM/2012 2012-03-26

Publications (2)

Publication Number Publication Date
JP2013200872A true JP2013200872A (ja) 2013-10-03
JP5521164B2 JP5521164B2 (ja) 2014-06-11

Family

ID=47901836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013060524A Active JP5521164B2 (ja) 2012-03-26 2013-03-22 連続して存在する英数字を識別するための画像処理システムおよびその方法

Country Status (4)

Country Link
US (1) US8965123B2 (ja)
EP (1) EP2645305A3 (ja)
JP (1) JP5521164B2 (ja)
CN (1) CN103366167B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101545809B1 (ko) * 2014-02-07 2015-08-21 전북대학교산학협력단 차량 번호판 이중 검출 방법 및 장치
JP2016071675A (ja) * 2014-09-30 2016-05-09 富士通フロンテック株式会社 ローラ痕検出プログラム、ローラ痕検出装置およびローラ痕検出方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165187B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9922263B2 (en) * 2012-04-12 2018-03-20 Tata Consultancy Services Limited System and method for detection and segmentation of touching characters for OCR
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US9773186B2 (en) 2013-03-15 2017-09-26 Mitek Systems, Inc. Methods for mobile image capture of vehicle identification numbers in a non-document
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10467465B2 (en) * 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US11587327B2 (en) 2015-10-01 2023-02-21 Intellivision Technologies Corp Methods and systems for accurately recognizing vehicle license plates
US10706330B2 (en) 2015-10-01 2020-07-07 Intellivision Technologies Corp Methods and systems for accurately recognizing vehicle license plates
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US20190202372A1 (en) * 2018-01-03 2019-07-04 Getac Technology Corporation Vehicular image pickup device and image capturing method
CN110889415B (zh) * 2019-12-05 2023-04-21 上海交通大学 用于不同反光率表面的压印序列号字符分割方法
CN114359201A (zh) * 2021-12-29 2022-04-15 丽台(上海)信息科技有限公司 一种汽车生产线上镌刻标识质量检测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS623391A (ja) * 1985-06-28 1987-01-09 Nec Corp 閾値範囲検出装置
JPH01502371A (ja) * 1986-05-05 1989-08-17 パーセプティックス・コーポレーション ナンバープレート読取装置
JP2000348138A (ja) * 1999-06-02 2000-12-15 Pfu Ltd かすれ補正装置、かすれ補正方法および記録媒体
JP2003502739A (ja) * 1999-06-15 2003-01-21 ソリステイツク 画像2値化方法
JP2003216775A (ja) * 2002-01-25 2003-07-31 Dds:Kk 不正監視システム
JP2007156741A (ja) * 2005-12-02 2007-06-21 Koito Ind Ltd 文字抽出方法、文字抽出装置およびプログラム
JP2007280293A (ja) * 2006-04-11 2007-10-25 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
WO2008099664A1 (ja) * 2007-02-15 2008-08-21 Mitsubishi Heavy Industries, Ltd. 車両番号認識装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129713A (ja) * 1993-11-01 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置
US6026177A (en) 1995-08-29 2000-02-15 The Hong Kong University Of Science & Technology Method for identifying a sequence of alphanumeric characters
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
US6674900B1 (en) * 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US7492974B2 (en) * 2005-08-18 2009-02-17 International Business Machines Corporation Gray scale image cleaning system and method
US7613328B2 (en) 2005-09-09 2009-11-03 Honeywell International Inc. Label detection
CN101154270A (zh) * 2006-09-30 2008-04-02 电子科技大学中山学院 基于补偿原理和中心区域扫描的车牌二值化方法
JP5011508B2 (ja) * 2007-04-27 2012-08-29 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
CN102024139A (zh) * 2009-09-18 2011-04-20 富士通株式会社 字符串识别装置和方法
TWI409718B (zh) 2009-12-04 2013-09-21 Huper Lab Co Ltd 移動中車輛之車牌定位方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS623391A (ja) * 1985-06-28 1987-01-09 Nec Corp 閾値範囲検出装置
JPH01502371A (ja) * 1986-05-05 1989-08-17 パーセプティックス・コーポレーション ナンバープレート読取装置
JP2000348138A (ja) * 1999-06-02 2000-12-15 Pfu Ltd かすれ補正装置、かすれ補正方法および記録媒体
JP2003502739A (ja) * 1999-06-15 2003-01-21 ソリステイツク 画像2値化方法
JP2003216775A (ja) * 2002-01-25 2003-07-31 Dds:Kk 不正監視システム
JP2007156741A (ja) * 2005-12-02 2007-06-21 Koito Ind Ltd 文字抽出方法、文字抽出装置およびプログラム
JP2007280293A (ja) * 2006-04-11 2007-10-25 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
WO2008099664A1 (ja) * 2007-02-15 2008-08-21 Mitsubishi Heavy Industries, Ltd. 車両番号認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101545809B1 (ko) * 2014-02-07 2015-08-21 전북대학교산학협력단 차량 번호판 이중 검출 방법 및 장치
JP2016071675A (ja) * 2014-09-30 2016-05-09 富士通フロンテック株式会社 ローラ痕検出プログラム、ローラ痕検出装置およびローラ痕検出方法

Also Published As

Publication number Publication date
US20130272607A1 (en) 2013-10-17
US8965123B2 (en) 2015-02-24
EP2645305A3 (en) 2014-05-14
CN103366167A (zh) 2013-10-23
EP2645305A2 (en) 2013-10-02
JP5521164B2 (ja) 2014-06-11
CN103366167B (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
JP5521164B2 (ja) 連続して存在する英数字を識別するための画像処理システムおよびその方法
Yousif et al. Toward an optimized neutrosophic K-means with genetic algorithm for automatic vehicle license plate recognition (ONKM-AVLPR)
CN109583345B (zh) 道路识别方法、装置、计算机装置及计算机可读存储介质
Kaur et al. An efficient approach for number plate extraction from vehicles image under image processing
ATE357030T1 (de) Objektdetektion in bildern
US8559707B2 (en) System and method for face detection using face region location and size predictions and computer program product thereof
CN110070548B (zh) 一种深度学习训练样本优化方法
Chakraborty et al. An improved template matching algorithm for car license plate recognition
CN111383191A (zh) 用于血管断裂修复的图像处理方法及装置
Shi et al. Image enhancement for degraded binary document images
Das A statistical tool based binarization method for document images
Chang et al. An efficient thresholding algorithm for degraded document images based on intelligent block detection
CN104657972A (zh) 一种图像块的模糊度判断方法及系统
Davix et al. License plate localization by sobel vertical edge detection method
JP5979008B2 (ja) 画像処理装置、画像処理方法及びプログラム
Satish et al. Edge assisted fast binarization scheme for improved vehicle license plate recognition
JP2019003534A (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
CN113450355A (zh) 一种基于多膜态ct图像和3dcnn网络提取图像特征的方法
Dinh et al. Low-complexity text extraction in Korean signboards for mobile applications
CN101789081B (zh) 模糊文档图像的二值化方法及其设备
Paunwala et al. Multiple License Plate Extraction Based on Mathematical Morphology and Component Filtering in Indian Traffic Conditions
VELUSAMY et al. AN INTELLIGENT DESIGN FOR OPTIMIZED VEHICLE IDENTIFICATION IN TRANSPORT SYSTEMS
Yang et al. Summary of Document Image Binarization
CN112270657A (zh) 一种基于天空背景的目标检测与跟踪算法
Bouchara et al. A fast and robust super-resolved binarization algorithm for license plate recognition

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140311

R150 Certificate of patent or registration of utility model

Ref document number: 5521164

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250