JP2014526760A - 文字認識のため機械植字をトレーニングする方法及びシステム - Google Patents

文字認識のため機械植字をトレーニングする方法及びシステム Download PDF

Info

Publication number
JP2014526760A
JP2014526760A JP2014531839A JP2014531839A JP2014526760A JP 2014526760 A JP2014526760 A JP 2014526760A JP 2014531839 A JP2014531839 A JP 2014531839A JP 2014531839 A JP2014531839 A JP 2014531839A JP 2014526760 A JP2014526760 A JP 2014526760A
Authority
JP
Japan
Prior art keywords
template
characters
marking
grid
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014531839A
Other languages
English (en)
Inventor
フェロ,アンドリュー・フランク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Electric Co
Original Assignee
General Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Electric Co filed Critical General Electric Co
Publication of JP2014526760A publication Critical patent/JP2014526760A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

文字認識のためOCRアルゴリズムと共に使用するマシンビジョンシステムをトレーニングする方法及びシステム。このような方法は、認識されることになる文字を識別するステップと、文字の各々についてテンプレートの少なくとも第1のセットを個別に生成するステップと、を含む。各テンプレートは、セルのグリッドを含み、グリッドの特定のセルを選択して文字の対応するものに相関付けるパターンを定義することによって生成される。次いで、テンプレートに関する情報が媒体上に保存され、該媒体から後で情報を取り出してテンプレートを再生成することができる。テンプレートは、マーキング内に含まれる文字の少なくとも一部を認識するために光学的文字認識アルゴリズムで使用することができる。
【選択図】 図1

Description

本出願は、文字認識のため機械植字をトレーニングする方法及びシステムに関する。
本発明は、全体的に、画像化処理技術及びその用途に関する。より詳細には、本発明は、例えば、監視、検査、及び/又は制御用途で使用されるタイプの画像ベースプロセスにおいて利用される光学式文字認識(object character recognition (OCR))と共に用いることができるマシンビジョン(MV)画像化処理法及び装置に関する。
マシンビジョン(MV)は一般に、視覚画像を収集(「読み取り」)してコンピュータがデータを抽出できる形態に画像を変換し、抽出したデータを以前に開発された規格に関連するデータと比較して、この比較に基づいて所与の用途に有用とすることができる出力を生成する、画像検知技術の使用に関する。このような用途の非限定的な実施例は、部品の識別、欠陥検出、3次元スペース内での部品の位置、その他が挙げられる。マシンビジョンシステムの分野は一般に、OCR装置及びアルゴリズムを含む。非限定的な実施例は、製造物品に関連する一連の文字、例えば、シリアル番号、部品番号、ベンダーコード、その他を含む部品マーキングの認識(「読み取り」)である。部品マーキング(及び他の多くの用途)で使用される文字は、数字に限定されず、多くの場合、人間が読めると見なされる英数字、及び/又は限定ではないが、一次元又は二次元のデータマトリクスバーコードを含む、人間が読めないと見なされるシンボルを含む。
OCR装置及びアルゴリズムを利用するマシンビジョンシステムは、一般に、物品からマーキングを含む画像を収集し、次いで、収集した画像を格納されている植字テンプレートと比較して、収集画像内の個々の文字を識別することによって、物品上のマーキングを識別する。テンプレートは通常、以前に収集された画像データを用いてトレーニングされる。図1は、特定用途向けパラメータの識別、及びこれに続く、例えば、テンプレート14が生成される部品マーキング12の文字からのトレーニング画像の収集を含むようなプロセスを実施するビジョンシステム10を示す。これらのステップは、多くの場合、好適な記憶デバイス16にテンプレート14を格納するアプリケーション技術者によって実施される。所与の文字に対する各テンプレート14は、本明細書では画像スペースと呼ばれる、当該文字の物理的範囲に相当する。スケール、照明条件、表面仕上げ、その他の変化の可能性に起因して、ビジョンシステム10によって認識されることになる各文字に対して複数のテンプレート14を作成するために、十分なトレーニング画像を収集しなければならない。次いで、既製のOCRアルゴリズムを用いて、(例えば、製造された物品から)オンライン収集された画像を文字認識用の格納されたテンプレート14と比較することにより、文字認識を実施することができる。このタイプのプロセスでは、各ビジョンシステム10は、特定の用途及び特定用途向けパラメータに対してトレーニングしなければならない。
図1に示される手法に伴うトレーニング法は、例えば、特定の文字がこれまで見たことがなく且つ画像化されたことがない場合には、トレーニング不足となり、文字が様々なアーチファクト又はノイズが埋め込まれた状態で複数回トレーニングをしている場合には、過剰トレーニングとなる可能性がある。更に、OCRアルゴリズムをトレーニングするために収集した画像データを使用することにより、ズームスケール、照明条件、表面仕上げ、及び同様のものなどのほぼ一定の画像化条件にその品質が依存する植字テンプレート14がもたらされる。
共通のタスクにおいて検査の設定を容易にするようなマシンビジョンが提供する画像化一式に起因して、マシンビジョンアプリケーションにおいて既製のラピッドプロトタイピング(rapid prototyping)のビジョンシステムを求める誘因がある。しかしながら、植字トレーニングは、各文字についての代表的な例が必要とされ、場合によっては、ノイズ、アーチファクト、又は幾何学的ばらつきの存在下で同じ文字について複数の例を必要とするので、難しい作業となる可能性がある。異なる幾何形状を有する可能性がある異なる製造物品の読み込み、又は異なる照明条件、ズームスケール、その他の下での物品の読み込みなど、広範囲な又は汎用の用途を対象とした状況において、反復の文字トレーニングの必要性が特に問題となる。反復トレーニングの欠点は、過剰トレーニングであり、ここでは、異なる異常を有する各例示的な文字が単一文字を定めるセットに加えられたときに、文字の特定の特徴要素が歪み又は失われることになる可能性がある。
上記のことを考慮すると、既存のOCRトレーニング法に伴う欠点を克服できるOCRシステムに対する継続的な要求があることを理解されたい。詳細には、読み込みプロセス中の精度を改善した簡易的トレーニング法があれば有利であろう。更に、最終用途と独立したOCRトレーニング法を提供することが有利であろう。
米国特許公開第2002131642A1号明細書
本発明は、文字認識のためOCRアルゴリズムと共に使用するマシンビジョンシステムをトレーニングする方法及びシステムを提供する。
本発明の第1の態様によれば、認識されることになる文字を識別するステップと、文字の各々についてテンプレートの少なくとも第1のセットを個別に生成するステップと、を含む方法が提供される。各テンプレートは、セルのグリッドを含み、グリッドの特定のセルを選択して文字の対応するものに相関付けるパターンを定義することによって生成される。次いで、テンプレートの形状に関連する情報が、該情報を取り出すことができる媒体上に保存される。その後、テンプレートは、媒体から情報を取り出すことにより再生成され、光学的文字認識アルゴリズムで使用するためエクスポートされてマーキング内に含まれる文字の少なくとも一部を認識することができる。
本発明の第2の態様によれば、文字認識を実施するためのシステムは、複数の文字の各々についてテンプレートの少なくとも第1のセットを個別に生成する手段と、テンプレートを保存するよう適合され且つテンプレートを取り出すことができる媒体と、テンプレートを用いてマーキング内に含まれる文字の少なくとも一部を認識するよう適合された光学文字認識アルゴリズムと、を含む。各テンプレートは、セルのグリッドを含み、グリッドの特定のセルを選択して文字の対応するものに相関付けるパターンを定義することによって生成される。
本発明の技術的効果は、本質的にノイズ及びアーチファクトが無く、特定の植字又はフォントに関連付けることができるテンプレートを生成できることであり、これにより、OCRアルゴリズムのトレーニングは、固有のアプリケーション毎に実施されるのではなく、植字又はフォント当たりに一度だけ必要とされるようになる。その結果、テンプレートは、同じ植字又はフォントを使用するが、この文字は従来のOCRマシンビジョンシステムの使用を困難にするであろう異なる条件下で読み込まれる複数のアプリケーション用に容易に適合させることができる。テンプレートが画像発生源から生成されないので、これらテンプレートは、歪み、照明欠陥、表面粗さ、及び他の特定用途の異常が存在しない。この手法は、トレーニングされた植字を使用する広範囲の多数のアプリケーションに対する相関で使用するOCRアルゴリズム用の最も汎用性の高いテンプレートを提供する。別の利点は、テンプレートは、最終アプリケーションとは別の誰かによるオンラインプロセス以外でOCRアルゴリズムをトレーニングすることができ、こうすることで、文字認識トレーニング法の速度及び効率を高めることができる。
本発明の他の態様及び利点は、以下の詳細な説明からより明らかになるであろう。
文字を認識するために従来技術のOCRトレーニング法を用いるマシンビジョンを示す図。 本開示の実施形態による、文字を認識するためにマシンビジョンシステムと組み合わせて用いることができるテンプレートの一例の概略図。 オンラインマシンビジョン読み込みプロセスを用いて読み込み可能な、タービンブレード上の部品マーキングを示す図。 図3に示すマーキングの文字の各々について生成される、図2と同様の個々のテンプレートを示す図。 図2と同様のテンプレートを用いて実施することができる、オフラインテンプレート生成プロセス及びオンライン文字読み込みプロセスの例示的なフローチャート。 図5のオフライントレーニングプロセスで使用できるオフラインテンプレート生成システムの概略図。 文字を認識するためのOCRトレーニングプロセスにおいて図6のオフラインテンプレート生成システムを用いるマシンビジョンシステムを示す図。
以下では、文字、例えば、物品上の部品マーキングの文字を認識するためのOCRアルゴリズムと共に用いることができる出力を生成するためのマシンビジョンシステム及びこのようなシステムを作動させる方法の実施形態について記載している。図2は、文字(非限定的な実施例が、図2のパーセンテージ記号(%)34である)を認識するために本発明により利用できるテンプレート20の一例を示している。テンプレート20は、横列26と縦列28で配列されたセル24のグリッド22として構成される。図2から明らかなように、セル24の一部は、「オン」(網掛け付き)30であり、他は「オフ」32であり、「オン」であるこれらセル24は、パーセンテージ記号34の形状に相当する。従って、「オン」又は「オフ」としてのセル24のステータスは、特定の文字を表すデータを構成する。物品上に点(ドット)をインプリント(ピーニング)して文字を形成する機械を用いてマーキングが形成される場合には、各セル24は、文字を定めるドットピーニンググリッドの単一のドットを表すことができ、テンプレート20は、ドットピーニンググリッドを文字画像と同じ分解能にアップサンプリングすることにより形成されるセルグリッド22の表現とすることができる。
本発明の好ましい態様によれば、グリッド22及びそのセル24は、文字についてのテンプレート20の形状に関する情報を効果的に構成し、この情報は、多くのアプリケーションにおいて読み込まれるのが望ましい文字毎に別個のテンプレート20が形成されるオフラインプロセスで生成することができる。図1の従来技術のシステム10によって必要とされるような、オンライン「アプリケーション」レベルでマシンビジョンシステムをトレーニングするために複数のトレーニング画像を収集する従来の実施とは異なり、テンプレート20を表す情報は、オフライン「システム」レベルで作成することができる。より詳細には、情報は、テンプレート20を用いることができる1つ又はそれ以上のアプリケーションにおいてどの文字が使用されるか又は使用される可能性があるかを識別し、次いで、識別した文字に個々に相関付けることができる「オン」及び「オフ」セル24のパターンを選択することによってオフラインで生成することができる。各テンプレート20におけるセル24のアレイは、アレイの横列26及び縦列28により定められる「グリッドスペース」と本明細書で呼ばれるものを定める。所与の文字において、アレイのサイズ(及び従って、テンプレート20におけるセル24の数)は、関心のある文字についてデータを特徴付けるのに必要な最小サイズに制限することができる。同時に、テンプレート20のオンオフフォーマットを利用して、所与のグリッドスペースにおいて最も高いコントラストを生成することができる。図2の実施例において、5×7セル24のアレイは、パーセンテージ記号34についてのテンプレート20のグリッドスペースを定めるには十分であるが、より小さな及びより大きなアレイも予期できる点を理解されたい。何れの事例においても、「オン」セル24のパターンは、図1の従来のマシンビジョンシステムのテンプレート14を生成するのに収集される画像の分解能とは異なり、文字の分解能を具現化する。図5〜7を参照して考察するように、目的とする1つ又は複数のアプリケーションについての所望の数のテンプレート20の生成に続いて、テンプレート20に関する情報は、オンラインマシンビジョン文字読み込みプロセスにおいて後で使用するために格納することができる。
文字が、図1の画像スペースではなくグリッドスペースで定義されるので、テンプレート20は、本質的に同じ植字又はフォントを含むアプリケーションに対して作成し使用することができる。より詳細には、グリッドスペースによって定義されるテンプレート20は、特定のアプリケーション毎に存在する可能性がある特定の環境要因を考慮しなければならない画像スペースのテンプレートのように、特定のアプリケーションには限定されない。以下で考察するように、異なる植字又はフォントを有するアプリケーションで使用するために異なるテンプレート20セットを作成することができるが、植字の作成及び結果として得られるテンプレート20は、他の点では最終用途とは無関係である。
図3は、タービンブレード36の根元端部を概略的に示しており、ここでは、例示的な部品マーキング(例えば、シリアル番号、部品番号、ベンダーコード、その他)がスタンプ又は他の方法で作成されており、その個々の文字をブレード36上で実施される処理、検査、又は他の何らかのオンラインプロセス中に読み込むことができる。図4は、マーキング38の文字の各々について生成されたテンプレート20を概略的に示している。マーキング38は、英数文字(従って、人間が読めると見なされる)のみを含むように示されているが、本発明はまた、本質的に、限定ではないが、一次元又は二次元のデータマトリクスバーコードを含む、人間が読めないと見なされるシンボル又は他の文字を含む一連の何らかの文字を用いて利用することができる。図4から明らかなように、文字の各々は、5×7セル24のグリッドスペースを含むテンプレート20によって定義することができるが、より少ない又はより多くのセル24を用いることもできる。上述のように、テンプレート20は、システムレベルではオフラインで定義され、次いで、後で、アプリケーションレベルで文字を認識するためにOCRアルゴリズムによってオンラインで生成し使用することができる。
テンプレート20に加えて、OCRアルゴリズムによって使用するのに他の入力が望ましい場合がある。例えば、テンプレート20を表す情報から特定の情報を算出又は取得し、OCRアルゴリズムが使用するための出力として利用可能にすることができる。非限定的な実施例として、同様のテンプレートを定義する目的の「ルックアップテーブル」(LUT)、テンプレート内の同様の特定の領域を定義するLUT、テンプレートスペース用のLUT、スケール及び許容差のLUT、並びにテンプレート形態に含まれる情報の知識により容易且つ自動的に生成できる他の何れかのOCR特定入力が挙げられる。図6に関する以下の考察からより理解されるように、これらの追加入力を用いて、特定の文字テンプレート20で読み込まれる画像を良好に相関付けるためのOCRアルゴリズムのトレーニングを助けることができる。テンプレート20を定義するオフラインプロセスは、最も基本的なスケールで、すなわちグリッドスペースで各文字の形状に関する情報を有するので、これら追加の入力を容易に出力することができる。
図5は、特定のマーキング(図3及び4のマーキング38のような)に対するOCRパラメータを決定するステップを含む、本発明のオフラインステージを示し、この間にテンプレート20が生成され、読み込まれることになるマーキングにおける関心のある各文字に対して、テンプレート20を定義する情報セットが格納される。図5は、物品に対して、例えばブレード35の画像内の関心領域(ROI)が決定される追加のステップを示し、ここから文字が読み込まれることになる。オフラインプロセスの一部として、これらのステップを繰り返し、異なる植字又はフォントを利用できる多くのマーキングシステムに対するテンプレート20の別個のセットを作成することができる。図5は更に、本発明のテンプレート生成オフラインプロセスの出力を利用するオンライン又はアプリケーションレベルを示す。オンラインプロセスは、適切なテンプレート20のセットを読み込むステップと、関心領域を用いてマーキングをトリミングし、関心のあるマーキングを保持しない物品の不要な読み込み領域を排除するステップと、次いで、OCRアルゴリズムにおいてテンプレート20を用いてマーキングの文字を読み取り識別するステップと、を含むように示される。本発明のテンプレート生成オフラインプロセスの出力を使用することの他に、図5のオンラインプロセスは、既製のOCRアルゴリズムの動作を表している。OCRアルゴリズムは、相関手法を用いて、マーキング38の画像をテンプレート20と比較し、マーキング38から認識された文字のデジタル表現を生成する。
図6に示すように、テンプレート20の形状に関する情報は、オフラインシステム40を使用することにより生成され、次いで、OCRアルゴリズムによってアクセス可能な好適な記憶デバイス上のテンプレートデータベースに格納することができる。図6から明らかなように、テンプレート20のスクリーン画像は、パーソナルコンピュータ又は他の好適な処理装置のスクリーン46上に表示することができ、ここからユーザが個々のセル24を選択し、認識されることになる文字を一意的に識別できる「オフ」セルを定義することができる。このステップは、文字認識が実施されることなる1つ又はそれ以上のアプリケーションにおいて読み込まれるはずの各文字について繰り返される。本発明のオフラインテンプレート生成方法の利点は、図6のテンプレート20のすっきりとしたグリッドスペースと、図1の従来のマシンビジョンシステムのテンプレート14との比較から容易に理解することができる。
OCRアルゴリズムによって使用するのが望ましい他の何れかの入力もまた、記憶デバイス42上に格納することができる。加えて、テンプレート20に含まれるデータから特定の情報を算出又は取得し、OCRアルゴリズムに利用可能にすることができる。例えば、図6は、類似のテンプレート20を有する文字、例えば、数字の「1」と大文字の「I」について生成することができる「ルックアップテーブル」(LUT)44が含まれることを示している。OCRアルゴリズムは、文字テンプレート20を用いて関心領域内で読み込まれる各画像を相関付け、読み込んだ画像のあらゆる画素を分析して、関心領域内のあらゆる画素について出力相関スコアを生成するようトレーニングすることができる。高い相関関係は、これまでに読み込んだことのある文字の認識を意味する。OCRアルゴリズムはまた、ルックアップテーブル44を参照して相関スコアを改善することを教え込むことができる。例えば、LUT44は、テンプレート20のどの区域が同一であるかに関する情報を提供し、他の場合では近すぎて判定できなかったであろう相関スコアの差違を改善するために、これらの区域をマスクすることができる。従って、OCRアルゴリズムは、反復プロセスを用いて、読み込んだ画像を格納されたテンプレート20の文字に相関付け、並びにトレーニングプロセスに有用とすることができる他の入力を利用することができる。
上述のように、テンプレート20の異なるセットは、異なる植字又はフォントを利用するアプリケーションで用いるために作成することができる。例えば、テンプレート20は、異なる植字又はフォントに対して作成され、この異なるテンプレート20は、記憶デバイス42上の別個のプロジェクトファイルに格納することができる。更に、テンプレート20は、グリッドスペースのテンプレート20をOCRアルゴリズムに入力する(図7において「アプリケーション仕様」として示される)ための画像スペースの画像クーポンに変換する目的で、スケール調整(ズームイン/アウト)することができる。例えば、5×7セルのグリッドスペースでは、5.0のズームスケールを用いて、各テンプレート20が25×35ピクセル画像を生成することができる。同様に、テンプレート20をグリッドスペースから画像スペースに変換するのに非整数のズームスケールを利用することができ、この結果、OCRアルゴリズムによって作られる相関が、アルゴリズムを利用するそれぞれの各アプリケーションで収集される画像に可能な限り近接して一致するようになる。OCRアルゴリズムは、テンプレート20が画像の収集されたのと同じ分解能及びズームスケールのものであることが要求されるものとする。
図7は、図1の従来のフローチャートと同様であるが、本発明の特定の態様を例示するために修正されたフローチャートを示す。図7はまた、検査プロセスのシステムレベルでのオフラインで実施される特定のステップと、検査プロセスのアプリケーションレベルでオンラインで実施される他のステップとを示す。オフラインプロセスでは、関心のある1つ又はそれ以上のアプリケーションにおいて認識する必要がある文字が識別され、これらの文字の各々のテンプレート20は、例えば、図6のスクリーン画面46上に「描画」あれる。上述のように、テンプレート20の別個のセットが生成され、記憶デバイス32上に別個のプロジェクトとして格納することができる。ルックアップテーブル44はまた、プロジェクト及びそのテンプレート20のセット毎に生成することができる。上述のように、ルックアップテーブル44の使用は、本発明のオフラインプロセス内で生成可能なOCR依存の入力パラメータを全て含めることを意味するものではなく、単にその一例を含むに過ぎない。グリッドスペースにおけるテンプレートから取得できる他のOCR依存入力もまた生成することができる。ユーザは、特定のアプリケーションに対応するアプリケーション仕様を入力することによって、適切なテンプレート20を生成し、これらを後でオンラインで使用するために記憶デバイス42上に保存することができる。次いで、適切なテンプレート20が画像スペースにおいてエクスポートされ、すなわち、これらは、画像において予測されるものと同じ分解能及びズームスケールに再サンプリングされ、その後、関心のある文字が読み込まれ、OCRアルゴリズムが作動して文字を認識する。
テンプレート20は、特定の植字又はフォントに関連するプロジェクトファイルにおいて編集することができるので、OCRアルゴリズムのトレーニングは、図1の従来システム10において必要となる固有のアプリケーション毎に実施されるのではなく、植字又はフォント当たりに一度だけ必要とされる。更に、OCRアルゴリズムのトレーニングは、検査プロセスのオンラインプロセス以外で行うことができる。従って、重要な利点として、オフラインプロセスは、OCRアルゴリズムのトレーニングプロセスにおけるアプリケーション当たりの技術的タッチタイムを短縮し、マシンビジョンシステムの速度、効率、及び最も重要な精度を向上させ、その出力が、他の場合では標準であるオンラインOCRアルゴリズムによって用いることができることが挙げられる。別の利点としては、OCRアルゴリズムのトレーニングがオフラインで行われるので、テンプレート20は、同じ植字又はフォントを使用するが、この文字は図1に示されるタイプの従来システムの使用を困難にするであろう異なる条件下で読み込まれる他の複数のアプリケーション用により容易に適合させることができる。
図1に示されるタイプの従来のトレーニング手法はまた、異なる環境影響を有する画像をテンプレートが以前に見たことがある画像と相関付ける可能性を高めるために、同じ文字の複数の事例を見ることに依存している。このことは、過剰トレーニングにつながる可能性があり、この場合、文字の固有で僅かな特徴が失われる場合がある。この問題は、当初から環境影響が無いテンプレート20を使用し、文字毎に正確な1つの例のテンプレート20を有してOCRアルゴリズムを提供することができる本発明によって解決される。図1の従来技術のトレーニング手法はまた、少なくとも一度は文字の例を見ることに依存している。このことが、テンプレートセットがオンラインモードで提供される前に実施可能でない場合には、トレーニング不足を生じやすく、この場合、最初に文字を見たとき、又は以前の例のテンプレートの何れかにも相関付けられていない環境影響を有する文字を見たときにOCRアルゴリズムが機能しないことになる。本発明は、システムレベルでユーザが文字セット全体をオフラインでトレーニング可能にすることによってこの問題を解決する。図1の従来技術のトレーニング手法はまた、OCRアルゴリズムに文字スペース情報をトレーニングするために、トレーニングプロセス内の間に文字列形態の複数の文字を見ることに依存している。上述の同じ理由から、本発明は、システムレベルでユーザがこのスペースをグリッドスペースにトレーニングするのを可能にして、オンザフライで当該情報を単一の植字の植字属性に埋め込むことによって、この課題を解決する。
特定の実施形態について本発明を説明してきたが、当業者によれば他の形態を適応させることができることは理解されるであろう。例えば、マシンビジョンシステムを構築するハードウェア及びソフトウェアの物理的構成は、上記で説明又は図示したものとは異なることができる。従って、本発明の範囲は、添付の請求項のみによって限定されるものとする。
10 ビジョンシステム
12 部品マーキング
14 テンプレート
16 記憶デバイス

Claims (20)

  1. 文字認識のため機械植字をトレーニングする方法であって、
    認識されることになる文字を識別するステップと、
    前記文字の各々について、各々がセルのグリッドを含み且つ該グリッドの特定のセルを選択して前記文字の対応するものに相関付けるパターンを定義することによって各々が生成されるテンプレートの少なくとも第1のセットを個別に生成するステップと、
    情報を取り出すことができる媒体上に前記各テンプレートの形状に関連する情報を保存するステップと、
    前記媒体から前記情報を取り出すステップと、
    前記情報から前記テンプレートを再度生成するステップと、
    光学的文字認識アルゴリズムで使用するため前記テンプレートをエクスポートし、マーキング内に含まれる文字の少なくとも一部を認識するステップと、
    を含む、方法。
  2. 前記文字を識別するステップ、前記テンプレートを生成するステップ、及び前記テンプレートを保存するステップが、検査プロセスにおけるオフラインで実施される、請求項1に記載の方法。
  3. 前記テンプレートを取り出すステップ及び前記テンプレートを用いるステップが、検査プロセスにおけるオフラインで実施される、請求項1に記載の方法。
  4. 前記テンプレートを生成するステップが、前記グリッドを画面上に表示し、該画面から前記セルを選択することにより実施される、請求項1に記載の方法。
  5. 前記テンプレートの第1のセットを生成するステップが、単一の植字又はフォントについて実施される、請求項1に記載の方法。
  6. 第2の植字又はフォントについてテンプレートの少なくとも第2のセットを生成するステップを更に含む、請求項5に記載の方法。
  7. 前記テンプレートからOCR依存入力パラメータを生成し、該入力パラメータを媒体上に保存するステップを更に含む、請求項1に記載の方法。
  8. 前記グリッドからルックアップテーブルを取得し、該ルックアップテーブルを媒体上に保存するステップを更に含む、請求項1に記載の方法。
  9. 前記テンプレートを前記光学的文字認識アルゴリズムで使用するステップが、前記マーキングに含まれる文字を認識する前に、前記画像スペース画像クーポンに前記テンプレートをエクスポートするステップを含む、請求項1に記載の方法。
  10. 前記エクスポートするステップが、前記テンプレートを文字の一致する分解能及びズームスケールに再サンプリングするステップを含む、請求項1に記載の方法。
  11. 前記マーキングが、構成要素上の部品マーキングである、請求項1に記載の方法。
  12. 前記構成要素が、ガスタービンエンジン構成要素である、請求項1に記載の方法。
  13. 文字認識のため機械植字をトレーニングするシステムであって、
    複数の文字の各々について、各々がセルのグリッドを含み且つ該グリッドの特定のセルを選択して前記文字の対応するものに相関付けるパターンを定義することによって各々が生成されるテンプレートの少なくとも第1のセットを個別に生成する手段と、
    前記各テンプレートの形状に関連する情報を保存するよう適合され且つ前記情報を取り出すことができる媒体と、
    前記情報から前記テンプレートを再度生成する手段と、
    前記テンプレートを用いてマーキング内に含まれる文字の少なくとも一部を認識するよう適合された光学文字認識アルゴリズムと、
    を備える、システム。
  14. 前記生成手段及び前記媒体が、オフラインシステムの構成要素であり、前記光学文字認識アルゴリズムが、オンラインシステムの構成要素である、請求項13に記載のシステム。
  15. 前記生成手段が、グリッドが表示され且つセルを選択可能なスクリーンを含む、請求項13に記載のシステム。
  16. 前記生成手段が、単一の植字又はフォントに対してテンプレートの第1のセットを生成するよう構成されている、請求項13に記載のシステム。
  17. 前記生成手段が、第2の植字又はフォントに対してテンプレートの第2のセットを生成するよう構成されている、請求項13に記載のシステム。
  18. 前記グリッドから取得され且つ前記媒体上に格納されるルックアップテーブルを更に備える、請求項13に記載のシステム。
  19. 前記マーキングに含まれる文字を認識する前に、前記テンプレートを画像スペースにエクスポートする手段を更に備える、請求項13に記載のシステム。
  20. 前記光学的文字認識アルゴリズムが、相関手法を用いて前記マーキングの画像を前記テンプレートと比較し、前記マーキングから認識された少なくとも1つの文字のデジタル表現を生成する、請求項13に記載のシステム。
JP2014531839A 2011-09-23 2012-08-30 文字認識のため機械植字をトレーニングする方法及びシステム Pending JP2014526760A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161538564P 2011-09-23 2011-09-23
US61/538,564 2011-09-23
US13/341,210 2011-12-30
US13/341,210 US20130077856A1 (en) 2011-09-23 2011-12-30 Processes and systems for training machine typesets for character recognition
PCT/US2012/052951 WO2013043338A1 (en) 2011-09-23 2012-08-30 Processes and systems for optical character recognition using generated font templates

Publications (1)

Publication Number Publication Date
JP2014526760A true JP2014526760A (ja) 2014-10-06

Family

ID=47911354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014531839A Pending JP2014526760A (ja) 2011-09-23 2012-08-30 文字認識のため機械植字をトレーニングする方法及びシステム

Country Status (5)

Country Link
US (1) US20130077856A1 (ja)
EP (1) EP2758938A1 (ja)
JP (1) JP2014526760A (ja)
CN (1) CN103827918A (ja)
WO (1) WO2013043338A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI434368B (zh) * 2011-12-08 2014-04-11 Metal Ind Res & Dev Ct 無標記基板組裝對位方法
US9286526B1 (en) * 2013-12-09 2016-03-15 Amazon Technologies, Inc. Cohort-based learning from user edits
US10534968B1 (en) * 2015-04-16 2020-01-14 State Farm Mutual Automobile Insurance Company Verifying odometer mileage using captured images and optical character recognition (OCR)
CN104992152A (zh) * 2015-06-30 2015-10-21 深圳訾岽科技有限公司 一种基于模板字符库的字符识别方法及字符识别系统
US9946945B2 (en) * 2016-04-08 2018-04-17 Intelligent Security Systems Corporation Systems and methods for recognizing symbols in images
US10679101B2 (en) * 2017-10-25 2020-06-09 Hand Held Products, Inc. Optical character recognition systems and methods
US10789487B2 (en) * 2018-04-05 2020-09-29 Here Global B.V. Method, apparatus, and system for determining polyline homogeneity
CN112317962B (zh) * 2020-10-16 2022-09-02 广州黑格智造信息科技有限公司 一种用于隐形矫治器生产的打标系统及其方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4339745A (en) * 1980-05-14 1982-07-13 General Electric Company Optical character recognition
US5504822A (en) * 1986-09-19 1996-04-02 Holt; Arthur W. Character recognition system
US5539840A (en) * 1993-10-19 1996-07-23 Canon Inc. Multifont optical character recognition using a box connectivity approach
US5689620A (en) * 1995-04-28 1997-11-18 Xerox Corporation Automatic training of character templates using a transcription and a two-dimensional image source model
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters
CN100390815C (zh) * 2005-08-18 2008-05-28 北大方正集团有限公司 模板优化的字符识别方法和系统
US7873228B2 (en) * 2006-02-21 2011-01-18 Adobe Systems Incorporated System and method for creating synthetic ligatures as quality prototypes for sparse multi-character clusters

Also Published As

Publication number Publication date
US20130077856A1 (en) 2013-03-28
WO2013043338A1 (en) 2013-03-28
EP2758938A1 (en) 2014-07-30
WO2013043338A8 (en) 2014-04-17
CN103827918A (zh) 2014-05-28

Similar Documents

Publication Publication Date Title
JP2014526760A (ja) 文字認識のため機械植字をトレーニングする方法及びシステム
CN103324449B (zh) 一种区分输入图像中的字形与非字形图像伪像的方法
JP2006326913A5 (ja)
CN105022984A (zh) 指纹采集方法、指纹比对方法、指纹识别装置和系统
JP2021039424A5 (ja)
Baluja Learning typographic style
JP2019079347A (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
JP4672692B2 (ja) 単語認識システムおよび単語認識プログラム
CN111652209A (zh) 损伤检测方法、装置、电子设备及介质
JP6432179B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP6080586B2 (ja) 文字認識システム、文字認識プログラム及び文字認識方法
CA2848120A1 (en) Processes and systems for optical character recognition using generated font templates
JP4492258B2 (ja) 文字・図形の認識方法および検査方法
Zhao et al. Barcode character defect detection method based on Tesseract-OCR
JP2010211346A (ja) 手書き文字認識システム
CN112435196B (zh) 基于深度学习的文字修复方法及系统
Pal et al. Handwritten Character Recognition
JP2014078168A (ja) 文字認識装置及びプログラム
JP7291464B2 (ja) 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム
US20190205632A1 (en) Identifying location of shreds on an imaged form
CN113434491A (zh) 面向深度学习ocr识别的字模数据清洗方法、系统及介质
JP4206078B2 (ja) 二次元コード作成装置とそのプログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP6984440B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP2010061449A (ja) 原画像探索装置及び原画像探索プログラム