JP2014531656A - 印刷されたデータの機械読み取り - Google Patents

印刷されたデータの機械読み取り Download PDF

Info

Publication number
JP2014531656A
JP2014531656A JP2014530319A JP2014530319A JP2014531656A JP 2014531656 A JP2014531656 A JP 2014531656A JP 2014530319 A JP2014530319 A JP 2014530319A JP 2014530319 A JP2014530319 A JP 2014530319A JP 2014531656 A JP2014531656 A JP 2014531656A
Authority
JP
Japan
Prior art keywords
dots
character
dot
grid
binary number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014530319A
Other languages
English (en)
Other versions
JP6006315B2 (ja
Inventor
アラン ジョセフ ベル
アラン ジョセフ ベル
ロビンソン マーティン
ロビンソン マーティン
チェン グァンファ
チェン グァンファ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wessex Tech Opto Electronic Products Ltd
Original Assignee
Wessex Tech Opto Electronic Products Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wessex Tech Opto Electronic Products Ltd filed Critical Wessex Tech Opto Electronic Products Ltd
Publication of JP2014531656A publication Critical patent/JP2014531656A/ja
Application granted granted Critical
Publication of JP6006315B2 publication Critical patent/JP6006315B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

ドットのx−y配列の形態の文字、例えばドットマトリクス・プリンタによって印刷された文字によって表されたデータ読み取りの方法が、説明される。文字の像はディジタルカメラ装置によってキャプチャされ、次にコンピュータに送信される。さらに、データは、カメライメージの送信先のコンピュータで走っている分析ソフトウェアによって共分散、相関性、又は色データを用いることでドットの理想的な表示に対するドットの類似性が用いられ、ドット形状が特定され、さらに、キャプチャされたイメージ内のドットの各位置が検出される。検出されたドットに関する位置情報は、次に処理されることで、ドット間の距離が判断され、さらに互いに近接するドットのグループ内の隣接ドットの「クラスター」が特定され、さらにそのようなクラスターは、グリッド要素が交差するドットの意図された位置を定義する概念的なx−yグリッド上にマップされることが可能になる。イメージは次に分析されることで、グリッドの交点ごとに、ドットが存在するか又は存在しないかが判断され、x−yグリッドの1コーナーからスタートして、各交点において、ドットの存在又は非存在に対応する2進数が生成される。この2進数は、ドットマトリクスで印刷された文字に対応する情報に参照付けられている2進数の参照テーブル内の2進数と比較される。そして、特定された文字に対応する出力が生成される。リード・ソロモン算術を用いることで、印刷ミスになった文字であっても信頼性高く特定されることができる。

Description

本発明は、印刷されたデータの機械読み取りに関連する。
現代の世界では、コンピュータシステムが製品又は文書に印刷された情報にアクセス可能になっていることで、多くの領域において処理が活性化されたり強化されたりできる。機械読み取り可能な情報は、通常は、データ読み取りに用いられる処理に適合するようにエンコードされる。長い間にわたって、印刷された情報を読み取るために、多くのシステムが開発されかつ実行されてきた。そのような例を下記に説明する。
MICR(磁性インク文字認識)
磁性インク文字認識(MICR)のフォントを図1に示す。図に示すように、これは非常に様式化されたフォントであり、磁性インクによってインクされた場合、磁性スキャンヘッドによってスキャンされることで識別可能な連続パルスを生成可能なイメージを生成する。パルスは、デコードされて、個々の文字が機械によって読み取られ、次にデータが望み通りに処理される。
MICR文字は肉眼によって読み取り可能である。したがって、もしMICRデータが機械によって読み取られるときに適切にキャプチャされて正しくデコードされなければ、そのことは検出可能であり、例えば従来のキーボード又はキーパッドを用いてオペレータによって手動情報が入力される。
UPCバーコード
これらは消費者製品の上に印刷され、MICRTと同様に機能する。添付された図2に示された典型例のように、白黒のバー状パターンは機械(通常は、例えばスーパーマーケットのレジにおける携帯式のバーコード・スキャナによって又はレーザ・スキャナ)による読み取りに適している。人間が読み取り可能なデータは、バー状のパターンの下側の縁に複製されており、バー状のパターンがスキャナによって読み取りできない場合にコードの手動エントリーを可能にしている。機械読み取りに問題が生じた場合にデータを入力する人間のオペレータの能力は、UPCコードの設計に取り入れられている。しかし、これは、国際的に働くことが意図されている場合にコードが数字のみによって表されるように制限することになる。例えば日本の人はラテン文字を認識しないし又は非漢字記述をサポート可能なキーボード又はスクリーンを有していないからである。コードは数字のみに限定される。この数字文字制限は、コードがそれらが必要とされる桁より長いことを意味する。例えば、UPCコードは、12桁及びチェック用の1桁を有している。しかし、もしも従来の桁がラテン・アルファベットからの26文字と結合可能であれば、36シンボルが利用可能であり、同じ情報が8桁の英数字で表現可能となる。
MICR文字及びUPCバーコードは、信頼性のある機械読み取りを可能にする厳しく定められた公差に従って、注意深くデザインされかつ印刷された文字及びシンボルを含んでいる。これらのシステムの両方は、意図された読み取り方法が万一失敗したときのために、特定のバックアップ(手動データ・エントリー)を有している。
データマトリクス・マーキング
添付された図3は、典型的なデータマトリクスのマーキングを示している。図に示すように、それは、16×16黒又は白の正方形の配列からなり、それは適切なスキャナを用いることでスキャンされて0と1との並びとしてのマーキングによって表されるデータを生成できる。図に示すように、図3に示されたデータドットマトリクス・コードは、人間が読み取り可能な要素を含んでいない。しかし、このようなコードは急速かつ世界規模の採用が行われており、そこではコーディング・シンボル体系はよく知られており、印刷品質は国際的な標準によって管理されている。これらのコードは産業製品又は宣伝の上に見ることができる。産業製品の場合は、ロボットカメラが組み立てプロセスで組み込まれる部品を認証できる。宣伝の場合は、スマートフォンを持った人が、当該製品又はサービスについての情報をコード電話機のカメラでキャプチャすることによって取得可能である
データドットマトリクス・コードは、例えばリード・ソロモン(RS)演算によって生成された追加のエラー訂正情報を含んでいる。リード・ソロモン(RS)は、黒又は白のセルが間違って印刷された場合又は埃がコードの表面を汚染した場合は、コード内のデータが正しく読まれるようにする。
RSエラー訂正は周知である。一般的に、一連のデータがシンボルとして表され、エンコード処理では保護される対象のデータが処理されることでオリジナルシンボルに追加されるパリティ・シンボルのセットが作り出される。データを表しているシンボル及びパリティ・シンボルは、次に送信され又はある方法で記録される。
受信又はデータの読み取りの後には、データ・シンボル及びパリティ・シンボルは、オリジナルRS演算に従って処理されることで、伝送処理中にエラーが発生したか否かを判定される。エラーが発生していなければ、パリティ・シンボルは無視され、オリジナルデータがデータ・シンボルから抽出される。もしもRS算術が受信されたデータのいくつかは間違って受信されたと判断すれば、パリティ・シンボルがミスを訂正するのに用いられる。伝送媒体しだいでは、受信されたシンボルは、エラーと判断されたり(検出された間違ったシンボル)又は削除されたりする(シンボルは検出されていない)。RSアルゴリズムは、訂正可能なデータAのシンボル及びパリティのBシンボルの数が下記のようになることを可能とする。
2xエラーシンボル+y削減されたシンボル(x+y<=B)
もしもエラーと削除の合計数が上記式のBより大きければ、RS算術は、正しく受信されたシンボルが間違って訂正された訂正間違い(これは、オリジナルデータが失われたことを意味する)を起こしてしまう。
光学的文字登録(OCR)
このシステムは、光学的文字認識(OCR)フォントによって印刷されたデータを用いて開発されてきた。このシステムの一形態の数字は図4に示されている。そのようなフォントの文字形態は、機械によって読み取り可能になることが意図されており、この目的のために慎重にかつ厳しく管理された文字の形となるようにデザインされている。図5に示すように、示されたOCRフォント内のフォントは、各文字の下側半分のみを考慮した場合でも、残りのものから大きく異なっており各々が固有である。
異なるタイプのOCR処理が存在する。図4に示す文字は、テンプレート・マッチングによって読み取り可能なようにデザインされており、印刷された文字の形状におけるエラーは、テンプレートに一致する度合いを減らすことになる。OCRシステムは、OCRフォントを用いることで印刷されていないデータの機械読み取りを処理することまで実用的に拡張されている。OCRソフトウェアは、認識処理が実行できる基礎条件に基づいて導出されたデータを提供するために、各文字に由来するスキャンされた信号を要素部品に分解する。要素部品は、ループ、結合部及び曲線などある。
上記の4つのシステムは、広く用いられており、製品又は文書上の機械読み取り可能なデータを提供している。しかし、製品又は文書が他のデータを保持している必要があることが多く、それら他のデータは、機械以外のものによって読み取られることが意図されている。例えば、腐敗しやすい製品のラッピング又はパッケージングの上に印刷された「品質保持期限」である。「品質保持期限」データによって、消費者は購入及び消費の決定が可能になり、さらに、例えば、スーパーマーケットのスタッフが貯蔵/保持の判断が可能になる。このようなデータはしばしばすでに存在する印刷された材料(例えば、ラベル又はキャニスター)に適用されている。適用は、連続式インクジェット印刷(CIJP)で行われ、通常は、図6に示す標準のドットによる文字セットが用いられ、さらに当該基材の特定のタイプ(例えば、金属、湿った又は乾燥したガラス、紙、カード、プラチック)に意図されたインクが用いられる。従来からCIJPによって製品に適用されている印刷された情報は、様々なデータ、例えば、製品番号データ、バッチ情報、使用・賞味期限情報を含んでいる。
CIJP印刷が消費期限及び他の顧客関連データに用いられる理由の1つは、それが製造ラインの速度で適用可能だからである。また、CIJP印刷では、データを製品ごとに変更可能である。また、プリンター・ヘッドが印刷対象のアイテムに接触する(この接触は危険であり、ガラスのボトル又は丸くなっているプラスチック製品の場合は不可能である)必要がなくなるので、CIJP印刷は様々な基材に用いられる。質の良くない又は不規則な印刷から意図された情報を理解できる顧客の能力のおかげで、高品質で厳しい公差による印刷の必要性は単純には当てはまらない。
CIJP文字は、通常、概念的長方形のグリッド上に配置されたドットの配列として印刷されることを意図されている。概念的な長方形のグリッドは、図7の文字「A」で示すように、縦方向と横方向に概念的に均等に配置されている。このドットの分離は、均等になることを意図しており(デルタ−X、デルタ−Y)、つまり図7に示された概念的なグリッドラインは、ドットの意図された位置を示す箱を定義している。しかし、実際には、印刷ヘッドの汚れによって、印刷時にドットが凝集したり位置ずれしたりする。例えば、図8に示す例では、ドットは5×7の概念的長方形のグリッドの交点に落ちるように意図されている。もしも文字が曲がった面に印刷された場合、例えば、図6に示すボトルでは、ドット間のスペースは、印刷されたデータの一ブロックの中において変動している。カメラを利用した検査システムを用いて、印刷後直ちに製造ラインにおいて製品に適用されたCIJP文字を読むことは知られているが、汚れ又は不規則な表面に起因した最終印刷の変動する性質は、OCR技術(を用いては、上記の特定された問題(位置から外れたドット、又は凝集)が起こっていないことをチェックすることを目的として、製品が売られた後又は流通している間に印刷されたCIJPデータを実際に機械読み取ることができないことを意味している。そのようなシステムは、管理された証明及び印刷が行われる面からの距離が知られている高品質産業カメラといった、十分に定義された環境で動作する。これらのシステムは、さらに、プリンタに送信されたデータを最終結果の像と比較することで、データを適用しているプリンタとも緊密に連動する。別の例として、産業用カメラ構成は、デルタX及びデルタY及び他のCIJP印刷パラメータを定義する構成の設定を用い、カメラからの信号は適切なソフトウェアによって処理されることで文字がこれらの先に定められた必要事項を満たしていることをチェックされる。このようなCIJP印刷品質チェック用ソフトウェアは、通常は注目画像領域(ROI)情報を定義し、それによりROI内のイメージの一部分のみが文字データ用にチェックされる。
OCR技術を用いた機械読み取り可能な刻印に対する1つの試みが提案されている。それについては、プリンタが、図9に示すように重なり合ったドットを有する文字を形成するように、小さなデルタX及びデルタYを有するように設定される。これは、従来のOCRソフトウェアが実行可能となることを意図している。
発明者は、いくつかのイメージ分析技術を新たな方法で結びつけることで、ドットの配列により形成された文字を用いて印刷されたデータ(通常はCIJPにより生成されている)が電子的に読み取り可能であることを見いだした。
本発明によれば、ドットのx−y配列により表されたデータ読み取りの方法は、以下の連続するステップによって実行される。
a)文字の像は、ディジタルカメラ装置によってキャプチャされ、コンピュータに送信され、
b)カメライメージが送信されたコンピュータで走っている分析ソフトウェアを用いることで、共分散、相関性又は色データを用いることでドットの理想的な表示に対するドットの類似性を用いて、ドット形状が特定され、さらにキャプチャされたイメージ内でのドット形状の位置が検出され、
c)前記検出されたドットに関連する位置情報を処理することで、ドット間の距離を判定し、互いに近接するドットのグループ内の隣接ドットの「クラスター」を特定し、
d)前記ドットは、グリッド要素が交差するドットの配置された位置を定義するx−yグリッドを形成するために、結合され、
e)前記イメージを分析することで、グリッドの各交点において、ドットが存在するか否かを判定し、
f)各グループにおいて、与えられた固定位置からスタートし、先に定義されたシーケンスに従って、好ましくはx−yグリッドの1コーナーからスタートしかつ一列ずつ進み、各交点におけるドットの存在又は非存在に対応する2進数を発生し、
g)この2進数と、ドットマトリクスで印刷された文字に対応する情報に参照付けられている2進数の参照テーブル内の2進数とが比較され、
h)そのような比較によって特定された前記文字を組み合わせて形成された出力を提供する。
参照テーブルは、好ましくは、低品質で印刷された文字(例えば、凝集したドット又はいくつかのドットが失われている文字)に対応する数字を含んでいる。参照テーブルは、好ましくは、文字を印刷するのに用いられたドットマトリクス・パターン、文字自身、アルファベットの種類(例えば、ローマ字、漢字)を示すこと、及び完全に印刷された文字の2進数と同じ文字を低品質で印刷された表示の2進数とが相違する量に対応するハミング距離を含んでいる。このようなテーブルでは、特定のドット・パターン/2進数は異なる文字との可能性のあるマッチを示すために1度より多く存在できるが、テーブルのエントリー内の各2進数は異なるハミング数に関連付けられるだろう。ステップf)における2進数の発生は、図10に示された文字の形態を反映しており、下記の通りである。

2進数
10001 10001 11111 10001 10001 01010 00100

2進数(4ビット グルーピング)
100 0110 0011 1111 1000 1100 0101 0100 0100

16進数
4 6 3 F 8 C 5 4 4
低品質で印刷された文字に対応する数字を含むことによって、文字を高速で認識することが可能になる。その場合、例えば、認識対象のクラスターが、意図された位置の下側、上側又は左側又は右側に形成され、共通の印刷ミスが生じる。実施例は図11に示されている。
各参照数字の要素を構成するハミング距離は、完全に印刷された文字の2進法表示がミスプリントされた文字の2進法表示からどれだけ離れているかの基準である。ハミング距離は、2つの二進数をビットごとに比較することによって得られた、ミスマッチが生じた回数である。このように、もしもミスプリントされたバージョンにおいて1つだけドットが欠けていれば、ハミング距離は1となるであろう。もしも1つのドット欠けに加えて追加のドットがあれば、ハミング距離は2となるであろう。
ステップg)で述べられた比較は、好ましくは、参照テーブルの各エントリーにおいて、2進数と参照テーブルの2進数部分との間で、ビット単位で行われる。これにより、良い一致、及び先に保存されたベクターのハミング距離が1又は2である近い一致が特定される。
比較の最後には、完全一致及びいずれかの近い一致(及びそれらの各ハミング距離)が、文字ごとに記録される。文字及び未知の文字の間のハミング距離は保存され、それにより候補として考えることができる可能性のある結果のセットが生み出される。候補の結果は、次に、予測される文字の合成ストリングに用いられる所定の規則のいずれかのセットに基づいた分析の対象になる。例えば、数字のみが予測されていれば、完全に一致としてのアルファベット文字を生み出す比較結果は無視することができ、次に短いハミング距離に対する応答が用いられる。
上記のようにデコードされた文字の組み合わせは、ハミング距離及び各デコードされた文字の生じる不確実さを示す英数字の連続(デコードされたストリング)を形成する。
文字認識処理の最終ステップは、リード・ソロモン又は他のエラー訂正及び検出物のハミング距離を用いたデコードされたストリングに対する検出方法を含んでいてもよい。それは、どの文字が分類又は削除可能であるかを示すためであり、又は、リード・ソロモン処理をシードするために代替候補の文字を発生し、さらに代替物又はリード・ソロモン処理から生じ得る訂正ミスをチェックするためにである。もしもこの分析によって繰り返されたエラーが得られれば、さらなるエントリーを参照テーブルに追加することで将来の認識処理におけるエラーを除去できる。
例えば、図12に示された刻印を検討する。図12は、ドットマトリクス・プリンタによってラテン文字セットを用いることで印刷された安全コードのマーキングを示している。
図に示すように、第1ラインは、EBAH 6NS8 N06A AYD9である。もしも印刷エラーがなければ、上記に概要を説明したステップによって正確に読まれるべきものである。しかし、もしも例えば第1シンボルが底の列から2個のドットを欠いていれば、上述のテーブル処理は、2のハミング距離によってEと、2のハミング距離のFとを生み出す。ソフトウェアは、リード・ソロモン処理によって数の配列を2回テストするようにプログラム可能である。第1位置おけるEによる第1パスと、第1位置におけるFによる第2パスとである。このことは、改良された最終結果につながる、すなわち、デコードされたマーキングがオリジナルを正確に反映していることの蓋然性が高くなる。
もしも第1位置の文字がひどく損傷しておりしかも近い一致がなければ(例えば、ハミング距離が5を超える)、第3のリード・ソロモン処理が実行可能であり、そこでは文字位置は「削除」と記されている(公知のリード・ソロモン処理技術)。
上記の例では、アルゴリズムに対して3を超える不正確な文字入力が行われると、間違った答えが生じるのに対して、6の削除までは、文字は正しく訂正されることができる。このように、リード・ソロモン処理を正しく実行するためには、シンボル認識処理の信頼性、それゆえ、参照セット内の印刷品質が悪い文字(劣化した文字イメージとそのハミング距離との間のハミング距離)が役に立つことを知っておくことがきわめて重要である。
本発明は、製品における様々な刻印に適用可能である。例えば、製品、日付及び他の情報を結びつけて数字及びラテン文字を用いてシンボルの英数字セットにする刻印であって、リード・ソロモンエラー訂正文字によって増加されることができるものである。適切な「翻訳」ソフトウェアを用いることで、ローマ・アルファベット文字は、見ることが意図されている人の言語を反映するために用いられる非ローマ文字のセットに置き換えられる。このようにして、例えば、ロシアで販売予定の製品には数字及びキリル文字を用いて印刷が行われる。この例は、図13に示されている。万一電子的読み取りが失敗し顧客がデータを入力することが必要になれば、その国のキーボード及びコンピュータ・スクリーンがこれらの文字をサポートする可能性が高くなり、顧客がこれらの文字をそれらがローマ・アルファベットで印刷された場合に比べてより良く認識できるようになる可能性が高くなる。製造日付及び他の情報を表する方法は、さらに、オリジナル製品コードを処理によって分かりにくくしてもよい。
本発明はCIJPによって印刷された文字に関連して説明されたが、使用されているフォントがドットマトリクスのフォントであるならば、本方法は他の印刷技術によって印刷された文字にも適用可能である。
本発明は、ドットマトリクス文字形状による刻印が流通中の又は最終顧客にある製品から読み取られる必要がある環境において、特別な価値を有する。これらの状況では、印刷されているもののオリジナルデータを参照することができない。データのイメージをキャプチャするカメラは、スマートフォンにある安価なカメラ、又は専門官が使う高品質カメラであってもよい。これらの状況では、カメラに対するコードの配置は限定されず、さらに背景データは、CIJP印刷データが保持されるアイテムを持つ人物の手といった絵内の他のランダム情報を含むであろう。用いられる照明は限定されない。像における反射は、ガラス面からの太陽光の反射によって引き起こされる。しかし、上記で特定された試みは、情報を容易に抽出可能である。
ドットドットマトリクスが印刷された刻印に対する機械による読み取りに対する上述の試みは、公知の文字セットに従って製造される標準のドットマトリクス印刷について、うまく機能する。しかし、これらの文字セットは、肉眼による読みやすさの観点から開発され、その結果、消費者及び他の者によって読み取られるようになっている。発明者は、過度に脆弱な人間の目の信頼性に頼ることなく、本発明の方法を用いることで実現されたドットドットマトリクスによって印刷された文字の文字認識の改良が得られることを見いだした。改良とは、エラーレートの低減の点であり、すなわち、より少ない「誤って他のものであるとすること」とする。特定の文字を表すドットドットマトリクス内の複数のドットの位置を調整することによって、本発明に係るデータ読み取り方法によって実行されることで文字認識を改良する。
このようにして、好ましい実施形態では、本方法は、表面に適用されることになる印刷されたデータ、例えば、製品の上に直接人間及び機械によって同時に読み取り可能である形態で設けられたものを読み取ることに適用できる。上記データは、ドットの配列によって表された英数文字シンボルからなるデータであり、そこでは、ドット位置のいくつかは、対応する標準のドットドットマトリクス・フォント内の標準の位置から同じ文字又はシンボル内の他のものに対して、シフトしている。その結果、リード・ソロモン処理技術を用いて各シンボルの認識を改良できる。データ効率の高い度合いは、そのような試みを用いること確実に得られる。フォントは、望ましいアルファベットのいずれかであり、例えば、ラテン文字、キリル文字、漢字又はカタカナであり、その結果、本方法の効果的な使用が世界における異なる地域で可能になる。
言い換えると、本発明に係る印刷されたデータを機械読み取りする有効性は、もしもデータを印刷するのに用いられるドットマトリクス・タイプフェースを構成する文字セットが、少なくともいくつかの文字において、特定のx−yグリッド用の標準のドットマトリクス・タイプフェース・デザインによって占められている位置以外の位置にあるドットを有していれば、強化される。この種の印刷データを保持するアイテムは、本発明のさらなる特徴を構成する。

Claims (8)

  1. 概念的なx−yグリッドに関連付けられたドットの配列からなり、表面に設けられた文字によって示されたデータ読み取りの方法であって、以下の連続するステップを備えており、
    a)ディジタルカメラ装置によって文字の像をキャプチャし、
    b)そのようにキャプチャされたイメージをコンピュータに送信し、
    c)カメライメージの送信先であるコンピュータで走っている分析ソフトウェアによって、共分散、相関性又は色データの結合を用いることで、ドットの理想的な表示に対するドットの類似性を特定し、
    d)検出されたドットに関連する位置情報を処理することで、ドット間の距離を判定し、互いに近接するドットのグループ内の隣接ドットの「クラスター」を特定し、
    e)各グループ内のドット同士を結合し、そのようなグループにx−yグリッドを関連付け、そこでは各グループ内のドットの多数はグリッド要素が交差する位置にあり、
    f)各グループのイメージを分析することで、x−yグリッドの各交点においてドットが存在するか否かを判定し、
    g)各グループにおいて、与えられた固定位置からスタートし、先に定義されたシーケンスに従って、各交点におけるドットの存在又は非存在に対応する2進数を発生し、
    h)この2進数と、各グループにおいてドットマトリクスで印刷された文字に対応する情報に参照付けられている2進数の参照テーブル内の2進数とで、一番良いマッチを判定し、及び
    i)そのような比較によって特定された複数の文字同士を組み合わせることで形成された出力を提供する、
    方法。
  2. ステップg)において、固定位置はx−yグリッドの1コーナーであり、シーケンスは一列ずつ進む、請求項1に記載の方法。
  3. ステップh)で用いられる参照テーブルは、低品質で印刷された文字に対応する数字を含む、請求項1又は2に記載の方法。
  4. ステップh)で用いられる参照テーブルは、文字自体を印刷するのに用いられたドットマトリクス・パターン、前記文字が属するアルファベットを示すこと、及び完全に印刷された文字の2進数と同じ文字を低品質で印刷された表示の2進数とが相違する量に対応するハミング距離を含んでいる、請求項1〜3のいずれかに記載の方法。
  5. ステップh)で記載された前記比較は、参照テーブルのエントリーごとに、2進数と参照テーブルの2進数部分との間でビット単位で実行される、請求項1〜4のいずれかに記載の方法。
  6. 近い一致のみならず完全な一致(及びそれらの各ハミング距離)が記録された後に、前記記録された結果は、期待されている文字セットの特徴に合わせて調整された所定の規則のセットに基づいて、分析される、請求項1〜5のいずれかに記載の方法。
  7. 本発明の方法によって読み取られることに適した印刷データを有するアイテムであって、
    前記アイテム上の印刷は、ドットの配列で示された英数字シンボルの形態で、アイテムの表面に適用され、
    ドット位置のいくつかは、対応する標準のドットマトリクス・フォント内の標準の位置から、同じ文字又はシンボル内の他のものに対して、シフトしており、そこではリード/ソロモン処理技術を用いて各シンボルの認識を向上できる、アイテム。
  8. アルファベット・シンボルは、非ラテン・アルファベット及びアラビア数字に対応する数字シンボルである、請求項7に記載のアイテム。

JP2014530319A 2011-09-16 2012-09-14 印刷されたデータの機械読み取り Active JP6006315B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1116095.9 2011-09-16
GB201116095A GB201116095D0 (en) 2011-09-16 2011-09-16 Machine reading of printed data
PCT/GB2012/052287 WO2013038207A1 (en) 2011-09-16 2012-09-14 Machine reading of printed data

Publications (2)

Publication Number Publication Date
JP2014531656A true JP2014531656A (ja) 2014-11-27
JP6006315B2 JP6006315B2 (ja) 2016-10-12

Family

ID=44937447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014530319A Active JP6006315B2 (ja) 2011-09-16 2012-09-14 印刷されたデータの機械読み取り

Country Status (5)

Country Link
US (1) US9104936B2 (ja)
EP (1) EP2756457A1 (ja)
JP (1) JP6006315B2 (ja)
GB (1) GB201116095D0 (ja)
WO (1) WO2013038207A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013104401A1 (de) * 2013-04-30 2014-10-30 Schulte-Schlagbaum Aktiengesellschaft Verfahren zur Fertigung eines Ersatzteiles einer Schließvorrichtung
CN103400102B (zh) * 2013-08-16 2016-12-28 徐宁 一种以图像为载体的信息传播系统、终端设备、服务器及其方法
GB201520241D0 (en) 2015-11-17 2015-12-30 Wessex Technology Opto Electronic Products Ltd Accessing confidential or sensitive information associated with plans, diagrams or the like
EP3497708A4 (en) * 2016-08-11 2020-03-11 Videojet Technologies Inc. PRINTER DEVICE, PRINTER MARKING SYSTEM AND METHOD HAVING MULTI-STAGE PRODUCTION PRINTING INSPECTION
US10356318B1 (en) * 2017-04-27 2019-07-16 Intuit, Inc. Long document capture on mobile devices
CN109034166B (zh) * 2017-06-08 2021-09-24 北京君正集成电路股份有限公司 易混淆字符识别模型训练方法和装置
CN108154544A (zh) * 2017-12-19 2018-06-12 苏州华兴源创电子科技有限公司 一种在图像上叠加字符的方法和装置
CN109358909A (zh) * 2018-08-28 2019-02-19 努比亚技术有限公司 显示页面控制方法、终端及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593690A (ja) * 1982-06-28 1984-01-10 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン 入力パタ−ンにインデツクス番号を適応的に割当てる方法
JPS5998287A (ja) * 1982-11-26 1984-06-06 Nec Corp ドツト文字認識装置
JPS6143385A (ja) * 1984-08-06 1986-03-01 Fujitsu Ltd ドツトパタ−ンの認識方法
JPH06274689A (ja) * 1993-03-24 1994-09-30 Toshiba Corp 文字認識装置
JP2002312720A (ja) * 2001-04-11 2002-10-25 Ricoh Co Ltd 文字認識装置、文字認識方法、プログラム及び記憶媒体
JP2003187187A (ja) * 2001-12-20 2003-07-04 Omron Corp モデル登録方法およびこの方法を用いたパターン認識装置
JP2006065581A (ja) * 2004-08-26 2006-03-09 Matsushita Electric Works Ltd 文字・図形の認識方法および検査方法
JP2007526566A (ja) * 2004-03-01 2007-09-13 ブコデ ピーティーワイ リミテッド 文字データのエンコード及びデコード

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3873972A (en) * 1971-11-01 1975-03-25 Theodore H Levine Analytic character recognition system
US4130819A (en) 1977-06-22 1978-12-19 Hildegarde Seifried Optical character recognition device
US5504822A (en) * 1986-09-19 1996-04-02 Holt; Arthur W. Character recognition system
JPH0277891A (ja) 1988-09-14 1990-03-16 Canon Inc 文字認識装置
US5025479A (en) 1988-09-19 1991-06-18 Jose Pastor Recognition method for character set
DE69228647T2 (de) 1991-11-01 1999-09-23 Eastman Kodak Co., Rochester Verfahren und Gerät zur Detektion von Text in Punktmatrixdruck zur Verbesserung von optischer Zeichenerkennung
US5212741A (en) 1992-01-21 1993-05-18 Eastman Kodak Company Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition
AU2003221887A1 (en) * 2002-04-12 2003-10-27 Tritek Technologies, Inc. Mail sorting processes and systems
ATE434803T1 (de) * 2002-09-26 2009-07-15 Kenji Yoshida Informationswiedergabe-i/o-verfahren mit punktmuster und informationswiedergabeeinrichtung

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593690A (ja) * 1982-06-28 1984-01-10 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン 入力パタ−ンにインデツクス番号を適応的に割当てる方法
JPS5998287A (ja) * 1982-11-26 1984-06-06 Nec Corp ドツト文字認識装置
JPS6143385A (ja) * 1984-08-06 1986-03-01 Fujitsu Ltd ドツトパタ−ンの認識方法
JPH06274689A (ja) * 1993-03-24 1994-09-30 Toshiba Corp 文字認識装置
JP2002312720A (ja) * 2001-04-11 2002-10-25 Ricoh Co Ltd 文字認識装置、文字認識方法、プログラム及び記憶媒体
JP2003187187A (ja) * 2001-12-20 2003-07-04 Omron Corp モデル登録方法およびこの方法を用いたパターン認識装置
JP2007526566A (ja) * 2004-03-01 2007-09-13 ブコデ ピーティーワイ リミテッド 文字データのエンコード及びデコード
JP2006065581A (ja) * 2004-08-26 2006-03-09 Matsushita Electric Works Ltd 文字・図形の認識方法および検査方法

Also Published As

Publication number Publication date
WO2013038207A1 (en) 2013-03-21
JP6006315B2 (ja) 2016-10-12
GB201116095D0 (en) 2011-11-02
EP2756457A1 (en) 2014-07-23
US9104936B2 (en) 2015-08-11
US20140363081A1 (en) 2014-12-11

Similar Documents

Publication Publication Date Title
JP6006315B2 (ja) 印刷されたデータの機械読み取り
US5298731A (en) Method for printing and reading for orthogonal bar code patterns
US7510125B2 (en) Multi-dimensional symbologies and related methods
JP5643998B2 (ja) 2次元識別パターン、当該パターンを含む物品、および当該パターンをマーキングおよび識別する方法
US7676038B2 (en) Secure printing method to thwart counterfeiting
US7428996B2 (en) Method and system for encoding information into a bar code with different module size
TW201719505A (zh) 從成像檔案擷取正文之方法、設備以及有形電腦可讀儲存媒體
CN108351956B (zh) 用于印刷取证编码的2d条形码的方法和系统
EP3200120B1 (en) Enhanced matrix symbol error correction method
CN108073966A (zh) 一种二维码与孔阵码的转换方法
WO2016206446A1 (zh) 具有纠错功能的字符编码方法、字符解码方法及其产品
US20230034244A1 (en) Secure marking method and device and authentication method and device
US20070140567A1 (en) Method, system and computer program for encoding and decoding a pixelized target graphic symbol
JP5592234B2 (ja) 二次元コード生成装置、二次元コード読取装置、二次元コード、二次元コード生成方法、二次元コード読取方法及びプログラム
Bogataj et al. Multi-color 2D datamatrix codes with poorly readable colors
WO2021095457A1 (ja) 二次元コード生成方法、二次元コード評価方法、二次元コードシステム、二次元コード生成装置、及び二次元コード評価装置、及び二次元コード
Berisso Reed-Solomon Based Bar Code Character Substitution Rates
Akila et al. Secured data encoding technique in high capacity color barcodes for m-ticket application
EP3100243A1 (en) A system for simple coding, authentication and copy detection of printed documents
CN113011536A (zh) 一种设置图形码打印参数的方法及装置
JPH02259892A (ja) パリティ付マス目コード発生装置
JP2007038473A (ja) 印刷装置
JP2014205322A (ja) 画像付きカードの発行方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160908

R150 Certificate of patent or registration of utility model

Ref document number: 6006315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250