JP2016523397A

JP2016523397A - 情報認識のための方法及びシステム

Info

Publication number: JP2016523397A
Application number: JP2016516260A
Authority: JP
Inventors: リー・ヤン; チェン・グオ
Original assignee: Alipay com Co Ltd
Current assignee: Alipay com Co Ltd
Priority date: 2013-06-03
Filing date: 2014-06-03
Publication date: 2016-08-08
Anticipated expiration: 2034-06-03
Also published as: SG10201606988WA; CN109766890B; KR101836071B1; CN104217202A; WO2014195802A2; US9367753B2; EP3005234A4; TW201447775A; US20160247037A1; KR20160014728A; EP3005234A2; US20140355883A1; SG11201509903TA; US10210415B2; JP6255486B2; CN104217202B; WO2014195802A3; CN109766890A

Abstract

【解決手段】本出願の実施形態は、情報認識のための方法、情報認識のためのシステム、及び情報認識のためのコンピュータプログラム製品に関する。情報認識のための方法が提供される。この方法は、複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、各カードゾーン内において情報ゾーンを位置特定し、各情報ゾーンを少なくとも１つの文字ゾーンに分割し、カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、ぼけ修正された文字ゾーンに基づいて、文字列情報を認識することを備える。【選択図】図１Ｂ

Description

［関連出願の相互参照］
本出願は、あらゆる目的のために、参照によって本明細書に組み込まれる、２０１３年６月３日に出願され、発明の名称を「ＩＮＦＯＲＭＡＴＩＯＮＲＥＣＯＧＮＩＴＩＯＮＭＥＴＨＯＤ，ＥＱＵＩＰＭＥＮＴＡＮＤＳＹＳＴＥＭ（情報認識の方法、機器、及びシステム）」とする中国特許出願第２０１３１０２１６６１１．５号に基づく優先権を主張する。

本出願は、情報認識のための方法及びシステムに関する。

インターネットの発展に伴って、オンライン決済、携帯電話を利用した決済、及びその他のエクスプレス決済が、益々広まっている。通常、クレジットカードのユーザは、そのカード情報を直接入力する。入力速度を上げるために、ユーザは、ときには、画像取り込み機器を使用してクレジットカード情報及び補助情報を取得する。

今日市場に出ているアプリケーションの多くは、シングルフレーム画像を収集し、そのシングルフレーム画像を処理して目的領域を取得し、次いで、これらの取得された目的領域に対して画像処理及び光学式文字認識を実施することができる。収集されたクレジットカード画像は、例えば、画像取り込み機器の受光素子の限界及び環境からの影響ゆえに、被写体ぼけやノイズなどの問題を有する。システムにとって、取り込まれた画像の品質の悪さを回避することは困難であり、したがって、その画像内においてカードゾーンの位置を定めることも困難である。場合によっては、カード上の一部の文字ゾーンが明瞭である一方で、カード上のその他の文字ゾーンはぼやけていることがある。条件の違いを区別することなく均一に処理を行う現行のシングルフレーム処理方法が用いられる場合は、正しく認識される文字がある一方で、容易に認識されずひいては認識に失敗する文字がある。

本発明の様々な実施形態が、以下の詳細な説明及び添付の図面で開示される。

ここで説明される図面は、本出願の理解を深めることを意図しており、本出願の一部を構成する。本出願の代表的な実施形態及びその説明は、本出願の説明を意図しており、本出願を不適切に制限することはない。

カードゾーンの一例を示す図である。

情報認識のためのプロセスの一実施形態を示すフローチャートである。

文字ゾーンをぼけ修正するためのプロセスの一実施形態を示すフローチャートである。

文字ゾーンの明瞭度を計算するためのプロセスの一実施形態を示すフローチャートである。

情報認識のためのデバイスの一実施形態を示す構造ブロック図である。

ぼけ修正モジュールの一実施形態を示す構造ブロック図である。

明瞭度計算モジュールの一実施形態を示す構造ブロック図である。

情報認識のためのシステムの一実施形態を示す構造ブロック図である。

情報認識のためのプログラムドコンピュータシステムの一実施形態を示す機能図である。

本発明は、プロセス、装置、システム、合成物、コンピュータ読み取り可能ストレージ媒体に実装されたコンピュータプログラム製品、並びに／又は接続先のメモリに記憶された命令及び／若しくは接続先のメモリによって提供される命令を実行するように構成されたプロセッサ等のプロセッサなどの、数々の形態で実現可能である。本明細書では、これらの実現形態、又は本発明がとりえるその他のあらゆる形態を、技術と称することができる。総じて、開示されるプロセスの各ステップの順番は、本発明の範囲内で変更可能である。別途明記されない限り、タスクを実施するように構成されるものとして説明されるプロセッサ又はメモリなどのコンポーネントは、所定時にタスクを実施するように一時的に構成された汎用コンポーネントとして、又はタスクを実施するように製造された特殊コンポーネントとして実装可能である。本明細書で使用される「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された１つ以上のデバイス、回路、並びに／又は処理コアを言う。

本発明の原理を例示す添付の図面とともに、以下で、本発明の１つ以上の実施形態の詳細な説明が提供される。本発明は、このような実施形態に関連付けて説明されるが、いずれの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定され、本発明は、数々の代替形態、変更形態、及び均等物を包含している。以下の説明では、本発明の完全な理解を与えるために、数々の具体的詳細が明記されている。これらの詳細は、例示を目的として提供されるものであり、本発明は、これらの詳細の一部又は全部を伴わずとも、特許請求の範囲にしたがって実施可能である。明瞭を期するために、本発明に関連した技術分野で知られる技術要素は、本発明が不必要に不明瞭にされないように、詳細な説明を省略されている。

原シングルフレーム画像処理プロセスをマルチフレーム画像シーケンスに導入するための方法が提供される。ポータブル端末上のカメラなどの画像取り込みデバイスによって、情報収集元となるクレジットカード又はＩＤカードなどの標準的なカードに対してビデオストリームサンプリング又はマルチ画像サンプリングが実施される。次いで、画像取り込みデバイスは、サンプリングされたビデオストリームの複数のフレーム又は複数の画像のなかの文字ゾーンに対して個別にぼけ修正を実施し、複数のフレームのなかから認識に適さない文字ゾーンをフィルタリングによって排除し、認識に適した文字ゾーンを保存し合体させて上記カードのための文字列情報認識結果を得る。一部の実施形態では、カード情報は、ポータブル端末のアプリケーションインターフェースに迅速に且つ便利に且つ正確に入力される。

図１Ａは、カードゾーンの一例を示す図である。カードゾーンは、画像における矩形領域を指す。画像は、アプリケーションウィンドウの中に見ることができる。矩形領域の四辺は、カードの四辺に対応している。一部の実施形態では、技術は、複数のフレームを使用してフィルタリングを行って明瞭な文字を取得し、次いで、認識を実施して文字列情報を取得する。例えば、例えばフレームｉなどの第１のフレームにおける或る文字ゾーン内の或る文字が明瞭でない、すなわちピンぼけしている場合は、そのフレームｉにおけるその文字をスキップし、例えばフレームｉ＋１などの次のフレームにおける同じ文字ゾーン内の文字を、もしその文字が明瞭であれば使用することができる。

図１Ｂは、情報認識のためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス１００は、図７のサーバ又は情報認識機器７２０によって実行され、以下を含む。

一部の実施形態では、ポータブルコンピュータ、パームトップコンピュータ、又は携帯電話などのポータブル端末を通じてオンライン決済を行うにあたり、カード番号又は有効期限などのクレジットカード情報を入力するときに、ユーザは、ポータブル端末上のカメラなどの画像取り込みデバイスを通じてクレジットカード情報を認識及び入力する。

ある例では、ユーザは、画像取り込みデバイスを通じて（例えばビデオ取り込みアプリケーションの使用によって）クレジットカードのビデオストリームを取り込む、又は画像取り込みデバイスによって（例えば複数の写真を撮ることによって）クレジットカードの複数のシングルフレーム画像を取り込む。別の例では、ユーザは、画像取り込みデバイスによって、クレジットカードの複数のシングルフレーム画像及びビデオストリームの両方を取り込む。

一部の実施形態では、ユーザは、取り込んだ複数のシングルフレーム画像及び／又はビデオストリームを画像取り込みデバイス又はポータブル端末のキャッシュに保存し、サーバは、このキャッシュから、後ほど画像解析を実施するために画像フレームシーケンスを取得する。

操作１１０において、サーバは、カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う。

一部の実施形態では、画像フレームシーケンスは、複数の取り込み画像からのシングルフレーム画像の集合に相当する（例えば複数の写真）、又は画像フレームシーケンスは、キャッシュ内の連続したビデオストリーム（例えばビデオストリームの一部分）から選択されている。一部の実施形態では、画像フレームシーケンスは、既定の数の連続フレームを含む、又は画像フレームシーケンスは、所定の数のフレームから一定間隔で選択された既定の数の非連続フレームに相当する。一例として、非連続フレームは、３つに１つのフレームに相当する。一部の実施形態では、画像フレームシーケンス内のフレームの数は、具体的な実行形態に応じて異なる。例えば、画像フレームシーケンス内のフレームの数は、１０を超えない。別の例では、画像フレームシーケンス内のフレームの数は、３又は５である。

一部の実施形態では、カードゾーンは、任意の既知の位置特定技術に基づいて、各フレーム内において位置特定される。既知の位置特定技術の例として、統計調査に基づく物体検出や、テンプレート整合に基づく物体検出などが挙げられる。一部の実施形態では、カードゾーンは、所定の形状、所定のサイズ、カード面に固有な特徴、又はこれらの任意の組み合わせに基づいて、画像フレームシーケンス内の各フレーム内において位置特定される。

例えば、クレジットカードは、国際基準に基づいて作成される。クレジットカードは、標準のサイズ及び形状を有し、カード番号及び有効期限などの文字情報は、カード上において比較的決まった位置を有する。また、文字情報には、特定の形式がある。したがって、カードゾーンは、これらの文字の位置に基づいて、画像フレーム内において位置特定することができる。一部の実施形態では、サーバは、先ずカードゾーンを位置特定し、次いで数字ゾーンを位置特定する。

一部の実施形態では、カードゾーンの位置解析を実施しつつ、目測によって現フレームが十分に鮮明でないと評価される場合、すなわちカードゾーンの位置が特定できない場合、サーバは、現フレームを破棄し、キャッシュから次のフレームを取得し、取得された次のフレームに対して解析を実施する。例えば、ブレナ勾配を使用してフレームの鮮明度が計算され、この計算されたフレーム鮮明度は閾値と比較することができ、もし、計算されたフレーム鮮明度が閾値を上回る場合は、フレームは、十分に鮮明であると判断される。

サーバは、上記の実施形態で説明された手法だけでなく、当該分野で既知である手法又は今後開発される手法を含む任意の適切な手法を使用して、画像フレーム内においてカードゾーンを位置特定することができる。

操作１２０において、サーバは、各カードゾーン内に位置する少なくとも１つの情報ゾーンを位置特定する。

一部の実施形態では、サーバは、カード内における情報ゾーンの既定の位置、情報ゾーンの既定のサイズ、情報ゾーンの既定の形状、又はこれらを任意に組み合わせた特性に基づいて、位置特定されたカードゾーン内において情報ゾーンを位置特定する。情報ゾーンとして、例えば、カード番号ゾーン、有効期限ゾーン、カード名義人ゾーン、セキュリティコードゾーン、カード上に見られるその他の任意のタイプの情報、又はこれらの任意の組み合わせが挙げられる。

一例として、上記のように、クレジットカードは、国際基準にしたがって作成される。例えば、カード番号や有効期限などの情報ゾーンの相対位置は、カード面上で決まっており、これらの情報ゾーンは、特定の形状を有する。８７ｍｍ×５５ｍｍのカードを一例として使用すると、カードの左上隅が原点とされ、カードの長さがＸ軸であり、カードの高さがＹ軸である。通常、数字は、長さが６８ｍｍで高さが５ｍｍの領域における１０ｍｍ×３０ｍｍ付近に見られる。したがって、サーバは、上記のこれらの特性に基づいて、カードゾーン画像内において情報ゾーンを位置特定する。

サーバは、上記の実施形態で説明された手法だけでなく、当該分野で既知である手法又は今後開発される手法を含む任意の適切な手法を使用して、カードゾーン内において情報ゾーンを位置特定することができる。

操作１３０において、サーバは、各情報ゾーンを個々の文字ゾーンに分割する。

一部の実施形態では、サーバは、位置特定された情報ゾーンを、情報ゾーン内における文字の間隔、文字の数、文字のサイズ、又はこれらを任意に組み合わせた特性に基づいて、少なくとも１つの文字ゾーンに分割する。例えば、文字ゾーンは、１つの数字又は文字を含む。

一部の実施形態では、サーバは、上記の実施形態で説明された手法だけでなく、当該分野で既知である手法又は今後開発される手法を含む任意の適切な手法を使用して、情報ゾーンを少なくとも１つの文字ゾーンに分割する。例えば、サーバは、当該分野でよく知られた閾値区分方法を利用し、情報ゾーンに前景・背景区分、閾値化、並びに分類子パターン分類を施して、情報ゾーンを少なくとも１つの文字ゾーンに分割する。

一例として、情報ゾーンを分割するために、サーバは、先ず、その情報ゾーンの勾配画像を取得し、事前に分割された勾配画像をグレースケール値が蓄積している水平線上に投影し、水平線上における領域又は文字ゾーンの明瞭な区切りを識別する。

操作１４０において、サーバは、カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正する。

一部の実施形態では、分割動作において、画像フレームシーケンス内の各フレームにおける情報ゾーンが、少なくとも１つの文字ゾーンに分割される。各フレームには同数の文字ゾーンが含まれるので、各フレームにおいて同じ位置又はシーケンス番号を有する文字ゾーンは、対応文字ゾーンとして定義される。シーケンス番号は、特定の位置にある文字ゾーンに固定シリアル番号を与えるものであり、このシリアル番号は、フレームシーケンス内において変わることはない。例えば、各フレームにおける第１の文字ゾーンが一対応文字ゾーンであり、各フレームにおける第２の文字ゾーンが一対応文字ゾーンであり、各フレームにおける第３の文字ゾーンが一対応文字ゾーンであり、以下同様に続く。

一部の実施形態では、サーバは、全てのフレームの対応文字ゾーンの画像を同一ベクトルデータ構造に保存する。カード面上の或る情報ゾーンがＮ個の文字を有し、フレームシーケンス内のフレーム数がＭであると想定する。この例では、データ構造内のベクトル数がＮに相当し、ベクトルの次元数がＭに相当する。

一部の実施形態では、画像認識精度を上げるために、サーバは、画像フレームシーケンス内の全てのフレームにわたって対応している少なくとも１つの文字ゾーンをぼけ修正する。

例えば、サーバは、個々の対応文字ゾーンをぼけ修正するために、既知の手法であるか又は今後開発される手法であるかを問わず、任意のぼけ修正方法を使用することができる。ぼけ修正方法の例として、ウィーナフィルタやルーシー・リチャードソンアルゴリズムなどを使用した方法が挙げられる。

図２は、文字ゾーンをぼけ修正するためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス２００は、図１Ｂの１４０を実現するものであり、以下を含む。

操作２１０において、画像フレームシーケンス内の全てのフレームに対応している文字ゾーンに関し、サーバは、各文字ゾーンの、その文字ゾーンがどれくらい明瞭である、鮮明である、及び／又は読みやすいと見なされるかを表す明瞭度を計算する。

一部の実施形態では、サーバは、全てのフレームにわたる文字ゾーンのうちの各文字ゾーンの明瞭度を算出する。実際、一部の実施形態では、サーバは、文字ゾーンの明瞭度を計算するために、画像鮮明度を計算するための任意の適切な方法を使用することができる。例えば、画像鮮明度は、ブレナ勾配を使用して計算することができる。

一部の実施形態では、サーバは、文字ゾーンの明瞭度を、その文字ゾーン内の画素のグレースケール値に基づいて計算する。図３は、文字ゾーンの明瞭度を計算するためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス３００は、図２の２１０を実現するものであり、以下を含む。

通常、クレジットカード上の文字は、平坦ではなく型打ちされて隆起しているという特性を有する。文字の線は、通常、水平及び垂直の２方向である。文字に斜めの線が見られるのは比較的稀であり、水平線と垂直線とをつなぐコーナー角は比較的小半径である。これらの特性は、投影されたクレジットカード文字の画像が水平方向及び垂直方向に極めて著しい勾配特徴を有することを示している。勾配特徴は、水平方向又は垂直方向における画像内の変化率を表している。一例として、グレースケール値が（０．１，０．５，０．９）である隣り合う３つの画素からなる第１の画素群を、グレースケール値が（０．３，０．３，０．３）である隣り合う３つの画素からなる第２の画素群と比較すると、第１の画素群は、第２の画素群よりも大きい勾配特徴を有する。したがって、文字ゾーン明瞭度は、文字ゾーン内の画素のグレースケール値の水平勾配特徴及び垂直勾配特徴を使用して記述される。

操作３１０において、サーバは、文字ゾーン内の各画素の強度値を、その文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得する。

一例として、サーバは、所定の文字強度テスト演算子集合に基づいて、文字ゾーン内の各画素をスキャンし、該スキャンの結果に基づいて、各画素のグレースケール値の水平勾配特徴及び垂直勾配特徴を取得し、次いで、文字ゾーン内の全ての画素の強度値を取得する。

一部の実施形態では、文字強度テスト演算子集合は、Ｔ＝｛ａ，ｂ｝として定義される。一部の実施形態では、パラメータａは、文字ゾーン内の水平勾配特徴を抽出及びスキャンするために使用されるパラメータであり、パラメータｂは、文字ゾーン内の垂直勾配特徴を抽出及びスキャンするために使用されるパラメータであり、ａ及びｂは、ともに、３×３行列である。行列内の各要素は、画像内の一画素に対応している。行列要素の配置の一例は、以下に示されるように、画像内における画素の配置に対応している。

一部の実施形態では、スキャンプロセスにおいて、水平スキャンを行うためにパラメータａが使用され、垂直スキャンにパラメータｂが使用され、水平スキャン値及び垂直スキャン値は、全ての画素の強度値を得るために合算される。例えば、水平スキャンを行っている間、行列ａ内の各要素が、対応する画素のグレースケール値で掛け合わされ、各要素とそれに対応する画素のグレースケール値との積が、合算される。結果として得られる和は、行列の中心位置にある要素に対応する画素の強度値に関係する。また、計算中に、画像の縁に位置する画素に遭遇すると、サーバは、計算を完成させるために画素の補完を行い、補完されたこれらの画素のグレースケール値はゼロに設定される。垂直スキャン処理は、水平スキャン処理と同様であり、簡潔を期するためにこれ以上論じられない。

テスト演算子集合Ｔは、一例に過ぎず、本発明を限定するものではなく、演算子集合Ｔのなかのパラメータａ及びｂも、その他の任意の適切な値であってよい。

一部の実施形態では、文字ゾーン内の画素の強度値は、上述された処理において効果的に記述される。強度値は、明瞭度を決定するために使用される。また、サーバは、文字ゾーンの明瞭度を反映するために、画素のグレースケール値の水平勾配特徴及び垂直勾配特徴を効果的に使用することができる。また、上述された処理に関わる演算子は比較的少なく、その結果、計算効率が向上される。

操作３２０において、サーバは、各文字ゾーンの明瞭度を強度値に基づいて決定する。

一部の実施形態では、各文字ゾーンに関し、サーバは、文字ゾーン内の全ての画素の強度値の平均をその文字ゾーンの明瞭度として算出する。

したがって、操作３１０及び３２０において、サーバは、各文字ゾーンの明瞭度を決定する。ここでは、でこぼこの及び／又は隆起した文字に関して明瞭度の基準が決定されるクレジットカードの例が使用されているが、明瞭度の基準及び方式は、でこぼこの及び／又は隆起した文字に限定されず、平坦な文字が存在する状況にも適用される。

図２に戻り、操作２２０において、サーバは、対応文字ゾーンの中から明瞭度が最も高い文字ゾーンを選択し、該明瞭度が最も高い文字ゾーンを候補文字ゾーンとして決定する。

一例では、サーバは、フレームシーケンス内の各フレームの文字ゾーンの明瞭度を個別に計算し、それによって、フレームシーケンス内の対応文字ゾーンの明瞭度の集合を取得する。この明瞭度の集合から、サーバは、明瞭度が最も高い文字ゾーンを候補文字ゾーンとして選択する。

操作２３０において、サーバは、候補文字ゾーンの明瞭度が既定の閾値よりも高いか否かを判断する。一部の実施形態では、既定の閾値は、経験的に決定される。

操作２４０において、候補文字ゾーンの明瞭度が既定の閾値よりも高い場合に、サーバは、その候補文字ゾーンを、後続の認識処理のための対応文字ゾーンの選択画像と見なす。

操作２５０において、候補文字ゾーンの明瞭度が既定の閾値以下である場合に、サーバは、次の画像フレームシーケンスを取得し、該次の画像フレームシーケンスを引き続き処理する。

一例として、キャッシュから別のフレームシーケンスが取得され、図１Ｂの情報認識プロセス１００の実行によって再び情報認識が実施される。一部の実施形態では、この別のフレームシーケンスは、先立って処理されたフレームシーケンスと同数のフレームを有する。

この時点で、操作２１０〜２５０を通じて全ての文字ゾーンがぼけ修正されている。一部の実施形態では、ビデオストリームから複数のフレームが順次選択される、又は幾つかのフレームが一定間隔で選択される。一態様として、一部の実施形態では、隣り合うフレーム間における時間データの類似性の観点から、複数のシングルフレームが数フレーム間隔で選択され、これらのフレームは、重点フレームと呼ばれる。この手法は、連続して選択する場合よりもデータ計算量が少なくてすみ、計算効率を効果的に高めるとともに、システム全体のパフォーマンスを向上させることができる。

また、フレーム数の選択及び文字明瞭度閾値の選択に関しては、サーバは、基準としての閾値要件を文字明瞭度が満たしている全Ｎ文字ゾーンの選択画像をとり、情報認識システムの動作条件に基づいてフレーム数及び文字明瞭度閾値に重みを付けることによって、フレーム数及び文字明瞭度閾値を決定することができる。要するに、あるカード情報認識プロセスにおいて、サーバがＭ個のフレームを取得し、明瞭度閾値を超える明瞭度を有する全Ｎ文字ゾーンの選択画像を得たときに、サーバは、これ以上フレームを取得する必要はない。また、一部の実施形態では、サーバは、次のカード情報認識の際も、Ｍ個のフレームを選択する。一部の実施形態では、Ｍという数は、大きすぎてはならない。Ｍが大きすぎると、システム全体のパフォーマンスが低下し、ユーザの待機時間が長くなる。例えば、認識プロセスの際に、要件を満たすＮ文字ゾーンの選択画像が１０フレーム以内で得られない場合、サーバは、次の認識プロセスでは、１０フレーム以内で鮮明なＮ文字ゾーンを得るために、文字明瞭度閾値を適宜引き下げる。プロセスは、Ｍを１０又は特定の数に限定することを意図しておらず、Ｍは、この数よりも大きくても又は１０未満であってもよい。

図１Ｂに戻り、操作１５０において、サーバは、ぼけ修正された文字ゾーンに基づいて、文字列情報を認識する。

一部の実施形態では、サーバは、任意の既知の認識技術に基づいて、全文字ゾーンの選択画像内における対応文字を順次認識し、それによって、文字列情報を得る。例えば、サーバは、当該分野で一般的に利用されている閾値区分方法を利用し、前景・背景区分、閾値化、及び分類子パターン分類を通じて対応文字を認識する。文字列情報の認識の一例として、機械学習技術を使用し、０〜９の数字を認識するように識別エンジンを訓練し、次いで、識別エンジンを使用して各文字を認識することが挙げられる。

マルチフレーム画像処理結果に融合処理を施し、それによって、後続の認識処理に適した鮮明な文字ゾーン画像を得ることによって、カード情報認識正解率が上がるうえに、カード情報認識システム全体のパフォーマンスも向上し、その結果、ユーザの便宜が良くなる。融合処理の一例を、図３のプロセス３００に見ることができる。

なお、上記の実施形態は、いずれもクレジットカードを例として使用していることに留意されたい。しかしながら、これらの方式は、クレジットカードに限定されず、ＩＤカードや会員カードなどの、基準に適合する様々な標準的カードにも適用可能である。

一部の実施形態では、文字列情報が認識された後、操作１６０において、サーバは、文字列情報の正確さを検証する。

一部の実施形態では、認識された文字列情報は、カードのための所定のルールにしたがって検証される。一部の実施形態では、認識された文字列情報の正確さが立証された場合に、サーバは、後続処理を実施する。例えば、文字列情報が、確認のためにカード情報としてユーザに対して表示される。一部の実施形態では、認識された文字列情報の正確さが立証されなかった場合に、サーバは、次の画像フレームシーケンスを取得し、図１Ｂのプロセス１００を使用して再び情報認識が実施される。

クレジットカードを例として使用し、認識された文字ゾーンがカード番号情報ゾーンである場合、サーバは、認識された文字列情報が、例えば国際基準におけるクレジットカード番号の一連の番号についての所定の桁数又は所定の配置などの所定のルールに適合するかどうかを検証する。

検証動作を通じて、プロセスは、カード情報認識の正解率、カード情報認識システム全体のパフォーマンス、及びユーザの便宜を向上させる。

図４は、情報認識のためのデバイスの一実施形態を示す構造ブロック図である。一部の実施形態では、デバイス４００は、図１Ｂのプロセス１００を実行するものであり、カード位置特定モジュール４１０と、情報位置特定モジュール４２０と、文字ゾーン分割モジュール４３０と、ぼけ修正モジュール４４０と、認識モジュール４５０とを含む。

一部の実施形態では、カード位置特定モジュール４１０は、カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う。一例として、カード位置特定モジュール４１０は、任意の既知の位置特定技術を使用して、各フレーム内においてカードゾーンを位置特定する。一部の実施形態では、カード位置特定モジュール４１０は、所定の形状、所定のサイズ、文字情報に固有な特徴、又はこれらを任意に組み合わせた特性に基づいて、画像フレーム内においてカードゾーンを位置特定する。

一部の実施形態では、情報位置特定モジュール４２０は、各カードゾーン内において情報ゾーンを個別に位置特定する。一部の実施形態では、情報位置特定モジュール４２０は、更に、カード内における情報ゾーンの既定の位置、情報ゾーンの既定のサイズ、情報ゾーンの既定の形状、又はこれらを任意に組み合わせた特性に基づいて、各カードゾーン内において情報ゾーンを位置特定する。例えば、情報ゾーンとして、カード番号ゾーン、有効期限ゾーン、カード名義人ゾーンなどが挙げられる。

一部の実施形態では、文字ゾーン分割モジュール４３０は、各情報ゾーンを個々の文字ゾーンに分割する。一部の実施形態では、文字分割モジュール４３０は、情報ゾーンを、文字の間隔、文字の数、文字のサイズ、又はこれらを任意に組み合わせた特性に基づいて、少なくとも１つの文字ゾーンに分割する。例えば、文字ゾーンは、数字又は文字を含む。

一部の実施形態では、ぼけ修正モジュール４４０は、画像フレームシーケンス内の全てのフレームにわたって対応している文字ゾーンをぼけ修正する。一部の実施形態では、ぼけ修正モジュール４４０は、既知であるか又は今後開発されるかを問わず、全ての対応文字ゾーンをぼけ修正する。

図５は、ぼけ修正モジュールの一実施形態を示す構造ブロック図である。一部の実施形態では、ぼけ修正モジュール５００は、図４のぼけ修正モジュール４４０を実現したものであり、明瞭度計算モジュール５１０と、候補文字ゾーン選択モジュール５２０と、閾値決定モジュール５３０とを含む。

一部の実施形態では、明瞭度計算モジュール５１０は、画像フレームシーケンス内の全てのフレームにわたって対応している文字ゾーンのうちの各文字ゾーンの明瞭度を計算する。

図６は、明瞭度計算モジュールの一実施形態を示す構造ブロック図である。一部の実施形態では、明瞭度計算モジュール６００は、図５の明瞭度計算モジュール５１０を実現したものであり、強度値計算モジュール６１０と、明瞭度決定モジュール６２０とを含む。

一部の実施形態では、強度値計算モジュール６１０は、文字ゾーン内の各画素の強度値を、その文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて計算する。

一部の実施形態では、明瞭度決定モジュール６２０は、各文字ゾーンの明瞭度を、その文字ゾーン内の各画素の強度値にしたがって決定する。

図５に戻り、一部の実施形態では、候補文字ゾーン選択モジュール５２０は、対応文字ゾーンのなかから明瞭度が最も高い文字ゾーンを選択し、この選択された文字ゾーンを候補文字ゾーンとする。

一部の実施形態では、候補文字ゾーンの明瞭度が既定の閾値よりも高い場合に、閾値決定モジュール５３０は、その候補文字ゾーンを、後続の認識処理のための対応文字ゾーンの選択画像と見なす。候補文字ゾーンの明瞭度が既定の閾値よりも低い場合に、閾値決定モジュール５３０は、次の画像フレームシーケンスを取得し、該次の画像フレームシーケンスを引き続き処理する。

図４に戻り、一部の実施形態では、認識モジュール４５０は、ぼけ修正された文字ゾーンに基づいて、文字列情報を認識する。

ここまでは、情報認識機器の概要構造が説明されてきた。マルチフレーム画像処理結果に融合処理を施し、それによって、後続の認識処理に適した鮮明な文字ゾーン画像を得ることによって、カード情報認識正解率及びカード情報認識システム全体のパフォーマンスが向上し、ユーザの便宜が良くなる。

一部の実施形態では、デバイス４００は、ストレージモジュール４６０と、画像フレームシーケンス取得モジュール４７０とを含む。

一部の実施形態では、ストレージモジュール４６０は、カードを撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存する。

一部の実施形態では、画像フレームシーケンス取得モジュール４７０は、キャッシュから画像フレームシーケンスを取得する。

一部の実施形態では、画像フレームシーケンス取得モジュール４７０は、画像フレームシーケンス内の個々のフレームを、キャッシュ内の連続ビデオストリームから特定のフレーム数間隔で選択する。

一部の実施形態では、デバイス４００は、検証モジュール４８０を含む。

一部の実施形態では、検証モジュール４８０は、カード面上の文字列情報の正確さを検証する。一部の実施形態では、検証モジュール４８０は、文字列情報がカードのための所定のルールに適合するかどうかを検証する。文字列情報がカードのための所定のルールに適合する場合に、検証モジュール４８０は、その文字列情報を、ユーザによって確認されるカード情報として表示する。文字列情報がカードのための所定のルールに適合しない場合に、検証モジュール４８０は、次の画像フレームシーケンスを取得し、該次の画像フレームシーケンスを引き続き処理する。検証を通じて、カード情報認識の正解率、カード情報認識システム全体のパフォーマンス、及びユーザの便宜が向上される。

図７は、情報認識のためのシステムの一実施形態を示す構造ブロック図である。一部の実施形態では、システム７００は、画像取り込み機器７１０と、情報認識機器７２０と、表示機器７３０とを含む。

一部の実施形態では、画像取り込み機器７１０は、カード画像フレームシーケンスを取得する。例えば、画像取り込み機器７１０は、内臓若しくは外付けのカメラ、又はポータブル端末に取り付けられたスキャナなどの、画像取得デバイスであってよい。この画像取り込み機器７１０は、カードのビデオストリームを撮影する又はカードの複数の画像サンプルを撮ることができ、それによって、複数のシングルフレーム画像を得る。このようにして、画像取り込み機器７１０は、カード画像フレームシーケンスを取得する。

一部の実施形態では、情報認識機器又はサーバ７２０は、カード画像フレームシーケンス内のカード面文字列情報を認識する。一部の実施形態では、情報認識機器７２０は、カードゾーン内のカード面文字列情報を認識し、画像取り込み機器７１０によって取り込まれたカード画像フレームシーケンス内のカードゾーンを認識する。一部の実施形態では、情報認識機器７２０は、図４のデバイス４００に相当する。

一部の実施形態では、表示機器７３０は、情報認識機器７２０によって認識された文字列情報を表示する。一部の実施形態では、表示機器７３０は、情報認識機器７２０によって出力された文字列情報を受信し、この文字列情報を、確認のためにユーザに対して表示する。

一部の実施形態では、情報認識システム７００は、画像取り込み機器７１０を使用してカード画像フレームシーケンスを取り込み、複数のフレームの文字ゾーン画像処理結果に融合処理を施し、合体された文字ゾーン画像を認識する。このようにして、情報認識システム７００は、カード面文字列情報を抽出する。情報認識システム７００は、マルチフレーム融合処理を実施するので、カード情報認識の正解率を高め、カード情報認識システム全体のパフォーマンスを向上させ、ユーザの便宜を良くすることができる。

図８は、情報認識のためのプログラムドコンピュータシステムの一実施形態を示す機能図である。図から明らかなように、情報認識には、その他のコンピュータシステムアーキテクチャ及び構成も使用可能である。後述のような様々なサブシステムを含むコンピュータシステム８００は、少なくとも１つのマイクロプロセッササブシステム（プロセッサ又は中央演算処理装置（ＣＰＵ）とも呼ばれる）８０２を含む。例えば、プロセッサ８０２は、シングルチッププロセッサによって又は複数のプロセッサによって実現可能である。一部の実施形態では、プロセッサ８０２は、コンピュータシステム８００の動作を制御する汎用デジタルプロセッサである。メモリ８１０から取り出された命令を使用して、プロセッサ８０２は、入力データの受信及び操作と、出力デバイス（例えばディスプレイ８１８）へのデータの出力及び表示とを制御する。

プロセッサ８０２は、メモリ８１０に双方向に接続され、該メモリ８１０は、通常はランダムアクセスメモリ（ＲＡＭ）である第１の一次ストレージと、通常は読み出し専用メモリ（ＲＯＭ）である第２の一次ストレージとを含むことができる。当該分野で周知のように、一次ストレージは、汎用ストレージエリア及びスクラッチパッドメモリとして使用可能であり、入力データ及び処理済みデータを格納するためにも使用可能である。一次ストレージは、プログラミング命令及びデータを、プロセッサ８０２上で生じるプロセスのためのその他のデータ及び命令に加えて、データオブジェクト及びテキストオブジェクトの形態で格納することもできる。当該分野で周知のように、一次ストレージは、通常は、プロセッサ８０２がその機能（例えばプログラム命令）を実施するために使用する基本的な動作命令、プログラムコード、データ、及びオブジェクトを含む。例えば、メモリ８１０は、例えば、データアクセスが双方向又は単方向のいずれである必要があるかに応じ、後述の任意の適切なコンピュータ読み取り可能ストレージ媒体を含むことができる。例えば、プロセッサ８０２は、頻繁に必要とされるデータを直接に且つ非常に迅速に取り出して、直接に且つ非常に迅速にキャッシュメモリ（不図示）に格納することができる。

着脱式の大容量ストレージデバイス８１２は、コンピュータシステム８００のための追加のデータストレージ容量を提供し、双方向（読み出し／書き込み）に又は単方向（読み出しのみ）にプロセッサ８０２に接続される。例えば、ストレージ８１２は、磁気テープ、フラッシュメモリ、ＰＣカード、ポータブル大容量ストレージデバイス、ホログラフィックストレージデバイス、及びその他のストレージデバイスを含むこともできる。例えば、固定式の大容量ストレージ８２０が、追加のデータストレージ容量を提供することもできる。大容量ストレージ８２０として最も一般的な例は、ハードディスクドライブである。大容量ストレージ８１２、８２０は、一般に、プロセッサ８０２が通常は能動的に使用していない追加のプログラミング命令やデータなどを格納する。大容量ストレージ８１２、８２０内に保持される情報は、もし必要であれば、仮想メモリとしてメモリ８１０（例えばＲＡＭ）の一部に標準的に組み込み可能であることがわかる。

バス８１４は、プロセッサ８０２にストレージサブシステムへのアクセスに加えてその他のサブシステム及びデバイスへのアクセスを提供するためにも使用可能である。図に示されるように、これらには、ディスプレイモニタ８１８、ネットワークインターフェース８１６、キーボード８０４、及びポインティングデバイス８０６はもちろん、必要に応じて、補助入出力デバイスインターフェース、サウンドカード、スピーカ、及びその他のサブシステムがある。例えば、ポインティングデバイス８０６は、マウス、スタイラス、トラックボール、又はタブレットであってよく、グラフィカルユーザインターフェースとやり取りするのに有用である。

ネットワークインターフェース８１６は、図に示されるようなネットワーク接続を使用してプロセッサ８０２が別のコンピュータ、コンピュータネットワーク、又は電気通信ネットワークに接続されることを可能にする。例えば、ネットワークインターフェース８１６を通じて、プロセッサ８０２は、方法／プロセスのステップを実施する過程において別のネットワークから情報（例えばデータオブジェクト若しくはプログラム命令）を取り出す又は別のネットワークに情報を出力することができる。情報は、多くの場合、プロセッサで実行される一連の命令として表され、別のネットワークから取り出し可能である又は別のネットワークに出力可能である。コンピュータシステム８００を外部ネットワークに接続するために、及びデータを標準プロトコルにしたがって転送するために、インターフェースカード又は類似のデバイスと、プロセッサ８０２によって実装される（例えばプロセッサ８０２上で実行される／実施される）適切なソフトウェアとが使用可能である。例えば、本明細書で開示される様々なプロセス実施形態は、プロセッサ８０２上で実行可能である、又は処理の一部を供給するリモートプロセッサと協働してインターネット、イントラネットネットワーク、若しくはローカルエリアネットワークなどのネットワークで実施可能である。プロセッサ８０２には、ネットワークインターフェース８１６を通じて追加の大容量ストレージデバイス（不図示）も接続可能である。

コンピュータシステム８００と協働して、補助入出力デバイスインターフェース（不図示）が使用可能である。補助入出力デバイスインターフェースは、プロセッサ８０２が、マイク、タッチセンサ式ディスプレイ、トランスデューサカードリーダ、テープリーダ、音声又は手書き文字認識装置、生体認証リーダ、カメラ、ポータブル大容量ストレージデバイス、及びその他のコンピュータなどのその他のデバイスにデータを送信することを、又はより一般的にはこれらのその他のデバイスからデータを取り出すことを可能にする、汎用又は専用のインターフェースを含むことができる。

図８に示されたコンピュータシステムは、本明細書で開示される様々な実施形態との使用に適したコンピュータシステムの一例に過ぎない。このような使用に適したその他のコンピュータシステムは、含まれるサブシステムが更に多くてよい又は少なくてよい。また、バス８１４は、サブシステムをつなぐ働きをするあらゆる相互接続方式を例示するものである。異なる構成のサブシステムを有するその他のコンピュータアーキテクチャも利用可能である。

上述されたモジュールは、１つ以上の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、又はプログラマブルロジックデバイス及び／若しくは特定の機能を実施するように設計された特殊用途向け集積回路などのハードウェアとして、又はそれらの組み合わせとして実装可能である。一部の実施形態では、モジュールは、本発明の実施形態で説明される方法を（パソコン、サーバ、ネットワーク機器などの）計算装置に実行させるための幾つかの命令を含み尚且つ（光ディスク、フラッシュストレージデバイス、モバイルハードディスクなどの）不揮発性のストレージ媒体に記憶させることができるソフトウェア製品の形で具現化可能である。モジュールは、１つのデバイス上に実装されてよい、又は複数のデバイスに分散されてよい。モジュールの機能は、互いに統合されてよい、又は複数のサブユニットに更に分けられてよい。

本明細書で開示された実施形態に照らして説明される方法又はアルゴリズム的ステップは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、又はこれら両方の組み合わせを使用して実現可能である。ソフトウェアモジュールは、ランダムアクセスメモリ（ＲＡＭ）、メモリ、読み出し専用メモリ（ＲＯＭ）、電気的にプログラム可能なＲＯＭ、電気的に消去可能でプログラム可能なＲＯＭ、レジスタ、ハードドライブ、着脱式ディスク、ＣＤ−ＲＯＭ、又は当該技術分野で知られるその他の任意の形態のストレージ媒体にインストール可能である。

以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、限定するものではない。

以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、限定するものではない。
適用例１：情報認識のための方法であって、
１つ以上のプロセッサを使用し、複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
前記１つ以上のプロセッサを使用し、各カードゾーン内において情報ゾーンを位置特定し、
前記１つ以上のプロセッサを使用し、各情報ゾーンを少なくとも１つの文字ゾーンに分割し、
前記１つ以上のプロセッサを使用し、前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記１つ以上のプロセッサを使用し、前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識すること、
を備える方法。
適用例２：適用例１に記載の方法であって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、方法。
適用例３：適用例２に記載の方法であって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、方法。
適用例４：適用例１に記載の方法であって、更に、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定する前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える方法。
適用例５：適用例４に記載の方法であって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、方法。
適用例６：適用例１に記載の方法であって、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得すること、
を備える方法。
適用例７：適用例３に記載の方法であって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、方法。
適用例８：情報認識のためのシステムであって、
少なくとも１つのプロセッサであって、
複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
各カードゾーン内において情報ゾーンを位置特定し、
各情報ゾーンを少なくとも１つの文字ゾーンに分割し、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するように構成されている少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに接続され、前記少なくとも１つのプロセッサに命令を提供するように構成されているメモリと、
を備える、システム。
適用例９：適用例８に記載のシステムであって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
適用例１０：適用例９に記載のシステムであって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、システム。
適用例１１：適用例８に記載のシステムであって、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
前記カード画像フレームシーケンス内の各フレームにおいてカードゾーンを位置特定する前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える、システム。
適用例１２：適用例１１に記載のシステムであって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
適用例１３：適用例８に記載のシステムであって、
前記少なくとも１つのプロセッサは、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するように構成されている、システム。
適用例１４：適用例１０に記載のシステムであって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
適用例１５：情報認識のためのシステムであって、
複数のフレームを含むカード画像フレームシーケンスを取得するために使用される画像取り込み機器と、
情報認識機器であって、
カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
各カードゾーン内において情報ゾーンを位置特定し、
各情報ゾーンを少なくとも１つの文字ゾーンに分割し、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するために使用される情報認識機器と、
前記認識された文字列情報を表示するために使用される表示機器と、
を備えるシステム。
適用例１６：適用例１５に記載のシステムであって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
適用例１７：適用例１６に記載のシステムであって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、システム。
適用例１８：適用例１５に記載のシステムであって、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える、システム。
適用例１９：適用例１８に記載のシステムであって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
適用例２０：適用例１５に記載のシステムであって、
前記情報認識機器は、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するために使用される、システム。
適用例２１：適用例１７に記載のシステムであって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
適用例２２：有体の非一時的なコンピュータ読み取り可能ストレージ媒体に盛り込まれた、情報認識のためのコンピュータプログラム製品であって、
複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定するためのコンピュータ命令と、
各カードゾーン内において情報ゾーンを位置特定するためのコンピュータ命令と、
各情報ゾーンを少なくとも１つの文字ゾーンに分割するためのコンピュータ命令と、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正するためのコンピュータ命令と、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するためのコンピュータ命令と、
を備えるコンピュータプログラム製品。

Claims

情報認識のための方法であって、
１つ以上のプロセッサを使用し、複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
前記１つ以上のプロセッサを使用し、各カードゾーン内において情報ゾーンを位置特定し、
前記１つ以上のプロセッサを使用し、各情報ゾーンを少なくとも１つの文字ゾーンに分割し、
前記１つ以上のプロセッサを使用し、前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記１つ以上のプロセッサを使用し、前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識すること、
を備える方法。
請求項１に記載の方法であって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、方法。
請求項２に記載の方法であって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、方法。
請求項１に記載の方法であって、更に、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定する前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える方法。
請求項４に記載の方法であって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、方法。
請求項１に記載の方法であって、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得すること、
を備える方法。
請求項３に記載の方法であって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、方法。
情報認識のためのシステムであって、
少なくとも１つのプロセッサであって、
複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
各カードゾーン内において情報ゾーンを位置特定し、
各情報ゾーンを少なくとも１つの文字ゾーンに分割し、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するように構成されている少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに接続され、前記少なくとも１つのプロセッサに命令を提供するように構成されているメモリと、
を備える、システム。
請求項８に記載のシステムであって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
請求項９に記載のシステムであって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、システム。
請求項８に記載のシステムであって、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
前記カード画像フレームシーケンス内の各フレームにおいてカードゾーンを位置特定する前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える、システム。
請求項１１に記載のシステムであって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
請求項８に記載のシステムであって、
前記少なくとも１つのプロセッサは、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するように構成されている、システム。
請求項１０に記載のシステムであって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
情報認識のためのシステムであって、
複数のフレームを含むカード画像フレームシーケンスを取得するために使用される画像取り込み機器と、
情報認識機器であって、
カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
各カードゾーン内において情報ゾーンを位置特定し、
各情報ゾーンを少なくとも１つの文字ゾーンに分割し、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するために使用される情報認識機器と、
前記認識された文字列情報を表示するために使用される表示機器と、
を備えるシステム。
請求項１５に記載のシステムであって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
請求項１６に記載のシステムであって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、システム。
請求項１５に記載のシステムであって、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える、システム。
請求項１８に記載のシステムであって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
請求項１５に記載のシステムであって、
前記情報認識機器は、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するために使用される、システム。
請求項１７に記載のシステムであって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
有体の非一時的なコンピュータ読み取り可能ストレージ媒体に盛り込まれた、情報認識のためのコンピュータプログラム製品であって、
複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定するためのコンピュータ命令と、
各カードゾーン内において情報ゾーンを位置特定するためのコンピュータ命令と、
各情報ゾーンを少なくとも１つの文字ゾーンに分割するためのコンピュータ命令と、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正するためのコンピュータ命令と、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するためのコンピュータ命令と、
を備えるコンピュータプログラム製品。